問いは世界を創造する
問いから始まる世界
「問い」は、世界を理解し、働き掛け、変えていく上での、すべての出発点であり、暫定的に得た「回答」からの折り返し点でもある。その繰り返しが、世界の理解及び問題解決と創造に結びつく。この過程を「問いは世界を創造する」と捉えよう。このような「問い」の重要性は、古く、プラトンの描くソクラテスの言動からも分かることだ。
ただ「問いは世界を創造する」はいささか大仰な物言いなので、編集工学研究所の安藤昭子さんの「問いの編集力 思考の「はじまり」を探究する」に倣って、いったん「問いは世界を編集する」にしてみたが、「編集」という言葉になかなか馴染めないので、しばらくは「問いは世界を創造する」を試用することにしよう。
「問い」については、古くから検討されている「古典的な問い」と、生成AIで利用される「現代の問いープロンプティング」を検討すべきである。
古典的な問いー世界を創造するプロセス
古典的な問いを考える
問いについては、ⅰ問いが生まれる状況、ⅱ問いの種類、ⅲ問いの後の展開過程がそれぞれ問題になるだろう。これらについて、私が考えている「基本書」を設定しよう。
ⅰについては、子どもの問いを取り上げた「子どもは40000回質問する~あなたの人生を創る「好奇心」の驚くべき力~:イアン・レスリー」、そして脳が世界を構成する仕組みを考察する「脳の大統一理論 自由エネルギー原理とはなにか:乾 敏郎、阪口 豊」が参考になる。
「問い」を論じる多くの本は、如何に立派な問いを発するかという点に焦点をあてているのだが、余り見通しがよくない。まず問いが生まれる状況を理解することが重要だ。
ⅱについては、大きくWhat、Why、Howに加えて、実践的な問いとしてWhy→What if→Howを加えてもいいだろう。「リサーチ・クエスチョンとは何か?:佐藤郁哉」は2W1Hを取り上げ、「Q思考:ウォーレン・バーガー」は、Why→What if→Howを重要視している。
そしてⅲについて私は、今、次の図式を考えている。
問い(What、Why、How)⇆(推論、アイデア、リサーチ)→(知識、問題解決、創造)=知的生産⇆問い
上述した「問いの編集力 思考の「はじまり」を探究する:安藤昭子」は、故松岡正剛のスキーム(例えば「知の編集工学」)と重なる部分があるが、文化・教養に関わる問題をきちんと整理していて、格好いいし、応用範囲も広いので参考にしよう。
以上の5書を「古典的な問い」の基本書にしよう。
ただ「問いは世界を創造する」ことの理解は、言わば実践の結果であるから、最初から本ばかり読み込んでいても仕方がないのだが。
基本5書の紹介
<子どもは40000回質問する>の要約と目次
書誌 子どもは40000回質問する~あなたの人生を創る「好奇心」の驚くべき力~:イアン・レスリー(光文社 )
各章の要約
はじめに
この章では、言葉を操る天才ザルであるカンジが質問をしないこと、売れっ子プロデューサーが「自分は何者なのか」という苦悩に直面したこと、そして知的好奇心の程度を測る「認知欲求」の概念が紹介される。人間にとって「知りたい」という欲求が不可欠であり、それが人生や社会を大きく変える力になることが述べられている。カンジの例を通して、高度な知能があっても好奇心や探求心がない場合、自己や世界に対する深い理解が得られないことが示唆される。また、ジョン・ロイドの苦悩を通して、成功者がスランプに陥る背景には知識の欠乏があることが指摘され、認知欲求の重要性が強調されている。認知欲求は、人が複雑な課題に積極的に取り組み、深く考えることを楽しむ傾向を指し、自己評価を通じて自身の認知欲求の高さを知ることができる。しかし、認知欲求は環境によって変化するため、常に意識して好奇心を刺激し続ける必要がある。
第1部:好奇心のはたらき
第1章:ヒトは好奇心のおかげで人間になった
この章では、ブライアンという少年が銃に触れたことから予期せぬ事態を引き起こした事例や、言語学者のアレグザンダー・アーゲイエスが飽くなき言語習得への欲求を持ち続けた事例を通じて、人間の根源的な感情である好奇心がいかに人を行動へと駆り立てるかが描かれている。ブライアンの事例は、子どもの好奇心が危険な状況を生み出す可能性を示唆しつつ、銃に対する知りたいという欲求に変化したことが述べられている。一方、アーゲイエスの事例は、言語習得への情熱が、いかに人を自己変革へと導くかを示している。ダ・ヴィンチの広範な関心事のリストも紹介され、知識欲の多様性と深さが強調されている。太古の人々が狩猟をするために、どれほど多くの知識を必要としたかが述べられ、ホモサピエンスが好奇心旺盛な生き物である理由が考察されている。拡散的好奇心と知的好奇心の違いにも言及されている。
第2章:子どもの好奇心はいかに育まれるか
この章では、ロンドンのベビーラボでの実験を基に、子どもの知的好奇心の起源と発達について探求している。幼児の好奇心が常に一定ではなく、環境や周囲の大人たちの影響を大きく受けることが強調されている。実験を通して、赤ちゃんが新しい情報にどれだけ関心を示すかを測定し、好奇心が刺激される瞬間の脳波を観察する試みが紹介されている。また、人間の長い子ども時代が、知識や疑問を抱く能力を育む上で重要な役割を果たしていることが述べられている。乳幼児の学習は、大人や環境との共同作業であり [19]、他者との関わりを通じて共感的好奇心が育まれる。好奇心旺盛な子とそうでない子の違いは、認知能力と養育者の対応にあるとされている。脳の発達過程において、使われない神経経路は退化し、秩序が確立される。
第3章:パズルとミステリー
この章では、心理学者のダニエル・バーラインの研究を基に、好奇心が「理解」と「理解の欠如」の双方によって刺激されるという、好奇心の矛盾する性質を解き明かしている。人が物事に興味を抱くのは、「奇妙なこと、ありきたりでないこと、腑に落ちないこと」に対してであると指摘する。また、ジョージ・ローウェンスタインの「情報の空白」理論を紹介し、新しい情報によって無知を自覚させられたときに好奇心が生まれると主張する。人は、何も知らないことには興味を抱かず、少しだけ知識がある状態が好奇心に火をつける。しかし、何でも知っていると思い込むと無関心になりがちであるため、自分の知識に空白があることを自覚することが重要である。グレゴリー・トレバートンのパズルとミステリーの区別を引用し、パズルには明快な答えがあるのに対し、ミステリーは答えが不明確であることを指摘する。
第2部:好奇心格差の危険
第4章:好奇心の三つの時代
この章では、好奇心の歴史的変遷を概観する。古代ギリシャでは好奇心は実利を求めない純粋な知識欲とされ、中世では罪深いものとされた。ルネサンスと交易、科学革命によって好奇心の威信が取り戻され、啓蒙時代には知識の普及が進んだ 。共感的好奇心の高まりにも言及され 、都市がセレンディピティ(予期せぬ発見)を生み出す場としての役割を果たすことが強調される。
第5章:好奇心格差が社会格差を生む
この章では、好奇心の格差が経済格差を悪化させるという問題に焦点を当てる。大学教育を受けないことの代償は大きく 、学業成績には知的好奇心が大きく影響することが示される。ロンドン大学ゴールドスミス・カレッジの講師ソフィー・フォン・シュトゥムの研究を引用し、知的好奇心の強さが知識を習得し、新しい考えを吸収する意欲に繋がると述べている 。人口統計学的な属性は大学での成績にはほとんど影響がないことが述べられている。好奇心を維持できる人が成果を手にする時代であると述べられている。
第6章:問いかける力
この章では、質問することの重要性が強調される。ロススタインの活動を紹介し、質問の仕方を変えるだけで人生が変わる可能性さえあることを示唆する。1930年のドロシア・マッカーシーの研究を引用し、高所得層の家庭の子は低所得層の子よりも質問する回数が多いという調査結果を紹介する。バーバラ・ティザードとマーティン・ヒューズの研究でも同様の傾向が明らかになっている。ポール・ハリスは、この傾向の背景には各国の相対的な教育レベルの差があると指摘する。
第7章:知識なくして創造性も思考力もない
この章では、知識の重要性が強調される。スラム街にコンピューターを置いても教育効果は期待できず、「好奇心駆動型」教育が機能しない理由が説明される。人間の長期記憶が果たす役割に言及し、知識こそが好奇心を持続させる力であり 、知識は知識に引き寄せられるというマタイ効果が紹介される。ジャーナリストのポール・タフの著書を引用し、「好奇心」や「やり抜く力」だけでは不十分であることを示唆する。知識こそが、創造性と好奇心の源泉であると結論づけている。
第3部:好奇心を持ち続けるには
第8章:好奇心を持ち続ける7つの方法
この章では、好奇心を持ち続けるための具体的な方法が提示される。成功にあぐらをかかず、自分の領域外に目を向けることの重要性が説かれる。自分のなかに知識のデータベースを構築し、広告業界のバイブルに学ぶことが推奨される。アイディアを得るための5つのステップが紹介され、キツネとハリネズミのように多角的に知識を探し求めることが重要であると結論づけられる 。夫婦生活の退屈は痴話喧嘩よりも有害であるという研究結果を紹介し 、日常に変化を取り入れることの重要性を説く。パズルをミステリーに変えるという視点から、ウィリアム・フリードマンの暗号解読の事例を紹介し、好奇心を意識的に養っていくべきであると述べている。
全体の要約
本書は、人間の根源的な欲求である「好奇心」に焦点を当て、それが個人の成長、社会の発展、そして幸福な人生に不可欠な要素であることを多角的に論じている。まず、好奇心の定義や種類(拡散的好奇心と知的好奇心、共感的好奇心)について解説し、歴史的な事例や研究データを用いて、社会が好奇心を抑圧してきた過程を明らかにする。古代ギリシャにおける好奇心の尊重から、中世における罪悪視、ルネサンス以降の復権、そして現代の情報社会における新たな課題まで、その変遷を辿る。
本書は、子どもの好奇心がどのように育まれるか、そして家庭環境や教育がそれに与える影響についても深く掘り下げている。ベビーラボでの実験 や、高所得層と低所得層の家庭における質問の質の違いなどを通して、好奇心は単なる個人的な性質ではなく、社会的な要因によって大きく左右されることを示す。また、知識の重要性を強調し、知識こそが好奇心を持続させ、創造性を高める源泉であると主張する。
さらに、本書は知的好奇心を育むための具体的な方法を提示し、スランプからの脱出、夫婦関係の改善、自己中心的な考えからの解放など、人生のさまざまな局面で好奇心を活用できることを示す。ベンジャミン・フランクリンの事例を引用し、知識と経験を結びつけ、具体的な事柄と抽象的な事柄を統合する思考の重要性を説く。また、ビッグデータに頼りすぎるのではなく、「なぜ」を問い続けることの重要性を説く。
本書は、好奇心は意識的に養うべきものであり、学業や職業上の成功だけでなく、人生そのものを豊かにする力があると結論づけている。知識を吸収し、既成概念にとらわれず、常に新しいことに興味を持ち続けること。それこそが、変化の激しい現代社会を生き抜き、充実した人生を送るための鍵となることを、本書は力強く訴えている 。
詳細目次
はじめに 「知りたい」という欲求が人生と社会を変える
言葉を操る天才子ザルが「質問しない」こと
売れっ子プロデューサーの苦悩
人の好奇心をかきたてる番組をつくる
現代は人類発展の停滞期――もはや賢いだけでは生き残れない
知りたいと思う気持ち――認知欲求
好奇心を育てるには「労力」が必要だ
「拡散的好奇心」――知りたいという心のうずき
「知的好奇心」――知識と理解を求める意欲
「共感的好奇心」――他人の考えや感情を知りたい
危険な「好奇心格差」が生まれつつある
好奇心は加齢による認知機能低下に抵抗する
第1部 好奇心のはたらき
第1章 ヒトは好奇心のおかげで人間になった
子どもは銃を触らずにはいられない――ブライアンの例
拡散的好奇心の功罪
言語習得への飽くなき欲求――アーゲイエスの例
拡散的好奇心が知的好奇心に変わるとき
人間が拡散的好奇心を持っているわけ
知識欲は脳内で喜びの物質へと変わる
人は文化を蓄積し、それを探究することで環境に順応する
ダ・ヴィンチのToDoリスト
第2章 子どもの好奇心はいかに育まれるか
知的好奇心の起源――ロンドンのベビーラボ
ヒトの長い子ども時代の秘密
乳幼児の学習は大人や環境との合弁事業
好奇心旺盛な子とそうでない子の違い
指さしと 喃語 は学習の心構えができている合図
子どもは四万回質問する
質問の技術とパワー
第3章 パズルとミステリー
知識の「探索」と「活用」
好奇心は「理解」と「理解の欠如」の双方によって刺激される
少しだけ知っていることが好奇心に火をつける
何でも知っていると思い込むと無関心になりがち――過信効果
自信不足もまた好奇心をしぼませる
魅惑的ストーリーの構造――情報の空白を利用する
「パズル」と「ミステリー」
「パズル」を重視する文化
インターネットが奪う「生産的フラストレーションの体験」とは
苦労して学ぶほうが習熟度は高い
情報技術は人間の好奇心にとってプラスか
第2部 好奇心格差の危険
第4章 好奇心の三つの時代
威信失墜の時代
古代――好奇心は「実利のためではない」
中世――好奇心は「罪深いもの」である
ルネサンス――好奇心の威信回復
問いかけの時代 啓蒙時代――知識の普及
共感的好奇心の高まり――文学はなぜ人の心を動かしたか
都市が生み出すセレンディピティ
解答の時代
情報の蓄積とリンク――メメックスとインターネット
好奇心がなければセレンディピティは訪れない
自分が何を求めているかわからなかったら?
グーグルは「何を尋ねるべきか」を教えてはくれない
セレンディピティの欠如はイノベーションを阻害する
第5章 好奇心格差が社会格差を生む
大学教育を受けない代償は大きい
学業の成績には知的好奇心も大きく影響する
好奇心格差が経済格差を悪化させる
好奇心を維持できる人が成果を手にする時代
第6章 問いかける力
貧しい家庭の心の問題 高
所得層の家庭の子は、低所得層の子より多く質問する
多くの質問をする子は、親から多くの質問をされている
経済的余裕のある家庭とそうでない家庭では何が違うのか
大人はなぜ質問をやめてしまうのか
大企業病――意図的な無知 質問すべきときに質問しない理由
第7章 知識なくして創造性も思考力もない
スラム街にコンピューターを置いてみる
繰り返される「好奇心駆動型」教育
「好奇心駆動型」教育が機能しないわけ
人間の長期記憶が果たす役割
知識こそが、好奇心を持続させる力
知識は知識に引き寄せられる――マタイ効果
教育上の進歩主義と社会的な進歩主義はまったく別のもの
「好奇心」や「やり抜く力」だけでは足りない ――一流高校に入れなかったチェスマスター
知識こそが、創造性と好奇心の源泉
第3部 好奇心を持ち続けるには
第8章 好奇心を持ち続ける7つの方法
成功にあぐらをかかない
ウォルト・ディズニーとスティーブ・ジョブズ
中国の帝国はなぜ没落したか
自分の領域の外に目を向ける
自分のなかに知識のデータベースを構築する
広告業界のバイブルに学ぶ
アイディアを得るための5つのステップ
ひらめきは偶然ではない
キツネハリネズミのように探し回る
スペシャリストかジェネラリストか
多才なキツネと堅実なハリネズミの雑種
大学教育の問題
なぜかと深く問う
アイルランド和平の立役者
交渉の達人――「なぜ」を問う
共感的好奇心が物を言う
人はなぜ「なぜ」を避けるのか
手を動かして考える
油は波を静めるか――フランクリンの実験
ミクロとマクロ、具体性と抽象性を統合する
知識と技術、思索と行動は依存しあっている
ティースプーンに問いかける
退屈会議
何も起きないときに何が起きるか
「つまらない」を「面白い」に変える技術
夫婦生活の退屈は痴話喧嘩よりも有害
パズルをミステリーに変える
暗号のエキスパート
パズルの裏にミステリーを探す
おわりに さあ、知識の世界を探究しよう
アメリカの土地を踏まなかった男の判断
自己中心の考えから逃れる
絶望の淵から――好奇心の喪失
好奇心とは生きる力
謝辞 補足 訳者あとがき 参考文献
<脳の大統一理論>の要約と目次
<リサーチ・クエスチョンとは何か?>の要約と目次
<Q思考>の要約と目次
<問いの編集力>の要約と目次
現代の問いープロンプティング
プロンプティングは付き合い方が少し難しい
プロンプティングとは、生成AIに指示・質問する「問い」(プロンプト)のやり方のことである。当然自然言語で行う。従って「国語力」と同値のような気もする。
だから最初の頃、「あなたは先生です」(ペルソナパターン)、「初心者に説明してください」(オーディエンス・ペルソナパターン)という条件を入れると有効だ、などと言われると、小馬鹿にされたようでとても胡散臭かった。
しかし、生成AIは、「ある記述」に引き続いて「どのような記述」が高い確率で継続するかということが基本的な構造であり、「ある記述」がプロンプトであるといわれると、そういうものかと、少し納得する。
だから格好いいプロンプトを考える前に、生成AIに有効と思われるパターンを知り、それを反復して経験的に有効なプロンプトをマスターするのが、望ましいプロンプト・エンジニアリングであろう。
それに加えて、生成AIは日々変化進展しているから、プロンプティング技法は新しい方がいいという面もある。
そういう観点から、当面、後記の「生成AIスキルとしての言語学 誰もが「AIと話す」時代におけるヒトとテクノロジーをつなぐ言葉の入門書:佐野大樹(2024年2月刊)」、「AI時代の質問力 プロンプトリテラシー 「問い」と「指示」が生成AIの可能性を最大限に引き出す:岡 瑞起,橋本 康弘(2024年6月)」を基本書にしたい。ただ著者は学者のようだが、どこまで生成AIを使い込んでいるかはよくわからない。?とも思うのだが、英会話ができない英語学者もいるから、それでも構わないか。
要は私が、NotebookLMやGemini 1.5 pro with Deep Reseachを使い込むことで、プロンプティングをマスターすればいいのだ。
パターンを頭に入れるために、、「AI時代の質問力」の第3章から第5章は、章の要約に変え、そこに記述されたプロンプティングのパターンを要約掲載しておく。
基本2書の紹介
<生成AIスキルとしての言語学>の要約と目次
<AI時代の質問力 >の要約と目次
書誌 AI時代の質問力 プロンプトリテラシー 「問い」と「指示」が生成AIの可能性を最大限に引き出す:岡 瑞起,橋本 康弘(2024年6月)
各章の要約
第1章 大規模言語モデルの登場
第1章では、ChatGPTの登場が社会現象となったことが述べられています。従来のAI技術は専門家によって作られるものでしたが、ChatGPTはプロンプトと呼ばれる自然言語での指示によって、誰でも容易に利用できるようになった点が画期的です。ChatGPTのリリース後、わずか5日間で100万人のユーザーを獲得し、数ヶ月で世界的な話題を集めました。
ChatGPTを支える技術として、「トランスフォーマー」と「自己教師あり学習」の2つが挙げられています。トランスフォーマーは、人間の脳の構造を模倣した多層ネットワークで複雑なパターンを捉えるディープラーニング技術であり、自己教師あり学習は、既存の文章から自動的に予測問題を作成し、答え合わせをしながら自己学習を進める方法です。
トランスフォーマーは、文章の文脈や構造を捉え、単語間の関係性を学習することで、より豊かな文の解釈を可能にします。自己教師あり学習では、穴埋め問題を通じて文章の文脈、構造、つながり、背景知識などを学習し、大量のテキストデータを教師データとして活用することで、人間が教師データを用意する手間を省きます。
ChatGPTは、これらの技術を基に対話に特化して学習されており、質問への適切な答え方を学習したり、人間からのフィードバックを基に改善を重ねることで、より自然な会話を実現しています. また教育現場でのAIの活用例をあげ、教師の仕事の中で、情報を提供したり、生徒の疑問に答えるタスクはAIで代替可能になるかもしれないと述べています。
AIの能力を引き出す質問力を高めることが、AIとの連携を円滑にし、人間には不可能だった成果を得ることに繋がると述べられています。
第2章 プロンプトエンジニアリング
第2章では、プロンプトエンジニアリングの重要性と、大規模言語モデルを使いこなすための基礎知識が解説されています。プロンプトとは、人間がコンピュータに与える自然言語で書かれた指示書のことであり、大規模言語モデルに仕事を依頼する際の頼み方でもあります。プロンプトを工夫することで、大規模言語モデルからより適切な応答を引き出すことが可能になります。
大規模言語モデルは、穴埋め問題の延長として後続する単語を次々と選択し、文章を生成する仕組みを持っています。このため、プロンプトにどのようなパターンが含まれているかを意識し、大規模言語モデルの訓練データとなった文章の中で、そのパターンがどのように使われていたかを想像することが重要になります。
プロンプトを書く際は、具体的に、詳細に記述することが推奨されます。プロンプトの焦点が曖昧だと、結果も同様に曖昧になるため、指示を具体的に与えることで、ニーズに合ったカスタマイズされた回答を生成させることができます。
大規模言語モデルは高度な推論能力を持つ一方で、簡単な四則演算を間違えるなど、ハルシネーションと呼ばれる現象を起こすことがあります。しかし、適切なプロンプトを使用することで、この現象をある程度克服することができます。
大規模言語モデルは、プロンプトに応じて内部状態を調整し、動的にネットワークの重みを変化させるように動作します。この文脈内学習と呼ばれる振る舞いにより、大規模言語モデルは氷漬けの関数ではなく、与えられた文脈やタスクに応じて異なる表現を作り出し、問題の解釈や解決方法を変えていくことができます。
第3章 プロンプトパターン
3-1 ペルソナパターン
ペルソナパターンは、大規模言語モデルに特定の人物やキャラクターのように振る舞わせるプロンプト技術です。実在の人物だけでなく、アニメキャラクターや猫などの架空の存在もペルソナとして設定できます。例えば、「哲学者のように振る舞ってください」と指示することで、AIに哲学的な観点から回答させることが可能です。ペルソナを使い分けることで、特定の視点や知識に基づいた回答を引き出すことができます。ペルソナは、AIの応答に個性を与え、より人間らしい対話を可能にするための強力なツールとなります。
3-2 オーディエンス・ペルソナパターン
オーディエンス・ペルソナパターンは、特定の対象者(オーディエンス)に合わせた回答を生成するプロンプト技術です。これは、単に指示を与えるのではなく、モデルに対して「目の前の人々に対して持つべき会話の方向性」を示すものです。例えば、コンピューターサイエンスの知識がない人に対して大規模言語モデルを説明する場合と、専門家に対して説明する場合とで、異なる回答を生成することができます。オーディエンス・ペルソナパターンは、コミュニケーションの対象者に最適化された情報を提供するために有効です。
3-3 質問精緻化パターン
質問精緻化パターンは、質問をより厳密で詳細なものにすることで、より適切な答えを得るためのプロンプトパターンです。質問があいまいだと、得られる結果もあいまいになるため、質問に具体性を持たせることが重要です。質問精緻化パターンを利用することで、質問するたびにより改善された質問を提案してくれます3。改善された質問を見ることで、元の質問には何が足りなかったのか、という質問を振り返るための視点を与えてくれます。このパターンは、ペルソナパターンやオーディエンス・ペルソナパターンと組み合わせることで、質問にコンテキストを与えることができます。質問精緻化パターンの形式は以下の通りです。入力するプロンプト:「私が質問をしたときは、常に改善した質問を提案してください。」◦この後にプロンプトに与えた質問は、より詳細な質問に言い直されます。質問精緻化パターンは、大規模言語モデルに質問する際のコツを学ぶのに役立ち、質問の意図を汲み取って、より良い質問をしてくれる存在は心強いと述べられています。また、改善された質問が自分の意図と異なる場合には、元の質問には様々な答え方があることに気づき、コンテキストを追加する必要性を示唆します
3-4 認識検証パターン
認識検証パターンは、大規模言語モデルが質問された際に、まず質問を細分化し、追加の情報や詳細をユーザーに求めることで、より質の高い推論を可能にするプロンプト技術です。このパターンは、問題解決における「分割統治」戦略を応用したもので、質問をより深く理解し、多角的な視点から情報を統合することで、詳細かつ正確な回答を導き出すことを目指します。
3-5 反転インタラクションパターン
反転インタラクションパターンは、大規模言語モデルがユーザーに対して質問をすることで、問題解決に必要な情報や手順を明確にするアプローチです。例えば、実験がうまくいかないという悩みに対して、「何を目的とした実験なのか?」「どの部分がうまくいっていないのか?」といった質問をモデルからユーザーに投げかけます。これにより、ユーザーは自身の研究や実験についてより深く考え、問題点や改善の糸口を自ら見つけることができます。
3-6 少数ショットパターン
少数ショットパターンは、大規模言語モデルに対して、何をすべきかを詳しく記述するのではなく、例を与えることでタスクを伝えるプロンプト技術です。例えば、記事のタイトルからカテゴリを特定するタスクにおいて、複数の例(入力と出力のペア)を示すことで、モデルはパターンを学習し、新しい入力に対して適切なカテゴリを予測することができます。少数ショットパターンは、モデルがコンテキストを理解し、与えられたタスクを効果的に実行するための強力な手段となります。
第4章 トリガープロンプトの威力
4-1 Chain-of-Thoughtパターン
Chain-of-Thought(CoT)パターンは、大規模言語モデルに解答に至るまでの推論ステップを説明させることで、最終的な答えの精度を向上させる手法です。CoTパターンは、質問と思考過程を含む回答の組からなる例を少数ショットで与え、最後に本当に聞きたい質問を提示するという形式を取ります。これにより、モデルは問題をステップごとに分解し、論理的な推論過程を経て解決策を導き出すことを学習します。また、「ステップバイステップで考えよう」というトリガープロンプトを質問文に追加するだけでCoTパターンと同様の効果を得る「ゼロショットCoT」という手法もあります。
4-2 Chain-of-Verificationパターン
Chain-of-Verification(CoVe)パターンは、CoTパターンのハルシネーション(もっともらしい誤情報)を抑制するために考案された手法です。CoVeパターンは、質問に対する最初の回答を生成し、その回答に含まれる事実に対して検証質問を生成し、それらの検証質問に回答し、検証結果を踏まえて最終的な回答を生成するという4段階で構成されます。このプロセスを通じて、モデルは自身の回答を自己検証し、誤りを訂正することで、より正確な情報を提供することができます。
4-3 ステップバックプロンプトパターン
ステップバックプロンプトパターンは、質問に直接答えるのではなく、まず質問の背景にある知識を明らかにするための質問(ステップバック質問)を生成し、その質問に答えることで、より正確な回答を導き出す手法です。ステップバックプロンプトは、大規模言語モデルが持つ知識のギャップを埋め、より深い理解に基づいて推論を行うことを可能にします。
4-4 メタ認知的プロンプトパターン
メタ認知的プロンプトパターンは、モデルの出力結果を再度処理することによって、より質の高い推論結果を得るための手法です。これは、モデルが自身の思考過程を内省し、改善することを促すものであり、再帰的な処理を行うことが特徴です。
第5章 発展的な技術
5-1 自己一貫性パターン
自己一貫性(Self-consistency)パターンは、CoTパターンの推論能力を改善するために考案された手法で、一つのモデルから複数の回答を生成し、多数決で最終回答を選ぶという方法です。このアプローチは、問題解決において多様な推論過程を考慮することの重要性を示唆しており、モデルの出力結果の質を高めるために広く応用されています。
5-2 ReActパターン
ReActパターンは、「Reason(推論)+Act(行動)」を意味し、CoTパターンのような推論と、ウェブにアクセスするといった行動を組み合わせて、正しい推論のために必要な情報検索を合わせて行う手法です。ReActパターンは、APIを介して外部にアクセスして情報を取得するという点が決定的に重要であり、大規模言語モデルの推論能力を拡張するために不可欠です。
5-3 RAG(検索拡張生成)
RAG(Retrieval Augmented Generation)は、情報検索(Retrieval)とテキスト生成(Generation)を組み合わせたアプローチで、モデルの外部に記憶の機構を持ち、それを有効に活用する方法の一つです。RAGは、モデルが容易にアクセス可能な形で、モデルの外部にドメイン固有の知識データベースを持たせることで、事前学習の限界を超えた知識を提供します。
5-4 LLM-as-Agent
LLM-as-Agentは、大規模言語モデルを自律的、創造的に振る舞うAIエージェントとして実装する技術です。LLM-as-Agentを実現するには、エージェント固有の知識や経験、行動の背景となる記憶を保持する仕組みと、内省によって洗練された行動を生成していくメタ認知的な仕組みが必要です。Reflexion、心の理論に基づくAIエージェント、マルチエージェントAIモデルなどがその例として挙げられます。
第6章 AIエージェントと社会
第6章では、AIエージェントの自律性と社会性について考察されています。自律性とは、個体が外部からの指示や制御なしに、自己の意志や決定に基づいて行動できる能力を指します。AIエージェントが自律性を持つことで、人間の代理人として様々なタスクをこなせるようになる可能性が示唆されています。
大規模言語モデルは、多様なリソースから収集されたテキストデータから、道徳や慣習を含む様々なルールや法則を学習しています。しかし、AIエージェントは現実世界へのコミットメント(責任を持った関わり)がないため、その振る舞いにおいて人間にとってのある種の「エイリアン」として認識される可能性があります。
高い自律性を持ったAIエージェントは、人間とは異なり、生成した内容を実際に理解しているわけではありません。このギャップを埋めるためには、意味理解やタスクの分節化、言語化といった要素をAIエージェントに組み込む必要があります。
AIエージェントが社会に浸透していく中で、エコーチェンバーのような問題が深刻化する可能性も指摘されています。しかし、適切に配置されたAIエージェントが社会全体のパフォーマンスを高める可能性も示唆されています。
AIエージェントは、生命体のような自律的なシステムと似ており、所与の環境への適応やパターンマッチングを超えた、オープンエンドな創造性を発揮できるかもしれません。AGI(汎用人工知能)やASI(人工超知能)の実現を見据え、人間とAIが共生する未来について考察が展開されています。
全体の要約
本書は、大規模言語モデル(LLM)を最大限に活用するための知識とスキルを提供することを目的としています。ChatGPTの登場を皮切りに、AI技術は社会に浸透しつつあり、その中心的な役割を担うのがLLMです。
LLMの基礎技術:
トランスフォーマー:人間の脳の構造を模倣した多層ネットワークで、文章の文脈や構造を捉え、単語間の関係性を学習する。
自己教師あり学習:既存の文章から自動的に予測問題を作成し、答え合わせをしながら自己学習を進める。これにより、人間が教師データを用意する手間を省き、大量のテキストデータを活用できる。
プロンプトエンジニアリングの重要性:
LLMに対する指示であるプロンプトを工夫することで、より適切な応答を引き出すことが可能となる。
プロンプトには、どのようなパターンが含まれているかを意識し、LLMの訓練データとなった文章の中で、そのパターンがどのように使われていたかを想像することが重要となる。
プロンプトは具体的に、詳細に記述することが推奨される。指示を具体的に与えることで、ニーズに合ったカスタマイズされた回答を生成させることができる。
プロンプトパターン:
LLMに特定のタスクを実行させる際に用いるプロンプトのフレーズと構造を指す。
ペルソナパターン:「Xのように振る舞ってください」というプロンプトで、LLMに特定の役割を演じさせる。科学者、政治家、歴史的偉人など、多様な背景を持つプロフェッショナルの振る舞いをトリガーできる。
オーディエンス・ペルソナパターン:特定のペルソナに向けた回答を生成する。コンピュータサイエンスの知識を持たない人や、豊臣秀吉など、異なるオーディエンスに合わせた説明が可能になる。
質問精緻化パターン:質問をより厳密で詳細なものにすることで、より適切な答えを得る。質問があいまいだと、得られる結果もあいまいになるため、質問に具体性を持たせることが重要となる。
認識検証パターン:質問を細分化し、追加の情報や詳細をユーザーに求め、各質問の答えを統合して、最終的に全体の回答を提供する。
反転インタラクションパターン:達成したい目標があっても具体的なステップがわからない場合に、LLMに質問してもらうことで、考えを整理し、見えていないことについて考える。
少数ショットパターン:例を与えることで、LLMにタスクを伝える。1つの例を与える「1-ショットプロンプト」と、複数の例を与える「少数ショットプロンプト」がある。何も例を示さないプロンプトは「ゼロショットプロンプト」と呼ばれる。
トリガープロンプトの威力:
LLMが応答を返す際の思考過程のトリガーとなるプロンプト。Chain-of-Thoughtパターンに代表されるトリガープロンプトは、モデルの推論能力を大きく向上させることが知られている。
CoVe(Cognitive Verifier)パターン:質問から得た回答を複数の内容に分割し、それぞれについて検証することで、回答全体の正確性を担保する。
ステップバックプロンプトパターン: 質問に直接答えるのではなく、質問の背後にある物理的な原理や背景知識を明らかにするための質問(ステップバック質問)を生成する。
メタ認知的プロンプト:自己の認知プロセスに対する認識や調整を促すプロンプト。LLMに自身の思考過程を内省させ、より適切な回答を導き出す。
より発展的な技術:
ReActパターン:LLMが質問に答えるだけでなく、外部のツール(ウェブ検索など)と連携して情報を収集し、その結果を基に考察を行う。
RAG(検索拡張生成):LLMが持つ知識だけでなく、外部のデータベースや文書から関連情報を検索し、それらを組み合わせて回答を生成する。これにより、LLMの知識の限界を補い、より専門的で正確な情報を提供できる。
LLM as Agent:LLMをエージェントとして活用し、長期記憶や他のエージェントとの連携を通じて、より複雑なタスクを実行する。
AIエージェントと社会:
AIエージェントが自律性を持つことで、人間の代理人として様々なタスクをこなせるようになる。
AIエージェントは現実世界へのコミットメント(責任を持った関わり)がないため、その振る舞いにおいて人間にとってのある種の「エイリアン」として認識される可能性がある。
AIエージェントが社会に浸透していく中で、エコーチェンバーのような問題が深刻化する可能性も指摘されている。
AIエージェントは、生命体のような自律的なシステムと似ており、所与の環境への適応やパターンマッチングを超えた、オープンエンドな創造性を発揮できるかもしれない。
本書は、LLMの基本的な仕組みから、高度なプロンプトエンジニアリングのテクニック、そしてAIエージェントが社会に与える影響まで、幅広く解説しています。読者は本書を通じて、LLMを積極的に使いこなすための知識とスキルを獲得し、新しい知的創造のためのツールとしてLLMを活用できるようになるでしょう.
詳細目次
はじめに
第1章 大規模言語モデルの登場
1-1 社会現象となったChatGPT
1-2 AIによって仕事はどう変わるのか
1-3 AIとの共存の必要性
第2章 プロンプトエンジニアリング
2-1 プロンプトとは
2-2 プロンプトを書くときに気をつけるべきこと
2-3 大規模言語モデルを飼いならす
第3章 プロンプトパターン
3-1 ペルソナパターン
3-2 オーディエンス・ペルソナパターン
3-3 質問精緻化パターン
3-4 認識検証パターン
3-5 反転インタラクションパターン
3-6 少数ショットパターン
第4章 トリガープロンプトの威力
4-1 Chain-of-Thoughtパターン
4-2 Chain-of-Verificationパターン
4-3 ステップバックプロンプトパターン
4-4 メタ認知的プロンプトパターン
第5章 発展的な技術
5-1 自己一貫性パターン
5-2 ReActパターン
5-3 RAG(検索拡張生成)
5-4 LLM-as-Agent
第6章 AIエージェントと社会
6-1 AIエージェントの自律性
6-2 AIエージェントの社会性
6-3 新しい情報生態系
おわりに