WHATISAI第2章

なぜ「聞き方」を変えるだけで、
答えの質が激変するのか

同じAIに、同じことを頼んでいるはずなのに ── 一言を添えるかどうかで、返ってくるものが見違える。 この章を読み終えると、その理由を「AIの中で何が起きているか」から、あなた自身の言葉で説明できるようになります。

📐 この章には、本書で唯一「本物の数式」が出てきます。でも安心してください。 一行ずつ、ふだんの言葉で「要するに何か」を必ず添えます。 数式は飛ばしても筋は通ります ── 深く知りたい方のための手すりです。

あれ? と思った、あの瞬間たぶん、あなたはもう経験している

来週の会議の準備をAIに手伝ってもらおうとした場面を思い出してください。最初の頼み方と、少し言葉を足した頼み方では、こうも違ったはずです。

ふつうに頼む

「来週の会議の議題を考えて」

当たり障りのない一般論。どの会社でも通用しそうで、自社には刺さらない。

一言を足す

「来週の経営会議の議題を、来期予算の承認を最優先に、30分で終わる構成で考えて」

優先順位のついた、そのまま使えそうな具体案に変わる。

同じAIです。賢くなったわけでも、何かを新しく学んだわけでもありません。変わったのは、あなたの言葉だけ。では、その一言は、AIの中の何を動かしたのでしょうか。

まず直感でつかむAIは毎回、「どの言葉に注目するか」を決めている

たとえるなら ── 会議の進行役

優れた進行役は、出席者全員の発言を均等に聞いたりしません。「いま何を決めるべきか」に照らして、大事な発言に重みをつけて耳を傾け、それ以外は軽く流します。

LLMもまったく同じことをしています。次の一語を選ぶとき、入力された言葉を均等には見ていません。「いま注目すべき観点」に照らして、どの単語にどれだけ注目するかを配分している。これが、専門用語でいう注意機構(Attention)の正体です。

ここが肝心です。あなたのプロンプトの一言は、この「注目すべき観点」そのものを書き換えます。「予算の承認を最優先に」と書けば、AIは “予算” や “承認” への注目度をぐっと引き上げる。だから、出てくる言葉が変わるのです。

仕組みを見る | 本書唯一の数式パート「注目度」は、3つのステップで計算される

1

相性を測る ── 注意スコア

まず、「いま注目したい観点」を、一本の矢印(ベクトル)だと思ってください。これを クエリ q\mathbf{q} と呼びます。

日常語でいうと
あなたの頭の中の「いま何の話がしたいか」を、ひとつの向きとして表したもの。今回なら「予算の承認の話」という向きです。

一方、入力された各単語も、それぞれの意味を表す矢印を持っています。これを キー ki\mathbf{k}_i と呼びます。

日常語でいうと
単語ひとつひとつが持つ「私はこういう意味です」という名札のようなもの。“予算” の矢印は「お金・計画」の向きを指しています。

この2本の「相性」を、内積という計算で1つの点数にします。

si  =  qkis_i \;=\; \mathbf{q}\cdot\mathbf{k}_i
この式は要するに
qk\mathbf{q}\cdot\mathbf{k}2本の矢印がどれくらい同じ方向を向いているかを、たった1つの数字にすること。 同じ方向ほど点数(相性スコア s)は大きく、逆向きならマイナスになります。下の図で動かしてみてください。
q(あなたの観点)k(単語)
相性スコア s = +0.91相性◎ よく注目される

だから “予算” は、あなたの観点 q\mathbf{q} と方向が近く、相性スコア ss が大きく出ます。「いまは予算の話だ」とAIが気づける、ということです。

2

注目度に変える ── softmax

スコア sis_i は、まだ大小バラバラのただの数字です。これを「合計してちょうど100%になる注目度」に変換します。この変換が softmax(ソフトマックス) ── LLMの心臓部であり、この本でいちばん大事な式です。

ai  =  esijesja_i \;=\; \dfrac{e^{\,s_i}}{\displaystyle\sum_j e^{\,s_j}}

いちどに覚えなくて大丈夫です。2つの部品に分けて、順に見ます。

部品① 分子の e のうえに s
ese^{\,s} は「スコアを強調しながら、必ずプラスの値にする」変換です。 大きいスコアはより一層際立ち、小さいスコアはほとんど消えます。差を、くっきりさせる役目です。
部品② 分母のΣ(シグマ)
Σ は「全部足す」の記号。全員のスコアの合計で割ることで、全体をきっちり100%にそろえます。 だから aia_i は「その単語に何%注目するか」になり、全部足すと必ず 1(=100%)
触って確かめる:注目度はこう決まる各単語の「観点との相性スコア s」を動かすと、softmax が注目度(%)に変えます。 一つを上げると、他が自動で下がる ── 注目は奪い合いです。
来週
1.3%
予算
69.6%
承認
25.6%
会議
3.5%
注目度の合計:100.0% ── softmax は、何をどう動かしても必ず100%に保ちます。
3

文脈をまとめる

最後に、各単語が持つ「中身」── バリュー vi\mathbf{v}_i を、いま求めた注目度 aia_i で重みづけして混ぜ合わせます。

文脈の要約  =  iaivi\text{文脈の要約} \;=\; \sum_i a_i\,\mathbf{v}_i
この式は要するに
注目度の高い単語の意味を濃く、低い単語を薄く混ぜた「いま効いている文脈の要約」をつくること。 AIは、この要約をもとに次の一語の確率を決めます。
発展発展:本物の注意機構(スケール化内積・マルチヘッド)と、最新研究▼ 数式が苦手な方は飛ばしてOK

本文では si=qkis_i=\mathbf{q}\cdot\mathbf{k}_i と単純化しましたが、Transformer(Vaswaniら, 2017「Attention Is All You Need」)の正確な式は次の通りです。

Attention(Q,K,V)=softmax ⁣(QKdk)V\mathrm{Attention}(Q,K,V)=\mathrm{softmax}\!\left(\frac{QK^{\top}}{\sqrt{d_k}}\right)V

① スケーリング 1/dk1/\sqrt{d_k}:ベクトルの次元 dkd_k が大きいと内積が大きくなりすぎ、softmax が一点に飽和して勾配が消えます。次元の平方根で割ることで安定させます。

② マルチヘッド注意:実際は q,k,v\mathbf{q},\mathbf{k},\mathbf{v} を複数の「ヘッド」に分け、別々の観点で並行して注意を計算し、最後に結合します。1つのヘッドは構文、別のヘッドは共参照…と役割が分かれることが観察されています。本章の図は、その1つのヘッドの概念図です。

MultiHead(Q,K,V)=Concat(head1,,headh)WO\mathrm{MultiHead}(Q,K,V)=\mathrm{Concat}(\mathrm{head}_1,\dots,\mathrm{head}_h)\,W^{O}

③ 最新動向:長い文脈での QKQK^\top の計算量は系列長の二乗 O(n2)O(n^2) で、これが長文脈のコスト要因です。FlashAttention(Daoら)はGPUメモリの使い方を工夫して実質的に高速化し、FlashAttention-2/3 へと発展。推論時には過去の K,VK,V を保存する KVキャッシュ が使われます。

⚠ 正確性の注記:attentionの重みは「モデルが何を根拠にしたか」の説明そのものではありません("attention is not explanation" という議論があります)。あくまで計算上の重み付けです。また出力を担うのは注意だけでなく FFN(全結合層) も中核です。


全部が、つながる瞬間ここまでを、1枚の絵に

相性スコア(Step 1)→ softmaxで注目度に(Step 2)→ 文脈をまとめる(Step 3)。この3つが同時に働くと、あなたの「聞き方」がどう効くのかが、1枚で見えてきます。まず、予想してみてください。

まず予想してみる

「最優先は予算」と添えたとき、AIが最も強く注目するのはどの言葉だと思いますか?

注目のレンズ:聞き方で、AIの「見るところ」が動くあなたが添える観点(最優先は何か)を切り替えてください。文の色の濃さ=注目度が一語で動き、次に出やすい言葉まで変わります。
あなたが添えた一言:

↑ 濃い言葉ほど、AIが強く注目している

→ 次に出やすい議題
来期予算の承認54%
予算配分の見直し27%
コスト削減策13%

※ わかりやすさのため、注目度は代表的な見方を単語単位で図示しています(実際のモデルでは多数の注目が並行して働きます)。

観点の一言を切り替えるだけで、注目の濃さも、次に出る言葉も入れ替わる。あなたは今、プロンプトが効く仕組みを「見た」のです。


だから、こうなるあなたの「聞き方」は、AIの注目先を書き換えている

もう、最初の謎は解けています。「来期予算の承認を最優先に」という一言は ──

  1. 観点 q\mathbf{q} を書き換える
  2. “予算”“承認” への注目度 aa が跳ね上がる
  3. 混ぜ合わさる「文脈の要約」が変わる
  4. 次の一語の確率が変わる
  5. 出力が変わる
この章のひとこと

プロンプトとは「お願いの言葉」ではなく、
AIに渡す「注目の設計図」である。

── 次にAIに何かを頼むとき、試してみてください。「最優先は何か」をたった一語そえるだけで、 AIの注目先が動き、答えの芯が変わります。あなたはもう、それがなぜかを知っています。