Top-p

Top-p は、次の単語候補を確率の高い集団へしぼってから選ぶための設定です。

Top-p のアイキャッチ図解
まずは、こう考えるとつかみやすいです。

会議で出た案を全部は検討せず、有力候補だけを残した箱から1つ選ぶような絞り込みです。

ひとことで言うと

Top-p は、LLM が次に出す候補を「上位の有力グループ」に絞ってから選ぶ設定です。

どんな場面で使うか

  • 回答のぶれを少し抑えつつ、不自然な固定化も避けたいとき
  • 同じ質問への答えが散らばりすぎるのを防ぎたいとき
  • Temperature だけでは調整しきれないとき
  • 業務文の安定性と自然さのバランスを取りたいとき

Top-p は、確率が高い候補から順に足していき、合計が一定ラインに届くまでを候補として残す考え方です。 そのため、状況によって候補数が増減し、「有力でない候補」は早めに外しやすくなります。

Temperatureとの違い

  • Temperature は、全体のばらつきをどれくらい出すかの調整
  • Top-p は、そもそも選択肢として残す範囲をどこまでにするかの調整

実務では両方を同時に触れることがありますが、まずは片方を固定して、どちらが効いているのか分かる状態で試すほうが安全です。

実務で気にするポイント

  • Temperature と Top-p を同時に大きく変えると、原因切り分けが難しくなる
  • 事実性が重要な業務では、候補を広げすぎないほうが安定しやすい
  • クリエイティブ用途でも、評価時は設定を固定しないと比較しにくい
  • モデルごとに挙動差があるため、同じ値をそのまま横展開しないほうがよい

注意: Top-p は品質を自動で上げるつまみではありません。候補の絞り方を変える設定なので、用途に合ったプロンプトと評価がないと、単に出力傾向が変わるだけで終わります。