ひとことで言うと
Top-p は、LLM が次に出す候補を「上位の有力グループ」に絞ってから選ぶ設定です。
どんな場面で使うか
- 回答のぶれを少し抑えつつ、不自然な固定化も避けたいとき
- 同じ質問への答えが散らばりすぎるのを防ぎたいとき
- Temperature だけでは調整しきれないとき
- 業務文の安定性と自然さのバランスを取りたいとき
Top-p は、確率が高い候補から順に足していき、合計が一定ラインに届くまでを候補として残す考え方です。 そのため、状況によって候補数が増減し、「有力でない候補」は早めに外しやすくなります。
Temperatureとの違い
- Temperature は、全体のばらつきをどれくらい出すかの調整
- Top-p は、そもそも選択肢として残す範囲をどこまでにするかの調整
実務では両方を同時に触れることがありますが、まずは片方を固定して、どちらが効いているのか分かる状態で試すほうが安全です。
実務で気にするポイント
- Temperature と Top-p を同時に大きく変えると、原因切り分けが難しくなる
- 事実性が重要な業務では、候補を広げすぎないほうが安定しやすい
- クリエイティブ用途でも、評価時は設定を固定しないと比較しにくい
- モデルごとに挙動差があるため、同じ値をそのまま横展開しないほうがよい
注意: Top-p は品質を自動で上げるつまみではありません。候補の絞り方を変える設定なので、用途に合ったプロンプトと評価がないと、単に出力傾向が変わるだけで終わります。