一文定義
トップピーとは、出力トークンの選択範囲を累積確率で制御するサンプリング手法(nucleus sampling)です。Temperatureとともにテキスト生成の多様性・質を調整するパラメータです。
詳細解説
Top-p(トップピー)とは、核サンプリング(Nucleus Sampling)とも呼ばれる、LLMのテキスト生成における確率的サンプリング手法です。次のトークンを選ぶ際に、累積確率がp値に達するまでの候補トークン群(「核(nucleus)」)からのみランダムに選択します。
具体的な動作を説明すると、LLMが各トークンに確率を割り当て(例:「私」40%、「あなた」25%、「彼」15%...)、Top-p=0.9の場合、累積確率90%に達するまでのトークン群を候補として、その中からランダムに選びます。確率の高い数トークンだけで90%に達する場合は選択肢が絞られ(確信度が高い文脈)、確率が分散している場合は多くのトークンが候補に含まれます(多様な文脈)。
TemperatureとTop-pの違いと使い分けについて、Temperatureは確率分布全体の「鋭さ」を変えるのに対し、Top-pは確率上位のトークンに絞ることで低品質なトークンを除外します。実際の利用では、両方を同時に設定するよりも「どちらか一方を調整する」ことが推奨されています(OpenAI公式ドキュメント)。Top-p=1.0はすべてのトークンを候補に含む(制限なし)、Top-p=0.1は確率上位10%のみを選択(非常に決定論的)です。
参考情報・出典
- ▸The Curious Case of Neural Text Degeneration— arXiv / Holtzman et al.(参照日: 2026-02-25)
- ▸API Reference: top_p - OpenAI Documentation— OpenAI(参照日: 2026-02-25)