一文定義
能力引き出しとは、LLMが潜在的に持つ能力を最大限に引き出すプロンプト・手法を探る研究領域で、Few-shot・CoT・ツール使用等で隠れた能力が現れることがありフロンティアモデル評価に重要です。
詳細解説
能力引き出し(Capability Elicitation)とは、LLMが潜在的に保有している能力を、最適なプロンプト設計・技法・ツール使用によって最大限に引き出すことを目的とした研究・実践領域です。
**なぜ能力引き出しが重要か:** LLMは学習済みの能力を常に発揮するわけではありません。プロンプトの書き方次第で同じモデルでも大きく性能差が出ます。また、フロンティアモデルの危険な能力評価において「見かけ上できない」と「本当にできない」を区別するために不可欠です。
**主な能力引き出し技法:**
**プロンプトエンジニアリング系:** - **Chain-of-Thought(CoT)**:「ステップバイステップで考えよ」と促すことで推論能力が大幅向上 - **Few-shot prompting**:例示によって未学習タスクでも高性能を発揮 - **Role prompting**:「あなたは専門家です」と役割を与えることで特定知識を引き出す - **Self-consistency**:複数回推論して多数決で精度向上
**ツール・環境系:** - **Tool use(Function Calling)**:計算・検索ツールを与えることで苦手な算術や最新情報を補完 - **コード実行環境**:Python interpreterを与えると数学・データ分析能力が飛躍的向上
**AI安全性における能力引き出し:** フロンティアモデルの危険能力評価(生物兵器情報・サイバー攻撃支援等)では、「素のプロンプトでできるか」だけでなく「最善の能力引き出し技法を使えばできるか」が問われます。Anthropicの内部評価チームはこの観点で継続的にモデルを評価しています。
モデルの「本当の能力」の上限を知ることが、適切なリスク評価と対策設計の前提となります。
参考情報・出典
- ▸Measuring Massive Multitask Language Understanding— arXiv / Hendrycks et al.(参照日: 2026-02-26)
- ▸Anthropic Responsible Scaling Policy— Anthropic(参照日: 2026-02-26)