一文定義
検索拡張ファインチューニング(RAFT)とは、RAGシステムでの利用を想定してノイズ文書も含めた検索結果から学習させるファインチューニング手法で、ドメイン固有のRAG精度を大幅に向上させます。
詳細解説
検索拡張ファインチューニング(RAFT:Retrieval Augmented Fine-Tuning)とは、RAGシステムに特化した性能を持つモデルを作るためのファインチューニング手法です。UC BerkeleyのZhangらが2024年に提案しました。
通常のRAGでは、汎用LLMが検索結果の文書を参照して回答を生成しますが、取得された文書にはノイズ(関係ない文書)が混ざることが多く、モデルがどの文書を参照すべきかを正確に判断できないという問題があります。
RAFTの核心は学習データの構成にあります。質問・正解文書・ノイズ文書・正解の4つ組を作り、「正解文書だけが含まれるケース」「ノイズ文書のみのケース」「両方混在するケース」をバランスよく学習させます。特にノイズ文書しかない場合でも質問に答えようとするトレーニングにより、モデルは関連文書と無関係文書を区別する能力を習得します。医療・法律・金融などのドメイン特化RAGシステムで特に効果を発揮します。
参考情報・出典
- ▸RAFT: Adapting Language Model to Domain Specific RAG— arXiv / Zhang et al. (2024) / UC Berkeley(参照日: 2026-02-26)
- ▸RAFT: A new way to teach LLMs to be better at RAG— Microsoft Tech Community(参照日: 2026-02-26)
最終更新: 2026-02-26← 用語集一覧へ