一文定義
リトリーバルとは、クエリに関連するドキュメント・情報を大規模データベースから検索・取得する処理で、RAGシステムの中核となる技術です。
詳細解説
リトリーバル(Retrieval:検索・取得)とは、ユーザーのクエリや質問に対して、大規模なドキュメントコレクションや知識ベースから関連する情報を効率的に検索・取得するプロセスです。RAG(Retrieval-Augmented Generation)の名前にも含まれており、生成AIシステムの重要な構成要素です。
リトリーバルが重要な理由は、LLMは学習データのカットオフ以降の情報を知らない・企業固有の情報を持っていないという限界があり、リトリーバルで外部知識を動的に取得してLLMに渡すことで、最新かつ正確な応答を実現できるためです。
リトリーバル手法は大きく2種類に分かれます。①スパース検索(BM25・TF-IDFなど):キーワードの一致で検索する古典的手法。高速で解釈しやすいが、同義語・文脈に弱い。②密ベクトル検索(Semantic Search):テキストをEmbeddingでベクトル化してコサイン類似度で検索。意味的な近さで検索でき、文脈を考慮できる。実用的なシステムでは両者を組み合わせる「ハイブリッド検索」が採用されることも多く、ベクトルデータベース(Vector DB)と組み合わせて実装されます。
参考情報・出典
- ▸Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks— arXiv / Facebook AI(参照日: 2026-02-26)
- ▸RAG - Hugging Face Documentation— Hugging Face(参照日: 2026-02-26)