一文定義
LLMの応答を外部知識・リアルタイムデータで補強する技術の総称。RAGの核となる概念で、モデルの知識カットオフや幻覚を補完する。
詳細解説
検索拡張(Retrieval Augmentation)とは、LLMが生成する回答の品質・正確性・最新性を高めるために、外部の知識ベース・データベース・ウェブ検索結果などを動的に取得してLLMのコンテキストに組み込む技術の総称です。RAG(Retrieval-Augmented Generation)の核となる概念であり、LLMの本質的な制約(知識カットオフ・ハルシネーション・特定ドメイン知識の不足)を補完します。
検索拡張が解決する問題として、(1)知識カットオフ:LLMの学習データには最終更新日があり、最新情報を知らない。リアルタイム検索で補完、(2)ハルシネーション:根拠なく事実を「創作」する問題。検索した信頼できるソースを参照文書として与えることでグラウンディングを強化、(3)ドメイン特化:医療・法律・社内情報など専門知識は汎用LLMに含まれないことが多い。専門データベースを検索して補完があります。
検索拡張のバリエーションとして、(1)Naive RAG:質問→検索→LLM生成というシンプルなパイプライン、(2)Advanced RAG:クエリ拡張・リランキング・階層検索を加えた高精度版、(3)Modular RAG:プラグイン的にコンポーネントを入れ替え可能な柔軟な設計、(4)Graph RAG:知識グラフを検索源として活用、(5)Web Augmented Generation:リアルタイムウェブ検索をLLMに統合(Perplexity・Bing AI等)があります。
評価フレームワークとして、検索の正確性(Retrieval Precision/Recall)と生成の忠実性(Generation Faithfulness)を独立して評価することが重要で、RagasやTruLensが評価パイプラインを提供しています。
参考情報・出典
- ▸Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks— arXiv / Lewis et al. (2020)(参照日: 2026-02-26)
- ▸Advanced RAG Techniques – LlamaIndex— LlamaIndex(参照日: 2026-02-26)