一文定義
RAGとは、ユーザーの質問に関連する情報を外部データベースから検索し、その情報をLLMに渡して回答を生成させる技術です。ハルシネーションを減らし、外部データや社内情報への対応を可能にします。
詳細解説
RAG(Retrieval-Augmented Generation:検索拡張生成)とは、LLMの回答生成に先立って、関連情報を外部データソースから検索・取得し、その情報をコンテキストとしてLLMに与えることで、より正確な回答を引き出す手法です。
RAGが必要とされる主な理由は2つあります。第一に、LLMはトレーニングデータの知識しか持たないため、詳細な情報や組織固有の知識(社内規程、製品情報など)を直接答えられません。第二に、LLMはもっともらしい誤情報(ハルシネーション)を生成することがあり、根拠となるドキュメントを参照させることでこれを抑制できます。
実装の流れは「①ドキュメントをチャンクに分割→②エンベディング(ベクトル化)→③ベクトルDBに格納→④クエリをベクトル化して類似検索→⑤取得したチャンクをLLMのコンテキストに追加して回答生成」となります。社内FAQや製品ナレッジベース、法令文書への問い合わせシステムなどで広く利用されています。
参考情報・出典
- ▸Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks— arXiv / Facebook AI Research(参照日: 2026-02-25)
- ▸Retrieval augmented generation - Google Cloud— Google Cloud(参照日: 2026-02-25)
最終更新: 2026-02-25← 用語集一覧へ