RAG（検索拡張生成）とは？わかりやすく解説

一文定義

RAGとは、ユーザーの質問に関連する情報を外部データベースから検索し、その情報をLLMに渡して回答を生成させる技術です。ハルシネーションを減らし、外部データや社内情報への対応を可能にします。

詳細解説

RAG（Retrieval-Augmented Generation：検索拡張生成）とは、LLMの回答生成に先立って、関連情報を外部データソースから検索・取得し、その情報をコンテキストとしてLLMに与えることで、より正確な回答を引き出す手法です。

RAGが必要とされる主な理由は2つあります。第一に、LLMはトレーニングデータの知識しか持たないため、詳細な情報や組織固有の知識（社内規程、製品情報など）を直接答えられません。第二に、LLMはもっともらしい誤情報（ハルシネーション）を生成することがあり、根拠となるドキュメントを参照させることでこれを抑制できます。

実装の流れは「①ドキュメントをチャンクに分割→②エンベディング（ベクトル化）→③ベクトルDBに格納→④クエリをベクトル化して類似検索→⑤取得したチャンクをLLMのコンテキストに追加して回答生成」となります。社内FAQや製品ナレッジベース、法令文書への問い合わせシステムなどで広く利用されています。

参考情報・出典

▸
Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks— arXiv / Facebook AI Research（参照日: 2026-02-25）
▸
Retrieval augmented generation - Google Cloud— Google Cloud（参照日: 2026-02-25）

RAG（検索拡張生成）

一文定義

詳細解説

参考情報・出典

関連用語

AIスキルだけでなく、自分と未来を再設計する