一文定義
情報検索とは、ユーザーのクエリに対して大規模文書集合から関連情報を効率的に検索・取得する技術体系です。RAGの基盤技術であり、BM25・ベクトル検索・ハイブリッド検索などの手法で実装されます。
詳細解説
情報検索(Information Retrieval、IR)とは、大規模なテキスト文書集合の中から、ユーザーの情報ニーズ(クエリ)に適合する文書や情報を効率的に見つけ出して提供するための理論・技術体系です。Webサーチエンジン(Google等)から社内文書検索まで幅広いシステムの基盤となっています。
情報検索が重要な理由は、人間が必要な情報を適切なタイミングで入手できるかどうかがあらゆる知的活動の効率を決定するためです。LLMの普及以降、情報検索はRAGの「R(Retrieval)」として生成AIシステムの中核コンポーネントとなっており、情報検索の品質がRAGシステム全体の回答品質を左右します。
主な技術として、語彙ベース検索(BM25・TF-IDF:キーワードの一致度でスコアリング)、密ベクトル検索(Dense Retrieval:embeddingによるsemantic-search)、sparse+denseを組み合わせたhybrid-search、検索結果を精緻化するrerankingがあります。評価指標にはPrecision@K・Recall@K・MRR(Mean Reciprocal Rank)・NDCG(Normalized Discounted Cumulative Gain)が使われます。BEIRベンチマークがゼロショット検索能力の標準評価として広く参照されています。
参考情報・出典
- ▸Introduction to Information Retrieval— Manning, Raghavan & Schütze (2008) / Cambridge University Press(参照日: 2026-02-26)
- ▸Information retrieval - Wikipedia— Wikipedia(参照日: 2026-02-26)