一文定義
テキスト・画像をベクトル化してコサイン類似度等で意味的に近いデータを高速検索する技術。RAGの中核コンポーネント。
詳細解説
ベクトル検索(Vector Search)とは、テキスト・画像・音声などのデータを埋め込みモデルで高次元ベクトルに変換し、クエリベクトルとの類似度(コサイン類似度・内積・ユークリッド距離など)によって意味的に近いデータを高速に検索する技術です。キーワードの完全一致ではなく「意味的な近さ」で検索できる点が特徴です。
内部アルゴリズムとして、全件比較(Exact Nearest Neighbor)では精度は完璧ですが大規模データでは遅すぎるため、実用上はHNSW(Hierarchical Navigable Small World)やIVF(Inverted File Index)などの近似最近傍探索(ANN)アルゴリズムが使われます。PineconeやWeaviate・Qdrant・pgvector(PostgreSQL拡張)などのベクトルデータベースがこれらを実装済みで提供しています。
RAGシステムでのベクトル検索の流れは、(1)文書をチャンクに分割し埋め込みモデルでベクトル化してベクトルDBに保存、(2)ユーザーの質問をベクトル化、(3)質問ベクトルに近い上位K件の文書チャンクを取得、(4)取得チャンクをLLMのコンテキストに入れて回答生成、というパイプラインです。
ハイブリッド検索(キーワード検索+ベクトル検索の組み合わせ)を用いることで、固有名詞・コード・数字など意味ベクトルが弱い要素も拾える補完的な設計が推奨されています。
参考情報・出典
- ▸Vector search overview – Pinecone Documentation— Pinecone(参照日: 2026-02-26)
- ▸Qdrant – Vector Database Documentation— Qdrant(参照日: 2026-02-26)