一文定義
エンベディングとは、テキストや画像などのデータを数値ベクトルに変換する技術です。意味的に近いデータ同士はベクトル空間で近くに配置されるため、類似検索やRAGの基盤として機能します。
詳細解説
エンベディング(Embedding:埋め込み)とは、テキスト・画像・音声などのデータをAIが扱いやすい数値ベクトル(浮動小数点の数値の配列)に変換する技術です。
エンベディングが重要な理由は、意味的に似たデータが数値空間の中で近い位置(高いコサイン類似度)に配置されるためです。これにより、「犬」と「猫」は「犬」と「自動車」よりも近いベクトル表現になります。
主な活用場面は3つあります。①RAGのパイプラインで、ドキュメントをベクトル化してベクトルDBに格納し、クエリとの類似検索を行う②セマンティック検索システムの構築③レコメンデーション(類似商品・記事の提案)。OpenAIやCohere、Google等がAPIとして提供しており、数百〜数千次元のベクトルを生成します。
参考情報・出典
- ▸Embeddings - OpenAI Documentation— OpenAI(参照日: 2026-02-25)
- ▸Word embedding - Wikipedia— Wikipedia(参照日: 2026-02-25)
最終更新: 2026-02-25← 用語集一覧へ