一文定義
潜在空間とは、ニューラルネットワークが入力データを変換した高次元ベクトル表現の空間で、意味的に似たデータが近い位置に配置される性質を持ち、埋め込み・生成モデル・RAGすべての基盤となる概念です。
詳細解説
潜在空間(Latent Space)とは、ニューラルネットワークが入力データ(テキスト・画像・音声など)を内部で変換した際に生成される、連続的な高次元ベクトルの空間です。「潜在」とは、人間には直接観測できない隠れた表現という意味です。
**なぜ潜在空間が重要なのか:** 生のデータ(テキストや画像のピクセル)には冗長性が多く、そのままでは類似性の計算や生成が困難です。潜在空間では: - 意味的に近いデータは空間的にも近くなる - データの本質的な構造・関係が圧縮されて表現される - 連続空間内の補間や演算が意味のある変換に対応する
**具体的なイメージ:** テキスト埋め込みでは「王様」「女王」「男性」「女性」という概念が、「女王 ≈ 王様 − 男性 + 女性」が成立するような幾何学的関係で配置されます。
**主な利用場面:**
**1. 埋め込み・セマンティック検索** 文書をベクトル化し潜在空間に配置することで、意味的類似度でRAG検索を実現。
**2. 生成モデル(VAE / 拡散モデル)** 潜在空間内でランダムサンプリングや操作を行い、新しい画像・テキストを生成。Stable Diffusionはノイズを含む潜在ベクトルを段階的に除去して画像を生成します。
**3. 異常検知・クラスタリング** 学習データの分布から外れた点(異常)を潜在空間での距離で検出。
**次元削減との関係:** PCA・t-SNE・UMAPは高次元潜在空間を2〜3次元に圧縮して可視化するツールとして使われます。これにより「モデルが何を学んだか」を直感的に確認できます。
参考情報・出典
- ▸Auto-Encoding Variational Bayes— arXiv / Kingma & Welling(参照日: 2026-02-26)
- ▸Deep Learning (Goodfellow et al.) Chapter 14— MIT Press(参照日: 2026-02-26)