一文定義
対照学習とは、類似サンプルを近づけ、非類似サンプルを遠ざけることで意味のある表現を学習する手法です。CLIPやSimCLRの基盤技術であり、マルチモーダルAIのembeddingに広く活用されています。
詳細解説
対照学習(Contrastive Learning)とは、ポジティブペア(意味的に類似したサンプルの組)を潜在空間上で近づけ、ネガティブペア(非類似サンプルの組)を遠ざけることで、データの意味的な構造を捉えたembeddingを学習する手法です。ラベルなしデータを活用できる自己教師あり学習の代表的アプローチです。
対照学習が重要な理由は、ラベルなしデータから高品質な表現を学習できるためです。膨大な画像・テキスト・音声データに正解ラベルを付けることなく、意味的に関連するペアを活用することで、下流タスクに汎用的な特徴表現を獲得できます。
代表的な応用として、OpenAIのCLIP(画像とテキストのembeddingを対照学習で整合)、Google SimCLR(画像拡張を用いたビジュアル表現学習)、文埋め込みモデルのContriever等があります。vision-language-modelの多くはCLIPの対照学習で画像・テキスト表現を統合し、semantic-searchやzero-shot-learningを実現しています。fine-tuningと組み合わせることで特定ドメインへの適応も可能です。
参考情報・出典
- ▸A Simple Framework for Contrastive Learning of Visual Representations— arXiv / Chen et al. (2020)(参照日: 2026-02-26)
- ▸Learning Transferable Visual Models From Natural Language Supervision (CLIP)— arXiv / OpenAI (2021)(参照日: 2026-02-26)