一文定義
セマンティックセグメンテーションとは、画像の各ピクセルをクラスに分類するコンピュータビジョンタスクです。自動運転・医療画像解析で必須の技術で、Segment Anything Model(SAM)の登場で汎用化が加速しました。
詳細解説
セマンティックセグメンテーション(Semantic Segmentation)とは、入力画像の各ピクセル(画素)に対してクラスラベル(道路・車・人・空等)を割り当てる、ピクセルレベルの画像分類タスクです。object-detectionが矩形ボックスで物体の位置を示すのに対し、セグメンテーションは物体の正確な輪郭・形状をピクセル精度で識別します。
セマンティックセグメンテーションが重要な理由は、物体の「どこにあるか」ではなく「どこまでが何か」を正確に把握する必要がある用途に不可欠なためです。自動運転では「この領域は走行可能な道路か歩道か」、医療では「この領域が腫瘍か正常組織か」という判断がピクセル精度で必要です。
2023年にMeta AIが発表した「Segment Anything Model(SAM)」は、あらゆる画像の任意の物体を指示に従って高精度にセグメントできる汎用モデルで、セマンティックセグメンテーションの可能性を大きく広げました。SAM 2(2024年)は動画への対応も実現しました。vision-language-modelとの統合により、「この画像の犬だけをセグメントして」という自然言語指示での精密なセグメンテーションも可能になっています。
参考情報・出典
- ▸Segment Anything— arXiv / Kirillov et al. / Meta AI (2023)(参照日: 2026-02-26)
- ▸Semantic segmentation - Wikipedia— Wikipedia(参照日: 2026-02-26)