一文定義
分類とは、入力データを事前定義されたカテゴリに振り分ける機械学習の基本タスクです。スパムフィルタ・感情分析・画像認識・医療診断など最も広く使われるAI応用の基盤であり、2値分類と多クラス分類があります。
詳細解説
分類(Classification)とは、入力データ(テキスト・画像・数値等)を事前定義された離散的なカテゴリ(クラス)のいずれかに割り当てる機械学習タスクです。「このメールはスパムか否か(2値分類)」「この画像は猫・犬・鳥・魚のどれか(多クラス分類)」のように、明確なラベル付きデータで訓練するsupervised-learningの代表的なタスクです。
分類が重要な理由は、ビジネス上の意思決定の多くが「Aか、Bか、Cか」という選択の形式をとるためです。与信審査(承認・否決)、医療診断(良性・悪性)、コンテンツモデレーション(適切・不適切)、顧客セグメンテーション(優良・一般・離脱リスク)など、分類モデルが実務に直結しています。
代表的なアルゴリズムとして、ロジスティック回帰・サポートベクターマシン(SVM)・決定木・ランダムフォレスト・勾配ブースティング(XGBoost・LightGBM)・ニューラルネットワークがあります。LLMは分類タスクを自然言語の指示で処理でき、「このレビューのセンチメントを判定して」というプロンプトでsentiment-analysisが実現します。評価指標として精度(Accuracy)・適合率(Precision)・再現率(Recall)・F1スコアが使われ、不均衡データではF1やROC-AUCが重視されます。
参考情報・出典
- ▸Statistical classification - Wikipedia— Wikipedia(参照日: 2026-02-26)
- ▸Deep Learning - Goodfellow, Bengio & Courville (2016)— MIT Press(参照日: 2026-02-26)