一文定義
エンコーダーデコーダーとは、入力を固定長のベクトルに圧縮(エンコード)し、そこから出力を生成(デコード)するアーキテクチャです。機械翻訳・要約・テキスト生成の基本構造として広く用いられています。
詳細解説
エンコーダーデコーダー(Encoder-Decoder)とは、入力データを潜在的な表現(ベクトル)に圧縮するエンコーダーと、その表現から目的の出力を生成するデコーダーを組み合わせたニューラルネットワークアーキテクチャです。2014年にSutskeverらがseq2seqモデルとして提案し、機械翻訳のブレークスルーをもたらしました。
このアーキテクチャが重要な理由は、入力と出力の長さが異なるシーケンス変換タスクを自然に扱えるためです。翻訳(英語→日本語)、要約(長文→短文)、音声認識(音声波形→テキスト)など、現代のNLPタスクの多くがこの構造をベースにしています。
transformerはエンコーダーデコーダー構造をAttentionメカニズムで大幅に改良したアーキテクチャです。BERTはエンコーダーのみ、GPTはデコーダーのみ、T5・BARTはエンコーダーデコーダー両方を持つ構造として設計されています。LLMの多くはデコーダーオンリー構造を採用しており、次のトークンを順次生成することでテキストを出力します。embeddingの生成にはエンコーダー型が、テキスト生成にはデコーダー型が適しています。
参考情報・出典
- ▸Sequence to Sequence Learning with Neural Networks— arXiv / Sutskever et al. (2014)(参照日: 2026-02-26)
- ▸Encoder-decoder architecture - Wikipedia— Wikipedia(参照日: 2026-02-26)