一文定義
要約とは、長いテキストから重要な情報を抽出して短くまとめるLLMのタスクです。議事録・ニュース・論文・報告書などのビジネス文書処理で広く活用されています。
詳細解説
要約(Summarization)とは、長文のテキストから核心的な情報を抽出・圧縮して短いテキストとして出力するNLPタスクです。「抽出型要約(Extractive)」と「生成型要約(Abstractive)」の二種類があり、LLMは主に生成型で元の文章にない表現も使いながら自然な要約を生成します。
要約が重要な理由は、現代のビジネス環境で処理すべき文書量が増大し続けているためです。会議の議事録、長文の報告書、大量のニュース記事、学術論文などをLLMで要約することで、情報把握の時間を大幅に削減できます。
実装上の注意点として、LLMのcontext-windowを超える長文の要約には「チャンク分割+再要約」や「MapReduceパターン」が使われます。RAGと組み合わせ、大量の文書から関連部分を検索した上で要約するパターンも一般的です。要約品質の評価にはROUGEスコアが長く使われてきましたが、LLMによる評価(LLM-as-a-Judge)も普及しています。
参考情報・出典
- ▸Get To The Point: Summarization with Pointer-Generator Networks— arXiv / See et al. (2017)(参照日: 2026-02-26)
- ▸Text summarization - Wikipedia— Wikipedia(参照日: 2026-02-26)
最終更新: 2026-02-26← 用語集一覧へ