LLMセキュリティとは？わかりやすく解説

一文定義

LLMアプリケーションを標的とした攻撃（プロンプトインジェクション・データ流出・モデル操作）への防御と脆弱性管理。

詳細解説

LLMセキュリティ（LLM Security）とは、LLMを組み込んだアプリケーション・サービスを標的とした固有の攻撃手法を理解し、適切な防御策・脆弱性管理・インシデント対応を設計するセキュリティ分野です。OWASP（Open Worldwide Application Security Project）が2023年に「LLM Top 10」を公開し、LLM固有のリスクを体系化しました。

OWASP LLM Top 10の主要リスクとして、(1)プロンプトインジェクション：悪意ある指示をユーザー入力に埋め込み、モデルに意図しない動作をさせる（最重要リスク）、(2)インセキュアな出力処理：LLM出力をサニタイズせず直接実行しXSS・SQLインジェクションが発生、(3)訓練データポイズニング：学習データに悪意あるデータを混入してモデル挙動を操作、(4)モデルDoS：意図的に大量トークンを消費させてサービス不能にする、(5)過度な権限付与：エージェントに必要以上のツール・API権限を与えるリスクがあります。

防御のベストプラクティスとして、(1)入力バリデーション：ユーザー入力の長さ制限・禁止パターン検出、(2)最小権限の原則：エージェントに必要最低限のツール権限のみ付与、(3)出力サニタイゼーション：LLM出力をHTML/SQLに渡す前にエスケープ処理、(4)プロンプトインジェクション対策：信頼できる指示と外部入力を明確に分離、(5)レート制限とコスト上限の設定があります。

LLMセキュリティはWebアプリケーションセキュリティの知識を基礎としながら、AI固有のリスクモデルを追加した複合的な専門領域です。

参考情報・出典

▸
OWASP Top 10 for LLM Applications— OWASP（参照日: 2026-02-26）
▸
NIST AI Risk Management Framework— NIST（参照日: 2026-02-26）

LLMセキュリティ

一文定義

詳細解説

参考情報・出典

関連用語

AIスキルだけでなく、自分と未来を再設計する