実装

プロンプトキャッシング

プロンプトキャッシング

一文定義

プロンプトキャッシングとは、繰り返し使うプロンプト部分をサーバー側でキャッシュしてAPIコストと遅延を削減する機能です。長いシステムプロンプトや共通コンテキストに効果的です。

詳細解説

プロンプトキャッシング(Prompt Caching)とは、APIリクエスト毎に全プロンプトを再処理するのではなく、変化しない部分(システムプロンプト・長文コンテキスト・ドキュメントなど)をプロバイダーのサーバー上にキャッシュし、再利用することでトークン処理コストと応答レイテンシを削減する機能です。

プロンプトキャッシングが重要な理由は、RAGシステムや長文コンテキストを多用するアプリケーションでは、同一のベースプロンプトに対して何千ものリクエストが発生するため、キャッシュなしでは費用が線形に増大するからです。一度キャッシュが生成されると、そのトークン処理コストが大幅に削減(Anthropicの場合は最大90%削減)されます。

AnthropicはClaude APIでプロンプトキャッシングをサポートし、"cache_control"パラメータでキャッシュポイントを指定できます。OpenAIも一定の文字数以上のプロンプトに対して自動的にプロンプトキャッシングを適用する仕組みを持っています。長いシステムプロンプト・共通のコンテキスト・数十ページのドキュメントを繰り返し参照するユースケースで特に効果的です。

参考情報・出典

最終更新: 2026-02-26← 用語集一覧へ

AIスキルだけでなく、自分と未来を再設計する

生成AI活用力を体系的に習得し、自己理解・キャリアデザインを深め、志を同じくする仲間と共に学ぶ場がここにあります。

AIリブートアカデミーを見る