一文定義
中国のDeepSeek社が開発したオープンソースLLM。DeepSeek-R1はOpenAI o1に匹敵する推論性能を低コストで実現し、2025年初頭にAI業界に衝撃を与えた。
詳細解説
DeepSeekとは、中国のAIスタートアップであるDeepSeek社(深度求索)が開発するオープンソースの大規模言語モデルシリーズです。2024年から2025年にかけてDeepSeek-V2・V3・R1を矢継ぎ早にリリースし、特にDeepSeek-R1は推論特化型モデルとしてOpenAI o1に匹敵する性能を大幅に低いコストで実現したことで、2025年1月にAI業界に大きな衝撃を与えました。
技術的特徴として、DeepSeek-V3/R1は(1)Mixture of Experts(MoE)アーキテクチャ:671Bパラメータのうち推論時にアクティブなのは37Bのみで、計算効率を大幅に向上、(2)Multi-head Latent Attention(MLA):KVキャッシュの圧縮により推論時のメモリ使用量を削減、(3)FP8混合精度学習:低精度演算の活用で学習コストを約1/10に削減する技術を採用しています。
DeepSeek-R1は推論特化型モデルで、応答前に内部で「思考の連鎖」を実行します。OpenAI o1と異なり思考プロセスが公開されており、数学・コーディング・科学的推論で最先端レベルの性能を達成しています。注目すべきは、R1の学習コストがわずか約560万ドルと推定され、OpenAI o1の開発コストの数十分の一とされている点です。
AI業界への影響として、DeepSeek-R1の登場は(1)オープンソースモデルが商用最先端モデルに匹敵できることを実証、(2)大規模な計算資源がなくても高性能モデルを開発できることを示し、「スケーリング法則の限界」に関する議論を活性化、(3)中国のAI技術力の急速な向上を世界に示す契機となりました。モデルはオープンウェイト(MIT License)で公開され、Together AI・Groq・Replicate等のプラットフォームで利用可能です。
参考情報・出典
- ▸DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning— arXiv / DeepSeek(参照日: 2026-02-26)
- ▸DeepSeek Official Website— DeepSeek(参照日: 2026-02-26)