一文定義
Googleが開発した軽量オープンソースLLM。2B〜27Bのサイズでローカル実行が容易。Geminiと同じ技術基盤を持ちリソース制限環境での活用に適する。
詳細解説
Gemmaとは、Google DeepMindが開発した軽量・オープンソースの大規模言語モデルシリーズです。Googleの最先端モデルGeminiと同じ研究・技術基盤(Transformerアーキテクチャ・学習手法)を使って構築されていますが、2B〜27Bという小〜中規模のサイズに特化しており、ローカル環境やリソース制限のある環境での実行に最適化されています。
モデルラインナップとして、(1)Gemma 2(2B・9B・27B):テキスト生成に特化した汎用モデル。27Bモデルは同サイズクラスで最高レベルの性能、(2)CodeGemma:コード生成・補完に特化したバリアント、(3)PaliGemma:画像理解(VLM)に対応したマルチモーダルバリアント、(4)RecurrentGemma:Griffin(RNNベース)アーキテクチャを採用した長文脈効率化モデルを展開しています。
技術的特徴として、(1)知識蒸留:大規模なGeminiモデルの知識を小さなGemmaに蒸留することで、サイズに対して高い性能を実現、(2)効率的なアーキテクチャ:Grouped-Query Attention(GQA)やRoPE(回転位置埋め込み)等の最新技術を採用し、推論速度とメモリ効率を最適化、(3)安全性:RLHF・安全性フィルタリング等のアライメント処理を施し、責任あるAI利用を考慮した設計となっています。
LLMアプリ開発での活用として、Ollama・llama.cpp・LM Studioでのローカル実行、Google Cloud Vertex AIでのマネージドデプロイメント、Hugging Face Transformersでのファインチューニングが可能です。特に2B・9Bモデルはモバイルデバイスや組み込み環境でも動作可能なため、エッジAIやオンデバイスAIのユースケースで注目されています。Gemmaはオープンウェイトモデルとして公開されており、研究・商用利用の両方が可能です。
参考情報・出典
- ▸Gemma Official Documentation— Google DeepMind(参照日: 2026-02-26)
- ▸Gemma 2 Technical Report— arXiv / Google DeepMind(参照日: 2026-02-26)