Gemmaとは？わかりやすく解説

一文定義

Googleが開発した軽量オープンソースLLM。2B〜27Bのサイズでローカル実行が容易。Geminiと同じ技術基盤を持ちリソース制限環境での活用に適する。

詳細解説

Gemmaとは、Google DeepMindが開発した軽量・オープンソースの大規模言語モデルシリーズです。Googleの最先端モデルGeminiと同じ研究・技術基盤（Transformerアーキテクチャ・学習手法）を使って構築されていますが、2B〜27Bという小〜中規模のサイズに特化しており、ローカル環境やリソース制限のある環境での実行に最適化されています。

モデルラインナップとして、(1)Gemma 2（2B・9B・27B）：テキスト生成に特化した汎用モデル。27Bモデルは同サイズクラスで最高レベルの性能、(2)CodeGemma：コード生成・補完に特化したバリアント、(3)PaliGemma：画像理解（VLM）に対応したマルチモーダルバリアント、(4)RecurrentGemma：Griffin（RNNベース）アーキテクチャを採用した長文脈効率化モデルを展開しています。

技術的特徴として、(1)知識蒸留：大規模なGeminiモデルの知識を小さなGemmaに蒸留することで、サイズに対して高い性能を実現、(2)効率的なアーキテクチャ：Grouped-Query Attention（GQA）やRoPE（回転位置埋め込み）等の最新技術を採用し、推論速度とメモリ効率を最適化、(3)安全性：RLHF・安全性フィルタリング等のアライメント処理を施し、責任あるAI利用を考慮した設計となっています。

LLMアプリ開発での活用として、Ollama・llama.cpp・LM Studioでのローカル実行、Google Cloud Vertex AIでのマネージドデプロイメント、Hugging Face Transformersでのファインチューニングが可能です。特に2B・9Bモデルはモバイルデバイスや組み込み環境でも動作可能なため、エッジAIやオンデバイスAIのユースケースで注目されています。Gemmaはオープンウェイトモデルとして公開されており、研究・商用利用の両方が可能です。

参考情報・出典

▸
Gemma Official Documentation— Google DeepMind（参照日: 2026-02-26）
▸
Gemma 2 Technical Report— arXiv / Google DeepMind（参照日: 2026-02-26）

Gemma

一文定義

詳細解説

参考情報・出典

関連用語

AIスキルだけでなく、自分と未来を再設計する