一文定義
モデルマージとは、複数のfine-tunedモデルの重みを統合して、それぞれの能力を組み合わせた新モデルを作る手法です。追加学習なしで異なる専門能力を持つモデルを融合でき、Hugging Faceコミュニティで広く活用されています。
詳細解説
モデルマージ(Model Merging)とは、同じベースモデル(foundation-model)から派生した複数のfine-tunedモデルのパラメータ(重み)を数学的に統合することで、それぞれのモデルが持つ異なる能力・知識を組み合わせた新しいモデルを作成する手法です。追加の学習データも計算資源もほぼ必要なく、重みの算術演算だけで実現できる点が特徴です。
モデルマージが注目される理由は、「コーディング特化モデル」と「日本語特化モデル」を統合して「日本語でコーディングができるモデル」を作るような、異なる専門能力の組み合わせを低コストで実現できるためです。Hugging Faceのオープンモデルコミュニティで爆発的に普及しており、Open LLM Leaderboardの上位モデルの多くがマージモデルとなっています。
代表的な手法として、SLERP(球面線形補間、2モデルの滑らかな補間)、TIES-Merging(冗長パラメータを除去しながら統合)、DARE(ランダムドロップ+リスケールで干渉を削減)、Frankenmerging(異なるモデルのレイヤーを組み合わせる)などがあります。mergekitというOSSツールが多様なマージ手法を簡単に実行できる環境を提供しており、loraベースのモデルでも対応可能です。
参考情報・出典
- ▸TIES-Merging: Resolving Interference When Merging Models— arXiv / Yadav et al. (2023)(参照日: 2026-02-26)
- ▸mergekit - Model merging toolkit— Arcee AI(参照日: 2026-02-26)