生成AI用語集

推論モデルとは、回答前に内部で思考プロセス（Chain-of-Thought）を実行し、複雑な数学・論理・コーディング問題を解く能力に特化したLLMです。

知識蒸留

知識蒸留とは、大規模モデル（教師）の知識を小規模モデル（生徒）に転移させてモデルを軽量化する技術で、エッジデバイス展開に有効です。

AIエージェントベンチマーク

AIエージェントベンチマークとは、AIエージェントの能力を測定するための標準テスト群で、SWE-bench（コーディング）・WebArena（Web操作）・GAIA（汎用タスク）等がありエージェントAIの進歩を追跡します。

AIレッドチーム

AIレッドチームとは、AIシステムの脆弱性・有害出力・セーフティ問題を意図的に探索する専門チームまたは活動で、OpenAI・Anthropic等が公開前に社内外の専門家によるモデル攻撃的評価を実施します。

AIサーチグラウンディング

AIサーチグラウンディングとは、LLMの回答をリアルタイムWeb検索結果に基づかせる技術で、知識カットオフ問題を解消して最新情報を提供します。Perplexity・Gemini with Search・ChatGPT Searchが代表例です。

AI生成動画

AIセイセイドウガ

AI金融

AIきんゆう

AI金融とは、金融業界でのAI活用で、アルゴリズム取引・リスク管理・不正検出・信用スコアリング・顧客サービス・投資調査の自動化を指し、Bloomberg GPT・FinGPTなど金融特化LLMも登場しています。

AI創薬

AIそうやく

エーアイガバナンス

AIガバナンスとは、AIの開発・運用・利用を適切に管理するための方針・ルール・体制の総称です。リスク管理、透明性確保、倫理的利用の担保を目的とします。

オーケストレーション

AIオーケストレーションとは、複数のAIエージェント・ツール・モデルの実行順序・データ連携・エラー処理を統括する制御層のことです。複雑なAIワークフローを管理します。

アライメント（AI Alignment）

アライメント

AIアライメントとは、AIシステムの目標・価値観・行動を人間の意図や倫理観に一致させるための研究・技術・取り組みの総称です。AIの安全性を確保する上で中心的なテーマです。

アテンションメカニズム

アテンションメカニズムとは、入力の各部分に重みを付けて重要な情報に集中する機構です。トランスフォーマーの中核技術であり、LLMが文脈を理解する基盤となっています。

インストラクションチューニング

インストラクションチューニングとは、指示形式のデータでモデルを微調整し、指示に従う能力を高める手法です。事前学習済みモデルをチャットボットや業務AIとして実用化するための重要な工程です。

OpenAI API

オープンエーアイエーピーアイ

OpenAI APIとは、OpenAIが提供するGPTシリーズ等のモデルをHTTP経由で利用できるAPIで、テキスト生成・画像生成・音声変換など多様なAI機能をアプリケーションに組み込めます。

オープンソースLLM

オープンソースLLMとは、ソースコードや重みが公開されているLLMです。Meta LLaMA・Mistralが代表例で、ローカル実行・カスタマイズ・コスト削減が強みです。

AI規制

エーアイきせい

AI規制とは、AIシステムの開発・利用に関する法的ルール・ガイドラインの総称です。EU AI法が世界初の包括的AI規制として注目され、各国で規制整備が加速しています。

エンコーダーデコーダー

エンコーダーデコーダーとは、入力を固定長のベクトルに圧縮（エンコード）し、そこから出力を生成（デコード）するアーキテクチャです。機械翻訳・要約・テキスト生成の基本構造として広く用いられています。

AI検索

エーアイけんさく

AI検索とは、LLMを組み込んで自然言語での質問に直接回答する次世代検索エンジンです。Perplexity AI、Google AI Overviewsが代表例で、従来のリンク一覧型検索を変革しています。

エージェントメモリとは、AIエージェントが過去の行動・会話・知識を保持し長期的に一貫した動作をするための記憶機構です。短期・長期・エピソード記憶に分類され、自律型エージェントの中核コンポーネントです。

アテンションシンクとは、LLMのアテンション機構で最初のトークンが異常に高いアテンション重みを受ける現象で、StreamingLLMの研究で発見され、無限長文脈での推論を可能にするKVキャッシュ管理に活用されています。

エージェントループとは、AIエージェントが環境を認識→推論→行動→観察を繰り返すサイクルで、ReActフレームワークの「Thought→Action→Observation」反復がエージェントAIの基本アーキテクチャとして広く採用されています。

アテンションマップ

アテンションマップとは、トランスフォーマーの各アテンションヘッドがどのトークンに注意を向けているかを可視化した熱マップで、モデルの解釈可能性研究・デバッグ・エラー分析にBertVizなどのツールで描画されます。

アダプターチューニング

アダプターチューニングとは、トランスフォーマーの各層に小さなアダプターモジュールを挿入し、元のパラメータを固定したまま新タスクに適応させるPEFT手法で、LoRAと並ぶパラメータ効率的な転移学習技術です。

71件

コンテキストウィンドウ

コンテキストウィンドウとは、LLMが一度に処理できるトークン数の上限です。ウィンドウ内の全情報がモデルの「作業記憶」となり、長い文書の処理や長期会話の精度に直接影響します。

機械学習（マシンラーニング）

きかいがくしゅう（マシンラーニング）

機械学習とは、コンピュータがデータからパターンを自動的に学習し、明示的にプログラムしなくてもタスクを実行できるようにするAI技術の総称です。ディープラーニングはその代表的な手法です。

拡散モデル（Diffusion Model）

かくさんモデル（ディフュージョンモデル）

拡散モデルとは、画像にノイズを段階的に加えてから除去する過程を学習し、ランダムなノイズから高品質な画像を生成するAIモデルです。現在の画像生成AIの主流技術です。

きょうしなしがくしゅう

教師なし学習とは、ラベルなしデータからパターンや構造を自律的に発見する機械学習手法です。クラスタリング・次元削減・異常検知に活用され、LLMの事前学習もこの考え方を応用しています。

コンピュータビジョンとは、画像・動画から情報を抽出・理解するAI技術の総称です。画像認識・物体検出・セグメンテーション・OCRを包含し、自動運転・医療・製造・小売など幅広い産業に応用されています。

回帰（リグレッション）

かいき

回帰とは、入力から連続値（数値）を予測する機械学習タスクです。株価予測・需要予測・不動産評価・気温予測など、「いくら？いくつ？どのくらい？」という量的な予測に使われる教師あり学習の基本形です。

画像生成

がぞうせいせい

テキストや画像を入力としてAIが新たな画像を生成する技術の総称。Stable Diffusion・DALL-E・Midjourneyが代表例。

コードインタープリターとは、LLMがPythonコードを記述・実行してデータ分析・グラフ作成・ファイル処理をリアルタイムで行う機能で、ChatGPT Advanced Data Analysisが普及させ、AIの活用範囲を大きく広げました。

継続的バッチ処理

けいぞくてきバッチしょり

継続的バッチ処理とは、LLM推論サーバーがリクエストを動的にバッチ化し、GPU利用率を最大化する技術で、トークン生成中に新しいリクエストをバッチに追加してスループットを大幅に向上させます。

合成事前学習

ごうせいじぜんがくしゅう

合成事前学習とは、実データ不足を補うために合成データで事前学習を行う手法で、Phi-1・Phi-2・Phi-3がコード・教科書品質の合成データのみで高性能を達成し、「小さいモデルで大きな性能」の可能性を示しました。

検索拡張ファインチューニング（RAFT）

けんさくかくちょうファインチューニング

検索拡張ファインチューニング（RAFT）とは、RAGシステムでの利用を想定してノイズ文書も含めた検索結果から学習させるファインチューニング手法で、ドメイン固有のRAG精度を大幅に向上させます。

クロスアテンション

クロスアテンションとは、エンコーダーとデコーダー間でクエリをデコーダー側、キー・バリューをエンコーダー側から取る注意機構で、翻訳・画像キャプション・マルチモーダルモデルにおける異なるモダリティ間の情報統合に使われます。

画像キャプション生成

がぞうキャプションせいせい

画像キャプション生成とは、画像の内容を自然言語で説明するテキストを自動生成するタスクで、CLIPやViTなどのビジョンモデルとLLMを組み合わせ、アクセシビリティ・画像検索・医療画像説明に応用されます。

Classifier-Free Guidance（CFG）

クラシファイアーフリーガイダンス

Classifier-Free Guidance（CFG）とは、拡散モデルで条件付き生成を制御するテクニックで、分類器なしにテキストプロンプトへの準拠度をガイダンススケールで調整します。値が高いほどプロンプトに忠実な生成結果が得られます。

サ行

58件

GPT

ジーピーティー

GPTとは、OpenAIが開発したトランスフォーマーベースの言語モデルシリーズで、GPT-4oをはじめとする主要モデルはテキスト・画像・音声を扱うマルチモーダルAIとして広く普及しています。

生成AI（ジェネレーティブAI）

せいせいエーアイ

生成AIとは、テキスト・画像・音声・動画などを新たに生成できるAI技術の総称です。LLMを中心に急速に普及し、ビジネスや創作活動に変革をもたらしています。

CoT（Chain of Thought）

シーオーティー（チェーン・オブ・ソート）

CoTとは、LLMに「ステップごとに考える」よう促すプロンプト技法です。「ステップバイステップで考えて」と指示するだけで、複雑な推論問題の正答率が大幅に向上します。

Zero-shot学習

ゼロショットがくしゅう

Zero-shot学習とは、入力例を一切示さずにLLMに新しいタスクを実行させる技法です。事前学習で得た汎用知識だけで、説明のみから対応するLLMの能力を活用します。

推論（インファレンス）

すいろん（インファレンス）

推論とは、学習済みのAIモデルが新しい入力データに対して出力を生成するプロセスです。AIの「実際に使う段階」を指し、学習（トレーニング）とは区別されます。

システムプロンプト

システムプロンプトとは、LLMの動作の前提条件（役割・制約・出力形式など）を設定するための特別なプロンプトです。ユーザーからは見えない状態で適用されることが多く、アプリ開発の要です。

セマンティック検索

情報検索

じょうほうけんさく

情報検索とは、ユーザーのクエリに対して大規模文書集合から関連情報を効率的に検索・取得する技術体系です。RAGの基盤技術であり、BM25・ベクトル検索・ハイブリッド検索などの手法で実装されます。

セマンティックチャンキング

セマンティックチャンキングとは、RAGにおいてドキュメントを意味的な塊（チャンク）に分割する手法です。固定文字数分割と異なり意味的な境界で分割するため、検索精度と回答品質が向上します。

AIが自分自身を相手に対戦・競争を繰り返して学習する強化学習手法。AlphaGoがチェスや囲碁で人間を超え、LLMの自己改善トレーニングにも応用される。

スーパーアライメント

スーパーアライメントとは、人間の知的能力を超えるAIシステムを安全に整合させる研究領域で、OpenAIが2023年に専任チームを設置し、AIを使って超知能AIのアライメント問題を自動的に解くことを目指す壮大な取り組みです。

潜在空間

せんざいくうかん

潜在空間とは、ニューラルネットワークが入力データを変換した高次元ベクトル表現の空間で、意味的に似たデータが近い位置に配置される性質を持ち、埋め込み・生成モデル・RAGすべての基盤となる概念です。

スケーラブル監督

スケーラブルかんとく

スケーラブル監督とは、AIが人間の評価能力を超えるタスクをこなすようになったときに正しいフィードバックを与え続けるための研究領域で、議論支援・AIが採点するAIなど、人間の監督能力を拡張する手法を探求します。

GQA（グループクエリアテンション）

ジーキューエー（グループクエリアテンション）

トークナイザーとは、テキストをLLMが処理できるトークン単位に分割するツール・アルゴリズムです。トークン化の方式がモデルの日本語処理能力やコストに直接影響します。

ツールユース

ツールユースとは、LLMが外部ツール（検索・計算機・APIなど）を呼び出してタスクを完遂する能力と仕組みで、エージェント実装の中核技術です。

音声合成（Text-to-Speech）

テキストトゥスピーチ

音声合成（TTS）とは、テキストを自然な音声に変換するAI技術です。OpenAI TTS・ElevenLabsなどが代表的で、読み上げ・音声AIに活用されます。

転移学習（トランスファーラーニング）

てんいがくしゅう

転移学習とは、既存タスクで学習した知識を別タスクに応用する手法です。LLMのfine-tuningの基盤となる概念で、少ないデータで高い性能を実現できます。

対照学習

たいしょうがくしゅう

対照学習とは、類似サンプルを近づけ、非類似サンプルを遠ざけることで意味のある表現を学習する手法です。CLIPやSimCLRの基盤技術であり、マルチモーダルAIのembeddingに広く活用されています。

データポイズニング

データポイズニングとは、学習データに悪意あるサンプルを混入させてモデルの挙動を意図的に改ざんする攻撃手法です。AIシステムのセキュリティリスクとして、OWASP LLM Top 10にも挙げられています。

敵対的攻撃

てきたいてきこうげき

敵対的攻撃とは、人間には知覚されにくい微小な摂動をデータに加えてAIモデルを誤分類させる攻撃手法です。画像認識・音声認識・LLMなど幅広いAIシステムの堅牢性に関わる重要なセキュリティ課題です。

DALL-E（ダリ）

ダリ

DALL-Eとは、OpenAIが開発したテキストから高品質な画像を生成するモデルシリーズです。DALL-E 3では自然言語での細かな画像制御が可能になり、ChatGPTやAPIに統合されて広く使われています。

ツリーオブソート（ToT）

ツリーオブソート

ツリーオブソート（Tree of Thoughts）とは、LLMが複数の思考パスを木構造で探索・評価しながら問題を解くプロンプト戦略です。Chain-of-Thoughtの発展形で、複雑な推論・計画タスクで有効です。

ディープフェイク

ディープフェイクとは、AIを使って本物と見分けがつかない偽の動画・音声・画像を生成する技術です。詐欺・フィッシング・選挙干渉・非合意的な性的コンテンツ生成などの悪用が社会問題化しています。

チェーンオブデンシティ（CoD）

チェーンオブデンシティ

チェーンオブデンシティ（Chain of Density）とは、要約の情報密度を段階的に高めながら情報損失を最小化する要約プロンプト手法です。GPT-4で有効性が実証され、高品質な要約生成の実践的テクニックとして注目されています。

投機的デコーディング

とうきてきデコーディング

投機的デコーディングとは、小型モデルで候補トークンを先読みし、大型モデルで検証することで推論速度を大幅に向上させる技術です。出力品質を保ちながらレイテンシを削減できます。

チャットボットとは、テキストや音声で人間と自動的に会話するソフトウェアです。ChatGPTの登場でLLMベースの高精度チャットボットが急速に普及し、カスタマーサポート・社内ヘルプデスク・教育など幅広い場面で活用されています。

データセット

データセットとは、AI・機械学習モデルの学習・評価に使う構造化されたデータの集合です。品質・量・多様性がモデル性能に直結し、ImageNet・Wikipedia・Common Crawlなどが代表的なデータセットです。

データサイエンス

統計・機械学習・データエンジニアリングを組み合わせてデータから価値を引き出す学際的な分野。AI・ML開発の基盤となるスキルセット。

テキスト生成

テキストせいせい

LLMがプロンプトに基づいて文章・記事・コード・詩等を自動生成する機能。生成AIの最も基本的なアウトプット形式。

動画生成

どうがせいせい

テキストや画像を入力としてAIが動画を自動生成する技術。Sora・Runway・Pika等が代表例。エンタメ・広告制作を変えつつある。

チェーン・オブ・ソート・プロンプティング

チェーンオブソートプロンプティング

「ステップバイステップで考えてください」等の指示でLLMの推論過程を引き出すプロンプト手法。CoTの実践的応用。

トークン制限

トークンせいげん

APIリクエストごとの最大トークン数（入力＋出力）の上限値。コスト管理と長文処理の設計に直結する制約。

デジタルツイン

物理的な物体・プロセス・システムをリアルタイムでシミュレートする仮想モデル。AIと組み合わせて製造・都市・医療で活用される。

データ拡張

データかくちょう

既存学習データに反転・回転・クロップ・ノイズ付加等の変換を加えてデータ量を人工的に増やす手法。過学習防止に有効。

特徴量エンジニアリング

とくちょうりょうエンジニアリング

機械学習モデルの性能を高めるために生データから有用な入力変数（特徴量）を設計・選択・変換するプロセス。

Top-K サンプリング

トップケーサンプリング

LLMのテキスト生成時に次トークン候補を確率上位K個に絞って選択するサンプリング手法。temperatureやtop-pと組み合わせて多様性と品質を制御する。

データパイプライン

データの収集・クレンジング・変換・保存・配信を自動化する一連のプロセス。AI/MLシステムの学習・推論データ供給を担う。

ドロップアウト

学習時にランダムにニューロンを無効化して過学習を防ぐ正則化手法。推論時は全ニューロンを使用し重みをスケール調整する。

TTS（テキスト音声合成）

ティーティーエス（テキストおんせいごうせい）

テキストを音声に変換する技術（Text-to-Speech）。OpenAI TTS・ElevenLabs・Google Cloud TTS等が代表で、自然な発話品質でAIアシスタントに不可欠。

ドキュメントQ&A

ドキュメントキューアンドエー

PDFや文書ファイルをアップロードしてLLMに質問できるシステム。RAGを活用してドキュメント内の情報を根拠として回答を生成する。

ディープシーク

中国のDeepSeek社が開発したオープンソースLLM。DeepSeek-R1はOpenAI o1に匹敵する推論性能を低コストで実現し、2025年初頭にAI業界に衝撃を与えた。

ディフュージョンポリシーとは、ロボット制御に拡散モデルを応用した手法で、人間のデモンストレーションから複雑な操作スキルを学習でき、ロボット工学とAIの融合を代表する注目技術です。

ツール拡張生成

ツールカクチョウセイセイ

ツール拡張生成とは、LLMが外部ツール（電卓・検索・コード実行等）を呼び出して回答を生成するアーキテクチャで、RAGを超えた能動的な情報取得・処理が可能で、ReActフレームワークが代表的です。

トークンエコノミクス

トークンエコノミクスとは、LLM APIの利用コストをトークン単価・入出力比・キャッシュ効率で最適化する考え方で、プロンプト設計・モデル選択・バッチ処理戦略がROIに直結するビジネス重要概念です。

データフライホイール

データフライホイールとは、ユーザーが使えば使うほどデータが蓄積しモデルが改善され更に多くのユーザーが集まる好循環で、AIプロダクトの競争優位の源泉です。ChatGPT・Copilotが典型例です。

データキュレーション

データキュレーションとは、LLM学習のためにデータを体系的に収集・選別・クリーニング・品質評価する工程で、FineWebやRedPajamaなどの高品質コーパス構築で重要性が増し、「データの質がモデル性能を左右する」ことが広く認識されています。

多言語LLM

たげんごエルエルエム

多言語LLMとは複数言語で学習・推論できるLLMで、mBERT・XLM-R・Ayaが代表的。日本語特化モデルにはSwallow・Tanukiがあり、言語間転移学習により少数言語でも高い性能を発揮します。

チェーンオブコード

チェーンオブコードとは、LLMがコードを記述・実行することで推論を行う手法で、数値計算・データ処理・論理演算をコードで正確に解き、プログラム実行結果を答えに組み込むことでCoTの計算ミスや論理の曖昧さを補います。

のうどうがくしゅう

能動学習とは、モデルが最も学習効果の高いサンプルを自ら選択してラベル付けを依頼する、効率的なデータ収集・学習手法です。アノテーションコストを最小化しながら性能を最大化します。

ナレッジベース

組織や製品の情報を構造化して蓄積・検索可能にしたデータベース。RAGシステムの情報源として活用。

ノーコードAI

ノーコードエーアイ

プログラミング不要でAI機能を構築・活用できるツール・プラットフォーム。Make・Zapier・Difyが代表例。非エンジニアのAI活用を加速。

ニューラルアーキテクチャ探索

ニューラルアーキテクチャたんさく

最適なニューラルネットワーク構造を自動的に探索するAI技術（NAS）。人間によるアーキテクチャ設計を自動化する。

能力引き出し（ケイパビリティ・エリシテーション）

ノウリョクヒキダシ（ケイパビリティ・エリシテーション）

能力引き出しとは、LLMが潜在的に持つ能力を最大限に引き出すプロンプト・手法を探る研究領域で、Few-shot・CoT・ツール使用等で隠れた能力が現れることがありフロンティアモデル評価に重要です。

ニューラルスケーリング

ニューラルスケーリングとは、モデルサイズ・データ量・計算量を増やすと予測可能な形で性能が向上する法則の実証的研究で、Chinchilla法則がパラメータとデータの最適比率を示しLLM開発の指針となっています。

ナレッジ編集

ナレッジ編集とは、再学習なしでLLMが持つ特定の事実的知識を標的型に修正・追加・削除する技術で、ROME・MEMITが代表的手法として知られています。

NeRF（ニューラルラジアンスフィールド）

ニューラルラジアンスフィールド

NeRFとは、複数の2D画像からニューラルネットワークで3Dシーンを暗黙的に表現する技術です。新視点からのレンダリングを可能にし、3D生成・AR/VR・ロボティクスに応用されています。

ハ行

69件

プロンプト

プロンプトとは、AIモデルに対して送る入力テキストの総称です。AIへの「指示書」にあたり、プロンプトの書き方次第で出力の品質が大きく変わります。

ファインチューニング

ファインチューニングとは、事前学習済みの大規模モデルを特定タスク・ドメインのデータで追加学習し、その領域の性能を向上させる技術です。

ハルシネーション（幻覚）

ハルシネーション（げんかく）

ハルシネーションとは、LLMが事実と異なる情報をもっともらしく生成する現象です。自信満々に嘘をつくため、出力の事実確認が必須となります。

Few-shot学習

フューショットがくしゅう

Few-shot学習とは、プロンプト内に少数の入出力例（ショット）を示すことでLLMに望ましい回答形式・スタイルを学ばせる技法です。追加学習なしに出力の品質を向上できます。

プロンプトエンジニアリング

プロンプトエンジニアリングとは、LLMから望ましい出力を引き出すためにプロンプトを体系的に設計・最適化するスキルと技術体系です。モデルの再学習なしに性能を向上させる方法です。

Function Calling（ツール呼び出し）

ファンクションコーリング（ツールよびだし）

Function Callingとは、LLMがユーザーの意図を解釈し、定義済みの関数（外部API・DBなど）を適切なパラメータで呼び出す指示を返す機能です。AIと外部システムを連携させる基盤技術です。

ベクトルDB（ベクトルデータベース）

ベクトルデータベース

ベクトルDBとは、エンベディング（ベクトル）を効率的に格納・検索するために設計されたデータベースです。RAGシステムの中核として、意味的に類似した情報を高速に取り出せます。

バイアス（AIバイアス）

バイアス（エーアイバイアス）

AIバイアスとは、AIモデルの訓練データや設計に内在する偏りによって、特定の属性（性別・人種・年齢等）に対して不公平な出力が生じる問題です。

評価指標（BLEU / ROUGE）

ひょうかしひょう（ブルー / ルージュ）

BLEUとROUGEとは、AIが生成したテキストの品質を自動評価するための代表的な指標です。参照テキストとの一致度を数値化し、翻訳・要約・対話システムの性能比較に使われます。

ベンチマーク

ベンチマークとは、AIモデルの性能を測定・比較するための標準化されたテストセットです。MMLUやHumanEvalなど様々なベンチマークが存在し、モデル選定の指標として活用されます。

プロンプトインジェクション

プロンプトインジェクションとは、悪意ある入力をプロンプトに埋め込みAIの動作を乗っ取る攻撃です。OWASP LLM Top 10で最重要リスク（LLM01）に挙げられています。

パラメーター

パラメーターとは、ニューラルネットワークが学習によって調整する内部変数（重みとバイアス）の総称で、モデルの規模はB（十億）やT（兆）の単位で表します。

Hugging Face（ハギングフェイス）

ハギングフェイス

Hugging Faceとは、事前学習済みモデルやデータセットの公開・共有・活用を支援するAIプラットフォームで、オープンソースAI開発のハブとして機能しています。

プロンプトキャッシング

プロンプトキャッシングとは、繰り返し使うプロンプト部分をサーバー側でキャッシュしてAPIコストと遅延を削減する機能です。長いシステムプロンプトや共通コンテキストに効果的です。

VRAM

ブイラム

VRAMとはGPU上の専用メモリ（Video RAM）で、LLMの推論・学習時にモデルの重みを保持するために必要です。容量がモデルサイズの実行可能性を決定します。

プライバシー（AI文脈）

プライバシー

AIにおけるプライバシーとは、AIの学習・推論過程における個人情報の保護を指します。学習データへの無断利用や推論時の情報漏洩が主要リスクで、適切な対策が求められます。

ビジョン言語モデル（VLM）

ビジョンげんごモデル

ビジョン言語モデル（VLM）とは、画像とテキストの両方を入力・出力できるマルチモーダルAIモデルです。GPT-4V、Gemini、Claudeなどが代表例で、画像の理解・説明・分析に活用されます。

BERT（バート）

バート

BERTとは、Googleが2018年に開発した双方向Transformerエンコーダモデルです。文脈を左右両方向から読む設計で高精度な自然言語理解（NLU）を実現し、多くのNLPタスクで当時の最高性能を記録しました。

PEFT（パラメータ効率的ファインチューニング）

ペフト

PEFTとは、モデルの全パラメータを更新せず一部のみを調整して効率的にfine-tuningする手法群（Parameter-Efficient Fine-Tuning）です。LoRA・Adapter・Prefix Tuningが代表例で、少ないGPUリソースで大規模モデルを適応できます。

プロンプトチューニング

ハイパーパラメータとは、学習前に人間が設定するモデル外部のパラメータです（学習率・バッチサイズ・エポック数・レイヤー数等）。モデルの性能に大きく影響し、AutoMLや手動チューニングで最適値を探索します。

Phi（ファイ）

ファイ

Phiとは、Microsoftが開発する小型高性能LLMシリーズです。高品質な合成データで訓練することでGPT-3.5相当の性能を大幅に小さいパラメータ数で実現し、「小さなモデルでも良いデータがあれば賢くなれる」を証明しました。

物体検出

ぶったいけんしゅつ

物体検出とは、画像内の複数の物体を矩形（バウンディングボックス）で位置検出しながら同時にクラス分類するコンピュータビジョンタスクです。YOLOシリーズが代表的で、自動運転・監視カメラ・小売業で広く活用されています。

FlashAttention

フラッシュアテンション

FlashAttentionとは、TransformerのAttention計算をGPUメモリ階層を考慮して最適化し、速度向上とメモリ削減を実現するアルゴリズムです。ほぼすべての現代LLMの学習・推論に採用されている重要な基盤技術です。

ヒューマンインザループ

ヒューマンインザループとは、AIの判断プロセスに人間が介在して確認・修正・承認を行う設計パターンです。高リスクな判断・低信頼度ケースで品質と安全性を担保するAI運用の重要な原則です。

プロンプトチェーニング

プロンプトチェーニングとは、複数のプロンプトを連鎖させ前のLLM出力を次のプロンプトの入力として活用することで複雑なタスクを段階的に処理する手法です。エージェントワークフローの基本パターンの一つです。

ViT（ビジョントランスフォーマー）

ビジョントランスフォーマー

ViT（Vision Transformer）とは、画像をパッチに分割してTransformerで処理する画像認識アーキテクチャです。CNNを超える性能を示し、GPT-4VやGeminiなどマルチモーダルモデルのビジュアルエンコーダーの基盤技術となっています。

PPO（近接方策最適化）

ピーピーオー

PPO（Proximal Policy Optimization）とは、方策の更新幅をクリッピングで制限して安定した学習を実現する強化学習アルゴリズムです。ChatGPTやClaudeのRLHF訓練に広く採用されてきましたが、近年はDPOへの移行も進んでいます。

分類（クラシフィケーション）

ぶんるい

分類とは、入力データを事前定義されたカテゴリに振り分ける機械学習の基本タスクです。スパムフィルタ・感情分析・画像認識・医療診断など最も広く使われるAI応用の基盤であり、2値分類と多クラス分類があります。

パーソナライゼーション

ユーザー個々の好み・行動・属性に合わせてAIがコンテンツ・UI・提案を最適化する技術。ECサイト・メディア・教育で広く活用。

パイトーチ

Facebookが開発したPythonベースのディープラーニングフレームワーク。直感的なAPIと動的計算グラフで研究者・開発者に広く使われ、LLM開発の標準的な基盤。

プロンプトリーキング

システムプロンプトや隠れた指示をユーザーが巧みな質問や攻撃によって引き出してしまう脆弱性。企業秘密の漏洩やセキュリティリスクにつながる。

Vibe Coding（バイブコーディング）

バイブコーディング

AIに自然言語で指示しコードを書かせる開発スタイル。Andrej Karpathyが2025年に提唱。技術的詳細よりも「何を作りたいか」の意図をAIに伝えることで素早くプロトタイプを実現する。

プロンプト最適化（Prompt Optimization）

プロンプトさいてきか

LLMを使って自動的により良いプロンプトを探索・生成する技術。DSPy・APEなどのフレームワークが代表的。手動チューニングより効率的に高精度プロンプトを実現。

ベンチマーク汚染（Benchmark Leakage）

ベンチマークおせん

LLMの評価に使うテストデータが事前学習データに含まれてしまう問題。評価結果が実力よりも過大評価され、ベンチマークの信頼性を損なう深刻な課題。

Hugging Face Spaces

ハギングフェイススペーシス

Hugging Faceが提供する無料AIデモホスティングプラットフォーム。Gradio・StreamlitアプリをGPU付きで公開でき、AIデモの発表場所として広く活用されている。

ファンクションアズアサービス

ファンクションアズアサービス（FaaS）とは、AIエージェントがサーバーレス関数をツールとして動的に呼び出すパターンで、AWS Lambda・Vercel Functions等を組み合わせてスケーラブルなエージェントシステムを構築します。

プレフィックスチューニング

プレフィックスチューニングとは、学習可能な連続ベクトル（プレフィックス）をトランスフォーマーの各層に追加してタスク適応するパラメータ効率的な手法で、LoRA登場前に主流だったPEFT手法のひとつです。

プロセス報酬モデル（PRM）

プロセスほうしゅうモデル

プロセス報酬モデルとは、最終回答だけでなく推論の各ステップを評価する報酬モデルで、数学・コーディング・論理推論においてLLMの精度を大幅に向上させます。

プロンプト感度

プロンプトかんど

プロンプト感度とは、LLMの出力がプロンプトの小さな変化に対して大きく変動する現象で、語順・句読点・例示の違いで結果が劇的に変わることがあり、本番システムの安定性評価で重要な指標です。

バッチ推論

バッチ推論とは、複数のリクエストをまとめてLLMに処理させスループットを最大化する技術で、大量文書処理・評価・データ生成に使用され、OpenAI・Anthropic共にバッチAPIを提供しています。

深さの混合（MoD）

ふかさのこんごう

深さの混合（MoD）とは、トランスフォーマーの各層でトークンの処理を動的にスキップする適応計算手法で、重要トークンのみ深い層を通過させることで計算量を削減しながら性能を維持します。

ビジュアルグラウンディング

ビジュアルグラウンディングとは、自然言語の表現が指す画像内の領域・物体を特定するタスクで、「赤い車の左にある木」のような参照表現から画像内の対応領域を見つけ、マルチモーダルモデルとロボティクスで重要です。

フローマッチング

フローマッチングとは、確率的フローを使ってノイズからデータへの変換経路を直接学習する生成モデル技術です。DDPMより学習が安定し、少ないステップで高品質な生成が可能で、Stable Diffusion 3・Fluxなど最新モデルに採用されています。

マ行

36件

マルチモーダル

マルチモーダルとは、テキスト・画像・音声・動画など複数の入出力形式（モダリティ）を扱えるAIモデルの特性です。GPT-4oやGeminiが代表例です。

マルチエージェント

マルチエージェントとは、複数のAIエージェントが役割を分担・連携して複雑なタスクを解決するシステムアーキテクチャです。単一エージェントでは困難な並列処理や専門分化が可能になります。

MCP（モデルコンテキストプロトコル）

モデルコンテキストプロトコル

MCPとは、Anthropicが策定したAIとツール・データソースを標準的に接続するオープンプロトコルで、エージェントがさまざまな外部サービスを統一的に利用できるようにします。

MoE（Mixture of Experts）

ミクスチャーオブエキスパーツ

MoEとは、モデルの一部（専門家サブネット）だけを選択的に活性化する効率的なアーキテクチャです。Mixtral・GPT-4などが採用し、大規模化と計算効率を両立します。

モデルカード

モデルカードとは、AIモデルの用途・性能・限界・倫理的考慮事項を記述した透明性文書です。Googleが2019年に提唱し、Hugging Faceでの標準ドキュメントとして普及しています。

モデルマージ

モデルマージとは、複数のfine-tunedモデルの重みを統合して、それぞれの能力を組み合わせた新モデルを作る手法です。追加学習なしで異なる専門能力を持つモデルを融合でき、Hugging Faceコミュニティで広く活用されています。

マルチモーダル生成

マルチモーダルせいせい

マルチモーダル生成とは、テキスト・画像・音声・動画など複数のモダリティを同時に入出力するAIシステムの生成能力です。GPT-4oやGeminiが対応しており、単一モデルで複合的なコンテンツを生成できます。

マルチモーダルRAG

マルチモーダルラグ

マルチモーダルRAGとは、テキストに加えて画像・表・図・音声などの複数モダリティを含む文書を検索・活用するRAG拡張手法です。PDF・プレゼンテーション・製品カタログなどの複合文書処理に有効です。

Mistral

ミストラル

Mistralとは、フランスのMistral AIが開発するオープンソースLLMシリーズです。Mistral 7BとMixtral 8x7Bが高い性能効率比で注目を集め、MoEアーキテクチャを採用した欧州発の主要オープンソースモデルです。

モデルサービング

モデルサービングとは、学習済みモデルをAPI経由で提供するインフラ・システムです。vLLM・TGI（Text Generation Inference）・Tritonなどがバッチ処理・メモリ管理・スケーリングを最適化したLLM向けフレームワークとして普及しています。

モデル選定

モデルせんてい

タスク・コスト・精度・レイテンシ等の要件に基づいて最適なAIモデルを選択するプロセス。LLMリーダーボードやベンチマークを参照。

マルチタスク学習

マルチタスクがくしゅう

複数の関連タスクを同時に学習することで汎化性能・データ効率・表現力を向上させる機械学習手法。

モデル剪定

モデルせんてい

ニューラルネットワークの重要度の低い重みや層を除去して、精度を保ちながらモデルサイズを削減する圧縮技術。

モデルレジストリ

学習済みモデルのバージョン管理・メタデータ記録・デプロイ状態管理を行うMLOpsの中核コンポーネント。MLflow Model Registry等が代表。

マルチエージェントシステムとは、複数のAIエージェントが役割分担・協調しながら動作するアーキテクチャで、オーケストレーターとワーカーの階層構造で複雑なタスクを並列処理します。

メタ学習

メタがくしゅう

メタ学習とは「学習の仕方を学習する」パラダイムで、少数サンプルから素早く新タスクに適応できるモデルを構築します。MAMLが代表的アルゴリズムで、few-shot learningの理論的基盤となっています。

密検索（Dense Retrieval）

みつけんさく

密検索（Dense Retrieval）とは、クエリと文書をベクトル化して意味的類似度で検索する手法です。BM25などのスパース検索と対比し、RAGシステムの中核技術として広く採用されています。

マルチモーダル推論

マルチモーダルすいろん

マルチモーダル推論とは、テキスト・画像・グラフ・表など複数のモダリティにまたがって論理的推論を行う能力です。数学的証明の図解理解・科学論文の図表解釈など高度なタスクを扱い、GPT-4o・Claude・Geminiが高い性能を示します。

ヤ行

2件

要約（サマリゼーション）

ようやく

要約とは、長いテキストから重要な情報を抽出して短くまとめるLLMのタスクです。議事録・ニュース・論文・報告書などのビジネス文書処理で広く活用されています。

予測分析

よそくぶんせき

レッドチーミングとは、AIシステムの安全性・脆弱性を攻撃者視点で意図的に探索・評価するプロセスで、デプロイ前の安全評価に不可欠です。

LLaMA（ラマ）

ラマ

LLaMAとは、Metaが開発・公開するオープンソースLLMシリーズです。LLaMA 3まで進化しており、ローカル実行やfine-tuningに広く使われるオープンソースLLMの代表格です。

連合学習

れんごうがくしゅう

連合学習とは、データを中央サーバに集めずに各デバイス・組織でローカル学習し、モデルの更新情報だけを共有するプライバシー保護型の分散機械学習手法です。スマートフォンや医療データの学習に活用されています。

リランキング

リランキングとは、初期検索結果をクロスエンコーダー等で再スコアリングして関連性の高い順に並び替えるRAG改善手法です。検索精度を大幅に向上させ、LLMへ渡す文書の質を高めます。

ロングコンテキスト

ロングコンテキストとは、数十万〜数百万トークンを一度に処理できるLLMの能力です。Gemini 1.5（100万トークン）やClaude（20万トークン）が先行しており、長文書・コードベース全体・動画の一括処理が可能になります。

レイテンシ（応答遅延）

レイテンシ

レイテンシとは、LLMが入力を受け取ってから最初のトークンを返すまでの時間（TTFT: Time to First Token）です。ユーザー体験に直結する重要な性能指標で、streamingやprompt-cachingで改善できます。

RNN（リカレントニューラルネットワーク）

リカレントニューラルネットワーク

RNNとは、前の出力を次の入力に使う再帰的な構造で時系列・系列データを処理するニューラルネットワークです。LSTMやGRUが発展形で、Transformerの登場前はNLPの主力アーキテクチャでした。

リワードハッキングとは、AIが報酬関数の抜け穴を利用して高スコアを得るが人間の意図した目標を達成しない問題で、強化学習で頻発しAI安全性の核心課題です。RLHFでも発生しうることが知られています。

RoPE（回転位置埋め込み）

ロープ（かいてんいちうめこみ）

RoPEとは、トランスフォーマーの位置情報をクエリ・キーベクトルの回転として表現する手法で、Llama・Mistral・Gemmaなど主要LLMに採用され、長文対応のコンテキスト拡張にも活用されます。

対数確率

ログプロブス（対数確率）

対数確率（logprobs）とは、LLMが各トークンに割り当てる確率の対数値で、モデルの確信度測定・カリブレーション評価・ビーム探索・制約付き生成に活用される指標です。

ReActエージェント

リアクトエージェント

ReActエージェントとは、Reasoning（推論）とActing（行動）を交互に繰り返すフレームワークで実装されたAIエージェントで、Thought→Action→ObservationのサイクルをLLMで実現します。

ワ行

2件

Word2Vec

ワードトゥベック

Word2Vecとは、単語を意味的な高次元ベクトル空間に埋め込む手法です。「king - man + woman ≈ queen」のような意味演算が可能で、現代のembeddingの原型として自然言語処理の発展に大きく貢献しました。

ワールドモデル