Databricks GenAI Engineer Associate完全解説｜RAG・LLM対策ガイド【2026】

Databricks Certified Generative AI Engineer Associate試験は、RAGパイプライン構築・LLMデプロイ・ガバナンスを含む生成AIエンジニアリングの実践力を問う資格です。本記事では6つの出題ドメインの配点と頻出テーマ、RAGアーキテクチャの技術的詳細、LangChain統合、他資格との違い、そして学習ロードマップまでを網羅します。

試験概要

Generative AI Engineer Associateは2024年に新設されたDatabricks認定資格で、生成AIアプリケーションの設計・実装・運用能力を評価します。従来のML Associate/Professionalが古典的ML寄りであるのに対し、本試験はRAG・LLM・プロンプトエンジニアリングに特化しています。

項目	内容
問題数	45問（選択式）
試験時間	90分
合格ライン	70%（32問/45問）
受験料	$200（税別）
言語	英語・日本語対応
有効期限	2年間
前提資格	なし（独立した資格）
推奨経験	Databricksでの生成AIアプリ開発6ヶ月以上、Pythonプログラミング経験

6つの出題ドメインと配点

出題は6ドメインに分かれ、RAG Solutionsが全体の30%と最大の比重を占めます。残り5ドメインは各15%または10%で、まんべんなく対策する必要があります。

ドメイン	配点	問題数目安
1. Design and Implement RAG Solutions	30%	約14問
2. Design and Implement Model Training	15%	約7問
3. Design and Implement Model Deployment	15%	約7問
4. Design and Implement Governance	15%	約7問
5. Design and Implement Evaluation	15%	約7問
6. Foundational Concepts	10%	約3問

RAGアーキテクチャの詳細

RAG（Retrieval-Augmented Generation）は試験全体の30%を占める最重要テーマです。Databricks上でのRAGパイプラインは「データ準備→チャンキング→Embedding→Vector Store格納→検索→LLM呼び出し→回答生成」の流れで構成されます。

チャンキング戦略

ドキュメントをLLMのコンテキストウィンドウに収まるサイズに分割する処理がチャンキングです。戦略の選択はRetrieval品質に直結します。

戦略	分割基準	適したユースケース
Fixed-size Chunking	文字数・トークン数で固定長に分割	構造が均一なログデータ、FAQ集など。実装が簡単でオーバーヘッドが少ない
Semantic Chunking	Embeddingの類似度変化で意味的な区切りを検出	技術文書・論文など、段落の境界が意味的に重要な文書。精度は高いが計算コストも高い
Recursive Chunking	段落→文→単語の順で再帰的に分割し、目標サイズに収める	LangChainのRecursiveCharacterTextSplitterで広く使用。汎用性が高くデフォルト選択として推奨

試験では「社内マニュアル1,000ページをRAGに取り込む際、最適なチャンキング戦略は？」のようなシナリオ問題が出ます。オーバーラップ（chunk_overlap）の設定がコンテキスト喪失を防ぐ役割を持つ点も頻出です。

Embeddingモデル

チャンクをベクトル空間に変換するEmbeddingモデルの選択は、検索精度を左右します。Databricks上で利用可能な主要モデルは以下の通りです。

Databricks Foundation Model API (BGE / GTE)：Databricksがホストするマネージドエンドポイントで、追加インフラ不要。Unity Catalogとの統合が容易で、ガバナンス要件が厳しい環境に適する
OpenAI text-embedding-3-small / large：External Modelsとして登録。多言語対応が強く、英語以外のドキュメントを扱うRAGで選択されることが多い
BGE-large-en / BGE-M3：オープンソースで、Databricks Model Servingにカスタムデプロイ可能。コスト最適化やデータ主権の要件がある場合に選択
Instructor系モデル：タスク固有の指示をプレフィックスとして付与でき、検索・分類・クラスタリングなど用途別に精度を向上させられる

Mosaic AI Vector Search

Databricksが提供するマネージドベクトル検索サービスで、2種類のインデックスタイプがあります。試験ではこの違いを正確に区別できることが求められます。

比較項目	Delta Sync Index	Direct Vector Access Index
データソース	Delta Tableから自動同期	REST APIで直接ベクトルを書き込み
Embedding計算	Databricksが自動計算（Managed Embedding）または事前計算済みカラムを参照	外部で事前計算したベクトルを渡す
同期頻度	Delta Tableの変更を自動検知して差分同期（Continuous / Triggered）	APIコールごとに即座に反映
適したシナリオ	社内文書検索など、Delta Tableにデータが蓄積されるバッチ型RAG	リアルタイム更新が必要なチャットボット、外部ベクトルDB移行時
Unity Catalog統合	テーブルレベルのACLを自動継承	エンドポイントレベルでの権限設定が必要

LLM呼び出し方法

Retrievalで取得したコンテキストをLLMに渡して回答を生成する際、Databricksでは2つの主要な呼び出し経路があります。

Foundation Model API (Pay-per-token)：DBRX、Llama 3、Mixtralなど、Databricksがホストするモデルをサーバーレスで呼び出す。エンドポイント管理が不要で、従量課金のため小〜中規模のワークロードに最適。ai_query()SQL関数やOpenAI互換のREST APIで利用可能
External Models：OpenAI GPT-4o、Anthropic Claude、Google Geminiなどの外部プロバイダーをMosaic AI Gateway経由で統一的に呼び出す。レート制限・コスト追跡・ガードレールをゲートウェイ層で一元管理でき、プロバイダー切り替え時にアプリケーションコードの変更が不要

各ドメインの主要トピック

Domain 1: RAG Solutions（30%）

最大配点のドメインで、エンドツーエンドのRAGパイプライン構築能力が問われます。

Vector Search設定：エンドポイントの作成、Delta Sync Indexのスキーマ定義（source_column、embedding_vector_column）、sync_typeの選択
Retrieval品質の向上：Hybrid Search（キーワード＋セマンティック）、Re-ranking、Metadata Filtering、チャンクサイズとオーバーラップの最適化
Prompt Engineering：System Prompt設計、Few-shot例の挿入、Chain-of-Thought誘導、Temperature/Top-pの調整
Multi-turn対話：会話履歴の管理、コンテキストウィンドウの制約を考慮した履歴圧縮戦略

Domain 2: Model Training（15%）

LLMのFine-tuningとRAGの使い分け、パラメータ効率の良い学習手法が出題の中心です。

Fine-tuning vs RAG判断基準：ドメイン固有の語彙・スタイル適応にはFine-tuning、最新情報参照にはRAG。コスト・レイテンシ・データ量のトレードオフを問う問題が頻出
LoRA / QLoRA：フルパラメータ更新の代わりにLow-Rank Adaptationで追加パラメータのみ学習。QLoRAは4bit量子化と組み合わせてGPUメモリ使用量を大幅削減。Databricks上ではMosaic AI Fine-tuning APIで実行可能
学習データの準備：Instruction-Response形式のデータセット作成、データ品質のフィルタリング、Unity Catalogでのデータリネージ管理

Domain 3: Model Deployment（15%）

Model Servingの構成とGPUサービングの設計が主な出題範囲です。

Mosaic AI Model Serving：サーバーレスリアルタイム推論エンドポイント。オートスケーリング設定（min_instances、scale_to_zero）、トラフィックルーティング（A/Bテスト）
GPU Serving：大規模LLMをGPUインスタンスでホスティング。vLLMベースの高スループット推論、バッチ推論とリアルタイム推論の使い分け
エンドポイントの監視：レイテンシ・スループット・エラー率のメトリクス、Inference Tableによるリクエスト/レスポンスのログ収集

Domain 4: Governance（15%）

生成AIアプリケーション特有のガバナンス要件に関する問題が出題されます。

Unity Catalogによるモデルリネージ：モデル→学習データ→Embeddingモデル→Vector Indexの依存関係を追跡。アーティファクトのバージョン管理とステージ遷移（None→Champion→Archived）
AI Guardrails：Mosaic AI Gatewayでの入力/出力フィルタリング。有害コンテンツ検出、PII（個人情報）マスキング、トピック制限の設定
アクセス制御：サービングエンドポイントのトークン認証、Unity CatalogのACLによるモデルアクセス制限、監査ログによる利用状況追跡

Domain 5: Evaluation（15%）

LLMアプリケーションの品質評価手法が問われます。従来のMLメトリクスとは異なるLLM固有の評価方法を理解する必要があります。

MLflow evaluate()：mlflow.evaluate()にモデルと評価データセットを渡し、toxicity、relevance、faithfulness等のメトリクスを自動計算。結果はMLflow UIでExperiment横断比較が可能
LLM-as-Judge：GPT-4oなどの高性能LLMを評価者として使い、回答の正確性・関連性・安全性をスコアリング。人間の評価との相関が高くスケーラブルな手法
RAG固有の評価指標：Retrieval Precision（検索されたチャンクの関連性）、Faithfulness（回答がコンテキストに忠実か）、Answer Relevance（回答が質問に合致するか）
Mosaic AI Agent Evaluation：エンドツーエンドでRAGエージェントの品質を評価するフレームワーク。評価データセットの作成、自動スコアリング、回帰テストの自動化

Domain 6: Foundational Concepts（10%）

LLM・Transformer・生成AIの基礎概念が出題されます。配点は10%と少ないものの、他ドメインの理解の土台となるため軽視できません。

Transformerアーキテクチャ：Self-Attention機構、Encoder-Decoder構造、位置エンコーディングの役割
トークナイゼーション：BPE（Byte Pair Encoding）、SentencePiece、コンテキストウィンドウの制約とトークン数の関係
生成AI vs 従来ML：確率的テキスト生成のメカニズム、ハルシネーションのリスクとRAGによる緩和策

LangChainとDatabricksの統合

試験ではLangChainを使ったRAGチェーン構築のコードが頻出します。Databricks固有のコンポーネントとLangChainの統合ポイントを押さえてください。

ChatDatabricks：Foundation Model APIやExternal ModelsのエンドポイントをLangChainのChatModelとして利用。ChatDatabricks(endpoint="databricks-dbrx-instruct")のように指定
DatabricksVectorSearch Retriever：Vector SearchインデックスをLangChainのRetrieverとして接続。columnsパラメータで返却カラムを制御し、filtersでメタデータフィルタリングを実行
DatabricksEmbeddings：Embedding計算をDatabricksエンドポイント経由で実行。LangChainのEmbeddingsインターフェースに準拠
MLflow + LangChain：mlflow.langchain.log_model()でチェーン全体をMLflowアーティファクトとして記録。Model Servingへのデプロイ時にチェーンの依存関係が自動解決される

他のDatabricks資格との比較

GenAI Engineer Associateは、ML Associate（MLA）やML Professional（MLP）と出題範囲が一部重複しますが、フォーカスが明確に異なります。

比較項目	GenAI Engineer Associate	ML Associate	ML Professional
主なフォーカス	RAG・LLM・生成AIアプリ	古典的ML・MLflowワークフロー	MLOps・本番運用設計
RAG / Vector Search	30%（最重点）	出題なし	出題なし
MLflow	Evaluation中心	Tracking / Registry中心	CI/CD統合・Model Registry
Model Serving	LLM Serving・GPU Serving	基本的なリアルタイム推論	A/Bテスト・カナリアデプロイ
LangChain	チェーン構築・統合	出題なし	出題なし
Fine-tuning	LoRA/QLoRA・LLM特化	Hyperopt・AutoML	分散学習・Feature Store
難易度	Associate（中級）	Associate（中級）	Professional（上級）

MLA取得者がGenAI Engineerに進む場合、MLflow・Model Serving・Unity Catalogの知識はそのまま活用できます。追加学習が必要なのはRAGパイプライン、Vector Search、LangChain統合、LLM評価手法の4領域です。

学習ロードマップ（1〜2ヶ月）

生成AIの基礎知識がある前提で、1〜2ヶ月の学習計画を示します。平日1時間・週末2〜3時間の学習ペースを想定しています。

Week 1〜2：基礎固め（Foundational Concepts + RAG概要）

Databricks Academy「Generative AI Engineer Learning Path」を開始
Transformerアーキテクチャ、トークナイゼーション、プロンプトエンジニアリングの基礎を復習
RAGの概念とDatabricks上での実装パターンを公式ドキュメントで理解

Week 3〜4：RAG深掘り + Vector Search実践

Mosaic AI Vector Searchのエンドポイント作成、Delta Sync Index構築をハンズオン
チャンキング戦略の比較実験（RecursiveCharacterTextSplitter vs SemanticChunker）
LangChainでRAGチェーンを構築し、ChatDatabricks + DatabricksVectorSearch Retrieverを統合

Week 5〜6: Training + Deployment + Governance

Fine-tuning vs RAGの判断基準を整理し、LoRA/QLoRAの仕組みを理解
Model Servingの構成（オートスケーリング、GPU Serving、Inference Table）を学習
Unity Catalogでのモデルリネージ、AI Guardrailsの設定方法を確認

Week 7〜8：Evaluation + 総仕上げ

MLflow evaluate()によるLLM評価、LLM-as-Judgeの実装を実践
Mosaic AI Agent Evaluationの公式ドキュメントを通読
模擬試験を2〜3回実施し、弱点ドメインを集中補強
Exam Guideの全トピックを最終チェック

サンプル問題で実力チェック

RAG Solutions

問題 1

ある企業が社内ナレッジベース（約10,000件のPDFドキュメント）をDatabricks上でRAGシステムとして構築しています。ドキュメントはDelta Tableに保存され、毎日新しいドキュメントが追加されます。検索品質を維持しながら運用コストを最小化したい場合、最適なVector Searchインデックスの構成はどれですか？

Direct Vector Access Indexを使用し、新しいドキュメントが追加されるたびにREST APIでベクトルを手動で書き込む
Delta Sync Index（Managed Embedding）を使用し、Triggered sync modeでEmbeddingの自動計算と差分同期を行う
Delta Sync Index（Self-managed Embedding）を使用し、Continuous sync modeで常時同期を維持する
Vector Searchは使用せず、LLMのコンテキストウィンドウに全ドキュメントを直接渡す

正解: B

Delta Tableにデータが蓄積される構成では、Delta Sync Indexが最適です。Managed Embeddingを選択すると、Databricksが自動的にEmbeddingを計算するため、Embeddingパイプラインの構築・管理が不要になります。Triggered sync modeは毎日の更新に対して差分同期を実行するため、Continuous modeよりもコンピュートコストを抑えられます。選択肢Aは毎日の手動API呼び出しが運用負荷となり、選択肢Cは常時同期のためコストが高くなります。選択肢Dは10,000件のドキュメントをコンテキストウィンドウに収めることが物理的に不可能です。

よくある質問

GenAI Engineer Associate試験にPythonのコーディング問題は出ますか？

選択式のみで、IDEでコードを実行する形式の問題はありません。ただしPythonコードの読解力は必須です。LangChainのチェーン構築、MLflow evaluate()のパラメータ指定、Foundation Model APIの呼び出しコードなど、コードスニペットを読んで正しい動作や修正点を選ぶ問題が頻出します。日頃からDatabricksノートブック上でRAGパイプラインを組む練習をしておくと、コード読解問題への対応力が格段に上がります。

ML Associate（MLA）を先に取るべきですか、それともGenAI Engineerから受けてよいですか？

GenAI Engineer Associateは独立した資格であり、MLAの取得は前提条件ではありません。ただしMLflowやModel Servingなど約30%の範囲がMLAと重複するため、MLA取得者は学習時間を短縮できます。生成AI領域の実務経験がある方はGenAI Engineerから直接受験しても十分合格可能です。逆に機械学習の基礎が不安な場合はMLAを先に取得すると、Training・Deployment・Evaluationドメインの理解がスムーズになります。

RAGドメイン（30%）を効率的に学習する方法は？

まずDatabricks公式のGenerative AI Engineer Learning Pathを完了し、次にMosaic AI Vector SearchのドキュメントでDelta Sync IndexとDirect Vector Access Indexの違いを押さえます。その後、LangChainとDatabricksの統合（ChatDatabricks、DatabricksVectorSearch Retriever）を実際にノートブックで動かし、最後にチャンキング戦略（Fixed-size、Semantic、Recursive）の使い分けを整理すると、RAGドメインの大部分をカバーできます。

Databricks資格の関連記事

Machine Learning Associate 完全解説

出題範囲が約 30% 重なる前段認定

Databricks 試験の難易度ランキング

全 7 試験を学習時間と一緒に比較

Vector Search 完全ガイド

Delta Sync Index と Direct Access Index の使い分け

RAG パターン実装ガイド

Mosaic AI / LangChain での RAG 構築

この記事で学んだ内容を問題で確認しましょう

16,000問以上の問題で実力チェック

無料で問題を解いてみる

この記事の著者

NicheeLab編集部

データエンジニアリング・クラウド資格の専門家。Databricks・Snowflake等の認定資格を保有し、実務経験に基づいた問題作成・解説を行っています。NicheeLab運営。

Databricks GenAI Engineer Associate完全解説｜RAG・LLM対策