Databricks

Databricks GenAI Engineer Associate完全解説|RAG・LLM対策

2026-03-26
更新: 2026-03-27
NicheeLab編集部

Databricks Certified Generative AI Engineer Associate試験は、RAGパイプライン構築・LLMデプロイ・ガバナンスを含む生成AIエンジニアリングの実践力を問う資格です。 本記事では6つの出題ドメインの配点と頻出テーマ、RAGアーキテクチャの技術的詳細、LangChain統合、他資格との違い、そして学習ロードマップまでを網羅します。

試験概要

Generative AI Engineer Associateは2024年に新設されたDatabricks認定資格で、生成AIアプリケーションの設計・実装・運用能力を評価します。 従来のML Associate/Professionalが古典的ML寄りであるのに対し、本試験はRAG・LLM・プロンプトエンジニアリングに特化しています。

項目内容
問題数45問(選択式)
試験時間90分
合格ライン70%(32問/45問)
受験料$200(税別)
言語英語・日本語対応
有効期限2年間
前提資格なし(独立した資格)
推奨経験Databricksでの生成AIアプリ開発6ヶ月以上、Pythonプログラミング経験

6つの出題ドメインと配点

出題は6ドメインに分かれ、RAG Solutionsが全体の30%と最大の比重を占めます。残り5ドメインは各15%または10%で、まんべんなく対策する必要があります。

ドメイン配点問題数目安
1. Design and Implement RAG Solutions30%約14問
2. Design and Implement Model Training15%約7問
3. Design and Implement Model Deployment15%約7問
4. Design and Implement Governance15%約7問
5. Design and Implement Evaluation15%約7問
6. Foundational Concepts10%約3問

RAGアーキテクチャの詳細

RAG(Retrieval-Augmented Generation)は試験全体の30%を占める最重要テーマです。Databricks上でのRAGパイプラインは「データ準備→チャンキング→Embedding→Vector Store格納→検索→LLM呼び出し→回答生成」の流れで構成されます。

チャンキング戦略

ドキュメントをLLMのコンテキストウィンドウに収まるサイズに分割する処理がチャンキングです。戦略の選択はRetrieval品質に直結します。

戦略分割基準適したユースケース
Fixed-size Chunking文字数・トークン数で固定長に分割構造が均一なログデータ、FAQ集など。実装が簡単でオーバーヘッドが少ない
Semantic ChunkingEmbeddingの類似度変化で意味的な区切りを検出技術文書・論文など、段落の境界が意味的に重要な文書。精度は高いが計算コストも高い
Recursive Chunking段落→文→単語の順で再帰的に分割し、目標サイズに収めるLangChainのRecursiveCharacterTextSplitterで広く使用。汎用性が高くデフォルト選択として推奨

試験では「社内マニュアル1,000ページをRAGに取り込む際、最適なチャンキング戦略は?」のようなシナリオ問題が出ます。オーバーラップ(chunk_overlap)の設定がコンテキスト喪失を防ぐ役割を持つ点も頻出です。

Embeddingモデル

チャンクをベクトル空間に変換するEmbeddingモデルの選択は、検索精度を左右します。Databricks上で利用可能な主要モデルは以下の通りです。

  • Databricks Foundation Model API (BGE / GTE):Databricksがホストするマネージドエンドポイントで、追加インフラ不要。Unity Catalogとの統合が容易で、ガバナンス要件が厳しい環境に適する
  • OpenAI text-embedding-3-small / large:External Modelsとして登録。多言語対応が強く、英語以外のドキュメントを扱うRAGで選択されることが多い
  • BGE-large-en / BGE-M3:オープンソースで、Databricks Model Servingにカスタムデプロイ可能。コスト最適化やデータ主権の要件がある場合に選択
  • Instructor系モデル:タスク固有の指示をプレフィックスとして付与でき、検索・分類・クラスタリングなど用途別に精度を向上させられる

Databricksが提供するマネージドベクトル検索サービスで、2種類のインデックスタイプがあります。試験ではこの違いを正確に区別できることが求められます。

比較項目Delta Sync IndexDirect Vector Access Index
データソースDelta Tableから自動同期REST APIで直接ベクトルを書き込み
Embedding計算Databricksが自動計算(Managed Embedding)または事前計算済みカラムを参照外部で事前計算したベクトルを渡す
同期頻度Delta Tableの変更を自動検知して差分同期(Continuous / Triggered)APIコールごとに即座に反映
適したシナリオ社内文書検索など、Delta Tableにデータが蓄積されるバッチ型RAGリアルタイム更新が必要なチャットボット、外部ベクトルDB移行時
Unity Catalog統合テーブルレベルのACLを自動継承エンドポイントレベルでの権限設定が必要

LLM呼び出し方法

Retrievalで取得したコンテキストをLLMに渡して回答を生成する際、Databricksでは2つの主要な呼び出し経路があります。

  • Foundation Model API (Pay-per-token):DBRX、Llama 3、Mixtralなど、Databricksがホストするモデルをサーバーレスで呼び出す。 エンドポイント管理が不要で、従量課金のため小〜中規模のワークロードに最適。ai_query()SQL関数やOpenAI互換のREST APIで利用可能
  • External Models:OpenAI GPT-4o、Anthropic Claude、Google Geminiなどの外部プロバイダーをMosaic AI Gateway経由で統一的に呼び出す。レート制限・コスト追跡・ガードレールをゲートウェイ層で一元管理でき、プロバイダー切り替え時にアプリケーションコードの変更が不要

各ドメインの主要トピック

Domain 1: RAG Solutions(30%)

最大配点のドメインで、エンドツーエンドのRAGパイプライン構築能力が問われます。

  • Vector Search設定:エンドポイントの作成、Delta Sync Indexのスキーマ定義(source_column、embedding_vector_column)、sync_typeの選択
  • Retrieval品質の向上:Hybrid Search(キーワード+セマンティック)、Re-ranking、Metadata Filtering、チャンクサイズとオーバーラップの最適化
  • Prompt Engineering:System Prompt設計、Few-shot例の挿入、Chain-of-Thought誘導、Temperature/Top-pの調整
  • Multi-turn対話:会話履歴の管理、コンテキストウィンドウの制約を考慮した履歴圧縮戦略

Domain 2: Model Training(15%)

LLMのFine-tuningとRAGの使い分け、パラメータ効率の良い学習手法が出題の中心です。

  • Fine-tuning vs RAG判断基準:ドメイン固有の語彙・スタイル適応にはFine-tuning、最新情報参照にはRAG。コスト・レイテンシ・データ量のトレードオフを問う問題が頻出
  • LoRA / QLoRA:フルパラメータ更新の代わりにLow-Rank Adaptationで追加パラメータのみ学習。QLoRAは4bit量子化と組み合わせてGPUメモリ使用量を大幅削減。Databricks上ではMosaic AI Fine-tuning APIで実行可能
  • 学習データの準備:Instruction-Response形式のデータセット作成、データ品質のフィルタリング、Unity Catalogでのデータリネージ管理

Domain 3: Model Deployment(15%)

Model Servingの構成とGPUサービングの設計が主な出題範囲です。

  • Mosaic AI Model Serving:サーバーレスリアルタイム推論エンドポイント。オートスケーリング設定(min_instances、scale_to_zero)、トラフィックルーティング(A/Bテスト)
  • GPU Serving:大規模LLMをGPUインスタンスでホスティング。vLLMベースの高スループット推論、バッチ推論とリアルタイム推論の使い分け
  • エンドポイントの監視:レイテンシ・スループット・エラー率のメトリクス、Inference Tableによるリクエスト/レスポンスのログ収集

Domain 4: Governance(15%)

生成AIアプリケーション特有のガバナンス要件に関する問題が出題されます。

  • Unity Catalogによるモデルリネージ:モデル→学習データ→Embeddingモデル→Vector Indexの依存関係を追跡。アーティファクトのバージョン管理とステージ遷移(None→Champion→Archived)
  • AI Guardrails:Mosaic AI Gatewayでの入力/出力フィルタリング。有害コンテンツ検出、PII(個人情報)マスキング、トピック制限の設定
  • アクセス制御:サービングエンドポイントのトークン認証、Unity CatalogのACLによるモデルアクセス制限、監査ログによる利用状況追跡

Domain 5: Evaluation(15%)

LLMアプリケーションの品質評価手法が問われます。従来のMLメトリクスとは異なるLLM固有の評価方法を理解する必要があります。

  • MLflow evaluate()mlflow.evaluate()にモデルと評価データセットを渡し、toxicity、relevance、faithfulness等のメトリクスを自動計算。結果はMLflow UIでExperiment横断比較が可能
  • LLM-as-Judge:GPT-4oなどの高性能LLMを評価者として使い、回答の正確性・関連性・安全性をスコアリング。人間の評価との相関が高くスケーラブルな手法
  • RAG固有の評価指標:Retrieval Precision(検索されたチャンクの関連性)、Faithfulness(回答がコンテキストに忠実か)、Answer Relevance(回答が質問に合致するか)
  • Mosaic AI Agent Evaluation:エンドツーエンドでRAGエージェントの品質を評価するフレームワーク。評価データセットの作成、自動スコアリング、回帰テストの自動化

Domain 6: Foundational Concepts(10%)

LLM・Transformer・生成AIの基礎概念が出題されます。配点は10%と少ないものの、他ドメインの理解の土台となるため軽視できません。

  • Transformerアーキテクチャ:Self-Attention機構、Encoder-Decoder構造、位置エンコーディングの役割
  • トークナイゼーション:BPE(Byte Pair Encoding)、SentencePiece、コンテキストウィンドウの制約とトークン数の関係
  • 生成AI vs 従来ML:確率的テキスト生成のメカニズム、ハルシネーションのリスクとRAGによる緩和策

LangChainとDatabricksの統合

試験ではLangChainを使ったRAGチェーン構築のコードが頻出します。Databricks固有のコンポーネントとLangChainの統合ポイントを押さえてください。

  • ChatDatabricks:Foundation Model APIやExternal ModelsのエンドポイントをLangChainのChatModelとして利用。ChatDatabricks(endpoint="databricks-dbrx-instruct")のように指定
  • DatabricksVectorSearch Retriever:Vector SearchインデックスをLangChainのRetrieverとして接続。columnsパラメータで返却カラムを制御し、filtersでメタデータフィルタリングを実行
  • DatabricksEmbeddings:Embedding計算をDatabricksエンドポイント経由で実行。LangChainのEmbeddingsインターフェースに準拠
  • MLflow + LangChainmlflow.langchain.log_model()でチェーン全体をMLflowアーティファクトとして記録。Model Servingへのデプロイ時にチェーンの依存関係が自動解決される

他のDatabricks資格との比較

GenAI Engineer Associateは、ML Associate(MLA)やML Professional(MLP)と出題範囲が一部重複しますが、フォーカスが明確に異なります。

比較項目GenAI Engineer AssociateML AssociateML Professional
主なフォーカスRAG・LLM・生成AIアプリ古典的ML・MLflowワークフローMLOps・本番運用設計
RAG / Vector Search30%(最重点)出題なし出題なし
MLflowEvaluation中心Tracking / Registry中心CI/CD統合・Model Registry
Model ServingLLM Serving・GPU Serving基本的なリアルタイム推論A/Bテスト・カナリアデプロイ
LangChainチェーン構築・統合出題なし出題なし
Fine-tuningLoRA/QLoRA・LLM特化Hyperopt・AutoML分散学習・Feature Store
難易度Associate(中級)Associate(中級)Professional(上級)

MLA取得者がGenAI Engineerに進む場合、MLflow・Model Serving・Unity Catalogの知識はそのまま活用できます。追加学習が必要なのはRAGパイプライン、Vector Search、LangChain統合、LLM評価手法の4領域です。

学習ロードマップ(1〜2ヶ月)

生成AIの基礎知識がある前提で、1〜2ヶ月の学習計画を示します。平日1時間・週末2〜3時間の学習ペースを想定しています。

Week 1〜2:基礎固め(Foundational Concepts + RAG概要)

  • Databricks Academy「Generative AI Engineer Learning Path」を開始
  • Transformerアーキテクチャ、トークナイゼーション、プロンプトエンジニアリングの基礎を復習
  • RAGの概念とDatabricks上での実装パターンを公式ドキュメントで理解

Week 3〜4:RAG深掘り + Vector Search実践

  • Mosaic AI Vector Searchのエンドポイント作成、Delta Sync Index構築をハンズオン
  • チャンキング戦略の比較実験(RecursiveCharacterTextSplitter vs SemanticChunker)
  • LangChainでRAGチェーンを構築し、ChatDatabricks + DatabricksVectorSearch Retrieverを統合

Week 56: Training + Deployment + Governance

  • Fine-tuning vs RAGの判断基準を整理し、LoRA/QLoRAの仕組みを理解
  • Model Servingの構成(オートスケーリング、GPU Serving、Inference Table)を学習
  • Unity Catalogでのモデルリネージ、AI Guardrailsの設定方法を確認

Week 7〜8:Evaluation + 総仕上げ

  • MLflow evaluate()によるLLM評価、LLM-as-Judgeの実装を実践
  • Mosaic AI Agent Evaluationの公式ドキュメントを通読
  • 模擬試験を2〜3回実施し、弱点ドメインを集中補強
  • Exam Guideの全トピックを最終チェック

サンプル問題で実力チェック

RAG Solutions

問題 1

ある企業が社内ナレッジベース(約10,000件のPDFドキュメント)をDatabricks上でRAGシステムとして構築しています。ドキュメントはDelta Tableに保存され、毎日新しいドキュメントが追加されます。検索品質を維持しながら運用コストを最小化したい場合、最適なVector Searchインデックスの構成はどれですか?

  1. Direct Vector Access Indexを使用し、新しいドキュメントが追加されるたびにREST APIでベクトルを手動で書き込む
  2. Delta Sync Index(Managed Embedding)を使用し、Triggered sync modeでEmbeddingの自動計算と差分同期を行う
  3. Delta Sync Index(Self-managed Embedding)を使用し、Continuous sync modeで常時同期を維持する
  4. Vector Searchは使用せず、LLMのコンテキストウィンドウに全ドキュメントを直接渡す

正解: B

Delta Tableにデータが蓄積される構成では、Delta Sync Indexが最適です。Managed Embeddingを選択すると、Databricksが自動的にEmbeddingを計算するため、Embeddingパイプラインの構築・管理が不要になります。Triggered sync modeは毎日の更新に対して差分同期を実行するため、Continuous modeよりもコンピュートコストを抑えられます。選択肢Aは毎日の手動API呼び出しが運用負荷となり、選択肢Cは常時同期のためコストが高くなります。選択肢Dは10,000件のドキュメントをコンテキストウィンドウに収めることが物理的に不可能です。

よくある質問

GenAI Engineer Associate試験にPythonのコーディング問題は出ますか?

選択式のみで、IDEでコードを実行する形式の問題はありません。ただしPythonコードの読解力は必須です。LangChainのチェーン構築、MLflow evaluate()のパラメータ指定、Foundation Model APIの呼び出しコードなど、コードスニペットを読んで正しい動作や修正点を選ぶ問題が頻出します。日頃からDatabricksノートブック上でRAGパイプラインを組む練習をしておくと、コード読解問題への対応力が格段に上がります。

ML Associate(MLA)を先に取るべきですか、それともGenAI Engineerから受けてよいですか?

GenAI Engineer Associateは独立した資格であり、MLAの取得は前提条件ではありません。ただしMLflowやModel Servingなど約30%の範囲がMLAと重複するため、MLA取得者は学習時間を短縮できます。生成AI領域の実務経験がある方はGenAI Engineerから直接受験しても十分合格可能です。逆に機械学習の基礎が不安な場合はMLAを先に取得すると、Training・Deployment・Evaluationドメインの理解がスムーズになります。

RAGドメイン(30%)を効率的に学習する方法は?

まずDatabricks公式のGenerative AI Engineer Learning Pathを完了し、次にMosaic AI Vector SearchのドキュメントでDelta Sync IndexとDirect Vector Access Indexの違いを押さえます。その後、LangChainとDatabricksの統合(ChatDatabricks、DatabricksVectorSearch Retriever)を実際にノートブックで動かし、最後にチャンキング戦略(Fixed-size、Semantic、Recursive)の使い分けを整理すると、RAGドメインの大部分をカバーできます。

Databricks資格の関連記事

Machine Learning Associate 完全解説

出題範囲が約 30% 重なる前段認定

Databricks 試験の難易度ランキング

全 7 試験を学習時間と一緒に比較

Vector Search 完全ガイド

Delta Sync Index と Direct Access Index の使い分け

RAG パターン実装ガイド

Mosaic AI / LangChain での RAG 構築

この記事で学んだ内容を問題で確認しましょう

16,000問以上の問題で実力チェック

無料で問題を解いてみる
この記事の著者

NicheeLab編集部

データエンジニアリング・クラウド資格の専門家。Databricks・Snowflake等の認定資格を保有し、実務経験に基づいた問題作成・解説を行っています。NicheeLab運営。


関連記事
Databricks

Databricks資格一覧|全7試験・難易度・勉強法

Databricks認定資格全7試験の一覧・難易度・出題範囲・合格ラインを徹底解説。2026年最新版の公式試験ガイドに準...

Databricks

Databricks試験の難易度ランキング|全7資格を徹底比較

Databricks認定全7試験の難易度をランキング形式で徹底比較。合格率・学習時間・出題傾向から難易度を分析。...

Databricks

Databricks資格の勉強方法|最短合格ルートと学習時間の目安

Databricks認定資格に最短で合格するための勉強方法を完全ガイド。公式リソース・問題集・学習スケジュールを徹底解説...

Databricks

Databricks Data Engineer Associate完全解説|出題範囲・問題例・合格戦略

Databricks Certified Data Engineer Associate試験を徹底解説。5つの出題ドメイ...

Databricks

Databricks Data Engineer Professional完全解説|上級試験の攻略法

Databricks Certified Data Engineer Professional試験を徹底解説。10の出題...

Databricksの記事一覧 (109件)
© 2026 NicheeLab All rights reserved.