Databricks Certified Data Analyst Associate(DAA)は、 Databricks SQLを使ったクエリ作成・ダッシュボード構築・データ分析の実務力を測定する認定試験です。 SQLの知識が中心で、PythonやSparkのコーディングは不要です。 2025年後半にAI/BI Genieが試験範囲に追加され、9ドメインの出題構成になっています。
| 項目 | 内容 |
|---|---|
| 試験名 | Databricks Certified Data Analyst Associate |
| 問題数 | 45問 |
| 試験時間 | 90分(1問あたり平均2分) |
| 合格ライン | 70%(32問以上正解) |
| 受験料 | $200(税別) |
| 言語 | 英語・日本語(選択可) |
| 前提条件 | なし |
| 有効期間 | 2年間 |
| 主要ツール | Databricks SQL・SQL Warehouse・ダッシュボード |
| ドメイン | 配点 | 出題数目安 | 主要トピック |
|---|---|---|---|
| Databricks SQL | 14% | 6〜7問 | SQLウェアハウス設定・クエリエディタ操作 |
| Data Management | 12% | 5〜6問 | テーブル操作・ビュー・CTEの使い分け |
| SQL Query | 16% | 7〜8問 | SELECT・JOIN・集約・サブクエリ |
| Data Visualization | 12% | 5〜6問 | チャート種類の選択・書式設定 |
| Dashboards | 12% | 5〜6問 | ダッシュボード作成・フィルタ・共有 |
| Analytics Applications | 10% | 4〜5問 | アラート設定・スケジュール実行 |
| AI/BI Genie | 8% | 3〜4問 | Genie Spaceの構成・自然言語クエリ |
| Data Access and Security | 8% | 3〜4問 | テーブル権限・共有設定 |
| Lakehouse Concepts | 8% | 3〜4問 | Delta Lake基礎・メダリオンアーキテクチャ |
SQL Queryドメインが16%で最大の配点を持ちます。SQLの実行結果を問う問題が中心で、 JOIN・Window関数・CTEの理解が必須です。次にDatabricks SQLドメイン(14%)が続き、 SQLウェアハウスの設定・管理に関する知識が問われます。
SQL WarehouseはDatabricks SQLのコンピュートリソースで、3つのタイプがあります。
| タイプ | 特徴 | 用途 |
|---|---|---|
| Serverless | 起動時間が秒単位で最速。Databricksがインフラ管理 | 本番ダッシュボード・アドホッククエリ(推奨) |
| Pro | 中程度の起動時間。Photonエンジン搭載 | コスト管理が必要な本番環境 |
| Classic | 起動に数分。機能が限定的 | レガシー互換(新規利用は非推奨) |
AI/BI Genieは自然言語でデータに質問できるインターフェースです。 「先月の売上上位5商品は?」のような質問を入力すると、 適切なSQLが自動生成されて結果が返されます。
OPTIMIZE my_table ZORDER BY (column1)でフィルタ列を指定ANALYZE TABLE my_table COMPUTE STATISTICS FOR ALL COLUMNS| 比較項目 | Data Analyst Associate (DAA) | Data Engineer Associate (DEA) |
|---|---|---|
| 主な対象者 | BIアナリスト・データアナリスト | データエンジニア |
| 使用コンピュート | SQL Warehouse | All-purpose / Job Cluster |
| 主要ツール | Databricks SQL・ダッシュボード・Genie | ノートブック・DLT・Workflows |
| 主要言語 | SQL(100%) | Python + SQL |
| Delta Lake出題範囲 | 基礎概念のみ(Time Travel・OPTIMIZE) | 詳細(MERGE・CDF・Schema Evolution) |
| Unity Catalog出題範囲 | テーブル権限・共有設定 | 3レベル名前空間・リネージ・外部ロケーション |
| ダッシュボード | 出題あり(12%) | 出題なし |
| ETLパイプライン | 出題なし | 出題あり(DLT・Auto Loader・Workflows) |
| 推奨学習期間 | 3〜4週間(SQL基礎がある場合) | 5〜6週間 |
Databricks
問題 1
Databricks SQLでダッシュボードの表示速度を改善したいと考えています。ダッシュボードには5つのクエリが含まれ、各クエリの平均実行時間は30秒です。最も効果的な改善策はどれですか?
正解: B
ダッシュボードの表示速度改善には、まずResult Cacheの活用とテーブルの物理最適化が最も効果的です。Result Cacheが有効であれば、同一クエリの2回目以降の実行はキャッシュから即座に結果が返されます。さらにOPTIMIZE + Z-ORDERにより、フィルタ対象の列のデータが物理的に近い場所に配置され、スキャン量が削減されます。選択肢Aのクラスタサイズ増大はコストが大幅に増加する一方、クエリ自体の最適化なしではスキャン量は変わらないため費用対効果が低いです。選択肢Cは表示速度の根本的な改善ではなく、データの鮮度が犠牲になります。選択肢DはUNION ALLで異なるスキーマのクエリを無理に統合することで可読性とメンテナンス性が大幅に低下します。
Data Analyst AssociateとData Engineer Associateはどちらを先に受けるべきですか?
業務内容で判断してください。SQLでのクエリ作成・ダッシュボード構築・BI分析が中心の方はDAAが適しています。ETLパイプライン構築・Delta Lake操作・Workflowsによるジョブ管理が中心の方はDEAが適しています。DAAはSQL知識があれば3〜4週間で対策可能です。DEAはPython/PySpark・Delta Lakeの知識が追加で必要なため、5〜6週間が目安です。両方取得する場合、SQL基礎があるならDAAを先に取得し、DatabricksプラットフォームのUIに慣れてからDEAに進むルートが効率的です。
AI/BI Genieはどの程度出題されますか?
AI/BI GenieはDatabricks SQLの新機能として2〜3問程度出題されます。自然言語でデータに質問できるインターフェースであること、Genie SpaceとしてSQLウェアハウスに接続して動作すること、アクセス権限はUnity Catalogのテーブル権限に従うことを押さえておけば対応可能です。SQLの自動生成精度や制約条件(複雑なJOINの限界等)について問う問題も報告されています。
Databricks SQLの実務経験がなくても合格できますか?
合格は可能です。Databricks Community Edition(無料)ではSQLウェアハウスは使えませんが、ノートブック上のSQL実行でクエリ作成の練習ができます。ダッシュボード・アラート・クエリ履歴の機能は公式ドキュメントのスクリーンショットと操作手順を覚えることで対応できます。14日間の無料トライアルに登録すれば、SQLウェアハウスとダッシュボードの実際の操作も体験できるため、試験前に一度触れておくことを推奨します。
NicheeLab編集部
データエンジニアリング・クラウド資格の専門家。Databricks・Snowflake等の認定資格を保有し、実務経験に基づいた問題作成・解説を行っています。NicheeLab運営。
Databricks資格一覧|全7試験・難易度・勉強法
Databricks認定資格全7試験の一覧・難易度・出題範囲・合格ラインを徹底解説。2026年最新版の公式試験ガイドに準...
Databricks試験の難易度ランキング|全7資格を徹底比較
Databricks認定全7試験の難易度をランキング形式で徹底比較。合格率・学習時間・出題傾向から難易度を分析。...
Databricks資格の勉強方法|最短合格ルートと学習時間の目安
Databricks認定資格に最短で合格するための勉強方法を完全ガイド。公式リソース・問題集・学習スケジュールを徹底解説...
Databricks Data Engineer Associate完全解説|出題範囲・問題例・合格戦略
Databricks Certified Data Engineer Associate試験を徹底解説。5つの出題ドメイ...
Databricks Data Engineer Professional完全解説|上級試験の攻略法
Databricks Certified Data Engineer Professional試験を徹底解説。10の出題...