Azure

Microsoft Fabric Lakehouse 入門|OneLake・Shortcut・Direct Lake・Medallion 実装

2026-05-24
NicheeLab編集部

Microsoft Fabric Lakehouse は、Microsoft Fabric の Data Engineering Workload で提供される統合データプラットフォームです。 Data Lake と Data Warehouse の両方の特性を併せ持つ『Lakehouse』アーキテクチャの Microsoft 実装で、Azure Synapse / Databricks の後継として急速に普及中。 本記事では、Lakehouse の基本・OneLake・Shortcut・Direct Lake・Medallion 実装・コスト管理を網羅的に整理します。

Lakehouse の基本

  • 内部的に Delta Parquet 形式で OneLake (Fabric の統一ストレージ) に保管
  • Apache Spark で処理 (PySpark / Spark SQL / Scala)
  • SQL Endpoint で Read-only T-SQL クエリも可能
  • Power BI Direct Lake モードで超低レイテンシ分析
  • Tables (Delta Tables) と Files (Raw Files) の 2 セクション構成

OneLake と Shortcut

OneLake は Fabric の統一ストレージレイヤ、すべての Fabric ワークロードが共有。内部的に ADLS Gen2 ベース。

Shortcut の対応データソース

  • ADLS Gen2 Storage Account
  • Amazon S3
  • Google Cloud Storage
  • Dataverse
  • 別 Workspace の OneLake

代表的なユースケース

  • 既存 ADLS Gen2 データを Fabric から直接活用 (移行不要)
  • AWS S3 のマルチクラウドデータ統合
  • 複数 Workspace 間のデータ共有 (アクセス権限管理は元 Workspace 維持)

Shortcut により Fabric は『データ移動なしのデータ統合』を実現、クラウド横断のデータレイク戦略の中核技術。

Direct Lake モード

Direct Lake は Microsoft Fabric の Power BI Semantic Model 接続モードの 1 つ。

モード動作速度Fresh データ適用シーン
Importデータを Power BI にコピー最速定期 Refresh 必要従来主流
DirectQueryクエリごとに Source へ遅い常に Freshリアルタイム性要件
Direct LakeDelta Parquet 直接読み込みImport 並み常に FreshFabric 主推奨
  • Refresh 不要 (常に最新)
  • Import より大規模データ対応 (10 億行+ も対応)
  • Power BI Premium / Fabric Capacity 必須
  • Fabric の最大の差別化機能の 1 つ

Lakehouse の構築手順

  1. Workspace → New Item → Lakehouse → 名前指定で作成 (数秒で完了)
  2. Lakehouse Explorer で Tables と Files の 2 セクションが表示
  3. Files にファイルアップロード (CSV・JSON・Parquet・各種形式)
  4. Notebook で PySpark コード実行してデータ処理
  5. df.write.format('delta').saveAsTable('table_name') で Delta Table 作成
  6. SQL Endpoint で T-SQL クエリ実行
  7. Power BI Semantic Model 自動作成 (Direct Lake 接続) で BI 分析

代表的な Spark コード例

from pyspark.sql import functions as F

df = (spark.read
    .format('csv')
    .option('header', 'true')
    .load('Files/raw/sales_2024.csv'))

cleaned = (df
    .filter(F.col('amount') > 0)
    .withColumn('processed_at', F.current_timestamp()))

cleaned.write.format('delta').mode('overwrite').saveAsTable('cleaned_sales')

Medallion Architecture の実装

Fabric Lakehouse での Medallion 実装パターン:

  1. Lakehouse Workspace に Bronze / Silver / Gold の 3 つの Lakehouse 作成 (環境分離)、または同一 Lakehouse 内で Schema/Folder 分離
  2. Bronze: Files にソースデータをそのまま配置 (CSV・JSON・Parquet)、または Tables にスキーマ最小限の Delta Table
  3. Silver: Bronze から PySpark で読み込み → クレンジング・JOIN・型変換 → Delta Table 化
  4. Gold: Silver から集計・Aggregate → Star Schema または Wide Table で Delta Table 化
  5. Pipeline で Bronze → Silver → Gold の依存関係を Orchestration
  6. Power BI Direct Lake で Gold を分析

詳細は Data Lake Gen2 完全設計 の Medallion セクションも参照。

Lakehouse vs Warehouse

項目LakehouseWarehouse
エンジンApache SparkMicrosoft SQL Engine
言語PySpark / Spark SQL / ScalaT-SQL
形式Delta LakeDelta Parquet (内部)
データ種類構造化 + 半構造化 + 非構造化構造化中心
SchemaSchema-on-Read 柔軟Schema-on-Write 厳密
ACIDあり (Delta)あり
用途Big Data・ML・StreamingSQL アナリスト・BI

詳細は Fabric Lakehouse vs Warehouse 完全比較 で深掘り。

Capacity Unit (CU) とコスト管理

Fabric の課金単位は Capacity Unit (CU)。

主要 SKU

SKUCU月額目安用途
F22約 4 万円開発
F44約 8 万円開発・テスト
F1616約 30 万円小規模本番
F6464約 64 万円本番標準
F128128約 130 万円大規模本番
F512512約 500 万円エンタープライズ
F20482048約 2,000 万円超大規模

コスト最適化施策

  1. 開発環境は F2 / F4 (Pause 可能)・本番のみ F64+
  2. Reserved Instance (1 年契約) で約 41% 割引
  3. Auto Scale で需要連動
  4. Pause 機能で業務時間外停止 (Dev / Stage)
  5. Capacity Metrics App で利用パターン分析・Right-sizing
  6. Workload 別 Capacity 分離 (Lakehouse Heavy 処理は別 Capacity に)

運用ベストプラクティス

  1. Workspace 単位で環境分離 (Dev / Stage / Prod)
  2. Bronze / Silver / Gold の Medallion 構造
  3. Shortcut で外部データを論理参照 (移行不要)
  4. Direct Lake で Power BI 統合・Refresh 不要化
  5. Notebook で開発・Pipeline で本番 Orchestration
  6. Reserved Instance + Pause でコスト最適化
  7. Capacity Metrics で月次 Right-sizing
  8. Git 連携で Notebook バージョン管理
  9. Workspace Role で権限制御
  10. OneLake の Domain で組織横断データガバナンス

関連認定試験

よくある質問

Microsoft Fabric Lakehouse とは?

Microsoft Fabric Lakehouse は、Microsoft Fabric の Data Engineering Workload で提供される統合データプラットフォームで、Data Lake と Data Warehouse の両方の特性を併せ持つ『Lakehouse』アーキテクチャの Microsoft 実装。内部的に Delta Parquet 形式で OneLake (Fabric の統一ストレージ) に保管、Apache Spark で処理。SQL Endpoint で Read-only T-SQL クエリも可能、Power BI Direct Lake モードで超低レイテンシ分析。代表的なユースケース: 1) データレイク + データウェアハウスの統合、2) Bronze / Silver / Gold Medallion Architecture の実装、3) PySpark でのデータ処理、4) Notebook ベースのインタラクティブ開発。DP-700 (Fabric Data Engineer Associate) 試験の中核トピックで、Azure Synapse / Databricks の後継として急速に普及中の最新データプラットフォームです。

Lakehouse と Warehouse の違いは?

Lakehouse: Apache Spark ベース、PySpark / Spark SQL / Scala でのデータ処理、Delta Lake 形式、構造化 + 半構造化 + 非構造化データ全対応、Notebook ベースの開発、Auto Loader でのストリーミング取り込み、Schema-on-Read 柔軟。Warehouse: T-SQL ベース、Microsoft SQL エンジンで動作、ACID トランザクション + Distributed Query、構造化データ中心、ストアドプロシージャ・関数対応、Schema-on-Write 厳密、BI / レポート向け最適化。判断: 1) Big Data・ML・Streaming → Lakehouse、2) SQL アナリスト・BI レポート → Warehouse、3) 両方混在 → 同一 OneLake 上で両方を運用可能 (Cross-warehouse Query で結合可)。新規 Fabric プロジェクトでは『Lakehouse (Bronze/Silver) + Warehouse (Gold)』のハイブリッド構成が標準パターン、データエンジニアと BI 開発者が同じデータ基盤で協業可能になります。

OneLake と Shortcut の動作は?

OneLake は Fabric の統一ストレージレイヤ、すべての Fabric ワークロード (Lakehouse・Warehouse・KQL Database・Power BI Semantic Model) が共有。内部的に ADLS Gen2 ベースで Delta Parquet 形式。Shortcut: 外部データソースを OneLake に論理参照する機能 (実データコピーなし)、対応: 1) ADLS Gen2 Storage Account、2) Amazon S3、3) Google Cloud Storage、4) Dataverse、5) 別 Workspace の OneLake。代表的なユースケース: 1) 既存 ADLS Gen2 データを Fabric から直接活用 (移行不要)、2) AWS S3 のマルチクラウドデータ統合、3) 複数 Workspace 間のデータ共有 (アクセス権限管理は元 Workspace 維持)。Shortcut により Fabric は『データ移動なしのデータ統合』を実現、クラウド横断のデータレイク戦略の中核技術となっています。

Direct Lake モードとは?

Direct Lake は Microsoft Fabric の Power BI Semantic Model 接続モードの 1 つで、Lakehouse / Warehouse の Delta Parquet データを直接 Power BI で分析する高速モード。従来の Power BI 接続モード比較: 1) Import Mode (データを Power BI にコピー、最速だが Fresh ではない、定期 Refresh 必要)、2) DirectQuery (クエリごとに Source へ、Fresh だが遅い)、3) Direct Lake (Delta Parquet を直接読み込み、Import 並みの速度 + Fresh データ)。動作: Delta Parquet ファイルを Power BI が直接メモリ Load → ユーザークエリ実行 → Lakehouse / Warehouse の最新データで分析。Refresh 不要 (常に最新)、Import より大規模データ対応 (10 億行+ も対応)。Power BI Premium / Fabric Capacity 必須。Fabric の最大の差別化機能の 1 つで、データエンジニアと BI 開発者の連携を大幅に効率化します。

Lakehouse の構築手順は?

Fabric Workspace で Lakehouse 作成: 1) Workspace → New Item → Lakehouse → 名前指定で作成 (数秒で完了)、2) Lakehouse Explorer で Tables (Delta Tables) と Files (Raw Files) の 2 セクションが表示、3) Files にファイルアップロード (CSV・JSON・Parquet・各種形式)、4) Notebook で PySpark コード実行してデータ処理、5) df.write.format('delta').saveAsTable('table_name') で Delta Table 作成、6) SQL Endpoint で T-SQL クエリ実行、7) Power BI Semantic Model 自動作成 (Direct Lake 接続) で BI 分析。代表的な Spark コード例: spark.read.format('csv').load('Files/raw/').filter(F.col('amount') > 0).write.format('delta').saveAsTable('cleaned_data')。Notebook と Lakehouse を統合した Fabric の開発体験は、Databricks に近い感覚で Microsoft エコシステム内で完結する利点があります。

Medallion Architecture を Lakehouse で実装するには?

Fabric Lakehouse での Medallion 実装パターン: 1) Lakehouse Workspace に Bronze / Silver / Gold の 3 つの Lakehouse 作成 (環境分離)、または同一 Lakehouse 内で Schema/Folder 分離、2) Bronze: Files にソースデータをそのまま配置 (CSV・JSON・Parquet)、または Tables にスキーマ最小限の Delta Table、3) Silver: Bronze から PySpark で読み込み → クレンジング・JOIN・型変換 → Delta Table 化、4) Gold: Silver から集計・Aggregate → Star Schema または Wide Table で Delta Table 化、5) Pipeline で Bronze → Silver → Gold の依存関係を Orchestration、6) Power BI Direct Lake で Gold を分析。Fabric Notebook で各段階を実装、Spark Session の Persistent Connection で開発効率向上。Databricks 経験者なら短期間で習熟可能、新規データエンジニアにも分かりやすい構成です。

Capacity Unit (CU) とコスト管理は?

Fabric の課金単位は Capacity Unit (CU)、SKU は F2 (2 CU)・F4・F8・F16・F32・F64・F128・F256・F512・F1024・F2048 (2048 CU)。Lakehouse の Spark 計算リソースは CU から動的割り当て、Pipeline Activity・Power BI Refresh・Notebook 実行などすべての処理が CU を消費。価格例: F64 (本番標準・約 64 万円/月)・F128 (約 130 万円/月)。コスト最適化: 1) 開発環境は F2 / F4 (Pause 可能)・本番のみ F64+、2) Reserved Instance (1 年契約) で約 41% 割引、3) Auto Scale で需要連動、4) Pause 機能で業務時間外停止 (Dev / Stage)、5) Capacity Metrics App で利用パターン分析・Right-sizing、6) Workload 別 Capacity 分離 (Lakehouse Heavy 処理は別 Capacity に)。本番運用では Capacity Metrics で月次 Right-sizing が標準パターンです。

関連認定試験は?

DP-700 (Fabric Data Engineer Associate) で Fabric Lakehouse が深く問われる本領域の本命認定 (Lakehouse 構築・Notebook・PySpark・Pipeline・Power BI Direct Lake 統合)。DP-600 (Fabric Analytics Engineer Associate) で BI / モデリング寄りの Lakehouse 活用、AZ-305 (Solutions Architect Expert) でアーキテクト視点での Fabric 採用判断、AI-103 (2026-06 GA) で Lakehouse + Azure AI Foundry の RAG 基盤統合。Databricks 認定 (Data Engineer Associate / Professional) との二刀流もマルチクラウドデータ基盤プロジェクトで評価。Microsoft Fabric は今後 5-10 年の Azure データ基盤の主軸として位置付けられており、データエンジニアにとって必須スキルです。

関連記事・技術深掘り

Azure Data Lake Storage Gen2 (ADLS Gen2) 完全設計|HNS・Medallion Architecture・Partition 戦略【2026 年版】

Azure Data Lake Storage Gen2 (ADLS Gen2) の完全ガイド。Hierarchical Namespace (HNS) の利点、Medallion Architecture (Bronze/Silver/Gold)、Partition 戦略、ABFS Driver、POSIX ACL + RBAC アクセス制御、Lifecycle Management、Microsoft Fabric / Databricks 統合、関連認定試験 (DP-700 / DP-300 / AI-103) を日本語で網羅。

Azure AI エンジニア キャリアロードマップ|AI-901 → AI-103 → 生成 AI アーキテクトへの道【2026 年版】

Azure AI エンジニアになるための認定取得ロードマップ完全版。AI-901 (2026-06 GA、AI-900 後継) → AI-103 (2026-06 GA、AI-102 後継) の最新ルート、Azure AI Foundry / Agent Service / OpenAI 中心の生成 AI 時代の構成、Databricks GenAI / OpenAI Direct との二刀流戦略、年収レンジまで日本語で網羅。

Azure データエンジニア キャリアロードマップ|DP-900 → DP-700 → AI-103 シニアデータエンジニアへの道【2026 年版】

Azure データエンジニアになるための認定取得ロードマップ完全版。DP-900 → DP-700 → DP-600 / DP-300 の Fabric 時代の王道ルート、Databricks 認定との二刀流、AI-103 統合戦略、DP-203 リタイア後の選択、12-18 ヶ月の学習プラン、年収レンジまで日本語で網羅。

DP-700 完全ガイド|Microsoft Certified: Fabric Data Engineer Associate 出題範囲・学習リソース・合格戦略【2026 年版】

Microsoft Certified: Fabric Data Engineer Associate (DP-700) の完全ガイド。3 ドメインの出題範囲、Microsoft Fabric の Lakehouse / Warehouse / Real-Time Intelligence / Pipelines の実装、DP-203 からの移行戦略、3 ヶ月の合格ロードマップ、DP-600 / AZ-305 への展開ルートを日本語で網羅。

本記事の技術情報は Microsoft Fabric Lakehouse Documentation に基づいています。 本記事は Microsoft Corporation の公式商品ではなく、いかなる提携・後援関係もありません。 Microsoft、Azure、Microsoft Fabric は Microsoft group of companies の商標です。Apache Spark は Apache Software Foundation の商標です。 情報は 2026 年 5 月 24 日時点の公式公開資料に基づきます。最新情報は必ず公式ページをご確認ください。

この記事で学んだ内容を問題で確認しましょう

16,000問以上の問題で実力チェック

Azure 試験対策ページを見る
この記事の著者

NicheeLab編集部

データエンジニアリング・クラウド資格の専門家。Databricks・Snowflake等の認定資格を保有し、実務経験に基づいた問題作成・解説を行っています。NicheeLab運営。


関連記事
Azure

AZ-900 完全ガイド|Microsoft Azure Fundamentals 出題範囲・学習リソース・合格戦略

Microsoft Azure Fundamentals (AZ-900) の 2026 年 1 月 14 日改訂版に対...

Azure

Azure 認定資格ロードマップ 2026 完全版|全 26 試験の体系と大型再編 (AI-901/AI-103/SC-500)

Microsoft Azure 認定資格 全 26 試験 (現行 23 + 退役 3) の 2026 年版ロードマップ。...

Azure

AI-901 完全ガイド|Azure AI Fundamentals 新試験

Microsoft Certified: Azure AI Fundamentals (AI-901) の出題範囲・Mi...

Azure

Microsoft Entra ID 入門|旧 Azure AD から学ぶ ID 管理 (AZ-900/SC-900/AZ-104 必須知識)

Microsoft Entra ID (旧 Azure Active Directory) の入門解説。2023 年 7...

Azure

DP-900 完全ガイド|Azure Data Fundamentals 出題範囲・学習リソース・合格戦略

Microsoft Azure Data Fundamentals (DP-900) の完全ガイド。4 ドメインの出題範...

Azureの記事一覧 (103件)
© 2026 NicheeLab All rights reserved.