Azure

Microsoft Fabric Lakehouse vs Warehouse 完全比較|エンジン・T-SQL 互換性・性能・選定基準

2026-05-24
NicheeLab編集部

Microsoft Fabric の LakehouseWarehouse は、両方とも OneLake 上のデータプラットフォームでありながら、エンジン・開発スタイル・用途が大きく異なります。 本記事では、両者の違い・選定基準・ハイブリッド構成パターンを多角的に比較整理します。 Fabric Lakehouse の基礎は Fabric Lakehouse 入門 を参照。

全体比較

項目LakehouseWarehouse
エンジンApache SparkMicrosoft SQL Engine
言語PySpark / Spark SQL / ScalaT-SQL
開発スタイルNotebook ベースSSMS / Azure Data Studio
形式Delta LakeDelta Parquet (内部)
データ種類構造化 + 半構造化 + 非構造化構造化中心
SchemaSchema-on-Read 柔軟Schema-on-Write 厳密
ACIDあり (Delta)あり
T-SQL DML不可 (SQL Endpoint は Read-only)
Stored Procedure不可
用途Big Data・ML・StreamingBI・SQL アナリスト

Cross-warehouse Query

Cross-warehouse Query は、Lakehouse SQL Endpoint と Warehouse を相互に JOIN・参照する Fabric の機能。

動作

  • 同一 Workspace 内であれば 3-part-name (database.schema.table) または fully qualified name で別データソース参照可能
  • データ複製不要、論理参照のみ
  • Lakehouse SQL Endpoint と Warehouse の両方向 Query 可能

代表的なユースケース

  • Lakehouse の Bronze データと Warehouse の Reference Data を JOIN
  • Warehouse の Gold データを Lakehouse の Notebook で読み取り
  • Lakehouse Delta Table と Warehouse Table の Hybrid 分析

従来は Synapse の SQL Pool / Spark Pool を別途構築 → ETL でデータ複製というアーキテクチャだったが、Fabric では Cross-warehouse Query で論理統合のみ・複製不要

T-SQL 互換性

機能Lakehouse SQL EndpointWarehouse
SELECT / JOIN / CTE / Window Function
INSERT / UPDATE / DELETE / MERGE×
Stored Procedure×
User-defined Function×
Trigger×
CLR××
SSIS Job×× (Pipeline で代替)

SQL Server から Warehouse への移行は基本的に Lift and Shift 可能だが、一部 SQL Server 固有機能 (CLR・SSIS Job など) は対応していないため、事前互換性チェックが必要。

性能特性の違い

項目Lakehouse SparkWarehouse
Cold Start数秒-数十秒なし (即時)
並列処理高並列Distributed Query
最適規模TB-PB 級GB-TB 級
インタラクティブクエリPersistent Session で高速化常時高速
Result Set Caching限定あり

判断: 1) インタラクティブ短時間クエリ → Warehouse、2) 大量データバッチ処理 → Lakehouse、3) ML 学習 → Lakehouse Spark、4) Power BI Direct Lake 接続では両方とも同等高速。

Microsoft 公式選定基準

Lakehouse 推奨

  • Spark / Python での開発経験チームが多い
  • 大量データ (10 TB+) のバッチ処理
  • ML / AI ワークロード
  • 半構造化・非構造化データ (JSON・画像・動画)
  • Streaming データ取り込み
  • Open Source Data Format 重視
  • Notebook ベースの探索的データ分析

Warehouse 推奨

  • 既存 SQL Server / Synapse Dedicated SQL Pool からの移行
  • SQL アナリスト・BI 開発者が主担当
  • 中規模データ (TB レベル) の高頻度分析
  • ACID トランザクション必須の Operational Data
  • Stored Procedure / Function による複雑業務ロジック
  • サードパーティ BI ツール (Tableau・Qlik) との SQL 接続

両方推奨

  • Bronze/Silver = Lakehouse + Gold = Warehouse のハイブリッド構成
  • データエンジニア (Lakehouse) + BI 開発者 (Warehouse) の協業環境

コスト面の違い

両者とも Fabric Capacity (CU) を消費する単一課金体系で、別途追加コストなし。

CU 消費パターンの違い

項目Lakehouse Spark JobWarehouse Query
CU 消費起動時に高負荷、処理完了後解放常時 Background Process で消費
Idle 時ゼロ消費常時消費
スパイク大きい小さい
適用シーンバッチ処理中心常時 BI アクセス

Capacity Metrics App で Workload 別 CU 消費を可視化、月次レビューで Right-sizing。

ハイブリッド構成のベストプラクティス

標準的なハイブリッドアーキテクチャ:

  1. Bronze Lakehouse: Raw データ取り込み・Spark で Schema 検出・Notebook 開発
  2. Silver Lakehouse: クレンジング・JOIN・Spark でデータ品質処理
  3. Gold Warehouse: 集計・Star Schema・SQL アナリストが直接クエリ・Stored Procedure で業務ロジック
  4. Power BI Semantic Model: Direct Lake 接続 (Gold Warehouse 経由)
  5. Pipeline: Lakehouse → Warehouse のデータ移動 Orchestration
  6. Cross-warehouse Query: Lakehouse データを Warehouse から参照可能

アクセス権限

  • Lakehouse はデータエンジニアのみ書き込み可・SQL アナリストは Read-only
  • Warehouse は BI 開発者・SQL アナリストが業務ロジック実装可

役割分担が明確になり、組織全体のデータ活用効率が大幅向上。

運用ベストプラクティス

  1. 新規プロジェクトは Lakehouse + Warehouse のハイブリッド構成から検討
  2. データエンジニアと BI 開発者の役割分担を明確化
  3. Cross-warehouse Query で論理統合・複製回避
  4. Power BI Direct Lake で Warehouse / Lakehouse 両方統合
  5. Workspace Role で適切な権限分離
  6. Capacity Metrics で月次 CU 消費分析
  7. Git 連携で Notebook / SQL バージョン管理
  8. Pipeline で Bronze → Silver → Gold 依存関係 Orchestration
  9. OneLake Domain で組織横断データガバナンス
  10. 定期的なアーキテクチャレビュー (年 2 回)

関連認定試験

よくある質問

Lakehouse と Warehouse の最大の違いは?

エンジンと開発スタイルが根本的に異なる。Lakehouse: Apache Spark エンジン、PySpark / Spark SQL / Scala で開発、Notebook ベースのインタラクティブ開発、Delta Lake 形式、Schema-on-Read 柔軟、Big Data / ML / Streaming 向け。Warehouse: Microsoft SQL エンジン、T-SQL ベース、SSMS / Azure Data Studio で開発、Distributed Query Processing、Schema-on-Write 厳密、BI / レポート向け最適化。両者は同じ OneLake 上で動作 (Delta Parquet 形式共有)、Cross-warehouse Query で相互結合可能。データエンジニア (Lakehouse) と BI 開発者 / SQL アナリスト (Warehouse) が同じデータ基盤で協業可能、Microsoft Fabric の設計思想の中核。新規プロジェクトでは両方を組み合わせた『Lakehouse (Bronze/Silver) + Warehouse (Gold)』のハイブリッド構成が標準パターンです。

Cross-warehouse Query とは?

Cross-warehouse Query は、Lakehouse SQL Endpoint と Warehouse を相互に JOIN・参照する Fabric の機能。同一 Workspace 内であれば 3-part-name (database.schema.table) または fully qualified name で別データソースのテーブル参照可能。代表例: 1) Lakehouse の Bronze データと Warehouse の Reference Data を JOIN、2) Warehouse の Gold データを Lakehouse の Notebook で読み取り、3) Lakehouse Delta Table と Warehouse Table の Hybrid 分析。これにより データエンジニア が Lakehouse でデータ準備 → BI 開発者 が Warehouse + Lakehouse 統合クエリで分析、というシームレスな協業が実現。従来は Synapse の SQL Pool / Spark Pool を別途構築 → ETL でデータ複製、というアーキテクチャだったが、Fabric では Cross-warehouse Query で論理統合のみ・複製不要というアーキテクチャ革新を実現しています。

T-SQL 互換性は?

Warehouse の T-SQL 互換性: 基本的な SELECT / INSERT / UPDATE / DELETE / MERGE・JOIN・Window Function・CTE は完全サポート、Stored Procedure・User-defined Function・Sequence Object・Trigger も対応。Lakehouse SQL Endpoint の T-SQL: Read-only クエリのみサポート (SELECT / JOIN / CTE / Window Function 対応)、INSERT / UPDATE / DELETE は不可 (Spark Notebook 経由でのみ書き込み)、Stored Procedure 不可。判断: T-SQL での DML 操作 (INSERT / UPDATE) 必要 → Warehouse、Read-only Analytics → Lakehouse SQL Endpoint で十分。SQL Server から Warehouse への移行は基本的に Lift and Shift 可能だが、一部 SQL Server 固有機能 (CLR・SSIS Job など) は対応していないため、事前互換性チェックが必要です。

性能特性の違いは?

Lakehouse Spark: Spark Job 起動オーバーヘッド (Cold Start 数秒-数十秒)、起動後は高並列処理可能、Large Dataset (TB-PB 級) で性能発揮、Notebook の Persistent Spark Session で対話的処理高速化。Warehouse: 即時クエリ実行 (Cold Start なし)、複雑 JOIN・集計クエリ高速 (Distributed Query)、小-中規模 (GB-TB) で性能良好、Result Set Caching で繰り返しクエリ高速化。判断: 1) インタラクティブ短時間クエリ → Warehouse、2) 大量データバッチ処理 → Lakehouse、3) ML 学習 → Lakehouse Spark、4) Power BI Direct Lake 接続では両方とも同等高速 (Delta Parquet 直接読み込みのため)。本番運用では Workload 特性に応じて両方を使い分け、Fabric の Capacity (CU) は両方に共通で消費されるためコスト管理は統一可能です。

Microsoft 公式の使い分け基準は?

Microsoft が推奨する選定基準: Lakehouse 推奨: 1) Spark / Python での開発経験チームが多い、2) 大量データ (10 TB+) のバッチ処理、3) ML / AI ワークロード、4) 半構造化・非構造化データ (JSON・画像・動画)、5) Streaming データ取り込み、6) Open Source Data Format (Iceberg・Hudi など将来対応) 重視、7) Notebook ベースの探索的データ分析。Warehouse 推奨: 1) 既存 SQL Server / Synapse Dedicated SQL Pool からの移行、2) SQL アナリスト・BI 開発者が主担当、3) 中規模データ (TB レベル) の高頻度分析、4) ACID トランザクション必須の Operational Data、5) Stored Procedure / Function による複雑業務ロジック、6) サードパーティ BI ツール (Tableau・Qlik) との SQL 接続。両方推奨: 1) Bronze/Silver = Lakehouse + Gold = Warehouse のハイブリッド構成、2) データエンジニア (Lakehouse) + BI 開発者 (Warehouse) の協業環境。

コスト面の違いは?

両者とも Fabric Capacity (CU) を消費する単一課金体系で、別途追加コストなし。CU 消費パターンの違い: Lakehouse Spark Job: 起動時に CU を高負荷消費、処理完了後 CU 解放、Idle 時間ゼロ消費。Warehouse Query: 常時 Background Process で CU 消費 (Always Warm)、クエリ実行時にスパイク。判断: 1) バッチ処理中心 → Lakehouse のほうが CU 効率良い (処理時間のみ消費)、2) 常時 BI アクセス → Warehouse の常時 CU 消費を見込む、3) 開発・テストは Lakehouse の Pause 可能性活用。Capacity Metrics App で Workload 別 CU 消費を可視化、月次レビューで Right-sizing。Microsoft Fabric の Capacity 共有設計により、Lakehouse / Warehouse を別々に予算化する必要がなく、Workload 全体での最適化が可能です。

ハイブリッド構成のベストプラクティスは?

標準的なハイブリッドアーキテクチャ: 1) Bronze Lakehouse (Raw データ取り込み・Spark で Schema 検出・Notebook 開発)、2) Silver Lakehouse (クレンジング・JOIN・Spark でデータ品質処理)、3) Gold Warehouse (集計・Star Schema・SQL アナリストが直接クエリ・Stored Procedure で業務ロジック)、4) Power BI Semantic Model に Direct Lake 接続 (Gold Warehouse 経由)、5) Pipeline で Lakehouse → Warehouse のデータ移動 Orchestration、6) Cross-warehouse Query で Lakehouse データを Warehouse から参照可能。アクセス権限: Lakehouse はデータエンジニアのみ書き込み可・SQL アナリストは Read-only、Warehouse は BI 開発者・SQL アナリストが業務ロジック実装可。役割分担が明確になり、組織全体のデータ活用効率が大幅向上します。

関連認定試験は?

DP-700 (Fabric Data Engineer Associate) で両方の使い分けが深く問われる本領域の本命認定。DP-600 (Fabric Analytics Engineer Associate) で Warehouse + Power BI 統合、AZ-305 (Solutions Architect Expert) でアーキテクト視点での Fabric アーキテクチャ判断、AI-103 (2026-06 GA) で Lakehouse + Azure AI Foundry の統合シナリオ。Microsoft Fabric の差別化機能の理解が DP-700 試験合格の鍵で、Cross-warehouse Query・Direct Lake・Medallion 実装パターンを実機で習得することが推奨されます。

関連記事・技術深掘り

Azure SQL Database vs Managed Instance vs SQL on VM 完全比較|SQL Server プラットフォーム選定ガイド【2026 年版】

Azure 上の SQL Server プラットフォーム 3 選択肢 SQL Database・Managed Instance・SQL on VM を完全比較。互換性・機能差・サービスティア (GP/BC/Hyperscale)・vCore vs DTU・HADR・コスト・セキュリティを表形式で整理。関連認定試験 (DP-300 / AZ-305 / SC-100) を日本語で網羅。

DP-700 完全ガイド|Microsoft Certified: Fabric Data Engineer Associate 出題範囲・学習リソース・合格戦略【2026 年版】

Microsoft Certified: Fabric Data Engineer Associate (DP-700) の完全ガイド。3 ドメインの出題範囲、Microsoft Fabric の Lakehouse / Warehouse / Real-Time Intelligence / Pipelines の実装、DP-203 からの移行戦略、3 ヶ月の合格ロードマップ、DP-600 / AZ-305 への展開ルートを日本語で網羅。

DP-203 vs DP-700 完全比較|旧 Azure Data Engineer vs 新 Fabric Data Engineer の違いと移行戦略【2026 年版】

Microsoft Azure データエンジニア認定の旧 DP-203 (Azure Data Engineer Associate、2024-03 リタイア) と新 DP-700 (Fabric Data Engineer Associate、2024-11 GA) を完全比較。試験仕様・対象プラットフォーム・出題範囲・難易度・学習時間・キャリアパスを表形式で整理。Microsoft Fabric への移行戦略、既保有者の追加取得ルートを日本語で網羅。

Microsoft Fabric Lakehouse 入門|OneLake・Shortcut・Direct Lake・Medallion 実装【2026 年版】

Microsoft Fabric Lakehouse の入門ガイド。OneLake 統一ストレージ・Shortcut 外部参照・Direct Lake モード・Medallion Architecture (Bronze/Silver/Gold) 実装・Lakehouse 構築手順・Capacity Unit (CU) コスト管理・関連認定試験 (DP-700 / DP-600 / AI-103) を日本語で網羅。

本記事の技術情報は Microsoft Fabric Warehouse Documentation およびFabric Data Engineering Documentation に基づいています。 本記事は Microsoft Corporation の公式商品ではなく、いかなる提携・後援関係もありません。 Microsoft、Azure、Microsoft Fabric は Microsoft group of companies の商標です。 情報は 2026 年 5 月 24 日時点の公式公開資料に基づきます。最新情報は必ず公式ページをご確認ください。

この記事で学んだ内容を問題で確認しましょう

16,000問以上の問題で実力チェック

Azure 試験対策ページを見る
この記事の著者

NicheeLab編集部

データエンジニアリング・クラウド資格の専門家。Databricks・Snowflake等の認定資格を保有し、実務経験に基づいた問題作成・解説を行っています。NicheeLab運営。


関連記事
Azure

AZ-900 完全ガイド|Microsoft Azure Fundamentals 出題範囲・学習リソース・合格戦略

Microsoft Azure Fundamentals (AZ-900) の 2026 年 1 月 14 日改訂版に対...

Azure

Azure 認定資格ロードマップ 2026 完全版|全 26 試験の体系と大型再編 (AI-901/AI-103/SC-500)

Microsoft Azure 認定資格 全 26 試験 (現行 23 + 退役 3) の 2026 年版ロードマップ。...

Azure

AI-901 完全ガイド|Azure AI Fundamentals 新試験

Microsoft Certified: Azure AI Fundamentals (AI-901) の出題範囲・Mi...

Azure

Microsoft Entra ID 入門|旧 Azure AD から学ぶ ID 管理 (AZ-900/SC-900/AZ-104 必須知識)

Microsoft Entra ID (旧 Azure Active Directory) の入門解説。2023 年 7...

Azure

DP-900 完全ガイド|Azure Data Fundamentals 出題範囲・学習リソース・合格戦略

Microsoft Azure Data Fundamentals (DP-900) の完全ガイド。4 ドメインの出題範...

Azureの記事一覧 (103件)
© 2026 NicheeLab All rights reserved.