Microsoft Fabric の Lakehouse と Warehouse は、両方とも OneLake 上のデータプラットフォームでありながら、エンジン・開発スタイル・用途が大きく異なります。 本記事では、両者の違い・選定基準・ハイブリッド構成パターンを多角的に比較整理します。 Fabric Lakehouse の基礎は Fabric Lakehouse 入門 を参照。
| 項目 | Lakehouse | Warehouse |
|---|---|---|
| エンジン | Apache Spark | Microsoft SQL Engine |
| 言語 | PySpark / Spark SQL / Scala | T-SQL |
| 開発スタイル | Notebook ベース | SSMS / Azure Data Studio |
| 形式 | Delta Lake | Delta Parquet (内部) |
| データ種類 | 構造化 + 半構造化 + 非構造化 | 構造化中心 |
| Schema | Schema-on-Read 柔軟 | Schema-on-Write 厳密 |
| ACID | あり (Delta) | あり |
| T-SQL DML | 不可 (SQL Endpoint は Read-only) | 可 |
| Stored Procedure | 不可 | 可 |
| 用途 | Big Data・ML・Streaming | BI・SQL アナリスト |
Cross-warehouse Query は、Lakehouse SQL Endpoint と Warehouse を相互に JOIN・参照する Fabric の機能。
従来は Synapse の SQL Pool / Spark Pool を別途構築 → ETL でデータ複製というアーキテクチャだったが、Fabric では Cross-warehouse Query で論理統合のみ・複製不要。
| 機能 | Lakehouse SQL Endpoint | Warehouse |
|---|---|---|
| SELECT / JOIN / CTE / Window Function | ○ | ○ |
| INSERT / UPDATE / DELETE / MERGE | × | ○ |
| Stored Procedure | × | ○ |
| User-defined Function | × | ○ |
| Trigger | × | ○ |
| CLR | × | × |
| SSIS Job | × | × (Pipeline で代替) |
SQL Server から Warehouse への移行は基本的に Lift and Shift 可能だが、一部 SQL Server 固有機能 (CLR・SSIS Job など) は対応していないため、事前互換性チェックが必要。
| 項目 | Lakehouse Spark | Warehouse |
|---|---|---|
| Cold Start | 数秒-数十秒 | なし (即時) |
| 並列処理 | 高並列 | Distributed Query |
| 最適規模 | TB-PB 級 | GB-TB 級 |
| インタラクティブクエリ | Persistent Session で高速化 | 常時高速 |
| Result Set Caching | 限定 | あり |
判断: 1) インタラクティブ短時間クエリ → Warehouse、2) 大量データバッチ処理 → Lakehouse、3) ML 学習 → Lakehouse Spark、4) Power BI Direct Lake 接続では両方とも同等高速。
両者とも Fabric Capacity (CU) を消費する単一課金体系で、別途追加コストなし。
| 項目 | Lakehouse Spark Job | Warehouse Query |
|---|---|---|
| CU 消費 | 起動時に高負荷、処理完了後解放 | 常時 Background Process で消費 |
| Idle 時 | ゼロ消費 | 常時消費 |
| スパイク | 大きい | 小さい |
| 適用シーン | バッチ処理中心 | 常時 BI アクセス |
Capacity Metrics App で Workload 別 CU 消費を可視化、月次レビューで Right-sizing。
標準的なハイブリッドアーキテクチャ:
役割分担が明確になり、組織全体のデータ活用効率が大幅向上。
Lakehouse と Warehouse の最大の違いは?
エンジンと開発スタイルが根本的に異なる。Lakehouse: Apache Spark エンジン、PySpark / Spark SQL / Scala で開発、Notebook ベースのインタラクティブ開発、Delta Lake 形式、Schema-on-Read 柔軟、Big Data / ML / Streaming 向け。Warehouse: Microsoft SQL エンジン、T-SQL ベース、SSMS / Azure Data Studio で開発、Distributed Query Processing、Schema-on-Write 厳密、BI / レポート向け最適化。両者は同じ OneLake 上で動作 (Delta Parquet 形式共有)、Cross-warehouse Query で相互結合可能。データエンジニア (Lakehouse) と BI 開発者 / SQL アナリスト (Warehouse) が同じデータ基盤で協業可能、Microsoft Fabric の設計思想の中核。新規プロジェクトでは両方を組み合わせた『Lakehouse (Bronze/Silver) + Warehouse (Gold)』のハイブリッド構成が標準パターンです。
Cross-warehouse Query とは?
Cross-warehouse Query は、Lakehouse SQL Endpoint と Warehouse を相互に JOIN・参照する Fabric の機能。同一 Workspace 内であれば 3-part-name (database.schema.table) または fully qualified name で別データソースのテーブル参照可能。代表例: 1) Lakehouse の Bronze データと Warehouse の Reference Data を JOIN、2) Warehouse の Gold データを Lakehouse の Notebook で読み取り、3) Lakehouse Delta Table と Warehouse Table の Hybrid 分析。これにより データエンジニア が Lakehouse でデータ準備 → BI 開発者 が Warehouse + Lakehouse 統合クエリで分析、というシームレスな協業が実現。従来は Synapse の SQL Pool / Spark Pool を別途構築 → ETL でデータ複製、というアーキテクチャだったが、Fabric では Cross-warehouse Query で論理統合のみ・複製不要というアーキテクチャ革新を実現しています。
T-SQL 互換性は?
Warehouse の T-SQL 互換性: 基本的な SELECT / INSERT / UPDATE / DELETE / MERGE・JOIN・Window Function・CTE は完全サポート、Stored Procedure・User-defined Function・Sequence Object・Trigger も対応。Lakehouse SQL Endpoint の T-SQL: Read-only クエリのみサポート (SELECT / JOIN / CTE / Window Function 対応)、INSERT / UPDATE / DELETE は不可 (Spark Notebook 経由でのみ書き込み)、Stored Procedure 不可。判断: T-SQL での DML 操作 (INSERT / UPDATE) 必要 → Warehouse、Read-only Analytics → Lakehouse SQL Endpoint で十分。SQL Server から Warehouse への移行は基本的に Lift and Shift 可能だが、一部 SQL Server 固有機能 (CLR・SSIS Job など) は対応していないため、事前互換性チェックが必要です。
性能特性の違いは?
Lakehouse Spark: Spark Job 起動オーバーヘッド (Cold Start 数秒-数十秒)、起動後は高並列処理可能、Large Dataset (TB-PB 級) で性能発揮、Notebook の Persistent Spark Session で対話的処理高速化。Warehouse: 即時クエリ実行 (Cold Start なし)、複雑 JOIN・集計クエリ高速 (Distributed Query)、小-中規模 (GB-TB) で性能良好、Result Set Caching で繰り返しクエリ高速化。判断: 1) インタラクティブ短時間クエリ → Warehouse、2) 大量データバッチ処理 → Lakehouse、3) ML 学習 → Lakehouse Spark、4) Power BI Direct Lake 接続では両方とも同等高速 (Delta Parquet 直接読み込みのため)。本番運用では Workload 特性に応じて両方を使い分け、Fabric の Capacity (CU) は両方に共通で消費されるためコスト管理は統一可能です。
Microsoft 公式の使い分け基準は?
Microsoft が推奨する選定基準: Lakehouse 推奨: 1) Spark / Python での開発経験チームが多い、2) 大量データ (10 TB+) のバッチ処理、3) ML / AI ワークロード、4) 半構造化・非構造化データ (JSON・画像・動画)、5) Streaming データ取り込み、6) Open Source Data Format (Iceberg・Hudi など将来対応) 重視、7) Notebook ベースの探索的データ分析。Warehouse 推奨: 1) 既存 SQL Server / Synapse Dedicated SQL Pool からの移行、2) SQL アナリスト・BI 開発者が主担当、3) 中規模データ (TB レベル) の高頻度分析、4) ACID トランザクション必須の Operational Data、5) Stored Procedure / Function による複雑業務ロジック、6) サードパーティ BI ツール (Tableau・Qlik) との SQL 接続。両方推奨: 1) Bronze/Silver = Lakehouse + Gold = Warehouse のハイブリッド構成、2) データエンジニア (Lakehouse) + BI 開発者 (Warehouse) の協業環境。
コスト面の違いは?
両者とも Fabric Capacity (CU) を消費する単一課金体系で、別途追加コストなし。CU 消費パターンの違い: Lakehouse Spark Job: 起動時に CU を高負荷消費、処理完了後 CU 解放、Idle 時間ゼロ消費。Warehouse Query: 常時 Background Process で CU 消費 (Always Warm)、クエリ実行時にスパイク。判断: 1) バッチ処理中心 → Lakehouse のほうが CU 効率良い (処理時間のみ消費)、2) 常時 BI アクセス → Warehouse の常時 CU 消費を見込む、3) 開発・テストは Lakehouse の Pause 可能性活用。Capacity Metrics App で Workload 別 CU 消費を可視化、月次レビューで Right-sizing。Microsoft Fabric の Capacity 共有設計により、Lakehouse / Warehouse を別々に予算化する必要がなく、Workload 全体での最適化が可能です。
ハイブリッド構成のベストプラクティスは?
標準的なハイブリッドアーキテクチャ: 1) Bronze Lakehouse (Raw データ取り込み・Spark で Schema 検出・Notebook 開発)、2) Silver Lakehouse (クレンジング・JOIN・Spark でデータ品質処理)、3) Gold Warehouse (集計・Star Schema・SQL アナリストが直接クエリ・Stored Procedure で業務ロジック)、4) Power BI Semantic Model に Direct Lake 接続 (Gold Warehouse 経由)、5) Pipeline で Lakehouse → Warehouse のデータ移動 Orchestration、6) Cross-warehouse Query で Lakehouse データを Warehouse から参照可能。アクセス権限: Lakehouse はデータエンジニアのみ書き込み可・SQL アナリストは Read-only、Warehouse は BI 開発者・SQL アナリストが業務ロジック実装可。役割分担が明確になり、組織全体のデータ活用効率が大幅向上します。
関連認定試験は?
DP-700 (Fabric Data Engineer Associate) で両方の使い分けが深く問われる本領域の本命認定。DP-600 (Fabric Analytics Engineer Associate) で Warehouse + Power BI 統合、AZ-305 (Solutions Architect Expert) でアーキテクト視点での Fabric アーキテクチャ判断、AI-103 (2026-06 GA) で Lakehouse + Azure AI Foundry の統合シナリオ。Microsoft Fabric の差別化機能の理解が DP-700 試験合格の鍵で、Cross-warehouse Query・Direct Lake・Medallion 実装パターンを実機で習得することが推奨されます。
関連記事・技術深掘り
Azure SQL Database vs Managed Instance vs SQL on VM 完全比較|SQL Server プラットフォーム選定ガイド【2026 年版】
Azure 上の SQL Server プラットフォーム 3 選択肢 SQL Database・Managed Instance・SQL on VM を完全比較。互換性・機能差・サービスティア (GP/BC/Hyperscale)・vCore vs DTU・HADR・コスト・セキュリティを表形式で整理。関連認定試験 (DP-300 / AZ-305 / SC-100) を日本語で網羅。
DP-700 完全ガイド|Microsoft Certified: Fabric Data Engineer Associate 出題範囲・学習リソース・合格戦略【2026 年版】
Microsoft Certified: Fabric Data Engineer Associate (DP-700) の完全ガイド。3 ドメインの出題範囲、Microsoft Fabric の Lakehouse / Warehouse / Real-Time Intelligence / Pipelines の実装、DP-203 からの移行戦略、3 ヶ月の合格ロードマップ、DP-600 / AZ-305 への展開ルートを日本語で網羅。
DP-203 vs DP-700 完全比較|旧 Azure Data Engineer vs 新 Fabric Data Engineer の違いと移行戦略【2026 年版】
Microsoft Azure データエンジニア認定の旧 DP-203 (Azure Data Engineer Associate、2024-03 リタイア) と新 DP-700 (Fabric Data Engineer Associate、2024-11 GA) を完全比較。試験仕様・対象プラットフォーム・出題範囲・難易度・学習時間・キャリアパスを表形式で整理。Microsoft Fabric への移行戦略、既保有者の追加取得ルートを日本語で網羅。
Microsoft Fabric Lakehouse 入門|OneLake・Shortcut・Direct Lake・Medallion 実装【2026 年版】
Microsoft Fabric Lakehouse の入門ガイド。OneLake 統一ストレージ・Shortcut 外部参照・Direct Lake モード・Medallion Architecture (Bronze/Silver/Gold) 実装・Lakehouse 構築手順・Capacity Unit (CU) コスト管理・関連認定試験 (DP-700 / DP-600 / AI-103) を日本語で網羅。
本記事の技術情報は Microsoft Fabric Warehouse Documentation およびFabric Data Engineering Documentation に基づいています。 本記事は Microsoft Corporation の公式商品ではなく、いかなる提携・後援関係もありません。 Microsoft、Azure、Microsoft Fabric は Microsoft group of companies の商標です。 情報は 2026 年 5 月 24 日時点の公式公開資料に基づきます。最新情報は必ず公式ページをご確認ください。
NicheeLab編集部
データエンジニアリング・クラウド資格の専門家。Databricks・Snowflake等の認定資格を保有し、実務経験に基づいた問題作成・解説を行っています。NicheeLab運営。
AZ-900 完全ガイド|Microsoft Azure Fundamentals 出題範囲・学習リソース・合格戦略
Microsoft Azure Fundamentals (AZ-900) の 2026 年 1 月 14 日改訂版に対...
Azure 認定資格ロードマップ 2026 完全版|全 26 試験の体系と大型再編 (AI-901/AI-103/SC-500)
Microsoft Azure 認定資格 全 26 試験 (現行 23 + 退役 3) の 2026 年版ロードマップ。...
AI-901 完全ガイド|Azure AI Fundamentals 新試験
Microsoft Certified: Azure AI Fundamentals (AI-901) の出題範囲・Mi...
Microsoft Entra ID 入門|旧 Azure AD から学ぶ ID 管理 (AZ-900/SC-900/AZ-104 必須知識)
Microsoft Entra ID (旧 Azure Active Directory) の入門解説。2023 年 7...
DP-900 完全ガイド|Azure Data Fundamentals 出題範囲・学習リソース・合格戦略
Microsoft Azure Data Fundamentals (DP-900) の完全ガイド。4 ドメインの出題範...