Azure

Microsoft Fabric Lakehouse vs Warehouse 完全比較｜エンジン・T-SQL 互換性・性能・選定基準

2026-05-24

NicheeLab編集部

Microsoft Fabric の Lakehouse と Warehouse は、両方とも OneLake 上のデータプラットフォームでありながら、エンジン・開発スタイル・用途が大きく異なります。本記事では、両者の違い・選定基準・ハイブリッド構成パターンを多角的に比較整理します。 Fabric Lakehouse の基礎は Fabric Lakehouse 入門を参照。

全体比較

項目	Lakehouse	Warehouse
エンジン	Apache Spark	Microsoft SQL Engine
言語	PySpark / Spark SQL / Scala	T-SQL
開発スタイル	Notebook ベース	SSMS / Azure Data Studio
形式	Delta Lake	Delta Parquet (内部)
データ種類	構造化 + 半構造化 + 非構造化	構造化中心
Schema	Schema-on-Read 柔軟	Schema-on-Write 厳密
ACID	あり (Delta)	あり
T-SQL DML	不可 (SQL Endpoint は Read-only)	可
Stored Procedure	不可	可
用途	Big Data・ML・Streaming	BI・SQL アナリスト

Cross-warehouse Query

Cross-warehouse Query は、Lakehouse SQL Endpoint と Warehouse を相互に JOIN・参照する Fabric の機能。

動作

同一 Workspace 内であれば 3-part-name (database.schema.table) または fully qualified name で別データソース参照可能
データ複製不要、論理参照のみ
Lakehouse SQL Endpoint と Warehouse の両方向 Query 可能

代表的なユースケース

Lakehouse の Bronze データと Warehouse の Reference Data を JOIN
Warehouse の Gold データを Lakehouse の Notebook で読み取り
Lakehouse Delta Table と Warehouse Table の Hybrid 分析

従来は Synapse の SQL Pool / Spark Pool を別途構築 → ETL でデータ複製というアーキテクチャだったが、Fabric では Cross-warehouse Query で論理統合のみ・複製不要。

T-SQL 互換性

機能	Lakehouse SQL Endpoint	Warehouse
SELECT / JOIN / CTE / Window Function	○	○
INSERT / UPDATE / DELETE / MERGE	×	○
Stored Procedure	×	○
User-defined Function	×	○
Trigger	×	○
CLR	×	×
SSIS Job	×	× (Pipeline で代替)

SQL Server から Warehouse への移行は基本的に Lift and Shift 可能だが、一部 SQL Server 固有機能 (CLR・SSIS Job など) は対応していないため、事前互換性チェックが必要。

性能特性の違い

項目	Lakehouse Spark	Warehouse
Cold Start	数秒-数十秒	なし (即時)
並列処理	高並列	Distributed Query
最適規模	TB-PB 級	GB-TB 級
インタラクティブクエリ	Persistent Session で高速化	常時高速
Result Set Caching	限定	あり

判断: 1) インタラクティブ短時間クエリ → Warehouse、2) 大量データバッチ処理 → Lakehouse、3) ML 学習 → Lakehouse Spark、4) Power BI Direct Lake 接続では両方とも同等高速。

Microsoft 公式選定基準

Lakehouse 推奨

Spark / Python での開発経験チームが多い
大量データ (10 TB+) のバッチ処理
ML / AI ワークロード
半構造化・非構造化データ (JSON・画像・動画)
Streaming データ取り込み
Open Source Data Format 重視
Notebook ベースの探索的データ分析

Warehouse 推奨

既存 SQL Server / Synapse Dedicated SQL Pool からの移行
SQL アナリスト・BI 開発者が主担当
中規模データ (TB レベル) の高頻度分析
ACID トランザクション必須の Operational Data
Stored Procedure / Function による複雑業務ロジック
サードパーティ BI ツール (Tableau・Qlik) との SQL 接続

両方推奨

Bronze/Silver = Lakehouse + Gold = Warehouse のハイブリッド構成
データエンジニア (Lakehouse) + BI 開発者 (Warehouse) の協業環境

コスト面の違い

両者とも Fabric Capacity (CU) を消費する単一課金体系で、別途追加コストなし。

CU 消費パターンの違い

項目	Lakehouse Spark Job	Warehouse Query
CU 消費	起動時に高負荷、処理完了後解放	常時 Background Process で消費
Idle 時	ゼロ消費	常時消費
スパイク	大きい	小さい
適用シーン	バッチ処理中心	常時 BI アクセス

Capacity Metrics App で Workload 別 CU 消費を可視化、月次レビューで Right-sizing。

ハイブリッド構成のベストプラクティス

標準的なハイブリッドアーキテクチャ:

Bronze Lakehouse: Raw データ取り込み・Spark で Schema 検出・Notebook 開発
Silver Lakehouse: クレンジング・JOIN・Spark でデータ品質処理
Gold Warehouse: 集計・Star Schema・SQL アナリストが直接クエリ・Stored Procedure で業務ロジック
Power BI Semantic Model: Direct Lake 接続 (Gold Warehouse 経由)
Pipeline: Lakehouse → Warehouse のデータ移動 Orchestration
Cross-warehouse Query: Lakehouse データを Warehouse から参照可能

アクセス権限

Lakehouse はデータエンジニアのみ書き込み可・SQL アナリストは Read-only
Warehouse は BI 開発者・SQL アナリストが業務ロジック実装可

役割分担が明確になり、組織全体のデータ活用効率が大幅向上。

運用ベストプラクティス

新規プロジェクトは Lakehouse + Warehouse のハイブリッド構成から検討
データエンジニアと BI 開発者の役割分担を明確化
Cross-warehouse Query で論理統合・複製回避
Power BI Direct Lake で Warehouse / Lakehouse 両方統合
Workspace Role で適切な権限分離
Capacity Metrics で月次 CU 消費分析
Git 連携で Notebook / SQL バージョン管理
Pipeline で Bronze → Silver → Gold 依存関係 Orchestration
OneLake Domain で組織横断データガバナンス
定期的なアーキテクチャレビュー (年 2 回)

よくある質問

Lakehouse と Warehouse の最大の違いは?

エンジンと開発スタイルが根本的に異なる。Lakehouse: Apache Spark エンジン、PySpark / Spark SQL / Scala で開発、Notebook ベースのインタラクティブ開発、Delta Lake 形式、Schema-on-Read 柔軟、Big Data / ML / Streaming 向け。Warehouse: Microsoft SQL エンジン、T-SQL ベース、SSMS / Azure Data Studio で開発、Distributed Query Processing、Schema-on-Write 厳密、BI / レポート向け最適化。両者は同じ OneLake 上で動作 (Delta Parquet 形式共有)、Cross-warehouse Query で相互結合可能。データエンジニア (Lakehouse) と BI 開発者 / SQL アナリスト (Warehouse) が同じデータ基盤で協業可能、Microsoft Fabric の設計思想の中核。新規プロジェクトでは両方を組み合わせた『Lakehouse (Bronze/Silver) + Warehouse (Gold)』のハイブリッド構成が標準パターンです。

Cross-warehouse Query とは?

Cross-warehouse Query は、Lakehouse SQL Endpoint と Warehouse を相互に JOIN・参照する Fabric の機能。同一 Workspace 内であれば 3-part-name (database.schema.table) または fully qualified name で別データソースのテーブル参照可能。代表例: 1) Lakehouse の Bronze データと Warehouse の Reference Data を JOIN、2) Warehouse の Gold データを Lakehouse の Notebook で読み取り、3) Lakehouse Delta Table と Warehouse Table の Hybrid 分析。これによりデータエンジニアが Lakehouse でデータ準備 → BI 開発者が Warehouse + Lakehouse 統合クエリで分析、というシームレスな協業が実現。従来は Synapse の SQL Pool / Spark Pool を別途構築 → ETL でデータ複製、というアーキテクチャだったが、Fabric では Cross-warehouse Query で論理統合のみ・複製不要というアーキテクチャ革新を実現しています。

T-SQL 互換性は?

Warehouse の T-SQL 互換性: 基本的な SELECT / INSERT / UPDATE / DELETE / MERGE・JOIN・Window Function・CTE は完全サポート、Stored Procedure・User-defined Function・Sequence Object・Trigger も対応。Lakehouse SQL Endpoint の T-SQL: Read-only クエリのみサポート (SELECT / JOIN / CTE / Window Function 対応)、INSERT / UPDATE / DELETE は不可 (Spark Notebook 経由でのみ書き込み)、Stored Procedure 不可。判断: T-SQL での DML 操作 (INSERT / UPDATE) 必要 → Warehouse、Read-only Analytics → Lakehouse SQL Endpoint で十分。SQL Server から Warehouse への移行は基本的に Lift and Shift 可能だが、一部 SQL Server 固有機能 (CLR・SSIS Job など) は対応していないため、事前互換性チェックが必要です。

性能特性の違いは?

Lakehouse Spark: Spark Job 起動オーバーヘッド (Cold Start 数秒-数十秒)、起動後は高並列処理可能、Large Dataset (TB-PB 級) で性能発揮、Notebook の Persistent Spark Session で対話的処理高速化。Warehouse: 即時クエリ実行 (Cold Start なし)、複雑 JOIN・集計クエリ高速 (Distributed Query)、小-中規模 (GB-TB) で性能良好、Result Set Caching で繰り返しクエリ高速化。判断: 1) インタラクティブ短時間クエリ → Warehouse、2) 大量データバッチ処理 → Lakehouse、3) ML 学習 → Lakehouse Spark、4) Power BI Direct Lake 接続では両方とも同等高速 (Delta Parquet 直接読み込みのため)。本番運用では Workload 特性に応じて両方を使い分け、Fabric の Capacity (CU) は両方に共通で消費されるためコスト管理は統一可能です。

Microsoft 公式の使い分け基準は?

Microsoft が推奨する選定基準: Lakehouse 推奨: 1) Spark / Python での開発経験チームが多い、2) 大量データ (10 TB+) のバッチ処理、3) ML / AI ワークロード、4) 半構造化・非構造化データ (JSON・画像・動画)、5) Streaming データ取り込み、6) Open Source Data Format (Iceberg・Hudi など将来対応) 重視、7) Notebook ベースの探索的データ分析。Warehouse 推奨: 1) 既存 SQL Server / Synapse Dedicated SQL Pool からの移行、2) SQL アナリスト・BI 開発者が主担当、3) 中規模データ (TB レベル) の高頻度分析、4) ACID トランザクション必須の Operational Data、5) Stored Procedure / Function による複雑業務ロジック、6) サードパーティ BI ツール (Tableau・Qlik) との SQL 接続。両方推奨: 1) Bronze/Silver = Lakehouse + Gold = Warehouse のハイブリッド構成、2) データエンジニア (Lakehouse) + BI 開発者 (Warehouse) の協業環境。

コスト面の違いは?

両者とも Fabric Capacity (CU) を消費する単一課金体系で、別途追加コストなし。CU 消費パターンの違い: Lakehouse Spark Job: 起動時に CU を高負荷消費、処理完了後 CU 解放、Idle 時間ゼロ消費。Warehouse Query: 常時 Background Process で CU 消費 (Always Warm)、クエリ実行時にスパイク。判断: 1) バッチ処理中心 → Lakehouse のほうが CU 効率良い (処理時間のみ消費)、2) 常時 BI アクセス → Warehouse の常時 CU 消費を見込む、3) 開発・テストは Lakehouse の Pause 可能性活用。Capacity Metrics App で Workload 別 CU 消費を可視化、月次レビューで Right-sizing。Microsoft Fabric の Capacity 共有設計により、Lakehouse / Warehouse を別々に予算化する必要がなく、Workload 全体での最適化が可能です。

ハイブリッド構成のベストプラクティスは?

標準的なハイブリッドアーキテクチャ: 1) Bronze Lakehouse (Raw データ取り込み・Spark で Schema 検出・Notebook 開発)、2) Silver Lakehouse (クレンジング・JOIN・Spark でデータ品質処理)、3) Gold Warehouse (集計・Star Schema・SQL アナリストが直接クエリ・Stored Procedure で業務ロジック)、4) Power BI Semantic Model に Direct Lake 接続 (Gold Warehouse 経由)、5) Pipeline で Lakehouse → Warehouse のデータ移動 Orchestration、6) Cross-warehouse Query で Lakehouse データを Warehouse から参照可能。アクセス権限: Lakehouse はデータエンジニアのみ書き込み可・SQL アナリストは Read-only、Warehouse は BI 開発者・SQL アナリストが業務ロジック実装可。役割分担が明確になり、組織全体のデータ活用効率が大幅向上します。

この記事で学んだ内容を問題で確認しましょう

16,000問以上の問題で実力チェック

Azure 試験対策ページを見る

この記事の著者

NicheeLab編集部

データエンジニアリング・クラウド資格の専門家。Databricks・Snowflake等の認定資格を保有し、実務経験に基づいた問題作成・解説を行っています。NicheeLab運営。

Azure

AZ-900 完全ガイド｜Microsoft Azure Fundamentals 出題範囲・学習リソース・合格戦略

Microsoft Azure Fundamentals (AZ-900) の 2026 年 1 月 14 日改訂版に対...

Azure

Azure 認定資格ロードマップ 2026 完全版｜全 26 試験の体系と大型再編 (AI-901/AI-103/SC-500)

Microsoft Azure 認定資格全 26 試験 (現行 23 + 退役 3) の 2026 年版ロードマップ。...

Azure

AI-901 完全ガイド｜Azure AI Fundamentals 新試験

Microsoft Certified: Azure AI Fundamentals (AI-901) の出題範囲・Mi...

Azure

Microsoft Entra ID 入門｜旧 Azure AD から学ぶ ID 管理 (AZ-900/SC-900/AZ-104 必須知識)

Microsoft Entra ID (旧 Azure Active Directory) の入門解説。2023 年 7...

Azure

DP-900 完全ガイド｜Azure Data Fundamentals 出題範囲・学習リソース・合格戦略

Microsoft Azure Data Fundamentals (DP-900) の完全ガイド。4 ドメインの出題範...

Microsoft Fabric Lakehouse vs Warehouse 完全比較｜エンジン・T-SQL 互換性・性能・選定基準

全体比較

Cross-warehouse Query

動作

代表的なユースケース

T-SQL 互換性

性能特性の違い

Microsoft 公式選定基準

Lakehouse 推奨

Warehouse 推奨

両方推奨

コスト面の違い

CU 消費パターンの違い

ハイブリッド構成のベストプラクティス

アクセス権限

運用ベストプラクティス

関連認定試験

よくある質問

この記事で学んだ内容を問題で確認しましょう

この記事の著者

関連記事

Azureの記事一覧 (103件)