Microsoft Azure の主要 ETL / ELT オーケストレーションサービスである Fabric Pipeline と Azure Data Factory (ADF) を完全比較します。 両者は機能的に重複しつつも、課金体系・統合範囲・将来戦略が異なります。 本記事では、両者の違い・選定基準・Activity・Trigger・コスト最適化を網羅的に整理します。
| 項目 | Fabric Pipeline | Azure Data Factory (ADF) |
|---|---|---|
| 位置付け | Fabric Workspace 内 | 独立 Azure リソース |
| 課金 | Fabric Capacity (CU) | Activity Run + DIU + IR 時間 |
| Connector 数 | 多数 (Fabric 統合中心) | 90+ (最も多い) |
| Mapping Data Flow | × | ○ (Spark ベース) |
| Dataflow Gen2 | ○ | × (Gen1 のみ) |
| Notebook 統合 | Fabric Notebook 密結合 | Databricks / Synapse Notebook |
| Integration Runtime | Fabric 内動作 | Azure IR / Self-hosted IR / SSIS IR |
| 用途 | 新規 Fabric プロジェクト | 既存 ADF プロジェクト・非 Fabric 統合 |
| 長期戦略 | Microsoft 主推奨 (主流化中) | 継続サポートだが投資縮小傾向 |
Dataflow Gen2 は Microsoft Fabric の Data Engineering / Data Factory Workload で提供される Power Query ベースの ETL ツール。
Pipeline (Activity ベース・Orchestration) と Dataflow Gen2 (データ変換特化) は補完関係、両方組み合わせるのが標準。
| Activity | 用途 |
|---|---|
| Copy Activity | Source → Sink へのデータコピー (最も汎用) |
| Notebook Activity | Fabric Notebook / Synapse Notebook 実行 |
| Stored Procedure Activity | Warehouse Stored Procedure 実行 |
| Dataflow Activity | Dataflow Gen2 実行 |
| Lookup Activity | Data Source から値取得・後続 Activity 入力 |
| ForEach Activity | Loop 制御 |
| If Condition / Switch Activity | 分岐制御 |
| Wait Activity | 待機 |
| Execute Pipeline Activity | Pipeline 呼び出し (Modular 構成) |
| Web Activity | REST API 呼び出し |
| Set / Append Variable Activity | Pipeline 変数操作 |
| Validation Activity | 条件チェック |
Activity の依存関係 (Success / Failure / Completion / Skipped) で柔軟な分岐制御が可能。
| Trigger | 用途 |
|---|---|
| Schedule Trigger | CRON 式または定期間隔 (毎時・毎日・毎週) |
| Tumbling Window Trigger | 重複なし時間ウィンドウ単位、過去データ遡及処理 |
| Event-based Trigger | Storage Blob 作成・削除・Event Grid 統合 |
| Manual Trigger | Pipeline UI から手動実行 |
| Pipeline Run from Pipeline | Execute Pipeline Activity 経由 |
ADF / Synapse Pipeline の Integration Runtime (IR) は、データ統合処理を実行するコンピュート環境。
| 種類 | 用途 | 特徴 |
|---|---|---|
| Azure IR | Azure 内 PaaS から Public Network 経由 | 最も簡単・スケーラブル・標準 |
| Self-hosted IR | オンプレ・VNet 内・Private Endpoint 経由 | ネットワーク分離環境に必須 |
| Azure-SSIS IR | 既存 SSIS Package のリフト&シフト | SQL Server SSIS 移行向け |
Self-hosted IR は単一インスタンス (最大 4 ノード冗長化) で、ノード数増やすほど並列処理性能向上。 Fabric Pipeline は Integration Runtime 概念がやや簡素化、Fabric Capacity 内で動作。
Mapping Data Flow は ADF / Synapse Pipeline で提供される Visual Data Transformation 機能、内部で Spark Job として動作。
Mapping Data Flow は Spark Job として裏で動作、大量データ処理可能 (TB 級)。 Fabric Pipeline には Mapping Data Flow は提供されず、代わりに Dataflow Gen2 + Notebook で同等機能を実装するのが Fabric の設計思想。
Microsoft は Fabric Pipeline への投資を加速、長期的には Fabric Pipeline が主流になる見込み。
Fabric Pipeline と Azure Data Factory の違いは?
両方とも GUI ベースの ETL / ELT オーケストレーションサービスで、機能的に重複。Fabric Pipeline: Microsoft Fabric Workspace 内で動作、Fabric Lakehouse / Warehouse / KQL Database と密接統合、課金は Fabric Capacity (CU)、Activity 種類はやや限定的だが Fabric ネイティブサービス連携が強力、新規 Fabric プロジェクト向け。Azure Data Factory (ADF): 独立した Azure リソース、ADLS Gen2 / Synapse / Databricks / SQL DB / オンプレなど 90+ Connector、課金は Activity Run 単位 + Integration Runtime 時間、エンタープライズ ETL の長期実績、既存プロジェクトの保守。判断: 新規 Fabric ベースプロジェクト → Fabric Pipeline、既存 ADF プロジェクトの継続保守 → ADF、Fabric + 非 Fabric リソース統合 → 両方併用。Microsoft は Fabric Pipeline への投資を加速、長期的には Fabric Pipeline が主流になる見込みです。
Dataflow Gen2 とは?
Dataflow Gen2 は Microsoft Fabric の Data Engineering / Data Factory Workload で提供される Power Query ベースの ETL ツール。従来の Dataflow Gen1 (Power BI 内) の進化版で、Fabric Workspace で独立した Item として作成。代表的な機能: 1) Power Query Online で 300+ コネクタからのデータ取り込み (SaaS・Database・File)、2) Visual ETL 編集 (M Language ベースだが GUI 中心)、3) Output Destination として Lakehouse / Warehouse / KQL Database / SQL DB を指定、4) Pipeline からの呼び出し可能 (Activity として組み込み)、5) Auto-Schema 推論。代表的なユースケース: 1) SaaS データ (Salesforce・SAP・Dynamics 365) の取り込み、2) Power BI ユーザーが慣れた Power Query 言語で ETL、3) SQL アナリスト・ビジネスユーザー向けの低コード ETL。Pipeline (Activity ベース・Orchestration) と Dataflow Gen2 (データ変換特化) は補完関係、両方組み合わせるのが標準です。
Pipeline の Activity 種類は?
Fabric Pipeline / ADF の主要 Activity: 1) Copy Activity (Source → Sink へのデータコピー、90+ Connector 対応、最も汎用)、2) Notebook Activity (Fabric Notebook 実行・Synapse Notebook 実行)、3) Stored Procedure Activity (Warehouse Stored Procedure 実行)、4) Dataflow Activity (Dataflow Gen2 実行)、5) Lookup Activity (Data Source から値取得・後続 Activity 入力)、6) ForEach Activity (Loop 制御)、7) If Condition / Switch Activity (分岐制御)、8) Wait Activity (待機)、9) Execute Pipeline Activity (Pipeline 呼び出し・Modular 構成)、10) Web Activity (REST API 呼び出し)、11) Set Variable / Append Variable Activity (Pipeline 変数操作)、12) Validation Activity (条件チェック)。Pipeline = Activity の組み合わせで複雑な ETL ワークフローを GUI で構築、依存関係 (Success / Failure / Completion / Skipped) で柔軟な分岐制御が可能です。
Trigger の種類は?
Pipeline 実行の Trigger: 1) Schedule Trigger (CRON 式または定期間隔、毎時・毎日・毎週)、2) Tumbling Window Trigger (重複なし時間ウィンドウ単位、データ取り込みの過去日付処理に最適)、3) Event-based Trigger (Storage Account Blob 作成・削除・Event Grid 統合、リアクティブ ETL)、4) Manual Trigger (Pipeline UI から手動実行)、5) Pipeline Run from Pipeline (Execute Pipeline Activity 経由)。代表的な使い分け: 1) 毎日深夜のバッチ ETL → Schedule、2) リアルタイム Blob Upload → Event-based、3) 過去データの遡及処理 → Tumbling Window、4) Ad-hoc 実行 → Manual。本番運用では Schedule Trigger が最も一般的、Event-based でリアルタイム性を確保、Tumbling Window でデータ整合性を保証するのが標準パターンです。
Integration Runtime とは?
ADF / Synapse Pipeline の Integration Runtime (IR) は、データ統合処理を実行するコンピュート環境。3 種類: 1) Azure IR (Microsoft マネージド、Azure 内 PaaS から Public Network 経由でデータ取得、最も簡単・スケーラブル・標準的)、2) Self-hosted IR (オンプレ・VNet 内に IR Agent インストール、オンプレ DB・VNet 内 SQL DB・Private Endpoint 経由アクセス、ネットワーク分離環境に必須)、3) Azure-SSIS IR (既存 SSIS Package のリフト&シフト実行、SQL Server SSIS 移行向け)。Self-hosted IR は単一インスタンス (最大 4 ノード冗長化) で、ノード数増やすほど並列処理性能向上。本番運用では Azure IR + Self-hosted IR の組み合わせ (オンプレ部分は Self-hosted・Azure 部分は Azure IR) が標準パターン。Fabric Pipeline は Integration Runtime 概念がやや簡素化されており、Fabric Capacity 内で動作します。
Mapping Data Flow とは?
Mapping Data Flow は ADF / Synapse Pipeline で提供される Visual Data Transformation 機能、内部で Spark Job として動作。Source → Transformation (Filter・Aggregate・Join・Pivot・Sink) → Sink の GUI で ETL ロジック設計、コード不要。代表的な Transformation: 1) Filter (行フィルタリング)、2) Derived Column (新規列計算)、3) Aggregate (Group By + 集計)、4) Join (複数 Source 結合)、5) Lookup (Reference Data 検索)、6) Pivot / Unpivot (列方向変換)、7) Surrogate Key (連番付与)、8) Window (Window Function)、9) Conditional Split (条件分岐)、10) Sink (出力先指定)。Mapping Data Flow は Spark Job として裏で動作するため、大量データ処理可能 (TB 級)。Fabric Pipeline には Mapping Data Flow は提供されず、代わりに Dataflow Gen2 + Notebook で同等機能を実装するのが Fabric の設計思想です。
コスト最適化の戦略は?
ADF コスト要素: 1) Activity Run 料金 (Copy Activity・Lookup など 1 回 0.001 USD 程度)、2) Data Movement (DIU 時間 × DIU 数、データ転送量に応じてスケール)、3) Pipeline Activity 実行時間、4) Self-hosted IR Node の VM 料金 (本番 4 ノード冗長で月数十万円規模)。Fabric Pipeline コスト: Fabric Capacity (CU) のみ、Pipeline / Notebook / Dataflow すべて CU 共有。最適化施策: 1) Copy Activity の DIU を Auto から固定値 (4 DIU 標準) に変更、Data Movement コスト予測可能化、2) 不要 Trigger 停止 (頻繁実行 Schedule の見直し)、3) Self-hosted IR の Auto Scale 設定、4) Pipeline の並列実行数調整 (同時 Activity 数制限)、5) Fabric Pipeline の Pause / Resume 活用、6) Activity Log を Azure Monitor 送信して継続最適化。本番運用では月次 Pipeline 実行履歴レビューが必須で、Activity 実行回数の異常増加を早期検知することが重要です。
関連認定試験は?
DP-700 (Fabric Data Engineer Associate) で Fabric Pipeline が深く問われる本領域の本命認定 (Pipeline Activity・Trigger・Dataflow Gen2・Notebook 統合)。DP-203 (Azure Data Engineer Associate、2024-03 リタイア済) では ADF が中核トピックだった。AZ-305 (Solutions Architect Expert) でアーキテクト視点での ETL ツール選定、DP-300 (DBA) で Pipeline + SQL DB 統合、AI-103 (2026-06 GA) で Pipeline + Azure AI Foundry のデータ準備パイプライン。データエンジニアにとって Pipeline / Data Factory の理解は必須スキル、Fabric Pipeline は今後の主流ツールとして重点学習推奨です。
関連記事・技術深掘り
DP-203 vs DP-700 完全比較|旧 Azure Data Engineer vs 新 Fabric Data Engineer の違いと移行戦略【2026 年版】
Microsoft Azure データエンジニア認定の旧 DP-203 (Azure Data Engineer Associate、2024-03 リタイア) と新 DP-700 (Fabric Data Engineer Associate、2024-11 GA) を完全比較。試験仕様・対象プラットフォーム・出題範囲・難易度・学習時間・キャリアパスを表形式で整理。Microsoft Fabric への移行戦略、既保有者の追加取得ルートを日本語で網羅。
Azure Functions Trigger 完全解説|HTTP/Timer/Queue/Service Bus/Cosmos DB Change Feed 等全種類【2026 年版】
Azure Functions の Trigger 全種類を完全解説。HTTP Trigger・Timer Trigger・Queue Storage Trigger・Service Bus Trigger・Event Grid Trigger・Event Hub Trigger・Cosmos DB Change Feed Trigger・Blob Storage Trigger と Input/Output Binding。サーバーレスイベント駆動アーキテクチャ、関連認定試験 (AZ-204 / AZ-305 / AI-103) を日本語で網羅。
Azure Data Lake Storage Gen2 (ADLS Gen2) 完全設計|HNS・Medallion Architecture・Partition 戦略【2026 年版】
Azure Data Lake Storage Gen2 (ADLS Gen2) の完全ガイド。Hierarchical Namespace (HNS) の利点、Medallion Architecture (Bronze/Silver/Gold)、Partition 戦略、ABFS Driver、POSIX ACL + RBAC アクセス制御、Lifecycle Management、Microsoft Fabric / Databricks 統合、関連認定試験 (DP-700 / DP-300 / AI-103) を日本語で網羅。
Azure データエンジニア キャリアロードマップ|DP-900 → DP-700 → AI-103 シニアデータエンジニアへの道【2026 年版】
Azure データエンジニアになるための認定取得ロードマップ完全版。DP-900 → DP-700 → DP-600 / DP-300 の Fabric 時代の王道ルート、Databricks 認定との二刀流、AI-103 統合戦略、DP-203 リタイア後の選択、12-18 ヶ月の学習プラン、年収レンジまで日本語で網羅。
本記事の技術情報は Microsoft Fabric Data Factory Documentation およびAzure Data Factory Documentation に基づいています。 本記事は Microsoft Corporation の公式商品ではなく、いかなる提携・後援関係もありません。 Microsoft、Azure、Microsoft Fabric は Microsoft group of companies の商標です。 情報は 2026 年 5 月 24 日時点の公式公開資料に基づきます。最新情報は必ず公式ページをご確認ください。
NicheeLab編集部
データエンジニアリング・クラウド資格の専門家。Databricks・Snowflake等の認定資格を保有し、実務経験に基づいた問題作成・解説を行っています。NicheeLab運営。
AZ-900 完全ガイド|Microsoft Azure Fundamentals 出題範囲・学習リソース・合格戦略
Microsoft Azure Fundamentals (AZ-900) の 2026 年 1 月 14 日改訂版に対...
Azure 認定資格ロードマップ 2026 完全版|全 26 試験の体系と大型再編 (AI-901/AI-103/SC-500)
Microsoft Azure 認定資格 全 26 試験 (現行 23 + 退役 3) の 2026 年版ロードマップ。...
AI-901 完全ガイド|Azure AI Fundamentals 新試験
Microsoft Certified: Azure AI Fundamentals (AI-901) の出題範囲・Mi...
Microsoft Entra ID 入門|旧 Azure AD から学ぶ ID 管理 (AZ-900/SC-900/AZ-104 必須知識)
Microsoft Entra ID (旧 Azure Active Directory) の入門解説。2023 年 7...
DP-900 完全ガイド|Azure Data Fundamentals 出題範囲・学習リソース・合格戦略
Microsoft Azure Data Fundamentals (DP-900) の完全ガイド。4 ドメインの出題範...