Azure

Fabric Pipeline vs Azure Data Factory 完全比較｜Activity・Trigger・Integration Runtime・選定基準

2026-05-24

NicheeLab編集部

Microsoft Azure の主要 ETL / ELT オーケストレーションサービスである Fabric Pipeline と Azure Data Factory (ADF) を完全比較します。両者は機能的に重複しつつも、課金体系・統合範囲・将来戦略が異なります。本記事では、両者の違い・選定基準・Activity・Trigger・コスト最適化を網羅的に整理します。

全体比較

項目	Fabric Pipeline	Azure Data Factory (ADF)
位置付け	Fabric Workspace 内	独立 Azure リソース
課金	Fabric Capacity (CU)	Activity Run + DIU + IR 時間
Connector 数	多数 (Fabric 統合中心)	90+ (最も多い)
Mapping Data Flow	×	○ (Spark ベース)
Dataflow Gen2	○	× (Gen1 のみ)
Notebook 統合	Fabric Notebook 密結合	Databricks / Synapse Notebook
Integration Runtime	Fabric 内動作	Azure IR / Self-hosted IR / SSIS IR
用途	新規 Fabric プロジェクト	既存 ADF プロジェクト・非 Fabric 統合
長期戦略	Microsoft 主推奨 (主流化中)	継続サポートだが投資縮小傾向

Dataflow Gen2

Dataflow Gen2 は Microsoft Fabric の Data Engineering / Data Factory Workload で提供される Power Query ベースの ETL ツール。

主要機能

Power Query Online で 300+ コネクタからのデータ取り込み
Visual ETL 編集 (M Language ベースだが GUI 中心)
Output Destination として Lakehouse / Warehouse / KQL Database / SQL DB を指定
Pipeline からの呼び出し可能 (Activity として組み込み)
Auto-Schema 推論

代表的なユースケース

SaaS データ (Salesforce・SAP・Dynamics 365) の取り込み
Power BI ユーザーが慣れた Power Query 言語で ETL
SQL アナリスト・ビジネスユーザー向けの低コード ETL

Pipeline (Activity ベース・Orchestration) と Dataflow Gen2 (データ変換特化) は補完関係、両方組み合わせるのが標準。

Pipeline の Activity 種類

Activity	用途
Copy Activity	Source → Sink へのデータコピー (最も汎用)
Notebook Activity	Fabric Notebook / Synapse Notebook 実行
Stored Procedure Activity	Warehouse Stored Procedure 実行
Dataflow Activity	Dataflow Gen2 実行
Lookup Activity	Data Source から値取得・後続 Activity 入力
ForEach Activity	Loop 制御
If Condition / Switch Activity	分岐制御
Wait Activity	待機
Execute Pipeline Activity	Pipeline 呼び出し (Modular 構成)
Web Activity	REST API 呼び出し
Set / Append Variable Activity	Pipeline 変数操作
Validation Activity	条件チェック

Activity の依存関係 (Success / Failure / Completion / Skipped) で柔軟な分岐制御が可能。

Trigger の種類

Trigger	用途
Schedule Trigger	CRON 式または定期間隔 (毎時・毎日・毎週)
Tumbling Window Trigger	重複なし時間ウィンドウ単位、過去データ遡及処理
Event-based Trigger	Storage Blob 作成・削除・Event Grid 統合
Manual Trigger	Pipeline UI から手動実行
Pipeline Run from Pipeline	Execute Pipeline Activity 経由

代表的な使い分け

毎日深夜のバッチ ETL → Schedule
リアルタイム Blob Upload → Event-based
過去データの遡及処理 → Tumbling Window
Ad-hoc 実行 → Manual

Integration Runtime (ADF)

ADF / Synapse Pipeline の Integration Runtime (IR) は、データ統合処理を実行するコンピュート環境。

種類	用途	特徴
Azure IR	Azure 内 PaaS から Public Network 経由	最も簡単・スケーラブル・標準
Self-hosted IR	オンプレ・VNet 内・Private Endpoint 経由	ネットワーク分離環境に必須
Azure-SSIS IR	既存 SSIS Package のリフト&シフト	SQL Server SSIS 移行向け

Self-hosted IR は単一インスタンス (最大 4 ノード冗長化) で、ノード数増やすほど並列処理性能向上。Fabric Pipeline は Integration Runtime 概念がやや簡素化、Fabric Capacity 内で動作。

Mapping Data Flow (ADF 専用)

Mapping Data Flow は ADF / Synapse Pipeline で提供される Visual Data Transformation 機能、内部で Spark Job として動作。

代表的な Transformation

Filter (行フィルタリング)
Derived Column (新規列計算)
Aggregate (Group By + 集計)
Join (複数 Source 結合)
Lookup (Reference Data 検索)
Pivot / Unpivot (列方向変換)
Surrogate Key (連番付与)
Window (Window Function)
Conditional Split (条件分岐)

Mapping Data Flow は Spark Job として裏で動作、大量データ処理可能 (TB 級)。 Fabric Pipeline には Mapping Data Flow は提供されず、代わりに Dataflow Gen2 + Notebook で同等機能を実装するのが Fabric の設計思想。

コスト最適化

ADF コスト要素

Activity Run 料金 (Copy Activity・Lookup など 1 回 0.001 USD 程度)
Data Movement (DIU 時間 × DIU 数)
Pipeline Activity 実行時間
Self-hosted IR Node の VM 料金 (本番 4 ノード冗長で月数十万円)

Fabric Pipeline コスト

Fabric Capacity (CU) のみ
Pipeline / Notebook / Dataflow すべて CU 共有

最適化施策

Copy Activity の DIU を Auto から固定値 (4 DIU 標準) に変更
不要 Trigger 停止 (頻繁実行 Schedule の見直し)
Self-hosted IR の Auto Scale 設定
Pipeline の並列実行数調整 (同時 Activity 数制限)
Fabric Pipeline の Pause / Resume 活用
Activity Log を Azure Monitor 送信して継続最適化

選定基準

新規 Fabric ベースプロジェクト → Fabric Pipeline
既存 ADF プロジェクトの継続保守 → ADF
Fabric + 非 Fabric リソース統合 → 両方併用
SSIS リフト&シフト → ADF + Azure-SSIS IR
オンプレデータソース統合 → ADF + Self-hosted IR
Power BI ユーザー向け低コード ETL → Fabric Pipeline + Dataflow Gen2
Spark ベース大量データ変換 → Fabric Notebook (Mapping Data Flow 不要)

Microsoft は Fabric Pipeline への投資を加速、長期的には Fabric Pipeline が主流になる見込み。

運用ベストプラクティス

新規プロジェクトは Fabric Pipeline を優先検討
Modular 設計 (Execute Pipeline で子 Pipeline 分割)
Schedule + Event-based の組み合わせで柔軟な Trigger 設計
Failure Handling (Retry・Alert・Failover Activity)
Pipeline Parameter で環境別構成 (Dev / Stage / Prod)
Activity Log を Azure Monitor 送信
Microsoft Sentinel に Pipeline 失敗イベント送信
Git 連携で Pipeline JSON バージョン管理
Self-hosted IR の Health Monitor アラート
月次 Activity Run 履歴レビュー

よくある質問

Fabric Pipeline と Azure Data Factory の違いは?

両方とも GUI ベースの ETL / ELT オーケストレーションサービスで、機能的に重複。Fabric Pipeline: Microsoft Fabric Workspace 内で動作、Fabric Lakehouse / Warehouse / KQL Database と密接統合、課金は Fabric Capacity (CU)、Activity 種類はやや限定的だが Fabric ネイティブサービス連携が強力、新規 Fabric プロジェクト向け。Azure Data Factory (ADF): 独立した Azure リソース、ADLS Gen2 / Synapse / Databricks / SQL DB / オンプレなど 90+ Connector、課金は Activity Run 単位 + Integration Runtime 時間、エンタープライズ ETL の長期実績、既存プロジェクトの保守。判断: 新規 Fabric ベースプロジェクト → Fabric Pipeline、既存 ADF プロジェクトの継続保守 → ADF、Fabric + 非 Fabric リソース統合 → 両方併用。Microsoft は Fabric Pipeline への投資を加速、長期的には Fabric Pipeline が主流になる見込みです。

Dataflow Gen2 とは?

Dataflow Gen2 は Microsoft Fabric の Data Engineering / Data Factory Workload で提供される Power Query ベースの ETL ツール。従来の Dataflow Gen1 (Power BI 内) の進化版で、Fabric Workspace で独立した Item として作成。代表的な機能: 1) Power Query Online で 300+ コネクタからのデータ取り込み (SaaS・Database・File)、2) Visual ETL 編集 (M Language ベースだが GUI 中心)、3) Output Destination として Lakehouse / Warehouse / KQL Database / SQL DB を指定、4) Pipeline からの呼び出し可能 (Activity として組み込み)、5) Auto-Schema 推論。代表的なユースケース: 1) SaaS データ (Salesforce・SAP・Dynamics 365) の取り込み、2) Power BI ユーザーが慣れた Power Query 言語で ETL、3) SQL アナリスト・ビジネスユーザー向けの低コード ETL。Pipeline (Activity ベース・Orchestration) と Dataflow Gen2 (データ変換特化) は補完関係、両方組み合わせるのが標準です。

Pipeline の Activity 種類は?

Fabric Pipeline / ADF の主要 Activity: 1) Copy Activity (Source → Sink へのデータコピー、90+ Connector 対応、最も汎用)、2) Notebook Activity (Fabric Notebook 実行・Synapse Notebook 実行)、3) Stored Procedure Activity (Warehouse Stored Procedure 実行)、4) Dataflow Activity (Dataflow Gen2 実行)、5) Lookup Activity (Data Source から値取得・後続 Activity 入力)、6) ForEach Activity (Loop 制御)、7) If Condition / Switch Activity (分岐制御)、8) Wait Activity (待機)、9) Execute Pipeline Activity (Pipeline 呼び出し・Modular 構成)、10) Web Activity (REST API 呼び出し)、11) Set Variable / Append Variable Activity (Pipeline 変数操作)、12) Validation Activity (条件チェック)。Pipeline = Activity の組み合わせで複雑な ETL ワークフローを GUI で構築、依存関係 (Success / Failure / Completion / Skipped) で柔軟な分岐制御が可能です。

Trigger の種類は?

Pipeline 実行の Trigger: 1) Schedule Trigger (CRON 式または定期間隔、毎時・毎日・毎週)、2) Tumbling Window Trigger (重複なし時間ウィンドウ単位、データ取り込みの過去日付処理に最適)、3) Event-based Trigger (Storage Account Blob 作成・削除・Event Grid 統合、リアクティブ ETL)、4) Manual Trigger (Pipeline UI から手動実行)、5) Pipeline Run from Pipeline (Execute Pipeline Activity 経由)。代表的な使い分け: 1) 毎日深夜のバッチ ETL → Schedule、2) リアルタイム Blob Upload → Event-based、3) 過去データの遡及処理 → Tumbling Window、4) Ad-hoc 実行 → Manual。本番運用では Schedule Trigger が最も一般的、Event-based でリアルタイム性を確保、Tumbling Window でデータ整合性を保証するのが標準パターンです。

Integration Runtime とは?

ADF / Synapse Pipeline の Integration Runtime (IR) は、データ統合処理を実行するコンピュート環境。3 種類: 1) Azure IR (Microsoft マネージド、Azure 内 PaaS から Public Network 経由でデータ取得、最も簡単・スケーラブル・標準的)、2) Self-hosted IR (オンプレ・VNet 内に IR Agent インストール、オンプレ DB・VNet 内 SQL DB・Private Endpoint 経由アクセス、ネットワーク分離環境に必須)、3) Azure-SSIS IR (既存 SSIS Package のリフト&シフト実行、SQL Server SSIS 移行向け)。Self-hosted IR は単一インスタンス (最大 4 ノード冗長化) で、ノード数増やすほど並列処理性能向上。本番運用では Azure IR + Self-hosted IR の組み合わせ (オンプレ部分は Self-hosted・Azure 部分は Azure IR) が標準パターン。Fabric Pipeline は Integration Runtime 概念がやや簡素化されており、Fabric Capacity 内で動作します。

Mapping Data Flow とは?

Mapping Data Flow は ADF / Synapse Pipeline で提供される Visual Data Transformation 機能、内部で Spark Job として動作。Source → Transformation (Filter・Aggregate・Join・Pivot・Sink) → Sink の GUI で ETL ロジック設計、コード不要。代表的な Transformation: 1) Filter (行フィルタリング)、2) Derived Column (新規列計算)、3) Aggregate (Group By + 集計)、4) Join (複数 Source 結合)、5) Lookup (Reference Data 検索)、6) Pivot / Unpivot (列方向変換)、7) Surrogate Key (連番付与)、8) Window (Window Function)、9) Conditional Split (条件分岐)、10) Sink (出力先指定)。Mapping Data Flow は Spark Job として裏で動作するため、大量データ処理可能 (TB 級)。Fabric Pipeline には Mapping Data Flow は提供されず、代わりに Dataflow Gen2 + Notebook で同等機能を実装するのが Fabric の設計思想です。

コスト最適化の戦略は?

ADF コスト要素: 1) Activity Run 料金 (Copy Activity・Lookup など 1 回 0.001 USD 程度)、2) Data Movement (DIU 時間 × DIU 数、データ転送量に応じてスケール)、3) Pipeline Activity 実行時間、4) Self-hosted IR Node の VM 料金 (本番 4 ノード冗長で月数十万円規模)。Fabric Pipeline コスト: Fabric Capacity (CU) のみ、Pipeline / Notebook / Dataflow すべて CU 共有。最適化施策: 1) Copy Activity の DIU を Auto から固定値 (4 DIU 標準) に変更、Data Movement コスト予測可能化、2) 不要 Trigger 停止 (頻繁実行 Schedule の見直し)、3) Self-hosted IR の Auto Scale 設定、4) Pipeline の並列実行数調整 (同時 Activity 数制限)、5) Fabric Pipeline の Pause / Resume 活用、6) Activity Log を Azure Monitor 送信して継続最適化。本番運用では月次 Pipeline 実行履歴レビューが必須で、Activity 実行回数の異常増加を早期検知することが重要です。

この記事で学んだ内容を問題で確認しましょう

16,000問以上の問題で実力チェック

Azure 試験対策ページを見る

この記事の著者

NicheeLab編集部

データエンジニアリング・クラウド資格の専門家。Databricks・Snowflake等の認定資格を保有し、実務経験に基づいた問題作成・解説を行っています。NicheeLab運営。

Azure

AZ-900 完全ガイド｜Microsoft Azure Fundamentals 出題範囲・学習リソース・合格戦略

Microsoft Azure Fundamentals (AZ-900) の 2026 年 1 月 14 日改訂版に対...

Azure

Azure 認定資格ロードマップ 2026 完全版｜全 26 試験の体系と大型再編 (AI-901/AI-103/SC-500)

Microsoft Azure 認定資格全 26 試験 (現行 23 + 退役 3) の 2026 年版ロードマップ。...

Azure

AI-901 完全ガイド｜Azure AI Fundamentals 新試験

Microsoft Certified: Azure AI Fundamentals (AI-901) の出題範囲・Mi...

Azure

Microsoft Entra ID 入門｜旧 Azure AD から学ぶ ID 管理 (AZ-900/SC-900/AZ-104 必須知識)

Microsoft Entra ID (旧 Azure Active Directory) の入門解説。2023 年 7...

Azure

DP-900 完全ガイド｜Azure Data Fundamentals 出題範囲・学習リソース・合格戦略

Microsoft Azure Data Fundamentals (DP-900) の完全ガイド。4 ドメインの出題範...

Fabric Pipeline vs Azure Data Factory 完全比較｜Activity・Trigger・Integration Runtime・選定基準

全体比較

Dataflow Gen2

主要機能

代表的なユースケース

Pipeline の Activity 種類

Trigger の種類

代表的な使い分け

Integration Runtime (ADF)

Mapping Data Flow (ADF 専用)

代表的な Transformation

コスト最適化

ADF コスト要素

Fabric Pipeline コスト

最適化施策

選定基準

運用ベストプラクティス

関連認定試験

よくある質問

この記事で学んだ内容を問題で確認しましょう

この記事の著者

関連記事

Azureの記事一覧 (103件)