Azure

Fabric Pipeline vs Azure Data Factory 完全比較|Activity・Trigger・Integration Runtime・選定基準

2026-05-24
NicheeLab編集部

Microsoft Azure の主要 ETL / ELT オーケストレーションサービスである Fabric PipelineAzure Data Factory (ADF) を完全比較します。 両者は機能的に重複しつつも、課金体系・統合範囲・将来戦略が異なります。 本記事では、両者の違い・選定基準・Activity・Trigger・コスト最適化を網羅的に整理します。

全体比較

項目Fabric PipelineAzure Data Factory (ADF)
位置付けFabric Workspace 内独立 Azure リソース
課金Fabric Capacity (CU)Activity Run + DIU + IR 時間
Connector 数多数 (Fabric 統合中心)90+ (最も多い)
Mapping Data Flow×○ (Spark ベース)
Dataflow Gen2× (Gen1 のみ)
Notebook 統合Fabric Notebook 密結合Databricks / Synapse Notebook
Integration RuntimeFabric 内動作Azure IR / Self-hosted IR / SSIS IR
用途新規 Fabric プロジェクト既存 ADF プロジェクト・非 Fabric 統合
長期戦略Microsoft 主推奨 (主流化中)継続サポートだが投資縮小傾向

Dataflow Gen2

Dataflow Gen2 は Microsoft Fabric の Data Engineering / Data Factory Workload で提供される Power Query ベースの ETL ツール。

主要機能

  • Power Query Online で 300+ コネクタからのデータ取り込み
  • Visual ETL 編集 (M Language ベースだが GUI 中心)
  • Output Destination として Lakehouse / Warehouse / KQL Database / SQL DB を指定
  • Pipeline からの呼び出し可能 (Activity として組み込み)
  • Auto-Schema 推論

代表的なユースケース

  • SaaS データ (Salesforce・SAP・Dynamics 365) の取り込み
  • Power BI ユーザーが慣れた Power Query 言語で ETL
  • SQL アナリスト・ビジネスユーザー向けの低コード ETL

Pipeline (Activity ベース・Orchestration) と Dataflow Gen2 (データ変換特化) は補完関係、両方組み合わせるのが標準。

Pipeline の Activity 種類

Activity用途
Copy ActivitySource → Sink へのデータコピー (最も汎用)
Notebook ActivityFabric Notebook / Synapse Notebook 実行
Stored Procedure ActivityWarehouse Stored Procedure 実行
Dataflow ActivityDataflow Gen2 実行
Lookup ActivityData Source から値取得・後続 Activity 入力
ForEach ActivityLoop 制御
If Condition / Switch Activity分岐制御
Wait Activity待機
Execute Pipeline ActivityPipeline 呼び出し (Modular 構成)
Web ActivityREST API 呼び出し
Set / Append Variable ActivityPipeline 変数操作
Validation Activity条件チェック

Activity の依存関係 (Success / Failure / Completion / Skipped) で柔軟な分岐制御が可能。

Trigger の種類

Trigger用途
Schedule TriggerCRON 式または定期間隔 (毎時・毎日・毎週)
Tumbling Window Trigger重複なし時間ウィンドウ単位、過去データ遡及処理
Event-based TriggerStorage Blob 作成・削除・Event Grid 統合
Manual TriggerPipeline UI から手動実行
Pipeline Run from PipelineExecute Pipeline Activity 経由

代表的な使い分け

  • 毎日深夜のバッチ ETL → Schedule
  • リアルタイム Blob Upload → Event-based
  • 過去データの遡及処理 → Tumbling Window
  • Ad-hoc 実行 → Manual

Integration Runtime (ADF)

ADF / Synapse Pipeline の Integration Runtime (IR) は、データ統合処理を実行するコンピュート環境。

種類用途特徴
Azure IRAzure 内 PaaS から Public Network 経由最も簡単・スケーラブル・標準
Self-hosted IRオンプレ・VNet 内・Private Endpoint 経由ネットワーク分離環境に必須
Azure-SSIS IR既存 SSIS Package のリフト&シフトSQL Server SSIS 移行向け

Self-hosted IR は単一インスタンス (最大 4 ノード冗長化) で、ノード数増やすほど並列処理性能向上。 Fabric Pipeline は Integration Runtime 概念がやや簡素化、Fabric Capacity 内で動作。

Mapping Data Flow (ADF 専用)

Mapping Data Flow は ADF / Synapse Pipeline で提供される Visual Data Transformation 機能、内部で Spark Job として動作。

代表的な Transformation

  • Filter (行フィルタリング)
  • Derived Column (新規列計算)
  • Aggregate (Group By + 集計)
  • Join (複数 Source 結合)
  • Lookup (Reference Data 検索)
  • Pivot / Unpivot (列方向変換)
  • Surrogate Key (連番付与)
  • Window (Window Function)
  • Conditional Split (条件分岐)

Mapping Data Flow は Spark Job として裏で動作、大量データ処理可能 (TB 級)。 Fabric Pipeline には Mapping Data Flow は提供されず、代わりに Dataflow Gen2 + Notebook で同等機能を実装するのが Fabric の設計思想。

コスト最適化

ADF コスト要素

  • Activity Run 料金 (Copy Activity・Lookup など 1 回 0.001 USD 程度)
  • Data Movement (DIU 時間 × DIU 数)
  • Pipeline Activity 実行時間
  • Self-hosted IR Node の VM 料金 (本番 4 ノード冗長で月数十万円)

Fabric Pipeline コスト

  • Fabric Capacity (CU) のみ
  • Pipeline / Notebook / Dataflow すべて CU 共有

最適化施策

  1. Copy Activity の DIU を Auto から固定値 (4 DIU 標準) に変更
  2. 不要 Trigger 停止 (頻繁実行 Schedule の見直し)
  3. Self-hosted IR の Auto Scale 設定
  4. Pipeline の並列実行数調整 (同時 Activity 数制限)
  5. Fabric Pipeline の Pause / Resume 活用
  6. Activity Log を Azure Monitor 送信して継続最適化

選定基準

  1. 新規 Fabric ベースプロジェクト → Fabric Pipeline
  2. 既存 ADF プロジェクトの継続保守 → ADF
  3. Fabric + 非 Fabric リソース統合 → 両方併用
  4. SSIS リフト&シフト → ADF + Azure-SSIS IR
  5. オンプレデータソース統合 → ADF + Self-hosted IR
  6. Power BI ユーザー向け低コード ETL → Fabric Pipeline + Dataflow Gen2
  7. Spark ベース大量データ変換 → Fabric Notebook (Mapping Data Flow 不要)

Microsoft は Fabric Pipeline への投資を加速、長期的には Fabric Pipeline が主流になる見込み。

運用ベストプラクティス

  1. 新規プロジェクトは Fabric Pipeline を優先検討
  2. Modular 設計 (Execute Pipeline で子 Pipeline 分割)
  3. Schedule + Event-based の組み合わせで柔軟な Trigger 設計
  4. Failure Handling (Retry・Alert・Failover Activity)
  5. Pipeline Parameter で環境別構成 (Dev / Stage / Prod)
  6. Activity Log を Azure Monitor 送信
  7. Microsoft Sentinel に Pipeline 失敗イベント送信
  8. Git 連携で Pipeline JSON バージョン管理
  9. Self-hosted IR の Health Monitor アラート
  10. 月次 Activity Run 履歴レビュー

関連認定試験

よくある質問

Fabric Pipeline と Azure Data Factory の違いは?

両方とも GUI ベースの ETL / ELT オーケストレーションサービスで、機能的に重複。Fabric Pipeline: Microsoft Fabric Workspace 内で動作、Fabric Lakehouse / Warehouse / KQL Database と密接統合、課金は Fabric Capacity (CU)、Activity 種類はやや限定的だが Fabric ネイティブサービス連携が強力、新規 Fabric プロジェクト向け。Azure Data Factory (ADF): 独立した Azure リソース、ADLS Gen2 / Synapse / Databricks / SQL DB / オンプレなど 90+ Connector、課金は Activity Run 単位 + Integration Runtime 時間、エンタープライズ ETL の長期実績、既存プロジェクトの保守。判断: 新規 Fabric ベースプロジェクト → Fabric Pipeline、既存 ADF プロジェクトの継続保守 → ADF、Fabric + 非 Fabric リソース統合 → 両方併用。Microsoft は Fabric Pipeline への投資を加速、長期的には Fabric Pipeline が主流になる見込みです。

Dataflow Gen2 とは?

Dataflow Gen2 は Microsoft Fabric の Data Engineering / Data Factory Workload で提供される Power Query ベースの ETL ツール。従来の Dataflow Gen1 (Power BI 内) の進化版で、Fabric Workspace で独立した Item として作成。代表的な機能: 1) Power Query Online で 300+ コネクタからのデータ取り込み (SaaS・Database・File)、2) Visual ETL 編集 (M Language ベースだが GUI 中心)、3) Output Destination として Lakehouse / Warehouse / KQL Database / SQL DB を指定、4) Pipeline からの呼び出し可能 (Activity として組み込み)、5) Auto-Schema 推論。代表的なユースケース: 1) SaaS データ (Salesforce・SAP・Dynamics 365) の取り込み、2) Power BI ユーザーが慣れた Power Query 言語で ETL、3) SQL アナリスト・ビジネスユーザー向けの低コード ETL。Pipeline (Activity ベース・Orchestration) と Dataflow Gen2 (データ変換特化) は補完関係、両方組み合わせるのが標準です。

Pipeline の Activity 種類は?

Fabric Pipeline / ADF の主要 Activity: 1) Copy Activity (Source → Sink へのデータコピー、90+ Connector 対応、最も汎用)、2) Notebook Activity (Fabric Notebook 実行・Synapse Notebook 実行)、3) Stored Procedure Activity (Warehouse Stored Procedure 実行)、4) Dataflow Activity (Dataflow Gen2 実行)、5) Lookup Activity (Data Source から値取得・後続 Activity 入力)、6) ForEach Activity (Loop 制御)、7) If Condition / Switch Activity (分岐制御)、8) Wait Activity (待機)、9) Execute Pipeline Activity (Pipeline 呼び出し・Modular 構成)、10) Web Activity (REST API 呼び出し)、11) Set Variable / Append Variable Activity (Pipeline 変数操作)、12) Validation Activity (条件チェック)。Pipeline = Activity の組み合わせで複雑な ETL ワークフローを GUI で構築、依存関係 (Success / Failure / Completion / Skipped) で柔軟な分岐制御が可能です。

Trigger の種類は?

Pipeline 実行の Trigger: 1) Schedule Trigger (CRON 式または定期間隔、毎時・毎日・毎週)、2) Tumbling Window Trigger (重複なし時間ウィンドウ単位、データ取り込みの過去日付処理に最適)、3) Event-based Trigger (Storage Account Blob 作成・削除・Event Grid 統合、リアクティブ ETL)、4) Manual Trigger (Pipeline UI から手動実行)、5) Pipeline Run from Pipeline (Execute Pipeline Activity 経由)。代表的な使い分け: 1) 毎日深夜のバッチ ETL → Schedule、2) リアルタイム Blob Upload → Event-based、3) 過去データの遡及処理 → Tumbling Window、4) Ad-hoc 実行 → Manual。本番運用では Schedule Trigger が最も一般的、Event-based でリアルタイム性を確保、Tumbling Window でデータ整合性を保証するのが標準パターンです。

Integration Runtime とは?

ADF / Synapse Pipeline の Integration Runtime (IR) は、データ統合処理を実行するコンピュート環境。3 種類: 1) Azure IR (Microsoft マネージド、Azure 内 PaaS から Public Network 経由でデータ取得、最も簡単・スケーラブル・標準的)、2) Self-hosted IR (オンプレ・VNet 内に IR Agent インストール、オンプレ DB・VNet 内 SQL DB・Private Endpoint 経由アクセス、ネットワーク分離環境に必須)、3) Azure-SSIS IR (既存 SSIS Package のリフト&シフト実行、SQL Server SSIS 移行向け)。Self-hosted IR は単一インスタンス (最大 4 ノード冗長化) で、ノード数増やすほど並列処理性能向上。本番運用では Azure IR + Self-hosted IR の組み合わせ (オンプレ部分は Self-hosted・Azure 部分は Azure IR) が標準パターン。Fabric Pipeline は Integration Runtime 概念がやや簡素化されており、Fabric Capacity 内で動作します。

Mapping Data Flow とは?

Mapping Data Flow は ADF / Synapse Pipeline で提供される Visual Data Transformation 機能、内部で Spark Job として動作。Source → Transformation (Filter・Aggregate・Join・Pivot・Sink) → Sink の GUI で ETL ロジック設計、コード不要。代表的な Transformation: 1) Filter (行フィルタリング)、2) Derived Column (新規列計算)、3) Aggregate (Group By + 集計)、4) Join (複数 Source 結合)、5) Lookup (Reference Data 検索)、6) Pivot / Unpivot (列方向変換)、7) Surrogate Key (連番付与)、8) Window (Window Function)、9) Conditional Split (条件分岐)、10) Sink (出力先指定)。Mapping Data Flow は Spark Job として裏で動作するため、大量データ処理可能 (TB 級)。Fabric Pipeline には Mapping Data Flow は提供されず、代わりに Dataflow Gen2 + Notebook で同等機能を実装するのが Fabric の設計思想です。

コスト最適化の戦略は?

ADF コスト要素: 1) Activity Run 料金 (Copy Activity・Lookup など 1 回 0.001 USD 程度)、2) Data Movement (DIU 時間 × DIU 数、データ転送量に応じてスケール)、3) Pipeline Activity 実行時間、4) Self-hosted IR Node の VM 料金 (本番 4 ノード冗長で月数十万円規模)。Fabric Pipeline コスト: Fabric Capacity (CU) のみ、Pipeline / Notebook / Dataflow すべて CU 共有。最適化施策: 1) Copy Activity の DIU を Auto から固定値 (4 DIU 標準) に変更、Data Movement コスト予測可能化、2) 不要 Trigger 停止 (頻繁実行 Schedule の見直し)、3) Self-hosted IR の Auto Scale 設定、4) Pipeline の並列実行数調整 (同時 Activity 数制限)、5) Fabric Pipeline の Pause / Resume 活用、6) Activity Log を Azure Monitor 送信して継続最適化。本番運用では月次 Pipeline 実行履歴レビューが必須で、Activity 実行回数の異常増加を早期検知することが重要です。

関連認定試験は?

DP-700 (Fabric Data Engineer Associate) で Fabric Pipeline が深く問われる本領域の本命認定 (Pipeline Activity・Trigger・Dataflow Gen2・Notebook 統合)。DP-203 (Azure Data Engineer Associate、2024-03 リタイア済) では ADF が中核トピックだった。AZ-305 (Solutions Architect Expert) でアーキテクト視点での ETL ツール選定、DP-300 (DBA) で Pipeline + SQL DB 統合、AI-103 (2026-06 GA) で Pipeline + Azure AI Foundry のデータ準備パイプライン。データエンジニアにとって Pipeline / Data Factory の理解は必須スキル、Fabric Pipeline は今後の主流ツールとして重点学習推奨です。

関連記事・技術深掘り

DP-203 vs DP-700 完全比較|旧 Azure Data Engineer vs 新 Fabric Data Engineer の違いと移行戦略【2026 年版】

Microsoft Azure データエンジニア認定の旧 DP-203 (Azure Data Engineer Associate、2024-03 リタイア) と新 DP-700 (Fabric Data Engineer Associate、2024-11 GA) を完全比較。試験仕様・対象プラットフォーム・出題範囲・難易度・学習時間・キャリアパスを表形式で整理。Microsoft Fabric への移行戦略、既保有者の追加取得ルートを日本語で網羅。

Azure Functions Trigger 完全解説|HTTP/Timer/Queue/Service Bus/Cosmos DB Change Feed 等全種類【2026 年版】

Azure Functions の Trigger 全種類を完全解説。HTTP Trigger・Timer Trigger・Queue Storage Trigger・Service Bus Trigger・Event Grid Trigger・Event Hub Trigger・Cosmos DB Change Feed Trigger・Blob Storage Trigger と Input/Output Binding。サーバーレスイベント駆動アーキテクチャ、関連認定試験 (AZ-204 / AZ-305 / AI-103) を日本語で網羅。

Azure Data Lake Storage Gen2 (ADLS Gen2) 完全設計|HNS・Medallion Architecture・Partition 戦略【2026 年版】

Azure Data Lake Storage Gen2 (ADLS Gen2) の完全ガイド。Hierarchical Namespace (HNS) の利点、Medallion Architecture (Bronze/Silver/Gold)、Partition 戦略、ABFS Driver、POSIX ACL + RBAC アクセス制御、Lifecycle Management、Microsoft Fabric / Databricks 統合、関連認定試験 (DP-700 / DP-300 / AI-103) を日本語で網羅。

Azure データエンジニア キャリアロードマップ|DP-900 → DP-700 → AI-103 シニアデータエンジニアへの道【2026 年版】

Azure データエンジニアになるための認定取得ロードマップ完全版。DP-900 → DP-700 → DP-600 / DP-300 の Fabric 時代の王道ルート、Databricks 認定との二刀流、AI-103 統合戦略、DP-203 リタイア後の選択、12-18 ヶ月の学習プラン、年収レンジまで日本語で網羅。

本記事の技術情報は Microsoft Fabric Data Factory Documentation およびAzure Data Factory Documentation に基づいています。 本記事は Microsoft Corporation の公式商品ではなく、いかなる提携・後援関係もありません。 Microsoft、Azure、Microsoft Fabric は Microsoft group of companies の商標です。 情報は 2026 年 5 月 24 日時点の公式公開資料に基づきます。最新情報は必ず公式ページをご確認ください。

この記事で学んだ内容を問題で確認しましょう

16,000問以上の問題で実力チェック

Azure 試験対策ページを見る
この記事の著者

NicheeLab編集部

データエンジニアリング・クラウド資格の専門家。Databricks・Snowflake等の認定資格を保有し、実務経験に基づいた問題作成・解説を行っています。NicheeLab運営。


関連記事
Azure

AZ-900 完全ガイド|Microsoft Azure Fundamentals 出題範囲・学習リソース・合格戦略

Microsoft Azure Fundamentals (AZ-900) の 2026 年 1 月 14 日改訂版に対...

Azure

Azure 認定資格ロードマップ 2026 完全版|全 26 試験の体系と大型再編 (AI-901/AI-103/SC-500)

Microsoft Azure 認定資格 全 26 試験 (現行 23 + 退役 3) の 2026 年版ロードマップ。...

Azure

AI-901 完全ガイド|Azure AI Fundamentals 新試験

Microsoft Certified: Azure AI Fundamentals (AI-901) の出題範囲・Mi...

Azure

Microsoft Entra ID 入門|旧 Azure AD から学ぶ ID 管理 (AZ-900/SC-900/AZ-104 必須知識)

Microsoft Entra ID (旧 Azure Active Directory) の入門解説。2023 年 7...

Azure

DP-900 完全ガイド|Azure Data Fundamentals 出題範囲・学習リソース・合格戦略

Microsoft Azure Data Fundamentals (DP-900) の完全ガイド。4 ドメインの出題範...

Azureの記事一覧 (103件)
© 2026 NicheeLab All rights reserved.