Lakeflow Connect Free Tier は、Databricks が 2026 年に FabCon で発表したマネージドコネクタの無料利用枠です。各 Workspace に対して1 日 100 DBU = 約 1 億レコードの取り込みが無料で提供されます。 これは年間換算で約 190 万円相当のコスト削減に相当し、Fivetran や Stitch といった 従来 ETL SaaS の代替を狙う革命的な施策です。
本記事では、Free Tier の正確な無料枠の中身・対応コネクタ全リスト・他 ETL ツールとの徹底比較・ セットアップ手順・本番運用のベストプラクティスを完全解説します。
Lakeflow Connect は、Databricks のマネージド SaaS / DB データ取り込みサービス。 従来 SaaS データを Databricks に取り込むには、Fivetran / Stitch / Airbyte 等の外部 ETL ツール、または自前で Python スクリプトを組む必要がありました。 Lakeflow Connect はDatabricks 公式の純正マネージドコネクタとして、これを「設定だけ」で実現します。
2026 年 FabCon で発表された Free Tier は、その Lakeflow Connect に対して各 Workspace 1 日 100 DBU の無料クレジットを付与するもの。 コネクタ実行時に消費する DBU が、まず無料枠から差し引かれます。
100 DBU を取り込みレコード数に換算すると、1 日あたり最大 1 億レコード。 これは多くの中規模企業の日次取り込み量を十分カバーする量です。
具体例:
Premium tier の DBU 単価は $0.35。100 DBU/日 × 365 日 × $0.35 = $12,775/年 = 約 190 万円。 各 Workspace に対してこの額が補助される計算になります。
マルチ Workspace 構成 (例: 開発/ステージング/本番で 3 つ) なら年間 570 万円相当。 中堅企業の ETL ツール予算をほぼ完全にカバーします。
Free Tier 対象のマネージドコネクタは以下の通り (2026 年 5 月時点)。
マーケティング、営業、人事、財務、IT、エンジニアリングの全領域を Free Tier だけでカバー可能です。
以下はFree Tier の対象外で、通常料金が発生します。
低遅延ストリーミング取り込み専用機能。リアルタイム要件 (数秒〜数分の遅延) があるシナリオで使用。 Free Tier には含まれず、通常 DBU 課金。
Apache Kafka 等のストリーミングプラットフォームからの取り込みは Structured Streaming 機能を使うため、Free Tier 対象外。 リアルタイムイベント基盤を持つ組織は別途予算が必要。
Databricks 公式ではない第三者製のコネクタは Free Tier 対象外。 ただし将来的に公式化される可能性のあるものも多く、要件次第で公式コネクタへの切り替えを検討。
S3 / ADLS / GCS のファイル取り込み (Auto Loader) は通常 DBU 課金。 既存のデータレイクからの取り込みは引き続き有料です。
例: HubSpot から Databricks へ Contact データを 1 時間ごとに取り込む。
Workspace 管理者が Settings から「Lakeflow Connect」を有効化。既に有効な場合はスキップ。
サイドバーから「Lakeflow Connect」→「New Pipeline」→ コネクタ一覧から「HubSpot」を選択。
OAuth フローで HubSpot にログイン。読み取り権限を付与。
Contacts、Deals、Companies、Tickets、Notes 等から必要なオブジェクトを選択 (複数可)。
Catalog / Schema を選択。テーブル名は自動生成 (例: `hubspot_contacts`)。
cron 表記で実行頻度を指定 (例: 1 時間ごと = `0 * * * *`)。
以降は自動で取り込みが継続。Unity Catalog のテーブルを Delta Lake / DBSQL / Genie Space で参照可能に。
リアルタイム性が不要なデータは、頻度を抑えて DBU 消費を最小化。1 時間ごと → 6 時間ごとなど。 100 DBU/日の枠内に収めるよう、複数コネクタの合計を計算しておく。
100 DBU/日はWorkspace 単位で付与されるため、開発・ステージング・本番で別 Workspace を使えば 300 DBU/日相当の無料枠が得られます。
Lakeflow Connect で SaaS データを取り込み → Lakebase で OLTP 処理 → Lakehouse Sync で Delta テーブルに書き戻し、という一気通貫の構成が可能。 マーケティングオートメーション・パーソナライズドプロダクトのバックエンドとして強力。
取り込んだ直後に Lakehouse Monitoring でデータ品質を自動チェック。 異常を Slack / PagerDuty に通知して、誤ったデータが下流に流れるのを防ぐ。
System Tables の `system.billing.usage` から Lakeflow Connect の DBU 消費を日次でモニタリング。 無料枠を超えそうなら頻度を下げる、または取り込み対象を絞る対応。
Fivetran / Stitch に月 $1,000-5,000 払っている組織は、ほぼ全額削減可能。 年間 100-500 万円の予算が浮く計算で、その分を本来の分析・ML 開発に再投資できる。
まだ ETL ツールに予算を割けないスタートアップにとって、無料でプロフェッショナルグレードの ETL が手に入る。 早期にデータドリブン経営の基盤を整えられる。
Databricks + Snowflake + BigQuery を併用している組織は、Lakeflow Connect で一部を置き換えるとマルチプラットフォーム ETL ツール (Fivetran 等) との二重管理になる可能性。 段階的移行か、Databricks への集約を決めてから導入。
2026 年 5 月時点で、Data Engineer Associate / Professional の公式 Exam Guide に Lakeflow Connect は未掲載。 ただし以下から、次回改定で出題対象となる可能性が極めて高いです。
先取り学習のおすすめトピック:
Lakeflow Connect Free Tier の無料枠はどのくらい?
各 Workspace に対して『1 日 100 DBU 無料』が付与されます。これは 1 日あたり最大 1 億レコードの取り込みに相当 (eligible なマネージドコネクタ経由)。1 DBU が Premium tier で $0.35 のため、年間 $12,775 USD (約 190 万円) の補助が各 Workspace に対して与えられる計算です。
どんなデータソースから取り込めますか?
SaaS アプリ: Google Analytics、Workday、ServiceNow、Dynamics 365、Zendesk、Google Ads、HubSpot、TikTok Ads、Jira、Confluence、Meta。データベース・DWH: SQL Server、Oracle、PostgreSQL、MySQL、Snowflake、BigQuery。これら全てが Free Tier 対象です。マーケティング・営業・人事・財務など部署横断のデータ統合がコストゼロで可能になります。
Free Tier の対象外は何ですか?
(1) Zerobus Ingest (低遅延ストリーミング取り込み専用機能) (2) Structured Streaming ソース (例: Kafka) (3) Community connector (Databricks 公式ではない第三者製) (4) File source connector (例: Auto Loader、S3 / ADLS / GCS のファイル取り込み)。これらは引き続き通常料金が発生します。Free Tier はあくまで『マネージド SaaS / DB コネクタ』対象です。
1 億レコード/日 を超えたら課金される?
はい。100 DBU を超えた使用分は通常の Premium 料金 ($0.35/DBU) で従量課金されます。ただし 1 億レコードは中規模企業の日次取り込み量を十分カバーする量で、多くの組織は無料枠内で運用可能です。スタートアップ・中堅企業にとっては『ETL コストを年間数十万〜数百万円削減できる』革命的な提案。
Snowflake / BigQuery のデータも Databricks に取り込めますか?
はい、Free Tier 対象です。これにより『Snowflake で蓄積したデータを Databricks で分析する』マルチプラットフォーム構成がコストゼロで実現可能。Databricks がマルチプラットフォーム戦略を本気で推進している証拠でもあり、Snowflake からの段階的移行を検討する組織にも追い風です。
Lakeflow Connect Free Tier はいつから使えますか?
Azure Databricks では既に GA (一般提供開始)。AWS / GCP の Databricks Workspace でも順次展開中。利用するには Workspace の管理者が Lakeflow Connect を有効化し、対象コネクタを設定するだけ。クレジットカード追加や別契約は不要、既存の Databricks 課金体系内で完結します。
セットアップにかかる時間は?
1 コネクタあたり 15-30 分が標準。例: HubSpot からの取り込みなら (1) Lakeflow Connect で『New Pipeline』を選択 (2) HubSpot OAuth で認証 (3) 取り込み対象オブジェクト (Contacts / Deals / Companies 等) を選択 (4) Unity Catalog 内の出力先 Catalog / Schema を指定 (5) スケジュール設定 (例: 1 時間ごと)。コードを書かずに数クリックで完了します。
Free Tier は Stitch / Fivetran / Airbyte の代替になりますか?
なります。Fivetran は MAR (Monthly Active Rows) 課金で、中規模組織で年間数百万〜数千万円。Lakeflow Connect Free Tier はこれをほぼゼロにする可能性があります。ただし (1) Fivetran はコネクタ数が圧倒的に多い (500+) (2) Airbyte は OSS 版があり完全無料 (3) Stitch / Fivetran は成熟度が高い、というメリットも。Databricks に集約するなら Lakeflow Connect、マルチプラットフォームに分散させたいなら従来 ETL ツール、という使い分けが現実的です。
NicheeLab Databricks編集部
データエンジニアリング・クラウド資格の専門家。Databricks・Snowflake等の認定資格を保有し、実務経験に基づいた問題作成・解説を行っています。NicheeLab運営。
Databricks資格一覧|全7試験・難易度・勉強法
Databricks認定資格全7試験の一覧・難易度・出題範囲・合格ラインを徹底解説。2026年最新版の公式試験ガイドに準...
Databricks試験の難易度ランキング|全7資格を徹底比較
Databricks認定全7試験の難易度をランキング形式で徹底比較。合格率・学習時間・出題傾向から難易度を分析。...
Databricks資格の勉強方法|最短合格ルートと学習時間の目安
Databricks認定資格に最短で合格するための勉強方法を完全ガイド。公式リソース・問題集・学習スケジュールを徹底解説...
Databricks Data Engineer Associate完全解説|出題範囲・問題例・合格戦略
Databricks Certified Data Engineer Associate試験を徹底解説。5つの出題ドメイ...
Databricks Data Engineer Professional完全解説|上級試験の攻略法
Databricks Certified Data Engineer Professional試験を徹底解説。10の出題...