dbt_utils パッケージ最頻出マクロの一覧と使いどころ

dbt の日常運用で最も手に取るパッケージのひとつが dbt_utils です。クロスウェアハウスで安定して動き、モデル記述を短く読みやすくします。

ここでは試験でも実務でも頻出のマクロに絞って、用途・落とし穴・最低限のスニペットをまとめます。公式ドキュメントの一般的で安定した使い方のみを扱います。

頻出マクロ早見表

まずは全体像。試験の設問は「どのマクロを選ぶべきか」を問うことが多いので、ユースケースを軸に俯瞰します。

ここに挙げるマクロは、主要 DWH（Snowflake、BigQuery、Redshift、Databricks/Spark）で広く使われ、API も安定しています。

generate_surrogate_key: 複合キーのハッシュ化と NULL 耐性
star: SELECT * を安全に（除外・接頭辞・接尾辞）
union_relations: 列不一致の UNION 整形
date_spine: 日付/時間の連続系列生成
safe_divide: ゼロ割り回避の安全な除算
unique_combination_of_columns（テスト）: 複合一意制約の検証

マクロ	典型用途	実務の要点	試験の観点
generate_surrogate_key	複数カラムから一意キーを生成	トリミングと NULL を統一処理して安定ハッシュを作る	ワークハウス間の一貫性と NULL 耐性を選択理由にできるか
star	SELECT 列展開（除外・prefix/suffix）	スキーマ変動時の列メンテ負荷を下げる	ワイルドカードの安全な代替として説明できるか
union_relations	スキーマ差があるテーブルの UNION	不足列を NULL 補完・順序そろえで失敗を防ぐ	異なるカラム集合の統合に最適と判断できるか
date_spine	日付・時間の連続行を生成	開始/終了境界のオフバイワンに注意	カレンダーテーブルの作り方を選べるか
safe_divide	ゼロ割り回避の集計	NULL/0 を安全に処理しダッシュボードの NaN を防ぐ	堅牢な派生指標の作成を説明できるか
unique_combination_of_columns（テスト）	複合一意の検証	業務キーの一貫性確保に直結	どの粒度で一意性を担保すべきか判断できるか

packages.yml への追加（前提）

packages:
  - package: dbt-labs/dbt_utils
    version: "+"  # 安定版の範囲指定（プロジェクトの互換性に合わせる）

モデル設計と dbt_utils の位置づけ

dbt_utils はモデリングの反復作業を短縮し、スキーマ変化や DWH 差異に強い SQL を書く助けになります。特に Staging/Intermediate/Mart の各層で役割が明確です。

試験では、どの層でどのマクロを使うと保守性が高いか、という観点がよく問われます。

Staging: star で生ソースの列展開、generate_surrogate_key で安定キー生成
Intermediate: union_relations でスキーマ整形、date_spine で系列補完
Mart: safe_divide で堅牢な率指標、テストで unique_combination_of_columns

dbt モデル層と頻出マクロの対応

ref と Jinja によるマクロ呼び出しの基本形

select
  {{ dbt_utils.star(from=ref('stg_orders'), except=['_ingested_at']) }}
from {{ ref('stg_orders') }}

generate_surrogate_key で安定した複合キーを作る

複数カラムの結合やディメンションの同定に必要なのが代理キーです。generate_surrogate_key はトリムや NULL を吸収して一貫性のあるハッシュ文字列を返します。

ベースの列を変更したらキーも変わるため、ディメンションの SCD 設計とあわせて使い方を固定化しておくと安全です。

NULL/空白・前後空白の違いをハッシュ前に平準化
DWH 間で関数差異を吸収（パッケージ側でディスパッチ）
長さは実装依存だが、VARCHAR(32〜64) 程度を許容しておくのが無難

典型スニペット（ディメンションの自然キーから代理キー）

with src as (
  select * from {{ ref('stg_customers') }}
)
select
  {{ dbt_utils.generate_surrogate_key([
    'coalesce(country_code, \"\")',
    'customer_id'
  ]) }} as customer_sk,
  *
from src

star と union_relations でスキーマ差分を吸収する

生ソースの列は増減や並び順変更が起こります。star は除外や接頭辞/接尾辞を指定して安全に列展開します。さらに複数テーブルを統合する際は union_relations が列不一致を自動で補完します。

試験では SELECT * の危険性と、star による制御可能な列展開の説明、そして UNION 前整形の手法が問われます。

star: except=['raw_load_ts'] のように監査列を除外
star: prefix/suffix で衝突回避（例: prefix='src_')
union_relations: 欠損列は NULL、余剰列は揃えて投影してくれる

複数ソースを UNION（列不一致を自動調整）

with a as (
  select {{ dbt_utils.star(from=ref('stg_orders_us'), except=['_ingested_at']) }} from {{ ref('stg_orders_us') }}
), b as (
  select {{ dbt_utils.star(from=ref('stg_orders_eu'), except=['_ingested_at']) }} from {{ ref('stg_orders_eu') }}
)
select * from {{ dbt_utils.union_relations(relations=[ref('stg_orders_us'), ref('stg_orders_eu')]) }}

date_spine で欠損日付を埋める

イベントが無い日もレポートに日付行を出したいとき、date_spine で連続系列を生成して左結合します。これにより稼働日での欠測が可視化されます。

開始・終了の境界と粒度を明示し、オフバイワンを避けます。終了日は通常、当日または翌日開始時刻にします。

datepart は 'day' や 'hour' などを指定
start_date / end_date は DWH が解釈できる式を文字列で渡す
集計対象と LEFT JOIN して欠損ゼロ埋めを実現

日次スパインと売上の結合（ゼロ埋め）

with spine as (
  select * from {{ dbt_utils.date_spine(
    datepart='day',
    start_date="cast('2021-01-01' as date)",
    end_date="current_date"
  ) }}
), sales as (
  select order_date::date as d, sum(amount) as revenue
  from {{ ref('fct_orders') }}
  group by 1
)
select s.date_day as d,
       coalesce(sa.revenue, 0) as revenue
from spine s
left join sales sa on sa.d = s.date_day

テストマクロと安全な派生指標（unique_combination_of_columns / safe_divide）

モデルの品質担保は試験でも実務でも重要です。dbt_utils のテストマクロでビジネスキーの一意性を検証し、集計では safe_divide を用いてゼロ割りを回避します。

特に Looker や BI でゼロ割りエラーや NaN を発生させない実装は、ダッシュボード安定運用の基礎です。

unique_combination_of_columns: 複合キーの一意性を宣言的に担保
safe_divide: 分子/分母のいずれかが 0/NULL でも安全に NULL または 0 を返す実装
品質テストは CI で自動実行し、回帰を早期検知

YAML テストと安全な除算の例

# models/schema.yml
version: 2
models:
  - name: dim_customer
    tests:
      - dbt_utils.unique_combination_of_columns:
          combination_of_columns: [customer_natural_key, effective_from]

-- models/mart/fct_kpi.sql
select
  date_day,
  {{ dbt_utils.safe_divide(sum(conversions), nullif(sum(sessions), 0)) }} as cr
from {{ ref('fct_sessions') }}
group by 1

問題で確認

Analytics Engineer

問題 1

複数のソースから得た customer_id と country_code を結合し、DWH 間で一貫した代理キーを作成したい。NULL や前後空白のばらつきにも耐性を持たせるには、dbt_utils のどのマクロを使うべきか？

A. generate_surrogate_key
B. star
C. union_relations
D. safe_divide

正解: A

generate_surrogate_key は複数カラムから安定したハッシュキーを生成し、NULL や空白のゆらぎを吸収する。star は列展開、union_relations は UNION 整形、safe_divide は数値演算用であり目的に合致しない。

よくある質問

dbt_utils のマクロは DWH ごとに動作が変わる心配はない？

主要マクロはアダプター・ディスパッチで DWH 差異を吸収します。例えば generate_surrogate_key は各エンジンの関数差を内部で扱います。ただし start_date/end_date のように SQL 文字列で渡す箇所（date_spine など）は、各 DWH が解釈できる式にする必要があります。

star は SELECT * と何が違う？

star は除外（except）や接頭辞/接尾辞（prefix/suffix）を指定でき、列の並びや命名衝突を制御できます。SELECT * のように予期しない新列が混入してクエリが壊れるリスクを抑えられます。

テストマクロ unique_combination_of_columns はいつ書くべき？

ディメンションの自然キーやファクトの業務上の一意粒度を定義したら同時に書くのが実務では安全です。CI の毎回実行で重複を即検知でき、下流の集計崩れを防ぎます。

この記事で学んだ内容を問題で確認しましょう

16,000問以上の問題で実力チェック

無料で問題を解いてみる

この記事の著者

NicheeLab編集部

データエンジニアリング・クラウド資格の専門家。Databricks・Snowflake等の認定資格を保有し、実務経験に基づいた問題作成・解説を行っています。NicheeLab運営。

dbt_utils パッケージ最頻出マクロの一覧と使いどころ

頻出マクロ早見表

モデル設計と dbt_utils の位置づけ

generate_surrogate_key で安定した複合キーを作る

star と union_relations でスキーマ差分を吸収する

date_spine で欠損日付を埋める

テストマクロと安全な派生指標（unique_combination_of_columns / safe_divide）

問題で確認

よくある質問

この記事で学んだ内容を問題で確認しましょう

この記事の著者

関連記事

dbtの記事一覧 (101件)

dbt_utils パッケージ 最頻出マクロの一覧と使いどころ

頻出マクロ早見表

モデル設計と dbt_utils の位置づけ

generate_surrogate_key で安定した複合キーを作る

star と union_relations でスキーマ差分を吸収する

date_spine で欠損日付を埋める

テストマクロと安全な派生指標（unique_combination_of_columns / safe_divide）

問題で確認

よくある質問

この記事で学んだ内容を問題で確認しましょう

この記事の著者

関連記事

dbtの記事一覧 (101件)

dbt_utils パッケージ最頻出マクロの一覧と使いどころ