Google Cloud

Document AI 完全ガイド|PDF/画像 OCR・請求書・契約書・Custom Extractor

2026-05-24
NicheeLab編集部

Document AI は PDF / 画像から構造化データを自動抽出する GCP の文書 AI プラットフォームで、 50+ の専門プロセッサー (請求書・領収書・契約書・身分証等) と汎用 OCR / Form Parser を提供します。 Gemini との組み合わせで OCR → 構造化 → 要約・分類・Q&A の完全な文書処理パイプラインを構築できます。

プロセッサー種別

カテゴリプロセッサー用途
汎用Document OCRテキスト抽出
汎用Form Parserキーバリュー抽出
汎用Layout Parserレイアウト構造抽出
金融Invoice Parser請求書
金融Expense (領収書)領収書 / レシート
金融Bank Statement銀行明細
金融Pay Stub / W-2 / 1099給与明細・税書類
IDUS Driver License / Passport身分証
不動産Mortgage / Lease住宅ローン契約
医療Healthcare Forms医療フォーム
CustomCustom Extractor / Classifier業界固有

典型的なパイプライン

  1. GCS にドキュメントアップロード
  2. Eventarc トリガー → Cloud Run
  3. Document AI で抽出 (例: Invoice Parser)
  4. 信頼度スコア閾値 (例: 0.85) で判定
  5. 合格 → BigQuery / DB 自動登録
  6. 不合格 → Human-in-the-loop (HITL) レビュー UI
  7. Gemini で要約・分類・Q&A 追加

Python サンプル (Invoice Parser)

from google.cloud import documentai_v1 as documentai

client = documentai.DocumentProcessorServiceClient()
processor_name = "projects/PROJECT/locations/us/processors/INVOICE_PROCESSOR_ID"

with open("invoice.pdf", "rb") as f:
    raw_doc = documentai.RawDocument(content=f.read(), mime_type="application/pdf")

request = documentai.ProcessRequest(name=processor_name, raw_document=raw_doc)
result = client.process_document(request=request)

for entity in result.document.entities:
    print(f"{entity.type_}: {entity.mention_text} (conf: {entity.confidence:.2f})")
# 出力例:
# invoice_id: INV-2026-001 (conf: 0.99)
# total_amount: 12500 (conf: 0.98)
# supplier_name: ACME Corp (conf: 0.95)

料金 (us, 2026)

プロセッサー料金/1000 page
Document OCR$1.50
Form Parser$30
Layout Parser$10
Invoice / Expense / W-2$30
Mortgage / Loan$65
Custom Extractor (推論)$30
Custom 学習$5/h

Gemini との連携パターン

# Document AI で構造化抽出
extracted = process_with_doc_ai(pdf_path)
text = extracted.document.text

# Gemini で要約・Q&A
from vertexai.generative_models import GenerativeModel
gemini = GenerativeModel("gemini-2.0-pro-001")

summary = gemini.generate_content(
    f"以下の契約書を 5 行で要約してください:\n{text}"
)

answer = gemini.generate_content(
    f"以下の契約書を読んで、解約条件を教えてください:\n{text}"
)

他クラウド OCR 比較

項目Document AIAWS TextractAzure Form Recognizer
OCR
Form 抽出◎ Form Parser
専門プロセッサー50+請求書 / 領収書 / 身分証請求書 / 領収書 / ID
Custom 学習◎ (Custom Queries)◎ Custom Model
料金 (OCR)$1.50/1k$1.50/1k$1/1k

典型的なユースケース

  • 経理: 請求書・領収書の自動取り込み (経費精算 SaaS)
  • 金融: ローン申込書 + 給与明細の検証
  • 不動産: 賃貸契約書のデータ化
  • 医療: 保険書類・診断書の構造化
  • HR: 履歴書・雇用契約のパース
  • 物流: 配送伝票・通関書類

Document AI とは?

PDF / 画像から構造化データを自動抽出するサービス。OCR + ML で請求書 / 領収書 / 契約書 / フォーム / 身分証明書などを処理。

対応プロセッサーは?

Document OCR (汎用)、Form Parser、Layout Parser、専門プロセッサー (請求書 / 領収書 / W-2 / W-9 / 運転免許証 / パスポート等 50+)、Custom Extractor (自前学習)。

Custom Extractor とは?

業界特有のフォームに対応するため自分でラベリングして学習させる機能。Custom Document Classifier と組み合わせて自前処理パイプラインを構築可能。

料金体系は?

Document OCR $1.50/1000 page、Form Parser $30/1000 page、専門プロセッサー $30〜65/1000 page。Custom は学習費 + 推論費。

Vertex AI / Gemini との連携は?

Document AI で抽出 → Gemini で要約 / Q&A / 分類のパイプラインが定石。Vertex AI Search に投入して RAG ベースも可能。

Document AI Warehouse は廃止?

2024 に廃止 → Vertex AI Search に統合。長期保管 + 検索は Vertex AI Search 経由が標準。

他クラウド OCR 比較は?

AWS Textract、Azure Form Recognizer も同等機能。Document AI は専門プロセッサーの種類が最も豊富。HIPAA / PCI 対応も◎。

信頼度スコアの活用は?

各抽出値に Confidence Score (0〜1) が付与される。閾値以下は人手レビューに回す Human-in-the-loop (HITL) パターンが標準。

関連記事・AI / 文書処理

Vertex AI Agent Builder 完全ガイド|Conversational Agents・Vertex AI Search・Tool Use (GCP)

Google Cloud Vertex AI Agent Builder の全機能解説。Conversational Agents (Dialogflow CX 後継)、Vertex AI Search、Tool Use、Grounding、Playbook、料金、ChatGPT GPTs / Copilot Studio 比較を網羅。

Vision AI / Video Intelligence 完全ガイド|画像・動画解析 API (GCP)

Google Cloud Vision API / Video Intelligence / Vertex AI Vision の全機能解説。OCR、物体検出、顔認識、SafeSearch、AutoML Vision、Edge デプロイ、料金、AWS Rekognition / Azure CV 比較を網羅。

Cloud Build 完全ガイド|CI/CD・cloudbuild.yaml・Private Pool・GitHub 連携 (GCP)

Google Cloud Cloud Build の全機能解説。cloudbuild.yaml、トリガー設定、Private Pool、Workload Identity、Build Approvals、Cloud Deploy 連携、AWS CodeBuild / Azure DevOps 比較を網羅。

Generative AI Leader (GAIL) 完全ガイド|Google Cloud 生成 AI 認定 (2025 年 5 月リリース新試験)

Google Cloud Generative AI Leader (GAIL、2025-05-14 リリース) の完全ガイド。4 ドメイン (生成 AI 基礎 30% / GCP 提供サービス 35% / モデル出力改善 20% / ビジネス戦略 15%)、Gemini ファミリー、Vertex AI Agent Builder、RAG、ビジネス導入観点を日本語で網羅。

※ Google Cloud は Google LLC の商標です。最新情報は Document AI 公式 をご確認ください。

この記事で学んだ内容を問題で確認しましょう

16,000問以上の問題で実力チェック

GCP 試験対策ページを見る
この記事の著者

NicheeLab編集部

データエンジニアリング・クラウド資格の専門家。Databricks・Snowflake等の認定資格を保有し、実務経験に基づいた問題作成・解説を行っています。NicheeLab運営。


関連記事
Google Cloud

Google Cloud (GCP) 認定資格ロードマップ 2026 完全版|全 15 試験を体系化

Google Cloud 認定資格 全 15 試験 (Foundational 2 + Associate 3 + Pr...

Google Cloud

Cloud Digital Leader (CDL) 完全ガイド|出題範囲・学習リソース・合格戦略

Google Cloud Cloud Digital Leader (CDL) の完全ガイド。6 ドメイン 92 bul...

Google Cloud

Generative AI Leader (GAIL) 完全ガイド|Google Cloud 生成 AI 認定

Google Cloud Generative AI Leader (GAIL、2025-05-14 リリース) の完全...

Google Cloud

Vertex AI 入門|Google Cloud 統合 ML プラットフォームの全機能

Google Cloud Vertex AI の入門解説。Vertex AI Studio / Agent Builde...

Google Cloud

GCP Associate Cloud Engineer (ACE) 完全ガイド|試験範囲・受験料・学習ロードマップ

Google Cloud Associate Cloud Engineer (ACE) の試験範囲・受験料 125 US...

Google Cloudの記事一覧 (102件)
© 2026 NicheeLab All rights reserved.