Document AI は PDF / 画像から構造化データを自動抽出する GCP の文書 AI プラットフォームで、 50+ の専門プロセッサー (請求書・領収書・契約書・身分証等) と汎用 OCR / Form Parser を提供します。 Gemini との組み合わせで OCR → 構造化 → 要約・分類・Q&A の完全な文書処理パイプラインを構築できます。
| カテゴリ | プロセッサー | 用途 |
|---|---|---|
| 汎用 | Document OCR | テキスト抽出 |
| 汎用 | Form Parser | キーバリュー抽出 |
| 汎用 | Layout Parser | レイアウト構造抽出 |
| 金融 | Invoice Parser | 請求書 |
| 金融 | Expense (領収書) | 領収書 / レシート |
| 金融 | Bank Statement | 銀行明細 |
| 金融 | Pay Stub / W-2 / 1099 | 給与明細・税書類 |
| ID | US Driver License / Passport | 身分証 |
| 不動産 | Mortgage / Lease | 住宅ローン契約 |
| 医療 | Healthcare Forms | 医療フォーム |
| Custom | Custom Extractor / Classifier | 業界固有 |
from google.cloud import documentai_v1 as documentai
client = documentai.DocumentProcessorServiceClient()
processor_name = "projects/PROJECT/locations/us/processors/INVOICE_PROCESSOR_ID"
with open("invoice.pdf", "rb") as f:
raw_doc = documentai.RawDocument(content=f.read(), mime_type="application/pdf")
request = documentai.ProcessRequest(name=processor_name, raw_document=raw_doc)
result = client.process_document(request=request)
for entity in result.document.entities:
print(f"{entity.type_}: {entity.mention_text} (conf: {entity.confidence:.2f})")
# 出力例:
# invoice_id: INV-2026-001 (conf: 0.99)
# total_amount: 12500 (conf: 0.98)
# supplier_name: ACME Corp (conf: 0.95)| プロセッサー | 料金/1000 page |
|---|---|
| Document OCR | $1.50 |
| Form Parser | $30 |
| Layout Parser | $10 |
| Invoice / Expense / W-2 | $30 |
| Mortgage / Loan | $65 |
| Custom Extractor (推論) | $30 |
| Custom 学習 | $5/h |
# Document AI で構造化抽出
extracted = process_with_doc_ai(pdf_path)
text = extracted.document.text
# Gemini で要約・Q&A
from vertexai.generative_models import GenerativeModel
gemini = GenerativeModel("gemini-2.0-pro-001")
summary = gemini.generate_content(
f"以下の契約書を 5 行で要約してください:\n{text}"
)
answer = gemini.generate_content(
f"以下の契約書を読んで、解約条件を教えてください:\n{text}"
)| 項目 | Document AI | AWS Textract | Azure Form Recognizer |
|---|---|---|---|
| OCR | ◎ | ◎ | ◎ |
| Form 抽出 | ◎ Form Parser | ◎ | ◎ |
| 専門プロセッサー | 50+ | 請求書 / 領収書 / 身分証 | 請求書 / 領収書 / ID |
| Custom 学習 | ◎ | ◎ (Custom Queries) | ◎ Custom Model |
| 料金 (OCR) | $1.50/1k | $1.50/1k | $1/1k |
Document AI とは?
PDF / 画像から構造化データを自動抽出するサービス。OCR + ML で請求書 / 領収書 / 契約書 / フォーム / 身分証明書などを処理。
対応プロセッサーは?
Document OCR (汎用)、Form Parser、Layout Parser、専門プロセッサー (請求書 / 領収書 / W-2 / W-9 / 運転免許証 / パスポート等 50+)、Custom Extractor (自前学習)。
Custom Extractor とは?
業界特有のフォームに対応するため自分でラベリングして学習させる機能。Custom Document Classifier と組み合わせて自前処理パイプラインを構築可能。
料金体系は?
Document OCR $1.50/1000 page、Form Parser $30/1000 page、専門プロセッサー $30〜65/1000 page。Custom は学習費 + 推論費。
Vertex AI / Gemini との連携は?
Document AI で抽出 → Gemini で要約 / Q&A / 分類のパイプラインが定石。Vertex AI Search に投入して RAG ベースも可能。
Document AI Warehouse は廃止?
2024 に廃止 → Vertex AI Search に統合。長期保管 + 検索は Vertex AI Search 経由が標準。
他クラウド OCR 比較は?
AWS Textract、Azure Form Recognizer も同等機能。Document AI は専門プロセッサーの種類が最も豊富。HIPAA / PCI 対応も◎。
信頼度スコアの活用は?
各抽出値に Confidence Score (0〜1) が付与される。閾値以下は人手レビューに回す Human-in-the-loop (HITL) パターンが標準。
関連記事・AI / 文書処理
Vertex AI Agent Builder 完全ガイド|Conversational Agents・Vertex AI Search・Tool Use (GCP)
Google Cloud Vertex AI Agent Builder の全機能解説。Conversational Agents (Dialogflow CX 後継)、Vertex AI Search、Tool Use、Grounding、Playbook、料金、ChatGPT GPTs / Copilot Studio 比較を網羅。
Vision AI / Video Intelligence 完全ガイド|画像・動画解析 API (GCP)
Google Cloud Vision API / Video Intelligence / Vertex AI Vision の全機能解説。OCR、物体検出、顔認識、SafeSearch、AutoML Vision、Edge デプロイ、料金、AWS Rekognition / Azure CV 比較を網羅。
Cloud Build 完全ガイド|CI/CD・cloudbuild.yaml・Private Pool・GitHub 連携 (GCP)
Google Cloud Cloud Build の全機能解説。cloudbuild.yaml、トリガー設定、Private Pool、Workload Identity、Build Approvals、Cloud Deploy 連携、AWS CodeBuild / Azure DevOps 比較を網羅。
Generative AI Leader (GAIL) 完全ガイド|Google Cloud 生成 AI 認定 (2025 年 5 月リリース新試験)
Google Cloud Generative AI Leader (GAIL、2025-05-14 リリース) の完全ガイド。4 ドメイン (生成 AI 基礎 30% / GCP 提供サービス 35% / モデル出力改善 20% / ビジネス戦略 15%)、Gemini ファミリー、Vertex AI Agent Builder、RAG、ビジネス導入観点を日本語で網羅。
※ Google Cloud は Google LLC の商標です。最新情報は Document AI 公式 をご確認ください。
NicheeLab編集部
データエンジニアリング・クラウド資格の専門家。Databricks・Snowflake等の認定資格を保有し、実務経験に基づいた問題作成・解説を行っています。NicheeLab運営。
Google Cloud (GCP) 認定資格ロードマップ 2026 完全版|全 15 試験を体系化
Google Cloud 認定資格 全 15 試験 (Foundational 2 + Associate 3 + Pr...
Cloud Digital Leader (CDL) 完全ガイド|出題範囲・学習リソース・合格戦略
Google Cloud Cloud Digital Leader (CDL) の完全ガイド。6 ドメイン 92 bul...
Generative AI Leader (GAIL) 完全ガイド|Google Cloud 生成 AI 認定
Google Cloud Generative AI Leader (GAIL、2025-05-14 リリース) の完全...
Vertex AI 入門|Google Cloud 統合 ML プラットフォームの全機能
Google Cloud Vertex AI の入門解説。Vertex AI Studio / Agent Builde...
GCP Associate Cloud Engineer (ACE) 完全ガイド|試験範囲・受験料・学習ロードマップ
Google Cloud Associate Cloud Engineer (ACE) の試験範囲・受験料 125 US...