GCP の画像・動画 AI は 3 つのサービスから構成されます — Cloud Vision API (画像分析)、Video Intelligence API (動画分析)、Vertex AI Vision (カスタム + Edge)。 本記事ではそれぞれの機能、使い分け、AWS / Azure 比較をまとめます。
| 機能 | 用途 |
|---|---|
| Label Detection | 物体・概念ラベリング |
| Object Detection / Localization | バウンディングボックス検出 |
| OCR (Text Detection) | テキスト抽出 (日本語対応) |
| Document Text Detection | ドキュメント OCR (Document AI 推奨) |
| Face Detection | 顔位置・感情・属性 (識別ではない) |
| Landmark Detection | 世界の有名スポット認識 |
| Logo Detection | 企業ロゴ認識 |
| SafeSearch | 不適切コンテンツ判定 |
| Web Detection | 類似画像 Web 検索 |
| Image Properties | 主要色 / クロップヒント |
| Product Search | 商品画像検索 |
from google.cloud import vision
client = vision.ImageAnnotatorClient()
image = vision.Image()
image.source.image_uri = "gs://my-bucket/photo.jpg"
# 複数機能を 1 リクエストで
features = [
vision.Feature(type_=vision.Feature.Type.LABEL_DETECTION, max_results=10),
vision.Feature(type_=vision.Feature.Type.TEXT_DETECTION),
vision.Feature(type_=vision.Feature.Type.SAFE_SEARCH_DETECTION),
]
request = vision.AnnotateImageRequest(image=image, features=features)
response = client.annotate_image(request=request)
for label in response.label_annotations:
print(f"{label.description}: {label.score:.2f}")
print("OCR:", response.text_annotations[0].description)
print("Adult:", response.safe_search_annotation.adult.name)| サービス | 料金 |
|---|---|
| Vision API (Label / OCR) | $1.50/1000 unit |
| Vision API 無料枠 | 月 1000 unit / 機能 |
| Video Intelligence Label | $0.10/分 |
| Video Intelligence Speech | $0.048/分 |
| Vertex AI Vision (カスタム学習) | $3.15/h |
| Vertex AI Vision Stream | $0.30/h (ストリーム数) |
| 項目 | Vision AI | AWS Rekognition | Azure Computer Vision |
|---|---|---|---|
| OCR (日本語) | ◎ | ○ (英語中心) | ○ |
| 顔識別 | — | ◎ | ○ |
| 動画分析 | Video Intelligence | Video Analysis | Video Indexer |
| カスタム学習 | AutoML Vision / Vertex | Custom Labels | Custom Vision |
| 料金 (Label) | $1.50/1k | $1/1k | $1/1k |
Vision AI / Cloud Vision API とは?
画像から物体・顔・テキスト・ロゴ・ランドマーク・不適切コンテンツ等を検出する事前学習済み API。1 リクエストで複数機能を組み合わせ可能。
Video Intelligence API は何ができる?
動画からシーン変化、物体追跡、テキスト、ロゴ、不適切コンテンツ、人物検出、スピーチ転写を抽出。CDN 連携で大規模動画処理可能。
Vertex AI Vision との違いは?
Vision API = 事前学習 API、Vertex AI Vision = カスタムモデル学習 + IoT デプロイ。リアルタイム監視や Edge 推論には Vertex AI Vision。
Imagen との関係は?
Vision API = 既存画像の分析、Imagen = テキストから画像生成。別物だが組み合わせ可能 (例: 商品画像生成 → Vision API で品質チェック)。
料金体系は?
Vision API: $1.50/1000 unit (機能ごと)、月 1000 unit 無料。Video Intelligence: $0.10/分 (Label Detection)、機能多岐。
AWS Rekognition / Azure Computer Vision 比較は?
3 つとも機能ほぼ同等。Vision AI は OCR の日本語精度・Web Detection・SafeSearch が優位。Rekognition は顔認識が強い。
AutoML Vision で何ができる?
業界固有の画像分類・物体検出モデルをノーコードで学習。Vision API では検出できない独自カテゴリ (自社商品分類等) に対応。
Edge デプロイは可能?
Vertex AI Vision で IoT Edge デバイスにモデルデプロイ可。AutoML Vision Edge で軽量モデル生成 (TensorFlow Lite / Core ML / TPU)。
関連記事・AI / 画像処理
Vertex AI AutoML 完全ガイド|Tables・Vision・NL・Video・Forecasting (GCP)
Google Cloud Vertex AI AutoML の全機能解説。AutoML Tables / Vision / Video / Natural Language / Translation / Forecasting、BigQuery ML との使い分け、AWS SageMaker Autopilot 比較、料金を網羅。
Document AI 完全ガイド|PDF/画像 OCR・請求書・契約書・Custom Extractor (GCP)
Google Cloud Document AI の全機能解説。Document OCR、Form Parser、専門プロセッサー (請求書 / 領収書 / 身分証)、Custom Extractor、Vertex AI 連携、料金、AWS Textract / Azure Form Recognizer 比較を網羅。
Vertex AI Agent Builder 完全ガイド|Conversational Agents・Vertex AI Search・Tool Use (GCP)
Google Cloud Vertex AI Agent Builder の全機能解説。Conversational Agents (Dialogflow CX 後継)、Vertex AI Search、Tool Use、Grounding、Playbook、料金、ChatGPT GPTs / Copilot Studio 比較を網羅。
Generative AI Leader (GAIL) 完全ガイド|Google Cloud 生成 AI 認定 (2025 年 5 月リリース新試験)
Google Cloud Generative AI Leader (GAIL、2025-05-14 リリース) の完全ガイド。4 ドメイン (生成 AI 基礎 30% / GCP 提供サービス 35% / モデル出力改善 20% / ビジネス戦略 15%)、Gemini ファミリー、Vertex AI Agent Builder、RAG、ビジネス導入観点を日本語で網羅。
※ Google Cloud は Google LLC の商標です。最新情報は Cloud Vision 公式 をご確認ください。
NicheeLab編集部
データエンジニアリング・クラウド資格の専門家。Databricks・Snowflake等の認定資格を保有し、実務経験に基づいた問題作成・解説を行っています。NicheeLab運営。
Google Cloud (GCP) 認定資格ロードマップ 2026 完全版|全 15 試験を体系化
Google Cloud 認定資格 全 15 試験 (Foundational 2 + Associate 3 + Pr...
Cloud Digital Leader (CDL) 完全ガイド|出題範囲・学習リソース・合格戦略
Google Cloud Cloud Digital Leader (CDL) の完全ガイド。6 ドメイン 92 bul...
Generative AI Leader (GAIL) 完全ガイド|Google Cloud 生成 AI 認定
Google Cloud Generative AI Leader (GAIL、2025-05-14 リリース) の完全...
Vertex AI 入門|Google Cloud 統合 ML プラットフォームの全機能
Google Cloud Vertex AI の入門解説。Vertex AI Studio / Agent Builde...
GCP Associate Cloud Engineer (ACE) 完全ガイド|試験範囲・受験料・学習ロードマップ
Google Cloud Associate Cloud Engineer (ACE) の試験範囲・受験料 125 US...