Google Cloud

Gemini API 完全ガイド|料金・モデル選定・マルチモーダル・Function Calling

2026-05-24
NicheeLab編集部

Gemini API は Google の最新マルチモーダル LLM ファミリーで、2024 から Gemini 2.0 系がリリースされました。 Flash / Pro / Ultra の 3 ティアで、Context Cache 75% 削減、200 万トークンコンテキスト、Tool Use 標準対応など、OpenAI / Anthropic と並ぶ主要 LLM API です。

モデルファミリー (2026)

モデルコンテキスト入力料金 ($/M tok)出力料金 ($/M tok)用途
Gemini 2.0 Flash1M$0.075$0.30チャット / 要約 / 軽量タスク
Gemini 2.0 Pro2M$1.25$5.00RAG / コード生成 / 推論
Gemini Ultra2MカスタムカスタムEnterprise 高度推論
Gemma 2 (OSS)8k無料無料Edge / オンプレ

Google AI Studio vs Vertex AI

項目Google AI StudioVertex AI
用途個人・PoC本番・Enterprise
無料枠寛大 (RPD 制限あり)$300 クレジット
認証API KeyIAM / Service Account
CMEK
VPC SC
SLA99.9%
Data Use学習に使われる可能性使われない (デフォルト)

主要機能

  • マルチモーダル: テキスト + 画像 + 音声 + 動画 + PDF
  • Long Context: 1M / 2M トークン
  • Function Calling: Tool Use、並列、Strict mode
  • Code Execution: サンドボックス Python 実行 (Pro)
  • Context Caching: 入力トークン 75% 削減
  • Grounding with Google Search: 最新情報引用
  • JSON Mode: 構造化出力強制
  • Streaming: SSE で逐次レスポンス
  • Batch API: 非同期で 50% 割引

Python サンプル (Vertex AI SDK)

from vertexai.generative_models import GenerativeModel, Part
import vertexai

vertexai.init(project="my-project", location="asia-northeast1")
model = GenerativeModel("gemini-2.0-flash-001")

# Text
response = model.generate_content("日本の首都は?")
print(response.text)

# Multimodal (image + text)
image = Part.from_uri("gs://my-bucket/photo.jpg", mime_type="image/jpeg")
response = model.generate_content([image, "この画像を説明して"])

# Function Calling
from vertexai.generative_models import Tool, FunctionDeclaration

weather_func = FunctionDeclaration(
    name="get_weather",
    description="Get current weather",
    parameters={
        "type": "object",
        "properties": {"city": {"type": "string"}},
        "required": ["city"],
    },
)
tools = [Tool(function_declarations=[weather_func])]
response = model.generate_content(
    "東京の天気は?", tools=tools
)

Context Caching パターン

from vertexai.preview import caching
from datetime import datetime, timedelta

# システムプロンプト + 長文ドキュメントを Cache
cached_content = caching.CachedContent.create(
    model_name="gemini-2.0-pro-001",
    system_instruction="あなたは社内 FAQ ボットです",
    contents=[long_document],
    ttl=timedelta(hours=1),
)

# Cache 利用 (入力 75% 割引)
model = GenerativeModel.from_cached_content(cached_content)
response = model.generate_content("休暇申請の方法は?")

他 LLM API 比較

項目Gemini 2.0 FlashGPT-4o miniClaude Haiku 3.5
入力 ($/M tok)$0.075$0.15$0.80
出力 ($/M tok)$0.30$0.60$4.00
コンテキスト1M128k200k
マルチモーダル◎ (動画も)○ (画像)○ (画像)
項目Gemini 2.0 ProGPT-4oClaude Sonnet 3.5
入力 ($/M tok)$1.25$2.50$3.00
出力 ($/M tok)$5.00$10.00$15.00
コンテキスト2M128k200k

典型的なユースケース

  • RAG (社内ドキュメント検索 + 回答)
  • 動画コンテンツ解析・要約
  • マルチモーダル OCR + 構造化抽出
  • コード生成 + リファクタリング
  • Agent (Tool Use で外部 API 連携)
  • 多言語翻訳 (100+ 言語)

Gemini API は Google AI Studio と Vertex AI どちらを使う?

個人開発・PoC は Google AI Studio (無料枠寛大)、本番・エンタープライズは Vertex AI (CMEK / VPC SC / SLA)。同じ Gemini モデルだが認証・課金・SLA が異なる。

Gemini 2.0 Flash と Pro の違いは?

Flash = 低レイテンシ・低コスト・1M トークン (チャット・要約)、Pro = 高精度・2M トークン (RAG・コード生成)。99% のユースケースは Flash で十分。

Gemini の料金は?

Flash: 入力 $0.075/M tok、出力 $0.30/M tok。Pro: 入力 $1.25/M tok、出力 $5.00/M tok。GPT-4o より 5-10 倍安く、Claude Sonnet と同水準。

マルチモーダル対応は?

テキスト + 画像 + 音声 + 動画 + PDF 入力対応。Pro は 2 時間動画、Flash は 1 時間動画を 1 リクエストで処理可能。

Function Calling は?

OpenAI 互換の Tool Use API。自動関数呼び出し、並列実行、Strict mode で JSON Schema 厳守。

Context Caching とは?

繰り返し参照する大きなコンテキスト (システムプロンプト + ドキュメント) を Cache 化、入力トークン単価を 75% 削減。RAG・チャットボットで効果絶大。

Grounding with Google Search は?

Pro で利用可。最新情報を Google 検索結果でグラウンディング。$35/1000 リクエストで利用。

Safety Filter はどう設定する?

Harassment / Hate Speech / Sexually Explicit / Dangerous Content の 4 カテゴリ × 4 段階 (BLOCK_NONE / FEW / SOME / MOST)。デフォルトは SOME。

関連記事・Gen AI

Vertex AI 入門|Google Cloud 統合 ML プラットフォームの全機能 (GAIL/PMLE/PCD 必須知識)

Google Cloud Vertex AI の入門解説。Vertex AI Studio / Agent Builder / Model Garden / Search / Pipelines / Training の全機能、Gemini モデルファミリー (Pro/Flash/Ultra)、Azure OpenAI との比較、料金体系、Responsible AI 機能を日本語で整理。

Vertex AI Agent Builder 完全ガイド|Conversational Agents・Vertex AI Search・Tool Use (GCP)

Google Cloud Vertex AI Agent Builder の全機能解説。Conversational Agents (Dialogflow CX 後継)、Vertex AI Search、Tool Use、Grounding、Playbook、料金、ChatGPT GPTs / Copilot Studio 比較を網羅。

Vertex AI vs SageMaker vs Azure ML 徹底比較|MLOps プラットフォーム選び方 (2026)

Google Vertex AI / AWS SageMaker / Azure ML の徹底比較。Gen AI 統合 (Gemini / Bedrock / Azure OpenAI)、AutoML、Pipelines、Feature Store、GPU/TPU、料金、認定試験を 2026 年最新版で網羅。

Gemini vs GPT-4 vs Claude vs Llama 徹底比較|LLM API 選び方・料金 (2026)

Google Gemini 2.0 / OpenAI GPT-4o / Anthropic Claude Opus 4 / Meta Llama 3.3 の徹底比較。性能 / コード / 推論 / マルチモーダル / 料金 / コンテキスト長 / GCP・AWS・Azure 経由利用を 2026 年最新版で網羅。

※ Google、Gemini は Google LLC の商標です。最新情報は Vertex AI Gen AI 公式 をご確認ください。

この記事で学んだ内容を問題で確認しましょう

16,000問以上の問題で実力チェック

GCP 試験対策ページを見る
この記事の著者

NicheeLab編集部

データエンジニアリング・クラウド資格の専門家。Databricks・Snowflake等の認定資格を保有し、実務経験に基づいた問題作成・解説を行っています。NicheeLab運営。


関連記事
Google Cloud

Google Cloud (GCP) 認定資格ロードマップ 2026 完全版|全 15 試験を体系化

Google Cloud 認定資格 全 15 試験 (Foundational 2 + Associate 3 + Pr...

Google Cloud

Cloud Digital Leader (CDL) 完全ガイド|出題範囲・学習リソース・合格戦略

Google Cloud Cloud Digital Leader (CDL) の完全ガイド。6 ドメイン 92 bul...

Google Cloud

Generative AI Leader (GAIL) 完全ガイド|Google Cloud 生成 AI 認定

Google Cloud Generative AI Leader (GAIL、2025-05-14 リリース) の完全...

Google Cloud

Vertex AI 入門|Google Cloud 統合 ML プラットフォームの全機能

Google Cloud Vertex AI の入門解説。Vertex AI Studio / Agent Builde...

Google Cloud

GCP Associate Cloud Engineer (ACE) 完全ガイド|試験範囲・受験料・学習ロードマップ

Google Cloud Associate Cloud Engineer (ACE) の試験範囲・受験料 125 US...

Google Cloudの記事一覧 (102件)
© 2026 NicheeLab All rights reserved.