Gemini API は Google の最新マルチモーダル LLM ファミリーで、2024 から Gemini 2.0 系がリリースされました。 Flash / Pro / Ultra の 3 ティアで、Context Cache 75% 削減、200 万トークンコンテキスト、Tool Use 標準対応など、OpenAI / Anthropic と並ぶ主要 LLM API です。
| モデル | コンテキスト | 入力料金 ($/M tok) | 出力料金 ($/M tok) | 用途 |
|---|---|---|---|---|
| Gemini 2.0 Flash | 1M | $0.075 | $0.30 | チャット / 要約 / 軽量タスク |
| Gemini 2.0 Pro | 2M | $1.25 | $5.00 | RAG / コード生成 / 推論 |
| Gemini Ultra | 2M | カスタム | カスタム | Enterprise 高度推論 |
| Gemma 2 (OSS) | 8k | 無料 | 無料 | Edge / オンプレ |
| 項目 | Google AI Studio | Vertex AI |
|---|---|---|
| 用途 | 個人・PoC | 本番・Enterprise |
| 無料枠 | 寛大 (RPD 制限あり) | $300 クレジット |
| 認証 | API Key | IAM / Service Account |
| CMEK | — | ◎ |
| VPC SC | — | ◎ |
| SLA | — | 99.9% |
| Data Use | 学習に使われる可能性 | 使われない (デフォルト) |
from vertexai.generative_models import GenerativeModel, Part
import vertexai
vertexai.init(project="my-project", location="asia-northeast1")
model = GenerativeModel("gemini-2.0-flash-001")
# Text
response = model.generate_content("日本の首都は?")
print(response.text)
# Multimodal (image + text)
image = Part.from_uri("gs://my-bucket/photo.jpg", mime_type="image/jpeg")
response = model.generate_content([image, "この画像を説明して"])
# Function Calling
from vertexai.generative_models import Tool, FunctionDeclaration
weather_func = FunctionDeclaration(
name="get_weather",
description="Get current weather",
parameters={
"type": "object",
"properties": {"city": {"type": "string"}},
"required": ["city"],
},
)
tools = [Tool(function_declarations=[weather_func])]
response = model.generate_content(
"東京の天気は?", tools=tools
)from vertexai.preview import caching
from datetime import datetime, timedelta
# システムプロンプト + 長文ドキュメントを Cache
cached_content = caching.CachedContent.create(
model_name="gemini-2.0-pro-001",
system_instruction="あなたは社内 FAQ ボットです",
contents=[long_document],
ttl=timedelta(hours=1),
)
# Cache 利用 (入力 75% 割引)
model = GenerativeModel.from_cached_content(cached_content)
response = model.generate_content("休暇申請の方法は?")| 項目 | Gemini 2.0 Flash | GPT-4o mini | Claude Haiku 3.5 |
|---|---|---|---|
| 入力 ($/M tok) | $0.075 | $0.15 | $0.80 |
| 出力 ($/M tok) | $0.30 | $0.60 | $4.00 |
| コンテキスト | 1M | 128k | 200k |
| マルチモーダル | ◎ (動画も) | ○ (画像) | ○ (画像) |
| 項目 | Gemini 2.0 Pro | GPT-4o | Claude Sonnet 3.5 |
|---|---|---|---|
| 入力 ($/M tok) | $1.25 | $2.50 | $3.00 |
| 出力 ($/M tok) | $5.00 | $10.00 | $15.00 |
| コンテキスト | 2M | 128k | 200k |
Gemini API は Google AI Studio と Vertex AI どちらを使う?
個人開発・PoC は Google AI Studio (無料枠寛大)、本番・エンタープライズは Vertex AI (CMEK / VPC SC / SLA)。同じ Gemini モデルだが認証・課金・SLA が異なる。
Gemini 2.0 Flash と Pro の違いは?
Flash = 低レイテンシ・低コスト・1M トークン (チャット・要約)、Pro = 高精度・2M トークン (RAG・コード生成)。99% のユースケースは Flash で十分。
Gemini の料金は?
Flash: 入力 $0.075/M tok、出力 $0.30/M tok。Pro: 入力 $1.25/M tok、出力 $5.00/M tok。GPT-4o より 5-10 倍安く、Claude Sonnet と同水準。
マルチモーダル対応は?
テキスト + 画像 + 音声 + 動画 + PDF 入力対応。Pro は 2 時間動画、Flash は 1 時間動画を 1 リクエストで処理可能。
Function Calling は?
OpenAI 互換の Tool Use API。自動関数呼び出し、並列実行、Strict mode で JSON Schema 厳守。
Context Caching とは?
繰り返し参照する大きなコンテキスト (システムプロンプト + ドキュメント) を Cache 化、入力トークン単価を 75% 削減。RAG・チャットボットで効果絶大。
Grounding with Google Search は?
Pro で利用可。最新情報を Google 検索結果でグラウンディング。$35/1000 リクエストで利用。
Safety Filter はどう設定する?
Harassment / Hate Speech / Sexually Explicit / Dangerous Content の 4 カテゴリ × 4 段階 (BLOCK_NONE / FEW / SOME / MOST)。デフォルトは SOME。
関連記事・Gen AI
Vertex AI 入門|Google Cloud 統合 ML プラットフォームの全機能 (GAIL/PMLE/PCD 必須知識)
Google Cloud Vertex AI の入門解説。Vertex AI Studio / Agent Builder / Model Garden / Search / Pipelines / Training の全機能、Gemini モデルファミリー (Pro/Flash/Ultra)、Azure OpenAI との比較、料金体系、Responsible AI 機能を日本語で整理。
Vertex AI Agent Builder 完全ガイド|Conversational Agents・Vertex AI Search・Tool Use (GCP)
Google Cloud Vertex AI Agent Builder の全機能解説。Conversational Agents (Dialogflow CX 後継)、Vertex AI Search、Tool Use、Grounding、Playbook、料金、ChatGPT GPTs / Copilot Studio 比較を網羅。
Vertex AI vs SageMaker vs Azure ML 徹底比較|MLOps プラットフォーム選び方 (2026)
Google Vertex AI / AWS SageMaker / Azure ML の徹底比較。Gen AI 統合 (Gemini / Bedrock / Azure OpenAI)、AutoML、Pipelines、Feature Store、GPU/TPU、料金、認定試験を 2026 年最新版で網羅。
Gemini vs GPT-4 vs Claude vs Llama 徹底比較|LLM API 選び方・料金 (2026)
Google Gemini 2.0 / OpenAI GPT-4o / Anthropic Claude Opus 4 / Meta Llama 3.3 の徹底比較。性能 / コード / 推論 / マルチモーダル / 料金 / コンテキスト長 / GCP・AWS・Azure 経由利用を 2026 年最新版で網羅。
※ Google、Gemini は Google LLC の商標です。最新情報は Vertex AI Gen AI 公式 をご確認ください。
NicheeLab編集部
データエンジニアリング・クラウド資格の専門家。Databricks・Snowflake等の認定資格を保有し、実務経験に基づいた問題作成・解説を行っています。NicheeLab運営。
Google Cloud (GCP) 認定資格ロードマップ 2026 完全版|全 15 試験を体系化
Google Cloud 認定資格 全 15 試験 (Foundational 2 + Associate 3 + Pr...
Cloud Digital Leader (CDL) 完全ガイド|出題範囲・学習リソース・合格戦略
Google Cloud Cloud Digital Leader (CDL) の完全ガイド。6 ドメイン 92 bul...
Generative AI Leader (GAIL) 完全ガイド|Google Cloud 生成 AI 認定
Google Cloud Generative AI Leader (GAIL、2025-05-14 リリース) の完全...
Vertex AI 入門|Google Cloud 統合 ML プラットフォームの全機能
Google Cloud Vertex AI の入門解説。Vertex AI Studio / Agent Builde...
GCP Associate Cloud Engineer (ACE) 完全ガイド|試験範囲・受験料・学習ロードマップ
Google Cloud Associate Cloud Engineer (ACE) の試験範囲・受験料 125 US...