Azure

Azure OpenAI Service 入門｜モデル選定・PTU・Prompt Engineering・Function Calling・Embeddings

2026-05-24

NicheeLab編集部

Azure OpenAI Service は OpenAI の GPT モデル (gpt-4o・o1・o3 シリーズ)・DALL-E・Whisper・Embeddings を Microsoft Azure 上で提供するマネージドサービスです。 OpenAI API (Native) と機能・性能はほぼ同等ながら、エンタープライズグレードのセキュリティ・コンプライアンス・統合を提供。本記事では、モデル選定・Deployment 方式・Prompt Engineering・Function Calling・Embeddings・セキュリティを網羅的に整理します。

OpenAI API との違い

項目	OpenAI API (Native)	Azure OpenAI Service
提供	OpenAI 直接	Microsoft Azure
認証	API Key のみ	Microsoft Entra ID + Managed Identity
Private Network	×	Private Endpoint
暗号化	標準	Customer-Managed Key
SLA	標準	99.9% (PTU で 99.99%)
コンプライアンス	限定	SOC 2 / HIPAA / ISO 27001 / PCI DSS / FedRAMP
用途	個人開発・PoC	エンタープライズ本番

主要モデル一覧

モデル	特徴	用途
gpt-4o	Multimodal・画像入力対応・高性能・低コスト	標準推奨
gpt-4o-mini	高速・最低コスト (gpt-4o の約 1/10 価格)	大量処理・チャット
gpt-4 Turbo	旧世代・長期サポート	既存システム
o1-preview / o1-mini	Reasoning モデル・複雑推論	数学・複雑コーディング
o3-mini	最新 Reasoning モデル・コスト効率	推論 + コスト両立
text-embedding-3-large	3,072 次元 Embedding	高精度 RAG
text-embedding-3-small	1,536 次元 Embedding	低コスト RAG
DALL-E 3	画像生成	マーケティング・デザイン
Whisper	音声認識・転写	音声 → テキスト
GPT-4o Realtime	リアルタイム音声対話	音声 AI アシスタント

Standard Deployment vs PTU

項目	Standard (Pay-as-you-go)	Provisioned Throughput Units (PTU)
課金	トークン単価	固定容量予約・固定月額
リソース	共有	専用
レイテンシ保証	なし	あり
SLA	99.9%	99.99%
最小単位	なし	50 PTU
月額目安	従量	数十万円〜
用途	開発・PoC・小規模本番	大規模本番・SLA 要件

Region 戦略

Global Standard: Microsoft 全 Region で処理 (データ Region 不問)
Data Zone Standard: 特定データレジデンシー Region 内処理 (GDPR / 日本データレジデンシー要件)

Reserved Capacity (1 年契約) で PTU 月額大幅割引も可能。

Prompt Engineering

基本構造

System Message: アシスタントの役割・制約定義 (最重要)
User Message: ユーザーの質問・指示
Assistant Message: 応答 (ChatHistory として保持)

代表的なテクニック

Zero-shot: 例示なし、シンプル質問
Few-shot: 3-5 例示で動作パターン学習
Chain of Thought (CoT): 『ステップバイステップで考えて』指示で推論精度向上
Role Playing: 『あなたは医療専門家です』のような役割付与
Structured Output: JSON Schema 指定で構造化応答
Temperature 調整: 0 = 決定的・1 = 創造的
Top-p 調整: 確率分布の累積閾値
Frequency / Presence Penalty: 繰り返し抑制

本番運用では Prompt Library を組織で集中管理、A/B Test で継続改善、Prompt Injection 対策の設計が重要。

Function Calling / Tool Calling

LLM が外部関数 / API を自律的に呼び出す機能。

代表的なユースケース

天気 API 呼び出し
データベースクエリ
計算実行
Email / Slack 通知
他 LLM API 呼び出し (Multi-Agent パターン)

実装フロー

Functions Schema 定義 (関数名・引数・型・説明)
ChatCompletion 呼び出し時に Tools 引数で関数リスト送信
LLM が呼び出し必要と判断したら tool_calls 配列を返却
クライアントが対応関数を実行
結果を Tool Message として LLM に返却
LLM が結果を踏まえて最終応答生成

Azure AI Foundry Agent Service で複雑な Multi-step Function Calling を抽象化、より高度な Agent パターンが実装可能。

Embeddings と Vector Search

Embeddings は『テキスト → ベクトル (高次元数値配列)』変換、意味的類似度を計算可能にする技術。

動作

Document を Chunks (200-1,000 トークン単位) に分割
各 Chunk を Embedding API で Vector 化
Vector を Vector Database (Azure AI Search・Cosmos DB Vector・PostgreSQL pgvector) に保管
ユーザーの Query も Embedding API で Vector 化
Cosine Similarity / Dot Product で Query Vector に近い Chunks を検索 (Top-K)
検索結果 Chunks を GPT-4o の Prompt に含めて応答生成 (RAG パターン)

Azure AI Search の Vector Search は組み込み機能で、Hybrid Search (Vector + Full-text + BM25) で精度向上。詳細は RAG パターン実装ガイド参照。

セキュリティとガバナンス

Microsoft Entra ID 認証 + Managed Identity (API Key 不要)
Private Endpoint で完全プライベート (privatelink.openai.azure.com)
Customer-Managed Key で暗号化 (Key Vault 連携)
Microsoft Defender for AI で異常使用検知
Content Filter: Hate / Self-harm / Sexual / Violence の自動 Block (4 段階強度)
Prompt Shield: Jailbreak / Prompt Injection 検知 (Direct + Indirect Attack)
Groundedness Detection: Hallucination (幻覚) 検知
Protected Material Detection: 著作権侵害コンテンツ検知
Usage Logs (Diagnostic Logs): 全 Prompt / Response 監査ログ送信
Token 消費の Cost Management 統合

コスト最適化

モデル選定の最適化 (gpt-4o-mini で十分なら gpt-4o-mini)
Prompt の最小化 (System Message を簡潔に)
Few-shot 例の最小化
Output Token 上限 (max_tokens) 設定
Embedding は text-embedding-3-small で十分な場合は small
Caching (Semantic Cache で類似 Query の応答再利用)
Batch API で非リアルタイム処理 (50% 割引)
PTU を Reserved Capacity で割引
Azure Monitor で Token 消費継続監視
Prompt Library で社内テンプレート共有

運用ベストプラクティス

本番は Managed Identity + Private Endpoint
Content Filter + Prompt Shield + Groundedness Detection 必須
Prompt Library で組織標準化
Structured Output (JSON Schema) で型安全
Function Calling で外部統合
RAG パターンで自社データ活用
Azure AI Foundry で Prompt Flow による評価パイプライン
Microsoft Sentinel に Diagnostic Logs 送信、KQL 異常検知
Token 消費 Cost Management で月次レビュー
Responsible AI 6 原則準拠 (公平性・透明性・説明責任・プライバシー・包括性・信頼性)

よくある質問

Azure OpenAI Service とは?

Azure OpenAI Service は OpenAI の GPT モデル (gpt-4o・gpt-4o-mini・o1・o3 シリーズ)・DALL-E (画像生成)・Whisper (音声認識)・Embeddings モデルを Microsoft Azure 上で提供するマネージドサービス。OpenAI API (Native) と機能・性能はほぼ同等だが、Azure 統合のメリット: 1) Microsoft Entra ID 認証 + Managed Identity 対応 (Secret 不要)、2) Private Endpoint で完全プライベート (Public Internet 経由不要)、3) Customer-Managed Key で暗号化、4) Microsoft Defender for AI 統合、5) SOC 2 / HIPAA / ISO 27001 / PCI DSS / FedRAMP 等エンタープライズコンプライアンス、6) Azure SLA 99.9% (Provisioned Throughput Units で 99.99%)、7) Microsoft 365・Power Platform 統合。エンタープライズで生成 AI を本番運用する場合の標準選択肢で、AI-103 試験の中核トピックです。

モデル選定はどうしますか?

Azure OpenAI が提供する主要モデル: 1) gpt-4o (Multimodal・画像入力対応・高性能・低コスト・標準推奨)、2) gpt-4o-mini (高速・最低コスト・gpt-4o の約 1/10 価格・大量処理向け)、3) gpt-4 Turbo (旧世代、長期サポート)、4) o1-preview / o1-mini (Reasoning モデル・複雑推論向け・コスト高)、5) o3-mini (最新 Reasoning モデル、コスト効率良)、6) text-embedding-3-large / small (Embedding 生成・RAG 必須)、7) DALL-E 3 (画像生成)、8) Whisper (音声認識)、9) GPT-4o Realtime (リアルタイム音声対話)。判断: 1) 一般的なチャット・要約 → gpt-4o-mini (コスト最適)、2) 高精度要求 → gpt-4o、3) 複雑な推論・数学・コーディング → o1 / o3、4) RAG の Embedding → text-embedding-3-large。Model Catalog で Quota 申請後に Deploy、Region により利用可能モデルが異なる点に注意が必要です。

Standard Deployment と Provisioned Throughput Units (PTU) の違いは?

Standard Deployment (Pay-as-you-go): トークン単価課金 (入力 + 出力)、共有リソース、需要に応じてスケール、Throughput 制限あり (毎分トークン数 TPM)、開発・PoC・小規模本番向け。Provisioned Throughput Units (PTU): 固定容量予約・固定月額、専用リソース、レイテンシ保証、大規模本番・SLA 99.99% 要件向け、最小 50 PTU 月数十万円〜。判断: 月数百万 Token 以下 → Standard、月数千万 Token 以上 + レイテンシ保証要件 → PTU、エンタープライズ本番アプリ → PTU 推奨。Global Standard と Data Zone Standard の選択もあり: Global Standard は Microsoft 全 Region で処理 (データ Region 不問)、Data Zone Standard は特定データレジデンシー Region 内処理 (GDPR / 日本データレジデンシー要件)。Reserved Capacity (1 年契約) で PTU 月額大幅割引も可能です。

Prompt Engineering の基本は?

Prompt Engineering は LLM への入力 (Prompt) を設計する技法。基本構造: 1) System Message (アシスタントの役割・制約定義、最重要)、2) User Message (ユーザーの質問・指示)、3) Assistant Message (応答、ChatHistory として保持)。代表的なテクニック: 1) Zero-shot (例示なし、シンプル質問)、2) Few-shot (3-5 例示で動作パターン学習)、3) Chain of Thought (CoT、『ステップバイステップで考えて』指示で推論精度向上)、4) Role Playing (『あなたは医療専門家です』のような役割付与)、5) Structured Output (JSON Schema 指定で構造化応答)、6) Temperature 調整 (0 = 決定的・1 = 創造的)、7) Top-p 調整 (確率分布の累積閾値)、8) Frequency Penalty / Presence Penalty (繰り返し抑制)。本番運用では Prompt Library を組織で集中管理、A/B Test で継続改善、Prompt 漏洩防止 (Prompt Injection 対策) の設計が重要です。

Function Calling / Tool Calling の使い方は?

Function Calling (Tool Calling) は LLM が外部関数 / API を自律的に呼び出す機能。代表的なユースケース: 1) 天気 API 呼び出し (『東京の天気は?』→ get_weather('Tokyo') 呼び出し → 結果を要約)、2) データベースクエリ (『2024 年の売上は?』→ query_sales('2024') 呼び出し → 結果を Format)、3) 計算実行 (『複雑な税金計算』→ calculate_tax 呼び出し)、4) Email 送信 (『Slack に通知して』→ send_slack_message 呼び出し)、5) 他 LLM API 呼び出し (Multi-Agent パターン)。実装フロー: 1) Functions Schema 定義 (関数名・引数・型・説明)、2) ChatCompletion 呼び出し時に Tools 引数で関数リスト送信、3) LLM が呼び出し必要と判断したら tool_calls 配列を返却、4) クライアントが対応関数を実行、5) 結果を Tool Message として LLM に返却、6) LLM が結果を踏まえて最終応答生成。Azure AI Foundry Agent Service で複雑な Multi-step Function Calling を抽象化、より高度な Agent パターンが実装可能です。

Embeddings と Vector Search の動作は?

Embeddings は『テキスト → ベクトル (高次元数値配列)』変換、意味的類似度を計算可能にする技術。text-embedding-3-large は 3,072 次元 (高精度)・small は 1,536 次元 (高速・低コスト)。動作: 1) Document を Chunks (200-1,000 トークン単位) に分割、2) 各 Chunk を Embedding API で Vector 化、3) Vector を Vector Database (Azure AI Search Vector・Cosmos DB Vector・PostgreSQL pgvector) に保管、4) ユーザーの Query も Embedding API で Vector 化、5) Cosine Similarity / Dot Product で Query Vector に近い Chunks を検索 (Top-K)、6) 検索結果 Chunks を GPT-4o の Prompt に含めて応答生成 (RAG パターン)。Azure AI Search の Vector Search は組み込み機能で、Hybrid Search (Vector + Full-text + BM25) で精度向上。RAG の詳細実装は RAG パターン実装ガイド記事を参照してください。

セキュリティとガバナンスは?

Azure OpenAI のセキュリティ機能: 1) Microsoft Entra ID 認証 + Managed Identity (API Key 不要のシークレットレス)、2) Private Endpoint で完全プライベート (privatelink.openai.azure.com)、3) Customer-Managed Key で暗号化 (Key Vault 連携)、4) Microsoft Defender for AI で異常使用検知、5) Content Filter で Hate / Self-harm / Sexual / Violence の自動 Block (4 段階強度)、6) Prompt Shield で Jailbreak / Prompt Injection 検知 (Direct + Indirect Attack)、7) Groundedness Detection で Hallucination (幻覚) 検知、8) Protected Material Detection で著作権侵害コンテンツ検知、9) Usage Logs (Diagnostic Logs) で全 Prompt / Response 監査ログ送信、10) Token 消費の Cost Management 統合。本番運用では Content Filter + Prompt Shield + Microsoft Sentinel 統合で異常検知 + Logic App Playbook 自動応答が標準パターン、Responsible AI 6 原則準拠の実装が必須です。

この記事で学んだ内容を問題で確認しましょう

16,000問以上の問題で実力チェック

Azure 試験対策ページを見る

この記事の著者

NicheeLab編集部

データエンジニアリング・クラウド資格の専門家。Databricks・Snowflake等の認定資格を保有し、実務経験に基づいた問題作成・解説を行っています。NicheeLab運営。

Azure

AZ-900 完全ガイド｜Microsoft Azure Fundamentals 出題範囲・学習リソース・合格戦略

Microsoft Azure Fundamentals (AZ-900) の 2026 年 1 月 14 日改訂版に対...

Azure

Azure 認定資格ロードマップ 2026 完全版｜全 26 試験の体系と大型再編 (AI-901/AI-103/SC-500)

Microsoft Azure 認定資格全 26 試験 (現行 23 + 退役 3) の 2026 年版ロードマップ。...

Azure

AI-901 完全ガイド｜Azure AI Fundamentals 新試験

Microsoft Certified: Azure AI Fundamentals (AI-901) の出題範囲・Mi...

Azure

Microsoft Entra ID 入門｜旧 Azure AD から学ぶ ID 管理 (AZ-900/SC-900/AZ-104 必須知識)

Microsoft Entra ID (旧 Azure Active Directory) の入門解説。2023 年 7...

Azure

DP-900 完全ガイド｜Azure Data Fundamentals 出題範囲・学習リソース・合格戦略

Microsoft Azure Data Fundamentals (DP-900) の完全ガイド。4 ドメインの出題範...

Azure OpenAI Service 入門｜モデル選定・PTU・Prompt Engineering・Function Calling・Embeddings

OpenAI API との違い

主要モデル一覧

Standard Deployment vs PTU

Region 戦略

Prompt Engineering

基本構造

代表的なテクニック

Function Calling / Tool Calling

代表的なユースケース

実装フロー

Embeddings と Vector Search

動作

セキュリティとガバナンス

コスト最適化

運用ベストプラクティス

関連認定試験

よくある質問

この記事で学んだ内容を問題で確認しましょう

この記事の著者

関連記事

Azureの記事一覧 (103件)