Azure

Azure OpenAI Service 入門|モデル選定・PTU・Prompt Engineering・Function Calling・Embeddings

2026-05-24
NicheeLab編集部

Azure OpenAI Service は OpenAI の GPT モデル (gpt-4o・o1・o3 シリーズ)・DALL-E・Whisper・Embeddings を Microsoft Azure 上で提供するマネージドサービスです。 OpenAI API (Native) と機能・性能はほぼ同等ながら、エンタープライズグレードのセキュリティ・コンプライアンス・統合を提供。 本記事では、モデル選定・Deployment 方式・Prompt Engineering・Function Calling・Embeddings・セキュリティを網羅的に整理します。

OpenAI API との違い

項目OpenAI API (Native)Azure OpenAI Service
提供OpenAI 直接Microsoft Azure
認証API Key のみMicrosoft Entra ID + Managed Identity
Private Network×Private Endpoint
暗号化標準Customer-Managed Key
SLA標準99.9% (PTU で 99.99%)
コンプライアンス限定SOC 2 / HIPAA / ISO 27001 / PCI DSS / FedRAMP
用途個人開発・PoCエンタープライズ本番

主要モデル一覧

モデル特徴用途
gpt-4oMultimodal・画像入力対応・高性能・低コスト標準推奨
gpt-4o-mini高速・最低コスト (gpt-4o の約 1/10 価格)大量処理・チャット
gpt-4 Turbo旧世代・長期サポート既存システム
o1-preview / o1-miniReasoning モデル・複雑推論数学・複雑コーディング
o3-mini最新 Reasoning モデル・コスト効率推論 + コスト両立
text-embedding-3-large3,072 次元 Embedding高精度 RAG
text-embedding-3-small1,536 次元 Embedding低コスト RAG
DALL-E 3画像生成マーケティング・デザイン
Whisper音声認識・転写音声 → テキスト
GPT-4o Realtimeリアルタイム音声対話音声 AI アシスタント

Standard Deployment vs PTU

項目Standard (Pay-as-you-go)Provisioned Throughput Units (PTU)
課金トークン単価固定容量予約・固定月額
リソース共有専用
レイテンシ保証なしあり
SLA99.9%99.99%
最小単位なし50 PTU
月額目安従量数十万円〜
用途開発・PoC・小規模本番大規模本番・SLA 要件

Region 戦略

  • Global Standard: Microsoft 全 Region で処理 (データ Region 不問)
  • Data Zone Standard: 特定データレジデンシー Region 内処理 (GDPR / 日本データレジデンシー要件)

Reserved Capacity (1 年契約) で PTU 月額大幅割引も可能。

Prompt Engineering

基本構造

  • System Message: アシスタントの役割・制約定義 (最重要)
  • User Message: ユーザーの質問・指示
  • Assistant Message: 応答 (ChatHistory として保持)

代表的なテクニック

  1. Zero-shot: 例示なし、シンプル質問
  2. Few-shot: 3-5 例示で動作パターン学習
  3. Chain of Thought (CoT): 『ステップバイステップで考えて』指示で推論精度向上
  4. Role Playing: 『あなたは医療専門家です』のような役割付与
  5. Structured Output: JSON Schema 指定で構造化応答
  6. Temperature 調整: 0 = 決定的・1 = 創造的
  7. Top-p 調整: 確率分布の累積閾値
  8. Frequency / Presence Penalty: 繰り返し抑制

本番運用では Prompt Library を組織で集中管理、A/B Test で継続改善、Prompt Injection 対策の設計が重要。

Function Calling / Tool Calling

LLM が外部関数 / API を自律的に呼び出す機能。

代表的なユースケース

  • 天気 API 呼び出し
  • データベースクエリ
  • 計算実行
  • Email / Slack 通知
  • 他 LLM API 呼び出し (Multi-Agent パターン)

実装フロー

  1. Functions Schema 定義 (関数名・引数・型・説明)
  2. ChatCompletion 呼び出し時に Tools 引数で関数リスト送信
  3. LLM が呼び出し必要と判断したら tool_calls 配列を返却
  4. クライアントが対応関数を実行
  5. 結果を Tool Message として LLM に返却
  6. LLM が結果を踏まえて最終応答生成

Azure AI Foundry Agent Service で複雑な Multi-step Function Calling を抽象化、より高度な Agent パターンが実装可能。

Embeddings と Vector Search

Embeddings は『テキスト → ベクトル (高次元数値配列)』変換、意味的類似度を計算可能にする技術。

動作

  1. Document を Chunks (200-1,000 トークン単位) に分割
  2. 各 Chunk を Embedding API で Vector 化
  3. Vector を Vector Database (Azure AI Search・Cosmos DB Vector・PostgreSQL pgvector) に保管
  4. ユーザーの Query も Embedding API で Vector 化
  5. Cosine Similarity / Dot Product で Query Vector に近い Chunks を検索 (Top-K)
  6. 検索結果 Chunks を GPT-4o の Prompt に含めて応答生成 (RAG パターン)

Azure AI Search の Vector Search は組み込み機能で、Hybrid Search (Vector + Full-text + BM25) で精度向上。 詳細は RAG パターン実装ガイド 参照。

セキュリティとガバナンス

  1. Microsoft Entra ID 認証 + Managed Identity (API Key 不要)
  2. Private Endpoint で完全プライベート (privatelink.openai.azure.com)
  3. Customer-Managed Key で暗号化 (Key Vault 連携)
  4. Microsoft Defender for AI で異常使用検知
  5. Content Filter: Hate / Self-harm / Sexual / Violence の自動 Block (4 段階強度)
  6. Prompt Shield: Jailbreak / Prompt Injection 検知 (Direct + Indirect Attack)
  7. Groundedness Detection: Hallucination (幻覚) 検知
  8. Protected Material Detection: 著作権侵害コンテンツ検知
  9. Usage Logs (Diagnostic Logs): 全 Prompt / Response 監査ログ送信
  10. Token 消費の Cost Management 統合

コスト最適化

  1. モデル選定の最適化 (gpt-4o-mini で十分なら gpt-4o-mini)
  2. Prompt の最小化 (System Message を簡潔に)
  3. Few-shot 例の最小化
  4. Output Token 上限 (max_tokens) 設定
  5. Embedding は text-embedding-3-small で十分な場合は small
  6. Caching (Semantic Cache で類似 Query の応答再利用)
  7. Batch API で非リアルタイム処理 (50% 割引)
  8. PTU を Reserved Capacity で割引
  9. Azure Monitor で Token 消費継続監視
  10. Prompt Library で社内テンプレート共有

運用ベストプラクティス

  1. 本番は Managed Identity + Private Endpoint
  2. Content Filter + Prompt Shield + Groundedness Detection 必須
  3. Prompt Library で組織標準化
  4. Structured Output (JSON Schema) で型安全
  5. Function Calling で外部統合
  6. RAG パターンで自社データ活用
  7. Azure AI Foundry で Prompt Flow による評価パイプライン
  8. Microsoft Sentinel に Diagnostic Logs 送信、KQL 異常検知
  9. Token 消費 Cost Management で月次レビュー
  10. Responsible AI 6 原則準拠 (公平性・透明性・説明責任・プライバシー・包括性・信頼性)

関連認定試験

よくある質問

Azure OpenAI Service とは?

Azure OpenAI Service は OpenAI の GPT モデル (gpt-4o・gpt-4o-mini・o1・o3 シリーズ)・DALL-E (画像生成)・Whisper (音声認識)・Embeddings モデルを Microsoft Azure 上で提供するマネージドサービス。OpenAI API (Native) と機能・性能はほぼ同等だが、Azure 統合のメリット: 1) Microsoft Entra ID 認証 + Managed Identity 対応 (Secret 不要)、2) Private Endpoint で完全プライベート (Public Internet 経由不要)、3) Customer-Managed Key で暗号化、4) Microsoft Defender for AI 統合、5) SOC 2 / HIPAA / ISO 27001 / PCI DSS / FedRAMP 等エンタープライズコンプライアンス、6) Azure SLA 99.9% (Provisioned Throughput Units で 99.99%)、7) Microsoft 365・Power Platform 統合。エンタープライズで生成 AI を本番運用する場合の標準選択肢で、AI-103 試験の中核トピックです。

モデル選定はどうしますか?

Azure OpenAI が提供する主要モデル: 1) gpt-4o (Multimodal・画像入力対応・高性能・低コスト・標準推奨)、2) gpt-4o-mini (高速・最低コスト・gpt-4o の約 1/10 価格・大量処理向け)、3) gpt-4 Turbo (旧世代、長期サポート)、4) o1-preview / o1-mini (Reasoning モデル・複雑推論向け・コスト高)、5) o3-mini (最新 Reasoning モデル、コスト効率良)、6) text-embedding-3-large / small (Embedding 生成・RAG 必須)、7) DALL-E 3 (画像生成)、8) Whisper (音声認識)、9) GPT-4o Realtime (リアルタイム音声対話)。判断: 1) 一般的なチャット・要約 → gpt-4o-mini (コスト最適)、2) 高精度要求 → gpt-4o、3) 複雑な推論・数学・コーディング → o1 / o3、4) RAG の Embedding → text-embedding-3-large。Model Catalog で Quota 申請後に Deploy、Region により利用可能モデルが異なる点に注意が必要です。

Standard Deployment と Provisioned Throughput Units (PTU) の違いは?

Standard Deployment (Pay-as-you-go): トークン単価課金 (入力 + 出力)、共有リソース、需要に応じてスケール、Throughput 制限あり (毎分トークン数 TPM)、開発・PoC・小規模本番向け。Provisioned Throughput Units (PTU): 固定容量予約・固定月額、専用リソース、レイテンシ保証、大規模本番・SLA 99.99% 要件向け、最小 50 PTU 月数十万円〜。判断: 月数百万 Token 以下 → Standard、月数千万 Token 以上 + レイテンシ保証要件 → PTU、エンタープライズ本番アプリ → PTU 推奨。Global Standard と Data Zone Standard の選択もあり: Global Standard は Microsoft 全 Region で処理 (データ Region 不問)、Data Zone Standard は特定データレジデンシー Region 内処理 (GDPR / 日本データレジデンシー要件)。Reserved Capacity (1 年契約) で PTU 月額大幅割引も可能です。

Prompt Engineering の基本は?

Prompt Engineering は LLM への入力 (Prompt) を設計する技法。基本構造: 1) System Message (アシスタントの役割・制約定義、最重要)、2) User Message (ユーザーの質問・指示)、3) Assistant Message (応答、ChatHistory として保持)。代表的なテクニック: 1) Zero-shot (例示なし、シンプル質問)、2) Few-shot (3-5 例示で動作パターン学習)、3) Chain of Thought (CoT、『ステップバイステップで考えて』指示で推論精度向上)、4) Role Playing (『あなたは医療専門家です』のような役割付与)、5) Structured Output (JSON Schema 指定で構造化応答)、6) Temperature 調整 (0 = 決定的・1 = 創造的)、7) Top-p 調整 (確率分布の累積閾値)、8) Frequency Penalty / Presence Penalty (繰り返し抑制)。本番運用では Prompt Library を組織で集中管理、A/B Test で継続改善、Prompt 漏洩防止 (Prompt Injection 対策) の設計が重要です。

Function Calling / Tool Calling の使い方は?

Function Calling (Tool Calling) は LLM が外部関数 / API を自律的に呼び出す機能。代表的なユースケース: 1) 天気 API 呼び出し (『東京の天気は?』→ get_weather('Tokyo') 呼び出し → 結果を要約)、2) データベースクエリ (『2024 年の売上は?』→ query_sales('2024') 呼び出し → 結果を Format)、3) 計算実行 (『複雑な税金計算』→ calculate_tax 呼び出し)、4) Email 送信 (『Slack に通知して』→ send_slack_message 呼び出し)、5) 他 LLM API 呼び出し (Multi-Agent パターン)。実装フロー: 1) Functions Schema 定義 (関数名・引数・型・説明)、2) ChatCompletion 呼び出し時に Tools 引数で関数リスト送信、3) LLM が呼び出し必要と判断したら tool_calls 配列を返却、4) クライアントが対応関数を実行、5) 結果を Tool Message として LLM に返却、6) LLM が結果を踏まえて最終応答生成。Azure AI Foundry Agent Service で複雑な Multi-step Function Calling を抽象化、より高度な Agent パターンが実装可能です。

Embeddings と Vector Search の動作は?

Embeddings は『テキスト → ベクトル (高次元数値配列)』変換、意味的類似度を計算可能にする技術。text-embedding-3-large は 3,072 次元 (高精度)・small は 1,536 次元 (高速・低コスト)。動作: 1) Document を Chunks (200-1,000 トークン単位) に分割、2) 各 Chunk を Embedding API で Vector 化、3) Vector を Vector Database (Azure AI Search Vector・Cosmos DB Vector・PostgreSQL pgvector) に保管、4) ユーザーの Query も Embedding API で Vector 化、5) Cosine Similarity / Dot Product で Query Vector に近い Chunks を検索 (Top-K)、6) 検索結果 Chunks を GPT-4o の Prompt に含めて応答生成 (RAG パターン)。Azure AI Search の Vector Search は組み込み機能で、Hybrid Search (Vector + Full-text + BM25) で精度向上。RAG の詳細実装は RAG パターン実装ガイド記事を参照してください。

セキュリティとガバナンスは?

Azure OpenAI のセキュリティ機能: 1) Microsoft Entra ID 認証 + Managed Identity (API Key 不要のシークレットレス)、2) Private Endpoint で完全プライベート (privatelink.openai.azure.com)、3) Customer-Managed Key で暗号化 (Key Vault 連携)、4) Microsoft Defender for AI で異常使用検知、5) Content Filter で Hate / Self-harm / Sexual / Violence の自動 Block (4 段階強度)、6) Prompt Shield で Jailbreak / Prompt Injection 検知 (Direct + Indirect Attack)、7) Groundedness Detection で Hallucination (幻覚) 検知、8) Protected Material Detection で著作権侵害コンテンツ検知、9) Usage Logs (Diagnostic Logs) で全 Prompt / Response 監査ログ送信、10) Token 消費の Cost Management 統合。本番運用では Content Filter + Prompt Shield + Microsoft Sentinel 統合で異常検知 + Logic App Playbook 自動応答が標準パターン、Responsible AI 6 原則準拠の実装が必須です。

関連認定試験は?

AI-103 (Developing AI Apps and Agents on Azure、2026-06 GA) のドメイン 2 (Generative AI 30-35%) で Azure OpenAI が深く問われる本領域の本命認定。AI-901 (AI Fundamentals、2026-06 GA・AI-900 後継) で生成 AI 基礎、AZ-204 (Developer Associate、2026-07 リタイア注意) で開発者視点での Azure OpenAI SDK、SC-100 (Cybersecurity Architect Expert) で AI セキュリティ・Responsible AI、DP-700 (Fabric Data Engineer) で AI 用データ準備パイプライン、AZ-305 (Solutions Architect Expert) で AI アーキテクチャ判断。Azure AI エンジニアにとって Azure OpenAI の理解は必須で、AI-103 学習の中核領域です。

関連記事・技術深掘り

Azure AI エンジニア キャリアロードマップ|AI-901 → AI-103 → 生成 AI アーキテクトへの道【2026 年版】

Azure AI エンジニアになるための認定取得ロードマップ完全版。AI-901 (2026-06 GA、AI-900 後継) → AI-103 (2026-06 GA、AI-102 後継) の最新ルート、Azure AI Foundry / Agent Service / OpenAI 中心の生成 AI 時代の構成、Databricks GenAI / OpenAI Direct との二刀流戦略、年収レンジまで日本語で網羅。

AI-103 完全ガイド|Developing AI Apps and Agents on Azure【2026 年 6 月 GA・AI-102 後継】

Microsoft Certified: Developing AI Apps and Agents on Azure (AI-103) の完全ガイド。AI-102 の後継として 2026 年 6 月 30 日 GA。Azure AI Foundry / Agent Service / OpenAI / AI Search を中心に、RAG パターン・Agent オーケストレーション・Responsible AI・Semantic Kernel SDK の実装スキル、3-4 ヶ月の合格ロードマップを日本語で網羅。

Azure AI Foundry 完全ガイド|Hub/Project・Prompt Flow・Agent Service・Model Catalog・Fine-tuning【2026 年版】

Microsoft Azure AI Foundry (旧 AI Studio) の完全ガイド。Hub-Project 階層・Prompt Flow LLM ワークフロー・Agent Service・Evaluation メトリクス・Model Catalog (1,800+ モデル)・Fine-tuning・Content Safety・関連認定試験 (AI-103 / AI-901) を日本語で網羅。

Azure RAG パターン実装ガイド|Chunking・Embedding・Azure AI Search・Hallucination 削減【2026 年版】

Azure での RAG (Retrieval-Augmented Generation) パターン完全実装ガイド。5 ステップパイプライン (Ingestion・Chunking・Embedding・Indexing・Retrieval・Generation)・Azure AI Search Vector Search・Hybrid Search・Semantic Ranking・Hallucination 削減・関連認定試験 (AI-103 / DP-420) を日本語で網羅。

本記事の技術情報は Azure OpenAI Service Documentation に基づいています。 本記事は Microsoft Corporation の公式商品ではなく、いかなる提携・後援関係もありません。 Microsoft、Azure、Azure OpenAI は Microsoft group of companies の商標です。OpenAI は OpenAI, Inc. の商標です。 情報は 2026 年 5 月 24 日時点の公式公開資料に基づきます。最新情報は必ず公式ページをご確認ください。

この記事で学んだ内容を問題で確認しましょう

16,000問以上の問題で実力チェック

Azure 試験対策ページを見る
この記事の著者

NicheeLab編集部

データエンジニアリング・クラウド資格の専門家。Databricks・Snowflake等の認定資格を保有し、実務経験に基づいた問題作成・解説を行っています。NicheeLab運営。


関連記事
Azure

AZ-900 完全ガイド|Microsoft Azure Fundamentals 出題範囲・学習リソース・合格戦略

Microsoft Azure Fundamentals (AZ-900) の 2026 年 1 月 14 日改訂版に対...

Azure

Azure 認定資格ロードマップ 2026 完全版|全 26 試験の体系と大型再編 (AI-901/AI-103/SC-500)

Microsoft Azure 認定資格 全 26 試験 (現行 23 + 退役 3) の 2026 年版ロードマップ。...

Azure

AI-901 完全ガイド|Azure AI Fundamentals 新試験

Microsoft Certified: Azure AI Fundamentals (AI-901) の出題範囲・Mi...

Azure

Microsoft Entra ID 入門|旧 Azure AD から学ぶ ID 管理 (AZ-900/SC-900/AZ-104 必須知識)

Microsoft Entra ID (旧 Azure Active Directory) の入門解説。2023 年 7...

Azure

DP-900 完全ガイド|Azure Data Fundamentals 出題範囲・学習リソース・合格戦略

Microsoft Azure Data Fundamentals (DP-900) の完全ガイド。4 ドメインの出題範...

Azureの記事一覧 (103件)
© 2026 NicheeLab All rights reserved.