情報セキュリティばんざい！: マネージドAI推論プラットフォーム徹底比較：Amazon Bedrock / Azure AI Foundry / Google Vertex AI / OCI Generative AI（2025〜2026年6月版）

クラウド上で生成AIを本番利用する際、インフラ運用を意識せずに多様なLLMを呼び出せる「マネージドAI推論プラットフォーム」の重要性が急速に高まっている。2026年6月時点で主要プレイヤーとなっているのが、Amazon Bedrock・Azure AI Foundry・Google Vertex AI・OCI Generative AIの4サービスだ。本記事では、対応モデル・料金・日本リージョン/主権AI対応・RAG/エージェント機能・セキュリティ・市場シェアの6軸で徹底比較する。

1. サービス概要と位置づけ

まず4サービスの基本的な立ち位置を整理する。いずれも「APIを叩けば複数のLLMを呼び出せるマネージドサービス」という点では共通だが、強みの方向性は大きく異なる。

項目	Amazon Bedrock	Azure AI Foundry	Google Vertex AI	OCI Generative AI
提供元	Amazon Web Services	Microsoft	Google Cloud	Oracle Cloud Infrastructure
最大の強み	モデルの幅・AWSエコシステム統合・JP Geo推論	OpenAI最新モデルへの最速アクセス・M365統合	Gemini自社モデル・MLOps・BigQuery統合	Oracle DB統合・コスト・ZDR・ソブリンAI
主な対象ユーザー	AWS中心の企業・金融・公共	Microsoft/Azure中心・Office利用企業	GCP利用企業・データサイエンス重視	Oracle DB資産保有・コスト重視・規制業界
旧名称/統合経緯	—（2023年4月GA）	旧Azure AI Studio + Azure OpenAI Serviceを統合（2024年）	2026年Cloud NextでGemini Enterprise Agent Platformへ統合	—（2024年1月US GA、同年12月大阪提供開始）

2. 対応モデル・LLMラインナップ

モデルの選択肢はサービスの根幹だ。4社の提供モデルを比較する。

カテゴリ	Amazon Bedrock	Azure AI Foundry	Google Vertex AI	OCI Generative AI
自社ファーストパーティ	Amazon Nova（Micro/Lite/Pro/Premier）	OpenAI GPT-5.1/GPT-4o/o系/Phi-4シリーズ（Microsoft独占契約）	Gemini 2.5 Pro/Flash/Flash-Lite、Gemini 3.x系、Imagen、Veo	なし（マルチプロバイダー特化）
Anthropic Claude	Opus 4.6/4.7、Sonnet 4.5/4.6、Haiku 4.5（東京・大阪）	Claude系はModel Catalog経由で一部提供	Model GardenでClaude Opus/Sonnet/Haikuを一級市民として提供	非対応（2026年6月時点）
Meta Llama	Llama 3.3 70B、Llama 4系	Llama 3系	Model GardenでLlama対応	Llama 3.3/4 Maverick/Scout（大阪で提供）
Cohere	Command R+	一部提供	Model Garden経由	Command A（256Kコンテキスト）、Command A Vision/Reasoning（大阪）
xAI Grok	—	Grok系をModel Catalog経由で提供	—	Grok 4系（OCI DCでホスト、大阪対応）
OpenAI gpt-oss（オープンウェイト）	2025年9月〜。ただし東京での日本国内限定提供は未確認。	gpt-5.1など最新クローズドモデルが主力	—	gpt-oss-120b/20b（大阪でGA、2025年12月〜）。OpenAI互換APIキーで接続可能
Mistral	Large 2、Ministral 3B等	各種Mistralモデル	Model Garden経由	一部提供
総モデル数	15社以上のプロバイダー	11,000以上（コミュニティ含む）	200以上（Model Garden）	十数モデル（厳選型）

⚠️ 注意：Azure AI FoundryでのOpenAIモデルは「Microsoft FoundryモデルとしてAzureが販売」する形態と「パートナー・コミュニティモデル」に分かれる。最新GPT系は前者（Azure直販）、その他はModel Catalog経由。モデルのリージョン提供状況は頻繁に変わるため、本番採用前に公式ドキュメントを要確認。

3. 料金・コスト構造

代表的なモデルの料金（2026年6月時点、オンデマンド、100万トークンあたりUSD）を比較する。なお料金は頻繁に変動するため、本番採用前は各社公式ページで最新値を必ず確認すること。

モデル	入力（$）	出力（$）	経由サービス	備考
Claude Sonnet 4.5/4.6	$3.00	$15.00	Bedrock / Vertex AI	200K超は2倍料金。JP Geo使用時は+10%（Bedrock）
Claude Opus 4.6/4.7	$5.00	$25.00	Bedrock	JP Geo（日本国内限定）は未対応。グローバルCRISのみ
Claude Haiku 4.5	$1.00	$5.00	Bedrock / Vertex AI	JP Geo対応（Sonnet 4.5と同様）
Gemini 2.5 Pro	$1.25（200K以下）/ $2.50（200K超）	$10.00（200K以下）/ $15.00（200K超）	Vertex AI	推論トークンも出力として課金される点に注意
Gemini 2.5 Flash	$0.30	$2.50	Vertex AI / Gemini API	—
Gemini 2.5 Flash-Lite	$0.10	$0.40	Vertex AI / Gemini API	主要モデルで最安値クラス
Gemini 3.5 Flash（新）	$1.50	$9.00	Vertex AI / Gemini API	2026年5月19日リリース。コーディング・エージェント性能改善
GPT-4o	$2.50	$10.00	Azure AI Foundry	Global Standard料金。Data Zone/Standardは異なる場合あり
GPT-4.1	$2.00	$8.00	Azure AI Foundry	1Mトークンコンテキスト。GPT-4oより若干安価
Amazon Nova Pro	$0.80	$3.20	Bedrock	AWS自社モデル。マルチモーダル対応
Amazon Nova Micro	$0.035	$0.14	Bedrock	全主要プロバイダー中最安値クラス
Llama 3.3 70B（Bedrock）	$0.72	$0.72	Bedrock	入出力均一料金
OCI gpt-oss-120b	約$0.15	—	OCI Generative AI（大阪）	※二次情報。公式価格ページで要確認
OCI Cohere Command（旧世代）	文字課金（1文字=1トランザクション）	—	OCI Generative AI	新モデルはトークン課金に移行中

💡 コスト最適化のポイント：バッチ推論は各社50%割引。プロンプトキャッシュはBedrock/Vertexで最大90%削減。OCI gpt-ossは大阪リージョンでOpenAI互換APIキーを使えば、ベースURLを変えるだけでアクセス可能（2026年1月〜）。プロビジョンドスループット（Bedrock）・PTU（Azure）は月150〜200Mトークン超で損益分岐となる場合が多い。

4. 日本リージョン・主権AI対応

日本の金融・公共・製造業では「データを国内処理する」要件が重要だ。各社の対応状況を詳細に確認する。

項目	Amazon Bedrock	Azure AI Foundry	Google Vertex AI	OCI Generative AI
日本リージョン	東京（ap-northeast-1）/ 大阪（ap-northeast-3）	東日本（Japan East）	東京・大阪リージョンあり	大阪（Japan Central）のみ。東京はGenerative AI未提供
日本国内推論完結	JP Geo CRIS対応（Claude Sonnet 4.5・Haiku 4.5のみ）。東京↔大阪のみでルーティング。Opus系は国内限定未対応	Japan Data Zoneなし。最新モデルはGlobal Standard（全世界ルーティング）またはData Zone（EU/US）経由が多い	「ML Processing in Japan」を訴求。Gemini世代によって日本リージョン未対応のケースあり（要確認）	大阪でOCIホストモデル（gpt-oss/Llama/Grok/Cohere）は国内完結。ただし大阪のGemini 2.5 Pro/Flashは外部呼び出し（Google Asia Pacific経由）で国内完結ではない
ISMAP登録	✅ 登録済み（2021年3月〜、更新継続）	✅ Azure OpenAI Service ISMAP登録済み（2024年2月）	✅ Vertex AI ISMAP登録済み	✅ OCI ISMAP登録済み（2021年6月）
ガバメントクラウド	✅ 採択済み（令和4年度〜）	✅ 採択済み（令和4年度〜）	✅ 採択済み（令和4年度〜）	✅ 採択済み（令和4年度〜）
主権AI・ソブリンクラウド	JP Geo CRISがデータレジデンシー要件に対応。SCP/IAMで国内強制可能	日本向けソブリン構成は非公式。Azure Sovereignは特定国向け	国内処理完結を訴求するが、モデル世代ごとに要確認	ZDR（ゼロデータ保持）エンドポイント、専用AIクラスタ、富士通・NTTデータとのOracle Alloyソブリンクラウドで差別化
日本向け投資	2027年までに2.26兆円を東京・大阪インフラに投資予定（2024年1月発表）	日本でのデータセンター拡張継続中	東京・大阪リージョン継続強化	富士通・NTTデータ・NRI・SoftBank・NS SolutionsとOracle Alloy展開中

⚠️ ファクトチェック重要注意：BedrockのJP Geo（日本国内クロスリージョン推論）はClaude Sonnet 4.5・Haiku 4.5のみ対応（2026年6月時点）。Claude Opus 4.7は東京リージョンで利用可能だが、JP Geo（日本国内限定ルーティング）は未対応で、グローバルCRISまたはシングルリージョン利用となる。また、OCI大阪でのGemini 2.5 Pro/Flashは推論がGoogleのAsia Pacific設備で処理されるため、日本国内完結とはならない点に注意が必要。

5. RAG・エージェント機能

単なるLLM呼び出しを超えた「RAG構築」「エージェント」「ワークフロー自動化」機能が各社の差別化点になっている。

機能カテゴリ	Amazon Bedrock	Azure AI Foundry	Google Vertex AI	OCI Generative AI
RAG・ナレッジベース	Knowledge Bases（Managed/Self-managed）。S3 Vectorsでベクトルストアコスト最大90%削減	Foundry IQ（SharePoint/Fabric/Bing grounding）、Azure AI Search統合	RAG Engine（GA）、Vertex AI Search（現Agent Search）、Vector Search	ベクトル検索、NL2SQL（SQL Search）、OCI Responses APIのFile Search
エージェント機能	Bedrock AgentCore（Runtime/Gateway/Memory/Identity/Browser/Code Interpreter）、Bedrock Flows	Foundry Agent Service、Microsoft Agent Framework（2025年12月〜）	Agent Builder（ADK＋Agent Engine）、100以上のコネクタ	OCI Generative AI Agents（大阪：2025年4月〜）、ホスト型エージェント
MCP対応	✅ AgentCore Gateway経由でMCP対応	✅ 1,400以上のMCP対応ツール、Toolbox（MCP互換エンドポイント）	✅ MCP対応（A2Aプロトコルも提唱・Linux Foundationへ寄贈）	✅ OCI Responses APIのMCP Calling対応
マルチエージェント・A2A	✅ A2A対応、LangChain/CrewAI/LlamaIndex/Strands統合	✅ A2A対応、Entra Agent ID（エージェントID管理）	✅ A2Aプロトコル（Googleが提唱）	マルチエージェント構成可能だがA2A対応は限定的（要確認）
OpenAI互換API	—（独自SDK/API）	✅ Azure OpenAI Service互換	—（独自SDK）	✅ OCI Generative AI APIキー（2026年1月〜）でOpenAI互換、ベースURL変更だけで移行可能

6. セキュリティ・コンプライアンス

項目	Amazon Bedrock	Azure AI Foundry	Google Vertex AI	OCI Generative AI
認証・認可	IAM、PrivateLink（VPCエンドポイント）	Entra ID/RBAC、Private Networking（BYO VNet）	IAM、VPC Service Controls	IAM、専用AIクラスタ（テナンシー専有GPU）
プロンプト保護・ガードレール	Bedrock Guardrails（コンテンツフィルタ・PII・プロンプトインジェクション対策・Automated Reasoning checks）	Content Safety、Azure AI Guardrails（XPIA対策含む）、Purview連携	Model Armor（プロンプトインジェクション対策）、Content filters	OCI Guardrails、ZDRエンドポイント
主要認証	SOC2、ISO 27001/27017/27018、HIPAA、GDPR、CSA STAR Level 2、FedRAMP High（GovCloud）	SOC2、ISO、HIPAA、HITRUST、FedRAMP High	SOC2、ISO 27001、HIPAA、FedRAMP High（2025年3月取得）	SOC2、ISO、PCI DSS、FISC安全対策基準、3省ガイドライン、政府統一基準、FedRAMP
ISMAP	✅（157サービス、東京・大阪含む）	✅（Azure OpenAI Service）	✅	✅（2021年6月〜）
学習データ利用	デフォルトでモデル学習に使用しない	デフォルトでモデル学習に使用しない	有償API利用時はモデル改善に使用しない	ZDRエンドポイント利用でデータ保持ゼロ

💡 ISMAP生成AIの重要動向（2026年1月）：ISMAPポータルが「生成AIサービスに関する留意点」を公表。Bedrock・Vertex AI・Azure OpenAI等の開発基盤がISMAP登録対象範囲に含まれていれば、その上で動く個々のLLMモデル（Claudeなど）は個別のISMAP登録が不要と整理された。政府機関が生成AIを調達しやすくなった点で、エンタープライズ向けに大きな意味を持つ。

7. 市場シェア・普及状況

クラウドインフラ市場（IaaS+PaaS）のシェアは、Synergy Research Group 2025年Q3時点でAWS 29%、Microsoft Azure 20%、Google Cloud 13%（上位3社で約62%）。生成AI市場の成長率はGartner予測で2025年に+76.4%（支出$644B）に達するとされる。エンタープライズAI推論プラットフォームは「Bedrock（モデル幅）」「Azure（OpenAI深度＋Microsoft統合）」「Vertex（ML/MLOps＋BigQuery）」の三つ巴で、OCIはOracle DB統合・コスト・主権AIで独自ポジションを確立している。

日本国内では、ソニーグループがBedrock AgentCoreで全社Agenticプラットフォームを構築、ベネッセ・パナソニックコネクト・宮崎銀行等がAzure OpenAIを採用、みずほ銀行はOracle Autonomous AI Databaseを共通データベース基盤に採用するなど、各社に有力な採用事例がある。

8. 選定推奨：どのサービスを選ぶべきか

こんな要件なら	推奨サービス	理由
AWS中心の企業＋日本国内データ完結必須（金融・公共）	Amazon Bedrock	JP Geo CRIS（Claude Sonnet 4.5/Haiku 4.5）でデータが東京↔大阪のみ。IAM/SCPでリージョン強制可能
Microsoft 365/Azure中心＋ OpenAI最新モデルを優先利用	Azure AI Foundry	GPT-5.1等の最速アクセス。ただしJapan Data Zoneなし。データレジデンシー要件がある場合は処理ロケーションを事前検証すること
Google Cloud/BigQuery中心＋ MLOps・データパイプライン重視	Vertex AI	FedRAMP High取得済み（2025年3月）、BigQuery・Workbench・Data Catalogとのシームレスな統合。Gemini日本リージョン対応状況は世代ごとに要確認
Oracle DB資産活用＋ OSS系モデルを大阪で完結＋コスト最優先	OCI Generative AI	gpt-oss/Llama/Grokを大阪でホスト、ZDRエンドポイント、OpenAI互換APIキーで移行容易。Gemini系はGoogle外部呼び出しのため国内完結要件には不適
ソブリンAI・日本専用クラウド要件（Oracle Alloy）	OCI Generative AI ＋ Oracle Alloy	富士通Alloy（NRI/Fujitsu/NTT Data/SoftBank/NS Solutions）でソブリン要件を満たしたAI推論が可能

まとめ

4サービスはいずれもISMAP登録・ガバメントクラウド採択済みで「政府・金融が使えない」サービスはない。選定の実質的な差は次の3点に集約される。

① 使いたいモデル：GPT-5.x系を最速で使いたい → Azure AI Foundry一択。Claude・LlamaをAWSエコシステムで使いたい → Bedrock。Gemini自社モデルを使いたい → Vertex AI。gpt-ossを大阪でOSSとして使いたい → OCI。

② データレジデンシー要件の厳しさ：「推論処理も日本国内のみ」という最厳格要件 → BedrockのJP Geo CRISかOCI大阪（OCIホストモデル限定）。AzureとVertexはリージョン内処理を保証しにくいケースがある。

③ 既存クラウド資産：多くの企業にとって「今使っているクラウドのAI推論サービス」が最初の選択肢になることが多い。マルチクラウド戦略では、モデルごとに使い分ける「ベストモデル選択」アプローチも現実的だ。

※本記事は2026年6月時点の公式ドキュメント・二次情報に基づく。モデルラインナップ・料金・リージョン対応は週次で変動するため、本番採用前に各社公式ページで最新情報を必ず確認すること。OCI Generative AIの一部料金は動的読み込みのため二次情報に依拠している箇所があり要確認。

情報セキュリティばんざい！

月曜日, 6月 22, 2026

マネージドAI推論プラットフォーム徹底比較：Amazon Bedrock / Azure AI Foundry / Google Vertex AI / OCI Generative AI（2025〜2026年6月版）