クラウド上で生成AIを本番利用する際、インフラ運用を意識せずに多様なLLMを呼び出せる「マネージドAI推論プラットフォーム」の重要性が急速に高まっている。2026年6月時点で主要プレイヤーとなっているのが、Amazon Bedrock・Azure AI Foundry・Google Vertex AI・OCI Generative AIの4サービスだ。本記事では、対応モデル・料金・日本リージョン/主権AI対応・RAG/エージェント機能・セキュリティ・市場シェアの6軸で徹底比較する。
1. サービス概要と位置づけ
まず4サービスの基本的な立ち位置を整理する。いずれも「APIを叩けば複数のLLMを呼び出せるマネージドサービス」という点では共通だが、強みの方向性は大きく異なる。
| 項目 | Amazon Bedrock | Azure AI Foundry | Google Vertex AI | OCI Generative AI |
|---|---|---|---|---|
| 提供元 | Amazon Web Services | Microsoft | Google Cloud | Oracle Cloud Infrastructure |
| 最大の強み | モデルの幅・AWSエコシステム統合・JP Geo推論 | OpenAI最新モデルへの最速アクセス・M365統合 | Gemini自社モデル・MLOps・BigQuery統合 | Oracle DB統合・コスト・ZDR・ソブリンAI |
| 主な対象ユーザー | AWS中心の企業・金融・公共 | Microsoft/Azure中心・Office利用企業 | GCP利用企業・データサイエンス重視 | Oracle DB資産保有・コスト重視・規制業界 |
| 旧名称/統合経緯 | —(2023年4月GA) | 旧Azure AI Studio + Azure OpenAI Serviceを統合(2024年) | 2026年Cloud NextでGemini Enterprise Agent Platformへ統合 | —(2024年1月US GA、同年12月大阪提供開始) |
2. 対応モデル・LLMラインナップ
モデルの選択肢はサービスの根幹だ。4社の提供モデルを比較する。
| カテゴリ | Amazon Bedrock | Azure AI Foundry | Google Vertex AI | OCI Generative AI |
|---|---|---|---|---|
| 自社ファーストパーティ | Amazon Nova(Micro/Lite/Pro/Premier) | OpenAI GPT-5.1/GPT-4o/o系/Phi-4シリーズ(Microsoft独占契約) | Gemini 2.5 Pro/Flash/Flash-Lite、Gemini 3.x系、Imagen、Veo | なし(マルチプロバイダー特化) |
| Anthropic Claude | Opus 4.6/4.7、Sonnet 4.5/4.6、Haiku 4.5(東京・大阪) | Claude系はModel Catalog経由で一部提供 | Model GardenでClaude Opus/Sonnet/Haikuを一級市民として提供 | 非対応(2026年6月時点) |
| Meta Llama | Llama 3.3 70B、Llama 4系 | Llama 3系 | Model GardenでLlama対応 | Llama 3.3/4 Maverick/Scout(大阪で提供) |
| Cohere | Command R+ | 一部提供 | Model Garden経由 | Command A(256Kコンテキスト)、Command A Vision/Reasoning(大阪) |
| xAI Grok | — | Grok系をModel Catalog経由で提供 | — | Grok 4系(OCI DCでホスト、大阪対応) |
| OpenAI gpt-oss(オープンウェイト) | 2025年9月〜。ただし東京での日本国内限定提供は未確認。 | gpt-5.1など最新クローズドモデルが主力 | — | gpt-oss-120b/20b(大阪でGA、2025年12月〜)。OpenAI互換APIキーで接続可能 |
| Mistral | Large 2、Ministral 3B等 | 各種Mistralモデル | Model Garden経由 | 一部提供 |
| 総モデル数 | 15社以上のプロバイダー | 11,000以上(コミュニティ含む) | 200以上(Model Garden) | 十数モデル(厳選型) |
⚠️ 注意:Azure AI FoundryでのOpenAIモデルは「Microsoft FoundryモデルとしてAzureが販売」する形態と「パートナー・コミュニティモデル」に分かれる。最新GPT系は前者(Azure直販)、その他はModel Catalog経由。モデルのリージョン提供状況は頻繁に変わるため、本番採用前に公式ドキュメントを要確認。
3. 料金・コスト構造
代表的なモデルの料金(2026年6月時点、オンデマンド、100万トークンあたりUSD)を比較する。なお料金は頻繁に変動するため、本番採用前は各社公式ページで最新値を必ず確認すること。
| モデル | 入力($) | 出力($) | 経由サービス | 備考 |
|---|---|---|---|---|
| Claude Sonnet 4.5/4.6 | $3.00 | $15.00 | Bedrock / Vertex AI | 200K超は2倍料金。JP Geo使用時は+10%(Bedrock) |
| Claude Opus 4.6/4.7 | $5.00 | $25.00 | Bedrock | JP Geo(日本国内限定)は未対応。グローバルCRISのみ |
| Claude Haiku 4.5 | $1.00 | $5.00 | Bedrock / Vertex AI | JP Geo対応(Sonnet 4.5と同様) |
| Gemini 2.5 Pro | $1.25(200K以下)/ $2.50(200K超) | $10.00(200K以下)/ $15.00(200K超) | Vertex AI | 推論トークンも出力として課金される点に注意 |
| Gemini 2.5 Flash | $0.30 | $2.50 | Vertex AI / Gemini API | — |
| Gemini 2.5 Flash-Lite | $0.10 | $0.40 | Vertex AI / Gemini API | 主要モデルで最安値クラス |
| Gemini 3.5 Flash(新) | $1.50 | $9.00 | Vertex AI / Gemini API | 2026年5月19日リリース。コーディング・エージェント性能改善 |
| GPT-4o | $2.50 | $10.00 | Azure AI Foundry | Global Standard料金。Data Zone/Standardは異なる場合あり |
| GPT-4.1 | $2.00 | $8.00 | Azure AI Foundry | 1Mトークンコンテキスト。GPT-4oより若干安価 |
| Amazon Nova Pro | $0.80 | $3.20 | Bedrock | AWS自社モデル。マルチモーダル対応 |
| Amazon Nova Micro | $0.035 | $0.14 | Bedrock | 全主要プロバイダー中最安値クラス |
| Llama 3.3 70B(Bedrock) | $0.72 | $0.72 | Bedrock | 入出力均一料金 |
| OCI gpt-oss-120b | 約$0.15 | — | OCI Generative AI(大阪) | ※二次情報。公式価格ページで要確認 |
| OCI Cohere Command(旧世代) | 文字課金(1文字=1トランザクション) | — | OCI Generative AI | 新モデルはトークン課金に移行中 |
💡 コスト最適化のポイント:バッチ推論は各社50%割引。プロンプトキャッシュはBedrock/Vertexで最大90%削減。OCI gpt-ossは大阪リージョンでOpenAI互換APIキーを使えば、ベースURLを変えるだけでアクセス可能(2026年1月〜)。プロビジョンドスループット(Bedrock)・PTU(Azure)は月150〜200Mトークン超で損益分岐となる場合が多い。
4. 日本リージョン・主権AI対応
日本の金融・公共・製造業では「データを国内処理する」要件が重要だ。各社の対応状況を詳細に確認する。
| 項目 | Amazon Bedrock | Azure AI Foundry | Google Vertex AI | OCI Generative AI |
|---|---|---|---|---|
| 日本リージョン | 東京(ap-northeast-1)/ 大阪(ap-northeast-3) | 東日本(Japan East) | 東京・大阪リージョンあり | 大阪(Japan Central)のみ。東京はGenerative AI未提供 |
| 日本国内推論完結 | JP Geo CRIS対応(Claude Sonnet 4.5・Haiku 4.5のみ)。東京↔大阪のみでルーティング。Opus系は国内限定未対応 | Japan Data Zoneなし。最新モデルはGlobal Standard(全世界ルーティング)またはData Zone(EU/US)経由が多い | 「ML Processing in Japan」を訴求。Gemini世代によって日本リージョン未対応のケースあり(要確認) | 大阪でOCIホストモデル(gpt-oss/Llama/Grok/Cohere)は国内完結。ただし大阪のGemini 2.5 Pro/Flashは外部呼び出し(Google Asia Pacific経由)で国内完結ではない |
| ISMAP登録 | ✅ 登録済み(2021年3月〜、更新継続) | ✅ Azure OpenAI Service ISMAP登録済み(2024年2月) | ✅ Vertex AI ISMAP登録済み | ✅ OCI ISMAP登録済み(2021年6月) |
| ガバメントクラウド | ✅ 採択済み(令和4年度〜) | ✅ 採択済み(令和4年度〜) | ✅ 採択済み(令和4年度〜) | ✅ 採択済み(令和4年度〜) |
| 主権AI・ソブリンクラウド | JP Geo CRISがデータレジデンシー要件に対応。SCP/IAMで国内強制可能 | 日本向けソブリン構成は非公式。Azure Sovereignは特定国向け | 国内処理完結を訴求するが、モデル世代ごとに要確認 | ZDR(ゼロデータ保持)エンドポイント、専用AIクラスタ、富士通・NTTデータとのOracle Alloyソブリンクラウドで差別化 |
| 日本向け投資 | 2027年までに2.26兆円を東京・大阪インフラに投資予定(2024年1月発表) | 日本でのデータセンター拡張継続中 | 東京・大阪リージョン継続強化 | 富士通・NTTデータ・NRI・SoftBank・NS SolutionsとOracle Alloy展開中 |
⚠️ ファクトチェック重要注意:BedrockのJP Geo(日本国内クロスリージョン推論)はClaude Sonnet 4.5・Haiku 4.5のみ対応(2026年6月時点)。Claude Opus 4.7は東京リージョンで利用可能だが、JP Geo(日本国内限定ルーティング)は未対応で、グローバルCRISまたはシングルリージョン利用となる。また、OCI大阪でのGemini 2.5 Pro/Flashは推論がGoogleのAsia Pacific設備で処理されるため、日本国内完結とはならない点に注意が必要。
5. RAG・エージェント機能
単なるLLM呼び出しを超えた「RAG構築」「エージェント」「ワークフロー自動化」機能が各社の差別化点になっている。
| 機能カテゴリ | Amazon Bedrock | Azure AI Foundry | Google Vertex AI | OCI Generative AI |
|---|---|---|---|---|
| RAG・ナレッジベース | Knowledge Bases(Managed/Self-managed)。S3 Vectorsでベクトルストアコスト最大90%削減 | Foundry IQ(SharePoint/Fabric/Bing grounding)、Azure AI Search統合 | RAG Engine(GA)、Vertex AI Search(現Agent Search)、Vector Search | ベクトル検索、NL2SQL(SQL Search)、OCI Responses APIのFile Search |
| エージェント機能 | Bedrock AgentCore(Runtime/Gateway/Memory/Identity/Browser/Code Interpreter)、Bedrock Flows | Foundry Agent Service、Microsoft Agent Framework(2025年12月〜) | Agent Builder(ADK+Agent Engine)、100以上のコネクタ | OCI Generative AI Agents(大阪:2025年4月〜)、ホスト型エージェント |
| MCP対応 | ✅ AgentCore Gateway経由でMCP対応 | ✅ 1,400以上のMCP対応ツール、Toolbox(MCP互換エンドポイント) | ✅ MCP対応(A2Aプロトコルも提唱・Linux Foundationへ寄贈) | ✅ OCI Responses APIのMCP Calling対応 |
| マルチエージェント・A2A | ✅ A2A対応、LangChain/CrewAI/LlamaIndex/Strands統合 | ✅ A2A対応、Entra Agent ID(エージェントID管理) | ✅ A2Aプロトコル(Googleが提唱) | マルチエージェント構成可能だがA2A対応は限定的(要確認) |
| OpenAI互換API | —(独自SDK/API) | ✅ Azure OpenAI Service互換 | —(独自SDK) | ✅ OCI Generative AI APIキー(2026年1月〜)でOpenAI互換、ベースURL変更だけで移行可能 |
6. セキュリティ・コンプライアンス
| 項目 | Amazon Bedrock | Azure AI Foundry | Google Vertex AI | OCI Generative AI |
|---|---|---|---|---|
| 認証・認可 | IAM、PrivateLink(VPCエンドポイント) | Entra ID/RBAC、Private Networking(BYO VNet) | IAM、VPC Service Controls | IAM、専用AIクラスタ(テナンシー専有GPU) |
| プロンプト保護・ガードレール | Bedrock Guardrails(コンテンツフィルタ・PII・プロンプトインジェクション対策・Automated Reasoning checks) | Content Safety、Azure AI Guardrails(XPIA対策含む)、Purview連携 | Model Armor(プロンプトインジェクション対策)、Content filters | OCI Guardrails、ZDRエンドポイント |
| 主要認証 | SOC2、ISO 27001/27017/27018、HIPAA、GDPR、CSA STAR Level 2、FedRAMP High(GovCloud) | SOC2、ISO、HIPAA、HITRUST、FedRAMP High | SOC2、ISO 27001、HIPAA、FedRAMP High(2025年3月取得) | SOC2、ISO、PCI DSS、FISC安全対策基準、3省ガイドライン、政府統一基準、FedRAMP |
| ISMAP | ✅(157サービス、東京・大阪含む) | ✅(Azure OpenAI Service) | ✅ | ✅(2021年6月〜) |
| 学習データ利用 | デフォルトでモデル学習に使用しない | デフォルトでモデル学習に使用しない | 有償API利用時はモデル改善に使用しない | ZDRエンドポイント利用でデータ保持ゼロ |
💡 ISMAP生成AIの重要動向(2026年1月):ISMAPポータルが「生成AIサービスに関する留意点」を公表。Bedrock・Vertex AI・Azure OpenAI等の開発基盤がISMAP登録対象範囲に含まれていれば、その上で動く個々のLLMモデル(Claudeなど)は個別のISMAP登録が不要と整理された。政府機関が生成AIを調達しやすくなった点で、エンタープライズ向けに大きな意味を持つ。
7. 市場シェア・普及状況
クラウドインフラ市場(IaaS+PaaS)のシェアは、Synergy Research Group 2025年Q3時点でAWS 29%、Microsoft Azure 20%、Google Cloud 13%(上位3社で約62%)。生成AI市場の成長率はGartner予測で2025年に+76.4%(支出$644B)に達するとされる。エンタープライズAI推論プラットフォームは「Bedrock(モデル幅)」「Azure(OpenAI深度+Microsoft統合)」「Vertex(ML/MLOps+BigQuery)」の三つ巴で、OCIはOracle DB統合・コスト・主権AIで独自ポジションを確立している。
日本国内では、ソニーグループがBedrock AgentCoreで全社Agenticプラットフォームを構築、ベネッセ・パナソニックコネクト・宮崎銀行等がAzure OpenAIを採用、みずほ銀行はOracle Autonomous AI Databaseを共通データベース基盤に採用するなど、各社に有力な採用事例がある。
8. 選定推奨:どのサービスを選ぶべきか
| こんな要件なら | 推奨サービス | 理由 |
|---|---|---|
| AWS中心の企業 + 日本国内データ完結必須(金融・公共) | Amazon Bedrock | JP Geo CRIS(Claude Sonnet 4.5/Haiku 4.5)でデータが東京↔大阪のみ。IAM/SCPでリージョン強制可能 |
| Microsoft 365/Azure中心 + OpenAI最新モデルを優先利用 | Azure AI Foundry | GPT-5.1等の最速アクセス。ただしJapan Data Zoneなし。データレジデンシー要件がある場合は処理ロケーションを事前検証すること |
| Google Cloud/BigQuery中心 + MLOps・データパイプライン重視 | Vertex AI | FedRAMP High取得済み(2025年3月)、BigQuery・Workbench・Data Catalogとのシームレスな統合。Gemini日本リージョン対応状況は世代ごとに要確認 |
| Oracle DB資産活用 + OSS系モデルを大阪で完結 + コスト最優先 | OCI Generative AI | gpt-oss/Llama/Grokを大阪でホスト、ZDRエンドポイント、OpenAI互換APIキーで移行容易。Gemini系はGoogle外部呼び出しのため国内完結要件には不適 |
| ソブリンAI・日本専用クラウド要件(Oracle Alloy) | OCI Generative AI + Oracle Alloy | 富士通Alloy(NRI/Fujitsu/NTT Data/SoftBank/NS Solutions)でソブリン要件を満たしたAI推論が可能 |
まとめ
4サービスはいずれもISMAP登録・ガバメントクラウド採択済みで「政府・金融が使えない」サービスはない。選定の実質的な差は次の3点に集約される。
① 使いたいモデル:GPT-5.x系を最速で使いたい → Azure AI Foundry一択。Claude・LlamaをAWSエコシステムで使いたい → Bedrock。Gemini自社モデルを使いたい → Vertex AI。gpt-ossを大阪でOSSとして使いたい → OCI。
② データレジデンシー要件の厳しさ:「推論処理も日本国内のみ」という最厳格要件 → BedrockのJP Geo CRISかOCI大阪(OCIホストモデル限定)。AzureとVertexはリージョン内処理を保証しにくいケースがある。
③ 既存クラウド資産:多くの企業にとって「今使っているクラウドのAI推論サービス」が最初の選択肢になることが多い。マルチクラウド戦略では、モデルごとに使い分ける「ベストモデル選択」アプローチも現実的だ。
※本記事は2026年6月時点の公式ドキュメント・二次情報に基づく。モデルラインナップ・料金・リージョン対応は週次で変動するため、本番採用前に各社公式ページで最新情報を必ず確認すること。OCI Generative AIの一部料金は動的読み込みのため二次情報に依拠している箇所があり要確認。
0 件のコメント:
コメントを投稿