月曜日, 5月 18, 2026

Agentic SRE 元年の全貌:クラウドAI DevOps/SREエージェント包括比較レポート(2026年5月)

 

はじめに:2026年は「Agentic SRE元年」

2026年は後から振り返ったとき、確実に「Agentic SRE元年」と呼ばれる年になるだろう。

AWS DevOps Agent(2026年3月GA)、Azure SRE Agent(2026年3月GA)、Google Gemini Cloud Assist(Google Cloud Next '26で大幅刷新)が、いずれも実運用可能なフェーズに入った。サードパーティ側でもDatadog Bits AI SREが2025年12月にGA、incident.io AI SRE、Rootly AI、PagerDuty SRE Agentが立て続けに登場し、観測・インシデント管理・CI/CD領域に自律エージェントが浸透している。

背景にはMCP(Model Context Protocol)のLinux Foundation寄贈(2025年12月)とGoogle A2Aの150組織超への拡大があり、マルチエージェント協調の標準プロトコルが事実上確立されたことが大きい。


第1章:AWS DevOps Agent — Bedrock AgentCore基盤の本命

発表と展開

AWS DevOps AgentはAmazon Bedrock AgentCore上に構築された自律SREエージェントで、2025年12月2日のre:Invent 2025プレビュー発表を経て、2026年3月31日にGAとなった。

GA時点で対応リージョンは6拠点に拡大した:

  • us-east-1(バージニア北部)
  • us-west-2(オレゴン)
  • eu-central-1(フランクフルト)
  • eu-west-1(アイルランド)
  • ap-southeast-2(シドニー)
  • ap-northeast-1(東京)★

東京リージョン(ap-northeast-1)がGA初日から対応しており、大阪リージョン(ap-northeast-3)は2026年5月時点で未対応。日本企業にとってはAWSが最もすぐ使いやすい選択肢となっている。

アーキテクチャと機能

中核はTriage Agent / RCA Agent / Mitigation Agent / Evaluation Agentから成るマルチエージェント構造。各エージェントはCloudWatchアラーム・PagerDuty・Dynatrace Problem・ServiceNowチケット・Webhookで起動する。

自律性は「Human-in-the-loop」設計を厳守しており、エージェントは調査・分析・緩和計画生成までは自律的に行うが、AWS環境に直接変更を加えない設計になっている。代わりに「agent-ready spec」を生成し、コーディングエージェントのKiroに引き渡して実装するワークフローが標準となっている。

実績数値(AWS公式発表)

指標数値
MTTR短縮(最大)75%
調査速度向上80%
根本原因特定精度94%
Western Governors University 解決時間2時間 → 28分(77%短縮)

統合とエコシステム

GA時点で対応する主要ツール:

  • オブザーバビリティ: Datadog、Dynatrace、New Relic、Splunk、Grafana(ビルトインMCPサーバー)
  • インシデント管理: PagerDuty、ServiceNow
  • CI/CD: GitHub Actions、GitLab CI/CD、Azure DevOps
  • マルチクラウド: Azure / Azure DevOpsおよびオンプレミスがGAで追加

Azure / Azure DevOps対応をGA時点で正式追加した点は、AWSがマルチクラウド戦略を本格的に打ち出したシグナルとして重要だ。

料金体系

$0.0083 / agent-second(約$29.88/時間)

小規模利用(月10件×8分): $39.84/月
エンタープライズ(月500件×8分+評価): $2,290.80/月

新規顧客向け無料トライアル(2か月間):月あたり10 agent spaces / 20時間調査 / 15時間評価 / 20時間オンデマンドSREタスク。

AWSサポートプラン(Business Support+、Enterprise Support、Unified Operationsプラン)契約者は、プラン内のクレジットが利用料に充当される形で提供される。


第2章:Azure SRE Agent — Microsoftの自社実績が証明する本番力

発表と展開

2025年5月のMicrosoft Build 2025で発表、2025年9月1日に課金開始、2026年3月10日にGAとなった。

Microsoftが最も重要な差別化要素として掲げるのが自社での本番運用実績だ:

指標数値
社内稼働エージェント数1,300超
自律処理したインシデント数35,000超
削減した運用工数月20,000時間以上
Azure App Serviceでの緩和時間改善40.5時間 → 3分

これらはすべてMicrosoft自社環境での実績であり、外部顧客の標準ベンチマークではない点に留意が必要だが、実運用の説得力は業界随一だ。

AAU料金モデル

Azure SRE Agentの課金体系は独特の「Azure Agent Unit(AAU)」方式を採用している:

  • Always-on flow(常時稼働): 4 AAU/agent-hour(固定)
  • Active flow(作業中): 2026年4月15日以降、トークンベース課金に移行
  • 1 AAU ≈ $0.10(米国リージョン参考値)

試算:

エージェント1個のベースライン: 4 AAU × 730時間 × $0.10 = $292/月

無料枠は存在せず、エージェント作成時点から課金が始まる設計はAWS DevOps Agent(無料トライアルあり)と対照的だ。

機能と自律性設計

3段階の自律性から選択できる:

  1. Reader(読み取りのみ)
  2. Approval-gated(承認付き実行)
  3. Privileged(ガードレール内自律)

デフォルトは承認ゲート方式で、Deep Context・Code Interpreter(Python実行)・Memory and learning・no-codeサブエージェントビルダー・Skills・Agent hooksを備える。

注目:クロスクラウド連携

AWS MCP Serverを通じたクロスクラウド調査が実現しており、EC2・EKS・Lambda・RDSを横断して調査できる。AWS DevOps Agentとのエージェント間連携も可能だ。

リージョンと日本市場

対応リージョンはEast US 2 / Sweden Central / Australia Eastの3リージョンのみで、日本リージョンは2026年5月時点で未対応。日本顧客はAustralia Eastに配置して日本のリソースをリモート管理する形になる。また公式UIの言語は英語のみとなっており、日本企業の導入判断において重要な検討事項だ。


第3章:Google Gemini Cloud Assist と OCI

Google Cloud Next '26で進化したGemini Cloud Assist

2026年4月のGoogle Cloud Next '26でGemini Cloud Assistは大きく刷新された。主な発表内容は以下の4点:

  1. Application Design Centerの再設計と自律エージェント化
  2. gcloud / kubectl / Terraform自動化エージェント
  3. 24時間体制のFinOpsコスト異常検知エージェント
  4. Cloud Assist自体をMCPサーバーとして公開(IDE / CLI / ServiceNow / Slack等から利用可)

ただし、インシデント調査の核心機能であるCloud Assist Investigationsは現在も制限付きアクセスが続いている。2026年4月10日以降はPremium Support契約保有者または個別申請者のみアクセス可能となり、エンタープライズ採用の入り口は狭まっている。

Gemini Cloud Assistの制約

  • 料金: Gemini Code Assist Enterprise経由($54/ユーザー/月、年契約$45/ユーザー/月)
  • 分析対象: Google Cloud内のリソースのみ。AWS / Azure / オンプレミスリソースの直接的なRCAはサポート対象外
  • Gemini CLI: OSSとしてApache 2.0ライセンスで無料配布

マルチクラウド対応の弱さが、AWS・Azureとの最大の差別化要因(不利な方向で)となっている。

OCI:専用製品なし、参照実装あり

OCIには「専用SRE AIエージェント」製品は2026年5月時点で存在しない。

Oracle AI Agent StudioはFusion Applications(ERP/HCM/SCM/CX)向けの業務エージェントプラットフォームであり、SRE用途ではない。

代わりに、Oracle公式が2026年4月27日に公開した「kagent + OCI Generative AI on OKE」アーキテクチャが事実上のリファレンス実装となっている。kagentはSolo.io(Istioの創設者)が開発したKubernetesネイティブAIエージェントOSSで(Apache 2.0)、CNCFへの寄贈後も活発に開発が続いている。


第4章:ハイパースケーラー3社の機能比較

比較軸AWS DevOps AgentAzure SRE AgentGoogle Gemini Cloud Assist
GA時期2026年3月31日2026年3月10日Investigations含めアクセス制限中
対応リージョン6拠点(東京含む)3拠点(日本未対応)グローバル(制限付き)
基本料金$0.0083/agent-second4 AAU/hour + トークン課金Code Assist Enterprise $45-54/ユーザー/月
無料枠2か月トライアルありなしアクセス制限中は個別申請
自律性HITL固定(変更は人間承認)3段階選択可明示承認必須
マルチクラウドAzureとオンプレGA対応AWS MCP Server経由Google Cloud内のみ
日本リージョン✅ 対応済(東京)❌ 未対応グローバル(制限付き)
MCP対応ファーストクラスファーストクラスCloud AssistをMCPサーバーとして公開
主要実績WGU:77% MTTR短縮App Service:40.5時間→3分Next '26で多数事例発表

日本市場の観点では、AWS DevOps Agentが東京リージョン対応で最も導入障壁が低い。 Azure SRE Agentは実績・機能面で充実しているが、日本リージョン未対応と英語UIが課題。Gemini Cloud AssistはマルチクラウドサポートとアクセスがPremium Support必須の制約が選択を左右する。


第5章:オブザーバビリティ各社 — Datadogが先行GA

Datadog Bits AI SRE(GA済:2025年12月2日)

オブザーバビリティ5社の中で唯一完全GAに達しているのがDatadog Bits AI SREだ。DASH 2025(2025年12月2日、ラスベガス)で一般公開された。

料金

  • 年契約プラン:$500 / 20調査 / 月(1調査あたり約$25)
  • 月次プラン:$600 / 20調査 / 月
  • 完了した調査のみ課金、未完了は無料という珍しいモデル

Datadog MCP Serverは2026年3月9日にGAし、Claude Code・Cursor・Codex・GitHub Copilot・Kiroから接続可能になった。AWS DevOps Agentとの連携プレビューも進行中で、エコシステムの中心的な位置を占めつつある。

GA後は推論深度2倍・速度約2倍に強化され、ソースコード・RUM・Database Monitoring・Continuous Profilerまで解析対象が拡大している。

Dynatrace Intelligence(2026年1月発表)

Dynatrace Intelligenceは2026年1月28日のPerform 2026(ラスベガス)で発表された。「Deterministic AIとAgentic AIの融合」という独自路線が特徴だ。

Dynatrace自身のベンチマーク結果(独立検証は未実施):

  • 問題解決成功率:最大12倍
  • 解決速度:最大3倍
  • トークンコスト:半減

Operator Agent + SRE/Dev/Security専門エージェントの構成で、Davis CoPilotは「Dynatrace Assist」にリブランドされた。

New Relic SRE Agent(2026年2月24日発表、Preview)

New Relic Advance 2026(2026年2月24日)でSRE AgentとAgentic Platformを発表した。いずれもPreviewステータスだが注目点が多い。

  • 2026 AI Impact Report:AI機能利用ユーザーのインシデント解決時間が非利用ユーザー比で25%高速化
  • 「no incremental spend」で既存APMの上にネイティブ提供するコスト設計が差別化要素

Grafana Assistant(GA:2025年10月8日)

Grafana Labsは2025年10月8日のObservabilityCON 2025でGrafana AssistantをGAとし、Assistant InvestigationsをPublic Previewとして発表した。

OSS(Apache 2.0)でGrafana LLM PluginとMCP Server(Prometheus / Loki / Tempo / Pyroscope対応)を公開する独自路線で、Free階層でも利用可能な点が他社との差別化要素。

Splunk / Cisco(統合移行期)

CiscoによるSplunk買収(2024年3月クローズ)後の統合が進む。.conf25ではCisco Data FabricCisco AI Canvas(Splunk Cloud Platform統合、2026年提供予定)を発表。ただしForresterからは「競合の後追い」と指摘されており、主要機能の本番展開はまだ先の状況だ。


第6章:インシデント管理・AIOps — 業界再編の波

2025年の大型買収・統合

2025年はインシデント管理スタートアップが大手プラットフォームに吸収された年だった:

日付買収金額等
2025年3月3日SolarWinds → Squadcast買収-
2025年3月10日ServiceNow → Moveworks買収$2.85B
2025年12月15日Freshworks → FireHydrant買収クロージングは2026年Q1

独立系スタートアップ:incident.io と Rootly

incident.ioは2025年4月10日に$62M Series B(評価額$400M、累計$96M)を調達し、AI SRE機能を開発。「インシデント対応の最初の80%を自動処理」を謳うマルチエージェント・オーケストレーションを実装し、「Code it up」ボタンによるPRドラフト機能も備える。

Rootlyは2025年3月12日にAPIをAgent-First設計に刷新。AI-Assist → AI-Automate → AI-Autonomy(自己治癒)の3段階ロードマップを提示している。

PagerDuty AIエージェントスイート

2025年10月8日、PagerDutyは業界初を謳うエンドツーエンドAIエージェントスイートを発表した(SRE Agent / Scribe Agent / Shift Agent / Insights Agent)。早期導入顧客で最大50%のMTTR短縮を公表している。

ServiceNow Yokohama / Zurich

ServiceNow Yokohama(2025年3月GA)でAI Agent OrchestratorとAI Agent Studioが正式提供開始。Zurich(2025年10月)でAI Control Tower / Agent Fabricを追加し、Pro Plus / Enterprise Plusライセンスへの同梱方式に転換した。

その他注目動向

  • Opsgenie:2025年6月4日に新規購入停止、2027年4月5日に完全EOL確定。JSM Operations(Atlassian Rovo Ops agent搭載)またはCompassへの移行が必須
  • BigPanda:2025年11月10日にVelocityを買収し、Agentic ITOpsプラットフォームへ進化
  • Moogsoft(旧名):現在はDell APEX AIOps。2024年5月にリブランド済み(IBMではなくDell Technologiesが買収)
  • OpsRamp(HPE傘下):GreenLake Intelligence「agentic command center」として再定位

第7章:DevOps/CI-CD と MCPエコシステムの加速

GitHub Copilot

GitHub Copilot Coding Agentは2025年5月19日(Microsoft Build 2025)のPublic Preview公開を経て、順次有償プランへ展開が進んでいる。VS Code内のAgent ModeはSWE-bench Verifiedで**pass rate 56.0%(Claude 3.7 Sonnet使用)**を記録。

GitHub Universe 2025ではAgentHQを発表し、開発者が独自エージェントを構築・デプロイできるエコシステムに進化した。

GitLab Duo Agent Platform

2025年7月17日にPublic Betaが開始。Credit Pooling方式の課金(Claude Sonnet-4で2 model requests/credit)により、チーム単位の予算管理が容易になった。GitLab 18系でIDE統合・Planner Agent / Security Analyst Agentを段階的に追加している。

Harness AI DevOps

2025 UnscriptedでAI DevOps Agent / SRE Agent / Release Agent / AppSec Agent / Test Agent / FinOps Agentを統合的に発表。Software Delivery Knowledge Graphを中核とした設計で、ベータ顧客でダウンタイム50%削減・テストサイクル80%削減の実績を公開。

MCPとA2A:標準プロトコルの確立

MCP(Model Context Protocol)の普及は急速で、Anthropic公式発表によると月間SDKダウンロードは2025年12月時点で9,700万に達した。

2025年12月9日、AnthropicはMCPをLinux FoundationのAgentic AI Foundation(AAIF)に寄贈した。AnthropicとOpenAI・Blockが共同設立者となり、Google・Microsoft・AWS・Cloudflareが支援する体制となっている。

Google A2A(Agent-to-Agent)プロトコルも2026年4月9日時点で150以上の組織が参加し、Linux Foundationガバナンスに移行した。IBM ACPもA2Aに統合され、業界標準としての地位を固めつつある。

**MCPは「ツール接続層」、A2Aは「エージェント間通信層」**として役割分担しながら、マルチエージェント協調の基盤が整いつつある。


第8章:市場動向とSRE職への影響

AI DevOps/SRE市場規模

MarketsandMarketsの「AI Agents Market」レポートによると:

  • 2025年市場規模:$7.84B
  • 2030年予測:$52.62B
  • CAGR:46.3%

なお同社の「Agentic AI Market」は別レポートで、より広義の数値($7.06B → $93.20B、2032年、CAGR 44.6%)となっている。

Gartnerの予測と警告

  • 2030年:Guardian Agent技術がAgentic AI市場の**10〜15%**を占有
  • 2027年末まで:Agentic AIプロジェクトの40%以上がキャンセル(コスト増・価値不明確・リスク管理不足が原因)

「79%の企業が導入済み」という調査(PwC, 2025)が広く引用される一方で、KPMG調査ではQ1 2025時点で実際にAIエージェントの導入を開始した企業は11%にとどまっており(Q3には42%に上昇)、期待と実態のギャップは今も大きい。

SRE職への影響

2025〜2026年にかけて、主要テック企業での人員削減が相次いだ:

  • Meta:2026年4月に全体の約10%(約8,000人)を削減
  • Microsoft:2025年5月に約6,000人、2025年7月に約9,000人(計約15,000人)を削減
  • Nadella CEOの発言(2025年4月29日、Meta LlamaCon):「一部のプロジェクトでは20〜30%のコードがAIによって書かれている」

Challenger, Gray & Christmasの2026年Q1レポートでは、テクノロジーセクターの削減は52,050人(全業種合計217,362人)と集計されている。

Acceleration Whiplash:加速の副作用

Google Cloud提供のDORA Report 2025では、開発者の90%がAIを業務利用し、80%超が生産性向上を実感していることが示された。

一方、Faros AIの「AI Engineering Report 2026」では、AI採用が進むにつれて:

  • PRレビュー時間:+441%
  • 開発者あたりのバグ数:+54%
  • PRあたりインシデント数:+242.7%

という「Acceleration Whiplash」現象が報告されており、速度の向上が品質・安定性に新たな圧力をかけている実態が浮き彫りになっている。

PagerDutyをはじめ各社は「AIエージェントはSREの代替ではなく増幅」「First responders → Architects of digital operations」という見解を示しているが、Lorin Hochstein(Surfing Complexity)のような識者からは「AI SREは多いがAI incident managerはまだ存在しない」という鋭い指摘もあり、業界議論は続いている。


結論:三層構造で進化するAgentic SRE市場

2026年5月時点で見えてきたのは、「クラウドネイティブ(AWS/Azure/GCP)」「オブザーバビリティ統合(Datadog/Dynatrace等)」「インシデント管理特化(incident.io/Rootly/PagerDuty)」の三層が並行して進化し、MCPとA2Aで相互接続する構造だ。

三層の役割分担

Layer 1: クラウドネイティブ(AWS DevOps Agent / Azure SRE Agent / Gemini Cloud Assist)
          → インフラ層との深い統合、マルチサービス調査の自動化

Layer 2: オブザーバビリティ(Datadog Bits AI SRE / Dynatrace Intelligence / New Relic SRE Agent)
          → テレメトリ分析の深度、クラウド横断の観測

Layer 3: インシデント管理(PagerDuty / incident.io / Rootly / ServiceNow)
          → ワークフロー自動化、チームコミュニケーション、後処理

これらがMCP/A2A経由で連携することで、「アラート検知 → 自動調査 → 修正コードPR作成 → ポストモーテム自動生成」というエンドツーエンドの自律インシデント対応が現実に近づいている。

完全自律は「まだ先」、HITL設計が現在の答え

各社共通して、Human-in-the-loopが業界共通の現実解となっている。Microsoft Azure SRE Agentが提唱した「4段階の自律性ラダー(読み取り→推奨→承認付き→ガードレール内自律)」が事実上の業界標準となりつつある。

Gartnerが警告する「40%のプロジェクトキャンセル」と、Faros AIが示す「Acceleration Whiplash」は、ガバナンス・コスト管理・人材育成が次の課題であることを示している。

日本市場のウォッチポイント

  • AWS DevOps Agent:東京リージョン対応済みで最も導入しやすい
  • Azure SRE Agent:日本リージョン対応時期が最大のウォッチポイント
  • Gemini Cloud Assist Investigations:GA時期とPremium Support要件の変化に注目
  • 日本語対応:各社とも基盤LLMは日本語対応だが、公式UIは英語主体

2026年下期から2027年上期にかけて、自社環境に最適なエージェントスタックを設計する時期に入った。ツール単体の評価から、「どのレイヤーにどの製品を置き、MCPでどう連携させるか」という設計思想の議論が、次の実務的な問いとなるだろう。


参考リンク

AWS DevOps Agent

Azure SRE Agent

Google Cloud

OCI

サードパーティ

標準化・市場動向

準大手LLM企業の2026年動向:生存戦略とソブリンAIの台頭

準大手LLM企業の2026年動向:生存戦略とソブリンAIの台頭

2026年5月作成|対象:Mistral AI、Cohere、xAI、Perplexity AI、Writer、AI21 Labs、Aleph Alpha、Stability AI ほか


1. 概観:市場構造の変容

2026年のLLM市場は、大手による支配の固定化準大手の分岐加速という二つの動きが同時進行している。

フロンティア競争は事実上、OpenAI・Google・Anthropic・Metaの4社に集約された。OpenAIのARRは約$20B(2025年実績)、AnthropicのARRは約$19B(2026年2月時点)に達しており、数百億ドルのインフラ投資が可能な企業でなければ汎用フロンティアモデルの競争に参加できない構造が固まりつつある。

一方で、この直下に位置する「準大手(Mid-tier)」企業群は、正面からのモデル規模競争を放棄し、以下の戦略軸に特化することで独自ポジションを構築している。

  • データ主権・ソブリンAI対応(Mistral AI、Cohere+Aleph Alpha)
  • エンタープライズ業務特化(Cohere、Writer)
  • 消費者向けインターフェースの置換(Perplexity AI)
  • 垂直統合型の超大規模インフラ競争(xAI)

同時に、DeepSeekに代表される中国発モデルの価格破壊により、「推論APIを売るだけ」のビジネスモデルは急速に成立しにくくなっている。


2. 推論コストの急落とDeepSeekの衝撃

2025〜2026年にかけて、推論APIのトークン単価は大幅に下落した。GPT-4投入時(2023年)の$20/Mトークン前後と比較すると、2026年時点の主要モデルの単価は以下のとおりである。

プロバイダー モデル 入力単価($/ 1Mトークン) 備考
DeepSeek V3.2-Exp(キャッシュヒット時) $0.07 MoE、Fine-Grained Sparse Attention採用
Google Gemini 2.5 Flash $0.15 高速推論特化
Mistral AI Mistral Large 3 参考値(公開APIの場合) 675B MoE、Apache 2.0
OpenAI GPT-5(旧:GPT-5.2) $15.00 汎用フロンティアモデル

※ 各社公式APIドキュメント・報道より

DeepSeekの2025年8月リリース「DeepSeek-V3.1」は、学習コスト約550万ドル(メガテックの1/100以下とされる)で高性能を達成し、業界の常識を覆した。その後継「V3.2-Exp」はハイブリッド思考モード(Thinking/Non-thinking切り替え)をツール利用に直接統合し、企業ユースケースでのROIをさらに高めている。

こうした環境下で、推論能力そのものを汎用APIとして販売するビジネスモデルは価格競争の底辺に向かいつつある。準大手各社が「エージェント化」「業務特化」「規制対応」へとピボットする背景には、この構造的圧力がある。


3. 主要企業の現状と見通し

3-1. Mistral AI(フランス)

概要:2023年設立、元DeepMind・Meta研究者による欧州最大の独立LLMラボ。欧州のデータ主権政策と強く連動した戦略を取る。

  • 2025年9月、ASMLを主要投資家に迎え評価額約$13.8B(€11.7B)で資金調達(CNBC、2025年9月)
  • ARR:2024年の約$30Mから2026年初頭に$400M超へ成長。同社CEOは2026年末に$1B ARRを目標として公言
  • 2026年3月、7行の銀行団から$830Mのデットファイナンスを調達。パリ近郊に44MW・GB300 GPU×13,800基のデータセンターを着工(CNBC、2026年3月)
  • 主要パートナー:SAP(仏独公共サービス向け展開協定)、CMA CGM(海運・€100M/5年)、AXA、BNP Paribas、Accenture(70万人規模)、Stellantis、Helsing(欧州防衛)、シンガポール国防省
  • Apple による買収観測が報じられた(The Information、2025年8月)が、Mistral CEOは否定

差別化戦略:EU AI Act(2026年8月本格適用)が課す高いコンプライアンスコスト(1モデルあたり年間約€29,277と試算)を逆用し、「EU域内で物理的・法的に完結するインフラ」として銀行・医療・防衛セクターを囲い込む。主力のMistral Large 3(675B MoE、Apache 2.0ライセンス、256Kコンテキスト)はフロンティアモデルと同等水準ではないが、エンタープライズの実用域では競争力を維持している。

リスク:フロンティアモデルとの性能格差拡大。フランス政府の保護的姿勢に依存している側面もあり、EU以外での展開は競争環境が異なる。

NTT DATAは2025年7月にMistralとグローバル戦略提携を発表(5カ国でCenter of Excellence設立)。日本市場ではNTT DATA経由の展開が主流となる見込み。

3-2. Cohere(カナダ)+Aleph Alpha(ドイツ)

概要:エンタープライズRAGとオンプレミス・プライベートデプロイに特化したカナダ発企業。2026年4月にドイツの独語圏ソブリンAI企業Aleph Alphaを統合した。

  • 2025年8月:AMD・Nvidia・Salesforce等から$500M調達、評価額$6.8B
  • 2025年9月:追加$100M調達、評価額$7B(TechCrunch)
  • 2026年4月:Schwarz Group(LIDLの親会社)が$600Mをリード、評価額$20B(Business Wire)
  • 2025年度ARR:$240M(前年比約4倍成長・粗利率70%)。2026年のARRはさらに$264.9Mと予測(TechCrunch、2026年2月)
  • 消費者向けプロダクトを一切持たず、収益の大部分がプライベートデプロイ。マルチクラウド+オンプレ対応が強み
  • Aleph Alpha統合により、独政府・Bundeswehr・BMW・Siemensとの顧客関係と、Schwarz傘下STACKITのソブリンクラウドインフラを獲得
  • エンタープライズワークフロープラットフォーム「North」を2025年夏に投入
  • SaabとのAerospace・防衛分野協業を2026年3月に発表
  • IPO体制構築:Uber出身CFO・Meta FAIR出身CAOを採用。CEO Aidan Gomezは2025年10月に「soon」とIPOを示唆
富士通との戦略提携(2024年7月)・Series D出資により、TakaneはCohereのCommand R+を基盤として開発された。2026年2月には中央省庁でのパブリックコメント処理(約12万字)の実証に成功し、FY2026商用展開へ。

3-3. xAI(米国)

概要:イーロン・マスクが設立した大規模AIラボ。2026年2月にSpaceXが全株式を買収し、合算評価額は$1.25兆と報じられた(Fortune、TechCrunch)。

  • 2026年1月:Series E $20Bクローズ(単独評価額$230B)。投資家にNvidia・Cisco・Fidelity・Qatar Investment Authority・サウジアラビアHUMAIN($3B)等
  • 財務状況(Bloomberg・Reuters報道、2026年1月):
    - 2025年Q3(7〜9月)の純損失:$1.46B、同期間の売上:$107M
    - 2025年1〜9月の現金支出:$7.8B(1日あたり約$28M)
    - 2025年通年の売上見通し:約$500M(Sacra)
  • キャッシュバーン:月約$10億規模(Bloomberg、2025年6月)。なお当初レポートに記載の「年140億ドル」は誤りで、正確には年$10〜13B規模(2025年計画値)
  • Colossus(メンフィス):H100/H200/GB200合計で推定約20万GPU規模。世界最大級のAIクラスターの一つ
  • Grok 4:Humanity's Last Exam(HLE)ベンチマークで一時50.7%を記録し首位(2025年7月)。ただしGPT-5・Claude 4 Opus・Gemini 3等の後発モデルで優位は縮小
リスク:
Grok Undressingコンテンツ問題:EU・米国・日本等で規制当局が調査。オランダ裁判所は生成停止命令を発出
反ユダヤ的投稿問題:2025年7月にGrokが差別的コンテンツを投稿し米議会でも問題に
マスクの政治的活動(DOGE等)による企業ガバナンスへの懸念が継続
・日本の公共・金融調達においては、これらの規制リスクが実質的な障壁となる可能性がある

3-4. Perplexity AI(米国)

概要:AI検索エンジンとして急成長し、検索×エージェントプラットフォームへのピボットを加速中。

  • 評価額:2025年9月の$200M調達時点で$20B(TechCrunch)、2026年初頭に$21.2Bへ上昇
  • ARR:2025年9月時点で約$200M、2026年3月には$450M超(FT報道、PYMNTS、2026年4月確認)。月次で50%急増
  • 月次アクティブユーザー:1億人超(企業顧客数万社)
  • AIブラウザ「Comet」を2025年7月に投入→10月に全世界無料化→11月Android→2026年3月iOS
  • Samsung Galaxy S26(2026年3月発売)への標準AIエージェント搭載
  • SoftBankと日本独占リセラー契約(2025年3月)
  • 2025年8月、Google ChromeブラウザへのM&A提案($34.5B)を表明(CNBC)
  • 2026年ARR目標:$656M(会社目標)
リスク:
・News Corp・BBC・Nikkei等のパブリッシャーとの著作権訴訟が継続
・$20B超の評価額に対してARRは$200〜450M(100倍前後の倍率)。成長が鈍化した際の評価修正リスク
・OpenAI Atlas・Google AI Modeとの正面衝突が激化

3-5. Writer(米国)

概要:Fortune 500企業向けの垂直統合型エンタープライズAIプラットフォーム。準大手の中で財務健全性が最も高い部類に入る。

  • 2024年11月、Series C $200M調達、評価額$1.9B(TechCrunch)
  • ARR:$100M超、NRR(ネットレベニューリテンション)160%
  • 主要顧客:Mars・Vanguard・Accenture・L'Oréal・Intuit・Qualcomm・Prudential(Fortune 500 250社超)
  • 自社モデル「Palmyra X4」を合成データ訓練で低コスト開発(開発コスト約$700Kと報告)
  • IPO準備:CFO・CRO・CMOにIPO経験者を採用。2026〜2027年のS-1提出が現実的なシナリオ

3-6. AI21 Labs(イスラエル)

概要:Mamba/Transformerハイブリッドアーキテクチャ「Jamba」で差別化する技術企業。

  • 2025年5月、Google・Nvidiaから$300M調達(SiliconANGLE)
  • Jambaの特徴:256Kコンテキストウィンドウを低コストで処理するハイブリッド設計
  • Nvidiaによる$2〜3Bでの買収を検討中と報道(SiliconANGLE、2025年12月)。独立継続は不透明な状況

3-7. Aleph Alpha(ドイツ)→ Cohere統合

独語圏ソブリンAIに特化したが、単独での事業規模は限定的だった。2026年4月にCohereに統合されたことで、事実上の独立企業としての歴史に幕を下ろした。CohereはこれによりSchwarz Group(STACKIT)のクラウドインフラと独政府・軍の顧客基盤を獲得した。

3-8. Stability AI(英国)

2023年の資金難・CEO交代を経て、2025〜2026年に再建が進行中。Sean Parker(会長)・James Cameron(取締役)・Prem Akkaraju(CEO、元Weta Digital)体制のもと、NVIDIA・WPP・Universal Music・Warner Musicとの提携を再構築。Stable Diffusion 3.5やSOC 2取得で信頼性の回復を図っている。


4. 各社比較サマリー

企業 評価額(最新) ARR 主戦略 IPO/M&A観測
Mistral AI $13.8B(2025年9月) $400M+(2026年初) 欧州ソブリン×OSS×自社DC 独立継続。買収観測は否定
Cohere+Aleph Alpha $20B(2026年4月) $240M(2025年度) エンタープライズRAG×独加ソブリン 2026〜2027年IPO有力
xAI $230B(単独、2026年1月) ~$500M(2025年通年) X統合×大規模インフラ×政府 SpaceX買収完了(2026年2月)
Perplexity AI $21.2B(2026年初) $450M+(2026年3月) AI検索→エージェント×デバイス組込 Apple/Meta買収候補とも観測
Writer $1.9B(2024年11月) $100M+ Fortune 500垂直特化 2026〜2027年S-1準備中
AI21 Labs 非公開($300M調達後) 非公表 Jamba技術(Mamba/Transformer) Nvidia M&A観測
Reka AI $1B+(2025年7月) 非公表 Snowflake統合×マルチモーダル Snowflake傘下化の可能性
Stability AI 非公開 非公開 画像・映像生成特化 再建中、独立継続

5. ソブリンAI:最大の成長機会

McKinsey(2026年3月)は、グローバルのソブリンAIワークロード市場が2030年までに年$600B規模に達すると試算している。準大手企業にとって、この市場は「大手が独占できない規制・言語・文化の複雑性」に守られた最大の事業機会である。

欧州:EU AI Actを競争防壁として活用

2026年8月から本格適用のEU AI Actは、企業のAIシステムに対して高いコンプライアンスコストを課す。試算によれば1モデルあたり年間約€29,277(堅牢性確保€10,733・人間の監視義務€7,764・文書化€4,390等)が必要とされ、違反時には最大€750万または全世界売上1.5%の制裁金が科される。

Mistralはこの状況を逆手に取り、「EU域内で法的・物理的に完結する処理」を保証するソブリンクラウドを提供することで、金融・医療・防衛の規制業種における米国大手の利用を抑制しようとしている。SAPとの仏独公共サービス展開協定(2025年11月)はその代表的な事例である。

中東:アラビア語圏のAI主権確立

UAEのG42/Inception(MBZUAI・Cerebras共同)は、2.6兆トークンのアラビア語コーパスで訓練した「Jais-2」を展開。Cerebrasのウェーハスケール・クラスター上で毎秒2,000トークンという高速推論を実現し、中東諸国にフロンティアレベルのAI能力を提供している。インドへの8エクサフロップスクラスター(Condor Galaxy India)輸出など、AIインフラ外交も展開している。

日本:国産AI整備と外資の囲い込みが交錯

  • デジタル庁「源内(Gennai)」:政府職員18万人向けのAIプラットフォームとして、国産LLM7社(tsuzumi 2、PLaMo 2.0 Prime、Takane 32B等)を選定(2026年3月)。2027年4月の本格展開を目指す
  • Japan AI Foundation Model Development:SoftBank・Sony・Honda・NEC・MUFG・SMBC・MizuhoがNEDO経由で1兆円・5年の国費投入の連合体を2026年4月に設立。Physical AI向けトリリオン・パラメータモデルを目指す
  • 外資の攻勢:Microsoftが2026〜2029年で日本へ$10Bの投資を発表(2026年4月)。SoftBankはPerplexity Enterprise Proの日本独占リセラーとして7,000名の法人営業を投入
  • Sakana AI:2025年11月にSeries B $135Mを調達(評価額$2.65B)。MUFG・大和証券・In-Q-Telが参画。進化型AI・モデルマージング手法で独自ポジションを確立

6. 業界再編の動向

消滅・再編事例(リバース・アクハイア)

2024〜2026年にかけて、独立を維持できなくなった準大手・中堅AI企業が相次いだ。単なるM&Aではなく、企業ごと買収せずに研究チームや特定技術のみを吸収する「リバース・アクハイア」が主流となっている。

  • Inflection AI:共同創業者のReid Hoffman・Mustafa Suleymanら主要メンバーがMicrosoftへ移籍(2024年)。残存事業はオンプレミスAIへ軸足を移し再建中
  • Adept AI:共同創業者らのチームがAmazonへ(2024年)
  • Character.AI:共同創業者Noam Shazeer(元Google)をはじめとするチームがGoogleへ復帰(2024年)
  • Thinking Machines Lab(Mira Murati設立):約$2Bのシード調達にもかかわらず、共同創業者を含む5名がMetaのSuperintelligence Labsへ移籍

FTCはこれらの手法を「Hart-Scott-Rodino報告義務を回避した実質的な企業支配」として調査を開始しており、今後規制強化の可能性がある。

人材争奪の激化

準大手企業にとって最大の持続リスクは、メガテックによる人材引き抜きである。数兆ドルの時価総額を誇る企業と同水準の株式報酬を提供し続けることは構造的に困難であり、キーパーソンの流出が開発ロードマップ全体に影響を及ぼす事例が増加している。


7. 準大手の競争優位が成立する条件

2026年時点の市場分析から、準大手LLM企業が独立して競争優位を維持できる条件は以下に収束する。

  1. データ主権・規制対応への適合:EU AI Act・各国のソブリンAI要件に準拠したインフラとガバナンスを提供できるか。大手テックは法的・政治的制約から、特定国のソブリン要件に完全に応えることが難しいケースがある
  2. エンタープライズROIの実証:「AI実験」から「業務改善の定量化」へ。特定ドメインでのARR成長・粗利率・NRRが評価指標となっている
  3. 資本効率:DeepSeekが示したように、モデル性能は必ずしも投入資本量に比例しない。アーキテクチャ最適化・合成データ活用・特化型微調整で大規模投資を避けられるか
  4. 強固なパートナーシップ:PFNのように独自ハードウェアを持つか、MistralやSakana AIのようにNVIDIA・国家インフラプロジェクトと深く結びつくか

逆に、「汎用的なLLM APIの再販」「特定の大手に強く依存しながら独自技術を持たないラッパー企業」は、価格競争と大手の値下げ攻勢の双方にさらされ、中期的な事業継続が困難になると予想される。


8. 日本国内の準大手・特化型LLM企業

企業 特徴 主な動向(2025〜2026年)
Preferred Networks(PFN) フルスクラッチ開発、独自AIチップ(MN-Core)、トヨタ出資 2026年3月に「PLaMo 3.0 Prime」詳細公開。Reasoning機能・64Kコンテキスト実装。GENIACプロジェクト選定
Sakana AI 進化型AI・モデルマージング、軽量・高効率モデル 2025年11月にSeries B $135M調達(評価額$2.65B)。NVIDIA・SoftBankとの連携、MUFG・大和証券・In-Q-Tel参画
NII(国立情報学研究所) 産学連携・オープンソース国産LLM 2026年4月に「LLM-jp-4」公開(12兆トークン学習、Apache 2.0ライセンス)。国産ベースラインモデルとして普及
Kotoba Technologies 音声AI・リアルタイム翻訳特化、元Meta研究者 音声間翻訳iOSアプリ「DOTSU」が3ヶ月で50万セッション。2025年6月にシードラウンド累計$13.3M調達。GENIACプログラム支援

9. まとめ

  • 準大手LLMの競争は「モデル性能の最大化」から「配備・規制対応・業務特化」へ主戦場が移った
  • フロンティア競争はOpenAI・Google・Anthropic・Metaに事実上集約。準大手が純粋なパラメータ規模で対抗することは資本的に不可能
  • DeepSeekの価格破壊により、汎用推論APIの再販ビジネスは成立しにくくなっている
  • Mistral(欧州ソブリン)・Cohere(エンタープライズ深耕)・Writer(垂直特化)の三社が、異なる軸での堀(Moat)構築に成功しており、生存確率が高い
  • xAIは規模と政治的リスクの両方で他社と異なる軌道。キャッシュバーンは月約$10億規模で、SpaceX買収後も財務的課題は継続
  • Perplexity AIはARR成長が実証されているが、評価額に対する収益倍率は依然100倍前後と高く、著作権訴訟も抱える
  • ソブリンAI需要(2030年に年$600B規模)は、規制・言語・文化の複雑性に守られた準大手の最大の成長機会
  • 日本では国産LLM整備(Gennai、Japan AI Foundation)と外資の攻勢(Microsoft・SoftBank)が並行しており、SI企業のパートナー選択が戦略的分岐点となる

日曜日, 4月 26, 2026

Google Gemini API 歴代価格表

Google Gemini API 歴代価格表

※ 価格はすべて 有料ティア・1Mトークンあたり USD(税抜)。コンテキストキャッシュ割引・バッチ割引(50%引き)は含まない。
※ 音声入力など一部モダリティは別料金。価格は頻繁に改定されるため、必ず 公式ページ を参照してください。

🔵 Gemini 1.x 世代(すべて廃止済み)

モデル リリース コンテキスト上限 価格区間 入力 ($/1M) 出力 ($/1M) 状態
Gemini 1.0 Pro 2023年12月 32K $0.125 $0.375 ❌ 廃止
Gemini 1.5 Pro(初期) 2024年4月 最大2M ≤128K $3.50 $10.50 ❌ 廃止
Gemini 1.5 Pro(値下げ後) 2024年10月〜 最大2M ≤128K $1.25 $5.00 ❌ 2025年4月30日終了
Gemini 1.5 Pro(値下げ後) 2024年10月〜 最大2M >128K $2.50 $10.00
Gemini 1.5 Flash(値下げ後) 2024年8月〜 最大1M ≤128K $0.075 $0.30 ❌ 2025年4月30日終了
Gemini 1.5 Flash(値下げ後) 2024年8月〜 最大1M >128K $0.15 $0.60

⚠️ 修正情報: Gemini 1.0 Pro の初期価格は入力 $0.125/1M・出力 $0.375/1M(公式記録より)。Gemini 1.5 Pro の初期価格は入力 $3.50/1M・出力 $10.50/1M(≤128K)で、2024年10月に大幅値下げ。1.5 Flash の初期価格は公式アーカイブから正確な数値を確認できなかったため、値下げ後の数値のみ掲載。

🟡 Gemini 2.x 世代

モデル リリース コンテキスト上限 価格区間 入力 ($/1M) 出力 ($/1M) 状態
Gemini 2.0 Flash 2025年初 1M $0.10 $0.40 ⚠️ 2026年6月1日終了予定
Gemini 2.0 Flash-Lite 2025年初 1M $0.075 $0.30 ⚠️ 2026年6月1日終了予定
Gemini 2.5 Pro 2025年 1M ≤200K $1.25 $10.00 ✅ 現役
Gemini 2.5 Pro 2025年 1M >200K $2.50 $15.00
Gemini 2.5 Flash 2025年6月 1M $0.30 $2.50 ✅ 現役
Gemini 2.5 Flash-Lite 2025年7月 1M $0.10 $0.40 ✅ 現役(最安値帯)

🟢 Gemini 3.x 世代(最新・2025年12月〜)

モデル リリース コンテキスト上限 価格区間 入力 ($/1M) 出力 ($/1M)※思考トークン含む 状態
Gemini 3 Flash Preview 2025年12月 1M $0.50 $3.00 ✅ 現役
Gemini 3.1 Pro Preview 2026年2月 1M ≤200K $2.00 $12.00 ✅ 現役(最新フラグシップ)
Gemini 3.1 Pro Preview 2026年2月 1M >200K $4.00 $18.00
Gemini 3.1 Flash-Lite Preview 2026年3月 1M $0.25 $1.50 ✅ 現役

📌 価格推移のポイント

時期 主な変化
2024年8月 Gemini 1.5 Flash を大幅値下げ(高ボリューム向け中心)
2024年10月 Gemini 1.5 Pro を大幅値下げ(≤128K:入力 $3.50→$1.25、出力 $10.50→$5.00)
2025年4月30日 Gemini 1.5 Pro・Flash が終了。2.5 Pro / Flash への移行推奨
2025年12月 無料ティアの上限が大幅縮小。フリー枠は実質テスト・開発専用に
2026年2〜3月 Gemini 3.1 Pro Preview、3.1 Flash-Lite Preview が登場
2026年6月1日(予定) Gemini 2.0 Flash・2.0 Flash-Lite が終了予定

⚙️ 思考トークン(Thinking tokens): Gemini 2.5・3系モデルでは、内部推論に使われる「思考トークン」も出力として課金されます。複雑なプロンプトでは見た目のレスポンス以上にコストが発生するため注意が必要です。
💾 バッチ処理・コンテキストキャッシュ: バッチAPIで最大50%引き、コンテキストキャッシュで最大90%のコスト削減が可能です。

情報源:Google Gemini Developer API 公式価格ページ(2025年4月15日更新)、pricepertoken.com(2026年4月23日)、zerlo.net 価格変遷記事(2026年2月19日)
本表は筆者が情報を取りまとめたものです。最新・正確な情報は公式ページでご確認ください。

OpenAI API 価格一覧(2026年4月時点)

OpenAI API 価格一覧(2026年4月時点)

価格はすべて USD / 1Mトークン(100万トークンあたり)。出典:openai.com/api/pricing(2026年4月25日確認)

GPT-5.5(2026年4月リリース)

モデルリリース入力キャッシュ入力出力コンテキスト
GPT-5.52026/04$5.00$0.50$30.001,050K
GPT-5.5 Pro2026/04$30.00$180.001,050K

GPT-5.4(2026年3月リリース)

モデルリリース入力キャッシュ入力出力コンテキスト
GPT-5.4 Pro2026/03$30.00$180.00270K
GPT-5.42026/03$2.50$0.25$15.00270K
GPT-5.4 Mini2026/03$0.75$0.075$4.50270K
GPT-5.4 Nano2026/03$0.20$0.020$1.25270K

GPT-5 / GPT-5.1(2025年8〜11月リリース)

モデルリリース入力キャッシュ入力出力コンテキスト
GPT-5.12025/11$1.25$0.125$10.00400K
GPT-52025/08$0.625$0.125$5.00400K
GPT-5 Mini2025/08$0.25$0.025$2.00400K
GPT-5 Nano2025/08$0.05$0.005$0.40400K

GPT-4.1(2025年4月リリース)

モデルリリース入力キャッシュ入力出力コンテキスト
GPT-4.12025/04$2.00$0.50$8.001,048K
GPT-4.1 Mini2025/04$0.40$0.10$1.601,048K
GPT-4.1 Nano2025/04$0.10$0.025$0.401,048K

GPT-4.5 / GPT-4o(2024〜2025年リリース)

モデルリリース入力キャッシュ入力出力コンテキスト
GPT-4.52025/02$75.00$37.50$150.00128K
GPT-4o2024/05$2.50$1.25$10.00128K
GPT-4o Mini2024/07$0.15$0.075$0.60128K

o シリーズ(推論モデル)

モデルリリース入力キャッシュ入力出力コンテキスト
o3 Deep Research2025/10$10.00$2.50$40.00
o4-mini Deep Research2025/10$2.00$8.00
o32025/04$2.00$0.50$8.00200K
o4-mini2025/04$1.10$0.275$4.40200K
o3-mini2025/02$1.10$0.55$4.40200K
o12024/12$15.00$7.50$60.00200K

GPT-4(2023〜2024年リリース)

モデルリリース入力キャッシュ入力出力コンテキスト
GPT-4 Turbo2023/11$10.00$30.00128K
GPT-4(32K)2023/03$60.00$120.0032K
GPT-4(8K)2023/03$30.00$60.008K

GPT-3.5(2022〜2023年リリース)

モデルリリース入力キャッシュ入力出力コンテキスト
GPT-3.5 Turbo Instruct2023/09$1.50$2.004K
GPT-3.5 Turbo2022/11$0.50$1.5016K

【注記】
キャッシュ入力:同一プレフィックスを繰り返し送信した場合に適用される割引価格。対応していないモデルは「—」。
Batch API:24時間以内処理の非同期バッチ。全モデルで入出力ともに50%割引(例:o4-mini → $0.55 / $2.20)。
o シリーズ:内部思考(リーズニングトークン)も出力として課金されるため、実コストは表示より高くなる場合あり。
GPT-5.4 長文脈割増:272Kトークン超のプロンプトは入力が$5.00/Mに倍増。
GPT-3.5 Turbo の価格はリリース後の値下げを経た最終価格。
・情報源:openai.com/api/pricing(2026年4月25日確認)

Anthropic Claude API 料金一覧(歴代モデル)

APIコスト解説

Anthropic Claude 歴代モデル
API料金完全まとめ(2026年4月)

Claude 2 から Opus 4.7 まで。料金推移・値下げの理由・割引オプションを徹底解説。

📅 2026年4月更新  |  単位:USD / 100万トークン(MTok)
Opus フラッグシップモデルは Claude 4.5 世代で $15 → $5 と約67%の大幅値下げが実施されました。この記事では歴代の API 価格を世代別に整理し、なぜここまで安くなったのかを解説します。
Claude 1〜2 世代(2023年)
モデル リリース 入力 出力 ステータス
Claude Instant 1.2 2023年8月 参考値※ 参考値※ 廃止
Claude 2 2023年7月 $8.00 $24.00 廃止
Claude 2.1 2023年11月 $8.00 $24.00 廃止

※ Claude Instant 1.2 の料金は情報源によって $0.80〜$1.63(入力)、$2.40〜$5.51(出力)と記載が一致しないため参考値扱い。

Claude 3 世代(2024年)
モデル リリース 入力 出力 ステータス 備考
Claude 3 Haiku 2024年3月 $0.25 $1.25 現役
Claude 3 Sonnet 2024年3月 $3.00 $15.00 廃止
Claude 3 Opus 2024年3月 $15.00 $75.00 廃止
Claude 3.5 Sonnet 2024年6月 $3.00 $15.00 廃止
Claude 3.5 Sonnet v2 ⭐ 2024年10月 $3.00 $15.00 廃止 Computer Use 機能を追加
Claude 3.5 Haiku 2024年10月 $0.80 $4.00 現役
Claude 3.7〜4.1 世代(2025年前半)
モデル リリース 入力 出力 ステータス 備考
Claude 3.7 Sonnet 2025年2月 $3.00 $15.00 廃止 Extended Thinking 初導入
Claude Sonnet 4 2025年5月 $3.00 $15.00 現役
Claude Opus 4 2025年5月 $15.00 $75.00 現役
Claude Opus 4.1 2025年8月 $15.00 $75.00 現役
Claude 4.5〜4.7 世代(2025年末〜2026年)
🔥
Opus が $15 → $5 へ約67%値下げ。この世代から Opus・Sonnet・Haiku 全ライン料金が大幅に改定されました。
モデル 入力 出力 コンテキスト ステータス
Claude Haiku 4.5 $1.00 $5.00 200K 現役・推奨
Claude Sonnet 4.5 $3.00 $15.00 200K〜1M 現役
Claude Opus 4.5 $5.00 $25.00 200K〜1M 現役
Claude Sonnet 4.6 $3.00 $15.00 1M(割増なし) 現役・推奨
Claude Opus 4.6 $5.00 $25.00 1M(割増なし) 現役・推奨
Claude Opus 4.7 🆕 $5.00 $25.00 1M(割増なし) 現役・最新

※ Opus 4.7 は新トークナイザー採用により、同一テキストで最大35%多くトークンを消費する場合があります(実効コストに注意)。

世代間の価格推移サマリー
世代 Opus 入力 Sonnet 入力 Haiku 入力
Claude 2(2023年) $8.00
Claude 3(2024年3月) $15.00 $3.00 $0.25
Claude 3.5(2024年6〜10月) $3.00 $0.80
Claude 4〜4.1(2025年) $15.00 $3.00
Claude 4.5〜4.7(2025〜2026年) $5.00 🎉 $3.00 $1.00
なぜ Opus 4.5 から一気に安くなったのか?
理由 01
モデル効率の劇的な向上
Opus 4.5 は同じ品質の成果を出力トークン数約76%減で達成。以前 500 トークン必要だったタスクが約 120 トークンで完了します。トークン単価だけでなく、消費量も激減。
理由 02
旧モデルの価格逆転問題
Sonnet 4.5 が古くて高価な Opus 4.1 を多くの場面で上回るという逆転現象が発生。フラッグシップの価値が失われていたため、値下げにより自然な階層を回復する必要がありました。
理由 03
競合との価格競争
OpenAI GPT-5.1($1.25/$10)や Google Gemini 3 Pro($2/$12)が台頭。$15/$75 のままでは市場競争力を維持できず、値下げは不可避でした。
理由 04
推論インフラコストの低下
GPU 性能向上と推論最適化技術の進歩により、同規模モデルの運用コストが業界全体で年々低下。コスト削減分を価格に反映できるようになりました。
割引オプション(全モデル共通)
50%OFF
バッチ API
非同期処理(24時間以内返却)
90%OFF
プロンプトキャッシュ ヒット
キャッシュ済みトークンの再利用
1.25×
キャッシュ書き込み(5分)
初回キャッシュ登録時(割増)
キャッシュ書き込み(1時間)
長時間キャッシュ(割増)
1.1×
US リージョン限定推論
データ主権要件がある場合(割増)
Opus 4.6 Fast Mode(β)
低レイテンシ用途(割増)
💡
バッチ API + プロンプトキャッシュを組み合わせると最大95%OFF。Opus 4.7 の場合、バッチ価格でキャッシュヒットした入力は $0.25/MTok まで下がります。