月曜日, 5月 18, 2026

Agentic SRE 元年の全貌:クラウドAI DevOps/SREエージェント包括比較レポート(2026年5月)

 

はじめに:2026年は「Agentic SRE元年」

2026年は後から振り返ったとき、確実に「Agentic SRE元年」と呼ばれる年になるだろう。

AWS DevOps Agent(2026年3月GA)、Azure SRE Agent(2026年3月GA)、Google Gemini Cloud Assist(Google Cloud Next '26で大幅刷新)が、いずれも実運用可能なフェーズに入った。サードパーティ側でもDatadog Bits AI SREが2025年12月にGA、incident.io AI SRE、Rootly AI、PagerDuty SRE Agentが立て続けに登場し、観測・インシデント管理・CI/CD領域に自律エージェントが浸透している。

背景にはMCP(Model Context Protocol)のLinux Foundation寄贈(2025年12月)とGoogle A2Aの150組織超への拡大があり、マルチエージェント協調の標準プロトコルが事実上確立されたことが大きい。


第1章:AWS DevOps Agent — Bedrock AgentCore基盤の本命

発表と展開

AWS DevOps AgentはAmazon Bedrock AgentCore上に構築された自律SREエージェントで、2025年12月2日のre:Invent 2025プレビュー発表を経て、2026年3月31日にGAとなった。

GA時点で対応リージョンは6拠点に拡大した:

  • us-east-1(バージニア北部)
  • us-west-2(オレゴン)
  • eu-central-1(フランクフルト)
  • eu-west-1(アイルランド)
  • ap-southeast-2(シドニー)
  • ap-northeast-1(東京)★

東京リージョン(ap-northeast-1)がGA初日から対応しており、大阪リージョン(ap-northeast-3)は2026年5月時点で未対応。日本企業にとってはAWSが最もすぐ使いやすい選択肢となっている。

アーキテクチャと機能

中核はTriage Agent / RCA Agent / Mitigation Agent / Evaluation Agentから成るマルチエージェント構造。各エージェントはCloudWatchアラーム・PagerDuty・Dynatrace Problem・ServiceNowチケット・Webhookで起動する。

自律性は「Human-in-the-loop」設計を厳守しており、エージェントは調査・分析・緩和計画生成までは自律的に行うが、AWS環境に直接変更を加えない設計になっている。代わりに「agent-ready spec」を生成し、コーディングエージェントのKiroに引き渡して実装するワークフローが標準となっている。

実績数値(AWS公式発表)

指標数値
MTTR短縮(最大)75%
調査速度向上80%
根本原因特定精度94%
Western Governors University 解決時間2時間 → 28分(77%短縮)

統合とエコシステム

GA時点で対応する主要ツール:

  • オブザーバビリティ: Datadog、Dynatrace、New Relic、Splunk、Grafana(ビルトインMCPサーバー)
  • インシデント管理: PagerDuty、ServiceNow
  • CI/CD: GitHub Actions、GitLab CI/CD、Azure DevOps
  • マルチクラウド: Azure / Azure DevOpsおよびオンプレミスがGAで追加

Azure / Azure DevOps対応をGA時点で正式追加した点は、AWSがマルチクラウド戦略を本格的に打ち出したシグナルとして重要だ。

料金体系

$0.0083 / agent-second(約$29.88/時間)

小規模利用(月10件×8分): $39.84/月
エンタープライズ(月500件×8分+評価): $2,290.80/月

新規顧客向け無料トライアル(2か月間):月あたり10 agent spaces / 20時間調査 / 15時間評価 / 20時間オンデマンドSREタスク。

AWSサポートプラン(Business Support+、Enterprise Support、Unified Operationsプラン)契約者は、プラン内のクレジットが利用料に充当される形で提供される。


第2章:Azure SRE Agent — Microsoftの自社実績が証明する本番力

発表と展開

2025年5月のMicrosoft Build 2025で発表、2025年9月1日に課金開始、2026年3月10日にGAとなった。

Microsoftが最も重要な差別化要素として掲げるのが自社での本番運用実績だ:

指標数値
社内稼働エージェント数1,300超
自律処理したインシデント数35,000超
削減した運用工数月20,000時間以上
Azure App Serviceでの緩和時間改善40.5時間 → 3分

これらはすべてMicrosoft自社環境での実績であり、外部顧客の標準ベンチマークではない点に留意が必要だが、実運用の説得力は業界随一だ。

AAU料金モデル

Azure SRE Agentの課金体系は独特の「Azure Agent Unit(AAU)」方式を採用している:

  • Always-on flow(常時稼働): 4 AAU/agent-hour(固定)
  • Active flow(作業中): 2026年4月15日以降、トークンベース課金に移行
  • 1 AAU ≈ $0.10(米国リージョン参考値)

試算:

エージェント1個のベースライン: 4 AAU × 730時間 × $0.10 = $292/月

無料枠は存在せず、エージェント作成時点から課金が始まる設計はAWS DevOps Agent(無料トライアルあり)と対照的だ。

機能と自律性設計

3段階の自律性から選択できる:

  1. Reader(読み取りのみ)
  2. Approval-gated(承認付き実行)
  3. Privileged(ガードレール内自律)

デフォルトは承認ゲート方式で、Deep Context・Code Interpreter(Python実行)・Memory and learning・no-codeサブエージェントビルダー・Skills・Agent hooksを備える。

注目:クロスクラウド連携

AWS MCP Serverを通じたクロスクラウド調査が実現しており、EC2・EKS・Lambda・RDSを横断して調査できる。AWS DevOps Agentとのエージェント間連携も可能だ。

リージョンと日本市場

対応リージョンはEast US 2 / Sweden Central / Australia Eastの3リージョンのみで、日本リージョンは2026年5月時点で未対応。日本顧客はAustralia Eastに配置して日本のリソースをリモート管理する形になる。また公式UIの言語は英語のみとなっており、日本企業の導入判断において重要な検討事項だ。


第3章:Google Gemini Cloud Assist と OCI

Google Cloud Next '26で進化したGemini Cloud Assist

2026年4月のGoogle Cloud Next '26でGemini Cloud Assistは大きく刷新された。主な発表内容は以下の4点:

  1. Application Design Centerの再設計と自律エージェント化
  2. gcloud / kubectl / Terraform自動化エージェント
  3. 24時間体制のFinOpsコスト異常検知エージェント
  4. Cloud Assist自体をMCPサーバーとして公開(IDE / CLI / ServiceNow / Slack等から利用可)

ただし、インシデント調査の核心機能であるCloud Assist Investigationsは現在も制限付きアクセスが続いている。2026年4月10日以降はPremium Support契約保有者または個別申請者のみアクセス可能となり、エンタープライズ採用の入り口は狭まっている。

Gemini Cloud Assistの制約

  • 料金: Gemini Code Assist Enterprise経由($54/ユーザー/月、年契約$45/ユーザー/月)
  • 分析対象: Google Cloud内のリソースのみ。AWS / Azure / オンプレミスリソースの直接的なRCAはサポート対象外
  • Gemini CLI: OSSとしてApache 2.0ライセンスで無料配布

マルチクラウド対応の弱さが、AWS・Azureとの最大の差別化要因(不利な方向で)となっている。

OCI:専用製品なし、参照実装あり

OCIには「専用SRE AIエージェント」製品は2026年5月時点で存在しない。

Oracle AI Agent StudioはFusion Applications(ERP/HCM/SCM/CX)向けの業務エージェントプラットフォームであり、SRE用途ではない。

代わりに、Oracle公式が2026年4月27日に公開した「kagent + OCI Generative AI on OKE」アーキテクチャが事実上のリファレンス実装となっている。kagentはSolo.io(Istioの創設者)が開発したKubernetesネイティブAIエージェントOSSで(Apache 2.0)、CNCFへの寄贈後も活発に開発が続いている。


第4章:ハイパースケーラー3社の機能比較

比較軸AWS DevOps AgentAzure SRE AgentGoogle Gemini Cloud Assist
GA時期2026年3月31日2026年3月10日Investigations含めアクセス制限中
対応リージョン6拠点(東京含む)3拠点(日本未対応)グローバル(制限付き)
基本料金$0.0083/agent-second4 AAU/hour + トークン課金Code Assist Enterprise $45-54/ユーザー/月
無料枠2か月トライアルありなしアクセス制限中は個別申請
自律性HITL固定(変更は人間承認)3段階選択可明示承認必須
マルチクラウドAzureとオンプレGA対応AWS MCP Server経由Google Cloud内のみ
日本リージョン✅ 対応済(東京)❌ 未対応グローバル(制限付き)
MCP対応ファーストクラスファーストクラスCloud AssistをMCPサーバーとして公開
主要実績WGU:77% MTTR短縮App Service:40.5時間→3分Next '26で多数事例発表

日本市場の観点では、AWS DevOps Agentが東京リージョン対応で最も導入障壁が低い。 Azure SRE Agentは実績・機能面で充実しているが、日本リージョン未対応と英語UIが課題。Gemini Cloud AssistはマルチクラウドサポートとアクセスがPremium Support必須の制約が選択を左右する。


第5章:オブザーバビリティ各社 — Datadogが先行GA

Datadog Bits AI SRE(GA済:2025年12月2日)

オブザーバビリティ5社の中で唯一完全GAに達しているのがDatadog Bits AI SREだ。DASH 2025(2025年12月2日、ラスベガス)で一般公開された。

料金

  • 年契約プラン:$500 / 20調査 / 月(1調査あたり約$25)
  • 月次プラン:$600 / 20調査 / 月
  • 完了した調査のみ課金、未完了は無料という珍しいモデル

Datadog MCP Serverは2026年3月9日にGAし、Claude Code・Cursor・Codex・GitHub Copilot・Kiroから接続可能になった。AWS DevOps Agentとの連携プレビューも進行中で、エコシステムの中心的な位置を占めつつある。

GA後は推論深度2倍・速度約2倍に強化され、ソースコード・RUM・Database Monitoring・Continuous Profilerまで解析対象が拡大している。

Dynatrace Intelligence(2026年1月発表)

Dynatrace Intelligenceは2026年1月28日のPerform 2026(ラスベガス)で発表された。「Deterministic AIとAgentic AIの融合」という独自路線が特徴だ。

Dynatrace自身のベンチマーク結果(独立検証は未実施):

  • 問題解決成功率:最大12倍
  • 解決速度:最大3倍
  • トークンコスト:半減

Operator Agent + SRE/Dev/Security専門エージェントの構成で、Davis CoPilotは「Dynatrace Assist」にリブランドされた。

New Relic SRE Agent(2026年2月24日発表、Preview)

New Relic Advance 2026(2026年2月24日)でSRE AgentとAgentic Platformを発表した。いずれもPreviewステータスだが注目点が多い。

  • 2026 AI Impact Report:AI機能利用ユーザーのインシデント解決時間が非利用ユーザー比で25%高速化
  • 「no incremental spend」で既存APMの上にネイティブ提供するコスト設計が差別化要素

Grafana Assistant(GA:2025年10月8日)

Grafana Labsは2025年10月8日のObservabilityCON 2025でGrafana AssistantをGAとし、Assistant InvestigationsをPublic Previewとして発表した。

OSS(Apache 2.0)でGrafana LLM PluginとMCP Server(Prometheus / Loki / Tempo / Pyroscope対応)を公開する独自路線で、Free階層でも利用可能な点が他社との差別化要素。

Splunk / Cisco(統合移行期)

CiscoによるSplunk買収(2024年3月クローズ)後の統合が進む。.conf25ではCisco Data FabricCisco AI Canvas(Splunk Cloud Platform統合、2026年提供予定)を発表。ただしForresterからは「競合の後追い」と指摘されており、主要機能の本番展開はまだ先の状況だ。


第6章:インシデント管理・AIOps — 業界再編の波

2025年の大型買収・統合

2025年はインシデント管理スタートアップが大手プラットフォームに吸収された年だった:

日付買収金額等
2025年3月3日SolarWinds → Squadcast買収-
2025年3月10日ServiceNow → Moveworks買収$2.85B
2025年12月15日Freshworks → FireHydrant買収クロージングは2026年Q1

独立系スタートアップ:incident.io と Rootly

incident.ioは2025年4月10日に$62M Series B(評価額$400M、累計$96M)を調達し、AI SRE機能を開発。「インシデント対応の最初の80%を自動処理」を謳うマルチエージェント・オーケストレーションを実装し、「Code it up」ボタンによるPRドラフト機能も備える。

Rootlyは2025年3月12日にAPIをAgent-First設計に刷新。AI-Assist → AI-Automate → AI-Autonomy(自己治癒)の3段階ロードマップを提示している。

PagerDuty AIエージェントスイート

2025年10月8日、PagerDutyは業界初を謳うエンドツーエンドAIエージェントスイートを発表した(SRE Agent / Scribe Agent / Shift Agent / Insights Agent)。早期導入顧客で最大50%のMTTR短縮を公表している。

ServiceNow Yokohama / Zurich

ServiceNow Yokohama(2025年3月GA)でAI Agent OrchestratorとAI Agent Studioが正式提供開始。Zurich(2025年10月)でAI Control Tower / Agent Fabricを追加し、Pro Plus / Enterprise Plusライセンスへの同梱方式に転換した。

その他注目動向

  • Opsgenie:2025年6月4日に新規購入停止、2027年4月5日に完全EOL確定。JSM Operations(Atlassian Rovo Ops agent搭載)またはCompassへの移行が必須
  • BigPanda:2025年11月10日にVelocityを買収し、Agentic ITOpsプラットフォームへ進化
  • Moogsoft(旧名):現在はDell APEX AIOps。2024年5月にリブランド済み(IBMではなくDell Technologiesが買収)
  • OpsRamp(HPE傘下):GreenLake Intelligence「agentic command center」として再定位

第7章:DevOps/CI-CD と MCPエコシステムの加速

GitHub Copilot

GitHub Copilot Coding Agentは2025年5月19日(Microsoft Build 2025)のPublic Preview公開を経て、順次有償プランへ展開が進んでいる。VS Code内のAgent ModeはSWE-bench Verifiedで**pass rate 56.0%(Claude 3.7 Sonnet使用)**を記録。

GitHub Universe 2025ではAgentHQを発表し、開発者が独自エージェントを構築・デプロイできるエコシステムに進化した。

GitLab Duo Agent Platform

2025年7月17日にPublic Betaが開始。Credit Pooling方式の課金(Claude Sonnet-4で2 model requests/credit)により、チーム単位の予算管理が容易になった。GitLab 18系でIDE統合・Planner Agent / Security Analyst Agentを段階的に追加している。

Harness AI DevOps

2025 UnscriptedでAI DevOps Agent / SRE Agent / Release Agent / AppSec Agent / Test Agent / FinOps Agentを統合的に発表。Software Delivery Knowledge Graphを中核とした設計で、ベータ顧客でダウンタイム50%削減・テストサイクル80%削減の実績を公開。

MCPとA2A:標準プロトコルの確立

MCP(Model Context Protocol)の普及は急速で、Anthropic公式発表によると月間SDKダウンロードは2025年12月時点で9,700万に達した。

2025年12月9日、AnthropicはMCPをLinux FoundationのAgentic AI Foundation(AAIF)に寄贈した。AnthropicとOpenAI・Blockが共同設立者となり、Google・Microsoft・AWS・Cloudflareが支援する体制となっている。

Google A2A(Agent-to-Agent)プロトコルも2026年4月9日時点で150以上の組織が参加し、Linux Foundationガバナンスに移行した。IBM ACPもA2Aに統合され、業界標準としての地位を固めつつある。

**MCPは「ツール接続層」、A2Aは「エージェント間通信層」**として役割分担しながら、マルチエージェント協調の基盤が整いつつある。


第8章:市場動向とSRE職への影響

AI DevOps/SRE市場規模

MarketsandMarketsの「AI Agents Market」レポートによると:

  • 2025年市場規模:$7.84B
  • 2030年予測:$52.62B
  • CAGR:46.3%

なお同社の「Agentic AI Market」は別レポートで、より広義の数値($7.06B → $93.20B、2032年、CAGR 44.6%)となっている。

Gartnerの予測と警告

  • 2030年:Guardian Agent技術がAgentic AI市場の**10〜15%**を占有
  • 2027年末まで:Agentic AIプロジェクトの40%以上がキャンセル(コスト増・価値不明確・リスク管理不足が原因)

「79%の企業が導入済み」という調査(PwC, 2025)が広く引用される一方で、KPMG調査ではQ1 2025時点で実際にAIエージェントの導入を開始した企業は11%にとどまっており(Q3には42%に上昇)、期待と実態のギャップは今も大きい。

SRE職への影響

2025〜2026年にかけて、主要テック企業での人員削減が相次いだ:

  • Meta:2026年4月に全体の約10%(約8,000人)を削減
  • Microsoft:2025年5月に約6,000人、2025年7月に約9,000人(計約15,000人)を削減
  • Nadella CEOの発言(2025年4月29日、Meta LlamaCon):「一部のプロジェクトでは20〜30%のコードがAIによって書かれている」

Challenger, Gray & Christmasの2026年Q1レポートでは、テクノロジーセクターの削減は52,050人(全業種合計217,362人)と集計されている。

Acceleration Whiplash:加速の副作用

Google Cloud提供のDORA Report 2025では、開発者の90%がAIを業務利用し、80%超が生産性向上を実感していることが示された。

一方、Faros AIの「AI Engineering Report 2026」では、AI採用が進むにつれて:

  • PRレビュー時間:+441%
  • 開発者あたりのバグ数:+54%
  • PRあたりインシデント数:+242.7%

という「Acceleration Whiplash」現象が報告されており、速度の向上が品質・安定性に新たな圧力をかけている実態が浮き彫りになっている。

PagerDutyをはじめ各社は「AIエージェントはSREの代替ではなく増幅」「First responders → Architects of digital operations」という見解を示しているが、Lorin Hochstein(Surfing Complexity)のような識者からは「AI SREは多いがAI incident managerはまだ存在しない」という鋭い指摘もあり、業界議論は続いている。


結論:三層構造で進化するAgentic SRE市場

2026年5月時点で見えてきたのは、「クラウドネイティブ(AWS/Azure/GCP)」「オブザーバビリティ統合(Datadog/Dynatrace等)」「インシデント管理特化(incident.io/Rootly/PagerDuty)」の三層が並行して進化し、MCPとA2Aで相互接続する構造だ。

三層の役割分担

Layer 1: クラウドネイティブ(AWS DevOps Agent / Azure SRE Agent / Gemini Cloud Assist)
          → インフラ層との深い統合、マルチサービス調査の自動化

Layer 2: オブザーバビリティ(Datadog Bits AI SRE / Dynatrace Intelligence / New Relic SRE Agent)
          → テレメトリ分析の深度、クラウド横断の観測

Layer 3: インシデント管理(PagerDuty / incident.io / Rootly / ServiceNow)
          → ワークフロー自動化、チームコミュニケーション、後処理

これらがMCP/A2A経由で連携することで、「アラート検知 → 自動調査 → 修正コードPR作成 → ポストモーテム自動生成」というエンドツーエンドの自律インシデント対応が現実に近づいている。

完全自律は「まだ先」、HITL設計が現在の答え

各社共通して、Human-in-the-loopが業界共通の現実解となっている。Microsoft Azure SRE Agentが提唱した「4段階の自律性ラダー(読み取り→推奨→承認付き→ガードレール内自律)」が事実上の業界標準となりつつある。

Gartnerが警告する「40%のプロジェクトキャンセル」と、Faros AIが示す「Acceleration Whiplash」は、ガバナンス・コスト管理・人材育成が次の課題であることを示している。

日本市場のウォッチポイント

  • AWS DevOps Agent:東京リージョン対応済みで最も導入しやすい
  • Azure SRE Agent:日本リージョン対応時期が最大のウォッチポイント
  • Gemini Cloud Assist Investigations:GA時期とPremium Support要件の変化に注目
  • 日本語対応:各社とも基盤LLMは日本語対応だが、公式UIは英語主体

2026年下期から2027年上期にかけて、自社環境に最適なエージェントスタックを設計する時期に入った。ツール単体の評価から、「どのレイヤーにどの製品を置き、MCPでどう連携させるか」という設計思想の議論が、次の実務的な問いとなるだろう。


参考リンク

AWS DevOps Agent

Azure SRE Agent

Google Cloud

OCI

サードパーティ

標準化・市場動向

0 件のコメント: