月曜日, 6月 08, 2026

AIが溢れるほど『本物』が高くなる――供給過多時代の逆説的経済学

AIが溢れるほど『本物』が高くなる――供給過多時代の逆説的経済学

📌 この記事のポイント(TL;DR)
AIはコストを下げて需要を爆発させる「ジェボンズのパラドックス」と、供給を爆発させて単価を暴落させる「コモディティ化」を同時に引き起こす。ソフトウェア開発では前者が優勢で需要は拡大する一方、文章・画像・翻訳など複製可能な情報財では後者が優勢で、すでにフリーランスの仕事と単価の減少が実証データで確認されている。そして価値は「生産」から「信頼・判断・責任・体験」へ移動しつつある。

はじめに――問いを立てる

AIによる自動化が進むと、ソフトウェアだけでなく、文章・画像・翻訳・法律文書・コンサルレポートといった「情報財」全般が「供給過多」になり、価値が暴落するのではないか。

この問いは、表面的には「AIに仕事を奪われるか」という雇用問題に見えるが、本質は経済構造の変容にある。技術の進歩は常に「生産性向上→コスト低下→需要の変化」というサイクルを生み出してきたが、今回のAI革命は、そのサイクルが情報財という非常に特殊な財に適用されるため、過去の産業革命とは異なるダイナミクスをはらんでいる。

本稿では、この問いを経済学的なフレームワークと実証データを使って解きほぐし、「供給過多が起きる領域」と「むしろ価値が高まる領域」の分岐点を探る。

1. ジェボンズのパラドックス――効率化は需要を「減らす」のか「増やす」のか

19世紀の経済学者ウィリアム・スタンレー・ジェボンズは1865年、ワットの蒸気機関が石炭の利用効率を高めたにもかかわらず、イギリスの石炭消費量がむしろ激増したことを指摘した。効率化がコストを押し下げ、それが新たな需要を呼び込んだためだ。

歴史的には照明が典型例だ。過去2世紀で光のコストは劇的に下がり、それに伴って一人当たりの照明使用量はそれを上回る桁で増加した。電力、IT(情報通信技術)でも同じパターンが繰り返されてきた。

ソフトウェア開発におけるジェボンズ

生成AIによるコーディング支援は明確な効率改善をもたらしている。GitHubが4,000人以上の開発者を対象に行った調査では、AIコーディング支援ツールの利用で平均26%の生産性向上が報告されている。

重要なのは、ソフトウェアの効率が上がるたびに市場が縮小ではなく拡大してきたという歴史的パターンだ。世界のソフトウェア市場が約5,000億ドルなのに対し、その背後にあるサービス市場は最大5兆ドルと推計される。AIがこの「潜在需要」を掘り起こすことで、コモディティ化する部分と価値が高まる部分が同時に生まれる。

領域 今後の見通し
定型コーディング・単体テスト コモディティ化。AIが最も得意とする領域で価値は限りなくゼロへ
要件定義・アーキテクチャ設計 価値上昇。複数システムを束ねて成果に責任を持つ役割が希少に
超ニッチな業務ツール開発 新規需要の爆発。これまで「コストが合わなかった」潜在需要が顕在化

2. ソフトウェア以外での「供給過多」――実証データが語る現実

ここが本稿の核心だ。ソフトウェアでジェボンズのパラドックスが効きやすいのは、潜在需要が事実上無限に近いからだ。しかし「複製限界費用がほぼゼロ」かつ「需要に上限がある」情報財では、同じ効率化が供給過多→価値暴落をもたらす。

📉 コンテンツ・クリエイティブ領域:すでに数字が出ている

Hui・Reshef・Zhou(Organization Science 35(6):1977-1989, 2024)の研究は、フリーランスプラットフォーム「Upwork」のデータを差分の差分法で分析した結果、ChatGPT登場後に以下の変化が確認されたと報告している。

職種カテゴリ 月間仕事数の変化 月間収入の変化 トリガーとなったAIツール
ライティング・校正・編集 −2% −5.2% ChatGPT(2022年11月)
画像制作・デザイン・アーティスト −3.7% −9.4% DALL-E(2022年4月)、Midjourney(2022年7月)

さらに注目すべきは、経験豊富で高評価のフリーランサーほど打撃が大きかったという点だ。AIが「下位層の品質を引き上げて差を埋める」ため、トップ層が持っていたプレミアムが失われたと解釈されている。

ストック写真市場も構造転換に直面している。GettyとShutterstockは2025年1月、合算企業価値約37億ドルの合併を発表した。この合併の背景には、AI画像生成ツールの台頭による需要減少という構造的な圧力がある。皮肉なことにShutterstockは自社ライブラリをAI企業に学習用データとして提供することで収益を得ており、「自社のアーカイブを、いずれそのアーカイブを不要にするツールを作る企業に売る」という自己カニバリゼーション的なビジネスモデルに陥っている。

⚖️ 知識労働・専門職:参入障壁が崩れ始めている

法律・会計・コンサルティング・翻訳など、これまで高い参入障壁で守られてきた専門知識が、AIによって「そこそこの品質で、ほぼ無料」で供給され始めている。Thomson Reutersの2025年「Future of Professionals Report」(法務・税務・会計など2,275人を調査)は、AIが法務専門家の時間を年間約240時間節約しうると予測。回答者の43%が今後5年で時間制課金モデルの縮小を見込んでいる。

翻訳業界では、Oxfordの研究(Frey & Llanos-Paredes, 2025)が米国の696の地域労働市場を分析し、機械翻訳の利用率が1ポイント上がるごとに翻訳者の雇用成長率が約0.7ポイント下がり、2010〜2023年に約2.8万人分の翻訳者ポストが失われたと推計している。

🤖 カスタマーサービス:「代替の最前線」で起きた揺り戻し

AIによる代替が最も先行したカスタマーサービス領域で、象徴的な事例が生まれた。

スウェーデンの決済フィンテック企業Klarnaは2024年2月、OpenAI製アシスタントが稼働1か月で230万件の会話を処理し、対応の3分の2を自動化、「フルタイム700人分の業務」に相当すると喧伝した。しかし2025年5月、CEOのSiemiatkowskiはBloombergに「コストを評価軸にしすぎた結果、品質が低下した」と認め、人間のサポート要員を再び採用する方針へ転換した。

💡 Klarnaの教訓: AIによる全面代替は「定型処理のコスト削減」には効果的だが、共感・ニュアンス・複雑な問題解決が求められる領域では品質の壁にぶつかる。

🏥 医療診断:コモディティ化が進んでも雇用が増える「反例」

ただし、「コモディティ化=雇用消滅」という図式が常に成立するわけではない。放射線科は典型的な反例だ。FDA認可のAI医療機器は2025年時点で1,300件超に達し、その大半(約77%)が放射線科向けだ。にもかかわらず、放射線科医の需要と賃金はむしろ上昇し、慢性的な人材不足が続いている。

なぜか。AIが各医師の処理能力を高め、不足を補う「補完」として機能しているためだ。需要が技術によって作り出されている翻訳業界とは正反対の構図といえる。この分岐を決めるのは「需要の弾力性」と「専門的・制度的な制約の有無」だ。

3. 経済学的フレームワークで整理する

限界費用ゼロ社会との接続

ジェレミー・リフキンは『限界費用ゼロ社会』(2014)で、競争市場のダイナミズムが限界費用をゼロ近くまで押し下げ、財を「ほぼ無料」にしてしまう資本主義の逆説を論じた。生成AIはまさに情報財の限界費用をゼロに近づける技術であり、リフキンの論理をさらに加速させる。

「ジェボンズ型」か「コモディティ型」か――分岐を決める2つの要因

ジェボンズ型(需要拡大) コモディティ型(価値暴落)
需要の弾力性 高い(潜在需要が無限) 低い(需要に天井がある)
供給の制約 専門性・制度的制約が残る 複製限界費用≒ゼロ
典型例 ソフトウェア開発、放射線科診断 ストック写真、単純翻訳、定型ライティング

労働市場への影響――主要レポートの数値

WEFの「Future of Jobs Report 2025」(55経済圏・1,000超の雇用主を調査)は、2030年までに1.7億の新規雇用が生まれ、9,200万が消失し、純増7,800万(現在の総雇用の22%が流動化)と予測する。Goldman Sachs(2023年3月)は、世界で「3億のフルタイム雇用」相当が自動化の影響を受けうると推計し、労働生産性の向上で10年間で世界GDPを7%押し上げうるとしている。McKinseyは生成AIが年間2.6兆〜4.4兆ドルの経済価値を生みうると見積もっている。

重要な質的転換は、従来の自動化が製造業・低スキル・男性に影響したのに対し、生成AIは高スキル・大都市圏・女性により大きく影響するという点だ(OECD, 2024)。

4. 「供給過多」への反論――楽観論の根拠

🏷️ 「AIスロップ」時代に高まる「本物性」の価値

Merriam-Websterは「slop(スロップ)」を2025年の「Word of the Year」に選んだ。定義は「AIによって通常大量に生産される低品質なデジタルコンテンツ」だ。AI生成コンテンツが溢れるほど、人間の署名・本物性(authenticity)・権威に希少価値が逆に生まれる。

Adobe・AP通信・ロイターなどが支援するContent Authenticity Initiative(C2PA)は、撮影から公開まで人間の著作を証明する暗号的な「コンテンツ認証情報」を推進している。「誰が作ったか」を証明することが新たな経済の軸になりつつある。

✈️ 体験・リアルな人間性への回帰

航空機旅行がZoomに完全には置き換えられなかったように、AIで代替できない「リアルな体験」「人間同士の関係性」への回帰が起きうる。Klarnaが人間サポートに回帰したのも、共感・ニュアンス・複雑な問題解決という領域で人間が依然として優位を持つからだ。

🔒 規制・著作権という供給制限

EU AI Actは、汎用AI(GPAI)提供者に学習データの透明性開示と著作権法遵守を義務付けた(GPAI規則は2025年8月発効)。こうした規制は、無制限な供給拡大に一定のブレーキをかけうる。

5. 日本固有の視点

SIer・多重下請け構造への直撃

日本のSI業界は「人月商売」と「多重下請け構造」という固有の特徴を持つ。生成AIによる開発自動化と、ユーザー企業の内製化加速という二つの力が同時に作用することで、SIerへの工数需要は構造的に縮小すると見られている。経済産業省のデータでは元請と下請で生産性に約1.7倍の差があり、利益率の薄い下請けほどAI投資・人材再教育の余力がなく、変革から取り残されやすい。ある専門家は「これまで10億円かかっていた基幹システム刷新がAIで1億円になれば、SIerの売上は理論上9割減少する」と警告している。

AI特需で収益が安定している「今」こそ、人月モデルから知識集約・成果責任型モデルへの転換に投資する好機だ。

少子高齢化という「緩衝材」

一方、日本では少子高齢化による労働力不足(パーソル総合研究所の試算では2030年に約644万人不足)が、AI自動化の「失業圧力」を吸収する緩衝材として機能する余地が大きい。欧米では「AIが仕事を奪う」脅威として語られる自動化が、日本では「人手不足を補う手段」として機能するという、固有の需給バランスが存在する。ただし「総数が維持されても雇用の二極化と格差が拡大する」という懸念も残る。

6. 個人・企業がとるべき戦略

個人(特に知識労働者・クリエイター)へ

  1. 自分の業務を「コモディティ化する作業」と「価値が高まる判断」に仕分けよ。 定型的・低判断・複製可能な作業はAIに置き換わる前提で動く。最も労力がかかり判断の少ない作業から、AIが7割こなせるか検証し、浮いた時間を「自分にしかできない仕事」へ再投資せよ。
  2. AIを道具として使いこなす側に回れ。 データは、AIを使う仕事の方が使わない仕事より高い報酬を得る傾向を示している。
  3. 「判断・信頼・関係性・体験」を売る側にシフトせよ。 権威性・本物性・責任の引き受けは、供給過多の時代に希少価値を持つ。署名・実体験・固有の視点こそが差別化要因になる。

企業へ

  1. 「安く速く作る」を価値の軸にしている事業は、軸の転換を急げ。 特に日本のSIerは人月モデルから知識集約・成果責任型モデルへの転換が急務だ。
  2. カスタマーサービスはKlarnaの教訓に学べ。 AIで定型対応を捌き、人間が複雑・高共感案件を担うハイブリッド設計が現実解だ。コスト一辺倒のAI全面代替は品質低下のリスクがある。
  3. 本物性・信頼の可視化に投資せよ。 コンテンツ認証(C2PA等)や人間の関与の明示は、AIスロップ時代の差別化要因になる。

まとめ――問いへの答え

「AIによる自動化が進むと、ソフトウェア以外でも供給過多になるのか」という問いへの答えは、YesでありNoでもある

複製限界費用がほぼゼロで需要に天井がある情報財(定型コンテンツ、単純翻訳、ストック素材)では、供給過多→価値暴落がすでに実証データで確認されている。一方、潜在需要が巨大で専門性・制度的制約が残る領域(ソフトウェアのアーキテクチャ設計、医療診断、高度なコンサルティング)では、ジェボンズのパラドックスが働いて需要が拡大しうる。

そして最も重要な逆説は、AIが供給を爆発させるほど、人間が生み出す「本物性・信頼・責任・体験」の希少価値が高まるという点だ。価値は「生産」から「判断と関係性」へシフトしつつある。

⚠️ 注記
・フリーランス研究(Hui et al.)は「短期効果」を捉えたものであり、著者らも長期的にはAIと協働する新たな仕事が生まれる可能性を認めている。
・WEF・Goldman Sachs・McKinseyの将来予測は推計であり、前提次第で大きく振れる。特に「3億雇用」は自動化に「さらされうる」職務数であり、確定的な失業予測ではない。
・放射線科のように「AI導入=雇用消滅」とならない領域がある一方、翻訳のように雇用・収入の減少が実証される領域もあり、一般化には慎重を要する。

参考文献
・Hui, X., Reshef, O., & Zhou, L. (2024). The Short-Term Effects of Generative Artificial Intelligence on Employment. Organization Science, 35(6), 1977–1989.
・World Economic Forum. (2025). Future of Jobs Report 2025.
・Goldman Sachs. (2023). The Potentially Large Effects of Artificial Intelligence on Economic Growth (Briggs & Kodnani).
・McKinsey Global Institute. (2023). The economic potential of generative AI: The next productivity frontier.
・Merriam-Webster. (2025). Word of the Year: "slop".
・Thomson Reuters. (2025). Future of Professionals Report.
・パーソル総合研究所・中央大学. (2018). 労働市場の未来推計2030.

日曜日, 6月 07, 2026

再帰的自己改善(RSI)の現在地 AIがAIを作り始めた時代

再帰的自己改善(RSI)の現在地:AIがAIを作り始めた時代
🤖 AI Research Deep Dive

再帰的自己改善(RSI)の現在地
AIがAIを作り始めた時代

技術メカニズム・主要プレイヤー・AI安全性・AI for Science・タイムラインを一挙解説

2026年6月7日 | 情報セキュリティばんざい!
📌 TL;DR — この記事の3行まとめ
  • RSIは「SF」から「現在進行形の研究テーマ」に移行したが、完全な自律ループはまだ閉じていない。AlphaEvolve、Darwin Gödel Machine、AnthropicのClaudeによるコード生成など、ループの一部は確かに自動化されつつある。
  • 最も具体的な自己改善の兆候はコードと数学の領域に集中している。Anthropicは自社コードの80%超をClaudeが書くと公表し、DeepMindのAlphaEvolveは56年破られなかった行列乗算記録を更新、OpenAI・Googleは共にIMO(国際数学オリンピック)で金メダル相当を達成した。
  • 「知能爆発」を本気で警戒する専門家が急増している。AI研究者25人へのインタビュー調査では20人が「AI研究の自動化を最も深刻で緊急なリスクの一つ」と回答。一方で物理的制約から「爆発」より「逓減的改善」になるとの慎重論も根強い。

1 RSIとは何か? — 定義と概念的背景

再帰的自己改善(RSI: Recursive Self-Improvement)とは、AIが人間の介入なしに自分自身の能力を改善し、さらにその改善能力自体も改善することで、改善が指数関数的に加速するプロセスを指す。

起源 — I.J. Goodの「知能爆発」(1965年)

この発想の起源は、アラン・チューリングとともに働いたイギリスの数学者I.J. Goodが1965年に発表した論文「Speculations Concerning the First Ultraintelligent Machine」Advances in Computers, Vol.6)にある。彼の主張は現在も引用され続けている:

「超知能機械を、どんなに賢い人間のあらゆる知的活動をはるかに凌駕する機械と定義しよう。機械の設計はそうした知的活動の一つであるから、超知能機械はさらに優れた機械を設計できる。そうなれば間違いなく『知能爆発(intelligence explosion)』が起こり、人間の知性ははるか後方に置き去りにされるだろう。」 — I.J. Good, 1965

その後、Nick Bostromが著書『Superintelligence』(2014)でこの考えを形式化し、ある能力閾値を越えたシステムが人間の監督が事実上不可能になるほど急速に自己改善しうると論じた。

「弱いRSI」と「強いRSI」

実務上は区別が重要だ。

種別定義現状
弱いRSI 特定タスク(コード・数学など)での自己改善 ✅ すでに実現中
強いRSI システムが中核アーキテクチャや学習アルゴリズム自体を人間の指示なしに書き換える ⚠️ 未実現・論争中

IEEE Spectrum(2026年5月)の整理によれば、RSIは「多くの人にとって多くの意味を持つ」スペクトラムであり、「問題は自己改善が今日存在するかどうかではなく、ループのどれだけが実際に閉じたかである」。

2 技術的メカニズム — どうやって自己改善するか

現在の「自己改善」は主に4つの系統に分類できる。

① Constitutional AI / RLHF / RLAIF — AIがAIを批判する

Anthropicが2022年12月に提案したConstitutional AI(CAI、arXiv:2212.08073)は、人間が有害出力をラベル付けする代わりに、文章で書かれた「憲法(constitution)」の原則をモデル自身に与え、モデルが自らの応答を批判(critique)→修正(revise)するループで学習させる手法だ。これは「AIがAIを監督する」という弱いRSIの実装の一例と言える。

② Self-Play / Self-Refinement / Self-Critique — モデルが自分を評価する

Metaの「Self-Rewarding Language Models」や、NAACL 2025採択の日本発論文「Can Large Language Models Invent Algorithms to Improve Themselves?」(Ishibashi他、NAACL Long Papers 519)など、モデルが自らの出力を評価・改善する研究が急増している。特に後者では「LLMが人間の直感を超えるモデル改善技術を自律的に発明できる」と報告されている。

③ 進化的コード探索 — AlphaEvolveとDarwin Gödel Machine

最も具体的な成果が出ているのがこの系統だ。

🔬 ケーススタディ:AlphaEvolve(Google DeepMind、2025年5月)

GeminiモデルとLLMベースの自動評価器を組み合わせ、進化的フレームワークでアルゴリズムを改善するコーディングエージェント(白書:arXiv:2506.13131)。

  • 行列乗算の記録更新:4×4複素数行列の乗算を48回のスカラー乗算で実現し、シュトラッセンのアルゴリズム(1969年、49回)を56年ぶりに更新した(複素数体における初の改善)。
  • 50超の数学問題に適用:既知の最良解を約75%で再発見し、約20%のケースで従来の最良解を改善した。
  • Googleのデータセンター(Borg):継続的に世界全体の計算資源を平均0.7%回収するヒューリスティックを発見し、本番環境で1年以上稼働中。
  • Gemini訓練の高速化:重要な行列乗算カーネルを23%高速化し、エンドツーエンドで訓練時間を1%短縮。FlashAttentionカーネルは最大32.5%高速化した(別の成果)。
🔬 ケーススタディ:Darwin Gödel Machine(Sakana AI+UBC+Vector Institute、2025年5月)

Schmidhuberの理論的「Gödel Machine」を経験的アプローチに置き換えたもの(arXiv:2505.22954、ICLR 2026採択)。LLMベースのコーディングエージェントが自らのコードを書き換え、ダーウィン的進化(系統樹アーカイブから選択・変異・評価)で改善する。東京・Sakana AIの日本発プロジェクトだ。

  • SWE-benchで性能を20.0%→50.0%へ自律的に向上
  • Polyglotで14.2%→30.7%へ向上(全実験はサンドボックス・人間監督の安全策あり)

④ Chain-of-Thought / Test-Time Compute — 「考える時間」で改善する

o1/o3、Gemini Deep Think等の推論モデルは「考える時間」を増やすことで実行時に性能を上げる。Snell et al.(arXiv:2408.03314、2024)が示したように、テスト時計算をスケールさせる方が、モデルパラメータを増やすより効果的な場合がある。ただし「一度きりのトリック」という側面もあり、チップを増産しない限り繰り返せないという指摘もある。

3 現在の研究動向と主要プレイヤー

🇺🇸 Anthropic
  • Claude Code(2025年2月〜)
  • Constitutional AI / RLAIF
  • 機構的解釈可能性研究(Circuit Tracing)
  • 「When AI builds itself」(2026年6月4日)で内部データを異例の率直さで公開
🇺🇸 OpenAI
  • IMO 2025で実験的推論モデルが金メダル相当(35/42点)
  • 汎用RLとTest-Time Computeスケーリングの新手法
  • GPT-5系コーディングエージェント
🇬🇧 Google DeepMind
  • AlphaEvolve(進化的アルゴリズム探索)
  • Gemini Deep Think(IMO 2025金メダル相当)
  • AlphaProof+AlphaGeometry 2(IMO 2024銀メダル、Nature掲載)
  • AlphaFold 3(ノーベル化学賞)
🇺🇸 Meta
  • Self-Rewarding Language Models
  • 「Co-improvement(共改善)」アプローチを提唱
  • 人間をループに残す協調型RSIを推奨
🇯🇵 Sakana AI(東京)
  • AI Scientist(研究自動化)
  • Darwin Gödel Machine(SWE-bench 20%→50%)
  • 2億ドル調達済み
🇯🇵 日本の研究者
  • NAACL 2025でLLMによるアルゴリズム自律発明を報告(Ishibashi他)
  • 日本政府:AI Safety Institute(AISI)設置

Anthropicの「When AI builds itself」 — 内部データの詳細

2026年6月4日、AnthropicはMarina Favaro+Jack Clark共著でRSIへの自社進捗を異例の率直さで公開した。主要数値は以下のとおりだ。

80%超
2026年5月時点でAnthropicのコードベースにマージされるコードのうち、Claudeが書いた割合
(Claude Code投入前は「数%」)
2026年Q2の典型的エンジニアが2024年比でマージするコード量の倍率
(同社注:コード行数は生産性の過大評価)
52×
Claude Mythos Previewによる社内MLコード最適化ベンチの高速化倍率(Claude Opus 4:約3×)
(熟練人間研究者は4×に4〜8時間)
76%
最も開放的なタスクでのClaude成功率(2026年5月)、6か月で50ポイント上昇
Anthropic内部計測
⚠️ ファクトチェック注記:自己申告データの扱い

上記の数値はAnthropicの自己申告であり、独立検証されていない。同社自身が「コード行数は生産性の過大評価」「8倍は真の生産性向上の過大評価でほぼ確実」と注意書きを付けている。直近の非公開IPO申請と安全ブランドという利害も背景にある点を踏まえ、「Anthropicの主張」として参照すべきだ。

数学の達成 — IMO金メダルという節目

2025年7月のIMO(国際数学オリンピック)第66回大会では、歴史的な節目が訪れた。

システムスコア相当
2024年 AlphaProof+AlphaGeometry 2(DeepMind) 28/42点 銀メダル相当(Nature掲載:2025年11月)
2025年 Gemini Deep Think(DeepMind) 35/42点 🥇 金メダル相当(自然言語エンドツーエンド)
2025年 実験的推論LLM(OpenAI) 35/42点(5問/6問正解) 🥇 金メダル相当(ツールなし・自然言語)

特に重要なのはOpenAIが強調した点——「特定の形式数学システムではなく汎用RLとTest-Time Computeスケーリングを用いたLLMが数学を解いている」という事実だ。答えが形式検証できる数学・コードの領域でRSI的な自己改善が特に有効である理由がここにある。

4 AI安全性とリスク — RSIとAGIの関係

専門家の本音 — 25人インタビュー調査(2026年3月)

MATSプログラム(Berkeley)のField、Douglas、Kruegerによる「AI Researchers' Views on Automating AI R&D and Intelligence Explosions」(arXiv:2603.03338)は、2025年8〜9月にGoogle DeepMind・OpenAI・Anthropic・Meta・UC Berkeleyなど25人の研究者にインタビューした結果をまとめている(182人に依頼し25人が応諾)。

「AI研究の自動化を最も深刻かつ緊急なAIリスクの一つ」と回答
25人中20人(80%)
知能爆発を「AI研究自動化の自然な帰結」として議論に前向き
25人中23人(「RSI」という語を嫌った2名を除く全員)
高度なAIシステムは「内部留保され公衆の目に触れなくなる」と予想
明確に答えた20人のうち約半数(68%)。公開予想は20%

共著者のDavid Kruegerは「コードの99%がAIによって書かれることをAI開発一時停止のレッドラインの一つに挙げ、それは今まさに越えつつあるかもしれない」と述べている(IEEE Spectrum)。

Yoshua Bengioの「Scientist AI」提案

2018年チューリング賞受賞者・国際AI安全報告書議長のBengioは、2025年2月の論文「Superintelligent Agents Pose Catastrophic Risks: Can Scientist AI Offer a Safer Path?」(arXiv:2502.15657、13名共著)で、自律的に計画・行動・目標追求する「エージェント的」AIが欺瞞や自己保存といった意図しない目標を追求しうる危険を論じた。代替案として、行動するのではなく「観測から世界を説明する」非エージェント的な「Scientist AI」を提案。2025年にはLawZeroを共同設立してその実現を追求している。

Anthropicの解釈可能性研究

Anthropicは「ニューラルネットワークを理解せずにその安全性を論じるのは極めて困難」という立場から、機構的解釈可能性(mechanistic interpretability)に注力している。2025年5月に回路追跡(circuit tracing)ツールをオープンソース化し、モデルが詩を書く際に韻を踏む単語を事前に選ぶ(計画する)、多段推論で中間表現を作るといった内部機構を可視化した。MIT Technology Reviewは機構的解釈可能性を2026年のブレークスルー技術の一つに選出している。

規制の動向

EU AI Act:累積訓練計算量が1025 FLOPsを超えるモデルを「システミックリスクを持つ汎用AI(GPAI)」と推定し、敵対的テスト・インシデント報告・エネルギー消費報告などを義務付ける。GPAI向け規定は2025年8月2日に発効した。

日本:英国を範とした「AI Safety Institute(AISI)」を設置し、フロンティアモデルの事前テストに注力している。


5 AI for Scienceとの関係

RSIの「現実的な成果」が最も分かりやすく出ているのが科学研究の自動化領域だ。

AlphaFold 3とノーベル賞

DeepMindのAlphaFold 3(2024年5月、Nature掲載)は拡散モデルアーキテクチャでタンパク質だけでなくリガンド・核酸・イオンなどほぼ全生体分子の構造と相互作用を予測できる。リガンド結合予測で従来のドッキング手法より50%精度向上。Demis HassabisとJohn JumperはAlphaFold開発でノーベル化学賞(2024年)を受賞した。Isomorphic Labsは2024年初頭にEli Lilly・Novartisと総額30億ドルの契約を締結し、創薬応用が現実化している。

GNoMEによる220万結晶の発見

DeepMind+Lawrence Berkeley(2023年11月、Nature)のGNoMEはグラフニューラルネットで220万の新結晶を予測した(人類の約800年分の知識に相当)。うち38万が安定とされ、Lawrence BerkeleyのA-Labでは17日間の自律ロボット実験で予測化合物の71%を合成することに成功した。

Sakana AIのAI Scientist

Sakana AI(東京)のAI Scientist(Lu et al.、arXiv:2408.06292)はアイデア生成→実験→論文執筆→査読まで研究ライフサイクル全体の自動化を目指す。AI Scientist-v2ではAIが完全自律で書いた論文がICLRワークショップの査読を通過し(3本投稿、1本採択)、2026年3月にはNature誌に手法が掲載された。

⚠️ AI Scientistの限界

独立評価(Beel et al.、arXiv:2502.14297)は、文献レビューが単純なキーワード検索に留まり、既知概念を「新規」と誤判定するなどの限界を指摘している。Nature掲載時も当初の主張は大幅に後退させられた。「完全自律の科学者」はまだ誇大な表現だ。

6 ビジネス・産業への影響

ソフトウェア開発の自動化

SWE-bench Verified(実際のGitHub issueを解決するベンチマーク)のスコアは急上昇を続けている:2023年10月は1.96%、2026年4月には約80%超に達した(Claude Opus 4.6、GPT-5.2系など)。重要な発見は「足場(scaffolding)設計がモデル選びと同じくらい効く」という点で、同じモデルでもエージェント枠組みによって大きな性能差が出る。

METRの「タスク長倍増」研究

METR(Beth Barnesが率いるAI安全研究機関)の研究「Measuring AI Ability to Complete Long Software Tasks」(Thomas Kwa他25名、arXiv:2503.14499、NeurIPS 2025採択)は、AIが50%の信頼度で完遂できるソフトウェアタスクの長さ(人間専門家の所要時間で測定)が「2019年以降約7か月ごとに倍増しており、2024年には傾向が加速した可能性がある」と示した。2026年1月の更新版ではこの倍増時間が約4.3か月に短縮し、進捗が約20%加速したと推定している。

7 今後の見通しとタイムライン

AGI予測の前倒しと揺り戻し

6年前には専門家の中央値予測が2060〜2070年だったが、急速に前倒しされた。Metaculusコミュニティ(約2000人)はAGIに2029年までに25%、2033年までに50%の確率を置く。ただし2025年に一度短くなった予測は後半に揺り戻し、Metaculusの「強いAGI」予測は2031年7月から2033年11月へ後退している。

  • Dario Amodei(Anthropic CEO、2026年ダボス会議):「数年内、おそらく2027年までに」
  • Demis Hassabis(DeepMind CEO):「2030年までに約50%」
  • 2778人サーベイ(Grace et al., 2023):高度機械知能の50%確率は2040年

CEO層は2027〜2028年と強気な一方、学術研究者の中央値は2040年と大きく乖離している点に注意が必要だ。

2025–27
弱いRSIの深化 コード生成の自律性向上(SWE-bench 80%超)、数学IMO金の定着、AlphaEvolve型の科学的発見拡大。AI R&Dの「雑務」自動化が進む。
2027–30
正念場(80,000 Hours分析) 計算資源・電力・チップの拡大が頭打ちになり始める時期。RSIが本格化するか逓減するかが分かれる。
2030年以降
知能爆発シナリオの現実性は依然論争的 物理的制約(データセンター建設・発電・金属採掘)が完全なRSIの障壁になるとの慎重論も根強い。

「爆発」か「逓減」か — 二大シナリオ

シナリオ主な論者根拠
知能爆発(Hard Takeoff) Krueger、Clune、Altman、一部のAnthropicチーム タスク長の倍増ペース加速、コード比率80%超、IMO金
逓減的自己改善(Lossy Self-Improvement) Nathan Lambert、Epoch AI周辺(Erdil & Barnett)、Dean Ball 計算資源・データ・電力・物理インフラの制約、知識の分散性

8 まとめ — 技術者・研究者として何を見るべきか

RSIを「来るか来ないか」の二択ではなく「ループのどこが閉じたか」のスペクトラムで捉えることが重要だ。以下、注視すべきポイントをまとめる。

📊 注視すべき閾値・ベンチマーク
  • METRのタスク長倍増時間:7か月→4.3か月への加速がさらに進むか(超指数化)、頭打ちになるか
  • SWE-bench Verified/Pro:80%台からの伸び。特に難問サブセットでの進捗
  • AnthropicのClaudeコード比率:80%超→Kruegerの「99%」レッドラインまでの距離
  • 形式証明可能な数学・科学問題:IMO以降の自己改善ループの一般化
「我々はまだそこ(RSI)には到達していない。RSIは不可避でもない。だが、ほとんどの組織が備えているより早く来るかもしれない。」 — Anthropic Institute「When AI builds itself」(2026年6月4日)

現状の最大の課題は「ループのどこが閉じているか」を客観的に測る指標の欠如だ。Anthropicの数値は自己申告、AI Scientistは独立評価で後退、専門家予測は2040年台まで分散する。この不確実性を直視しながら、METRのタスク長倍増や解釈可能性ツールの進展を地道に追い続けることが、AI時代に一番大切なリテラシーかもしれない。

📌 ファクトチェック・注記

  • AlphaEvolveの行列乗算:「56年ぶりの記録更新」は複素数体上での話。2022年のAlphaTensor(DeepMind、Nature掲載)は有限体(mod 2)で47回を達成しており、体の条件が異なる。AlphaEvolveは複素数体での最初の改善(49回→48回)。
  • Anthropicの自己申告数値:コード80%超・8倍・52倍などは独立検証されていない。同社自身が過大評価の可能性を注記している。
  • IMO 2025スコア:OpenAIとGemini Deep Think両社が35/42点(金メダル相当)を達成した。AlphaProof+AG2はIMO 2024での銀メダル(28点)、論文はNature2025年11月掲載。
  • AI Scientist:Nature掲載時に当初の主張が後退。独立評価(Beel et al.)は文献レビュー・新規性判定の弱さを指摘。
  • AGIタイムライン:Metaculus等の予測は2025年に一度前倒し、後半に揺り戻した。点推定として鵜呑みにせずシナリオ構築の道具として使うこと(RAND推奨)。
  • 本記事は2026年6月時点の情報を基にしている。AI分野は急速に変化するため、モデル名・数値は陳腐化する可能性がある。

金曜日, 6月 05, 2026

Microsoft Build 2026 徹底総まとめ:エージェント時代の「フルスタック」が見えた2日間

Microsoft Build 2026 徹底総まとめ

2026年6月2〜3日、米サンフランシスコの Fort Mason Center で Microsoft Build 2026 が開催された。キーワードは「エージェント(Agentic AI)」。自社シリコン(Maia 200/Cobalt 200)からOS(Windows・Project Solara)、開発ツール(GitHub Copilot app)、クラウド(Foundry・HorizonDB・Fabric)、そして自社モデル群(MAI 7種)まで、スタック全層をひとつの物語で束ねた2日間だった。本記事は公式ブログ・各製品チームの Dev Blog を一次情報として、カテゴリ別に技術的詳細と実務インパクトをまとめる。

1. 開催概要とキーノート

会場はサンフランシスコの Fort Mason Center(例年の Moscone Center は別イベントが入っていたため変更)。基調講演は CEO Satya Nadella が約2時間半にわたって登壇し、ゲストとして NVIDIA CEO Jensen Huang(台北/Computex からライブ中継)、Qualcomm CEO Cristiano Amon、Mayo Clinic CEO Gianrico Farrugia らが登場した。

公式ブログ「Microsoft Build 2026: Be yourself at work」(著者:Kyle Daigle、GitHub COO 兼 Developer 部門 CMO)は3つのテーマを提示している。

  1. Intelligence that's truly yours(本当にあなたのものである知能)
  2. The full stack built your way(あなたのやり方で組み上げるフルスタック)
  3. What comes next(次に来るもの)

今年の Book of News に相当する公式リアルタイムブログ Microsoft Build Live(news.microsoft.com/build-2026-live-blog)に100件超の発表が集約されている。

2. AI・Copilot 関連の発表

2-1. Microsoft IQ:エージェントの「コンテキスト層」

今回の最重要概念が Microsoft IQ だ。GitHub Copilot・Microsoft Foundry・Copilot Studio をまたいでエージェントを「仕事の知識」と「世界の知識」の双方に接地(グラウンディング)させるコンテキスト層として、全体的に GA(一般提供)となった。4つのコンポーネントで構成される。

コンポーネント 概要 提供状況
Work IQ メール・会議・ドキュメント・組織構造など M365 全体の「仕事の進み方」を捉える職場インテリジェンス層。Work IQ API は Chat/Context/Tools/Workspaces の4ドメイン。課金は Copilot Credits の従量制。 API:6/16 GA予定
Fabric IQ 構造化業務データに対する共有セマンティック基盤。オントロジー・グラフ・Power BI セマンティックモデルを通じて自然言語クエリを可能にする。 GA
Foundry IQ Work IQ・Fabric IQ・Azure SQL・File Search・MCP を1つのSLA付き検索エンドポイントに統合する知識層。Serverless 階層がプレビュー。 GA(Serverless はプレビュー)
Web IQ 今回新発表。AIファースト・MCPネイティブの Web 検索スタック。公式ブログは「次点の代替手段の約2.5倍速で関連パッセージを返す」と主張(比較対象は匿名。第三者検証なし)。Microsoft Copilot と ChatGPT のグラウンディングを支えると説明。 GA

2-2. MAI モデル群:自社製7モデルを一挙発表

Microsoft AI チーム(Mustafa Suleyman が率いる Microsoft AI Superintelligence Team)が自社開発の新モデル7種を発表した。いずれも OpenAI データを一切使わず、商用ライセンス済みデータでフルスクラッチ学習した点を強調している。

モデル 種別 概要 主要ベンチ/スコア 提供状況
MAI-Thinking-1 推論
Reasoning
アクティブ35B(総計約1T)sparse MoE。256K コンテキスト。商用ライセンスデータのみ・蒸留ゼロで学習。Surge の盲検人間評価で Claude Sonnet 4.6 より選好。 AIME 2025: 97.0%
AIME 2026: 94.5%
SWE-Bench Pro: Opus 4.6 相当
※自社ベンチ
Foundry
プライベートプレビュー
MAI-Code-1 コーディング GitHub・VS Code 向けにチューニングされた推論効率重視のコーディングモデル。公式ブログではこの名称で案内。 Copilot・
VS Code でGA
MAI-Code-1-Flash コーディング
(軽量)
5B パラメータの軽量コーディングモデル。VS Code のデフォルトとして6/2からロールアウト開始。 SWE-Bench Pro: 51%
(Haiku 4.5 比 +16pt)
IF Bench: +28.9pt
※自社ベンチ
VS Code でGA
MAI-Image-2.5
(+Flash)
画像生成 text-to-image と image-to-image の両方に対応。PowerPoint に搭載済み、OneDrive に展開中。 t2i: Arena #3
i2i: Arena #2
(Nano Banana 2 超え)
PowerPoint GA
Foundry展開中
MAI-Transcribe-1.5 音声認識 43言語対応(日本語含む)。ストリーミング対応が近日予定。 FLEURS 平均WERで GPT-4o-Transcribe・Scribe v2・Gemini 3.1 Flash Lite 超えと主張
※自社ベンチ
Foundry 展開中
MAI-Voice-2
(+Flash)
音声合成 15言語以上に対応。新しい音声オプションを追加。音声クローニングへの不正使用防止機能を内蔵。 Foundry 展開中

※ 7モデルの内訳は MAI-Thinking-1・MAI-Code-1・MAI-Code-1-Flash・MAI-Image-2.5・MAI-Image-2.5 Flash・MAI-Transcribe-1.5・MAI-Voice-2(+Flash)の構成と報道されている。Flash バリアントの扱い方で数え方が異なる記事もある。

Maia 200 上での最適化により、GB200 比で性能/電力比が1.4倍改善したと Mustafa Suleyman が言及。モデルは Foundry 経由に加え、Open Router・Fireworks AI・Baseten でも提供される。

2-3. エージェント基盤:Microsoft Foundry Agent Service

Foundry Agent Service では本番運用向けの「ホステッドエージェント(hosted agents)」がプレビュー登場(GA は2026年7月初頭予定)。各セッションが専用コンピュート・メモリ・ファイルシステムを持つサンドボックスで動作し、Microsoft Agent Framework・GitHub Copilot SDK・LangGraph などフレームワーク非依存でデプロイできる。

主なアップデートは以下の通り。

  • Toolboxes(プレビュー):全ツールを単一のMCP互換エンドポイントに集約し、認証・ライフサイクル・ガバナンスを Foundry が肩代わりする。
  • Microsoft Agent Framework 1.0:Python と .NET でGA。
  • Frontier Tuning(プライベートプレビュー):コンプライアンス境界内で強化学習を適用し、エージェントが自社の業務スタイルを学習する。
  • Agent Optimizer(プライベートプレビュー):観測→評価→最適化→デプロイのループを実現する可観測性機能。OpenTelemetry 経由で LangChain・LangGraph・OpenAI SDK 等に対応。
  • Microsoft Scout:OpenClaw と Work IQ を基盤とする常時稼働の個人用エージェント(「Autopilots」カテゴリ)。Frontier プログラム経由で提供開始。

2-4. Microsoft 365 Copilot:Cowork とエージェントモードの拡大

Word・Excel・PowerPoint・Outlook で Agent Mode が拡大。Copilot Cowork は長時間・複数ステップのタスクを委任できるエージェント体験で、iOS/Android対応・再利用可能な Skills・Fabric や Dynamics 365 等 Plugins に対応する。タスクは「何を送信・投稿・スケジュールするか」を事前プレビューしてから実行する設計で、ユーザーが制御を維持できる。Frontier プログラム経由で提供。

2-5. セキュリティ:Agent 365 と MDASH

Agent 365 for local agents は Entra・Defender・Purview を単一のコントロールプレーンに拡張し、ホスト場所やフレームワークに依存せずエージェントを観測・統治・保護する。オープンソースとして ASSERT(ポリシー駆動の安全性評価)と Agent Control Specification(エージェントループ制御の標準化)も公開された。

Codename MDASH は100以上のエージェントを展開してデータフロー・ビジネスロジック・エクスプロイトチェーンを推論し、Defender Portal に文脈対応の修正を直接届けるマルチモデル型エージェントセキュリティシステム。Agent 365 と MXC(後述)との統合は2026年7月開始予定。

3. Azure 関連の発表

3-1. 自社シリコン:Azure Cobalt 200 と Maia 200

Azure Cobalt 200 は Arm Neoverse V3(CSS V3)、TSMC 3nm(N3P)採用で SoCあたり132コア構成(VMは最大128 vCPU)。Cobalt 100 比で最大50%のパフォーマンス向上を謳い、早期アクセスプレビューとなった。設計に35万超の構成候補を評価するデジタルツインシミュレーションを活用。Azure Boost 統合でネットワーク・ストレージ性能を底上げする。

Maia 200(2026年1月発表・本番稼働済み)は TSMC 3nm、216 GB HBM3e(7 TB/s)、FP4 で10ペタFLOPS超の AI 推論アクセラレータ。現行フリート比でパフォーマンス/ドルが30%優れるとされ、MAI モデルとの共同設計で性能/電力比がさらに1.4倍向上。最大6,144アクセラレータまで標準 Ethernet でスケール。米中部(アイオワ)に展開済みで米西部3(アリゾナ)が続く。

3-2. Azure HorizonDB:AI 時代の PostgreSQL 互換サービス

マネージド PostgreSQL 互換サービス Azure HorizonDB がパブリックプレビューとなった。コンピュートとストレージを分離するスケールアウト型アーキテクチャで、主な特徴は以下の通り。

  • 最大128 TB のデータベース規模
  • 読み取りスケールアウト:最大15のリードレプリカ
  • 可用性ゾーン間サブミリ秒コミットレイテンシ(フェイルオーバー5秒未満)
  • コンピュートは最大3,072 vCore までスケール
  • 自己管理型 PostgreSQL 比で最大3倍高速と主張(Microsoft 内部ベンチマーク。第三者検証なし)
  • DiskANN による高度フィルタリング付きベクトル検索、DB内 AI モデル管理などネイティブ AI 機能

VS Code 用 PostgreSQL 拡張機能(インストール数50万超・Oracle→PostgreSQL の AI スキーマ変換含む)もGAとなった。プレビュー開始リージョンは Australia East・Central US・Sweden Central・West US 2・West US 3 の5つ。Japan East を含む追加リージョン(East US・Canada Central・Indonesia Central・Italy North・Japan East・Korea Central・Poland Central)が数週間以内に追加予定と公式エンジニアリングブログが明記している。

3-3. Microsoft Fabric のアップデート

Fabric IQ がGA、グラフ機能がGA。GPU 高速化 Fabric Data Warehouse(早期アクセス)が登場し、NVIDIA アクセラレーテッドコンピューティング上でクエリを書き換えなしに実行、内部ベンチマークで主要クラウド DWH 比最大7倍速を謳う(この研究「CoddSpeed」は SIGMOD 2026 Best Industry Paper を受賞)。

Database Hub(プライベートプレビュー)は HorizonDB・Azure Database for PostgreSQL・Cosmos DB を一元管理し OneLake にミラーする。また Anyscale on Azure(Ray on AKS)パブリックプレビュー、PostgreSQL flexible server の V6 コンピュート SKU(最大192 vCore・PostgreSQL 18対応・エラスティッククラスタ)、Intel TDX を用いた Confidential Live Migration なども発表された。

4. 開発者ツール関連の発表

4-1. GitHub Copilot app:エージェントネイティブなデスクトップ

GitHub Copilot app(テクニカルプレビュー、Windows 11/Mac/Linux 対応)が最大の目玉の一つ。「My Work」ビューから接続リポジトリ全体のアクティブセッション・Issue・PR・バックグラウンド自動化を一望できる「エージェント司令塔」を志向する。

  • 各セッションは独立した git worktree で動作し、並列エージェントが互いに干渉しない
  • Agent Merge:CI監視・必須レビュアー追跡・失敗チェック対応でレビュー〜マージを伴走
  • Canvas:人とエージェントの双方向作業面
  • ローカル/クラウドのサンドボックスに対応
  • 利用には Copilot Pro/Pro+/Business/Enterprise が必要。ヘビーユーザー向け Copilot Max も用意。Free 向けにはウェイトリストが開設

あわせて GitHub Copilot SDK(Node.js/TypeScript・Python・Go・.NET・Rust・Java でGA)、Copilot CLI 刷新(タブ式UI・/every 定期実行コマンド)も発表。LaunchDarkly・Amplitude・Sonar・PagerDuty・Miro などのパートナー製エージェントアプリも統合される。なお GitHub は週次の Actions が20億分超、月間コミットが14億件超に達したと述べている。GitHub Universe は2026年10月28〜29日(San Francisco・Fort Mason)開催予定。

4-2. Visual Studio / VS Code のアップデート

Visual Studio は AI 統合の基盤を GitHub Copilot SDK へ移行。Copilot がチャット・補完を超え、デバッグ・プロファイリング・テストに能動的に参加するエージェントへ進化する。主な発表は以下の通り。

  • ビルド開始前のエラー・警告チェック
  • AI支援によるマージコンフリクト解決
  • モダナイゼーション機能(Web Forms→Blazor 移行・既存アプリへの Aspire 追加)
  • BYOK/BYOM(ローカル/クラウドの任意モデルを利用可能に)

VS Code では MAI-Code-1-Flash がデフォルトモデルとしてロールアウト開始。Foundry Toolkit for VS Code(GA)によりエディタを離れずにエージェントの作成・ローカルデバッグ・デプロイが可能になった。また Project Rayfin(プレビュー)が Microsoft Fabric 上のマネージド backend-as-a-service を提供し、Replit との連携でプロトタイプから本番展開への高速パスを実現する。

5. Windows・プラットフォーム関連の発表

5-1. 開発プラットフォームとしての Windows 強化

機能 概要 提供状況
Coreutils for Windows Rust 製 uutils ベースの75以上のUNIX系コマンドラインユーティリティをWindowsネイティブで提供。winget install Microsoft.Coreutils で導入可能。 GA
WSL containers サードパーティツール不要で CLI/API から Linux コンテナを直接扱える。WSL は Build 2025 でOSS化以降、月200超のPRを集めている。 近日パブリックプレビュー
Windows Developer Configurations WinGet で VS Code・GitHub Copilot・WSL・PowerShell 7 等をワンコマンド構築。Windows 365 にも同構成(プレビュー)を提供。 GA
Intelligent Terminal ACP(Agent Communication Protocol)を用い、ターミナル内に AI エージェントペインを統合。既定エージェントは GitHub Copilot。 実験的プレビュー
Windows Development Skills WinUI 3 と winapp CLI を使い、エージェントがネイティブ Windows アプリをエンドツーエンドで構築するための構造化知識。 GA

5-2. エージェントランタイム:MXC(Microsoft Execution Containers)

MXC(プレビュー)は Windows と WSL をまたぐポリシー駆動のエージェント実行層。開発者がエージェントのアクセス範囲(ファイル・ネットワーク等)を宣言すると OS が実行時に境界を強制する。高速プロセス分離からセッション分離まで、ワークロードに応じた分離レベルを単一の SDK/ポリシーモデルで提供。NVIDIA の OpenShell(自律エージェント向けセキュアランタイム)も MXC を利用し、ポリシー管理・推論ルーティング・PII 難読化を追加する。Agent 365 との統合は2026年7月開始予定。

5-3. オンデバイス AI:Aion 1.0

Windows 向けの新世代オンデバイス小規模言語モデル(SLM)Aion 1.0 が発表された。

  • Aion 1.0 Instruct:要約・書き換え・意図検出などのテキスト処理向け。CPU でも動作し対応PC の裾野が広い。Edge Insider チャネルでプレビュー。2026年7月に Hugging Face でオープンウェイト公開予定。
  • Aion 1.0 Plan:推論・ツール呼び出し対応モデル。ユーザー意図の推論・ツール起動・ファイル管理・サブエージェント統括をローカルで実行する。対応デバイスに同梱(in-box)予定で、今後数か月での提供を予告。

Aion 1.0 Plan は AMD・Intel・Qualcomm の CPU/NPU と NVIDIA RTX Spark に対応。Windows AI APIs も拡張され、NPU/CPU 上での音声認識(新 Speech Recognition API・プレビュー)、対応 dGPU 上での SLM テキストインテリジェンス、CPU 上での Video Super Resolution なども追加された。

5-4. Surface RTX Spark Dev Box

開発者向けの新ハードウェア Surface RTX Spark Dev Box が発表された。NVIDIA RTX Spark(Grace CPU 20コア + Blackwell GPU 6,144 CUDA コア)を搭載し、最大1ペタFLOPS の AI 演算と128 GB のユニファイドメモリ(CPU・GPU 間で共有)を備える。クラウド GPU なしで120B パラメータ超の LLM をローカル実行可能。WSL 2+ネイティブ GPU パススルー(CUDA 対応)、VS Code・GitHub Copilot・Python・Git・Node.js・PowerShell 7 などがプリインストールされた開発即戦力構成。

⚠️ 注意:Microsoft Build Live ブログは「Surface RTX Spark Dev Box は FCC 認可を未取得であり、認可取得まで販売・リースはできない」と明記している。米国での販売開始時期は認可取得後となる見込み。

5-5. Project Solara:エージェントファースト・デバイスの新プラットフォーム

Microsoft Applied Sciences Group の CVP・Technical Fellow Stevie Bathiche が率いるチームが、アプリではなく AI エージェントを動かす「エージェントファースト」デバイス向けの chip-to-cloud プラットフォーム Project Solara を発表した。

  • OS:Windows ではなく MDEP(Microsoft Device Ecosystem Platform)=AOSP ベースのエンタープライズ Android。理由は小型・低消費電力デバイスへの対応と、Intune・Entra ID・Defender などエンタープライズ管理機能の維持を両立するため。
  • Just-in-time UI:エージェントがデバイスやタスクに応じて動的にUIを生成する設計。
  • 概念デバイス:据置型デスクコンパニオンとウェアラブルバッジの2種(Qualcomm・MediaTek がリファレンス設計に協力)。
  • パイロット参加予定:AccuWeather・Best Buy・CVS Health・Levi's・Target 等が数か月以内に参加予定と発表。

なお、これらはリファレンスデザインであり、Microsoft が自ら製品として販売するものではない。

6. 科学・量子コンピューティング

Microsoft Discovery がGAとなった。Azure 上に構築された科学ワークフロー全体のためのエージェント型 AI プラットフォームで、BHP(銅の浸出ソリューション)・Syensqo(半導体R&D)・GSK(創薬)などが活用している。GitHub Copilot アカウントだけで使える無料の Discovery ローカルアプリもプレビュー提供され、Mayo Clinic とはヘルスケア向けフロンティアモデルの共同開発が発表された。

次世代量子チップ Majorana 2 も披露された。前世代(Majorana 1)比で1,000倍超の信頼性向上、平均クォービット寿命20秒・最大1分を達成(別ソースでは平均29秒とも報告。公式ブログの「20秒」表記を優先するが、計測条件が異なる可能性がある)。手のひらサイズのチップで100万クォービットへの道筋を謳い、エージェント型 AI の助けを借りて2029年までにスケーラブルな量子マシンを実現するとのロードマップが示された。ただし独立した物理学者による Majorana 2 の性能主張への異議申し立てが複数報道されており、peer review 結果を待ちたい。

7. 日本市場・日本語対応

  • Azure HorizonDB:プレビュー開始時のリージョンに日本は含まれないが、公式エンジニアリングブログは Japan East を「数週間以内に追加されるリージョン」の一つとして明記している。
  • MAI-Transcribe-1.5:43言語対応に日本語が含まれることを Foundry のモデルカタログで確認できる。
  • MAI-Voice-2:公式ブログは「15言語以上」と記載するが、日本語が含まれるかの公式明記は現時点では確認できていない(未確認)。
  • Microsoft 365 Copilot の日本語対応:Copilot は日本語(ja-JP)を公式サポート済み。Agent Mode も標準 Copilot 言語サポートに準じる見込みだが、機能名指しでの公式明記は確認できていない。
  • 日本マイクロソフト公式イベント:「Best of Microsoft Recap Day Japan 2026」が開催され、公式日本語抄訳(news.microsoft.com/source/asia)も公開されている。

8. まとめ・総評と実務アクション

Build 2026 を一言で表すなら「エージェントのためのフルスタック」だ。Microsoft は (1) 自社シリコン(Cobalt 200/Maia 200)、(2) OS とローカルランタイム(MXC・Aion・Surface RTX Spark Dev Box)、(3) クラウド基盤(Foundry・HorizonDB・Fabric)、(4) 開発ツール(GitHub Copilot app・Visual Studio)、(5) 自社モデル(MAI 7種)、(6) ガバナンス(Agent 365・MDASH)という全層を「エージェントを開発・運用・統治する」という一本の物語で束ねた。単一モデルへの依存を避け、モデル多様(model diverse)・オープン・ヘテロジニアスを強調した点も際立っていた。

実務面での重要度が高い発表は以下の4点だ。

  1. Microsoft IQ/Work IQ API による「コンテキスト層」の標準化
  2. Foundry Agent Service のフレームワーク非依存ホスティングと OpenTelemetry 可観測性
  3. MXC(Windows エージェントサンドボックス)と OS 強制ガバナンス
  4. GitHub Copilot app による並列エージェント管理

一方、多くの機能はプレビュー/プライベートプレビュー段階であり、Copilot Credits の従量課金・ガバナンス・モデルロックインの観点で慎重な評価が求められる。HorizonDB の「3倍」、Web IQ の「2.5倍速」、Cobalt 200 の「50%向上」といった性能値も Microsoft 自社ベンチマークであり、本番採用判断前の自前検証を推奨する。

推奨アクション
タイミング アクション
今すぐ(GA済み) Coreutils for Windows・Windows Developer Configurations を開発環境に導入。VS Code の Foundry Toolkit でエージェントをローカル実行。MAI-Code-1-Flash を VS Code モデルピッカーで試す。
近い将来(評価フェーズ) Work IQ API を1コール試験し、Copilot Credits の消費量を測定。Japan East での HorizonDB GA を待ちつつ、他リージョンでベクトル検索・DB内モデル管理をPoC。
採用判断の閾値 プレビュー機能はSLA・課金体系・日本リージョン提供が明示された段階で本格採用を検討。Copilot Credits は M365 管理センターで上限・アラートを設定してから有効化。

出典・注記:The Official Microsoft Blog「Microsoft Build 2026: Be yourself at work」(Kyle Daigle)、Microsoft Build Live(news.microsoft.com/build-2026-live-blog)、Microsoft AI 公式ブログ「Introducing MAI-Thinking-1」「Microsoft Build 2026: MAI keynote transcript」、Windows Developer Blog「Build 2026: Furthering Windows as the trusted platform for development」、Microsoft Foundry Blog、GitHub Blog、Azure Blog/Microsoft Community Hub(HorizonDB・PostgreSQL・Cobalt 200)、Microsoft 365 Blog(Work IQ API・Cowork)、Command Line「Composing a new platform for agent-first devices」(Project Solara)、GeekWire「Inside Microsoft's Project Solara」ほか、公式一次情報および主要技術メディアの報道に基づく。性能数値の多くは Microsoft 内部ベンチマークであり第三者検証は未実施。多数の機能はプレビュー段階のため、提供状況・名称・課金は今後変更され得る。Majorana 2 については独立した研究者による反論が報告されており、peer review の結果を参照することを推奨する。

Google I/O 2026 完全網羅レポート

Google I/O 2026 完全網羅レポート:「エージェント型Gemini時代」の幕開け

2026年5月19〜20日 / Mountain View, CA

Google I/O 2026 完全網羅レポート

「エージェント型Gemini時代」の幕開け

※ ファクトチェック済(公式ブログ・Alphabet Q1決算・DeepMind モデルカード等で検証)

📌 TL;DR(3点まとめ)

① Google I/O 2026(2026年5月19〜20日、Mountain View)の中心テーマは「agentic Gemini era(エージェント型Geminiの時代)」。最大の発表は新モデル2本――アクションに特化した「Gemini 3.5 Flash」(当日GA)と、あらゆる入力から動画を生成・編集できる世界モデル「Gemini Omni(Omni Flash)」――、および24時間稼働する個人AIエージェント「Gemini Spark」だった。

② AIは「答えるAI」から「自律的に行動するエージェント」へと移行し、Search・Gemini app・ショッピング(Universal Cart)・開発(Antigravity 2.0/Managed Agents)・Android(Gemini Intelligence)・Android XR(インテリジェント・アイウェア)まで、全製品スタックにエージェント機能が浸透した。

③ 多くの目玉機能(Spark、情報エージェント、生成UI、Workspace音声機能など)はテスター限定・米国先行・サブスク限定で、本格展開は2026年夏以降。Gemini 3.5 Proは2026年6月提供予定(執筆時点で未GA)。サンダー・ピチャイCEOは2026年の設備投資ガイダンスを$180〜190 billion(1,800〜1,900億ドル)に引き上げると表明した(Alphabet Q1 2026決算、2026年4月29日:従来予想$175〜185Bから上方修正、CFO Anat Ashkenaziは2027年も「significantly increase」と明言)。

1. キーノートの骨格とピチャイCEOのメッセージ

イベントは2026年5月19日(火)午前10時PT、Mountain ViewのShoreline Amphitheatreで開幕した(開発者向けキーノートは同日13:30 PT)。ピチャイCEOは「AIファースト転換から10年」を振り返り、カスタムシリコン→研究・モデル→製品という「フルスタック」アプローチを強調した。

スケール指標として挙げられた数字は以下のとおり(公式ブログ「I/O 2026: Welcome to the agentic Gemini era」より)。

指標 数値 備考
月間トークン処理量 3.2 quadrillion超 前年比7倍(前年:約480兆、2年前:9.7兆)
API トークン処理速度 約190億トークン/分 前回決算発表比(約100億/分)から約2倍
月次モデル利用開発者数 850万人超 毎月新規アプリ・体験を構築
Gemini app MAU 900万MAU超 前年(I/O 2025時点)の400万から1年で倍増超。日次リクエストは7倍超
AI Overviews MAU 25億MAU超 Google全体で最もAIを届けているプロダクト
AI Mode MAU 10億MAU突破 投入からわずか1年で到達
10億MAU超プロダクト数 13製品 うち5製品が30億MAU超
Nano Banana 生成画像累計 500億枚超 画像生成モデルの累計利用実績
SynthID 透かし付与実績 1,000億超の画像・動画、6万年分の音声 Gemini appでの検証利用は5,000万回超
大型Google Cloud顧客 375社超 過去12カ月で各社1兆トークン超を処理

ピチャイCEOは閉会の辞として「我々は明確にエージェント型Geminiの時代にいる」と締めくくった。

2. AI・Geminiモデル

2-1. Gemini 3.5 Flash(GA)

✅ GA(2026年5月19日) ⭐ 重要度:★★★★★

「frontier intelligence with action」を掲げるGemini 3.5系の第1弾。Gemini 3 Flashを基盤に「thinking levels」を載せた自然マルチモーダル推論モデルで、当日より全プロダクト・APIでGA提供が開始された。

入力モダリティ テキスト・画像・音声・動画・PDF(最大100万トークン文脈)
出力 テキスト最大64Kトークン(公式モデルカード値)
知識カットオフ 2025年1月
APIモデルID gemini-3.5-flash(stableステータス)
API価格(標準) 入力 $1.50/M トークン、出力 $9.00/M トークン、キャッシュ入力 $0.15/M(90%割引)
速度 「比較フロンティアモデルの4倍速い」(ピチャイ発言)、Antigravity向けに最適化版は「12倍速」
主なベンチマーク Terminal-Bench 2.1:76.2%、GDPval-AA:1656 Elo、MCP Atlas:83.6%、CharXiv:84.2%(いずれも3.1 Proを上回る)
弱点 Humanity's Last Exam・ARC-AGI-2・長文脈テスト(128K MRCR v2)は3.1 Proに及ばず、Pro層の完全置き換えではない
配布先 Gemini app、Gemini API(AI Studio等)、Search AI Mode(グローバルデフォルト)、Antigravity 2.0、Gemini Enterprise
⚠️ コスト注意点:thinkingトークンは出力レートで課金されるため、高推論設定ではトータルコストが3.1 Proを上回る場合がある(Simon Willison氏ら複数エンジニアが指摘)。本番投入前に実ワークロードでのコスト計測を推奨。

2-2. Gemini 3.5 Pro(2026年6月提供予定・執筆時点未GA)

社内での利用が先行しており、2026年6月提供予定とピチャイCEOが発表。ただし執筆時点(2026年6月5日)ではまだ一般提供(GA)には至っておらず、Gemini 3.1 ProがProティアのAPI現行バージョンとして提供継続中。提供開始後に改めて詳細確認が必要。

2-3. Gemini Omni / Gemini Omni Flash(動画出力GA)

✅ GA(Gemini app・Flow・YouTube Shorts) 🔜 API:数週間以内 ⭐ 重要度:★★★★★

Google DeepMind Koray Kavukcuoglu CTO発表の次世代マルチモーダルモデル。「Geminiの推論能力と創造能力が出会う場所。world understanding(世界理解)、マルチモーダリティ、編集における飛躍をもたらす」と説明され、あらゆる入力(テキスト・画像・音声・動画)からあらゆる出力モダリティを生成できる設計が特徴。動画出力からスタートし、将来的に画像・テキストも対応予定。

transformerベースのネイティブマルチモーダルモデルで、重力・運動エネルギー・流体力学などへの直感的理解が向上。会話による逐次編集が可能で、キャラクターの一貫性(外見・声)を全シーンで保持する。全生成コンテンツにSynthIDの不可視ウォーターマーク+C2PA Content Credentialsを付与。

一点注意が必要なのは、Veo・Nano Banana・Genie 3はDeepMindのモデルカタログ上で独立したモデルとして存続しており、GeminiOmniがそれらを「置き換え・統合する」という公式言明はない点だ。公式ベンチマーク数値も現時点では未公表で、API公開時に評価結果が開示される予定。

2-4. Gemini Spark(24/7パーソナルエージェント)

🧪 Beta:米国のAI Ultra加入者向け ⭐ 重要度:★★★★★

Gemini app内の個人AIエージェント。Google Cloud VM上で24時間稼働し、ノートPCを閉じても背景でタスクを継続。Gemini 3.5+Google Antigravity harnessで長期タスクを実行する。Gmail・Docs・Slides等の自社ツールと統合し、夏にかけてMCP(Model Context Protocol)経由でCanva・OpenTable・Instacart等の第三者ツールに拡大予定。重大なアクションの前に確認を取る設計になっている。

提供状況:トラステッドテスターへの先行ロールアウト後、翌週(5月26日週)より米国のGoogle AI Ultra加入者($100・$200両プラン対象)向けBeta。Android Haloでステータスバーから進捗確認が可能。将来的にChrome内でのエージェント型ブラウジングにも対応予定。

3. インフラ:TPU第8世代・設備投資

3-1. TPU第8世代(TPU 8t / TPU 8i)

2026年4月のGoogle Cloud Next 2026で発表された第8世代TPU。今世代初めてのデュアルチップ構成で、訓練用「TPU 8t」と推論用「TPU 8i」に役割を分離している。Google DeepMindとの共同設計であり、フロンティアモデル訓練・エージェント開発・大規模推論ワークロードに対応する。

項目 TPU 8t(訓練特化) TPU 8i(推論特化)
用途 フロンティアモデルの訓練高速化 低レイテンシー推論・エージェント処理
スーパーポッド構成 最大9,600チップ、共有HBM 2PB 最大1,152チップ(前世代256から拡大)
演算性能 121 ExaFlops (FP4)、前世代比ほぼ3倍 11.6 ExaFlops (FP8)、ポッドHBM総容量 331.8TB
on-chip SRAM 384MB(前世代比3倍)、HBM 288GB
稼働率目標 goodput 97%以上(故障時自動迂回等) KVキャッシュ最適化で低レイテンシー維持
ホストCPU 両チップとも Google Axion ARMベースCPU(初の自社CPU採用)

ネットワーク面では新しい「Virgo Network」ファブリックを導入。TPU 8tについては、単一データセンター内で134,000チップを接続でき、さらに複数データセンターにまたがる論理クラスターとして100万チップ超での訓練が可能(JAX+Pathwaysソフトウェアとの組み合わせによる)。これは単一の建屋・単一クラスターではなく、複数拠点を束ねた構成であることに留意。

✅ TPU 8tの訓練加速:Googleは「フロンティアモデルの開発サイクルを数ヶ月から数週間に短縮できる」と公式に述べている。

3-2. 設備投資(CapEx)

Alphabet Q1 2026決算(2026年4月29日)でCFO Anat Ashkenaziが更新した2026年CapExガイダンスは$180〜190 billion。従来予想の$175〜185Bからの引き上げで、Intersect社(データセンター、2026年3月クローズ)の買収関連投資を含む。2027年は「significantly increase」と明言。2022年実績の約310億ドルと比較すると6倍規模への増加となる。

4. Android・デバイス

4-1. Android 17 と Gemini Intelligence

Android 17(API level 37、コードネーム:Cinnamon Bun)は、2026年5月12日の「The Android Show: I/O Edition」で先行公開された。安定版は2026年6月頃にPixelデバイス向けに順次展開予定(他OEMは2026年Q3後半以降の見込み)。

今世代の最大テーマはAndroidを「OS」から「intelligence system(知能システム)」へ進化させること。Gemini Intelligenceがアプリ横断の自律タスク(例:Gmailからシラバスを見つけ必要書籍をカートに追加)を背景実行する。主な新機能は以下のとおり。

  • Create My Widget:自然言語でウィジェットをその場生成
  • Rambler(Gboard):音声ディクテーションをGeminiが整形
  • Pause Point:ドゥームスクロール抑止機能
  • Live Threat Detection強化:端末上のリアルタイム脅威検知
  • Android Halo:エージェント(Spark等)の進捗をステータスバーに表示(年内対応予定)
  • Googlebook:Gemini Intelligence前提のプレミアムAIノートPCカテゴリ。Acer・ASUS・Dell・HP・Lenovo等から年内投入予定
  • Android Auto:Material 3 Expressive、Immersive Navigation(3D)、Gemini連携(16ブランド100車種超)

なお大画面(sw > 600dp)向けのadaptive layout対応は、API 37ターゲットアプリに対してオプトアウト不可で必須化される(従来の向き制限・サイズ変更制限の回避属性が無効化)。開発者は早急な対応確認が必要。

4-2. Android XR:インテリジェント・アイウェア

2種類のXRグラス形状が発表された。

音声グラス(今秋発売予定):Samsung・Qualcomm基盤、外装はGentle Monster(前衛的デザイン)とWarby Parker(伝統的デザイン)が担当。AndroidとiOS両対応。「Hey Google」またはフレームのタップでGemini起動。道案内、視界内オブジェクトへの質問、アプリ連携(Uber配車等)が可能。

ディスプレイ・グラス:レンズ内情報表示・リアルタイム翻訳機能を備える上位モデル。詳細は今後公開予定。

5. 開発者向け技術

5-1. Google Antigravity 2.0

エージェントファースト開発プラットフォーム。スタンドアロンのデスクトップアプリとして提供され、複数エージェントの並列オーケストレーションが可能。サブエージェント・hooks・非同期タスク管理などのプリミティブが追加され、Gemini 3.5 Flashと協調最適化されている。

Antigravity CLIは当日より全ユーザー向け提供開始。なお既存のGemini CLI(Gemini Code Assist IDEエクステンション含む)は2026年6月18日にサンセットとなり、AI Pro・Ultra・無料個人向けユーザーのリクエスト受付が停止される(企業向けCloud組織ライセンスは別途猶予あり)。公式Developers BlogにAntigravity CLIへの移行ガイドが公開済みのため、早急な確認を推奨。

5-2. Managed Agents(Gemini API)

単一API呼び出しでリモートLinuxサンドボックス付きエージェントをプロビジョニング。AGENTS.md/SKILL.mdで挙動を定義。Interactions API・AI Studioで提供。

5-3. Jules(非同期コーディングエージェント):GA

隔離VM上でタスクを実行しPRを返す非同期コーディングエージェント。I/O 2026でGAに到達。有料プランはGemini 3.1 Pro、無料はGemini 3 Flashを採用。Jules Toolsというターミナル向けCLIも同時提供。次世代版(社内コード名「Jitro」)はゴール駆動(KPI駆動)型へ進化する計画。

5-4. MCP(Model Context Protocol)対応

Google CloudサービスへのフルマネージドリモートMCPサーバーを発表。BigQuery・Maps Grounding Liteから順次、Cloud Run・Storage・AlloyDB等は数カ月以内に対応予定。Spark・Antigravityの第三者ツール連携もMCP経由で実現。自社API・ツールをMCPサーバー化すれば、Spark・Antigravity・他社エージェント(Claude/Cursor等)からも横断利用が可能になる。

またWebMCP(ブラウザエージェント向けにJS関数・HTMLフォームを構造化ツールとして公開する提案標準)がChrome 149でオリジントライアル開始。

5-5. Google AI Studio

ネイティブAndroid(Kotlin)vibe coding、Workspace統合、Cloud Run/Firebaseへのワンクリックデプロイ、Play Console連携(内部テストトラックへ公開)、Antigravityへのエクスポート、モバイルアプリ(近日)。最初の2アプリはCloud無料デプロイ対応。

5-6. その他開発者向け発表

  • Gemma 4(オープンウェイト、2026年4月リリース済み):E2B/E4B/26B/31Bバリアント、Android Bench リーダーボード追加
  • Firebase:Gemini Live APIのセッション再開、Google Maps連携グラウンディング、iOS向けGemma 4ハイブリッド推論
  • CodeMender:脆弱性自動修正AIセキュリティエージェント、Agent Platformに統合
  • Build with Gemini XPRIZE Hackathon:賞金総額200万ドル(ハッカソン史上最大規模)、2026年9月ファイナル

6. Google Workspace

機能 概要 提供時期・対象
Gmail Live 音声で受信箱を会話検索(例「フライトのゲート番号は?」) 2026年夏、米国AI Pro/Ultra(Android/iOS、英語)
AI Inbox パーソナライズ下書き返信、関連Docs/Sheets/Slidesリンク、タスク管理 Ultra限定から米国AI Plus/Proへ拡大
Docs Live 音声で文書を作成・編集(Gmail/Drive/Chat/Webから情報取込、許可制) 2026年夏、AI Pro/Ultra(英語グローバル)
Google Keep 音声ブレインダンプを整理されたノートに変換 2026年夏、Android AI Pro/Ultra
Google Pics 最新Nano Bananaベースの画像生成・編集ツール。Workspace統合(Slides等) 2026年夏、AI Pro/Ultraグローバル
Google Meet 「Take Notes for me」:他社会議・対面会議でも要約・アクションアイテム取得可能に。直近1カ月で1.1億人超が利用(前年比8.5倍) 拡張機能の段階展開中
Google Sheets Sheets Canvasでインタラクティブなミニアプリ(ダッシュボード・ヒートマップ等)を構築、HubSpot/Salesforce等からのデータ取込 順次展開

7-1. AI Search の刷新

AI ModeのデフォルトモデルをGemini 3.5 Flashにグローバル更新。25年以上ぶりに検索ボックスを刷新(テキスト・画像・ファイル・動画・Chromeタブを横断入力、AI候補提示)。AI OverviewsとAI Modeを一体化し、デスクトップ・モバイルで当日グローバル展開。

また「情報エージェント」が背景で24/7稼働し、特定トピック(ブログ・ニュース・SNS+金融/買い物/スポーツのリアルタイムデータ)を監視・要約・アクション。2026年夏にAI Pro/Ultra加入者先行。「生成UI(Antigravity in Search)」では質問ごとにカスタムレイアウト・インタラクティブ可視化を即時生成し、夏に全員無料提供開始予定。

7-2. Universal Cart(統合ショッピングカート)

Gemini駆動の統合ショッピングカート。Search・Gemini・YouTube・Gmailから商品を追加でき、価格追跡・在庫アラート・互換性チェック・支払い最適化(Google Wallet基盤)が一元管理できる。Universal Commerce Protocol(UCP、Shopify・Etsy・Wayfair・Target等と共同開発)で決済をシームレス化。2026年夏に米国のSearch・Geminiで先行展開予定。

7-3. Chrome

Gemini in Chrome(auto browse)で多段タスクを代行(旅行調査・フォーム記入・予約等)。米国のAI Pro/Ultra先行。Nano Bananaでページ内画像生成、SynthID/C2PA検証をChromeに拡大(数週間以内)。

7-4. Google Maps

Ask Maps(会話検索)とImmersive Navigation(3Dナビ)は2026年3月12日に米国・インド先行で公開済み(TechCrunch確認)。Maps史上10年ぶり最大の刷新。ピチャイ氏は「Ask Mapsはより複雑で長い質問に使われている」と言及。

7-5. Ask YouTube

複雑な検索クエリに対し関連動画を横断提示し、最適な再生位置にジャンプする新機能。2026年夏に米国で広範展開予定。現在はyoutube.com/newで実験開始。

7-6. Google Flow

AIクリエイティブスタジオ。Gemini Omni Flash搭載、Flow Agent(多段タスク)、Flow Tools(vibe codingで自作ツール)、Flow Music(Lyria 3)。Android(ベータ)・iOS向けモバイルアプリ化。140カ国超で展開。

7-7. NotebookLM

I/O 2026のために専用ノートブックを公開(Audio/Video Overview、スライド、インフォグラフィック)。直近の機能追加にCinematic Video Overviews・EPUB対応・PPTXエクスポート・Drive自動同期・10種の新インフォグラフィックスタイル等。

8. Google DeepMind 研究成果

8-1. Project Genie + Street View

汎用世界モデルGenieをGoogleのStreet View画像(約20年分、2,800億枚超)と接続。米国の実在地点を起点に、スタイルやキャラクターを指定して探索可能なインタラクティブな世界を生成できる。Waymoのレアイベント学習にも活用。Google AI Ultra($200プラン)加入者向けにグローバル展開(米国地点先行)

技術的には実験的研究プロトタイプであり、物理法則を完全には理解しない(人物がサボテンを突き抜ける等の挙動あり)。Genie研究者Jack Parker-Holder氏は「インタラクティブな世界生成は精度面で動画生成より6〜12カ月遅れている」と説明。真のブレークスルーは「空間的連続性(360度振り返っても背後を正しく記憶)」にあるとMaps担当ディレクターが指摘。

8-2. Gemini for Science

Co-Scientistベースの仮説生成・AlphaEvolve/ERAベースの計算的発見・NotebookLMベースの文献インサイトの3実験ツールを提供。UniProt・AlphaFold DB等30超の生命科学DBに接続する「Science Skills」をGitHub・Antigravityで提供。学術誌等とのエージェント型ピアレビュー実験(PAT、ScholarPeer)も進行中。

8-3. Demis Hassabis(DeepMind CEO)のAGI発言

キーノートのクロージングでHassabis氏は「振り返ったとき、今は特異点の麓(foothills of the singularity)に立っていた時代だったとわかるだろう。それは人類にとって深遠な瞬間になる」と述べた。

翌週にAxios(Ina Fried氏)が行ったインタビューでは、「依然として大まかにはAGI到来を2030年前後と見込んでいるが、今や2029年も可能性の範囲内になった」と語った。Fast Companyのインタビューでは「2030年、プラスマイナス1年」とも発言している。これは本人の個人見解であり、製品の能力保証ではない点に留意が必要。

9. Google AI サブスクリプション改定(I/O 2026)

プラン 月額 主な内容
AI Plus $7.99 Gemini基本機能、限定クリエイティブツール
AI Pro $19.99 Gemini 3.1 Pro対応、1,000クレジット/月、5TB ストレージ、YouTube Premium Lite(一部の国)、Google Home Premium・Google Health Premium付帯
AI Ultra(新設) $100 AI Pro比5倍の利用上限、20TB ストレージ、YouTube Premium インディビジュアルプラン、Antigravity優先アクセス、Gemini 3.5 Flash統合、$40の月次Google Cloud クレジット+10,000 Flow Credits、Gemini Spark(米国のみ)
AI Ultra(値下げ) $250 $200 AI Pro比20倍の利用上限($100プランの4倍)、20TB ストレージ、YouTube Premium インディビジュアル、Project Genie(グローバル・米国地点先行)、Gemini Spark(米国のみ)。機能は従来$250と同一
⚠️ 課金モデル変更:従来の「日次プロンプト数」から「compute-used(演算量ベース)」に移行。プロンプトの複雑さ・使用機能・チャット長を加味して計算。5時間ごとにリフレッシュし、週次上限まで利用可能。上限到達時は小型モデルへ自動切替。Pro/Ultraはトップアップクレジット購入も可能。
✅ 価値計算の参考($100 Ultra):YouTube Premium インディビジュアル($16相当)+$40 Cloud クレジット+20TB ストレージ($10相当)+Google Home Premium Advanced($20相当)+Google Health Premium($10相当)を合算すると実質コストは約$4/月という試算もある(AndroidAuthority等)。

10. 推奨アクション

🔧 開発者・技術リード向け

今すぐ着手:Gemini 3.5 FlashをAntigravity 2.0/AI Studioで評価。エージェント・コーディング・長期タスクのワークロードで自社の実トークン消費を計測(thinkingトークンが出力課金されるため、高推論設定では3.1 Proよりコスト高になり得る)。Gemini CLI利用者は2026年6月18日サンセット前にAntigravity CLIへ移行必須。

6月の判断ポイント:Gemini 3.5 Pro(6月提供予定・執筆時点未GA)のモデルカード・価格・文脈長が確定してから、深い推論/長文脈タスクの移行可否を決定。

MCP標準化:自社API/ツールをMCPサーバー化すれば、Spark・Antigravity・他社エージェントから横断利用可能に。WebMCPのChrome 149オリジントライアルも検証対象。

📊 Workspace・ビジネスユーザー向け

2026年夏のロールアウト(Gmail Live・Docs Live・Pics・AI Inbox拡大)に備え、米国・英語環境での先行検証を計画。課金が「演算量ベース」に変わるため、ヘビーユーザーはAI Pro(1,000クレジット/月)かAI Ultra $100(プランの実利用量で再評価)か確認を。Google Meetの「Take Notes for me」は他社会議でも使えるため、横展開を検討。

🏢 経営・戦略観点

エージェント型AI(自律実行)への移行は構造的転換であり、最適化指標は「モデルの賢さ」から「エージェントが本番規模でどれだけ確実に・低コストで仕事を完遂できるか」へ移る。Googleは「自社訓練シリコン+自社推論シリコン+10億ユーザー級のSearch配信層+9億ユーザーのGemini app」という、純粋AIラボには再現困難な配信・コスト優位を前面に出している。この「フルスタック配信」を競争評価の軸に据えるべきだろう。

11. 留意点(Caveats)

提供時期の幅:Spark・情報エージェント・生成UI・Workspace音声機能・Universal Cart・Pics・Ask YouTube等は多くが「2026年夏」「数カ月以内」「米国先行」「サブスク限定」。当日GAではない機能が多い。Gemini 3.5 Proは6月予定だが執筆時点(2026年6月5日)で未GA。

Gemini Omniのベンチマーク未公表:公開ベンチマーク数値は現時点で未公表。10秒上限・720p・生成時間などの数値は公式資料に記載がなくプレス・ブリーフィング由来の情報。Veo・Nano Banana・Genie 3との関係も「融合」ではなく公式上は別個の独立モデルとして併存。

Project Genieは実験的研究プロトタイプ:物理法則を完全に理解しないケースがあり(人物がサボテンを突き抜ける等)、写実性はゲーム品質。AI Ultra $200限定。

数値の出所:トークン処理量・ユーザー数などはピチャイCEOキーノート(「壇上発表内容を補足するため編集」との注記あり)由来。設備投資額$180〜190BはAlphabet Q1決算(CNBC 2026年4月29日)でも裏付け確認済み。

DeepMind CEOのAGI発言:Hassabis氏の「特異点の麓」「2029〜2030年」発言は本人の個人見解であり、製品の能力保証ではない。

主要参照ソース:Google Blog「I/O 2026: Welcome to the agentic Gemini era」(Sundar Pichai、2026年5月19日)、Google Blog「100 things we announced at I/O 2026」、Google Blog「Everything new in our Google AI subscriptions」、Google DeepMind Model Card「Gemini 3.5 Flash」、Google Cloud Blog「TPU 8t and TPU 8i technical deep dive」(2026年4月22日)、Google Developers Blog「Transitioning Gemini CLI to Antigravity CLI」(2026年5月19日)、Alphabet Q1 2026 Earnings Call(2026年4月29日)、Axios「Google DeepMind CEO Demis Hassabis says we're close to AGI」(2026年5月26日)

ファクトチェック実施日:2026年6月5日 / 記事作成:kuniyon.blogspot.com