火曜日, 5月 26, 2026

【2026年5月版】クラウド環境でOracle Databaseを利用するには

以前、クラウド環境でのOracle Database利用についてまとめた記事(2018年9月)を書きました。 それからかなりの時間が経ち、状況が大きく変わったので、2026年5月時点の最新情報に更新します。

まず前提として、Oracle Database(以下、Oracle)を冗長化された仮想環境で利用することのハードルの高さは変わっていません。 OracleのライセンスカウントはSoft Partitioning(VMware、Hyper-Vなど)の場合、Oracleがインストールされた仮想マシンが稼働する可能性のある物理サーバ全台分のプロセッサに対してライセンスが必要です。 HCI(ハイパーコンバージドインフラ)の普及でクラスタが1つのリソースとして管理されるようになった現在、この問題はさらに深刻化しています。

Soft PartitioningとHard Partitioningの違いについては以下のOracleパーティショニング・ポリシー(最終更新2022年2月)を参照してください。
Oracle Server Partitioning Policy(PDF)

ということで、冗長化された仮想環境上のOracleライセンス問題はオンプレミスでも変わらず厄介ですが、2024〜2026年にかけてクラウド側の選択肢が劇的に広がりました。 ここではその最新状況を整理します。 なお、ここで記載している内容は2026年5月時点のものです。特にライセンスの考え方は変わることがあるため、必ず購入元にご確認をお願いします。


1.Oracleが承認したクラウド環境(AWS・Azure・GCP)でのライセンス

OracleはAWS・Azure・Google Cloud Platform(GCP)を「承認済みクラウド環境(Authorized Cloud Environments)」として公式に認めており、仮想マシン上でのOracle利用についてvCPUベースのライセンスカウントルールが適用されます。
Licensing Oracle Software in the Cloud Computing Environment(Oracle公式PDF、2024年6月12日版)

最大の変化:2024年6月12日にGCPが正式追加
2018年時点ではAWSとAzureの2社だけでしたが、2024年6月12日付のポリシー改訂でGoogle Cloud Platformが正式に承認済みクラウドに追加されました。 これにより、AWS・Azure・GCPの3社が横並びで同一のライセンスカウントルールの対象となっています。

承認済みクラウド3社共通のライセンスカウントルール(Enterprise Edition)は以下の通りです。

  • マルチスレッディング(ハイパースレッディング)が有効の場合:2 vCPU = 1 Processor License
  • マルチスレッディングが無効の場合:1 vCPU = 1 Processor License
  • Oracle Processor Core Factor Table(コア係数表)は適用されない
  • カウント対象はインスタンスタイプの最大vCPU数(実際の使用コア数ではない)

Standard Edition 2については、4 vCPU以下のインスタンスが1ソケット(1 Processor License)扱いとなり、4 vCPU超は4 vCPU単位で切り上げてソケット数を計算します。

なお、上記のポリシーPDF末尾には「This document is for educational purposes only and provides guidelines regarding Oracle's policies... It may not be incorporated into any contract」と明記されています。あくまでガイドラインであり、実際の契約はOracle Master Agreement(OMA)等が優先します。


2.Oracle Database@AWS(2025年7月GA・東京2025年12月GA)

2025年最大のトピックの一つがOracle Database@AWSの正式提供開始です。 これはAWSのデータセンター内にOracle Cloud Infrastructure(OCI)のExadataハードウェアを物理設置し、AWSのネットワークと接続してOCIのマネージドサービスとして提供するサービスです。

  • 2025年7月8日:US East(N.Virginia)・US West(Oregon)の2リージョンでGA
  • 2025年12月22日:東京(AP-Northeast-1)・Ohio(US-East-2)でGA
  • 2025年12月23日:Frankfurt(EU-Central-1)でGA、計5リージョン
  • 2026年4月8日:Dublin・London・Mumbai・Hyderabad・Seoulが追加され計12リージョンに拡大(うち東京・Sydney・Canadaは2AZ対応)

提供サービスはOCI Exadata Database Service、Oracle Autonomous AI Database on Dedicated Infrastructure、Oracle Autonomous Recovery Serviceの3種類です。 RACもそのまま利用でき、Oracle AI Database 26aiにも対応しています。 Amazon S3・Bedrock・SageMaker・Redshiftとのゼロ-ETL連携も可能で、AWS Marketplaceから購入でき、AWSのコミットメント(EDP)消化にも充当できます。 BYOL・Oracle Support Rewardsも適用可能です。

なお従来のAmazon RDS for Oracleは引き続き提供されています。 RDS for OracleはフルマネージドでSE2のLicense Included(EEはBYOLのみ)を選べる唯一のサービスですが、対応バージョンは19cおよび21cのみです(2026年5月時点)。 26ai/23aiは未対応で、マネージドサービスで最新バージョンを利用したい場合はOracle Database@AWSのAutonomous Databaseが選択肢となります。 また、RDS Custom for Oracleでは2025年7月にMulti-AZサポートが追加され、ベアメタルインスタンス対応も拡充されています。


3.Oracle Database@Azure(2025年2月日本GA・ISMAP対応)

Oracle Database@AzureはOracleとMicrosoftが2023年9月に発表したサービスで、AzureのデータセンターにOCI Exadataを物理設置してOracle側がフルマネージドで運用します。

  • 2023年12月13日:US East(East US)で初GA
  • 2025年2月13日日本(Japan East)で国内初GA
  • 2025年中:Japan West(大阪)もDR用途で追加
  • 2025年10月時点:28リージョンで提供(AI World 2025発表)、その後11月に31リージョンへ拡大

日本における重要な進展として、ISMAP(政府向けクラウドサービス安全性評価制度)への対応が2025年中に完了しました。 また、Azure Key Vault統合・Microsoft Sentinel/Purview連携・Microsoft Fabric Open Mirroringも提供されており、エンタープライズおよび公共・金融向けの実績も生まれています。 たとえば2025年10月には、日本オラクルがネオファースト生命保険(第一生命グループ、保有契約件数100万件超)が保険契約管理システムのデータベース基盤にOracle Database@Azure(Exadata Database Service)を採用したと公表しています。

利用可能なサービスはExadata Database Service、Autonomous Database、Base Database Service(19c/26ai選択可)、GoldenGate、Oracle Exadata Database Service on Exascale Infrastructure(ExaDB-XS)などです。 Azure Marketplaceから購入でき、Azureのコミット(MACC)消化が可能です。


4.Oracle Database@Google Cloud(2025年6月東京GA)

OracleとGoogleは2019年に相互接続の連携を発表していましたが、2024年6月に大幅に提携を拡張し、Google CloudのデータセンターにOCI Exadataを物理設置するOracle Database@Google Cloudを発表。同年9月9日にAshburn・Salt Lake City・London・Frankfurtの4リージョンでGAしました。

  • 2025年6月13日東京(Asia-Northeast 1)で国内初GA
  • 2026年2月:大阪(Asia-Northeast 2)でExadata Database ServiceがGA
  • 2026年4月22日時点:15リージョンで提供(東京・大阪含む)

提供サービスはExadata Database Service、Autonomous AI Database、Base Database Service(26ai対応)、Exadata Database Service on Exascale Infrastructure(ExaDB-XS)、Oracle AI Lakehouse(Apache Iceberg対応)などです。 Google Cloud Marketplace経由での購入・パートナー販売が可能で、Google Cloudのコミット消化にも充当できます。 Gemini・Vertex AIとOracle DBの統合(同一データセンター内)が最大の特徴であり、AI活用を検討する企業にとって大きなメリットとなります。

なお2025年6月時点では東京リージョンのみGAで大阪は未対応だったため、DR構成が必要な場合はOCI大阪リージョン+FastConnect構成との組み合わせが現実的でした。現在は大阪も対応済みです。


5.Oracle Cloud Infrastructure(OCI)を利用する

Oracle DBを利用するうえで、ライセンスコストの構造的優位があるのがOCIです。 OCI東京リージョン(ap-tokyo-1)は2019年4月30日に開設、大阪リージョン(ap-osaka-1)は2020年12月に開設され、日本国内に2拠点の本番・DR構成が可能です。 Oracleは2024年4月に「今後10年間で日本のクラウド・AIインフラに80億ドル以上を投資する」と発表しており、引き続き日本での投資を強化しています。

BYOLのライセンス計算(OCI vs. AWS/Azure/GCP の差)

環境 1 Processor Licenseで使えるvCPU/OCPU コア係数表
AWS・Azure・GCP(HT有効) 2 vCPU = 1 Processor License 適用なし
OCI 2 OCPU = 1 Processor License(EE)
4 OCPU = 1 Processor License(SE2)
適用なし
(OCI独自の有利なルール)

OCIではOCPU(1 OCPU = 2 vCPU相当)単位で課金するため、同じProcessor License数でAWS/Azure/GCPの2倍のvCPU相当の処理能力が得られます。 さらにOracle Support Rewards(OCI利用料金1ドルあたり0.25〜0.33ドルをオンプレのOracleサポート費から控除)により、TCO面でOCIが構造的に有利です。

OCI上のデータベースサービスとしては、Autonomous Database(サーバーレス)、Base Database Service(19c/26ai)、Exadata Database Service、Exadata Database Service on Exascale Infrastructureなどが揃っています。 RAC構成も組め、高可用性が必要な大規模Oracleもカバーできます。


6.国産ソブリンクラウド(Oracle Alloyベース)

Oracleは「Oracle Alloy」というプログラムを通じて、パートナー企業が自社のデータセンターにOCI相当の環境を構築・提供できる仕組みを整備しています。 日本では以下の4社がOracle Alloyを採用したソブリンクラウドを提供・計画しています。

  • NRI(野村総合研究所)atlax2024年4月16日に日本国内で初めてOracle Alloyが稼働開始した事業者。東京・大阪の自社DCの2拠点にOracle Alloyを導入し、OCI IaaS・PaaSのフルサービスと100以上のOCIサービスを提供。以前から自社DCにOCI Dedicated Regionを導入し、金融SaaS(BESTWAY・T-STAR・THE STAR等)の基盤として実績があったことが背景にある。マネージドサービス「atlax」との組み合わせにより、金融・小売などの顧客のマルチクラウド環境をトータルで運営・監視できるのが特徴。2025年2月にはセキュリティサービス・AI実行環境の提供も拡充。
  • 富士通クラウドサービス powered by Oracle Alloy:2025年4月14日に国内提供開始。富士通DCからOCI相当の150以上のサービスを提供。経済安全保障推進法の基幹インフラ事業者向けの主権クラウドとして位置づけ。なお旧「FJcloud-O」上のDB powered by Oracle Cloudは2024年に新規申込終了。
  • NTTデータ OpenCanvas:Oracle Alloyベースのソブリンクラウドを、東日本リージョンから段階的に展開予定。
  • SoftBank Cloud PF Type A:2025年10月に発表、Oracle AlloyとGPU環境を組み合わせた国内ソブリンクラウド。

これらのサービスは、クラウドへの移行を希望しつつもデータ主権・セキュリティ要件が厳しい公共・金融・医療分野の企業にとって、現実的な選択肢となっています。 特にNRIは日本国内のOracle Alloy第一号として2024年4月に稼働開始しており、金融業界を中心に最も実績が豊富です。


7.Oracle AI Database 26ai(2026年1月オンプレGA済み)

2024年5月にOracle Database 23aiがGAとなり、AI Vector Search・JSON Relational Duality・Raft Replication・SQL Firewall・Select AIなどAI時代向けの300超の新機能が搭載されました。 そして2025年10月14日、Las Vegasで開催されたOracle AI World 2025にてLarry Ellison会長がOracle AI Database 26aiを発表。23aiをさらに進化させたAIネイティブDBとして、名称・バージョン番号が改められました。

26aiの仕組みとしては、Oracle Database 23aiに「October 2025 Release Update(バージョン23.26.0)」を適用するだけで移行でき、データベースのアップグレードやアプリケーションの再認定は不要です。 AI Vector Search・Unified Hybrid Vector Search・Agenticフレームワーク統合・AI Lakehouse(Apache Iceberg対応)などの機能が追加料金なしで利用できます。

クラウドおよびオンプレミスの提供状況

  • OCI(Autonomous DB、Base DB、Exadata等)、Oracle Database@Azure・AWS・Google Cloud:提供中
  • Oracle Exadata、Oracle Database Appliance(ODA):提供中
  • 汎用オンプレミス(Linux x86-64):2026年1月27日GA済み(バージョン23.26.1、EEのみ。SE2は2026年内の他プラットフォームリリースと同様に順次対応予定)

長らく「次のLTSリリース(23ai/26ai)はいつオンプレで使えるのか」が注目されていましたが、2026年1月27日にLinux x86-64向けEEが正式提供されたことで、オンプレ環境でも最新のAI機能(Vector Search、Select AI等)が利用できるようになりました。 19cからの移行先として、オンプレ継続企業にとっても大きな選択肢が加わったと言えます。

なお26aiはLong-Term Supportリリースで、Premier Supportは2031年12月31日まで(23aiと同一のサポート期間を継承)です。


8.その他:オンプレとのハイブリッド・ハウジング構成

高可用性・高信頼性が求められ、すぐにはクラウド移行が難しいOracle環境については、Oracle部分だけオンプレ(データセンターのハウジングやホスティング)に残しつつ、他のシステムはクラウド化するハイブリッド構成も依然として有効です。 具体的なオプションとしては以下があります。

  • OCI Exadata Cloud@Customer:顧客のDCにExadataハードウェアを設置し、OCIのマネージドサービスとして運用。ハイブリッドクラウドの中でも最もOracleとの親和性が高い。
  • OCI Compute Cloud@Customer / Dedicated Region:OCIを顧客DC内で動かす別オプション。
  • 専用線接続(Oracle FastConnect / AWS Direct Connect / Azure ExpressRoute):オンプレOracle環境とクラウドを低遅延・高帯域で接続。

また、さくらのクラウドなどOracleの承認済みクラウドに含まれない国産クラウドのIaaS上でOracleを稼働させることは、ライセンス的にはSoft Partitioning扱い(物理サーバ全台分のライセンスが必要)となるため、コスト面で現実的ではありません。 さくらインターネット自身も公式に「Oracle Database直接利用不可、専用サーバPHYまたはOCI経由でのマルチクラウド構成を推奨」と案内しています。


まとめ(2026年5月時点)

2018年の記事執筆時からの最大の変化は、Oracle DatabaseがAWS・Azure・GCP(Google Cloud)すべてのメジャークラウド上で、「Oracle社がフルマネージドで運用するExadataサービス」として利用できるようになったことです。 以前はハイパースケーラー上でのOracle利用はライセンスカウントの煩雑さとRAC不可という制限がありましたが、Oracle Database@系のサービスを使えばRACも使えてライセンスもBYOL・Support Rewardsが適用されます。

各クラウドの選択ポイントを整理すると:

  • AWSをメインに使っている企業:Oracle Database@AWSが東京GAで選択肢に。AWSのコミット消化も可能。
  • Azureをメインに使っている企業:Oracle Database@AzureがJapan EastでISMAP対応済み。公共・金融・医療向けに最も実績あり。
  • Google CloudやGemini AIと組み合わせたい企業:Oracle Database@Google Cloudが東京・大阪両リージョン対応済み。
  • TCOを最大化したい企業(OracleライセンスをBYOLで活用):OCI直接か富士通Alloyなどの国産ソブリンクラウドがライセンス効率で有利。
  • 小〜中規模でフルマネージドをリーズナブルに:Amazon RDS for Oracle(SE2 License Included)が依然として唯一の選択肢。ただし対応は19c/21cのみ。
  • オンプレ継続だが23ai/26aiの機能を使いたい:2026年1月27日に26aiオンプレ版(Linux x86-64 EE)がGA済み。ExadataやODAは不要。

Oracleのライセンスポリシーは変わりやすく、また各ポリシー文書は「non-contractual(契約書ではない)」と明示されています。 移行や新規導入の判断にあたっては、必ず最新のOracle公式ドキュメントおよびOracle営業・販売店に確認することをお勧めします。

最後になりますが、Oracleがある環境のクラウド化を進める一番わかりやすい方法が「Oracleをやめる」であることは2018年から変わっていません。 ただ、DBの移行は大変な作業ですし、特にストアドプロシージャが多い環境やOracleを前提としたパッケージ製品では容易ではありません。 そんな環境でも、上記のようにOracle Database@系サービスやOCIを活用することでクラウドのメリットを享受する選択肢が格段に広がっています。 この記事が少しでも参考になれば幸いです。

月曜日, 5月 25, 2026

〖2025年5月版〗国産クラウド(IaaS)最新動向まとめ

 〖2025年7月版〗国産クラウド(IaaS)最新動向まとめを公開してから約10ヶ月が経ちました。この間、国産クラウドとしては初めて「さくらのクラウド」がガバメントクラウドに正式採択されるという歴史的な出来事があり、富士通やソフトバンクがOracle Alloyを基盤とするソブリンクラウドを相次いで立ち上げるなど、国内クラウド市場の地図が大きく塗り替わりました。また、MicrosoftやGoogleが日本への大規模投資を相次いで発表し、AI対応型インフラの整備が急加速しています。本稿では2026年5月時点の主要IaaS事業者の動向を、2025年7月版との差分を意識しながら整理します。対象は2025年7月版とは異なり、国内外を問わず日本市場で存在感を持つIaaSを広くカバーします。

日本のクラウド市場概況(2025〜2026年)

矢野経済研究所が2026年に発表した調査によると、2025年の国内クラウド基盤(IaaS/PaaS)市場規模は前年比約19%増の2兆7,100億円で、2029年には5兆2,200億円に達するとしています(CAGR約18%)。IDC Japanの集計ではIaaS・PaaS・ホスティング型プライベートを合算した2024年の国内パブリッククラウド市場は4兆1,423億円(前年比26%増)で、2029年には8兆8,164億円に拡大する見通しです。また、IDCは2026年の国内AIインフラ市場を約55億ドル(約8,300億円)と試算しており、2030年には1兆円を突破するとみています。成長を牽引するのは生成AI需要、基幹系のクラウド移行、そしてBroadcom傘下となったVMwareのライセンス体系見直しに伴う代替需要の三本柱です。

ガバメントクラウドとISMAP — 2025年7月版からの最大の変化

2026年3月27日、デジタル庁は「さくらのクラウド」がガバメントクラウドの全技術要件305項目を充足したことを確認し、令和5年度・令和8年度の双方でガバメントクラウドサービス提供事業者として正式採択したと発表しました。これにより2026年度のガバメントクラウド対象はAmazon Web Services・Google Cloud・Microsoft Azure・Oracle Cloud Infrastructure・さくらのクラウドの5サービスとなり、国産クラウドはさくらのクラウドが唯一の座を占めます。さくらインターネットの田中邦裕社長は「日本の行政におけるクラウドの選択肢を広げるとともに、日本のデジタル基盤の自律性と持続性を高める一歩」とコメントしています。

2023年11月に条件付きで採択されてから約2年半、さくらインターネットが国内各所から「ぜひ実現してほしい」という声を受けながら開発を続けてきた成果です。正式採択と同時に、石狩第3ゾーンを活用した法人向けキャンペーンも開始されました。ISMAPクラウドサービスリストはデジタル庁が2025年11月・2026年3月に更新し、Salesforceの「Agentforce」を含む複数製品が新規追加されています。

〖ハイパースケーラー〗

AWS(Amazon Web Services)

AWSジャパンは2024年1月に発表した「2023〜2027年で2兆2,600億円を東京・大阪リージョンに投資する」計画を継続中です。2011〜2022年の累計1兆5,100億円と合わせると、2027年までの国内クラウドインフラ投資総額は約3兆7,700億円に達する見込みです。2024年11月には長崎忠雄前社長に代わり白幡晶彦氏が代表執行役員社長に就任し、2026年1月には「For Japan, For Society Leaping Ahead」を2026年の新戦略として打ち出しました。

サービス面では2025年12月、Oracle Database@AWSが東京リージョン(ap-northeast-1)で一般提供(GA)を開始しました。東京リージョン内のapne1-az1とapne1-az4で利用でき、Oracle ExadataデータベースをAWSのインフラで動かしながら、データを日本国内に置き続けることが可能になりました。生成AI向けのAmazon Bedrockも日本リージョンで提供済みで、引き続き先行投入が続いています。障害面では2025年4月に東京リージョンで約1時間の一時的な接続障害が発生し、同年10月には米国バージニア北部を震源とするグローバル規模の障害が起きています。いずれも長期化は免れましたが、グローバルコントロールプレーンに依存するサービスを利用している場合のリスクとして改めて意識されました。

Microsoft Azure

Microsoftは2026年4月3日、「技術」「信頼」「人材」の3本柱を軸に2026〜2029年の4年間で日本に100億ドル(約1兆6,000億円)を投資する計画を発表しました。副会長兼社長のブラッド・スミス氏が来日し、高市早苗首相を表敬訪問した際に公表されたものです。2024年4月の29億ドル投資発表に続く追加コミットメントで、規模は3倍超に拡大しています。

技術面では、さくらインターネットおよびソフトバンクと連携し、日本国内にデータを置いたままAzure経由でGPU計算資源を利用できる「主権AIスタック」の整備を進めます。信頼面では国家サイバー統括室や警察庁との官民連携によるサイバー防衛強化を明示しています。人材育成では、NTTデータ・ソフトバンク・NEC・日立・富士通の5社と協力し、2030年までに日本で100万人のエンジニア・開発者育成を目指します。なお、2024年4月の投資発表以降、同社は日本で340万人以上のAIスキル習得を支援しており、当初の目標300万人を超過達成しています。

Google Cloud

千葉県印西市に国内初のGoogle Cloud専用データセンターが2024年に稼働し、東京・大阪リージョンでのサービス品質が向上しています。2025年6月にはOracle Database@Google Cloudが東京(Asia-Northeast 1)で提供を開始し、Google Cloud Marketplace経由のリセラー販売にも対応しました。生成AI分野では2026年4月のGoogle Cloud Nextでベルリン・セメラー型AIエージェント基盤と新型チップTPU 8(学習用8t・推論用8i)を発表し、クラウド収益は前年同期比48%増(Q4 2025、177億ドル)と急成長しています。

設備投資は急拡大しており、2025年通期CapExは約900億ドル(前年比約2倍)、2026年は当初1,750〜1,850億ドルのガイダンスを示しましたが、2026年4月29日のQ1 2026決算で1,800〜1,900億ドルに上方修正されています。Alphabet年次報告書(2026年4月)では「2025年の約900億ドルの2倍」と表現されており、AIインフラ需要が旺盛なことを裏付けています。

Oracle Cloud Infrastructure(OCI)

東京・大阪の2リージョン体制を継続強化しており、2025〜2026年にかけてWebLogicマネジメント、Compute E6 Standardシェイプ、Batchサービスなどを国内リージョンで順次提供開始しています。Oracle Database@AWSが東京でGAとなったことでマルチクラウドDB移行がより現実的な選択肢となりました。国内における大型導入事例では長野県信用組合や荏原製作所、ニッセイ・ウェルス生命などの勘定系・基幹系移行案件が続いています。2024年4月に発表した「向こう10年で80億ドル超の日本投資」計画は継続中で、Oracle Alloyを通じたソブリンクラウドパートナー戦略の拡大も進んでいます(後述)。

〖国内クラウド事業者〗

さくらインターネット — さくらのクラウド(歴史的な転換点)

2026年の国内クラウド市場における最大のニュースは、3月27日のさくらのクラウドのガバメントクラウド正式採択でしょう。2023年11月の条件付き採択から約2年半を経て305項目すべての技術要件を充足し、国産クラウドとして初めて本番環境での提供が可能となりました。政府・自治体のシステムをさくらのクラウド上に構築する選択肢が事実上解禁されたことは、これまで外資4社が独占していた公共クラウド市場の構造を変える出来事です。日経Xテックや時事通信は「国産AI推進という政府方針との親和性が高い」と評価しています。

GPU基盤の「高火力」シリーズも急速に拡充されました。2024年8月にNVIDIA H100を2,000基整備し、2025年8月にはBlackwell世代のNVIDIA B200を搭載した「B200プラン」を提供開始(初期400基・最終1,500基規模を計画)。2025年9月にはマネージドスパコン「さくらONE」(H200×55台)を、同10月にはB200×48台(384 GPU)構成も追加しました。2025年9月には石狩データセンターに第3ゾーンを新設し、ガバメントクラウド向けの大規模受け入れに備えています。2024年度〜2030年度で1,000億円規模のGPU投資を計画しており、経済産業省のクラウドプログラムが50%助成しています。

富士通 — FJcloud-VとFujitsu Alloyの並列体制

2024年4月にニフクラをFJcloud-Vに統合済みで、VMware vSphereベースのIaaSとして継続提供されています。2025年7月にBroadcom社によるVCSPパートナー契約の見直しが行われましたが、富士通は継続認定を受けています。既存のVMware資産を抱える企業の移行先として引き続き有力な選択肢です。

最大の新展開は、2025年4月14日に「Fujitsu クラウドサービス powered by Oracle Alloy」(富士通ソブリンクラウド)の国内提供を開始したことです。富士通のデータセンター内に置いたOracle Alloy基盤上で、OCI互換の100以上のサービスを利用できます。日本のソブリン要件に合わせ既存OCIの機能に加えて106の機能を実装しており、データ・運用・法的・セキュリティの4つの主権に対応します。今後3年間で100社への導入を目標としており、発表以降200社超から問い合わせがあったとしています。2025年7月24日にはグランドオープンイベントを開催し、経産省AI産業戦略室の渡辺室長が講演しました。同年10月にはPwC Japanと協業し、経済安全保障推進法「基幹インフラ役務」制度に対応するリファレンスガイドを2025年12月に公開しています。なお、FJcloud-VとFujitsu Alloyは「後継・先代」の関係ではなく、用途が異なる並列ラインアップです。FJcloud-VはVMware既存資産の移行に、Fujitsu Alloyはミッションクリティカルなソブリン要件対応に、それぞれ重点を置いています。

NTTドコモビジネス(旧NTTコミュニケーションズ)— Smart Data Platform(SDPF)

2025年7月1日、NTTコミュニケーションズはNTTグループの組織再編に伴い「NTTドコモビジネス株式会社」に社名を変更しました。同時にNTTコムウェアも「NTTドコモソリューションズ」に改称しています。クラウドサービスはSmart Data Platform(SDPF)クラウドとして継続提供されており、ISMAPへの登録も継続しています。

2025年6月にはNTTドコモビジネス・ゲットワークス・NTTPCの3社が「AI-Centric ICTプラットフォーム構想」として戦略的業務提携を締結し、水冷GPUサーバーを活用したAI計算基盤の整備を進めています。NTTグループ全体では、2026年4月27日にデータセンターの消費電力容量を2033年度に現在の約3倍超(約1GW)へ拡張する計画を発表しました。NTTの島田社長は「推論用途の裾野が広がっている」とAIインフラ拡張の理由を説明しています。

KDDI — KCPS刷新とGPU Cloud

2025年12月19日にKDDIクラウドプラットフォームサービス(KCPS)を全面リニューアルし、フラッシュドライブへの移行によるストレージ性能向上、最大32vCPU/512GBのハイスペックメニュー追加、PaaS機能の拡充を図りました。ただしKCPS Ver.2は2026年3月31日をもって新規申込受付を終了しており、現在は後継の「KDDI GPU Cloud」への移行を推進しています。KDDI GPU Cloudは大阪堺データセンターにNVIDIA GB200 NVL72を採用した構成で、2026年4月から申込受付を開始しました。KCPSとの閉域連携に対応しており、既存KCPSユーザーからのスムーズな移行を支援します。ISMAP登録(C21-0010-2)は継続しており、KDDIアイレットを通じてガバメントクラウドの運用管理補助者の役割も担っています。

ソフトバンク — Cloud PF Type A(Oracle Alloy採用)

ソフトバンクは2025年10月8日にOracle Alloyを採用したソブリンクラウドサービス「Cloud PF Type A」を2026年4月から提供すると発表し、2026年4月1日に東日本リージョンでの提供を正式開始しました。西日本リージョンは2026年10月開始予定です。OCI互換の200種類以上のサービスに対応し、日本国内のソフトバンクデータセンターでデータの所在・管理・運用を完結させます。セキュリティ面ではOracle KMS VaultとソフトバンクKMSの組み合わせ、ネットワーク面ではOnePort・SmartVPNによる閉域接続を提供します。

2026年4月16日には、SB Intuitionsが開発した国産LLM「Sarashina」を活用した生成AIサービスを同年6月から順次提供開始すると発表しました。Sarashina AIサービスの提供開始は4月ではなく6月からである点に注意が必要です。また、MicrosoftとはAzure経由でソフトバンクのGPU計算基盤を利用するソリューションの共同開発を2026年4月3日に発表しており、主権AIスタック構築の観点からも注目されています。既存のホワイトクラウドASPIREはISMAP登録・VMware Sovereign Cloud認定を継続しています。

IDCフロンティア — IDCFクラウド

国内15ゾーン・SLA 99.999%の体制を継続しています。GPU基盤では2025年から推論用GPUクラスタの提供事例が増えており、デジタルダイナミックやモルゲンロットとの事業提携を通じてIDCフロンティアのデータセンターを活用したGPU環境の導入が進んでいます。2025年12月には大規模な推論AI向けGPUクラスタの導入事例を公開しました。AWS・Azure・Google Cloud等との閉域接続サービスは継続提供しており、マルチクラウド構成の「ハブ」としての役割も担っています。

ソブリンクラウドの競合構図

2025〜2026年にかけて最も急速に立ち上がったのがソブリンクラウド(データ主権クラウド)の市場です。大きく分けると、Oracle Alloyを基盤とした陣営(富士通・ソフトバンク・NTTデータ・NRI)と、さくらのクラウド(完全国産)、そしてMicrosoftの「主権AIスタック」(さくら・SBと連携)の三極構造が形成されています。富士通・NTTデータ・NRIはそれぞれミッションクリティカル系・SI系の既存顧客基盤を持ちながらOracle Alloyを採用しており、中央省庁・金融・製造業の基幹系クラウド移行を主なターゲットとしています。一方、さくらのクラウドはガバメントクラウド正式採択という裏付けを持ち、地方自治体や省庁のシステム基盤として純国産という訴求力を最大の武器としています。

AI規制の動向 — AI推進法の施行

日本初のAI分野特化法となる「人工知能関連技術の研究開発及び活用の推進に関する法律」(令和7年法律第53号、通称:AI推進法)が2025年5月28日に成立し、6月4日に公布・一部施行、9月1日に全面施行されました(内閣府公式)。同日、内閣総理大臣を本部長・全閣僚を構成員とするAI戦略本部が設置され、9月12日に初会合が開かれています。石破総理(当時)は「国家戦略として省庁横断でAIによるイノベーションを本格的に推進する」と述べ、AI基本計画の策定を指示しました。

同法は罰則を伴わない基本法的性格で、EU AI Actのような直接規制とは異なります。活用事業者の責務(第7条)や国による調査・指導・助言の仕組みを規定し、「世界で最もAIを開発・活用しやすい国」を目指す方向性を明示しています。クラウド事業者にとっては、AIサービスを提供する際の透明性確保や不適切利用への対応体制が今後のガイドラインで具体化されていく可能性があるため、動向を注視する必要があります。

まとめ

2026年5月時点の国内IaaS市場は、「AI対応」「データ主権」「ガバメントクラウド」の三つのキーワードで動いています。さくらのクラウドのガバメントクラウド正式採択、富士通・ソフトバンクのOracle Alloyソブリンクラウド提供開始、MicrosoftやOracleの巨額の日本投資、そしてAI推進法の全面施行と、2025年7月版からの10ヶ月間は国内クラウド史上でも有数の変化の多い期間でした。

選定の指針としては、公共・自治体システムには5社体制となったガバメントクラウドの中でさくらのクラウドも有力な選択肢として評価すること、ミッションクリティカルな機密系システムにはFujitsu Alloy・ソフトバンクCloud PF Type A・NTTデータAlloy・NRIAlloyなどOracle Alloy系を本命として検討すること、生成AI・LLM基盤にはさくら高火力PHY B200・KDDI GPU Cloud(GB200)・ソフトバンクCloud PF Type A(Sarashina、6月〜)を比較すること、が実務的なアプローチとなりそうです。VMwareの既存資産を抱える場合は、BroadcomのVCSP認定を継続しているFJcloud-V・IIJ GIO P2 Gen.2・ホワイトクラウドASPIREを優先候補とすることも引き続き有効です。

なお、本稿は2026年5月25日時点の公開情報をもとに作成しており、Microsoftの100億ドル投資の詳細な実施内容、ガバメントクラウド要件緩和の最終ルール(複数サービス組み合わせによる充足を許容する方向性が打ち出されているが最終確定前)、各社GPU調達状況など、今後の公式発表で変わる可能性がある事項を含みます。引き続き最新の公式発表を確認してください。

ChatGPT後のロシア生成AI:制裁下の「主権AI」戦略と西側との分岐(2022–2026年)

 

TL;DR

  • ロシアは制裁と頭脳流出に直面しながらも、Sber(GigaChat)とYandex(YandexGPT/Alice AI)を二大プレイヤーとする「主権AI(Sovereign AI)」エコシステムを2023年以降急速に構築した。だが、独立系評価では米国LLMがMMLUでGigaChat MAXの現水準より1年先行しており(Ben Dubow/CEPA・Omelas、The Moscow Times 2025年1月28日付)、Sber自身が認める「米中に6〜9ヶ月遅れ」(Alexander Vedyakhin副CEO、Reuters 2025年6月)はむしろ楽観寄りである。
  • OpenAI、Microsoft Azure、Google Cloud、AWSはいずれも2022年3月までにロシアでの新規販売を停止、OpenAIは2024年7月9日にAPIアクセスをIP単位でブロックした。一般ユーザーはChatGPTにVPN経由でしかアクセスできず、国内代替(GigaChat、YandexGPT、T-Bank Gen-T、MTS Cotype)への移行が国家戦略として推進されている。
  • 同時に、ロシア政府はAIを国家安全保障の中核と位置づけ、2030年までにAIによるGDP寄与を11兆ルーブル超に拡大することを目標化。一方でRT/FSB主導の「Meliorator」や「Pravda(プラウダ)ネットワーク」など、生成AIを情報戦・西側LLMの「LLMグルーミング(汚染)」に転用する活動が並行して進む二面性が際立つ。

1. 国産LLMの主要プレイヤー

Sber GigaChat

2023年4月クローズドβ公開、2024年2月時点で個人ユーザー250万人。2025年3月のGigaChat 2.0発表時点で15,000社の法人ユーザー(Sber副CEO Alexander Vedyakhin発言、Reuters取材)。Sber投資家プレゼンでは2025年通年で「月次2,000万ユーザー、年間8億クエリ、AIによる経済効果4,500億ルーブル(うち生成AI500億ルーブル)」と自己申告(Investing.com経由)。

2025年11月のオープン化では2モデルを同時公開(GitHub salute-developers/gigachat3、MITライセンス):

  • GigaChat 3 Ultra Preview(702B-A36B):MoE、MTP、MLA搭載のフラッグシップ。コンテキスト128Kトークン。ロシア語MERAベンチマーク1位を主張(自己ベンチ)。
  • GigaChat 3 Lightning(10B-A1.8B):ローカル・高負荷用の軽量版。コンテキスト256Kトークン。

さらに2026年1月には改良版GigaChat 3.1 Ultra/Lightningを追加公開(Habr 2026年1月記事)。

冷静な批判:Ben Dubow(CEPA上級研究員・Omelas CTO)はThe Moscow Times 2025年1月28日付記事「Russian AI Struggles in Its Own Language」で「GigaChat MAXの200億パラメータ・13万1千トークンコンテキストはChatGPT-3.5(約2年前)相当、Gemini 1.5の200万トークンには遠く及ばない」と指摘。mysummit.school(2026年3月)の独立ベンチマークでは「ファクトエラーが定期的に発生」とされDeepSeek V3.2やQwen 3.5 Plusを下回る。

Yandex YandexGPT/Alice AI

オープン公開のYaLM 100B(800台のA100で65日訓練)から商用YandexGPTへ移行。2024年4月にYandexGPT 3搭載Alice AIを発表、Aliceの月間アクティブユーザーは6,600万人(Yandex公式プレスリリース2024年4月19日)。2025年2月にYandexGPT 5、2026年初頭に新ファミリー発表。AliceはYandexGPT 5世代以降の最新モデルで継続的に更新。

T-Bank(旧Tinkoff)Gen-T

2024年12月に**T-Pro(320億パラメータ)とT-Lite(70億パラメータ)**をApache 2.0でオープン化。中国Alibaba Qwen2.5をベースにロシア語適応、開発コストを「ゼロから訓練する企業比で80〜90%削減」と主張(T-Bank広報、Vedomosti紙)。

MTS AI Cotype

2024年11月にCotype Nano(15億パラメータ)を商用利用可能なライセンスで公開(Snapdragon 8 Gen 2搭載スマホで9.5トークン/秒)。2025年にCotype Pro 2(コンテキスト12.8万トークン、推論速度40%向上)を発表。


2. 制裁・地政学的影響

西側テック企業の撤退

  • Microsoft:2022年3月4日にロシアでの新規製品・サービス販売を停止。EU第12次制裁パッケージ(2023年12月)を受け、2024年3月20日以降、ロシア法人はOffice 365、Azure、Teams等の利用を遮断
  • AWS:2022年3月8日に新規アカウント受付停止(Bloombergほか)。
  • Google Cloud:2022年3月10日に新規顧客受付停止、Google LLC Russiaは2022年9月28日に破産。
  • OpenAI2024年7月9日からAPIトラフィックのIPブロックを開始(ロシア・中国・イラン・北朝鮮対象)。
  • Meta:2022年3月21日にモスクワ裁判所が「過激派組織」認定。Facebook・Instagramがブロック(WhatsAppのみ例外)。

GPU・半導体制裁の実態

  • 2022年8月、NVIDIAがA100・H100のロシア・中国向け輸出停止を開示。2023年10月にA800/H800/L40Sに拡大。H200・Blackwellへの対象拡大が続く。
  • Shreyaサプライチェーン事件(Bloomberg, 2024年10月):インドの製薬会社Shreya Life Sciencesが2024年4〜8月、Dell PowerEdge XE9680サーバー1,111台(約3億ドル相当)をロシアに輸出。ルートは「マレーシア(Dell子会社出荷元)→インド(Shreya輸入)→ロシア(再輸出)」の3段階(Bloomberg詳報、TechSpot)。サーバーにはNVIDIA H100またはAMD Instinct MI300Xが搭載(混在、1,111台中998台はH100と判明)。2024年3〜8月にマレーシアからインドへ計1,407台が輸入された事実を貿易データが確認。
  • 英国政府はBaikal Electronics、MCST、MikronをARMライセンス停止対象として制裁指定(DCD)。

GPU保有の格差(推定)

RFE/RL匿名ソース:Sberが2022年2月以降に蓄積したGPUは推定約9,000枚。比較:

  • Microsoft:2024年単年で485,000枚のNVIDIA Hopper系を購入(Omdia調査、FT 2024年12月18日)
  • Meta:2024年に224,000枚購入、総保有60万H100換算(DCD)
  • Google:2024年に169,000枚購入

3. 国家戦略・政府政策

  • 2019年に初版、2024年2月に大統領令で大幅改訂したAI国家戦略。目標:AIサービス市場を2022年の120億ルーブルから2030年に600億ルーブルに、AI専攻大卒者を年15,500人(現状3,000人)に。
  • 2030年GDP寄与11兆ルーブル目標:副首相Chernyshenko発言(Interfax 2023年9月)。
  • プーチンは2025年11月のAI Journey会議で「国家AI実装計画」策定を指示(TASS)、同時に大統領府・政府直下の「AI本部」設置を命令。
  • 政府AI予算:2024年に50億ルーブル超(Mishustin首相、Interfax 2023年9月27日)。
  • データ経済国家プロジェクトに6年間7,000億ルーブル配分(プーチン、2024年2月連邦議会演説)。

4. 軍事・情報戦

Meliorator(AI駆動ボットファーム)

2024年7月、米司法省・FBI・カナダ・オランダ当局合同発表。RT副編集長指揮下のFSB共同運営、2022年4月開始。2024年6月時点でX上に968件の検証済み偽アカウント。米英独蘭波西ウクライナ・イスラエルを標的。米司法省は2024年7月にドメインmlrtr.com等を差し押さえ。

Pravdaネットワーク/LLMグルーミング

仏Viginumが2024年2月発見。182ドメイン、74ヶ国、12言語。NewsGuard 2025年3月報告:「2024年に360万本の記事を生成、10のメジャーチャットボットが偽情報を33%の頻度で復唱」。DFRLab(2026年4月):Common Crawlにおけるプラウダ英語記事は2024年11月の37本→2025年11月に約40,000本に急増。

ただしHarvard Kennedy School Misinformation Review(2025年10月、Alyukov et al.)は「偽情報復唱は5%」と異なる結論を出しており、**「LLMグルーミングよりデータ空白(data voids)が主因」**と指摘。

戦場AI

LancetドローンにNVIDIA Jetsonベースの自律ターゲティングモジュール搭載が2026年3月のキーウ攻撃で確認(ウクライナ軍情報総局HUR、Kyiv Post)。構成部品の大半が西側・中国製。


5. ユーザー普及・活用状況

  • Yakov and Partners調査(2024〜2025年):ロシア国民の**24%**が生成AIを個人・業務利用、**47%**が国産AIを優先。
  • ChatGPTはOpenAIのIPブロックにより事実上アクセス不可。VPN経由で利用継続するIT専門層が多い。
  • 政府サービス:Gosuslugi(電子政府)の「Robot Max」チャットボットが2024年にGPT機能追加。日次1,100万人訪問者。
  • 医療:モスクワ放射線リファレンスセンターが市内90クリニックでAI診断運用。
  • 宇宙2025年11月27日打ち上げのSoyuz MS-28でGigaChatをISS国際宇宙ステーションに配備(TASS、2025年11月26日)。
  • VK MAX:2025年にリリースされたスーパーアプリ。2025年9月1日以降、ロシアで販売されるスマートフォンへのプリインストール義務化。

6. 中国との接近・国際的位置づけ

  • 2024年末プーチンが中国との協力深化を指示。Sber副CEO VedyakhinはQwen/DeepSeek/MiniMaxとのパートナーシップ優先を表明。
  • 国際ランキング:Tortoise Media Global AI Index(2024年9月、83カ国)でロシアは31位。G5のうち上位にいない唯一の国。
  • DeepSeekによる「低コストLLM」の証明はロシアにとっても希望材料だが、「中国・インドは制裁回避取引に慎重」(RFE/RL)であり、資源・データ規模でも中国に遠く及ばない。

7. Yandex「分裂」:Nebius Groupとの対比

  • Yandex分離取引:2024年2月に475億ルーブル($5.2B)で合意、2024年7月に最終クロージング(最終的に**$5.4B相当)。ロシア資産を完全売却し、オランダ持株会社がNebius Group(NASDAQ: NBIS)**として独立。
  • Nebius:フィンランドのデータセンター(75MWに拡張中)を中心にAIクラウドへ特化。2026年3月11日、NVIDIAと戦略的パートナーシップを締結、NVIDIA が20億ドルを投資し「2030年末までにNVIDIAシステム5ギガワット超のデプロイ」を目標(NVIDIA公式プレスリリース、2026年3月11日)。Q1 2026売上の98%がAIクラウド事業、ARR 19.2億ドル。

考察と展望

ロシアの生成AIは「主権」と「実力」の間に大きな乖離を抱えたまま2026年を迎えている。制裁によるGPU不足は深刻で、Sber推定9,000枚はMicrosoftの2024年単年購入485,000枚の約2%にすぎない。GigaChat 3/3.1のMoEアーキテクチャ採用はハード制約への合理的適応だが、独立ベンチマークでは中国製オープンモデル(DeepSeek、Qwen)に後れをとっている。

国産チップ(Elbrus・Baikal)はTSMC依存の断絶で機能不全に近く、Huawei Ascend系チップへの依存は「中国の供給待ち行列の最後尾」という構造的弱点を抱える。2030年の「10基スーパーコンピュータ計画」($60億規模)は公開された建設進捗がなく、実現見通しは不透明だ。

一方でGigaChatはISS宇宙ステーション搭載やVK MAXへの組み込みなど「存在感の演出」において成果を上げており、ロシア語特化タスクでは依然として一定の競争力を持つ。ロシアAIの今後の分岐点は、(1)Huawei Ascend 950PRの確実な調達、(2)2030年スパコン計画の具体化、(3)年間AI人材育成15,500人目標の達成、の3点を観察軸として評価すべきである。


情報源の注記

  • ロシア政府・Sber・Yandex等の公式発表は政治的・商業的バイアスがあり、独立検証が困難。
  • 独立情報源:Moscow Times、RFE/RL、Meduza、CEPA、DFRLab、The Bell等を優先参照。
  • GPU保有数・ユーザー数等の数値はいずれも自己申告または推定であり、幅を持って解釈が必要。

土曜日, 5月 23, 2026

中国LLM 2026年5月 完全ガイド

 

1. はじめに — 「中国AI」はもう一つの宇宙になった


2025年1月、DeepSeek R1が世界を驚かせてから1年半。中国のLLM開発は、単なる「米国モデルの追随」から「独自のフロンティア形成」へと質的に変化しました。


2026年5月時点でトップ層の差は数ポイント以内に縮まり、一部のコーディング・エージェントベンチマークでは中国モデルが米国フラッグシップを上回っています。同時に、コスト面での逆転は既成事実です。同等性能で5〜30倍安価というのは、もはや例外ではなく標準です。


本記事では、2026年5月時点の中国LLM勢力図を全方位で整理します。オープンソース・商用・政府系を問わず主要モデルを網羅し、米国フロンティアとの性能比較、開発戦略、そして日本企業への実務的な含意まで解説します。


2. 2026年5月 中国LLM 勢力図俯瞰


まず全体像を把握するために、主要プレイヤーを「オープンソース系」「商用クローズド系」「特化型・業界LLM」に分類して整理します。


2-1. オープンソース/オープンウェイト系(グローバル展開型)


DeepSeek(杭州)Qwen/通義千問(Alibaba)GLM(Z.ai / 清華大学発)Kimi(Moonshot AI)MiniMaxの5社が中核です。いずれもMIT/Apache 2.0でウェイトを公開し、Hugging Faceで世界中の開発者に浸透しています。


特筆すべきは Alibaba Qwen ファミリーの規模です。2025年10月時点で Meta の Llama を抜き、2025年12月の月間ダウンロード数は下位8モデルの合計を超えました。2026年1月時点の累計ダウンロード数は約7億、派生モデルは20万超という圧倒的なエコシステムを形成しています。


2-2. 商用クローズド系(国内市場主力)


Baidu(ERNIE)Tencent(Hunyuan)ByteDance(Doubao Seed)iFlytek(Spark)の4社が中心です。これらは中国国内の消費者・企業市場でシェアを争い、WeChat・Douyin・百度検索などの巨大プラットフォームと深く統合されています。


Doubao(ByteDance)はQuestMobile 2025年12月調査で中国No.1 AIアプリ(155百万週間アクティブユーザー)を記録。ByteDanceの計算では2025年12月時点で1日50兆トークン以上を処理しています。


2-3. 特化型・業界LLM


法律(Thunisoft 华语万象)、医療(Alibaba Health 医知鹿)、製造・エネルギー(Huawei Pangu 5.5)、金融、政府向けなど、業界特化モデルが急増中です。また01.AI(李開復)はSamsung・Alibaba Cloudとの統合で企業向けにピボットしました。


3. 主要モデル詳説


3-1. DeepSeek — 効率革命の旗手


DeepSeek は杭州の量子ファンド系企業で、2023年末から「少ないコンピュートで最大の性能」を哲学として打ち出してきました。


DeepSeek V4(2026年4月24日リリース)


2026年最大の注目リリースです。

  • V4-Pro:総パラメータ 1.6T MoE / 49B アクティブ / 1M トークン文脈 / MIT

  • V4-Flash:284B MoE / 13B アクティブ / 1M トークン文脈 / MIT

  • アーキテクチャ革新:Compressed Sparse Attention (CSA) + Heavily Compressed Attention (HCA) のハイブリッドにより、1M文脈時の計算量をV3.2比27%・KVキャッシュを10%に圧縮

  • 価格:V4-Pro 入力 $1.74 / 出力 $3.48 per Mtok。V4-Flash 入力 $0.14 / 出力 $0.28 per Mtok

  • SWE-bench Verified:80.6%(V4-Pro-Max)


V4-Pro の出力単価($3.48/Mtok)は Claude Opus 4.7($25)の約7倍安、GPT-5.5($30)の約9倍安です。フロンティアに肩を並べるコーディング性能をこの価格で実現したことで、企業採用の閾値を一段引き下げました。


DeepSeek V3.2 / V3.2-Exp(2025年9〜12月)


V3.2の系譜は2段階に分けて理解する必要があります。

  • V3.2-Exp(2025年9月29日):実験版。DSAの初実装。コンテキスト約128K。API価格を最大50%引き下げ

  • V3.2 正式版(2025年12月1日):685B MoE。コンテキスト約160K。SWE-Bench Verified 77.2%。入力 $0.26 / 出力 $0.38 per Mtok

  • V3.2-Speciale(2025年12月1〜15日限定):数学・競プロ特化。AIME 2025 96.0%、IMO/CMO/ICPC/IOI金メダル級


DeepSeek R1(2025年1月20日)


  • 671B MoE / MIT。AIME 2024 79.8%、MATH-500 94.5%。OpenAI o1 相当の推論性能でオープン化

  • R2 については2026年5月時点で公式リリースなし(V4 Thinkingモードが事実上の後継と見る見方が多い)


3-2. Qwen / 通義千問(Alibaba)— 世界最大の派生エコシステム


Alibaba のオープンソース戦略の中核です。累計ダウンロード約7億(2026年1月時点)、公式派生モデル113,000超、タグ込みで200,000超という規模は他を大きく引き離しています。


  • Qwen 3.5(397B-A17B、2026年2月):201言語対応、Gated Delta Network + Sparse MoE。GPQA Diamond 86.0、AIME 2026 92.7

  • Qwen 3.6-27B / 35B-A3B / 3.6-Plus(2026年4月):27Bデンス版がSWE-Bench Verified 77.2%でMoE大型版を上回る。Q4_K_M量子化で16.8GB(消費者GPU1枚動作)

  • Qwen3-Coder-480B-A35B:最大コーディング特化モデル。さくらのAI Engineで国内ホスト提供中

  • NVIDIA TensorRT-LLM最適化でQwen3-4B BF16が最大16倍スループット


3-3. Kimi K2.6(Moonshot AI)— オープンのコーディング王者


北京発のMoonshot AIは「オープンソース版Claude」を目指し、短期間でフロンティア入りを果たしました。


Kimi K2.6(2026年4月20日リリース)

  • 1T MoE / 32B アクティブ / Modified MIT / 文脈長 256K トークン

  • SWE-Bench Pro 58.6%(GPT-5.4の57.7%、Claude Opus 4.6の53.4%を超えコーディング系で首位)

  • SWE-Bench Verified 80.2%(Claude Opus 4.6の80.8%と同等水準)

  • Terminal-Bench 2.0 66.7%、HLE with tools 54.0%

  • Agent Swarm:300サブエージェント / 4,000ステップの並列自律実行

  • API価格:入力 $0.60 / 出力 $2.50 per Mtok(Claude Opus 4.7比 約10倍安)


専用CLI「Kimi Code」(Apache 2.0)は Claude Code エコシステムと互換設計で、MCP・Claude Code CLI との置き換えを明示的に狙っています。


3-4. GLM-5 / GLM-5.1(Z.ai / 旧 Zhipu AI)— 国産チップで作ったフロンティアモデル


清華大学発のZ.ai(旧Zhipu AI)は、2026年1月8日に香港証券取引所へ上場(上場初日時価総額 HK$52.83億、約68億米ドル)し、世界初の上場LLM基盤モデル企業になりました。IPO調達額は HKD 43.5億(約5.6億米ドル)です。


GLM-5(2026年2月11日)

  • 744B MoE / 40B アクティブ / MIT / 文脈 200K

  • 最大の技術的意義:100,000台の Huawei Ascend 910B + MindSpore で完全トレーニング(NVIDIA不使用)

  • SWE-Bench Verified 77.8%、Humanity's Last Exam 50.4%(Claude Opus 4.5超え)、BrowseComp 75.9(オープン1位)

  • なお Z.ai は2025年1月に米国エンティティリストに追加され、H100/H200等の購入が法的に禁止された状態での達成


GLM-5.1(2026年4月7日、オープンウェイト公開)

  • 754B MoE / 40B アクティブ / MIT

  • SWE-Bench Pro 58.4%(2026年5月時点の独立集計でフロンティア超え)

  • 8時間連続自律実行、655イテレーションでLinuxデスクトップ環境をゼロ構築したデモが話題


GLM-5ファミリーが「NVIDIA不要でフロンティア競争力を持てる」ことを証明したことの地政学的・産業的インパクトは計り知れません。


3-5. ERNIE / 文心(Baidu)— 巨人の逆襲


  • ERNIE 4.5シリーズ(2025年6月オープンソース化):0.3B〜424B(47Bアクティブ)の10バリアント、Apache 2.0

  • ERNIE 5.0(2026年1月22日):2.4T MoE、ネイティブマルチモーダル(テキスト・画像・音声・動画)、アクティブ率 < 3%

  • ERNIE-4.5-VL-28B-A3B-Thinking:Apache 2.0、28B/3Bアクティブで視覚推論特化

  • 価格戦略:ERNIE X1 が DeepSeek R1 比半額(入力2元/100万トークン)で攻勢


3-6. Hunyuan(Tencent)— 元OpenAI研究者が陣頭指揮


  • Hunyuan Hy3 Preview(2026年4月23日):元OpenAI研究者・姚順雨(清華大学姚班卒、28歳)指揮。295B/21Bアクティブ MoE。SWE-Bench Verified 74.4%

  • HunyuanImage 3.0:80B MoE画像生成、LM Arena ELO 1152(#8位)

  • Hunyuan-MT-7B(2025年9月):33言語翻訳特化、Hugging Faceトレンド1位


3-7. Doubao Seed 2.0(ByteDance)— 中国 No.1 AIアプリのエンジン


  • 2026年2月14日リリース(中国春節ガラ2日前)。Pro / Lite / Mini / Code の4バリアント

  • Doubao Seed 2.0 Pro:AIME 2025 98.3%、GPQA Diamond 88.9%、SWE-Bench Verified 76.5%、Codeforces 3020

  • VideoMME 89.5%(1時間動画理解)、ICPC / IMO / CMO 金メダル級

  • 価格:入力 $0.47 / 出力 $2.37 per Mtok(GPT-5.2比 入力3.7倍・出力5.9倍安)

  • Doubaoアプリは155百万 WAU(中国 No.1)。2025年12月時点で1日50兆トークン処理


3-8. その他注目モデル


  • Step 3.5 Flash(階躍星辰、2026年2月1日):196B/11Bアクティブ、AIME 2025 97.3%。入力 $0.10 / 出力 $0.30 per Mtok(業界最安価帯)

  • MiniMax M2.7(2026年3月18日):Self-Evolving(100ラウンド自律最適化)、SWE-Pro 56.2%、入力 $0.30 / 出力 $1.20 per Mtok

  • iFlytek Spark X1(2025年4月):Huawei Ascendのみで70B学習。国産AIスタック完結の象徴

  • 01.AI(李開復):2025年から企業向けAIアプリ路線にピボット。Alibaba Cloud との統合で垂直展開


4. フロンティアモデルとの性能比較


主要ベンチマークで中国モデルと米国フロンティアを比較します。(*印は各社自己申告値を含む。独立検証との乖離に注意)


モデル

リリース

SWE Pro

SWE Verified

GPQA Diamond

AIME 2026

API価格(in/out, per Mtok)

── 米国フロンティアモデル(比較基準)

Claude Opus 4.7*

2026/05

58.6+

87.6

94.6

99.1

$5 / $25(推定)

GPT-5.5*

2026/04

57.7

92.8

99.2

$5 / $30(推定)

Gemini 3.1 Pro*

2026/04

54.2

80.6

92.4

$1.25 / $10

── 中国主要モデル(2026年5月時点最新)

DeepSeek V4-Pro

2026/04/24

80.6

$1.74 / $3.48

DeepSeek V4-Flash

2026/04/24

$0.14 / $0.28

Kimi K2.6

2026/04/20

58.6

80.2

90.5

96.4

$0.60 / $2.50

GLM-5.1(Z.ai)

2026/04/07

58.4

95.3

$0.80–1.00 / $2.56–3.20

GLM-5(Z.ai)

2026/02/11

77.8

86.0

92.7

$1.00 / $3.20

Doubao Seed 2.0 Pro

2026/02/14

76.5

88.9

94.2

$0.47 / $2.37

Hunyuan Hy3 Preview

2026/04/23

74.4

¥1.2 / ¥4(元)

Qwen 3.5(397B-A17B)

2026/02

72.4(27B)

86.0

92.7

Alibaba Cloud

MiniMax M2.7

2026/03/18

56.2

$0.30 / $1.20

Step 3.5 Flash

2026/02/01

97.3

$0.10 / $0.30

DeepSeek V3.2

2025/12/01

77.2

75.1

$0.26 / $0.38


注:SWE-Bench Proは評価ハーネスの実装(ツール・プロンプト設定)によって同一モデルでも10ポイント以上変動するため、同一ハーネスでの比較が望ましい。*印モデルはベンダー公表値のみで、独立検証が限定的。「Claude Opus 4.7」「GPT-5.5」等の正式名称・バージョンは参照元ソースの表記に基づく。


4-1. 総合知能 vs コーディング:評価軸による逆転


2026年5月時点のLLM競争は「どのベンチマーク軸で見るか」で勝敗が大きく異なります。


  • 総合知能(Artificial Analysis Intelligence Index、GPQA Diamond 等):米国フロンティア(Claude Opus 4.7・GPT-5.5・Gemini 3.1 Pro)が依然リード

  • コーディング(SWE-Bench Pro / Verified):Kimi K2.6(58.6%)とGLM-5.1(58.4%)が GPT-5.4(57.7%)を超え、中国モデルが首位

  • コスト/性能比:GPT-5.5 / Claude Opus 4.7 と同等タスクで 5〜30倍安価。Kimi K2.6 vs Opus 4.7 はSWE-Bench Pro 同水準で出力約10倍安


4-2. ギャップ縮小トレンド


LMSYS Chatbot Arena における オープン vs プロプライエタリの MMLU差は2025〜2026年の1年で約17.5ポイントから0.3ポイントまで縮小。

推論コストは2023年初頭の $30/Mtok から2026年には $1/Mtok 以下(年率約10倍低下)へ。


5. 開発の狙いと戦略


5-1. オープンソース化で世界のエコシステムを取る


DeepSeek・Qwen・GLM・Kimi の主要4系列は MIT または Apache 2.0 でウェイトを公開しています。その狙いは明確です。

  • API 有料化のための「上流囲い込み」:オープン化で世界中の開発者に浸透させ、スケールアップ需要はクラウドAPIで課金

  • ベンチマーク権威獲得:Hugging Face 上でのダウンロード数・派生モデル数がブランド力に直結

  • 地政学的ヘッジ:「誰でも使える」状態にしておくことで制裁リスクを分散


5-2. 国産チップ独立とソブリンAI戦略


2025年1月の米国エンティティリスト強化(H100/H200対中輸出禁止維持)への対応として、中国各社は加速度的に国産チップへの移行を進めています。

  • GLM-5 / GLM-5.1:100,000台 Huawei Ascend 910B のみでトレーニング完了(NVIDIA不使用)

  • iFlytek Spark X1:Ascend のみで70B学習

  • DeepSeek V4:Huawei Ascend対応の推論最適化を明記


CFR(米外交問題評議会)の Chris McGuire は2025年12月時点で「現在の米国AIチップ(NVIDIA H100クラス)は Huawei 最高製品の約5倍の性能(Total Processing Performance 比)」とし、2027年にはその差が17倍に広がると予測しています。しかし GLM-5 の実績は「性能差があっても、ソフトウェア最適化・クラスタ規模・効率的なアーキテクチャで補完可能」であることを示しました。


5-3. 各社の差別化戦略


  • DeepSeek:「アーキテクチャ効率革命」。MoE + MLA + DSA + Muon Optimizer で NVIDIA 制約を構造的に回避

  • Alibaba(Qwen):「オープン × クラウド」。Apache 2.0 で全デバイス対応(Apple Silicon・AMD・Arm・MediaTek)、商用はAlibaba Cloud で課金

  • Tencent(Hunyuan):元OpenAI研究者を招聘し WeChat / Yuanbao との深い製品統合で差別化

  • Z.ai(GLM):香港上場・MIT公開・Coding Plan サブスク。「透明なフロンティア企業」として信頼醸成

  • Moonshot(Kimi):Claude Code エコシステムとの互換性で乗り換えコストゼロ

  • ByteDance(Doubao):155百万ユーザーへの「無料」配布で No.1 AIアプリ化。Volcano Engine で法人課金


6. 中国政府の政策・規制


中国国内のAI規制は「育成と管理の両立」を基本方針としています。


  • 生成式人工知能服務管理暫定弁法(2023年8月施行):世論喚起力を持つ生成AIサービスは届出(备案)義務。2025年8月末時点で538件届出済、263件登録済

  • AI生成合成内容標識弁法(2025年9月施行):AI生成物への明示・暗示ラベル義務

  • 政務領域AI大模型部署応用指引(2025年10月、CAC):政府機関のAI利用は「補助型」位置付け、人間レビュー必須

  • 拟人化互动服务管理暂行办法(2026年7月施行予定):AIコンパニオン・感情型インタラクションを規律

  • 「人工知能+」行動意見(2025年8月、国務院)、AI安全治理框架 2.0(2025年9月)


ソブリンAI 2.0 政策のもと、外資モデル(OpenAI・Anthropic・Google)は実質的に中国市場から締め出されており、中国企業は国内クローズド市場でスケールを獲得する一方、オープンソース経由で海外市場への浸透を図るという非対称な競争を展開しています。


7. 日本市場・企業への影響


7-1. 採用した企業


日本企業による中国系LLMの採用は着実に進んでいます。主な事例は以下のとおりです。


企業

採用モデル

公表時期

ライセンス

概要・成果

みずほFG

Qwen3-32B(継続学習)

2025年12月

Apache 2.0

H100×1枚でRAG付き正答率89%(GPT-5.2同等)。金融業務特化SFT

楽天グループ

Rakuten AI 3.0(=DeepSeek V3)

2026年3月17日

MIT(後追い付与)

671B/37Bアクティブ。config.jsonでDeepSeek V3ベース発覚。METI GENIAC支援

サイバーエージェント

DeepSeek-R1-Distill-Qwen 14B/32B日本語版

2025年1月27日

MIT

32B版がo1-mini超えベンチ報告

ABEJA

Qwen2.5-32B / QwQ-32B 日本語特化

2025年1〜4月

Apache 2.0

MT-Bench 9.2(自社評価)

Lightblue(東大発)

DeepSeek-R1 Distill / Qarasu / Karasu 系

2025年2月〜

Apache 2.0

消費者GPU1枚動作、自然言語98.2%精度(自社評価)

さくらのAI Engine

Qwen3-Coder-480B-A35B等 国内ホスト

2025年9月24日 GA

各種

¥0.15/万入力tok、国内DC完結、学習データ非送信


7-2. 「DeepSeekラッパー問題」— 楽天AI 3.0の教訓


2026年3月17日、楽天グループは Rakuten AI 3.0 を「日本最大・最強のAIモデル」として発表しました。しかし公開当日、コミュニティが Hugging Face の config.json ファイルを確認し、アーキテクチャフィールドが「DeepseekV3ForCausalLM」であることを発見。パラメータ構成(671B / 37Bアクティブ / 128K文脈)も DeepSeek V3 と完全一致していました。


さらに初版リリースには DeepSeek の MIT ライセンス NOTICE が付属しておらず、指摘後に追加されるという対応となりました。楽天はその後「オープンソースコミュニティの成果をベースに採用した」と認めています。


日経は「日本の主要企業LLMの上位10種のうち6種が DeepSeek または Qwen の二次開発」と報じました(Aitoolsbee 経由)。国内AIと謳われるモデルのベースを確認することが、現在の調達判断において不可欠です。


7-3. 禁止した企業


共同通信(2025年2月12日報道)によると、以下の企業が自主的に利用を禁止しています。

  • トヨタ自動車:「情報セキュリティの観点から懸念があるため、利用を禁止」

  • 三菱重工業:従業員の申請を却下、業務利用一切不可

  • ソフトバンク:「社内からのアクセスを規制し、業務用端末でのダウンロードや利用を禁止」

  • 大手素材メーカー、大手住宅メーカー(社名非公表)


7-4. 政府・規制当局の対応


  • 個人情報保護委員会(2025年2月3日):DeepSeek が取得した個人情報は PRC サーバーに保存され、中国法令が適用される旨を周知

  • デジタル庁/NISC(2025年2月6日):機密・要機密情報での利用を禁じる事務連絡。関連省庁は NISC・デジタル庁に事前協議を求める

  • 林芳正官房長官(2025年2月6日会見):「適切な対応を講じている」

  • 日本の現行対応:「注意喚起」レベルにとどまり、韓国・台湾・イタリア・テキサス州・米海軍等のブランケット禁止とは異なる


重要:日本政府は機関ごとの自主判断を基本としており、クラウドAPIの直接利用のみを制限する通知です。オープンウェイトをオンプレ(国内 DC)で動かすことは現行規制の対象外です。


8. 日本企業への実務指針


8-1. 用途別モデル選択の考え方


用途

推奨モデル

理由

高度推論・複雑タスク

Claude Opus 4.7 / GPT-5.5

総合知能で依然リード。機密性の低い用途

コーディング・SWE

Kimi K2.6 / GLM-5.1

SWE-Bench Pro でフロンティア超え。Claude Code 互換

汎用・バッチ処理

Qwen 3.5 / DeepSeek V4-Flash

高速・低コスト。国内DCホスト可能

数学・推論特化

Doubao Seed 2.0 Pro

AIME 98.3%、数学競技金メダル級

機密性の高い業務

Qwen3-32B / GLM-5(オンプレ)

Apache 2.0/MIT。国内DCでクローズド運用

超低コストバッチ

Step 3.5 Flash / DeepSeek V4-Flash

$0.10〜$0.14/Mtok。性能より量を重視する場合


8-2. リスク管理の三原則


  • 【個人情報・機密データ】中国本土のAPIに機密情報を送らない。PPC通知のとおり、中国法令が適用される。クラウド版ではなくオンプレ + 国内DCで完結する設計を

  • 【ライセンス透明性】調達時に config.json / アーキテクチャ / ライセンスNOTICE の整合を確認。楽天AI 3.0 のケースのように、「国産」を謳うモデルのベースが中国モデルである事例が複数存在

  • 【地政学変化モニタリング】米国の追加制裁(中国AI企業向け)、日本の規制強化の可能性あり。月次でPPC・デジタル庁・NICSの発表を確認


8-3. 段階的導入アプローチ


Stage 1:評価・PoC(〜3ヶ月)

非機密データで Qwen 3.5 / DeepSeek V4-Flash / Kimi K2.6 を比較評価

ルーティング先:さくらのAI Engine(国内DC)/ AWS Bedrock / Azure(米国リージョン)— 中国本土API直叩きは不可

採用閾値目安:SWE-Bench Verified 70%以上 / AA Intelligence Index 50以上 / MT-Bench 8.5以上


Stage 2:オンプレ展開(3〜9ヶ月)

機密性の高い業務はオープンウェイト(Apache 2.0 / MIT)をオンプレ運用

推奨:Qwen 3.6-27B(量子化で消費者GPU動作)/ GLM-5.1 INT4量子化 / DeepSeek V4-Flash

みずほFGの先行事例(Qwen3-32B + RAG + H100×1枚 → 正答率89%)が参照アーキテクチャ

ガバナンス:国内DC完結・学習データ非送信・生成コンテンツ標識・ログ180日保存


Stage 3:マルチモデル・ルーティング(9〜18ヶ月)

「Tiered Intelligence Stack」:高難度タスクは Claude/GPT、汎用は Qwen、コーディングは Kimi K2.6/GLM-5.1、バッチは V4-Flash

AI ゲートウェイ層で全リクエストをログ(モデル先・トークン数・レイテンシ・タイムスタンプ)

AI.cc(2026年5月)調査では企業の64%が「Tiered Intelligence Stack」を採用し、平均使用モデル数は前年比+124%(2.1→4.7)


9. まとめ — 中国LLMとどう向き合うか


2026年5月の中国LLM群を一言で表すなら「コーディング・コスト領域での逆転、総合知能での追い上げ」です。


Kimi K2.6 と GLM-5.1 はコーディング系ベンチマークで米国フラッグシップを超えました。GLM-5 は NVIDIA なしでフロンティアを作れることを証明しました。Doubao は中国国内で 155百万 WAU のリアルな実績を持ちます。Qwen は世界最大のオープンエコシステムを構築しています。


一方で、総合的な知能ベンチマーク(GPQA Diamond・HLE等)での最上位は依然として Claude Opus / GPT-5 系列です。「コーディングは中国モデル、推論は米国モデル」という使い分けが現実解に近づいています。


日本企業にとっての実務的な結論は:

  • 非機密のコーディング・バッチ・汎用タスクは積極活用。コストが5〜30倍安い選択肢を無視する理由はない

  • 個人情報・機密は国内DCオンプレ一択。クラウドAPIは「どのリージョンで処理されるか」を必ず確認

  • 「国産AI」を謳うモデルのベースは必ず確認。楽天AI 3.0のようにDeepSeek/Qwen二次開発が多数ある

  • 月次で規制動向をウォッチ。PPC・デジタル庁・NICSの追加発表があれば即時対応


中国LLMは「競争相手」でも「危険なもの」でもなく、使い方次第で強力なコスト削減と生産性向上をもたらすツールです。正しいガバナンスのもとで賢く活用することが、AI競争時代の企業戦略の鍵となります。