月曜日, 5月 25, 2026

ChatGPT後のロシア生成AI:制裁下の「主権AI」戦略と西側との分岐(2022–2026年)

 

TL;DR

  • ロシアは制裁と頭脳流出に直面しながらも、Sber(GigaChat)とYandex(YandexGPT/Alice AI)を二大プレイヤーとする「主権AI(Sovereign AI)」エコシステムを2023年以降急速に構築した。だが、独立系評価では米国LLMがMMLUでGigaChat MAXの現水準より1年先行しており(Ben Dubow/CEPA・Omelas、The Moscow Times 2025年1月28日付)、Sber自身が認める「米中に6〜9ヶ月遅れ」(Alexander Vedyakhin副CEO、Reuters 2025年6月)はむしろ楽観寄りである。
  • OpenAI、Microsoft Azure、Google Cloud、AWSはいずれも2022年3月までにロシアでの新規販売を停止、OpenAIは2024年7月9日にAPIアクセスをIP単位でブロックした。一般ユーザーはChatGPTにVPN経由でしかアクセスできず、国内代替(GigaChat、YandexGPT、T-Bank Gen-T、MTS Cotype)への移行が国家戦略として推進されている。
  • 同時に、ロシア政府はAIを国家安全保障の中核と位置づけ、2030年までにAIによるGDP寄与を11兆ルーブル超に拡大することを目標化。一方でRT/FSB主導の「Meliorator」や「Pravda(プラウダ)ネットワーク」など、生成AIを情報戦・西側LLMの「LLMグルーミング(汚染)」に転用する活動が並行して進む二面性が際立つ。

1. 国産LLMの主要プレイヤー

Sber GigaChat

2023年4月クローズドβ公開、2024年2月時点で個人ユーザー250万人。2025年3月のGigaChat 2.0発表時点で15,000社の法人ユーザー(Sber副CEO Alexander Vedyakhin発言、Reuters取材)。Sber投資家プレゼンでは2025年通年で「月次2,000万ユーザー、年間8億クエリ、AIによる経済効果4,500億ルーブル(うち生成AI500億ルーブル)」と自己申告(Investing.com経由)。

2025年11月のオープン化では2モデルを同時公開(GitHub salute-developers/gigachat3、MITライセンス):

  • GigaChat 3 Ultra Preview(702B-A36B):MoE、MTP、MLA搭載のフラッグシップ。コンテキスト128Kトークン。ロシア語MERAベンチマーク1位を主張(自己ベンチ)。
  • GigaChat 3 Lightning(10B-A1.8B):ローカル・高負荷用の軽量版。コンテキスト256Kトークン。

さらに2026年1月には改良版GigaChat 3.1 Ultra/Lightningを追加公開(Habr 2026年1月記事)。

冷静な批判:Ben Dubow(CEPA上級研究員・Omelas CTO)はThe Moscow Times 2025年1月28日付記事「Russian AI Struggles in Its Own Language」で「GigaChat MAXの200億パラメータ・13万1千トークンコンテキストはChatGPT-3.5(約2年前)相当、Gemini 1.5の200万トークンには遠く及ばない」と指摘。mysummit.school(2026年3月)の独立ベンチマークでは「ファクトエラーが定期的に発生」とされDeepSeek V3.2やQwen 3.5 Plusを下回る。

Yandex YandexGPT/Alice AI

オープン公開のYaLM 100B(800台のA100で65日訓練)から商用YandexGPTへ移行。2024年4月にYandexGPT 3搭載Alice AIを発表、Aliceの月間アクティブユーザーは6,600万人(Yandex公式プレスリリース2024年4月19日)。2025年2月にYandexGPT 5、2026年初頭に新ファミリー発表。AliceはYandexGPT 5世代以降の最新モデルで継続的に更新。

T-Bank(旧Tinkoff)Gen-T

2024年12月に**T-Pro(320億パラメータ)とT-Lite(70億パラメータ)**をApache 2.0でオープン化。中国Alibaba Qwen2.5をベースにロシア語適応、開発コストを「ゼロから訓練する企業比で80〜90%削減」と主張(T-Bank広報、Vedomosti紙)。

MTS AI Cotype

2024年11月にCotype Nano(15億パラメータ)を商用利用可能なライセンスで公開(Snapdragon 8 Gen 2搭載スマホで9.5トークン/秒)。2025年にCotype Pro 2(コンテキスト12.8万トークン、推論速度40%向上)を発表。


2. 制裁・地政学的影響

西側テック企業の撤退

  • Microsoft:2022年3月4日にロシアでの新規製品・サービス販売を停止。EU第12次制裁パッケージ(2023年12月)を受け、2024年3月20日以降、ロシア法人はOffice 365、Azure、Teams等の利用を遮断
  • AWS:2022年3月8日に新規アカウント受付停止(Bloombergほか)。
  • Google Cloud:2022年3月10日に新規顧客受付停止、Google LLC Russiaは2022年9月28日に破産。
  • OpenAI2024年7月9日からAPIトラフィックのIPブロックを開始(ロシア・中国・イラン・北朝鮮対象)。
  • Meta:2022年3月21日にモスクワ裁判所が「過激派組織」認定。Facebook・Instagramがブロック(WhatsAppのみ例外)。

GPU・半導体制裁の実態

  • 2022年8月、NVIDIAがA100・H100のロシア・中国向け輸出停止を開示。2023年10月にA800/H800/L40Sに拡大。H200・Blackwellへの対象拡大が続く。
  • Shreyaサプライチェーン事件(Bloomberg, 2024年10月):インドの製薬会社Shreya Life Sciencesが2024年4〜8月、Dell PowerEdge XE9680サーバー1,111台(約3億ドル相当)をロシアに輸出。ルートは「マレーシア(Dell子会社出荷元)→インド(Shreya輸入)→ロシア(再輸出)」の3段階(Bloomberg詳報、TechSpot)。サーバーにはNVIDIA H100またはAMD Instinct MI300Xが搭載(混在、1,111台中998台はH100と判明)。2024年3〜8月にマレーシアからインドへ計1,407台が輸入された事実を貿易データが確認。
  • 英国政府はBaikal Electronics、MCST、MikronをARMライセンス停止対象として制裁指定(DCD)。

GPU保有の格差(推定)

RFE/RL匿名ソース:Sberが2022年2月以降に蓄積したGPUは推定約9,000枚。比較:

  • Microsoft:2024年単年で485,000枚のNVIDIA Hopper系を購入(Omdia調査、FT 2024年12月18日)
  • Meta:2024年に224,000枚購入、総保有60万H100換算(DCD)
  • Google:2024年に169,000枚購入

3. 国家戦略・政府政策

  • 2019年に初版、2024年2月に大統領令で大幅改訂したAI国家戦略。目標:AIサービス市場を2022年の120億ルーブルから2030年に600億ルーブルに、AI専攻大卒者を年15,500人(現状3,000人)に。
  • 2030年GDP寄与11兆ルーブル目標:副首相Chernyshenko発言(Interfax 2023年9月)。
  • プーチンは2025年11月のAI Journey会議で「国家AI実装計画」策定を指示(TASS)、同時に大統領府・政府直下の「AI本部」設置を命令。
  • 政府AI予算:2024年に50億ルーブル超(Mishustin首相、Interfax 2023年9月27日)。
  • データ経済国家プロジェクトに6年間7,000億ルーブル配分(プーチン、2024年2月連邦議会演説)。

4. 軍事・情報戦

Meliorator(AI駆動ボットファーム)

2024年7月、米司法省・FBI・カナダ・オランダ当局合同発表。RT副編集長指揮下のFSB共同運営、2022年4月開始。2024年6月時点でX上に968件の検証済み偽アカウント。米英独蘭波西ウクライナ・イスラエルを標的。米司法省は2024年7月にドメインmlrtr.com等を差し押さえ。

Pravdaネットワーク/LLMグルーミング

仏Viginumが2024年2月発見。182ドメイン、74ヶ国、12言語。NewsGuard 2025年3月報告:「2024年に360万本の記事を生成、10のメジャーチャットボットが偽情報を33%の頻度で復唱」。DFRLab(2026年4月):Common Crawlにおけるプラウダ英語記事は2024年11月の37本→2025年11月に約40,000本に急増。

ただしHarvard Kennedy School Misinformation Review(2025年10月、Alyukov et al.)は「偽情報復唱は5%」と異なる結論を出しており、**「LLMグルーミングよりデータ空白(data voids)が主因」**と指摘。

戦場AI

LancetドローンにNVIDIA Jetsonベースの自律ターゲティングモジュール搭載が2026年3月のキーウ攻撃で確認(ウクライナ軍情報総局HUR、Kyiv Post)。構成部品の大半が西側・中国製。


5. ユーザー普及・活用状況

  • Yakov and Partners調査(2024〜2025年):ロシア国民の**24%**が生成AIを個人・業務利用、**47%**が国産AIを優先。
  • ChatGPTはOpenAIのIPブロックにより事実上アクセス不可。VPN経由で利用継続するIT専門層が多い。
  • 政府サービス:Gosuslugi(電子政府)の「Robot Max」チャットボットが2024年にGPT機能追加。日次1,100万人訪問者。
  • 医療:モスクワ放射線リファレンスセンターが市内90クリニックでAI診断運用。
  • 宇宙2025年11月27日打ち上げのSoyuz MS-28でGigaChatをISS国際宇宙ステーションに配備(TASS、2025年11月26日)。
  • VK MAX:2025年にリリースされたスーパーアプリ。2025年9月1日以降、ロシアで販売されるスマートフォンへのプリインストール義務化。

6. 中国との接近・国際的位置づけ

  • 2024年末プーチンが中国との協力深化を指示。Sber副CEO VedyakhinはQwen/DeepSeek/MiniMaxとのパートナーシップ優先を表明。
  • 国際ランキング:Tortoise Media Global AI Index(2024年9月、83カ国)でロシアは31位。G5のうち上位にいない唯一の国。
  • DeepSeekによる「低コストLLM」の証明はロシアにとっても希望材料だが、「中国・インドは制裁回避取引に慎重」(RFE/RL)であり、資源・データ規模でも中国に遠く及ばない。

7. Yandex「分裂」:Nebius Groupとの対比

  • Yandex分離取引:2024年2月に475億ルーブル($5.2B)で合意、2024年7月に最終クロージング(最終的に**$5.4B相当)。ロシア資産を完全売却し、オランダ持株会社がNebius Group(NASDAQ: NBIS)**として独立。
  • Nebius:フィンランドのデータセンター(75MWに拡張中)を中心にAIクラウドへ特化。2026年3月11日、NVIDIAと戦略的パートナーシップを締結、NVIDIA が20億ドルを投資し「2030年末までにNVIDIAシステム5ギガワット超のデプロイ」を目標(NVIDIA公式プレスリリース、2026年3月11日)。Q1 2026売上の98%がAIクラウド事業、ARR 19.2億ドル。

考察と展望

ロシアの生成AIは「主権」と「実力」の間に大きな乖離を抱えたまま2026年を迎えている。制裁によるGPU不足は深刻で、Sber推定9,000枚はMicrosoftの2024年単年購入485,000枚の約2%にすぎない。GigaChat 3/3.1のMoEアーキテクチャ採用はハード制約への合理的適応だが、独立ベンチマークでは中国製オープンモデル(DeepSeek、Qwen)に後れをとっている。

国産チップ(Elbrus・Baikal)はTSMC依存の断絶で機能不全に近く、Huawei Ascend系チップへの依存は「中国の供給待ち行列の最後尾」という構造的弱点を抱える。2030年の「10基スーパーコンピュータ計画」($60億規模)は公開された建設進捗がなく、実現見通しは不透明だ。

一方でGigaChatはISS宇宙ステーション搭載やVK MAXへの組み込みなど「存在感の演出」において成果を上げており、ロシア語特化タスクでは依然として一定の競争力を持つ。ロシアAIの今後の分岐点は、(1)Huawei Ascend 950PRの確実な調達、(2)2030年スパコン計画の具体化、(3)年間AI人材育成15,500人目標の達成、の3点を観察軸として評価すべきである。


情報源の注記

  • ロシア政府・Sber・Yandex等の公式発表は政治的・商業的バイアスがあり、独立検証が困難。
  • 独立情報源:Moscow Times、RFE/RL、Meduza、CEPA、DFRLab、The Bell等を優先参照。
  • GPU保有数・ユーザー数等の数値はいずれも自己申告または推定であり、幅を持って解釈が必要。

土曜日, 5月 23, 2026

中国LLM 2026年5月 完全ガイド

 

1. はじめに — 「中国AI」はもう一つの宇宙になった


2025年1月、DeepSeek R1が世界を驚かせてから1年半。中国のLLM開発は、単なる「米国モデルの追随」から「独自のフロンティア形成」へと質的に変化しました。


2026年5月時点でトップ層の差は数ポイント以内に縮まり、一部のコーディング・エージェントベンチマークでは中国モデルが米国フラッグシップを上回っています。同時に、コスト面での逆転は既成事実です。同等性能で5〜30倍安価というのは、もはや例外ではなく標準です。


本記事では、2026年5月時点の中国LLM勢力図を全方位で整理します。オープンソース・商用・政府系を問わず主要モデルを網羅し、米国フロンティアとの性能比較、開発戦略、そして日本企業への実務的な含意まで解説します。


2. 2026年5月 中国LLM 勢力図俯瞰


まず全体像を把握するために、主要プレイヤーを「オープンソース系」「商用クローズド系」「特化型・業界LLM」に分類して整理します。


2-1. オープンソース/オープンウェイト系(グローバル展開型)


DeepSeek(杭州)Qwen/通義千問(Alibaba)GLM(Z.ai / 清華大学発)Kimi(Moonshot AI)MiniMaxの5社が中核です。いずれもMIT/Apache 2.0でウェイトを公開し、Hugging Faceで世界中の開発者に浸透しています。


特筆すべきは Alibaba Qwen ファミリーの規模です。2025年10月時点で Meta の Llama を抜き、2025年12月の月間ダウンロード数は下位8モデルの合計を超えました。2026年1月時点の累計ダウンロード数は約7億、派生モデルは20万超という圧倒的なエコシステムを形成しています。


2-2. 商用クローズド系(国内市場主力)


Baidu(ERNIE)Tencent(Hunyuan)ByteDance(Doubao Seed)iFlytek(Spark)の4社が中心です。これらは中国国内の消費者・企業市場でシェアを争い、WeChat・Douyin・百度検索などの巨大プラットフォームと深く統合されています。


Doubao(ByteDance)はQuestMobile 2025年12月調査で中国No.1 AIアプリ(155百万週間アクティブユーザー)を記録。ByteDanceの計算では2025年12月時点で1日50兆トークン以上を処理しています。


2-3. 特化型・業界LLM


法律(Thunisoft 华语万象)、医療(Alibaba Health 医知鹿)、製造・エネルギー(Huawei Pangu 5.5)、金融、政府向けなど、業界特化モデルが急増中です。また01.AI(李開復)はSamsung・Alibaba Cloudとの統合で企業向けにピボットしました。


3. 主要モデル詳説


3-1. DeepSeek — 効率革命の旗手


DeepSeek は杭州の量子ファンド系企業で、2023年末から「少ないコンピュートで最大の性能」を哲学として打ち出してきました。


DeepSeek V4(2026年4月24日リリース)


2026年最大の注目リリースです。

  • V4-Pro:総パラメータ 1.6T MoE / 49B アクティブ / 1M トークン文脈 / MIT

  • V4-Flash:284B MoE / 13B アクティブ / 1M トークン文脈 / MIT

  • アーキテクチャ革新:Compressed Sparse Attention (CSA) + Heavily Compressed Attention (HCA) のハイブリッドにより、1M文脈時の計算量をV3.2比27%・KVキャッシュを10%に圧縮

  • 価格:V4-Pro 入力 $1.74 / 出力 $3.48 per Mtok。V4-Flash 入力 $0.14 / 出力 $0.28 per Mtok

  • SWE-bench Verified:80.6%(V4-Pro-Max)


V4-Pro の出力単価($3.48/Mtok)は Claude Opus 4.7($25)の約7倍安、GPT-5.5($30)の約9倍安です。フロンティアに肩を並べるコーディング性能をこの価格で実現したことで、企業採用の閾値を一段引き下げました。


DeepSeek V3.2 / V3.2-Exp(2025年9〜12月)


V3.2の系譜は2段階に分けて理解する必要があります。

  • V3.2-Exp(2025年9月29日):実験版。DSAの初実装。コンテキスト約128K。API価格を最大50%引き下げ

  • V3.2 正式版(2025年12月1日):685B MoE。コンテキスト約160K。SWE-Bench Verified 77.2%。入力 $0.26 / 出力 $0.38 per Mtok

  • V3.2-Speciale(2025年12月1〜15日限定):数学・競プロ特化。AIME 2025 96.0%、IMO/CMO/ICPC/IOI金メダル級


DeepSeek R1(2025年1月20日)


  • 671B MoE / MIT。AIME 2024 79.8%、MATH-500 94.5%。OpenAI o1 相当の推論性能でオープン化

  • R2 については2026年5月時点で公式リリースなし(V4 Thinkingモードが事実上の後継と見る見方が多い)


3-2. Qwen / 通義千問(Alibaba)— 世界最大の派生エコシステム


Alibaba のオープンソース戦略の中核です。累計ダウンロード約7億(2026年1月時点)、公式派生モデル113,000超、タグ込みで200,000超という規模は他を大きく引き離しています。


  • Qwen 3.5(397B-A17B、2026年2月):201言語対応、Gated Delta Network + Sparse MoE。GPQA Diamond 86.0、AIME 2026 92.7

  • Qwen 3.6-27B / 35B-A3B / 3.6-Plus(2026年4月):27Bデンス版がSWE-Bench Verified 77.2%でMoE大型版を上回る。Q4_K_M量子化で16.8GB(消費者GPU1枚動作)

  • Qwen3-Coder-480B-A35B:最大コーディング特化モデル。さくらのAI Engineで国内ホスト提供中

  • NVIDIA TensorRT-LLM最適化でQwen3-4B BF16が最大16倍スループット


3-3. Kimi K2.6(Moonshot AI)— オープンのコーディング王者


北京発のMoonshot AIは「オープンソース版Claude」を目指し、短期間でフロンティア入りを果たしました。


Kimi K2.6(2026年4月20日リリース)

  • 1T MoE / 32B アクティブ / Modified MIT / 文脈長 256K トークン

  • SWE-Bench Pro 58.6%(GPT-5.4の57.7%、Claude Opus 4.6の53.4%を超えコーディング系で首位)

  • SWE-Bench Verified 80.2%(Claude Opus 4.6の80.8%と同等水準)

  • Terminal-Bench 2.0 66.7%、HLE with tools 54.0%

  • Agent Swarm:300サブエージェント / 4,000ステップの並列自律実行

  • API価格:入力 $0.60 / 出力 $2.50 per Mtok(Claude Opus 4.7比 約10倍安)


専用CLI「Kimi Code」(Apache 2.0)は Claude Code エコシステムと互換設計で、MCP・Claude Code CLI との置き換えを明示的に狙っています。


3-4. GLM-5 / GLM-5.1(Z.ai / 旧 Zhipu AI)— 国産チップで作ったフロンティアモデル


清華大学発のZ.ai(旧Zhipu AI)は、2026年1月8日に香港証券取引所へ上場(上場初日時価総額 HK$52.83億、約68億米ドル)し、世界初の上場LLM基盤モデル企業になりました。IPO調達額は HKD 43.5億(約5.6億米ドル)です。


GLM-5(2026年2月11日)

  • 744B MoE / 40B アクティブ / MIT / 文脈 200K

  • 最大の技術的意義:100,000台の Huawei Ascend 910B + MindSpore で完全トレーニング(NVIDIA不使用)

  • SWE-Bench Verified 77.8%、Humanity's Last Exam 50.4%(Claude Opus 4.5超え)、BrowseComp 75.9(オープン1位)

  • なお Z.ai は2025年1月に米国エンティティリストに追加され、H100/H200等の購入が法的に禁止された状態での達成


GLM-5.1(2026年4月7日、オープンウェイト公開)

  • 754B MoE / 40B アクティブ / MIT

  • SWE-Bench Pro 58.4%(2026年5月時点の独立集計でフロンティア超え)

  • 8時間連続自律実行、655イテレーションでLinuxデスクトップ環境をゼロ構築したデモが話題


GLM-5ファミリーが「NVIDIA不要でフロンティア競争力を持てる」ことを証明したことの地政学的・産業的インパクトは計り知れません。


3-5. ERNIE / 文心(Baidu)— 巨人の逆襲


  • ERNIE 4.5シリーズ(2025年6月オープンソース化):0.3B〜424B(47Bアクティブ)の10バリアント、Apache 2.0

  • ERNIE 5.0(2026年1月22日):2.4T MoE、ネイティブマルチモーダル(テキスト・画像・音声・動画)、アクティブ率 < 3%

  • ERNIE-4.5-VL-28B-A3B-Thinking:Apache 2.0、28B/3Bアクティブで視覚推論特化

  • 価格戦略:ERNIE X1 が DeepSeek R1 比半額(入力2元/100万トークン)で攻勢


3-6. Hunyuan(Tencent)— 元OpenAI研究者が陣頭指揮


  • Hunyuan Hy3 Preview(2026年4月23日):元OpenAI研究者・姚順雨(清華大学姚班卒、28歳)指揮。295B/21Bアクティブ MoE。SWE-Bench Verified 74.4%

  • HunyuanImage 3.0:80B MoE画像生成、LM Arena ELO 1152(#8位)

  • Hunyuan-MT-7B(2025年9月):33言語翻訳特化、Hugging Faceトレンド1位


3-7. Doubao Seed 2.0(ByteDance)— 中国 No.1 AIアプリのエンジン


  • 2026年2月14日リリース(中国春節ガラ2日前)。Pro / Lite / Mini / Code の4バリアント

  • Doubao Seed 2.0 Pro:AIME 2025 98.3%、GPQA Diamond 88.9%、SWE-Bench Verified 76.5%、Codeforces 3020

  • VideoMME 89.5%(1時間動画理解)、ICPC / IMO / CMO 金メダル級

  • 価格:入力 $0.47 / 出力 $2.37 per Mtok(GPT-5.2比 入力3.7倍・出力5.9倍安)

  • Doubaoアプリは155百万 WAU(中国 No.1)。2025年12月時点で1日50兆トークン処理


3-8. その他注目モデル


  • Step 3.5 Flash(階躍星辰、2026年2月1日):196B/11Bアクティブ、AIME 2025 97.3%。入力 $0.10 / 出力 $0.30 per Mtok(業界最安価帯)

  • MiniMax M2.7(2026年3月18日):Self-Evolving(100ラウンド自律最適化)、SWE-Pro 56.2%、入力 $0.30 / 出力 $1.20 per Mtok

  • iFlytek Spark X1(2025年4月):Huawei Ascendのみで70B学習。国産AIスタック完結の象徴

  • 01.AI(李開復):2025年から企業向けAIアプリ路線にピボット。Alibaba Cloud との統合で垂直展開


4. フロンティアモデルとの性能比較


主要ベンチマークで中国モデルと米国フロンティアを比較します。(*印は各社自己申告値を含む。独立検証との乖離に注意)


モデル

リリース

SWE Pro

SWE Verified

GPQA Diamond

AIME 2026

API価格(in/out, per Mtok)

── 米国フロンティアモデル(比較基準)

Claude Opus 4.7*

2026/05

58.6+

87.6

94.6

99.1

$5 / $25(推定)

GPT-5.5*

2026/04

57.7

92.8

99.2

$5 / $30(推定)

Gemini 3.1 Pro*

2026/04

54.2

80.6

92.4

$1.25 / $10

── 中国主要モデル(2026年5月時点最新)

DeepSeek V4-Pro

2026/04/24

80.6

$1.74 / $3.48

DeepSeek V4-Flash

2026/04/24

$0.14 / $0.28

Kimi K2.6

2026/04/20

58.6

80.2

90.5

96.4

$0.60 / $2.50

GLM-5.1(Z.ai)

2026/04/07

58.4

95.3

$0.80–1.00 / $2.56–3.20

GLM-5(Z.ai)

2026/02/11

77.8

86.0

92.7

$1.00 / $3.20

Doubao Seed 2.0 Pro

2026/02/14

76.5

88.9

94.2

$0.47 / $2.37

Hunyuan Hy3 Preview

2026/04/23

74.4

¥1.2 / ¥4(元)

Qwen 3.5(397B-A17B)

2026/02

72.4(27B)

86.0

92.7

Alibaba Cloud

MiniMax M2.7

2026/03/18

56.2

$0.30 / $1.20

Step 3.5 Flash

2026/02/01

97.3

$0.10 / $0.30

DeepSeek V3.2

2025/12/01

77.2

75.1

$0.26 / $0.38


注:SWE-Bench Proは評価ハーネスの実装(ツール・プロンプト設定)によって同一モデルでも10ポイント以上変動するため、同一ハーネスでの比較が望ましい。*印モデルはベンダー公表値のみで、独立検証が限定的。「Claude Opus 4.7」「GPT-5.5」等の正式名称・バージョンは参照元ソースの表記に基づく。


4-1. 総合知能 vs コーディング:評価軸による逆転


2026年5月時点のLLM競争は「どのベンチマーク軸で見るか」で勝敗が大きく異なります。


  • 総合知能(Artificial Analysis Intelligence Index、GPQA Diamond 等):米国フロンティア(Claude Opus 4.7・GPT-5.5・Gemini 3.1 Pro)が依然リード

  • コーディング(SWE-Bench Pro / Verified):Kimi K2.6(58.6%)とGLM-5.1(58.4%)が GPT-5.4(57.7%)を超え、中国モデルが首位

  • コスト/性能比:GPT-5.5 / Claude Opus 4.7 と同等タスクで 5〜30倍安価。Kimi K2.6 vs Opus 4.7 はSWE-Bench Pro 同水準で出力約10倍安


4-2. ギャップ縮小トレンド


LMSYS Chatbot Arena における オープン vs プロプライエタリの MMLU差は2025〜2026年の1年で約17.5ポイントから0.3ポイントまで縮小。

推論コストは2023年初頭の $30/Mtok から2026年には $1/Mtok 以下(年率約10倍低下)へ。


5. 開発の狙いと戦略


5-1. オープンソース化で世界のエコシステムを取る


DeepSeek・Qwen・GLM・Kimi の主要4系列は MIT または Apache 2.0 でウェイトを公開しています。その狙いは明確です。

  • API 有料化のための「上流囲い込み」:オープン化で世界中の開発者に浸透させ、スケールアップ需要はクラウドAPIで課金

  • ベンチマーク権威獲得:Hugging Face 上でのダウンロード数・派生モデル数がブランド力に直結

  • 地政学的ヘッジ:「誰でも使える」状態にしておくことで制裁リスクを分散


5-2. 国産チップ独立とソブリンAI戦略


2025年1月の米国エンティティリスト強化(H100/H200対中輸出禁止維持)への対応として、中国各社は加速度的に国産チップへの移行を進めています。

  • GLM-5 / GLM-5.1:100,000台 Huawei Ascend 910B のみでトレーニング完了(NVIDIA不使用)

  • iFlytek Spark X1:Ascend のみで70B学習

  • DeepSeek V4:Huawei Ascend対応の推論最適化を明記


CFR(米外交問題評議会)の Chris McGuire は2025年12月時点で「現在の米国AIチップ(NVIDIA H100クラス)は Huawei 最高製品の約5倍の性能(Total Processing Performance 比)」とし、2027年にはその差が17倍に広がると予測しています。しかし GLM-5 の実績は「性能差があっても、ソフトウェア最適化・クラスタ規模・効率的なアーキテクチャで補完可能」であることを示しました。


5-3. 各社の差別化戦略


  • DeepSeek:「アーキテクチャ効率革命」。MoE + MLA + DSA + Muon Optimizer で NVIDIA 制約を構造的に回避

  • Alibaba(Qwen):「オープン × クラウド」。Apache 2.0 で全デバイス対応(Apple Silicon・AMD・Arm・MediaTek)、商用はAlibaba Cloud で課金

  • Tencent(Hunyuan):元OpenAI研究者を招聘し WeChat / Yuanbao との深い製品統合で差別化

  • Z.ai(GLM):香港上場・MIT公開・Coding Plan サブスク。「透明なフロンティア企業」として信頼醸成

  • Moonshot(Kimi):Claude Code エコシステムとの互換性で乗り換えコストゼロ

  • ByteDance(Doubao):155百万ユーザーへの「無料」配布で No.1 AIアプリ化。Volcano Engine で法人課金


6. 中国政府の政策・規制


中国国内のAI規制は「育成と管理の両立」を基本方針としています。


  • 生成式人工知能服務管理暫定弁法(2023年8月施行):世論喚起力を持つ生成AIサービスは届出(备案)義務。2025年8月末時点で538件届出済、263件登録済

  • AI生成合成内容標識弁法(2025年9月施行):AI生成物への明示・暗示ラベル義務

  • 政務領域AI大模型部署応用指引(2025年10月、CAC):政府機関のAI利用は「補助型」位置付け、人間レビュー必須

  • 拟人化互动服务管理暂行办法(2026年7月施行予定):AIコンパニオン・感情型インタラクションを規律

  • 「人工知能+」行動意見(2025年8月、国務院)、AI安全治理框架 2.0(2025年9月)


ソブリンAI 2.0 政策のもと、外資モデル(OpenAI・Anthropic・Google)は実質的に中国市場から締め出されており、中国企業は国内クローズド市場でスケールを獲得する一方、オープンソース経由で海外市場への浸透を図るという非対称な競争を展開しています。


7. 日本市場・企業への影響


7-1. 採用した企業


日本企業による中国系LLMの採用は着実に進んでいます。主な事例は以下のとおりです。


企業

採用モデル

公表時期

ライセンス

概要・成果

みずほFG

Qwen3-32B(継続学習)

2025年12月

Apache 2.0

H100×1枚でRAG付き正答率89%(GPT-5.2同等)。金融業務特化SFT

楽天グループ

Rakuten AI 3.0(=DeepSeek V3)

2026年3月17日

MIT(後追い付与)

671B/37Bアクティブ。config.jsonでDeepSeek V3ベース発覚。METI GENIAC支援

サイバーエージェント

DeepSeek-R1-Distill-Qwen 14B/32B日本語版

2025年1月27日

MIT

32B版がo1-mini超えベンチ報告

ABEJA

Qwen2.5-32B / QwQ-32B 日本語特化

2025年1〜4月

Apache 2.0

MT-Bench 9.2(自社評価)

Lightblue(東大発)

DeepSeek-R1 Distill / Qarasu / Karasu 系

2025年2月〜

Apache 2.0

消費者GPU1枚動作、自然言語98.2%精度(自社評価)

さくらのAI Engine

Qwen3-Coder-480B-A35B等 国内ホスト

2025年9月24日 GA

各種

¥0.15/万入力tok、国内DC完結、学習データ非送信


7-2. 「DeepSeekラッパー問題」— 楽天AI 3.0の教訓


2026年3月17日、楽天グループは Rakuten AI 3.0 を「日本最大・最強のAIモデル」として発表しました。しかし公開当日、コミュニティが Hugging Face の config.json ファイルを確認し、アーキテクチャフィールドが「DeepseekV3ForCausalLM」であることを発見。パラメータ構成(671B / 37Bアクティブ / 128K文脈)も DeepSeek V3 と完全一致していました。


さらに初版リリースには DeepSeek の MIT ライセンス NOTICE が付属しておらず、指摘後に追加されるという対応となりました。楽天はその後「オープンソースコミュニティの成果をベースに採用した」と認めています。


日経は「日本の主要企業LLMの上位10種のうち6種が DeepSeek または Qwen の二次開発」と報じました(Aitoolsbee 経由)。国内AIと謳われるモデルのベースを確認することが、現在の調達判断において不可欠です。


7-3. 禁止した企業


共同通信(2025年2月12日報道)によると、以下の企業が自主的に利用を禁止しています。

  • トヨタ自動車:「情報セキュリティの観点から懸念があるため、利用を禁止」

  • 三菱重工業:従業員の申請を却下、業務利用一切不可

  • ソフトバンク:「社内からのアクセスを規制し、業務用端末でのダウンロードや利用を禁止」

  • 大手素材メーカー、大手住宅メーカー(社名非公表)


7-4. 政府・規制当局の対応


  • 個人情報保護委員会(2025年2月3日):DeepSeek が取得した個人情報は PRC サーバーに保存され、中国法令が適用される旨を周知

  • デジタル庁/NISC(2025年2月6日):機密・要機密情報での利用を禁じる事務連絡。関連省庁は NISC・デジタル庁に事前協議を求める

  • 林芳正官房長官(2025年2月6日会見):「適切な対応を講じている」

  • 日本の現行対応:「注意喚起」レベルにとどまり、韓国・台湾・イタリア・テキサス州・米海軍等のブランケット禁止とは異なる


重要:日本政府は機関ごとの自主判断を基本としており、クラウドAPIの直接利用のみを制限する通知です。オープンウェイトをオンプレ(国内 DC)で動かすことは現行規制の対象外です。


8. 日本企業への実務指針


8-1. 用途別モデル選択の考え方


用途

推奨モデル

理由

高度推論・複雑タスク

Claude Opus 4.7 / GPT-5.5

総合知能で依然リード。機密性の低い用途

コーディング・SWE

Kimi K2.6 / GLM-5.1

SWE-Bench Pro でフロンティア超え。Claude Code 互換

汎用・バッチ処理

Qwen 3.5 / DeepSeek V4-Flash

高速・低コスト。国内DCホスト可能

数学・推論特化

Doubao Seed 2.0 Pro

AIME 98.3%、数学競技金メダル級

機密性の高い業務

Qwen3-32B / GLM-5(オンプレ)

Apache 2.0/MIT。国内DCでクローズド運用

超低コストバッチ

Step 3.5 Flash / DeepSeek V4-Flash

$0.10〜$0.14/Mtok。性能より量を重視する場合


8-2. リスク管理の三原則


  • 【個人情報・機密データ】中国本土のAPIに機密情報を送らない。PPC通知のとおり、中国法令が適用される。クラウド版ではなくオンプレ + 国内DCで完結する設計を

  • 【ライセンス透明性】調達時に config.json / アーキテクチャ / ライセンスNOTICE の整合を確認。楽天AI 3.0 のケースのように、「国産」を謳うモデルのベースが中国モデルである事例が複数存在

  • 【地政学変化モニタリング】米国の追加制裁(中国AI企業向け)、日本の規制強化の可能性あり。月次でPPC・デジタル庁・NICSの発表を確認


8-3. 段階的導入アプローチ


Stage 1:評価・PoC(〜3ヶ月)

非機密データで Qwen 3.5 / DeepSeek V4-Flash / Kimi K2.6 を比較評価

ルーティング先:さくらのAI Engine(国内DC)/ AWS Bedrock / Azure(米国リージョン)— 中国本土API直叩きは不可

採用閾値目安:SWE-Bench Verified 70%以上 / AA Intelligence Index 50以上 / MT-Bench 8.5以上


Stage 2:オンプレ展開(3〜9ヶ月)

機密性の高い業務はオープンウェイト(Apache 2.0 / MIT)をオンプレ運用

推奨:Qwen 3.6-27B(量子化で消費者GPU動作)/ GLM-5.1 INT4量子化 / DeepSeek V4-Flash

みずほFGの先行事例(Qwen3-32B + RAG + H100×1枚 → 正答率89%)が参照アーキテクチャ

ガバナンス:国内DC完結・学習データ非送信・生成コンテンツ標識・ログ180日保存


Stage 3:マルチモデル・ルーティング(9〜18ヶ月)

「Tiered Intelligence Stack」:高難度タスクは Claude/GPT、汎用は Qwen、コーディングは Kimi K2.6/GLM-5.1、バッチは V4-Flash

AI ゲートウェイ層で全リクエストをログ(モデル先・トークン数・レイテンシ・タイムスタンプ)

AI.cc(2026年5月)調査では企業の64%が「Tiered Intelligence Stack」を採用し、平均使用モデル数は前年比+124%(2.1→4.7)


9. まとめ — 中国LLMとどう向き合うか


2026年5月の中国LLM群を一言で表すなら「コーディング・コスト領域での逆転、総合知能での追い上げ」です。


Kimi K2.6 と GLM-5.1 はコーディング系ベンチマークで米国フラッグシップを超えました。GLM-5 は NVIDIA なしでフロンティアを作れることを証明しました。Doubao は中国国内で 155百万 WAU のリアルな実績を持ちます。Qwen は世界最大のオープンエコシステムを構築しています。


一方で、総合的な知能ベンチマーク(GPQA Diamond・HLE等)での最上位は依然として Claude Opus / GPT-5 系列です。「コーディングは中国モデル、推論は米国モデル」という使い分けが現実解に近づいています。


日本企業にとっての実務的な結論は:

  • 非機密のコーディング・バッチ・汎用タスクは積極活用。コストが5〜30倍安い選択肢を無視する理由はない

  • 個人情報・機密は国内DCオンプレ一択。クラウドAPIは「どのリージョンで処理されるか」を必ず確認

  • 「国産AI」を謳うモデルのベースは必ず確認。楽天AI 3.0のようにDeepSeek/Qwen二次開発が多数ある

  • 月次で規制動向をウォッチ。PPC・デジタル庁・NICSの追加発表があれば即時対応


中国LLMは「競争相手」でも「危険なもの」でもなく、使い方次第で強力なコスト削減と生産性向上をもたらすツールです。正しいガバナンスのもとで賢く活用することが、AI競争時代の企業戦略の鍵となります。