1. はじめに — 「中国AI」はもう一つの宇宙になった
2025年1月、DeepSeek R1が世界を驚かせてから1年半。中国のLLM開発は、単なる「米国モデルの追随」から「独自のフロンティア形成」へと質的に変化しました。
2026年5月時点でトップ層の差は数ポイント以内に縮まり、一部のコーディング・エージェントベンチマークでは中国モデルが米国フラッグシップを上回っています。同時に、コスト面での逆転は既成事実です。同等性能で5〜30倍安価というのは、もはや例外ではなく標準です。
本記事では、2026年5月時点の中国LLM勢力図を全方位で整理します。オープンソース・商用・政府系を問わず主要モデルを網羅し、米国フロンティアとの性能比較、開発戦略、そして日本企業への実務的な含意まで解説します。
2. 2026年5月 中国LLM 勢力図俯瞰
まず全体像を把握するために、主要プレイヤーを「オープンソース系」「商用クローズド系」「特化型・業界LLM」に分類して整理します。
2-1. オープンソース/オープンウェイト系(グローバル展開型)
DeepSeek(杭州)、Qwen/通義千問(Alibaba)、GLM(Z.ai / 清華大学発)、Kimi(Moonshot AI)、MiniMaxの5社が中核です。いずれもMIT/Apache 2.0でウェイトを公開し、Hugging Faceで世界中の開発者に浸透しています。
特筆すべきは Alibaba Qwen ファミリーの規模です。2025年10月時点で Meta の Llama を抜き、2025年12月の月間ダウンロード数は下位8モデルの合計を超えました。2026年1月時点の累計ダウンロード数は約7億、派生モデルは20万超という圧倒的なエコシステムを形成しています。
2-2. 商用クローズド系(国内市場主力)
Baidu(ERNIE)、Tencent(Hunyuan)、ByteDance(Doubao Seed)、iFlytek(Spark)の4社が中心です。これらは中国国内の消費者・企業市場でシェアを争い、WeChat・Douyin・百度検索などの巨大プラットフォームと深く統合されています。
Doubao(ByteDance)はQuestMobile 2025年12月調査で中国No.1 AIアプリ(155百万週間アクティブユーザー)を記録。ByteDanceの計算では2025年12月時点で1日50兆トークン以上を処理しています。
2-3. 特化型・業界LLM
法律(Thunisoft 华语万象)、医療(Alibaba Health 医知鹿)、製造・エネルギー(Huawei Pangu 5.5)、金融、政府向けなど、業界特化モデルが急増中です。また01.AI(李開復)はSamsung・Alibaba Cloudとの統合で企業向けにピボットしました。
3. 主要モデル詳説
3-1. DeepSeek — 効率革命の旗手
DeepSeek は杭州の量子ファンド系企業で、2023年末から「少ないコンピュートで最大の性能」を哲学として打ち出してきました。
DeepSeek V4(2026年4月24日リリース)
2026年最大の注目リリースです。
V4-Pro:総パラメータ 1.6T MoE / 49B アクティブ / 1M トークン文脈 / MIT
V4-Flash:284B MoE / 13B アクティブ / 1M トークン文脈 / MIT
アーキテクチャ革新:Compressed Sparse Attention (CSA) + Heavily Compressed Attention (HCA) のハイブリッドにより、1M文脈時の計算量をV3.2比27%・KVキャッシュを10%に圧縮
価格:V4-Pro 入力 $1.74 / 出力 $3.48 per Mtok。V4-Flash 入力 $0.14 / 出力 $0.28 per Mtok
SWE-bench Verified:80.6%(V4-Pro-Max)
V4-Pro の出力単価($3.48/Mtok)は Claude Opus 4.7($25)の約7倍安、GPT-5.5($30)の約9倍安です。フロンティアに肩を並べるコーディング性能をこの価格で実現したことで、企業採用の閾値を一段引き下げました。
DeepSeek V3.2 / V3.2-Exp(2025年9〜12月)
V3.2の系譜は2段階に分けて理解する必要があります。
V3.2-Exp(2025年9月29日):実験版。DSAの初実装。コンテキスト約128K。API価格を最大50%引き下げ
V3.2 正式版(2025年12月1日):685B MoE。コンテキスト約160K。SWE-Bench Verified 77.2%。入力 $0.26 / 出力 $0.38 per Mtok
V3.2-Speciale(2025年12月1〜15日限定):数学・競プロ特化。AIME 2025 96.0%、IMO/CMO/ICPC/IOI金メダル級
DeepSeek R1(2025年1月20日)
671B MoE / MIT。AIME 2024 79.8%、MATH-500 94.5%。OpenAI o1 相当の推論性能でオープン化
R2 については2026年5月時点で公式リリースなし(V4 Thinkingモードが事実上の後継と見る見方が多い)
3-2. Qwen / 通義千問(Alibaba)— 世界最大の派生エコシステム
Alibaba のオープンソース戦略の中核です。累計ダウンロード約7億(2026年1月時点)、公式派生モデル113,000超、タグ込みで200,000超という規模は他を大きく引き離しています。
Qwen 3.5(397B-A17B、2026年2月):201言語対応、Gated Delta Network + Sparse MoE。GPQA Diamond 86.0、AIME 2026 92.7
Qwen 3.6-27B / 35B-A3B / 3.6-Plus(2026年4月):27Bデンス版がSWE-Bench Verified 77.2%でMoE大型版を上回る。Q4_K_M量子化で16.8GB(消費者GPU1枚動作)
Qwen3-Coder-480B-A35B:最大コーディング特化モデル。さくらのAI Engineで国内ホスト提供中
NVIDIA TensorRT-LLM最適化でQwen3-4B BF16が最大16倍スループット
3-3. Kimi K2.6(Moonshot AI)— オープンのコーディング王者
北京発のMoonshot AIは「オープンソース版Claude」を目指し、短期間でフロンティア入りを果たしました。
Kimi K2.6(2026年4月20日リリース)
1T MoE / 32B アクティブ / Modified MIT / 文脈長 256K トークン
SWE-Bench Pro 58.6%(GPT-5.4の57.7%、Claude Opus 4.6の53.4%を超えコーディング系で首位)
SWE-Bench Verified 80.2%(Claude Opus 4.6の80.8%と同等水準)
Terminal-Bench 2.0 66.7%、HLE with tools 54.0%
Agent Swarm:300サブエージェント / 4,000ステップの並列自律実行
API価格:入力 $0.60 / 出力 $2.50 per Mtok(Claude Opus 4.7比 約10倍安)
専用CLI「Kimi Code」(Apache 2.0)は Claude Code エコシステムと互換設計で、MCP・Claude Code CLI との置き換えを明示的に狙っています。
3-4. GLM-5 / GLM-5.1(Z.ai / 旧 Zhipu AI)— 国産チップで作ったフロンティアモデル
清華大学発のZ.ai(旧Zhipu AI)は、2026年1月8日に香港証券取引所へ上場(上場初日時価総額 HK$52.83億、約68億米ドル)し、世界初の上場LLM基盤モデル企業になりました。IPO調達額は HKD 43.5億(約5.6億米ドル)です。
GLM-5(2026年2月11日)
744B MoE / 40B アクティブ / MIT / 文脈 200K
最大の技術的意義:100,000台の Huawei Ascend 910B + MindSpore で完全トレーニング(NVIDIA不使用)
SWE-Bench Verified 77.8%、Humanity's Last Exam 50.4%(Claude Opus 4.5超え)、BrowseComp 75.9(オープン1位)
なお Z.ai は2025年1月に米国エンティティリストに追加され、H100/H200等の購入が法的に禁止された状態での達成
GLM-5.1(2026年4月7日、オープンウェイト公開)
754B MoE / 40B アクティブ / MIT
SWE-Bench Pro 58.4%(2026年5月時点の独立集計でフロンティア超え)
8時間連続自律実行、655イテレーションでLinuxデスクトップ環境をゼロ構築したデモが話題
GLM-5ファミリーが「NVIDIA不要でフロンティア競争力を持てる」ことを証明したことの地政学的・産業的インパクトは計り知れません。
3-5. ERNIE / 文心(Baidu)— 巨人の逆襲
ERNIE 4.5シリーズ(2025年6月オープンソース化):0.3B〜424B(47Bアクティブ)の10バリアント、Apache 2.0
ERNIE 5.0(2026年1月22日):2.4T MoE、ネイティブマルチモーダル(テキスト・画像・音声・動画)、アクティブ率 < 3%
ERNIE-4.5-VL-28B-A3B-Thinking:Apache 2.0、28B/3Bアクティブで視覚推論特化
価格戦略:ERNIE X1 が DeepSeek R1 比半額(入力2元/100万トークン)で攻勢
3-6. Hunyuan(Tencent)— 元OpenAI研究者が陣頭指揮
Hunyuan Hy3 Preview(2026年4月23日):元OpenAI研究者・姚順雨(清華大学姚班卒、28歳)指揮。295B/21Bアクティブ MoE。SWE-Bench Verified 74.4%
HunyuanImage 3.0:80B MoE画像生成、LM Arena ELO 1152(#8位)
Hunyuan-MT-7B(2025年9月):33言語翻訳特化、Hugging Faceトレンド1位
3-7. Doubao Seed 2.0(ByteDance)— 中国 No.1 AIアプリのエンジン
2026年2月14日リリース(中国春節ガラ2日前)。Pro / Lite / Mini / Code の4バリアント
Doubao Seed 2.0 Pro:AIME 2025 98.3%、GPQA Diamond 88.9%、SWE-Bench Verified 76.5%、Codeforces 3020
VideoMME 89.5%(1時間動画理解)、ICPC / IMO / CMO 金メダル級
価格:入力 $0.47 / 出力 $2.37 per Mtok(GPT-5.2比 入力3.7倍・出力5.9倍安)
Doubaoアプリは155百万 WAU(中国 No.1)。2025年12月時点で1日50兆トークン処理
3-8. その他注目モデル
Step 3.5 Flash(階躍星辰、2026年2月1日):196B/11Bアクティブ、AIME 2025 97.3%。入力 $0.10 / 出力 $0.30 per Mtok(業界最安価帯)
MiniMax M2.7(2026年3月18日):Self-Evolving(100ラウンド自律最適化)、SWE-Pro 56.2%、入力 $0.30 / 出力 $1.20 per Mtok
iFlytek Spark X1(2025年4月):Huawei Ascendのみで70B学習。国産AIスタック完結の象徴
01.AI(李開復):2025年から企業向けAIアプリ路線にピボット。Alibaba Cloud との統合で垂直展開
4. フロンティアモデルとの性能比較
主要ベンチマークで中国モデルと米国フロンティアを比較します。(*印は各社自己申告値を含む。独立検証との乖離に注意)
注:SWE-Bench Proは評価ハーネスの実装(ツール・プロンプト設定)によって同一モデルでも10ポイント以上変動するため、同一ハーネスでの比較が望ましい。*印モデルはベンダー公表値のみで、独立検証が限定的。「Claude Opus 4.7」「GPT-5.5」等の正式名称・バージョンは参照元ソースの表記に基づく。
4-1. 総合知能 vs コーディング:評価軸による逆転
2026年5月時点のLLM競争は「どのベンチマーク軸で見るか」で勝敗が大きく異なります。
総合知能(Artificial Analysis Intelligence Index、GPQA Diamond 等):米国フロンティア(Claude Opus 4.7・GPT-5.5・Gemini 3.1 Pro)が依然リード
コーディング(SWE-Bench Pro / Verified):Kimi K2.6(58.6%)とGLM-5.1(58.4%)が GPT-5.4(57.7%)を超え、中国モデルが首位
コスト/性能比:GPT-5.5 / Claude Opus 4.7 と同等タスクで 5〜30倍安価。Kimi K2.6 vs Opus 4.7 はSWE-Bench Pro 同水準で出力約10倍安
4-2. ギャップ縮小トレンド
LMSYS Chatbot Arena における オープン vs プロプライエタリの MMLU差は2025〜2026年の1年で約17.5ポイントから0.3ポイントまで縮小。
推論コストは2023年初頭の $30/Mtok から2026年には $1/Mtok 以下(年率約10倍低下)へ。
5. 開発の狙いと戦略
5-1. オープンソース化で世界のエコシステムを取る
DeepSeek・Qwen・GLM・Kimi の主要4系列は MIT または Apache 2.0 でウェイトを公開しています。その狙いは明確です。
API 有料化のための「上流囲い込み」:オープン化で世界中の開発者に浸透させ、スケールアップ需要はクラウドAPIで課金
ベンチマーク権威獲得:Hugging Face 上でのダウンロード数・派生モデル数がブランド力に直結
地政学的ヘッジ:「誰でも使える」状態にしておくことで制裁リスクを分散
5-2. 国産チップ独立とソブリンAI戦略
2025年1月の米国エンティティリスト強化(H100/H200対中輸出禁止維持)への対応として、中国各社は加速度的に国産チップへの移行を進めています。
GLM-5 / GLM-5.1:100,000台 Huawei Ascend 910B のみでトレーニング完了(NVIDIA不使用)
iFlytek Spark X1:Ascend のみで70B学習
DeepSeek V4:Huawei Ascend対応の推論最適化を明記
CFR(米外交問題評議会)の Chris McGuire は2025年12月時点で「現在の米国AIチップ(NVIDIA H100クラス)は Huawei 最高製品の約5倍の性能(Total Processing Performance 比)」とし、2027年にはその差が17倍に広がると予測しています。しかし GLM-5 の実績は「性能差があっても、ソフトウェア最適化・クラスタ規模・効率的なアーキテクチャで補完可能」であることを示しました。
5-3. 各社の差別化戦略
DeepSeek:「アーキテクチャ効率革命」。MoE + MLA + DSA + Muon Optimizer で NVIDIA 制約を構造的に回避
Alibaba(Qwen):「オープン × クラウド」。Apache 2.0 で全デバイス対応(Apple Silicon・AMD・Arm・MediaTek)、商用はAlibaba Cloud で課金
Tencent(Hunyuan):元OpenAI研究者を招聘し WeChat / Yuanbao との深い製品統合で差別化
Z.ai(GLM):香港上場・MIT公開・Coding Plan サブスク。「透明なフロンティア企業」として信頼醸成
Moonshot(Kimi):Claude Code エコシステムとの互換性で乗り換えコストゼロ
ByteDance(Doubao):155百万ユーザーへの「無料」配布で No.1 AIアプリ化。Volcano Engine で法人課金
6. 中国政府の政策・規制
中国国内のAI規制は「育成と管理の両立」を基本方針としています。
生成式人工知能服務管理暫定弁法(2023年8月施行):世論喚起力を持つ生成AIサービスは届出(备案)義務。2025年8月末時点で538件届出済、263件登録済
AI生成合成内容標識弁法(2025年9月施行):AI生成物への明示・暗示ラベル義務
政務領域AI大模型部署応用指引(2025年10月、CAC):政府機関のAI利用は「補助型」位置付け、人間レビュー必須
拟人化互动服务管理暂行办法(2026年7月施行予定):AIコンパニオン・感情型インタラクションを規律
「人工知能+」行動意見(2025年8月、国務院)、AI安全治理框架 2.0(2025年9月)
ソブリンAI 2.0 政策のもと、外資モデル(OpenAI・Anthropic・Google)は実質的に中国市場から締め出されており、中国企業は国内クローズド市場でスケールを獲得する一方、オープンソース経由で海外市場への浸透を図るという非対称な競争を展開しています。
7. 日本市場・企業への影響
7-1. 採用した企業
日本企業による中国系LLMの採用は着実に進んでいます。主な事例は以下のとおりです。
7-2. 「DeepSeekラッパー問題」— 楽天AI 3.0の教訓
2026年3月17日、楽天グループは Rakuten AI 3.0 を「日本最大・最強のAIモデル」として発表しました。しかし公開当日、コミュニティが Hugging Face の config.json ファイルを確認し、アーキテクチャフィールドが「DeepseekV3ForCausalLM」であることを発見。パラメータ構成(671B / 37Bアクティブ / 128K文脈)も DeepSeek V3 と完全一致していました。
さらに初版リリースには DeepSeek の MIT ライセンス NOTICE が付属しておらず、指摘後に追加されるという対応となりました。楽天はその後「オープンソースコミュニティの成果をベースに採用した」と認めています。
日経は「日本の主要企業LLMの上位10種のうち6種が DeepSeek または Qwen の二次開発」と報じました(Aitoolsbee 経由)。国内AIと謳われるモデルのベースを確認することが、現在の調達判断において不可欠です。
7-3. 禁止した企業
共同通信(2025年2月12日報道)によると、以下の企業が自主的に利用を禁止しています。
トヨタ自動車:「情報セキュリティの観点から懸念があるため、利用を禁止」
三菱重工業:従業員の申請を却下、業務利用一切不可
ソフトバンク:「社内からのアクセスを規制し、業務用端末でのダウンロードや利用を禁止」
大手素材メーカー、大手住宅メーカー(社名非公表)
7-4. 政府・規制当局の対応
個人情報保護委員会(2025年2月3日):DeepSeek が取得した個人情報は PRC サーバーに保存され、中国法令が適用される旨を周知
デジタル庁/NISC(2025年2月6日):機密・要機密情報での利用を禁じる事務連絡。関連省庁は NISC・デジタル庁に事前協議を求める
林芳正官房長官(2025年2月6日会見):「適切な対応を講じている」
日本の現行対応:「注意喚起」レベルにとどまり、韓国・台湾・イタリア・テキサス州・米海軍等のブランケット禁止とは異なる
重要:日本政府は機関ごとの自主判断を基本としており、クラウドAPIの直接利用のみを制限する通知です。オープンウェイトをオンプレ(国内 DC)で動かすことは現行規制の対象外です。
8. 日本企業への実務指針
8-1. 用途別モデル選択の考え方
8-2. リスク管理の三原則
【個人情報・機密データ】中国本土のAPIに機密情報を送らない。PPC通知のとおり、中国法令が適用される。クラウド版ではなくオンプレ + 国内DCで完結する設計を
【ライセンス透明性】調達時に config.json / アーキテクチャ / ライセンスNOTICE の整合を確認。楽天AI 3.0 のケースのように、「国産」を謳うモデルのベースが中国モデルである事例が複数存在
【地政学変化モニタリング】米国の追加制裁(中国AI企業向け)、日本の規制強化の可能性あり。月次でPPC・デジタル庁・NICSの発表を確認
8-3. 段階的導入アプローチ
Stage 1:評価・PoC(〜3ヶ月)
非機密データで Qwen 3.5 / DeepSeek V4-Flash / Kimi K2.6 を比較評価
ルーティング先:さくらのAI Engine(国内DC)/ AWS Bedrock / Azure(米国リージョン)— 中国本土API直叩きは不可
採用閾値目安:SWE-Bench Verified 70%以上 / AA Intelligence Index 50以上 / MT-Bench 8.5以上
Stage 2:オンプレ展開(3〜9ヶ月)
機密性の高い業務はオープンウェイト(Apache 2.0 / MIT)をオンプレ運用
推奨:Qwen 3.6-27B(量子化で消費者GPU動作)/ GLM-5.1 INT4量子化 / DeepSeek V4-Flash
みずほFGの先行事例(Qwen3-32B + RAG + H100×1枚 → 正答率89%)が参照アーキテクチャ
ガバナンス:国内DC完結・学習データ非送信・生成コンテンツ標識・ログ180日保存
Stage 3:マルチモデル・ルーティング(9〜18ヶ月)
「Tiered Intelligence Stack」:高難度タスクは Claude/GPT、汎用は Qwen、コーディングは Kimi K2.6/GLM-5.1、バッチは V4-Flash
AI ゲートウェイ層で全リクエストをログ(モデル先・トークン数・レイテンシ・タイムスタンプ)
AI.cc(2026年5月)調査では企業の64%が「Tiered Intelligence Stack」を採用し、平均使用モデル数は前年比+124%(2.1→4.7)
9. まとめ — 中国LLMとどう向き合うか
2026年5月の中国LLM群を一言で表すなら「コーディング・コスト領域での逆転、総合知能での追い上げ」です。
Kimi K2.6 と GLM-5.1 はコーディング系ベンチマークで米国フラッグシップを超えました。GLM-5 は NVIDIA なしでフロンティアを作れることを証明しました。Doubao は中国国内で 155百万 WAU のリアルな実績を持ちます。Qwen は世界最大のオープンエコシステムを構築しています。
一方で、総合的な知能ベンチマーク(GPQA Diamond・HLE等)での最上位は依然として Claude Opus / GPT-5 系列です。「コーディングは中国モデル、推論は米国モデル」という使い分けが現実解に近づいています。
日本企業にとっての実務的な結論は:
非機密のコーディング・バッチ・汎用タスクは積極活用。コストが5〜30倍安い選択肢を無視する理由はない
個人情報・機密は国内DCオンプレ一択。クラウドAPIは「どのリージョンで処理されるか」を必ず確認
「国産AI」を謳うモデルのベースは必ず確認。楽天AI 3.0のようにDeepSeek/Qwen二次開発が多数ある
月次で規制動向をウォッチ。PPC・デジタル庁・NICSの追加発表があれば即時対応
中国LLMは「競争相手」でも「危険なもの」でもなく、使い方次第で強力なコスト削減と生産性向上をもたらすツールです。正しいガバナンスのもとで賢く活用することが、AI競争時代の企業戦略の鍵となります。