2026年3月6日、デジタル庁は全府省庁39機関・約18万人の政府職員を対象とした生成AI基盤「源内(げんない)」の大規模実証開始と、国産LLM7モデルの選定を同日発表した。 これは単なるAIツール導入ではなく、日本の行政がAIネイティブへと転換するうえでの起点となる宣言だ。
本稿では、採用言語モデルの技術比較と2027年以降の予測、官庁・自治体への浸透度、そして2030年に向けた中長期展望を、一次情報をもとに整理する。
1. 源内とは何か——基本構造と位置づけ
「源内」は、デジタル庁がAWSのOSSプロジェクト「GenU」をベースに内製開発した政府共用の生成AI利用環境だ。名称は「Generative AI(Gen AI)=ゲンナイ」と、江戸の発明家・平賀源内を掛け合わせたもので、"生成AIアプリの発明が集まる場所"というコンセプトが込められている。
2025年5月にデジタル庁職員約1,200人への試験導入から始まり、20種類以上の行政実務特化アプリ(法制度調査支援AI「Lawsy」、国会答弁検索AI等)を内製してきた。現在搭載されているLLMはClaude Sonnet/Haiku、AWS Nova Liteなど複数の海外モデルで、職員が用途に応じて選択できる「LLM統合基盤」として設計されている。
今後のスケジュール(デジタル庁公式)
| 時期 | 内容 |
|---|---|
| 2026年5月〜 | 全府省庁39機関・約18万人への大規模実証開始 |
| 2026年8月頃〜 | 国産LLM7モデルの試用開始 |
| 2027年1月頃 | 評価・検証結果の公表 |
| 2027年4月〜 | 優れたモデルの有償政府調達開始 |
補正予算は令和7年度補正予算44.0億円(デジタル庁ガバメントAI整備事業)として計上済みだ。
2. 国産LLM「七人の侍」——7モデルの選定と技術比較
選定プロセス
デジタル庁は2025年12月2日〜2026年1月31日で公募を実施し、15件の応募から7件を選定した。評価はきわめて厳格で、試験当日に初めて開示する50問の評価テストへの対応、海外主要LLMとの比較ベンチマーク結果の提出、ハルシネーション・安全性対策の技術説明、そしてガバメントクラウド上での推論動作確認が求められた。2026年度中は無償提供が条件(インフラ費用はデジタル庁負担で検討中)で、2027年4月以降に優秀モデルが有償調達される。
7モデルの概要
| モデル | 開発元(応募元) | ベースアーキテクチャ | 特徴 |
|---|---|---|---|
| PLaMo 2.0 Prime | Preferred Networks | フルスクラッチ(SSM+SWA) | 日本語特化の独自設計、行政文書翻訳で先行活用済み |
| tsuzumi 2 | NTTデータ | フルスクラッチ | NTT研究所の長年のNLP知見、ドメイン適応効率が高い |
| Takane 32B | 富士通 | Cohere Command R+ベース | JGLUEで高スコア※、中央省庁での実証実績あり |
| cotomi v3 | NEC | 独自アーキテクチャ | 軽量・低コスト推論。エージェント技術「cotomi Act」と連携 |
| ELYZA-JP-70B | KDDI/ELYZA | Llama 3.1ベース | 70Bの大規模パラメータで高い日本語生成品質 |
| Sarashina2 mini | SB Intuitions | フルスクラッチ | 大規模GPU基盤(4,000+GPU)によるスケーラブル運用 |
| CC Gov-LLM | カスタマークラウド | 非公開 | 行政文書処理を想定、ガバメントクラウド動作確認済 |
※注意 TakaneのJGLUE「世界最高記録」は、富士通とCohereが2024年9月に自社測定した数値です。公式プレスリリース自体に「JNLIとJCoLAについては正解データに不確かさがあったため、複数人のアノテーターにより正解データを修正して測定した参考値」という注釈が付いており、第三者による独立検証ではない点に留意が必要です。
注目すべきエージェント技術:cotomi Act
NECは2025年8月、エージェント技術「cotomi Act」(cotomi v3とは別物)を発表した。Web操作の国際ベンチマーク「WebArena」において、人間のタスク成功率78.2%を上回る80.4%を世界で初めて達成した(NEC公表、179タスクでの測定)。これはLLM本体ではなくエージェント層の成果だが、行政業務における自律型AIの可能性を示す指標として注目される。
2027年以降の採用予測
**本命(高い採用可能性)**はPLaMo 2.0 PrimeとNTTデータのtsuzumi 2だ。PLaMoはすでに源内の「PLaMo翻訳」として行政文書翻訳機能に組み込まれており、先行アドバンテージが大きい。tsuzumi 2はNTT研究所の基礎研究と、ドメイン適応に必要な学習データ量の効率性が強みだ。
有力候補はcotomi v3とTakane 32Bだ。cotomi v3は軽量で推論コストが抑えられ、AIエージェント化(cotomi Act)への展開が見込める。Takane 32Bは中央省庁でのパブコメ業務実証という行政領域での実績と、富士通の官公庁SI基盤が後押しする。
現実的には2〜4モデルが用途別に並行採用される可能性が高い。汎用チャット・法令文書処理・軽量タスクで使い分けが想定され、機密性の低い汎用業務では海外モデルとの共存も続くだろう。
海外モデルの位置づけ
政府の機密性2情報の処理は、海外モデルのAPI経由では原則として不可とされており、外交・安全保障関連業務は国産モデルが必須となる。一方、汎用業務では引き続きClaude・GPT系が併用される「ハイブリッド共存モデル」が主流になる見通しだ。
3. 予算構造と調達——「ガバメントクラウド連動」という設計思想
政府のAI投資規模
2025年12月のAI基本計画(閣議決定)では、「当面1兆円超をAI関連施策の推進に投資する」という方針が明記された。経産省の令和8年度(2026年度)予算案では半導体・AI関連に大規模な予算が計上されており、GENIAC(生成AI基盤モデル開発プロジェクト)の第3期では24件が採択されている。
デジタル庁の令和8年度概算要求は前年度比29%増の6,143億円(初めて6,000億円超)。AI利用環境整備費は数億円規模の要求で、「初めてAIを対象とする予算要求」と日経が報じた。
ガバメントクラウドとの連動
ガバメントAIはガバメントクラウド上で運用される設計で、国産LLMの推論環境もガバメントクラウド上での動作確認が選定要件とされている。ガバメントクラウドには現在、AWS・Azure・Google Cloud・OCI・さくらインターネットの5事業者が参加している。
ロックイン回避の観点では、2025年5月策定の「生成AI調達ガイドライン」(DS-920)が調達チェックシートによる仕様標準化を定めており、源内も複数LLMから選択可能な設計とされている。
4. 官庁・自治体への浸透度——鮮明になる「二極化」
中央省庁:すでに稼働し始めた成果
源内の検証フェーズ(デジタル庁内・約1,200人)では、法制度調査支援AI、国会答弁検索AI、公用文チェッカーAIなど20種類以上のアプリが内製・提供されている。具体的な業務効率化事例も報告されており、警察庁の闇バイト対策SNSフィルタリングでの目視確認件数削減といった成果が出ている。
課題も明確になっている。デジタル庁内でも管理職層の約半数が利用実績ゼロという報告があり、「AI疲れ」ではなく「AI未着手」という実態が浮かんでいる。2026年5月の全省庁展開では、18万人への利用推進体制(カスタマーサポート・ハンズオン研修)の整備が鍵となる。
自治体:都道府県はほぼ100%、市区町村は30%の壁
総務省調査(令和6年12月31日現在)が示す現状は明確だ。
- 都道府県:導入済み87.2%(前年比+36.1pt)
- 指定都市:導入済み90.0%(前年比+50.0pt)
- 実証中・導入予定を含む:都道府県・指定都市ともに100%到達
- 市区町村:導入済み29.9%、実証中・導入予定含め51%
この格差の背景にある課題は(総務省調査より、上位順)、**「人材不足」(549件)、「AI生成物の正確性への懸念」(522件)、「導入効果が不明」**という順番だ。コストの問題も存在するが、導入コスト「0円」と回答した団体が669件で最多というデータが示すように、「費用」よりも「人材・ノウハウ不足」が本質的な障壁になっている。
2027年時点の市区町村の生成AI導入率は50〜60%に到達すると予測される。市レベルでは70〜80%まで伸びる可能性があるが、町・村レベルは20〜30%にとどまる見通しだ。
5. 先行自治体の独自AIはどうなるか
各自治体の取り組みと実績
先行自治体は2023年前半から独自のAI環境を構築し、着実な成果を上げてきた。
- 横須賀市:全国初のChatGPT全庁導入(2023年4月)。国保データ突合の大幅な短縮など実績多数
- 大阪市:独自生成AIアシスタント「Oasis」をAzure OpenAI Service上に構築し、要配慮個人情報を含む情報も入力可能にする先進的な運用
- 東京都(GovTech東京):OSSベースの生成AIプラットフォームを内製構築し、都内区市町村への横展開を目指す
- 福岡市:QT-GenAIで業務時間を平均33%削減(日経報道)
- 都城市:自治体AI「zevo」を開発し、約300団体が試行導入
利用サービスでは、「LoGoAIアシスタント」(トラストバンク)が本運用での採用団体数トップで、続いてChatGPT、自治体AI zevo、Microsoft Copilotが続く。
独自AIとガバメントAIの「共存モデル」へ
2027〜2028年度にガバメントAIの自治体展開が始まると、選択は「統合」ではなく「二層共存」に収斂する可能性が高い。
- ガバメントAI層:国が共通基盤(源内)で標準機能を提供、セキュリティ担保
- 自治体独自層:各自治体が固有業務(水道・福祉・税務等)向けのRAG・カスタマイズ層を構築
東京都・大阪市・横須賀市のような先進自治体は独自環境との併用を維持し、リソース・人材が少ない小規模自治体を中心にガバメントAIへの依存が高まると見られる。
源内のOSS化が実現すれば、先行自治体が蓄積したプロンプト事例集や運用ノウハウを国の共有財産として全国展開できる——これが最も現実的なシナリオだ。
6. 中長期展望——2030年の「エージェント型行政」
Phase 1(2027年):本格運用へ
有償調達が始まり、各省庁が自らの予算でAIを調達・運用する段階に入る。国産LLMの評価結果次第で2〜4モデルが採用され、省庁横断AIアプリの本格展開が始まる。
Phase 2(2028年):AIエージェントの試験導入
補正予算事業で開発が進む「審査業務支援AI」「相談業務支援AI」(えるぼし・くるみん認定審査、個別労働紛争対応等)が本格稼働し、AIが自律的にタスクを実行する「エージェント型」業務の実証が始まる。シンガポールの行政AIアシスタント「Ask Jamie」(80政府サイト、1,500万件超対応)のような住民向け対話AIも視野に入る。
Phase 3(2029〜2030年):AIファースト行政の萌芽
マルチエージェントによる省庁横断業務の部分自動化、リアルタイム政策シミュレーションの運用開始など、AIが行政判断を補佐する段階へ。ただしAIの判断に基づく行政処分の法的責任はあくまで行政機関に帰属する原則は変わらない。AI基本計画が掲げる「人間中心」の原則が制度的な制約として機能し続ける。
AI主権という視点
日本のガバメントAI戦略には「AI主権」の確立という明確な目標がある。機密性2情報を海外サーバーで処理する安全保障リスクの排除、海外AIサービス利用料によるデジタル赤字の抑制、そして国産AI産業の育成だ。
2025年5月成立のAI法と同年12月のAI基本計画により、日本はEUの包括的規制路線と米国のイノベーション最優先路線の中間に位置する独自アプローチを確立した。「世界で最もAIを開発・活用しやすい国」を目指しながら、「人間中心・安全性重視」の原則を堅持するというバランスは、欧米どちらとも異なる日本モデルとして評価されるかどうか——2027年以降の実装の質が問われる。
まとめ:3つの核心的な問い
① 国産LLMは実際に使えるのか 2027年1月にデジタル庁が評価結果を公表する時点で、初めて客観的な答えが出る。現時点では各社の自社測定ベンチマークしかなく、実際の行政業務での比較評価が判断の唯一の根拠になる。
② 自治体AI活用の「二極化」は解消できるか 技術やコストだけの問題ではなく、「人材」と「ノウハウの横展開」が鍵だ。源内のOSS化と先行自治体の事例共有の仕組みができるかどうかが、2028年以降の浸透速度を左右する。
③ AIエージェントはいつ行政の「仕事」を担うか cotomi Actの事例が示すように技術的基盤は整いつつある。だが行政という高い公正性・透明性・責任明確化が求められる領域での本格展開は、技術の成熟より制度設計と社会的合意の形成が律速要因になる。
ガバメントAI源内は、今まさに「技術検証」から「制度定着」へのフェーズ転換を迎えようとしている。2026年5月からの18万人実証が、日本の行政AIのリトマス試験となる。
0 件のコメント:
コメントを投稿