PLaMo 3.0 Prime正式リリース——国産フルスクラッチLLMが「実務で戦える」段階へ
2026年6月22日、株式会社Preferred Networks(PFN、代表取締役社長:岡野原大輔)が、国産生成AI基盤モデル「PLaMo 3.0 Prime」を正式にリリースした。2026年3月19日のβ版から約3か月のモニター運用を経ての本番投入で、同日にSakana AIの「Fugu」もGA公開となり、国産LLMにとって象徴的な1日となった。
本記事では、PFN公式テックブログ・プレスリリース・NICT発表・ITmedia等の一次情報に基づき、性能・価格・技術仕様・競合比較・注意点をまとめる。
本記事の数値・事実はPFN公式テックブログ(
tech.preferred.jp)・PFNプレスリリース(preferred.jp/ja/news/pr20260622)・NICT発表・ITmediaを一次ソースとして確認した。ベンチマークの絶対スコアは公式グラフ画像内にのみ開示されており、テキスト形式での生スコアは現時点で外部公開されていない。第三者リーダーボード(Nejumi等)への登録は執筆時点で未反映。
目次
1. 概要とリリース背景
PLaMo 3.0 PrimeはPFNが国立研究開発法人情報通信研究機構(NICT)との共同研究で得た事前学習モデルをベースに、海外モデルを一切使わずゼロベースで構築した国産フルスクラッチLLMのフラッグシップモデルである。経産省・NEDOが推進するGENIAC(生成AI基盤モデル開発プロジェクト)第3期の成果も事後学習に取り込んでいる。
PLaMoシリーズのリリース歴は以下のとおり。
| リリース日 | バージョン | 主なトピック |
|---|---|---|
| 2024年 | PLaMo-100B | 1,000億パラメータ、GENIAC第1期、フルスクラッチ |
| 2024年12月 | PLaMo Prime(1.0) | 商用フラッグシップ初版、コンテキスト長約16K |
| 2025年5月 | PLaMo 2.0 Prime | GENIAC第2期、生成速度約2倍、価格1/4以下、日経優秀製品賞最優秀賞(2026年2月表彰) |
| 2026年1月 | PLaMo 2.2 Prime | 指示追従性能向上、32Kコンテキスト |
| 2026年3月19日 | PLaMo 3.0 Prime β版 | アーキテクチャ刷新、国産フルスクラッチ初のReasoningモデル、64Kコンテキスト |
| 2026年6月22日 | PLaMo 3.0 Prime(正式版) | Reasoning/Non-reasoning 2系統、256Kコンテキスト、構造化出力対応 |
2. β版からの主な変更点
PFN公式テックブログ(執筆:PLaMo事後学習チーム 今村氏)は以下の4点を主要改善として挙げている。
① 推論能力の強化
β版で導入した強化学習(RL)を、コーディング・長コンテキスト・対話性能など多岐にわたるデータを増強して継続実施した。強化学習のステップ数はβ版比で約2倍。
② Non-reasoningモデルの追加
β版はReasoningモデルのみだったが、モニター企業からの「高速な応答が欲しい」というフィードバックを受け、Non-reasoningモデルを正式版で追加。要約・分類・定型的な問い合わせ対応はNon-reasoning、複雑な論理タスクはReasoningと使い分けられる。
③ コンテキスト長の拡張(64K→256K)
YaRNと継続事前学習の組み合わせにより、β版の64K(65,536トークン)から256K(262,144トークン)へ拡張。PFN公式の位置づけは以下の通り:
| モデル | コンテキスト長 | 備考 |
|---|---|---|
| PLaMo 3.0 Prime | 256K(262,144トークン) | 最大出力20,000トークン |
| gpt-oss-120b | 128K | PLaMo 3.0 Primeより短い |
| Qwen3.6-27B | 256K | 同水準 |
| Claude Haiku 4.5 | 200K | PLaMo 3.0 Primeより短い |
| GPT-5.4 Mini | 400K | PLaMo 3.0 Primeより長い |
| DeepSeek V4 Pro / GPT-5.5 Pro | 1M | PLaMo公式が「まだギャップがある」と明記 |
出典:PFN公式テックブログ「PLaMo 3.0 Primeをリリースしました」(2026年6月22日)
④ 構造化出力(Structured Output)のサポート
LLMの出力をユーザーが指定したデータ構造(JSONスキーマ等)に必ず準拠させる機能を新たにサポート。既存システムや外部APIとの連携が大幅に容易になる。
3. 技術仕様・API仕様
| 項目 | 内容 |
|---|---|
| モデルID | plamo-3.0-prime |
| パラメータ数 | 非公開(dense/MoEの別も未開示) ※ NICT共同開発のbaseモデル( plamo-3-nict-2b/8b/31b-base)はHugging Faceで公開済みだが、Prime本体は別構成 |
| コンテキスト長 | 262,144トークン(256K)、最大出力20,000トークン |
| API形式 | OpenAI互換Chat Completions形式 エンドポイント: https://api.platform.preferredai.jp/v1 |
| reasoning_effort | none(Non-reasoning)または medium(Reasoning)のみ有効。low/highはHTTP 422エラー |
| レート制限 | APIキーごとに100リクエスト/分 |
| 事後学習手法 | SFT → DPO → 強化学習(RL)。思考過程も損失計算対象 |
| 提供形態 | PLaMo Chat・PLaMo API(クラウド)・オンプレミス・Amazon Bedrock Marketplace・Snowflake |
| データ処理 | すべてのAPIリクエストが日本国内サーバーで処理される |
クラスメソッドDevelopersIOの検証によると、Reasoning ON(
medium)にすると completion_tokens が12〜35倍、レイテンシが6〜17倍になるケースが確認されている。用途に応じてnone/mediumを使い分けることが重要。
4. 価格体系
| プラン | 入力(/100万トークン) | 出力(/100万トークン) | 備考 |
|---|---|---|---|
| Free | 無料(利用量制限あり) | 無料(利用量制限あり) | 試用向け |
| Standard | 60円 | 250円(128Kトークンまで) | 商用利用の標準プラン |
| Provider | 個別見積もり | 個別見積もり | AIサービス提供者向け |
GAリリースキャンペーン(〜2026年7月31日):新規登録で1,000万トークン相当のクレジットが付与される。
主要モデルとのコスト比較(参考)
※ 海外モデルの円換算は変動するため参考値。PFN公式の比較軸に基づく同価格帯での位置づけ。
| モデル | 入力(/100万トークン) | 出力(/100万トークン) | PFNの比較対象分類 |
|---|---|---|---|
| PLaMo 3.0 Prime | ¥60 | ¥250 | — |
| GPT-5.4 Mini(OpenAI) | 同価格帯 | 同価格帯 | 同価格帯クローズド |
| Claude Haiku 4.5(Anthropic) | 同価格帯 | 同価格帯 | 同価格帯クローズド |
| gpt-oss-120b(OpenAI) | 同性能帯 | 同性能帯 | 同性能帯オープン |
| Qwen3.6-27B(Alibaba) | 同性能帯 | 同性能帯 | 同性能帯オープン |
出典:PFN公式プレスリリース(2026年6月22日)。各モデルの円換算コストはOpenRouterの平均価格をPFNが評価コスト計算に使用。
5. ベンチマーク評価——強みと弱点
PFNは15種のベンチマークで社内評価を実施し、結果をテックブログで公表している。比較対象は、同性能帯オープンモデル(gpt-oss-120b、Qwen3.6-27B)と同価格帯クローズドモデル(GPT-5.4 Mini、Claude Haiku 4.5)。
評価ベンチマーク一覧
| ベンチマーク | 測定内容 |
|---|---|
| IFBench / JFBench | 英語・日本語の指示追従性 |
| MT-bench / Japanese MT-bench | 英語・日本語の対話性能 |
| BFCL v4 | 英語ツール使用性能(Function calling) |
| BrowseComp-Plus | Web検索付き質問応答 |
| LongBench v1 / v2 | 長コンテキスト質問応答 |
| AIME 2024 | 数学(高校数学オリンピック) |
| GPQA-Diamond | STEM分野の専門知識 |
| LiveCodeBench | コーディング性能 |
| lawqa_jp | 日本の法令質問応答 |
| MedRECT / 医師国家試験 | 医療分野の質問応答 |
| HELM Safety | 安全性(暴力・詐欺・差別・性的表現等6カテゴリ) |
強み(PFN公式が競争力ありと主張する領域)
- 日本語指示追従・対話:同価格帯のGPT-5.4 Mini・Claude Haiku 4.5と競争力あり
- ツール利用(Function calling):ただしparallel function callingは現状非対応
- コーディング:LLMコーディング評価で同価格帯モデルと同等以上
- 医療ドメイン:MedRECT・医師国家試験で高スコア
- 安全性:HELM Safetyで海外モデルと同程度以上(NICTの安全性データを活用)
弱点(PFN公式が明示的に認めている領域)
- Web探索・リアルタイム検索
- 長コンテキスト(LongBench)
- 数学的推論(AIME 2024等)
- STEM分野(GPQA-Diamond)
- 日本の法令分野(lawqa_jp)
絶対スコアはPFN公式テックブログの図表(グラフ画像)内にのみ掲載されており、テキスト形式での生スコアは外部公開されていない。すべてPFN社内評価であり、第三者による独立検証(Nejumi LLMリーダーボード等)は執筆時点で未実施。評価コスト比較は、海外モデルをOpenRouterの平均価格で計算している点も考慮が必要。
6. 競合比較
国内LLMとの比較
| モデル | 開発元 | ベース | 特徴・差別化ポイント |
|---|---|---|---|
| PLaMo 3.0 Prime | Preferred Networks | フルスクラッチ | Reasoning対応、256K、デジタル庁「源内」採用、国内処理保証 |
| tsuzumi 2 | NTT | フルスクラッチ | 30B、1GPU(A100 40GB)動作、金融・自治体・医療特化 |
| cotomi v3 | NEC | フルスクラッチ | 最大30万字の長文処理、GPT-4比5倍以上の速度(Pro) |
| Takane 32B | 富士通 | Cohere Command R+派生 | JGLUE世界最高記録、1bit量子化 |
| Llama-3.1-ELYZA-JP-70B | KDDI・ELYZA | Llama派生 | 70B、日本語チューニング、オープンウェイト |
※ 各社スペックは各社公称値・業界メディア情報。Nejumi等の横並び独立比較データはデジタル庁「源内」評価公表(2027年1月予定)を待つ必要がある。
グローバル競合との位置づけ
PFNは公式に「フロンティアモデル(GPT-5.5 Pro、DeepSeek V4 Pro等)との性能ギャップはある」と認めており、「同価格帯(GPT-5.4 Mini / Claude Haiku 4.5)での勝負」を明言している。フロンティアモデルとの比較は公式言及なく、戦っていないのが正確な認識。
7. 採用実績・ユースケース
デジタル庁「源内(Gennai)」への採用
デジタル庁が整備する政府職員向け生成AI環境「源内」(生成AI=Gen AIと江戸時代の発明家・平賀源内に由来)において、PLaMo 3.0 Primeが試用国産LLMに選定されている。PFN公式によれば「2026年8月頃から試験利用される」とされており、2027年3月まで評価・検証が続く予定。優れたモデルの有償政府調達は2027年度以降を想定。PLaMo翻訳は2025年12月から先行導入済み。
その他の採用事例
- QommonsAI(Polimill株式会社):多数の自治体・省庁に導入されている行政向け生成AIサービスにPLaMoが標準搭載。PFN公式リリース(2026年6月22日)には「約800自治体」の記載あり(※β版発表時の資料では700自治体以上との記述もあり、時点により変動)
- miibo:国産AI構築プラットフォームに統合
- Tachyon生成AI:法人向け生成AIサービスに採用
8. 注意点・限界
- パラメータ数・アーキテクチャが非公開:dense/MoEの別も未開示で、コスト合理性や推論効率の客観評価が困難
- 絶対ベンチマークスコアが非公開:性能主張はすべて社内評価の図表画像のみ。第三者独立検証は未実施
- 苦手領域が明確に存在:Web探索・数学・STEM・長コンテキスト・日本の法令でPFN自身が「劣る」と明記
- parallel function callingが非対応:複数ツールの並列呼び出しが必要なエージェント用途は注意
- クローズドモデル:Prime本体のウェイトは非公開。オープンウェイトモデルのエコシステムには参加できない
- 思考過程は現状英語:Reasoning ONの内部思考トークンは英語で生成されている(将来的な日本語化を検討中とPFNが明記)
9. 今後の展望
PFNは今後の課題として、さらなるコンテキスト長拡張・高度な推論・実務タスク全般の性能向上を挙げている。また、NICT共同開発の事前学習モデル(PLaMo 3.0 Pretrained)の2026年春公開も予定されていた(β版資料より)。
PFNの事業戦略における位置づけとしては、AI半導体(MN-Core)・計算基盤・基盤モデル・ソリューションの4層垂直統合を掲げており、推論向けMN-Core L1100/L1400の2027年提供予定とPLaMoの連携も視野に入る。
Nejumi LLMリーダーボード等の第三者ベンチマークへの登録(執筆時点で未登録)と、デジタル庁「源内」の評価結果公表(2027年1月予定)が、国産LLM横並び比較の重要な指標になる見込みだ。
10. まとめ
PLaMo 3.0 Primeは、「世界最高性能」を目指したモデルではなく、「データ主権・日本語性能・コスト」の3軸を国産フルスクラッチで同時に実現した実用モデルという位置づけが正確だ。
| PLaMo 3.0 Primeが向いているケース | 他モデルを検討すべきケース |
|---|---|
|
|
現実的な導入アプローチとしては、まずFreeプランまたはGAキャンペーンクレジット(〜2026年7月31日)で自社の実業務データを使ってPoCを行い、GPT-5.4 Mini・Claude Haiku 4.5と並走比較するのが合理的だ。判断基準は「ベンチマーク値」より「自社業務で本当に効くか」。データ主権・個人情報保護が問われる案件では、全リクエストが日本国内で処理されるという点がそのまま差別化になる。
主な参照情報源(2026年6月23日時点)
・PFNプレスリリース pr20260622(正式版)
・PFN Tech Blog「PLaMo 3.0 Primeをリリースしました」(2026年6月22日)
・PFN Tech Blog「PLaMo 3.0 Prime β版をリリースしました」(2026年3月19日)
・NICT告知「Preferred Networksが国産生成AI基盤モデルPLaMo 3.0 Primeをリリース」(2026年6月22日)
・ITmedia AI+「国産フルスクラッチAI『PLaMo 3.0 Prime』提供開始」(2026年6月22日)
・ITmedia AI+「初の"長考"できる国産フルスクラッチLLM『PLaMo 3.0 Prime』」(2026年3月23日、β版)
・DevelopersIO「PLaMo 3.0 Primeを試してみた」(2026年6月22日)
・Impress Watch「PFN、企業利用の実用性を高めた国産AIモデル」(2026年6月22日)
0 件のコメント:
コメントを投稿