火曜日, 6月 23, 2026

PLaMo 3.0 Prime正式リリース——国産フルスクラッチLLMが「実務で戦える」段階へ

PLaMo 3.0 Prime正式リリース——国産フルスクラッチLLMが「実務で戦える」段階へ

2026年6月22日、株式会社Preferred Networks(PFN、代表取締役社長:岡野原大輔)が、国産生成AI基盤モデル「PLaMo 3.0 Prime」を正式にリリースした。2026年3月19日のβ版から約3か月のモニター運用を経ての本番投入で、同日にSakana AIの「Fugu」もGA公開となり、国産LLMにとって象徴的な1日となった。

本記事では、PFN公式テックブログ・プレスリリース・NICT発表・ITmedia等の一次情報に基づき、性能・価格・技術仕様・競合比較・注意点をまとめる。

📋 ファクトチェック済み(2026年6月23日)
本記事の数値・事実はPFN公式テックブログ(tech.preferred.jp)・PFNプレスリリース(preferred.jp/ja/news/pr20260622)・NICT発表・ITmediaを一次ソースとして確認した。ベンチマークの絶対スコアは公式グラフ画像内にのみ開示されており、テキスト形式での生スコアは現時点で外部公開されていない。第三者リーダーボード(Nejumi等)への登録は執筆時点で未反映。

目次

  1. 概要とリリース背景
  2. β版からの主な変更点
  3. 技術仕様・API仕様
  4. 価格体系
  5. ベンチマーク評価——強みと弱点
  6. 競合比較
  7. 採用実績・ユースケース
  8. 注意点・限界
  9. 今後の展望
  10. まとめ

1. 概要とリリース背景

PLaMo 3.0 PrimeはPFNが国立研究開発法人情報通信研究機構(NICT)との共同研究で得た事前学習モデルをベースに、海外モデルを一切使わずゼロベースで構築した国産フルスクラッチLLMのフラッグシップモデルである。経産省・NEDOが推進するGENIAC(生成AI基盤モデル開発プロジェクト)第3期の成果も事後学習に取り込んでいる。

PLaMoシリーズのリリース歴は以下のとおり。

リリース日 バージョン 主なトピック
2024年 PLaMo-100B 1,000億パラメータ、GENIAC第1期、フルスクラッチ
2024年12月 PLaMo Prime(1.0) 商用フラッグシップ初版、コンテキスト長約16K
2025年5月 PLaMo 2.0 Prime GENIAC第2期、生成速度約2倍、価格1/4以下、日経優秀製品賞最優秀賞(2026年2月表彰)
2026年1月 PLaMo 2.2 Prime 指示追従性能向上、32Kコンテキスト
2026年3月19日 PLaMo 3.0 Prime β版 アーキテクチャ刷新、国産フルスクラッチ初のReasoningモデル、64Kコンテキスト
2026年6月22日 PLaMo 3.0 Prime(正式版) Reasoning/Non-reasoning 2系統、256Kコンテキスト、構造化出力対応

2. β版からの主な変更点

PFN公式テックブログ(執筆:PLaMo事後学習チーム 今村氏)は以下の4点を主要改善として挙げている。

① 推論能力の強化

β版で導入した強化学習(RL)を、コーディング・長コンテキスト・対話性能など多岐にわたるデータを増強して継続実施した。強化学習のステップ数はβ版比で約2倍

② Non-reasoningモデルの追加

β版はReasoningモデルのみだったが、モニター企業からの「高速な応答が欲しい」というフィードバックを受け、Non-reasoningモデルを正式版で追加。要約・分類・定型的な問い合わせ対応はNon-reasoning、複雑な論理タスクはReasoningと使い分けられる。

③ コンテキスト長の拡張(64K→256K)

YaRNと継続事前学習の組み合わせにより、β版の64K(65,536トークン)から256K(262,144トークン)へ拡張。PFN公式の位置づけは以下の通り:

モデル コンテキスト長 備考
PLaMo 3.0 Prime 256K(262,144トークン) 最大出力20,000トークン
gpt-oss-120b 128K PLaMo 3.0 Primeより短い
Qwen3.6-27B 256K 同水準
Claude Haiku 4.5 200K PLaMo 3.0 Primeより短い
GPT-5.4 Mini 400K PLaMo 3.0 Primeより長い
DeepSeek V4 Pro / GPT-5.5 Pro 1M PLaMo公式が「まだギャップがある」と明記

出典:PFN公式テックブログ「PLaMo 3.0 Primeをリリースしました」(2026年6月22日)

④ 構造化出力(Structured Output)のサポート

LLMの出力をユーザーが指定したデータ構造(JSONスキーマ等)に必ず準拠させる機能を新たにサポート。既存システムや外部APIとの連携が大幅に容易になる。

3. 技術仕様・API仕様

項目 内容
モデルID plamo-3.0-prime
パラメータ数 非公開(dense/MoEの別も未開示)
※ NICT共同開発のbaseモデル(plamo-3-nict-2b/8b/31b-base)はHugging Faceで公開済みだが、Prime本体は別構成
コンテキスト長 262,144トークン(256K)、最大出力20,000トークン
API形式 OpenAI互換Chat Completions形式
エンドポイント:https://api.platform.preferredai.jp/v1
reasoning_effort none(Non-reasoning)または medium(Reasoning)のみ有効。low/highはHTTP 422エラー
レート制限 APIキーごとに100リクエスト/分
事後学習手法 SFT → DPO → 強化学習(RL)。思考過程も損失計算対象
提供形態 PLaMo Chat・PLaMo API(クラウド)・オンプレミス・Amazon Bedrock Marketplace・Snowflake
データ処理 すべてのAPIリクエストが日本国内サーバーで処理される
💡 Reasoning ON時のトークン消費・レイテンシに注意
クラスメソッドDevelopersIOの検証によると、Reasoning ON(medium)にすると completion_tokens が12〜35倍、レイテンシが6〜17倍になるケースが確認されている。用途に応じてnone/mediumを使い分けることが重要。

4. 価格体系

プラン 入力(/100万トークン) 出力(/100万トークン) 備考
Free 無料(利用量制限あり) 無料(利用量制限あり) 試用向け
Standard 60円 250円(128Kトークンまで) 商用利用の標準プラン
Provider 個別見積もり 個別見積もり AIサービス提供者向け

GAリリースキャンペーン(〜2026年7月31日):新規登録で1,000万トークン相当のクレジットが付与される。

主要モデルとのコスト比較(参考)

※ 海外モデルの円換算は変動するため参考値。PFN公式の比較軸に基づく同価格帯での位置づけ。

モデル 入力(/100万トークン) 出力(/100万トークン) PFNの比較対象分類
PLaMo 3.0 Prime ¥60 ¥250
GPT-5.4 Mini(OpenAI) 同価格帯 同価格帯 同価格帯クローズド
Claude Haiku 4.5(Anthropic) 同価格帯 同価格帯 同価格帯クローズド
gpt-oss-120b(OpenAI) 同性能帯 同性能帯 同性能帯オープン
Qwen3.6-27B(Alibaba) 同性能帯 同性能帯 同性能帯オープン

出典:PFN公式プレスリリース(2026年6月22日)。各モデルの円換算コストはOpenRouterの平均価格をPFNが評価コスト計算に使用。

5. ベンチマーク評価——強みと弱点

PFNは15種のベンチマークで社内評価を実施し、結果をテックブログで公表している。比較対象は、同性能帯オープンモデル(gpt-oss-120b、Qwen3.6-27B)と同価格帯クローズドモデル(GPT-5.4 Mini、Claude Haiku 4.5)。

評価ベンチマーク一覧

ベンチマーク 測定内容
IFBench / JFBench英語・日本語の指示追従性
MT-bench / Japanese MT-bench英語・日本語の対話性能
BFCL v4英語ツール使用性能(Function calling)
BrowseComp-PlusWeb検索付き質問応答
LongBench v1 / v2長コンテキスト質問応答
AIME 2024数学(高校数学オリンピック)
GPQA-DiamondSTEM分野の専門知識
LiveCodeBenchコーディング性能
lawqa_jp日本の法令質問応答
MedRECT / 医師国家試験医療分野の質問応答
HELM Safety安全性(暴力・詐欺・差別・性的表現等6カテゴリ)

強み(PFN公式が競争力ありと主張する領域)

  • 日本語指示追従・対話:同価格帯のGPT-5.4 Mini・Claude Haiku 4.5と競争力あり
  • ツール利用(Function calling):ただしparallel function callingは現状非対応
  • コーディング:LLMコーディング評価で同価格帯モデルと同等以上
  • 医療ドメイン:MedRECT・医師国家試験で高スコア
  • 安全性:HELM Safetyで海外モデルと同程度以上(NICTの安全性データを活用)

弱点(PFN公式が明示的に認めている領域)

PFN公式テックブログは以下を「苦手なタスク」として明記している(β版時点のITmedia報道も同内容を確認済み):
  • Web探索・リアルタイム検索
  • 長コンテキスト(LongBench)
  • 数学的推論(AIME 2024等)
  • STEM分野(GPQA-Diamond)
  • 日本の法令分野(lawqa_jp)
「世界一賢い」ではなく「日本語実務でコスト効率よく使える」が正確な位置づけ。
⚠️ ベンチマークスコアの読み方に注意
絶対スコアはPFN公式テックブログの図表(グラフ画像)内にのみ掲載されており、テキスト形式での生スコアは外部公開されていない。すべてPFN社内評価であり、第三者による独立検証(Nejumi LLMリーダーボード等)は執筆時点で未実施。評価コスト比較は、海外モデルをOpenRouterの平均価格で計算している点も考慮が必要。

6. 競合比較

国内LLMとの比較

モデル 開発元 ベース 特徴・差別化ポイント
PLaMo 3.0 Prime Preferred Networks フルスクラッチ Reasoning対応、256K、デジタル庁「源内」採用、国内処理保証
tsuzumi 2 NTT フルスクラッチ 30B、1GPU(A100 40GB)動作、金融・自治体・医療特化
cotomi v3 NEC フルスクラッチ 最大30万字の長文処理、GPT-4比5倍以上の速度(Pro)
Takane 32B 富士通 Cohere Command R+派生 JGLUE世界最高記録、1bit量子化
Llama-3.1-ELYZA-JP-70B KDDI・ELYZA Llama派生 70B、日本語チューニング、オープンウェイト

※ 各社スペックは各社公称値・業界メディア情報。Nejumi等の横並び独立比較データはデジタル庁「源内」評価公表(2027年1月予定)を待つ必要がある。

グローバル競合との位置づけ

PFNは公式に「フロンティアモデル(GPT-5.5 Pro、DeepSeek V4 Pro等)との性能ギャップはある」と認めており、「同価格帯(GPT-5.4 Mini / Claude Haiku 4.5)での勝負」を明言している。フロンティアモデルとの比較は公式言及なく、戦っていないのが正確な認識。

7. 採用実績・ユースケース

デジタル庁「源内(Gennai)」への採用

デジタル庁が整備する政府職員向け生成AI環境「源内」(生成AI=Gen AIと江戸時代の発明家・平賀源内に由来)において、PLaMo 3.0 Primeが試用国産LLMに選定されている。PFN公式によれば「2026年8月頃から試験利用される」とされており、2027年3月まで評価・検証が続く予定。優れたモデルの有償政府調達は2027年度以降を想定。PLaMo翻訳は2025年12月から先行導入済み。

⚠️ 「源内」採用に関する留意事項:現段階は試用・評価フェーズであり、本格的な有償政府調達(2027年度以降)が確定したわけではない。またWTO政府調達協定との整合性の観点から、現段階で海外製品の排除を意味するものではない。

その他の採用事例

  • QommonsAI(Polimill株式会社):多数の自治体・省庁に導入されている行政向け生成AIサービスにPLaMoが標準搭載。PFN公式リリース(2026年6月22日)には「約800自治体」の記載あり(※β版発表時の資料では700自治体以上との記述もあり、時点により変動)
  • miibo:国産AI構築プラットフォームに統合
  • Tachyon生成AI:法人向け生成AIサービスに採用

8. 注意点・限界

📌 導入検討前に確認すべき重要事項
  • パラメータ数・アーキテクチャが非公開:dense/MoEの別も未開示で、コスト合理性や推論効率の客観評価が困難
  • 絶対ベンチマークスコアが非公開:性能主張はすべて社内評価の図表画像のみ。第三者独立検証は未実施
  • 苦手領域が明確に存在:Web探索・数学・STEM・長コンテキスト・日本の法令でPFN自身が「劣る」と明記
  • parallel function callingが非対応:複数ツールの並列呼び出しが必要なエージェント用途は注意
  • クローズドモデル:Prime本体のウェイトは非公開。オープンウェイトモデルのエコシステムには参加できない
  • 思考過程は現状英語:Reasoning ONの内部思考トークンは英語で生成されている(将来的な日本語化を検討中とPFNが明記)

9. 今後の展望

PFNは今後の課題として、さらなるコンテキスト長拡張・高度な推論・実務タスク全般の性能向上を挙げている。また、NICT共同開発の事前学習モデル(PLaMo 3.0 Pretrained)の2026年春公開も予定されていた(β版資料より)。

PFNの事業戦略における位置づけとしては、AI半導体(MN-Core)・計算基盤・基盤モデル・ソリューションの4層垂直統合を掲げており、推論向けMN-Core L1100/L1400の2027年提供予定とPLaMoの連携も視野に入る。

Nejumi LLMリーダーボード等の第三者ベンチマークへの登録(執筆時点で未登録)と、デジタル庁「源内」の評価結果公表(2027年1月予定)が、国産LLM横並び比較の重要な指標になる見込みだ。

10. まとめ

PLaMo 3.0 Primeは、「世界最高性能」を目指したモデルではなく、「データ主権・日本語性能・コスト」の3軸を国産フルスクラッチで同時に実現した実用モデルという位置づけが正確だ。

PLaMo 3.0 Primeが向いているケース 他モデルを検討すべきケース
  • 機密文書の社内処理(日本国内サーバー保証)
  • 日本語業務文書の要約・分類・QA
  • 公共・金融・医療でのデータ主権要件
  • コスト重視で同価格帯クローズドモデルと比較
  • エージェント用途(ただしparallel FC非対応)
  • 最先端の数学・STEM研究用途
  • 大規模Web検索・リアルタイム情報取得
  • 1M超の超長コンテキスト処理
  • オープンウェイトモデルのローカル実行
  • 英語中心の業務

現実的な導入アプローチとしては、まずFreeプランまたはGAキャンペーンクレジット(〜2026年7月31日)で自社の実業務データを使ってPoCを行い、GPT-5.4 Mini・Claude Haiku 4.5と並走比較するのが合理的だ。判断基準は「ベンチマーク値」より「自社業務で本当に効くか」。データ主権・個人情報保護が問われる案件では、全リクエストが日本国内で処理されるという点がそのまま差別化になる。


主な参照情報源(2026年6月23日時点)
・PFNプレスリリース pr20260622(正式版)
・PFN Tech Blog「PLaMo 3.0 Primeをリリースしました」(2026年6月22日)
・PFN Tech Blog「PLaMo 3.0 Prime β版をリリースしました」(2026年3月19日)
・NICT告知「Preferred Networksが国産生成AI基盤モデルPLaMo 3.0 Primeをリリース」(2026年6月22日)
・ITmedia AI+「国産フルスクラッチAI『PLaMo 3.0 Prime』提供開始」(2026年6月22日)
・ITmedia AI+「初の"長考"できる国産フルスクラッチLLM『PLaMo 3.0 Prime』」(2026年3月23日、β版)
・DevelopersIO「PLaMo 3.0 Primeを試してみた」(2026年6月22日)
・Impress Watch「PFN、企業利用の実用性を高めた国産AIモデル」(2026年6月22日)

0 件のコメント: