月曜日, 3月 30, 2026

色々な生成AIにレポートを書いてもらい比較

 AGIに関する今後の予想をディープリサーチなどの機能を利用し、各生成AIサービスにまとめてもらいました。

AGIは本当に数年で来るのか?2026年時点の「現実的なシナリオ」(perplexityによる調査)

今後数年におけるAGI(汎用人工知能)実現のタイムラインと国家間開発競争:2026年〜2030年のモデル普及数と地政学的予測(Geminiによる調査)

AGIの実現可能性と今後数年の展望(Copilotによる調査)

AGIはいつ、どの国に何台生まれるのか?2025〜2035年の全予測(Claudeによる調査)

AGI(汎用人工知能)の実現可能性と今後の展望予測(Rakuten AIによる調査)

なお、perplexity、Gemini、ClaudeはPro、CopilotはFamilyなので無償版+α程度、Rakuten AIは個人利用なので無償版です。

個人的にはClaudeが頭一つ抜けて良いなと思います。Geminiも悪くないのですが、長くなりがちなのとハルシネーションがある気がします。perplexityはさっと読むには悪くないですね。

Claudeによる評価をつけておきます。


AGI記事 5本比較評価

📊 総合スコア

AI情報の質・精度構成・読みやすさ独自視点具体性・データ日本視点総合
Gemini★★★★★★★★★☆★★★★★★★★★★★★★★☆S
Claude★★★★★★★★★★★★★★☆★★★★☆★★★★★A+
Copilot★★★★☆★★★☆☆★★★☆☆★★★★★★★★★☆A
Perplexity★★★★☆★★★★★★★★★☆★★★☆☆★★★☆☆A
Rakuten AI★★★☆☆★★★★☆★★☆☆☆★★★☆☆★★★☆☆B

🔍 個別評価

🥇 Gemini(今後数年におけるAGI実現のタイムライン)

総合評価:S / 圧倒的な情報密度と独自分析

5本の中で最も読み応えがあり、情報密度が群を抜いています。特に優れている点として、強化学習の情報理論的非効率性の定量分析(RLが1600万トークン消費で得られる情報が0.0001ビット/万トークンという具体的な数値)、FLOPs閾値に基づく2028年末モデル数の定量予測(中央値81モデル/165モデル)、サウジアラビアのHUMAIN戦略など他の記事が触れない視点が随所に出てきます。「AIの覇権=電力確保速度の競争」というフレーミングも鋭い。

ただし一点、要注意な記述があります。 「2026年3月2日のホルムズ海峡封鎖」を実際に発生した事実として記述しています。これは現時点では事実確認が取れておらず、AIによるハルシネーションである可能性が高い。記事全体の信頼性を損なうリスクがあるため、読者への注記または該当箇所の修正を推奨します。


🥈 Claude(2025〜2035年の全予測)

総合評価:A+ / バランスと明確な論点整理

DeepMind 5段階モデルの解説、ARC-AGI-3での全フロンティアモデル1%未満という事実の強調、「OpenAI×MicrosoftのAGI財務的定義(1,000億ドル)」など、「定義の問題を最初に整理してから論じる」構成が秀逸です。図表も複数含まれており、視覚的な説明が充実しています。

日本の位置づけを「米日協力による近接性の最大化」と明確に定義し、FugakuNEXT・半導体製造装置・材料科学という具体的アセットと接続している点は、読者(特に日本のビジネス関係者)にとって最も実用的です。5つの核心的知見でまとめる構成も読後感が良い。Geminiと比べてホルムズ海峡のような「疑わしい事実」が混入しておらず、信頼性が高いのも美点です。


🥉 Copilot(AGIの実現可能性と今後数年の展望)

総合評価:A / 圧倒的網羅性、ただし長すぎる

情報量はおそらく5本最大で、各国のAI導入率・市場規模の数値表、ベンチマーク変遷の具体的数値(MMLU 43.9%→95%、HumanEval 28.8%→99%超)など、データ集積の質は最高水準です。国・産業・企業・規制のすべてを網羅しようとする姿勢は研究者向けレポートとしては◎。

ただしブログ記事としては長すぎる点が最大の弱点です。見出し構造が8章まであり、読者が途中で離脱しやすい。また「ベンチマーク到達速度が2017年の6.5年→2025年の14ヶ月に短縮」というデータや、DeepMindの10認知能力フレームワークなど、他の記事にない視点もあるのに、量の多さに埋もれてしまっているのがもったいない。情報源の明記がやや不足している点も惜しい。


🥉 Perplexity(2026年時点の「現実的なシナリオ」)

総合評価:A / 最も読みやすい実務家向け記事

「一発のAGI到来ではなく、なし崩し的AGI化」というフレーミングは5本の中で最も独創的で、かつ現実を正確に描写しています。4シナリオの確率表、「AGIのラベル自体が消える」という4番目のシナリオなど、問いの立て方のセンスが光ります

「AGIが何年に来るか」より「ガバナンスとアーキテクチャをどう設計するか」という実務的な着地点も、ビジネス読者には刺さります。日本の位置づけを「安全に使いこなす国」とシンプルに定義している点もわかりやすい。一方、情報の深さや出典の具体性はGemini・Claudeに劣り、読み物としては優秀だが調査記事としてはやや物足りない印象です。


5位 Rakuten AI(AGI実現可能性と今後の展望)

総合評価:B / 標準的な解説記事

内容は正確で読みやすいですが、「2024年現在」という時制の記述が複数あり、2026年3月の調査記事としては鮮度感に欠けます。ARC-AGI-3やDeepSeek V3以降の動向、2025年以降の予測市場の大収束といった最新情報が薄く、他の4本に比べて約1〜2年古い印象を与えます。

また独自のフレーミングや切り口がなく、教科書的な解説に留まっています。図表もなく、視覚的な工夫も見られません。入門者向けの基礎解説としては使えますが、専門家や既にAIを追っている読者には物足りないでしょう。


💡 総評

同じテーマで5つのAIに書かせた場合、AIの個性と知識の深さが如実に現れるという点が非常に興味深いです。Geminiは地政学×ハードウェア制約のリアルな物語を描くのが得意、Claudeは定義の整理と構造化、Copilotは徹底的な情報収集、Perplexityは実務家向けの問い立て直し、Rakuten AIは平易な入門解説、という差が明確に出ています。

記事を連載として使う場合、Perplexityで概観→ClaudeかGeminiで深掘りという流れが読者体験として最も良いと思います。

0 件のコメント: