AI

「Gemini Ultra」は何が違う?GPT-5(噂)との性能差をベンチマークで比較

Google が 2024 年末に発表した Gemini Ultra は、公開ベンチマーク MMLU で 90.0% を記録し、人間平均を超えたと話題になりました。一方、OpenAI の GPT-5 は 2025 年夏〜秋リリース予定と見込まれています。現時点の公開情報とリークを整理し、両者を比較します。

■ ベンチマーク&仕様比較(2025 年 6 月版)

項目 Gemini Ultra GPT-5(推定)
MMLU (5-shot) 90.0% 92〜93%(開発者プレビュー情報)
MMMU(画像理解) 58.2% 60% 以上と推測
GPQA 77% 80% 超えの可能性
Context Window 1 M tokens(圧縮モード) 1 M tokens 以上
マルチモーダル 画像・音声・動画入力に対応 画像・音声・動画+外部ツール連携強化
API 価格 $0.012 / 1k in
$0.036 / 1k out
$0.02 / 1k in?
$0.06 / 1k out?(未確定)
公開時期 2024 年 12 月 2025 年 Q3〜Q4

■ パフォーマンス解釈

  • 事実系タスク:Gemini Ultra が検索・表計算ネイティブの強みで優位
  • 創造系/推論:GPT-o シリーズより上積みがあれば GPT-5 が逆転の可能性
  • 長文&コード:長いコンテキストとコード系ベンチが GPT 系優位と予想

■ シナリオ別おすすめ

ユースケース 優先モデル 理由
企業ナレッジ検索(図・PDF混在) Gemini Ultra Google Workspace 連携とマルチモーダル読解が強み
長文技術ブログ生成(6000 words↑) GPT-5 長文整合と反論検査が強化見込み
高速試作 & コスト重視 Gemini Ultra
または GPT-4o
トークン単価が半額以下

■ 今後のチェックポイント

  1. GPT-5 公式ベンチ公開を待って再比較
  2. Gemini 3.x(動画生成ネイティブ)の正式発表
  3. 両社の API 価格改定と無料枠動向

■ まとめ

  • 現時点では 事実系 → Gemini長文推論 → GPT 系 が目安
  • GPT-5 の正式スペック次第で再逆転の可能性
  • 開発現場では「タスク別にモデルを切り替える」設計が鉄板

リリース競争は佳境。最適モデルを選ぶのではなく、最適にスイッチする設計が 2025 年後半の勝ち筋です。