Google が 2024 年末に発表した Gemini Ultra は、公開ベンチマーク MMLU で 90.0% を記録し、人間平均を超えたと話題になりました。一方、OpenAI の GPT-5 は 2025 年夏〜秋リリース予定と見込まれています。現時点の公開情報とリークを整理し、両者を比較します。
■ ベンチマーク&仕様比較(2025 年 6 月版)
| 項目 | Gemini Ultra | GPT-5(推定) |
|---|---|---|
| MMLU (5-shot) | 90.0% | 92〜93%(開発者プレビュー情報) |
| MMMU(画像理解) | 58.2% | 60% 以上と推測 |
| GPQA | 77% | 80% 超えの可能性 |
| Context Window | 1 M tokens(圧縮モード) | 1 M tokens 以上 |
| マルチモーダル | 画像・音声・動画入力に対応 | 画像・音声・動画+外部ツール連携強化 |
| API 価格 | $0.012 / 1k in $0.036 / 1k out |
$0.02 / 1k in? $0.06 / 1k out?(未確定) |
| 公開時期 | 2024 年 12 月 | 2025 年 Q3〜Q4 |
■ パフォーマンス解釈
- 事実系タスク:Gemini Ultra が検索・表計算ネイティブの強みで優位
- 創造系/推論:GPT-o シリーズより上積みがあれば GPT-5 が逆転の可能性
- 長文&コード:長いコンテキストとコード系ベンチが GPT 系優位と予想
■ シナリオ別おすすめ
| ユースケース | 優先モデル | 理由 |
|---|---|---|
| 企業ナレッジ検索(図・PDF混在) | Gemini Ultra | Google Workspace 連携とマルチモーダル読解が強み |
| 長文技術ブログ生成(6000 words↑) | GPT-5 | 長文整合と反論検査が強化見込み |
| 高速試作 & コスト重視 | Gemini Ultra または GPT-4o |
トークン単価が半額以下 |
■ 今後のチェックポイント
- GPT-5 公式ベンチ公開を待って再比較
- Gemini 3.x(動画生成ネイティブ)の正式発表
- 両社の API 価格改定と無料枠動向
■ まとめ
- 現時点では 事実系 → Gemini、長文推論 → GPT 系 が目安
- GPT-5 の正式スペック次第で再逆転の可能性
- 開発現場では「タスク別にモデルを切り替える」設計が鉄板
リリース競争は佳境。最適モデルを選ぶのではなく、最適にスイッチする設計が 2025 年後半の勝ち筋です。
