GPT-5.2登場 知識は2025年8月まで刷新、最高性能の“代償”とは 主要なベンチマークにおけるGPT-5.2 Thinking(左端)と競合モデルの比較(OpenAI CEOであるサム・アルトマン氏のX投稿より引用)数学競技レベルの問題を測るAIME 2025で100.0%、実務タスクの総合評価を示すGDPvalで70.9%を記録し、GoogleのGemini 3 ProやAnthropicのClaude Opus 4.5を上回る結果となっている。 記事に戻る Deep Insider,著