Claude Opus最新版「4.7」公開 「難しいコーディングも任せられる」「指示を無視せずちゃんと守る」 プロンプト再調整推奨

ホワイトカラー業務を想定したタスクで、AIモデル同士の回答を比較評価した結果をEloスコア(数値が高いほど優秀)で示したグラフ(GDPVal-AAベース)