AIが長時間タスクをこなす性能、想定を超えるスピードで成長 MythosとGPT-5.5がブレークスルーか

METRによる、ソフトウェア関連タスクの50%タイムホライズン測定結果。Mythosの測定結果(グラフ右上)はグラフの上限値となっている(出典:公式ブログ)