「コードを書く」から「意図を説明する」へ AIエージェントが変えたソフトウェア開発

METRによるAIモデルのリーズニング(推論)能力評価。モデルが新しくなるにつれ、複雑なタスクを完遂できるようになっている(METRのブログ記事より)