Claude Sonnet 4.6登場 Opus級の知能が“普段使い”の価格に、AIが「作業する存在」へ Claudeシリーズにおける「Computer Use(コンピュータ利用)」能力の推移(Anthropic公式発表ページより引用)縦軸はスコア(%)、横軸はリリース時期を示す。「OSWorld」と「OSWorld-Verified」ベンチマーク(いずれもPC操作を伴うタスクの評価指標)の推移をまとめたグラフであり、Claude SonnetはSonnet 3.5(new)の14.9%からSonnet 4.6の72.5%まで一貫してスコアを伸ばしている。詳細な意味については本文で解説する。 記事に戻る 一色政彦,デジタルアドバンテージ