Anthropic、ハイブリッド推論モデル「Claude 3.7 Sonnet」とコマンドラインツール「Claude Code」公開 開発者をどう支援するのか

ユーザーとツールのやりとりを伴う実世界の複雑なタスクでAIエージェントをテストするTAU-benchの結果(提供:Anthropic)