Anthropic、ハイブリッド推論モデル「Claude 3.7 Sonnet」とコマンドラインツール「Claude Code」公開 開発者をどう支援するのか ユーザーとツールのやりとりを伴う実世界の複雑なタスクでAIエージェントをテストするTAU-benchの結果(提供:Anthropic) 記事に戻る @IT