軽量AIモデル「Claude Haiku 4.5」登場 コーディング性能は前世代上位モデル並みでも、コストは1/3

ソフトウェアエンジニアリング分野のベンチマーク(SWE-bench Verified)におけるコーディング性能比較(公式発表ページより引用)横軸は主要AIモデル(例:Claude Sonnet 4.5、Claude Haiku 4.5、GPT-5-Codex、Gemini 2.5 Proなど)を示し、縦軸は「課題を正しく解決できた割合(%)」を表している。上に行くほどコード生成や修正タスクの精度が高いことを意味する。色付きのバーはClaudeシリーズ(Haiku/Sonnet)を示しており、Haiku 4.5は73.3%で、前世代Sonnet 4(72.7%)をわずかに上回る精度を達成した。一方で、現行の上位モデルSonnet 4.5(77.2%)と比べると3.9ポイント低い結果となっている。