軽量AIモデル「Claude Haiku 4.5」登場　コーディング性能は前世代上位モデル並みでも、コストは1/3

ソフトウェアエンジニアリング分野のベンチマーク（SWE-bench Verified）におけるコーディング性能比較（公式発表ページより引用）横軸は主要AIモデル（例：Claude Sonnet 4.5、Claude Haiku 4.5、GPT-5-Codex、Gemini 2.5 Proなど）を示し、縦軸は「課題を正しく解決できた割合（％）」を表している。上に行くほどコード生成や修正タスクの精度が高いことを意味する。色付きのバーはClaudeシリーズ（Haiku／Sonnet）を示しており、Haiku 4.5は73.3％で、前世代Sonnet 4（72.7％）をわずかに上回る精度を達成した。一方で、現行の上位モデルSonnet 4.5（77.2％）と比べると3.9ポイント低い結果となっている。

記事に戻る