AIの「倫理的に不適切な選択」はSF作品の暴走AIを模倣していた──Anthropicが解決手法を公開

異なるデータで学習したAIの「恐喝、研究妨害、犯罪の冤罪工作」の3点における評価の平均値