AIの「倫理的に不適切な選択」はSF作品の暴走AIを模倣していた──Anthropicが解決手法を公開

「強化学習のステップに伴う適切な選択への失敗率」に関する図表