OpenAI、推論モデル「o3」で安全性を高める「熟慮的アラインメント」採用

ポリシー違反のプロンプトへの回答を拒否する過程(公式ブログより)