AnthropicのClaude、有害な会話を自ら終了する機能を試験導入 “AIの福祉”研究の一環

Claudeが明らかな苦痛パターンを示す例(画像:Anthropic)