AnthropicのClaude、有害な会話を自ら終了する機能を試験導入 “AIの福祉”研究の一環
Claudeが明らかな苦痛パターンを示す例(画像:Anthropic)
記事に戻る
ITmedia