Anthropic、LLMはわずか250件の悪意あるデータで「汚染」可能という研究結果

250件のポイズニングされた文書に対するサービス拒否攻撃の成功率(画像:Anthropic)