GoogleがGPT-3開発メンバーらのスタートアップと提携、解釈可能で操作可能なAIシステムを目指す

AnthropicがWebサイトで研究の方向性として示している論文の一つは人間が作成した敵対的な入力に対して、言語モデルのどの安全技術がより堅牢であるかを探る内容だ(出典:コーネル大学の論文アーカイブ)