AIが「言語生成AIとの対話」で賢くなり続ける自動成長モデル 米Meta含む研究者らが開発

Motifの手順を三つの段階で示す。LLMを使用してキャプションのペアから高い優先度のデータを取り出し、データセットに保存、そのデータを元に、報酬関数を作成、作成した報酬関数を使って、エージェントを訓練