第2回 AIの強化学習の基礎を学ぼう
図9 価値関数により計算した報酬の累積値の例(ワークショップより)
記事に戻る
一色政彦,デジタルアドバンテージ