第2回 AIの強化学習の基礎を学ぼう

図6 DeepRacerにおけるゴールのみの報酬関数のイメージ(ワークショップより)