強化學習,簡而言之就是控制在某個環境下自主行動的個體,透過環境和規則的互動,不斷改變它的行為模式。

比如,吃豆人遊戲,自主行動的個體就是控制的吃豆人,環境就是迷宮,獎勵就是吃到的豆子,行為就是上下左右的操作。

強化學習的輸入是,角色在某一位置的狀態,該狀態下允許的操作,和每個操作帶來的價

《重生之AI教父》153. 你小心被網暴

《》