W3Cschool
恭喜您成为首批注册用户
获得88经验值奖励
在本章中,您将详细了解人工智能中强化学习的概念。
这种学习类型用于基于评估信息来强化或增强网络。也就是说,在强化学习下训练的网络会从环境中接收一些反馈。然而,与监督学习不同,这种反馈是评估性的,而不是指导性的。基于此反馈,网络会调整权重,以在未来获得更好的评估信息。
这种学习过程类似于监督学习,但我们可能只有很少的信息。下图给出了强化学习的框图:

Copyright©2021 w3cschool编程狮|闽ICP备15016281号-3|闽公网安备35020302033924号
违法和不良信息举报电话:173-0602-2364|举报邮箱:jubao@eeedong.com

扫描二维码
下载编程狮App

编程狮公众号
联系方式:

更多建议: