扫码下载编程狮APP
W3Cschool
恭喜您成为首批注册用户
获得88经验值奖励
在本章中,您将详细学习使用 Python 进行 AI 强化学习的概念。
这种类型的学习被用来加强或加强基于评论者信息的网络。 也就是说,在强化学习下训练的网络从环境中获得一些反馈。 但是,反馈是评价性的,并且不像监督式学习的情况那样具有启发性。 基于这种反馈,网络将对权重进行调整以获得更好的评论信息。
这个学习过程类似于监督学习,但我们可能拥有的信息非常少。 下图给出了强化学习的框图 -
更多建议:
扫描二维码
下载编程狮App
编程狮公众号
联系方式:
更多建议: