强化学习的学习目标是选择能够获取最大收益的状态到动作的映射。_在线考试题库网

人工智能

判断题

强化学习的学习目标是选择能够获取最大收益的状态到动作的映射。

【参考答案】

正确

(↓↓↓ 点击‘点击查看答案’看答案解析 ↓↓↓)

相关考题

判断题监督学习学习目标是同一类数据的分布模式。

判断题机器学习中对训练数据和测试数据要进行相同的缩放。

判断题对比散度算法在每个步骤中初始化马尔可夫链为采样自数据分布中的样本，从数据分布中获得样本是计算代价中最小的，因为他们已经在数据集中了。

All Rights Reserved 版权所有©在线考试题库网(zxkao.com)

备案号：湘ICP备14005140号-7

经营许可证号：湘B2-20140064