单项选择题

A.优化固定算法
B.在未知环境中学习最佳行为
C.模拟人类行为
D.解决确定性问题