在马尔可夫决策过程中,状态值函数表示什么?

2024年10月21日

在马尔可夫决策过程中,状态值函数表示什么?
A. 从当前状态开始采取最优策略得到的期望总奖励
B. 从初始状态开始采取最优策略得到的期望总奖励
C. 从当前状态开始采取任意策略得到的期望总奖励
D. 从初始状态开始采取任意策略得到的期望总奖励

查看答案

关于网站 - 联系我们 - 网站地图
版权所有:湖北自考服务中心网