在马尔科夫决策过程中,策略通常表示为:

2024年10月21日

在马尔科夫决策过程中,策略通常表示为:
A. 状态到动作的映射
B. 动作到状态的映射
C. 状态到奖励的映射
D. 奖励到动作的映射

查看答案

关于网站 - 联系我们 - 网站地图
版权所有:湖北自考服务中心网