在马尔可夫决策过程中,状态值函数表示什么?A. 从当前状态开始采取最优策略得到的期望总奖励B. 从初始状态开始采取最优策略得到的期望总奖励C. 从当前状态开始采取任意策略得到的期望总奖励D. 从初始状态开始采取任意策略得到的期望总奖励