随机动态规划(stochastic dynamic programming),工学-控制科学与工程-控制系统性能-稳定性-多目标优化-随机动态规划,将动态规划的模型结构与信息系统的随机性相结合的一种不确定规划。对于具有确定过程的规划问题来说,在当前阶段做出的决策产生的下一状态是确定的。而对于随机动态规划,在当前状态下做出的决策,由于受到随机变量因素的影响,下一状态不能够完全确定呈现随机的特点。在随机动态规划中如何更好地应用分阶段思想处理随机变量是重点。与动态规划一样,随机动态规划也是将现实世界中存在的可以反映现象的实际状况表述为数学中的抽象向量,通过建立数学模型来解决问题。在对系统用随机动态规划进行优化时,常用的数学模型通常由阶段、状态变量、决策变量、随机变量、策略、状态转移、指标函数、约束、递推方程等部分组成。随机变量可以呈现出不同的特性,对于那些建立在统计基础上的随机变量,随机变量在不同阶段表现是不同的,可能是独立离散的,可能是独立连续的,也可能具有马尔可夫的性质,因此随机动态规划可分为独立随机变量的随机动态规划和具有马尔可夫性质的随机动态规划等。