随机最优控制(Stochastic optimal control)是指选择控制变量,使随机系统某个性能指标达到最优的控制。在随机系统控制中,必须进行状态估计。应用不同的状态估计方法,会得到不同的解。因为系统的状态方程和观测方程一般都要受到噪声的干扰,系统的状态是不确定的,确切知道的只是已经获得的一组输出数据和已经施加于系统的控制输入。随机最优控制是指选择控制变量,使随机系统某个性能指标达到最优的控制。在随机系统控制中,必须进行状态估计。应用不同的状态估计方法,会得到不同的解。因为系统的状态方程和观测方程一般都要受到噪声的干扰,系统的状态是不确定的,确切知道的只是已经获得的一组输出数据和已经施加于系统的控制输入。如何利用这些输入输出数据实时信息去估计系统的状态或输出,便构成了不同的信息结构。因此,随机最优控制问题的研究首先必须与信息结构相联系。信息结构分为经典信息结构和非经典信息结构。对于经典信息结构,每一时刻控制量的确定都利用了最大实时信息。而在非经典信息结构下控制量每个分量的确定利用了最大实时信息的一部分。