逆向归纳法(backward induction),是求解动态博弈均衡的方法,是博弈论中一个比较古老的概念,是指博弈参与人的行动存在着先后次序,并且后行动的参与人能够观察到前面的行动。逆向归纳法是博弈论中一个比较古老的概念,它的提出最早可以追溯到泽梅罗(1913) 针对国际象棋有最优策略解的证明,后来人们将其推广到了更广泛的博弈中。例如,在有限完美信息扩展型博弈中,就是用逆向归纳法(BI)来证明子博弈完美均衡(SPE)的存在以及求解 SPE,其基本思路是从动态博弈中的最后一个阶段开始,局中人都遵循效用最大化原则选择行动,然后逐步倒推至前一个阶段,一直到博弈开始局中人的行动选择,其逻辑严密性毋庸置疑。然而,当从终点往前推到某一决策点时,BI 完全忽略了到达该决策点的以往历史行动,而这一历史行动当然会影响处于该决策点的局中人有关其对手将来如何采取行动的信念,例如,一个局中人如果观察到对手在过去没有按照 BI 进行行动选择,那么他就有理由相信他的对手仍会采取同样的模式进行下去,但是通过这种信念修正以后所做的选择就会与 BI矛盾。