什么是纳什均衡,他的原理是什么?

来源:百度知道 编辑:UC知道 时间:2024/06/17 13:57:11
怎样解读博弈论里的矩阵?

纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
纳什均衡是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。
假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的),则此策略组合被称为纳什均衡。所有局中人策略构成一个策略组合。纳什均衡,从实质上说,是一种非合作博弈状态。
纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态,需要注意的是,只有最优策略才可以达成纳什均衡,严格劣势策略不可能成为最佳对策,而弱优势和弱劣势策略是有可能达成纳什均衡的。在一个博弈中可能有一个以上的纳什均衡,而囚徒困境中有且只有一个纳什均衡。

  假设有一个团体里面有两个人叫a、b共同作生意
  根据以前的观点a的利益最大化、b的利益最大化那么这个团体的利益就最大化了
  但根据博弈论的观点a的利益最大化、b的利益最大化并非会导致这个团体的利益最大化
  最有名的例子就是小偷的例子
  两个小偷去偷东西被抓住了分开来审讯
  这时每个小偷有2种结果,招和不招
  如果招了被确认有罪责判5年,如果不招被判有罪责判10年,但如果2个人都不招则无法判其有罪责被当场释放,这时就可以列出博弈矩阵
  a招 a不招
  b招 均5年 a10年,b5年
  b不招 a5年,b10年 均释放

  显然最好的策略是双方都抵赖,结果是大家都无罪。但是由于两人处于隔离的情况下无法串供,按照亚当·斯密的理论,每一个人都是一个“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他招了,我不招,得坐10年监狱,招了才5年,所以招了划算;假如我招了,他也招,得坐5年,他要是不招,我就只坐1年,而他会坐10年牢,也是招了划算。综合以上几种情况考虑,不管他招不招,对我而言都是招了划算。两个人都会动这样的脑筋,最终,两个人都选择了招,结果都被判5年刑期。