博弈论 一报还一报 贴现率

来源:百度知道 编辑:UC知道 时间:2024/05/28 09:42:02
题目如此下:
假设两个人重复Prisoner’s Dliemma,两个人都合作(r,r),两个人都不合作(p,p),Player 1合作,Player 2 不合作(t,s),Player 2合作,Player 1 不合作(s,t). t>r>p>s, 2r>s+t
A Tit for Tat player cooperates on the first round of a repeated Prisoner's Dilemma and thereafter does what the other player did in the previous round~

求解:

show that for a sufficiently low and largest discount rate for each of the player in tit for tat nash equilirium.

说实话,这道题让我花费了两个小时的时间,我的解题方法相对很稚嫩,而我由在解题的一开始就犯了基础性的错误,导致浪费了很多时间,废话不多说了,我将我的思路讲一下,希望有高手指出错误并给出好方法。

如题我们知道第一轮博弈双方均采取了合作,也就是说他们在第一轮收益均为r,我们要考虑的就是后面的无限次重复博弈的一个子博弈完美纳什均衡。

由于双方均采取一报还一报的策略原则,所以其实他们的策略组合不外乎3中
1.双方从第二轮一直合作到底,这种情况下他们的收益相同,均为
π=r +r×a+r×a²+……=r +ar/(1-a)
我用a代表折旧率,我出错的地方就是这一步,那个单独的r不可以省去
希望你能明白我的意思,至于ar/(1-a)是怎么来的,你应该知道吧

2.双方在第二轮同时选择不合作,那么他们必定会不合作到底
此时,他们的得益也相同
π=r+p×a+p×a²+……=r +ap/(1-a)

在讨论第三种情况之前我们可以清晰的看出双方选择合作的得益比选择不合作的得益多,因为r>p,这和我们的经验也相符,所以题目要求的最优解,应该向合作靠拢,即尽量将不合作的可能性降到最低。

3.在第二轮一方选择不合作,而另一方选择合作,这样就会带来一种很有趣的局面,在接下去的博弈中,总是出现一方合作,一方不合作。
率先不合作方的得益为
π=r+s×a+t×a²+……=r +(as+a²t)/ (1-a²)
另一方的得益为
π= r+t×a+s×a²+……=r +(at+a²s)/ (1-a²)

比较第一种情况和第三种情况的得益,即比较大小知(具体过程你可以自己解一下)
当折旧率在(t-r)/(r-s)<a<(r-s)/(t-r)时双方会选择合作的策略
这个区间满足合作时的双方得益大于情况三中的两种任何一种得益
在区间的两个端点处,两方中一方选择情况1和3的得益相等,这句话比较粗略,如果你自己好好想想,