本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
- E) `7 W' F6 e) d" d0 v3 t+ |! s- t3 e$ l9 M
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
0 n: b0 _* N& U& ? }3 @ F 以下三个定义:8 b: |% p! o7 W" r" Q
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
! h1 h2 p3 H% a; C 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 & j1 [" x& W3 @5 O. W2 v+ s
所谓的双方优势策略则是指双方利益总和最大的策略。 / X3 m( @$ H" o. M1 z
[编辑本段]严格优势策略举例分析+ R- b- `" p d7 V# K
一、经典的囚徒困境
. h3 [. f% ^! i' R4 a 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 9 y& ?% m( z9 G5 ?3 \
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 6 A" u4 p7 V( r4 Y' m
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 - Y' s7 G6 L. E
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
' A" f9 R- U. {5 [6 U0 H9 T9 y2 P, p/ H 若二人都互相检举(互相“背叛”),则二人同样判监2年。1 j- f8 R% _( _/ v7 X3 [
5 [+ v3 k" I. a7 f7 J+ a' d
用表格概述如下:" I% O$ F- l0 ~% B& I( _7 R! G- c
8 b0 w+ N1 f1 x' D8 h) c
甲沉默(合作) 甲认罪(背叛) 9 K9 E3 Z9 ^2 I3 D9 f' A, r
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 & b' y9 @5 r# [
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
+ d# Y$ d- ^- x" t+ v: H& S8 p
. O: `! C* c# n# }% o0 P 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
, s3 _# a$ w/ [, t3 D: n 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ; Z7 O2 q2 J% C+ U! h, p& c# n9 Z
若对方沉默、背叛会让我获释,所以会选择背叛。 8 ?- s$ T3 d8 D4 e" L4 V
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 4 G. R% h, u- y: ^
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
/ v; I2 J- d, x( Q 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ; b: G8 \3 W o) L: p5 ?
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
! K& v( u+ l& z/ p5 W5 ~ e[编辑本段]二、智猪博弈理论* K, N/ J' f8 `" S4 ~' q
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 / ~5 l! f$ A8 n9 b7 }
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 $ z4 c, Z6 f" P# u5 i# p# j
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
. P {. Y4 i j! { 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 $ _% ]2 }" b0 U2 b" `5 s
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
W$ Z# ` c8 a0 N& `! Q 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
) e1 Z: B3 Y: u& t* G; x4 h/ D 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
* l/ P" b" d/ V4 q! s
0 V% r. F& b: W1 K# e6 I& D三、关于企业价格策略
# m* E9 z( L/ E ?+ k9 `
" S$ _& x" U* k" H; q! z+ x
0 m) J Z0 m* D2 m, F' A. ] 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
/ ]' {" S# V* c 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
% Z2 _5 s4 U- }+ y5 I' r; u: d 以下三个定义:
8 g: X4 r* a' {, Z% \ N 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
# g- R3 g! z" U/ S; O. w 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
% R8 v) W8 L* ^3 x4 t' |7 q 所谓的双方优势策略则是指双方利益总和最大的策略。 ) [7 ^7 n! o5 C
[编辑本段]严格优势策略举例分析
8 K) y$ d g$ O; Y# {) I& F 一、经典的囚徒困境
, O6 G( I- j% Y/ m4 i 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: , v) e8 [; t B8 s
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
( p" D, }# P/ q a( L- m 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
% W# C- N" N& |3 U6 }: s6 t9 U! W 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 1 {3 t- u% F( o! Q, U
若二人都互相检举(互相“背叛”),则二人同样判监2年。/ `* f# T* m d( ]
6 @6 [8 V3 s/ z4 x7 a用表格概述如下:+ |# ~2 x0 v% L _
0 v/ A( O3 Z$ W1 r: ?" p 甲沉默(合作) 甲认罪(背叛) 7 B5 M) v& R u5 T
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 8 W9 s6 t8 m7 L* ?- n2 T3 |5 X" o
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 9 n+ I, }1 X7 a/ r ] {
. X: D: Z9 D1 j9 A: v1 W6 T5 o" E# a; o
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 6 ]" j) C2 V' r, L; b# |! l
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
6 ~: J3 Q* @* K( ?9 Q/ _; s 若对方沉默、背叛会让我获释,所以会选择背叛。 & A& a2 y5 _% N: @% T) X4 m# m
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
" p" m% k3 C+ f/ Y2 d 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
- ]# p& C# n& E6 D 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ) N) o( @, k, I# S1 i
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
( I r+ i1 m. k" P* u[编辑本段]二、智猪博弈理论3 Y! J4 C- O( ?% G/ _! M1 ~9 F% @
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 8 I# e! L7 W- R$ O& \ V
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 3 M. [' j2 S! T6 \# U7 `
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
8 ?* Y! h1 {0 e% o, ? 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 1 @' J3 q2 F. J4 _& t6 r( f
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 % Y3 D! M: q Z! |. O- n2 H
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ( s9 L" G0 J; h0 ^- X. j
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
! H. {+ r4 L; o& e7 ]& [' f
; m6 j! k& r8 D: t三、关于企业价格策略. z9 ]# [2 T0 f D2 g
, v* c8 Q4 V. o z
5 E9 ?1 k& p8 L7 J+ N 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 7 z# M4 G/ [8 |( t
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
& ], j3 p4 d( Z3 Y; \5 y( I9 T 以下三个定义:
" c8 s: m1 t$ q5 y, R1 r 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 : l' l m6 T0 U
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ' e/ o$ C; R- X: \
所谓的双方优势策略则是指双方利益总和最大的策略。 5 I9 \$ g6 l9 S5 ]% Q7 e" C
[编辑本段]严格优势策略举例分析
$ y4 c. k+ A% Z1 F 一、经典的囚徒困境 ) C" x% z) R1 u
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 1 h% O0 s9 b/ H1 @" m) \7 f
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: # Q3 c9 q1 d/ Q9 ^
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 . `" c, H3 n3 O/ ~
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
% n/ P& q0 o) X% O% ] 若二人都互相检举(互相“背叛”),则二人同样判监2年。+ W4 h; _. r3 Z" D+ Y, m, j+ M
( M/ i4 j5 p' I& w( `* \用表格概述如下:1 i- _9 B8 c. T
4 Q% w7 ^) C' G
甲沉默(合作) 甲认罪(背叛) % V+ Y. W2 }/ i# W8 {1 r( _8 I
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
/ v% F+ ^8 |9 V, m5 `3 A% v乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
! B4 t0 M" ?+ j# y8 b7 {, D' t+ ` b
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
% U3 z( R7 y! I J 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 1 r% r) N- \! n2 x( A. L
若对方沉默、背叛会让我获释,所以会选择背叛。
( L6 { E m8 w3 t$ n 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
" N! W: l, o1 @/ i8 ^3 T 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
S# o7 z1 ], D* v% I$ M 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 9 \9 [# X* N+ @0 V6 ]! L; n
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。. K) p- p9 a$ n9 p, y4 B
[编辑本段]二、智猪博弈理论9 j* H2 P$ c3 {4 P; F" K. ^
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 2 A8 J7 k) f" x' x& u
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
: r4 O c% x3 ^ q 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 % y4 d9 Q7 n2 a. q2 _( t. P
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 / n( A& X' X2 R9 k
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
* @* ~+ Z# }7 v8 K& T7 y 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
& u, h2 O* @2 B/ V( h1 s. g 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
$ ?7 p! h: _3 l$ f7 r6 Y1 p r
: k0 V$ w$ P% `- |/ d, x三、关于企业价格策略
& R) e% z4 H# E6 \7 F
5 ~, s6 i' L% B3 g7 t5 q1 q& D& a- ]; r ) G. y3 j; H9 R* W
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ( `) l# F2 E0 y5 y+ ?# C) ~- Y
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);/ m% ?8 \7 d) [7 _$ e
以下三个定义:
: a# k" c" O, N 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
4 `! m( M- G% ^$ H7 P) w e# s7 B, y 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
+ r- n$ n# D, r4 c; Q# [( R 所谓的双方优势策略则是指双方利益总和最大的策略。
C5 d: P0 J. B. Q4 n! V% t[编辑本段]严格优势策略举例分析
$ D) M* W9 T/ @6 }1 `6 i* w 一、经典的囚徒困境
% M b* G( h% X+ h3 v% O3 z 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
$ b& \# V: k- x. n: t* i( u7 J 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
: g' O8 c$ s1 g2 r1 x. n) q 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 7 t/ j. g- L4 o
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
1 }) \$ E, M4 {9 C( e' l! A 若二人都互相检举(互相“背叛”),则二人同样判监2年。9 h. B& H1 h, b# l
. ]+ y2 x! u1 c5 p3 q }, ^7 w4 F
用表格概述如下:
/ O! a6 p/ c3 S8 S" v3 I1 ?4 C* p9 E" X0 j9 \! Q+ H
甲沉默(合作) 甲认罪(背叛) ! x9 {. m- H% F# z
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
5 E2 O N1 ]3 Z( ?2 p3 I/ p乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
$ |7 u- g0 j$ u8 X6 w! m a9 F0 `1 h
# k0 `; W2 W) G* c+ j 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
* H0 `; \$ d9 O, h/ S0 S 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 4 S: Q5 }+ p0 s0 e' t7 L
若对方沉默、背叛会让我获释,所以会选择背叛。
- j+ {& V- |9 _* H4 S8 `9 b% ~! | 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
2 N! G- k( \4 l! H- l; S9 y' x 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 % r& r* x, {& U; F: i
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ; [5 v; i' U, r) v2 u
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
6 Y+ i* j# a6 b- R* D[编辑本段]二、智猪博弈理论
- l1 z- y; X4 O4 B$ | 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
3 b# c* d2 w* x 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 / S; |4 p' x0 q5 \0 l7 y7 ~) I1 q
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ' b$ N8 H, P* g) m! c
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
: R% i7 X3 F C2 i. j4 ~% z “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
3 r# I% d1 F( L' e* p$ k 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 1 c7 L) L% l% Z0 _* M4 q. c
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
' w3 c9 {( @" z
( v# J8 D% e2 S9 d三、关于企业价格策略, c; v9 J \# A, g( S4 O
a( @$ @( n* |: S) S 3 N( ~4 k! h: d+ V' m6 Z
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
; x) k9 |! Z- U3 m1 e 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |