本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 , C! M6 h% Q3 g# M% x
; _+ p) [# s3 I8 C严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
$ c f- H* O! A2 F3 j6 X 以下三个定义:( @4 B" b( l+ u7 w
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
L9 |1 Q0 I$ W4 D( Q+ k) d# ^ 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
" S/ u* t* ~$ k- w 所谓的双方优势策略则是指双方利益总和最大的策略。 , o6 V) x* Z' P
[编辑本段]严格优势策略举例分析- z# @% c k6 S5 Q
一、经典的囚徒困境 , b0 \& z) F! N. l5 l
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
( h0 [2 n: `( L% Z4 B& v# f2 a) k! B 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
4 q/ c0 h0 L, t0 ^9 K 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
9 ~# ]4 v' I1 L 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 : H( g2 n0 U. q, n- ?
若二人都互相检举(互相“背叛”),则二人同样判监2年。
; m w+ E: q. Z * Y. J' w |7 ^( T# z3 ?: Z
用表格概述如下:" b/ f# _* K# c5 h7 p% v7 {
8 T3 W L7 }; N6 L 甲沉默(合作) 甲认罪(背叛) 9 V. n2 G5 l0 Q
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
4 s9 q3 m( q8 Y9 a% m5 U' Q/ c1 N乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
% ?) S* Z, b9 c8 n" ?4 W6 H5 u- e; F, h& ~' M7 x1 |; p
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
; @: a g' e# D" f 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 8 T; `6 b7 R3 H/ C# e8 c, y
若对方沉默、背叛会让我获释,所以会选择背叛。
+ s9 p0 N; j7 \1 y$ J 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
. d! g: b& @0 ~: A4 g- T 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
9 X$ l4 h! M; X- ~- M' ?+ x 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 . A3 P0 n6 i$ ^- i5 o3 W9 Y4 q
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。' x5 C6 h: f% ]/ ]% W3 E. W$ k
[编辑本段]二、智猪博弈理论
* _7 B. s' s" }# q- k: N+ s 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 8 \0 Y0 G7 g( U7 W4 d, q J- |
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
' H9 H5 a5 e& C ]5 c+ v1 R) U7 T 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 3 _! s* f2 V. Z% `* j
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
6 T) D: A# P0 a- k2 C) { “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ; l N3 o* l z3 Z9 K4 f
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 + t. ?+ \' G& e% E
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。, M; ]0 t0 e9 u1 \* P, P; A
^; `& U7 i o8 U6 k/ v
三、关于企业价格策略. n, z- L5 l1 @2 A% |
2 a/ G; _; x- ~) K5 j* v: m
3 {. q7 Q* n: v1 `5 F8 d 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? - |% S6 A8 V- t% P$ p7 M
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
$ B) f/ i5 }: m1 Z 以下三个定义:
. D& a9 d) T8 s; s5 ^+ }. Y 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 + ^! H0 B( x/ ^+ u( \
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
' k: M% m: H' }+ l3 \9 s! N, f 所谓的双方优势策略则是指双方利益总和最大的策略。 ; F6 x) V) y1 k" X: l
[编辑本段]严格优势策略举例分析
4 F I9 [$ U( R0 B, t# P8 }& ~/ S 一、经典的囚徒困境
7 H V" g1 N% {3 c$ J7 ?4 V 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
D% M* t8 j+ f5 {$ Q3 E$ a 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
! D9 B; U" W+ m z% d) z 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
) u6 D7 f4 i7 A- R0 g6 @) x 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
: K7 a' f$ }" K# l 若二人都互相检举(互相“背叛”),则二人同样判监2年。. i$ _' t) x# c3 w8 r
4 K! p1 b/ z. x: G$ {/ O, D( r
用表格概述如下:
2 I3 b& l* I7 F/ ^3 b" ? I: c$ C1 a" y+ V. C, A" A
甲沉默(合作) 甲认罪(背叛)
2 y& w+ C- J, V0 |+ Z' Y. X. d乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 : |! H6 o: E# `4 A. w. U! z9 I2 C
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
6 L3 \3 G: i2 R# |
+ N- _+ A2 D: J) Q( `' h 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 7 u1 S# J8 J G" h: n, X7 {
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: , X! F. m, F: H4 i% Y
若对方沉默、背叛会让我获释,所以会选择背叛。
, b4 c7 M4 m- Z' [; k1 s2 K 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 3 a, \1 K1 ~3 v
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 $ a# }* b& Z' B$ v7 J: ~3 g* z6 B
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
& \6 b' C3 ^3 ^: i 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
: m0 v/ i- f0 i0 N9 ]2 X5 s6 e. k[编辑本段]二、智猪博弈理论
* L/ T Y( l: ?. Z4 l& Q( Z5 P+ { 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
6 Q# m H6 w! z7 J5 G2 o3 l" P 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ) Y9 e; @4 t- T( a, Y
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 8 t' d9 F# D5 Y7 I% z
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 6 l; T8 h) n; [7 C. g5 R% n
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ' w# O/ K( c0 [% N7 [) [
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 1 C/ E+ f3 q$ h4 ]$ T+ |
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
* @4 P9 w% Z) G. v) C 7 A& n& ?- }% Z
三、关于企业价格策略2 A# C* T+ V8 Q7 _
) v7 V" K2 {" u: @- N, } 1 a/ @! x2 k* W5 ?
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
7 q0 t1 O. s6 V( r# o, l 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
s( x9 N( q8 U2 ?; ~) E 以下三个定义:
( o2 S7 K* n# G% U% q6 A! |. W 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 + u- M; X' q, j
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ( U4 y" o; o$ m0 D
所谓的双方优势策略则是指双方利益总和最大的策略。
9 {8 A. k5 |- K( C9 U |. _[编辑本段]严格优势策略举例分析1 [+ @% Q" z. |! Y7 C
一、经典的囚徒困境 . P; r% T4 g4 E( L
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: $ j2 V$ z; k5 h9 s( n' h# p
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 9 H6 R7 O' q5 W1 c
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ' q6 b H1 K8 j A, s; I0 A
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 4 p/ d$ p; q( U! @+ R% W
若二人都互相检举(互相“背叛”),则二人同样判监2年。
" p o! R1 s+ n! @9 {# b) O. h # o1 Q5 \" G% g1 u
用表格概述如下:
2 k; P; C f w. N4 C# o( H8 v0 B4 G
甲沉默(合作) 甲认罪(背叛)
* |$ a8 @* F' U. L, n y乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
| l; k6 B1 z1 \3 W* C乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
( `* x7 i. A e% ]2 p: L9 N" {# O S! i0 a/ g' c1 M L
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
& I6 k6 W" Z5 u: j0 s 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
C1 g6 m, U" U, J/ i 若对方沉默、背叛会让我获释,所以会选择背叛。 T3 c. k0 B/ B l7 A0 ^' o
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
0 K. V9 F* c9 e' P9 g& i8 e 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 0 b6 {* }/ m3 L
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
, r1 ` z" Q) a3 U, D 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。8 c( F8 g! \( U% Q% v( O
[编辑本段]二、智猪博弈理论2 _ F. `3 d/ E- u L: p
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ( {% P, K5 n! n) T' M$ w3 V% L, A
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
J5 n. H* N u: Y3 p- F3 } 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
; Y q- M$ J+ K h* E T$ _ 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 * ]% G B% M) g$ z7 y* O8 }
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 - w7 x4 N0 j! o: k, ?
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 1 N8 I' {; s9 o
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。6 v; v/ Z$ t5 ]8 ?
" y7 e7 t( T" ^, Y: ^1 Z
三、关于企业价格策略+ }, k) N- V/ l
, Q. H+ ^. M" u# x1 Q8 H6 a
! V$ {8 r% o- F) A
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
$ z9 I! ~" X# n+ s9 I 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy); `: G. \) ?9 {
以下三个定义:+ x# a4 Z! T# O: Y
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 $ B) Z5 g/ D3 T/ x7 e
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 : T2 z# z! o1 l
所谓的双方优势策略则是指双方利益总和最大的策略。
4 V$ ]1 e5 n" Q/ f. b[编辑本段]严格优势策略举例分析
7 F- D' k2 P3 C. [; g2 G0 ?' p 一、经典的囚徒困境
2 p- S4 p2 L8 s 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
2 e6 K) L, Y+ r B0 E5 ?: s6 H2 _, L 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: * g% W5 K$ ]5 R2 u8 ?2 R( M% @0 S
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
! Y: V1 z. X* I6 T6 o6 p. F 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ( k2 q8 d, [, y; }) @* q6 d3 P/ D1 w0 Q
若二人都互相检举(互相“背叛”),则二人同样判监2年。& ^, f' ?1 o& N6 k- m# R
7 j7 X9 V) \8 [. H用表格概述如下:2 Y3 l7 X7 M/ _. k: {# v( ~6 r: I6 l
5 R; v+ v1 E' _1 z1 V8 ]5 J 甲沉默(合作) 甲认罪(背叛)
/ Q/ l/ D9 x/ T+ c$ l3 ~& q+ G6 h乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 / V! F9 ]+ [; h) {( r A( Z* u
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 8 ?5 {* k4 @. G% ?! q: D, w
( j: m2 I8 h3 x
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
' P, j8 {* J- d: q 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
( a; J' Z8 Z; I 若对方沉默、背叛会让我获释,所以会选择背叛。
; d( C% j3 O0 n 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
( n. w" I3 j' J( v9 g; V9 G$ o 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
( ?8 h( O# C1 j/ Y2 e' r$ n% U6 X# v 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ( h# O" W# K' T0 ~. q6 I F
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
3 y% G6 U: z" l b9 e# c[编辑本段]二、智猪博弈理论! _6 @! }5 P7 @: n; V" C/ T
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
; a- d2 r n* P. u, c0 G$ a1 _3 y* O5 d 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
3 s1 k" t3 b' V! I9 e: j 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
- V8 Z# h2 ]$ i B0 Z# j( x 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 2 f+ x" D6 o% A
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
8 V# \( z* [. n4 D, g 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ' j3 }/ E1 J* r9 }" V( g5 w4 R
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
% I1 {* f% p: f: U# A4 {
7 r0 H. Q! v' v3 ?) J8 f5 o( H三、关于企业价格策略0 K; Y9 D1 |. h) _" O
/ {2 [- V0 k5 W7 V" C5 @5 ]
1 B% f( e& ~. {4 ?" z 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? # t6 Y- T0 k0 Z; ?; n
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |