关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
- E) `7 W' F6 e) d" d0 v3 t+ |! s- t3 e$ l9 M
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
0 n: b0 _* N& U& ?  }3 @  F  以下三个定义:8 b: |% p! o7 W" r" Q
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
! h1 h2 p3 H% a; C  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 & j1 [" x& W3 @5 O. W2 v+ s
  所谓的双方优势策略则是指双方利益总和最大的策略。  / X3 m( @$ H" o. M1 z
[编辑本段]严格优势策略举例分析+ R- b- `" p  d7 V# K
  一、经典的囚徒困境
. h3 [. f% ^! i' R4 a  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 9 y& ?% m( z9 G5 ?3 \
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 6 A" u4 p7 V( r4 Y' m
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 - Y' s7 G6 L. E
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
' A" f9 R- U. {5 [6 U0 H9 T9 y2 P, p/ H  若二人都互相检举(互相“背叛”),则二人同样判监2年。1 j- f8 R% _( _/ v7 X3 [
  5 [+ v3 k" I. a7 f7 J+ a' d
用表格概述如下:" I% O$ F- l0 ~% B& I( _7 R! G- c
8 b0 w+ N1 f1 x' D8 h) c
    甲沉默(合作)  甲认罪(背叛)  9 K9 E3 Z9 ^2 I3 D9 f' A, r
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  & b' y9 @5 r# [
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
+ d# Y$ d- ^- x" t+ v: H& S8 p
. O: `! C* c# n# }% o0 P  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
, s3 _# a$ w/ [, t3 D: n  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ; Z7 O2 q2 J% C+ U! h, p& c# n9 Z
  若对方沉默、背叛会让我获释,所以会选择背叛。 8 ?- s$ T3 d8 D4 e" L4 V
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 4 G. R% h, u- y: ^
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
/ v; I2 J- d, x( Q  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ; b: G8 \3 W  o) L: p5 ?
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
! K& v( u+ l& z/ p5 W5 ~  e[编辑本段]二、智猪博弈理论* K, N/ J' f8 `" S4 ~' q
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 / ~5 l! f$ A8 n9 b7 }
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 $ z4 c, Z6 f" P# u5 i# p# j
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
. P  {. Y4 i  j! {  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 $ _% ]2 }" b0 U2 b" `5 s
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
  W$ Z# `  c8 a0 N& `! Q  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
) e1 Z: B3 Y: u& t* G; x4 h/ D  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
* l/ P" b" d/ V4 q! s  
0 V% r. F& b: W1 K# e6 I& D三、关于企业价格策略
# m* E9 z( L/ E  ?+ k9 `
" S$ _& x" U* k" H; q! z+ x  
0 m) J  Z0 m* D2 m, F' A. ]  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
/ ]' {" S# V* c  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
% Z2 _5 s4 U- }+ y5 I' r; u: d  以下三个定义:
8 g: X4 r* a' {, Z% \  N  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
# g- R3 g! z" U/ S; O. w  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
% R8 v) W8 L* ^3 x4 t' |7 q  所谓的双方优势策略则是指双方利益总和最大的策略。  ) [7 ^7 n! o5 C
[编辑本段]严格优势策略举例分析
8 K) y$ d  g$ O; Y# {) I& F  一、经典的囚徒困境
, O6 G( I- j% Y/ m4 i  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: , v) e8 [; t  B8 s
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
( p" D, }# P/ q  a( L- m  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
% W# C- N" N& |3 U6 }: s6 t9 U! W  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 1 {3 t- u% F( o! Q, U
  若二人都互相检举(互相“背叛”),则二人同样判监2年。/ `* f# T* m  d( ]
  
6 @6 [8 V3 s/ z4 x7 a用表格概述如下:+ |# ~2 x0 v% L  _

0 v/ A( O3 Z$ W1 r: ?" p    甲沉默(合作)  甲认罪(背叛)  7 B5 M) v& R  u5 T
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  8 W9 s6 t8 m7 L* ?- n2 T3 |5 X" o
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  9 n+ I, }1 X7 a/ r  ]  {
. X: D: Z9 D1 j9 A: v1 W6 T5 o" E# a; o
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 6 ]" j) C2 V' r, L; b# |! l
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
6 ~: J3 Q* @* K( ?9 Q/ _; s  若对方沉默、背叛会让我获释,所以会选择背叛。 & A& a2 y5 _% N: @% T) X4 m# m
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
" p" m% k3 C+ f/ Y2 d  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
- ]# p& C# n& E6 D  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ) N) o( @, k, I# S1 i
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
( I  r+ i1 m. k" P* u[编辑本段]二、智猪博弈理论3 Y! J4 C- O( ?% G/ _! M1 ~9 F% @
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 8 I# e! L7 W- R$ O& \  V
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 3 M. [' j2 S! T6 \# U7 `
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
8 ?* Y! h1 {0 e% o, ?  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 1 @' J3 q2 F. J4 _& t6 r( f
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 % Y3 D! M: q  Z! |. O- n2 H
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ( s9 L" G0 J; h0 ^- X. j
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
! H. {+ r4 L; o& e7 ]& [' f  
; m6 j! k& r8 D: t三、关于企业价格策略. z9 ]# [2 T0 f  D2 g
, v* c8 Q4 V. o  z
  
5 E9 ?1 k& p8 L7 J+ N  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 7 z# M4 G/ [8 |( t
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
& ], j3 p4 d( Z3 Y; \5 y( I9 T  以下三个定义:
" c8 s: m1 t$ q5 y, R1 r  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 : l' l  m6 T0 U
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ' e/ o$ C; R- X: \
  所谓的双方优势策略则是指双方利益总和最大的策略。  5 I9 \$ g6 l9 S5 ]% Q7 e" C
[编辑本段]严格优势策略举例分析
$ y4 c. k+ A% Z1 F  一、经典的囚徒困境 ) C" x% z) R1 u
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 1 h% O0 s9 b/ H1 @" m) \7 f
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: # Q3 c9 q1 d/ Q9 ^
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 . `" c, H3 n3 O/ ~
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
% n/ P& q0 o) X% O% ]  若二人都互相检举(互相“背叛”),则二人同样判监2年。+ W4 h; _. r3 Z" D+ Y, m, j+ M
  
( M/ i4 j5 p' I& w( `* \用表格概述如下:1 i- _9 B8 c. T
4 Q% w7 ^) C' G
    甲沉默(合作)  甲认罪(背叛)  % V+ Y. W2 }/ i# W8 {1 r( _8 I
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
/ v% F+ ^8 |9 V, m5 `3 A% v乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
! B4 t0 M" ?+ j# y8 b7 {, D' t+ `  b
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
% U3 z( R7 y! I  J  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 1 r% r) N- \! n2 x( A. L
  若对方沉默、背叛会让我获释,所以会选择背叛。
( L6 {  E  m8 w3 t$ n  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
" N! W: l, o1 @/ i8 ^3 T  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
  S# o7 z1 ], D* v% I$ M  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 9 \9 [# X* N+ @0 V6 ]! L; n
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。. K) p- p9 a$ n9 p, y4 B
[编辑本段]二、智猪博弈理论9 j* H2 P$ c3 {4 P; F" K. ^
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 2 A8 J7 k) f" x' x& u
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
: r4 O  c% x3 ^  q  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 % y4 d9 Q7 n2 a. q2 _( t. P
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 / n( A& X' X2 R9 k
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
* @* ~+ Z# }7 v8 K& T7 y  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
& u, h2 O* @2 B/ V( h1 s. g  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
$ ?7 p! h: _3 l$ f7 r6 Y1 p  r  
: k0 V$ w$ P% `- |/ d, x三、关于企业价格策略
& R) e% z4 H# E6 \7 F
5 ~, s6 i' L% B3 g7 t5 q1 q& D& a- ]; r  ) G. y3 j; H9 R* W
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ( `) l# F2 E0 y5 y+ ?# C) ~- Y
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);/ m% ?8 \7 d) [7 _$ e
  以下三个定义:
: a# k" c" O, N  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
4 `! m( M- G% ^$ H7 P) w  e# s7 B, y  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
+ r- n$ n# D, r4 c; Q# [( R  所谓的双方优势策略则是指双方利益总和最大的策略。  
  C5 d: P0 J. B. Q4 n! V% t[编辑本段]严格优势策略举例分析
$ D) M* W9 T/ @6 }1 `6 i* w  一、经典的囚徒困境
% M  b* G( h% X+ h3 v% O3 z  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
$ b& \# V: k- x. n: t* i( u7 J  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
: g' O8 c$ s1 g2 r1 x. n) q  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 7 t/ j. g- L4 o
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
1 }) \$ E, M4 {9 C( e' l! A  若二人都互相检举(互相“背叛”),则二人同样判监2年。9 h. B& H1 h, b# l
  . ]+ y2 x! u1 c5 p3 q  }, ^7 w4 F
用表格概述如下:
/ O! a6 p/ c3 S8 S" v3 I1 ?4 C* p9 E" X0 j9 \! Q+ H
    甲沉默(合作)  甲认罪(背叛)  ! x9 {. m- H% F# z
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
5 E2 O  N1 ]3 Z( ?2 p3 I/ p乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
$ |7 u- g0 j$ u8 X6 w! m  a9 F0 `1 h
# k0 `; W2 W) G* c+ j  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
* H0 `; \$ d9 O, h/ S0 S  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 4 S: Q5 }+ p0 s0 e' t7 L
  若对方沉默、背叛会让我获释,所以会选择背叛。
- j+ {& V- |9 _* H4 S8 `9 b% ~! |  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
2 N! G- k( \4 l! H- l; S9 y' x  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 % r& r* x, {& U; F: i
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ; [5 v; i' U, r) v2 u
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
6 Y+ i* j# a6 b- R* D[编辑本段]二、智猪博弈理论
- l1 z- y; X4 O4 B$ |  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
3 b# c* d2 w* x  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 / S; |4 p' x0 q5 \0 l7 y7 ~) I1 q
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ' b$ N8 H, P* g) m! c
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
: R% i7 X3 F  C2 i. j4 ~% z  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
3 r# I% d1 F( L' e* p$ k  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 1 c7 L) L% l% Z0 _* M4 q. c
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
' w3 c9 {( @" z  
( v# J8 D% e2 S9 d三、关于企业价格策略, c; v9 J  \# A, g( S4 O

  a( @$ @( n* |: S) S  3 N( ~4 k! h: d+ V' m6 Z
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
; x) k9 |! Z- U3 m1 e  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )