关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 % g) B& l# \8 J) s8 h

; \2 o& L; U* B7 r严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);8 X, j( U* E( }* t$ Y& a3 }
  以下三个定义:1 m) A: V6 d7 g$ V
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ( a7 L. ]( J8 r  |$ n
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
6 ^/ r9 {& g2 V2 H  所谓的双方优势策略则是指双方利益总和最大的策略。  
- r, [& A+ T) D5 P, n6 U; R7 r; n8 H[编辑本段]严格优势策略举例分析
  ~; i5 [- @" [2 I  一、经典的囚徒困境
; a; |1 |3 J' F: s  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ! O$ ^1 O  S- X" V% |" ~
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
  K# O2 \$ i( b& D. D0 m# d  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
$ Z7 k0 {* [: X( _  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
5 z' t( q- V0 T8 M" X# u  若二人都互相检举(互相“背叛”),则二人同样判监2年。
  _$ f% S  Z, e; }  R  ; V3 n, _# v0 P5 B
用表格概述如下:8 |8 v9 d8 R. ~) [& h

5 _; ~& l5 [/ P* g1 V    甲沉默(合作)  甲认罪(背叛)  
$ ~9 ^( x" B/ l2 i6 G# |乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  $ U' m0 [! b4 O0 A; X
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
- }5 T1 y2 U; n+ d3 O" G$ i6 ~* B9 H1 G+ _
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
! [' P  n% G  U- I: J2 t- |  \  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
- F/ [# U( \7 p- |$ I! E  若对方沉默、背叛会让我获释,所以会选择背叛。 . z) V/ g2 i/ b* |2 I4 D
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 # V! ]! G) _2 N/ \& @; t: }' R. z
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ! O" Z0 O$ G' p) Q% p$ c/ e5 g
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
4 L, i' C" {4 v) G- U" R; ?1 V* K1 X0 N  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
: B9 U8 x1 X1 p+ @( l( V  I[编辑本段]二、智猪博弈理论* k9 Y: Z6 @8 q! }% ~) q0 {
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
& ^' V9 x. R% F8 s  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ; M$ c/ n6 N0 T3 T5 d' ?
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
; |4 Y) y3 k5 y  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
; Y; `; d+ E* _0 V1 ^  i* e" u  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ' r* w  i: j# x: N4 a
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
; E2 W9 J/ k& A) S  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
/ \  y  b7 V/ z% k4 C. @0 y! ~: t  7 F% \2 H4 Z2 [6 }$ Z" U  q
三、关于企业价格策略* H# W. Y$ V2 B+ _' t+ V8 S8 u; O7 e- h
- L4 x# s# r9 k8 _* E8 F
  . v1 U, e( H- q7 F
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
+ r  H1 b8 M! X' a1 u  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
* h0 f; U+ [) W1 p  以下三个定义:
) d- R0 r5 B6 O. l2 ^7 V) g  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 7 ]8 e) C1 {$ `0 C( R2 O% m+ Y
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 * z7 Y$ V; k; q
  所谓的双方优势策略则是指双方利益总和最大的策略。  6 Q" N, F& s  R. P
[编辑本段]严格优势策略举例分析( P2 S3 `2 z% c' {8 n1 e# Q
  一、经典的囚徒困境
6 t/ o: L( V. T- \6 F8 y6 u# i- w3 U  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ) w# |0 b+ _! o. Q% @( a. m
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: " ?! K3 k- H1 L& T- \  b( }* P
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
/ D' O0 m) I# G$ `  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 & r5 X0 d: {( h. a; B: Y+ S5 x
  若二人都互相检举(互相“背叛”),则二人同样判监2年。& z6 e% x( \+ A3 E* j$ B
  7 m/ U) H! C2 o0 k5 B$ s5 t% g3 K
用表格概述如下:3 h, [4 N3 R7 e$ R( x1 h% p7 e, j

2 K4 F9 C: U) R3 Q/ Q    甲沉默(合作)  甲认罪(背叛)  
; R4 o3 P& j8 g  G& P乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  * `0 e; l5 l% \: S4 Y; ]) L# D  w
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  5 S6 M- y( q, F; }7 X2 l2 R5 R

4 K  h8 [! \9 c1 F4 k, d  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
2 {) _; _' j# ?; I8 k  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 8 y+ [& k& q- m  \* T. U
  若对方沉默、背叛会让我获释,所以会选择背叛。
! s2 @( P: o1 E$ \7 d5 a4 p1 \  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
! Y) T/ M3 @8 k  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
" M0 c/ A, p9 Y" I: [  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 - A& V* q/ t' L
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
4 y; p2 b* M* Q) b9 G, R[编辑本段]二、智猪博弈理论
5 o) Y# d7 C1 }1 W  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
0 c' K( r* j) k  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
5 I  c6 \0 p7 `/ {7 Q( z  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
3 T' y0 P6 @- M. Z/ z5 |1 F1 v7 p  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 % s# ?8 J0 R% L  L3 e, Z1 \, v
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ( V) b( G) L: X1 b
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
  ]" v0 {" v! [# g- I! P  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
( X  q: v* H- ~4 ~% v  6 k9 y( K& B; K  D4 J& _- c2 U
三、关于企业价格策略9 l( I/ p6 D  R4 h/ v
/ j2 z- v, [+ N8 }- G
  
3 ^2 P4 s& [' }; x6 J8 P& w7 p  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? & @, K7 s; H7 t3 c8 v
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);4 J; }8 L) \$ E: A7 S4 i$ S
  以下三个定义:% o. |; e/ j" P! q/ Y
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
8 j5 H* {1 `! k2 q( R  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
. q) ^: j9 ~3 y/ R. o  所谓的双方优势策略则是指双方利益总和最大的策略。  
. i' A* Y, ?; i& _[编辑本段]严格优势策略举例分析8 t1 ]9 w. F5 a" f9 t: }4 C
  一、经典的囚徒困境 1 p5 y/ R8 B7 @: D: m
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ; W( r* K4 k+ n( x
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: & O  v8 ]# m3 n; p# s  g5 x
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
* D  y0 I, v: v+ @, m9 z  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 1 A+ p6 ~+ J* O7 e4 K$ X' V- r
  若二人都互相检举(互相“背叛”),则二人同样判监2年。# @/ T2 u- \7 p  Y. v# e2 Q2 [
  
& _' x( d) F9 n( C; ]+ q/ H& X用表格概述如下:
7 _5 d4 l$ E0 g* z9 A$ p1 G/ n7 s5 q$ Y. B* g# ?% t& d
    甲沉默(合作)  甲认罪(背叛)  ' D" T, Z( C0 ]& W. B( P
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  : ]% S: j# N+ D# @5 B9 s' r7 n$ l
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
+ Y* n- K4 F5 E8 e9 v+ t( ], a3 M. x8 t' o' `; p- t
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 $ F5 t) e9 H4 t
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
, B/ D1 C$ B. S! v% d" U" m  若对方沉默、背叛会让我获释,所以会选择背叛。
, \6 [" g9 v* X) Y. l  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
3 f5 p$ E  h+ o5 W  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 + l' J( {) ^1 p( A3 V* c
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 % @6 E) N( J7 x/ A
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。# M7 n1 j* W5 Y& ?) q
[编辑本段]二、智猪博弈理论: w3 J) n  d9 B2 h6 n
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 - A9 k% g3 D/ C4 b. V1 p& `+ K
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 % r3 p) {0 G" o' c8 M% I
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
- B. n! h5 {7 O: r  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 3 b- u* _4 I! r) z- x# `; R
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 + r2 b; m: g" O2 ^
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 & Y6 O* s/ B4 ~# H
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。. V* k7 d9 {" R& F2 a5 B
  9 M6 f% R, F* G6 g' o( C
三、关于企业价格策略
1 H0 }/ U! J$ `( R# Y% X  |$ P2 @$ c3 m& K' V
  
2 T& e" n" u5 x: H  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? % x, M/ A. ]" [0 O& k& b0 L
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);% J5 z1 M. {7 a/ v
  以下三个定义:0 p, l6 k% Z% h8 y" x
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
% w# O: e2 N- c6 D& g  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 8 n: x! C6 J3 d' c# @* U% Q
  所谓的双方优势策略则是指双方利益总和最大的策略。  ) S( m0 A5 G# ]0 x. D! ~& j
[编辑本段]严格优势策略举例分析# S0 t: r$ U  l7 W( h/ l( x
  一、经典的囚徒困境 7 p1 M4 s7 Y. c) t9 ^5 W
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
' _6 K& t% D5 X) R  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
% j, c  H0 Z, j  Z3 p  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
& q- d$ S# f! k9 ]; [3 S  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
9 J8 R( `5 K  M2 F8 V$ P1 R5 \  若二人都互相检举(互相“背叛”),则二人同样判监2年。
# g6 i( q' \3 @3 C/ y+ A  
9 U- p+ K7 a4 k- j9 g用表格概述如下:
2 I# j3 {; Y8 K# p, p& \/ g
& A& v' \' p7 g    甲沉默(合作)  甲认罪(背叛)  
" H& W$ s2 o2 b: e& I乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  : w( g9 W# ^! r& _! [
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
6 G; Y1 b. j0 l' {8 F3 T: Y+ Y- M9 [+ w/ l
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ; X& d$ W* h! K& x$ t: G
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
7 y) r; }; v" f# f. r% V  若对方沉默、背叛会让我获释,所以会选择背叛。
+ @1 Q5 K. S+ z* m- O4 P+ L; w  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
- H3 f- |4 u: J0 ?  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
7 {  ~! |3 e3 A  \" o/ s  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 3 q+ X: R" S! Y' r, L
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。6 ?5 s, T+ {/ _( z9 Z! J0 Y* m
[编辑本段]二、智猪博弈理论8 X2 ^; ~" k5 H7 s0 p3 L
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
& p5 o( V5 O( ]6 L" s  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
# `/ U8 D! I  t& s: F6 O6 c  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
3 o5 Q! x! t. H3 Y  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 8 U$ X4 V, d. u; O) v
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
8 b" f. H( j) ?+ Y: O' C% ?0 U  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
+ L9 S2 O: P: |: A, j5 y4 R1 ]  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
( F& P* a+ B% D0 q* i9 P  2 M! o* s" T9 j6 W$ a' H7 X& j
三、关于企业价格策略
% W4 J$ B2 w3 I- Z7 j( y  X5 M3 ^' `7 }/ \
  1 o; t+ p1 }% u. |
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 9 {1 k- y% T/ n: B
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )