前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇博弈論的基本原理范文,相信會為您的寫作帶來幫助,發(fā)現(xiàn)更多的寫作思路和靈感。
關(guān)鍵詞:獨立董事;博弈
一、引言
獨立董事指具有完全獨立意志,代表全體股東和公司整體利益董事會成員。我國絕大部分上市公司按照證監(jiān)會的要求,在公司董事會中引入了兩名以上的獨立董事。經(jīng)過近幾年的運行實踐,業(yè)界普遍認(rèn)為,雖然獨立董事在一定程度上改善了上市公司治理結(jié)構(gòu),但獨立董事的作用沒有充分的發(fā)揮。獨立董事缺席董事會會議、對公司的重大交易聽之任之、做重大經(jīng)營決策時“搭便車”等現(xiàn)象普遍存在,有關(guān)實證研究表明,我國獨立董事與公司業(yè)績只有非常微弱的正相關(guān)關(guān)系。獨立董事的作用不能充分發(fā)揮,固然有其各方面主觀或客觀的原因,但獨立董事在與被監(jiān)督對象――大股東與經(jīng)營者博弈中處于劣勢則是問題產(chǎn)生的根源。本文運用博弈論的基本原理,剖析了獨立董事制度失效的原因,提出通過完善獨立董事制度,改善博弈雙方的信息和支付,并由此改變博弈雙方的行動和戰(zhàn)略,充分發(fā)揮獨立董事的作用。
二、分析方法
博弈論是研究多個決策主體的戰(zhàn)略選擇問題的理論,其中的核心概念是納什均衡。通過對納什均衡的分析,揭示了一項制度充分發(fā)揮作用的前提條件,即制度安排所涉及的戰(zhàn)略是行為者最優(yōu)戰(zhàn)略的組合,也就是一種納什均衡。
從博弈論的角度來看,獨立董事制度的引入恰恰是資產(chǎn)所有者(股東)與資產(chǎn)經(jīng)營者(公司高層管理人員)博弈的結(jié)果。原有董事會的失靈,破壞了原有的均衡狀態(tài),需要引入獨立董事制度,建立起新的均衡關(guān)系,克服董事會失靈,解決公司“內(nèi)部人控制”問題。
三、模型分析
本文用博弈論的基本原理,建立獨立董事與股東之間以及獨立董事與經(jīng)營者之間兩個博弈模型,對獨立董事的博弈行為進(jìn)行分析。
(一)獨立董事與大股東的博弈
大股東與獨立董事的博弈分為兩個階段:第一階段發(fā)生在上市公司在聘用獨立董事時,第二階段則發(fā)生在獨立董事被聘用后。因為上市公司必須聘用獨立董事,所以本文對第一階段的博弈不做分析,著重分析博弈的第二階段。
在此階段,大股東和獨立董事的行動策略是共同知識,所以博弈屬于完全信息博弈,又雙方的行動存在時間上的先后,因此博弈屬于動態(tài)博弈,即大股東和獨立董事在此階段的博弈屬于完全信息動態(tài)博弈。
基本假設(shè):一是獨立董事和大股東都是理論上的理性人,都追求自身效用的最大化。二是博弈雙方獲取的信息是對稱的。三是博弈雙方的收益包括經(jīng)濟(jì)和聲譽兩個方面。四是大股東可能存在違規(guī)與合規(guī)兩種行為,即其戰(zhàn)略空間為(違規(guī),合規(guī)),獨立董事在觀察到大股東的行動以后可能會對這種行為選擇發(fā)表獨立意見或不發(fā)表對立意見,即其戰(zhàn)略空間為(發(fā)表,不發(fā)表),獨立董事選擇行動后博弈結(jié)束。五是大股東選擇違規(guī)的情況下,獨立董事如選擇發(fā)表意見,會受到來自管理層的壓力如更換獨立董事等,這是給獨立董事帶來的損失Ip。同時大股東也會有一個聲譽損失Lr,這時雙方的支付函數(shù)為(L-Lr,I-Ip);若獨立董事選擇不發(fā)表意見,這時大股東與獨立董事可能分別獲得額外收益Ld和Id,但雙方的合謀可能受到監(jiān)管當(dāng)局的查處,假設(shè)合謀受到查處的概率為r,這時雙方的物質(zhì)損失和聲譽損失分別為Lc,Lr和Ic,Ir,此時雙方支付函數(shù)為:(L+Ld-r(Lr+Lc),I+Id-r(Ir+Ic)),在大股東選擇合規(guī)情況下,雙方的支付函數(shù)為(L,I)。具體的博弈樹,如圖1所示:
根據(jù)圖1的博弈樹,本文采用逆歸納法對此模型求解:在此博弈的第二階段,獨立董事是否會對大股東的違規(guī)行為發(fā)表意見取決于其收益,根據(jù)理性人的假設(shè),獨立董事會選擇使自己獲得最大收益的戰(zhàn)略。由上圖可見,如果獨立董事選擇發(fā)表意見,其效用為I-Ip,如果選擇不發(fā)表意見,則其效用為I+Id-r(Ir+Ic)?,F(xiàn)實情況中,我國對于獨立董事與大股東之間的合謀缺乏完善的查處機(jī)制,即r非常??;另一方面,獨立董事選擇不發(fā)表意見后,其所獲得的額外收益Id非常大,顯然有I+Id-r(Ir+Ic)1-Ip>I-Ip,即不發(fā)表獨立意見成為獨立董事在該階段的最優(yōu)策略。在博弈的第一階段,大股東同樣作為一個理性人,預(yù)測到獨立董事在第二階段會選擇不發(fā)表,其行為選擇取決于L與L+Ld-r(Lr+Lc)的大小,根據(jù)前面分析,顯然有Ld-r(Lr+Lc)>0。因此,此博弈出現(xiàn)惟一的一個子博弈精練納什均衡(違規(guī),不發(fā)表),即“雙方合謀”。由上面的分析可以看到,獨立董事能否發(fā)表獨立意見是大股東與獨立董事之間基于收益與成本上的理性選擇,是一套制度安排的結(jié)果。如果加大違規(guī)成本,降低合謀收益,將促使雙方的博弈均衡點離開“合謀”,從而促使獨立董事發(fā)表獨立意見。
(二)獨立董事與經(jīng)營者的博弈
在此博弈模型中,參與人是獨立董事和經(jīng)營者。經(jīng)營者的戰(zhàn)略空間是(合作,不合作),獨立董事的戰(zhàn)略空間是(積極作為,消極作為)。假定獨立董事積極作為的成本是C,消極作為的成本是0;經(jīng)營者合作的成本是YC,不合作的成本是NC。
在不同條件下,參與者的收益情況設(shè)定如下:在經(jīng)營者合作條件下,獨立董事積極作為的收益是R1,消極作為的收益是0;在經(jīng)營者不合作條件下,獨立董事積極作為的收益是R2,消極作為的收益是0。其中獨立董事充分發(fā)揮效用的概率是P,經(jīng)營者合作的概率是Q,即在此處引入“混合戰(zhàn)略”的概念。
當(dāng)獨立董事選擇積極作為時,其收益Ud1=(R1-C)×Q+(R2-C)×(1-Q)=(R1-R2)×Q+R2-C;當(dāng)獨立董事選擇消極作為時,其收益Ud2=0×Q+0×(1-Q)=0。顯而易見:Ud1Ud2時,Q(C-R2)/(R1-R2);Ud1Ud2時,Q(C-R2)/(R1-R2);Ud1=Ud2時,Q=(C-R2)/(R1-R2)。
當(dāng)經(jīng)營者選擇合作時,其收益Uj1=(R1-YC)×P-YC×(1-P);當(dāng)經(jīng)營者選擇不合作時,其收益Uj2=(R2-NC)×P+0×(1-P)=(R2-NC)×P。同樣有:Uj1Uj2時,PYC/(R1-R2+NC);Uj1Uj2時,PYC/(R1-R2+NC);Uj1=Uj2時,P=YC/(R1-R2+NC)。
綜合以上分析,如果經(jīng)營者合作的概率小于(C-R2)/(R1-R2),獨立董事積極作為的期望收益小于消極作為的期望收益,這將導(dǎo)致獨立董事消極作為;如果經(jīng)營者合作的概率大于(C-R2)/(R1-R2),則獨立董事積極作為的期望收益大于消極作為的期望收益,這將導(dǎo)致獨立董事積極作為;如果經(jīng)營者合作的概率等于(C-R2)/(R1-R2),獨立董事積極作為的期望收益等于消極作為的期望收益,此時,獨立董事在選擇積極作為或消極作為是無偏好的。
如果獨立董事積極作為的概率小于YC/(R1-R2+NC),經(jīng)營者合作的期望收益小于不合作的期望收益,經(jīng)營者將選擇不合作;如果獨立董事積極作為的概率大于YC/(R1-R2+NC),經(jīng)營者合作的期望收益大于不合作的期望收益,經(jīng)營者將選擇合作;如果獨立董事充分發(fā)揮效用的概率等于YC/(R1-R2+NC),經(jīng)營者合作的期望收益等于不合作的期望收益,此時,經(jīng)營者在選擇合作或不合作上是無偏好的。
四、結(jié)論及政策建議
(一)結(jié)論
通過分析,得出兩個結(jié)論:一是在現(xiàn)有的公司法人治理結(jié)構(gòu)下,由上市公司選聘獨立董事難以真正發(fā)揮獨立董事的監(jiān)督作用,獨立董事未能有效地監(jiān)督和制約上市公司的行為。二是獨立董事與大股東合謀問題,在現(xiàn)有監(jiān)督體制下無法得到有效解決。
通過對獨立董事與經(jīng)營者的博弈模型的分析,可以發(fā)現(xiàn)此博弈的納什均衡與獨立董事積極作為的成本C,合作及不合作條件下預(yù)期收益(R1或R2),以及經(jīng)營者選擇合作或不合作的策略成本(YC或NC)有關(guān)。換言之,博弈的結(jié)果能否達(dá)到預(yù)期目標(biāo)不但取決于獨立董事、經(jīng)營者各自的支付成本,很大程度上還取決于(合作、不合作)條件下兩種預(yù)期收益的差額(R1-R2)。因此,在進(jìn)行獨立董事制度的構(gòu)建時,對于上述因素應(yīng)給予足夠的重視,創(chuàng)造實現(xiàn)納什均衡的條件,以使制度的效用充分發(fā)揮。
(二)政策建議
首先,必須改變獨立董事的聘任方法。將獨立董事的聘用決定權(quán)交給證監(jiān)會,其行為將與上市公司無關(guān),有效行使監(jiān)督職責(zé)是證監(jiān)會聘用獨立董事的唯一標(biāo)準(zhǔn)。從獨立董事的角度看,盡責(zé)行為付出的成本小于回報,會最大限度地履行職責(zé),以期得到證監(jiān)會的信任和繼續(xù)得到聘用。
其次,完善獨立董事的激勵機(jī)制,刺激獨立董事積極履行職責(zé),多做貢獻(xiàn)。一是聲譽激勵。獨立董事發(fā)揮作用的動力來源于其維持自身聲譽的努力,在上市公司中表現(xiàn)出應(yīng)有的獨立性和客觀性,無形中將極大地保護(hù)和提升他們的聲譽,并由此產(chǎn)生相應(yīng)的收益,在一定程度上避免獨立董事與執(zhí)行董事之間的“合謀”。二是薪酬激勵。采取給予報酬和持股計劃以促使獨立董事更加積極認(rèn)真地投入工作,獨立董事在其從事的領(lǐng)域乃至社會上具有較高的知名度和良好的聲譽,必須有相對固定的薪酬以其心理上得到平衡。三是權(quán)利激勵。授予獨立董事必要的控制權(quán),如提名、審計、監(jiān)督、評價等。獨立董事必須具有監(jiān)督權(quán)、審核權(quán)、否決權(quán)。
參考文獻(xiàn):
1、張維迎.博弈論與信息經(jīng)濟(jì)學(xué)[M].上海人民出版社,1996.
2、施錫銓.博弈論[M].上海財經(jīng)大版社,2000.
3、孟明.獨立董事的激勵機(jī)制[J].企業(yè)改革與管理,2003(11).
4、張凡.關(guān)于獨立董事制度幾個問題的認(rèn)識[J].管理世界,2007(2).
5、胡金焱,丁士祥.我國上市公司獨立董事制度的博弈分析[J].山東大學(xué)學(xué)報社會科學(xué)版,2003(3).
6、林凌,常誠.獨立董事制度研究[J].證券市場導(dǎo)報,2000(9).
7、何問陶,王金全.我國獨立董事制度的實證分析[J].財貿(mào)經(jīng)濟(jì),2002(9).
8、饒玉蕾,李永紅.獨立董事制度失效的博弈分析[J].湖南財經(jīng)高等??茖W(xué)校學(xué)報,2003(5).
9、譚勁松.獨立董事與公司治理:基于我國上市公司的研究[M].中國財政經(jīng)濟(jì)出版社,2003.
關(guān)鍵詞:入行論;博弈論;思想;辯證
《入行論》全稱入菩薩行論,是印度那爛陀寺寂天菩薩[1]所著,所作年份不詳,該論典是是大乘佛教諸多典籍中較為重要的論著,正如索達(dá)吉堪布在《入行論廣釋》中說:“《入菩薩行論》是修學(xué)大乘佛法者不可缺少的論典。在藏傳佛教各派中,每一個正規(guī)寺院里的修行人,都會傳講聽習(xí)此論;而且已形成一種普遍觀念,認(rèn)為如果要做真實的修行人,必須精通《入菩薩行論》 ”[1]。佛學(xué)中將論著分為四類:言簡而義深、言繁而義淺、言簡而義淺、言繁而義深。其中最佳的當(dāng)屬言簡而義深的一類,而《入行論》正是屬于這一類論著,其中所闡述的內(nèi)容精辟而深刻,運用了諸多比喻,系統(tǒng)的示解了大乘佛法修行者所要修行的步驟及方法。九世紀(jì)初,《入菩薩行》傳入藏地,歷代高僧大德廣泛弘揚,至今也留下了二十余部注疏,使其成為地區(qū)膾炙人口的一部寶典,也成為了藏傳佛教中修行者的必修論典。這部論典中所闡述的價值觀,也是佛教教育者們的價值觀,是以利他菩提心為主,不單講不能偷盜邪、要尊師重道、知禮義廉恥、回報社會、尊老愛幼,更甚者講到除人類外的所有有生之物,都要營造無害、和諧,這種思想也就必然對后人起到了影響。
博弈論(Game theory)又稱之為對策論、游戲論,現(xiàn)在已發(fā)展成為現(xiàn)代數(shù)學(xué)的一個分支,被當(dāng)作運籌學(xué)的一個重要研究對象和方法。1928年馮?諾依曼證明了博弈論的基本原理,從而宣告了博弈論的正式誕生。1944年,馮?諾依曼和摩根斯坦共著的劃時代巨著《博弈論與經(jīng)濟(jì)行為》,開啟了博弈論思想的系統(tǒng)化研究浪潮。然而,這一論著并非最早提出博弈的著作,其實早在戰(zhàn)國時期,孫武所作的《孫子兵法》,可以說是最早的一部講述博弈的著作。隨之便出現(xiàn)了諸多研究博弈,以博弈思想為基石創(chuàng)作諸多方方面面的著作,也成為了風(fēng)靡一時的青少年讀物,更甚者以此為自己的價值觀,出現(xiàn)了諸多效仿的事跡。但大風(fēng)大浪過后,回頭審視這一行徑,才恍然發(fā)現(xiàn)博弈論帶來的不完全只有利益,更多的是磨滅了傳統(tǒng)思想中正面和積極、人性化的部分,這點值得研究和考慮。
一、《入行論》所闡述的主要思想
《入行論》一書的創(chuàng)作背景具有特殊性和局限性,其特殊性表現(xiàn)在,它是作于一個佛法盛傳的那爛陀寺,而且作者又是一位得道修行者,其局限性在于作者是出家人,又置身寺院中,從科學(xué)理論的角度而言,是具有一定的局限性的。而論著中主要講大乘深觀和廣行法,主要以廣行法為主,講解如何修心、修行應(yīng)當(dāng)持有怎樣的心態(tài)等。這部論著分為十品,第一品講發(fā)菩提心的利益,第二品講懺悔罪業(yè),第三品講受持菩提心,這三品就是為了“未生者當(dāng)生”,沒有生起菩提心的令生起菩提心。第四品講不放逸,第五品講正知正見,第六品講安忍,這三品是為了“已生勿退失”,相續(xù)中已經(jīng)產(chǎn)生了菩提心,但這也是很容易退轉(zhuǎn)的,這三品是為了令生起的菩提心不退轉(zhuǎn)。第七品講精進(jìn),第八品講靜慮(禪定),第九品講智慧品,第十品講回向品,這四品是講“輾轉(zhuǎn)益增長”,為了已經(jīng)具有的菩提心能夠增長,甚至圓滿。整部《入行論》就是為了未生的菩提心能夠生起,已經(jīng)生起的不退失,而能夠增長[2]。其中以諸多比喻形象而生動的喻說了善惡取舍,正如《入行論》中將人身比作過河之乘舟,將最終的和諧當(dāng)做彼岸,為得到這種人與人、人與自然的和諧而只為利他。
二、博弈論所涵蓋的主要思想
博弈思想簡單概括就是二人在平等的對局中各自利用對方的策略變換自己的對抗策略,達(dá)到取勝的意義。也就是二人對局如何占優(yōu)。以博弈中的要素:參與者、各自的策略、得失(或者支付矩陣)、次序等達(dá)到均衡。理性的參與者為了使自己的利益最大或者損失最小并結(jié)合對方的處境等指導(dǎo)作出決策達(dá)到均衡。甚至犧牲他人的利益,將自己的利益最大化。
正如其中典型的海盜分金、囚徒困境等等舉例,大致將可以涵蓋和解釋其內(nèi)在的思想角度。在軍事戰(zhàn)略、游戲、統(tǒng)籌等學(xué)科,這一理論無疑是極具指導(dǎo)價值的,但在倫理人情中,尤其是東方文化中是否可行,這一論點值得探討和研究。
三、兩者的辯證關(guān)系
《入行論》的菩提思想與博弈思想,兩者即統(tǒng)一又對立,其統(tǒng)一點在于,兩者最終都是致力于求得最大的功利,這點是完全相同的。二者又有著對立的一面,因為菩提心不僅為了今生得到功利,還致力于來世,所做一切都是為了得到和諧、善果,甚至為得到和諧不惜失去生命的大愛。而博弈論則不同在于它不承認(rèn)來世,所以只致力于眼前的現(xiàn)世今生,所求的是物質(zhì)上的利益,甚至是將自己的利益建立在別人的損失之上,甚至認(rèn)為任何別人的付出都是“有原因”的,極度機(jī)械化的價值觀,不利于處理倫理、友情等問題,因為有些時候人與動物的區(qū)別正在于此,在于貢獻(xiàn)和無私付出,在于“利他”。
注釋:
[1]寂天菩薩:印度南方賢疆國王太子,原名寂鎧,出家來到那爛陀寺后,依當(dāng)時寺內(nèi)五百班智達(dá)之首的勝天為親教師出家,法名寂天。
參考文獻(xiàn):
[1] 索達(dá)吉堪布著. 《入行論廣釋》[Z] . 智悲佛網(wǎng)電子版記述.2013:2.
在我國旅游業(yè)高速發(fā)展的今天,作為旅游業(yè)的三大之柱之一的酒店業(yè)也取得了很大的成績,但在發(fā)展的過程中也存在一些問題,如各星級酒店發(fā)展的不平衡,酒店內(nèi)部管理體制問題,基層員工的離職率較高等,本文以酒店業(yè)為背景,運用了博弈論的基本原理,建立數(shù)學(xué)模型,應(yīng)用動態(tài)博弈模型研究來員工與經(jīng)理的多階段博弈問題,討論了酒店發(fā)展過程中的員工的離職問題,談到了如何才能降低離職率,同時也給出了優(yōu)化酒店管理的合理化的建議。
一、模型中數(shù)據(jù)參數(shù)的假定
在酒店里,作為酒店的管理者,作為股東的人,他要對員工的日常工作情況進(jìn)行監(jiān)督和管理,下面是他和員工在工作中的一些參數(shù)的假定設(shè)置。
1.酒店經(jīng)理一旦進(jìn)行監(jiān)督就能發(fā)現(xiàn)酒店員工是否努力。2.假設(shè)酒店員工工作努力就不會離職,所以也無需考慮經(jīng)理是否會進(jìn)行教育,當(dāng)經(jīng)理不監(jiān)督時也不存在教育與離職的問題,即沒有博弈樹下面的分支了。3.當(dāng)員工工作不努力時,客人們可以能會將酒店員工的不努力行為擴(kuò)散給其他人,這樣酒店經(jīng)理的聲譽會損失,設(shè)為。4.經(jīng)理進(jìn)行酒店日常的管理工作,股東賦予他的管理經(jīng)費為M,這也是工資的一部分,經(jīng)理的監(jiān)督成本,酒店員工的努力成本為,F(xiàn)為經(jīng)理不教育時對不努力的員工的罰金,(注意這里教育則不罰款了)假設(shè)員工離職向經(jīng)理交事先勞動合同上的違約金為,這個可以對員工起到一定的約束作用。5.經(jīng)理不教育不努力員工時,經(jīng)理教育不努力的員工時,教育成本為J。經(jīng)理出于短期效益,對于不努力的員工,他希望罰款,而董事會的股東們則更希望他通過教育,讓他們接受愛崗敬業(yè),接受企業(yè)文化的教育,增強團(tuán)隊凝聚力,這有利于酒店長遠(yuǎn)的發(fā)展,所以本節(jié)后面有一個股東對經(jīng)理的監(jiān)督與否的問題。6.員工將要離職時對外界有個期望值R,當(dāng)期望高時,對他是一種離職的誘因。7.當(dāng)員工工作不努力時,經(jīng)理自身的聲譽損失為;經(jīng)理一旦監(jiān)督,發(fā)現(xiàn)了員工不努力時,酒店員工聲譽損失為;員工努力時,其聲譽得益為;當(dāng)經(jīng)理通過教育后員工不離職了,則經(jīng)理的聲譽損失為。這里要說明一下,聲譽損失再這里主要表現(xiàn)的是一種量變關(guān)系,當(dāng)然我們也可以把賦予它一定的實際意義,比如經(jīng)理的聲譽損失可以在股東召開股東大會在季度獎、年終獎時給予體現(xiàn),而員工聲譽損失、聲譽得益也可以由經(jīng)理對他的努力情況進(jìn)行評價后,在他的獎金中設(shè)置給予一定的份額來體現(xiàn)。8.設(shè)經(jīng)理監(jiān)督的概率為,不監(jiān)督的概率為1-,員工工作努力的概率為,員工工作不努力的概率為1-,經(jīng)理不教育的概率為,經(jīng)理教育的概率為1-,員工離職的概率為,員工不離職的概率為1-。9.設(shè)最底層經(jīng)理與員工的期望收益分別為11、12,上一層經(jīng)理與員工的期望收益分別為21、22
該模型的博弈樹如圖1所示,樹中顯示了經(jīng)理與員工在多個階段的動態(tài)博弈,根據(jù)假定條件與博弈樹可以確定圖1中各參與人在結(jié)點①-⑧的收益值,即有:
二、博弈模型的求解
采用逆向歸納法求此動態(tài)博弈的均衡解,即從博弈樹的最低層開始,組成考察每層的經(jīng)理與酒店員工的期望收益,具體過程如下:
1)從最底層考察酒店員工離職與經(jīng)理不教育的情況,分別求出酒店經(jīng)理與員工的期望收益,用11、12表示,涉及到?jīng)Q策點②、③、④、⑤
則這個階段經(jīng)理的期望收益
(1)
則員工的期望收益
(2)
對式(1)、(2)求一階求導(dǎo),并取:
從而得在這一階段二者的均衡解為
(3)
2)在討論了上面這個階段的情況后,再考察酒店員工是否努力及經(jīng)理是否監(jiān)督這一層次,涉及決策結(jié)點①、⑥、⑦、⑧,用21、22分別表示本階段經(jīng)理和酒店員工的期望收益。
本階段中,在決策點處
對于經(jīng)理
(4)
對于員工
(5)
對(4)、(5)求一階條件,并取
從而均衡解為:
(6)
三、對上述的均衡結(jié)果分析
上面通過數(shù)據(jù)的假定,求出了在各個階段經(jīng)理與員工之間的均衡策略,即最底層的考察酒店員工離職與經(jīng)理不教育的情況,分別求出酒店經(jīng)理與員工的期望收益,當(dāng)討論了上面這個階段的情況后,再考察酒店員工是否努力及經(jīng)理是否監(jiān)督這一層次,分別求出了本階段經(jīng)理和酒店員工的期望收益,然后依次求導(dǎo)后,得出了下面的均衡概率,下面對上述結(jié)果給予分析。
由上述求解過程可得模型的均衡解為:
(7)
1)均衡條件下為經(jīng)理監(jiān)督的概率,由可知:
①酒店員工努力成本C2越高,經(jīng)理監(jiān)督的概率越大,因為酒店員工的努力成本越高,酒店員工不努力的概率越大,因此經(jīng)理為促使酒店員工努力就需提高其監(jiān)督概率。
②酒店員工努力的聲譽得益越大,酒店員工努力可以得到承認(rèn),那么酒店員工越敬業(yè),即使經(jīng)理不監(jiān)督,酒店員工仍然努力,所以,此時經(jīng)理監(jiān)督的概率就越小。
③1*2越大,不努力酒店員工的損失越大,酒店員工為了避免這種損失就需要努力工作,在這種環(huán)境下,可降低其經(jīng)理監(jiān)督概率。
2)是酒店員工努力的概率,由可知:
①C1越大,越小,因為經(jīng)理的監(jiān)督成本越高,造成經(jīng)理監(jiān)督概率越小,導(dǎo)致酒店員工越會降低其努力積極性。
②越大,這表明經(jīng)理在第一階段的收益越大,而這個收益與不努力酒店員工在這個階段的損失相關(guān),也就是說越大時不努力酒店員工的損失越大,為了避免這種較大的損失,酒店員工努力的概率越大,即越大。
③M越大,股東賦予經(jīng)理的管理費用越多,經(jīng)理越會加強監(jiān)督,執(zhí)行股東的想法,員工自然會努力工作了。
3)為經(jīng)理不教育不努力員工的概率,由可知:
①J越大,越大,當(dāng)教育不努力的員工成本太高時,經(jīng)理顯然越不會去教育員工了,而會選擇罰款。②越大時,越小,員工意識到不努力帶來的聲譽損失太大,有可能被解雇的危險,必然會努力工作,自然就不會發(fā)展到下一步需要經(jīng)理去罰款了。③R越大,越小,當(dāng)員工對外界有一個較大的期望時,此時員工是最容易離職的,那么此時若經(jīng)理只是簡單的罰款,只會加速員工的離職,因此只能是教育了,教育的概率加大了,不教育的概率變小了。④越大,越大,這是因為我們可以借助后面模型帶來的股東情況,當(dāng)員工因離職要交的違約金越多時,員工因不愿意交這部分違約金,而會努力工作,則經(jīng)理高忱無憂,不教育的可能性是顯然增大了。
4)為酒店員工離職的概率,由可知:
關(guān)鍵詞:演化博弈;品牌;價值體驗;自主創(chuàng)新
中圖分類號:F713.50 文獻(xiàn)標(biāo)識:A 文章編號:1674-9448 (2013) 04-0061-10
An Evolutionary Game Model about Independent Innovation Based on Experience of Brand Value
GUO Ben-hai1,2 LIU Si-feng2(1. School of Management, Jiangsu University, Jiangsu Zhenjiang 212013, China,2. School of Economics and Management, Nanjing University of Aeronautics and Astronautics, Jiangsu Nanjing 211100, China)
Abstract: From a market perspective, enterprise independent innovation must adhere to category innovation and brand strategy as the core, create new category different from competitors’ or even the opposite one and make consumers get more experience of brand value. This is not only the respect for the generalized virtual value demand, but also the mark of enterprise market success by independent innovation. The enterprise independent innovation based on brand value experience is a comprehensive system which Includes activities such as concept innovation, technology innovation and service innovation and so on. Whether enterprise will devote to this complicated and high-risk innovation activities not only depends on the interests of the enterprise itself, but also is affected by the policy environment and competitors. Facing the dilemma and incentives of enterprise brand building, the bounded rationality and incomplete information evolutionary game theory are applied to analyse the strategies and earnings of main game parties during the enterprise innovation process on brand value experience. An “enterprise-enterprise” and “enterprise-government” evolutionary game model is established to solve and seek evolutionary stable strategy.
Keywords: evolutionary game, erand, value experience, independent innovation
一、引 言
美國著名未來學(xué)家阿爾文?托夫勒曾指出,體驗經(jīng)濟(jì)將逐漸成為繼農(nóng)業(yè)經(jīng)濟(jì)、工業(yè)經(jīng)濟(jì)、服務(wù)經(jīng)濟(jì)之后的一種經(jīng)濟(jì)形態(tài)[1]?,F(xiàn)時代經(jīng)濟(jì)社會生活與過去相比,發(fā)生的顯著變化是大批只具有虛擬價值的商品涌入商品大家族[2],虛擬價值在本質(zhì)上是社會心理需求對商品價值的再造[3]。作為經(jīng)濟(jì)活動微觀主體的企業(yè),必須在提高提供顧客體驗價值的過程中獲取競爭優(yōu)勢;以品牌價值體驗為導(dǎo)向的自主創(chuàng)新活動,將會是企業(yè)發(fā)展的不竭動力。中國企業(yè)之所以難出國際知名品牌,缺少的就是在消費者心中的品牌價值認(rèn)知度;自主品牌產(chǎn)品少、品牌價值偏低,是我國企業(yè)自主品牌建設(shè)的基本現(xiàn)狀。提升消費者的品牌價值體驗度和認(rèn)知度,已經(jīng)成為擺在中國企業(yè)面前的當(dāng)務(wù)之急問題。
理論界對自主知識產(chǎn)權(quán)品牌建設(shè)及演化博弈問題做了多方面研究。張明立[4]從消費者―品牌關(guān)系中的廣義虛擬價值角度探索品牌形象對品牌忠誠的作用機(jī)制;劉明珍 [5]通過數(shù)據(jù)研究方法,提出從內(nèi)在機(jī)制、建立法規(guī)、統(tǒng)一內(nèi)外資企業(yè)所得稅等方面支持我國企業(yè)自主知識產(chǎn)權(quán)產(chǎn)品發(fā)展的政策建議;黃永春,楊晨 [6]以品牌競爭理論為基礎(chǔ),從外顯性與潛力性構(gòu)面探究了企業(yè)自主知識產(chǎn)權(quán)名牌競爭力的構(gòu)成要素;范秀成 [7]從服務(wù)的過程屬性出發(fā),闡述了服務(wù)企業(yè)品牌建設(shè)的焦點應(yīng)該是顧客體驗,并提出通過塑造顧客體驗來創(chuàng)建服務(wù)品牌的策略。
對演化博弈論發(fā)展具有開創(chuàng)性貢獻(xiàn)的是 Smith [8]與Price [9],他們提出的“演化穩(wěn)定策略”成為演化博弈論的基本概。近年來,演化博弈研究出現(xiàn)了一些新動向。如L.A. Bach,T.Helvikc,F(xiàn).B.Christiansen [10]研究了演化穩(wěn)定策略(ESS)的分歧問題;David K. Levine,Wolfgang Pesendorfer [11]對有一方模仿情況下的合作演化博弈問題進(jìn)行了相關(guān)研究;韓少春等 [12]在演化博弈論的基礎(chǔ)上,分析輿論傳播的羊群效應(yīng)問題。在演化博弈應(yīng)用領(lǐng)域,郭本海、方志耕 [13]運用演化博弈的基本原理,分析了中國節(jié)能政策實施中中央與地方的演化博弈策略,提出“中央―地方”演化博弈的三個階段;阮愛清、劉思峰 [14]運用演化博弈模型分析了產(chǎn)業(yè)集群的種子、核和集群三種狀態(tài)及不同階段的收益狀況,建立了產(chǎn)業(yè)集群成長的演化模型;周德群 [15]基于非對稱主體的進(jìn)化博弈方法,探討了不同規(guī)模的企業(yè)在新興產(chǎn)業(yè)進(jìn)入問題上的對策;謝非 [16]應(yīng)用進(jìn)化博弈論的方法從風(fēng)險投資者和風(fēng)險企業(yè)的角度,結(jié)合風(fēng)險資本的時間價值,對風(fēng)險投資退出方式進(jìn)行了研究;劉偉兵、王先甲 [17]將強化學(xué)習(xí)引入到進(jìn)化博弈中,建立了進(jìn)化博弈中的多人強化學(xué)習(xí)模型。
本文在已有研究基礎(chǔ)上,從顧客的品牌價值體驗入手,分析企業(yè)創(chuàng)新過程中各方利益主體的博弈關(guān)系以及品牌價值體驗與企業(yè)自主創(chuàng)新的作用機(jī)理;構(gòu)建了“企業(yè)―企業(yè)”及“企業(yè)―政府”為博弈雙方、以提升品牌價值體驗為基本目的的自主創(chuàng)新演化博弈模型,通過模型求解,闡釋各方主體的演化穩(wěn)定策略。
二、提升品牌價值體驗的自主創(chuàng)新博弈關(guān)系分析
演化博弈理論源于生物進(jìn)化論,其基本思想是,在具有一定規(guī)模的博弈群體中,博弈方進(jìn)行著反復(fù)的博弈活動;相對于靜態(tài)均衡和比較靜態(tài)均衡,演化博弈強調(diào)動態(tài)均衡。演化博弈以有限理性和學(xué)習(xí)能力代替了傳統(tǒng)博弈論關(guān)于主體完全理性的假定, 即博弈雙方不可能在每一次博弈中都能找到最優(yōu)的均衡點;演化博弈以一種動態(tài)的框架來分析系統(tǒng)均衡及達(dá)到均衡的過程,從而更準(zhǔn)確地描述系統(tǒng)的發(fā)展變化。演化博弈的核心概念是“演化穩(wěn)定策略”( Evolutionary Stable Strategy, ESS ) 和“復(fù)制動態(tài)”(Replicator Dynamics)。
以提升顧客品牌價值體驗為根本訴求的企業(yè)自主創(chuàng)新活動,既要考慮到創(chuàng)新的不確定性、外部經(jīng)濟(jì)性等風(fēng)險,又要深度理解并充分尊重市場需求,這個過程實際上是不同企業(yè)、政府部門、消費者和社會公眾等主體間的復(fù)雜博弈。其中,不同企業(yè)的策略選擇、政府的政策設(shè)計與選擇將在很大程度上影響著博弈態(tài)勢,企業(yè)與企業(yè)之間、企業(yè)與政府之間的博弈占據(jù)主導(dǎo)地位。在不同的政策體系下,各方博弈主體的收益預(yù)期會有所不同,相應(yīng)的博弈策略也不斷調(diào)整。一方面,企業(yè)將根據(jù)政策特點及競爭對手的策略采取相應(yīng)的行動,決定是否全力置身于自主創(chuàng)新和自主品牌建設(shè);或者根據(jù)已選擇的創(chuàng)新模式以及政府的政策作用效力估測收益趨勢,對已有創(chuàng)新模式做出相應(yīng)調(diào)整。另一方面,政府根據(jù)政策執(zhí)行的情況評估政策效力、判斷品牌建設(shè)未來發(fā)展趨勢,并對現(xiàn)有政策做出相應(yīng)的調(diào)整。
(一)損益變量選取
(1)影響企業(yè)自主創(chuàng)新的損益變量
初始收益M:企業(yè)在不創(chuàng)新且不“搭便車”情況下所獲得的經(jīng)營利潤;
自主創(chuàng)新邊際收益V:企業(yè)因自主創(chuàng)新而獲得的直接收益;
自主創(chuàng)新衍生收益E0:企業(yè)因自主創(chuàng)新而獲得的間接收益;
創(chuàng)新基礎(chǔ)設(shè)施投入G:政府在創(chuàng)新基礎(chǔ)設(shè)施建設(shè)上的投入,以減輕企業(yè)基礎(chǔ)性成本負(fù)擔(dān);
“搭便車”收益E:不從事創(chuàng)新的企業(yè)“搭便車”獲得包括初始受益在內(nèi)的收入,令 ,E=M+ηV;η∈(0,1);
創(chuàng)新直接成本I0:企業(yè)自主創(chuàng)新所發(fā)生的直接支出;
“搭便車”成本H:不從事創(chuàng)新的企業(yè)“搭便車”所產(chǎn)生的必要費用;
懲罰費用C0:“搭便車”可能被查處而遭受的懲罰,令C0=βI(β為懲罰系數(shù),I為從事創(chuàng)新的企業(yè)在某個方面的創(chuàng)新投入);
(一)損益變量選取
1.影響企業(yè)申請知識產(chǎn)權(quán)保護(hù)的損益變量
初始收益M:企業(yè)在不創(chuàng)新且不“搭便車”情況下所獲得的經(jīng)營利潤;
自主創(chuàng)新邊際收益V:企業(yè)因自主創(chuàng)新而獲得的直接收益;
品牌溢出價值B0:自主創(chuàng)新提高了產(chǎn)品知名度和品牌價值體驗度,企業(yè)因此而獲利,可令B0=λM0=λ(M+V)0,λ為品牌價值溢出率,λ∈(0,1);
讓渡收益O:企業(yè)通過知識產(chǎn)權(quán)買賣、轉(zhuǎn)讓而獲得的收益;
政府激勵G0:企業(yè)積極申請知識產(chǎn)權(quán)保護(hù)而獲得的來自政府的獎勵收益;
賠償收益P:申請了知識產(chǎn)權(quán)保護(hù)的企業(yè)獲得的來自“搭便車”侵權(quán)企業(yè)的賠償;
保護(hù)成本K:企業(yè)實施知識產(chǎn)權(quán)保護(hù)產(chǎn)生的成本費用;
知識產(chǎn)權(quán)溢出損失B1:因企業(yè)不申請知識產(chǎn)權(quán)保護(hù)或政府不監(jiān)督,企業(yè)被侵權(quán)而導(dǎo)致利潤減少;
品牌價值折損B2:因企業(yè)品牌建設(shè)不力或政府監(jiān)督弱化,品牌價值折損導(dǎo)致企業(yè)收益相應(yīng)減少。
2.影響政府監(jiān)督的損益變量
行政收費Y:政府向申請知識產(chǎn)權(quán)保護(hù)的企業(yè)收取的費用;
衍生收益W:政府因在知識產(chǎn)權(quán)保護(hù)上的有力作為(監(jiān)督)而無形收益,如政府形象及區(qū)域形象改進(jìn)等;
罰沒收入P:政府依法對“搭便車”企業(yè)實施罰沒懲戒而獲得的收益;
獎勵支出G0:政府對積極申請知識產(chǎn)權(quán)保護(hù)的企業(yè)給予的獎勵;
監(jiān)督成本C:政府實施監(jiān)督過程中消耗的人、財、物成本;
衍生損失W’:政府因在知識產(chǎn)權(quán)保護(hù)上不作為可能帶來的負(fù)面影響,如區(qū)域形象受損、投資環(huán)境質(zhì)量下降等。
(二)收益函數(shù)構(gòu)建
1.支付函數(shù)構(gòu)建
假定:政府知識產(chǎn)權(quán)保護(hù)上采取“監(jiān)督”策略的概率為p,則不監(jiān)督(或監(jiān)督力度不力)的概率為(1-p);企業(yè)申請知識產(chǎn)權(quán)保護(hù)的概率為q,則不申請知識產(chǎn)權(quán)保護(hù)的概率為(1-q)。令企業(yè)申請知識產(chǎn)權(quán)保護(hù)的情形為F1,不申請知識產(chǎn)權(quán)保護(hù)的情形為F2;政府部門進(jìn)行監(jiān)督的情形為G1,不進(jìn)行監(jiān)督的情形為G2。雙方的收益矩陣如表2所示。
五、結(jié)束語
解決我國企業(yè)自主品牌產(chǎn)品少、品牌價值偏低的問題,是一個系統(tǒng)工程,企業(yè)、政府、消費者以及社會公眾皆在其中扮演著重要角色;以企業(yè)為基本主體、以政府為重要推動力量、以提高顧客品牌價值體驗程度為根本訴求的自主創(chuàng)新,是解決這一系統(tǒng)性問題的關(guān)鍵。 圍繞這一問題而展開的“企業(yè)-企業(yè)”間及“企業(yè)-政府”間演化博弈,實質(zhì)上是有效構(gòu)建科學(xué)調(diào)控機(jī)制,促使具有競合關(guān)系的不同企業(yè)與政府一起構(gòu)成策略互動體,以演化穩(wěn)定策略順利推進(jìn)基于品牌價值體驗的企業(yè)自主創(chuàng)新活動。
參考文獻(xiàn):
[1] 阿爾文?托夫勒著.未來的沖擊[M].蔡伸章譯.北京:中信出版社, 2006.
[2] 林左鳴.虛擬價值的人類活動論依據(jù)[J].北京大學(xué)學(xué)報(哲學(xué)社科版),2006(2):43-50.
[3] 吳秀生.虛擬價值:價值規(guī)律的新視野[J].廣義虛擬經(jīng)濟(jì),2011(4):36-45.
[4] 張明立,任淑霞,王偉.基于廣義虛擬價值的品牌形象對品牌忠誠影響機(jī)制研究[J].廣義虛擬經(jīng)濟(jì)研究,2011(3):38-46.
[5] 劉明珍.中國企業(yè)自主知識產(chǎn)權(quán)和知名品牌發(fā)展研究[J].中國軟科學(xué),2006(3):123-130.
[6] 黃永春,楊晨.企業(yè)自主知識產(chǎn)權(quán)品牌的競爭效應(yīng)的理論分析[J].科技管理研究,2007(4):27-33.
[7] 范秀成.顧客體驗驅(qū)動的服務(wù)品牌建設(shè)[J].南開管理評論,2001(6):123-131.
[8] Maynard Smith J. The Theory of Games and the Evolution of Animal Conflict[J].Journal of Theory Biology,1973, (47).
[9] Maynard Smith J, Price G R. The Logic of Animal Conflicts [J]. Nature, 1974 (246):15-18.
[10] L.A. Bach, T. Helvikc, F.B.Christiansen. The evolution of n-player cooperation-threshold games and ESS bifurcations [J].Journal of Theoretical Biology,2006, 238.
[11] David K. Levine, Wolfgang Pesendorfer. The evolution of cooperation through imitation [J]. Games and Economic Behavior,2007,58.
[12] 韓少春,劉云,張彥超 等.基于動態(tài)演化博弈論的輿論傳播羊群效應(yīng)[J].系統(tǒng)工程學(xué)報, 2011(2):275-281
[13] GUO Benhai, FANG Zhigeng.A study of evolutionary game between central government and the local in energy conservation policy implementation[C]. 2011 IEEE International Conference, 2011(9):874-879.
[14] 阮愛清,劉思峰.基于進(jìn)化博弈模型的產(chǎn)業(yè)集群成長研究[J].科學(xué)學(xué)與科學(xué)技術(shù)管理, 2008(2):91-95.
[15] 許肖瑜,周德群.基于進(jìn)化博弈的新興產(chǎn)業(yè)進(jìn)入問題研究[J].技術(shù)與創(chuàng)新管理, 2008(11):600―606.
[關(guān)鍵詞]博弈論;理性人假定;公共知識;社會科學(xué)方法論
[中圖分類號]C3
[文獻(xiàn)標(biāo)識碼]A
[文章編號]1671-511X(2012)04-0020-03
博弈論是研究理性人的互動的理論,或者說研究交互決策的理論。1928年,馮·諾依曼證明了博弈論的基本原理,宣告了博弈論的正式誕生。1944年,馮·諾依曼和摩根斯坦合著的《博弈論與經(jīng)濟(jì)行為》將二人博弈推廣到n人博弈結(jié)構(gòu)并將博弈論系統(tǒng)應(yīng)用于經(jīng)濟(jì)領(lǐng)域,奠定了這一學(xué)科的基礎(chǔ)和理論體系。1950-1951年,約翰·納什利用不動點定理證明了均衡點的存在,為博弈論的一般化奠定了堅定的基礎(chǔ)。塞爾頓、哈桑尼、謝林、奧曼等人的研究也大大推動了博弈論的發(fā)展。因此,盡管博弈論是一門新生的學(xué)科,但是它今天已經(jīng)發(fā)展成為有較完善的理論體系的科學(xué)。
今天,博弈論已經(jīng)成為社會科學(xué)的通用方法論。盡管它是演繹科學(xué),對社會現(xiàn)象有強大的解釋力,然而,由于其理想主體的假定使得其演繹出的理論解與實際博弈結(jié)果存在差異。許多實驗經(jīng)濟(jì)學(xué)家通過博弈實驗研究實際中人們的博弈過程,分析博弈論的演繹解與博弈實驗結(jié)果之間的差異。如2002年諾貝爾經(jīng)濟(jì)學(xué)獎就頒發(fā)給了丹尼爾·卡尼曼和邁農(nóng)·史密斯,他們是實驗經(jīng)濟(jì)學(xué)的先驅(qū)。今天在西方學(xué)術(shù)界通過實驗來驗證博弈的理論結(jié)果已經(jīng)成為一種潮流。本文下面設(shè)計并進(jìn)行了一個博弈實驗,通過分析實驗結(jié)果與理論解的差異,分析博弈論作為社會科學(xué)方法論的局限性,并提出改進(jìn)的可能路徑。
一、博弈實驗及結(jié)果分析
1 實驗描述
我們設(shè)計了如下的一個博弈實驗。該實驗的參與人是南京大學(xué)選修文化素質(zhì)課“邏輯與科學(xué)方法基礎(chǔ)”的大學(xué)生,他們是二三年級的學(xué)生,文理科學(xué)生均有。
該實驗是以試題的形式進(jìn)行的,該試題作為期末試卷中的最后一道題。該題目為:
在0-100之間選擇一個數(shù)字,規(guī)則是:若你選擇的數(shù)字“是或最接近”在座同學(xué)所選擇的數(shù)字的平均數(shù)的2/3(即在座同學(xué)所選數(shù)的總和除以總?cè)藬?shù)之后所得數(shù)字的2/3,如:若平均數(shù)為90,你應(yīng)當(dāng)選2/3×90=60),你將獲勝。請給出你選擇的理由。
實驗說明:
(1)實驗參與者即參加考試的學(xué)生,事前不知道這是一個實驗;
(2)該課程教師以講座的形式給實驗參與者傳授過博弈論知識,但沒有提到所進(jìn)行的博弈;
(3)因為(2),他們中的大多數(shù)掌握“博弈”、“公共知識”等概念;
(4)試卷是保密的,沒有任何學(xué)生預(yù)先知道考試內(nèi)容,考試過程中學(xué)生間無任何交流;
(5)該博弈的理論解(即納什均衡)為0或1。
2 實驗結(jié)果
對于考試中的每個學(xué)生,在這個博弈實驗中他能夠獲勝的關(guān)鍵是,他要準(zhǔn)確猜測他人是如何選擇的,一旦他猜測正確,他將他猜測的平均數(shù)乘以2/3便是獲勝答案。
共有176人參加了考試。排除掉5個不明確的選擇,供分析的實際選擇數(shù)為171個(其中3個選擇非整數(shù))。實驗結(jié)果為(按照數(shù)字大小排序):
“0”:46人;“1”:14人;“5”:1人;“9”:1人;“10”:4人;“12”:1人;“15”:3人;“20”:3人;“22”:18人;“22.44”:1人;“24”:1人;“25”:3人;“28”:2人;“29”:1人;“30”:4人;“32”:2人;“33”:24人;“100/3”:1人;“34”:4人;“35”:1人;“36”:2人;“38”:3人;“39”:1人;“40”:6人;“43”:1人;“44”:5人,“45”:3人;“47”:1人;“50”:3人;“58”:1人;“59”:1人;“60”:2人;“66”:1人;“67”:3人;“”:1人;“72”:1人;“75”:1人。
3 結(jié)果分析
在這些所選擇的數(shù)字中,最大的數(shù)字為75,最小的數(shù)字為0。171個數(shù)字相加后的平均數(shù)為21.91,本博弈勝出解:21.84×2/3=14.61。
這個博弈中,0和1是均衡解(下一部分將分析),它們是“理論解”。在該實驗中,0是所選最多的數(shù)字,共有46人選擇,比例為26.9%;選1的為14人,比例為8.2%。兩者相加共有60人,比例為35.1%。
從上述數(shù)據(jù)可以看出,在這場博弈中,“實驗解”為14.61,最接近該數(shù)的是14或15,這和“理論解”的“0”或“1”不同。在本實驗中,沒有人選擇14,而選擇15的有3人,這3人是該實驗的勝出者。
若按照區(qū)間來統(tǒng)計,實驗結(jié)果的分布情況見表1。本博弈實驗的“實驗解”14.61落在11-20之間。若我們把11-20看成是勝出區(qū)間,則有7人勝出。
對于這些選擇,有以下值得注意的幾點:
第一,67以上的選擇都是不理性的,因為參加考試的學(xué)生數(shù)為150-200之間,這是公共知識,即使所有的學(xué)生都選擇100,勝出的數(shù)字都不會超過67。但是還有3位學(xué)生選擇了大于67的數(shù)字,其中選擇的最大數(shù)為75。他們在給出這些選擇時沒有給出理由。
第二,分析學(xué)生所給出這些選擇的理由,可以看出,絕大部分選擇者在進(jìn)行他們的選擇時考慮到了他人的選擇以及他人的推理。不同的人對他人的假定不同,所進(jìn)行推理的步驟也不同。如選擇67的學(xué)生假定了他人都選擇100,因而選擇67是最優(yōu)選擇;再比如選擇30-40之間的數(shù)字的同學(xué),其理由大體上有兩個:或者認(rèn)為平均數(shù)集中在50-60之間,其2/3就集中在35-40之間;或者認(rèn)為都選100的話,66.7是最優(yōu)選擇,都選擇66.7的話,44是最優(yōu)選擇,而都選44的話,33是最優(yōu)選擇。
第三,有三個區(qū)間處的選擇比例較高:0-10間為38.6%,21-30間為17.6%,31-40間為25.7%。從所給理由可看出,不同區(qū)間的選擇者考慮群體的互動推理的步驟存在差別,如0-10區(qū)間的選擇者考慮他人的推理步驟比31-40區(qū)間的選擇者多些。
第四,值得注意的是,11-20區(qū)間里的選擇較少(事實上是,在這個博弈中所選擇的數(shù)字落在這個區(qū)間是最有可能勝出的)。原因可能是,一旦選擇者進(jìn)行了多步的互動推理,他們便能夠?qū)⑦@樣的推理進(jìn)行下去,從而將選擇向理論解0或1靠近。
第五,有一些“智慧的”選擇者,他們知道理論解,但他們知道存在不完全理性的選擇,因而他們沒有選擇理論解。盡管他們的選擇沒有勝出,他們的推理是有智慧的。這里,本文選擇了其中2個。一位選擇22的學(xué)生是這樣給出他所選擇的理由的:“作為理性人,我不會選擇大于2/3×100的數(shù),因為即使所有人都選擇最大數(shù),平均數(shù)的2/3也不會超過2/3×100。如果大家和我一樣理智,那么大家都不會選擇大于2/3×100,那么我不會選擇大于100×2/3×2/3。因為他們選擇最大的他們可能會選的數(shù),平均數(shù)的2/3也不會超過2/3×2/3×100。依此類推,如果全班都充分理智,那么全班最終都會選擇1,然而我不認(rèn)為班里的人都是足夠理智,故平均數(shù)的2/3會大于1。根據(jù)兩次游戲,平均數(shù)的2/3在20~30。如果是我,我會選擇靠近20的數(shù),那我就22吧。”一個選擇10的學(xué)生的理由是:“如果其他人都是隨機(jī)選擇,那么平均數(shù)最后可能接近于50,50×2/3≈33。但是,如果所有人都選擇接近33的數(shù),那么33為平均數(shù),33×2/3≈22……如此推理應(yīng)該為1。但是并非所有人均是理性、均會如此計算。我對南大有信心,所以,我將數(shù)字選得接近1一點,選10?!?/p>
第六,有一些選擇是沒有考慮到他人的選擇。如有這樣一些理由:“大家都認(rèn)為60是及格分,所以我選擇59”,“58是我的幸運數(shù)字”,等等。
二、博弈的理論解分析
本實驗是一個多人完全信息靜態(tài)博弈:參與者同時選擇行動,然后根據(jù)所有參與者的選擇,每個參與者得到各自的結(jié)果,每一參與者的收益函數(shù)在所有參與者之間是公共知識。
在這個實驗中,參加考試的176位學(xué)生是參與者,每個考生同時對0-100之間的數(shù)字進(jìn)行選擇行動,即每個參與者的策略空間Si∈(0,100),即有101種可能的策略。根據(jù)所有考生的選擇,每個考生最后得出自己的結(jié)果,對每個考生來說,結(jié)果無非就是,自己的選擇是“大家所選數(shù)字的平均數(shù)的2/3”,勝出;要么與“大家所選數(shù)字的平均數(shù)的2/3”不一致,失敗。
我們假定該博弈的參與人都是絕對理性人(事實上,這個要求在實際中難以達(dá)到,這也是本文要得到的一個結(jié)論)。
我們來分析絕對理性人的推理過程。
在這個博弈中策略組合有176×101種,每種策略組合下,每個人的收益是公共知識。如:如所有人都選100,平均數(shù)為100,此時每人都失敗,勝出結(jié)果是100×2/3=67;如175人都選100,有一個人選擇了67,那么選100的人失敗,而選擇67的人勝出……所以這些是理性參與人的公共知識。
我們看到,任何人都不應(yīng)該選67或以上,或者選擇67或以上是非理性的,因為所選擇的數(shù)字的最大平均數(shù)為100,此時勝出的數(shù)字為67,因此選擇67以上而獲勝的可能性是沒有。因此,作為理性人他們都不會選擇67或以上。
每個人都不會選擇67或以上,這本身也是公共知識。在這樣的公共知識的前提下,45以上的選擇都是不合理的,因為對每個人而言,只有在他人都選擇67以上,我選擇45或以上才是合理的(67的2/3約為45)。
每個人都不會選擇45或以上,這本身也是公共知識。于是,每個人都認(rèn)為不應(yīng)該選擇30或以上。
……
結(jié)論是:每個人選擇0或1是合理的,它們是該博弈的理論解。
事實上,每個人選擇0或都選擇1是納什均衡:對每個人而言,在其他人不改變選擇的情況下,當(dāng)下的選擇是最優(yōu)的。
在所有人均選擇0的情況下,因為對于每個人而言,若所有人都選擇0的話,0便成為平均數(shù),該數(shù)的2/3還是0。這樣,他選擇0是最優(yōu)選擇:在他人不改變選擇的情況下,他改變選擇將失敗。因此這點構(gòu)成納什均衡。
在所有人均選擇1的情況下,同樣,對于每個人而言,在其他人選擇1的情況下,平均數(shù)1的2/3為0.67,此時1最接近該數(shù)。因此,他選擇1是最優(yōu)選擇,并且若他改變了他的選擇他將失敗。因此,這點也構(gòu)成納什均衡。
當(dāng)然,面對多個納什均衡,作為理性的參與人作何選擇才能勝出呢?具體到這個博弈中,每個人要考慮的是,他選擇0還是選擇1才能勝出呢?
他會這樣思考:沒有理由認(rèn)為其中一個比另外一個更有可能勝出,這樣,選擇0或1勝出的概率為50%,但是,他人能夠與我有同樣的想法。既然如此,期望平均數(shù)應(yīng)該為0.5×1+0.5×0=0.5。于是,0.5的2/3接近0。因此,選擇0是最優(yōu)選擇。
從上面的分析可見,盡管0和1是納什均衡點,但選擇。是最優(yōu)選擇。
三、改進(jìn)博弈論的可能路徑
本文已經(jīng)表明,上述博弈是一個完全信息靜態(tài)博弈,然而,本實驗的實驗解(14.61)與理論解(0或1)之間發(fā)生偏離。本文認(rèn)為,有兩個主要原因:
第一,博弈論中所假定的理想主體與實際中的決策主體不相符合。理想的博弈參與人是絕對理性人;他們能夠進(jìn)行任何有窮步驟的推理,能夠分析所有有窮可能的情況,并且他們的推理、分析是在瞬時完成的,而實際博弈中人們是有界理性的。在我們的博弈實驗中若參與者是理想主體,他們能夠做本文上一部分那樣的分析,他們應(yīng)當(dāng)知道0和1是均衡解,也能夠預(yù)測O是最有可能實現(xiàn)的結(jié)果。本實驗表明,并不是所有人都能夠做出這樣分析的。并且,在實際中存在完全非理性的選擇,如本實驗中選擇大于67的3人,這不是完全偶然現(xiàn)象。