發(fā)布時間:2023-09-28 10:12:44
序言:作為思想的載體和知識的探索者,寫作是一種獨特的藝術(shù),我們?yōu)槟鷾?zhǔn)備了不同風(fēng)格的5篇博弈論的構(gòu)成要素,期待它們能激發(fā)您的靈感。
關(guān)鍵詞:博弈論;田忌賽馬;一般擴展式
一、什么是“博弈”
博弈論的思想最早可以追溯到18世紀(jì),但真正作為一種理論研究則始于20世紀(jì)20年代,公認(rèn)的開山之作是1944年出版的由科學(xué)家馮諾依曼和經(jīng)濟學(xué)家奧斯卡摩根斯坦恩合著的《博弈論與經(jīng)濟行為的理論》一書。此時,“博弈論”才作為一個完整的新名詞被提了出來。此后,國內(nèi)外對博弈論有了廣泛的研究,博弈論取得了長足的發(fā)展。國內(nèi)方面,關(guān)于博弈論的文章、專著不勝枚舉,各位學(xué)者對“博弈”一詞的認(rèn)識或定義也存在偏差。
按照《現(xiàn)代漢語詞典》的解釋,“博”是豐富多彩的意思,而“弈”則指下棋、打牌等對抗性游戲,因而“博弈”就是指豐富多彩的對抗性游戲。①在英文中,“博弈”一詞是“game”的復(fù)數(shù),表示各種各樣的游戲。因此,漢語中的“博弈”與英語中的“game”意思完全一致。“博弈”與“游戲”有這密不可分的聯(lián)系。
學(xué)者王俊冰對“博弈”一詞有著不同的理解。他指出:博弈的“博”字是競爭的意思,“弈”是對弈,是一種關(guān)于在競爭中選擇策略,爭取最好結(jié)果的技藝。②概括來講,博弈是一種技藝。學(xué)者郭磊認(rèn)為:博弈的基本意思是弈棋,博弈本身是一種游戲,但博弈更強調(diào)謀略……博弈則可能是一系列策略與行動的組合體,并且是一個由始而終并產(chǎn)生結(jié)果的完整過程。③可以理解為博弈是一個過程。還有學(xué)者認(rèn)為:博弈即一些個人、隊組或其他組織,面對一定的環(huán)境條件,在一定的規(guī)則下,同時或先后,一次或多次,從各自允許選擇的行為或策略中進(jìn)行選擇并加以實施,各自取得相應(yīng)結(jié)果的過程。④
二、“田忌賽馬”概述
忌數(shù)與齊諸公子馳逐重射。孫子見其馬足不甚相遠(yuǎn),馬有上、中、下輩。于是孫子謂田忌曰:“君弟重射,臣能令君勝。”田忌信然之,與王及諸公子逐射千金。及臨質(zhì),孫子曰:“今以君之下駟彼上駟,取君上駟與彼中駟,取君中駟與彼下駟。”既馳三輩,而田忌一不勝而再勝,卒得王千金。于是忌進(jìn)孫子于威王。威王問兵法,遂以為師。”⑤這是我國“田忌賽馬”故事的原型。這個故事可謂是眾所周知了,該故事發(fā)生在戰(zhàn)國時期,齊威王和大將田忌賽馬,根據(jù)馬跑的速度雙方各有上、中、下三種等級馬各一匹,其中田忌的馬比同一等級齊王的馬跑得慢,但比齊王低一級的馬跑得快。比賽規(guī)則為三局兩勝制,每局比賽各出一匹馬,負(fù)者向勝者支付黃金⑥一千,顯然相比之下齊王的馬占優(yōu)勢。在第一次比賽中,田忌以上等馬對齊王的上等馬,以中等馬對齊王的中等馬,以下等馬對齊王的下等馬,結(jié)果連負(fù)三局。在第二次比賽中,田忌采納孫臏的建議,以下馬對齊王的上馬,以中馬對齊王的下馬,以上馬對齊王的中馬,結(jié)果勝兩局負(fù)一局,贏齊王一千金,而自以為勝券在握的齊王反而輸?shù)粢磺Ы稹?/p>
首先要從語言上分析一下這個典故。“孫子見其馬足不甚相遠(yuǎn)”這一句是前提,否則這個故事就不會發(fā)生。我們可以這樣理解這句話,即“齊威王和田忌的馬根據(jù)速度劃分各有上、中、下三種等級各一匹,其中田忌的馬比同一等級齊王的馬跑得慢,但比齊王低一級的馬跑得快”。假如齊威王的馬按速度由快到慢分為A1、A2、A3,田忌的馬由快到慢分為B1、B2、B3,那么這六匹馬由快到慢依次是A1、B1、A2、B2、A3、B3。另外,還有一處是學(xué)者研究中普遍遺漏的,即“及臨質(zhì)”三個字,這一句起到了至關(guān)重要的作用。這句話在這個故事中應(yīng)該翻譯為“等到將要開始比賽的時候”,那么這句話告訴我們一個什么訊息呢?我認(rèn)為是說孫臏獻(xiàn)計田忌改變馬的出場順序這一情況并不為齊威王所知,這也成就了田忌在第二輪賽馬中能夠勝出的重要因素。“威王問兵法,遂以為師。”這一句也是關(guān)鍵所在,通過這一句話得知,齊威王并不知道自己是怎么輸?shù)模哉埥虒O臏。假設(shè)如果齊威王知道其中玄機的話,那么田忌將必輸無疑。以上三點是“田忌賽馬”故事得以出現(xiàn)的基本前提。
而我國關(guān)于“田忌賽馬”博弈論研究的相關(guān)論著可謂不少,但鮮有人認(rèn)真透徹地分析這個故事的原型,殊不知這關(guān)系到“田忌賽馬”是不是博弈、是怎樣的博弈等問題。在以往的文獻(xiàn)中,王俊冰在《白話博弈論》一文中指出“田忌賽馬”是一個非合作博弈;詹國樞在《博弈處處有,幾人能識之》中指出“田忌賽馬”是博弈論的實際運用,是典型的博弈案例;周瀚光認(rèn)為“田忌賽馬”是一個“二人有限零和博弈”,⑦但他并沒有首先從語言學(xué)的角度分析這個故事的前提;此外學(xué)者袁國強、和蔚、逯彥彥、郭鵬等等均指出“田忌賽馬”是一個博弈,但沒有深入分析它到底屬于什么類型的博弈,是怎樣博弈的等問題。
三“田忌賽馬”的博弈論分析
前文分析了該故事的三個前提,一、田忌的每等級的馬均次于齊威王同等級的馬,但強于齊威王下個等級的馬;二、齊威王事先不知道田忌臨陣改變了馬的出場順序;三、齊威王不知道改變馬出場順序其中的玄機。本文以下的分析均基于此三前提。
首先要從博弈論定義上理解“田忌賽馬”。很明顯,“田忌賽馬”確實符合“博弈”的定義,但現(xiàn)在言“田忌賽馬”就是博弈還為時尚早。
其次需要分析“田忌賽馬”是否具備博弈理論的基本要素。國內(nèi)學(xué)術(shù)界對博弈論基本構(gòu)成要素有分歧,基本分為兩派。一派認(rèn)為博弈論要素有四方面,即博弈的參加者、策略、進(jìn)行博弈的次序、博弈的信息。但是主張博弈理論四要素這一派內(nèi)部也有分歧,學(xué)者胡靜認(rèn)為博弈理論的第四個構(gòu)成要素是“博弈方的得益”,⑧而不是博弈的信息;另一派認(rèn)為博弈理論具有五方面的要素,即博弈的參加者、策略、進(jìn)行博弈的次序、博弈的信息、博弈方的得益。可以清晰地看出后者對博弈理論的要素有了一個完整的歸納。那么“田忌賽馬”是否具備五個要素呢?齊威王和田忌是博弈的參加者;策略選擇按照排列組合來計算共有六種(這里不詳細(xì)敘述);博弈的次序是雙方非同時決策,齊威王是先手;博弈的信息是不完全的,齊威王不知道田忌策略的變化;得益是每勝一局有一千金的獎勵。通過分析這些要素,我們得出一個結(jié)論,即“田忌賽馬”是一個完整的博弈。
最后要弄清楚“田忌賽馬”到底屬于什么類型的博弈。首先要了解一下博弈論的分類情況。(1)合作博弈與非合作博弈。如果各博弈方能達(dá)成某種有約束力的契約或默契,以選擇共同的策略,此種博弈就是合作博弈。反之,就屬于非合作博弈。(2)零和博弈、常和博弈與變和博弈。這是按得益情況劃分的,一方得益必來自一方損失,這種博弈是零和博弈。常和博弈又叫非零和博弈,指博弈各方得益之和不為零。變和博弈中各方得益之和不確定,這是最一般的博弈,常和博弈和零和博弈是它的特例。(3)靜態(tài)博弈與動態(tài)博弈。根據(jù)博弈的次序,即參加者策略選擇并行動的先后次序博弈可以分為靜態(tài)博弈和動態(tài)博弈。靜態(tài)博弈指參加者可同時決策并行動的博弈,并不考慮決策的次序問題。動態(tài)博弈指參加者先后、依次決策并且后行動者能夠觀察到先動者所選擇的策略和行動。⑨(4)完全信息博弈與不完全信息博弈。在前一種博弈中,每一個參與者都擁有全部的相關(guān)信息,只擁有部分相關(guān)信息的便屬于后一種博弈。⑩博弈理論按照不同的標(biāo)準(zhǔn)基本可分為以上四種情況。
“田忌賽馬”這個典故是非合作博弈,也是零和博弈,這在上文中已經(jīng)提到。同時,依據(jù)上文的三個前提,它同時也是一種不完全信息狀態(tài)下的動態(tài)博弈。
四“田忌賽馬”博弈的一般擴展式及其序列均衡
上文我們提到“田忌賽馬”博弈是非完全信息動態(tài)博弈,而這種博弈則是博弈論中最為復(fù)雜的模型,也稱動態(tài)貝葉斯博弈。序列均衡是非完全信息動態(tài)博弈的核心概念。
一個動態(tài)貝葉斯博弈的擴展式為=﹛N,H,P,I,p,u﹜,其中N為參與者集合,N=﹛0,1,2,…,n﹜,0代表自然。B11H為全歷史集合,即從博弈開始到博弈結(jié)束所有可能的行動序列﹛a0,a1,…,am﹜,m為任一自然數(shù),表示一個全歷史包含的行動次數(shù)。P為參與者函數(shù)即對于每一個子歷史h,P(h)將其映射成自然或是其他參與者。I為信息空間。p為自然的概率分布函數(shù),其表示當(dāng)自然行動時,自然以多大概率選擇某個行動。u表示參與者的偏好,其定義是在全歷史結(jié)果上的收益函數(shù)。B12
在“田忌賽馬”博弈中,參與者集合N=﹛0,1,2﹜,0代表自然。H是全歷史集合,表示所有可能的行動序列﹛上中下,上下中,中上下,下上中,下中上,中下上﹜,即共有六個可能的行動。在此博弈中,由于是齊威王先行動,所以無論馬出場順序如何,作為自然的孫臏總是可以幫助田忌,以下等馬對上等馬,以中等馬對下等馬,以上等馬對中等馬(順序無先后),這樣如果把三場全勝看做“1”的話,那么田忌總有“2/3”的收益。也就是說田忌有100%的可能獲得2/3的收益。齊威王由于過分自信或者智商不高,未能識破此中玄機,所以敗下陣來。但在現(xiàn)實生活中,一方的決策是嚴(yán)格保密的,作為自然的“孫臏”并不可能事先知道“齊威王”的決策,而齊威王有六種行動序列,相對應(yīng),“田忌”也有六種,我們說過,只有一種情況可以助“田忌”勝出,所以“田忌”獲勝的概率僅為1/6。P為參與者函數(shù)即對于每一個子歷史h,P(h)將其映射成自然或是其他參與者。在此博弈中,假設(shè)一個子歷史“上中下”,那么P(h)作為一個映射將有六種;一共有六個子歷史,所以P(h)應(yīng)該有36種。I是信息空間。假設(shè)I1 是齊威王的信息空間,I1=﹛上中下,上下中,中上下,下上中,下中上,中下上﹜,I2同I1,因為他同樣不知道對方的策略。
在“田忌賽馬”這個非完全信息動態(tài)博弈中,還有一個很重要的因素需要我們注意,即參與者可能臨時改變策略,這也更帶來了決策的復(fù)雜性和不穩(wěn)定性。因為一場賽馬是由三局比賽構(gòu)成的(非同時進(jìn)行),假設(shè)第一局結(jié)束后,參與者肯定要根據(jù)這一局得結(jié)果變換策略,同時也能觀察到一部分對方的策略,這么說來,雙方獲勝的概率就不是齊威王5/6,而田忌1/6的概率了,需要更復(fù)雜的計算。
客觀而言,直到今天理論界也沒有找到能適用所有非完全信息動態(tài)博弈的均衡概念,也缺乏一個普遍的方法來求解動態(tài)博弈的序列均衡。B13
結(jié)論
“田忌賽馬”博弈不是人們想象中的那么簡單的一個博弈,反而是博弈類型中最復(fù)雜的非完全信息動態(tài)博弈,應(yīng)該對這個博弈有一個全新的認(rèn)識。并且,在這個博弈中,至少包含著兩個子博弈,這更加劇了此博弈的復(fù)雜性。博弈論思想雖然在實際生活中適用性差,但它教會我們一種思考問題的方法,對合理規(guī)避風(fēng)險,獲取最大收益還是有指導(dǎo)意義的。(作者單位:四川大學(xué))
注解
①姚國慶:《博弈論》,北京:高等教育出版社,2007年,第1頁。
②王俊冰:“白話博弈論”,《理論學(xué)習(xí)》,2006年第6期,第63頁。
③郭磊:“博弈論簡論”,《山東經(jīng)濟》,1999年第6期,第17頁。
④胡靜:“博弈論在數(shù)學(xué)中的應(yīng)用”,《商情》,2006年第4期,第213頁。
⑤《孫子吳起列傳第五》,《史記》卷六十五,中華書局,2007年4月。
⑥“黃金”在古代是一種貨幣,不同于現(xiàn)代意義上的黃金;“黃金一千”只一千兩黃金的意思。
⑦周翰光:“論孫臏的對策論和辯證法”,《齊魯學(xué)刊》,1984年第3期,第36頁。
⑧胡靜:“博弈論在數(shù)學(xué)中的應(yīng)用”,《商情》,2008年第5期,第213頁。
⑨逯彥彥:“博弈論前瞻探討”,《商丘職業(yè)技術(shù)學(xué)院學(xué)報》,2009年第1期,第33頁。
⑩胡靜:“博弈論在數(shù)學(xué)中的應(yīng)用”,《商情》,2008年第5期,第213頁。
11“自然”指在動態(tài)貝葉斯博弈中參與博弈,無收益,但可以決定不同歷史發(fā)生概率的參與者。
【關(guān)鍵詞】游戲教學(xué)法 博弈論
項目支持:陜西省教育科學(xué)“十二五”規(guī)劃項目:雙語教學(xué)“多位一體化”教學(xué)方法研究(SGH140755)。
引 言
博弈論是研究策略性決策行為的社會經(jīng)濟科學(xué)分支,提供一種思維方法,幫助在互動行為中的行為方提高發(fā)現(xiàn)和引用有效策略的技能[1]。博弈的思想起源于游戲,數(shù)學(xué)家馮?諾伊曼運用數(shù)學(xué)模式研究游戲者應(yīng)該如何在游戲中選擇自己的策略,奠定了現(xiàn)代博弈論的基礎(chǔ)[2]。由于博弈論和經(jīng)濟學(xué)的基本假定相同,強調(diào)個人理性,所以博弈論在經(jīng)濟學(xué)中獲得了最廣泛、最成功的應(yīng)用,博弈論已成為經(jīng)濟分析最合適的工具之一。目前,博弈論課程作為相關(guān)本科專業(yè)的選修課,開設(shè)時間尚不長。授課方式以教師講授理論為主,不利于激發(fā)學(xué)生的獨立思考。加之博弈論的研究過程和分析方法一定程度上依賴于數(shù)學(xué)工具,需要一定的數(shù)學(xué)基礎(chǔ),學(xué)生在學(xué)習(xí)時覺得抽象有難度,課堂教學(xué)普遍沉悶、乏味[3]。因此,博弈論的課堂教學(xué)方法急需創(chuàng)新和改革。
游戲教學(xué)法
游戲教學(xué)法是游戲和教學(xué)的結(jié)合體。游戲是在某一固定的時空范圍內(nèi)進(jìn)行的一種自愿的活動,其規(guī)則是游戲者自愿接受的,但又有絕對的約束力[4]。就游戲的內(nèi)在精神而言,教學(xué)可以成為游戲。
最早對游戲法進(jìn)行系統(tǒng)闡述的是德國哲學(xué)家康德。1952年教育和發(fā)展心理學(xué)大師皮亞杰將游戲理論延伸到教育學(xué)領(lǐng)域。1976年日本索尼公司在學(xué)員培訓(xùn)中創(chuàng)立管理游戲。此后許多世界知名大學(xué)相繼將管理游戲引入課程教學(xué)[5]-[6]。1996年北京科技大學(xué)率先引入管理游戲,國內(nèi)一些學(xué)者從理論角度探討游戲教學(xué)法的可操作性[7]-[8];另一些學(xué)者從實踐角度,將游戲教學(xué)法應(yīng)用到歷史、體育、管理學(xué)等諸多課程中[9]-[10]。然而,卻鮮見在博弈論課程教學(xué)中引入游戲教學(xué)法。
博弈起源于游戲,無論是其英文原名(Games)還是中文翻譯(博和弈是中國古代的象棋和圍棋),都體現(xiàn)了與游戲的關(guān)系。博弈論課程主要分析互動行為,論文提出在課堂教學(xué)中引入互動性很強的游戲教學(xué)方法,并實施一個具體的課堂游戲,讓學(xué)生充分參與到游戲和學(xué)習(xí)活動中,期望這種新的教學(xué)方法對博弈論的課程教學(xué)有所裨益。
“選字母”游戲的設(shè)計實施
游戲互動教學(xué)法主要用在課堂引入或重難點講解過程中,設(shè)計一些讓學(xué)生參與其中的實驗性游戲,在游戲中獨立思考,組織策略,得到游戲結(jié)果,進(jìn)而討論、反思,學(xué)習(xí)理解理論知識。
1.游戲設(shè)計。博弈的組成要素,是理解和分析博弈過程的基石。在博弈論的首次課程中,作為課程引入,設(shè)計“選字母”游戲,引入介紹博弈基本要素、靜態(tài)博弈的得益矩陣等知識。通過游戲激發(fā)學(xué)生對該課程的興趣,加深對博弈組成要素知識點的理解。
2.游戲參與。給定游戲規(guī)則:學(xué)生互不商議參與游戲,字母a、b二選一。之后將隨機把學(xué)生分為兩人一組,根據(jù)得分判斷勝負(fù):同選字母a各得2分,同選字母b各得3分,不同選擇時選a得5分,選b得1分;兩人中得分高者勝。給學(xué)生充分的時間理解規(guī)則,同時在紙上寫出自己所選擇的字母。
學(xué)生獨立思考選擇后,隨機挑選兩位同學(xué)為一組判斷勝負(fù)。為增加參與性和趣味性,可隨機多選擇幾組同學(xué),判定勝負(fù)。
3.游戲討論小結(jié)。游戲暫時告一段落,請幾位同學(xué)闡述自己選擇的理由,進(jìn)而分析游戲,講解知識點。
首先,引導(dǎo)學(xué)生分析游戲構(gòu)成,借以學(xué)習(xí)博弈的基本要素。完成游戲需要有參與游戲的人和游戲規(guī)則。游戲參與者在博弈中稱為“博弈方”。游戲規(guī)則是所有參與者都了解的內(nèi)容,在博弈中稱為“信息”。游戲規(guī)則 “字母a、b二選一”,規(guī)定了參與者在游戲中可以選擇的行為,在博弈中稱為“策略”;游戲要求所有人同時作出選擇,即規(guī)定了游戲的參與順序,在博弈中稱為“次序”;得分標(biāo)準(zhǔn)即個人在游戲中所得的結(jié)果,在博弈中稱為“收益”。進(jìn)而具體講解博弈的基本構(gòu)成要素:博弈方、策略、信息、次序、收益。
其次,在這個簡單的博弈游戲中,個人的收益依賴于自己和對手的選擇。引領(lǐng)學(xué)生用表格的形式表現(xiàn)游戲結(jié)果,下圖1為自己的收益,圖2為對手的收益:
觀察發(fā)現(xiàn)兩個表格基本一致,為表現(xiàn)更簡便,引導(dǎo)學(xué)生將表格合二為一,用數(shù)組方式表示收益:第一個數(shù)字表示左側(cè)博弈方收益,第二個數(shù)字表示上側(cè)博弈方收益,如下圖3。圖3所示的表格即是博弈的基本表達(dá)形式“得益矩陣”。
至此,通過“選字母”游戲,在輕松的學(xué)習(xí)氛圍中,學(xué)生已經(jīng)基本掌握了博弈的基本要素及得益矩陣的表達(dá)方式。過程簡潔易懂,可讓學(xué)生通過自己總結(jié)完成,以達(dá)到這節(jié)課游戲教學(xué)的教學(xué)目的。
最后,還可以提出思考問題:在考慮他人的策略下,如何選擇,可以使得自己的得益最大?如果游戲允許兩人商議,又應(yīng)該如何選擇?通過開放問題的設(shè)置,引發(fā)學(xué)生思索討論,為后續(xù)個體理性、集體理性、博弈求解等知識點作好鋪墊。
游戲教學(xué)法實施過程及原則
1.根據(jù)教學(xué)內(nèi)容,選擇并設(shè)計合適的游戲。游戲教學(xué)中,課前游戲設(shè)計是關(guān)鍵,主體是教師,應(yīng)在對課程內(nèi)容充分理解和全盤把握的基礎(chǔ)上,確定游戲教學(xué)實施的章節(jié)和知識點,進(jìn)而設(shè)計游戲。課堂游戲的設(shè)計,一方面要與知識點相關(guān)聯(lián),另一方面要有一定的趣味性和群體參與性。游戲是一種輔助教學(xué)手段,課前應(yīng)準(zhǔn)備相應(yīng)的游戲道具,細(xì)化游戲規(guī)則。原則上游戲應(yīng)簡單易行,靈活可調(diào)整,易于實施,結(jié)果便于分析。同時,應(yīng)充分考慮到游戲過程中可能出現(xiàn)的各種情況,做好準(zhǔn)備方案。
2.課堂游戲引入。教師要在合適的時機介入和結(jié)束游戲,避免學(xué)生只關(guān)注游戲而忽略知識點。根據(jù)知識特點和游戲規(guī)則,合理組織學(xué)生,分小組或個人參與游戲。游戲進(jìn)行之前,教師介紹游戲的基本內(nèi)容,闡明游戲的基本規(guī)則,可執(zhí)行的基本行為。結(jié)合實際情況,幫助學(xué)生理解和分析游戲中隱藏的信息和行為方的可選策略,對一些較有難度的策略,給予提示和簡要分析。
3.游戲體驗。游戲參與實施環(huán)節(jié)主體是學(xué)生,在理解規(guī)則的基礎(chǔ)上,獨立思考,獨立決策,理性分析,給出自己的游戲方案。游戲過程中,教師暫時不再是知識的傳授者,而是游戲的主持人或參與者,要營造寬松、自由的環(huán)境,讓學(xué)生充分發(fā)揮主動性參與其中,體會游戲帶來的樂趣。
4.游戲結(jié)果分析討論。博弈研究的是相互影響的決策行為,其結(jié)果依賴于博弈方的不同選擇。因此游戲的結(jié)果,由于參與者的不同行為而呈現(xiàn)多樣性。教師應(yīng)引導(dǎo)學(xué)生一起思考其他人的行為策略,討論各自的行為對游戲結(jié)果帶來的影響。必要時還可將游戲進(jìn)行多輪,在其中體會不同策略組合下的不同游戲結(jié)果,討論導(dǎo)致不同游戲結(jié)果的原因及博弈結(jié)果的影響因素。
5.游戲總結(jié)評析。對游戲結(jié)果的分析討論和反思,是課堂教學(xué)組織的重點。有些學(xué)生可能只享受了游戲的樂趣,卻沒有思考其中的知識。教師借助游戲講解相應(yīng)的知識點,結(jié)合游戲的組織完成過程,充分理解其中包含的博弈基本思維方式和分析方法,利用游戲幫助學(xué)生理解理論。通過這些游戲性的實驗,提高學(xué)生的興趣,然后針對不同實驗結(jié)果,教師逐步切入主題并解釋分析。有老師深入淺出的講解,再加上親身體驗,學(xué)生對知識的理解將更深刻。
進(jìn)一步,還可以讓學(xué)生嘗試用所學(xué)的知識分析游戲,思考如何在游戲中更理性地給出行為策略,以獲得最好的結(jié)果。引導(dǎo)學(xué)生理解理論體系和博弈的思維方式,體會合作意識對博弈結(jié)果的重要影響。
結(jié) 論
博弈論是一門理論及應(yīng)用性均較強的課程。論文嘗試在課程中引入游戲教學(xué)法,打破傳統(tǒng)單一的教學(xué)模式,以游戲為橋梁,讓學(xué)生充分參與到學(xué)習(xí)活動中,促使學(xué)生主動學(xué)習(xí),培養(yǎng)學(xué)生獨立分析問題情境、獨立探索思考策略的習(xí)慣和能力,同時在模擬游戲分析的過程中,感受理性與合作的重要意義及實施過程,自發(fā)在學(xué)習(xí)生活中運用博弈的思維模式,形成一種新的思維和行為方式。游戲教學(xué)法作為一種新的教學(xué)方法,在其組織過程中,對課堂的掌控還有待于在實踐中進(jìn)一步探索和完善。
參考文獻(xiàn):
[1]張維迎:《博弈與社會》,北京大學(xué)出版社。
[2]尉洪池:《博弈論和語言游戲》,《外交評論》2013年第1期,第126-138頁。
[3]李太龍:《博弈論公選課的教學(xué)內(nèi)容與方法探析》,《教育探索》2012年第1期,第42-44頁。
[4]周建平:《游戲教學(xué)觀論要》,《教育理論與實踐》2002年第22期,第56-59頁。
[5]Pearson P, Webb P. “Improving the quality of games teaching to promote physical activity”. Journal of Science and Medicine in Sport. 2006,9(1):11.
[6]Demirbilek M, Tamer S L. “Math teachers’ perspectives on using educational computer games in math education”. Procedia-Social and Behavioral Sciences. 2010(9):709-716.
[7]蔣璐:《游戲教學(xué)中的個性化與社會化的統(tǒng)一》,《中國教育信息化》2010年第8期,第16-18頁。
[8]張臻、張世波:《從熵的角度反思游戲教學(xué)》,《教育理論與實踐》2011年第31期,第51-53頁。
[9]侯雁飛:《美國數(shù)字游戲教學(xué)模式對我國歷史教學(xué)改革的啟示》,《教育科學(xué)》 2013年第29期,第82-85頁。
【關(guān)鍵詞】博弈 納什均衡 自然資源
一、博弈與博弈論
博弈論開始于《博弈論和經(jīng)濟行為》(馮?諾依曼、摩根斯坦,1944),是研究決策主體的行為發(fā)生之間相互作用時候的決策以及這種決策的均衡問題。
博弈的構(gòu)成要素有:博弈方、策略及策略空間、博弈均衡、均衡結(jié)果、信息集。博弈方指參與博弈的決策主體,本文指企業(yè)。策略及策略空間,即博弈方在有關(guān)信息情況下的行動規(guī)則,本文指企業(yè)采取的策略組合帶來的不同經(jīng)濟效益。博弈均衡是指所有博弈方的最優(yōu)策略的組合,本文指均衡指企業(yè)之間最優(yōu)策略組合。均衡結(jié)果是指所有博弈方的設(shè)一可能的行動組合,會出現(xiàn)什么樣的結(jié)果。信息集指的是博弈方有關(guān)的博弈知識,本文中不僅包括企業(yè)特征和行動如產(chǎn)量、收益,還包括政府對企業(yè)行為的規(guī)定,懲罰、鼓勵措施等。
根據(jù)博弈過程劃分,可分為靜態(tài)博弈和動態(tài)博弈。前者指博弈中,參與人同時選擇行動但并不知道前形式者采取了什么具體行動;后者指參與人的行動有先后順序,且后行動者能夠觀察到先行動者所選擇的行動。博弈還可分為完全信息博弈和不完全信息博弈。完全信息指的是一個參與者對所有參與人的特征、戰(zhàn)略空間及支付函數(shù)有準(zhǔn)確的知識;否則,就是不完全信息。本文采用完全信息靜態(tài)博弈。
二、模型假設(shè)
假定某地區(qū)有n個企業(yè),該地區(qū)的自然環(huán)境還未破壞。每個企業(yè)均有利用該地區(qū)資源的自由。為了方便分析,我們將n個企業(yè)簡化為兩個代表性的企業(yè)1和企業(yè)2。每年每個企業(yè)決定各自的產(chǎn)量。企業(yè)1產(chǎn)量為q1,企業(yè)1產(chǎn)量為q2,產(chǎn)品總數(shù)為Q=q1+q2,產(chǎn)品的價格決定函數(shù)為P(Q)=m-Q=m-q1-q2,單位產(chǎn)品的成本都為c,企業(yè)1的得益為U1 =q1×(P(Q))-q1×c,企業(yè)2的得益為U2 =q2×(P(Q))-q2×c,總體的得益函數(shù)為U=p(Q)×Q-c×Q。
三、模型求解及結(jié)論
我們首先探討兩個企業(yè)各自根據(jù)另外一企業(yè)的產(chǎn)量來決定自己最佳產(chǎn)量的情況。
企業(yè)1的效用為:max(U1)=q1×(m-q1-q2)-q1×c。企業(yè)1效用最大化的一階條件為:aU1 /aq1=m-q1-c-2q2=0,可得q1=(m-c-q2)/2。兩企業(yè)決策時地位是對等的,易得q2=(mq2-c-2q1)/2兩式聯(lián)立,得:q1 =(m-c-q2)/2,q2=(m-q2-c-2q1)/2。解得 q1 =(m-c)/3, q2=(m-c)/3。此時,U1=U2=(m-c)2/9。即在這種情況下兩企業(yè)的產(chǎn)量和得益分別都是(m-c)/3、(m-c)2/9。從兩企業(yè)構(gòu)成的總體出發(fā)來決定各企業(yè)的產(chǎn)量時,總體得益函數(shù)為:max(U)=Q×P(Q)-c×Q-Q×(M-Q-c)。整體得益最大化的一階條件為:aU/aQ=m-c-2Q=0,可得:Q=(m-c)/2。即當(dāng)總產(chǎn)量為(m-c)/2,總得益最大,此時,U=(m-c)2/4。在這種情況下若兩企業(yè)經(jīng)過協(xié)商,均承諾各自產(chǎn)量(m-c)/4,則兩企業(yè)的得益為(m-c)2/8。
若在企業(yè)1違背承諾而企業(yè)2遵守。此時對于違背承諾者企業(yè)1得益為:max(U1)=q1×[a-q1-(m-c)/4]-q1×c。得益最大化一階條件為dU1/dq1=3(m-c)/4-2q1=O,可得,q1=3(m-c)/8,U1=9(m-c)2/64。此時,企業(yè)2相應(yīng)為q2 =(m-c)/4,U=3(m-c)2/32。兩企業(yè)位置互換,結(jié)果不變。
上述效用分布情況如圖1示。
圖1對企業(yè)1而言:在企業(yè)2選擇遵守的情況下,自己選擇遵守、違背的得益分別為(m-c)2/8、9(m-c)2/64,后者大于前者;在企業(yè)2選擇違背的情況下,自己選擇遵守、違背的效用分別為3(m-c)2/32、(m-c)2/9,選擇后者得益較大。企業(yè)1從個人利益最大化的角度出發(fā),無論對方做出何種選擇,自己選擇違背將能保證自己的得益最大化。企業(yè)2決策時也同樣如此。兩個企業(yè)分別從自己的得益最大化出發(fā),都做出了違背的決策,此時(違背、違背)便構(gòu)成了一個納什均衡。這個組合是所有組合中效果最差的,兩個企業(yè)紛紛增加產(chǎn)量,走入了破壞地區(qū)資源的怪圈,每個企業(yè)都從個人得益最大化出發(fā),結(jié)果既沒真正實現(xiàn)個人得益最大化,也沒實現(xiàn)總體的最大得益。在這種情況下的效用對個人、對整個社會而言,都是低效率的。顯然,這種結(jié)果是個人和社會都不愿意看到的。
四、模型改進(jìn)
在上面模型中對每個企業(yè)而言違背是占優(yōu)策略,企業(yè)無積極性去遵守承諾來打破(違背、違背)這一納什均衡的,從而陷入一個低效率利用資源的怪圈。為了提高地區(qū)資源的利用率,我們加入另一影響因素,假設(shè)在該模型中還存在一個對當(dāng)?shù)刭Y源有效利用負(fù)責(zé)的組織,如某一政府部門,它對于兩個企業(yè)具有完全信息并且其決定具強制力。該機構(gòu)從整體利益出發(fā),規(guī)定企業(yè)產(chǎn)量(m-c)/4,如果有企業(yè)超出此范圍,將對超出的企業(yè)生產(chǎn)的每單位產(chǎn)品給以p(m>p)的罰款,且對遵守規(guī)定的企業(yè)進(jìn)行補貼,確保得益為(m-c)2/8。①若雙方都遵守,雙方得益無變化,都為(m-c)2/8。②若企業(yè)1違背,它的得益max(U1)=q1×[m-q1-(m-c)/4]-q1×(p+c)。此時效用最大化條件為dU1/dq1=3(m-c)/4-p-2q1=0,得q1=3(m-c)/8-b/2,U1=[3(m-c)/8-p/2]2 此時企業(yè)2的得益為U2=(m-c)/8。兩企業(yè)位置互換,結(jié)果不變。③若雙方都不遵守,效用函數(shù)為:max(U1)=q1×[m-q1-q2]-q1 ×(p+c)。
根據(jù)模型未改進(jìn)時的求解情況,得q1=q2=(m-p-c)/3, U1=U2=(m-p-c)2/9。此時模型的得益分布情況如圖2所示。
圖2企業(yè)1在追求利益下遵守承諾應(yīng)滿足條件(m-c)2/8>[3(m-c)/8-p/2]2 ,解得p的范圍是(3-23/2 )×(m-c)/4
五、結(jié)論
分析表明,通過相關(guān)的組織制定對違規(guī)者進(jìn)行有效的處罰以及對因合理使用而承受損失風(fēng)險者以合理的補貼,并以貫徹實施,“公用地悲劇”可以得到改善。
整體性原則“整體大于各部分之和”是系統(tǒng)論最核心的內(nèi)容,整體觀和系統(tǒng)觀改變和影響了二十世紀(jì)五、六十年代以后的整個社會思維方式,導(dǎo)致了“整體設(shè)計”(EntireDesign)概念的提出。“整體設(shè)計主要是把城市當(dāng)作一個有機的整體去看待,即一個局部和另一個局部是相互依存而發(fā)揮作用的”。“環(huán)境的形式是整體的、統(tǒng)一和局部的變化,房屋是局部,環(huán)境是整體”。作為局部的建筑是通過人的生活結(jié)構(gòu)、行為活動將之統(tǒng)一在一起的。整體性原則在本文中主要指的是外顯因素,在城市建設(shè)上主要表現(xiàn)為外在的共同秩序,注重表現(xiàn)嚴(yán)格的整體秩序和幾何形式的邏輯性,使建筑和城市具有一種秩序化,簡晰化的整體性。例如:某濱江住宅區(qū)設(shè)計,上級規(guī)劃確定該地段是某市濱江重要景觀地帶,需重點考慮城市景觀效果,該方案缺乏從整體城市角度的出發(fā)的設(shè)計思維,誤讀上級規(guī)劃原則,注重表現(xiàn)建筑的自我,單從建筑本身的角度而言美輪美渙,而從沿江整體景觀形態(tài)角度而言,割裂了優(yōu)美的城市綠帶,嚴(yán)重破壞了整體的濱江景觀效果。又如:該住宅區(qū)設(shè)計中從整體分析城市居民活動需求,設(shè)置聯(lián)系濱江區(qū)域和上部城市區(qū)域的城市步行系統(tǒng),即完善了城市的功能,也為建筑引入了活力,使得建筑的開發(fā)價值得到提升,從這個角度看,這是很好的從整體考慮城市和建筑關(guān)系的例子。
關(guān)聯(lián)性原則
關(guān)聯(lián)性原理也是系統(tǒng)論的重要原理,系統(tǒng)之間以及組成系統(tǒng)各子系統(tǒng)之間具有相互關(guān)聯(lián)、相互作用的性質(zhì),各元素的關(guān)聯(lián)和協(xié)調(diào)是保證總系統(tǒng)最優(yōu)狀態(tài)的基本條件。城市是由多個層次、眾多子系統(tǒng)組成的復(fù)雜系統(tǒng),體現(xiàn)為各組成要素之間的相互影響和相互制約作用。其構(gòu)成元素具有多樣化的特點,就城市的建筑學(xué)屬性而言,形式和功能要素包括:建筑、自然地形地貌、交通設(shè)施、開敞空間等諸多構(gòu)成要素,就城市的社會屬性而言,包括經(jīng)濟、政治、文化等各要素,各構(gòu)成元素間相互是有關(guān)聯(lián)的。關(guān)聯(lián)性原則體現(xiàn)在城市建設(shè)上主要表現(xiàn)為內(nèi)在的聯(lián)系秩序,從城市出發(fā)的建筑設(shè)計應(yīng)考慮對設(shè)計地塊有影響的城市功能、景觀、文化的內(nèi)在聯(lián)系,如交通條件、歷史文脈、功能配套等。例如:某市區(qū)商業(yè)區(qū)某綜合建筑設(shè)計,綜合考慮城市步行功能和建筑本身的商業(yè)功能的內(nèi)在功能關(guān)聯(lián),建筑設(shè)計運用內(nèi)街,內(nèi)廣場,階臺廣場等多種建筑空間的設(shè)計手法,完善了城市步行系統(tǒng)功能,城市空間更好的得到使用。豐富了城市空間形態(tài),提升了城市空間品質(zhì),也為建筑自然引入了人氣,增加了豎線便捷度,大大的提升了建筑的商業(yè)價值。這是很好的從關(guān)聯(lián)考慮城市和建筑關(guān)系的例子。
統(tǒng)一性原則
通過博弈論的分析我們知道,建筑作為城市的構(gòu)成元素代表了不同利益團體的價值取向,承擔(dān)了城市社會屬性和建筑學(xué)屬性的雙重構(gòu)成角色,具有技術(shù)與邏輯、經(jīng)濟與政治、藝術(shù)與審美等多重屬性。作為個體的城市建筑,必須從整體的角度來確定自己的設(shè)計要點,做到政治、經(jīng)濟、文化等社會元素與空間、功能、形式等建筑元素的兼顧,達(dá)到作為城市的社會屬性構(gòu)成和建筑學(xué)屬性構(gòu)成的統(tǒng)一性,才能使建筑以及相關(guān)區(qū)域的整體價值最大化。統(tǒng)一性原則表現(xiàn)在本中指的是城市社會屬性和建筑自身屬性的統(tǒng)一,合理的城市的構(gòu)成必須是社會屬性和建筑學(xué)的屬性的共同協(xié)調(diào)。例如:某山鎮(zhèn)抗戰(zhàn)文化風(fēng)貌整治,該建筑整治對象為該鎮(zhèn)中心區(qū)建筑,該現(xiàn)狀建筑大多屬于老舊建筑,改造的經(jīng)費很少,工期要求很緊張。而且隨著城市更新的步伐近年內(nèi)將會整體的拆除改造,設(shè)計上所采用該抗戰(zhàn)風(fēng)貌類似色彩和簡化的符號,雖然從單體的本身來看顯的粗糙,但整體風(fēng)格協(xié)調(diào)。保證了在很少的資金和時間的前提下對鎮(zhèn)區(qū)環(huán)境風(fēng)貌整治效果。在達(dá)到城市要求的整體風(fēng)貌文脈效果的前提下,適度的設(shè)計,節(jié)約了社會資源,統(tǒng)一了城市的社會利益和建筑的經(jīng)濟利益。這也是很好的從整體考慮城市和建筑關(guān)系的例子。
關(guān)鍵詞:系統(tǒng)穩(wěn)定性;復(fù)合系統(tǒng);團體貸款
中圖分類號:F830.58
文獻(xiàn)標(biāo)識碼:A
文章編號:1009-9107(2012)04-0063-05
引言