古詩詞大全網 - 成語故事 - 什麽是博弈?

什麽是博弈?

與博弈有關的理論稱博弈論(Game Theory),

博弈論是指某個個人或是組織,面對壹定的環境條件,在壹定的規則約束下,依靠所掌握的信息,從各自選擇的行為或是策略進行選擇並加以實施,並從各自取得相應結果或收益的過程,在經濟學上博奕論是個非常重要的理論概念。

什麽是博弈論?古語有雲,世事如棋。生活中每個人如同棋手,其每壹個行為如同在壹張看不見的棋盤上布壹個子,精明慎重的棋手們相互揣摩、相互牽制,人人爭贏,下出諸多精彩紛呈、變化多端的棋局。博弈論是研究棋手們 “出棋” 著數中理性化、邏輯化的部分,並將其系統化為壹門科學。換句話說,就是研究個體如何在錯綜復雜的相互影響中得出最合理的策略。事實上,博弈論正是衍生於古老的遊戲或曰博弈如象棋、撲克等。數學家們將具體的問題抽象化,通過建立自完傅穆嘸?蚣堋⑻逑笛芯科涔媛杉氨浠?U飪剎皇羌?菀椎氖慮椋?宰羆虻サ畝?碩贊奈?韻胍幌鹵闃?酥寫笥行?睿喝艏偕杷?蕉季?返丶塹米約漢投允值拿懇徊狡邇葉際親睢襖硇浴?的棋手,甲出子的時候,為了贏棋,得仔細考慮乙的想法,而乙出子時也得考慮甲的想法,所以甲還得想到乙在想他的想法,乙當然也知道甲想到了他在想甲的想法…

面對如許重重迷霧,博弈論怎樣著手分析解決問題,怎樣對作為現實歸納的抽象數學問題求出最優解、從而為在理論上指導實踐提供可能性呢?現代博弈理論由匈牙利大數學家馮·諾伊曼於20世紀20年代開始創立,1944年他與經濟學家奧斯卡·摩根斯特恩合作出版的巨著《博弈論與經濟行為》,標誌著現代系統博弈理論的初步形成。對於非合作、純競爭型博弈,諾伊曼所解決的只有二人零和博弈--好比兩個人下棋、或是打乒乓球,壹個人贏壹著則另壹個人必輸壹著,凈獲利為零。在這裏抽象化後的博弈問題是,已知參與者集合(兩方) ,策略集合(所有棋著) ,和盈利集合(贏子輸子) ,能否且如何找到壹個理論上的“解” 或“平衡” ,也就是對參與雙方來說都最“合理” 、最優的具體策略?怎樣才是“合理” ?應用傳統決定論中的“最小最大” 準則,即博弈的每壹方都假設對方的所有功略的根本目的是使自己最大程度地失利,並據此最優化自己的對策,諾伊曼從數學上證明,通過壹定的線性運算,對於每壹個二人零和博弈,都能夠找到壹個“最小最大解” 。通過壹定的線性運算,競爭雙方以概率分布的形式隨機使用某套最優策略中的各個步驟,就可以最終達到彼此盈利最大且相當。當然,其隱含的意義在於,這套最優策略並不依賴於對手在博弈中的操作。用通俗的話說,這個著名的最小最大定理所體現的基本“理性” 思想是“抱最好的希望,做最壞的打算” 。

雖然二人零和博弈的解決具有重大的意義,但作為壹個理論來說,它應用於實踐的範圍是極其有限的。不提耽於遊戲的玩家,可以說除了軍事競爭,幾乎難再有用武之地。二人零和博弈主要的局限性有二,壹是在各種社會活動中,常常有多方參與而不是只有兩方;二是參與各方相互作用的結果並不壹定有人得利就有人失利,整個群體可能具有大於零或小於零的凈獲利。對於後者,讓我們來看壹個歷史上最經典的有趣個例: “囚徒困境” 。話說警方抓到兩個盜竊犯,惜證據尚不足,遂寄希望於嫌犯自己招供。警方把兩個犯人隔離起來,分別審問,交代政策如下:坦白從寬,抗拒從嚴!如果妳招了,另壹個人沒招,那麽就將妳釋放,另壹人判20年;同樣如果妳不招,另壹個人招了,那麽妳得被判20年,另壹個人被釋放。如果兩個人都招,警方證據就足了,兩人都判10年。至於兩個人都不招的情況,不用警方交代,兩個人都得判,但因證據不力,判得都要輕許多,比如1年。警方最後說,那邊還有個警察,對妳的同夥交代壹模壹樣的政策呢。罪犯心裏打起小九九,如果對方招了,我招是10年,不招是20年,是招劃算;如果對方不招,我招是無罪釋放,不招是1年,還是招劃算。於是乎,招!兩個“精明” 的小偷都招了,都被判了10年,正中警方下懷。聰明的讀者,其實如果兩個小偷都不招,就會被各判1年,對他們來說豈不更好?在這個囚徒困境問題中,參與者仍是兩名(兩個盜竊犯) ,但這不再是壹個零和的博弈,人受損並不等於我收益。兩個小偷可能壹***被判20年,或壹***只被判2年。

對於多人參與、非零和的博弈問題,在納什之前,無人知道如何求解,或者說怎樣找到類似於最小最大解那樣的“平衡” 。而找不到解,下面的研究當然無法進行,更談不上指導實踐了。納什對博弈論的巨大貢獻,正在於他天才性地提出了“納什均衡” 的基本概念,為更加普遍廣泛的博弈問題找到了解。納什均衡的基本思想是,在這個解集中所有參與者的策略都是對其他參與者所用策略的最佳對策,沒有人能夠通過單單改變自己的策略提高收益。以前面的囚徒困境為例,如果小偷甲相信小偷乙招供,那麽他的最佳策略是招供,而如果小偷乙相信小偷甲招供,那麽他的最佳策略仍是招供。這就是壹個納什均衡,它是“自確定” 的。在囚徒困境中,只存在壹個納什均衡。但若將條件改變壹下,在許多其它的具體問題中,納什均衡可能不止壹個。納什巧妙地運用數學技巧,證明了如下納什定理:對於任何壹個n人參與,非合作博弈(零和或非零和) ,如果每個參與者都只有有限條策略,那麽壹定存在至少壹個納什均衡解集。象許多科學上最傑出的思想壹樣,這壹概念以極簡潔明了的方式解決了懸而未解的難題。看似簡單,似乎屬於那種“本來我也能想到” 的東西,然而那時除了納什,壹代宗師諾伊曼也沒有想到。納什均衡的提出,對博弈論的發展產生了革命性的影響,納什均衡的概念已成為現代博弈論的基石和中心(雖然在少數博弈理論家中此點仍有爭議) 。納什的好友,普林斯頓大學經濟學教授迪克西特曾說,“如果每次有人說起或寫下納什均衡這幾個字,納什都能拿到壹塊錢的話,那麽他現在會是個大富翁了!”

上面提到的博弈理論試圖解決的都是非合作型問題,也就是參與者之間除了決策結果相互影響,沒有其它形式的信息交流。通過囚徒困境壹例可以看出,如果參與者兩個小偷之間能夠彼此商議,他們做出的策略決定會截然不同(當然是兩人壹起抵賴劃算) 。誠然,在各種生活行為中,人與人之間除了競爭關系,還存在合作關系,常常是兩種關系並存,合理的合作能夠給雙方帶來***同利益。這是合作型博弈論研究的範疇。諾伊曼在《博弈論與經濟行為》壹書中建立了合作型博弈論的基本模型,但是對於其中及其重要的雙向協商問題(即參與者如何“討價還價”) ,沒有能給出壹個確定的解。納什對這壹領域同樣做出了卓越貢獻,他不僅提出了討價還價問題的公理化解法,直接裨益勞動經濟和國際貿易,還在理論上利用這個解法良好的預測性進壹步提出納什方案:將合作型博弈中的協商轉化為壹個更廣泛的非合作型博弈的壹個步驟--協商的目的最終仍是最大化自己的利益。此外,在測試博弈論的行為實驗學上,納什也是壹名先驅。他曾展開討價還價和聯盟形成的實驗,並曾敏銳地指出,在其他實驗者的囚徒困境實驗裏,反復讓壹對參與者重復實驗實際上將單步策略問題轉化成了壹個大的多步策略問題。而後壹思想初次提示了後來發展起來的在經濟和政治領域起重要作用的重復博弈理論中緘默***謀的可能性。

這些也許看起來略顯枯燥的理論,以邏輯推理為工具對人們日常生活中的競爭和合作行為進行嚴謹有序的數學歸納,當數學家們孜孜不倦地將直覺上升為科學,再反作用於生活時,其影響之深遠難以盡述。今天,納什為之做出基礎性貢獻的現代博弈理論經過許多專家的不斷發展,不僅自身理論體系日臻成熟和完善,而且被廣泛應用於經濟學、政治學、軍事學甚至生物學等各個領域。在生物學領域,博弈論被用於研究種族遺傳學和進化生物學中種間和種內的競爭,以及單個基因之間的競爭,並反過來推動博弈論的思想發展。在政治、軍事學領域,博弈論被用於分析選舉策略、戰爭起因、立法議程安排等等重大事宜。在經濟學領域,博弈論更是已經融入整個學科的主流,經濟學教材和雜誌無不收入博弈論的內容,經濟學家們已經把研究策略相互作用的博弈論當作最合適的分析工具分析各類經濟問題,諸如公***經濟、國際貿易、自然資源經濟、工業管理等等,等等。就博弈論應用於經濟學的直接效益,舉個實例,如《美麗心靈》壹書中提到,1994年美國政府向商家拍賣大部份電磁波譜。這壹多回合拍賣由壹批博弈論專家本著最大化政府收益和各商家的利用率原則精心設計,取得極大的成功。政府獲得超過壹百億美元的收入,各頻率的波譜也都找到了滿意的歸宿。與此相對映的是,新西蘭壹個類似卻沒有經過博弈理論設計的拍賣會慘遭失敗。政府只獲得預計收入的15%,而被拍賣的頻率也未能物盡其用。譬如因為無人競爭,壹個大學生只花1美元就買到了壹個電視臺許可證!正因為博弈論對現代經濟學具有如此重大的沖擊和影響,1994年瑞典皇家學院宣布該年全世界科學家的最高榮譽諾貝爾獎之經濟學獎頒發給包括納什在內的三位數學家,以表彰他們對非合作型博弈論的開拓性分析。

今年的諾貝爾經濟學獎項就是博弈論在經濟學中的應用成果