男女扒开双腿猛进入爽爽免费,男生下面伸进女人下面的视频,美女跪下吃男人的j8视频,一本色道在线久88在线观看片

日常生活中的博弈模板(10篇)

時間:2023-10-12 10:26:20

導言:作為寫作愛好者,不可錯過為您精心挑選的10篇日常生活中的博弈,它們將為您的寫作提供全新的視角,我們衷心期待您的閱讀,并希望這些內容能為您提供靈感和參考。

篇1

而在臟臉博弈中,我看到了公共知識的巨大力量。那個印象深刻的,因為一個公共知識而導致村莊死了100個男人的故事,依然感到很不可思議。在日常生活中,有很多事情人們都心照不宣。他們各自知道某件事情,但不知道別人知不知道他們知道。而一旦這件事情成為公共知識,就可能引起很大的影響。而公共知識也是人們日常生活中必不可少的交流基礎,比如地球是圓的,我們都知道地球是圓的,那么在這一點上就能達成共識,當許多事情都達成共識,那么人們的交流也就更加順暢。

篇2

(武漢科技大學中南分校 文法學院,湖北 武漢 430223)

摘要:本文把博弈論基礎課程中介紹的策略式思維方法和能力納入到成功素質的五大體系之中,論述了博弈意識和策略思維能力是現代競爭社會中成功人士的必備素質。通過分析博弈論課程中的經典案例,探討了如何處理博弈中的策略問題,并由此引出了博弈意識的兩個核心要點:一是換位思考、改變觀點;二是向前展望、倒后推理。通過分析案例探討了成功素質教育的策略觀。

關鍵詞:成功素質教育;博弈論;策略思維

一、成功素質教育理念與博弈論和策略思維

成功素質教育是武漢科技大學中南分校率先提出的一種以促進人的成功為最終目的的教育理念。研究成果表明:成功素質的外延包括五大體系,即:觀念體系,主要包括世界觀、價值觀、人生觀和敬業精神、拼搏精神、創新精神等;品格體系,主要包括人格、道德、誠信、毅力、性格、風度、氣質、修養、心態等;方法體系,主要包括學習方法、思維方法和操作方法等;能力體系,主要包括領導、組織、管理、觀察、分析、表達、協調、溝通、應變、公關、體能等;知識體系,主要包括專業知識和非專業知識。在成功素質的五大體系中,觀念體系是核心體系。能力體系和方法體系是五大體系的重要組成部分。當代中國已經實施了市場經濟,國際化的步伐日益加快,在日常生活、學習和工作的方方面面,顯現出越來越明顯的競爭態勢,正逐步形成越來越嚴峻的競爭格局。如何在政治經濟、軍事體育乃至于日常生活中看清楚競爭對手的策略、并戰而勝之或取得雙贏,是國家或組織或個人所面臨的重要問題。

策略思維是關于了解對手打算如何戰勝你,然后戰而勝之的藝術。是在競爭環境下必須具備的能力或者方法。我們每個人都會在工作和日常學習、生活中用到策略思維。學習需要策略,就業需要策略,生意人和企業必須借助有效的競爭策略才能生存發展,政治家必須設計競選或施政策略等等。總之,學業成功、就業成功、創業成功和事業成功離不開策略思維的能力和方法。關于策略思維的科學稱為博弈論,博弈論原本是數學的一個分支,是一門相對年輕的科學,雖然其歷史尚不足50年,但由于它較好地解決了對競爭等問題的可操作性分析,已經成為經濟學中激蕩人心的一個研究領域。隨著研究的深入,人們認識到我們身邊的許多行為、現象都可用博弈來概括。當代“最后一個經濟學全才”保羅•薩繆爾森教授說,“要想在現代社會做一個有文化的人,你必須對博弈論有一個大致的了解”。成功素質教育的作用對象是在校的大學生,他們是將要掌握先進科學技術知識和把握先進文化方向的即將走進社會的中高級應用型人才,理應對博弈論知識和策略思維的方法有一定的理解,并能應用到實踐中去。

二、博弈論中的經典案例及其對成功素質教育的啟示

成功素質教育認為,塑造大學生的成功素質,必須圍繞專業素質和非專業素質兩大領域展開。專業素質是指人們實現成功所必備的具有專業特性的素質;非專業素質是指雖不具有專業特性但同樣是人們實現成功所必備的且對專業素質的形成與發揮起“倍增器”作用的素質。專業素質和非專業素質共同構成成功素質,兩者缺一不可。博弈意識和策略式思維能力已經成為各界成功人士必須具備的成功素質。分析和研究博弈論中一些經典案例,可從中體會到策略式思維的基本方法,感受到策略式思維的巨大魅力,從而有利于培養學生的成功素質。

(一)囚徒困境

假設警察局抓住了兩個合伙犯罪的嫌疑犯,但獲得的證據并不十分確切,對于兩者的量刑就可能取決于兩者對于犯罪事實的供認。警察局將這兩名嫌疑犯分別關押以防他們串供。兩名囚徒明白,如果他們都交代犯罪事實,則可能將各被判刑5年;如果他們都不交代,則有可能只會被以較輕的妨礙公務罪各判1年;如果一人交代,另一人不交代,交代者有可能會被立即釋放,不交代者則將可能被重判8年。

兩個囚徒該如何選擇呢?

對于兩個囚徒總體而言,他們設想的最好的策略可能是都不交代。但任何一個囚徒在選擇不交代的策略時,都要冒很大的風險。換句話說,一旦自己不交代而另一囚徒交代了,自己就將可能處于非常不利的境地。因此,囚徒在考慮自己策略選擇的時候,必須站在對手的角度來考慮策略。對于囚徒A而言,不管囚徒B采取何種策略,他的最佳策略都是交代。對于囚徒B而言也是如此。最后兩人都會選擇交代。這就是該博弈問題的解,是一個納什均衡。該問題反映了個體理與集體理之間的矛盾和沖突,叫做囚徒困境。

我們可以利用囚徒困境模型來分析日常生活中的許多不合作現象。例如出售同類產品的商家之間本來可以通過共同將價格維持在高位而獲利,但實際上卻是相互殺價,結果都賺不到錢。當一些商家共謀將價格抬高,消費者實際上不用著急,因為商家聯合維持高價的壟斷行為一般不會持久,可以等待壟斷的自身崩潰,價格就會掉下來。又如住戶在公共樓道里堆滿了雜物,結果大家都極不方便。但你如果不占用公共樓道,別人也會占用。每一居住面積狹小的住戶從自我利益最大化出發,都會選擇占用。但占用的結果卻最終損害了大家的利益。

在博弈論分析中,一定場合中的每個局中人在決定采取何種行動時都策略地、有目的的行事,他考慮到他的決策行為對其他人的可能影響,以及其他人的行為對他的可能影響,通過選擇最佳行動計劃,來尋求收益或效用的最大化。該案例啟示我們換位思考、改變觀點。我們希望你可以站在競爭對手的位置來進行策略思考,進而從別人的角度觀察這個世界。正確做到這一點對于找到你自己的最佳策略是必不可少的。不過,從別人的角度思考和觀察這個世界做起來并不容易。人們習慣于把別人看做和我們一樣的人,而不是完全不同的類型。博弈論的思維方式則要求你哪怕完全不能同意他們的見解,也要設身處地,仔細分析自己若處于對方的境地,思路會有什么變化。

(二)海盜分金

有5個海盜搶得了窖藏的100塊金幣,并打算瓜分這些戰利品。他們的習慣是按下面的方式進行分配:在5張紙條上分別寫了1、2、3、4、5這五個數字,然后抓鬮,抓到1的海盜就先提出分金幣的方案,然后所有的海盜(包括提出方案者本人)就此方案進行表決。如果有超過一半的海盜同意,就按照1號提出的方案分配,否則,1號海盜被扔進大海,再由2號海盜提出分配方案,規則同上...請問1號海盜應提出什么樣的分配方案?

所有的海盜都樂于看到他們的一位同伙被扔進海里,不過,如果讓他們選擇的話,他們還是寧可得一筆現金。他們當然也不愿意自己被扔到海里。所有的海盜都是有理性的,而且知道其他的海盜也是有理性的。這些金塊不能再分,也不允許幾名海盜共有金塊,因為任何海盜都不相信他的同伙會遵守關于共享金塊的安排。這是一伙每人都只為自己打算的海盜。

分析這個策略游戲的奧妙就在于應當從結尾出發倒推回去。當游戲快要結束時,你很容易看出應如何分配這些金幣。如果從游戲的開頭出發進行分析,那是走不了多遠的。其原因在于,所有后續人員的決策方案都是要確定:“如果我這樣做,那么下一個人會怎樣做?”

記住了這一點,就可以知道我們的出發點應當是游戲進行到只剩兩名海盜(假設前面3個海盜都被仍進大海了)――即4號和5號――的時候。這時提出分配方案的海盜是4號,而他的最佳分配方案是不存在的,因為不論他提出什么方案,5號海盜都是反對。5號海盜獨自得100枚金幣。

倒退回到上一步,現在加上3號海盜。4號海盜知道,如果3號的方案被否決,那么最后將只剩2個海盜,而4號將肯定一無所獲――此外,3號也明白4號了解這一形勢。因此,只要3號的分配方案給4號一點甜頭使他不至于空手而歸,那么不論3號提出什么樣的分配方案,4號都將投贊成票。因此3號需要分出盡可能少的一點金子來賄賂4號海盜,這樣就有了下面的分配方案:3號海盜分得99塊金子,4號海盜得1塊金子,5號海盜一無所獲。簡寫為(99,1,0)。

2號海盜的策略也差不多。他需要有50%以上的支持票,因此需再找二人做同黨。他可以給同黨的最低賄賂是1塊金子,而他可以用兩塊金子來收買4號和5號海盜。因此,4號的分配方案應是:(98,0,1,1)。

1號海盜的策略稍有不同。他需要收買另兩名海盜,因此至少得用2塊金子來賄賂,還要比2號的方案多拿出一塊才能使自己的方案得到采納。他的分配方案應該是:(97,0,1,0,2)或(97,0,1,2,0)。

該案例啟示我們向前展望、倒后推理。這里說的是做出一系列行動和反行動,預計沿著你現在前進的道路走下去,最后你會到達哪里。“向前展望、倒后推理”法則告訴你,應該首先確定自己最后希望達到什么目標,然后從這個結果倒后研究,直到找出自己現在應該選擇哪條道路,這樣才能保證以后可以達到那個目標。

在企業管理中人們經常談到學習邯鋼經驗,邯鋼成本控制經驗的核心其實就是“向前展望、倒后推理”方法的典型應用。“海盜分鉆石”據說是美國著名軟件公司招收員工時的考題,20分鐘內給出正確答案的人,年薪可以達到8萬美元。從中可以看出,世界最成功企業之一的軟件公司對員工素質提出的要求或標準;而成功素質教育的辦學理念中提出的超前發展、創新教育和實用教學等理念,要求把最新的最有用的知識傳授給學生,培養學生的成功素質,這與世界一流公司的用人理念有著相同的地方。

三、成功素質的策略觀

成功者離不開拼搏,博就是博弈,博弈是離不開策略的。構成一個博弈最基本的三個要素就是局中人、策略空間與得益函數。成功素質教育的策略觀,即要求人們具備博弈意識,也要求人們在各種博弈中必須把握和采用幾種共性的策略。其中威脅和反威脅、合作與不合作、先動與后動等策略是最重要的幾種。

在博弈中,人們經常采用威脅策略,但其他博弈方也會采取對威脅的辨別和反威脅策略。介紹一個前面提到過的托馬斯•謝林教授的小故事。若干年前,哈佛大學一幫學生來到謝林的課堂,他開始對學生講學這門課有多難,有些學生便離開了教室。之后,他詳細講述了他就這門課對學生提出的要求:極端嚴格和極其刻苦,更多的學生溜掉了。最后,只剩下幾個人在座位上惴惴不安,直冒冷汗,他卻告訴這幾個人放松。剛才那番強硬的說詞是他的一個計策,為的是讓上這門課的人數降到可以控制的范圍內,保證只有最刻苦的學生上他的課。后來,他的確讓這些學生很刻苦地學習。他們順利完成這門課之后,都覺得這個理論真的至關重要,教授也棒極了。在這場師生博弈中,托馬斯•謝林采用了一種比較溫和的“威脅”策略。對博弈論不夠堅定的學生相信了威脅,失去了機會;而對博弈論堅定不移的學生終于得到了世界一流大師的教誨,終生受益。

美國密西根大學的羅伯特愛克斯羅德經過計算機模擬“囚徒困境”發現,在重復博弈中,如果博弈的次數是無限的,博弈方會選擇相互合作的策略。但如果重復博弈的次數較少,則合作就不可能實現。這就是重復“囚徒困境”的結論。在我國的反腐敗斗爭中。

1983年美洲杯帆船賽前4輪結束后,丹尼斯康納的“自由號”在這項共有7輪比賽的重要賽事中暫時以3勝1負的成績排在首位。在第5輪比賽開始時,由于對手“澳大利亞二號”搶在發令槍之前起步,不得不退回到起點線后再次起步,這使“自由號”獲得了37秒的優勢。澳大利亞隊的船長約翰伯特蘭打算轉到賽道左邊,滿心希望風向發生變化,可以幫助他們趕上去。丹尼斯康納則決定將“自由號”留在賽道右邊。這一回,伯特蘭大膽押寶押對了,因為風向果然按照澳大利亞人的心愿偏轉了5度,“澳大利亞二號”以1分47秒的巨大優勢贏得這輪比賽。人們紛紛批評康納,說他策略失敗,沒能跟隨澳大利亞隊調整航向。再賽兩輪之后,“澳大利亞二號”贏得了決賽桂冠

一般來講,成績領先的帆船,通常都會照搬尾隨船只的策略。一旦遇到尾隨的船只改變方向,那么成績領先的船只也只會照做不誤。這就是博弈論中的后動優勢,如果雙方的技術實力相當,帆船比賽的輸贏在很大程度上是賭風向的比賽。在1983年的那場比賽中,當以3∶1的場數領先的美國人又以37秒領先時候,他們就獲得了后動優勢:澳大利亞人押什么風向,他們就跟隨押什么風向。這樣,他們就可以做到萬無一失,因為如果澳大利亞人押對了,他們也跟著押對,盡管可能因為決策晚一點而輸掉幾秒,卻很難把37秒輸光,同樣,如果澳大利亞人押錯了,那么大家都錯,那37秒的優勢仍然管用。

總之,成功素質教育的策略觀至少應該包括識別威脅或許諾是否可信,更加善于思考,具備深邃的洞察力;學會和競爭對手合作,共同獲得雙贏;學會掌握競爭中的主動權等。

參考文獻

[1]張維迎.博弈論與信息經濟學[M].上海:上海三聯書店,上海人民出版社,1996.

篇3

一、博弈論教學

博弈論也稱對策論,是研究在特定情境中互動決策問題的一門學科。著名的經濟學家薩繆爾森說過,“要想在現代社會做一個有文化的人,你必須對博弈論有一個大致了解”。

博弈論作為一門經濟學專業重要的專業課,在各大高校經管類專業中都有開設,而且以專業必修課居多。而且博弈論的方法,在我們日常生活決策中有重要的應用。它教給我們一種理性思維去分析生活當中的事情。其實博弈論的思想在我們的生活當中已經廣泛滲透。比如,小時候石頭剪刀布的游戲;小學語文課本中“田忌賽馬”的故事;生活中的討價還價等,都是博弈思想。只是當時我們還沒有接觸到這個概念,沒有系統完整的去學習。

大學課堂給了我們這個機會去更加深化思維,更深入的學習博弈知識,從而更好的在生活中應用博弈方法。但是目前博弈論課堂教學方法單一,主要依托講授習題練習,結合案例。學生的參與不足,理論與實踐的結合不足。所以怎樣豐富博弈論課堂,加大信息量,更多的體驗博弈論思想在生活中的積極應用,調動學生的積極參與,是博弈論教學改革的一個方向。而慕課不失為一種有效的手段。

二、慕課

慕課是二十世紀興起的一種網絡課程模式。以大范圍,形式新穎等特點,為大家廣泛地應用于現代教學中。目前慕課在國內外已經得到了長足發展,中國2014年在網注冊的慕課學員已經達到60多萬,這個數字還在繼續增長。現在已經有很多專業從事制作慕課的團隊,也完全能滿足各類學員各類課程的要求。

三、慕課與博弈論教學的結合

慕課具有完整的知識體系。作為一種方便的自學方式,慕課完整的知識體系可以作為博弈論課程的補充。彌補傳統課程課時不足,信息量有限的弊端。傳統課堂一節課50分鐘,各大高校博弈論課程安排34-51課時。有限的時間內,很難去更多地教授博弈論的知識,很難有更多的時間去體會博弈論思想在現實生活當中的應用。但如果能在傳統博弈論課程當中結合慕課,那么部分知識,包括大量的案例,情景O定等都可以通過慕課來完成。

慕課具有范圍廣的特點。博弈論作為一門專業課程,在經管類院校中被廣泛開設,基本上所有專業都要學習該課程。但是學校資源有限,老師的精力有限,而且各專業課時不一致,深度要求不同。僅憑傳統課堂,無法完全滿足學生的學習需要。慕課作為一種網絡課程,范圍廣,不受時間地點的限制,學生只要網上報名就可以學習,可以很方便的去彌補傳統課堂實體資源有限的缺點。完全可以滿足全校所有專業學生同時學習的要求,既方便又快捷。

慕課具有開放性。慕課作為一種網絡課程,對學員沒有限制。任何學員只要在線注冊就可以參與,有利于博弈論教學在全校的開展。雖然博弈論是經管類專業的專業課。但是很多非經管類專業的學生也有很大的需求想要學習該課程,所以當資源有限,不能全部安排課程的時候。慕課就起到了良好的作用,可以供任何專業的學生學習。同時去全民推廣博弈論課程也有利于經濟素養的提高,有利于國家政策的制定和執行。

慕課形式新穎。能方便的演示實驗,模擬情境,可以充分激發學生的興趣,能讓學生更真實感受博弈思想在日常生活中的應用是怎么影響個人的決策,充分的體現理論應用實際的現實意義。比如一個很經典的博弈案例“智豬博弈”,博弈故事描述的是大豬和小豬誰去按食槽開關的決策問題。實際上,這樣的博弈思想應用到實際生活中,可以模擬大小企業共存的問題。傳統課程只是結合案例簡單的分析了這種應用。如果在傳統課堂講授外能再更多的結合慕課深入案例,那么學習效果是事半功倍的。也可以讓學生更多的去切實的融入到生活情境當中,感受博弈對決策的影響。

慕課具有自檢性。學習不光要聽,更要練習鞏固。通過檢驗考察自己掌握的情況。傳統課堂老師能面對面地觀察學生,通過表情以及學生的課堂反應了解到學生的接受情況,并及時調整課堂具有高度的靈活性。還有課堂練習測驗的方式,也可以很方便的考察學生。慕課作為網絡課程也考慮到了這一問題。安排了作業,測驗,在線討論等方式,力求學生能盡可能地掌握所學。而且慕課的網絡特點是可以重復播放任意片段,一旦有知識不理解的,學員可以反復聽課,直到完全理解。

慕課具有約束性。注冊慕課后,學員只有完全學完課程,完成課程安排的學習任務,并在考試合格后才能獲得相應學分。這樣的約束性可以保證學習的有效性。應用到博弈論教學當中,在全校學生都能學習的情況下,還能保證學習質量。確實可以作為傳統博弈論課堂的補充。現在許多高校已經開始和特定的慕課平臺建立合作培養,承認學員在慕課中心拿到的學分,并計如總學分。這樣既有利于學生課程的學習,也有利于慕課在現代教學中的進一步推廣。

四、結論

慕課的特點可以很好的將其結合運用到博弈論教學當中。去彌補傳統的博弈論教學方式單一,課時有限的缺點。但是慕課作為一種新興的網絡教學方式,在發揮自己優勢特點的同時,我們也要注意到它的弊端。首先,在沒有老師的強制約束下,學生是否能自覺地獨立完成所有課程。其次,學生雖然能夠反復觀看視頻,反復理解學習內容。但是如果反復學習之后,仍然不能透徹理解時該怎么答疑解惑要怎么辦。這都是網絡課程所不能給予的,必須通過傳統課程去更好地實現。再者,慕課對學生的考核包括測驗,討論等方式,合格的評判標準是什么,所有學員都采用同樣的標準是否合理。這些都是將慕課應用到實際教學中面臨的問題。所以必須要明確,慕課作為一種新型的網絡課程,在幫助學員學習課程,輔助傳統堂的時候。更多的只能定位為一種輔的學習方式,絕對不能代替傳統課堂。

【參考文獻】

[1] 何國平,楊云帆,陳嘉等.“慕課”在護理教學中的應用與展望.中華護理雜志[J].2014(49)1095-1099.

[2] 胡珊邢濤.慕課視域下“教育心理學”課程教學.現代教育技術[J].2015(24)78-82.

[3] 張長海,焦建利.地方高校大學生慕課接受度影響因素研究.遠程教育與網絡教育[J].2015(345)64-68.

[4] 姜泓冰.“慕課”,攪動大學課堂[N].人民日報,2013-07-15(15).

篇4

文章編號:ISSN1006―656X(2013)12-0043-01

一、博弈論的概述

博弈論(game theory),又稱對策論,是研究決策主體的行為發生直接相互作用時的決策以及這種決策的均衡問題,也就是一些個人或組織,面對特定的環境條件,在一定的規則約束下,同時或先后,一次或多次,從各自的行為或策略中進行選擇并加以實施,各自取得相應結果的過程。

一個完整的博弈一般包含幾個要素:參與者,行動,策略,結果,均衡等。參與者、行動和結果統稱為博弈規則,博弈分析的目的是使用博弈規則來決定均衡。但是,博弈的行動不等同于博弈的策略,博弈的結果不等同于博弈的均衡。根據參與人的數量,可分為二人博弈和多人博弈;根據參與人是否合作,可分為合作博弈和非合作博弈;根據博弈結果的不同,可分為零和博弈、常和博弈和變和博弈。

博弈論對我們的經濟生活有重要意義,人們之間決策行為相互影響的例子有很多:從國家角度出發,在國際貿易中合理運用博弈論可使本國和其他國家都受益,取得雙贏效果;從個人角度出發,在生活中合理運用博弈論可使自己選擇最優策略,減少不必要的成本開支。

二、非合作博弈――納什均衡

非合作博弈是指不允許存在有約束力協議的博弈。完全信息靜態博弈屬于非合作博弈,該博弈中,每個博弈方的策略都是針對其他博弈方策略或策略組合的最佳對策,具有這種性質的策略組合,正是非合作博弈理論中最重要的一個概念“納什均衡”。

用表示一個博弈,如果有個博弈方,每個博弈方的全部可選策略的集合稱為“策略空間”,用表示;表示博弈方的第個策略,其中可取有限個值(有限策略博弈),也可取無限個值(無限策略博弈);博弈方的得益用表示,是各博弈方策略的多元函數。個博弈方的博弈常寫成。在博弈中,如果由各個博弈方的每一個策略組成的某個策略組合中,任一博弈方的策略,都是對其余博弈方策略組合的最佳對策,即

,對任意都成立,則稱為的一個“納什均衡”。

納什均衡的求解,常采用得益矩陣法。在囚徒困境中,每個參與者都能猜出對方策略,稱該納什均衡為純策略納什均衡。囚徒困境問題反映了非合作博弈的根本特征,體現了個人理性與集體理性的矛盾。兩寡頭企業選擇產量的博弈就是囚徒困境問題在經濟學上的應用。若兩企業聯合形成卡特爾,選擇壟斷利潤最大化的產量,每個企業都能得到更多利潤。但卡特爾協定不是納什均衡,給定對方遵守協議,每個企業都有增加產量的沖動,最后每個企業只能得到納什均衡產量的利潤,它嚴格小于卡特爾產量下的利潤。

在某類博弈中,每個理性人都不能猜出對方的策略,參與人是以一定的概率選擇某種策略的,這樣的策略稱為混合策略,相應的均衡稱為混合策略納什均衡。純策略是混合策略的特例。相關的例子有日常生活中的打撲克、劃拳等。

三、治理河流污水排放的制度設計

環境保護,人人有責,限制企業的污水排放符合社會各界的呼聲。檢查和制止排污是政府的職責,對于以利潤最大化為目標的企業,其一直采取各種措施盡可能降低生產成本。政府和企業間的關系可用經濟學中的監督博弈來解釋。

該博弈的參與者是政府和企業,政府的策略選擇是檢查或不檢查,企業的策略選擇是排污或不排污。假設是企業治理污水(不排污)增加的生產成本,若排污,為自己多得的收益。是政府檢查所需成本。是政府對企業排污的罰款金額。是企業排污對社會利益的損害。假設且,即政府對排污企業采取重罰措施。對應不同策略組合的得益矩陣可見下表。

政府和企業的得益矩陣

在以上假設條件下,政府和企業都猜不出對方會采取何種策略,因而不存在純策略納什均衡,只能求解混合策略納什均衡。如果假定條件不成立,通過劣策略剔除可得到占優策略,即(檢查,不排污)或(不檢查,排污)為占優均衡。

在得益矩陣中,用表示政府檢查的概率,表示企業排污的概率。給定,政府檢查和不檢查的期望收益分別為:

由,得。即如果企業排污概率小于,政府的最優選擇是不檢查;如果大于,政府的最優選擇是檢查;如果等于,政府隨機地選擇檢查或不檢查。

政府的最終目標是降低企業排污概率并保護環境。據的結果,有兩種措施:一是增大分母,即采取重罰措施,使企業平日不敢排污;二是減小分子,即降低檢查成本。現階段可行做法是設立舉報電話,避免政府盲目檢查,提高辦事效率。

再者,給定,企業選擇排污和不排污的期望收益分別為:

由得,即如果政府的檢查概率小于,企業的最優選擇是排污。現實中,政府對排污的懲罰越重,企業因排污獲得的收益越低,企業的排污概率就越小。反之,企業的排污概率就越大。

企業因排污獲得收益的大小,政府難以準確把握。前面談到的企業都是以利潤最大化為目標的企業,適于民營企業。現實中大多排污者是國有企業,這就涉及企業經營的控制權收益問題。企業因排污獲得的生產成本降低部分可以很容易轉化為企業經營者的控制權收益,這些收益包括獎金、福利或者因企業效益上升而帶來的升遷機會。反過來,如果企業因為排污而受罰,經營者并沒有控制權損失,因為罰款由企業出,經營者只是沒有控制權收益而已。

四、小結

本文以納什均衡為理論基礎,分析了純策略納什均衡和混合策略納什均衡在經濟生活中的應用。但本文探討的只是博弈論中一個很小的方面,對均衡問題中的子博弈精煉納什均衡等沒有涉及到,但它們的應用也很廣泛。在日常經濟生活中,小到購物時的討價還價,大到企業間的競爭與合作、國家間的傾銷與反傾銷等,都可歸結為博弈問題。

篇5

經濟學是經濟管理類專業的專業基礎課程,學生學習的好壞不僅會影響到后續課程的學習,對學生綜合素質的提高也會有著直接影響。由于經濟管理類專業大多是以招收文科考生為主,數學基礎比較差,對經濟學有些難以理解。有時候,盡管老師在講臺上講得天花亂墜,學生聽起來卻覺得干巴巴的、索然無味,像是過眼煙云,很難有好的教學效果。作為科任老師,我們可以改變自己的教學方法,用經濟理論解釋現實生活,用現實生活說明經濟理論。現結合我自己多年來教學的經驗,談談我對應用型人才經濟學教學的一些看法。

1 善于挖掘日常生活中的事例作為教學案例

經濟學是一門研究資源的配置與利用的科學,而生活中處處都面臨的各種各樣的選擇,這就涉及到經濟學。生活中處處都有經濟學,從起床到睡覺,從穿衣到吃飯,從睡眠到讀書、游戲、身體的鍛煉以及購物、聊天、休息,從生活起居到談情說愛,都存在著資源配置與利用,存在著經濟學問題。經濟學的問題比比皆是、俯首可拾,比方說,我們通常會遇到這種情況:一個人在外面走路,會感到孤單,甚至有時候會有一種不安全的感覺,于是,見了陌生人他也可能會跟對方主動打招呼聊天、一起走一段路。經濟理論很容易就可以解釋這些事情,因為跟他人聊天可以增加自己的效用,兩個人走路跟一個人走路相比,兩個人走路可以打發寂寞時光、可以增加安全感,從而增加他們的效用,這也是一個帕累托改進。用這些日本文由收集整理常生活中司空見慣的事情,來談經濟學,學生容易接受,也容易引發學生的興趣。帶著興趣與沒有興趣來學習同一門課程,其效果將是天淵之別。

2 善于用經濟學知識解釋日常生活中的現象

生活中雖然處處都有經濟學,但要利用經濟理論解釋它們卻需要我們經常去思考。例如,關于物質與愛情之間的關系問題,一般人認為,物質是基礎,但有了一定的物質基礎之后,物質和愛情何者更加重要,他們的關系如何,這可以用經濟理論來分析。

我們可以用u表示效用,m表示物質,l表示愛情,a、b、α、β、γ為不為零的常數,它們的關系式可以表示為:u=amα+bmβlγ。這個式子就較好的描述了一般人的物質與愛情的關系的觀點。當m=0時,不管l是否為零,u都等于0,說明物質是基礎,沒有物質基礎愛情也不能當飯吃。β、γ的大小代表物質與愛情孰輕孰重,當β>γ時,更加看重物質;當β<γ時,說明他有了一定的物質基礎之后,更加注重愛情。物質與愛情到底各占多大比重的問題,是一個效用最大化問題。

只要我們用心的去思考,就可以發現日常生活中存在太多的現象可以用經濟理論來解釋。甚至我們所說的一些在理的話,都包含了經濟學原理。例如,在電視連續劇《喬省長和他的女兒們》的大結局中喬省長有一句臺詞:“如果一個人有了害人之心就不可救藥了。”用經濟理論如何解釋這句話呢?經濟學有一個經濟人假設,人總是在謀求自己的利益,有害人之心的人總是把別人情況變好當作是件使自己效用減少的事情,為了增加自己的效用水平,在自己情況不能變好的情況下,他只能通過損害別人利益來提高自己的效用水平。

3 善于用經濟學知識解釋社會現象

經濟理論不僅應該解釋日常生活中的現象,而且要解釋社會現象。幾乎所有的社會現象都可以用經濟理論來解釋。最常見的社會現象如失業、通貨膨脹、經濟增長、房產問題、三農問題、人民幣匯率問題、經濟危機、歐洲債券危機等等,這些典型的經濟現象無一不是經濟問題,都可以用經濟理論來分析。有些社會現象,看起來不是經濟問題,但也可以用經濟理論來解釋,如很多人在感嘆物質文明取得長足進展的同時,驚呼道德淪喪問題。著名的經濟學家加利·s·貝克爾(gary s·becker)就因把經濟分析方法推廣到人口增長、家庭、教育、犯罪和處罰、歧視等社會問題研究領域,在1992年獲諾貝爾經濟學獎。同樣地,經濟理論還可以解釋我國的文憑熱、證件熱、國考熱、宰客門,甚至可以解釋考生的作弊現象;也可以解釋日本因地震而造成核泄露后中國出現的“搶鹽風波”,甚至可以解釋為什么我國反腐倡廉將是一件長期而艱巨的工作。有人對城鄉居民的幸福因子做過調查,結果顯示:生活條件差得多與收入低得多的農村居民比城市居民的幸福指數更高。這種結果讓常人難以理解,但在經濟學里面,解釋這種現象卻是一件輕而易舉的事情。正如常人所說的“幸福不是你擁有的多,而是你計較得少”。

轉貼于

4 善于用經濟學理論解決生活中存在的問題

經濟理論不僅可以解釋日常生活中的現象和社會現象,而且,還可以用于指導解決生活中存在的問題。經濟理論不僅來源于實際,而且自產生之日起,就是用來指導并解決“經濟”問題的。因此,經濟理論也可以用于解決生活中存在的問題。比方說,有的同學不能正確處理好戀愛與讀書、打工與讀書、游戲與讀書、鍛煉與讀書等關系問題。有的同學甚至產生厭學情緒,這部分人來到學校忘記了讀書就是自己的天職。對他們可以用機會成本理論、消費理論來教育他們好好讀書,讓他們算一算自己來到學校讀書的機會成本,不要以高昂的代價借入明天的錢用于今天的消費。

大學生中還存在著另一類極端的觀點:有一部分同學認為,只要讀書讀好了,其它方面都可以不必考慮。這部分人是學習至上主義者,他們可以忘我的讀書,而不顧自己的身體承受能力。還有一種人,他們為了自己的利益,即使是損害他人利益,甚至傷天害理也在所不惜。這種情況可以用產出函數來說明。我們知道有個這樣的柯布道格拉斯生產函數:y=alαkβ。y表示產出;a表示技術,在這里可以具體化為所學的知識或者本事。值得注意的是,這里的a與普通的柯布道格拉斯生產函數稍有不同,a的符號可正可負,當它是用來造福人類的時候,a>0;當它是用來破壞他人幸福、損害他人利益的時候,a<0;l表示勞動;k表示資本;指數α、β為常數。這個式子說明,如果不好好鍛煉身體,身體搞垮了,使得l=0,產出y也將等于0;如果思想道德品質敗壞,盡做一些損害他人利益的事情,他的產出將是負數,也就是危害社會的“產出”。因此,我們不僅要學習好,而且要鍛煉好身體,尤其是要保證思想道德品質不要出現問題。

5 善于應用經濟理論正確引導學生為人處世

經濟理論不僅可以解釋日常現象和社會現象,而且還可以引導學生為好人、處好事。前面的產出函數就是一個引導學生做人的非常好的例子。其實,經濟理論中有很多知識可以與為人處世聯系在一起。比如生產與消費的外部性問題教導學生不要做那些對社會、對他人有不利影響的事情,要多做一些好事情,至少不要做對他人造成不好的影響的事情。如某人生日party,寢室幾個人一起在寢室里唱歌跳舞猜拳飲酒,徹夜狂歡、好不快樂。可是,他們的行為卻具有很強的外部性,他們影響了別人正常的生活與休息。為了減少甚至消除他們的行為的外部性,他的生日party可以不要開得太晚,以免影響他人的正常休息,或者找一個不會影響他人的地方做他的生日party,如在酒店或娛樂場所。另外,可以用博弈論中囚徒困境的知識來分析為什么要構建和諧社會、為什么要與人為善、為什么要懂得尊老愛幼尊師重教、為什么要懂得感恩等等。福利經濟學的社會效用函數知識告訴我們,公交車上把座位讓給老弱病殘孕的乘客可以增進整個社會的福利水平;洛倫茲曲線與基尼系數的知識告訴我們應該關心弱勢群體,以促進整個社會的和諧發展;凱恩斯的邊際消費傾向理論從經濟學的另一個角度告訴我們,社會經濟平等也有利于社會經濟發展。

6 學生綜合素質的提高也涉及到經濟學

知識是素質的一個重要方面,要提高學生素質,就要讓學生掌握更多的包括經濟學在內的知識。學生綜合素質提高的問題也可以歸結為一個經濟學問題,可以看作是固定成本下的產出最大化問題,但這個問題與普通的投入產出問題有所區別。首先,人的綜合素質是有很多方面決定的,我們不妨把每一個方面也稱為一種素質;其次,每一種素質的培養又需要一定量各種“要素”的投入,同時,在培養這種素質的同時,其它素質也會發生變化。如果用z表示綜合素質,yi表示n個素質中的第i方面的素質,xj表示m個要素投入中的第j種要素的投入,假設第j種要素的價格為pj,總成本c為常數,用f和g表示某種函數關系。我們同樣可以將它們的關系用函數表示:

z=f(y1,y2,y3,…,yn)=g(x1,x2,x3,…,xm) x1p1+x2p2+x3p3+…+xmpm=c

(1)式有兩個方程,后面的等號表示m種要素的投入,有n個方面素質的產出,這是一個投入產出方程;前面的等號表示人的綜合素質是由y1、y2、y3……yn幾個方面的素質決定的,z為綜合素質,可以看作是由于獲得y1、y2、y3……yn所得的好處或者效用,因此,前面的等號可以看成是效用函數。(2)式為約束函數,表示資源的有限性。因此,如何使得學生綜合素質最大化,就可以歸結為有限資源如何配置的問題,這就是典型的經濟學問題。

篇6

一、引言

水是萬物之源。沒有水,社會將寸步難行。然而生活中,總會由于各種原因導致臨時停水,給人們生活和生產帶來不便。解決不可控因素下多方供水需求,單獨的救急中心遠遠不夠,必須調度多個救急中心的應急資源。由于各需水點對應急資源存在競爭關系,因此,尋找一種能夠反映各個需水點的缺水嚴重程度和救助響應時間的應急資源調度策略和模型,以達到利益均衡是一個值得研究的課題。

二、調度策略的非合作博弈模型建立

(一)模型假設

在解決本文提出的不可控因素發生時對應急資源合理調度的問題前可以做出如下假設:

1.對各子系統在相同情況下對應急資源的需求量做出分級,1表示嚴重缺水,2表示重度缺水,3表示中度缺水,4表示輕度缺水。

2.現實中單一救急中心往往無法解決所有需水點對水資源的需求,因此需聯合多個救急中心。假設當某一區域的應急資源難以解決問題時,可從鄰近區域調水。

3.成本函數作為一個多元復合函數,其影響因素包含很多,比如本事件中子系統的缺水程度,資源調度到救援響應的時間以及需水點到救急中心的距離等。因此在解決問題前需要對各子系統(即需水點)對救急中心的調度成本進行從大到小的排序。

(二)博弈模型的相關參數與數學表達式

1.調度成本函數C■■

理論上以其為調度策略的依據。C■■的函數表達如下所示:

C■■=H■*(■)∞(4)

公式中,H■表示需水點i的缺水級別,Y■■表示需水點i到救急中心k的距離。

2.效益函數Pi

在實際調度過程中,收益函數等于調度成本的倒數:

P■■=■(5)

其中k∈M。公式中,C■表示需水點i在救急中心k未能得到資源而從其他救急中心進行資源調度而產生的額外成本。需水點i從全部救急中心集合M中調度其所需資源的效益函數滿足疊加定理。

三、非合作博弈模型的算法求解

(一)求解水資源調度的非合作博弈模型Nash均衡解的步驟

1.對救援資源初始分配,確定各需水點向救急中心調度資源所產生的成本;

2.不考慮各救急中心可提供水資源的上限,按成本最小化原則向各需水點分配資源;

3.考慮各救急中心實際資源量,若可以滿足同一級別各需水點,則按需分配。若不能,同級別各需水點對該救急中心的資源將產生競爭,形成博弈;

4.構造非合作博弈調度模型,求解Nash均衡解,并按Nash均衡解對救急中心的水資源進行調度;

5.同一級別的需水點若存在按照Nash均衡解分配后仍不滿足需求的部分,則按成本最小化原則從其他救急中心調度資源,直到滿足需求;

6.重復步驟(3)。

(二)求解納什均衡

根據納什均衡的定義,對所有純策略組合進行逐一檢驗,得出純策略納什均衡。應用最多的一種算法稱為迭代算法。

在實際迭代計算中可以從任意的s(0)∈S(策略空間)開始,假設初始點s(0)與納什均衡點s*之間的距離為d(0),經過m次迭代以后,d(s(m),s*)≤?灼0d(s(0),s*)=?灼■■d(0),因為0≤?灼0≤1,因此可以采用迭代公式s(m+1)=Xs(m)來任意逼近納什均衡點s*。

四、實例計算與分析

問題描述如下:現因某地區發生山體滑坡塌方,導致自來水廠源水渾濁度超標,從而導致城市G臨時停水,期限不明。城市G有四個區a,b,c,d,分別報告了不同的缺水程度。城市G市內只有一處救急中心A,鄰市F有兩處救急中心B、C。為了不影響市民的日常生活,現有關部分組織進行水資源救助工作。數據假設如下。

表一 需水點缺水情況表

表二 救急中心資源情況表

現假設四個區域向各救急中心調度水資源所產生的成本是相同的。運用3.2提出的求解納什均衡解的迭代方法可以求出該博弈的純策略Nash均衡解:

s■■=(10,0,0) s■■=(1,5,2)

s■■=(2,5,1) s■■=(0,0,6)

將上述數據代入公式可求得:

總成本Ci,p=Ca,q+Cb,q+Cd,q=10+15+17+18=60是為最優化成本調度策略。

根據公式可求得此組合策略的各個收益函數,將各個需水點的收益函數代入公式,可得總的效益目標函數為:

F=Pa+Pb+Pc+Pd=21

綜上所述,利用迭代算法求得的Nash均衡解:

s■■=(10,0,0);s■■=(1,5,2);s■■=(2,5,1)s■■=(0,0,6)可以實現向區域a,b,c,d進行水資源公平合理調度,并且能夠保證調度策略的成本最小,效益最優。

五、結束語

該論文本著實用性原則針對日常生活中常見的臨時供水不足問題進行了相關研究,論文方法通俗易懂,且延展性較強,相關的思想方法也可以用來處理類似求解最優化組合的問題,比如解決自然災害發生時,不同地區受災點的資源調配問題或者用于公司經營中解決客戶售后服務的技術人員調配問題,商業中物流配送問題等。不足之處仍然存在,但客觀講,本文思想方法仍具有一定的理論及現實意義,具有較好的可操作性,值得廣泛推廣。

參考文獻:

[1]Sun J, Xu WB.A global search strategy of quantum- behaved particle swarm optimization [C].Proceedings of IEEE Conference on Cybernetics and Intelligent Systems, 2009.:111- 116.

[2]HWANG H-S. A food distribution model for famine relief [J]. Computer and industrial Engineering, 2011, 37 (1 /2) :335-338.

[3]Wan Xiaoyu,Pu Yifei, Li Bingjun, Fractional Differential Amplitude Hierarchical Feature of MPSK Signals[G].8tth INTERNATIONAL CONFERENCE ON SIGNAL PROCESSING PROCEEDINGS,2010,

[4]王萬良,蔣一波,李祖欣等.網絡控制與調度方法及其應用[M].北京:科學出版社,2009.

[5]楊繼軍.面向非常規突發事件的應急資源博弈調度模型與優化策略研究[D].上海:同濟大學經濟與管理學院,2009.

[6]姚杰,計雷,池宏.突發事件應急管理中的動態博弈分析[J].管理評論,2005(3):46-50.

篇7

Gábor Lugosi, Universitat Pompeu Fabra, Barcelona

Prediction, Learning and

Games

2006, 394pp.

HardcoverUSD65.00

ISBN 978-0-521-84108-5

Nicolò Cesa-Bianchi(意大利) 等著

日常生活中,有關預測的例子如預報給定地點明天的溫度,或者是猜測在下一個月內哪些資產將會獲得最佳效益,盡管它們內容不同,這些任務在一個抽象的層次上是類似的。在給定的有關過去的元素的某些知識以及其他可利用信息的條件下,預測一個未知序列的下一個元素,對這個過程的研究,就是預測研究。

本書的主題是單一序列預測。人們在各種不同的領域中對它進行研究如統計決策理論、信息理論、博弈理論、機器學習及數學金融領域。這個主題最早的形成可以追溯到20世紀50年代。與預測的標準統計學方法不同,單個序列預測對于數據產生機制并不強加任何概率統計的假設。此外人們還可以構建預測算法,該算法對于所有可能的序列都能很好地工作。在這個意義上講,單序列預測的性能與在一個給定參考類中的最佳預測策略是一樣好的。本書列舉的單序列預測模型使用的是專家咨詢預測模型。重復博弈,自適應數據壓縮,股票市場順序投資序列模式分析和其它幾個問題都可以看作是專家框架的示例。從一個普通的非隨機觀點進行分析,經常會揭示元素之間新的、令人感興趣的關系。作者對各種預測方法用精確的數學方式描述,以便表征這些預測方法在理論上存在哪些限制和可能性。

本書共有12章。第1章緒論;第2章預測與專家咨詢;第3章特殊損失的緊限界;第4章隨機化判斷;第5章用于大專家類的有效預測;第6章具有有限反饋的預測;第7章預測和進行博弈;第8章絕對損失;第9章對數損失;第10章順序投資;第11章線性模式識別;第12章線性分類。本書的附錄中收集了書中使用的技術工具。附錄A1概率論中的不等式;附錄A2基本的信息理論;附錄A3分類基礎。

作者撰寫本書是為了促使有關單一序列預測的概念在上述這些領域中更加順暢地流傳。本書可以用作機器學習、博弈論、統計學和信息理論專業的研究人員及學生的參考書和教科書。

胡光華,高級軟件工程師

篇8

中圖分類號:F069.9文獻標志碼:A文章編號:1673-291X(2009)29-0240-02

“博弈論”這一名詞的流行僅僅始于幾十年前,但是,博弈論思想本身卻有著悠久的歷史,如兩千多年前的“田忌賽馬”就是出色利用博弈論的典型生動的例子,至今仍然為中國的許多學者、老師應用來作為博弈論的入門例子。

一、博弈論的發展進程

博弈論思想雖然有著悠久的歷史,但是作為一門系統的學科來說還相當的年輕。近代以來,在學術研究的過程中許多學者逐漸認識到了博弈論的重要作用,對博弈理論進行了探索研究。一般認為,對于博弈理論的最早研究可以追溯到18世紀初。瓦德格拉夫(W aldegrave)在1713年提出了兩人博弈的極小化極大混合策略解。古諾(Coumot)和波特蘭德(Bertrand)分別在1838年和1883年提出了博弈論最經典的模型,兩位學者分別從產量決策和價格決策分析壟斷的雙寡頭競爭模型,確定了在競爭之下各自的最優反應函數。但是作為一種理論來說,1944年,馮?諾依曼(Von Neumann)和奧?摩根斯坦(Morgenstern)合著了《博弈論與經濟行為》在總結了以往關于博弈的研究成果的基礎上,提出了博弈論的概念術語、一般框架和表述方法,提出了較系統的博弈理論,因此這被認為是博弈理論初步形成的標志。50年代初,納什(J.Nash)的兩篇非合作博弈論奠基性之后,博弈論飛速發展。作為博弈論的一部分,非合作博弈比合作博弈的發展更加迅速,在經濟學等其他學科中的應用也更為廣泛。提起博弈論,現在差不多總是指非合作博弈論。50年代以來,納什(Nash)、澤爾騰(Selten)、海薩尼(Harsanyi)等人是博弈論成熟并最終進入使用。

最近三四十年,經濟學經歷了一場“博弈論革命”,經濟學者們引入博弈論的概念和方法改造經濟學的思維,推進了經濟學的研究,可以說博弈論在一定程度上已經改寫了微觀經濟學,成為推動經濟學發展的一大動力。一方面,納什均衡概念以及更多的博弈論知識的引入使寡頭競爭理論得到改造,在現實中應用的普遍性更明顯,嚴格而深入的探討競爭現實的現代寡頭理論迅速發展起來;另一方面,在經濟社會中,每個人的決策都是根據他所掌握的有關信息做出的,非對稱信息博弈論這種分析方法徹底改變了微觀經濟學的面貌,極大地促進了信息經濟學的發展,信息經濟學已經真正成為當今經濟分析的主流。

二、博弈論的主要內容

博弈論(Game Theory)又稱作對策論,是專門研究理性個體之間相互沖突和合作的學科。一個最基本的博弈結構,至少包括三個要素:局中人(player)、戰略空間(strategy space)和支付結構(payoff structure)。

博弈論的基礎假定是博弈的參與者即局中人是理性而明智的;在每個局中人的所有可選行動范圍(戰略空間)內,該局中人是獨立的,不受其他局中人任何形式的脅迫;一個局中人的支付結構表示在不同情況(不同戰略組合)下博弈終了時他的收益(或“得分”)。在典型的支付結構中,一個局中人所得的支付不僅與他自己選擇何種戰略有關,而且還是其他局中人所選戰略的函數,任何一個局中人改變自己的戰略都將影響所有局中人所獲的支付水平。這就是說,局中人之間的利益是相互牽連和相互制約的。除上述3個要素以外,要對一個博弈進行分析,對博弈定義一個信息結構也是必不可少的。研究者必須明確每個局中人知道什么和不知道什么。在局中人追求自己的支付最大化假定下,博弈論研究這些理性個體的行為選擇。一個博弈的“解”,也就是該博弈最可能出現的結果,稱為“均衡”(equilibrium)。一般情況下,博弈雙方的目的就是能夠得到一個均衡結果。

一個完整的博弈應該包含五個方面的內容:第一,博弈的參與人,即博弈過程中獨立決策、獨立承擔后果的個人和組織;第二,博弈信息,即博弈者所掌握的對選擇策略有幫助的情報資料;第三,博弈的行動空間,即博弈方可選擇的全部行為或策略的集合;第四,博弈的次序,即博弈參加者做出策略選擇的先后;第五,博弈方的收益,即各博弈方做出決策后的得失。

三、博弈論的應用和對博弈論反向應用的思考

自從將博弈論引入經濟學以后,經濟學改變了傳統經濟分析地那種以個人孤立決策,其他經濟活動者的行為影響則被典型地簡化為價格信號為基礎的分析方法,而側重于經濟活動中多個利益主體的行為所產生的相互作用和影響的分析,從而使經濟分析更能反應經濟系統的本質。

博弈的過程在一定程度上更接近經濟生活中的實際,具體來說,博弈論是怎樣應用到實際事務上的,下面將舉例說明,并且討論探索反向應用博弈論是否可能、是否有意義。

我們以日常生活中最常見的學生與家長的博弈為例:

假設一小學生和其家長,學生每天都必須完成老師布置的家庭作業,家長可能檢查也有可能不檢查其完成狀況。如果學生按時完成家庭作業,玩的時間減少;家長檢查,學生沒有完成就會得到懲罰。家長當然希望孩子按時完成作業,如果檢查發現學生沒有做作業,家長會感到生氣,而且天天檢查對家長來說是額外的負擔。因此如果學生做了作業家長也檢查了,那么學生得到的效用是-2,家長得到的效用是2;如果學生做了作業家長沒有檢查,那么學生得到的效用是-4,家長得到的效用為3;如果學生沒有做作業家長檢查了,學生增加了玩耍的時間卻受到了懲罰,得到的效用是0,家長得到的效用是-2;如果學生沒有做作業家長也沒有檢查那么學生得到的效用是4,家長的實際得到的效用是-1.博弈矩陣如圖1:

博弈的結果是學生會選擇不做作業,家長會選擇不檢查,實際影響是無論是對學生自己還是對家長來說,得到的都是最差的結果。

面對這樣不盡如人意的博弈結果,我們應該怎么辦呢?

博弈總是在一定的條件下進行的,這些條件決定了博弈的結果。那么根據現有的博弈結果,我們是否可以反向應用,找出可以改變的條件從而改變整個博弈的格局,改變博弈結果,改善博弈雙方的效用水平呢?

仍然以上面的學生家長博弈為例:

篇9

1950年和 1951年納什的兩篇關于非合作博弈的重要論文,徹底改變了人們對競爭和市場的看法。他證明了非合作博弈極其均衡解 ,并證明了均衡解的存在性,即著名的“納什均衡”,從而揭示了博弈均衡與經濟均衡的內在聯系奠定了現代非合作博弈論的基石。

要了解納什均衡,首先要知道什么是非合作博弈問題。“囚徒困境”是該問題最經典的例子,我們也從該例為切入點進行探討:

首先,一個完整的博弈應當包括五個方面的內容:第一,博弈的參加者,即博弈過程中獨立決策、獨立承擔后果的個人和組織;第二,博弈信息,即博弈者所掌握的對選擇策略有幫助的情報資料;第三,博弈方可選擇的全部行為或策略的集合;第四,博弈的次序,即博弈參加者做 出策略選擇的先后;第五,博弈方的收益,即各博弈方做出決策選擇后的所得和所失。

“囚徒困境”:兩個嫌疑犯(A和 B)作案后被警察抓住,隔離審訊;警方的政策是“坦白從寬,抗拒從嚴”,如果兩人都坦白則各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判 1O年;如果都不坦白則因證據不足各判1年。

在這個例子里,博弈的參加者就是兩個嫌疑犯 A和 B,他們每個人都有兩個策略即坦白和不坦白,判刑的年數就是他們的支付。可能出現的四種情況:A和 B均坦白或均不坦白、A坦白 B不坦白或者 B坦白A不坦白,是博弈的結果。在此,兩個嫌疑犯 A和 B面臨著兩難的選擇——坦白或抵賴。顯然最好的策略是雙方都抵賴,結果是大家都只被判 1年。但由于兩人處于隔離情況下無法串供。所以,按照亞當·斯密的理論,每一個人都是從利 己的目的出發,他們選擇坦白交代是最佳策略。因為坦白交代可以期望得到最好的解決辦法——釋放,但前提是同伙抵賴,顯然要比自己抵賴要坐 1O年牢好得多。這種策略是損人利 己的策略。不僅如此,坦白還有更多的好處。如果對方坦白了而自己抵賴了,那自己就得坐 1O年牢。太不劃算了!因此,在這種情況下還是應該選擇坦白交代,即使兩人同時坦白,至多也只判 8年,總 比被判 10年好。結果 ,兩人合理的選擇是坦白,原本對雙方都有利的策略(抵賴)和結局(各被判1年刑)就不會 出現。這樣兩人都選擇坦白的策略以及因此被判 8年 的結局被稱為“納什均衡”,也叫非合作均衡因為,每一方在選擇策略時都沒有“共謀”(串供),他們只是選擇對自己最有利的策略,而不考慮社會福利或任何其他對手的利益。也就是說,這種策略組合由所有局中人(也稱當事人、參與者)的最佳策略組合構成。沒有人會主動改變有著廣泛而深刻的意義。個人理性與集體理性的沖突,各人追求利己行為而導致的最終結局是一個“納什均衡”,也是對所有人都不利的結局。他們兩人都是在坦白與抵賴策略上首先想到自己,這樣他們必然要服長的刑期。只有當他們都首先替對方著想時,或者相互合謀(串供)時,才可以得到最短時間的監禁結果。“納什均衡”首先對亞當·斯密的“看不見的手”的原理提出挑戰。按照斯密的理論,在市場經濟中,每一個人都從利己的目的出發,而最終全社會達到利他的效果。不妨讓我們重溫一下這位經濟學圣人在《國富論》中的名言:“通過追求(個人的)自身利益,他常常會比其實際上想做的那樣更有效地促進社會利益。”從“納什均衡”我們引出了“看不見的手”的原理的一個悖論:從利己目的出發 ,結果損人不利己,既不利己也不利他。兩個囚徒的命運就是如此。從這個意義上說,“納什均衡”提出的悖論實際上動搖 了西方經濟學的基石。因此,從“納什均衡”中我們還可以悟出一條真理:合作是有利的“利 己策略”。但它必須符合以下黃金律:按照你愿意別人對你的方式來對別人,但只有他們也按同樣方式行事才行。也就是中國人說的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,“納什均衡”是一種非合作博弈均衡,在現實中非合作的情況要比合作情況普遍。所以“納什均衡”是對馮·諾依曼和摩根斯特恩的合作博弈理論的重大發展,甚至可以說是一場革命。

從“納什均衡”的普遍意義中我們可以深刻領悟司空見慣的經濟、社會、政治、國防、管理和日常生活中的博弈現象:

(1)電信價格競爭

根據我國電信業的實際情況,我們來構造電信業價格戰的博弈模型。假設此博弈的參加者為電信運營商 A與B,他們在電信某一領域展開競爭,一開始的價格都是 PoA(中國電信)是老牌企業,實力雄厚,占據了絕大多數的市場份額;B(中國聯通)則 剛成立不久 ,翅膀還沒長硬 ,是政府為了打破壟斷鼓勵競爭而籌建起來的。

正因為 B是政府扶植起來鼓勵競爭的,所以 B得到了政府的一些優惠,其中就有 B的價格可以比Po低 10%。這一舉動,還不會對 A產生多大的影響,因為 A的根基實在是太牢固了。在這樣的市場分配下,A、B可以達到平衡,但由于 B在價格方面的優勢,市場份額逐步壯大,到了一定程度對 A造成了影響。這時候,A該怎么做?不妨假定:

A降價而B維持,則A獲利 15,B損失5,整體獲利10;

A維持且B也維持,則 A獲利5,B獲利10,整體獲利15;

A維持而 B降價,則 A損失 10,B獲利 15,整體獲利5;

A降價且 B也降價,則 A損失 5,B損失 5,整體損失10。

從 A角度看 ,顯然降價要 比維持好,降價至少可以保證比 B好,在概率均等的情況下,A降價的收益為 15 x50%一5 x 50% =5,維持的收益為 5 x 50%一10 x 50% =一2.5,為了自身利益的最大化,A就不可避免地選擇了降價。從 B角度看,效果也一樣,降價同樣比維持好,其降價收益為 5,維持收益為2.5,它也同樣會選擇降價。在這輪博弈中,A、B都將降價作為策略,因此各損失 5,整體損失 10,整體收益是最差的。這就是此博弈最終所出現的納什均衡。我們構造的這一電信業價格戰博弈模型是典型的囚徒困境現象,各個局部都尋求利益的最大化,而整體利益卻不是最優,甚至是最差。

許多其他行業的價格競爭都是典型的囚徒困境現象,如可口可樂公司和百事可樂公司之間的競爭、各大航空公司之間的價格競爭等等。

(2)OPEC組織成員國之間的合作與背叛

“囚徒困境”告訴我們,個人理性和集體理性之間存在矛盾,基于個人理性的正確選擇會降低大家的福利,也就是說,基于個人利益最大化的前提下,帕累托改進得不到進行,帕累托最優得不到實現。

上述我們在對電信價格競爭的博弈分析中,只是一次性的“囚徒困境”博弈,因此得到了互相降價的納什均衡。而在現實生活當中,信任與合作很少達到如此兩難的境地,無論在自然界還是在人類社會,“合作”都是一種隨處可見的現象。比如中東石油輸出國組織(Organization of PetroleumExporting Countries簡稱 OPEC)的成立,本身就是要限制各石油生產國的產量,以保持石油價格,以便獲取利潤,是合作的產物。OPEC之所以能夠成立,各組織成員國之間之所以能夠合作,是因為囚徒困境如果是一次性博弈的話,基于個人利益最大化,得到納什均衡解,但如果是多次博弈,人們就有了合作的可能性,囚徒困境就有可能破解 ,合作就有可能達成。連續的合作有可能成為重復的囚徒困境的均衡解。這也是博弈論上著名的“大眾定理”(Folk Theorem)的含義。

但合作的可能性不是必然性。博弈論的研究表明,要想使合作成為多次博弈的均衡解,博弈的一方(最好是實力更強的一方)必須主動通過可信的承諾(Credible commit.r em),向另一方表示合作的善意,努力把這個善意表達清楚,并傳達出去。如果該困境同時涉及多個對手,則要在博弈對手中形成聲譽,并用心地維護這個聲譽。這里“可信的承諾”是一個很牽強的翻譯,“Credible commitment”并不是什么空口諾言,而是實實在在的付出。所以合作是非常困難的。所以 OPEC組織經常會有成員國不遵守組織的協定私 自增加石油產量。每個成員國都這樣想,只要他們不增加產量,我增加一點點產量對價格沒什么影響,結果每個國家都增加產量,造成石油價格下跌 ,大家的利潤都受到損失。當然,一些產量增加較少的國家損失更多,于是也更加大量生產,造成價格進一步下降——結果,陷入一個困境大家都增加產量,價格下跌,大家再增加產量,價格再下跌理論上,幾乎所有的卡特爾都會遭到失敗,原因就在于卡特爾的協定(類似囚犯的攻守同盟 )不是一個納什均衡沒有成員有興趣遵守。那么是不是不可能有卡特爾合作成功了?理論上,如果是無限期的合作 ,雙方考慮長遠利益他們的合作是會成功的。但只要是有限次的合作 ,合作就不會成功。比如合作 10次,那么在第九次博弈參與人就會采取不合作態度 ,因為大家都想趁最后一次機會撈一把,反正以后我也不會跟你合作了。但是大家料到第九次會出現不合作,那么就很可能在第八次就采取不合作的態度。第八次不合作會使大家在第七次就不合作……一直到,從第一次開始大家都不會采取合作態度。 還存在其他一些“非合作博議”的情況:

(1)污染博弈

假如市場經濟中存在著污染,但政府并沒有管制的環境,企業為了追求利潤的最大化,寧愿以犧牲環境為代價也絕不會主動增加環保設備投資。按照看不見的手的原理 ,所有企業都會從利己的 目的出發,采取不顧環境的策略 ,從而進入“納什均衡”狀態。如果一個企業從利他的目的出發,投資治理污染 ,而其他企業仍然不顧環境污染,那么這個企業的生產成本就會增加 ,價格就要提高,它的產品就沒有競爭力 ,甚至企業還要破產。這是一個“看不見的手的有效的完全競爭機制”失敗的例證。直到 20世紀 90年代中期 ,中國鄉鎮企業的盲 目發展造成嚴重污染的情況就是如此。只有在政府加強污染管制時,企業才會采取低污染的策略組合。企業在這種情況下,獲得與高污染同樣的利潤,但環境將更好。

(2)貿易自由與壁壘

這個問題對于剛剛加入 WTO的中國而言尤為重要。任何一個國家在國際貿易中都面臨著保持貿易自由與實行貿易保護主義的兩難選擇。貿易自由與壁壘問題,也是一個“納什均衡”,這個均衡是貿易雙方采取不合作博弈的策略,結果使雙方因貿易戰受到損害。x國試圖對 Y國進行進口貿易限制,比如提高關稅 ,則 Y國必然會進行反擊,也提高關稅,結果誰也沒有撈到好處。反之,如 x和 Y能達成合作性均衡,即從互惠互利的原則出發,雙方都減少關稅限制,結果大家都從貿易 自由中獲得了最大利益,而且全球貿易的總收益也增加了。

以上是運用博弈論中的經典案例“囚徒困境”對現實經濟生活的一些簡單的理論上的分析,雖然在現實生活當中影響人們決策和態度的因素很多,但是 ,博弈論作為現代經濟學的前沿領域,始終是一個強有力的分析工具。

參考文獻

篇10

中圖分類號:G642文獻標識碼:A 文章編號:1003-2851(2010)01-0025-02

一、概念

博弈論是經濟學中的一個重要的理論, 它在日常生活中有著廣泛的應用。現在博弈論也越來越多的被引人到體育領域, 結合具體的體育項目進行研究。

(一)博弈論

博弈論, 英文為game theory, 是研究決策主體的行為發生直接相互作用時候的決策以及這種決策的均衡問題。博弈論是一種方法論, 它是一種思維方式、技術方法和理論體系, 應用的范圍不僅包括經濟學, 而且包括政治、軍事、外交、體育等。博弈論可以分為合作型博弈和非合作(競爭)型博弈。合作博弈,指人們達成合作而得到的收益,即收益分配問題;非合作博弈,指人們在利益相互沖突的局勢中如何確定決策使自己的收益最大化,即策略選擇問題。因為人們之間的相互依存和相互制約作用以及自利的本性產生了博弈,而博弈簡單的論述就是雙方或多方在一維或多維之間斗智斗勇,作出決策分析,達到均衡解決,求得雙贏的結果。

一個完整的體育博弈應當包括五個方面:1.博弈的參加者,即博弈過程中獨立決策、獨立承擔所果的個人和組織;2.博弈信息,即博弈者所掌握的對手對選擇有幫助的情報資料;3.博弈方可選擇的全部行為或策略的集合;4.博弈的次序,即博弈運動員做出策略選擇的先后;5.博弈方的收益,即勝算或取得勝利。“囚徒困境”是博弈論的經典例子,經濟學家把大量的看似最優卻導致次優或較差的結果的行為稱“囚徒困境”。“囚徒困境”是用來說明博弈論及其在經濟環境中如何運用的一個例子,它很有說服力而又易于理解。然而不是所有參賽者,策略和后果的情形都會導致囚徒困境。

(二)體育博弈現象

是指體育實踐中存在的各種沖突、對抗與競爭。體育博弈現象表現在競技運動的方方面面。從申辦之爭、組織管理之爭、勞資大戰、儀器設備的研制, 到選材、訓練方法之爭。如高原訓練、力量訓練、興奮劑之爭、藥物與體能的恢復、消除疲勞等, 以及競賽之爭, 如中長跑的領先戰術、世界杯的斗智斗勇、競賽中的心理戰等等。現代化的社會也增加了體育競爭的激烈程度。排球比賽中也有不少的博弈現象,如發球階段,發球方可選擇發到前排也可選擇發到后排,還可選擇發給接一傳不穩得隊員,發球階段的博弈策略主要以破壞對方一傳為目的。網前技術的博弈現象更多,時間差進攻、位置差進攻、空間差進攻、梯次進攻、快球進攻等,紛繁交錯的技戰術讓對手防不勝防。面對對方強勢的攔網陣型,“尤其是在快速多變的戰術體系中,有針對性地運用吊球技術,可以使得戰術組合更加變化多端,從而擾亂對方的防守布局,破壞對方的防守節奏,甚至渙散對方的士氣,邊不利為有利。” 四兩撥千斤的吊球,有時可收到意想不到的效果。對方的吊球可與各種進攻戰術的扣球相結合, 即“ 打吊”結合,吊球可與各種進攻戰術的扣球相結合, 即“ 打吊”結….合,吊球可與各種進攻戰術的扣球相結合, 即“ 打吊”結合,吊球可與各種進攻戰術的扣球相結合, 即“ 打吊”結合,

二、排球比賽中發球策略的博弈分析

(一)比賽前對對手的情報資料的收集與分析

體育博弈論的精髓是對對手的情報資料的收集與分析,相對應地采用何種策略來對應。例如對對手技、戰術特點的了解。如以前蘇聯、保加利亞、波蘭男排為代表,他們身材高大,彈跳力強,以兇狠扣殺取勝的“力量排球”。以捷克斯洛伐克男排為代表,他們善于用腦,輕打軟吊,以巧取勝的“技巧排球”。以日本、中國男排為代表,他們主要 依靠默契配合,集體智慧,快速善變來達到取勝的目的的“配合排球”。因此,在參加比賽之前必須發揮團隊作用和臨場靈活的策略運用,才能提高勝算,最終取得勝利。

(二)策略的選擇

1.利用發球控制節奏

現代排球的實踐證明,比賽節奏主動權的掌握在臨場比賽中起著舉足輕重的作用。發球是破壞對方比賽節奏先發制人的進攻技術,準確而有威脅的發球不僅可以直接得分,還可以破壞對方一傳的質量,迫使對方打調整球,擾亂其戰術組合,減輕本方防守的壓力,力爭防反主動權。用“穩、狠、準”的發球,通過找點或找人發出速度、線路、性能、落點各不相同的球去破壞對方的一傳,使對方在一傳、二傳、扣殺等環節不能順利銜接,擾亂對方接發球反攻的節奏,達到破壞對方戰術節奏的目的[5]。

2.接發球策略

在排球比賽中,發球的策略尤為重要,達到破壞對方一傳的作用。但是雙方運動員都不可能運用單一的比賽策略,選擇單一的策略必然是愚蠢的,也不可能能夠打敗對手,因此,通常都是采用混合策略來對抗,讓對方不可預測才是明智的。例如A 隊與B隊進行比賽,A 隊的比分已領先,B隊在賽前已經掌握到A 隊的大量資料信息,A隊的強項是致命的大力跳發球與高攔網,似乎很顯然,在比賽到關鍵時刻,在接下來的比賽中,B 隊應該避免一傳不穩的隊員接發球或網前強攻;同樣很顯然A 隊很清楚地知道這個策略的人。因此A 隊在意識上和體力上都很好地做好大力跳發球和高攔網的準備,這樣,針對強項所進行的攻擊對B隊就很具有殺傷力。

A隊猜是快攻 A隊猜是吊球

B隊網快攻B贏得40% B贏得60%

A贏得60%A贏得40%

B隊網前吊球 B贏得60%B贏得50%%

A贏得40%A贏得50%

B隊在網前的時候有兩個選擇,進攻或吊球。相應地,A隊也有兩種策略,即預計對方可能進攻和預計對方可能吊球。如果A選手正確地猜到對手強攻,A隊將有60%的可能贏得該球;如果A隊正確地猜到吊球,A選手將有50%的可能贏得該球。如果A選手猜是快強攻,而B選手卻是吊球,那么A選手贏得該球的概率是40%;如果A 選手錯誤地猜是吊球,B 選手贏得該球的概率也是40%。

與囚徒困境的例子不一樣,這種情形并沒有單一的均衡結果。比如,假設B 選手一直對A 選手的吊球,A 選手看到這一點,于是A 選手總是作好接吊球的準備,這樣A 選手將贏得60%的球。B 選手意識到,如果能夠騙過了A 選手將會更好,于是B 選手發A 的快攻就贏得60%的球。A 選手很快也知道了B 的新策略,于是預料B 選手會快攻,贏得50%的球。B 再次調整,現在改為針對A 選手的強項―高攔網。因為A 仍然預計B 選手會發吊球,所以B 選手贏得60%的球。然而A 選手再次明白了,正確預料到會是強攻或快攻。這樣,A 與B又會到了出發點,贏得40%的球,真所謂的斗智斗勇。

既然長期中沒有任何戰略是最優的,那么只有通過騙過A 選手,發那種“A 預料不到”的球,B 才能獲得最大的優勢。這意味著B 選手必須采取一種混合策略,時而發吊球,時而強攻或快攻。如果A 選手猜對了,A 選手的反擊是致命的。因此,B 選手必須頻繁地交叉的改變戰術,以至于A 選手從猜中B 發正手還是發反手當中,根本得不到好處。

3.排球比賽中的一個概率問題

假定B 選手的策略是以概率p 發A 選手的吊球,因而針對A 的快攻或強攻的概率就是1-p,進一步假定A 選手的策略是預料為吊球的概率為q,因而預料為快攻或強攻的概率就是1-q。如果A 選手預料此球為吊球,那么,根據上表A 選手贏得此球的概率是p1=0.6+0.4(1-p)因為當A 選手預計為吊球時,A 贏得發給自己的吊球的60%,贏得發給自己快攻的40%。同理,如果A 選手預料此球為快攻,那么,贏得此球的概率為p2=0.6+0.5(1-p),B 選手的最優策略就應當是發吊球的概率要使得A 選手從猜吊球還是快攻中占不到任何便宜。換句話說,B 選手的最優策略是選擇一個p 值,使得p1=p2,解得,p=1/3。就會發現,B 選手的最優策略是1/3 的球發吊球,2/3 發快攻。這樣,無論A 選手猜什么,B 選手都會贏得53.3%的球。進而提高了勝算,取得最終的勝利。

排球比賽的各階段都需要博弈的思想來解決,找出最佳的最適合的發展對策,博弈貫穿于整個排球比賽中。盡管決定排球競賽的勝利因素很多,但是,教練員和運動員在某一項戰術上的策略運用得當,可以提高勝算的,所以運動員在提高自己的技術水平的基礎上,要發揚團隊精神,教練員和運動員在賽前對比賽對手的技術特點加以認真細致的研究,在臨場的戰術策略的運用要隨臨場的變化而變化,要使對手摸不著、猜不透,提高比賽心理素質,還得通過學習博弈理論在戰術運用上苦心鉆研,提高勝算,最終獲得勝利。

參考文獻

主站蜘蛛池模板: 平乐县| 阿克陶县| 通海县| 上栗县| 锡林郭勒盟| 磐石市| 平武县| 陕西省| 垫江县| 延安市| 安义县| 隆尧县| 东方市| 大同县| 宿松县| 富宁县| 常熟市| 东乡族自治县| 扶风县| 缙云县| 柞水县| 泽库县| 布尔津县| 翁牛特旗| 正阳县| 旺苍县| 灵山县| 临夏县| 海淀区| 南丰县| 乐昌市| 旺苍县| 许昌市| 巧家县| 海南省| 武胜县| 湖口县| 寿宁县| 德令哈市| 东光县| 龙泉市|