什麼是納什均衡解,什麼是納什均衡

2022-06-11 10:21:45 字數 4577 閱讀 5657

1樓:匿名使用者

納什均衡,nash equilibrium ,又稱為非合作博弈均衡,是博弈論的一個重要術語,以約翰·納什命名。

約翰·納什2023年作為年輕數學博士生進入普林斯頓大學。其研究成果見於題為《非合作博弈》(1950)的博士**。該博士**導致了《n人博弈中的均衡點》(1950)和題為《非合作博弈》(1951)兩篇**的發表。

納什在上述**中,介紹了合作博弈與非合作博弈的區別。他對非合作博弈的最重要貢獻是闡明瞭包含任意人數局中人和任意偏好的一種通用解概念,也就是不限於兩人零和博弈。該解概念後來被稱為納什均衡。

納什的主要學術貢獻體現在2023年和2023年的兩篇**,2023年他才把自己的研究成果寫成題為「非合作博弈」的文章刊登在美國全國科學院每月公報上,立即引起轟動。說起來這全靠師兄戴維·蓋爾之功,就在遭到馮·諾依曼貶低,嘲笑幾天之後,他遇到蓋爾,像說夢話似的告訴他自己已經將馮·諾依曼的「最小最大原理找到了普遍化的方法和均衡點。納什這個初出茅廬的小子,根本不知道競爭的險惡,從沒想到學術欺騙的後果。

結果還是戴維·蓋爾充當了他的「經紀人」,起草致科學院的簡訊,系主任列夫謝茨則利用方便的人脈關係親自將文稿遞交給科學院。納什寫的文章不多,他辯解說:少了才是精品。

中國國內提一個教授,要求在「核心的刊物」上發表多少篇文章。按照這個標準可能納什還不一定夠資格。

2023年諾貝爾經濟學獎得主莫爾里斯當牛津大學艾奇沃思經濟學講座教授時也沒有發表過什麼文章,特殊的人才,必須有特殊的選拔辦法。

nash平衡是指博弈中這樣的局面,對於每個參與者來說,只要其他人不改變策略,他就無法改善自己的狀況。nash在證明了在每個參與者都只有有限種策略選擇、並允許混合策略的前提下,nash平衡一定存在。以兩家公司的**大戰為例,nash平衡意味著兩敗俱傷的可能:

在對方不改變**的條件下,既不能提價,否則會進一步喪失市場;也不能降價,因為會出現賠本甩賣。於是兩家公司可以改變原先的利益格局,通過談判尋求新的利益評估分攤方案,也就是nash平衡。類似的推理當然也可以用到選舉,群體之間的利益衝突,潛在戰爭爆發前的僵局,議會中的法案爭執等。

假設有n個局中人蔘與博弈,給定其他人策略的條件下,每個局中人選擇自己的 納什均衡

最優策略(個人最優策略可能依賴於也可能不依賴於他人的戰略),從而使自己利益最大化。所有局中人策略構成一個策略組合(strategy profile)。納什均衡指的是這樣一種戰略組合,這種策略組合由所有參與人最優策略組成。

即在給定別人策略的情況下,沒有人有足夠理由打破這種均衡。納什均衡,從實質上說,是一種非合作博弈狀態。

納什均衡達成時,並不意味著博弈雙方都處於不動的狀態,在順序博弈中這個均衡是在博弈者連續的動作與反應中達成的。納什均衡也不意味著博弈雙方達到了一個整體的最優狀態,以下的囚徒困境就是一個例子。

2樓:

納什均衡點(港譯:納殊均衡點),又稱為非合作博弈均衡點,是博弈論的一個重要概念,以約翰·納什命名。如果某情況下無一參與者可以獨自行動而增加收益,則此策略組合被稱為納什均衡點。

經典的例子就是囚徒困境,囚徒困境是一個非零和博弈。

大意是:一個案子的兩個嫌疑犯被分開審訊,警官分別告訴兩個囚犯,如果你招供,而對方不招供,則你將被判刑一年,而對方將被判刑十年;如果兩人均招供,將均被判刑五年。 於是,兩人同時陷入招供還是不招供的兩難處境。

如果兩人均不招供,將最有利,只被判刑三年。 但兩人無法溝通,於是從各自的利益角度出發,都依據各自的理性而選擇了招供, 這種情況就稱為納氏均衡點。 這時,個體的理性利益選擇是與整體的理性利益選擇不一致的。

  囚犯甲的博弈矩陣   囚犯甲   招供 不招供   囚犯乙 招供 判刑五年 甲判刑十年;乙判刑一年   不招供 甲判刑一年;乙判刑十年 甲判刑三年   基於經濟學中rational agent的前提假設,兩個囚犯符合自己利益的選擇是坦白招供,原本對雙方都有利的策略不招供從而均被判刑三年就不會出現。事實上,這樣兩人都選擇坦白的策略以及因此被判五年的結局被是「納什均衡」(也叫非合作均衡),換言之,在此情況下,無一參與者可以「獨自行動」(即單方面改變決定)而增加收穫。第一,納什(nash)的關於非合作(non-cooperative)博弈論的平衡不動點解(equilibrium/fixpoint)學術證明是非構造性的(non-constructive),就是說納什用角谷靜夫不動點定理(kakutani fixed point theorem) 證明了平衡不動點解是存在的,但卻不能指出以什麼構造演算法如何去達到這個平衡不動點解。

這種非構造性的發現對現實生活裡的博弈的作用是有限的,即使知道平衡不動點解存在,在很多情況下達不到並不能解決問題。[**請求]在數學意義上,納什並沒有超越角谷靜夫不動點定理。   經過《美麗心靈》的sylvia nasar(書作者)和ron howard(電影作者)這樣的主流**的介入,角谷靜夫(kakutani)在這些人的作品裡被完全忽略。

有人認為,「納什平衡」(nash equilibrium)的更合適的名字應該叫作「角谷靜夫—納什博弈論不動點」(kakutani-nash game-theoretic fixed point)或「角谷靜夫—納什平衡」(kakutani-nash equilibrium),沒有角谷靜夫不動點定理,納什的證明沒有多大學術意義。《美麗心靈》完全忽視角谷靜夫之關鍵貢獻的作法有待商榷。   第二,納什的非合作(non-cooperative)博弈論模型僅僅是突破了博弈論中的一個侷限。

一個更大的侷限是,博弈論面對的往往是由幾十億節點的龐大物件構成的社會、經濟等複雜行為,但馮·諾伊曼(von neumann)和納什的研究是針對兩三個節點的小規模博弈論(有人稱之為tiny-scale toy case)。   這個假設的不完善處,可能比假設大家都是合作的(cooperative)更嚴重。因為在經濟學裡,一個龐大社會裡的人極不可能全部都是合作的,非合作的情況通常在龐大物件的情形中更普遍,而在兩三個節點的小規模經濟中倒反而影響較小。

既然改了合作前提為非合作前提,卻仍然停留在兩三個節點的小規模博弈論中,這是一個不可忽視的缺陷。最近香港城市大學和北京清華大學的學者群鄧小鐵、姚期智在基於複雜度理論的大規模博弈論上有所進展,這和納什小規模博弈論的本質以及《美麗心靈》的廣告效果是不可同日而語的。

什麼是納什均衡理論?

3樓:雪妖

納什均衡又稱非合作博弈均衡,是博弈論中的一個重要術語,以約翰·納什的名字命名。在博弈過程中,無論對方的戰略選擇是什麼,一方都會選擇一定的戰略,這就叫主導戰略。如果兩個博弈者的戰略組合構成各自的主導戰略,則該組合被定義為納什均衡。

當每個球員的平衡策略是達到其預期收益的最大值時,一個策略組合被稱為納什均衡,同時,所有其他球員遵循這一策略。

擴充套件資料;

納什均衡可分為兩類:純戰略納什均衡和混合戰略納什均衡。

要解釋純策略納什均衡和混合策略納什均衡,首先要解釋純策略和混合策略。

所謂純策略,就是為玩家提供一個完整的遊戲定義。特別是,純粹的策略決定了在任何情況下都要進行的運動,策略集合是玩家可以執行的純策略集合。

混合策略是通過給每一個純策略分配一個概率而形成的策略,混合策略允許玩家隨機選擇純策略,在混合策略博弈的均衡中,由於每個策略都是隨機的,當達到一定的概率時,就可以得到最優支付。由於概率是連續的,即使策略集是有限的,也會有無限的混合策略。

當然,嚴格地說,每個純策略都是一個「退化」混合策略,一個特定純策略的概率為1,另一個為0。

因此,「純戰略納什均衡」是指所有參與者都玩純戰略,而相應的「混合戰略納什均衡」則是指至少有一個參與者玩混合戰略。並不是每一個博弈都會有純戰略納什均衡,比如「硬幣問題」只有混合戰略納什均衡,而不是純戰略納什均衡。

然而,仍有許多博弈具有純戰略納什均衡(如協調博弈、囚徒困境博弈和鹿博弈)。甚至,有些遊戲可以同時擁有純策略和混合策略平衡。

4樓:free情到深處腿

納什均衡理論又稱為非合作博弈均衡,是博弈論的一個重要術語,以約翰·納什命名。在一個博弈過程中,無論對方的策略選擇如何,當事人一方都會選擇某個確定的策略。

則該策略被稱作支配性策略。如果兩個博弈的當事人的策略組合分別構成各自的支配性策略,那麼這個組合就被定義為納什平衡。

一個策略組合被稱為納什平衡,當每個博弈者的平衡策略都是為了達到自己期望收益的最大值,與此同時,其他所有博弈者也遵循這樣的策略。

擴充套件資料

納什均衡理論創始人約翰·納什介紹——2023年6月13日—2023年5月23日,提出納什均衡的概念和均衡存在定理,是著名經濟學家、《美麗心靈》男主角原型,前麻省理工學院助教,後任普林斯頓大學數學系教授,主要研究博弈論、微分幾何學和偏微分方程。

由於他與另外兩位數學家在非合作博弈的均衡分析理論方面做出了開創性的貢獻,對博弈論和經濟學產生了重大影響,而獲得2023年諾貝爾經濟學獎。

5樓:匿名使用者

一農戶在殺雞前的晚上餵雞,不經意地說:快吃吧,這是你最後一頓!

第二日,見雞已躺倒並留遺書:爺已吃老鼠藥,你們別想吃爺了,爺也不是好惹的。

當對手知道了你的決定之後,就能做出對自己最有利的決定。

——納什均衡理論

6樓:無名之人

納什均衡是指納什平衡,納什平衡(nash equilibrium),又稱為非合作博弈均衡,是博弈論的一個重要術語,以約翰·納什命名。

在一個博弈過程中,無論對方的策略選擇如何,當事人一方都會選擇某個確定的策略,則該策略被稱作支配性策略。如果兩個博弈的當事人的策略組合分別構成各自的支配性策略,那麼這個組合就被定義為納什平衡。

什麼是納什均衡,他的原理是什麼,什麼是納什均衡理論?

納什均衡,又稱為非合作博弈均衡,是博弈論的一個重要術語,以約翰 納什命名。納什均衡是一種策略組合,使得每個參與人的策略是對其他參與人策略的最優反應。假設有n個局中人蔘與博弈,如果某情況下無一參與者可以獨自行動而增加收益 即為了自身利益的最大化,沒有任何單獨的一方願意改變其策略的 則此策略組合被稱為納...

納什均衡點,應怎樣理解怎樣解釋納什均衡的哲學意義

納什平衡,又稱為非合作賽局平衡,是博弈論的一個重要概念,以約翰 納什命名。一開始我也以為是說史蒂夫納什 進來才發現不是 經典的例子就是囚徒困境,囚徒困境是一個非零和博弈。大意是 一個案子的兩個嫌疑犯被分開審訊,警官分別告訴兩個囚犯,如果你招供,而對方不招供,則你將被判刑一年,而對方將被判刑十年 如果...

納什均均衡中,多個均衡點是什麼情況?能舉幾個例子嗎

多個均衡點的例子很多 無論是純戰略納什均衡和混合戰略納什均衡都與出現 舉個最最最入門的例子給你看 這個例子一般博弈論都有學過的 情侶博弈 即使是情侶雙方的愛好或者偏好還是不盡相同的。大海和麗娟正在熱戀,難得的週六又到了,安排什麼節目好呢?週六晚上,中國足球隊要在世界盃小組賽中和巴西隊比賽。大海是個超...