納什均均衡中,多個均衡點是什麼情況?能舉幾個例子嗎

2021-03-09 05:20:38 字數 5016 閱讀 9688

1樓:匿名使用者

多個均衡點的例子很多 無論是純戰略納什均衡和混合戰略納什均衡都與出現 舉個最最最入門的例子給你看 這個例子一般博弈論都有學過的

情侶博弈

即使是情侶雙方的愛好或者偏好還是不盡相同的。大海和麗娟正在熱戀,難得的週六又到了,安排什麼節目好呢?週六晚上,中國足球隊要在世界盃小組賽中和巴西隊比賽。

大海是個超級球迷。也正好是這個週六的晚上,俄羅斯一個著名芭蕾舞劇團蒞臨該市。麗娟喜歡這樣高雅藝術。

那麼,一個人自已在家裡看電視轉播的足球賽,一個去劇院看芭蕾演出,不就得了?問題在於,他們是熱戀中的情侶,分開度過難得的週六,是他們最不樂意的事情。這樣一來,他們真是面臨了一場「博弈」。

我們不妨這樣給大海和麗娟的「滿意程度」賦值:如果大海看球讓麗娟一個人去看芭蕾,雙方的滿意程度都為0;兩個人一起看足球,大海的滿意程度為2,麗娟的滿意程度為1;兩個人一起去 看芭蕾,大海的滿意程度是1,麗娟的滿意程度為2;

在情侶博弈中,雙方都去看足球,或者雙方都去看芭蕾,就是我們所說的相對優勢策略的組合,一旦處於這樣的位置,雙方都不想單獨改變策略,因為單獨改變沒有好處,比方說兩人一起看足球,大海得2,麗娟得1;如果大海改變主意單獨去看足球,變成雙方都是0,沒有好處;如果麗娟改變主意單獨去看芭蕾,也變成雙方都得0,也沒有好處。所以,兩個人一起去看足球是穩定的局面。同樣,兩個人一起去看芭蕾也是穩定的局面。

這種穩定的結局就是「納什均衡」。在情侶博弈中,雙方都去看足球,或者雙方都去看芭蕾,是博弈的兩個納什均衡。形象地說,納什均衡實際上就是一種「僵局」:

給定別人不改變策略的情況下,沒有人有興趣單獨改變策略,而且,這種單獨改變不會給他帶來好處。

2樓:匿名使用者

a b

c (3,1) (2,2)

d (2,2) (1,3)

這裡兩個(2,2)就是兩個納什均衡

什麼是納什均衡?能不能舉個簡單的例子

3樓:匿名使用者

納什均衡是一種策略組合,使得同一時間內每個參與人的策略是對其他參與人策略的最優反應。

假設有n個局中人蔘與博弈,如果某情況下無一參與者可以獨自行動而增加收益(即為了自身利益的最大化,沒有任何單獨的一方願意改變其策略的[1] ),則此策略組合被稱為納什均衡。所有局中人策略構成一個策略組合(strategy profile)。納什均衡,從實質上說,是一種非合作博弈狀態。

納什均衡達成時,並不意味著博弈雙方都處於不動的狀態,在順序博弈中這個均衡是在博弈者連續的動作與反應中達成的。納什均衡也不意味著博弈雙方達到了一個整體的最優狀態,需要注意的是,只有最優策略才可以達成納什均衡,嚴格劣勢策略不可能成為最佳對策,而弱優勢和弱劣勢策略是有可能達成納什均衡的。在一個博弈中可能有一個以上的納什均衡,而囚徒困境中有且只有一個納什均衡。

案例囚徒困境

假設有兩個小偷a和b聯合犯事、私入民宅被警察抓住。**將兩人分別置於不同的兩個房間內進行審訊,對每一個犯罪嫌 疑人,**給出的政策是:

如果一個犯罪嫌疑人坦白了罪行,交出了贓物,於是證據確鑿,兩人都被判有罪。如果另一個犯罪嫌疑人也作了坦白,則兩人各被判刑8 年。

如果另一個犯罪嫌人沒有坦白而是抵賴,則以妨礙公務罪(因已有證據表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。

如果兩人都抵賴,則**因證據不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。

關於案例,顯然最好的策略是雙方都抵賴,結果是大家都只被判1年。但是由於兩人處於隔離的情況,首先應該是從心理學的角度來看,當事雙方都會懷疑對方會出賣自己以求自保、其次才是亞當·斯密的理論,假設每個人都是「理性的經濟人」,都會從利己的目的出發進行選擇。這兩個人都會有這樣一個盤算過程:

假如他坦白,如果我抵賴,得坐10年監獄,如果我坦白最多才8年;假如他要是抵賴,如果我也抵賴,我就會被判一年,如果我坦白就可以被釋放,而他會坐10年牢。綜合以上幾種情況考慮,不管他坦白與否,對我而言都是坦白了划算。兩個人都會動這 樣的腦筋,最終,兩個人都選擇了坦白,結果都被判8年刑期。

基於經濟學中rational agent的前提假設,兩個囚犯符合自己利益的選擇是坦白招供,原本對雙方都有利的策略不招供從而均被判處一年就不會出現。這樣兩人都選擇坦白的策略以及因此被判8年的結局,納什均衡」首先對亞當·斯密的「看不見的手」的原理提出挑戰:按照斯密的理論,在市場經濟中,每一個人都從利己的目的出發,而最終全社會達到利他的效果。

但是我們可以從「納什均衡」中引出「看不見的手」原理的一個悖論:從利己目的出發,結果損人不利己,既不利己也不利他。

納什均衡和佔優有什麼區別?可以舉一個例子(納什均衡和佔優均衡不完全相同的例子)說明一下嗎?

4樓:匿名使用者

一、納什均衡和佔優策略的區別

(一)概念不同

1、納什均衡,假設有n個局中人蔘與博弈,給定其他人策略的條件下,每個局中人選擇自己的最優策略(個人最優策略可能依賴於也可能不依賴於他人的戰略),從而使自己效用最大化。所有局中人策略構成一個策略組合 。納什均衡指的是這樣一種戰略組合,這種策略組合由所有參與人最優策略組成。

即在給定別人策略的情況下,沒有人有足夠理由打破這種均衡。

2、佔優策略:在一個博弈中,如果某一個博弈者不論其他博弈者選擇什麼策略,該博弈者確信自己選擇的唯一策略是最優的。

(二)特點不同

1、納什均衡指局中其他人一旦採取了某種措施,「我」有相應的策略,別人的策略不同,「我」的應對策略也可能不同。

2、佔優均衡是納什均衡特例,每個博弈方可以不用考慮別人的策略,就可以達到自己的最優。通俗來講就是不管別人採取什麼策略,「我」都用一種最優策略,策略唯一。

二、納什均衡舉例

佔優策略均衡一定是納什均衡,而納什均衡不一定是佔優策略均衡。

例如:**大戰,如果壟斷商們都不降價,收益最大。但如果一家悄悄降價,就會搶佔巨大利益。所以,降價是壟斷商們的「最優策略」,導致利潤微薄的「壞的均衡」。

壟斷商們通過「制度設計」,組成「托拉斯」,形成**同盟,走向「好的均衡」。**接著通過「制度設計」,出臺《反托拉斯》法,打破**同盟,逼著壟斷商們走向「壞的均衡」。

5樓:高傲的沙漠之狐

首先說佔優均衡。佔優均衡是指,對一個player1來說,無論其他players的策略是什麼,這個player1的最優決策都是同一個。例如囚徒困境中,兩個囚徒的最優決策都是坦白,而無論對方的決策是什麼。

對方坦白,我也坦白;對方繼續撒謊不坦白,我的最優策略還是坦白。坦白就是我的最優策略。同樣地,如果對方也有一個最優策略,那麼(坦白,坦白)就構成了佔優均衡。

納什均衡是指,對一個player1來說,如果給定其他players的決策,player1會選擇策略one,即策略one是player1在當前條件下的一個最優策略;同樣的,如果其他players的決策,也都是當前條件下的最有策略的話,那麼這些決策構成一個納什均衡。在納什均衡下,沒有player會改變自己的決策。

佔優均衡一定是納什均衡。納什均衡不一定是佔優均衡。

6樓:凌楚天

佔優均衡(dominant equilibrium),指不論其他參與者做何種策略選擇,每個參與者的最佳策略都是唯一的,其結果為佔優均衡。   佔優均衡一定是納什均衡。在「囚徒困境」中,不論囚徒b坦白還是不坦白,囚徒a的最優選擇都是坦白;同樣對於囚徒b來說,不論囚徒a坦白還是不坦白,他的最優策略是擔白。

因此(坦白,坦白)是策略組合的佔優均衡,同時這一策略組合又一定是納什均衡。因為一個參與者的佔優均衡是對基他參與者任何設定策略的最優選擇。

佔優均衡是納什均衡的其中一種情況,所以如果是佔優均衡就一定是納什均衡,而如果不是佔優均衡,跟納什均衡就沒有什麼關係了,所以沒有這樣的例子。

什麼是納什均衡?能不能舉個簡單的例子?納什均衡與最優策略的關係是什麼呢?

7樓:匿名使用者

一次博弈最終總會形成一個結果,好比討價還價,這就是博弈均衡。"納什均衡"是一種最常見的、也是最重要的博弈均衡。它是美國天才數學家納什在2023年正在攻讀博士學位時提出來的,**題為《n人博弈的均衡問題》。

納什巧妙運用數學技巧,證明了如下定理:對一任何一個n人蔘與的非合作博弈(零和或非零和),如果每個參與者的策略是有限的,那麼一定存在至少一個納什均衡解集。該**只有短短一頁紙,但卻成了博弈論的經典文獻,並使他獲得了諾貝爾經濟學獎。

"納什均衡"的經典案例是"囚徒困境":兩個作案嫌疑人分別關在兩件牢房,警察告知,如果兩人都招供,則各坐牢3年;如果兩人都不招供,則放出;如果一人招供而另一人不招供,則招供的坐牢3年,不招供的坐牢10年。局外人看來,最好兩人都不招供。

但從每個人來看,招與不招的代價分別為與,還是招供為好。

但從納什均衡卻得出一個悖論:單個人的最優選擇卻沒有導致全域性最佳的結果。現實中的例子很多,如**戰的結果是兩敗俱傷。

"納什均衡"證明了一個道理:非合作博弈的情況下困境無法解脫。

納什均衡點,應怎樣理解

8樓:自治區區

納什平衡,又稱為非合作賽局平衡,是博弈論的一個重要概念,以約翰·納什命名。

9樓:

……一開始我也以為是說史蒂夫納什……進來才發現不是……

10樓:匿名使用者

經典的例子就是囚徒困境,囚徒困境是一個非零和博弈。 大意是:一個案子的兩個嫌疑犯被分開審訊,警官分別告訴兩個囚犯,如果你招供,而對方不招供,則你將被判刑一年,而對方將被判刑十年;如果兩人均招供,將均被判刑五年。

於是,兩人同時陷入招供還是不招供的兩難處境。如果兩人均不招供,將最有利,只被判刑三年。 但兩人無法溝通,於是從各自的利益角度出發,都依據各自的理性而選擇了招供, 這種情況就稱為納氏均衡點。

這時,個體的理性利益選擇是與整體的理性利益選擇不一致的。 囚犯甲的博弈矩陣 囚犯甲 招供 不招供 囚犯乙 招供 判刑五年 甲判刑十年;乙判刑一年 不招供 甲判刑一年;乙判刑十年 甲判刑三年 基於經濟學中rational agent的前提假設,兩個囚犯符合自己利益的選擇是坦白招供,原本對雙方都有利的策略不招供從而均被判刑三年就不會出現。事實上,這樣兩人都選擇坦白的策略以及因此被判五年的結局被是「納什均衡」(也叫非合作均衡),換言之,在此情況下,無一參與者可以「獨自行動」(即單方面改變決定)而增加收穫。

什麼是納什均衡,他的原理是什麼,什麼是納什均衡理論?

納什均衡,又稱為非合作博弈均衡,是博弈論的一個重要術語,以約翰 納什命名。納什均衡是一種策略組合,使得每個參與人的策略是對其他參與人策略的最優反應。假設有n個局中人蔘與博弈,如果某情況下無一參與者可以獨自行動而增加收益 即為了自身利益的最大化,沒有任何單獨的一方願意改變其策略的 則此策略組合被稱為納...

什麼是納什均衡解,什麼是納什均衡

納什均衡,nash equilibrium 又稱為非合作博弈均衡,是博弈論的一個重要術語,以約翰 納什命名。約翰 納什1948年作為年輕數學博士生進入普林斯頓大學。其研究成果見於題為 非合作博弈 1950 的博士 該博士 導致了 n人博弈中的均衡點 1950 和題為 非合作博弈 1951 兩篇 的發...

納什均衡點,應怎樣理解怎樣解釋納什均衡的哲學意義

納什平衡,又稱為非合作賽局平衡,是博弈論的一個重要概念,以約翰 納什命名。一開始我也以為是說史蒂夫納什 進來才發現不是 經典的例子就是囚徒困境,囚徒困境是一個非零和博弈。大意是 一個案子的兩個嫌疑犯被分開審訊,警官分別告訴兩個囚犯,如果你招供,而對方不招供,則你將被判刑一年,而對方將被判刑十年 如果...