對于人類來說,從原始社會到現代社會,從每個家庭到各個公司、政府和機構,處處都有合作行為。另外,在生物界中,也有很多合作的例子。例如,吸血蝙蝠會把自己的食物分享給那些沒找到食物的同伴,一些種類的鳥類和群居昆蟲會經常幫助照顧彼此的幼崽,甚至細菌都會彼此合作,來一起抵抗滅掉它們的抗生素。
每個生物個體都為自己著想,那為什么還會出現合作行為呢?很顯然,通常這么做會嘗到甜頭。那在什么情況下,合作會容易出現呢?這個問題值得研究,因為解決它可以幫助人們為企業、政府創建一個促進合作的環境,幫助人們理解生物界中合作是如何進化出來的等等。而研究人員發現,通過博弈論可以為這些問題提供更好的解釋。

只有一次博弈就會背叛
提到博弈論,我們首先想到的就是“囚徒困境”,它說的是:警方逮捕了兩名嫌疑犯,但沒有足夠證據指控二人有罪。于是警方分開嫌疑犯,不讓他們相互溝通,并分別向兩個人提供以下相同的選擇:若一人認罪并檢舉對方(“背叛”對方),而對方保持沉默,此人將即時獲釋,沉默者將坐牢3年;若二人都保持沉默(互相“合作”),則二人都坐牢1年;若二人都互相檢舉(互相“背叛”),則二人都坐牢2年。
研究人員發現,參與者如果只進行一次囚徒困境的話,那么其最優策略就應該是背叛。現實生活中有很多只發生一次的博弈,而人們的確更愿意去背叛。例如,車站和旅游點等人群流動大的地方,這里的商品和服務不僅質量差,而且還存在假貨。因為商家和顧客之間基本上只是博弈一次,顧客基本不太會再次光臨,所以商家最理性的選擇就是盡可能地賺到錢。同樣,在一個陌生人和一個熟人之間,人們可能更愿意背叛陌生人,畢竟之后再也很難見面,選擇了背叛可以獲得最大利益,且風險最小。

多次博弈要合作
在現實生活中,除過只發生一次的博弈外,更多的是多次博弈,這就需要人們在做每一次決策時,可以根據過去的經驗,對未來做出預判。例如,你可能會懲罰曾經背叛過你的人,也可能不會背叛在未來有可能給你帶來好處的人。這樣,背叛可就不是什么好主意了。因此,處在社區的商店會更誠信,商業區的商店會提供更好的商品和服務,否則就沒有回頭客了。同樣,我們不愿意去背叛熟人。
博弈論模型也證實了這個日常的生活經驗。上個世紀70年代,美國政治學家羅伯特·阿克塞爾羅德邀請了許多博弈論專家,來為計算機設計各種策略,在重復的囚徒困境中彼此互相競爭。結果發現,盡管每個策略都是把贏取更多收益當作出發點,但是時間一長,在取得更多利益的策略中,采用合作的次數要多于背叛的次數。
阿克塞爾羅德的研究,可以很好的解釋生物界中合作是如何進化出來的。在生物界中,各種各樣的博弈會反反復復地發生,雖然每個生物在博弈開始時可能具有不同的策略,但經常選擇合作往往會帶來更多的利益。通過自然選擇,合作可以成為流傳下來的最優策略,即使每個生物都自私。
例如,生活在非洲的長尾黑顎猴,遇到危險時會大聲尖叫,以此來警告周圍的同伴有捕食者靠近。但是,這只大喊大叫的猴子,也等于把捕食者的注意力都吸引到它自己身上了。如果猴子一生只會遇到一次危險情況,這就相當于單次發生的囚徒困境,選擇沉默可能對自己是有好處的。但事實上,在猴子整個一生中,這種情況會反復發生,就像重復的囚徒困境一樣,那么發出警告就會成為最優策略,平均來說每只猴子會因此獲得更多的好處。
“以牙還牙”
在重復的囚徒困境中,你一直合作,而對手卻一直背叛,那該怎么辦呢?我們來談談一種叫做“以牙還牙”的策略,這種策略指的是開始時要采取合作的策略,之后每次做決策則模仿對手在上一階段的舉動。別看內容很簡單,但它在阿克塞爾羅德邀請的博弈論專家所進行的競賽中獲得的收益往往是最多的。
“以牙還牙”策略,并不新鮮。也就是我們常說的“恩仇必報”,“以其人之道,還治其人之身”,“出來混,早晚是要還的”等等。而在生物界中,也存在著“以牙還牙”的策略。例如,一對刺魚巡游時偵察到了附近的捕食者,它們就會采用“以牙還牙”的策略。如果一條魚決定刺向前方,那么另一條魚也會采取類似的勇敢行動。如果一條魚后撤并希望其同伴去冒這個險,那么另一條魚也會后撤。
“以牙還牙”的策略是鼓勵合作的出現,因為“以牙還牙”者會對背叛行為進行報復,而對方如果停止背叛,“以牙還牙”者會原諒對方并繼續合作。不過,它還可以進行改進,并能獲得更多的利益。其方法是當對方背叛時,參與者也偶爾會與對方合作,來防止陷入不斷背叛的循環之中。這叫做“寬恕地以牙還牙”策略,或者簡稱為慷慨策略。
小心勒索者
一般來說,在重復的囚徒困境中,參與者更傾向于選擇合作。但在有些情況下,卻不是這樣的。
2012年,美籍英裔物理學家弗里曼·戴森和美國計算機科學家威廉·普里斯為重復的囚徒困境找到了一個新的策略,即勒索策略,它正式的名稱叫做零行列式策略。應用這個策略有個前提,即只有兩個參與者參與重復的囚徒困境,而且每個參與者每次做決策則依據對手在上一階段的舉動。
勒索策略具體是這樣的:對方上次選擇背叛的話,那么勒索者下一次必然背叛;而在對方上次選擇合作時,勒索者并不總是合作,而是以一定地概率去選擇合作。其概率的多少,由收益等因素所決定,這會使對方認為,與其始終背叛還不如合作,因為勒索者有時會知恩圖報,最終算下來還是經常合作會獲得更多的利益。
所以,與勒索者進行囚徒困境有點像“最后通牒”博弈,也就是說,勒索者像是在提議一種分錢方案:如果對方不接受,那么每個人都沒錢。如果對方接受,那么就按照勒索者的方案分錢。很顯然,理性的結果就是勒索者只給對方一點點錢,對方就會接受。
但現實中,我們肯定不會接受這種分錢方案。同樣,人們很難在現實中應用勒索策略,因為博弈者會很快察覺出對方是勒索者,也會反過來威脅勒索者。美國哈佛大學的研究人員在真實的場景中進行了實驗,讓人類參與者與使用慷慨策略或勒索策略的電腦玩囚徒困境。結果是,與勒索的電腦共事時,人們就會被惹怒,傾向于拒絕與電腦合作,即使對雙方利益都有害。而人們與慷慨的電腦共事時,雙方都能獲得更多的利益。
而且,勒索策略一般適用于參與者為兩個的情況,如果參與者的數量足夠多的話,那么一個勒索者最終會遇到另一個勒索者,彼此收益都會降低。美國賓夕法尼亞大學的研究人員進行了模擬實驗。他們把很多種策略,應用到一些生物種群里,例如長尾黑顎猴種群,或吸血蝙蝠種群中。他們所發現,勒索策略根本無法傳播開來,而是前面所說的慷慨策略,往往最終會在生物種群中傳播開來。
面對雪堆最好去合作
我們以上談論的都是“囚徒困境”這種經典博弈類型。現實生活中還存在著另外一些博弈類型,更有利于合作的出現。下面就是一個例子。
想象一下,在一個風雪交加的夜晚,兩人被路上的一個雪堆所阻。如果兩人一齊動手鏟雪,則他們都可以盡快地回家。如果只有一人鏟雪,雖然兩個人都可以回家,但是背叛者還可以不出力氣。如果兩人都選擇背叛,那么兩人都無法回家。這種博弈叫做雪堆博弈,它與囚徒困境不同的是,合作更容易出現。面對背叛的對手時的最佳策略仍然是合作,而不是背叛,因為相互背叛的結果是極為嚴重的。在日常生活中,這種情況比較普遍,像小兩口都不想做飯,但不做飯就要餓肚子,所以最終一方還得不情愿地去做飯等等。
在生物世界,類似雪堆博弈也是存在的。例如,對于細菌來說,雪堆則是抗生素。一些細菌可以產生并分泌能抵抗抗生素的酶。不過生產酶是很費力的事情,一些細菌會懶得去生產,而是去利用身旁的更勤勞的細菌所分泌出的酶。勤勞的細菌也不會選擇背叛,否則會使得整個群體都會走向滅亡,它們會繼續合作來抵抗抗生素。這樣,這兩種類型的細菌就可以穩定共存。
合作的崩潰
在日常生活中,合作要付出一些代價,不過也會得到獎勵——那種在不合作情況下無法獲得的獎勵。通常情況下,人們在合作中付出的越多,得到的獎勵也越多。但即使這樣,有時合作也會發生崩潰。
合作的崩潰,會發生在付出與收益的比值變得太高的時候。例如,假設一個團隊中每個人在一個項目中都額外地付出了一些,那么過不多久每個人都會意識到,再怎么付出也得不到什么,還不如偷偷懶也不會有什么損失,畢竟其他人都在額外地付出。這種情況看起來是一個悖論,即合作者花了更大的努力來去合作,結果卻方便了背叛者,或者說,我們越是努力地合作,別人就越不可能這么做。
一個極端的例子,就是中國在過去說經歷過的“大鍋飯”時代:收益最終變為固定的,每個人“干好干壞一個樣”。這時,大家合作得越好,每個人就越想著偷懶。
所以有時,我們還不能過于促進合作,因為這同時也在促進背叛的出現。
(本文源自大科技*科學之謎2015年第12期文章)
0 篇文章
如果覺得我的文章對您有用,請隨意打賞。你的支持將鼓勵我繼續創作!