stevenliuyi,隨便玩玩
這其實是個典型的「伯克森悖論」(Berkson's paradox)。
一個演員受到存眷,本家兒要原因不過乎兩點,要么顏值夠高,要么演技夠好。顏值不在線、演技又尷尬的,天然存眷的人少,甚至可能都還沒踏進演藝圈就早被裁減了。這半斤八兩于對樣本做了一次篩選,使原本無關的「顏值」與「演技」變得相關了。我簡單畫了張圖來申明:
圖中每個圓點代表一位演員,顏值與演技無關,圓點在平面上隨機分布。斜線左下方的是既沒顏值也沒演技從而沒啥人存眷的演員。而我們熟知的明星則絕大大都位于斜線的右上方。若是考慮這些高知名度的演員的話,能較著看到顏值與演技呈現出了負相關關系,這就是發生長得都雅與演技當作反比這一印象的本家兒要原因。這種子虛的相關性即是所謂的伯克森悖論。
為了便利起見,圖中假設了顏值與演技都是呈平均分布。實際平分布固然不是平均的,但這并不影響結論。好比說正態分布,那位于圖中右上角的顏值演技兩開花的演員就更少了,負相關性甚至變得更強。
再舉一個伯克森悖論的例子:為什么良多人會感覺帥哥都是混蛋呢?。這個例子是 UW-Madison 數學系傳授 Jordan Ellenberg 提出來的。做個簡化的假設,當你找男生約會的時辰最垂青男生的兩個前提:長得是不是帥,對你是不是好。兩者至少知足其一你才會考慮跟他約會,長得不帥還不是暖男的壓根就沒有機遇。對你所有的約會對象而言,兩者有了負相關,于是你可能發生出渣男長得帥、暖男長得丑的印象。
伯克森悖論其實也可以看作是一種「幸存者誤差」,無論是受人存眷的演員,仍是你的約會對象,都算是某種意義上的「幸存者」。
最后提一下伯克森悖論和因果揣度中的 collider (碰撞點)之間的關系。下面的因果圖暗示了一組簡單的因果關系:演技(A)與顏值(B)是演員受存眷與否(C)的兩個決議身分,但 A 與 B 之間并無聯系關系。
C 被稱為 A 與 B 的 collider。collider 最主要的一個性質是:當節制了變量 C 之后,原本無關的 A 與 B 會呈現相關性。在我們的例子中,演技與顏值無關(A 與 B 之間沒有箭頭),但因為節制了變量 C(只考慮受人存眷的演員),便有了假性相關(spurious correlation)。中學時我們就都學過節制變量法,可能良多人會誤覺得節制的變量越多成果越切確,至少多些沒啥壞處。但伯克森悖論就是一個反例:節制的變量若是正好是個 collider,那能讓無關的變量變得相關,甚至原本正相關的兩個變量可能釀成了負相關。
0 篇文章
如果覺得我的文章對您有用,請隨意打賞。你的支持將鼓勵我繼續創作!