數據統計和闡發是每個科研人員都應具備的技術,但愿本文能幫忙初學者避免無意中犯錯,并讓你在看到居心扭曲的統計成果時,第一時候識破作假者的手法。
撰文 | Winnifred Louis & Cassandra Chapman
翻譯 | 楊晚鈺
審校 | 夏燁
圖片來歷:Carlos Muza on Unsplash
統計可以或許有用地呈現數據,便于我們理解四周宿世界中的模式。但若是憑直覺詮釋這些模式,成果凡是會令人掉望。以下是統計、概率和風險闡發中常見的幾種錯誤,以及避免這些錯誤的方式。
01 | 無意義的差別
股市的良多日常波動都只是偶爾現象,并沒有任何意義;在平易近意調查中,某黨領先的一兩個百分點凡是也只是數據噪聲罷了(在給心猿意馬的數據樣本或公式中,呈現的難以詮釋的轉變或隨機性)。
為避免對這種數據波動的原因作犯錯誤的推論,可以查看它們的“誤差幅度”。差別若是在誤差幅度內,則很可能無意義,這種轉變很可能只是隨機波動。
02 | 來自實際印象的誤會
我們常會聽到對兩個群體差別的籠統歸納綜合,例如說女性更樂于撫育兒女,而男性體格更強壯。這些結論凡是受到刻板印象和平易近間說法的影響,卻輕忽了兩個群體的相似之處,以及統一群體內部的差別。
若是隨機遴選兩個男性,他們的體能可能相差很大;若是隨機遴選一男一女,他們撫育兒女的表示也可能很是附近,男性的表示甚至會更較著。
要避免這樣的錯誤,你可以查看兩組的“效應量”(effect size)。它可以反映兩組間平均數的差別。若是效應量小,申明兩組相似度高。但即便效應量大,也可能是較大的組內差別導致的,是以不克不及斷心猿意馬兩組間的所有個別都存在差別。
03 | 忽略極值
考查對象從命正態分布(也稱“鐘形曲線”)時,效應量的兩頭是有主要意義的。在正態分布下,大大都個別接近平均值,只有一小部門個別遠高于或遠低于平均程度。
這種環境呈現時,組內的細小轉變城市導致差別。這種差別對平均值幾乎沒有影響,但可能會完全改變極值的特征(見第二點)。
要避免這個錯誤,需要細心考慮是否要研究極值。若是針對平均程度進行研究,凡是不消在意組內的細微差別。但若很是存眷極值,這些細微差別將會影響龐大。
當研究對象從命正態分布時(在鐘形曲線上),極值處的差別比平均值四周更為較著(表示在分布曲線上為:極值處的重疊區域較少,而平均值四周有大部門重疊)
04 | 相信巧合
美國每年淹死在泅水池里的人數和尼古拉斯·凱奇(Nicolas Cage)出演的片子數存在相關性,你知道嗎?
若是你不雅察夠細心,就會發現這種有趣的模式和相關性,但這也僅僅是巧合罷了。僅僅因為兩件事同時發生轉變,或者具有相似的轉變趨向,并不克不及申明它們有關。
要避免這一錯誤,需要思慮不雅察到的相關性在多大水平上是靠得住的。這種相關性是一次性的,仍是多次呈現的?將來的相關性又可否展望?若是這種相關性只呈現了一次,那它很有可能是隨機的成果。
05 | 因果倒置
舉例來說,假如掉業和心理問題存在相關性,你很輕易注重到此中“較著”的因果關系——心理問題會導致掉業。但有時因果關系恰好相反,例如說是掉業誘發了心理問題。
要避免這一錯誤,可以在發現相關性時提醒本身思慮反標的目的因果關系。這種影響從相反偏向猜測可以當作立嗎?仍是說兩者彼此感化,形當作了一個環形反饋?
06 | 第三種身分
人們經常會健忘對可能的“第三身分”(也稱外部身分)進行評估。某些環境下,兩件工作的相關性是由第三身分引起的,它們現實上都是第三身分的成果。
舉例來說,假設下飯館和更健康的心血管系統間存在相關性,這會讓我們相信兩者間存在某種因果關系。然而成果可能是,能經常下飯館的人社會地位更高,承擔得起更好的醫療保健辦事,而這種醫療保健辦事才是他們心血管系統更健康的原因。
要避免這一錯誤,別忘了在發現相關性時考慮第三身分。找到事務 A 的可能的原因 B 時,反過來想一想,會不會是外部身分 C 導致了 B?C 會導致 A 和 B 同時發生嗎?
07 | 點竄坐標軸
在對圖表的縱坐標進行縮放和標注時,會呈現良多利誘人的處所。縱坐標刻度該當將統計對象有意義的數據規模完整地呈現出來。但有時,制圖者為了強調細微差別和微弱的相關性,會縮小縱坐標的刻度規模。
從下圖可以看出,當縱坐標刻度規模為 0~100 時,兩個柱圖看起來差不多高。但若將刻度規模設置為 52.5~56.5,它們看起來就判然不同了。
要避免這一錯誤,可以注重不雅察坐標軸刻度。對于那些沒有刻度的圖表,更要持思疑立場。
本文經授權轉載自公家號“科研圈”,原文鏈接:https://www.sciencealert.com/the-seven-deadly-sins-of-statistical-misinterpretation-and-how-to-avoid-them
特 別 提 示
《返樸》,科學家領航的好科普。國際聞名物理學家文小剛與生物學家顏寧配合出任總編纂,與數十位分歧范疇一流學者構成的編委會一路,與你配合求索。存眷《返樸》介入更多會商。二次轉載或合作請聯系fanpusci@163.com。
0 篇文章
如果覺得我的文章對您有用,請隨意打賞。你的支持將鼓勵我繼續創作!