• <noscript id="ecgc0"><kbd id="ecgc0"></kbd></noscript>
    <menu id="ecgc0"></menu>
  • <tt id="ecgc0"></tt>

    你被騙過嗎?7 種操縱數據的方式,第 7 種讓無數人中招

    數據統計和闡發是每個科研人員都應具備的技術,但愿本文能幫忙初學者避免無意中犯錯,并讓你在看到居心扭曲的統計成果時,第一時候識破作假者的手法。

    撰文 | Winnifred Louis & Cassandra Chapman

    翻譯 | 楊晚鈺

    審校 | 夏燁

    圖片來歷:Carlos Muza on Unsplash

    統計可以或許有用地呈現數據,便于我們理解四周宿世界中的模式。但若是憑直覺詮釋這些模式,成果凡是會令人掉望。以下是統計、概率和風險闡發中常見的幾種錯誤,以及避免這些錯誤的方式。

    01 | 無意義的差別

    股市的良多日常波動都只是偶爾現象,并沒有任何意義;在平易近意調查中,某黨領先的一兩個百分點凡是也只是數據噪聲罷了(在給心猿意馬的數據樣本或公式中,呈現的難以詮釋的轉變或隨機性)。

    為避免對這種數據波動的原因作犯錯誤的推論,可以查看它們的“誤差幅度”。差別若是在誤差幅度內,則很可能無意義,這種轉變很可能只是隨機波動。

    02 | 來自實際印象的誤會

    我們常會聽到對兩個群體差別的籠統歸納綜合,例如說女性更樂于撫育兒女,而男性體格更強壯。這些結論凡是受到刻板印象和平易近間說法的影響,卻輕忽了兩個群體的相似之處,以及統一群體內部的差別。

    若是隨機遴選兩個男性,他們的體能可能相差很大;若是隨機遴選一男一女,他們撫育兒女的表示也可能很是附近,男性的表示甚至會更較著。

    要避免這樣的錯誤,你可以查看兩組的“效應量”(effect size)。它可以反映兩組間平均數的差別。若是效應量小,申明兩組相似度高。但即便效應量大,也可能是較大的組內差別導致的,是以不克不及斷心猿意馬兩組間的所有個別都存在差別。

    03 | 忽略極值

    考查對象從命正態分布(也稱“鐘形曲線”)時,效應量的兩頭是有主要意義的。在正態分布下,大大都個別接近平均值,只有一小部門個別遠高于或遠低于平均程度。

    這種環境呈現時,組內的細小轉變城市導致差別。這種差別對平均值幾乎沒有影響,但可能會完全改變極值的特征(見第二點)。

    要避免這個錯誤,需要細心考慮是否要研究極值。若是針對平均程度進行研究,凡是不消在意組內的細微差別。但若很是存眷極值,這些細微差別將會影響龐大。

    當研究對象從命正態分布時(在鐘形曲線上),極值處的差別比平均值四周更為較著(表示在分布曲線上為:極值處的重疊區域較少,而平均值四周有大部門重疊)

    04 | 相信巧合

    美國每年淹死在泅水池里的人數和尼古拉斯·凱奇(Nicolas Cage)出演的片子數存在相關性,你知道嗎?

    若是你不雅察夠細心,就會發現這種有趣的模式和相關性,但這也僅僅是巧合罷了。僅僅因為兩件事同時發生轉變,或者具有相似的轉變趨向,并不克不及申明它們有關。

    要避免這一錯誤,需要思慮不雅察到的相關性在多大水平上是靠得住的。這種相關性是一次性的,仍是多次呈現的?將來的相關性又可否展望?若是這種相關性只呈現了一次,那它很有可能是隨機的成果。

    05 | 因果倒置

    舉例來說,假如掉業和心理問題存在相關性,你很輕易注重到此中“較著”的因果關系——心理問題會導致掉業。但有時因果關系恰好相反,例如說是掉業誘發了心理問題。

    要避免這一錯誤,可以在發現相關性時提醒本身思慮反標的目的因果關系。這種影響從相反偏向猜測可以當作立嗎?仍是說兩者彼此感化,形當作了一個環形反饋?

    06 | 第三種身分

    人們經常會健忘對可能的“第三身分”(也稱外部身分)進行評估。某些環境下,兩件工作的相關性是由第三身分引起的,它們現實上都是第三身分的成果。

    舉例來說,假設下飯館和更健康的心血管系統間存在相關性,這會讓我們相信兩者間存在某種因果關系。然而成果可能是,能經常下飯館的人社會地位更高,承擔得起更好的醫療保健辦事,而這種醫療保健辦事才是他們心血管系統更健康的原因。

    要避免這一錯誤,別忘了在發現相關性時考慮第三身分。找到事務 A 的可能的原因 B 時,反過來想一想,會不會是外部身分 C 導致了 B?C 會導致 A 和 B 同時發生嗎?

    07 | 點竄坐標軸

    在對圖表的縱坐標進行縮放和標注時,會呈現良多利誘人的處所。縱坐標刻度該當將統計對象有意義的數據規模完整地呈現出來。但有時,制圖者為了強調細微差別和微弱的相關性,會縮小縱坐標的刻度規模。

    從下圖可以看出,當縱坐標刻度規模為 0~100 時,兩個柱圖看起來差不多高。但若將刻度規模設置為 52.5~56.5,它們看起來就判然不同了。

    要避免這一錯誤,可以注重不雅察坐標軸刻度。對于那些沒有刻度的圖表,更要持思疑立場。

    本文經授權轉載自公家號“科研圈”,原文鏈接:https://www.sciencealert.com/the-seven-deadly-sins-of-statistical-misinterpretation-and-how-to-avoid-them

    特 別 提 示

    《返樸》,科學家領航的好科普。國際聞名物理學家文小剛與生物學家顏寧配合出任總編纂,與數十位分歧范疇一流學者構成的編委會一路,與你配合求索。存眷《返樸》介入更多會商。二次轉載或合作請聯系fanpusci@163.com。


    • 發表于 2019-09-18 02:01
    • 閱讀 ( 942 )
    • 分類:其他類型

    你可能感興趣的文章

    相關問題

    0 條評論

    請先 登錄 后評論
    admin
    admin

    0 篇文章

    作家榜 ?

    1. xiaonan123 189 文章
    2. 湯依妹兒 97 文章
    3. luogf229 46 文章
    4. jy02406749 45 文章
    5. 小凡 34 文章
    6. Daisy萌 32 文章
    7. 我的QQ3117863681 24 文章
    8. 華志健 23 文章

    聯系我們:uytrv@hotmail.com 問答工具
  • <noscript id="ecgc0"><kbd id="ecgc0"></kbd></noscript>
    <menu id="ecgc0"></menu>
  • <tt id="ecgc0"></tt>
    久久久久精品国产麻豆