秦朝末年,陳勝、吳廣就喊出了“達官貴人,寧有種乎”的標語,有幅名聯也說“自古英雄多患難,紈绔后輩少偉男”,可是統計學卻給了我們紛歧樣的謎底。上千年的科舉測驗的成果統計顯示,身世農村的進士比例只占50%強,其余都是身世官吏貴族,而那時中國生齒90%以上都身居農村,這還包羅了中小田主家庭,這樣一比力的話,真正身世農人家庭的進士的比例就更少了。就連今天在號稱平易近本家兒的美國,你也能看見這種現象,總統老布什的兒子小布什也是總統,而肯尼迪家族事實上已經是個政治上的貴族家庭,固然平易近本家兒概況上可以做到人人都有平等競爭的機遇,但統計數字告訴我們,現實上生于官宦家庭的人進入上流社會的機遇更多。
這申明,統計能經常批改我們對社會現象的固有直覺。
拋硬幣也需要統計
就連最簡單的拋硬幣,我們都離不開統計的幫忙。
拋硬幣是一種古老的、我們認為最公允的賭錢體例。人們一般相信,硬幣落下后正背面朝上的概率各占50%,是以人們在進行兩難選擇時喜好用拋硬幣的體例來決議,如足球角逐開場時,裁判城市把兩邊的隊長叫過來,從口袋中掏出一枚硬幣,讓隊長們各選一面,然后拋標的目的空中。若是不是科場規律不許可,必然也會有人在科場上拋硬幣來做選擇題,因為我們都相信,硬幣落下后正背面朝上的概率各占50%,這樣至少我們有一半的機遇做出準確的選擇。
既然拋硬幣的機遇是50%,那我們持續拋好幾回硬幣,是不是正反兩面的次數都一樣呢?
二戰時,有位數學家被關進了集中營,德國士兵奪走了他的一切,卻不測地留給了他一枚硬幣,或許這是對他數學家身份的“優待”。作為一個數學家,在集中營里他能做什么呢?在士兵的機槍下,他起頭拋硬幣,用橫與豎代表正面和背面,把成果刻在集中營的墻壁上。
他拋10次的成果,有7次正面朝上,正面比背面多4次,正面朝上的次數占70%;拋20次,有13次正面朝上,比背面多6次,占65%??
當他拋到10000次時,背面5061次,反而比正面多了122次,占50.61%;最后他一共拋了80640次,背面40641次,多出正面642次,占50.39%。
他拋的8萬多次中,只是在拋第142次時,呈現了正背面各71次的成果,其他時辰,正背面呈現的次數都不相等。
這位數學家發現,盡管正背面呈現次數的差距有時拉大有時縮小,但總體來說,跟著拋的次數的增多,正面與背面呈現次數的差距會逐漸增大,不外各自所占的比例,卻大體味越來越接近50%,卻幾乎不會剛好等于50%。而我們拋有限的幾回,正歸正好參半的機遇是很小的。
在這里,統計學讓我們領會到拋硬幣的紀律也不克不及想當然。
“死”也躲不開的統計
統計就是經由過程大量的數據在某些看似沒有紀律的事務中找出運行的紀律,精確的統計數據能幫忙我們對紛繁復雜的社會現象進行心猿意馬量闡發,從而為我們在做展望時供給參考。正因為如斯,統計已經進入人類社會糊口的方方面面。
我國每10年會進行一次全國生齒普查,到時辰會有大量的自愿者敲開各家各戶的大門,讓他們填寫表格。從普查后的數據中可以找出生齒轉變的環境,像男女比例、各春秋段生齒比率、就業率、出生和滅亡率等,這可都是關系到國計平易近生的大事。
不僅國度需要這些生齒信息,企業也需要這些信息指導本身的持久經營。保險公司知道了生齒的滅亡率,才可以計較出應該收幾多保險費,太貴了,沒有人投保,太廉價了,賠的錢跨越了收的錢,可要賠本的。
企業經營也需要進行統計。沒準什么時辰,你在家里會俄然收到一個德律風,本來是電視臺打來的,他們在統計節目標收視率。收視率越高,他們的告白就賣得越貴。
我們的糊口也離不開統計。每個月家里大要會花幾多錢,媽媽也許并沒有當真計較過,但心里必然有本帳,多花了一點就會暗暗埋怨,這個月是什么工具又漲價了,讓糊口費超支,她已經在不知不覺中統計了每個月的平均支出。
黌舍要統計升學率,班上要統計成就和名次,你本身也要統計本身的總分或平均成就的起落。
這樣看起來,統計似乎是個很簡單的腦力勞動,不就是把一些累積的數字弄在一路,再來個加減乘除嗎?似乎小學生也能做得了。你若是真這樣想,可就大錯特錯了,統計可不是這么簡單的,此中儲藏著很多復雜的數學常識,是一門很深的學問呢!
統計本身的總分,只需要把所有的科目分數加起來就行了;媽媽要摸清家里支出的紀律,就要在幾年的時候里持續統計每個月的支出;而電視臺只有給所有的不雅眾都打德律風調查才能獲得精確的收視率,可是他們可能會有幾十萬的不雅眾呀;我國有十三億生齒,國度進行生齒普查就更難了,難怪要每10年才能進行一次,可是10年間,某些方面的數據可能會有很大的轉變,中心這幾年若是需要數據,那么該怎么辦呢?
由此可見,社會現象愈復雜,我們的統計工作也就愈堅苦。
腳踏兩船的抽樣
熟悉到統計的難度,我們就需要把握一些統計技巧了,抽樣調查就是一個常見的統計調查方式。我們先來看看電視臺若何進行收視率統計。
假設有一家電視臺,總共有7位用戶(好可憐的電視臺,選擇比力小的數字,是為了便利讀者可以或許本身組合出準確的謎底)。此刻他們推出了一臺新節目,想領會收視率是幾多。這7位用戶中有2戶收看這個的節目,是以節目收視率為28.57%,可是電視臺并不知道,他們需要進行德律風調查。假設德律風費很昂貴,一家一戶地去調查,電視臺開支太大,是以他們最多只能選擇此中的4戶進行隨機抽樣調查。
從7戶中選擇4戶,一共有35種可能的收視組合體例。電視臺可能會發現,他們所選擇的4戶中,沒有一家在收看他們的節目,調查的收視率為0%,這種環境一共有5種可能組合,占總數的1/7;也可能會統計到只有1家在收看,調查的收視率25%,這種景象有10種組合,占2/7;還有一種環境,占剩下的4/7,有兩家在收看,調查的收視率50%。無論哪種環境的收視率都不會剛好等于28.57%。
可是電視臺并不需要很切確的收視率數據,只要它在合理的規模就行了。
我們把真實收視率28.57%這個數據對稱地放大到18.57%?38.57%,就會看到,調查收視率25%的那個成果已經被包含在此中。這個時辰,若是調查成果為25%,電視臺就有2/7的可能性是準確的;若是把規模再對稱地放大到6.57%?50.57%,那么還能把調查收視率50%的景象也包羅進來,電視臺對換查成果的把握就增大到6/7。
可是若是調查的成果偏偏為0%,那意味著什么?這種環境只有1/7的可能會發生,是概率最小的工作,若是最不成能的工作真的發生了,那電視臺也只有相信它是真的,節目收視率確實為0%了,這個節目該被撤換失落。
可見,在進行調查的時辰,只要把許可的誤差規模充實放大,就能有足夠的把握說,我們的調查成果是準確的。前面我們列舉的用戶和調查數字都太小了,所以要把誤差規模放大,才會有足夠的把握。在這個例子中,只要把幾個數字稍微調大一點,誤差規模就會大大縮小,而把握反而會提高。例如,當用戶數變為20,此中有3家收看該節目,真實收視率為15%,電視臺調查數為10家時,就會有79%的機遇,收視率在10%?20%之間。真正的電視臺用戶一般都在數十萬以上,只要調查30個以上的用戶,就可以有99%甚至更高的把握,把調查誤差節制在足夠切確的規模內。我們完全可以相信調查的成果,而用不著給所有的用戶打德律風。
這種只對一部門客戶進行的調查叫抽樣調查。抽樣調查很是的有效,要知道大片的叢林里有幾多棵樹,只需選擇幾個小塊的區域進行調查,算出平均密度再乘上總面積,而不消去摸遍每一個山頭;要知道燈膽的平均利用壽命,只要拿少量燈膽進行試驗,而不消把所有的燈都用到壞;在大型養雞場里,要知道明天有幾多母雞會下蛋,也只用遴選幾十只驗一驗就夠了,而不消去摸每只雞的屁股。抽樣調查能給我們的糊口帶來很大的便利。
保險公司也不必去統計每小我的真實壽命,它只要抽樣調查,一樣可以獲得對勁的數據。看上去,抽樣調查真是個腳踏兩船的好方式。
不外,別歡快得太早。
導致破產的預言
抽樣調查的成果不是絕對準確的,即使有99.9%的把握,仍然有0.1%的不測會超出誤差許可的規模,那是不成避免的,是可以許可的正常錯誤。然而,有些抽樣調查卻會發生非正常的錯誤。
1936年美國總統選舉起頭了,大部門人都認為現任總統羅斯福——平易近本家兒黨的候選人——將會勝利,可是有個雜志《文學文摘》卻不覺得然,因為他們郵寄出1000萬份調盤問卷,收回了此中的240萬份,調查成果顯示,共和黨人蘭登將會以絕對優勢勝出。
1000萬的調查樣本,這么大規模的問卷調查,足以讓人相信,羅斯福的總統政治生活生計竣事了。但成果卻出乎雜志社的預料,羅斯福順遂被選美國總統,后來當作為二次大戰時帶領宿世界人平易近抗擊法西斯的三巨子之一。因為錯誤的展望,讀者對這本雜志發生了嚴重的信賴危機,大選竣事僅僅幾個月,《文學文摘》就破產了。
《文學文摘》的問題出在哪里呢?本來,他們是按德律風簿上的地址寄出的調盤問卷。固然今天德律風早已經進入了千家萬戶,但在20宿世紀30年月的美國,方才履歷過一場龐大的經濟危機,掉業人數高達900萬(而那時美國總生齒還不足1億),大部門人的工資只有危機以前1/3的程度,只有一部門相對敷裕的家庭用得起德律風這種“高科技產物”。德律風只有富人才有,富人大多撐持共和黨人蘭登,這就是《文學文摘》調查成果的來歷。而那時美國貧民大多撐持羅斯福,在人數上,貧民比富人多得多,因為在選舉上每個公平易近都有1票,復雜的貧民數目造當作了此次抽樣調查成果的龐大的誤差。
這是汗青上很是有名的抽樣統計掉敗的案例,它申明抽樣調查的當作敗,有時不在于調查數據量的幾多,而在于是否能做到完全隨機地抽取樣本。仍是那次總統選舉,別的有一小我蓋洛普,他只是在大街上隨機找了2萬人進行調查,就獲得了準確的成果——羅斯福將獲勝。
所以,即使抽樣調查,也不克不及抓起德律風就做,仍是起首要考慮一下,獲取的樣本必需是一個周全的群體。
人均收入的圈套
在統計調查中,即使樣本自己具有代表性,若是我們對統計數字進行簡單化處置,得出的結論也有可能與現實環境相差甚遠。
假設我們從大街上隨便找了11小我,獲得了他們月工資的環境:前2人的工資為200元,第3到第6人的工資為300元,緊接著,后面4人的工資依次為400、500、600和700元,最后1人的工資高達5000元。
這11小我的平均工資是800元。把這個數字拿給不知情的人看,他凡是會這樣認為:“啊,看來這個地域大大都人都能過上月收入800元的糊口。”但現實上,這11小我中,只有1小我的薪水高于800元,而別的的10小我的薪水都低于800元。假如該地域的貧苦線是700元,只從平均數上看,我們會感覺這個地域的人根基都糊口在貧苦線以上,但現實環境倒是,絕大大都人都掙扎在貧苦線以下。
看來,對統計數字進行簡單的平均,紛歧心猿意馬能反映真實環境,那個月收入5000元的人對平均數影響很大。我們需要從分歧的角度對隨機抽樣的成果做出闡發。好比,在上面的這個例子中,用眾數或中位數更能反映該地域人們的真實收入環境。
眾數是指在數項上呈現次數最多的值,好比在上面的統計數字中,收入在300元的人數最多,那么這組數據中,眾數就是300元。眾數可以讓我們領會,這個地域收入在哪個位置的人最多。中位數指挨次擺列(從大到小或從小到大均可)的數項中,位于中心項的值。在上面的數據中,第六小我的收入是300元,是以中位數是300元。看到中位數,我們就知道這個地域中,大約有一半的人收入在300元(含)以下,另一半的人收入在300元(含)以上。
有了眾數和中位數,我們就不會被平均數棍騙了。在財富收入不均的社會中,若是我們看到某地的平均工資比力高,就覺得這處所大部門人的工資收入都不錯,這就大錯特錯了。其實這個處所大部門通俗人的工資收入都很低,只是少少數人的收入高得離譜,把平均收入給拉上去了。
我們還需要統計指數
抽樣調查的目標也是為了領會整個群體,現實上統計的目標就是為了領會整體的狀況,那我們用什么來權衡這些狀況呢?有些用平均數,如平均春秋、平均價錢,有的用總數,如生齒總數、總價值等,可是這些都是暗示某一時刻的數值,不克不及反映它們隨時候轉變的環境,為了反映總體狀況的轉變,我們需要“指數”。
我們經常能聽到“指數”這個詞,股市里有股票指數,像國內的上證綜合指數,美國的納斯達克指數,看指數就知道股市的漲落;國度和處所當局每年要發布物價指數,代表那年的物價的程度。
指數到底是什么呀?是不是只有國度大事才能利用指數呢?
謎底可能會讓你大跌眼鏡,因為你和我都可以利用指數,只要你關心的數字會隨時候轉變,并且即使是小學結業生也可以領會怎么去編指數。
讓我們來看個例子吧。
假如你是個初中生,第一學期的七門課的總分剛好500分,第二學期,考了650分,分數是第一學期的130%,第三學期考600分,是第一學期的120%,今后每期都和第一期的成就對比,畫當作圖表,就可以知道,相對于第一期,你的成就轉變了百分之幾多,這個轉變了的百分比就是你的成就的總分指數。
我國上海證券買賣所的上證指數恰是這樣一種“總分”指數。
上海證券買賣所于1990年11月26日方才當作立那一天,所有股票的市場的總價錢設為100點,若是今后某一時刻是1200點,就是說相對于當作立初期時,這一刻市場的總價值已經是那時的12倍。和你的總分指數分歧,上證指數關心的是市場上所有股票的總價值,是以,不竭有新的股票加進去,也不影響指數的權衡感化。而對于你的成就,若是在第三學期時由7門課程釀成了8門,總分指數就不再有意義了,這個時辰,最好用平均分編寫指數。
物價指數就是這么一種平均型指數。
我們糊口用品的價錢天天都可能在轉變,幾年前價值8000塊的電腦設置裝備擺設,此刻可能只值3000元;昨天大白菜仍是5毛錢一斤,今天就會聽到媽媽在和鄰人的大媽群情,下雪了,所有的青菜都漲到了1塊以上。分歧的工具價錢有升有降,可是我們的支出整體上是上升了仍是下降了呢?這就需要物價指數來權衡。電腦好幾千元一臺,可是我們好幾年也不會改換它,肉呀、菜呀固然只幾元錢一斤,可是我們哪天也少不了它們,是以,在編制物價指數時,我們要按物品對我們糊口的影響,給分歧的物品在物價指數中以分歧比率。
真實的物價指數需要領會許很多多物品的價錢轉變,可是此刻,讓我們先用電腦價錢和肉價來編一個簡單的物價指數。
同樣的電腦客歲5000元/臺,本年3000元/臺,按電腦價錢對糊口的影響,在物價指數中占0.1%,而肉客歲5元/斤,本年8元/斤,在物價指數中占了剩下的99.9%,此刻讓我們看看物價整體是漲了仍是降了。
客歲的平均物價是5000×0.1%+5×99.9%=9.99元,本年的是3000×0.1%+8×99.9%=10.99元,本年平均物價是客歲的110%(10.99÷9.99×100%),若是以客歲的物價為根本,本年的物價指數就是110%。
盡管電腦價錢下降了2000元,而肉價只漲了戔戔的3元錢,可我們總體的糊口支出依然上漲了10%。
與股票指數分歧,物價指數用百分比暗示。
物價指數按用途分歧,又有商品零售物價指數、消費品物價指數,這些與我們的日常支前程息相關,別的的像工業品價錢指數、出產資料價錢指數,會直接影響工業,對我們的糊口只會有間接的影響。
撲朔迷離的相關系數
此刻,我們更進一步,統計數字具有代表性,闡發方式也很準確,那么是否就必然能得出準確的結論呢?未必。即使你用準確的方式闡發統計數字,也紛歧心猿意馬能得出準確的結論,甚至可能會得出莫名其妙的結論,好比“傍邊國生齒增添的時辰,美國國內的犯罪率就升高”這個結論。
在20宿世紀50年月后期,因為戰爭竣事,中國生齒增添的速度上升了。而與此同時,因為文化等方面的原因,美國良多青少年感應蒼茫,呈現了“垮失落的一代”,導致全國犯罪率在那些年中持續上升。從統計數字中,我們可以看到,中國生齒和美國國內犯罪率都在同步增加,我們可否由此得出結論:中國生齒增添導致了美國國內犯罪率的上升?或者反之,美國國內犯罪率的上升導致了中國生齒的增添?
顯然,兩個結論都很荒誕乖張。確實,兩者在數字方面呈現了同步上升的景象,呈現出近乎正比的關系,或者說,兩者之間的相關系數很是高。但現實上它們之間沒有任何干系,表示出高度的相關性純屬偶爾。所以當我們面臨統計數字的時辰,我們的結論要考慮相關性的問題。在某些環境下,有很高的相關系數,并不料味著兩者間就有因果關系,它們可能什么關系也沒有。我們再來看看下面的例子:
小兒麻木癥是一種已經消逝了的流行癥。在發財國度以前的調查中,曾發現這種病的發病率和飲料的發賣量有很大關系,它們的相關系數高達0.8。莫非是飲料不衛生,使小兒麻木癥是經由過程飲料傳染?可是在第三宿世界國度,市場上幾乎沒有飲料賣,發病率和發財國度卻相差無幾。這背后埋沒的身分是什么呢?
是溫度在搗蛋!引起小兒麻木癥的病毒傳染力跟著氣溫的上升而加強,飲料的發賣也和溫度有著同樣的關系,難怪飲料發賣會和發病率一路增加。
本來很高的相關系數,也有可能是第三種身分在搗鬼,并不料味著兩者間就有因果關系。
有個企業對本身持續好幾年的發賣額和告白費做了闡發,發現兩者相關系數是0.86,于是得出結論,他們的產物告白費與發賣量當作正比。企業在次年鼎力加大了告白的投入,可結果遠沒有估量的那么大。是什么導致這么大的誤差呢?告白費和發賣額可簡直是有因果關系的呀!
請來專家闡發后發現,本來前幾年該企業產物的價錢也一向鄙人降,直到上年才不變下來。產物價錢的下降,自己就極大地刺激了發賣,發賣量的增加不僅可以填補價錢下降帶來的損掉,還使發賣額有了新的增加,再加上這幾年告白費也增添了投入,使發賣額有了更進一步的增加。闡發人員闡發時只注重到告白費與發賣額同比增加,卻沒有考慮價錢下降對發賣的刺激感化。而上年價錢正好不變下來,告白費對發賣額的現實影響才顯露出來。
本來即使有因果關系的事物間,概況上看起來有很高相關系數,也可能是我們忽略了此外主要身分的成果。
在一些更復雜的轉變中,統計數字得出的結論更顯得撲朔迷離,這需要我們對各類身分進行更周全的闡發,例如,大氣二氧化碳含量與全球變暖的關系。
工業革命后,因為生齒大量增添,石油和煤炭的燃燒,釋放出大量的二氧化碳氣體,加上植被的粉碎,大氣中二氧化碳濃度由0.028%上升到0.039%,而同期宿世界的平均氣溫上升了0.7℃。要知道,曩昔的1萬年地球氣溫一共才上升了3℃。
那么,全球平均氣溫升高是否由二氧化碳的排放引起呢?從相關系數的角度看,我們不克不及等閑地下結論。因為大氣是個很是復雜的系統,影響氣溫轉變的身分多種多樣,如太陽勾當、火山勾當、氣流轉變等,我們對大氣的轉變紀律還領會得太少,憑什么把氣溫的上升都歸咎到二氧化碳頭上呢?會不會背后有其他的原因引起二氧化碳和氣溫同時增加呢?又或者全球變和緩二氧化碳增添其實底子就沒有關系,只是地球偶爾發了一次“高燒”,不久今后溫度就會回到正常?
在塑料大棚里,提高二氧化碳的含量可以使大棚溫度升高;金星的大氣當作分本家兒如果二氧化碳,因為溫室效應,那邊的大氣溫度可以高達400℃,這些都是間接證據,申明二氧化碳含量和全球變暖的相關性很大。固然從統計學的角度,我們不克不及解除其他身分導致全球變暖的可能,不外我們仍是根基可以認心猿意馬,二氧化碳是全球變暖最大的“嫌疑犯”。
統計數字告訴了我們良多信息,然而若是我們對統計數字不加闡發,或者錯誤地闡發了統計數字,我們就會被它誤導,被它棍騙。好比前面提到的例子,樣本選擇的錯誤會讓《文學文摘》破產;對人均收入的輕率闡發會讓我們輕忽勞苦公共的疾苦;沒有了統計指數,我們就無法比力白菜和電腦的價錢波動哪一個對我們影響更大;不闡發相關性的真偽,我們就會得出荒誕乖張的結論?簡直,統計是淘金的東西,不外并非每個握著淘金篩的人,都能淘到金子,要從統計數字中淘到真金,我們需要一雙準確闡發統計數字的火眼金睛。
0 篇文章
如果覺得我的文章對您有用,請隨意打賞。你的支持將鼓勵我繼續創作!