若何評價《流離地球》豆瓣評分從 8.5 分失落到 7.9 分?
chenqin,數據帝
截止到今天,《流離地球》總票房已經沖破 40 億,當作為中國影史票房第二的作品。與此同時,流離地球在豆瓣上的評分也從 8.5 下降到 7.9,兩者的背離激發的會商,其熱度完全不亞于《流離地球》內容自己的會商。
但事實上,這個下跌,從 8.5 到此刻的 7.9,或許并沒有什么特別的。正如以下兩個謎底所說:
若何評價流離地球豆瓣片子評分跌破分若何評價流離地球豆瓣片子評分跌破分
1,很多片子上映后都呈現了豆瓣分數逐漸下跌的現象。四部春節檔片子,分數下跌也都不比《流離地球》少。而按照 @驚記 抓取的豆瓣數據,在 2018 年的片子里,《唐人街探案 2》、《超人總帶動 2》、《李茶的姑媽》、《神奇動物:格林德沃之罪》、《無敵粉碎王 2:大鬧互聯網》,都在上映一周內分數下降 0.5。更別說我最喜好的《海王》了,人家從 8.5 下降到了 7.7,嚶嚶嚶(奉求可別在本謎底下刷海王真難看的評論了)。
2,《流離地球》的分數下降,和其他分數下降的片子一樣,本家兒如果由三星和四星的比例上升導致的。一星比例高達 2%,而固然偏離劃一片子的正常程度,卻對總分影響甚小。如下圖所示,在當前的分數布局下,即使把 2%的一星全數扔失落,平均分也只能增添 0.1 分。
事實上,豆瓣的報復者并不是對這些數字全無所聞。一起頭,他們說豆瓣分數下跌不正常;過幾天,他們認可分數下跌幅度或許正常,但一星比例高得不正常;再到后來,發現 2%的一星比例對總分影響不大,但又認為豆瓣熱評首頁里差評太多……
總之,這個板子,是必然要打到豆瓣身上去了。
但【已經花了 300 塊錢采辦了 3 張 IMAX 影票帶全家去不雅看了《流離地球》的】我感覺,因為對網站的評價不對勁,就把板子打在豆瓣這個 app 身上,似乎也有些莫名其妙。究竟結果一星的評分是用戶本身去打的。熱評首頁中差評排序居多,那幾萬票「有效」也是用戶本身投上去的。
好比豆瓣到此刻還排名第一的左丘掉明的長評——
人家確實有 5.6 萬個踩,但也有 4 萬多個贊,這不是一個小數字吧?
再好比對《流離地球》的短評。上圖是熱評的前三名,第二和第三名都打了一星,加起來有 10 萬個贊。此中排名第二的「嘟嘟熊之父」,此刻有 6.5 萬個贊,比一禮拜前增添了 4 萬多個。
而《流離地球》的一星評價數目,在同期只增添了 1.5 萬個。
對「嘟嘟熊之父」的一星短評的附和增量,遠遠多于現實的一星評價的增量。這意味著什么?
這意味著——良多人確實沒有頒發評論,也沒有給《流離地球》打一星,也許是因為打一星會顯示在頁面上。他們只是靜暗暗地找到合適本身設法的評論,然后點了一個不克不及被別人看到的贊。
這讓我想到 2016 年的美國總統大選,公共場所下大師都不喜好特朗普,所有的平易近調都不看好特朗普,媒體也說特朗普這欠好那欠好,看上去希拉里民氣所標的目的……
然后特朗普贏了。
在大選時,因為不喜好一小我而選擇別的一小我是常見的現象,但對片子來說,不存在直接的否決機制。我不喜好看這個片子,也沒法賣空,也不會拼命去看另一部片子,這沒意義。所以如果不喜好一部片子,除了評論和在軟件上打分,其他也啥都做不了。
是以,疆場才匯聚到了豆瓣身上。
但正如希拉里敗選后沒法去怪罪大選軌制一樣,因為豆瓣上的差評在首頁排名很高就去怪罪豆瓣的話,還不如去想一下,那些讓你們看不順眼的一星差評,為啥會拿到 6.5 萬個、4 萬個、3 萬個【有效】?
把這幾萬個點贊全數當當作【牧羊犬】【跪久了】,說幾句【爾曹身與名俱滅】之類的標致話,對理解這個問題,有幫忙嗎?
短評第一名是 5.6 萬個【愛國者】,短評第二名是 6.5 萬只【牧羊犬】,很讓人歡快嗎?
這篇文章從這里才真正起頭。我們想要研究的一個問題是——豆瓣的用戶,和真正去看片子的用戶,事實有什么紛歧樣?為什么會紛歧樣?這樣的差別會造當作什么?
起首,我們給每一部片子做一個用戶畫像。
片子的用戶畫像并欠好做,起首,在線購票的比例固然到了九當作,但并不知道這些票都是給誰買的。其次,對在線購票者本人來說,他們的畫像也紛歧心猿意馬精確。
是以,我們利用生齒普查分區縣數據和各區縣的票房和人次數據來完當作這個畫像,步調如下:
1,片子
的總不雅影人次為
,此中在區縣
的不雅影人次為
。
2,
,暗示每一個片子
在分歧區縣
的不雅影比例。
3,
暗示昔時區縣
的不雅影總人次,用每個區縣的不雅影總人次除以昔時全國不雅影人次
,獲得
,暗示昔時所有全國不雅影人次中分歧區縣
的不雅影比例。
4,
,暗示區縣
在片子
中的不雅影比例大于區縣
在所有片子中的不雅影比例的水平,可以理解為,是區縣 
5,對于每一個片子
,回歸該式:
,獲得一組
。他的寄義是,我們要用每一個區縣的特征,去詮釋為何分歧的區縣會對這部片子有紛歧樣的「偏心」水平。
舉一個例子,此刻有 100 小我,50 個漢子 50 個女人,本年總共看了 30 次片子,漢子看了 15 次,女人看了 15 次。
此中有一部片子叫做《刺激的動作片》,漢子看了 10 次,女人看了 5 次。那么
從上式我們發現,當性別從女性釀成男性的時辰,對《刺激的動作片》的偏心水平從
上升到
,帶來了一個效應為
的上升。是以有:
這樣,就把性別對《刺激的動作片》的偏好影響估算出來了。我們對每個片子都做如斯回歸,半斤八兩于是把 3000 多個區市縣算作 3000 個具有分歧特征的人,經由過程這 3000 個「人」的分歧特征和對片子的分歧偏好,把所有生齒特征對所有片子的偏好給算出來。
6,利用性別比例、平均教育水平和春秋布局三個特征,我們回歸計較了所有片子,記實下所有系數,這樣每個片子城市釀成一個三維的標的目的量。好比《復仇者聯盟》,我們就有三個數值:
對所有的片子,我們都有這三個數值。前 20 名的片子的系數表格如下:
拔取 2012 到 2018 年所有不雅影人次在 1000 萬以上的片子,將三個數值別離作為一個三維空間的 x、y 和 z 軸作圖,可得下圖:
在上面的三維坐標中,大于零的部門暗示性別越偏男性 / 教育越高 / 春秋越小 越偏好于這部片子。用不雅影人次排名前 20 的片子舉例,具體表格如下:
這個算法準禁絕呢?我們可以做一個查驗,看每一個點的比來的鄰人別離是誰——兩個在三維空間里距離較短的點,申明兩者的不雅影人群十分近似。我們嘗試了四部分歧類型的片子,別離找到離這四部片子比來的 5 個點,成果如下:
可以看到,在空間上最接近的幾個影片有不異的不雅眾偏好,一般也處在統一個范圍內。好比到《復仇者聯盟 2》距離比來的 5 部片子,有 4 部是漫威出品;在距離《熊出沒·變形記》比來的 5 部片子中,有 4 部都是熊出沒的系列片。
從直覺上看,這個算法仍是能很是精確地將片子給劃分隔來的。
出格有趣的是《戰狼 2》,距離他比來的五個點別離是——
1,小時代 3:刺金時代
2,小時代 4:魂靈絕頂
3,佳麗魚
4,捉妖記
5,小時代:青木時代。
這申明《戰狼 2》的不雅影人群畫像,和《小時代》系列是十分近似的。出格讓人驚奇的是,和我們的印象分歧,《小時代》的性別系數和《戰狼 2》一樣,都是正的,申明男性越多的地域,反而越偏好《小時代》。
并且我們可以看到一個現象——和戰狼 2 最接近的幾部片子,都締造了票房佳績。
每一部小時代都是昔時票房的佼佼者,到了《佳麗魚》和《捉妖記》,這個偏好的不雅世人群締造了昔時的票房冠軍,更別提《戰狼 2》了,他締造了中國影史票房冠軍。
這個現象也提出了本文的第二個問題——我們應該拍攝什么樣的影片,吸引什么畫像的人群,才能盡可能吸引更多不雅眾來不雅影?
我們將性別、教育和春秋這三個指標別離和不雅影人次的對數作圖,可以獲得下面三張圖:
從上面三張圖中,我們可以看到:
1,過于方向某一種性此外片子,不會有很好的票房,只有性別處在中心的時辰,票房才更高。
2,讓春秋太低或者春秋太高的人出格喜好的片子,票房也不會很高,也需要針對中心值來確定不雅眾的偏好。
3,和性別、春秋的圖中呈現的先上升、再下降的圖分歧,教育程度的偏好關系和不雅影人次似乎并沒有一個較著的峰值,而是跟著教育晉升,單調下降——越讓高教育生齒喜好的片子,票房越低。
我們將上面的第三張圖分當作 2015、2016、2017 和 2018 年,可以看到一個更較著的趨向——
上面四條線的斜率,一年比一年大,這意味著低教育偏好的片子,帶來的不雅影人次一年比一年高。
2015 年和 2016 年時,低教育偏好的片子和高教育偏好的片子,在不雅影人次上還差不多,從 2017 年起頭兩者的關系變為顯著負相關,系數為 -0.17,在 5%程度上顯著。
2018 年,低教育偏好能帶來更高票房,系數已經達到 -0.22,在 1%程度上顯著。
這意味著片子的方針不雅眾教育程度越低,該片子的票房越高,并且兩者的相關水平還在不竭上升。
為什么會這樣?謎底很是簡單——高教育生齒,已經不克不及進獻增量票房了。
我們將中國 3000 多個區市縣按照其平均教育程度分為四個部門,別離是平均教育年限大于 12 年(全國前百分之 1%程度)、10.9 年到 12 年之間(全國前 1%到全國前 10%)、9.6 年到 10.9 年之間(全國前 10%到全國前 25%)、9.6 年以下(全國后 75%程度),他們在 2012 到 2018 年的不雅影人次如下圖所示:
從上圖可以看到,在教育程度最高的地域,不雅影人次從 2015 年到 2018 年已經下降了 6%!
教育程度次高的地域也有同樣的現象,從 2015 到 2018 年只上升了 5%。
而平均教育年限在 9.6 年以下的地域,從 2015 到 2018 年的不雅影人次上升了 55%。
跟著中國的片子院在發財地域飽和,并標的目的三四線城市舒展,將來若是有人可以或許對片子票房發生新的進獻,那么他們必然是三四線城市的人群。
是以,新的賣座片子,必然是為這批不雅眾量身心猿意馬做的片子。
回到一起頭的問題——為什么會很多片子的豆瓣片子評分逐漸降低?那些豆瓣評分逐漸降低的片子,和片子自己的方針人群特征有什么關系?
我們將 @驚記 供給的豆瓣分數動態轉變數據和我們用票房數據計較出的每一部片子的偏好鏈接在一路,看哪一個維度的指標和豆瓣的評分降低有關。
成果,只有一個指標有顯著相關性,他就是一部片子方針人群的教育程度和片子偏好的系數。
上圖是豆瓣評分和片子傾標的目的不雅眾的教育年限之間的關系。可以看到,越傾標的目的于高教育地域的片子,在豆瓣上都有越高的評分。
上圖是豆瓣開分和十天后的評分差額與片子傾標的目的不雅眾的教育年限之間的關系。散點圖的相關性在 1%的程度上顯著,申明片子的方針不雅世人群越傾標的目的于低教育生齒,豆瓣給他的評分下降就越多。
此中,位置在最上方,分數提高最多的片子是《無問西東》,豆瓣開畫 6.7 分,到第十天是 7.7 分(今朝是 7.5 分),票房為 7.5 億。
而分數降低最多的是《后來的我們》,豆瓣分數從一起頭的 7.1,降低到第十天的 5.9(今朝仍為 5.9),票房為 13.6 億。
最后理順所有的故事:
1,從 2015 年起頭,那些比力發財、平均教育程度比力高的地域,不雅影人次達到飽和,呈現增加障礙,甚至下降。而那些欠發財、平均程度比力低的地域,不雅影人次持續增加。
2,欠發財地域生齒偏好度更高的片子,可以或許帶來更高的票房,且兩者關系逐年增添。而豆瓣對這批欠發財地域偏好的片子更為苛刻,他們固然經常拿到很高的票房,可是豆瓣評分卻往往逐漸降低。
3,片子的供給者當然會優先知足快速需求的增加。在這種趨向下,我們將來將看到更多為這批快速增加的欠發財地域不雅影人群量身打造的片子。
4,除非豆瓣的組成和中國不雅影人群的組成一樣快速改變,不然,跟著片子供給標的目的欠發財地域的偏好逐漸傾斜,豆瓣評分走低但票房又同時走高的現象,將會越來越頻仍地呈現。
注:
感激 @王義之 供給的片子票房分影院的日度數據以及 @驚記供給的從 2017 年起頭的豆瓣評分動態數據,其他數據來自第六次生齒普查分縣資料。因為還沒有拿到《流離地球》的分影院數據,我們臨時難以估計出《流離地球》的偏好坐標。
0 篇文章
如果覺得我的文章對您有用,請隨意打賞。你的支持將鼓勵我繼續創作!