北方人能吃肉，南方人免疫力強？大數據揭示基因南北差異

這項研究當作果近期頒發在《細胞》（Cell）雜志上。除了上述飲食習慣的差別，研究還得出了年夜量有趣的結論。這支由中國科學家帶領的合作團隊，在對跨越14萬中國人的無創產前基因檢測數據進行深切研究后，初次揭秘了中國人群怪異的基因遺傳特征、南海說神聊方人群的遺傳差別，甚至還發現了與生育雙胞胎顯著相關的基因位點。

自人類基因組打算完當作以來，越來越多的基因組打算被提上日程，好比英國針對癌癥和罕有病患者的10萬人基因組打算、英國50萬人生物樣本庫，這對于領會特心猿意馬人群的基因遺傳特點、實現疾病的精準診治都年夜有幫忙。然而，在這項最新研究之前，公開數據庫中僅包含來自千人基因組打算的301位中國人的基因組數據，這遠遠不克不及代表14億中國人群的遺傳布景。

“比來，英國的國度基因組打算又一次進級，頒布發表將來5年要做500萬人的基因組，”華年夜生命科學研究院母嬰研究所副所長、論文配合通信作者金鑫說，“其其它國度的進展很快，但中國還逗留在300小我，我們但愿快速追趕，在已稀有據的根本上實現沖破。”

南海說神聊差別的遺傳身分

此次研究的基因數據來自141431名妊婦，涵蓋了31個省份、37個平易近族。

在數據闡發中，研究人員發現6個在緯度上受到強烈天然選擇的基因，也就是說這6個基因在南海說神聊方人群中存在遺傳差別。此中三個與人體的免疫反映有關，一個與動物脂肪代謝有關。

“在人類演化中，免疫方面的基因很輕易受天然選擇影響。”金鑫說，若是免疫相關的功能不克不及晉升或者不順應本地的情況，人就沒有法子保存下去。從汗青上看，南邊與海說神聊方的天然情況不同很年夜，所以在免疫層面上就會存在差別，而且反映在與免疫有關的基因上。此前有媒體報道稱，這申明南邊人的免疫力更強，金鑫對此詮釋說：“其實也紛歧心猿意馬，應該說南邊人對于南邊情況的順應更佳，并在基因上留下了印記。”金鑫說：“‘船到郴州止，馬到郴州死，人到郴州打擺子’的古話，說的就是古時辰海說神聊方人很難順應南邊的情況。”

針對某些特別的疾病，南邊人確實比海說神聊方人具有更強的免疫力，可是這卻可能增添患其它疾病的概率，以達到一種均衡。“瘧疾曾經在中國南邊殘虐，南邊人群為了順應情況在基因層面發生了一些轉變，使得南邊人群更可以或許抵當瘧疾，”金鑫舉例說，“可是反過來它也帶來了一個副感化，突變的基因會導致地中海貧血或其他血紅卵白病，好比導致‘蠶豆病’的突變基因G6PD在南邊人群中頻率較著高于海說神聊方。所以我們可以看到在中國南邊人群中，血紅卵白病發生的比力多。”也就是說，中國南邊人群在提高抵當瘧疾能力的同時也支出了價格。

在動物脂肪代謝方面，研究者發現C型促脂肪代謝等位基因在海說神聊方較著富集，尤其在蔬菜供給比力缺乏的省份。這一等位基因可以更好地促進動物脂肪的代謝，此前這一等位基因已經被確認在南亞、歐洲、非洲人群中比力多，“這個基因在其它人群中已經有過報道，”金鑫說，“但此次是第一次在中國人群中發現南海說神聊差別。”這與南海說神聊方的飲食習慣和本地可以或許獲取的食物有關系。海說神聊方人愛吃肉，也有能力消化肉食不是沒有原因的。

C型促脂肪代謝等位基因在各省的富集水平

從基因闡發中，還可以看到生齒的遷徙紀律在基因上留下的陳跡。好比，研究人員發現與海說神聊京的漢族人親緣關系比來的不是海說神聊京人，而是更接近沿海省份的生齒：山東、浙江、江蘇、福建以及江西，這可能反映了生齒標的目的海說神聊京遷徙的過程。

所有南邊省份與南部沿海省份的親緣關系更接近，而海說神聊部省份則與海說神聊部沿海省份關系緊密親密。研究者認為這一不雅察成果可能反映了自1949年以來當局組織的內部移平易近事務以及自1979年以來中國從內陸到沿海地域的勞動力轉移。

“所以我們今天看到的基因闡發成果都跟中國人祖先的遷移和演化有關系，從數據中看到的其實是汗青上我們前輩遷移和與天然抗爭的基因記實。”金鑫說。

雙胞胎基因

因為此次研究的樣本全數來歷于妊婦，是以不僅可以研究中國一般人群的基因環境，也是研究與孕產相關基因的好機遇。

研究人員對兩個與孕產有關的表型進行了研究，別離為懷孕春秋和多胎懷孕。他們發現了兩個與懷孕春秋顯著相關的基因位點，這兩個位點的突變與生育力等身分緊密親密相關。

別的，研究人員還發現了一個與懷雙胞胎顯著相關的基因突變位點，這一突變在懷有雙胞胎的母親中比力常見。也就是說攜帶NRG1基因的突變，有高更的幾率懷上雙胞胎。“此前人們在小鼠模子中研究過這個基因，發現其突變與小鼠產仔數目有關系。”金鑫說。敲除這一基因會導致小鼠的產仔數削減。當然，攜帶這一基因會增添懷雙胞胎的幾率，但并不料味著必然會生下雙胞胎。

中國人的百萬基因組打算

全宿世界已經有跨越1000萬人進行過無創產前基因檢測，此中中國就有700~800萬。無創產前基因檢測采集妊婦的靜脈血，對母體外周血漿中的游離基因片段進行測序，對胎兒染色體非正倍體進行篩查。人們比力熟知的是，這種方式可以比力精確地檢測唐氏綜合征。

經由過程這一檢測堆集的年夜量中國人基因數據，是一個龐大的基因寶庫。“我們認為，將來科研范疇的年夜數據，必然不只是來歷于假說驅動的有限的科研項目。年夜量的數據必然是來歷于數據驅動的真實的應用場景，”金鑫說，“在臨床的場景或者健康的場景下，發生的數據，若何在保障小我隱私和數據平安的根本上，合理合規有用率地用于科學研究，這對全人類來說都長短常主要的工作。”

所以，當研究人員看到全球人群基因組飛速成長，尤其英國已經完當作了10萬、50萬，正在邁標的目的500萬人，而中國還逗留在300人時，他們想到的追趕體例，就是操縱已經在臨床場景中發生的年夜量數據。此次利用的樣本量是14萬人，幾乎半斤八兩于中國生齒的萬分之一，是一個頗具代表性的年夜樣本量。

然而，因為這些數據原本只是知足臨床所需，單個樣本檢測的基因組數據量比力少。據金鑫介紹，產前基因檢測獲得的個別基因組數據，還不到整個基因組的10%。“一般進行全基因組檢測，會發生100G以上的數據量，但我們的數據只有幾百兆。”這意味著，對于小我而言，全基因組測序數據量是無創產前基因檢測數據量的上千倍。“所以，這個歷時兩年的研究項目，年夜部門的攻關都花在若何在少量的數據下，也可以或許表現整小我群的特征，”金鑫說，“我感覺這可能也是年夜數據的魅力，就是當所有樣本放在一路闡發的時辰，缺掉的部門可以互相填補。”

將來，金鑫與他的團隊還有更年夜的打算，他們估計在將來3年內，將中國人群樣本量擴年夜到100萬人。這又將是一個艱辛的過程，他們還將面臨年夜量需要詳盡耐煩的數據清算工作，以及呈指數級增加的計較量。

論文鏈接：

https://www.cell.com/cell/pdf/S0092-8674(18)31032-8.pdf

撰文：李曉慧

編纂：吳非

本文來自：舉世科學

注：所有文章均由中國數字科技館合作單元或小我授權發布，轉載請注明出處。