科學(xué)家創(chuàng)建新的全基因組分析方法并發(fā)現(xiàn)人類在早、中更新世過渡期經(jīng)歷嚴(yán)重的群體瓶頸

文章來源:  |  發(fā)布時(shí)間:2023-09-05  |  【打印】 【關(guān)閉

  

 

9月1日,《科學(xué)》(Science)在線發(fā)表了中國(guó)科學(xué)院上海營(yíng)養(yǎng)與健康研究所李海鵬研究組與華東師范大學(xué)腦功能基因組學(xué)研究所潘逸萱研究組合作撰寫的題為Genomic inference of a severe human bottleneck during the Early to Middle Pleistocene transition的最新研究成果。該研究創(chuàng)建了快速極小時(shí)間溯祖(FitCoal)新理論,并發(fā)現(xiàn)了人類在早、中更新世過渡期由于氣候環(huán)境的急劇變化經(jīng)歷了嚴(yán)重的群體瓶頸,人類祖先近乎滅絕。

史前人口數(shù)量的變化,綜合反映了該時(shí)期氣候環(huán)境的變遷,因而通過群體遺傳學(xué)的研究方法進(jìn)行回溯,可以更深入地了解現(xiàn)代人類的形成。已有化石記錄表明,最近100萬年是人類進(jìn)化的關(guān)鍵時(shí)期,但人類群體歷史的研究多局限于最近的30~10萬年內(nèi)。雖然近年來古DNA測(cè)序技術(shù)迅猛發(fā)展,但由于炎熱條件不利于DNA的保存,無法從30萬年前非洲人類祖先化石中提取古DNA。因此,該研究通過群體遺傳學(xué)新理論分析現(xiàn)代人群基因組,探索百萬年前的群體歷史。

史前雖然沒有文字記載群體數(shù)量,但有效群體大小會(huì)影響每個(gè)世代的溯祖率,也就是兩個(gè)譜系在上一世代來自同一祖先的概率。因此,人類祖先曾在群體基因組中留下印記,反映當(dāng)時(shí)的群體大小。群體歷史越久遠(yuǎn),留存至今的印記信號(hào)越微弱。為準(zhǔn)確解讀這些信號(hào),進(jìn)而準(zhǔn)確估算百萬年前人類群體歷史,科研人員創(chuàng)建了群體遺傳學(xué)和計(jì)算生物學(xué)新理論,快速極小時(shí)間溯祖FitCoal。遵循這一理論進(jìn)行數(shù)學(xué)推導(dǎo),該工作獲得在任意群體模型下各突變類型(即突變頻譜)對(duì)應(yīng)溯祖樹枝長(zhǎng)期望值的解析解,并獲得精確的似然值,即在群體歷史條件下觀察到樣本突變頻譜的概率。因此,無需事先獲得群體歷史的先驗(yàn)知識(shí),F(xiàn)itCoal即可自動(dòng)快速搜尋出極大似然值,從而估算群體歷史,對(duì)古人類群體進(jìn)行“人口普查”。

研究人員通過設(shè)定群體歷史模型(true model)并分析模擬產(chǎn)生的DNA多態(tài)數(shù)據(jù),衡量估計(jì)群體歷史的無偏性和95%置信區(qū)間,即可評(píng)判一個(gè)分析方法的準(zhǔn)確程度。圖1顯示了兩個(gè)群體歷史模型的分析結(jié)果,可以看出FitCoal估計(jì)的群體歷史不但是無偏的,而且其置信區(qū)間小于目前領(lǐng)域內(nèi)常用的PSMC、Stairway Plot和SMC++三種方法。研究進(jìn)一步通過大量的計(jì)算機(jī)模擬,分析不同條件下的群體歷史,包括群體交融和自然選擇。結(jié)果均表明FitCoal可以精準(zhǔn)地估計(jì)百萬年內(nèi)的人類群體歷史。

基于FitCoal,研究進(jìn)一步分析了來自千人基因組計(jì)劃和HGDP-CEPH基因組計(jì)劃產(chǎn)生的、共50個(gè)現(xiàn)代人類群體的基因組數(shù)據(jù),首次發(fā)現(xiàn)了在距今93.0萬年前,人類祖先由于早、中更新世過渡期的氣候劇烈變化,在短期內(nèi)喪失了約98.7%的成員個(gè)體,幾乎滅絕。在長(zhǎng)達(dá)11.7萬年的時(shí)間里平均成年個(gè)體數(shù)僅為1,280,并從千人基因組和HGDP-CEPH兩組獨(dú)立數(shù)據(jù)獲得這一群體大小的估值幾乎完全一致,分別為1,270和1,300??紤]到群體數(shù)量的自然波動(dòng),這一平均估值代表了遠(yuǎn)古群體瓶頸期間最小群體數(shù)量的上限。研究采用HGDP-CEPH數(shù)據(jù)集的兩個(gè)南部非洲群體作了進(jìn)一步驗(yàn)證。雖然樣本量?jī)H為6個(gè)和8個(gè)個(gè)體,但FitCoal依然檢測(cè)到遠(yuǎn)古群體瓶頸。對(duì)非洲群體樣本重抽樣的研究成果表明,僅需3個(gè)非洲個(gè)體的基因組,F(xiàn)itCoal即可檢測(cè)到這一遠(yuǎn)古群體瓶頸,進(jìn)一步表明計(jì)算生物學(xué)創(chuàng)新成就了這一發(fā)現(xiàn)。

這一嚴(yán)重的遠(yuǎn)古群體瓶頸,恰好與非洲人類祖先化石的缺失環(huán)節(jié)、非洲直立人(Homo erectus)化石的消失、新的古人類物種(LCA)的形成、兩條古人類2號(hào)染色體的融合階段相對(duì)應(yīng)(圖2)。進(jìn)一步,這說明早、中更新世過渡期嚴(yán)重的群體瓶頸對(duì)人類進(jìn)化具有關(guān)鍵影響,可能決定了現(xiàn)代人類許多關(guān)鍵表型的形成。同時(shí),這一遠(yuǎn)古時(shí)期群體數(shù)量的衰減,降低了65.85%現(xiàn)代人群的遺傳多樣性,對(duì)人類生命和健康產(chǎn)生了深遠(yuǎn)影響。

該研究由營(yíng)養(yǎng)與健康所、華東師范大學(xué)主導(dǎo),聯(lián)合意大利羅馬大學(xué)、意大利佛羅倫薩大學(xué)和美國(guó)德克薩斯大學(xué)等共同完成。研究工作得到國(guó)家自然科學(xué)基金、中國(guó)科學(xué)院戰(zhàn)略性先導(dǎo)科技專項(xiàng)、國(guó)家重點(diǎn)研發(fā)計(jì)劃、美國(guó)國(guó)立衛(wèi)生研究院、山東省自然科學(xué)基金、中國(guó)博士后科學(xué)基金、營(yíng)養(yǎng)與健康所、華東師范大學(xué)及濟(jì)南市市校融合發(fā)展戰(zhàn)略工程項(xiàng)目的支持。

論文鏈接

圖1.?FitCoal、PSMC、Stairway Plot和SMC++估計(jì)的群體歷史

圖2.?人類祖先在早、中更新世過渡期經(jīng)歷的嚴(yán)重群體瓶頸(圖片右側(cè)對(duì)應(yīng)非洲古人類化石缺失環(huán)節(jié)和不同的化石分類、2號(hào)染色體的融合時(shí)間,其中LCA指現(xiàn)代人類、尼安德特人和丹尼索瓦人的共同祖先)