營(yíng)養(yǎng)與健康所邵振與詹麗杏研究組合作開發(fā)蛋白質(zhì)組比較算法解析紅細(xì)胞分化和肝癌異質(zhì)性

文章來源:上海營(yíng)養(yǎng)與健康研究所  |  發(fā)布時(shí)間:2024-10-17  |  【打印】 【關(guān)閉

  

10月14日,國(guó)際期刊Genome Biology在線發(fā)表了中國(guó)科學(xué)院上海營(yíng)養(yǎng)與健康研究所邵振研究組、詹麗杏研究組與中國(guó)科學(xué)院分子細(xì)胞科學(xué)卓越創(chuàng)新中心柳欣研究組題為”zMAP toolset: model?based analysis of large?scale proteomic data via a variance stabilizing z?transformation”的合作研究成果。該研究針對(duì)當(dāng)前TMT和iTRAQ等定量蛋白質(zhì)組數(shù)據(jù)缺乏多樣本比較分析工具的瓶頸,開發(fā)了zMAP工具集,并應(yīng)用它解析了紅細(xì)胞分化過程和肝癌病人組織之間的蛋白質(zhì)組動(dòng)態(tài)變化。

TMT和iTRAQ等重同位素標(biāo)記技術(shù)已廣泛用于蛋白質(zhì)組定量分析,為研究組織發(fā)育和疾病進(jìn)程中的蛋白質(zhì)表達(dá)變化提供了基礎(chǔ)?,F(xiàn)有的蛋白質(zhì)組差異分析工具主要面向兩個(gè)或兩組樣本之間比較,能進(jìn)行多樣本比較的工具有限。尤其是這些平臺(tái)生成的蛋白質(zhì)組數(shù)據(jù)往往包含強(qiáng)烈的批次效應(yīng),導(dǎo)致能夠整合多個(gè)質(zhì)譜實(shí)驗(yàn)批次數(shù)據(jù)開展定量比較分析的工具更是匱乏,局限了它們?cè)诖笠?guī)模生物樣本分析中的應(yīng)用。針對(duì)該瓶頸,研究者開發(fā)了zMAP和reverse-zMAP兩個(gè)新計(jì)算模型,并基于它們搭建了一個(gè)多功能的蛋白質(zhì)組數(shù)據(jù)分析平臺(tái)(http://bioinfo.cemps.ac.cn/shaolab/zMAP),面向基于不同實(shí)驗(yàn)設(shè)計(jì)的多批次多樣本數(shù)據(jù)開展統(tǒng)計(jì)比較和下游整合分析(圖1)。

研究人員應(yīng)用zMAP分析了一個(gè)已發(fā)表的紅細(xì)胞分化蛋白質(zhì)組數(shù)據(jù)集,包含4種細(xì)胞類型(成年階段造血干祖細(xì)胞A0及體外分化5天后的原紅細(xì)胞A5;胚胎階段造血干祖細(xì)胞F0及分化5天后的原紅細(xì)胞F5)和5次4通道iTRAQ實(shí)驗(yàn)生成的5組生物學(xué)重復(fù)。zMAP識(shí)別了2290個(gè)顯著高變化蛋白質(zhì),并基于z統(tǒng)計(jì)值對(duì)它們的表達(dá)模式聚類,發(fā)現(xiàn)很多僅在胚胎紅細(xì)胞分化過程中上調(diào)的蛋白質(zhì)。研究人員從中選擇了S100A8、S100A9、CHI3L1和PTEN,驗(yàn)證了這些基因在相應(yīng)分化過程中發(fā)揮了不可或缺的作用。

此外,研究人員還應(yīng)用reverse-zMAP分析了一個(gè)包含159例原發(fā)肝癌患者腫瘤和瘤旁正常對(duì)照組織的公開TMT蛋白質(zhì)組數(shù)據(jù)集,鑒定出3097個(gè)高變蛋白質(zhì)?;谒鼈儂統(tǒng)計(jì)值矩陣的主成分分析可以將兩類樣本清楚分開。結(jié)合z統(tǒng)計(jì)值和病人生存數(shù)據(jù)的Cox比例風(fēng)險(xiǎn)回歸分析鑒定了大量預(yù)后相關(guān)蛋白質(zhì)。它們中69.6%與第一主成分(PC1)顯著相關(guān),即在腫瘤和正常對(duì)照組織之間差異表達(dá),其中很多如NPC1和UBE2C可作為肝癌進(jìn)展分子標(biāo)志物。研究人員基于PC1得分對(duì)腫瘤樣本進(jìn)行層次聚類,將它們分為三個(gè)亞組,發(fā)現(xiàn)該分型能夠比常用的TNM和BCLC分期更好地解釋病人預(yù)后差異;另一方面,基于z統(tǒng)計(jì)值的基因集變異分析(GSVA)指出,PC1得分較高的癌旁對(duì)照肝組織樣本表現(xiàn)出肝代謝通路下調(diào)和免疫相關(guān)通路上調(diào)這一特殊狀態(tài),可能為肝癌發(fā)生“炎癌轉(zhuǎn)換”過程蛋白質(zhì)組的轉(zhuǎn)變模式提供有價(jià)值線索。上述兩方面發(fā)現(xiàn)表明這兩類病人組織樣本沿PC1分布的異質(zhì)性均具有可觀的生物學(xué)意義。研究人員還整合z統(tǒng)計(jì)值和腫瘤體細(xì)胞突變數(shù)據(jù)開展了蛋白質(zhì)表達(dá)數(shù)量性狀位點(diǎn)分析(pQTL)。5個(gè)高頻突變基因中,攜帶TSC2突變的腫瘤樣本PC1得分較高,并且患者預(yù)后較差,其腫瘤中TSC2蛋白質(zhì)表達(dá)顯著降低。根據(jù)pQTL結(jié)果,發(fā)現(xiàn)TSC2突變下調(diào)的均為對(duì)病人生存有利的蛋白質(zhì),而上調(diào)的均為對(duì)病人生存不利的蛋白質(zhì)。最后,研究人員驗(yàn)證了NPC1和UBE2C對(duì)肝癌細(xì)胞增殖和侵襲的促進(jìn)作用以及TSC2的抑癌作用。

中國(guó)科學(xué)院上海營(yíng)養(yǎng)與健康研究所博士后桂秀琪、研究生黃靜、吳燕君、郭烜和中國(guó)科學(xué)院分子細(xì)胞科學(xué)卓越創(chuàng)新中心研究生阮林杰為該論文共同第一作者。中國(guó)科學(xué)院上海營(yíng)養(yǎng)與健康研究所邵振研究員、涂世奇副研究員、詹麗杏研究員和中國(guó)科學(xué)院分子細(xì)胞科學(xué)卓越創(chuàng)新中心柳欣研究員為該論文共同通訊作者。該工作得到國(guó)家自然科學(xué)基金委、科技部、中國(guó)科學(xué)院等多項(xiàng)基金支持。研究使用的所有組學(xué)數(shù)據(jù)均為已公開發(fā)表數(shù)據(jù)。

原文鏈接::https://genomebiology.biomedcentral.com/articles/10.1186/s13059-024-03382-9


圖1:蛋白質(zhì)組數(shù)據(jù)分析平臺(tái)zMAP的核心架構(gòu)