上海高研院在mRNA藥物遞送系統(tǒng)脂質納米顆粒(LNPs)人工智能預測方面取得突破性進展
文章來源:上海高等研究院 | 發(fā)布時間:2024-05-15 | 【打印】 【關閉】
mRNA疫苗靶向治療泛癌癥是當前藥物研究的熱點,具有重大學術和經(jīng)濟價值。mRNA設計中的重要挑戰(zhàn)是遞送系統(tǒng)脂質納米顆粒(LNPs)的構建,作為把mRNA治療藥物或疫苗送達靶細胞的載體,LNPs組分篩選制備存在周期長、成本高的難題。以Chat GPT為代表的新一輪人工智能技術正推動人類社會全面變革,通過人工智能模型輔助藥物分子和物質組分設計,結合實驗測試迭代,驅動規(guī)?;幬锇l(fā)現(xiàn),針對mRNA-LNPs,利用人工智能技術跨學科交叉,對快速設計自主高轉染效率的mRNA-LNPs具有重要意義。?
近日,中國科學院上海高等研究院(以下簡稱“上海高研院”)人工智能團隊劉立莊研究團隊在mRNA藥物遞送系統(tǒng)脂質納米顆粒人工智能預測方面取得突破性進展,提出了一種基于mRNA-LNPs三維微觀結構與生化性質間映射的自注意力機制深度學習模型,實現(xiàn)了LNPs高精度自動篩選,結果優(yōu)于目前公開發(fā)表方法,相關研究成果以“Data-balanced transformer for accelerated ionizable lipid nanoparticles screening in mRNA delivery”為題發(fā)表在國際生物信息期刊Briefings in Bioinformatics上。
本研究設計基于mRNA-LNPs三維微觀結構與生化性質間映射的自注意力機制深度學習模型,稱為TransLNP(圖1)。TransLNP采用跨分子類自動學習方法(圖2),提取其他已有分子數(shù)據(jù)積累的知識,實現(xiàn)針對LNPs的小樣本訓練學習,從而實現(xiàn)不同分子類之間算法模型的遷移。為構建mRNA-LNPs三維微觀結構與生化性質間映射關系,充分利用粗粒度原子序列信息和細粒度原子空間對應關系,基于自注意力機制的原子信息(原子類型、坐標、相對距離矩陣、邊類型矩陣)交互,提取分子級特征。此外,針對有限的LNPs數(shù)據(jù)造成的不平衡問題,設計BalMol(balance molecule)模塊,通過平滑標簽分布和分子特征分布來平衡數(shù)據(jù)。TransLNP實現(xiàn)LNPs轉染效率預測均方誤差MSE<5,對比現(xiàn)行主流的多種圖卷積神經(jīng)網(wǎng)絡和機器學習算法相比,結果顯示(圖3),在均方誤差、決定系數(shù)R2和皮爾遜相關系數(shù)評價指標中性能最優(yōu),指標達到該領域一流水平。
圖1 TransLNP架構圖
圖2 跨分子類自動學習架構圖
圖3 TransLNP與多種圖卷積神經(jīng)網(wǎng)絡和機器學習算法預測結果對比圖
該工作實現(xiàn)快速精準預測mRNA-LNPs的轉染效率以及新脂質納米顆粒結構預測,新方法將推動mRNA藥物在基因治療、疫苗開發(fā)和藥物遞送等領域的應用發(fā)展。上海高研院碩士研究生武坤為本研究論文第一作者,上海高研院劉立莊正高級工程師為通訊作者,聯(lián)合了國家蛋白質科學研究(上海)設施李娜正高級工程師,日本筑波大學王梓旭博士共同完成。
文章鏈接: ttps://doi.org/10.1093/bib/bbae186