Nat Commun | 基于化學(xué)微擾轉(zhuǎn)錄組自監(jiān)督表征學(xué)習(xí)的藥物篩選

文章來源:上海藥物研究所  |  發(fā)布時(shí)間:2024-07-01  |  【打印】 【關(guān)閉

  

2024年6月25日,中國(guó)科學(xué)院上海藥物研究所鄭明月課題組在Nature Communications期刊發(fā)表題為“Deep representation learning of chemical-induced transcriptional profile for phenotype-based drug discovery”的研究論文。該研究提出基于自監(jiān)督表征學(xué)習(xí)的深度生成模型TranSiGen,學(xué)習(xí)化學(xué)微擾轉(zhuǎn)錄組表征用于藥物表型篩選。

基于表型的篩選是藥物研發(fā)中的重要方法之一,側(cè)重于化合物的更全面的細(xì)胞響應(yīng),提供對(duì)疾病機(jī)制更全面的理解,并有可能發(fā)現(xiàn)新的藥物作用機(jī)制和治療機(jī)會(huì)。高通量RNA測(cè)序技術(shù)促進(jìn)了大規(guī)模微擾轉(zhuǎn)錄組的產(chǎn)生。雖然化學(xué)微擾轉(zhuǎn)錄組能夠提供對(duì)藥物作用機(jī)制更全面的理解,化合物和細(xì)胞系組合的復(fù)雜性限制了通過高通量實(shí)驗(yàn)進(jìn)行徹底的探索。已有研究者利用大量公共數(shù)據(jù)構(gòu)建深度學(xué)習(xí)模型用于預(yù)測(cè)微擾轉(zhuǎn)錄組,然而轉(zhuǎn)錄組數(shù)據(jù)中固有的高噪聲往往掩蓋了真正的擾動(dòng)信號(hào),使得現(xiàn)有模型難以從中提取有意義的信息。

圖1.TranSiGen架構(gòu)和下游應(yīng)用

在該項(xiàng)研究中,研究團(tuán)隊(duì)提出基于變分自編碼器的TranSiGen模型,利用自監(jiān)督表征學(xué)習(xí)進(jìn)行轉(zhuǎn)錄譜的去噪和重建,并且用于推斷新的微擾轉(zhuǎn)錄譜(圖1)。TranSiGen同時(shí)學(xué)習(xí)三個(gè)分布,包括沒有擾動(dòng)的本底譜、化學(xué)微擾轉(zhuǎn)錄譜以及它們之間的映射關(guān)系。這種自監(jiān)督方法有效地減少了數(shù)據(jù)中的噪聲,并揭示了潛在的擾動(dòng)信號(hào)。廣泛的評(píng)估表明,TranSiGen在推斷本底譜、化學(xué)微擾轉(zhuǎn)錄譜以及相應(yīng)的差異基因表達(dá)(DEGs)方面優(yōu)于現(xiàn)有模型。作為一種統(tǒng)一的表型信息表征方式,TranSiGen推斷的差異基因表達(dá)可以有效地捕獲細(xì)胞和化合物的特征。

圖2.基于表型的藥物重定向

此外,TranSiGen表征在各種下游任務(wù)中展現(xiàn)出了有效性,包括基于配體的虛擬篩選、藥物響應(yīng)預(yù)測(cè)和基于表型的藥物重定向。利用TranSiGen進(jìn)行抗胰腺癌活性化合物虛擬篩選(圖2),體外實(shí)驗(yàn)驗(yàn)證結(jié)果展現(xiàn)出高命中率,這一結(jié)果顯示了TranSiGen在藥物篩選方面的潛力。

本研究引入深度生成模型TranSiGen,旨在通過自監(jiān)督表征學(xué)習(xí)克服轉(zhuǎn)錄譜中固有噪聲和混雜因素的局限,提供了一種標(biāo)準(zhǔn)化方法來表征與細(xì)胞環(huán)境和化合物效應(yīng)相關(guān)的表型信息。TranSiGen表征在各種下游任務(wù)中證實(shí)了其有效性,并在基于表型的藥物重定向及體外驗(yàn)證中展現(xiàn)了其在現(xiàn)實(shí)世界藥物發(fā)現(xiàn)場(chǎng)景中的前景。

上海藥物所博士童筱雛為論文的第一作者。上海藥物所藥物發(fā)現(xiàn)與設(shè)計(jì)中心(DDDC)鄭明月研究員、李敘潼副研究員與張素林副研究員為論文通訊作者。本研究得到了國(guó)家自然科學(xué)基金、國(guó)家重點(diǎn)研發(fā)計(jì)劃、上海藥物所與上海中醫(yī)藥大學(xué)中醫(yī)藥創(chuàng)新團(tuán)隊(duì)聯(lián)合研究項(xiàng)目、中國(guó)科學(xué)院青年創(chuàng)新促進(jìn)會(huì)會(huì)員項(xiàng)目以及上海市科技重大專項(xiàng)資助。感謝國(guó)家蛋白質(zhì)科學(xué)研究(上海)設(shè)施規(guī)模化蛋白質(zhì)制備系統(tǒng)工作人員提供的技術(shù)支持和幫助。

全文鏈接:https://doi.org/10.1038/s41467-024-49620-3