融合結(jié)構(gòu)知識(shí)的蛋白質(zhì)預(yù)訓(xùn)練模型進(jìn)展
物理學(xué)報(bào)
頁(yè)數(shù): 15 2024-08-12
摘要: 自然語(yǔ)言和圖像處理領(lǐng)域引發(fā)的人工智能革命給蛋白質(zhì)計(jì)算領(lǐng)域帶來(lái)了新的思路和研究范式.其中一個(gè)重大的進(jìn)展是從海量蛋白質(zhì)序列通過(guò)自監(jiān)督學(xué)習(xí)得到預(yù)訓(xùn)練的蛋白質(zhì)語(yǔ)言模型.這類預(yù)訓(xùn)練模型編碼了蛋白質(zhì)的序列、進(jìn)化、結(jié)構(gòu)乃至功能等多種信息,可方便地遷移至多種下游任務(wù),并展現(xiàn)了強(qiáng)大的泛化能力.在此基礎(chǔ)上,人們正進(jìn)一步發(fā)展融合更多種類數(shù)據(jù)的多模態(tài)預(yù)訓(xùn)練模型.考慮到蛋白質(zhì)結(jié)構(gòu)是決定其功能的主要因素,... (共15頁(yè))