用RoseTTAFold設(shè)計全新結(jié)構(gòu)與功能的蛋白質(zhì)
01
文章背景簡介
BACKGROUND INTRODUCTION
科學(xué)家們長期認為蛋白質(zhì)的形狀決定了其功能。只要了解蛋白質(zhì)的形狀,就能猜測其在細胞中的作用,并且開發(fā)出與其形狀相關(guān)的藥物。因此,研究人員通過冷凍電鏡、核磁共振、X射線等多種手段來確定蛋白質(zhì)的形狀。這一過程不僅繁瑣而且成本高昂。為此,CASP(Critical Assessment of protein Structure Prediction)大賽應(yīng)運而生。2020年,隨著AI技術(shù)的發(fā)展,Deepmind公司的AlphaFold2在CASP中橫空出世,有望解決這一困擾研究人員多年的難題。
為了探究合成全新蛋白質(zhì)算法的準(zhǔn)確度,2021年7月,華盛頓大學(xué)生物學(xué)家大衛(wèi)·貝克(David Baker)團隊研發(fā)的RoseTTAFold構(gòu)建了一種“三軌(three-track)”神經(jīng)網(wǎng)絡(luò),能在十幾分鐘之內(nèi)解析給定序列的三維結(jié)構(gòu)。2023年7月,該團隊成功獲得了一個蛋白質(zhì)骨架生成模型(generative model),并且通過實驗表征和電鏡驗證后,證明了該模型的可靠性,完成了真正意義上的蛋白質(zhì)從頭設(shè)計(de novo protein design),并且在《Nature》雜志(IF=64.8,Q1)上發(fā)表了題為“De novo design of protein structure and function with RFdiffusion”的文章。
02
所用到的主要方法
METHODS
1、RFdiffusion
2、DDPM
3、冷凍電鏡
4、圓二色光譜
5、尺寸排阻色譜
03
文章主要內(nèi)容摘要
ABSTRACT
對于蛋白質(zhì)設(shè)計的軟件來說,最終需要建立可視化的蛋白質(zhì)三維結(jié)構(gòu),為達成這一目標(biāo),該團隊使用了去噪擴散概率模型(Denoising Diffusion Probabilistic Model,DDPM)對已知的蛋白結(jié)構(gòu)模型進行學(xué)習(xí)并且根據(jù)所需條件引導(dǎo)該模型生成目標(biāo)蛋白。遺憾的是,無論是生成全新的蛋白質(zhì)還是二級結(jié)構(gòu),最終結(jié)果與實驗數(shù)據(jù)大相徑庭。
該團隊在DDPM中加入了RoseTTAFold(RF),不僅能夠生成高精度的蛋白質(zhì)結(jié)構(gòu),以具有旋轉(zhuǎn)等變性的殘基的剛性框架表示,并且具有能夠在單個殘基、殘基間距離和方向以及3D坐標(biāo)水平上對設(shè)計規(guī)格進行調(diào)節(jié)的體系結(jié)構(gòu)。首先,對RF進行了微調(diào),一步完成圍繞輸入的功能基序的蛋白質(zhì)骨架。實驗結(jié)果表明,該方法可以以原子精度支持廣泛的蛋白質(zhì)功能基序,但該方法只能接收精確的指令,對于給定的問題只能產(chǎn)生有限的設(shè)計多樣性。最終,該團隊通過算法優(yōu)化,建立了RFdiffusion模型,并且利用PDB數(shù)據(jù)庫進行深度學(xué)習(xí)。
圖1強調(diào)了RF結(jié)構(gòu)預(yù)測和RF擴散去噪步驟之間的相似之處:在這兩種情況下,根據(jù)模型的輸入條件將坐標(biāo)轉(zhuǎn)換為預(yù)測結(jié)構(gòu)。在RF中,輸入蛋白序列,并提供額外的結(jié)構(gòu)信息作為模板和模型的初始坐標(biāo)。在RF擴散中,主要的輸入是上一步得到的加噪坐標(biāo)。對于特定的設(shè)計任務(wù),可以提供一系列輔助條件信息,包括部分序列、折疊信息或固定的功能模體坐標(biāo)。
該實驗獲得了一個蛋白質(zhì)骨架的生成模型,該模型在無條件和拓撲受限的蛋白質(zhì)單體設(shè)計、蛋白質(zhì)粘合劑設(shè)計、對稱寡聚物設(shè)計、酶活性位點支架和對稱基序支架用于治療性和金屬結(jié)合蛋白設(shè)計方面取得了出色的性能。通過實驗表征數(shù)百種設(shè)計的對稱組裝體、金屬結(jié)合蛋白和蛋白粘合劑的結(jié)構(gòu)和功能,證明了該方法的威力和通用性,稱為Rose TTAFold diffusion ( RF diffusion )。
用RFdiffusion方法解決的問題的廣度和復(fù)雜性以及和精確性遠遠超過了以前的結(jié)果。與從文本提示生成圖像的方式類似,RFdiffusion使得用最少的專業(yè)知識從最小的分子規(guī)格(例如,對用戶指定的目標(biāo)蛋白質(zhì)具有高親和力的粘合劑,以及來自用戶指定對稱性的各種蛋白質(zhì)組裝體)生成功能蛋白成為可能。將RF擴展到包含配體,同樣可以使RFdiffusion擴展到顯式地模擬配體原子,并允許設(shè)計蛋白質(zhì)-配體相互作用。通過添加外部勢能和微調(diào)來定制RF擴散以應(yīng)對特定設(shè)計挑戰(zhàn)的能力,以及對基礎(chǔ)方法的持續(xù)改進,應(yīng)該能夠使從頭設(shè)計的蛋白質(zhì)設(shè)計達到更高的復(fù)雜性水平,以接近并在某些情況下超過自然進化所取得的成就。
簡而言之,本研究的主要內(nèi)容有:
1、獲得了一個蛋白質(zhì)骨架的生成模型
2、該模型在無條件和拓撲受限的蛋白質(zhì)單體設(shè)計、蛋白質(zhì)粘合劑設(shè)計、對稱寡聚物設(shè)計、酶活性位點支架和對稱基序支架用于治療性和金屬結(jié)合蛋白設(shè)計方面取得了出色的性能。
3、將RF擴展到包含配體,同樣可以使RF擴散擴展到顯式地模擬配體原子,并允許設(shè)計蛋白質(zhì)-配體相互作用。
原文標(biāo)題 : 用RoseTTAFold設(shè)計全新結(jié)構(gòu)與功能的蛋白質(zhì)

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
圖片新聞
技術(shù)文庫
最新活動更多
- 1 2025高端醫(yī)療器械國產(chǎn)替代提速,這些賽道值得關(guān)注!
- 2 多數(shù)人錯估了關(guān)稅將對中國醫(yī)藥產(chǎn)業(yè)的影響
- 3 一季度醫(yī)療儀器及器械進出口報告:前十大出口市場在哪?
- 4 認購火爆,映恩生物打響18A IPO重啟信號槍
- 5 中國創(chuàng)新藥出海:機遇、挑戰(zhàn)與未來展望
- 6 核藥賽道解碼:高壁壘、國產(chǎn)替代與千億市場卡位
- 7 創(chuàng)新藥是避風(fēng)港,更是發(fā)射臺!
- 8 第一醫(yī)藥扣非凈利潤僅687.40萬元:上!半[形土豪”要再沉淀沉淀
- 9 隱匿的醫(yī)療大佬,10年干出千億級公司
- 10 3月生物醫(yī)藥產(chǎn)業(yè)100個項目獲投,廣東最吸金