首頁(yè)>資訊 >
AlphaFold2立功,清華團(tuán)隊(duì)用深度學(xué)習(xí)增強(qiáng)新冠抗體,創(chuàng)AI里程碑 2022-03-21 13:16:51  來(lái)源:36氪

AlphaFold 2的問(wèn)世可謂是生物學(xué)界海嘯級(jí)地震,讓蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)走上另一個(gè)新階段。同時(shí),AlphaFold的開(kāi)創(chuàng)性方法也對(duì)其他研究產(chǎn)生深遠(yuǎn)的影響。這不,清華和MIT研究團(tuán)隊(duì)在最新研究中就用上了它。

2020年末,DeepMind開(kāi)發(fā)的第二代深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)AlphaFold 2的問(wèn)世震驚了結(jié)構(gòu)生物學(xué)界。

AlphaFold解決了困擾科學(xué)家?guī)资甑牡鞍踪|(zhì)折疊問(wèn)題。

最近的研究表明,AlphaFold開(kāi)創(chuàng)的方法正在向更廣泛的生物學(xué)界蔓延。

在《美國(guó)國(guó)家科學(xué)院院刊》上發(fā)表的一篇論文 Deep learning guided optimization of human antibody against SARS-CoV-2 variants with broad neutralization。

論文中,科學(xué)家描述了修改一種已知的COVID-19抗體的方式,以提高其對(duì)多種疾病變體的療效。

地址:https://www.pnas.org/doi/10.1073/pnas.2122954119

科學(xué)家們寫(xiě)道,「我們可以使抗體寬度以及sars-cov-2變體 (包括 Delta) 的效力提高10到600倍」。他們甚至發(fā)現(xiàn)了該方法可以對(duì)抗奧密克戎(Omicron)變體跡象的希冀。

深度學(xué)習(xí)增強(qiáng)新冠抗體

這項(xiàng)研究是由清華大學(xué)、伊利諾伊大學(xué)厄巴納-香檳分校和麻省理工學(xué)院的研究人員共同完成, 他們利用深度學(xué)習(xí)進(jìn)行研究有兩個(gè)重要的原因。

一個(gè)是擴(kuò)大所謂的搜索空間,即修改抗體的一組潛在解決方案。現(xiàn)有的方法,例如隨機(jī)突變,雖然很有價(jià)值,但費(fèi)時(shí)費(fèi)力。

使用深度學(xué)習(xí)是一種自動(dòng)化的方法,從而加快工作速度。

其次,像隨機(jī)突變這樣的方法可以在帶來(lái)好處的同時(shí)帶走抗體好的那一部分,結(jié)果可能不是最理想的。

通過(guò)使用深度學(xué)習(xí)的方法,作者希望擴(kuò)展功效的同時(shí)保留已經(jīng)取得的成果。

圖嵌入注意程序,用于查找對(duì)預(yù)測(cè)結(jié)合親和力具有重要意義的殘基對(duì)

他們的方法采用了AlphaFold2的基本技術(shù): 一個(gè)圖形網(wǎng)絡(luò),以及一種稱(chēng)為注意力機(jī)制的變量處理方法

圖形網(wǎng)絡(luò)是指一些事物的集合可以根據(jù)它們之間的關(guān)系進(jìn)行評(píng)估,比如社交網(wǎng)絡(luò)中的人。

AlphaFold 2利用蛋白質(zhì)的信息構(gòu)建了一個(gè)不同氨基酸之間距離的圖表。然后通過(guò)注意力機(jī)制操縱這些圖,計(jì)算每個(gè)氨基酸與另一個(gè)氨基酸的關(guān)系。

Shan和他的同事采取了同樣的方法,他們把這種方法應(yīng)用到病毒的氨基酸、抗原以及抗體的氨基酸上。

他們將所謂的野生型與兩者的突變形式進(jìn)行比較,以確定抗體與抗原的結(jié)合如何隨著野生型和突變型之間的氨基酸對(duì)的變化而變化。

為了訓(xùn)練一個(gè)深度神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)這一點(diǎn),他們?cè)O(shè)置了一個(gè)目標(biāo)。在機(jī)器學(xué)習(xí)領(lǐng)域被稱(chēng)作目標(biāo)函數(shù),該函數(shù)正是神經(jīng)網(wǎng)絡(luò)要復(fù)制的目標(biāo)。

在這一例中,目標(biāo)函數(shù)是自由能量的變化,即蛋白質(zhì)中的能量從野生型變到突變型,由希臘字母delta-delta、G和ΔΔG。

給定一個(gè)目標(biāo)自由能,神經(jīng)網(wǎng)絡(luò)可以可靠地預(yù)測(cè)哪一組氨基酸配對(duì)的變化和目標(biāo)自由能的變化最相符。

Shan和他的同事表示,為了評(píng)估變異對(duì)蛋白質(zhì)復(fù)合體的效果,我們首先通過(guò)重新包裝突變周?chē)膫?cè)鏈,預(yù)測(cè)了蛋白質(zhì)復(fù)合體的結(jié)構(gòu),之后解碼了野生型和突變型復(fù)合體,并利用該網(wǎng)絡(luò)來(lái)獲得野生型和突變型復(fù)合體的嵌入。

之后,通過(guò)額外的神經(jīng)網(wǎng)絡(luò)層和兩部分嵌入的比較來(lái)預(yù)測(cè)突變的影響(用ΔΔG衡量)。

雖然Shan和他的團(tuán)隊(duì)提到了AlphaFold2,他們也使用了AlphaFold2所使用的方法,但他們沒(méi)用DeepMind的代碼。

麻省理工學(xué)院的Bonnie Berger是該研究的聯(lián)合作者,他表示,「關(guān)于ΔΔG預(yù)測(cè)器的研究完全是從零開(kāi)始的。」

因?yàn)棣う預(yù)測(cè)器和AlphaFold2都是開(kāi)源的,每個(gè)人都可以親自去體驗(yàn),去看看二者的比較。ΔΔG預(yù)測(cè)器的代碼在GitHub,AlphaFold2的代碼在它自己的網(wǎng)站。

在訓(xùn)練神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)重要的抗體和抗原之后,作者們從新型冠狀病毒的α、β和γ版本中找到抗體已經(jīng)成功的證據(jù),并據(jù)此開(kāi)始進(jìn)行反向工作。

他們使用這些數(shù)據(jù)來(lái)預(yù)測(cè)哪些突變的抗體能夠延長(zhǎng)療效。

作者表示,我們的辦法生成了一個(gè)用電腦模擬的抗體CDR的突變庫(kù),通過(guò)訓(xùn)練幾何中立網(wǎng)絡(luò)進(jìn)行排序。這樣不僅能提高抗體和Delta RBD的結(jié)合,還能維持抗體和其它所關(guān)注變體的RBD的結(jié)合。

CDR,全稱(chēng)為互補(bǔ)性決定區(qū),是和抗原結(jié)合的一部分或是抗體。RBD,全稱(chēng)為受體結(jié)合區(qū),是病毒上的重要靶點(diǎn)。

研究人員得到了雙重、三重,甚至四重的變異抗體。他們?cè)趯?shí)驗(yàn)室里用合成的病毒來(lái)測(cè)試這些抗體。他們發(fā)現(xiàn),隨著突變的合成,降低抗原濃度的效果越來(lái)越強(qiáng)。

他們得出結(jié)論,認(rèn)為存在一種物質(zhì)能更好的讓突變抗體和病毒相結(jié)合。

他們寫(xiě)道,「有三到四次突變的抗體HX001-020、HX001-033和HX001-034也比有兩次突變的HX001-034要強(qiáng)。親合力的提高可能會(huì)讓這些抗體的中和活性在遇到非典或新冠的野生病毒或變體病毒時(shí)增加?!?/p>

有一個(gè)引人深思的發(fā)現(xiàn)是,一個(gè)突變的抗體能夠避免病毒的突變,其目的是提高效率。在一份結(jié)構(gòu)分析中,他們發(fā)現(xiàn)原始抗體的一部分和抗原的一個(gè)特定部分擦肩而過(guò),二者相互排斥。

這是因?yàn)榭贵w的粒子R103和抗原的粒子R436都有非常長(zhǎng)的側(cè)鏈,并且都攜帶正電子,這兩種粒子之間的親和性會(huì)產(chǎn)生一種強(qiáng)大的推力,這股力量會(huì)削弱抗體和抗原之間的結(jié)合度。

科學(xué)家們替換普通的抗體粒子之后,就觀察不到R346和Delta RBD的直接作用了。該因素也許能解釋針對(duì)Delta變體的中和效果為什么能夠大大改善。

作者們?cè)谘芯康目贵w正好是由Shan和他的同事們?nèi)ツ暌氲?。這一事實(shí)讓整個(gè)研究變得更加有趣。

名叫P36-5D2的抗體是從一名患過(guò)新冠病毒的康復(fù)患者的血清中提取出來(lái)的。Shan和他的團(tuán)隊(duì)通過(guò)動(dòng)物模型研究,發(fā)現(xiàn)這種抗體是一種適用面廣、有效、具有保護(hù)性的抗體。

因此,這項(xiàng)新研究標(biāo)志著人工智能領(lǐng)域的一個(gè)里程碑。即借助電腦,把傳統(tǒng)的生物產(chǎn)品進(jìn)行改進(jìn),從而擴(kuò)展傳統(tǒng)的生物安全實(shí)驗(yàn)室治療傳染性疾病的辦法。

AlphaFold足以改變?nèi)祟?lèi)?

2021年年底,人工智能預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)AlphaFold被評(píng)Science評(píng)為2021十大科學(xué)突破之首。

人工智能正在催生新的科研范式,AI for Science已經(jīng)成為許多科學(xué)家的共識(shí)。

長(zhǎng)期以來(lái),蛋白質(zhì)都是生命科學(xué)工作者研究的重點(diǎn)。

因?yàn)榈鞍踪|(zhì)是生命活動(dòng)的主要承擔(dān)者,甚至毫不夸張的說(shuō),沒(méi)有蛋白質(zhì)就沒(méi)有生命。

而其中,蛋白質(zhì)的結(jié)構(gòu)更是眾多生命科學(xué)工作者研究的熱點(diǎn),畢竟其主要功能是由結(jié)構(gòu)決定的。

2020年,AlphaFold2的問(wèn)世成為生物學(xué)界海嘯級(jí)的地震。

緊接著DeepMind開(kāi)源了AlphaFold2,并能夠預(yù)測(cè)出98.5%的蛋白質(zhì)結(jié)構(gòu),讓學(xué)術(shù)圈再次沸騰。

不僅如此,研究人員還將其做成了數(shù)據(jù)集,將其免費(fèi)開(kāi)放。

對(duì)蛋白質(zhì)進(jìn)行系統(tǒng)深入的研究,能讓人類(lèi)從更深層次詮釋生命體的構(gòu)成和運(yùn)作變化規(guī)律,進(jìn)而全面揭示生命運(yùn)行、發(fā)展的機(jī)制,激發(fā)生物科學(xué)、藥物研發(fā)、合成生物學(xué)方面的發(fā)展。

另一方面,將人工智能方法應(yīng)用到蛋白質(zhì)預(yù)測(cè),可以讓科研人員從中得到許多借鑒,站在神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)的技術(shù)巨人的肩膀上,推動(dòng)生物界的發(fā)展與研究。

「AI+生物」團(tuán)隊(duì)強(qiáng)強(qiáng)聯(lián)合

可以說(shuō),清華這個(gè)「AI+生物」的打造,是當(dāng)前新冠中和抗體研究打造的最佳團(tuán)隊(duì)。

它充分利用了清華大學(xué)的校內(nèi)科研資源優(yōu)勢(shì),聯(lián)合清華大學(xué)醫(yī)學(xué)院與清華大學(xué)智能產(chǎn)業(yè)研究院(AIR),進(jìn)行強(qiáng)強(qiáng)聯(lián)合,「AI+生物」集中攻關(guān)。

張林琦教授,來(lái)自清華大學(xué)醫(yī)學(xué)院,是該研究的領(lǐng)銜人物之一。

此前,張林琦教授一直致力于挖掘新冠免疫保護(hù)機(jī)制,開(kāi)創(chuàng)藥物和疫苗研發(fā)。

據(jù)清華大學(xué)醫(yī)學(xué)院官網(wǎng)介紹,張林琦教授于1992年獲得英國(guó)愛(ài)丁堡大學(xué)分子病毒學(xué)博士學(xué)位,之后在美國(guó)紐約大學(xué)和洛克菲勒大學(xué)擔(dān)任助理教授和副教授,2007年全職任教于清華大學(xué),現(xiàn)為清華大學(xué)醫(yī)學(xué)院長(zhǎng)聘教授,北京協(xié)和醫(yī)學(xué)院兼職教授,博士生導(dǎo)師,清華大學(xué)艾滋病綜合研究中心主任。

張林琦教授是首位中國(guó)籍非洲科學(xué)院院士,于2016年當(dāng)選。

2014年非洲爆發(fā)了大規(guī)模的埃博拉病毒,作為國(guó)內(nèi)外傳染病研究專(zhuān)家,張林琦教授帶著一名研究人員的初心和使命,致力于病毒研究。

然而,新冠病毒的肆虐遠(yuǎn)比我們想象地要猖狂!

面對(duì)這樣的困境,研究人員毫不畏縮,大膽嘗試,將計(jì)算機(jī)科學(xué)前沿成果與研究方法運(yùn)用到傳統(tǒng)生物研究上。

彭健,清華大學(xué)智能產(chǎn)業(yè)研究院高級(jí)訪問(wèn)教授,同樣是該研究的領(lǐng)銜人物之一。

彭健博士的主要研究領(lǐng)域?yàn)樾畔W(xué),他從生物化學(xué)領(lǐng)域找到了學(xué)科交叉點(diǎn),在生物信息學(xué)、化學(xué)信息學(xué)和機(jī)器學(xué)習(xí)方面,包括蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)技術(shù)的關(guān)鍵測(cè)試(CASP),及轉(zhuǎn)化醫(yī)學(xué)和藥物基因組學(xué)的DREAM 挑戰(zhàn)等,取得了備受矚目的成就。

清華AIR引領(lǐng)人工智能賦能生命科學(xué),這是吸引彭健博士加入清華大學(xué)智能產(chǎn)業(yè)研究院的重要原因

此前,彭健于2013年獲芝加哥大學(xué)豐田技術(shù)學(xué)院計(jì)算機(jī)科學(xué)博士,接著,在MIT計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室從事博士后研究,然后,擔(dān)任美國(guó)伊利諾伊大學(xué)厄巴納-香檳分校計(jì)算機(jī)科學(xué)系副教授。

彭健說(shuō):「交叉學(xué)科人才的培養(yǎng)尤其重要」!這不,加入不到1年時(shí)間,就已開(kāi)花結(jié)果。

參考資料:

https://www.med.tsinghua.edu.cn/info/1049/3926.htm

https://air.tsinghua.edu.cn/info/1001/1005.htm

https://www.zdnet.com/article/mit-and-tsinghua-scholars-use-deepminds-alphafold-approach-to-boost-covid-19-antibodies/

https://www.pnas.org/doi/10.1073/pnas.2122954119

關(guān)鍵詞:

相關(guān)閱讀:
熱點(diǎn)
圖片 圖片