人工智能(AI)再度發(fā)威,攻克了生物學(xué)領(lǐng)域一項(xiàng)重大難題:預(yù)測(cè)蛋白質(zhì)如何從線性氨基酸鏈卷曲成3D形狀以執(zhí)行任務(wù)。據(jù)美國(guó)《科學(xué)》雜志網(wǎng)站11月30日?qǐng)?bào)道,“蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)關(guān)鍵評(píng)估”(CASP)競(jìng)賽傳來喜訊:英國(guó)“深度學(xué)習(xí)”(DeepMind)稱其AI實(shí)現(xiàn)了上述成就,他們的方法將極大加快新藥研發(fā)進(jìn)程。
人體擁有成千上萬(wàn)種不同的蛋白質(zhì),每一種蛋白質(zhì)都包含幾十到幾百種氨基酸,這些氨基酸的順序決定了它們之間的作用,賦予蛋白質(zhì)復(fù)雜的三維形狀,進(jìn)而決定了蛋白質(zhì)的功能。了解這些三維形狀有助于研究人員設(shè)計(jì)出能在蛋白質(zhì)縫隙內(nèi)滯留的藥物。此外,合成出擁有所需結(jié)構(gòu)的蛋白質(zhì),還可以加快酶的研制進(jìn)程,讓生物燃料領(lǐng)域受益。
幾十年來,研究人員利用X射線晶體學(xué)或低溫電子顯微鏡(cryo-EM)等實(shí)驗(yàn)技術(shù)來破譯蛋白質(zhì)的三維結(jié)構(gòu),但這種方法可能需要數(shù)月甚至數(shù)年,且未必見效。目前,在生命體內(nèi)發(fā)現(xiàn)的2億多個(gè)蛋白質(zhì)中,只有17萬(wàn)個(gè)蛋白質(zhì)的結(jié)構(gòu)被破解。
1994年,為更好預(yù)測(cè)和破解蛋白質(zhì)三維結(jié)構(gòu),馬里蘭大學(xué)結(jié)構(gòu)生物學(xué)家約翰·穆爾特等人發(fā)起了CASP競(jìng)賽,每?jī)赡昱e行一次。在今年的比賽中,“深度學(xué)習(xí)”團(tuán)隊(duì)的“阿爾法折疊”(AlphaFold)方法的中位分?jǐn)?shù)為92.4(滿分100分,90分以上被認(rèn)為預(yù)測(cè)方法可與實(shí)驗(yàn)方法相媲美),預(yù)測(cè)最具挑戰(zhàn)性的蛋白質(zhì)的平均得分為87,比次優(yōu)預(yù)測(cè)高出25分。它甚至擅長(zhǎng)預(yù)測(cè)嵌入細(xì)胞膜的蛋白質(zhì)結(jié)構(gòu)——細(xì)胞膜是許多人類疾病的核心,但很難用X射線晶體學(xué)研究。
歐洲生物信息學(xué)研究所名譽(yù)主任珍妮特·桑頓說:“‘深度學(xué)習(xí)’團(tuán)隊(duì)所取得的成就是驚人的,將改變結(jié)構(gòu)生物學(xué)和蛋白質(zhì)研究的未來!
穆爾特則表示,這是一個(gè)有50年歷史的問題,“阿爾法折疊”改變了游戲規(guī)則,實(shí)驗(yàn)學(xué)家將能使用精確的結(jié)構(gòu)預(yù)測(cè)來理解不透明的X射線和低溫電磁數(shù)據(jù);藥物設(shè)計(jì)者也可借此迅速厘清新冠病毒等新冒出的危險(xiǎn)病原體中每種蛋白質(zhì)的結(jié)構(gòu),從而更快研制出相關(guān)藥物。(記者劉霞)