中國校企聯(lián)手發(fā)表科研成果,借AI發(fā)現(xiàn)超16萬種RNA病毒

分享到:

中國校企聯(lián)手發(fā)表科研成果,借AI發(fā)現(xiàn)超16萬種RNA病毒

2024年10月10日 14:23 來源:中國新聞網(wǎng)
大字體
小字體
分享到:

  中新網(wǎng)北京10月10日電(記者 夏賓)中新網(wǎng)記者10日了解到,國際頂級學術(shù)期刊《Cell》在北京時間9日11時發(fā)表了中山大學與阿里云合作的科研成果,研究團隊利用云計算與AI技術(shù)發(fā)現(xiàn)了180個超群、16萬余種全新RNA病毒,是已知病毒種類的近30倍,大幅提升了業(yè)界對RNA病毒多樣性和病毒演化歷史的認知。

  《Cell》是國際公認的享有最高學術(shù)聲譽的期刊之一,國內(nèi)每年入選《Cell》的論文數(shù)量僅有數(shù)十篇。此次入選的論文提出了一種基于深度學習的RNA病毒發(fā)現(xiàn)方法,是深度學習算法在病毒發(fā)現(xiàn)領域的里程碑式進展,為病毒學研究開創(chuàng)了全新范式。

  病毒與人類的健康密切相關,但人類已知已確認的病毒種類僅有5000余種,這只是病毒世界的冰山一角。傳統(tǒng)RNA病毒鑒定方法高度依賴于序列同源性比對,即通過比較未知病毒與已知病毒的序列相似性來進行識別。然而,RNA病毒種類繁多且高度分化,傳統(tǒng)方法難以捕捉缺乏同源性或同源性極低的“暗物質(zhì)病毒”,新病毒發(fā)現(xiàn)的效率較低。

  AI與病毒學研究的結(jié)合正在突破這一難題。本篇論文提出了全新的深度學習模型"LucaProt",它基于Transformer框架與大模型表征技術(shù),結(jié)合蛋白質(zhì)序列和內(nèi)在結(jié)構(gòu)性特征,在獨立的測試數(shù)據(jù)集上表現(xiàn)優(yōu)異,具有極高的準確性(假陽性率僅為0.014%)和特異性(假陰性率為1.72%)。

  據(jù)介紹,研究團隊對來自全球生物環(huán)境樣本的10487份數(shù)據(jù)進行病毒挖掘,發(fā)現(xiàn)了513134條病毒基因組,代表161979個潛在病毒種及180個RNA病毒超群。使RNA病毒超群數(shù)量擴容約9倍,病毒種類增加約30倍,其中23個超群無法通過序列同源方法識別,被稱為病毒圈的“暗物質(zhì)”。

  該論文還揭示了多個病毒學領域新發(fā)現(xiàn),例如發(fā)現(xiàn)迄今為止最長的RNA病毒基因組,長度達到47250個核苷酸;識別出超出以往認知的基因組結(jié)構(gòu),展示了RNA病毒基因組進化的靈活性。此外,在高溫的深海熱泉等極端環(huán)境中,RNA病毒依舊存在多樣性。

  中山大學醫(yī)學院教授施莽表示,在科研領域,AI的應用已經(jīng)勢不可擋,通過AI方法探索科學問題已取得了重要突破。“這種研究范式將成為未來科學界的常態(tài),也可能成為我們認知世界的重要手段?!?/p>

  該論文共同第一作者、阿里云飛天實驗室算法專家賀勇表示,基于“AI+病毒學”的新研究框架刷新了人類對病毒圈的認識,隨著這種認識的不斷完善,有助于人類對未來可能發(fā)生的大流行進行預警,以及進一步推動RNA病毒疫苗的研發(fā)。(完)

【編輯:張子怡】
發(fā)表評論 文明上網(wǎng)理性發(fā)言,請遵守新聞評論服務協(xié)議
本網(wǎng)站所刊載信息,不代表中新社和中新網(wǎng)觀點。 刊用本網(wǎng)站稿件,務經(jīng)書面授權(quán)。
未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復制及建立鏡像,違者將依法追究法律責任。
Copyright ©1999-2024 chinanews.com. All Rights Reserved

評論

頂部