科學家藉助AI技術發現病毒“暗物質”

記者10日從中山大學獲悉,該校醫學院施莽教授團隊與阿里雲李兆融團隊將人工智能(AI)技術應用於病毒鑑定,發現了傳統研究方法未能發現的病毒“暗物質”,探索了病毒學研究的新路徑。相關成果近日發表在國際期刊《細胞》上。

據介紹,傳統的病毒發現方法包括病毒分離和生命組學的生物信息學分析,高度依賴既有知識,對RNA病毒這種高度分化、種類繁多且容易變異的病毒識別率低。

在該研究中,團隊開發的LucaProt人工智能算法,能夠對病毒和非病毒基因組序列進行深度學習,並在數據集中自主判斷病毒序列。利用這套算法,團隊在來自全球生物環境樣本的10487份RNA測序數據中發現了超過51萬條病毒基因組,代表超過16萬個潛在病毒種及180個RNA病毒超羣,大幅擴展了全球RNA病毒的多樣性。其中,23個超羣無法通過序列同源方法識別,被稱爲病毒圈的“暗物質”。

“人工智能的算法模型能夠挖掘出我們之前忽略或根本不知道的病毒,這種能力在疾病防控和新病原的快速識別中尤爲重要。特別是在疫情暴發時,人工智能的速度和精度可以幫助科學家更快地鎖定潛在病原體。”施莽說。

通過進一步分析,團隊報告了迄今最長的RNA病毒基因組,長度達到47250個核苷酸;發現了超出以往認知的基因組結構,展現出RNA病毒基因組進化的靈活性;識別到多種病毒功能蛋白,特別是與細菌相關的功能蛋白,進一步表明還有更多類型的RNA噬菌體亟待探索;發現在南極底泥、深海熱泉、活性污泥和鹽鹼灘等極端環境中,RNA病毒的數量和多樣性仍然較高。這些發現刷新了科學家對病毒圈的認知。

“面對遠源的新病毒,現有病毒分類體系已經顯得力不從心。未來,這一體系在門、綱等更深層次的分類上,可能會有大規模調整。”施莽說,他們的研究展示了病毒多樣性的深度,但廣度仍有待更多樣本的補充。病毒的多樣性遠超人類想象,目前看到的仍是冰山一角。

施莽表示,未來將繼續通過跨領域科研合作,充分利用雲計算和人工智能優勢,解決生命科學領域的重要問題。

本網站轉載的所有的文章、圖片、音頻視頻文件等資料的版權歸版權所有人所有。如因無法聯繫到作者侵犯到您的權益,請與本網站聯繫,我們將採取適當措施。