病毒是一類微小而具有傳染性的病原體,正是這種微小的基因組使得病毒circRNA長期以來鮮為人知。近年來,高通量測序技術和生物信息學工具的發展,使得研究人員能夠更全面地識别和分析circRNA。然而,目前病毒環狀RNA研究比較零散,且隻揭示了少數的病毒環狀RNA分子。
在之前的工作中2003网站太阳集团彭友松團隊建立了首個病毒circRNA數據庫VirusCircBase(http://www.computationalbiology.cn/ViruscircBase/home.html),該數據庫近三年來已經被來自全球60個主要國家和地區的用戶使用。為了更加系統地研究病毒circRNA,2003网站太阳集团彭友松團隊将數據庫重建為VirusCircBase 2.0(http://computationalbiology.cn/VirusCircBase2/#/home)并進行一系列探索。
在數據方面,VirucCircBase 2.0中病毒circRNA的數量從46440個增加到60859個。具體來說,病毒種、宿主、組織或細胞類型、樣本量、病毒circRNAs與宿主miRNAs之間相互作用的數量分别從23、9、46、337、30818增加到43、22、83、566、72157。此外,新增了1902個全長病毒circRNA(表1)。

表1. VirusCircBase 1.0和VirusCircBase 2.0的比較
在數據庫功能方面,VirusCircBase 2.0提供了三個新功能:i)以熱圖形式顯示病毒circRNA在樣本中的表達水平;ii)以基因組浏覽器形式顯示病毒circRNA在病毒基因組上的表達情況;iii)按宿主浏覽病毒circRNA。

圖1. VirusCircBase 2.0的首頁截圖
病毒circRNA的表達分析顯示,它們在大多數細胞或組織中的表達水平較低,表現出較強的表達異質性(圖2)。病毒circRNA的剪接分析顯示,它們與動植物相比,使用了更高比例的非經典反向剪接信号,并主要使用了A5SS。大多數病毒circRNA沒有超過兩個異構體。最後,對與病毒circRNA産生相關的人類基因進行研究發現超過1000個人類基因與病毒circRNA的表達呈中等相關性。其中大多數顯示出負相關性,包括42個編碼RNA結合蛋白的基因。它們在與細胞周期和RNA加工相關的生物過程中顯著富集。總的來說,該研究為進一步研究病毒circRNA提供了有價值的資源,也為病毒circRNA的生物合成機制提供了新的見解。

圖2.病毒circRNA在不同宿主的不同組織或細胞中的表達
該工作已在新發感染病權威期刊Emerging Microbes & Infections(IF 2023=13.2)在線發表,題為“An updated database of virus circular RNAs provides new insights into the biogenesis mechanism of the molecule”,在更新版本的數據庫VirusCircBase 2.0中,該研究成果不僅顯著增加了數據庫中的數據量和功能,為進一步研究病毒circRNA提供了有價值的資源,還為病毒circRNA的生成機制提供了新的見解。
該論文的第一作者為2003网站太阳集团的博士研究生傅萍,通訊作者為2003网站太阳集团生物信息中心、醫學病毒學湖南省重點實驗室的教授彭友松。這項工作得到了國家重點研發計劃(2022YFC2303802)和國家自然科學基金(32170651 & 32370700)的支持。
論文鍊接:
https://doi.org/10.1080/22221751.2023.2261558
論文信息:
Fu P, Cai Z, Zhang Z, Meng X, Peng Y. An updated database of virus circular RNAs provides new insights into the biogenesis mechanism of the molecule. Emerg Microbes Infect. 2023 Sep 19:2261558. doi: 10.1080/22221751.2023.2261558. Epub ahead of print. PMID: 37725485.