近日,數(shù)據(jù)科學(xué)學(xué)院于彬教授團(tuán)隊(duì)在生物信息學(xué)研究領(lǐng)域取得進(jìn)展,相關(guān)成果以“RPI-GGCN: Prediction of RNA-Protein Interaction Based on Interpretability Gated Graph Convolution Neural Network and Co-Regularized Variational Autoencoders”為題發(fā)表在人工智能領(lǐng)域的國(guó)際期刊IEEE Transactions on Neural Networks and Learning Systems(中科院一區(qū)TOP期刊,影響因子10.4)。于彬教授為論文的唯一通訊作者,2021級(jí)研究生王逸飛為第一作者,青島科技大學(xué)為第一完成單位。
近年來(lái),隨著人工智能和生物信息學(xué)的快速發(fā)展,高通量蛋白質(zhì)組學(xué)數(shù)據(jù)挖掘研究已成為國(guó)內(nèi)外生物信息學(xué)研究的熱點(diǎn)和學(xué)科前沿。研究表明,RNA-蛋白質(zhì)相互作用(RPI)的異常可能導(dǎo)致多種疾病的發(fā)生,如癌癥、神經(jīng)系統(tǒng)疾病等。因此,準(zhǔn)確預(yù)測(cè)RNA-蛋白質(zhì)相互作用對(duì)于理解細(xì)胞功能、疾病診斷和治療具有重要意義。傳統(tǒng)的實(shí)驗(yàn)方法通常耗時(shí)耗力,迫切需要開(kāi)發(fā)快速而準(zhǔn)確的人工智能方法對(duì)RPI預(yù)測(cè)研究。
提出一種基于可解釋性RNA-蛋白質(zhì)相互作用預(yù)測(cè)的人工智能算法模型—RPI-GGCN。首次將門(mén)控循環(huán)單元(GRU)引入圖卷積神經(jīng)網(wǎng)絡(luò)(GCN)構(gòu)建RPI預(yù)測(cè)模型。其中,GCN通過(guò)聚合鄰居節(jié)點(diǎn)的特征來(lái)更新每個(gè)節(jié)點(diǎn)的表示,該方法能夠充分利用RNA和蛋白質(zhì)之間的拓?fù)浣Y(jié)構(gòu)信息,分析卷積操作的具體計(jì)算過(guò)程,理解模型如何利用圖結(jié)構(gòu)信息更新節(jié)點(diǎn)表示。進(jìn)而通過(guò)GRU使用更新門(mén)和重置門(mén)來(lái)選擇性地保留或清除信息,從而有效去除無(wú)關(guān)信息。本研究首次使用協(xié)正則變分自編碼器特征選擇方法,結(jié)合自編碼器和變分自編碼器的優(yōu)點(diǎn),并引入?yún)f(xié)方差正則化項(xiàng)提高模型的穩(wěn)定性和泛化能力。該方法進(jìn)一步增強(qiáng)模型的功效,從而對(duì)RPI進(jìn)行更準(zhǔn)確、高效和穩(wěn)定的預(yù)測(cè)。在5折交叉驗(yàn)證測(cè)試中,RPI-GGCN模型在數(shù)據(jù)集RPI369、RPI488、RPI1446、RP11807和RPI2241上優(yōu)于其它現(xiàn)有RPI預(yù)測(cè)算法。為了測(cè)試模型的泛化性能,在六個(gè)獨(dú)立的測(cè)試集上,均取得了優(yōu)異的性能。通過(guò)對(duì)Escherichia coli數(shù)據(jù)集的預(yù)測(cè)和可解釋性分析,RPI-GGCN模型不僅能夠準(zhǔn)確預(yù)測(cè)RPI網(wǎng)絡(luò),還能夠深入探究RNA-蛋白質(zhì)相互作用的本質(zhì)和規(guī)律,可為相關(guān)性機(jī)理研究提供新思路和方法。本文提出的RPI-GGCN人工智能算法模型可以成為生物信息學(xué)的一個(gè)有效工具,為揭示蛋白質(zhì)的生物學(xué)功能提供重要線索和理論依據(jù),也為探討疾病機(jī)理、新一代藥物設(shè)計(jì)、藥物開(kāi)發(fā)等方面提供新的見(jiàn)解。

文章鏈接:https://doi.org/10.1109/TNNLS.2024.3390935.
此外,該團(tuán)隊(duì)近一年來(lái)基于人工智能算法在生物信息學(xué)、人工智能領(lǐng)域的高水平SCI期刊Pattern Recognition、Briefings in Bioinformatics、Knowledge-Based Systems取得多項(xiàng)重要科研成果。
以上研究得到了國(guó)家自然科學(xué)基金面上項(xiàng)目(62172248)和山東省自然科學(xué)基金面上項(xiàng)目(ZR2021MF098)的資助。