近日,數(shù)據(jù)科學(xué)學(xué)院杜軍威教授團(tuán)隊(duì)的兩篇論文被第47屆國(guó)際計(jì)算機(jī)學(xué)會(huì)信息檢索會(huì)議(SIGIR)錄用。兩篇文章均為青島科技大學(xué)第一單位和唯一通訊單位,第一作者為學(xué)校博士生李浩杰、通訊作者為杜軍威教授。

據(jù)悉,國(guó)際計(jì)算機(jī)學(xué)會(huì)信息檢索會(huì)議(InternationalACM SIGIR Conference on Research and Development in Information Retrieval,簡(jiǎn)稱SIGIR)是人工智能領(lǐng)域信息檢索方向最權(quán)威的頂級(jí)國(guó)際會(huì)議,也是中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)推薦的A類國(guó)際學(xué)術(shù)會(huì)議。第47屆年會(huì)將于2024年7月在美國(guó)華盛頓召開。
論文題目:Intent Distribution based Bipartite Graph Representation Learning
作者:李浩杰 魏威 劉冠峰(麥考瑞大學(xué)) 劉金環(huán) 江峰 杜軍威(通信作者)
二部圖表示學(xué)習(xí)將用戶和項(xiàng)目嵌入到一個(gè)基于觀察到的交互作用的低維潛在空間中。以往的研究主要分為兩類:一類是通過(guò)節(jié)點(diǎn)的表示來(lái)重構(gòu)圖的結(jié)構(gòu)關(guān)系,另一類是利用圖神經(jīng)網(wǎng)絡(luò)來(lái)聚合相鄰節(jié)點(diǎn)的信息。然而,現(xiàn)有的方法只在學(xué)習(xí)過(guò)程中探索節(jié)點(diǎn)的局部結(jié)構(gòu)信息。這使得表示宏觀結(jié)構(gòu)信息變得困難,并且很容易受到數(shù)據(jù)稀疏性和噪聲的影響。為了解決這個(gè)問(wèn)題,提出了基于意圖分布的二部圖表示學(xué)習(xí)(IDBR)模型,該模型明確地將節(jié)點(diǎn)意圖分布信息集成到表示學(xué)習(xí)過(guò)程中。具體來(lái)說(shuō),通過(guò)聚類得到節(jié)點(diǎn)意圖分布,并設(shè)計(jì)了一個(gè)基于意圖分布的圖卷積神經(jīng)網(wǎng)絡(luò)來(lái)生成節(jié)點(diǎn)表示。與傳統(tǒng)方法相比,擴(kuò)展了節(jié)點(diǎn)表示的范圍,能夠獲得更全面的全局意圖表示。在構(gòu)建意圖分布時(shí),有效地緩解了數(shù)據(jù)的稀疏性和噪聲的問(wèn)題。此外,通過(guò)整合來(lái)自結(jié)構(gòu)維度和語(yǔ)義維度的潛在相鄰節(jié)點(diǎn)來(lái)豐富節(jié)點(diǎn)的表示。在鏈路預(yù)測(cè)和推薦任務(wù)上的實(shí)驗(yàn)表明,該方法優(yōu)于現(xiàn)有的方法。

論文題目:Behavior Pattern Mining-based Multi-Behavior Recommendation
作者:李浩杰 程志勇(山東省人工智能研究院)于旭(中國(guó)石油大學(xué))劉金環(huán) 劉冠峰(麥考瑞大學(xué))杜軍威(通信作者)
多行為推薦系統(tǒng)通過(guò)挖掘輔助活動(dòng)(例如,點(diǎn)擊和收藏)來(lái)克服傳統(tǒng)模型僅依賴于稀疏目標(biāo)行為(如購(gòu)買)的限制。現(xiàn)有的多行為推薦方法大致采用以下兩種方式:一是從單個(gè)行為的子圖獲取節(jié)點(diǎn)的初步表示;二是把多行為數(shù)據(jù)視作異質(zhì)圖,并利用圖神經(jīng)網(wǎng)絡(luò)獲得統(tǒng)一的節(jié)點(diǎn)表示。盡管取得了優(yōu)異的效果,但這些方案尚未深入挖掘用戶與項(xiàng)目間復(fù)雜的互動(dòng)模式。為了填補(bǔ)這一空白,提出了一種基于行為模式挖掘的多行為推薦(BPMR)的創(chuàng)新算法。該方法深入探討了用戶與項(xiàng)目之間的各類互動(dòng)模式,并將這些模式用作推薦特征的學(xué)習(xí)。通過(guò)貝葉斯方法簡(jiǎn)化了推薦流程,有效避免了圖神經(jīng)網(wǎng)絡(luò)算法面臨的難題,比如過(guò)度平滑導(dǎo)致無(wú)法精確捕捉用戶偏好。在三個(gè)真實(shí)世界的數(shù)據(jù)集上進(jìn)行的實(shí)驗(yàn)評(píng)估顯示,BPMR在性能上顯著超越了現(xiàn)有的先進(jìn)算法,在Recall@10指標(biāo)上平均提升了268.29%,在NDCG@10指標(biāo)上平均提升了248.02%。