免费A级毛片无码专区网站-成人国产精品视频一区二区-啊 日出水了 用力乖乖在线-国产黑色丝袜在线观看下-天天操美女夜夜操美女-日韩网站在线观看中文字幕-AV高清hd片XXX国产-亚洲av中文字字幕乱码综合-搬开女人下面使劲插视频

RDEA 謠言檢測(cè)《Rumor Detection on Social Media with Event Augmentations》

論文信息

論文標(biāo)題:Rumor Detection on Social Media with Event Augmentations論文作者:Zhenyu He, Ce Li, Fan Zhou, Yi Yang論文來(lái)源:2021,SIGIR論文地址:download論文代碼:download
1 Introduction現(xiàn)有的深度學(xué)習(xí)方法取得了巨大的成功,但是這些方法需要大量可靠的標(biāo)記數(shù)據(jù)集來(lái)訓(xùn)練,這是耗時(shí)和數(shù)據(jù)低效的 。為此,本文提出了 RDEA,通過(guò)事件增強(qiáng)在社交媒體上的謠言檢測(cè)(RDEA),該方案創(chuàng)新地集成了三種增強(qiáng)策略,通過(guò)修改回復(fù)屬性和事件結(jié)構(gòu),提取有意義的謠言傳播模式,并學(xué)習(xí)用戶(hù)參與的內(nèi)在表示 。
貢獻(xiàn):
    • 涉及了三種可解釋的數(shù)據(jù)增強(qiáng)策略,這在謠言時(shí)間圖數(shù)據(jù)中沒(méi)有得到充分的探索;
    • 在謠言數(shù)據(jù)集中使用對(duì)比自監(jiān)督的方法進(jìn)行預(yù)訓(xùn)練;
    • REDA 遠(yuǎn)高于其他監(jiān)督學(xué)習(xí)方法;
2 Methodology總體框架如下:
RDEA 謠言檢測(cè)《Rumor Detection on Social Media with Event Augmentations》

文章插圖
主要包括三個(gè)模塊:
    • event graph data augmentation
    • contrastive pre-training
    • model fne-tuning
2.1 Event Augmentation謠言事件中存在兩種用戶(hù):
    • malicious users
    • naive users
malicious users 故意傳播虛假信息,nvaive users 無(wú)意中幫助了 malicious users 傳播虛假信息,所以 mask node 是可行的 。
給定除 root node 的節(jié)點(diǎn)特征矩陣 $E^{-r} \in \mathbb{R}^{(|\mathcal{V}|-1) \times d}$,以及一個(gè) mask rate $p_{m}$,mask 后的節(jié)點(diǎn)特征矩陣為:
$E_{\text {mask }}^{-r}=\mathrm{M} \odot E^{-r} $
其中,$M \in\{0,1\}^{(|\mathcal{V}|-1) \times d}$ 代表著 mask matrix,隨機(jī)刪除 $ (|\mathcal{V}|-1) \times p_{m}$ 行節(jié)點(diǎn)特征矩陣 。
2.2 Subgraph【RDEA 謠言檢測(cè)《Rumor Detection on Social Media with Event Augmentations》】用戶(hù)在早期階段通常是支持真實(shí)謠言的,所以,在模型訓(xùn)練時(shí),如果過(guò)多的訪(fǎng)問(wèn)謠言事件的整個(gè)生命周期,將阻礙早期謠言檢測(cè)的準(zhǔn)確性,所以本文采取隨機(jī)游走生成謠言事件的子圖 $G_{i_sub}$ 。
2.3 Edge dropping形式上,給定一個(gè)鄰接矩陣 $A$ 和 $N_{e}$ 條邊和丟棄率 $p_38lypf8$,應(yīng)用 DropEdge 后的鄰接矩陣 $A_{d r o p}$,其計(jì)算方法如下:
$A_{d r o p}=A-A^{\prime}$
其中,$A^{\prime}$ 是隨機(jī)采樣 $N_{e} \times p_up8wr8d $ 條邊的鄰接矩陣 。
2.2 Contrastive Pre-training在本節(jié)將介紹如何通過(guò)在輸入事件和增強(qiáng)事件之間的對(duì)比預(yù)訓(xùn)練來(lái)獲得互信息 。
形式上,對(duì)于 node $j$ 和 event graph $G$,self-supervised learning 過(guò)程如下:
$\begin{array}{l}h_{j}^{(k)} &=&\operatorname{GCL}\left(h_{j}^{(k-1)}\right) \\h^{j} &=&\operatorname{CONCAT}\left(\left\{h_{j}^{(k)}\right\}_{k=1}^{K}\right)\\H(G) &=&\operatorname{READOUT}\left(\left\{h^{j}\right\}_{j=1}^{|\mathcal{V}|}\right)\end{array}$
其中,$h_{j}^{(k)}$ 是節(jié)點(diǎn)在第 $k$ 層的特征向量 。GCL 是 graph convolutional encoder,$h^{j}$ 是通過(guò)將 GCL 所有層的特征向量匯總為一個(gè)特征向量,該特征向量捕獲以每個(gè)節(jié)點(diǎn)為中心的不同尺度信息,$H(G)$ 是應(yīng)用 READOUT 函數(shù)的給定事件圖的全局表示 。本文并選擇 GIN 作為 GCL 和 mean 作為 READOUT 函數(shù)。對(duì)比預(yù)訓(xùn)練的目標(biāo)是使謠言傳播圖數(shù)據(jù)集上的互信息(MI)最大化,其計(jì)算方法為:
${\large \begin{aligned}I_{\psi}\left(h^{j}(G) ; H(G)\right):=& \mathbb{E}\left[-\operatorname{sp}\left(-T_{\psi}\left(\vec{h}^{j}\left(G_{i}^{\text {pos }}\right), H\left(G_{i}\right)\right)\right)\right] \\&-\mathbb{E}\left[\operatorname{sp}\left(T_{\psi}\left(\vec{h}^{j}\left(G_{i}^{n e g}\right), H\left(G_{i}\right)\right)\right)\right]\end{aligned}} $
其中,$I_{\psi}$ 為互信息估計(jì)器,$T_{\psi}$ 為鑒別器(discriminator),$G_{i}$ 是輸入 event 的 graph,$G_{i}^{\text {pos }}$ 是 $G_{i}$ 的 positive sample,$G_{i}^{\text {neg }}$ 是 $G_{i}$ 的負(fù)樣本,$s p(z)=\log \left(1+e^{z}\right)$ 是 softplus function 。對(duì)于正樣本,可以是 $G_{i}\left(E_{\text {mask }}^{-r}\right)$,$G_{i_{-} s u b$,$G_{i}\left(A_{d r o p}\right)$,負(fù)樣本是 一個(gè) batch 中其他 event graph 的局部表示 。

經(jīng)驗(yàn)總結(jié)擴(kuò)展閱讀