免费A级毛片无码专区网站-成人国产精品视频一区二区-啊 日出水了 用力乖乖在线-国产黑色丝袜在线观看下-天天操美女夜夜操美女-日韩网站在线观看中文字幕-AV高清hd片XXX国产-亚洲av中文字字幕乱码综合-搬开女人下面使劲插视频

PSA 謠言檢測(cè)——《Probing Spurious Correlations in Popular Event-Based Rumor Detection Benchmarks》( 四 )


$\tilde{\mathbf{s}}_{i}=\text { Concat }\left[\mathbf{s}_{1} ; \mathbf{s}_{2} ; \mathbf{s}_{3}\right] $
Microblog Veracity Prediction我們用相應(yīng)的發(fā)布者風(fēng)格表示 $\tilde{\mathbf{s}}_{i}$ 來增加微博表示 $\tilde{\mathbf{h}}_{i} \in \mathbb{R}^{n}$ 。最后 , 我們利用一個(gè)全連接層來預(yù)測(cè)微博的準(zhǔn)確性標(biāo)簽 $\hat{\mathbf{y}}_{i}$:
$\hat{\mathbf{y}}_{i}=\operatorname{Softmax}\left(\mathbf{W}_{2}^{\top}\left(\tilde{\mathbf{h}}_{i}+\mathbf{W}_{1}^{\top} \tilde{\mathbf{s}}_{i}\right)\right)$
其中 , 轉(zhuǎn)換 $\mathbf{W}_{1} \in \mathbb{R}^{3 F \times n}$ 和 $\mathbf{W}_{2} \in \mathbb{R}^{n \times|\mathcal{C}|}$ 。我們還在最后一層之前應(yīng)用 dropout , 以防止過擬合 。通過最小化 $\hat{\mathbf{y}}_{i}$ 和真實(shí)標(biāo)簽 $y_{i}$ 之間的交叉熵?fù)p失來優(yōu)化模型參數(shù)
5 ExperimentsModel Performance

PSA 謠言檢測(cè)——《Probing Spurious Correlations in Popular Event-Based Rumor Detection Benchmarks》

文章插圖
我們觀察到 , MeanText 在 Twitter15 和 Twitter16 上優(yōu)于現(xiàn)有方法 , 而 RootText 的準(zhǔn)確率僅比 PHEME 上的最佳基線低 0.6% 。由于 PHEME 對(duì)每個(gè)微博獨(dú)立貼標(biāo)簽 , 源帖子將包含最獨(dú)特的特征 。
Effffectiveness of PSA我們提出的PSA方法 , 將 AGGR 實(shí)現(xiàn)為 SUM 或 MEAN , 顯著增強(qiáng)了 RootText 和 MEAN 基分類器 。最佳的 PSA 組合比最佳基線表現(xiàn)更好;它們?cè)?Twitter15 上的事件分離謠言檢測(cè)準(zhǔn)確率提高了19.00% , 在 Twitter 16 上提高了 20.61% , 在 PHEME 上提高了 2.94% 。與現(xiàn)有的方法不同 , PSA 顯式地從多個(gè)事件中聚合了發(fā)布者風(fēng)格的特性 , 從而增強(qiáng)了模型學(xué)習(xí)事件不變特征的能力 。因此 , PSA能夠捕捉到與獨(dú)特的出版商特征相關(guān)的立場(chǎng)和風(fēng)格 , 從而導(dǎo)致實(shí)質(zhì)性的性能改進(jìn) 。
Early Rumor Detection
PSA 謠言檢測(cè)——《Probing Spurious Correlations in Popular Event-Based Rumor Detection Benchmarks》

文章插圖
即使只有最早的 10% 的評(píng)論 , PSA 在 Twitter15 上達(dá)到 57.53% , 在 Twitter 16 上達(dá)到60.65% , 在 PHEME 上達(dá)到46.30% 。請(qǐng)注意 , RootText(+PSA)模型在所有截止日期內(nèi)都保持了穩(wěn)定的性能 , 因?yàn)樗鼈儍H基于源帖子提供即時(shí)預(yù)測(cè) 。結(jié)果表明 , 用 publisher style representations 的表示來增強(qiáng)謠言檢測(cè)模型 , 達(dá)到了效率和有效性 。
Cross-Dataset Rumor Detection為了研究 PSA 的泛化能力 , 在 Twitter15 和 Wwitter16 上進(jìn)行了跨數(shù)據(jù)集實(shí)驗(yàn) , 其中模型在一個(gè)數(shù)據(jù)集上進(jìn)行訓(xùn)練 , 在另一個(gè)數(shù)據(jù)集上進(jìn)行測(cè)試 。為了進(jìn)行公平的比較 , 我們使用了相同的事件分離數(shù)據(jù)分割 。如果來自數(shù)據(jù)集 $A$ 的訓(xùn)練集和來自數(shù)據(jù)集 $B$ 的測(cè)試集之間存在重疊事件 , 我們將刪除訓(xùn)練集中與這些事件相關(guān)的所有實(shí)例 , 并將它們替換為從 $A$ 的測(cè)試集中隨機(jī)抽樣的相同數(shù)量的非重疊實(shí)例 。
跨數(shù)據(jù)集設(shè)置本質(zhì)上更具挑戰(zhàn)性 , 因?yàn)橛?xùn)練和測(cè)試事件源于不同的時(shí)間框架 , 這可以產(chǎn)生時(shí)間概念的轉(zhuǎn)移 。然而 , 表3顯示 , PSA 在 Twitter15上的基礎(chǔ)分類器 , 在Twitter16上分別提高了12.82% , 這進(jìn)一步證明了PSA對(duì)未知事件的通用性 。
PSA 謠言檢測(cè)——《Probing Spurious Correlations in Popular Event-Based Rumor Detection Benchmarks》

文章插圖
6 Conclusion在本文中 , 我們系統(tǒng)地分析了基于事件的數(shù)據(jù)收集方案如何在社交媒體謠言檢測(cè)基準(zhǔn)數(shù)據(jù)集中創(chuàng)建特定于事件和源的虛假相關(guān)性 。我們研究了事件分離謠言檢測(cè)去除事件特定相關(guān)性的任務(wù) , 并通過實(shí)證證明了現(xiàn)有方法的泛化能力的嚴(yán)重局限性 。為了更好地解決這一任務(wù) , 我們建議PSA使用聚合的發(fā)布者風(fēng)格的特性來增強(qiáng)微博表示 。在三個(gè)真實(shí)數(shù)據(jù)集上進(jìn)行的廣泛實(shí)驗(yàn)表明 , 在交叉事件、跨數(shù)據(jù)集和早期謠言檢測(cè)方面有了實(shí)質(zhì)性的改進(jìn) 。

經(jīng)驗(yàn)總結(jié)擴(kuò)展閱讀