Processing math: 6%
  • 中国精品科技期刊
  • CCF推荐A类中文期刊
  • 计算领域高质量科技期刊T1类
高级检索

基于事件驱动的超图卷积网络的谣言检测方法

曾智, 赵书庆, 刘欢, 赵翔, 罗敏楠

曾智, 赵书庆, 刘欢, 赵翔, 罗敏楠. 基于事件驱动的超图卷积网络的谣言检测方法[J]. 计算机研究与发展, 2024, 61(8): 1982-1992. DOI: 10.7544/issn1000-1239.202440136
引用本文: 曾智, 赵书庆, 刘欢, 赵翔, 罗敏楠. 基于事件驱动的超图卷积网络的谣言检测方法[J]. 计算机研究与发展, 2024, 61(8): 1982-1992. DOI: 10.7544/issn1000-1239.202440136
Zeng Zhi, Zhao Shuqing, Liu Huan, Zhao Xiang, Luo Minnan. Event-Driven Hypergraph Convolutional Network Based Rumor Detection Method[J]. Journal of Computer Research and Development, 2024, 61(8): 1982-1992. DOI: 10.7544/issn1000-1239.202440136
Citation: Zeng Zhi, Zhao Shuqing, Liu Huan, Zhao Xiang, Luo Minnan. Event-Driven Hypergraph Convolutional Network Based Rumor Detection Method[J]. Journal of Computer Research and Development, 2024, 61(8): 1982-1992. DOI: 10.7544/issn1000-1239.202440136

基于事件驱动的超图卷积网络的谣言检测方法

基金项目: 国家重点研发计划项目(2022YFB3102600);国家自然科学基金项目(62192781, 62272374, 62202367, 62250009, 62137002);陕西省自然科学基金项目(2024JC-JCQN-62);中国工程科学技术知识中心项目及中国工程院项目 “基于矢量的矢量计算方法研究”;中国工程科学技术知识中心项目及中国工程院项目“MOOC中国“一带一路”培训线上线下混合教育服务系统”;王宽诚教育基金
详细信息
    作者简介:

    曾智: 1998年生. 博士研究生. 主要研究方向为图学习、可解释深度学习

    赵书庆: 2001年生. 硕士研究生. 主要研究方向为图学习、可解释深度学习

    刘欢: 1990年生. 博士,助理教授. 主要研究方向为机器学习、计算机视觉以及网络舆情分析

    赵翔: 1986年生. 博士,教授. 主要研究方向为图数据管理与挖掘、智能分析

    罗敏楠: 1984年生. 教授,博士生导师. 主要研究方向为机器学习、图学习、跨媒体数据挖掘

    通讯作者:

    罗敏楠(minnluo@xjtu.edu.cn

  • 中图分类号: TP391

Event-Driven Hypergraph Convolutional Network Based Rumor Detection Method

Funds: This work was supported the National Key Research and Development Program of China (2022YFB3102600), the National Natural Science Foundation of China (62192781, 62272374, 62202367, 62250009, 62137002), the Natural Science Foundation of Shaanxi Province (2024JC-JCQN-62), the Project of China Knowledge Center for Engineering Science and Technology, the Project of Chinese academy of engineering “The Online and Offline Mixed Educational Service System for ‘The Belt and Road’ Training in MOOC China”, and the K. C. Wong Education Foundation.
More Information
    Author Bio:

    Zeng Zhi: born in 1998. PhD candidate. His main research interests include graph learning and explainable deep learning

    Zhao Shuqing: born in 2001. Master candidate. His main research interests include graph learning and explainable deep learning

    Liu Huan: born in 1990. PhD, assistant professor. His main research interests include machine learning, and computer vision and public opinion analysis

    Zhao Xiang: born in 1986. PhD, professor. His main research interests include graph data management and mining, and intelligent analytics

    Luo Minnan: born in 1984. Professor, PhD supervisor. Her main research interests include machine learning, graph learning, and cross-media data mining

  • 摘要:

    依靠社交平台谣言传播链检测谣言是社交网络分析研究中的一个重要课题. 但以往的研究大多将这个任务过度简化为依靠评论的传播链检测谣言,忽略了对现实世界新闻帖的复杂用户和事件交互的关注,难以捕捉到这些信息提供的潜在检测线索. 针对该挑战,提出了一个事件驱动的超图卷积网络(event-driven hypergraph convolutional network,EHGCN),首次尝试将新闻、用户和事件建模在一个统一的超图卷积网络之中,以提升谣言检测性能. 具体而言,基于用户的中心网络构建同质用户圈,以增强用户感知的谣言检测. 此外,EHGCN联合利用事件内的主事件和子事件关联以及事件间的不一致性关联来进行谣言检测. 在3个真实世界的数据集上进行的实验结果验证了EHGCN相较于现有方法在谣言检测方面的优势. 研究也证实EHGCN可以通过获取丰富的用户社交圈和事件信息,在谣言传播早期及时发现谣言.

    Abstract:

    Rumor detection with propagation chain remains an important topic in the research of social network analysis. Previous studies mostly oversimplify this task as detecting rumor in propagation chains of comments. However, real-world news posts usually share complex user and event interactions, which can provide potential detection clues. Therefore, we propose an event-driven HyperGraph convolutional network (EHGCN), which makes the first attempt to model news, user and event correlations into a unified hypergraph convolutional network for rumor detection. Specifically, it exploits egocentric network of users to construct homogeneous users circles for enhancing user-aware rumor verification. Moreover, EHGCN jointly leverages the main event and sub-event patterns at the intra-event level for rumor detection. The extensive experimental results show that EHGCN could improve the performance of rumor detection. Studies also confirm that EHGCN can detect rumors at an early stage by acquiring rich user circle and event information.

  • 随着信息化时代的到来,人们更倾向于在各种新媒体平台上浏览新闻,由此社交网络成为新闻传播的重要渠道,尤其是与热点事件相关的新闻帖子,其传播速度快、影响范围广,极大地改变了信息的流动方式. 然而,这种传播方式导致关于同一事件的不同新闻帖子往往在新闻真实性上存在较大差异,特别是在国际政治事件和公共卫生危机等关键时期[1-2],这种差异尤为突出,不准确的新闻帖子和谣言不仅会迅速扩散,还可能对公众认知和国际政治局势产生深远影响. 以2016年美国总统选举为例[1],前20位谣言故事的转发量和用户评论明显多于真实新闻故事,严重扭曲了公众的信息接收和判断. 类似地,新冠肺炎疫情期间[3],各种谣言和不实信息在社交媒体上的广泛传播严重阻碍了疫情防控措施的执行和公共秩序的维护. 因此,在社交媒体上及时检测具有事件相关性的谣言对于保护公众免受误导以及维护社会稳定具有重要意义.

    早期的社交媒体新闻大多以文本形式存在,基于文本的深度学习方法,如卷积神经网络(convolutional neural network,CNN)[4]、循环神经网络(recurrent neural network,RNN)[5]和预训练语言模型(language model,LM)[6]可以有效地提取关键文本特征以检测谣言. 然而,随着谣言制造者开始模仿真实新闻来源,仅依赖文本内容的检测方法显得力不从心[7]. 因此,研究者开始从社会学的角度出发,设计了基于图神经网络(graph neural network,GNN)模型来捕捉新闻相关的社会语境信息,这些信息有助于揭示谣言的传播机制. 特别地,对话图[7-8]和传播图[9-11]的应用可以分别捕捉新闻回复和传播结构,从而增强检测性能. 进一步地,随着对社交网络更深入地研究,研究者[12-13]开始考虑用户在谣言检测中的作用,并基于此构建了更加完整的社交网络来提升谣言检测性能.

    尽管文献[4-13]方法在谣言检测方面取得了初步的成功,但还未充分利用社交网络中的丰富信息,特别是忽略了2个关键问题:

    1) 复杂事件关联. 随着社交网络的日益完整,复杂的事件关联模式使得谣言建模更具挑战性. 传统的一对一新闻—事件关联建模变得低效,因为一对一的新闻—事件关联在事件内层面可能是不充分的. 例如,如图1(a)所示,在一个主题事件下,一个新闻帖子可能同属于一个主事件和一个子事件[14]. 同时,在事件间层面,主事件和子事件的新闻可能存在不同程度的虚假相关性,其中主事件报道了在Ferguson发生的枪击案后的相关帖子,其中包括谣言和非谣言. 而子事件报道了在Ferguson发生的枪击案后Walmart的相关行为,与之相关的都是谣言. 此外,由于事件的快速爆炸和及时标注过程的高昂成本,亟需一种无监督的事件标注方法,这加剧了捕捉复杂事件关联的困难.

    图  1  在Twitter15数据集上的2个示例
    Figure  1.  Two examples on Twitter15 dataset

    2) 社交用户关联. 在图1(b)中,谣言的传播往往起始于一个较小的、内容相似的社交用户圈,之后才广泛扩散至整个社交网络. 例如,在卡瓦诺听证会事件中,谣言首先在一个同质社交圈内迭代出几个不同的内容版本,然后在社交网络中广泛传播[15]. 当前方法倾向于分析更为庞大的用户关系网络,而忽略了这些同质社交圈的初始演化过程,而这恰恰是捕捉社交网络的用户感知和谣言传播早期线索的关键.

    为了应对以上2个挑战,本文提出事件驱动超图卷积网络(event-driven hypergraph convolutional network,EHGCN),尝试将新闻、用户和事件建模在一个统一的超图卷积网络之中,以提升谣言检测性能. 具体而言:首先,以无监督方式利用事件实体建模主事件和子事件. 如图2所示,在一个事件超图中,一条超边代表不同事件实体,每条新闻帖子通过超边关联不同事件,以捕捉事件内部和事件之间互补或矛盾的信息. 然后,利用用户的自我中心网络构建同质用户圈,以增强用户角度感知的谣言检测. 此外,EHGCN还采用了超图卷积网络来探索不同事件之间的关联,利用事件内层面的主事件和子事件关联以及事件间的不一致关联来进行谣言检测. 大量实验结果表明,EHGCN可以提高谣言检测的性能. 研究还证实,EHGCN可以通过获取丰富的用户社交圈和事件信息在谣言传播早期及时发现谣言.

    图  2  图1(a)的超图建模示例
    Figure  2.  An example of a hypergraph modeling of Fig. 1(a)

    本文的主要贡献有3点:

    1)提出了一种新颖的事件驱动超图卷积网络,尝试将新闻、用户和事件建模在一个统一的超图卷积网络之中,以提升谣言检测性能;

    2)事件驱动超图卷积网利用了事件内的主事件和子事件关联以及事件间的不一致关联,这有助于在谣言检测早期获取更丰富的事件信息,从而及早发现谣言;

    3)在3个真实数据集上对EHGCN进行了评估,结果表明,EHGCN优于最先进的模型.

    早期社交媒体上的新闻往往以文本形式存在,其中不乏恶意篡改的内容,而基于文本的模型,如CNN[4],RNN[5]和LM[6]都可以有效地检测这些文本内容. 然而,随着谣言制造者开始模仿真实新闻来源,仅依赖文本内容的检测方法显得力不从心[7]. 基于图的社交网络特征被证实是有效的[7,16],许多研究者开始对谣言的图结构特征进行建模,如会话图[7-8]和传播图[9-11],并从社会学的角度解释谣言. Bian等人[16]提出了一种双向图卷积网络模型,用于学习自顶向下和自底向上传播图的高级表示,利用其对显性社会背景的强大拓扑感知建模能力来检测谣言. Lao等人[17]应用混合特征学习提取新闻与时间信息之间的相关性,进行谣言. 随着建模的社会关系网络越来越复杂,研究者引入异质图神经网络[10-11]和超图神经网络[18],Min等人[10]利用用户交互、发布、新闻关联等多种关系构建异质图神经网络,其设计旨在建模社交网络的复杂关系以检测谣言. Yuan等人[11]利用新闻内容、发布者和用户的发布和转发关系,构建异质图神经网络,共同优化谣言检测,提升其早期检测性能. 研究者发现用户在社交网络上起重要作用[12-13],Jeong等人[18]探索利用超图网络关联用户和新闻的模式. Peng等人[15]考虑用户社交圈对谣言传播的影响,整合用户社交圈和新闻传播链来构建更加完整的社交网络以提升谣言检测性能.

    本文提出的基于事件驱动超图卷积网络将社交网络中的新闻、用户和事件相关性进行建模,不仅完整地建模了用户中心的社交网络,也很大程度上捕捉了新闻和事件的复杂关联. 该方法可以根据事件内层面主事件和子事件的关联动态地建模新闻特征,也可以根据事件间的不一致关联进行相应的处理. 本文研究的独特之处在于:完整地考虑新闻传播链、用户同质社交圈和复杂事件关联,为谣言检测利用完整的社交网络建模.

    本节主要介绍事件驱动超图卷积网络在谣言检测中的相关概念的定义. 在详细描述谣言检测算法之前,我们先给出一些基本的符号解释和定义.

    定义1. 事件超图. 给定一个无向图GE={VE,H},其中VE是新闻传播子图Gt的集合,超边H={h1,,hk,,hK}表示主事件或子事件. H中事件hk由工具Texsmart [19]提取的实体E={e1,,el}构成,与普通图相比,超边hk可以连接多个新闻传播子图. 同时,超图是复杂社交网络中一对多新闻事件关联建模的合适结构. 当超边hk与一个新闻传播子图Gti连接时,事件超图邻接矩阵 {\boldsymbol A}_{ik}^{h}={\boldsymbol{1}} ,如图3所示.

    图  3  EHGCN示意图
    Figure  3.  Illustration of EHGCN

    定义2. 新闻传播子图. 给定一个无向图 {G}^{t}=\{{V}^{t},{E}^{t}\} ,其中 {V}^{t} 是新闻及其评论的节点集合, {E}^{t} {V}^{t} 的边集. {V}^{t}=\{{p}_{0},{p}_{1},… ,{p}_{n}\} ,其中 {p}_{0} 为新闻节点, {p}_{n} 为第 n 条评论, {\boldsymbol A}^{t} {G}^{t} 的邻接矩阵.

    定义3. 同质用户子图. 给定一个无向图 {G}^{u}=\{{V}^{u},{E}^{u}\} {V}^{u} 表示用户的节点集, {G}^{u} 中用户之间的关系构成边集 {E}^{u} {\boldsymbol A}^{u} {G}^{u} 的邻接矩阵.

    谣言检测任务被视为图分类任务. 其目标是训练一个模型 f(\cdot ) ,结合 {G}_{E} {G}^{t} {G}^{u} 的社会背景信息来预测 {G}^{t} 的标签. y\left({G}^{t}\right)=\{0,\mathrm{ }1,\mathrm{ }2,\mathrm{ }3\} 表示分类标签,其中 y\left({G}^{t}\right)=\{0,\mathrm{ }1,\mathrm{ }2,\mathrm{ }3\} 分别表示 {G}^{t} 为真谣言(true rumor,TR)、假谣言(false rumor,FR)、未核实谣言(unverified rumor,UR)和非谣言(non-rumor,NR).

    本节详细介绍如何将新闻、用户和事件建模到一个统一的超图卷积网络中,从而提高谣言检测的性能. 整体框架如图3所示,由4个主要步骤组成:新闻传播子图构建、同质用户子图构建、事件超图构建络和谣言检测. EHGCN首先将新闻、用户和事件构建成事件驱动超图,将新闻传播子图和同质用户子图结合起来. 此外,还采用了事件间卷积网络策略探索不同事件间的关联,并捕捉其不一致关联,从而进行谣言分类.

    新闻的传播结构由评论回复关系构成. 对于新闻传播子图 {G}^{t} ,本文遵循之前的研究设置[16],使用 {\boldsymbol X}_{t} {\boldsymbol A}^{t} 分别作为其特征矩阵( {\boldsymbol X}_{t}^{0}={\boldsymbol X}_{t} )和邻接矩阵. 使用图卷积网络从新闻传播子图中评论的不同反馈中捕获新闻与评论的文本相关性,以增强其特征,其计算过程为:

    {\boldsymbol X}_{t}^{l}=\sigma \left({\boldsymbol W}_{t}{\hat{\boldsymbol A}^{t}}{\boldsymbol X}_{t}^{\left(l-1\right)}\oplus {{\boldsymbol X}_{t}}^{\left(l-1\right)}+{\boldsymbol b}_{t}\right)\text{,} (1)

    其中,\oplus 是拼接操作, {{\boldsymbol X}_{t}}^{\left(l-1\right)} 是由第 l-1 层图卷积网络计算的隐藏特征, \sigma \left(\cdot \right) 代表ReLU激活函数, {\boldsymbol W}_{t} {\boldsymbol b}_{t} 表示可学习的权重参数, {\hat{\boldsymbol A}^{t}} 表示归一化对称邻接矩阵. {\hat{\boldsymbol A}^{t}} 定义为:

    {\hat{\boldsymbol A}^{t}}={\widetilde {\boldsymbol D}}^{-1/2}{\widetilde {\boldsymbol A}}^{t}{\widetilde {\boldsymbol D}}^{-1/2}\text{,} (2)

    其中, {\widetilde {\boldsymbol A}}^{t}={\boldsymbol A}^{t}+{\boldsymbol I}_{N} {\boldsymbol I}_{N} 是自连接操作). {\widetilde {\boldsymbol D}}_{ii}=\displaystyle\sum _{j}{\widetilde {\boldsymbol D}}_{ij} 表示第 i 个节点的度数.

    新闻传播子图的子图级别特征学习整个新闻传播过程的动态演化和评论信息传递,其计算过程通过均值池化操作聚合得到,新闻传播子图的特征 {\boldsymbol S}^{t} 计算过程可以表示为:

    {\boldsymbol S}^{t}={mean}\left({\boldsymbol X}_{t}^{l}\right). (3)

    现有的研究者构建庞大的用户关系网络以利用用户关键促进谣言检测. 然而,收集完整的用户关系网络是复杂且昂贵的. 同质用户圈被证实是利用用户信息进行谣言验证的有效方法[15]. 因此,本文利用具有相似兴趣和行为的用户构建同质用户圈,以促进谣言检测.

    本节的目标是挖掘用户的兴趣、交流和相关关系,发现同质性较高的用户圈. 研究表明,具有相似兴趣的用户可能会在相似主题下发布推文[15]. 然而,社交媒体上的推文通常很短,无法很好地分析其主题和情绪. 因此,将用户的整个推文集合组合成一个大的文本文档. 然后,利用改进的LDA[20]模型获取用户主题矩阵 {\boldsymbol{UT}} ,并使用杰森-香农散度[21]获取 {u}_{i} {u}_{j} 之间的用户兴趣相似度 {s}_{ij}^{\rm I} ,其计算过程可以表示为:

    {s}_{ij}^{\rm I}=\dfrac{1}{\sqrt{JS D\left(i,j\right)}}\text{,} (4)

    其中, JS D\left(i,j\right) 表示杰森-香农散度的计算过程,它衡量 U{T}_{i} U{T}_{j} 之间的分歧,可以形式化为:

    JS D\left(i,j\right)=\dfrac{1}{2\left({\boldsymbol D}_{\rm KL}\right(U{T}_{i}\left)\|M\right)+\left({\boldsymbol D}_{\rm KL}\right(U{T}_{j}\left)\|M\right)}\text{,} (5)

    其中, M=\dfrac{1}{2\left(U{T}_{i}+U{T}_{j}\right)} {\boldsymbol D}_{\rm KL} 表示Kullback-Leibler 散度. 现有研究发现[15],同质性较高的用户经常转发或互相提及. 我们用 {u}_{i} {u}_{j} 之间的交流频率 {s}_{ij}^{\rm C} 来表示其交流相关性,其计算过程为:

    {s}_{ij}^{\rm C}=\dfrac{\left|{R}_{i}\right|+\left|{R}_{j}\right|}{\sqrt{\left|{R}_{i}\|{R}_{j}\right|}}+\dfrac{{r}_{ij}+{r}_{ji}}{\left|{R}_{i}\|{R}_{j}\right|}\text{,} (6)

    其中, {r}_{ij} 表示用户 {u}_{i} 转发或提及 {u}_{j}\left|{R}_{i}\right| 表示被 {u}_{i} 转发和提及的用户数量. 同时,朋友和关注者的重叠关系在挖掘同质用户圈方面也发挥着重要作用. {u}_{i} {u}_{j} 之间重叠的朋友和关注者表示为 {s}_{ij}^{\rm O} ,其计算过程为:

    {s}_{ij}^{\rm O}=\dfrac{\left|{\boldsymbol S}_{ \rm friend}\right|}{\sqrt{\left|{F}_{i}\|{F}_{j}\right|}}+\dfrac{\left|{\boldsymbol S}_{ \rm follower}\right|}{\left|{F}_{i}\|{F}_{j}\right|} \text{,} (7)

    其中, \left|{\boldsymbol S}_{ \rm friend}\right| \left|{\boldsymbol S}_{ \rm follower}\right| 分别表示2个用户的共同好友数量和关注者的数量, \left|{F}_{i}\right| \left|{F}_{j}\right| 分别表示 {u}_{i} 关注的用户数量和 {u}_{j} 关注的用户数量.

    {s}_{ij}^{\rm O} {s}_{ij}^{\rm C} {s}_{ij}^{\rm I} 组合为 {s}_{ij}={s}_{ij}^{\rm O}+{s}_{ij}^{\rm C}+{s}_{ij}^{\rm I} ,其中 {s}_{ij} 可以作为评估用户同质性的有效指标. 然后使用聚类方法以 {u}_{i} 为聚类中心,得到一级邻居节点集 N\left({u}_{i}\right)= \{{u}_{1},{u}_{2},… ,{u}_{j} \} . 然后,遵循上述过程,以 {u}_{j} 为聚类中心,得到二级邻居节点集 N\left({u}_{j}\right)=\left\{{u}_{1},{u}_{2},… ,{u}_{k}\right\} . 上述过程得到的两级社交圈 {G}^{u} 作为同质用户子图,其中 {\boldsymbol A}^{u} {G}^{u} 的邻接矩阵. 然后,我们应用图卷积网络挖掘同质用户子图中的用户与邻居关联,其计算过程为:

    {\boldsymbol X}_{u}^{l}=\sigma \left({\boldsymbol W}_{u}{\hat{\boldsymbol A}^{u}}{\boldsymbol X}_{u}^{\left(l-1\right)}\oplus{\boldsymbol X}_{u}^{\left(l-1\right)}+{\boldsymbol b}_{u}\right)\text{,} (8)

    其中, \oplus 是拼接操作,{\boldsymbol X}_{u}^{\left(l-1\right)} 是由 l-1 层图卷积网络计算的隐藏特征, \sigma \left(\cdot \right) 代表ReLU激活函数, {\boldsymbol W}_{u} {\boldsymbol b}_{u} 是可训练参数, {\hat{\boldsymbol A}^{u}} 表示归一化对称邻接矩阵. {\hat{\boldsymbol A}^{u}} 计算过程定义为:

    {\widetilde {\boldsymbol A}}^{u}={\widetilde {\boldsymbol D}}^{-1/2}{\widetilde {\boldsymbol A}}^{u}{\widetilde {\boldsymbol D}}^{-1/2} \text{,} (9)

    其中, {\hat{\boldsymbol A}^{u}}={\boldsymbol A}^{u}+{\boldsymbol I}_{N} {\boldsymbol I}_{N} 是自连接操作), {\widetilde {\boldsymbol D}}_{ii}=\displaystyle\sum _{j}{\widetilde {\boldsymbol D}}_{ij} 表示第 i 个节点的度数.

    同质用户子图的子图级别特征学习以目标用户为中心的两级社交圈的用户信息,通过对 {\boldsymbol X}_{u}^{l} 进行均值池化的聚合操作得到,其计算过程可以表示为:

    {\boldsymbol S}^{u}={mean}\left({\boldsymbol X}_{u}^{l}\right). (10)

    与传统的一对一新闻事件构造方法不同,现实世界的话题事件往往属于多个事件,例如主事件和子事件. 已有的研究验证了超图可以有效地利用社交媒体上的高阶交互,超图[22]是建模复杂社交网络上一对多新闻事件交互的合适结构.

    超图卷积网络可以捕获复杂的事件交互模式,可以对事件内级别的主事件和子事件关联以及事件间的不一致关联进行建模. 超图卷积运算主要关注3个方面:1)一条超边由一个事件表示,可以关联事件内级别的一致和不一致新闻;2)代表不同事件的超边可以关联同一新闻节点;3)具有更多连接的事件超边需要更多的传播. 因此,超边特征 {\boldsymbol S}^{e} 的计算过程可以表示为:

    \boldsymbol{S}^e=\boldsymbol{A}^h\boldsymbol{W}^h\boldsymbol{A}^{h\text{T}}\boldsymbol{S}^t, (11)

    其中, {\boldsymbol W}^{h} 代表可学习的权重参数, {\boldsymbol A}^{h} 代表超图邻接矩阵, {\boldsymbol S}^{t} 代表新闻传播子图的特征. 然而,堆叠多个超图卷积层可能会导致数值不稳定并增加梯度爆炸或消失的风险. 因此,EHGCN采用行归一化,其计算过程为:

    {\boldsymbol S}^{e}=\sigma \left({\boldsymbol D}^{-1}{\boldsymbol A}^{h}{\boldsymbol W}^{h}{\boldsymbol B}^{-1}{{\boldsymbol A}^{h}}^{\text{T}}{\boldsymbol S}^{t}\right)\text{,} (12)

    其中, \sigma \left(\cdot \right) 是ReLU激活函数, {\boldsymbol{D}} 代表节点的度矩阵, {\boldsymbol{B}} 代表超边的度矩阵.

    新闻的用户社交圈和事件信息可以为谣言检测提供额外的线索,因此,整合 {\boldsymbol S}^{t},{\boldsymbol S}^{u},{\boldsymbol S}^{e} 的图级别特征,即将 {G}^{t},{G}^{u} {G}^{e} 融合进行分类,其计算过程表示为:

    \hat{\boldsymbol y}=softmax\left({\boldsymbol W}_{0}\left({\boldsymbol S}^{t}\oplus {\boldsymbol S}^{u}\oplus {\boldsymbol S}^{e}\right)+{\boldsymbol b}_{0}\right)\text{,} (13)

    其中, \oplus 是拼接操作, {\boldsymbol W}_{0} {\boldsymbol b}_{0} 是可学习的参数, \sigma \left(\cdot \right) 代表ReLU激活函数, \hat{\boldsymbol y} 表示预测分数. 由于谣言检测是一个分类任务,在训练阶段使用交叉熵为损失函数:

    {L}_{\rm C}=\displaystyle\sum _{{\boldsymbol y}\in Y}-\boldsymbol y\mathrm{log}\left(\hat{\boldsymbol y}\right)-\left(1-\boldsymbol y\right)\mathrm{log}\left(1-\hat{\boldsymbol y}\right)\text{,} (14)

    其中, Y 是真实标签的集合. 上述训练过程可以使EHGCN学习事件内级别的主事件和子事件关联以及事件间的不一致关联,同时有效利用用户信息以进行社交网络上的谣言检测.

    本文使用3个谣言检测数据集广泛地评估了EHGCN模型,包括 Twitter15,Twitter16 [5]和 Pheme [23],它们中包含源新闻、用户圈、事件、对应评论和标签. Twitter数据集的原始标签包括4类,即TR,FR,UR和NR. Pheme 数据集的原始标签分为2类,TR和FR[23]. 表1描述了上述数据集的统计数据.

    表  1  数据集统计信息
    Table  1.  Statistics of the Datasets
    指标 Twitter15 Twitter16 Pheme
    # 源新闻 1458 818 3726
    # 用户圈 1458 818 0
    # 事件 83 56 85
    # 评论 331612 204820 67238
    # 真谣言 374 205 1863
    # 假谣言 370 205 1863
    # 未证实 374 203 0
    # 非谣言 372 205 0
    平均文本长度 15.84 15.87 17.79
    最大文本长度 136 383 78
    最小文本长度 2 2 2
    下载: 导出CSV 
    | 显示表格

    为了对 EHGCN 模型性能进行精准评估,采用了谣言检测任务中常见的评价指标对其检测性能进行评估,包括准确率、精确率、F1等常见的评价指标. 其分类结果混淆矩阵如表2所示.

    表  2  分类结果混淆矩阵
    Table  2.  Confusion Matrix of Classification Results
    预测类别
    正例 负例 总计
    正例 TP FN TP+FN
    负例 FP TN FP+TN
    总和 TP+FP FN+TN TP+FN+FP+TN
    注:TP表示真阳性,FN表示假阴性,FP表示假阳性,TN表示真阴性.
    下载: 导出CSV 
    | 显示表格

    准确率表示在所有分类的样本中,谣言检测中正确检测的正例和负例的数量在总体样本数的占比,其公式为:

    {准}{确}{率}=\dfrac{{T}{P}+{T}{N}}{{T}{P}+{F}{N}+{F}{P}+{T}{N}} . (15)

    {{F}}{1} 分数被定义为精确率和召回率的调和平均数,其公式为:

    {{F}}{1}=\dfrac{2\times \mathrm{精}\mathrm{确}\mathrm{率}\times \mathrm{召}\mathrm{回}\mathrm{率}}{\mathrm{精}\mathrm{确}\mathrm{率}+\mathrm{召}\mathrm{回}\mathrm{率}}\text{,} (16)

    其中,精确率和召回率的计算过程为:

    {精}{确}{率}=\dfrac{{T}{P}}{{T}{P}+{F}{P}}\text{,} (17)
    {召}{回}{率}=\dfrac{{T}{P}}{{T}{P}+{F}{N}} . (18)

    在EHGCN中,使用Adam作为优化器,Twitter15,Twitter16数据集上使用的学习率为5E–4,批大小为128,训练轮次为200,Pheme数据集上使用的学习率为5E–5,批大小为16,训练轮次为15,均采用早停策略. 对于用户圈,我们将每层的最大节点数设置为60. Twitter15和Twitter16数据集上的五折交叉验证划分和特征初始化遵循[16]使用五折交叉验证进行评估,评估指标包括总体准确率和4个类别上的F1分数. 由于Pheme数据集没有用户信息,其五折交叉验证划分和特征初始化遵循[24]使用五折交叉验证进行评估,评估指标包括准确率[25]和2个类别上的精确率[26]F1分数[27]. 并且本文进行了多次重复实验,并汇报多次重复实验的平均值和标准差.

    1)SVM-TK[7]. 一种支持向量机分类器,利用基于谣言传播结构的传播树核(tree kernel)进行谣言检测.

    2)RvNN[5]. 一种基于树状结构的谣言检测分类器,一种自上而下和自下而上的模型,从不同角度探索谣言传播图的结构特征.

    3) PRC[28]. 基于RNN和CNN的时间序列分类器,捕获用户沿传播图的全局和局部演化来检测谣言.

    4) BiGCN[16]. 基于自上而下和自下而上2种传播结构,利用自上而下和自下而上的有向图卷积神经网络模拟谣言的传播与扩散特性以进行谣言检测.

    5) UDGCN[16]. 采用无向图卷积神经网络进行谣言检测,利用根节点增强策略提高检测性能.

    6) GACL[29]. 该模型利用图对比学习捕获相同实例之间的共性,并引入对抗性特征变换以消除噪声和对抗性信息的影响,以提高谣言检测的鲁棒性.

    7) RDMSC[15]. 该模型结合新闻传播图和用户图来提高谣言检测的性能.

    在本文研究中,进行比较实验来验证EHGCN的性能. EHGCN和对比模型在Twitter15,Twitter16和Pheme数据集上的检测性能分别如表3~5所示.在3个真实世界数据集上,EHGCN整体取得了最好的检测性能.

    表  3  各方法在Twitter15数据集上的实验结果
    Table  3.  Experimental Results of Different Methods on Twitter15 Dataset
    方法 准确率 F1
    FR TR UR NR
    SVM-TK 0.667 0.669 0.772 0.645 0.619
    RvNN 0.723 0.758 0.821 0.654 0.682
    PRC 0.842 0.875 0.790 0.818 0.811
    BiGCN 0.817±0.0024 0.828±0.0093 0.8849±0.0058 0.785±0.0100 0.774±0.0097
    UDGCN 0.810±0.0035 0.820±0.0074 0.878±0.0040 0.782±0.0173 0.763±0.0067
    GACL 0.840±0.0070 0.780±0.0129 0.831±0.0118 0.797±0.0134 0.933±0.0023
    RDMSC 0.865±0.0031 0.863±0.0040 0.886±0.0054 0.831±0.0063 0.881±0.0062
    EHGCN 0.872±0.0006(↑0.7%) 0.867±0.0030(↑0.4%) 0.892±0.0073(↑0.6%) 0.837±0.0037(↑0.6%) 0.891±0.0041(↓4.2%)
    注:黑体数值表示最优值,下划线数值表示次优值,箭头标出相对于次优或最优数值提升或下降的百分比;“±”后的数值表示重复实验的标准差.
    下载: 导出CSV 
    | 显示表格
    表  4  各方法在Twitter16数据集上的实验结果
    Table  4.  Experimental Results of Different Methods on Twitter16 Dataset
    方法 准确率 F1
    FR TR UR NR
    SVM-TK 0.662 0.623 0.783 0.655 0.643
    RvNN 0.737 0.743 0.835 0.708 0.662
    PRC 0.863 0.898 0.837 0.843 0.820
    BiGCN 0.833±0.0057 0.830±0.0110 0.910±0.0107 0.836±0.0088 0.759±0.0165
    UDGCN 0.835±0.0046 0.833±0.0095 0.911±0.0061 0.838±0.0048 0.756±0.0081
    GACL 0.822±0.0082 0.675±0.0248 0.898±0.0064 0.838±0.0112 0.839±0.0162
    RDMSC 0.878±0.0041 0.849±0.0049 0.920±0.0067 0.884±0.0061 0.860±0.0071
    EHGCN 0.894±0.0019(↑1.6%) 0.871±0.0046(↑2.2%) 0.928±0.0041(↑0.8%) 0.905±0.0058(↑2.1%) 0.873±0.0082(↑1.3%)
    注:黑体数值表示最优值,下划线数值表示次优值,箭头标出相对于次优或最优数值提升或下降的百分比;“±”后的数值表示重复实验的标准差.
    下载: 导出CSV 
    | 显示表格
    表  5  各方法在Pheme数据集上的实验结果
    Table  5.  Experimental Results of Different Methods on Pheme Dataset
    方法 准确率 精确率 F1
    FR TR FR TR
    RvNN 0.704 0.673 0.778 0.734 0.657
    GACL 0.820 0.846 0.819 0.827 0.834
    BiGCN 0.758±0.0026 0.768±0.0036 0.750±0.0058 0.754±0.0043 0.762±0.0023
    UDGCN 0.759±0.0017 0.756±0.0064 0.762±0.0089 0.760±0.0046 0.757±0.0030
    EHGCN 0.863±0.0029(↑4.3%) 0.874±0.0040(↑2.8%) 0.853±0.0032(↑3.4%) 0.861±0.0030(↑3.4%) 0.865±0.0029(↑3.1%)
    注:黑体数值表示最优值,下划线数值表示次优值,箭头标出相对于次优或最优数值提升或下降的百分比;“±”后的数值表示重复实验的标准差.
    下载: 导出CSV 
    | 显示表格

    在基于内容的方法中,基于深度学习的方法,例如 RvNN,优于机器学习方法 SVM-TK. 这证实了深度学习方法强大的特征提取能力对于谣言检测的重要性. 基于图的谣言检测方法,例如 BiGCN和 UDGCN,通常优于不使用图基准方法SVM-TK. 这证实了探索新闻传播结构并通过图卷积网络提取高阶图表征以实现稳健谣言检测的重要性. GACL采用图对比学习进行鲁棒谣言检测. EHGCN在所有3个数据集上都优于GACL,这提供了证据,表明我们利用事件内和事件间关联的事件驱动超图卷积网络更加稳健.

    随着社交网络的日益复杂,多种方法(如PRC和RDMSC)利用更全面的用户和新闻建模能力,以高效地检测谣言. 而EHGCN将新闻、用户和事件关联到一个统一的框架中,这提供了充分利用社交网络上的多重线索以提高谣言检测性能的可能性.

    本文设计了3个消融实验评估 EHGCN 中组件的有效性. 具体而言,设计了3个去除模块的变体模型. –NPG:删除新闻传播子图的评论节点;–UHG:删除了同质用户子图的建模过程;–HGCL:删除了超图卷积网络的建模过程.

    1)新闻传播子图的重要性. 为了评估利用新闻传播子图的有效性,删除了新闻传播子图的建模过程,并将变体模型-NPG与EHGCN进行比较. 表6~8的结果表明,删除新闻传播子图会导致性能下降. 因此,新闻传播过程中的评论在谣言检测过程中是具有重要价值的.

    表  6  在Twitter15数据集上的消融实验结果
    Table  6.  Ablation Experimental Results on Twitter15 Dataset
    方法 准确率 F1
    FR TR UR NR
    –NPG 0.854±0.0028 0.849±0.0064 0.882±0.0075 0.815±0.0055 0.870±0.0056
    –UHG 0.846±0.0029 0.844±0.0052 0.890±0.0010 0.817±0.0039 0.831±0.0075
    –HGCL 0.866±0.0037 0.861±0.0042 0.888±0.0037 0.834±0.0071 0.883±0.0047
    EHGCN 0.872±0.0006 0.867±0.0030 0.892±0.0073 0.837±0.0037 0.891±0.0041
    注:“±”后的数值表示重复实验的标准差.
    下载: 导出CSV 
    | 显示表格
    表  7  在Twitter16数据集上的消融实验结果
    Table  7.  Ablation Experimental Results on Twitter16 Dataset
    方法 准确率 F1
    FR TR UR NR
    –NPG 0.882±0.0060 0.855±0.0101 0.920±0.0044 0.887±0.0126 0.866±0.0052
    –UHG 0.869±0.0058 0.868±0.0043 0.932±0.0029 0.865±0.0087 0.812±0.0085
    –HGCL 0.884±0.0019 0.860±0.0069 0.924±0.0049 0.890±0.0067 0.863±0.0057
    EHGCN 0.894±0.0019 0.871±0.0046 0.928±0.0041 0.905±0.0058 0.873±0.0082
    注:“±”后的数值表示重复实验的标准差.
    下载: 导出CSV 
    | 显示表格
    表  8  在Pheme数据集上的消融实验结果
    Table  8.  Ablation Experimental Results on Pheme Dataset
    方法 准确率 精确率 F1
    FR TR FR TR
    –NPG0.859±0.00280.874±0.00150.846±0.00550.856±0.00330.862±0.0023
    –HGCL0.859±0.00430.871±0.00840.847±0.00720.856±0.00460.861±0.0044
    EHGCN0.863±0.00290.874±0.00400.853±0.00320.861±0.00300.865±0.0029
    注:“±”后的数值表示重复实验的标准差.
    下载: 导出CSV 
    | 显示表格

    2)同质用户子图的重要性. 为了研究同质用户子图的重要性,删除模型建模过程中同质用户子图的建模. 表6~8中的结果表明,EHGCN优于变体模型-UHG,验证了同质用户子图的有效性,其原因是同质用户子图能够挖掘用户同质社交圈的有效信息.

    3)超图卷积网络的重要性. 为了探索建模新闻与事件关联在检测谣言过程中的影响,删除了超图卷积网络. 表6~8的结果证明,删除超图卷积网络会影响模型性能. 这也验证了超图卷积网络策略可以指导EHGCN 学习事件内级别的主事件和子事件关联以及事件间的不一致关联以促进提升谣言检测性能.

    为了探究参数学习率(learning rate,lr)和批大小(batchsize)的选择在模型性能方面的作用,在Twitter15,Twitter16和Pheme数据集上,选取不同lr和batch size的值,其模型性能的变化如图4所示.

    图  4  参数分析实验结果
    Figure  4.  Experimental results of parameter analysis

    图4中,我们观察到EHGCN的总体性能在大多数情况下都与lr和batchsize密切相关. 这进一步表明,在检测谣言时考虑合适大小的lr和batchsize是有益的. 在Twitter15,Twitter16数据集上使用的学习率为5E–4,批大小为128;以及在Pheme数据集上使用的学习率为5E–5,批大小为16时取得了最佳性能. 这是由于数据集的规模和不同实际训练过程中占用内存导致的. 在实际应用中,可以选择最优的lr和batchsize值适配不同的数据集和服务器,以提高谣言检测性能.

    在传播早期及时发现谣言对于谣言检测任务至关重要,因为随着谣言传播时间的延长,人们更加相信谣言. 在此任务中,选择不同时刻的新闻帖及其相关评论来评估EHGCN和其他模型的性能.

    图5显示了EHGCN 和其他模型的早期检测性能. 我们观察到每个模型的性能都随着时间的增加而提高. 此外,在Twitter15,Twitter16和Pheme数据集上,2 h后谣言检测准确率超过0.82. 可以得出结论,相比于BiGCN,UDGCN,RDMSC, EHGCN在早期谣言检测中的任何时候都是更优越且稳定的. 这是因为丰富的社交圈和事件信息并不依赖于新闻传播,这使得EHGCN能够在早期分析新闻源头的用户社交圈和事件信息,从而进行谣言检测.

    图  5  早期检测实验结果
    Figure  5.  Experimental results in early detection

    在本节中,通过可视化EHGCN以无监督的方式建模事件特征以进行案例研究. 从Twitter15和Twitter16 数据集中随机选择了2个事件样本,使用t-SNE算法[30]将其在向量空间可视化. 可视化结果如图6所示,实验结果表明,使用EHGCN 可以很好地区分这些事件,同时EHGCN 以无监督的方式可以学习合理的事件特征来进行谣言检测.

    图  6  Twitter15和Twitter16数据集上的案例研究
    Figure  6.  Case study on Twitter15 and Twitter16 datasets

    本文提出了一种基于事件驱动的超图卷积网络(EHGCN),尝试将新闻、用户和事件建模到一个统一的超图卷积网络中,以提升谣言检测性能. EHGCN联合利用来自同质用户社交圈的信息和事件内以及事件间关联进行谣言检测. 大量实验结果表明EHGCN可以提高谣言检测的性能,而且具有在谣言传播的早期阶段进行有效检测的能力. 未来的研究将进一步探索子图线索的溯源技术和子图结构的因果关联分析,以便更深入地理解谣言的传播机制和提高检测的准确性.

    作者贡献声明:赵书庆负责完成实验并撰写论文;曾智提出了算法思路和实验方案并撰写论文;刘欢提出修改意见;赵翔针对论文进行了修改和指导;罗敏楠提出指导意见并修改论文. 曾智和赵书庆为共同一作.

  • 图  1   在Twitter15数据集上的2个示例

    Figure  1.   Two examples on Twitter15 dataset

    图  2   图1(a)的超图建模示例

    Figure  2.   An example of a hypergraph modeling of Fig. 1(a)

    图  3   EHGCN示意图

    Figure  3.   Illustration of EHGCN

    图  4   参数分析实验结果

    Figure  4.   Experimental results of parameter analysis

    图  5   早期检测实验结果

    Figure  5.   Experimental results in early detection

    图  6   Twitter15和Twitter16数据集上的案例研究

    Figure  6.   Case study on Twitter15 and Twitter16 datasets

    表  1   数据集统计信息

    Table  1   Statistics of the Datasets

    指标 Twitter15 Twitter16 Pheme
    # 源新闻 1458 818 3726
    # 用户圈 1458 818 0
    # 事件 83 56 85
    # 评论 331612 204820 67238
    # 真谣言 374 205 1863
    # 假谣言 370 205 1863
    # 未证实 374 203 0
    # 非谣言 372 205 0
    平均文本长度 15.84 15.87 17.79
    最大文本长度 136 383 78
    最小文本长度 2 2 2
    下载: 导出CSV

    表  2   分类结果混淆矩阵

    Table  2   Confusion Matrix of Classification Results

    预测类别
    正例 负例 总计
    正例 TP FN TP+FN
    负例 FP TN FP+TN
    总和 TP+FP FN+TN TP+FN+FP+TN
    注:TP表示真阳性,FN表示假阴性,FP表示假阳性,TN表示真阴性.
    下载: 导出CSV

    表  3   各方法在Twitter15数据集上的实验结果

    Table  3   Experimental Results of Different Methods on Twitter15 Dataset

    方法 准确率 F1
    FR TR UR NR
    SVM-TK 0.667 0.669 0.772 0.645 0.619
    RvNN 0.723 0.758 0.821 0.654 0.682
    PRC 0.842 0.875 0.790 0.818 0.811
    BiGCN 0.817±0.0024 0.828±0.0093 0.8849±0.0058 0.785±0.0100 0.774±0.0097
    UDGCN 0.810±0.0035 0.820±0.0074 0.878±0.0040 0.782±0.0173 0.763±0.0067
    GACL 0.840±0.0070 0.780±0.0129 0.831±0.0118 0.797±0.0134 0.933±0.0023
    RDMSC 0.865±0.0031 0.863±0.0040 0.886±0.0054 0.831±0.0063 0.881±0.0062
    EHGCN 0.872±0.0006(↑0.7%) 0.867±0.0030(↑0.4%) 0.892±0.0073(↑0.6%) 0.837±0.0037(↑0.6%) 0.891±0.0041(↓4.2%)
    注:黑体数值表示最优值,下划线数值表示次优值,箭头标出相对于次优或最优数值提升或下降的百分比;“±”后的数值表示重复实验的标准差.
    下载: 导出CSV

    表  4   各方法在Twitter16数据集上的实验结果

    Table  4   Experimental Results of Different Methods on Twitter16 Dataset

    方法 准确率 F1
    FR TR UR NR
    SVM-TK 0.662 0.623 0.783 0.655 0.643
    RvNN 0.737 0.743 0.835 0.708 0.662
    PRC 0.863 0.898 0.837 0.843 0.820
    BiGCN 0.833±0.0057 0.830±0.0110 0.910±0.0107 0.836±0.0088 0.759±0.0165
    UDGCN 0.835±0.0046 0.833±0.0095 0.911±0.0061 0.838±0.0048 0.756±0.0081
    GACL 0.822±0.0082 0.675±0.0248 0.898±0.0064 0.838±0.0112 0.839±0.0162
    RDMSC 0.878±0.0041 0.849±0.0049 0.920±0.0067 0.884±0.0061 0.860±0.0071
    EHGCN 0.894±0.0019(↑1.6%) 0.871±0.0046(↑2.2%) 0.928±0.0041(↑0.8%) 0.905±0.0058(↑2.1%) 0.873±0.0082(↑1.3%)
    注:黑体数值表示最优值,下划线数值表示次优值,箭头标出相对于次优或最优数值提升或下降的百分比;“±”后的数值表示重复实验的标准差.
    下载: 导出CSV

    表  5   各方法在Pheme数据集上的实验结果

    Table  5   Experimental Results of Different Methods on Pheme Dataset

    方法 准确率 精确率 F1
    FR TR FR TR
    RvNN 0.704 0.673 0.778 0.734 0.657
    GACL 0.820 0.846 0.819 0.827 0.834
    BiGCN 0.758±0.0026 0.768±0.0036 0.750±0.0058 0.754±0.0043 0.762±0.0023
    UDGCN 0.759±0.0017 0.756±0.0064 0.762±0.0089 0.760±0.0046 0.757±0.0030
    EHGCN 0.863±0.0029(↑4.3%) 0.874±0.0040(↑2.8%) 0.853±0.0032(↑3.4%) 0.861±0.0030(↑3.4%) 0.865±0.0029(↑3.1%)
    注:黑体数值表示最优值,下划线数值表示次优值,箭头标出相对于次优或最优数值提升或下降的百分比;“±”后的数值表示重复实验的标准差.
    下载: 导出CSV

    表  6   在Twitter15数据集上的消融实验结果

    Table  6   Ablation Experimental Results on Twitter15 Dataset

    方法 准确率 F1
    FR TR UR NR
    –NPG 0.854±0.0028 0.849±0.0064 0.882±0.0075 0.815±0.0055 0.870±0.0056
    –UHG 0.846±0.0029 0.844±0.0052 0.890±0.0010 0.817±0.0039 0.831±0.0075
    –HGCL 0.866±0.0037 0.861±0.0042 0.888±0.0037 0.834±0.0071 0.883±0.0047
    EHGCN 0.872±0.0006 0.867±0.0030 0.892±0.0073 0.837±0.0037 0.891±0.0041
    注:“±”后的数值表示重复实验的标准差.
    下载: 导出CSV

    表  7   在Twitter16数据集上的消融实验结果

    Table  7   Ablation Experimental Results on Twitter16 Dataset

    方法 准确率 F1
    FR TR UR NR
    –NPG 0.882±0.0060 0.855±0.0101 0.920±0.0044 0.887±0.0126 0.866±0.0052
    –UHG 0.869±0.0058 0.868±0.0043 0.932±0.0029 0.865±0.0087 0.812±0.0085
    –HGCL 0.884±0.0019 0.860±0.0069 0.924±0.0049 0.890±0.0067 0.863±0.0057
    EHGCN 0.894±0.0019 0.871±0.0046 0.928±0.0041 0.905±0.0058 0.873±0.0082
    注:“±”后的数值表示重复实验的标准差.
    下载: 导出CSV

    表  8   在Pheme数据集上的消融实验结果

    Table  8   Ablation Experimental Results on Pheme Dataset

    方法 准确率 精确率 F1
    FR TR FR TR
    –NPG0.859±0.00280.874±0.00150.846±0.00550.856±0.00330.862±0.0023
    –HGCL0.859±0.00430.871±0.00840.847±0.00720.856±0.00460.861±0.0044
    EHGCN0.863±0.00290.874±0.00400.853±0.00320.861±0.00300.865±0.0029
    注:“±”后的数值表示重复实验的标准差.
    下载: 导出CSV
  • [1]

    Conroy N K, Rubin V L, Chen Yimin. Automatic deception detection: Methods for finding fake news[C]//Proc of the Association for Information Science and Technology. New York: OpenReview. net, 2015: 1−4

    [2]

    Wu Lianwei, Liu Pusheng, Zhang Yanning. See how you read? multi-reading habits fusion reasoning for multi-modal fake news detection[C]//Proc of the AAAI Conf on Artificial Intelligence. Menlo Park, CA: AAAI, 2023: 13736−13744

    [3]

    Scott B J, Felix S, Howard P N. Types, sources, and claims of COVID−19 misinformation[D]. Wellington Square, Oxford: University of Oxford, 2020

    [4]

    Yu Feng, Liu Qiang, Wu Shu, et al. A convolutional approach for misinformation identification[C]// Proc of the 26th Int Joint Conf on Artificial Intelligence. Freiburg: IJCAI, 2017: 3901−3907

    [5]

    Ma Jing, Gao Wei, Wong K F. Rumor detection on Twitter with tree-structured recursive neural networks[C]//Proc of Association for Computational Linguistics: Stroudsburg, PA: ACL, 2018: 1980−1989

    [6]

    Rao Dongning, Miao Xin, Jiang Zhihua. STANKER: Stacking network based on level-grained attention-masked BERT for rumor detection on social media[C]//Proc of the 2021 Conf on Empirical Methods in Natural Language. Stroudsburg, PA: ACL, 2021: 3347−3363

    [7]

    Ma Jing, Gao Wei, Wong K F. Detect rumors in microblog posts using propagation structure via kernel learning[C]//Proc of Association for Computational Linguistics. Stroudsburg, PA: ACL, 2017: 708−717

    [8]

    Li Jiawen, Yudianto S, Kao H Y. Exploiting microblog conversation structures to detect rumors[C]//Proc of the 28th Int Conf on Computational Linguistics. Stroudsburg, PA: ACL, 2020: 5420−5429

    [9]

    Nguyen V H, Kazunari S, Preslav H , et al. Fang: Leveraging social context for fake news detection using graph representation[C]//Proc of the 29th ACM Int Conf on Information & Knowledge Management. New York: ACM, 2020: 1165−1174

    [10]

    Min E, Yu Rong, Bian Yata, et al. Divide-and-conquer: Post-user interaction network for fake news detection on social media[C]//Proc of the ACM Web Conf 2022. New York: ACM, 2022: 1148−1158

    [11]

    Yuan Chunyuan, Ma Qianwen, Zhou Wei, et al. Early detection of fake news by utilizing the credibility of news, publishers, and users based on weakly supervised learning[J]. arXiv preprint, arXiv: 2012.04233, 2020

    [12]

    Dou Yingtong, Shu Kai, Xia Congying, et al. User preference-aware fake news detection[C]//Proc of the 44th Int ACM SIGIR Conf on Research and Development in Information Retrieval. New York: ACM, 2021: 2051−2055

    [13]

    Ling M S K, Hai L C, Zhao Qian, et al. Interpretable rumor detection in microblogs by attending to user interactions[C]//Proc of the AAAI Conf on Artificial Intelligence. Palo Alto, CA, AAAI, 2020, 34(5): 8783−8790

    [14]

    Chen Xing, Wang Yuan, Liu Jie, et al. Hashtag-based sub-event discovery using mutually generative lDA in Twitter[C]//Proc of the AAAI Conf on Artificial Intelligence. Palo Alto, CA: AAAI, 2016, 30: 2666−2672

    [15]

    Peng Zheng, Zhen Huang, Dou Yong, et al. Rumor detection on social media through mining the social circles with high homogeneity[J]. Information Sciences. Berlin: Springer, 2023, 642: 119083 doi: 10.1016/j.ins.2023.119083

    [16]

    Bian Tian, Xiao Xi, Xu Tingyang, et al. Rumor detection on social media with bi-directional graph convolutional networks[C]//Proc of the AAAI Conf on Artificial Intelligence. Palo Alto, CA: AAAI, 2020, 34: 549−556

    [17]

    Lao An, Shi Chongyang, Yang Yayi. Rumor detection with field of linear and non-linear propagation[C]//Proc of the Web Conf. New York: ACM, 2021: 3178−3187

    [18]

    Jeong U, Ding Kaize, Cheng Lu, et al. Nothing stands alone: Relational fake news detection with hypergraph neural networks[C]//Proc of 2022 IEEE Int Conf on Big Data (Big Data). Piscataway, NJ: IEEE, 2022: 596−605

    [19]

    Zhang Haisong, Liu Lemao, Jiang Haiyun. Texsmart: A text understanding system for fine-grained ner and enhanced semantic analysis[J]. arXiv preprint, arXiv: 2012.15639, 2020

    [20]

    Li Chenliang, Wang Haoran, Zhang Zhiqian, et al. Topic modeling for short texts with auxiliary word embeddings[C]//Proc of the 39th Int ACM SIGIR Conf on Research and Development in Information Retrieval. New York: ACM, 2016: 165−174

    [21]

    Fan Wentao, Xiao Fuyuan. A complex Jensen–Shannon divergence in complex evidence theory with its application in multi-source information fusion[J]. Engineering Applications of Artificial Intelligence. Berlin: Springer, 2022, 116: 105362 doi: 10.1016/j.engappai.2022.105362

    [22]

    Yan Bo, Yang Cheng, Shi Chuan, et al. Abnormal event detection via hypergraph contrastive learning[C]//Proc of the 2023 SIAM Int Conf on Data Mining (SDM). Berlin: Springer, 2023: 712−720

    [23]

    Zubiaga A, Liakata M, Procter R. Learning reporting dynamics during breaking news for rumour detection in social media[J]. arXiv preprint, arXiv: 1610.07363, 2016

    [24]

    Song Changhe, Yang Cheng, Chen Huimin, et al. CED: Credible early detection of social media rumors[J]. IEEE Transactions on Knowledge and Data Engineering, 2019, Piscataway, NJ: IEEE, 33(8): 3035−3047

    [25]

    Wu Yang, Zhan Pengwei, Zhang Yunjian, et al. Multimodal fusion with co-attention networks for fake news detection[C]//Findings of the Association for Computational Linguistics. Stroudsburg, PA: ACL, 2021: 2560−2569

    [26]

    Shivangi S, Anubha K, Mohit S, et al. Tanmoy Chakraborty and Ponnurangam Kumaraguru. Spotfake+: A multimodal framework for fake news detection via transfer learning[C]//Proc of the AAAI Conf on Artificial Intelligence. Palo Alto, CA, AAAI, 2020, 34(10): 13915−13916

    [27]

    Wang Yaqing, Ma Fenglong, Jin Zhiwei, et al. Eann: Event adversarial neural networks for multi-modal fake news detection[C]//Proc of the 24th ACM sigkdd Int Conf on Knowledge Discovery & Data Mining. New York: ACM, 2018: 849−857

    [28]

    Liu Yang, Wu YiFang. Early detection of fake news on social media through propagation path classification with recurrent and convolutional networks[C]//Proc of the AAAI Conf on Artificial Intelligence. Palo Alto, CA: AAAI, 2018, 32(1): 354−361

    [29]

    Sun Tiening, Qian Zhong, Dong Sujun, et al. Rumor detection on social media with graph adversarial contrastive learning[C]//Proc of the ACM Web Conf 2022. New York: ACM, 2022: 2789−2797

    [30]

    Van der Maaten L, Hinton G. Visualizing data using t-SNE[J]. Journal of Machine Learning Research, 2008, 9(11): 2579−2605

图(6)  /  表(8)
计量
  • 文章访问数:  163
  • HTML全文浏览量:  22
  • PDF下载量:  66
  • 被引次数: 0
出版历程
  • 收稿日期:  2024-03-14
  • 修回日期:  2024-05-19
  • 网络出版日期:  2024-07-04
  • 刊出日期:  2024-07-31

目录

/

返回文章
返回