author:魏静崎
2024年3月18日
研究方向:虚假信息检测
本周工作内容:
1、阅读论文Fang X, Wu H, g J, et al. NSEP: Early fake news detection via news semantic environment perception[J]. Information Processing & Management, 2024, 61(2): 103594.
该论文使用使用深度语义区分模块将新闻语义环境划分为宏观和微观语义环境,然后使用GCN来感知宏观语义环境中的语义不一致性,使用多头注意力和稀疏注意力来捕捉微观语义环境中新闻内容和帖子之间的语义矛盾。
![[1710826083075.png]]
1、微观和宏观语义区分模块
首先提取帖子与新闻项目之间基于预先相似度的集合,在具有与当前帖子最高语义相似性的n个新闻项目被视为候选宏观语义环境。
真实新闻在微观语义环境中与当前帖子高度相关,而假新闻通过聚类往往被视为异常的离群值,采用聚类算法对综合语义环境进行聚类,得到k个涵盖共享主题的群组,对每个集群进行平均池化得到其主题特征。之后选择与目标帖子最相关的集群,在所选集群与目标帖子进行相似度计算,最后选择最相关的r个新闻项目来构建微观语义环境
2、新闻语义环境感知
宏观语义检测模块:宏观语义环境中的帖子和新闻被视为图上的节点,帖子和新闻之间的相似性权值被表示为图上节点之间边的权重。在更新和聚合图上的相邻节点后,可以从节点向量中得到宏观语义环境感知特征。
微观语义检测模块:多头注意力使用不同的权重矩阵进行线性变换,使注意力机制能够将更多信息引入上下文向量的计算中。然后使用稀疏注意力机制解决注意力矩阵中有冗余的问题,并提高泛化能力。多头注意力和稀疏注意力互相补充所捕捉到的语义特征。
结果:![[1710838634910.png]]
消融研究:
宏观模块和微观模块是相互增强的。
单纯使用多头注意力会丢失信息,而自注意力机制会弥补部分丢失信息,但是不如稀疏注意力机制。
- 本文作者: 魏静崎
- 本文链接: https://slightwjq.github.io/2024/09/26/周报19/
- 版权声明: 该文章来源及最终解释权归作者所有