author:魏静崎
2024年6月4日
研究方向:虚假信息检测
本周工作内容:
1、阅读论文Wu D, Tan Z, Zhao H, et al. Domain-and category-style clustering for general fake news detection via contrastive learning[J]. Information Processing & Management, 2024, 61(4): 103725.
模型架构:![[1717319564717.png]]
模型(DCSC)的两个关键模块:内容完整性检测(CID)和对比风格检测(CSD)
模型先使用一个编码器E和一个解缠门来学习总体特征,然后将其分为内容特征hc和风格特征hs
解缠门:(disentanglement gate)是一种用于将输入特征分解为不同部分的机制。在本中,解缠门被用来分离输入特征中的内容和风格信息。
解缠门接受特征向量作为输入,并输出两个向量,一个代表内容特征,另一个代表风格特征。通过调节解缠门的参数,可以控制特征向量中内容和风格信息的权重,从而实现内容和风格的解耦。
内容完整性检测:由解码器和重构损失组成,D和E是一对,目的是保证语义内容的完整性。
重构损失(L1距离)是用来衡量重构样本与原始样本之间的差异,通过最小化重构损失,可以优化解码器、编码器和解缠门的参数,以实现内容特征的解耦。L1距离,也称为曼哈顿距离,是两个向量之间的距离度量。它是指两个向量中对应元素差的绝对值之和。
对比风格检测:在领域和类别级上对风格进行聚类,以寻求不失去领域特征的分类共性。为了实现跨领域一致的风格聚类,提出了一种多层对比损失,包括改进的三元损失和提出的四元损失。
在领域级别上使用三元损失对同一领域的风格预测进行聚类,并分离不同领域的风格预测,使用KL散度而不是L2距离来预测风格之间的相似性。
在类别上使用提出的四元损失来更好地分离,具体是将同一领域但不同类别的样本指定为负样本,从而增强相似样本之间的距离。
与普通的风格检测不同,内容特征通过内容反转层GRL进行操作。
GRL(⋅)在正向传播期间充当恒等变换,而在反向传播期间传递−1 × 𝑔𝑟𝑎𝑑𝑖𝑒𝑛𝑡给前一层。将风格特征的风格预测作为标签,利用KL散度来衡量内容和风格特征之间的相似性。因此,反转的梯度使得内容特征与风格特征不相似,实现了明确的解缠。
KL散度:
能够捕捉到两个分布之间的细微差异。
KL散度不具备对称性,即KL(p||q) ≠ KL(q||p),这意味着它不是一个度量,不能直接用于衡量两个分布之间的距离。
结果:
![[1717561079675.png]]
消融研究:
![[1717561137922.png]]
- 本文作者: 魏静崎
- 本文链接: https://slightwjq.github.io/2024/09/26/周报25/
- 版权声明: 该文章来源及最终解释权归作者所有