author:魏静崎
2023年12月18日
研究方向:虚假信息检测
本周工作内容:
1、阅读论文Grover K, Angara S M, Akhtar M S, et al. Public Wisdom Matters! Discourse-Aware Hyperbolic Fourier Co-Attention for Social Text Classification[J]. Advances in Neural Information Processing Systems, 2022, 35: 9417-9431.
文章使用帖子的评论/回复充当群众观点,提出Hyphen,将超拉柏图表征学习与新颖的傅里叶共同关注机制融合起来,通过整合评论或回复来提取新的特征。
![[1702906106228.png]]
Hyphen: 使用一种新的双曲傅里叶共同关注机制,将两种表示结合,有助于共同关注两种表示,最后将其传递给一个前馈网络进行最终分类。
将用户评论解析为抽象意义表示(AMR),单个评论级别的AMR图合成一个宏观AMR,代表全局的公共智慧和话语中的潜在频率。然后使用HGCN学习其宏观AMR表示。
宏观AMR图:为每一个用户评论分配一个抽象意义表示
a:添加一个全局虚拟节点
添加一个全局虚拟节点,将其连接到所有评论级别AMR的根节点,并在边上添加评论标签comment。虚拟节点确保所有AMR相连,以便在图编码期间交换信息。
b:概念合并
识别有重复概念的节点,从早期节点到晚期节点添加一条带有标签SAME的边。
c:评论间的共指解析
指代词是对话理解的主要挑战之一。对评论级别的AMR进行共指解析,识别包含指向同一实体的概念节点的共指簇。添加带有标签的COREF的边,从共指簇中的早期节点指向后期节点,以指示它们之间的关系。
双曲图编码:采用HGCN模型对帖子级AMR进行编码,以及形成用户评论的表示。
由于不同评论对应的帖子级AMR的不同子图,最终聚合节点表示形成子图嵌入。每个子图嵌入表示个人用户对源贴的理解。
co-reference resolution(共指解析):目的在于自动识别表示同一个实体的名词短语或代词,并将他们归类,共指(corefer):如果文本或句子中的两个mention(指称)指代的是同一个entity(实体),那么它们之间存在着一种共指(corefer)关系。
双曲型候选帖子编码器:
提出用双曲空间中的分层注意力网络(HHAN)来学习源帖子的内容表示。采用基于分层注意力的网络来捕捉各句子的相对重要性。类似于词级编码器,利用Mobius-GRU单元对源帖中每个句子进行编码。
双曲傅里叶共同关注机制:模拟源社交媒体帖子和用户评论间的相互影响。
通过对用户解释嵌入进行傅里叶变换的直觉可以被认为是尝试捕捉公共话语中最长出现的频率(知识、观点、情感),这些频率表达了大多数人对源帖的接受程度。此外,对源文嵌入进行傅叶立变换暗示了源帖传达的最突出信息。
最终可以通过使用得到的注意力权重进行加权求和生成源句和用户解释的注意力向量。
最后有一个前馈网络产生最终分类。
![[1702906069218.png]]
消融研究:
评论/回复的影响:移除之后在两个数据集中性能下降7%
双曲空间的影响:使用欧式空间代替后,两个数据集上分别下降3.55%和2.85%,双曲空间的唯一优势在于捕获宏观AMR图的固有层次结构。
傅里叶变换层的影响:傅里叶变换层捕获最显著的用户意见和源帖传达的最常见信息。通过傅里叶变换层的输出应用共同注意力,我们能更好地同时关注两种表示,模型捕获两者间相关性的能力增强。
- 本文作者: 魏静崎
- 本文链接: https://slightwjq.github.io/2024/03/04/周报13/
- 版权声明: 该文章来源及最终解释权归作者所有