虚假新闻检测介绍

2024-10-06

字数统计: 889字 | 阅读时长≈ 2分

author:魏静崎
2023年10月24日
研究方向：虚假信息检测

研究内容 2
什么是虚假新闻检测

研究意义 3
为什么要进行虚假信息检测

当前现状 3
十年内都是什么技术

主流模型
工作类别：不同类别所使用的技术 10
多模态
纯文本
追求效率
追求准确度
预处理技术、训练技术

未来期望 2

研究意义

随着网络技术的快速发展及自媒体的广泛应用，网络上除了真实信息也出现了许多虚假信息，虚假信息是故意传播以误导或欺骗为目的的虚假或不准确的信息。虚假信息比真实信息传播得更快，更广泛，真实信息需要比虚假信息多花５倍时间，才能达到同样的传播量，其在网络上的广泛传播会给个人甚至整个社会带来深刻的负面影响，研究当前社交网络虚假信息传播的特征、规律及控制手段，对虚拟网络空间安全和有效治理意义重大，亟待深入研究。网络虚假信息问题已经十分严峻，亟需探索高效的虚假信息检测方法，阻断虚假信息传播，保障网络空间信息可信、安全。

研究内容（背景）

虚假新闻检测的定义是给定新闻文章的新闻内容，社交上下文内容，以及外部知识，去判断新闻文章的真假。根据数据的标注情况将虚假新闻检测方法分为有监督虚假新闻检测方法，弱监督虚假新闻检测方法以及无监督虚假新闻检测方法。虚假新闻检测方法分为有监督虚假新闻检测方法，弱监督虚假新闻检测方法以及无监督虚假新闻检测方法。

研究现状

相关研究通常是把它建模为一个分类问题，存在两种问题建模：二分类和多分类。根据所使用的数据对象不同，网络虚假信息检测的研究工作可以分为三类：基于信息内容的方法，基于用户的方法和基于传播的方法。其中，基于信息内容的方法主要利用信息内容进行检测；基于用户的方法主要利用信息发布者或转发者的个人描述、性别、粉丝量、关注量等用户属性进行虚假信息识别；基于传播的方法主要利用信息传播过程中的评论、转发等特征进行虚假信息识别。
基于信息内容的虚假新闻检测又可以分为基于文本、基于图像和基于多模态的虚假新闻检测。基于文本的虚假信息检测研究主要分为基于文本语言特征的方法和基于文本结构特征的方法两种类型。虚假图像主要表现为两种形式：伪造和误用。伪造是指通过PS等软件对图像进行篡改，而误用是图像和文本不匹配，将不是同一事件的文本和图像放在一起，混肴视听。而多模态即是两者的融合。

基于文本的技术时间线：
基于图像的技术时间线：
基于多模态的技术时间线：

本文作者： 魏静崎
本文链接： https://slightwjq.github.io/2024/10/06/虚假新闻检测/
版权声明： 该文章来源及最终解释权归作者所有