CN110990744A

CN110990744A - 大数据处理中的虚假信息筛查设别系统及方法

Info

Publication number: CN110990744A
Application number: CN201911228116.XA
Authority: CN
Inventors: 喻珠; 薛涵
Original assignee: Jiangsu Zhimou Technology Co ltd
Current assignee: Jiangsu Zhimou Technology Co ltd
Priority date: 2019-12-04
Filing date: 2019-12-04
Publication date: 2020-04-10

Abstract

本发明公开了大数据处理中的虚假信息筛查设别系统及方法，该系统包括信息采集模块、信息预筛选模块、系统安全检测模块、处理中心、垃圾信息筛除模块；所述信息采集模块、信息预筛选模块、系统安全检测模块、处理中心、垃圾信息筛除模块依次电连接，信息采集模块包括数据信息采集子模块、音频信息采集子模块和图像信息采集子模块，信息预筛选模块包括数据筛选子模块、音频筛选子模块、图像筛选子模块和信息分类子模块，系统安全检测模块包括信息审核子模块和安全级别标记子模块，处理中心包括显示单元和人工审核通道，垃圾信息筛除模块包括信息删除子模块和信息源地址标记子模块。

Description

大数据处理中的虚假信息筛查设别系统及方法

技术领域

本发明涉及设别系统领域，具体是大数据处理中的虚假信息筛查设别系统及方法。

背景技术

虚假信息，就是不真实的信息。虚假信息、有着很大的负面影响；报导的真实性是新闻价值的要素之一，是新闻的生命，无论何种媒介都必须遵循新闻真实的规律。但是网络自身的传播特点为虚假信息的产生提供了生存的土壤。虚假信息泛滥给企业或个人带来的损害比起传统媒体来有过之而无不及，互联网具有高度的开放性和交互性，任何一个网站都能生产和发布信息，为所有传播信息和发表观点的人开辟了一个几乎不受限制的空间。正是这种无限的自由性使一些信息造假者和谣言传播者能够在网上发表不负责任的言论，或有意散布虚假信息，制造混乱。

网络在当今社会的影响力迅速膨胀，所以互联网也就演化为企业快速成长的发动机。而不管您从事什么样的行业，未来都离不开互联网；但是网络媒体本身也是一把双刃剑，我们一方面感受着互联网对社会发展的促进作用，另一方面它给人类社会带来得诸多负面效应也逐渐引起人们的重视。

发明内容

本发明的目的在于提供大数据处理中的虚假信息筛查设别系统及方法，以解决现有技术中的问题。

为实现上述目的，本发明提供如下技术方案：

大数据处理中的虚假信息筛查设别系统，该系统包括信息采集模块、信息预筛选模块、系统安全检测模块、处理中心、垃圾信息筛除模块；所述信息采集模块、信息预筛选模块、系统安全检测模块、处理中心、垃圾信息筛除模块依次电连接。

通过采用上述技术方案：所述信息采集模块包括数据信息采集子模块、音频信息采集子模块和图像信息采集子模块，其中，数据信息采集子模块、音频信息采集子模块和图像信息采集子模块分别与信息预筛选模块进行电连接；

所述数据信息采集模块用于对大数据处理中的数据信息进行采集，音频信息采集模块用于对大数据处理中的音频信息进行采集，图像信息采集模块用于对大数据处理中的图像信息进行采集。

通过采用上述技术方案：所述信息预筛选模块包括数据筛选子模块、音频筛选子模块、图像筛选子模块和信息分类子模块，其中，数据筛选子模块、音频筛选子模块和图像筛选子模块分别和数据信息采集子模块、音频信息采集子模块和图像信息采集子模块电连接，数据筛选子模块、音频筛选子模块和图像筛选子模块分别和信息分类子模块电连接，信息分类子模块的输出端与系统安全检测模块电连接；

所述数据筛选子模块用于对大数据处理中的数据信息进行筛查，音频筛选子模块用于对大数据处理中的音频信息进行筛查，图像筛选子模块用于对大数据处理中的图像信息进行筛查，信息分类子模块用于对筛查后的信息进行分类，从而将疑似虚假信息发送给系统安全检测模块。

通过采用上述技术方案：所述系统安全检测模块包括信息审核子模块和安全级别标记子模块，其中，信息审核子模块输入端与信息预筛选模块电连接，信息审核子模块与安全级别标记子模块电连接，安全级别标记子模块输出端与处理中心电连接；

所述信息审核子模块用于对信息的源地址、撰写人进行审核，安全级别标记子模块用于对审核的信息的进行安全级别的标记，级别越低，信息虚假性越高。

通过采用上述技术方案：所述处理中心包括显示单元和人工审核通道，所述显示单元和人工审核通道电连接，显示单元与系统安全检测模块电连接，人工审核通道与垃圾信息筛除模块电连接；显示单元用于对系统安全监测模块监测的信息进行显示，人工审核通道用于人工对安全级别低的信息人工审核。

通过采用上述技术方案：所述垃圾信息筛除模块包括信息删除子模块和信息源地址标记子模块，信息删除子模块和信息源地址标记子模块分别与处理中心电连接，信息删除模块用于对信息进行彻底的格式化，信息源地址标记子模块用于对虚假信息的源地址进行标记。

一种大数据处理中的虚假信息筛查设别方法，

S1：利用信息采集模块内部的数据信息采集子模块、音频信息采集子模块和图像信息采集子模块分别对信息中的数据、音频、图像进行采集，将采集结果发送给信息预筛选模块；

S2：利用信息预筛选模块内部的数据筛选子模块、音频筛选子模块、图像筛选子模块对数据信息、音频信息、图像信息进行初步筛查，信息分类子模块将筛选的信息进行分类，将分类的信息发送给系统安全检测模块进行审核；

S3：利用系统安全检测模块对分类后的数据进行审核，将审核数据发送给处理中心；

S4：利用处理中心内部的显示单元会对的审核后的数据进行显示，人工审核通道对初审后的信息进行二次审核，将审核结果发送给垃圾信息筛除模块；

S5：利用垃圾信息筛除模块内部的信息源地址标记子模块对虚假信息的源地址进行标记，信息删除子模块对信息进行彻底的格式化。

通过采用上述技术方案：所述步骤S3中，利用系统安全检测模块对分类后的数据进行审核，将审核数据发送给处理中心时，还包括以下步骤：

A1、利用信息审核子模块对一组采集的信息的源地址进行重复率分析，利用信息审核子模块对一组采集的信息的撰写人进行审核；

A2、信息审查子模块对分析源地址的重复率超过一定阈值后，进行撰写人比对，将比对结果发送给安全级别标记子模块；

A3、利用安全级别标记子模块对一组信息源地址、撰写人的分析比对结果进行安全级别标记。

通过采用上述技术方案：所述步骤A1中，利用信息审核子模块对一组采集的信息的源地址进行重复率分析，利用信息审核子模块对一组采集的信息的撰写人进行审核；

所述采集的信息的源地址和撰写人分别为R(P₁，C₁)、R(P₂，C₂)、R(P₃，C₃)、…、R(P_n-1，C_n-1)、R(P_n，C_n),提取其中的源地址P₁、P₂、P₃、…、P_(n-1)、P_n，对源地址进行核对，提取其中相同的源地址，设定相同源地址的数量为w，设定信息内部相同的源地址与所有信息的源地址的重复率为C，当重复率的阈值为设定阈值一，提取一组信息的所有的撰写人信息C1、C2、C3、…、C(n-1)、Cn，审核其中具有明确撰写人的信息，设定具体明确撰写人的数量为m，设定信息撰写人的明确率为V，当明确率的阈值为设定阈值二，根据公式：

当C小于设定阈值一且V小于设定阈值二时，默认该数据大部分具有不同的源地址，且具有明确的撰写人，安全级别标记子模块对该组数据进行标记中高级别；

当C大于等于设定阈值一且V小于设定阈值二时，或者当C小于设定阈值一且V大于等于设定阈值二时，默认该数据只有部分具有不同的源地址且具有明确的撰写人，安全级别标记子模块对该组数据进行标记中级别；

当C大于等于设定阈值一且V大于等于设定阈值二时，默认该数据小部分具有不同的源地址，且具有明确的撰写人，安全级别标记子模块对该组数据进行标记低级别，需要重点审查。与现有技术相比，本发明的有益效果是：

1.利用信息采集模块内部的数据信息采集子模块、音频信息采集子模块和图像信息采集子模块分别对信息中的数据、音频、图像进行采集；

2.利用信息预筛选模块内部的数据筛选子模块、音频筛选子模块、图像筛选子模块对数据信息、音频信息、图像信息进行初步筛查，信息分类子模块将筛选的信息进行分类，将分类的信息发送给系统安全检测模块进行审核；

3.利用系统安全检测模块对分类后的数据进行审核，将审核数据发送给处理中心；利用信息审核子模块对一组采集的信息的源地址进行重复率分析，利用信息审核子模块对一组采集的信息的撰写人进行审核；信息审查子模块对分析源地址的重复率超过一定阈值后，进行撰写人比对，将比对结果发送给安全级别标记子模块；利用安全级别标记子模块对一组信息源地址、撰写人的分析比对结果进行安全级别标记。

4.利用处理中心内部的显示单元会对的审核后的数据进行显示，人工审核通道对初审后的信息进行二次审核，将审核结果发送给垃圾信息筛除模块；

5.利用垃圾信息筛除模块内部的信息源地址标记子模块对虚假信息的源地址进行标记，信息删除子模块对信息进行彻底的格式化。

附图说明

为了使本发明的内容更容易被清楚地理解，下面根据具体实施例并结合附图，对本发明作进一步详细的说明。

图1为本发明大数据处理中的虚假信息筛查设别系统的模块结构示意图；

图2为本发明大数据处理中的虚假信息筛查设别方法的步骤示意图；

图3为本发明大数据处理中的虚假信息筛查设别方法的步骤S3具体步骤示意图；

图4为本发明大数据处理中的虚假信息筛查设别方法的实施过程的示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1～4，本发明实施例中，大数据处理中的虚假信息筛查设别系统及方法。

一种大数据处理中的虚假信息筛查设别方法，

当C大于等于设定阈值一且V大于等于设定阈值二时，默认该数据小部分具有不同的源地址，且具有明确的撰写人，安全级别标记子模块对该组数据进行标记低级别，需要重点审查。

实施例1：限定条件，采集的该组信息的源地址和撰写人为(192.168.20.144；赵一)、(192.068.30.133；钱二)、(192.168.20.144；孙三)、(192.168.20.162；无)、(192.168.151.23；李四)、(192.168.44.133；周五)，提取其中相同的源地址192.168.20.144，提取一组信息的所有的撰写人信息：赵一、钱二、孙三、无、李四、周五，审核其中具有明确撰写人的信息，设定阈值一为40％，设定阈值二都为20％，根据公式：

计算得出：

其中，重复率C为33％小于设定阈值一，且撰写人明确率V17％小于设定阈值二，默认该数据大部分具有不同的源地址，且具有明确的撰写人，安全级别标记子模块对该组数据进行标记中高级别。

实施例2：限定条件，采集的该组信息的源地址和撰写人为(192.168.18.88；赵一)、(192.068.30.133；钱二)、(192.168.20.144；孙三)、(192.168.20.162；无)、(192.168.20.162；李四)、(192.168.44.133；无)，提取其中相同的源地址192.168.20.162，提取一组信息的所有的撰写人信息：赵一、钱二、孙三、无、李四、无，审核其中具有明确撰写人的信息，设定阈值一为40％，设定阈值二都为20％，根据公式：

计算得出：

其中，重复率C为33％小于设定阈值一，且撰写人明确率V33％大于设定阈值二，默认该数据只有部分具有不同的源地址且具有明确的撰写人，安全级别标记子模块对该组数据进行标记中级别。

实施例3：限定条件，采集的该组信息的源地址和撰写人为(192.168.18.88；赵一)、(192.068.18.88；钱二)、(192.168.20.144；孙三)、(192.168.18.88；吴六)、(192.168.20.162；李四)、(192.168.44.133；无)，提取其中相同的源地址192.168.18.88，提取一组信息的所有的撰写人信息：赵一、钱二、孙三、吴六、李四、无，审核其中具有明确撰写人的信息，设定阈值一为40％，设定阈值二都为20％，根据公式：

计算得出：

其中，重复率C为50％大于设定阈值一，且撰写人明确率V17％小于设定阈值二，默认该数据只有部分具有不同的源地址且具有明确的撰写人，安全级别标记子模块对该组数据进行标记中级别。

实施例4：限定条件，采集的该组信息的源地址和撰写人为(192.168.18.88；赵一)、(192.068.18.88；钱二)、(192.168.20.144；孙三)、(192.168.18.88；无)、(192.168.20.162；李四)、(192.168.44.133；无)，提取其中相同的源地址192.168.18.88，提取一组信息的所有的撰写人信息：赵一、钱二、孙三、无、李四、无，审核其中具有明确撰写人的信息，设定阈值一为40％，设定阈值二都为20％，根据公式：

计算得出：

其中，重复率C为50％大于设定阈值一，且撰写人明确率V33％大于设定阈值二，默认该数据小部分具有不同的源地址，且具有明确的撰写人，安全级别标记子模块对该组数据进行标记低级别，需要重点审查。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims

1.大数据处理中的虚假信息筛查设别系统，其特征在于：所述该系统包括信息采集模块、信息预筛选模块、系统安全检测模块、处理中心、垃圾信息筛除模块；所述信息采集模块、信息预筛选模块、系统安全检测模块、处理中心、垃圾信息筛除模块依次电连接。

2.根据权利要求1所述的大数据处理中的虚假信息筛查设别系统，其特征在于：所述信息采集模块包括数据信息采集子模块、音频信息采集子模块和图像信息采集子模块，其中，数据信息采集子模块、音频信息采集子模块和图像信息采集子模块分别与信息预筛选模块进行电连接；

3.根据权利要求2所述的大数据处理中的虚假信息筛查设别系统，其特征在于：所述信息预筛选模块包括数据筛选子模块、音频筛选子模块、图像筛选子模块和信息分类子模块，其中，数据筛选子模块、音频筛选子模块和图像筛选子模块分别和数据信息采集子模块、音频信息采集子模块和图像信息采集子模块电连接，数据筛选子模块、音频筛选子模块和图像筛选子模块分别和信息分类子模块电连接，信息分类子模块的输出端与系统安全检测模块电连接；

4.根据权利要求1所述的大数据处理中的虚假信息筛查设别系统，其特征在于：所述系统安全检测模块包括信息审核子模块和安全级别标记子模块，其中，信息审核子模块输入端与信息预筛选模块电连接，信息审核子模块与安全级别标记子模块电连接，安全级别标记子模块输出端与处理中心电连接；所述信息审核子模块用于对信息的源地址、撰写人进行审核，安全级别标记子模块用于对审核的信息的进行安全级别的标记，级别越低，信息虚假性越高。

5.根据权利要求1所述的大数据处理中的虚假信息筛查设别系统，其特征在于：所述处理中心包括显示单元和人工审核通道，所述显示单元和人工审核通道电连接，显示单元与系统安全检测模块电连接，人工审核通道与垃圾信息筛除模块电连接；显示单元用于对系统安全监测模块监测的信息进行显示，人工审核通道用于人工对安全级别低的信息人工审核。

6.根据权利要求1所述的大数据处理中的虚假信息筛查设别系统，其特征在于：所述垃圾信息筛除模块包括信息删除子模块和信息源地址标记子模块，信息删除子模块和信息源地址标记子模块分别与处理中心电连接，信息删除模块用于对信息进行彻底的格式化，信息源地址标记子模块用于对虚假信息的源地址进行标记。

7.一种大数据处理中的虚假信息筛查设别方法，其特征在于：

8.根据权利要求7所述的大数据处理中的虚假信息筛查设别方法，其特征在于：所述步骤S3中，利用系统安全检测模块对分类后的数据进行审核，将审核数据发送给处理中心时，还包括以下步骤：

9.根据权利要求8所述的大数据处理中的虚假信息筛查设别方法，其特征在于：所述步骤A1中，利用信息审核子模块对一组采集的信息的源地址进行重复率分析，利用信息审核子模块对一组采集的信息的撰写人进行审核；