CN110990744A - 大数据处理中的虚假信息筛查设别系统及方法 - Google Patents

大数据处理中的虚假信息筛查设别系统及方法 Download PDF

Info

Publication number
CN110990744A
CN110990744A CN201911228116.XA CN201911228116A CN110990744A CN 110990744 A CN110990744 A CN 110990744A CN 201911228116 A CN201911228116 A CN 201911228116A CN 110990744 A CN110990744 A CN 110990744A
Authority
CN
China
Prior art keywords
information
submodule
screening
module
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911228116.XA
Other languages
English (en)
Inventor
喻珠
薛涵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Zhimou Technology Co ltd
Original Assignee
Jiangsu Zhimou Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Zhimou Technology Co ltd filed Critical Jiangsu Zhimou Technology Co ltd
Priority to CN201911228116.XA priority Critical patent/CN110990744A/zh
Publication of CN110990744A publication Critical patent/CN110990744A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/483Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Storage Device Security (AREA)

Abstract

本发明公开了大数据处理中的虚假信息筛查设别系统及方法,该系统包括信息采集模块、信息预筛选模块、系统安全检测模块、处理中心、垃圾信息筛除模块;所述信息采集模块、信息预筛选模块、系统安全检测模块、处理中心、垃圾信息筛除模块依次电连接,信息采集模块包括数据信息采集子模块、音频信息采集子模块和图像信息采集子模块,信息预筛选模块包括数据筛选子模块、音频筛选子模块、图像筛选子模块和信息分类子模块,系统安全检测模块包括信息审核子模块和安全级别标记子模块,处理中心包括显示单元和人工审核通道,垃圾信息筛除模块包括信息删除子模块和信息源地址标记子模块。

Description

大数据处理中的虚假信息筛查设别系统及方法
技术领域
本发明涉及设别系统领域,具体是大数据处理中的虚假信息筛查设别系统及方法。
背景技术
虚假信息,就是不真实的信息。虚假信息、有着很大的负面影响;报导的真实性是新闻价值的要素之一,是新闻的生命,无论何种媒介都必须遵循新闻真实的规律。但是网络自身的传播特点为虚假信息的产生提供了生存的土壤。虚假信息泛滥给企业或个人带来的损害比起传统媒体来有过之而无不及,互联网具有高度的开放性和交互性,任何一个网站都能生产和发布信息,为所有传播信息和发表观点的人开辟了一个几乎不受限制的空间。正是这种无限的自由性使一些信息造假者和谣言传播者能够在网上发表不负责任的言论,或有意散布虚假信息,制造混乱。
网络在当今社会的影响力迅速膨胀,所以互联网也就演化为企业快速成长的发动机。而不管您从事什么样的行业,未来都离不开互联网;但是网络媒体本身也是一把双刃剑,我们一方面感受着互联网对社会发展的促进作用,另一方面它给人类社会带来得诸多负面效应也逐渐引起人们的重视。
发明内容
本发明的目的在于提供大数据处理中的虚假信息筛查设别系统及方法,以解决现有技术中的问题。
为实现上述目的,本发明提供如下技术方案:
大数据处理中的虚假信息筛查设别系统,该系统包括信息采集模块、信息预筛选模块、系统安全检测模块、处理中心、垃圾信息筛除模块;所述信息采集模块、信息预筛选模块、系统安全检测模块、处理中心、垃圾信息筛除模块依次电连接。
通过采用上述技术方案:所述信息采集模块包括数据信息采集子模块、音频信息采集子模块和图像信息采集子模块,其中,数据信息采集子模块、音频信息采集子模块和图像信息采集子模块分别与信息预筛选模块进行电连接;
所述数据信息采集模块用于对大数据处理中的数据信息进行采集,音频信息采集模块用于对大数据处理中的音频信息进行采集,图像信息采集模块用于对大数据处理中的图像信息进行采集。
通过采用上述技术方案:所述信息预筛选模块包括数据筛选子模块、音频筛选子模块、图像筛选子模块和信息分类子模块,其中,数据筛选子模块、音频筛选子模块和图像筛选子模块分别和数据信息采集子模块、音频信息采集子模块和图像信息采集子模块电连接,数据筛选子模块、音频筛选子模块和图像筛选子模块分别和信息分类子模块电连接,信息分类子模块的输出端与系统安全检测模块电连接;
所述数据筛选子模块用于对大数据处理中的数据信息进行筛查,音频筛选子模块用于对大数据处理中的音频信息进行筛查,图像筛选子模块用于对大数据处理中的图像信息进行筛查,信息分类子模块用于对筛查后的信息进行分类,从而将疑似虚假信息发送给系统安全检测模块。
通过采用上述技术方案:所述系统安全检测模块包括信息审核子模块和安全级别标记子模块,其中,信息审核子模块输入端与信息预筛选模块电连接,信息审核子模块与安全级别标记子模块电连接,安全级别标记子模块输出端与处理中心电连接;
所述信息审核子模块用于对信息的源地址、撰写人进行审核,安全级别标记子模块用于对审核的信息的进行安全级别的标记,级别越低,信息虚假性越高。
通过采用上述技术方案:所述处理中心包括显示单元和人工审核通道,所述显示单元和人工审核通道电连接,显示单元与系统安全检测模块电连接,人工审核通道与垃圾信息筛除模块电连接;显示单元用于对系统安全监测模块监测的信息进行显示,人工审核通道用于人工对安全级别低的信息人工审核。
通过采用上述技术方案:所述垃圾信息筛除模块包括信息删除子模块和信息源地址标记子模块,信息删除子模块和信息源地址标记子模块分别与处理中心电连接,信息删除模块用于对信息进行彻底的格式化,信息源地址标记子模块用于对虚假信息的源地址进行标记。
一种大数据处理中的虚假信息筛查设别方法,
S1:利用信息采集模块内部的数据信息采集子模块、音频信息采集子模块和图像信息采集子模块分别对信息中的数据、音频、图像进行采集,将采集结果发送给信息预筛选模块;
S2:利用信息预筛选模块内部的数据筛选子模块、音频筛选子模块、图像筛选子模块对数据信息、音频信息、图像信息进行初步筛查,信息分类子模块将筛选的信息进行分类,将分类的信息发送给系统安全检测模块进行审核;
S3:利用系统安全检测模块对分类后的数据进行审核,将审核数据发送给处理中心;
S4:利用处理中心内部的显示单元会对的审核后的数据进行显示,人工审核通道对初审后的信息进行二次审核,将审核结果发送给垃圾信息筛除模块;
S5:利用垃圾信息筛除模块内部的信息源地址标记子模块对虚假信息的源地址进行标记,信息删除子模块对信息进行彻底的格式化。
通过采用上述技术方案:所述步骤S3中,利用系统安全检测模块对分类后的数据进行审核,将审核数据发送给处理中心时,还包括以下步骤:
A1、利用信息审核子模块对一组采集的信息的源地址进行重复率分析,利用信息审核子模块对一组采集的信息的撰写人进行审核;
A2、信息审查子模块对分析源地址的重复率超过一定阈值后,进行撰写人比对,将比对结果发送给安全级别标记子模块;
A3、利用安全级别标记子模块对一组信息源地址、撰写人的分析比对结果进行安全级别标记。
通过采用上述技术方案:所述步骤A1中,利用信息审核子模块对一组采集的信息的源地址进行重复率分析,利用信息审核子模块对一组采集的信息的撰写人进行审核;
所述采集的信息的源地址和撰写人分别为R(P1,C1)、R(P2,C2)、R(P3,C3)、…、R(Pn-1,Cn-1)、R(Pn,Cn),提取其中的源地址P1、P2、P3、…、P(n-1)、Pn,对源地址进行核对,提取其中相同的源地址,设定相同源地址的数量为w,设定信息内部相同的源地址与所有信息的源地址的重复率为C,当重复率的阈值为设定阈值一,提取一组信息的所有的撰写人信息C1、C2、C3、…、C(n-1)、Cn,审核其中具有明确撰写人的信息,设定具体明确撰写人的数量为m,设定信息撰写人的明确率为V,当明确率的阈值为设定阈值二,根据公式:
Figure BDA0002302797660000051
当C小于设定阈值一且V小于设定阈值二时,默认该数据大部分具有不同的源地址,且具有明确的撰写人,安全级别标记子模块对该组数据进行标记中高级别;
当C大于等于设定阈值一且V小于设定阈值二时,或者当C小于设定阈值一且V大于等于设定阈值二时,默认该数据只有部分具有不同的源地址且具有明确的撰写人,安全级别标记子模块对该组数据进行标记中级别;
当C大于等于设定阈值一且V大于等于设定阈值二时,默认该数据小部分具有不同的源地址,且具有明确的撰写人,安全级别标记子模块对该组数据进行标记低级别,需要重点审查。与现有技术相比,本发明的有益效果是:
1.利用信息采集模块内部的数据信息采集子模块、音频信息采集子模块和图像信息采集子模块分别对信息中的数据、音频、图像进行采集;
2.利用信息预筛选模块内部的数据筛选子模块、音频筛选子模块、图像筛选子模块对数据信息、音频信息、图像信息进行初步筛查,信息分类子模块将筛选的信息进行分类,将分类的信息发送给系统安全检测模块进行审核;
3.利用系统安全检测模块对分类后的数据进行审核,将审核数据发送给处理中心;利用信息审核子模块对一组采集的信息的源地址进行重复率分析,利用信息审核子模块对一组采集的信息的撰写人进行审核;信息审查子模块对分析源地址的重复率超过一定阈值后,进行撰写人比对,将比对结果发送给安全级别标记子模块;利用安全级别标记子模块对一组信息源地址、撰写人的分析比对结果进行安全级别标记。
4.利用处理中心内部的显示单元会对的审核后的数据进行显示,人工审核通道对初审后的信息进行二次审核,将审核结果发送给垃圾信息筛除模块;
5.利用垃圾信息筛除模块内部的信息源地址标记子模块对虚假信息的源地址进行标记,信息删除子模块对信息进行彻底的格式化。
附图说明
为了使本发明的内容更容易被清楚地理解,下面根据具体实施例并结合附图,对本发明作进一步详细的说明。
图1为本发明大数据处理中的虚假信息筛查设别系统的模块结构示意图;
图2为本发明大数据处理中的虚假信息筛查设别方法的步骤示意图;
图3为本发明大数据处理中的虚假信息筛查设别方法的步骤S3具体步骤示意图;
图4为本发明大数据处理中的虚假信息筛查设别方法的实施过程的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1~4,本发明实施例中,大数据处理中的虚假信息筛查设别系统及方法。
大数据处理中的虚假信息筛查设别系统,该系统包括信息采集模块、信息预筛选模块、系统安全检测模块、处理中心、垃圾信息筛除模块;所述信息采集模块、信息预筛选模块、系统安全检测模块、处理中心、垃圾信息筛除模块依次电连接。
通过采用上述技术方案:所述信息采集模块包括数据信息采集子模块、音频信息采集子模块和图像信息采集子模块,其中,数据信息采集子模块、音频信息采集子模块和图像信息采集子模块分别与信息预筛选模块进行电连接;
所述数据信息采集模块用于对大数据处理中的数据信息进行采集,音频信息采集模块用于对大数据处理中的音频信息进行采集,图像信息采集模块用于对大数据处理中的图像信息进行采集。
通过采用上述技术方案:所述信息预筛选模块包括数据筛选子模块、音频筛选子模块、图像筛选子模块和信息分类子模块,其中,数据筛选子模块、音频筛选子模块和图像筛选子模块分别和数据信息采集子模块、音频信息采集子模块和图像信息采集子模块电连接,数据筛选子模块、音频筛选子模块和图像筛选子模块分别和信息分类子模块电连接,信息分类子模块的输出端与系统安全检测模块电连接;
所述数据筛选子模块用于对大数据处理中的数据信息进行筛查,音频筛选子模块用于对大数据处理中的音频信息进行筛查,图像筛选子模块用于对大数据处理中的图像信息进行筛查,信息分类子模块用于对筛查后的信息进行分类,从而将疑似虚假信息发送给系统安全检测模块。
通过采用上述技术方案:所述系统安全检测模块包括信息审核子模块和安全级别标记子模块,其中,信息审核子模块输入端与信息预筛选模块电连接,信息审核子模块与安全级别标记子模块电连接,安全级别标记子模块输出端与处理中心电连接;
所述信息审核子模块用于对信息的源地址、撰写人进行审核,安全级别标记子模块用于对审核的信息的进行安全级别的标记,级别越低,信息虚假性越高。
通过采用上述技术方案:所述处理中心包括显示单元和人工审核通道,所述显示单元和人工审核通道电连接,显示单元与系统安全检测模块电连接,人工审核通道与垃圾信息筛除模块电连接;显示单元用于对系统安全监测模块监测的信息进行显示,人工审核通道用于人工对安全级别低的信息人工审核。
通过采用上述技术方案:所述垃圾信息筛除模块包括信息删除子模块和信息源地址标记子模块,信息删除子模块和信息源地址标记子模块分别与处理中心电连接,信息删除模块用于对信息进行彻底的格式化,信息源地址标记子模块用于对虚假信息的源地址进行标记。
一种大数据处理中的虚假信息筛查设别方法,
S1:利用信息采集模块内部的数据信息采集子模块、音频信息采集子模块和图像信息采集子模块分别对信息中的数据、音频、图像进行采集,将采集结果发送给信息预筛选模块;
S2:利用信息预筛选模块内部的数据筛选子模块、音频筛选子模块、图像筛选子模块对数据信息、音频信息、图像信息进行初步筛查,信息分类子模块将筛选的信息进行分类,将分类的信息发送给系统安全检测模块进行审核;
S3:利用系统安全检测模块对分类后的数据进行审核,将审核数据发送给处理中心;
S4:利用处理中心内部的显示单元会对的审核后的数据进行显示,人工审核通道对初审后的信息进行二次审核,将审核结果发送给垃圾信息筛除模块;
S5:利用垃圾信息筛除模块内部的信息源地址标记子模块对虚假信息的源地址进行标记,信息删除子模块对信息进行彻底的格式化。
通过采用上述技术方案:所述步骤S3中,利用系统安全检测模块对分类后的数据进行审核,将审核数据发送给处理中心时,还包括以下步骤:
A1、利用信息审核子模块对一组采集的信息的源地址进行重复率分析,利用信息审核子模块对一组采集的信息的撰写人进行审核;
A2、信息审查子模块对分析源地址的重复率超过一定阈值后,进行撰写人比对,将比对结果发送给安全级别标记子模块;
A3、利用安全级别标记子模块对一组信息源地址、撰写人的分析比对结果进行安全级别标记。
通过采用上述技术方案:所述步骤A1中,利用信息审核子模块对一组采集的信息的源地址进行重复率分析,利用信息审核子模块对一组采集的信息的撰写人进行审核;
所述采集的信息的源地址和撰写人分别为R(P1,C1)、R(P2,C2)、R(P3,C3)、…、R(Pn-1,Cn-1)、R(Pn,Cn),提取其中的源地址P1、P2、P3、…、P(n-1)、Pn,对源地址进行核对,提取其中相同的源地址,设定相同源地址的数量为w,设定信息内部相同的源地址与所有信息的源地址的重复率为C,当重复率的阈值为设定阈值一,提取一组信息的所有的撰写人信息C1、C2、C3、…、C(n-1)、Cn,审核其中具有明确撰写人的信息,设定具体明确撰写人的数量为m,设定信息撰写人的明确率为V,当明确率的阈值为设定阈值二,根据公式:
Figure BDA0002302797660000111
当C小于设定阈值一且V小于设定阈值二时,默认该数据大部分具有不同的源地址,且具有明确的撰写人,安全级别标记子模块对该组数据进行标记中高级别;
当C大于等于设定阈值一且V小于设定阈值二时,或者当C小于设定阈值一且V大于等于设定阈值二时,默认该数据只有部分具有不同的源地址且具有明确的撰写人,安全级别标记子模块对该组数据进行标记中级别;
当C大于等于设定阈值一且V大于等于设定阈值二时,默认该数据小部分具有不同的源地址,且具有明确的撰写人,安全级别标记子模块对该组数据进行标记低级别,需要重点审查。
实施例1:限定条件,采集的该组信息的源地址和撰写人为(192.168.20.144;赵一)、(192.068.30.133;钱二)、(192.168.20.144;孙三)、(192.168.20.162;无)、(192.168.151.23;李四)、(192.168.44.133;周五),提取其中相同的源地址192.168.20.144,提取一组信息的所有的撰写人信息:赵一、钱二、孙三、无、李四、周五,审核其中具有明确撰写人的信息,设定阈值一为40%,设定阈值二都为20%,根据公式:
Figure BDA0002302797660000121
计算得出:
Figure BDA0002302797660000122
其中,重复率C为33%小于设定阈值一,且撰写人明确率V17%小于设定阈值二,默认该数据大部分具有不同的源地址,且具有明确的撰写人,安全级别标记子模块对该组数据进行标记中高级别。
实施例2:限定条件,采集的该组信息的源地址和撰写人为(192.168.18.88;赵一)、(192.068.30.133;钱二)、(192.168.20.144;孙三)、(192.168.20.162;无)、(192.168.20.162;李四)、(192.168.44.133;无),提取其中相同的源地址192.168.20.162,提取一组信息的所有的撰写人信息:赵一、钱二、孙三、无、李四、无,审核其中具有明确撰写人的信息,设定阈值一为40%,设定阈值二都为20%,根据公式:
Figure BDA0002302797660000131
计算得出:
Figure BDA0002302797660000132
其中,重复率C为33%小于设定阈值一,且撰写人明确率V33%大于设定阈值二,默认该数据只有部分具有不同的源地址且具有明确的撰写人,安全级别标记子模块对该组数据进行标记中级别。
实施例3:限定条件,采集的该组信息的源地址和撰写人为(192.168.18.88;赵一)、(192.068.18.88;钱二)、(192.168.20.144;孙三)、(192.168.18.88;吴六)、(192.168.20.162;李四)、(192.168.44.133;无),提取其中相同的源地址192.168.18.88,提取一组信息的所有的撰写人信息:赵一、钱二、孙三、吴六、李四、无,审核其中具有明确撰写人的信息,设定阈值一为40%,设定阈值二都为20%,根据公式:
Figure BDA0002302797660000141
计算得出:
Figure BDA0002302797660000142
其中,重复率C为50%大于设定阈值一,且撰写人明确率V17%小于设定阈值二,默认该数据只有部分具有不同的源地址且具有明确的撰写人,安全级别标记子模块对该组数据进行标记中级别。
实施例4:限定条件,采集的该组信息的源地址和撰写人为(192.168.18.88;赵一)、(192.068.18.88;钱二)、(192.168.20.144;孙三)、(192.168.18.88;无)、(192.168.20.162;李四)、(192.168.44.133;无),提取其中相同的源地址192.168.18.88,提取一组信息的所有的撰写人信息:赵一、钱二、孙三、无、李四、无,审核其中具有明确撰写人的信息,设定阈值一为40%,设定阈值二都为20%,根据公式:
Figure BDA0002302797660000143
计算得出:
Figure BDA0002302797660000144
其中,重复率C为50%大于设定阈值一,且撰写人明确率V33%大于设定阈值二,默认该数据小部分具有不同的源地址,且具有明确的撰写人,安全级别标记子模块对该组数据进行标记低级别,需要重点审查。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims (9)

1.大数据处理中的虚假信息筛查设别系统,其特征在于:所述该系统包括信息采集模块、信息预筛选模块、系统安全检测模块、处理中心、垃圾信息筛除模块;所述信息采集模块、信息预筛选模块、系统安全检测模块、处理中心、垃圾信息筛除模块依次电连接。
2.根据权利要求1所述的大数据处理中的虚假信息筛查设别系统,其特征在于:所述信息采集模块包括数据信息采集子模块、音频信息采集子模块和图像信息采集子模块,其中,数据信息采集子模块、音频信息采集子模块和图像信息采集子模块分别与信息预筛选模块进行电连接;
所述数据信息采集模块用于对大数据处理中的数据信息进行采集,音频信息采集模块用于对大数据处理中的音频信息进行采集,图像信息采集模块用于对大数据处理中的图像信息进行采集。
3.根据权利要求2所述的大数据处理中的虚假信息筛查设别系统,其特征在于:所述信息预筛选模块包括数据筛选子模块、音频筛选子模块、图像筛选子模块和信息分类子模块,其中,数据筛选子模块、音频筛选子模块和图像筛选子模块分别和数据信息采集子模块、音频信息采集子模块和图像信息采集子模块电连接,数据筛选子模块、音频筛选子模块和图像筛选子模块分别和信息分类子模块电连接,信息分类子模块的输出端与系统安全检测模块电连接;
所述数据筛选子模块用于对大数据处理中的数据信息进行筛查,音频筛选子模块用于对大数据处理中的音频信息进行筛查,图像筛选子模块用于对大数据处理中的图像信息进行筛查,信息分类子模块用于对筛查后的信息进行分类,从而将疑似虚假信息发送给系统安全检测模块。
4.根据权利要求1所述的大数据处理中的虚假信息筛查设别系统,其特征在于:所述系统安全检测模块包括信息审核子模块和安全级别标记子模块,其中,信息审核子模块输入端与信息预筛选模块电连接,信息审核子模块与安全级别标记子模块电连接,安全级别标记子模块输出端与处理中心电连接;所述信息审核子模块用于对信息的源地址、撰写人进行审核,安全级别标记子模块用于对审核的信息的进行安全级别的标记,级别越低,信息虚假性越高。
5.根据权利要求1所述的大数据处理中的虚假信息筛查设别系统,其特征在于:所述处理中心包括显示单元和人工审核通道,所述显示单元和人工审核通道电连接,显示单元与系统安全检测模块电连接,人工审核通道与垃圾信息筛除模块电连接;显示单元用于对系统安全监测模块监测的信息进行显示,人工审核通道用于人工对安全级别低的信息人工审核。
6.根据权利要求1所述的大数据处理中的虚假信息筛查设别系统,其特征在于:所述垃圾信息筛除模块包括信息删除子模块和信息源地址标记子模块,信息删除子模块和信息源地址标记子模块分别与处理中心电连接,信息删除模块用于对信息进行彻底的格式化,信息源地址标记子模块用于对虚假信息的源地址进行标记。
7.一种大数据处理中的虚假信息筛查设别方法,其特征在于:
S1:利用信息采集模块内部的数据信息采集子模块、音频信息采集子模块和图像信息采集子模块分别对信息中的数据、音频、图像进行采集,将采集结果发送给信息预筛选模块;
S2:利用信息预筛选模块内部的数据筛选子模块、音频筛选子模块、图像筛选子模块对数据信息、音频信息、图像信息进行初步筛查,信息分类子模块将筛选的信息进行分类,将分类的信息发送给系统安全检测模块进行审核;
S3:利用系统安全检测模块对分类后的数据进行审核,将审核数据发送给处理中心;
S4:利用处理中心内部的显示单元会对的审核后的数据进行显示,人工审核通道对初审后的信息进行二次审核,将审核结果发送给垃圾信息筛除模块;
S5:利用垃圾信息筛除模块内部的信息源地址标记子模块对虚假信息的源地址进行标记,信息删除子模块对信息进行彻底的格式化。
8.根据权利要求7所述的大数据处理中的虚假信息筛查设别方法,其特征在于:所述步骤S3中,利用系统安全检测模块对分类后的数据进行审核,将审核数据发送给处理中心时,还包括以下步骤:
A1、利用信息审核子模块对一组采集的信息的源地址进行重复率分析,利用信息审核子模块对一组采集的信息的撰写人进行审核;
A2、信息审查子模块对分析源地址的重复率超过一定阈值后,进行撰写人比对,将比对结果发送给安全级别标记子模块;
A3、利用安全级别标记子模块对一组信息源地址、撰写人的分析比对结果进行安全级别标记。
9.根据权利要求8所述的大数据处理中的虚假信息筛查设别方法,其特征在于:所述步骤A1中,利用信息审核子模块对一组采集的信息的源地址进行重复率分析,利用信息审核子模块对一组采集的信息的撰写人进行审核;
所述采集的信息的源地址和撰写人分别为R(P1,C1)、R(P2,C2)、R(P3,C3)、…、R(Pn-1,Cn-1)、R(Pn,Cn),提取其中的源地址P1、P2、P3、…、P(n-1)、Pn,对源地址进行核对,提取其中相同的源地址,设定相同源地址的数量为w,设定信息内部相同的源地址与所有信息的源地址的重复率为C,当重复率的阈值为设定阈值一,提取一组信息的所有的撰写人信息C1、C2、C3、…、C(n-1)、Cn,审核其中具有明确撰写人的信息,设定具体明确撰写人的数量为m,设定信息撰写人的明确率为V,当明确率的阈值为设定阈值二,根据公式:
Figure FDA0002302797650000051
当C小于设定阈值一且V小于设定阈值二时,默认该数据大部分具有不同的源地址,且具有明确的撰写人,安全级别标记子模块对该组数据进行标记中高级别;
当C大于等于设定阈值一且V小于设定阈值二时,或者当C小于设定阈值一且V大于等于设定阈值二时,默认该数据只有部分具有不同的源地址且具有明确的撰写人,安全级别标记子模块对该组数据进行标记中级别;
当C大于等于设定阈值一且V大于等于设定阈值二时,默认该数据小部分具有不同的源地址,且具有明确的撰写人,安全级别标记子模块对该组数据进行标记低级别,需要重点审查。
CN201911228116.XA 2019-12-04 2019-12-04 大数据处理中的虚假信息筛查设别系统及方法 Pending CN110990744A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911228116.XA CN110990744A (zh) 2019-12-04 2019-12-04 大数据处理中的虚假信息筛查设别系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911228116.XA CN110990744A (zh) 2019-12-04 2019-12-04 大数据处理中的虚假信息筛查设别系统及方法

Publications (1)

Publication Number Publication Date
CN110990744A true CN110990744A (zh) 2020-04-10

Family

ID=70090001

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911228116.XA Pending CN110990744A (zh) 2019-12-04 2019-12-04 大数据处理中的虚假信息筛查设别系统及方法

Country Status (1)

Country Link
CN (1) CN110990744A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104317871A (zh) * 2014-10-20 2015-01-28 宁波市鄞州安业贸易有限公司 一种信息录入审查系统
CN109857936A (zh) * 2019-01-25 2019-06-07 武汉市网慧天下科技有限公司 一种大数据采集分析与服务系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104317871A (zh) * 2014-10-20 2015-01-28 宁波市鄞州安业贸易有限公司 一种信息录入审查系统
CN109857936A (zh) * 2019-01-25 2019-06-07 武汉市网慧天下科技有限公司 一种大数据采集分析与服务系统

Similar Documents

Publication Publication Date Title
Hayes Connecting the dots
CN107579956B (zh) 一种用户行为的检测方法和装置
DE112020001038T5 (de) Detektion von phishing-kampagnen
CN104244016B (zh) 一种h264视频内容篡改检测方法
CN113887219B (zh) 一种主管部门热线舆情识别与预警方法及系统
CN108509561B (zh) 基于机器学习的岗位招聘数据筛选方法、系统及存储介质
CN112667875B (zh) 一种数据获取、数据分析方法、装置、设备及存储介质
CN112422574A (zh) 风险账号的识别方法、装置、介质及电子设备
CN113360566A (zh) 一种信息内容监测方法及系统
CN114860882A (zh) 一种基于文本分类模型的公平竞争审查辅助方法
CN115664860A (zh) 网络安全威胁评估方法和系统
Meyer et al. Between calls for action and narratives of denial: Climate change attention structures on Twitter
CN111858924A (zh) 一种具有网络舆情监控及分析功能的系统
CN109284465B (zh) 一种基于url的网页分类器构建方法及其分类方法
CN110990744A (zh) 大数据处理中的虚假信息筛查设别系统及方法
Mu [Retracted] Spam Identification in Cloud Computing Based on Text Filtering System
Schulz-Tomančok et al. Credibility at stake. A comparative analysis of different hate speech comments on journalistic credibility and support on climate protection measures
CN113114664A (zh) 基于混合卷积神经网络的异常流量检测系统及方法
Weber et al. A general method to find highly coordinating communities in social media through inferred interaction links
Stempel et al. Beyond the Blue Blob: Salience and Perceived Legitimacy of Alternative Sea Level Rise Visualizations
CN112559844B (zh) 自然灾害舆情分析方法和装置
CN101676992A (zh) 一种针对回声隐写的隐写分析方法
CN110310215A (zh) 一种知识产权的侵权提醒系统
CN114553497B (zh) 基于特征融合的内部威胁检测方法
CN112818125B (zh) 一种网络话题结构演化发现方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200410