CN112966500B - 基于人工智能组态的网络数据链安全监测平台 - Google Patents

基于人工智能组态的网络数据链安全监测平台 Download PDF

Info

Publication number
CN112966500B
CN112966500B CN202110186100.8A CN202110186100A CN112966500B CN 112966500 B CN112966500 B CN 112966500B CN 202110186100 A CN202110186100 A CN 202110186100A CN 112966500 B CN112966500 B CN 112966500B
Authority
CN
China
Prior art keywords
module
comment
keywords
keyword
malicious
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110186100.8A
Other languages
English (en)
Other versions
CN112966500A (zh
Inventor
刘智勇
陈敏超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Hongrui Information Technology Co Ltd
Original Assignee
Zhuhai Hongrui Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuhai Hongrui Information Technology Co Ltd filed Critical Zhuhai Hongrui Information Technology Co Ltd
Priority to CN202110186100.8A priority Critical patent/CN112966500B/zh
Publication of CN112966500A publication Critical patent/CN112966500A/zh
Application granted granted Critical
Publication of CN112966500B publication Critical patent/CN112966500B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了基于人工智能组态的网络数据链安全监测平台,包括:网络数据截取模块、热度评估模块、热门评论获取模块、关键词提取模块、关键词库、关联匹配模块、恶意评论监测模块、评论管理模块和人工智能学习模块,采集网络上发布的文章内容,通过热度评估模块综合性地评估其热门程度,通过热门评论获取热门文章的评论内容,通过关键词提取模块提取评论中的关键词,与关键词库中的词汇进行相似度匹配,通过恶意评论监测模块判断匹配度高的关键词是否带有恶意性质,对对应的评论进行屏蔽处理,最终通过人工智能训练学习监测到的关键词以优化关键词库,提高了每次监测恶意评论的有效性,减轻了对相关人员的伤害。

Description

基于人工智能组态的网络数据链安全监测平台
技术领域
本发明涉及网络数据监测技术领域,具体为基于人工智能组态的网络数据链安全监测平台。
背景技术
人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作,随着网络时代的进步,人工智能的应用领域不断地扩大,人工智能由不同的领域组成,如机器学习、语言识别、图像识别、自然语言处理和专家系统等,也可以用来对网络数据进行监测,人们会经常性地在网上发布信息或文章,一些热度较高的文章会引来网友们的讨论和评论,然而,并非所有的评论是善意或保持中立的,也会出现一些恶意的评论,会给相关人员带来很大的伤害,为了避免这种情况发生,需要对网上出现的评论进行实时的监测,并对监测到的恶意评论进行及时地处理,所有的评论中都会由核心关键词,通过一定的方法监测出关键词,并利用人工智能技术对其进行机器学习更新机器词库,提高了每次监测恶意评论的有效性,减轻了对相关人员的伤害。
所以,人们需要基于人工智能组态的网络数据链安全监测平台来解决上述问题。
发明内容
本发明的目的在于提供基于人工智能组态的网络数据链安全监测平台,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:基于人工智能组态的网络数据链安全监测平台,其特征在于:所述平台包括:网络数据截取模块、热度评估模块、热门评论获取模块、关键词提取模块、关键词库、关联匹配模块、恶意评论监测模块、评论管理模块和人工智能学习模块;
所述网络数据截取模块的输出端连接所述热度评估模块的输入端,所述热度评估模块的输出端连接所述热门评论获取模块的输入端,所述热门评论获取模块的输出端连接所述关键词提取模块的输入端,所述关键词库的输出端连接所述关键词提取模块和所述关联匹配模块的输出端,所述关键词提取模块的输出端连接所述关联匹配模块的输入端,所述关联匹配模块的输出端连接所述恶意评论监测模块的输入端,所述恶意评论监测模块的输出端连接所述评论管理模块和所述人工智能学习模块的输入端;
所述网络数据截取模块用于获取网络上的部分文章内容,所述热度评估模块用于评估获取到的文章的热门程度,所述热门评论获取模块用于筛选获取相对热门文章的评论内容,所述关键词提取模块用于提取筛选出评论内容中的关键词,所述关联匹配模块用于匹配所述关键词库中存储的关键词和提取到的关键词特征,所述关键词库中存储有历史评论内容中带有恶意性质的关键词,所述恶意评论监测模块用于依据匹配结果监测评论中带有恶意性质的关键词,所述评论管理模块用于对带有恶意关键词的评论进行禁止发布或传播管理,所述人工智能学习模块用于对所述关键词库未存储的新监测到的关键词进行训练学习并对所述关键词库进行更新。
进一步的,所述热度评估模块对获取到的文章热度评估的依据是内容的初始阅读数、点赞数和评论数加权之和、内容当前的阅读数、点赞数和评论数加权之和、热度衰减速度以及文章发布以来的时长,所述初始阅读数、点赞数和评论数加权之和表示文章的初始热度,所述当前的阅读数、点赞数和评论数加权之和表示文章现在维持的热度。
进一步的,所述网络数据截取模块随机截取网络上的文章内容后,将截取内容传输到所述热度评估模块,所述热度评估模块依据阅读、点赞和评论数对截取到的内容进行热度评估,将评估数据传输到所述热门评论获取模块,所述热门评论获取模块依据评估结果筛选出热度高的文章的评论内容,将评论内容传输到所述关键词提取模块中,所述关键词提取模块调取所述关键词库中的所有关键词,并提取接收到的评论内容中的关键词,将所述关键词库中和评论内容中的关键词输入到所述关联匹配模块中。
进一步的,所述关联匹配模块接收到所述关键词库和评论内容中的关键词后,依据两者的特征匹配和所述关键词库中相似的关键词,将匹配结果传输到所述恶意评论监测模块中,所述恶意评论监测模块依据匹配结果监测评论中带有恶意性质的关键词,将监测结果传输到所述评论管理模块中,所述评论管理模块对带有恶意关键词的评论进行删除和屏蔽处理,所述恶意评论监测模块同时将带有恶意性质的关键词传输到所述人工智能学习模块,所述人工智能学习模块对新监测到的关键词进行训练学习并对所述关键词库进行更新,对带有恶意关键词的评论进行删除或屏蔽处理,避免了恶意评论内容的传播,减轻了对与评论内容相关人员的伤害。
进一步的,所述网络数据截取模块随机截取网络上的文章内容,获取到所有文章内容的初始阅读数集合为a={a1,a2,...,an},当前阅读数集合为a’={a1’,a2’,...,an’},初始评论数集合为b={b1,b2,...,bn},当前评论数集合为b’={b1’,b2’,...,bn’},初始点赞数集合为c={c1,c2,...,cn},当前点赞数集合为c’={c1’,c2’,...,cn’},获取到热度衰减速度集合为V={V1,V2,...,Vn},文章发布以来的时长集合为T={T1,T2,...,Tn},其中,n表示截取的文章总数,将获取到的数据传输到所述热度评估模块中。
进一步的,通过所述热度评估模块对截取到的内容进行热度评估:根据下列公式分别计算文章内容的初始热度W及当前维持热度W’:
Figure GDA0003302171960000031
Figure GDA0003302171960000032
其中,i表示截取到的随机一篇文章序号,根据下列公式计算截取到的内容热度H:
Figure GDA0003302171960000033
得到所有文章的热度集合:H={H1,H2,...,Hn},将评估数据传输到所述热门评论获取模块,所述热门评论获取模块设置有热度阈值H’,将H和H’比较,筛选出大于等于热度阈值H’的文章评论,将筛选出的评论内容传输到所述关键词提取模块中,文章的热度会随着时间的推移而发生衰减,依据初始和当前不同的热度计算文章热度的目的在于更准确地分析文章维持热度能力,为筛选文章评论内容提供重点,减轻了筛选的难度,提高了提取评论关键词的效率。
进一步的,所述关键词提取模块提取到筛选出的评论内容中出现频率最高的关键词,对提取到的关键词进行编号,编号集合为A={A1,A2,...,Am},其中,m表示筛选出的文章评论中提取的关键词总数,提取到的关键词特征向量坐标集合为
Figure GDA0003302171960000042
所述关键词库中存储的关键词编号集合为B={B1,B2,...,Bp},对应的关键词特征向量坐标集合为
Figure GDA0003302171960000043
Figure GDA0003302171960000044
其中,p表示所述关键词库中存储的关键词总数,将提取到的关键词信息传输到所述关联匹配模块中。
进一步的,所述关联匹配模块对所述关键词库中存储的关键词特征和提取到的关键词特征进行匹配:根据下列公式计算关键词相似系数Q:
Figure GDA0003302171960000041
相似系数越大,说明两者的匹配度越高,设定相似系数阈值为Q’,将Q与Q’相比较:若Q≥Q',说明所述关键词库和提取到的关键词相似程度高;若Q<Q',说明所述关键词库和提取到的关键词相似程度低,将比较的结果传输到所述恶意评论监测模块中,根据向量之间的夹角余弦值来计算其相似系数的目的在于确认提取到的关键词与关键词库中词汇的匹配度,提高了恶意评论监测模块识别监测带有恶意性质关键词的评论的效率,为评论管理模块调整带有恶意性质关键词的评论内容对他人屏蔽提供有效的帮助。
进一步的,所述恶意评论监测模块将相似系数大于等于阈值Q’的关键词进行监测识别,判断关键词是否有恶意性质,将识别到的带有恶意性质关键词的评论内容传输到所述评论管理模块中,所述评论管理模块调整对应的评论内容对他人屏蔽。
进一步的,所述恶意评论监测模块将识别到相似系数大于等于阈值Q’并带有恶意性质的关键词传输到所述人工智能学习模块中,所述人工智能学习模块对关键词进行训练学习,将新监测到的与所述关键词库中的对应匹配度高的关键词存储到一起,更新所述关键词库,帮助了对关键词库进行调优和查询优化,提高了每次监测恶意评论的效率。
与现有技术相比,本发明所达到的有益效果是:
1.本发明通过网络数据截取模块获取网络上发布的部分文章内容,通过热度评估模块对截取到的内容进行热度评估:由于文章的热度会随着时间的推移而发生衰减变化,根据对应文章的初始和当前的阅读数、评论数和点赞数综合性地评估文章的热门程度提高了热度评估结果的准确性,将评估数据传输到热门评论获取模块,通过与热门评论获取模块中设置的热度阈值进行比较,进一步筛选出热度保持稳定的文章的评论,将筛选出的评论内容传输到关键词提取模块中,通过关键词提取模块提取筛选出的评论内容中出现频率最高的关键词,将之与关键词库中的关键词特征进行比较,通过关联匹配模块匹配出相似度较高的关键词,通过恶意评论监测模块对匹配度高的关键词进行监测识别,判断其是否有恶意性质,通过评论管理模块调整带有恶意性质关键词的评论内容对他人屏蔽,有效减轻了网络上的不当言论对相关人员的伤害;
2.本发明通过人工智能学习模块对关键词进行训练学习,将新监测到的与关键词库中的对应匹配度高的关键词存储到一起,更新关键词库,帮助了关键词库进行调优和查询优化,丰富了关键词库中的数据量,提高了每次监测恶意评论的效率,降低了监测关键词的时延。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明基于人工智能组态的网络数据链安全监测平台的结构图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
请参阅图1,本发明提供技术方案:基于人工智能组态的网络数据链安全监测平台,其特征在于:平台包括:网络数据截取模块、热度评估模块、热门评论获取模块、关键词提取模块、关键词库、关联匹配模块、恶意评论监测模块、评论管理模块和人工智能学习模块;
网络数据截取模块的输出端连接热度评估模块的输入端,热度评估模块的输出端连接热门评论获取模块的输入端,热门评论获取模块的输出端连接关键词提取模块的输入端,关键词库的输出端连接关键词提取模块和关联匹配模块的输出端,关键词提取模块的输出端连接关联匹配模块的输入端,关联匹配模块的输出端连接恶意评论监测模块的输入端,恶意评论监测模块的输出端连接评论管理模块和人工智能学习模块的输入端;
网络数据截取模块用于获取网络上的部分文章内容,热度评估模块用于评估获取到的文章的热门程度,热门评论获取模块用于筛选获取相对热门文章的评论内容,关键词提取模块用于提取筛选出评论内容中的关键词,关联匹配模块用于匹配关键词库中存储的关键词和提取到的关键词特征,关键词库中存储有历史评论内容中带有恶意性质的关键词,恶意评论监测模块用于依据匹配结果监测评论中带有恶意性质的关键词,评论管理模块用于对带有恶意关键词的评论进行禁止发布或传播管理,人工智能学习模块用于对关键词库未存储的新监测到的关键词进行训练学习并对关键词库进行更新。
热度评估模块对获取到的文章热度评估的依据是内容的初始阅读数、点赞数和评论数加权之和、内容当前的阅读数、点赞数和评论数加权之和、热度衰减速度以及文章发布以来的时长,初始阅读数、点赞数和评论数加权之和表示文章的初始热度,当前阅读数、点赞数和评论数加权之和表示文章现在维持的热度。
网络数据截取模块随机截取网络上的文章内容后,将截取内容传输到热度评估模块,热度评估模块依据阅读、点赞和评论数对截取到的内容进行热度评估,将评估数据传输到热门评论获取模块,热门评论获取模块依据评估结果筛选出热度高的文章的评论内容,将评论内容传输到关键词提取模块中,关键词提取模块调取关键词库中的所有关键词,并提取接收到的评论内容中的关键词,将关键词库和评论内容中的关键词输入到关联匹配模块中。
关联匹配模块接收到关键词库中和评论内容中的关键词后,依据两者的特征匹配和关键词库中相似的关键词,将匹配结果传输到恶意评论监测模块中,恶意评论监测模块依据匹配结果监测评论中带有恶意性质的关键词,将监测结果传输到评论管理模块中,评论管理模块对带有恶意关键词的评论进行删除和屏蔽处理,恶意评论监测模块同时将带有恶意性质的关键词传输到人工智能学习模块,人工智能学习模块对新监测到的关键词进行训练学习并对关键词库进行更新,对带有恶意关键词的评论进行删除或屏蔽处理,能够避免恶意评论内容的传播并减轻对与评论内容相关人员的伤害。
网络数据截取模块随机截取网络上的文章内容,获取到所有文章内容的初始阅读数集合为a={a1,a2,...,an},当前阅读数集合为a’={a1’,a2’,...,an’},初始评论数集合为b={b1,b2,...,bn},当前评论数集合为b’={b1’,b2’,...,bn’},初始点赞数集合为c={c1,c2,...,cn},当前点赞数集合为c’={c1’,c2’,...,cn’},获取到热度衰减速度集合为V={V1,V2,...,Vn},文章发布以来的时长集合为T={T1,T2,...,Tn},其中,n表示截取的文章总数,将获取到的数据传输到热度评估模块中。
通过热度评估模块对截取到的内容进行热度评估:根据下列公式分别计算文章内容的初始热度W及当前维持热度W’:
Figure GDA0003302171960000071
Figure GDA0003302171960000072
其中,i表示截取到的随机一篇文章序号,根据下列公式计算截取到的内容热度H:
Figure GDA0003302171960000081
得到所有文章的热度集合:H={H1,H2,...,Hn},将评估数据传输到热门评论获取模块,热门评论获取模块设置有热度阈值H’,将H和H’比较,筛选出大于等于热度阈值H’的文章评论,将筛选出的评论内容传输到关键词提取模块中,文章的热度会随着时间的推移而发生衰减,依据初始和当前不同的热度计算文章热度的目的在于更准确地分析文章维持热度能力,为筛选文章评论内容提供重点,便于减轻筛选的难度以提高提取评论关键词的效率。
关键词提取模块提取到筛选出的评论内容中出现频率最高的关键词,对提取到的关键词进行编号,编号集合为A={A1,A2,...,Am},其中,m表示筛选出的文章评论中提取的关键词总数,提取到的关键词特征向量坐标集合为
Figure GDA0003302171960000083
Figure GDA0003302171960000084
关键词库中存储的关键词编号集合为B={B1,B2,...,Bp},对应的关键词特征向量坐标集合为
Figure GDA0003302171960000085
Figure GDA0003302171960000086
其中,p表示关键词库中存储的关键词总数,将提取到的关键词信息传输到关联匹配模块中。
关联匹配模块对关键词库中存储的关键词特征和提取到的关键词特征进行匹配:根据下列公式计算关键词相似系数Q:
Figure GDA0003302171960000082
相似系数越大,说明两者的匹配度越高,设定相似系数阈值为Q’,将Q与Q’相比较:若Q≥Q',说明关键词库和提取到的关键词相似程度高;若Q<Q',说明关键词库和提取到的关键词相似程度低,将比较的结果传输到恶意评论监测模块中,根据向量之间的夹角余弦值来计算其相似系数的目的在于确认提取到的关键词与关键词库中词汇的匹配度,便于提高恶意评论监测模块识别监测带有恶意性质关键词的评论的效率,为评论管理模块调整带有恶意性质关键词的评论内容对他人屏蔽提供有效的帮助。
恶意评论监测模块将相似系数大于等于阈值Q’的关键词进行监测识别,判断关键词是否有恶意性质,将识别到的带有恶意性质关键词的评论内容传输到评论管理模块中,评论管理模块调整对应的评论内容对他人屏蔽。
恶意评论监测模块将识别到相似系数大于等于阈值Q’并带有恶意性质的关键词传输到人工智能学习模块中,人工智能学习模块对关键词进行训练学习,将新监测到的与关键词库中的对应匹配度高的关键词存储到一起,更新关键词库,便于帮助对关键词库进行调优和查询优化,能够提高每次监测恶意评论的效率。实施例一:网络数据截取模块获取到所有文章内容的初始阅读数集合为a={a1,a2,a3,a4,a5}={1000,500,600,1200,2000},当前阅读数集合为a’={a1’,a2’,a3’,a4’,a5’}={8000,5000,6000,50000,4000},初始评论数集合为b={b1,b2,b3,b4,b5}={20,6,12,18,100},当前评论数集合为b’={20,160,50,200,350},初始点赞数集合为c={c1,c2,c3,c4,c5}={0,30,400,500,60},当前点赞数集合为c’={c1’,c2’,c3’,c4’,c5’}={5,300,400,1000,2000},热度衰减速度集合为V={2,5,6,3,2.1},文章发布以来的时长集合为T={20,10,5,8,30},根据公式
Figure GDA0003302171960000091
Figure GDA0003302171960000092
分别计算文章内容的初始热度W及当前维持热度W’:W={1020,536,1012,1718,2160};W’={8025,5460,6450,51200,6350},根据公式
Figure GDA0003302171960000093
得到截取到文章的内容热度H={H1,H2,H3,H4,H5}={20.51,0.04,0.16,72.59,6.73},设置热度阈值H’=10,大于等于热度阈值H’的文章有文章1和文章4,将对应评论内容传输到关键词提取模块中,关键词提取模块提取到筛选出的评论内容中出现频率最高的关键词,对提取到的关键词进行编号,编号集合为A={A1,A2},提取到的关键词特征向量坐标集合为
Figure GDA0003302171960000094
关键词库中存储的关键词编号集合为B={B1,B2,B3,B4,B5},对应的关键词特征向量坐标集合为
Figure GDA0003302171960000095
根据公式
Figure GDA0003302171960000096
计算关键词相似系数Q:对于A1:相似系数分别为:4.9、60.9、0.9、45.1、13.0;对于A2:0.6、0.8、0.5、1.0、0.7,设定相似系数阈值为Q’=10,将Q与Q’相比较,关键词A1和关键词库相似程度高,恶意评论监测模块对关键词A1进行监测识别,若A1带有恶意性质,评论管理模块调整对应的评论内容对他人屏蔽,人工智能学习模块对关键词A1进行训练学习,并将之与B2存储到一起,更新关键词库。
最后应说明的是:以上所述仅为本发明的优选实例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.基于人工智能组态的网络数据链安全监测平台,其特征在于:所述平台包括:网络数据截取模块、热度评估模块、热门评论获取模块、关键词提取模块、关键词库、关联匹配模块、恶意评论监测模块、评论管理模块和人工智能学习模块;
所述网络数据截取模块的输出端连接所述热度评估模块的输入端,所述热度评估模块的输出端连接所述热门评论获取模块的输入端,所述热门评论获取模块的输出端连接所述关键词提取模块的输入端,所述关键词库的输出端连接所述关键词提取模块和所述关联匹配模块的输出端,所述关键词提取模块的输出端连接所述关联匹配模块的输入端,所述关联匹配模块的输出端连接所述恶意评论监测模块的输入端,所述恶意评论监测模块的输出端连接所述评论管理模块和所述人工智能学习模块的输入端;
所述网络数据截取模块用于获取网络上的部分文章内容,所述热度评估模块用于评估获取到的文章的热门程度,所述热门评论获取模块用于筛选获取相对热门文章的评论内容,所述关键词提取模块用于提取筛选出评论内容中的关键词,所述关联匹配模块用于匹配所述关键词库中存储的关键词和提取到的关键词特征,所述关键词库中存储有历史评论内容中带有恶意性质的关键词,所述恶意评论监测模块用于依据匹配结果监测评论中带有恶意性质的关键词,所述评论管理模块用于对带有恶意关键词的评论进行禁止发布或传播管理,所述人工智能学习模块用于对所述关键词库未存储的新监测到的关键词进行训练学习并对所述关键词库进行更新;
所述热度评估模块对获取到的文章热度评估的依据是内容的初始阅读数、点赞数和评论数加权之和、内容当前的阅读数、点赞数和评论数加权之和、热度衰减速度以及文章发布以来的时长,所述初始阅读数、点赞数和评论数加权之和表示文章的初始热度,所述当前的阅读数、点赞数和评论数加权之和表示文章现在维持的热度;
所述网络数据截取模块随机截取网络上的文章内容后,将截取内容传输到所述热度评估模块,所述热度评估模块依据阅读、点赞和评论数对截取到的内容进行热度评估,将评估数据传输到所述热门评论获取模块,所述热门评论获取模块依据评估结果筛选出热度高的文章的评论内容,将评论内容传输到所述关键词提取模块中,所述关键词提取模块调取所述关键词库中的所有关键词,并提取接收到的评论内容中的关键词,将所述关键词库和评论内容中的关键词输入到所述关联匹配模块中;
所述网络数据截取模块随机截取网络上的文章内容,获取到所有文章内容的初始阅读数集合为a={a1,a2,...,an},当前阅读数集合为a’={a1’,a2’,...,an’},初始评论数集合为b={b1,b2,...,bn},当前评论数集合为b’={b1’,b2’,...,bn’},初始点赞数集合为c={c1,c2,...,cn},当前点赞数集合为c’={c1’,c2’,...,cn’},获取到热度衰减速度集合为V={V1,V2,...,Vn},文章发布以来的时长集合为T={T1,T2,...,Tn},其中,n表示截取的文章总数,将获取到的数据传输到所述热度评估模块中;
通过所述热度评估模块对截取到的内容进行热度评估:根据下列公式分别计算文章内容的初始热度W及当前维持热度W’:
Figure FDA0003302171950000021
Figure FDA0003302171950000022
其中,i表示截取到的随机一篇文章序号,根据下列公式计算截取到的内容热度H:
Figure FDA0003302171950000023
得到所有文章的热度集合:H={H1,H2,...,Hn},将评估数据传输到所述热门评论获取模块,所述热门评论获取模块设置有热度阈值H’,将H和H’比较,筛选出大于等于热度阈值H’的文章评论,将筛选出的评论内容传输到所述关键词提取模块中。
2.根据权利要求1所述的基于人工智能组态的网络数据链安全监测平台,其特征在于:所述关联匹配模块接收到所述关键词库和评论内容中的关键词后,依据两者的特征匹配和所述关键词库中相似的关键词,将匹配结果传输到所述恶意评论监测模块中,所述恶意评论监测模块依据匹配结果监测评论中带有恶意性质的关键词,将监测结果传输到所述评论管理模块中,所述评论管理模块对带有恶意关键词的评论进行删除和屏蔽处理,所述恶意评论监测模块同时将带有恶意性质的关键词传输到所述人工智能学习模块,所述人工智能学习模块对新监测到的关键词进行训练学习并对所述关键词库进行更新。
3.根据权利要求1所述的基于人工智能组态的网络数据链安全监测平台,其特征在于:所述关键词提取模块提取到筛选出的评论内容中出现频率最高的关键词,对提取到的关键词进行编号,编号集合为A={A1,A2,...,Am},其中,m表示筛选出的文章评论中提取的关键词总数,提取到的关键词特征向量坐标集合为
Figure FDA0003302171950000032
所述关键词库中存储的关键词编号集合为B={B1,B2,...,Bp},对应的关键词特征向量坐标集合为
Figure FDA0003302171950000033
Figure FDA0003302171950000034
其中,p表示所述关键词库中存储的关键词总数,将提取到的关键词信息传输到所述关联匹配模块中。
4.根据权利要求3所述的基于人工智能组态的网络数据链安全监测平台,其特征在于:所述关联匹配模块对所述关键词库中存储的关键词特征和提取到的关键词特征进行匹配:根据下列公式计算关键词相似系数Q:
Figure FDA0003302171950000031
相似系数越大,说明两者的匹配度越高,设定相似系数阈值为Q’,将Q与Q’相比较:若Q≥Q',说明所述关键词库和提取到的关键词相似程度高;若Q<Q',说明所述关键词库和提取到的关键词相似程度低,将比较的结果传输到所述恶意评论监测模块中。
5.根据权利要求4所述的基于人工智能组态的网络数据链安全监测平台,其特征在于:所述恶意评论监测模块将相似系数大于等于阈值Q’的关键词进行监测识别,判断关键词是否有恶意性质,将识别到的带有恶意性质关键词的评论内容传输到所述评论管理模块中,所述评论管理模块调整对应的评论内容对他人屏蔽。
6.根据权利要求5所述的基于人工智能组态的网络数据链安全监测平台,其特征在于:所述恶意评论监测模块将识别到相似系数大于等于阈值Q’并带有恶意性质的关键词传输到所述人工智能学习模块中,所述人工智能学习模块对关键词进行训练学习,将新监测到的与所述关键词库中的对应匹配度高的关键词存储到一起,更新所述关键词库。
CN202110186100.8A 2021-02-15 2021-02-15 基于人工智能组态的网络数据链安全监测平台 Active CN112966500B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110186100.8A CN112966500B (zh) 2021-02-15 2021-02-15 基于人工智能组态的网络数据链安全监测平台

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110186100.8A CN112966500B (zh) 2021-02-15 2021-02-15 基于人工智能组态的网络数据链安全监测平台

Publications (2)

Publication Number Publication Date
CN112966500A CN112966500A (zh) 2021-06-15
CN112966500B true CN112966500B (zh) 2021-11-23

Family

ID=76284938

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110186100.8A Active CN112966500B (zh) 2021-02-15 2021-02-15 基于人工智能组态的网络数据链安全监测平台

Country Status (1)

Country Link
CN (1) CN112966500B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113627559A (zh) * 2021-08-19 2021-11-09 腾讯音乐娱乐科技(深圳)有限公司 一种潜力爆款歌曲挖掘方法、装置、设备及介质
CN114139210B (zh) * 2021-12-15 2022-10-11 中软数智信息技术(武汉)有限公司 一种基于智慧业务的大数据安全威胁处理方法及系统
CN114897176B (zh) * 2022-03-11 2023-11-07 内蒙古塞上明珠科技成果推广服务有限公司 一种基于人工智能的互联网大数据处理系统及方法
CN115905600B (zh) * 2022-12-25 2023-12-12 广东朝阳企讯通科技有限公司 基于大数据平台的网络安全分析系统及方法
CN117556146B (zh) * 2024-01-10 2024-03-22 石家庄邮电职业技术学院 一种网络数据信息处理系统、方法、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923544A (zh) * 2009-06-15 2010-12-22 北京百分通联传媒技术有限公司 一种监测展示互联网热点的方法
WO2019244849A1 (ja) * 2018-06-19 2019-12-26 株式会社竹中工務店 投稿情報抽出制御装置、投稿情報抽出制御プログラム
CN111611461A (zh) * 2019-05-14 2020-09-01 北京精准沟通传媒科技股份有限公司 一种数据处理方法和装置
CN112231615A (zh) * 2020-09-29 2021-01-15 新华三信息安全技术有限公司 一种文章的敏感信息检测方法及装置

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08249335A (ja) * 1995-03-13 1996-09-27 Nippon Telegr & Teleph Corp <Ntt> キーワード照合支援方法及びキーワード照合支援装置
CN107644089B (zh) * 2017-09-26 2020-08-04 武大吉奥信息技术有限公司 一种基于网络媒体的热门事件提取方法
CN108021651B (zh) * 2017-11-30 2020-07-28 中科金联(北京)科技有限公司 一种网络舆情风险评估方法及装置
CN108268448A (zh) * 2018-01-24 2018-07-10 闽南师范大学 一种基于网络新闻的舆情分析方法、系统及介质
CN108959383A (zh) * 2018-05-31 2018-12-07 平安科技(深圳)有限公司 网络舆情的分析方法、装置及计算机可读存储介质
CN109271512B (zh) * 2018-08-29 2023-11-24 中国平安保险(集团)股份有限公司 舆情评论信息的情感分析方法、装置及存储介质
CN109344319B (zh) * 2018-11-01 2021-08-24 中国搜索信息科技股份有限公司 一种基于集成学习的线上内容热度预测方法
CN109857852B (zh) * 2019-01-24 2021-02-23 安徽商贸职业技术学院 一种电商在线评论训练集特征的筛选判断方法及系统
CN109902179A (zh) * 2019-03-04 2019-06-18 上海宝尊电子商务有限公司 基于自然语言处理的筛选电商垃圾评论的方法
CN109977403B (zh) * 2019-03-18 2020-04-14 北京金堤科技有限公司 恶意评论信息识别方法及装置
CN109947946A (zh) * 2019-03-22 2019-06-28 上海诺亚投资管理有限公司 一种预测文章传播热度的方法及装置
CN110287278B (zh) * 2019-06-20 2022-04-01 北京百度网讯科技有限公司 评论生成方法、装置、服务器及存储介质
CN111310021A (zh) * 2019-11-04 2020-06-19 深圳邦拓盛世品牌咨询管理有限公司 一种网络舆情监控方法
CN111310079A (zh) * 2020-02-14 2020-06-19 腾讯科技(深圳)有限公司 评论信息排序方法、装置、存储介质及服务器
CN111461553A (zh) * 2020-04-02 2020-07-28 上饶市中科院云计算中心大数据研究院 景区舆情监测分析系统和方法
CN111797235B (zh) * 2020-06-19 2024-01-26 成都融微软件服务有限公司 基于时间衰减因子的文本实时聚类方法
CN112035604A (zh) * 2020-08-03 2020-12-04 北京宏博知微科技有限公司 一种互联网热点事件的影响力算法
CN112035658B (zh) * 2020-08-05 2024-04-30 海纳致远数字科技(上海)有限公司 基于深度学习的企业舆情监测方法
CN112256946A (zh) * 2020-11-09 2021-01-22 广州瀚信通信科技股份有限公司 基于互联网大数据的全域旅游與情监测分析方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923544A (zh) * 2009-06-15 2010-12-22 北京百分通联传媒技术有限公司 一种监测展示互联网热点的方法
WO2019244849A1 (ja) * 2018-06-19 2019-12-26 株式会社竹中工務店 投稿情報抽出制御装置、投稿情報抽出制御プログラム
CN111611461A (zh) * 2019-05-14 2020-09-01 北京精准沟通传媒科技股份有限公司 一种数据处理方法和装置
CN112231615A (zh) * 2020-09-29 2021-01-15 新华三信息安全技术有限公司 一种文章的敏感信息检测方法及装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
A novel sentence similarity model with word embedding based on convolutional neural network;Haipeng Yao 等;《Concurrency and Computation: Practice and Experie》;20180118;第30卷(第23期);1-12 *
Editorial Versus Audience Gatekeeping:Analyzing News Selection and Consumption Dynamics in Online News Media;Chakraborty A. 等;《IEEE Transactions on Computational Social systems》;20191231;第6卷(第4期);680-691 *
基于信息生态理论的移动环境下微博舆情传播研究;赵丹;《中国优秀博硕士学位论文全文数据库(博士)信息科技辑》;20170915(第09期);I141-4 *
微博热点话题表示及演化研究;潘壮壮;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20200115(第01期);I138-2370 *

Also Published As

Publication number Publication date
CN112966500A (zh) 2021-06-15

Similar Documents

Publication Publication Date Title
CN112966500B (zh) 基于人工智能组态的网络数据链安全监测平台
Kim et al. Method of intrusion detection using deep neural network
CN111428044A (zh) 多模态获取监管识别结果的方法、装置、设备及存储介质
CN111163086A (zh) 一种多源异构的网络安全知识图谱构建与应用方法
Tian et al. Adversarial attacks and defense for CNN based power quality recognition in smart grid
CN109347801A (zh) 一种基于多源词嵌入和知识图谱的漏洞利用风险评估方法
CN106778259A (zh) 一种基于大数据机器学习的异常行为发现方法及系统
CN104809069A (zh) 一种基于集成神经网络的源代码漏洞检测方法
US20230306107A1 (en) A Method of Training a Submodule and Preventing Capture of an AI Module
CN112215292A (zh) 一种基于迁移性的图像对抗样本生成装置及方法
Gül et al. A feature selection algorithm for IDS
CN108229170A (zh) 利用大数据和神经网络的软件分析方法和装置
CN105956740A (zh) 一种基于文本逻辑特征的语义风险计算方法
Pinem et al. Implementation of classification and regression tree (CART) and fuzzy logic algorithm for intrusion detection system
Karanam et al. Intrusion detection mechanism for large scale networks using CNN-LSTM
CN113268370A (zh) 一种根因告警分析方法、系统、设备及存储介质
Kalyani et al. Privacy-preserving classification rule mining for balancing data utility and knowledge privacy using adapted binary firefly algorithm
CN112733954A (zh) 一种基于生成对抗网络的异常流量检测方法
CN112887323B (zh) 一种面向工业互联网边界安全的网络协议关联与识别方法
CN116192537B (zh) 一种apt攻击报告事件抽取方法、系统和存储介质
CN115001763B (zh) 钓鱼网站攻击检测方法、装置、电子设备及存储介质
CN112906722A (zh) 数据异常检测方法、装置及设备
Shakya et al. Intrusion detection system using back propagation algorithm and compare its performance with self organizing map
CN115129896A (zh) 基于对比学习的网络安全应急响应知识图谱关系提取方法
Xu et al. Tree based behavior monitoring for adaptive fraud detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant