CN114691830A - 一种基于大数据的网络安全分析方法及系统 - Google Patents

一种基于大数据的网络安全分析方法及系统 Download PDF

Info

Publication number
CN114691830A
CN114691830A CN202210329890.5A CN202210329890A CN114691830A CN 114691830 A CN114691830 A CN 114691830A CN 202210329890 A CN202210329890 A CN 202210329890A CN 114691830 A CN114691830 A CN 114691830A
Authority
CN
China
Prior art keywords
session
network interaction
session information
feature
interaction session
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210329890.5A
Other languages
English (en)
Other versions
CN114691830B (zh
Inventor
侯宇
顾明丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Dongyun Cloud Computing Co ltd
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202210329890.5A priority Critical patent/CN114691830B/zh
Publication of CN114691830A publication Critical patent/CN114691830A/zh
Application granted granted Critical
Publication of CN114691830B publication Critical patent/CN114691830B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • G06F16/337Profile generation, learning or modification
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1441Countermeasures against malicious traffic

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供的一种基于大数据的网络安全分析方法及系统,通过确定第一网络交互会话信息清单,然后将待进行安全敏感事件标记的网络交互会话信息分别与每一个关联网络交互会话信息进行会话主题匹配处理,得到每一个关联网络交互会话信息的会话主题匹配描述;最后对每一个关联网络交互会话信息的会话主题匹配描述进行描述关键词添加处理,得到每一个关联网络交互会话信息完成描述关键词添加的会话主题匹配描述,这样一来,在本公开实施例中,在对多组网络交互会话信息进行初阶会话主题匹配处理后,还可以对实施初阶会话主题匹配处理后的网络交互会话信息进行描述关键词添加处理可以更加有效地提高网络安全的可靠性和提高网络安全的预警性。

Description

一种基于大数据的网络安全分析方法及系统
技术领域
本申请涉及数据分析技术领域,具体而言,涉及一种基于大数据的网络安全分析方法及系统。
背景技术
大数据是规模非常巨大和复杂的数据集,传统数据库管理工具处理起来面临很多问题,比如说获取、存储、检索、共享、分析和可视化。随着云时代的来临,大数(Big data)也吸引了越来越多的关注。
现目前,大数据技术涉及的范围不断扩大,比如结合大数据对网络安全进行检测和大数据对网络信息传输进行分析等。此外,虽然网络数据安全防护的技术不断提高,即便如此网络数据在交互过程中可能会存在安全隐患(比如黑客入侵导致数据泄露和受到危险程序的入侵导致数据丢失等),如果没有将安全隐患排除,则难以保障网络安全的可靠性和提高网络安全的预警性。
发明内容
鉴于此,本申请提供了一种基于大数据的网络安全分析方法及系统。
第一方面,提供一种基于大数据的网络安全分析方法,应用于网络安全分析系统,所述方法至少包括:
确定第一网络交互会话信息清单,所述第一网络交互会话信息清单包括待进行安全敏感事件标记的网络交互会话信息以及与所述待进行安全敏感事件标记的网络交互会话信息存在关联关系的不少于一个关联网络交互会话信息;将所述待进行安全敏感事件标记的网络交互会话信息分别与每一个关联网络交互会话信息进行会话主题匹配处理,得到每一个关联网络交互会话信息的会话主题匹配描述;
结合所述待进行安全敏感事件标记的网络交互会话信息对每一个关联网络交互会话信息的会话主题匹配描述进行描述关键词添加处理,得到每一个关联网络交互会话信息完成描述关键词添加的会话主题匹配描述;结合所述完成描述关键词添加的会话主题匹配描述确定与所述待进行安全敏感事件标记的网络交互会话信息绑定的目标网络交互会话信息;其中,所述目标网络交互会话信息为完成安全敏感事件标记的网络交互会话信息。
可以理解,在执行上述内容时,本公开实施例通过确定第一网络交互会话信息清单,所述第一网络交互会话信息清单包括待进行安全敏感事件标记的网络交互会话信息以及与所述待进行安全敏感事件标记的网络交互会话信息存在关联关系的不少于一个关联网络交互会话信息;然后将所述待进行安全敏感事件标记的网络交互会话信息分别与每一个关联网络交互会话信息进行会话主题匹配处理,得到每一个关联网络交互会话信息的会话主题匹配描述;最后结合所述待进行安全敏感事件标记的网络交互会话信息对每一个关联网络交互会话信息的会话主题匹配描述进行描述关键词添加处理,得到每一个关联网络交互会话信息完成描述关键词添加的会话主题匹配描述,其中,所述完成描述关键词添加的会话主题匹配描述用于确定与所述待进行安全敏感事件标记的网络交互会话信息绑定的目标网络交互会话信息。这样一来,在本公开实施例中,在对多组网络交互会话信息进行初阶会话主题匹配处理后,还可以对实施初阶会话主题匹配处理后的网络交互会话信息进行描述关键词添加处理可以更加有效地提高网络安全的可靠性和提高网络安全的预警性。
在一种独立实施的实施例中,所述会话主题匹配处理包括如下步骤:
对所述待进行安全敏感事件标记的网络交互会话信息的第一显著会话表达簇和关联网络交互会话信息的第二显著会话表达簇中的显著会话表达进行分布式匹配处理和误差识别处理,得到所述关联网络交互会话信息的会话主题匹配描述,所述第一显著会话表达簇和所述第二显著会话表达簇中皆涵盖不少于一个存在差异的特征识别度的显著会话表达,所述关联网络交互会话信息的会话主题匹配描述的特征识别度与所述待进行安全敏感事件标记的网络交互会话信息的特征识别度一致。
可以理解,在执行上述内容时,通过对显著会话表达进行多维度的处理,从而能够提高会话主题匹配描述的准确性。
在一种独立实施的实施例中,所述对所述待进行安全敏感事件标记的网络交互会话信息的第一显著会话表达簇和关联网络交互会话信息的第二显著会话表达簇中的显著会话表达进行分布式匹配处理和误差识别处理,得到所述关联网络交互会话信息的会话主题匹配描述,包括:
对所述第一显著会话表达簇中特征识别度最低的显著会话表达和所述第二显著会话表达簇中特征识别度最低的显著会话表达进行所述第一特征挖掘处理,得到基础特征损失;
结合所述第一显著会话表达簇中的显著会话表达和所述第二显著会话表达簇中的显著会话表达以及所述基础特征损失,逐一循环实施所述分布式匹配处理和所述误差识别处理,直至确定特征识别度与所述待进行安全敏感事件标记的网络交互会话信息的特征识别度一致的已处理会话主题匹配描述,所述已处理会话主题匹配描述为所述分布式匹配处理的结果;
将所述特征识别度与所述待进行安全敏感事件标记的网络交互会话信息的特征识别度一致的已处理会话主题匹配描述确定为所述会话主题匹配描述。
可以理解,在执行上述内容时,对所述待进行安全敏感事件标记的网络交互会话信息的第一显著会话表达簇和关联网络交互会话信息的第二显著会话表达簇中的显著会话表达进行分布式匹配处理和误差识别处理时,改善基础特征损失不准确的问题,从而能够得到所述关联网络交互会话信息的会话主题匹配描述。
在一种独立实施的实施例中,所述分布式匹配处理的步骤包括:
对已具有的特征识别度最高的特征损失进行特征扩展处理,得到特征扩展后的特征损失;
从所述第二显著会话表达簇中确定与所述特征扩展后的特征损失的特征识别度一致的第一显著会话表达;
对所述第一显著会话表达和特征扩展后的特征损失进行分治处理,得到已处理会话主题匹配描述,所述已处理会话主题匹配描述与所述特征扩展后的特征损失的特征识别度一致,所述已处理会话主题匹配描述用于实施所述误差识别处理得到与所述已处理会话主题匹配描述特征识别度一致的特征损失。
可以理解,在执行上述内容时,通过特征扩展处理能够有效的提高特征损失的可信度,从而能够准确地得到已处理会话主题匹配描述。
在一种独立实施的实施例中,所述误差识别处理的步骤包括:
从所述第一显著会话表达簇中确定与所述特征扩展后的特征损失的特征识别度一致的第二显著会话表达;
将所述已处理会话主题匹配描述和所述第二显著会话表达进行第一特征挖掘处理;
结合所述第一特征挖掘处理的结果和所述特征扩展后的特征损失,得到备用特征损失,所述备用特征损失用于下一次实施所述分布式匹配处理得到备用已处理会话主题匹配描述。
可以理解,在执行上述内容时,通过对第二显著会话表达进行第一特征挖掘处理的步骤,能够有效地提高备用特征损失的可信度。
在一种独立实施的实施例中,所述描述关键词添加处理包括如下步骤:
结合所述待进行安全敏感事件标记的网络交互会话信息确定关联网络交互会话信息的会话主题匹配描述的重要性评价信息,所述重要性评价信息包括关联网络交互会话信息的会话主题匹配描述的第一重要性评价分布和待进行安全敏感事件标记的网络交互会话信息的最高特征识别度显著会话表达的第二重要性评价分布,所述最高特征识别度显著会话表达的特征识别度与所述关联网络交互会话信息的会话主题匹配描述的特征识别度一致;
确定所述关联网络交互会话信息的会话主题匹配描述和所述第一重要性评价分布的第一全局分析结果;
确定所述最高特征识别度显著会话表达和所述第二重要性评价分布的第二全局分析结果;
结合所述第一全局分析结果和所述第二全局分析结果,得到关联网络交互会话信息完成描述关键词添加的会话主题匹配描述。
可以理解,在执行上述内容时,从两种角度进行分析,能够准确的得到第一全局分析结果和第二全局分析结果,根据两个全局分析结果进行比较和分析处理,从而能够提高会话主题匹配描述的准确性。
在一种独立实施的实施例中,所述结合所述完成描述关键词添加的会话主题匹配描述确定与所述待进行安全敏感事件标记的网络交互会话信息绑定的目标网络交互会话信息,包括:使用第二AI线程模型对所述每一个关联网络交互会话信息完成描述关键词添加的会话主题匹配描述进行调整,得到与所述待进行安全敏感事件标记的网络交互会话信息绑定的目标网络交互会话信息。
可以理解,在执行上述内容时,结合所述完成描述关键词添加的会话主题匹配描述时,改善每一个关联网络交互会话信息存在缺陷的问题,从而能准确地确定与待进行安全敏感事件标记的网络交互会话信息绑定的目标网络交互会话信息。
第二方面,提供一种基于大数据的网络安全分析系统,包括互相之间通信的处理器和存储器,所述处理器用于从所述存储器中调取计算机程序,并通过运行所述计算机程序实现上述的方法。
本申请实施例所提供的一种基于大数据的网络安全分析方法及系统,通过确定第一网络交互会话信息清单,所述第一网络交互会话信息清单包括待进行安全敏感事件标记的网络交互会话信息以及与所述待进行安全敏感事件标记的网络交互会话信息存在关联关系的不少于一个关联网络交互会话信息;然后将所述待进行安全敏感事件标记的网络交互会话信息分别与每一个关联网络交互会话信息进行会话主题匹配处理,得到每一个关联网络交互会话信息的会话主题匹配描述;最后结合所述待进行安全敏感事件标记的网络交互会话信息对每一个关联网络交互会话信息的会话主题匹配描述进行描述关键词添加处理,得到每一个关联网络交互会话信息完成描述关键词添加的会话主题匹配描述,其中,所述完成描述关键词添加的会话主题匹配描述用于确定与所述待进行安全敏感事件标记的网络交互会话信息绑定的目标网络交互会话信息。这样一来,在本公开实施例中,在对多组网络交互会话信息进行初阶会话主题匹配处理后,还可以对实施初阶会话主题匹配处理后的网络交互会话信息进行描述关键词添加处理可以更加有效地提高网络安全的可靠性和提高网络安全的预警性。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例所提供的一种基于大数据的网络安全分析方法的流程图。
图2为本申请实施例所提供的一种基于大数据的网络安全分析装置的框图。
图3为本申请实施例所提供的一种基于大数据的网络安全分析系统的架构图。
具体实施方式
为了更好的理解上述技术方案,下面通过附图以及具体实施例对本申请技术方案做详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互组合。
请参阅图1,示出了一种基于大数据的网络安全分析方法,该方法可以包括以下步骤101-104所描述的技术方案。
101;确定第一网络交互会话信息清单,上述第一网络交互会话信息清单包括待进行安全敏感事件标记的网络交互会话信息以及与上述待进行安全敏感事件标记的网络交互会话信息存在关联关系的不少于一个关联网络交互会话信息。
在本实施例中,上述关联网络交互会话信息可以是与上述待进行安全敏感事件标记的网络交互会话信息持续的网络交互会话信息,也可以是与上述待进行安全敏感事件标记的网络交互会话信息相隔一组或多组的网络交互会话信息。即,如果待进行安全敏感事件标记的网络交互会话信息标记为time,其关联网络交互会话信息可以标记为time-n或time+n,其中n不小于2。比如在一个实时网络数据的依照定位分布的网络交互会话信息清单中,待进行安全敏感事件标记的网络交互会话信息关联网络交互会话信息可以理解为该待进行安全敏感事件标记的网络交互会话信息的前一组和/或后一组。上述待进行安全敏感事件标记的网络交互会话信息存在关联关系的网络交互会话信息可以至少不少于一组,本公开实施例不进行一一限定。
102;可以将上述待进行安全敏感事件标记的网络交互会话信息分别与每一个关联网络交互会话信息进行会话主题匹配处理,得到每一个关联网络交互会话信息的会话主题匹配描述。
在网络交互会话信息的处理过程中,需要筛选不少于一个网络交互会话信息认为匹配处理的参考组,其余网络交互会话信息向该参考组关联,进一步地理解,本公开实施例中可以将上述参考组作为待进行安全敏感事件标记的网络交互会话信息,该待进行安全敏感事件标记的网络交互会话信息以及与上述待进行安全敏感事件标记的网络交互会话信息存在关联关系的至少一个网络交互会话信息构成上述网络交互会话信息清单。
进一步地,在具体实施场景中可以上述可以将上述待进行安全敏感事件标记的网络交互会话信息分别与每一个关联网络交互会话信息进行会话主题匹配处理,也可以涵盖待进行安全敏感事件标记的网络交互会话信息与范例进行会话主题匹配处理,即将待进行安全敏感事件标记的网络交互会话信息范例也可以认为是一个关联网络交互会话信息,从而得到若干个会话主题匹配描述。比如,设定上述网络交互会话信息清单中涵盖time-2,time,time+2,三组网络交互会话信息;
并将第time组网络交互会话信息当做上述待进行安全敏感事件标记的网络交互会话信息,第time-2和time+2组网络交互会话信息认为上述关联网络交互会话信息。其次将第time组网络交互会话信息分别与第time-2,time,time+2组网络交互会话信息进行会话主题匹配处理,得到三个关联描述内容。其中可以将待进行安全敏感事件标记的网络交互会话信息与范例的会话主题匹配描述认为参考会话主题匹配描述。
在一种可以替换的实施例中,在可以将上述待进行安全敏感事件标记的网络交互会话信息分别与每一个关联网络交互会话信息进行会话主题匹配处理之前,可以根据上述内容将待进行安全敏感事件标记的网络交互会话信息和不少于一个关联网络交互会话信息进行线程刷选,依次得到上述待进行安全敏感事件标记的网络交互会话信息的第一显著会话表达簇和关联网络交互会话信息的不少于一个第二显著会话表达簇。其中,上述第一显著会话表达簇和上述第二显著会话表达簇中包括皆涵盖若干个特征识别度的显著会话表达,该若干个特征识别度的显著会话表达依照特征识别度关键性分布可以得到扁平结构的显著会话表达。其中,上述第一显著会话表达簇和第二显著会话表达簇绑定的扁平结构的显著会话表达的局部一致,且对应局部的显著会话表达的特征识别度也一致。
进一步地,上述显著会话表达是根据对上述事件清单中的网络交互会话信息进行线程刷选后得到的。从而可以对上述网络交互会话信息清单进行多特征识别度的线程刷选,从而得到存在差异的特征识别度的显著会话表达。然后可以将上述待进行安全敏感事件标记的网络交互会话信息的存在差异的特征识别度的显著会话表达认为上述第一显著会话表达簇,将每一个关联网络交互会话信息的若干个特征识别度的显著会话表达认为该关联网络交互会话信息的第二显著会话表达簇。在得到上述第一显著会话表达簇和上述第二显著会话表达簇之后,则利用上述第一显著会话表达簇和上述第二显著会话表达簇中的显著会话表达进行分布式匹配处理和误差识别处理,从而得到与上述第二显著会话表达簇绑定的关联网络交互会话信息的会话主题匹配描述。
示例性的,可以使用特征确定的方式来对上述事件清单中的网络交互会话信息进行线程筛选,以得到存在差异的特征识别度的显著会话表达。
进一步地,可以通过第一AI线程模型对上述待进行安全敏感事件标记的网络交互会话信息进行线程筛选,得到扁平结构的第一显著会话表达簇和依据第一AI线程模型对上述关联网络交互会话信息进行线程筛选,得到扁平结构的第二显著会话表达簇。
比如,可以使用上述第一AI线程模型对上述待进行安全敏感事件标记的网络交互会话信息和上述关联网络交互会话信息进行线程筛选,得到待进行安全敏感事件标记的网络交互会话信息的两个存在差异的特征识别度的显著会话表达,以及得到关联网络交互会话信息的两个存在差异的特征识别度的显著会话表达。然后将待进行安全敏感事件标记的网络交互会话信息的两个存在差异的特征识别度的显著会话表达认为上述第一显著会话表达簇,可以将上述关联网络交互会话信息的两个存在差异的特征识别度的显著会话表达认为上述第二显著会话表达簇。其中,待进行安全敏感事件标记的网络交互会话信息的两个存在差异的特征识别度的显著会话表达的两个特征识别度和关联网络交互会话信息的两个存在差异的特征识别度的显著会话表达的两个特征识别度对应一致。进一步地,通过线程筛选后,也可以得到不少于三个的存在差异的特征识别度的显著会话表达,本公开实施例不进行一一限定。
在一种可替换的实施例中,上述会话主题匹配处理包括如下步骤:
对上述待进行安全敏感事件标记的网络交互会话信息的第一显著会话表达簇和关联网络交互会话信息的第二显著会话表达簇中的显著会话表达进行分布式匹配处理和误差识别处理,得到上述关联网络交互会话信息的会话主题匹配描述。其中,对所述待进行安全敏感事件标记的网络交互会话信息的第一显著会话表达簇和关联网络交互会话信息的第二显著会话表达簇中的显著会话表达进行分布式匹配处理和误差识别处理,得到上述关联网络交互会话信息的会话主题匹配描述,具体可以包括以下内容:对上述第一显著会话表达簇中特征识别度最低的显著会话表达和上述第二显著会话表达簇中特征识别度最低的显著会话表达进行上述第一特征挖掘处理,得到基础特征损失;然后,基于上述第一显著会话表达簇和上述第二显著会话表达簇中的显著会话表达以及上述基础特征损失,逐一循环实施上述分布式匹配处理和上述误差识别处理,直至确定特征识别度与上述待进行安全敏感事件标记的网络交互会话信息的特征识别度一致的已处理会话主题匹配描述。其中,所述已处理会话主题匹配描述为所述分布式匹配处理的结果;最后,将所述特征识别度与所述待进行安全敏感事件标记的网络交互会话信息的特征识别度一致的已处理会话主题匹配描述确定为所述会话主题匹配描述。
在本公开实施例中,在执行会话主题匹配处理时,需要逐一循环实施上述分布式匹配处理和上述误差识别处理,在循环实施的过程中的终止条件为可以参照以下步骤:执行分布式匹配处理的结果的特征识别度(可以理解的是已处理会话主题匹配描述的特征识别度)与上述待进行安全敏感事件标记的网络交互会话信息的特征识别度一致。
在本实施例中,上述分布式匹配处理的步骤具体可以包括以下内容:对已具有的特征识别度最高的特征损失进行特征扩展处理,得到特征扩展后的特征损失;从上述第二显著会话表达簇中确定与上述特征扩展后的特征损失的特征识别度一致的第一显著会话表达;对上述第一显著会话表达和特征扩展后的特征损失进行弥补操作,得到已处理会话主题匹配描述。其中,所述已处理会话主题匹配描述与所述特征扩展后的特征损失的特征识别度一致,所述已处理会话主题匹配描述用于实施所述误差识别处理得到与所述已处理会话主题匹配描述特征识别度一致的特征损失。
在本公开实施例中,特征损失可以表示对于一致特征识别度的待进行安全敏感事件标记的网络交互会话信息的显著会话表达和关联事件的显著会话表达,关联事件的显著会话表达相对于待进行安全敏感事件标记的网络交互会话信息的显著会话表达在每一个定位的误差量。
在本实施例中,上述误差识别处理的步骤具体可以包括以下内容:确定与上述特征扩展后的特征损失的特征识别度一致的已处理会话主题匹配描述,以及从上述第一显著会话表达簇中确定与上述特征扩展后的特征损失的特征识别度一致的第二显著会话表达;将所述已处理会话主题匹配描述和第二显著会话表达进行第一特征挖掘处理;结合所述第一特征挖掘处理的结果和所述特征扩展后的特征损失,得到备用特征损失,所述备用特征损失用于下一次实施所述分布式匹配处理得到备用已处理会话主题匹配描述。其中,上述特征扩展后的特征损失可以表示当前已具有的特征识别度最高的特征损失进行特征扩展后得到的特征损失。
在本公开实施例中,已处理会话主题匹配描述是通过已具有的特征识别度最高的特征损失和关联网络交互会话信息的显著会话表达得到的,特征损失是基于已处理会话主题匹配描述和现有的特征损失进行误差识别处理得到的,然而在开始启动会话主题匹配处理时,既不存在已处理会话主题匹配描述也不存在特征损失。因此,可以设定存在一个第一特征损失,即所述基础特征损失,该特征损失中每一个定位的量化结果皆为M,该第一特征损失特征扩展后的特征识别度和上述第一显著会话表达簇或第二关键内容集中的最低特征识别度的显著会话表达的特征识别度一致。然后根据第一特征损失和第二显著会话表达簇中与该标准化的特征损失特征识别度一致的显著会话表达进行分布式匹配处理,以得到与上述最低特征识别度的显著会话表达的特征识别度一致的会话主题匹配描述,然后基于得到的会话主题匹配描述和上述第一特征损失进行误差识别处理,得到与上述最低特征识别度的显著会话表达的特征识别度一致的基础特征损失。并根据得到的基础特征损失持续逐一循环实施上述分布式匹配处理和上述误差识别处理,直到得到特征识别度与上述待进行安全敏感事件标记的网络交互会话信息一致的会话主题匹配描述为止。设定第一显著会话表达簇中有三个显著会话表达和第二显著会话表达簇中分别有三个显著会话表达 特征识别度皆是逐渐变大。
103;基于上述待进行安全敏感事件标记的网络交互会话信息对每一个关联网络交互会话信息的会话主题匹配描述进行描述关键词添加处理,得到每一个关联网络交互会话信息完成描述关键词添加的会话主题匹配描述。
在本公开实施例中,上述描述关键词添加处理可以表示使用上述待进行安全敏感事件标记的网络交互会话信息的最高特征识别度的显著会话表达(或者是待进行安全敏感事件标记的网络交互会话信息模板)对上述会话主题匹配描述中异常或存在错误的信息进行优化。比如,当待进行安全敏感事件标记的网络交互会话信息中局部约束条件在上述关联网络交互会话信息中存在不清楚或紊乱时,则上述会话主题匹配描述中对于该局部约束条件的数据在一定程度上存在一定程度的影响,所以需要通过待进行安全敏感事件标记的网络交互会话信息中该局部约束条件的信息对上述会话主题匹配描述进行优化,从而得到完成描述关键词添加的会话主题匹配描述。
进一步地,在得到每一个关联网络交互会话信息(可以涵盖待进行安全敏感事件标记的网络交互会话信息模板)的会话主题匹配描述(特征识别度与上述待进行安全敏感事件标记的网络交互会话信息的特征识别度一致)之后,可以使用上述待进行安全敏感事件标记的网络交互会话信息的最高特征识别度显著会话表达(或待进行安全敏感事件标记的网络交互会话信息模板)对每一个关联网络交互会话信息的会话主题匹配描述进行优化步骤,以得到每一个关联网络交互会话信息的完成描述关键词添加的会话主题匹配描述,便于使用每一个关联网络交互会话信息的完成描述关键词添加的会话主题匹配描述确定与上述待进行安全敏感事件标记的网络交互会话信息绑定的目标网络交互会话信息。
在一种可替换的实施例中,上述描述关键词添加处理具体可以包括以下内容:基于上述待进行安全敏感事件标记的网络交互会话信息确定关联网络交互会话信息的会话主题匹配描述的重要性评价信息,上述重要性评价信息包括关联网络交互会话信息的会话主题匹配描述的第一重要性评价分布和待进行安全敏感事件标记的网络交互会话信息的最高特征识别度显著会话表达的第二重要性评价分布,上述最高特征识别度显著会话表达的特征识别度与上述关联网络交互会话信息的会话主题匹配描述的特征识别度一致;确定上述关联网络交互会话信息的会话主题匹配描述和上述第一重要性评价分布的第一全局分析结果;确定上述最高特征识别度显著会话表达和上述第二重要性评价分布的第二全局分析结果;基于上述第一全局分析结果和上述第二全局分析结果,得到关联网络交互会话信息完成描述关键词添加的会话主题匹配描述。其中,上述第一重要性评价分布表征了上述关联网络交互会话信息的会话主题匹配描述中每一个定位的重要性评价。上述第二重要性评价分布表示上述待进行安全敏感事件标记的网络交互会话信息的最高特征识别度的显著会话表达(或者是上述待进行安全敏感事件标记的网络交互会话信息)中每一个定位的重要性评价。
在本实施例中,上述基于上述待进行安全敏感事件标记的网络交互会话信息确定关联网络交互会话信息的会话主题匹配描述的重要性评价信息,具体可以包括以下内容:可以将上述关联网络交互会话信息的会话主题匹配描述和上述最高特征识别度显著会话表达进行第二特征挖掘处理后,使用第一AI线程得到上述第一重要性评价分布;上述关联网络交互会话信息的会话主题匹配描述和上述最高特征识别度显著会话表达进行第三特征挖掘处理后,使用第二AI线程得到上述第二重要性评价分布。然后确定第一重要性评价分布和上述关联网络交互会话信息的会话主题匹配描述的第一全局分析结果,以及确定上述最高特征识别度显著会话表达和上述第二重要性评价分布的第二全局分析结果;最后,可以将上述第一全局分析结果和第二全局分析结果加权处理,得到关联网络交互会话信息完成描述关键词添加的会话主题匹配描述。
本公开实施例通过确定第一网络交互会话信息清单,上述第一网络交互会话信息清单包括待进行安全敏感事件标记的网络交互会话信息以及与上述待进行安全敏感事件标记的网络交互会话信息存在关联关系的不少于一个关联网络交互会话信息;然后可以将上述待进行安全敏感事件标记的网络交互会话信息分别与每一个关联网络交互会话信息进行会话主题匹配处理,得到每一个关联网络交互会话信息的会话主题匹配描述;最后基于上述待进行安全敏感事件标记的网络交互会话信息对每一个关联网络交互会话信息的会话主题匹配描述进行描述关键词添加处理,得到每一个关联网络交互会话信息完成描述关键词添加的会话主题匹配描述,其中,上述完成描述关键词添加的会话主题匹配描述用于确定与上述待进行安全敏感事件标记的网络交互会话信息绑定的目标网络交互会话信息。可以理解的是,在本公开实施例中,在对多组网络交互会话信息进行初阶会话主题匹配处理后,还可以对实施初阶会话主题匹配处理后的网络交互会话信息进行描述关键词添加处理可以更加有效地提高网络安全的可靠性和提高网络安全的预警性。
进一步地,在上述可以将上述待进行安全敏感事件标记的网络交互会话信息分别与每一个关联网络交互会话信息进行会话主题匹配处理之前,上述方法还可以包括以下内容:对上述第一网络交互会话信息清单中的网络交互会话信息进行优化处理。
104;结合所述完成描述关键词添加的会话主题匹配描述确定与所述待进行安全敏感事件标记的网络交互会话信息绑定的目标网络交互会话信息,其中,所述目标网络交互会话信息为完成安全敏感事件标记的网络交互会话信息。
在本公开实施例中,可以通过上述完成描述关键词添加的会话主题匹配描述进行事件调整,获得与上述待进行安全敏感事件标记的网络交互会话信息绑定的目标网络交互会话信息,可以挑选出一个质量较高的目标网络交互会话信息。
进一步的,通过上述完成描述关键词添加的会话主题匹配描述进行事件调整步骤可以包括以下内容:使用第二AI线程模型对上述每一个关联网络交互会话信息完成描述关键词添加的会话主题匹配描述进行调整,得到与上述待进行安全敏感事件标记的网络交互会话信息绑定的目标网络交互会话信息。
在一种可替换的实施例中,在网络安全分析系统收集到的第一信息集中网络交互会话信息清单的准确率不大于判定值的前提下,依次通过本公开实施例的基于大数据的网络安全分析方法中的步骤可以将上述网络交互会话信息清单中的每一网络交互会话信息认为上述待进行安全敏感事件标记的网络交互会话信息进行处理,得到处理后的网络交互会话信息清单;上述AI线程利用涵盖若干个参考网络交互会话信息清单对的信息集配置获得,上述参考网络交互会话信息对涵盖若干个第一参考网络交互会话信息清单和第二参考网络交互会话信息清单,上述第一参考网络交互会话信息清单为上述第二参考网络交互会话信息清单经过压缩得到的准确率小于上述第二参考网络交互会话信息清单的网络交互会话信息清单。
可以通过配置后的AI线程,完成加载的网络交互会话信息清单、输出完成描述关键词添加的会话主题匹配描述和可以确定上述目标网络交互会话信息的事件进行处理的步骤。
本公开实施例中,在上述会话主题匹配处理中,对于加载的的任意两个特征(待进行安全敏感事件标记的网络交互会话信息的显著会话表达和关联网络交互会话信息的显著会话表达),最优选的方式是将关联网络交互会话信息向待进行安全敏感事件标记的网络交互会话信息上关联。
进一步地,确定第一网络交互会话信息清单,上述第一网络交互会话信息清单包括待进行安全敏感事件标记的网络交互会话信息以及与上述待进行安全敏感事件标记的网络交互会话信息存在关联关系的不少于一个关联网络交互会话信息;可以将上述待进行安全敏感事件标记的网络交互会话信息分别与每一个关联网络交互会话信息进行会话主题匹配处理,得到每一个关联网络交互会话信息的会话主题匹配描述;基于上述待进行安全敏感事件标记的网络交互会话信息对每一个关联网络交互会话信息的会话主题匹配描述进行描述关键词添加处理,得到每一个关联网络交互会话信息完成描述关键词添加的会话主题匹配描述;结合所述完成描述关键词添加的会话主题匹配描述确定与所述待进行安全敏感事件标记的网络交互会话信息绑定的目标网络交互会话信息,其中,所述目标网络交互会话信息为完成安全敏感事件标记的网络交互会话信息。
本公开实施例通过确定第一网络交互会话信息清单,上述第一网络交互会话信息清单包括待进行安全敏感事件标记的网络交互会话信息以及与上述待进行安全敏感事件标记的网络交互会话信息存在关联关系的不少于一个关联网络交互会话信息;然后可以将上述待进行安全敏感事件标记的网络交互会话信息分别与每一个关联网络交互会话信息进行会话主题匹配处理,得到每一个关联网络交互会话信息的会话主题匹配描述;最后基于上述待进行安全敏感事件标记的网络交互会话信息对每一个关联网络交互会话信息的会话主题匹配描述进行描述关键词添加处理,得到每一个关联网络交互会话信息完成描述关键词添加的会话主题匹配描述,其中,上述完成描述关键词添加的会话主题匹配描述用于确定与上述待进行安全敏感事件标记的网络交互会话信息绑定的目标网络交互会话信息。可以理解的是,在本公开实施例中,在对多组网络交互会话信息进行初阶会话主题匹配处理后,还可以对实施初阶会话主题匹配处理后的网络交互会话信息进行描述关键词添加处理可以更加有效地提高网络安全的可靠性和提高网络安全的预警性。
在一种可替换的实施例中,在所述会话主题匹配处理步骤,具体可以包括以下内容:对上述待进行安全敏感事件标记的网络交互会话信息的第一显著会话表达簇和关联网络交互会话信息的第二显著会话表达簇中的显著会话表达进行分布式匹配处理和误差识别处理,得到上述关联网络交互会话信息的会话主题匹配描述,上述第一显著会话表达簇和上述第二显著会话表达簇中皆涵盖不少于一个存在差异的特征识别度的显著会话表达,上述关联网络交互会话信息的会话主题匹配描述的特征识别度与上述待进行安全敏感事件标记的网络交互会话信息的特征识别度一致。
在一种可替换的实施例中,在所述对所述待进行安全敏感事件标记的网络交互会话信息的第一显著会话表达簇和关联网络交互会话信息的第二显著会话表达簇中的显著会话表达进行分布式匹配处理和误差识别处理,得到所述关联网络交互会话信息的会话主题匹配描述步骤,具体可以包括以下步骤:对所述第一显著会话表达簇中特征识别度最低的显著会话表达和所述第二显著会话表达簇中特征识别度最低的显著会话表达进行所述第一特征挖掘处理,得到基础特征损失;结合所述第一显著会话表达簇中的显著会话表达和所述第二显著会话表达簇中的显著会话表达以及所述基础特征损失,逐一循环实施所述分布式匹配处理和所述误差识别处理,直至确定特征识别度与所述待进行安全敏感事件标记的网络交互会话信息的特征识别度一致的已处理会话主题匹配描述,所述已处理会话主题匹配描述为所述分布式匹配处理的结果;将所述特征识别度与所述待进行安全敏感事件标记的网络交互会话信息的特征识别度一致的已处理会话主题匹配描述确定为所述会话主题匹配描述。
在一种可替换的实施例中,在所述分布式匹配处理步骤,具体可以包括以下内容:对已具有的特征识别度最高的特征损失进行特征扩展处理,得到特征扩展后的特征损失;以及从上述第二显著会话表达簇中确定与上述特征扩展后的特征损失的特征识别度一致的第一显著会话表达;以及对上述第一显著会话表达和特征扩展后的特征损失进行分治处理,得到已处理会话主题匹配描述,所述已处理会话主题匹配描述与所述特征扩展后的特征损失的特征识别度一致,所述已处理会话主题匹配描述用于实施所述误差识别处理得到与所述已处理会话主题匹配描述特征识别度一致的特征损失。
在一种可替换的实施例中,在上述误差识别处理步骤,具体可以包括以下内容:确定与上述特征扩展后的特征损失的特征识别度一致的已处理会话主题匹配描述和从上述第一显著会话表达簇中确定与上述特征扩展后的特征损失的特征识别度一致的第二显著会话表达;以及将所述已处理会话主题匹配描述和所述第二显著会话表达进行第一特征挖掘处理;结合所述第一特征挖掘处理的结果和上述特征扩展后的特征损失,得到备用特征损失,所述备用特征损失用于下一次实施所述分布式匹配处理得到备用已处理会话主题匹配描述。
在一种可替换的实施例中,在所述描述关键词添加处理步骤,具体可以包括以下内容:基于上述待进行安全敏感事件标记的网络交互会话信息确定关联网络交互会话信息的会话主题匹配描述的重要性评价信息,上述重要性评价信息包括关联网络交互会话信息的会话主题匹配描述的第一重要性评价分布和待进行安全敏感事件标记的网络交互会话信息的最高特征识别度显著会话表达的第二重要性评价分布,上述最高特征识别度显著会话表达的特征识别度与上述关联网络交互会话信息的会话主题匹配描述的特征识别度一致;以及确定上述关联网络交互会话信息的会话主题匹配描述和上述第一重要性评价分布的第一全局分析结果;以及确定上述最高特征识别度显著会话表达和上述第二重要性评价分布的第二全局分析结果;以及基于上述第一全局分析结果和上述第二全局分析结果,得到关联网络交互会话信息完成描述关键词添加的会话主题匹配描述。
在一种可替换的实施例中,在所述基于上述待进行安全敏感事件标记的网络交互会话信息确定关联网络交互会话信息的会话主题匹配描述的重要性评价步骤,具体可以包括以下内容:可以将上述关联网络交互会话信息的会话主题匹配描述和上述最高特征识别度显著会话表达进行第二特征挖掘处理后,使用第一AI线程得到上述第一重要性评价分布;以及上述关联网络交互会话信息的会话主题匹配描述和上述最高特征识别度显著会话表达进行第三特征挖掘处理后,使用第二AI线程得到上述第二重要性评价分布。
在一种可替换的实施例中,在所述可以将上述待进行安全敏感事件标记的网络交互会话信息分别与每一个关联网络交互会话信息进行会话主题匹配处理之前,具体还可以包括以下内容:使用第一AI线程模型对上述第一网络交互会话信息清单进行线程筛选,得到上述待进行安全敏感事件标记的网络交互会话信息的不少于一个存在差异的特征识别度的显著会话表达,以及上述关联网络交互会话信息的不少于一个存在差异的特征识别度的显著会话表达。
在一种可替换的实施例中,在所述结合所述完成描述关键词添加的会话主题匹配描述确定与所述待进行安全敏感事件标记的网络交互会话信息绑定的目标网络交互会话信息步骤,具体可以包括以下内容:使用第二AI线程模型对上述每一个关联网络交互会话信息完成描述关键词添加的会话主题匹配描述进行调整,得到与上述待进行安全敏感事件标记的网络交互会话信息绑定的目标网络交互会话信息。
在一种可替换的实施例中,上述网络安全分析系统基于AI线程进行实施;上述AI线程利用涵盖若干个参考网络交互会话信息清单对的信息集配置获得,上述参考网络交互会话信息对涵盖若干个第一参考网络交互会话信息清单和第二参考网络交互会话信息清单,上述第一参考网络交互会话信息清单为上述第二参考网络交互会话信息清单经过压缩得到的准确率小于上述第二参考网络交互会话信息清单的网络交互会话信息清单。
在一种可替换的实施例中,在所述可以将上述待进行安全敏感事件标记的网络交互会话信息分别与每一个关联网络交互会话信息进行会话主题匹配处理之前,具体可以包括以下内容:对上述第一网络交互会话信息清单中的网络交互会话信息进行优化处理。
在上述基础上,请结合参阅图2,提供了一种基于大数据的网络安全分析装置200,应用于基于大数据的网络安全分析系统,所述装置包括:
主题匹配模块210,用于确定第一网络交互会话信息清单,所述第一网络交互会话信息清单包括待进行安全敏感事件标记的网络交互会话信息以及与所述待进行安全敏感事件标记的网络交互会话信息存在关联关系的不少于一个关联网络交互会话信息;将所述待进行安全敏感事件标记的网络交互会话信息分别与每一个关联网络交互会话信息进行会话主题匹配处理,得到每一个关联网络交互会话信息的会话主题匹配描述;
信息获得模块220,用于结合所述待进行安全敏感事件标记的网络交互会话信息对每一个关联网络交互会话信息的会话主题匹配描述进行描述关键词添加处理,得到每一个关联网络交互会话信息完成描述关键词添加的会话主题匹配描述;结合所述完成描述关键词添加的会话主题匹配描述确定与所述待进行安全敏感事件标记的网络交互会话信息绑定的目标网络交互会话信息;其中,所述目标网络交互会话信息为完成安全敏感事件标记的网络交互会话信息。
在上述基础上,请结合参阅图3,示出了一种基于大数据的网络安全分析系统300,包括互相之间通信的处理器310和存储器320,所述处理器310用于从所述存储器320中读取计算机程序并执行,以实现上述的方法。
在上述基础上,还提供了一种计算机可读存储介质,其上存储的计算机程序在运行时实现上述的方法。
综上,基于上述方案,本公开实施例通过确定第一网络交互会话信息清单,所述第一网络交互会话信息清单包括待进行安全敏感事件标记的网络交互会话信息以及与所述待进行安全敏感事件标记的网络交互会话信息存在关联关系的不少于一个关联网络交互会话信息;然后将所述待进行安全敏感事件标记的网络交互会话信息分别与每一个关联网络交互会话信息进行会话主题匹配处理,得到每一个关联网络交互会话信息的会话主题匹配描述;最后结合所述待进行安全敏感事件标记的网络交互会话信息对每一个关联网络交互会话信息的会话主题匹配描述进行描述关键词添加处理,得到每一个关联网络交互会话信息完成描述关键词添加的会话主题匹配描述,其中,所述完成描述关键词添加的会话主题匹配描述用于确定与所述待进行安全敏感事件标记的网络交互会话信息绑定的目标网络交互会话信息。这样一来,在本公开实施例中,在对多组网络交互会话信息进行初阶会话主题匹配处理后,还可以对实施初阶会话主题匹配处理后的网络交互会话信息进行描述关键词添加处理可以更加有效地提高网络安全的可靠性和提高网络安全的预警性。
应当理解,上述所示的系统及其模块可以利用各种方式来实现。例如,在一些实施例中,系统及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中,硬件部分可以利用专用逻辑来实现;软件部分则可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和系统可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本申请的系统及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用例如由各种类型的处理器所执行的软件实现,还可以由上述硬件电路和软件的结合(例如,固件)来实现。
需要说明的是,不同实施例可能产生的有益效果不同,在不同的实施例里,可能产生的有益效果可以是以上任意一种或几种的组合,也可以是其他任何可能获得的有益效果。
上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本申请的限定。虽然此处并没有明确说明,本领域技术人员可能会对本申请进行各种修改、改进和修正。该类修改、改进和修正在本申请中被建议,所以该类修改、改进、修正仍属于本申请示范实施例的精神和范围。
同时,本申请使用了特定词语来描述本申请的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本申请的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,本领域技术人员可以理解,本申请的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本申请的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、RF、或类似介质,或任何上述介质的组合。
本申请各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常规程序化编程语言如C语言、Visual Basic、Fortran 2003、Perl、COBOL 2002、PHP、ABAP,动态编程语言如Python、Ruby和Groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或服务器上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。
此外,除非权利要求中明确说明,本申请所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本申请流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本申请实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本申请披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本申请实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本申请对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
一些实施例中使用了描述成分、属性数量的数字,应当理解的是,此类用于实施例描述的数字,在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明,“大约”、“近似”或“大体上”表明所述数字允许有适应性的变化。相应地,在一些实施例中,说明书和权利要求中使用的数值参数均为近似值,该近似值根据个别实施例所需特点可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本申请一些实施例中用于确认其范围广度的数值域和参数为近似值,在具体实施例中,此类数值的设定在可行范围内尽可能精确。
针对本申请引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本申请作为参考。与本申请内容不一致或产生冲突的申请历史文件除外,对本申请权利要求最广范围有限制的文件(当前或之后附加于本申请中的)也除外。需要说明的是,如果本申请附属材料中的描述、定义、和/或术语的使用与本申请所述内容有不一致或冲突的地方,以本申请的描述、定义和/或术语的使用为准。
最后,应当理解的是,本申请中所述实施例仅用以说明本申请实施例的原则。其他的变形也可能属于本申请的范围。因此,作为示例而非限制,本申请实施例的替代配置可视为与本申请的教导一致。相应地,本申请的实施例不仅限于本申请明确介绍和描述的实施例。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (8)

1.一种基于大数据的网络安全分析方法,其特征在于,应用于网络安全分析系统,所述方法至少包括:
确定第一网络交互会话信息清单,所述第一网络交互会话信息清单包括待进行安全敏感事件标记的网络交互会话信息以及与所述待进行安全敏感事件标记的网络交互会话信息存在关联关系的不少于一个关联网络交互会话信息;将所述待进行安全敏感事件标记的网络交互会话信息分别与每一个关联网络交互会话信息进行会话主题匹配处理,得到每一个关联网络交互会话信息的会话主题匹配描述;
结合所述待进行安全敏感事件标记的网络交互会话信息对每一个关联网络交互会话信息的会话主题匹配描述进行描述关键词添加处理,得到每一个关联网络交互会话信息完成描述关键词添加的会话主题匹配描述;结合所述完成描述关键词添加的会话主题匹配描述确定与所述待进行安全敏感事件标记的网络交互会话信息绑定的目标网络交互会话信息;其中,所述目标网络交互会话信息为完成安全敏感事件标记的网络交互会话信息。
2.如权利要求2所述的基于大数据的网络安全分析方法,其特征在于,所述会话主题匹配处理包括如下步骤:
对所述待进行安全敏感事件标记的网络交互会话信息的第一显著会话表达簇和关联网络交互会话信息的第二显著会话表达簇中的显著会话表达进行分布式匹配处理和误差识别处理,得到所述关联网络交互会话信息的会话主题匹配描述,所述第一显著会话表达簇和所述第二显著会话表达簇中皆涵盖不少于一个存在差异的特征识别度的显著会话表达,所述关联网络交互会话信息的会话主题匹配描述的特征识别度与所述待进行安全敏感事件标记的网络交互会话信息的特征识别度一致。
3.如权利要求2所述的基于大数据的网络安全分析方法,其特征在于,所述对所述待进行安全敏感事件标记的网络交互会话信息的第一显著会话表达簇和关联网络交互会话信息的第二显著会话表达簇中的显著会话表达进行分布式匹配处理和误差识别处理,得到所述关联网络交互会话信息的会话主题匹配描述,包括:
对所述第一显著会话表达簇中特征识别度最低的显著会话表达和所述第二显著会话表达簇中特征识别度最低的显著会话表达进行所述第一特征挖掘处理,得到基础特征损失;
结合所述第一显著会话表达簇中的显著会话表达和所述第二显著会话表达簇中的显著会话表达以及所述基础特征损失,逐一循环实施所述分布式匹配处理和所述误差识别处理,直至确定特征识别度与所述待进行安全敏感事件标记的网络交互会话信息的特征识别度一致的已处理会话主题匹配描述,所述已处理会话主题匹配描述为所述分布式匹配处理的结果;
将所述特征识别度与所述待进行安全敏感事件标记的网络交互会话信息的特征识别度一致的已处理会话主题匹配描述确定为所述会话主题匹配描述。
4.如权利要求3所述的基于大数据的网络安全分析方法,其特征在于,所述分布式匹配处理的步骤包括:
对已具有的特征识别度最高的特征损失进行特征扩展处理,得到特征扩展后的特征损失;
从所述第二显著会话表达簇中确定与所述特征扩展后的特征损失的特征识别度一致的第一显著会话表达;
对所述第一显著会话表达和特征扩展后的特征损失进行分治处理,得到已处理会话主题匹配描述,所述已处理会话主题匹配描述与所述特征扩展后的特征损失的特征识别度一致,所述已处理会话主题匹配描述用于实施所述误差识别处理得到与所述已处理会话主题匹配描述特征识别度一致的特征损失。
5.如权利要求4所述的基于大数据的网络安全分析方法,其特征在于,所述误差识别处理的步骤包括:
从所述第一显著会话表达簇中确定与所述特征扩展后的特征损失的特征识别度一致的第二显著会话表达;
将所述已处理会话主题匹配描述和所述第二显著会话表达进行第一特征挖掘处理;
结合所述第一特征挖掘处理的结果和所述特征扩展后的特征损失,得到备用特征损失,所述备用特征损失用于下一次实施所述分布式匹配处理得到备用已处理会话主题匹配描述。
6.如权利要求1-5任一项所述的基于大数据的网络安全分析方法,其特征在于,所述描述关键词添加处理包括如下步骤:
结合所述待进行安全敏感事件标记的网络交互会话信息确定关联网络交互会话信息的会话主题匹配描述的重要性评价信息,所述重要性评价信息包括关联网络交互会话信息的会话主题匹配描述的第一重要性评价分布和待进行安全敏感事件标记的网络交互会话信息的最高特征识别度显著会话表达的第二重要性评价分布,所述最高特征识别度显著会话表达的特征识别度与所述关联网络交互会话信息的会话主题匹配描述的特征识别度一致;
确定所述关联网络交互会话信息的会话主题匹配描述和所述第一重要性评价分布的第一全局分析结果;
确定所述最高特征识别度显著会话表达和所述第二重要性评价分布的第二全局分析结果;
结合所述第一全局分析结果和所述第二全局分析结果,得到关联网络交互会话信息完成描述关键词添加的会话主题匹配描述。
7.如权利要求6所述的基于大数据的网络安全分析方法,其特征在于,所述结合所述完成描述关键词添加的会话主题匹配描述确定与所述待进行安全敏感事件标记的网络交互会话信息绑定的目标网络交互会话信息,包括:使用第二AI线程模型对所述每一个关联网络交互会话信息完成描述关键词添加的会话主题匹配描述进行调整,得到与所述待进行安全敏感事件标记的网络交互会话信息绑定的目标网络交互会话信息。
8.一种基于大数据的网络安全分析系统,其特征在于,包括互相之间通信的处理器和存储器,所述处理器用于从所述存储器中调取计算机程序,并通过运行所述计算机程序实现权利要求1-7任一项所述的方法。
CN202210329890.5A 2022-03-31 2022-03-31 一种基于大数据的网络安全分析方法及系统 Active CN114691830B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210329890.5A CN114691830B (zh) 2022-03-31 2022-03-31 一种基于大数据的网络安全分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210329890.5A CN114691830B (zh) 2022-03-31 2022-03-31 一种基于大数据的网络安全分析方法及系统

Publications (2)

Publication Number Publication Date
CN114691830A true CN114691830A (zh) 2022-07-01
CN114691830B CN114691830B (zh) 2022-12-20

Family

ID=82141092

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210329890.5A Active CN114691830B (zh) 2022-03-31 2022-03-31 一种基于大数据的网络安全分析方法及系统

Country Status (1)

Country Link
CN (1) CN114691830B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101119326A (zh) * 2006-08-04 2008-02-06 腾讯科技(深圳)有限公司 一种即时通信会话记录的管理方法及装置
US20100318620A1 (en) * 2009-06-16 2010-12-16 International Business Machines Corporation Instant Messaging Monitoring and Alerts
US20160078479A1 (en) * 2012-04-16 2016-03-17 Google Inc. Generating an Advertisement Associated with a Multi-Party Communication Session and a Named Topic
CN113903473A (zh) * 2021-10-26 2022-01-07 苏州律点信息科技有限公司 基于人工智能的医疗信息智能交互的方法及系统
CN114221803A (zh) * 2021-12-13 2022-03-22 山东畅想大数据服务有限公司 一种应用于智慧医疗大数据的网络安全分析方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101119326A (zh) * 2006-08-04 2008-02-06 腾讯科技(深圳)有限公司 一种即时通信会话记录的管理方法及装置
US20100318620A1 (en) * 2009-06-16 2010-12-16 International Business Machines Corporation Instant Messaging Monitoring and Alerts
US20160078479A1 (en) * 2012-04-16 2016-03-17 Google Inc. Generating an Advertisement Associated with a Multi-Party Communication Session and a Named Topic
CN113903473A (zh) * 2021-10-26 2022-01-07 苏州律点信息科技有限公司 基于人工智能的医疗信息智能交互的方法及系统
CN114221803A (zh) * 2021-12-13 2022-03-22 山东畅想大数据服务有限公司 一种应用于智慧医疗大数据的网络安全分析方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
卢恒等: "会话分析视角下虚拟学术社区用户交互行为特征研究", 《图书情报工作》 *
王曰芬等: "传播阶段中不同传播者的舆情主题发现与对比分析", 《现代情报》 *

Also Published As

Publication number Publication date
CN114691830B (zh) 2022-12-20

Similar Documents

Publication Publication Date Title
CN113886468A (zh) 基于互联网的在线互动数据挖掘方法及系统
CN114168747A (zh) 基于云服务的知识库构建方法及系统
CN114661994B (zh) 基于人工智能的用户兴趣数据处理方法、系统及云平台
CN114625804B (zh) 基于大数据的用户行为数据处理方法、系统及云平台
CN113378554A (zh) 一种医疗信息智能交互的方法及系统
CN114329116B (zh) 基于人工智能的智慧园区资源匹配度分析方法及系统
CN114691830B (zh) 一种基于大数据的网络安全分析方法及系统
CN115514570A (zh) 一种网络诊断处理方法、系统及云平台
CN115481197A (zh) 一种分布式数据处理方法、系统及云平台
CN115641176A (zh) 一种数据分析方法及ai系统
CN115473822A (zh) 一种5g智能网关数据传输方法、系统及云平台
CN115687618A (zh) 基于人工智能的用户意图分析方法及系统
CN113947709A (zh) 基于人工智能的图像处理方法及系统
CN114281815A (zh) 一种产业创新资源数据分析方法及系统
CN112600939B (zh) 一种监护仪控制信息检测方法、系统、服务器及存储介质
CN113918963B (zh) 一种基于业务需求的权限授权处理方法及系统
CN114661980B (zh) 一种网页数据推送方法、系统及云平台
CN113613252B (zh) 基于5g的网络安全的分析方法及系统
CN114663071A (zh) 一种科技项目数据在线处理的方法及系统
CN114139552A (zh) 基于大数据的可视化智能数据挖掘方法及系统
CN114168999A (zh) 基于数据中心的综合安保方法及系统
CN114970507A (zh) 基于元宇宙的特征识别方法及系统
CN115564048A (zh) 一种医疗大数据共享分析方法及系统
CN115455070A (zh) 一种电流信号的数据管控方法及系统
CN115455803A (zh) 一种室内能耗信息分析方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20221107

Address after: 212000 room 2208, 22nd floor, building 8, Xinyuan Huafu, No. 36, Huangshan South Road, Runzhou District, Zhenjiang City, Jiangsu Province

Applicant after: Jiangsu Dongyun Cloud Computing Co.,Ltd.

Address before: 678400 No. 66, Yongsheng Road, Pingyuan Town, Yingjiang County, Dehong Dai and Jingpo Autonomous Prefecture, Yunnan Province

Applicant before: Hou Yu

GR01 Patent grant
GR01 Patent grant