CN114564726A - 一种基于大数据办公的软件漏洞分析方法及系统 - Google Patents

一种基于大数据办公的软件漏洞分析方法及系统 Download PDF

Info

Publication number
CN114564726A
CN114564726A CN202210204151.3A CN202210204151A CN114564726A CN 114564726 A CN114564726 A CN 114564726A CN 202210204151 A CN202210204151 A CN 202210204151A CN 114564726 A CN114564726 A CN 114564726A
Authority
CN
China
Prior art keywords
vulnerability
software vulnerability
vector
office
software
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210204151.3A
Other languages
English (en)
Other versions
CN114564726B (zh
Inventor
马永青
李永丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Aite Yunxiang Information Technology Co ltd
Original Assignee
Shandong Aggregated Data Service Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Aggregated Data Service Co ltd filed Critical Shandong Aggregated Data Service Co ltd
Priority to CN202210204151.3A priority Critical patent/CN114564726B/zh
Priority to CN202211125706.1A priority patent/CN115455429A/zh
Publication of CN114564726A publication Critical patent/CN114564726A/zh
Application granted granted Critical
Publication of CN114564726B publication Critical patent/CN114564726B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/57Certifying or maintaining trusted computer platforms, e.g. secure boots or power-downs, version controls, system software checks, secure updates or assessing vulnerabilities
    • G06F21/577Assessing vulnerabilities and evaluating computer system security
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Stored Programmes (AREA)

Abstract

本发明提供一种基于大数据办公的软件漏洞分析方法及系统,首先,只通过需软件漏洞报错记便能够对软件漏洞属性进行识别分析,而软件漏洞报错记录中第二软件漏洞报错事件又是通过知识拓扑集形成的内容分布,这样可以不必生成包含较多噪声信息的全办公场景型内容分布,进而减少软件漏洞属性识别分析的软硬件资源开销,其次,鉴于对全办公场景型内容分布的依赖性较低,可以不用对内容分布进行经常更新。综上,能够高效精准地确定目标办公软件运行日志的目标软件漏洞属性,从而可以根据目标软件漏洞属性确定目标办公软件运行日志在相关软件漏洞分析机制中的漏洞隐患。

Description

一种基于大数据办公的软件漏洞分析方法及系统
技术领域
本发明涉及大数据办公技术领域,尤其涉及一种基于大数据办公的软件漏洞分析方法及系统。
背景技术
软件漏洞(software bug)是指计算机系统安全方面的一些列缺陷,这些缺陷可能会导致系统或其应用数据的保密性、完整性、可用性、访问控制等面临信息攻击。
随着大数据的不断发展,各类应用软件也随之迅速的发展。软件已经充斥在用户生活的方方面面,以办公软件为例,它能够为用户提供便利,比如优化工作效率。然而,办公软件的软件漏洞也不容忽视,针对办公软件的漏洞分析技术的重要性不言而喻。
发明内容
本发明提供一种基于大数据办公的软件漏洞分析方法及系统,为实现上述技术目的,本申请采用如下技术方案。
第一方面是一种基于大数据办公的软件漏洞分析方法,应用于软件漏洞分析系统,所述方法至少包括:确定目标办公软件运行日志以及所述目标办公软件运行日志的采集状态,并确定采集状态处的软件漏洞报错记录;其中,目标办公软件运行日志中包含第一软件漏洞报错事件,且软件漏洞报错记录中第二软件漏洞报错事件是通过知识拓扑集建立的内容分布;确定目标办公软件运行日志中第一软件漏洞报错事件的第一漏洞特征集,并确定软件漏洞报错记录中第二软件漏洞报错事件的第二漏洞特征集;通过第一漏洞特征集和第二漏洞特征集,识别获得第一软件漏洞属性;通过第一软件漏洞报错事件的第一语义关键词调整第一软件漏洞属性,得到目标办公软件运行日志的目标软件漏洞属性。
如此一来,确定目标办公软件运行日志以及所述目标办公软件运行日志的采集状态,并确定采集状态处的软件漏洞报错记录,且目标办公软件运行日志中包含第一软件漏洞报错事件,软件漏洞报错记录中第二软件漏洞报错事件是通过知识拓扑集建立的内容分布,基于此,确定目标办公软件运行日志中第一软件漏洞报错事件的第一漏洞特征集,并确定软件漏洞报错记录中第二软件漏洞报错事件的第二漏洞特征集,以及通过第一漏洞特征集和第二漏洞特征集,识别获得第一软件漏洞属性,从而通过第一软件漏洞报错事件的第一语义关键词调整第一软件漏洞属性,得到目标办公软件运行日志的目标软件漏洞属性,首先,只通过需软件漏洞报错记便能够对软件漏洞属性进行识别分析,而软件漏洞报错记录中第二软件漏洞报错事件又是通过知识拓扑集形成的内容分布,这样可以不必生成包含较多噪声信息的全办公场景型内容分布,进而减少软件漏洞属性识别分析的软硬件资源开销,其次,鉴于对全办公场景型内容分布的依赖性较低,可以不用对内容分布进行经常更新。综上,能够高效精准地确定目标办公软件运行日志的目标软件漏洞属性,从而可以根据目标软件漏洞属性确定目标办公软件运行日志在相关软件漏洞分析机制中的漏洞隐患。
在一种可选的实施例中,第一漏洞特征集涵盖多个第一办公软件漏洞特征,第二漏洞特征集涵盖多个第二办公软件漏洞特征;通过第一漏洞特征集和第二漏洞特征集,识别获得第一软件漏洞属性,包括:挖掘每个第一办公软件漏洞特征的第一描述向量,并挖掘每个第二办公软件漏洞特征的第二描述向量;其中,第一描述向量和第二描述向量皆涵盖漏洞特征集的阶段化传递描述和漏洞特征集的整体化绑定描述;通过第一描述向量和第二描述向量进行漏洞属性描述分析,得到第一软件漏洞属性。
如此设计,第一漏洞特征集涵盖多个第一办公软件漏洞特征,第二漏洞特征集涵盖多个第二办公软件漏洞特征,挖掘每个第一办公软件漏洞特征的第一描述向量,并挖掘每个第二办公软件漏洞特征的第二描述向量,且第一描述向量和第二描述向量皆涵盖漏洞特征集的阶段化传递描述和漏洞特征集的整体化绑定描述,鉴于此,通过第一描述向量和第二描述向量进行漏洞属性描述分析,得到第一软件漏洞属性,换言之,每个办公软件漏洞特征的描述向量不仅涵盖漏洞特征集的阶段化传递描述,而且还涵盖其与其他办公软件漏洞特征之间的绑定描述,这样能够显著提高描述向量的精度,同时有助于提高第一软件漏洞属性的精度。
在一种可选的实施例中,描述向量的挖掘方式包括:将多个待进行挖掘的办公软件漏洞特征的基础描述向量进行向量压缩操作,得到多个已完成向量压缩操作的办公软件漏洞特征的阶段化描述向量和映射分布标签;对于每个已完成向量压缩操作的办公软件漏洞特征,将已完成向量压缩操作的办公软件漏洞特征以及该已完成向量压缩操作的办公软件漏洞特征的模板办公软件漏洞特征的阶段化描述向量启用第一连接处理,得到第一向量连接处理结果;其中,模板办公软件漏洞特征基于映射分布标签从多个已完成向量压缩操作的办公软件漏洞特征中确定所得;基于多个已完成向量压缩操作的办公软件漏洞特征的第一向量连接处理结果进行向量扩展翻译,得到多个待进行挖掘的办公软件漏洞特征的目标描述向量;其中,在待进行挖掘的办公软件漏洞特征为第一办公软件漏洞特征的基础上,目标描述向量为第一描述向量,在待进行挖掘的办公软件漏洞特征为第二办公软件漏洞特征的基础上,目标描述向量为第二描述向量。
如此设计,将多个待进行挖掘的办公软件漏洞特征的基础描述向量进行向量压缩操作,得到多个已完成向量压缩操作的办公软件漏洞特征的阶段化描述向量和映射分布标签,对于每个已完成向量压缩操作的办公软件漏洞特征,将已完成向量压缩操作的办公软件漏洞特征以及该已完成向量压缩操作的办公软件漏洞特征的模板办公软件漏洞特征的阶段化描述向量启用第一连接处理,得到第一向量连接处理结果,且模板办公软件漏洞特征基于映射分布标签从多个已完成向量压缩操作的办公软件漏洞特征中确定所得,鉴于此,再基于多个已完成向量压缩操作的办公软件漏洞特征的第一向量连接处理结果进行向量扩展翻译,得到多个待进行挖掘的办公软件漏洞特征的目标描述向量,且在待进行挖掘的办公软件漏洞特征为第一办公软件漏洞特征的基础上,目标描述向量为第一描述向量,在待进行挖掘的办公软件漏洞特征为第二办公软件漏洞特征的基础上,目标描述向量为第二描述向量,一方面通过向量压缩操作能够挖掘出每个已完成向量压缩操作的办公软件漏洞特征的漏洞特征集的阶段化传递描述,另一方面通过基于映射分布标签确定已完成向量压缩操作的办公软件漏洞特征的模板办公软件漏洞特征,并将已完成向量压缩操作的办公软件漏洞特征以及该已完成向量压缩操作的办公软件漏洞特征的模板办公软件漏洞特征的阶段化描述向量启用第一连接处理,能够挖掘出每个已完成向量压缩操作的办公软件漏洞特征的漏洞特征集的整体化绑定描述,这样能够将两者进行整合并且根据向量扩展翻译能够挖掘出每个待进行挖掘的办公软件漏洞特征的漏洞特征集的阶段化传递描述和漏洞特征集的整体化绑定描述,这样能够有助于提高描述向量的精度。
在一种可选的实施例中,基于多个已完成向量压缩操作的办公软件漏洞特征的第一向量连接处理结果进行向量扩展翻译,得到多个待进行挖掘的办公软件漏洞特征的目标描述向量,包括:将已完成向量压缩操作的办公软件漏洞特征的阶段化描述向量和第一向量连接处理结果进行第二连接处理,得到第二向量连接处理结果;将多个已完成向量压缩操作的办公软件漏洞特征的第二向量连接处理结果进行向量扩展翻译,得到多个待进行挖掘的办公软件漏洞特征的目标描述向量。
如此设计,在向量扩展翻译步骤中,将已完成向量压缩操作的办公软件漏洞特征的阶段化描述向量和第一向量连接处理结果进行第二连接处理,得到第二向量连接处理结果,鉴于此,再将多个已完成向量压缩操作的办公软件漏洞特征的第二向量连接处理结果进行向量扩展翻译,得到多个待进行挖掘的办公软件漏洞特征的目标描述向量,在向量扩展翻译步骤中同时参照向量压缩操作所得到的阶段化描述向量,可以实现不同等级的特征的融合处理,进而有助于提高描述向量的精度。
在一种可选的实施例中,对于每个已完成向量压缩操作的办公软件漏洞特征,将已完成向量压缩操作的办公软件漏洞特征以及该已完成向量压缩操作的办公软件漏洞特征的模板办公软件漏洞特征的阶段化描述向量进行启用第一连接处理,得到第一向量连接处理结果,包括:将每个已完成向量压缩操作的办公软件漏洞特征依次作为当前办公软件漏洞特征,并将除所述当前办公软件漏洞特征以外的已完成向量压缩操作的办公软件漏洞特征作为待定办公软件漏洞特征;确定与当前办公软件漏洞特征之间的量化差异符合第一要求的待定办公软件漏洞特征,作为当前办公软件漏洞特征对应的模板办公软件漏洞特征;其中,量化差异是基于映射分布标签确定所得的;基于每个已完成向量压缩操作的办公软件漏洞特征以及该已完成向量压缩操作的办公软件漏洞特征对应的模板办公软件漏洞特征,生成视觉型拓扑;其中,视觉型拓扑中拓扑单元表示已完成向量压缩操作的办公软件漏洞特征的阶段化描述向量,且表示已完成向量压缩操作的办公软件漏洞特征以及该已完成向量压缩操作的办公软件漏洞特征的模板办公软件漏洞特征的阶段化描述向量的拓扑单元之间具有关联关系;基于视觉型拓扑进行向量连接处理,得到每个已完成向量压缩操作的办公软件漏洞特征的第一向量连接处理结果。
如此设计,将每个已完成向量压缩操作的办公软件漏洞特征依次作为当前办公软件漏洞特征,并将除所述当前办公软件漏洞特征以外的已完成向量压缩操作的办公软件漏洞特征作为待定办公软件漏洞特征,确定与当前办公软件漏洞特征之间的量化差异符合第一要求的待定办公软件漏洞特征,作为当前办公软件漏洞特征对应的模板办公软件漏洞特征,且量化差异是基于映射分布标签确定所得的,鉴于此,基于每个已完成向量压缩操作的办公软件漏洞特征以及该已完成向量压缩操作的办公软件漏洞特征对应的模板办公软件漏洞特征,生成视觉型拓扑,且视觉型拓扑中拓扑单元反映已完成向量压缩操作的办公软件漏洞特征的阶段化描述向量,且表示已完成向量压缩操作的办公软件漏洞特征以及该已完成向量压缩操作的办公软件漏洞特征的模板办公软件漏洞特征的阶段化描述向量的拓扑单元之间具有关联关系,鉴于此,再基于视觉型拓扑进行向量连接处理,得到每个已完成向量压缩操作的办公软件漏洞特征的第一向量连接处理结果,因此基于每个已完成向量压缩操作的办公软件漏洞特征的映射分布标签生成视觉型拓扑,在视觉型拓扑的基础上进行向量连接处理,有助于提高向量连接处理的可信度及精度。
在一种可选的实施例中,在确定与当前办公软件漏洞特征之间的量化差异符合第一要求的待定办公软件漏洞特征,作为当前办公软件漏洞特征对应的模板办公软件漏洞特征之前,该方法还包括:以软件漏洞报错记录在采集状态处与基准漏洞报告之间的共性数据为认证示例,生成用于对办公软件漏洞特征进行迁移变换的迁移变换引导信息,且基准漏洞报告与软件漏洞报错记录的关键词具有上下游联系;将每个已完成向量压缩操作的办公软件漏洞特征分别迁移变换至迁移变换引导信息的迁移变换空间,得到对应的对办公软件漏洞特征进行迁移变换;基于对办公软件漏洞特征进行迁移变换在迁移变换空间的非约束性比较结果,得到对应已完成向量压缩操作的办公软件漏洞特征之间的量化差异。
如此设计,在确定当前办公软件漏洞特征对应的模板办公软件漏洞特征之前,首先以软件漏洞报错记录在采集状态处与基准漏洞报告重复的共性数据为认证示例,生成用于对办公软件漏洞特征进行迁移变换的迁移变换引导信息,且基准漏洞报告与所述软件漏洞报错记录的关键词具有上下游联系,并将每个已完成向量压缩操作的办公软件漏洞特征分别迁移变换至迁移变换引导信息的迁移变换空间,得到对应的对办公软件漏洞特征进行迁移变换,鉴于此再结合对办公软件漏洞特征进行迁移变换在迁移变换空间的非约束性比较结果,得到对应已完成向量压缩操作的办公软件漏洞特征之间的量化差异,通过迁移变换能够在一定程度上降低显著性描述差异产生的误差,这样能够显著提高视觉型拓扑的精确性,有助于提高向量连接处理的精确性,进而可以有助于提高描述向量的精度。
在一种可选的实施例中,描述向量是通过AI智能模型挖掘所得的,AI智能模型包括第一子模型、第二子模型和第三子模型,且第一子模型包括x个全局滑动平均处理单元,第二子模型包括y个视觉滑动平均处理单元,第三子模型包括x个变换滑动平均处理单元;其中,第一子模型旨在实施向量压缩操作,第二子模型旨在实施第一连接处理,第三子模型旨在实施向量扩展翻译。
如此设计,描述向量是通过AI智能模型挖掘所得的,且AI智能模型包括第一子模型、第二子模型和第三子模型,第一子模型包括x个全局滑动平均处理单元,第二子模型包括y个视觉滑动平均处理单元,第三子模型包括x个变换滑动平均处理单元,第一子模型旨在实施向量压缩操作,第二子模型旨在实施第一连接处理,第三子模型旨在实施向量扩展翻译,因而通过AI智能模型实施向量压缩操作、第一连接处理以及向量扩展翻译,以挖掘得到描述向量,有助于提高描述挖掘完整性。
在一种可选的实施例中,通过第一软件漏洞报错事件的第一语义关键词调整第一软件漏洞属性,得到目标办公软件运行日志的目标软件漏洞属性,包括:通过第一软件漏洞属性,对软件漏洞报错记录进行操作行为解析,得到与第一软件漏洞属性对应的办公互动状态下第二软件漏洞报错事件的第二语义关键词;通过第一语义关键词与第二语义关键词之间的比较结果,得到属性识别偏差;基于属性识别偏差,调整第一软件漏洞属性,得到目标软件漏洞属性。
如此设计,通过第一软件漏洞属性,对软件漏洞报错记录进行操作行为解析,得到与第一软件漏洞属性对应的办公互动状态下第二软件漏洞报错事件的第二语义关键词,并通过第一语义关键词与第二语义关键词之间的比较结果,得到属性识别偏差,从而基于属性识别偏差,调整第一软件漏洞属性,得到目标软件漏洞属性,这样能够保障目标软件漏洞属性的时效性和可信度,从而为后续的软件漏洞修复提供参考。
在一种可选的实施例中,第一语义关键词通过设定维度的第一词向量矩阵进行记录,语义关键词通过设定维度的第二词向量矩阵进行记录,且设定维度为目标办公软件运行日志的特征维度;通过第一语义关键词与第二语义关键词之间的比较结果,得到属性识别偏差,包括:确定目标办公软件运行日志中每个分布节点对应的偏差重要性指数;其中,匹配于软件漏洞报错事件或漏洞安全防护事件的分布节点携带第一重要性指数,不匹配于软件漏洞报错事件、漏洞安全防护事件中其中一项的分布节点携带第二重要性指数,且第一重要性指数大于第二重要性指数;对于每个分布节点,确定分布节点分别在第一词向量矩阵中的第一属性描述值和在第二词向量矩阵中的第二属性描述值,并确定第一属性描述值和第二属性描述值之间的属性描述差异,以及基于分布节点对应的属性描述差异和偏差重要性指数,得到分布节点对应的局部识别偏差;基于每个分布节点对应的局部识别偏差,得到属性识别偏差。
如此设计,第一语义关键词通过设定维度的第一词向量矩阵进行记录,而语义关键词通过设定维度的第二词向量矩阵进行记录,且设定维度为目标办公软件运行日志的特征维度,确定目标办公软件运行日志中每个分布节点对应的偏差重要性指数,且匹配于软件漏洞报错事件或漏洞安全防护事件的分布节点携带第一重要性指数,不匹配于软件漏洞报错事件、漏洞安全防护事件中其中一项的分布节点携带第二重要性指数,第一重要性指数大于第二重要性指数,对于每个分布节点,确定分布节点分别在第一词向量矩阵中的第一属性描述值和在第二词向量矩阵中的第二属性描述值,并确定第一属性描述值和第二属性描述值之间的属性描述差异,以及基于分布节点对应的属性描述差异和偏差重要性指数,得到分布节点对应的局部识别偏差,鉴于此,再基于每个分布节点对应的局部识别偏差,得到属性识别偏差,由于第一重要性指数大于第二重要性指数,因此能够约束不匹配于软件漏洞报错事件、漏洞安全防护事件中其中一项的分布节点对应的局部识别偏差,且强化匹配于软件漏洞报错事件或漏洞安全防护事件的分布节点对应的局部识别偏差,从而减少边缘属性的干扰,有助于提高软件漏洞属性调整的精准性。
在一种可选的实施例中,基于属性识别偏差,调整第一软件漏洞属性,得到目标软件漏洞属性,包括:基于属性识别偏差,调整第一软件漏洞属性,得到第二软件漏洞属性;在所述属性识别偏差符合第二要求的前提下,将第二软件漏洞属性作为当前的第一软件漏洞属性,并再次跳转至通过第一软件漏洞属性,对软件漏洞报错记录进行操作行为解析的步骤,直到属性识别偏差不符合第二要求为止,以及将第二软件漏洞属性作为目标软件漏洞属性。
如此设计,基于属性识别偏差,调整第一软件漏洞属性,得到第二软件漏洞属性,并在所述属性识别偏差符合第二要求的前提下,将第二软件漏洞属性作为当前的第一软件漏洞属性,并再次跳转至通过第一软件漏洞属性,对软件漏洞报错记录进行操作行为解析的步骤,直到属性识别偏差不符合第二要求为止,以及将第二软件漏洞属性作为目标软件漏洞属性,因此在软件漏洞属性调整步骤中,能够根据属性识别偏差进行循环调整,能够保障获取到的目标软件漏洞属性的准确性。
在一种可选的实施例中,确定目标办公软件运行日志中第一软件漏洞报错事件的第一漏洞特征集,包括:确定目标办公软件运行日志中属于第一软件漏洞报错事件的第一日志内容块的第一显著性描述;通过第一日志内容块的第一显著性描述进行逆向迁移变换,得到第一漏洞特征集。
如此设计,确定目标办公软件运行日志中属于第一软件漏洞报错事件的第一日志内容块的第一显著性描述,并通过第一日志内容块的第一显著性描述进行逆向迁移变换,得到第一漏洞特征集,换言之在第一漏洞特征集的确定步骤中,只需要对目标办公软件运行日志实施上述相关操作便能够获得第一软件漏洞报错事件的第一漏洞特征集,这样能够有助于提高漏洞特征集确定的完整性。
在一种可选的实施例中,确定软件漏洞报错记录中第二软件漏洞报错事件的第二漏洞特征集,包括:基于软件漏洞报错记录在当前办公互动状态下携带有效标识的知识拓扑集,得到显著性描述信息;基于显著性描述信息中每个第二日志内容块的第二显著性描述进行逆向迁移变换,得到第二漏洞特征集。
如此设计,基于软件漏洞报错记录在当前办公互动状态下携带有效标识的知识拓扑集,得到显著性描述信息,并基于显著性描述信息中每个第二日志内容块的第二显著性描述进行逆向迁移变换,得到第二漏洞特征集,换言之,在第二漏洞特征集的确定步骤中,只重点留意在当前办公互动状态下携带有效标识的知识拓扑集,可以不必考虑在当前办公互动状态下没有携带的知识拓扑集,进而能够降低办公软件漏洞特征数目,这样有助于削弱后期通过第一漏洞特征集和第二漏洞特征集进行软件漏洞属性识别的复杂程度。
第二方面是一种软件漏洞分析系统,包括存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;其中,当所述处理器执行所述计算机指令时,使得所述软件漏洞分析系统执行第一方面的方法。
附图说明
图1为本发明实施例提供的一种基于大数据办公的软件漏洞分析方法的流程示意图。
图2为本发明实施例提供的一种基于大数据办公的软件漏洞分析装置的模块框图。
具体实施方式
以下,术语“第一”、“第二”和“第三”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”或“第三”等的特征可以明示或者隐含地包括一个或者更多个该特征。
图1示出了本发明实施例提供的一种基于大数据办公的软件漏洞分析方法的流程示意图,一种基于大数据办公的软件漏洞分析方法可以通过软件漏洞分析系统实现,软件漏洞分析系统可以包括存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;其中,当所述处理器执行所述计算机指令时,使得所述软件漏洞分析系统执行如下步骤所描述的技术方案。
S11、确定目标办公软件运行日志以及所述目标办公软件运行日志的采集状态,并确定采集状态处的软件漏洞报错记录。
对于本发明实施例而言,目标办公软件运行日志可以理解为办公用户端在进行办公软件交互时所产生的一系列运行记录。比如:软件的使用记录等。进一步的,目标办公软件运行日志中包含第一软件漏洞报错事件。比如:第一软件漏洞报错事件可以涵盖但不局限于文件丢失事件、网络异常事件、隐私泄露事件等不同类型的报错事件。
对于本发明实施例而言,采集状态可以理解为采集到目标办公软件运行日志时的办公互动状态,进一步的,采集状态可以涵盖但不局限于办公用户端与软件漏洞分析系统的不同互动状态(比如可以理解为从哪些角度来采集目标办公软件运行日志)。可以理解的是,对于本发明实施例而言,对于采集状态的类型不进行限制,只要可以与实际的办公互动状态匹配就可以作为备选项。比如可以根据实际需求匹配对应的采集状态,并基于该采集状态进行目标办公软件运行日志的采集,但不限于此。
对于本发明实施例而言,软件漏洞报错记录中第二软件漏洞报错事件是通过知识拓扑集建立的内容分布,软件漏洞报错记录中每个内容分布(比如节点化或者知识图谱化的分布情况)可以表达对应的软件漏洞报错事件的多维特征,这样可以通过尽可能少的信息来保障软件漏洞报错事件的丰富性,从而提高软硬件资源的利用率。
可以理解的是,虽然“第一软件漏洞报错事件”、“第二软件漏洞报错事件”存在字面差异,但是不表示目标办公软件运行日志中的软件漏洞报错事件和软件漏洞报错记录中的软件漏洞报错事件的特征分布或者格式类别之间存在不同,换言之,“第一软件漏洞报错事件”、“第二软件漏洞报错事件”是为了便于区分软件漏洞报错事件,换言之,目标办公软件运行日志中采集到的软件漏洞报错事件可以理解为“第一软件漏洞报错事件”,软件漏洞报错记录中的软件漏洞报错事件可以理解为“第二软件漏洞报错事件”。
S12、确定目标办公软件运行日志中第一软件漏洞报错事件的第一漏洞特征集,并确定软件漏洞报错记录中第二软件漏洞报错事件的第二漏洞特征集。
对于本发明实施例而言,可以确定目标办公软件运行日志中属于第一软件漏洞报错事件的第一日志内容块的第一显著性描述,并通过第一日志内容块的第一显著性描述进行逆向迁移变换(比如:反投影处理),得到第一漏洞特征集。如此,在第一漏洞特征集的确定步骤中,只需要对目标办公软件运行日志进行日志内容拆解、显著性描述挖掘等步骤便能够得到第一软件漏洞报错事件的第一漏洞特征集,因此能够有助于提高漏洞特征集的确定时效性和精度。
举例而言,本发明实施例中基于大数据办公的软件漏洞分析方法可以涵盖前处理环节、中间环节和调整环节。在前处理环节,可以对目标办公软件运行日志分别进行日志拆解和显著性描述挖掘,从而得到拆解结果result_I和显著性描述信息KEY_in。可以理解的是,拆解结果result_I中每个日志内容块的属性描述值反映目标办公软件运行日志中相应分布下的日志内容块所对应的类型,如在日志内容块的属性描述值为数值num1时,表示目标办公软件运行日志中相应分布下的日志内容块匹配于软件漏洞报错事件,在日志内容块的属性描述值为数值num2时,表示目标办公软件运行日志中相应分布下的日志内容块匹配于漏洞安全防护事件,在日志内容块的属性描述值为数值num3时,表示目标办公软件运行日志中相应分布下的日志内容块匹配于其他事件。另外,显著性描述信息KEY_in中每个日志内容块的属性描述值表示目标办公软件运行日志中相应分布下的日志内容块的第一显著性描述。基于此,可以基于拆解结果result_I和显著性描述信息KEY_in,目标办公软件运行日志中匹配第一软件漏洞报错事件的第一日志内容块的第一显著性描述。
另外,为了保障整体方案的智能化程度,上述日志拆解和显著性描述挖掘可以分别由对应的AI机器学习模型实现(关于AI机器学习模型的类型和架构选择,本发明实施例不作限制)。在确定到属于第一软件漏洞报错事件的第一日志内容块的第一显著性描述之后,可以进一步进行显著性描述调整(比如,噪声清洗等),以得到完成调整的第一显著性描述,进而方便后期基于完成调整的第一显著性描述进行逆向迁移变换,得到第一漏洞特征集。如此设计,在确定到第一漏洞特征集之后,进行显著性描述调整,有助于提高第一漏洞特征集的质量。另外,为了方便对本发明进行阐述,第一漏洞特征集可以理解为Loophole_A。
在一些示例中,可以结合第一显著性描述进行逆向迁移变换(比如可以理解为反映射),得到第一漏洞特征集。逆向迁移变换的实际实施步骤,可以参照显著性描述的逆向迁移变换,在此不作增多说明。
在一种可示性实施例中,可以基于软件漏洞报错记录在当前办公互动状态下携带有效标识的知识拓扑集,得到显著性描述信息,并基于显著性描述信息中每个第二日志内容块的第二显著性描述进行逆向迁移变换,得到第二漏洞特征集。如此,在第二漏洞特征集的确定步骤中,只重点留意在当前办公互动状态下携带有效标识的知识拓扑集,即可以不必考虑在当前办公互动状态下没有携带的知识拓扑集,进而能够降低办公软件漏洞特征数目,进而这样有助于削弱后期通过第一漏洞特征集和第二漏洞特征集进行软件漏洞属性识别的复杂程度。
举例而言,鉴于软件漏洞报错记录已带有显著性描述信息,因此可以对软件漏洞报错记录在当前办公互动状态下携带有效标识的知识拓扑集进行整体化标注,得到显著性描述信息,从而可以将显著性描述信息中每个日志内容块进行逆向迁移变换,得到第二漏洞特征集。可以理解的是,逆向迁移变换的实际实施步骤,可以参照显著性描述的逆向迁移变换的实施步骤,在此不作进一步描述。为了方便对本发明进行阐述,可以将第二漏洞特征集理解为Loophole_B。
S13、通过第一漏洞特征集和第二漏洞特征集,识别获得第一软件漏洞属性。
对于本发明实施例而言,第一漏洞特征集Loophole_A可以涵盖多个第一办公软件漏洞特征,第二漏洞特征集Loophole_B可以涵盖多个第二办公软件漏洞特征,鉴于此,可以挖掘每个第一办公软件漏洞特征的第一描述向量,并挖掘每个第二办公软件漏洞特征的第二描述向量,从而通过第一描述向量和第二描述向量进行漏洞属性描述分析,得到第一软件漏洞属性。比如:可以通过第一描述向量和第二描述向量,将每个第一办公软件漏洞特征和每个第二办公软件漏洞特征进行漏洞属性描述分析,得到多组办公软件漏洞特征二元组,且每个办公软件漏洞特征二元组包括一个第一办公软件漏洞特征和一个第二办公软件漏洞特征,由此可以根据多组办公软件漏洞特征,识别获得第一软件漏洞属性。
在一种可示性实施例中,可以挖掘每个第一办公软件漏洞特征的第一描述向量,并挖掘每个第二办公软件漏洞特征的第二描述向量,且第一描述向量和第二描述向量皆涵盖漏洞特征集的阶段化传递描述。举例而言,描述向量可以理解为特征表示。
在一种可示性实施例中,可以挖掘每个第一办公软件漏洞特征的第一描述向量,并挖掘每个第二办公软件漏洞特征的第二描述向量,且第一描述向量和第二描述向量皆涵盖漏洞特征集的阶段化传递描述和漏洞特征集的整体化绑定描述。举例而言,阶段化传递描述可以理解为局部的关系信息,整体化绑定描述可以理解为全局层面下的特征关联情况。
在一种可示性实施例中,在挖掘得到每个第一办公软件漏洞特征的第一描述向量以及每个第二办公软件漏洞特征的第二描述向量之后,可以将每个第一办公软件漏洞特征依次作为当前办公软件漏洞特征,并将与当前办公软件漏洞特征的第一描述向量最相似的第二描述向量所对应的第二办公软件漏洞特征,作为与第一办公软件漏洞漏洞属性描述分析的第二办公软件漏洞特征,基于此,可以匹配得到多组办公软件漏洞特征二元组,并将每个办公软件漏洞特征二元组中的第二办公软件漏洞特征、该组中第一办公软件漏洞特征二元组应于目标办公软件运行日志中的局部日志内容块作为一组绑定组合,以及根据预设的漏洞特征空间限制条件(预先建立的全局性的漏洞分析机制),根据每组绑定组合的定位标签生成对应于第一软件漏洞属性的算法模型,从而基于各组绑定组合分别对应的算法模型,能够输出第一软件漏洞属性。相关内容可以参照基于漏洞属性描述分析(特征匹配技术)的软件漏洞属性检测(基于多分类的属性识别技术)。
S14、通过第一软件漏洞报错事件的第一语义关键词调整第一软件漏洞属性,得到目标办公软件运行日志的目标软件漏洞属性。
可以理解的是,在得到第一软件漏洞属性之后,可以通过第一软件漏洞属性,对软件漏洞报错记录进行操作行为解析,得到与第一软件漏洞属性对应的办公互动状态下第二软件漏洞报错事件的第二语义关键词,鉴于此,可以通过第一语义关键词和第二语义关键词之间的比较结果,得到属性识别偏差,并基于属性识别偏差,调整第一软件漏洞属性,得到目标软件漏洞属性。上述方式,通过软件漏洞报错事件语义关键词进一步改善软件漏洞属性,有助于提高软件漏洞属性的可信度和时效性。
在一种可示性实施例中,第二语义关键词可以以设定维度的第二词向量矩阵进行表达,且设定维度可以为目标办公软件运行日志的特征维度。在操作行为解析步骤中,对于第二词向量矩阵V_array_2中第u个分布节点而言,可以确定软件漏洞报错记录中第v个知识拓扑集经第一软件漏洞属性迁移变换至目标办公软件运行日志的迁移变换指示位置,并确定迁移变换指示位置对目标办公软件运行日志中第u个分布节点的对应分布的统计信息以及确定目标办公软件运行日志中第u个分布节点的对应分布至迁移变换指示位置的邻居P(u,v),从而可以基于每个知识拓扑集对应的统计信息 和邻居P(u,v),得到第二词向量矩阵V_array_2中第u个分布节点的属性描述值。
在一种可示性实施例中,第一语义关键词可以以设定维度的第一词向量矩阵V_array_1进行表达,另外,第二语义关键词也可以以设定维度的第二词向量矩阵V_array_2进行表达,且设定维度可以为目标办公软件运行日志的特征维度。
基于此,可以确定目标办公软件运行日志中每个分布节点对应的偏差重要性指数,且匹配于软件漏洞报错事件或漏洞安全防护事件的分布节点携带第一重要性指数,不匹配于软件漏洞报错事件、漏洞安全防护事件中其中一项的分布节点携带第二重要性指数,第一重要性指数可以指定为大于第二重要性指数,如第一重要性指数可以指定为1,第二重要性指数可以指定为0。进一步地,对于每个分布节点,可以确定分布节点分别在第一词向量矩阵中的第一属性描述值和在第二词向量矩阵中的第二属性描述值,并确定第一属性描述值和第二属性描述值之间的属性描述差异,以及基于分布节点对应的属性描述差异和偏差重要性指数,得到分布节点对应的局部识别偏差,从而基于每个分布节点对应的局部识别偏差,得到属性识别偏差。为了方便对本发明进行阐述,可以以评价性矩阵eva_array来表示目标办公软件运行日志中每个分布节点对应的偏差重要性指数,比如评价性矩阵eva_array中第u个分布节点的属性描述值即为目标办公软件运行日志中第u个分布节点的偏差重要性指数。
在一种可示性实施例中,可以采用属性优化模型(比如RNN网络)结合属性识别偏差,对第一软件漏洞属性进行调整,示例性地,其学习率可以指定为0.3,但不限于此。软件漏洞属性调整的实际实施步骤,可以参照属性优化模型的相关技术内容。
在一种可示性实施例中,可以基于属性识别偏差,调整第一软件漏洞属性,得到第二软件漏洞属性,并响应于属性识别偏差符合设定要求,将第二软件漏洞属性作为当前的第一软件漏洞属性,并再次跳转至上述通过第一软件漏洞属性,对软件漏洞报错记录进行操作行为解析的步骤,直到属性识别偏差不符合该设定要求为止,此时可以将第二软件漏洞属性作为目标软件漏洞属性。基于上述内容,在软件漏洞属性调整步骤中,可以根据属性识别偏差进行反复调整,能够保障获取到的目标软件漏洞属性的准确性。
举例而言,指定要求可以指定为:属性识别偏差不小于设定判定值,换言之,当属性识别偏差不小于设定判定值时,可以认为软件漏洞属性调整效果可能还有待改进,在这种情况下可以进行反复调整,以再次进行软件漏洞属性调整,而当属性识别偏差小于设定判定值时,可以认为软件漏洞属性调整效果基本达到要求,在这种情况下可以停止调整,然后将最终的第二软件漏洞属性作为目标软件漏洞属性。设定判定值的实际取值,可以灵活设置。
基于上述技术内容,确定目标办公软件运行日志以及所述目标办公软件运行日志的采集状态,并确定采集状态处的软件漏洞报错记录,且目标办公软件运行日志中包含第一软件漏洞报错事件,软件漏洞报错记录中第二软件漏洞报错事件是通过知识拓扑集建立的内容分布,基于此,确定目标办公软件运行日志中第一软件漏洞报错事件的第一漏洞特征集,并确定软件漏洞报错记录中第二软件漏洞报错事件的第二漏洞特征集,以及通过第一漏洞特征集和第二漏洞特征集,识别获得第一软件漏洞属性,从而通过第一软件漏洞报错事件的第一语义关键词调整第一软件漏洞属性,得到目标办公软件运行日志的目标软件漏洞属性,首先,只通过需软件漏洞报错记便能够对软件漏洞属性进行识别分析,而软件漏洞报错记录中第二软件漏洞报错事件又是通过知识拓扑集形成的内容分布,这样可以不必生成包含较多噪声信息的全办公场景型内容分布,进而减少软件漏洞属性识别分析的软硬件资源开销,其次,鉴于对全办公场景型内容分布的依赖性较低,可以不用对内容分布进行经常更新。综上,能够高效精准地确定目标办公软件运行日志的目标软件漏洞属性,从而可以根据目标软件漏洞属性确定目标办公软件运行日志在相关软件漏洞分析机制中的漏洞隐患。
以下特征挖掘的相关技术方案。可以理解的是,对于本发明实施例而言,在待进行挖掘的办公软件漏洞特征为第一办公软件漏洞特征的基础上,目标描述向量为第一描述向量,在待进行挖掘的办公软件漏洞特征为第二办公软件漏洞特征的基础上,目标描述向量为第二描述向量。示例性的本发明实施例可以涵盖如下技术方案。
S61、将多个待进行挖掘的办公软件漏洞特征的基础描述向量进行向量压缩操作,得到多个已完成向量压缩操作的办公软件漏洞特征的阶段化描述向量和映射分布标签。
例如,基础描述向量可以理解为初始特征,向量压缩操作可以理解为下采样处理,映射分布标签可以理解为特征空间中的分布位置。
在一种可示性实施例中,为了保障特征挖掘质量,可以采用AI智能模型挖掘得到目标描述向量。进一步地,AI智能模型可以涵盖第一子模型,第一子模型(比如编码模型)旨在实施向量压缩操作。例如,第一子模型可以涵盖x个全局滑动平均处理单元(卷积层)。可以理解的是,x的取值可以灵活设计。
可以理解的是,在向量压缩操作步骤中,伴随模型显著性描述的不断扩增,办公软件漏洞特征也将逐渐处于非紧密状态,比如一个办公软件漏洞特征能够涵盖多个待进行挖掘的办公软件漏洞特征的描述内容,可以认为向量压缩操作所得到的已完成向量压缩操作的办公软件漏洞特征的覆盖范围在扩大,因此可以有效挖掘出漏洞特征集的阶段化传递描述。
例如,待进行挖掘的办公软件漏洞特征的基础描述向量可以根据需要进行设置。此外,映射分布标签可以通过三维坐标进行记录。举例而言,以第一子模型包括两个全局滑动平均处理单元为例,在通过第一个全局滑动平均处理单元向量压缩操作之后,可以得到范围较大的已完成向量压缩操作的办公软件漏洞特征的阶段化描述向量,进一步通过过第二个全局滑动平均处理单元向量压缩操作,可以得到范围更大的已完成向量压缩操作的办公软件漏洞特征的阶段化描述向量。
S62:对于每个已完成向量压缩操作的办公软件漏洞特征,将已完成向量压缩操作的办公软件漏洞特征以及该已完成向量压缩操作的办公软件漏洞特征的模板办公软件漏洞特征的阶段化描述向量启用第一连接处理,得到第一向量连接处理结果。
对于本发明实施例而言,模板办公软件漏洞特征基于映射分布标签从多个已完成向量压缩操作的办公软件漏洞特征中确定所得。例如,可以基于映射分布标签,分析每个已完成向量压缩操作的办公软件漏洞特征两两之间的量化差异,并对于每一已完成向量压缩操作的办公软件漏洞特征而言,可以将其他的已完成向量压缩操作的办公软件漏洞特征作为待定办公软件漏洞特征,并确定与其之间的量化差异符合指定要求的待定办公软件漏洞特征作为其对应的模板办公软件漏洞特征。示例性地,按照量化差异升序的规则将其他已完成向量压缩操作的办公软件漏洞特征进行整理,则指定要求可以指定为位于设定队列编号之前。
在一种可示性实施例中,为尽量削弱显著性描述差异带来的干扰,可以以软件漏洞报错记录在采集状态处与基准漏洞报告重复的共性数据为认证示例,生成用于对办公软件漏洞特征进行迁移变换的迁移变换引导信息,且该基准漏洞报告与所述软件漏洞报错记录的关键词具有上下游联系,并将每个已完成向量压缩操作的办公软件漏洞特征分别迁移变换至迁移变换引导信息的迁移变换空间,得到对应的对办公软件漏洞特征进行迁移变换,以及基于对办公软件漏洞特征进行迁移变换在迁移变换空间的非约束性比较结果,得到对应已完成向量压缩操作的办公软件漏洞特征之间的量化差异。基于上述技术方案,通过迁移变换能够在一定程度上降低显著性描述差异产生的误差,这样能够显著提高视觉型拓扑的精度和完整性,有助于提高向量连接处理的准确性,进而可以有助于提高描述向量的精度。
在一些示例下,上述认证示例(在先的漏洞报告)与基准漏洞报告之间的差异可以根据设计情况指定。可以理解的是,为了进一步减少显著性描述差异带来的干扰,该认证示例与采集状态的匹配度可能进行适应性调整。另外,基准漏洞报告可以是在采集状态下任意一个与关键词具有上下游联系的漏洞报告。
对于一些示例而言,为了便于非约束性比较结果(报告文本距离)的确定,可以将迁移变换引导信息(投影指示)的特征识别度尽可能扩大,从而可以采用对办公软件漏洞特征进行迁移变换之间的余弦相似度作为非约束性比较结果。
在一种可示性实施例中,结合上述相关技术方案,为了保障特征挖掘质量,可以采样AI智能模型挖掘得到目标描述向量,且AI智能模型可以涵盖第二子模型,且第二子模型旨在实施第一连接处理。
在一些可能的示例下,第二子模型可以涵盖y个视觉滑动平均处理单元,可以理解的是,y可以灵活设置。
举例而言,可以将每个已完成向量压缩操作的办公软件漏洞特征依次作为当前办公软件漏洞特征,并将除所述当前办公软件漏洞特征以外的已完成向量压缩操作的办公软件漏洞特征作为待定办公软件漏洞特征,基于此,可以确定与当前办公软件漏洞特征之间的量化差异符合指定要求的待定办公软件漏洞特征,作为当前办公软件漏洞特征对应的模板办公软件漏洞特征,且量化差异是基于映射分布标签确定所得的。关于量化差异的确定思路以及指定要求的配置思路,可以参照上述部分内容。
基于此,可以进一步基于每个已完成向量压缩操作的办公软件漏洞特征以及该已完成向量压缩操作的办公软件漏洞特征对应的模板办公软件漏洞特征,生成视觉型拓扑,视觉型拓扑(节点化的关系网络图)中拓扑单元表示已完成向量压缩操作的办公软件漏洞特征的阶段化描述向量,且表示已完成向量压缩操作的办公软件漏洞特征以及该已完成向量压缩操作的办公软件漏洞特征的模板办公软件漏洞特征的阶段化描述向量的拓扑单元之间具有关联关系,并可以基于视觉型拓扑进行向量连接处理,得到每个已完成向量压缩操作的办公软件漏洞特征的第一向量连接处理结果。如此设计,基于每个已完成向量压缩操作的办公软件漏洞特征的映射分布标签确定出视觉型拓扑,并在视觉型拓扑的基础上进行向量连接处理,有助于提高向量连接处理的可信度及精度。
举例而言,对于每一个视觉滑动平均处理单元而言,为了方便对本发明进行阐述,可以将已完成向量压缩操作的办公软件漏洞特征feature的阶段化描述向量记为part_feature,将已完成向量压缩操作的办公软件漏洞特征feature经视觉滑动平均处理单元进行向量连接处理之后的第一向量连接处理结果记为part’_feature,已完成向量压缩操作的办公软件漏洞特征feature对应的模板办公软件漏洞特征的集合可以记为SET(feature),且属于该集合SET(feature)中的第v个模板办公软件漏洞特征可以记为part_feature_j,则经一个视觉滑动平均处理单元进行向量连接处理之后的第一向量连接处理结果part’_feature可以通过相关公式计算得到(比如可以参阅相关人工智能场景下的特征计算公式)。如此设计,通过生成多个视觉滑动平均处理单元,可以充分挖掘漏洞特征集的整体化绑定描述。
S63:基于多个已完成向量压缩操作的办公软件漏洞特征的第一向量连接处理结果进行向量扩展翻译,得到多个待进行挖掘的办公软件漏洞特征的目标描述向量。
在一种可示性实施例中,AI智能模型还可以进一步包括第三子模型(比如可以理解为解码层),且第三子模型用于向量扩展翻译(上采样解码)。进一步地,第三子模型可以涵盖x个变换滑动平均处理单元。可以理解的是,x的取值可以灵活调整。另外,变换滑动平均处理单元的实际处理可以参阅转置卷积层的处理思路。
在一种可示性实施例中,为了进一步保障描述向量的精度和完整性,还可以将已完成向量压缩操作的办公软件漏洞特征的阶段化描述向量和第一向量连接处理结果进行第二连接处理,得到第二向量连接处理结果,再将多个已完成向量压缩操作的办公软件漏洞特征的第二向量连接处理结果进行向量扩展翻译,得到多个待进行挖掘的办公软件漏洞特征的目标描述向量。基于上述技术方案,在向量扩展翻译步骤中同时考虑向量压缩操作所得到的阶段化描述向量,可以实现不同等级的特征的融合处理,进而有助于提高描述向量的精度。举例而言,第二连接处理可以涵盖但不局限于均值处理、融合处理和加权处理等。
在一些示例下,在第一子模型具有x个全局滑动平均处理单元且第三子模型包括x个变换滑动平均处理单元的基础上,为了方便对本发明进行阐述,可以将数值num1确定为M,则第m个全局滑动平均处理单元与第M+1-m个变换滑动平均处理单元具有突变关联关系,以实现上述第二连接处理。以M为2为例,第1个全局滑动平均处理单元与第2个变换滑动平均处理单元之间可以具有突变关联关系,第2个全局滑动平均处理单元与第1个变换滑动平均处理单元之间可以具有突变关联关系(比如跳跃连接)。
另外,可以理解的是,AI智能模型在调试步骤可以结合比对型模型指标实现(对比损失),相关损失函数可以参阅部分现有技术方案实现。
应用于本发明实施例,将多个待进行挖掘的办公软件漏洞特征的基础描述向量进行向量压缩操作,得到多个已完成向量压缩操作的办公软件漏洞特征的阶段化描述向量和映射分布标签,对于每个已完成向量压缩操作的办公软件漏洞特征,将已完成向量压缩操作的办公软件漏洞特征以及该已完成向量压缩操作的办公软件漏洞特征的模板办公软件漏洞特征的阶段化描述向量启用第一连接处理,得到第一向量连接处理结果,且模板办公软件漏洞特征基于映射分布标签从多个已完成向量压缩操作的办公软件漏洞特征中确定所得。
基于此,再基于多个已完成向量压缩操作的办公软件漏洞特征的第一向量连接处理结果进行向量扩展翻译,得到多个待进行挖掘的办公软件漏洞特征的目标描述向量,且在待进行挖掘的办公软件漏洞特征为第一办公软件漏洞特征的基础上,目标描述向量为第一描述向量,在待进行挖掘的办公软件漏洞特征为第二办公软件漏洞特征的基础上,目标描述向量为第二描述向量,一方面通过向量压缩操作能够挖掘出每个已完成向量压缩操作的办公软件漏洞特征的漏洞特征集的阶段化传递描述,另一方面通过基于映射分布标签确定已完成向量压缩操作的办公软件漏洞特征的模板办公软件漏洞特征,并将已完成向量压缩操作的办公软件漏洞特征以及该已完成向量压缩操作的办公软件漏洞特征的模板办公软件漏洞特征的阶段化描述向量启用第一连接处理,能够挖掘出每个已完成向量压缩操作的办公软件漏洞特征的漏洞特征集的整体化绑定描述,这样能够将两者进行整合并且根据向量扩展翻译能够挖掘出每个待进行挖掘的办公软件漏洞特征的漏洞特征集的阶段化传递描述和漏洞特征集的整体化绑定描述,这样能够有助于提高描述向量的精度。
在一些可独立实施的实施例中,在确定出目标办公软件运行日志的目标软件漏洞属性之后,该方法还可以包括以下内容:根据所述目标软件漏洞属性确定所述目标办公软件运行日志对应的至少一个漏洞威胁信息;获取基于至少一个漏洞威胁信息衍生的办公事件运行轨迹、以及每个漏洞威胁信息的原始阶段化防护策略匹配结果;将所述办公事件运行轨迹包括的各个事件单元分组成多个事件单元队列;基于所述原始阶段化防护策略匹配结果,对分组得到的每个事件单元队列进行整体化防护策略匹配,确定每个所述事件单元队列的原始整体化防护策略匹配结果;基于每个所述事件单元队列的所述原始整体化防护策略匹配结果,确定针对所述每个漏洞威胁信息的待激活阶段化防护策略匹配结果。
在本发明实施例中,漏洞威胁信息用于表征目标软件漏洞属性可能造成的不良后果,比如文件丢失,信息泄露等,办公事件运行轨迹可以通过拓扑网络图的形式进行表达,用于反映办公事件的一系列节点化的运行情况,事件单元可以理解为办公事件运行轨迹中的多个不同的且存在关联的事件行为,阶段化防护策略匹配结果对应于局部的防护策略匹配,整体化防护策略匹配结果对应于全局的防护策略匹配,如此一来,通过原始整体化防护策略匹配结果对原始阶段化防护策略匹配结果进行更新,能够保障得到的待激活阶段化防护策略匹配结果的可信度和高匹配度,从而提高办公信息防护的质量。
在一些可独立实施的实施例中,所述将所述办公事件运行轨迹包括的各个事件单元分组成多个事件单元队列,包括:从所述办公事件运行轨迹包括的各个事件单元中,抽取设定数目的事件单元,将抽取的每个事件单元的互动会话描述分别作为待分组的事件单元队列的基准会话描述;确定所述各个事件单元中每个事件单元的所述互动会话描述,分别与每个所述基准会话描述之间的差异指数,并将该事件单元分组至对应的所述差异指数最小的基准会话描述所在的事件单元队列;确定每个事件单元队列对应的当前会话描述,并基于该当前会话描述,继续实施对事件单元队列进行分组的步骤,直至符合分组要求。
在本发明实施例中,分组要求可以是分组数量达到设定数量或者其他要求,本发明实施例不作限制,如此设计,能够实现对多个事件单元的有序分组,从而避免分组混乱。
基于同样的发明构思,图2示出了本发明实施例提供的一种基于大数据办公的软件漏洞分析装置的模块框图,一种基于大数据办公的软件漏洞分析装置可以包括实施图1所示的相关方法步骤的如下模块。
报错记录确定模块21,用于确定目标办公软件运行日志以及所述目标办公软件运行日志的采集状态,并确定采集状态处的软件漏洞报错记录。
漏洞特征获取模块22,用于确定目标办公软件运行日志中第一软件漏洞报错事件的第一漏洞特征集,并确定软件漏洞报错记录中第二软件漏洞报错事件的第二漏洞特征集。
漏洞属性识别模块23,用于通过第一漏洞特征集和第二漏洞特征集,识别获得第一软件漏洞属性。
漏洞属性优化模块24,用于通过第一软件漏洞报错事件的第一语义关键词调整第一软件漏洞属性,得到目标办公软件运行日志的目标软件漏洞属性。
应用于本发明的相关实施例可以达到如下技术效果:能够高效精准地确定目标办公软件运行日志的目标软件漏洞属性,从而可以根据目标软件漏洞属性确定目标办公软件运行日志在相关软件漏洞分析机制中的漏洞隐患。
以上所述,仅为本申请的具体实施方式。熟悉本技术领域的技术人员根据本申请提供的具体实施方式,可想到变化或替换,都应涵盖在本申请的保护范围之内。

Claims (10)

1.一种基于大数据办公的软件漏洞分析方法,其特征在于,应用于软件漏洞分析系统,所述方法至少包括:
确定目标办公软件运行日志以及所述目标办公软件运行日志的采集状态,并确定所述采集状态对应的软件漏洞报错记录;其中,所述目标办公软件运行日志中包含第一软件漏洞报错事件,且所述软件漏洞报错记录中第二软件漏洞报错事件是通过知识拓扑集建立的内容分布;
确定所述目标办公软件运行日志中所述第一软件漏洞报错事件的第一漏洞特征集,并确定所述软件漏洞报错记录中所述第二软件漏洞报错事件的第二漏洞特征集;结合所述第一漏洞特征集和所述第二漏洞特征集,识别获得第一软件漏洞属性;结合所述第一软件漏洞报错事件的第一语义关键词调整所述第一软件漏洞属性,得到所述目标办公软件运行日志的目标软件漏洞属性。
2.根据权利要求1所述的方法,其特征在于,所述确定所述目标办公软件运行日志中所述第一软件漏洞报错事件的第一漏洞特征集,包括:
确定目标办公软件运行日志中匹配于所述第一软件漏洞报错事件的第一日志内容块的第一显著性描述;
结合所述第一日志内容块的第一显著性描述进行逆向迁移变换,得到所述第一漏洞特征集。
3.根据权利要求1所述的方法,其特征在于,所述确定所述软件漏洞报错记录中所述第二软件漏洞报错事件的第二漏洞特征集,包括:
结合所述软件漏洞报错记录在当前办公互动状态下携带有效标识的知识拓扑集,得到显著性描述信息;
结合所述显著性描述信息中每个第二日志内容块的第二显著性描述进行逆向迁移变换,得到所述第二漏洞特征集。
4.根据权利要求1所述的方法,其特征在于,所述第一漏洞特征集涵盖多个第一办公软件漏洞特征,所述第二漏洞特征集涵盖多个第二办公软件漏洞特征;所述结合所述第一漏洞特征集和所述第二漏洞特征集,识别获得第一软件漏洞属性,包括:
挖掘每个所述第一办公软件漏洞特征的第一描述向量,并挖掘每个所述第二办公软件漏洞特征的第二描述向量;
其中,所述第一描述向量和所述第二描述向量皆涵盖漏洞特征集的阶段化传递描述和漏洞特征集的整体化绑定描述;
结合所述第一描述向量和所述第二描述向量进行漏洞属性描述分析,得到所述第一软件漏洞属性;
其中,描述向量的挖掘方式包括:将多个待进行挖掘的办公软件漏洞特征的基础描述向量进行向量压缩操作,得到多个已完成向量压缩操作的办公软件漏洞特征的阶段化描述向量和映射分布标签;对于每个所述已完成向量压缩操作的办公软件漏洞特征,将所述已完成向量压缩操作的办公软件漏洞特征以及该已完成向量压缩操作的办公软件漏洞特征的模板办公软件漏洞特征的阶段化描述向量启用第一连接处理,得到第一向量连接处理结果;其中,所述模板办公软件漏洞特征结合所述映射分布标签从所述多个已完成向量压缩操作的办公软件漏洞特征中确定所得;结合所述多个已完成向量压缩操作的办公软件漏洞特征的第一向量连接处理结果进行向量扩展翻译,得到所述多个待进行挖掘的办公软件漏洞特征的目标描述向量;其中,在所述待进行挖掘的办公软件漏洞特征为所述第一办公软件漏洞特征的基础上,所述目标描述向量为所述第一描述向量,在所述待进行挖掘的办公软件漏洞特征为所述第二办公软件漏洞特征的基础上,所述目标描述向量为所述第二描述向量;
其中,所述描述向量是通过AI智能模型挖掘所得的,所述AI智能模型包括第一子模型、第二子模型和第三子模型,且所述第一子模型包括x个全局滑动平均处理单元,所述第二子模型包括y个视觉滑动平均处理单元,所述第三子模型包括所述x个变换滑动平均处理单元;其中,所述第一子模型旨在实施所述向量压缩操作,所述第二子模型旨在实施所述第一连接处理,所述第三子模型旨在实施所述向量扩展翻译。
5.根据权利要求4所述的方法,其特征在于,所述结合所述多个已完成向量压缩操作的办公软件漏洞特征的第一向量连接处理结果进行向量扩展翻译,得到所述多个待进行挖掘的办公软件漏洞特征的目标描述向量,包括:
将所述已完成向量压缩操作的办公软件漏洞特征的阶段化描述向量和第一向量连接处理结果进行第二连接处理,得到第二向量连接处理结果;
将所述多个已完成向量压缩操作的办公软件漏洞特征的第二向量连接处理结果进行向量扩展翻译,得到所述多个待进行挖掘的办公软件漏洞特征的目标描述向量。
6.根据权利要求4所述的方法,其特征在于,所述对于每个所述已完成向量压缩操作的办公软件漏洞特征,将所述已完成向量压缩操作的办公软件漏洞特征以及该已完成向量压缩操作的办公软件漏洞特征的模板办公软件漏洞特征的阶段化描述向量启用第一连接处理,得到第一向量连接处理结果,包括:
将每个所述已完成向量压缩操作的办公软件漏洞特征依次作为当前办公软件漏洞特征,并将除所述当前办公软件漏洞特征以外的已完成向量压缩操作的办公软件漏洞特征作为待定办公软件漏洞特征;
确定与所述当前办公软件漏洞特征之间的量化差异符合第一要求的待定办公软件漏洞特征,作为所述当前办公软件漏洞特征对应的模板办公软件漏洞特征;其中,所述量化差异是结合所述映射分布标签确定所得的;
基于每个所述已完成向量压缩操作的办公软件漏洞特征以及该已完成向量压缩操作的办公软件漏洞特征对应的模板办公软件漏洞特征,生成视觉型拓扑;其中,所述视觉型拓扑中拓扑单元反映所述已完成向量压缩操作的办公软件漏洞特征的阶段化描述向量,且表示所述已完成向量压缩操作的办公软件漏洞特征以及该已完成向量压缩操作的办公软件漏洞特征的模板办公软件漏洞特征的阶段化描述向量的拓扑单元之间具有关联关系;
结合所述视觉型拓扑进行向量连接处理,得到每个所述已完成向量压缩操作的办公软件漏洞特征的第一向量连接处理结果。
7.根据权利要求6所述的方法,其特征在于,在所述确定与所述当前办公软件漏洞特征之间的量化差异符合第一要求的待定办公软件漏洞特征,作为所述当前办公软件漏洞特征对应的模板办公软件漏洞特征之前,所述方法还包括:
以所述软件漏洞报错记录在所述采集状态下与基准漏洞报告之间的共性数据为认证示例,生成用于对办公软件漏洞特征进行迁移变换的迁移变换引导信息;其中,所述基准漏洞报告与所述软件漏洞报错记录的关键词具有上下游联系;
将每个所述已完成向量压缩操作的办公软件漏洞特征分别迁移变换至所述迁移变换引导信息的迁移变换空间,得到对应的对办公软件漏洞特征进行迁移变换;
结合所述对办公软件漏洞特征进行迁移变换在所述迁移变换空间的非约束性比较结果,得到对应所述已完成向量压缩操作的办公软件漏洞特征之间的量化差异。
8.根据权利要求1~7任一项所述的方法,其特征在于,所述结合所述第一软件漏洞报错事件的第一语义关键词调整所述第一软件漏洞属性,得到所述目标办公软件运行日志的目标软件漏洞属性,包括:
结合所述第一软件漏洞属性,对所述软件漏洞报错记录进行操作行为解析,得到与所述第一软件漏洞属性对应的办公互动状态下所述第二软件漏洞报错事件的第二语义关键词;
结合所述第一语义关键词与所述第二语义关键词之间的比较结果,得到属性识别偏差;
结合所述属性识别偏差,更新所述第一软件漏洞属性,得到所述目标软件漏洞属性;
其中,所述第一语义关键词通过设定维度的第一词向量矩阵进行记录,所述第二语义关键词通过设定维度的第二词向量矩阵进行记录,且所述设定维度为所述目标办公软件运行日志的特征维度;所述结合所述第一语义关键词与所述第二语义关键词之间的比较结果,得到属性识别偏差,包括:确定所述目标办公软件运行日志中每个分布节点对应的偏差重要性指数;其中,匹配于软件漏洞报错事件或漏洞安全防护事件的分布节点携带第一重要性指数,不匹配于软件漏洞报错事件、漏洞安全防护事件中其中一项的分布节点携带第二重要性指数,且所述第一重要性指数大于所述第二重要性指数;对于每个所述分布节点,确定所述分布节点分别在所述第一词向量矩阵中的第一属性描述值和在所述第二词向量矩阵中的第二属性描述值,并确定所述第一属性描述值和所述第二属性描述值之间的属性描述差异,以及结合所述分布节点对应的属性描述差异和偏差重要性指数,得到所述分布节点对应的局部识别偏差;基于每个所述分布节点对应的局部识别偏差,得到所述属性识别偏差。
9.根据权利要求8所述的方法,其特征在于,所述结合所述属性识别偏差,更新所述第一软件漏洞属性,得到所述目标软件漏洞属性,包括:
结合所述属性识别偏差,更新所述第一软件漏洞属性,得到第二软件漏洞属性;
在所述属性识别偏差符合第二要求的前提下,将所述第二软件漏洞属性作为当前的第一软件漏洞属性,并再次跳转至所述结合所述第一软件漏洞属性,对所述软件漏洞报错记录进行操作行为解析的步骤,直到所述属性识别偏差不符合所述第二要求为止,以及将所述第二软件漏洞属性作为所述目标软件漏洞属性。
10.一种软件漏洞分析系统,其特征在于,包括:存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;其中,当所述处理器执行所述计算机指令时,使得所述软件漏洞分析系统执行如权利要求1-9中任意一项所述的方法。
CN202210204151.3A 2022-03-03 2022-03-03 一种基于大数据办公的软件漏洞分析方法及系统 Active CN114564726B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210204151.3A CN114564726B (zh) 2022-03-03 2022-03-03 一种基于大数据办公的软件漏洞分析方法及系统
CN202211125706.1A CN115455429A (zh) 2022-03-03 2022-03-03 基于大数据的漏洞分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210204151.3A CN114564726B (zh) 2022-03-03 2022-03-03 一种基于大数据办公的软件漏洞分析方法及系统

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202211125706.1A Division CN115455429A (zh) 2022-03-03 2022-03-03 基于大数据的漏洞分析方法及系统

Publications (2)

Publication Number Publication Date
CN114564726A true CN114564726A (zh) 2022-05-31
CN114564726B CN114564726B (zh) 2023-04-25

Family

ID=81717347

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202211125706.1A Withdrawn CN115455429A (zh) 2022-03-03 2022-03-03 基于大数据的漏洞分析方法及系统
CN202210204151.3A Active CN114564726B (zh) 2022-03-03 2022-03-03 一种基于大数据办公的软件漏洞分析方法及系统

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202211125706.1A Withdrawn CN115455429A (zh) 2022-03-03 2022-03-03 基于大数据的漏洞分析方法及系统

Country Status (1)

Country Link
CN (2) CN115455429A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115659351A (zh) * 2022-10-24 2023-01-31 南京鼎山信息科技有限公司 一种基于大数据办公的信息安全分析方法、系统及设备
CN116318751A (zh) * 2022-09-07 2023-06-23 上海金电网安科技有限公司 漏洞识别方法、装置、设备及存储介质
CN116956295A (zh) * 2023-09-19 2023-10-27 杭州海康威视数字技术股份有限公司 基于文件图谱拟合的安全检测方法、装置及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113332729A (zh) * 2021-07-08 2021-09-03 创联无忧(广州)信息科技有限公司 基于深度学习的云游戏漏洞检测方法及人工智能服务器
CN113407951A (zh) * 2021-07-08 2021-09-17 广州市信恒软件技术有限公司 基于人工智能的云服务漏洞修复方法及大数据分析系统
CN114095273A (zh) * 2021-12-06 2022-02-25 青岛力口互联网科技有限公司 基于深度学习的互联网漏洞挖掘方法及大数据挖掘系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113332729A (zh) * 2021-07-08 2021-09-03 创联无忧(广州)信息科技有限公司 基于深度学习的云游戏漏洞检测方法及人工智能服务器
CN113407951A (zh) * 2021-07-08 2021-09-17 广州市信恒软件技术有限公司 基于人工智能的云服务漏洞修复方法及大数据分析系统
CN114095273A (zh) * 2021-12-06 2022-02-25 青岛力口互联网科技有限公司 基于深度学习的互联网漏洞挖掘方法及大数据挖掘系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HAO ZHANG等: "A real-time and ubiquitous network attack detection based on deep belief network and support vector machine", 《IEEE/CAA JOURNAL OF AUTOMATICA SINICA》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116318751A (zh) * 2022-09-07 2023-06-23 上海金电网安科技有限公司 漏洞识别方法、装置、设备及存储介质
CN116318751B (zh) * 2022-09-07 2023-10-03 上海金电网安科技有限公司 漏洞识别方法、装置、设备及存储介质
CN115659351A (zh) * 2022-10-24 2023-01-31 南京鼎山信息科技有限公司 一种基于大数据办公的信息安全分析方法、系统及设备
CN115659351B (zh) * 2022-10-24 2023-10-03 南京鼎山信息科技有限公司 一种基于大数据办公的信息安全分析方法、系统及设备
CN116956295A (zh) * 2023-09-19 2023-10-27 杭州海康威视数字技术股份有限公司 基于文件图谱拟合的安全检测方法、装置及设备
CN116956295B (zh) * 2023-09-19 2024-01-05 杭州海康威视数字技术股份有限公司 基于文件图谱拟合的安全检测方法、装置及设备

Also Published As

Publication number Publication date
CN115455429A (zh) 2022-12-09
CN114564726B (zh) 2023-04-25

Similar Documents

Publication Publication Date Title
CN114564726A (zh) 一种基于大数据办公的软件漏洞分析方法及系统
EP3674918B1 (en) Column lineage and metadata propagation
CN105095048A (zh) 一种基于业务规则的监控系统告警关联处理方法
US10534700B2 (en) Separating test verifications from test executions
CN114218568B (zh) 一种应用于云服务的大数据攻击处理方法及系统
CN109213752A (zh) 一种基于cim的数据清洗转换方法
CN109308290B (zh) 一种基于cim的高效数据清洗转换方法
CN114968727B (zh) 基于人工智能运维的数据库贯穿基础设施的故障定位方法
WO2022053163A1 (en) Distributed trace anomaly detection with self-attention based deep learning
CN110427298A (zh) 一种分布式日志的自动特征提取方法
CN116502162A (zh) 边缘算力网络中的异常算力联邦检测方法、系统及介质
CN117289925A (zh) 一种基于组件技术的软件建模方法及系统
US20210208855A1 (en) Code recommender for resolving a new issue received by an issue tracking system
CN115345600B (zh) 一种rpa流程的生成方法和装置
CN116383832A (zh) 一种基于图神经网络的智能合约漏洞检测方法
CN113821630A (zh) 一种数据聚类的方法和装置
CN116974554A (zh) 代码数据处理方法、装置、计算机设备和存储介质
CN114627991B (zh) 一种基于智慧医疗大数据的用户隐私保护方法及系统
CN115268847A (zh) 区块链智能合约的生成方法、装置及电子设备
CN111562943B (zh) 一种基于事件嵌入树及gat网络的代码克隆检测方法和装置
CN114647528A (zh) 一种批量文件的报错数据处理方法及装置
WO2024012186A1 (zh) 根因定位方法、通信设备及计算机可读存储介质
CN114546706B (zh) 一种应用于深度学习的应用程序缺陷分析方法及服务器
CN117389908B (zh) 接口自动化测试用例的依赖关系分析方法、系统及介质
CN114721861B (zh) 一种基于日志差异化比对的故障定位方法与系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220810

Address after: No. 146, Yingchun Street, Laishan District, Yantai City, Shandong Province, 264000

Applicant after: Mao Ludong

Address before: 264000 room 2407, Feilong Tianrun building, No. 169, Yingchun street, Laishan District, Yantai City, Shandong Province

Applicant before: Shandong aggregated data service Co.,Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230220

Address after: Aite Yunxiang Big Data Industrial Park, No. 1177, Linzi Avenue, Linzi District, Zibo City, Shandong Province, 255000

Applicant after: Shandong Aite Yunxiang Information Technology Co.,Ltd.

Address before: No. 146, Yingchun Street, Laishan District, Yantai City, Shandong Province, 264000

Applicant before: Mao Ludong

GR01 Patent grant
GR01 Patent grant