CN116305171A - 一种组件漏洞分析方法、装置、设备和存储介质 - Google Patents

一种组件漏洞分析方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN116305171A
CN116305171A CN202310565953.1A CN202310565953A CN116305171A CN 116305171 A CN116305171 A CN 116305171A CN 202310565953 A CN202310565953 A CN 202310565953A CN 116305171 A CN116305171 A CN 116305171A
Authority
CN
China
Prior art keywords
vulnerability
component
information
target
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310565953.1A
Other languages
English (en)
Other versions
CN116305171B (zh
Inventor
秦少华
孙基栩
司红星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siwei Chuangzhi Beijing Technology Development Co ltd
Original Assignee
Siwei Chuangzhi Beijing Technology Development Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siwei Chuangzhi Beijing Technology Development Co ltd filed Critical Siwei Chuangzhi Beijing Technology Development Co ltd
Priority to CN202310565953.1A priority Critical patent/CN116305171B/zh
Publication of CN116305171A publication Critical patent/CN116305171A/zh
Application granted granted Critical
Publication of CN116305171B publication Critical patent/CN116305171B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/57Certifying or maintaining trusted computer platforms, e.g. secure boots or power-downs, version controls, system software checks, secure updates or assessing vulnerabilities
    • G06F21/577Assessing vulnerabilities and evaluating computer system security
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种组件漏洞分析方法、装置、设备和存储介质,包括:基于信息安全漏洞数据集、漏洞分析信息和系统组件的组件描述信息构建漏洞分析知识图谱;根据漏洞组件的组件相关信息确定搜索查询语句;基于漏洞分析知识图谱,通过自然语言处理算法对搜索查询语句进行语义解析,确定漏洞组件的目标漏洞类别和目标组件类别;根据目标组件类别,确定漏洞组件对应的目标组件生产源,以及漏洞组件的相似组件;基于漏洞分析知识图谱,根据目标漏洞类别、目标组件类别、目标组件生产源和相似组件,确定漏洞组件的目标组件漏洞情报。节约了对漏洞组件进行组件漏洞分析的人工成本,提高了组件漏洞分析效率。

Description

一种组件漏洞分析方法、装置、设备和存储介质
技术领域
本发明实施例涉及计算机领域,尤其涉及一种组件漏洞分析方法、装置、设备和存储介质。
背景技术
随着软件产业的高速发展,开源组件的广泛应用,操作系统、数据库、web(WorldWide Web,全球广域网)服务器等组件应用到了业务系统中,在此基础上,组件的安全性得到了广泛关注。随着网络攻击手段越来越复杂,针对漏洞组件的攻击也越来越多。目前,若要获取到漏洞组件的漏洞情报,往往是根据漏洞组件的搜索查询语句,从记录组件漏洞情报的数据库中查找出与漏洞组件匹配的漏洞情报。但是这种情报查询方式会导致查询到的与漏洞组件匹配的漏洞情报数量庞大,且查询到的漏洞情报涉及到的组件漏洞的危害等级参差不齐,同时需要消耗巨大的人工和时间成本去甄别出漏洞组件的目标漏洞情报。因此,如何提高对漏洞组件的组件漏洞分析的效率,节约确定漏洞组件的目标漏洞情报所需的人工成本,是需要解决的问题。
发明内容
本发明提供了一种组件漏洞分析方法、装置、设备和存储介质,可以提高对漏洞组件的组件漏洞分析的效率,节约确定漏洞组件的目标漏洞情报所需的人工成本。
根据本发明的一方面,提供了一种组件漏洞分析方法,包括:
基于信息安全漏洞数据集、漏洞分析信息和系统组件的组件描述信息构建漏洞分析知识图谱;
根据漏洞组件的组件相关信息确定搜索查询语句;
基于所述漏洞分析知识图谱,通过自然语言处理算法对所述搜索查询语句进行语义解析,确定漏洞组件的目标漏洞类别和目标组件类别;
根据所述目标组件类别,确定所述漏洞组件对应的目标组件生产源,以及所述漏洞组件的相似组件;
基于漏洞分析知识图谱,根据所述目标漏洞类别、所述目标组件类别、所述目标组件生产源和所述相似组件,确定所述漏洞组件的目标组件漏洞情报。
根据本发明的另一方面,提供了一种组件漏洞分析装置,该装置包括:
知识图谱构建模块,用于基于信息安全漏洞数据集、漏洞分析信息和系统组件的组件描述信息构建漏洞分析知识图谱;
搜索查询语句确定模块,用于根据漏洞组件的组件相关信息确定搜索查询语句;
目标组件类别确定模块,用于基于所述漏洞分析知识图谱,通过自然语言处理算法对所述搜索查询语句进行语义解析,确定漏洞组件的目标漏洞类别和目标组件类别;
组件生产源确定模块,用于根据所述目标组件类别,确定所述漏洞组件对应的目标组件生产源,以及所述漏洞组件的相似组件;
组件漏洞情报确定模块,用于基于漏洞分析知识图谱,根据所述目标漏洞类别、所述目标组件类别、所述目标组件生产源和所述相似组件,确定所述漏洞组件的目标组件漏洞情报。
根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的组件漏洞分析方法。
根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的组件漏洞分析方法。
本发明实施例的技术方案,基于信息安全漏洞数据集、漏洞分析信息和系统组件的组件描述信息构建漏洞分析知识图谱;根据漏洞组件的组件相关信息确定搜索查询语句;基于漏洞分析知识图谱,通过自然语言处理算法对搜索查询语句进行语义解析,确定漏洞组件的目标漏洞类别和目标组件类别;根据目标组件类别,确定漏洞组件对应的目标组件生产源,以及漏洞组件的相似组件;基于漏洞分析知识图谱,根据目标漏洞类别、目标组件类别、目标组件生产源和相似组件,确定漏洞组件的目标组件漏洞情报。上述方案,解决了在根据漏洞组件的搜索查询语句,从记录组件漏洞情报的数据库中查找出与漏洞组件匹配的漏洞情报,导致查询到的与漏洞组件匹配的漏洞情报数量庞大,在查询结束后仍需要消耗大量人力去对查询到的漏洞情报进行甄别以确定漏洞组件的目标漏洞情报,导致对目标漏洞情报的获取效率低,且获取到的目标漏洞情报的精确度较低的问题。基于自然语言处理算法,根据漏洞分析知识图谱和搜索查询语句对漏洞组件进行组件漏洞分析,能够在对组件漏洞分析时,综合考虑多种渠道的组件漏洞相关信息,避免对组件漏洞相关信息考虑不全面导致对漏洞组件的目标组件漏洞情报的误判问题,调高了目标组件漏洞情报的准确度。同时,提高了确定目标组件漏洞情报时的智能化和自动化水平,节约了对漏洞组件进行组件漏洞分析的人工成本,提高了组件漏洞分析效率,从而能够及时获取漏洞组件情报,并对针对漏洞组件的网络攻击手段及时进行预防。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的一种组件漏洞分析方法的流程图;
图2为本发明实施例二提供的一种组件漏洞分析方法的流程图;
图3为本发明实施例三提供的一种组件漏洞分析方法的流程图;
图4为本发明实施例四提供的一种组件漏洞分析装置的结构示意图;
图5为本发明实施例五提供的一种电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语 “候选”和“目标”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“等”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1为本发明实施例一提供了一种组件漏洞分析方法的流程图,本实施例可适用于对漏洞组件的相关信息进行分析,确定漏洞组件的目标组件漏洞情报的情况。该方法可以由组件漏洞分析装置来执行,该组件漏洞分析装置可以采用硬件和/或软件的形式实现,该组件漏洞分析装置可配置于电子设备中。如图1所示,该方法包括:
S110、基于信息安全漏洞数据集、漏洞分析信息和系统组件的组件描述信息构建漏洞分析知识图谱。
其中,信息安全漏洞数据集包括CVE(Common Vulnerabilities & Exposures,通用漏洞披露)、CWE(Common Weakness Enumeration,常见缺陷列表)、CPE(CommonPlatformEnumeration,通用平台枚举)、CAPEC(Common Attack Pattern Enumeration andClassification,攻击类型枚举和分类数据集)等。
CVE是一种公共漏洞和公开漏洞编号系统。它是一种用于标识已知漏洞的标准化方法,旨在提供漏洞管理和跟踪的一致性和可读性,一个为广泛认同的信息安全漏洞或者已经暴露出来的弱点给出一个公共的编号。 CWE是一个安全漏洞词典,是一种用于描述和识别软件和硬件方面常见弱点的分类系统,其给出了一个具体编号的CVE漏洞归属的漏洞类型。例如,CWE-20表示输入验证不当,CWE-79表示输入中和不当,CWE-89表示SQL注入类型的漏洞,同时每个CWE都有与其相关的实现该种漏洞类型攻击的技术即对应的CAPEC实体。CWE指常见缺陷列表,是一个安全漏洞词典。CPE是描述和识别企业计算资产中存在的应用程序、操作系统和硬件设备类别的标准化方法,它提供了一个标准的机器可读的格式,利用这个格式可以对IT产品和平台进行唯一编码。CAPEC是常用攻击类型的分类数据集。CAPEC包含了众多种攻击模式,每种攻击模式都有一个唯一的标识符和一组描述其特征和行为的属性。CAPEC中常见的攻击模式有授权攻击、注入攻击、概率攻击和资源耗尽攻击等,每一种攻击模式都会有其特有的攻击收益。
具体的,建立信息安全漏洞数据集、漏洞分析信息和系统组件的组件描述信息之间的关联关系。构建信息安全漏洞数据集、漏洞分析信息和系统组件的组件描述信息在漏洞分析知识图谱中对应的节点,并根据上述关联关系,确定漏洞分析知识图谱中各节点的连接关系,基于连接关系对各节点进行关联连接,以构建漏洞分析知识图谱。示例性的,可以使用Neo4j作为知识图谱的存储数据库,便于后续根据Neo4j的查询语言对漏洞分析知识图谱进行搜索插叙。Neo4j是一个高性能的NOSQL图形数据库,它将结构化数据存储在网络上而不是表中。
S120、根据漏洞组件的组件相关信息确定搜索查询语句。
其中,搜索查询语句即搜索query。搜索查询语句能够尽可能详细描述搜索的要求,搜索查询语句中包含有漏洞组件的漏洞等级、组件涉及的技术关键词等信息。漏洞组件是指监测到的存在漏洞的组件。
具体的,当发现漏洞组件时,需要确定漏洞组件的目标组件漏洞情报。目标组件漏洞情报包括漏洞组件出现漏洞的原因,以及关于漏洞组件的漏洞情况的详细描述信息。根据漏洞组件的组件相关信息确定搜索查询语句
S130、基于漏洞分析知识图谱,通过自然语言处理算法对搜索查询语句进行语义解析,确定漏洞组件的目标漏洞类别和目标组件类别。
示例性的,确定漏洞组件的目标漏洞类别和目标组件类别的方法可以是:基于漏洞分析知识图谱,通过自然语言处理算法中的漏洞类别分类模型对搜索查询语句进行语义解析,确定漏洞组件的目标漏洞类别;基于漏洞分析知识图谱,通过自然语言处理算法中的组件类别分类模型对搜索查询语句进行语义解析,确定漏洞组件的目标组件类别。
其中,自然语言处理算法中包含有漏洞类别分类模型和组件类别分类模型。漏洞类别分类模型和组件类别分类模型均为fasttext模型。
具体的,基于漏洞分析知识图谱,通过自然语言处理算法中的漏洞类别分类模型对搜索查询语句进行语义解析,根据语义解析结果获取至少一个漏洞分类类别,以及各漏洞分类类别对应的概率。确定搜索查询语句对应的最大概率的漏洞分类类别作为漏洞组件的目标漏洞类别。基于漏洞分析知识图谱,通过自然语言处理算法中的组件类别分类模型对搜索查询语句进行语义解析,根据语义解析结果获取至少一个组件分类类别,以及各组件分类类别对应的概率。确定搜索查询语句对应的最大概率的组件分类类别作为漏洞组件的目标组件类别。
可以理解的是,自然语言处理算法中包含有漏洞类别分类模型和组件类别分类模型,能够提高对漏洞组件的目标漏洞类别和目标组件类别的确定效率,以及提高确定的目标漏洞类别和目标组件类别的精确度。
S140、根据目标组件类别,确定漏洞组件对应的目标组件生产源,以及漏洞组件的相似组件。
其中,目标组件生产源是指可能是漏洞组件生产源头的厂家。漏洞组件的相似组件可以是目标组件生产源生产的,和漏洞组件相似的组件。
具体的,根据目标组件的类别,确定可能作为漏洞组件生产源头的厂家为目标组件生产源,并确定目标组件生产源所生产的和漏洞组件相似的组件为相似组件。
示例性的,确定漏洞组件对应的目标组件生产源,以及漏洞组件的相似组件的方法可以是:确定漏洞组件对应的候选组件生产源,并根据目标组件类别和候选组件生产源对应的候选组件类别,确定目标组件标识和候选组件标识之间的编辑距离相似度;根据编辑距离相似度,从候选组件生产源中确定目标组件生产源,并根据目标组件生产源确定漏洞组件的相似组件。
其中,候选组件类别是指候选组件生产源所生产的,可能和漏洞组件相似的候选组件的组件类别。
具体的,确定漏洞组件对应的候选组件生产源,并获取候选组件生产源所生产的候选组件的候选组件类别,并根据目标组件类别确定目标组件标识,且根据候选组件类别确定候选组件标识。目标组件标识可以是目标组件的名称,或者是表征目标组件身份的字符串。候选组件标识可以是候选组件的名称,或者是表征候选组件身份的字符串。确定目标组件标识和候选组件标识之间的编辑距离相似度。确定大于预设的距离阈值的编辑距离相似度所对应的候选组件生产源为目标组件生产源。确定目标组件生产源生产的候选组件为漏洞组件的相似组件。
示例性的,确定目标组件标识和候选组件标识之间的编辑距离相似度的公式如公式(1)所示:
Figure SMS_1
(1)
其中,Similarity(a,b)为目标组件标识和候选组件标识之间的编辑距离相似度;a为目标组件标识;b为候选组件标识;len(a)表示目标组件标识对应的字符串长度;len(b)表示候选组件标识对应的字符串长度;distance(a,b)是指目标组件标识和候选组件标识之间的编辑距离。编辑距离是指由一个字符串转成另一个字符串所需的最少编辑操作次数,编辑距离越小,说明两个字符串之间越相似。
可以理解的是,根据目标组件标识和候选组件标识的编辑距离相似度,确定漏洞组件的目标组件生产源和相似组件,可以进一步缩小对漏洞组件的目标组件漏洞情报的查询范围,以提高对目标组件漏洞情报的查询效率。
S150、基于漏洞分析知识图谱,根据目标漏洞类别、目标组件类别、目标组件生产源和相似组件,确定漏洞组件的目标组件漏洞情报。
其中,组件漏洞情报通常包括漏洞组件的漏洞信息、漏洞利用程序、组件修复情报等信息。
具体的,根据目标漏洞类别、目标组件类别、目标组件生产源和相似组件,对漏洞分析知识图谱进行搜索,根据搜索结果确定与目标漏洞类别、目标组件类别、目标组件生产源和相似组件匹配的漏洞分析信息,以及信息安全数据集中记录的组件漏洞相关信息,并将与目标漏洞类别、目标组件类别、目标组件生产源和相似组件匹配的漏洞分析信息和组件漏洞相关信息作为漏洞组件的目标组件漏洞情报。以使运维人员根据目标组件漏洞情报对漏洞组件进行修复。
示例性的,当获取的漏洞分析信息和组件漏洞相关信息数量较多时,可以采用信息安全漏洞数据集中的CAPEC对漏洞分析信息和组件漏洞相关信息进行攻击收益分析,以根据分析结果确定攻击收益较高的漏洞分析信息和组件漏洞相关信息为漏洞组件的目标组件漏洞情报。
本实施例提供的技术方案,基于信息安全漏洞数据集、漏洞分析信息和系统组件的组件描述信息构建漏洞分析知识图谱;根据漏洞组件的组件相关信息确定搜索查询语句;基于漏洞分析知识图谱,通过自然语言处理算法对搜索查询语句进行语义解析,确定漏洞组件的目标漏洞类别和目标组件类别;根据目标组件类别,确定漏洞组件对应的目标组件生产源,以及漏洞组件的相似组件;基于漏洞分析知识图谱,根据目标漏洞类别、目标组件类别、目标组件生产源和相似组件,确定漏洞组件的目标组件漏洞情报。上述方案,解决了在根据漏洞组件的搜索查询语句,从记录组件漏洞情报的数据库中查找出与漏洞组件匹配的漏洞情报,导致查询到的与漏洞组件匹配的漏洞情报数量庞大,在查询结束后仍需要消耗大量人力去对查询到的漏洞情报进行甄别以确定漏洞组件的目标漏洞情报,导致对目标漏洞情报的获取效率低,且获取到的目标漏洞情报的精确度较低的问题。基于自然语言处理算法,根据漏洞分析知识图谱和搜索查询语句对漏洞组件进行组件漏洞分析,能够在对组件漏洞分析时,综合考虑多种渠道的组件漏洞相关信息,避免对组件漏洞相关信息考虑不全面导致对漏洞组件的目标组件漏洞情报的误判问题,调高了目标组件漏洞情报的准确度。同时,提高了确定目标组件漏洞情报时的智能化和自动化水平,节约了对漏洞组件进行组件漏洞分析的人工成本,提高了组件漏洞分析效率,从而能够及时获取漏洞组件情报,并对针对漏洞组件的网络攻击手段及时进行预防。
实施例二
图2为本发明实施例二提供的一种组件漏洞分析方法的流程图,本实施例在上述实施例的基础上进行了优化,给出了一种基于漏洞分析知识图谱,根据目标漏洞类别、目标组件类别、目标组件生产源和相似组件,确定漏洞组件的目标组件漏洞情报的优选实施方式。具体的,如图2所示,该方法包括:
S210、基于信息安全漏洞数据集、漏洞分析信息和系统组件的组件描述信息构建漏洞分析知识图谱。
S220、根据漏洞组件的组件相关信息确定搜索查询语句。
S230、基于漏洞分析知识图谱,通过自然语言处理算法对搜索查询语句进行语义解析,确定漏洞组件的目标漏洞类别和目标组件类别。
S240、根据目标组件类别,确定漏洞组件对应的目标组件生产源,以及漏洞组件的相似组件。
S250、基于漏洞分析知识图谱,根据目标漏洞类别、目标组件类别、目标组件生产源和相似组件对漏洞组件进行组件漏洞分析,确定候选组件漏洞情报。
其中,候选组件漏洞情报是指,根据目标漏洞类别、目标组件类别、目标组件生产源和相似组件,对漏洞分析知识图谱进行初步查询,所获得的可能和漏洞组件有关的组件漏洞情报。
需要说明的是,基于漏洞分析知识图谱,根据目标漏洞类别、目标组件类别、目标组件生产源和相似组件对漏洞组件进行组件漏洞分析,获得的候选组件漏洞情报的数量依旧十分庞大,此时还需大量运维人员的参与,才能从候选组件漏洞情报中筛选出漏洞组件的相关漏洞情报。因此,还需要对候选组件漏洞情报进行进一步分析,以缩小漏洞组件的相关漏洞情报的范围。
示例性的,确定候选组件漏洞情报的方法可以是:从漏洞分析知识图谱中提取出信息评价值大于评价阈值的漏洞分析信息作为目标分析信息,并根据搜索查询语句确定漏洞组件的漏洞等级;根据目标分析信息和漏洞等级,从漏洞分析知识图谱中确定目标知识图谱;基于目标知识图谱,根据目标漏洞类别、目标组件类别、目标组件生产源和相似组件对漏洞组件进行组件漏洞分析,确定候选组件漏洞情报。
其中,信息评价值是指可以衡量漏洞分析信息的分值,可以根据漏洞分析信息的内容丰富程度确定漏洞分析信息的信息评价值。目标知识图谱是指从漏洞分析知识图谱中提取出的,符合目标分析信息和漏洞等级的知识图谱内容。
具体的,可以利用Neo4j的查询语言Cypher语句,对候选组件漏洞情报的查询条件进行限制,从漏洞分析知识图谱中提取出信息评价值大于评价阈值的漏洞分析信息作为目标分析信息,并根据搜索查询语句确定漏洞组件的漏洞等级;从漏洞分析知识图谱中提取出与目标分析信息和漏洞等级匹配的知识图谱内容作为目标知识图谱。根据目标漏洞类别、目标组件类别、目标组件生产源和相似组件,对目标知识图谱进行搜索,根据搜索结果确定与目标漏洞类别、目标组件类别、目标组件生产源和相似组件匹配的漏洞分析信息,以及信息安全数据集中记录的组件漏洞相关信息,并将与目标漏洞类别、目标组件类别、目标组件生产源和相似组件匹配的漏洞分析信息和组件漏洞相关信息作为漏洞组件的候选组件漏洞情报。
可以理解的是,基于评价阈值和漏洞组件的漏洞等级,从漏洞分析知识图谱中提取出所需要的目标知识图谱,再基于目标知识图谱,根据目标漏洞类别、目标组件类别、目标组件生产源,确定漏洞组件的候选组件漏洞情报,可以避免漏洞分析知识图谱中的不必要的信息进行查询,能够提高对候选组件漏洞情报的获取效率。
S260、若候选组件漏洞情报的情报数量大于数量阈值,则从信息安全漏洞数据集和漏洞分析信息中获取候选组件漏洞情报对应的情报描述信息。
具体的,若候选组件漏洞情报的情报数量大于数量阈值,则根据信息安全漏洞数据集和漏洞分析信息,确定候选组件漏洞情报对应的情报描述信息。
示例性的,若候选组件漏洞情报的情报数量小于数量阈值,则将候选组件漏洞情报作为目标组件漏洞情报。
S270、对搜索查询语句和情报描述信息进行余弦相似度计算,根据计算结果从候选组件漏洞情报中确定漏洞组件的目标组件漏洞情报。
需要说明的是,余弦相似度计算的思想是:一个向量空间中两个向量夹角间的余弦值作为衡量两个个体之间差异的大小,余弦值接近1,则夹角趋于0,表明两个向量越相似;余弦值接近于0,则夹角趋于90度,表明两个向量越不相似。
具体的,通过矩阵分解算法确定搜索查询语句的查询语句词向量,以及情报描述信息的描述信息词向量。对查询语句词向量和描述信息词向量进行余弦相似度计算,确定查询语句词向量和描述信息词向量之间的余弦值,根据查询语句词向量和描述信息词向量之间的余弦值从描述信息词向量中确定与查询语句词向量相似的目标信息词向量。确定目标信息词向量对应的候选组件漏洞情报为漏洞组件的目标组件漏洞情报。
本实施例的技术方案,基于信息安全漏洞数据集、漏洞分析信息和系统组件的组件描述信息构建漏洞分析知识图谱;根据漏洞组件的组件相关信息确定搜索查询语句;基于漏洞分析知识图谱,通过自然语言处理算法对搜索查询语句进行语义解析,确定漏洞组件的目标漏洞类别和目标组件类别;根据目标组件类别,确定漏洞组件对应的目标组件生产源,以及漏洞组件的相似组件;基于漏洞分析知识图谱,根据目标漏洞类别、目标组件类别、目标组件生产源和相似组件对漏洞组件进行组件漏洞分析,确定候选组件漏洞情报;若候选组件漏洞情报的情报数量大于数量阈值,则从信息安全漏洞数据集和漏洞分析信息中获取候选组件漏洞情报对应的情报描述信息;对搜索查询语句和情报描述信息进行余弦相似度计算,根据计算结果从候选组件漏洞情报中确定漏洞组件的目标组件漏洞情报。上述方案,在确定漏洞组件的目标组件漏洞情报时,先根据漏洞分析知识图谱、目标漏洞类别、目标组件类别、目标组件生产源和相似组件对对漏洞组件进行组件漏洞分析,可以获取数量较多的候选组件漏洞情报。,根据搜索查询语句和候选组件漏洞情报对应的情报描述信息进行余弦相似度计算,以对候选组件漏洞情报进一步进行收束,从候选组件漏洞情报中筛选出漏洞组件的目标组件漏洞情报,从而提高对漏洞组件进行组件漏洞分析的效率。
实施例三
图3为本发明实施例三提供的一种组件漏洞分析方法的流程图,本实施例在上述实施例的基础上进行了优化,给出了一种基于信息安全漏洞数据集、漏洞分析信息和系统组件的组件描述信息构建漏洞分析知识图谱的优选实施方式。具体的,如图3所示,该方法包括:
S310、通过自然语言处理算法对漏洞分析信息进行信息挖掘,获取漏洞分析信息的通用漏洞披露信息,并基于通用漏洞披露信息建立漏洞分析信息和信息安全漏洞数据集之间的信息关联关系。
其中,通用漏洞披露信息是指用通用的描述方式描述的组件漏洞的相关信息。
具体的,在互联网上有非常多的关于组件漏洞的漏洞分析信息。利用自然语言处理中的实体抽取技术能够得对互联网上抓取的漏洞分析信息进行信息挖掘,确定漏洞分析信息中记录的通用漏洞披露信息,以根据通用漏洞披露信息建立漏洞分析信息和信息安全漏洞数据集之间的信息关联关系。
S320、对漏洞分析信息进行信息分析,确定漏洞分析信息的可读性指标,并根据可读性指标确定漏洞分析信息的信息评价值。
可读性指标包括信息长度、信息关键内容和信息维度。
具体的,信息长度适中的漏洞分析信息一般具有较高的可读性。漏洞分析信息中的信息关键内容越丰富,则漏洞分析信息的可读性越高。漏洞分析信息的信息维度越广,说明漏洞分析信息涉及到的漏洞可能性越多,则漏洞分析信息的可读性越高。因此,可以对漏洞分析信息进行信息分析,确定漏洞分析信息的信息长度、信息关键内容和信息维度。根据漏洞分析信息的信息长度、信息关键内容和信息维度,作为漏洞分析信息的可读性指标。并对漏洞分析信息的信息长度、信息关键内容和信息维度进行综合分析,确定漏洞分析信息的信息评价值。
S330、根据信息安全漏洞数据集、信息关联关系、漏洞分析信息、信息评价值、系统组件的组件描述信息构建漏洞分析知识图谱。
需要说明的是,在构建漏洞分析知识图谱时,漏洞分析知识图谱中漏洞分析信息对应的节点的属性信息,可以根据漏洞分析信息和信息评价值确定。
具体的,确定信息安全漏洞数据集、信息关联关系、漏洞分析信息和系统组件的组件描述信息之间的关联关系。基于上述关联关系,根据信息安全漏洞数据集、信息关联关系、漏洞分析信息、系统组件的组件描述信息构建漏洞分析知识图谱,并根据漏洞分析信息和信息评价值确定漏洞分析信息在漏洞分析知识图谱中对应节点的属性信息。
S340、根据漏洞组件的组件相关信息确定搜索查询语句。
S350、基于漏洞分析知识图谱,通过自然语言处理算法对搜索查询语句进行语义解析,确定漏洞组件的目标漏洞类别和目标组件类别。
S360、根据目标组件类别,确定漏洞组件对应的目标组件生产源,以及漏洞组件的相似组件。
S370、基于漏洞分析知识图谱,根据目标漏洞类别、目标组件类别、目标组件生产源和相似组件,确定漏洞组件的目标组件漏洞情报。
本实施例的技术方案,通过自然语言处理算法对漏洞分析信息进行信息挖掘,获取漏洞分析信息的通用漏洞披露信息,并基于通用漏洞披露信息建立漏洞分析信息和信息安全漏洞数据集之间的信息关联关系;对漏洞分析信息进行信息分析,确定漏洞分析信息的可读性指标,并根据可读性指标确定漏洞分析信息的信息评价值;可读性指标包括信息长度、信息关键内容和信息维度;根据信息安全漏洞数据集、信息关联关系、漏洞分析信息、信息评价值、系统组件的组件描述信息构建漏洞分析知识图谱;根据漏洞组件的组件相关信息确定搜索查询语句;基于漏洞分析知识图谱,通过自然语言处理算法对搜索查询语句进行语义解析,确定漏洞组件的目标漏洞类别和目标组件类别;根据目标组件类别,确定漏洞组件对应的目标组件生产源,以及漏洞组件的相似组件;基于漏洞分析知识图谱,根据目标漏洞类别、目标组件类别、目标组件生产源和相似组件,确定漏洞组件的目标组件漏洞情报。上述方案,在构建漏洞分析知识图谱时,对网络上的漏洞分析信息进行分析,以建立漏洞分析信息和信息安全漏洞数据集之间的信息关联关系,由于网络上的漏洞分析信息良莠不齐,因此在构建漏洞分析知识图谱时,根据漏洞分析信息的内容确定漏洞分析信息的信息评价值,以使漏洞分析知识图谱能够表征漏洞分析信息的信息评价值,丰富漏洞分析知识图谱的内容,同时提高漏洞分析知识图谱的可靠性,在后续基于漏洞分析知识图谱确定漏洞组件的目标组件漏洞情报时,可以提高对目标组件漏洞情报的获取效率,同时提高获取的目标组件漏洞情报的精确度。
实施例四
图4为本发明实施例四提供的一种组件漏洞分析装置的结构示意图。本实施例可适用于对漏洞组件的相关信息进行分析,确定漏洞组件的目标组件漏洞情报的情况。如图4所示,该组件漏洞分析装置包括:知识图谱构建模块410、搜索查询语句确定模块420、目标组件类别确定模块430、组件生产源确定模块440和组件漏洞情报确定模块450。
其中,知识图谱构建模块410,用于基于信息安全漏洞数据集、漏洞分析信息和系统组件的组件描述信息构建漏洞分析知识图谱;
搜索查询语句确定模块420,用于根据漏洞组件的组件相关信息确定搜索查询语句;
目标组件类别确定模块430,用于基于漏洞分析知识图谱,通过自然语言处理算法对搜索查询语句进行语义解析,确定漏洞组件的目标漏洞类别和目标组件类别;
组件生产源确定模块440,用于根据目标组件类别,确定漏洞组件对应的目标组件生产源,以及漏洞组件的相似组件;
组件漏洞情报确定模块450,用于基于漏洞分析知识图谱,根据目标漏洞类别、目标组件类别、目标组件生产源和相似组件,确定漏洞组件的目标组件漏洞情报。
本实施例提供的技术方案,基于信息安全漏洞数据集、漏洞分析信息和系统组件的组件描述信息构建漏洞分析知识图谱;根据漏洞组件的组件相关信息确定搜索查询语句;基于漏洞分析知识图谱,通过自然语言处理算法对搜索查询语句进行语义解析,确定漏洞组件的目标漏洞类别和目标组件类别;根据目标组件类别,确定漏洞组件对应的目标组件生产源,以及漏洞组件的相似组件;基于漏洞分析知识图谱,根据目标漏洞类别、目标组件类别、目标组件生产源和相似组件,确定漏洞组件的目标组件漏洞情报。上述方案,解决了在根据漏洞组件的搜索查询语句,从记录组件漏洞情报的数据库中查找出与漏洞组件匹配的漏洞情报,导致查询到的与漏洞组件匹配的漏洞情报数量庞大,在查询结束后仍需要消耗大量人力去对查询到的漏洞情报进行甄别以确定漏洞组件的目标漏洞情报,导致对目标漏洞情报的获取效率低,且获取到的目标漏洞情报的精确度较低的问题。基于自然语言处理算法,根据漏洞分析知识图谱和搜索查询语句对漏洞组件进行组件漏洞分析,能够在对组件漏洞分析时,综合考虑多种渠道的组件漏洞相关信息,避免对组件漏洞相关信息考虑不全面导致对漏洞组件的目标组件漏洞情报的误判问题,调高了目标组件漏洞情报的准确度。同时,提高了确定目标组件漏洞情报时的智能化和自动化水平,节约了对漏洞组件进行组件漏洞分析的人工成本,提高了组件漏洞分析效率,从而能够及时获取漏洞组件情报,并对针对漏洞组件的网络攻击手段及时进行预防。
示例性的,组件漏洞情报确定模块450,包括:
候选漏洞情报确定单元,用于基于漏洞分析知识图谱,根据目标漏洞类别、目标组件类别、目标组件生产源和相似组件对漏洞组件进行组件漏洞分析,确定候选组件漏洞情报;
情报描述信息确定单元,用于若候选组件漏洞情报的情报数量大于数量阈值,则从信息安全漏洞数据集中获取候选组件漏洞情报对应的情报描述信息;
目标漏洞情报确定单元,用于对搜索查询语句和情报描述信息进行余弦相似度计算,根据计算结果从信息安全漏洞数据集和漏洞分析信息中确定漏洞组件的目标组件漏洞情报。
示例性的,候选漏洞情报确定单元具体用于:
从漏洞分析知识图谱中提取出信息评价值大于评价阈值的漏洞分析信息作为目标分析信息,并根据搜索查询语句确定漏洞组件的漏洞等级;
根据目标分析信息和漏洞等级,从漏洞分析知识图谱中确定目标知识图谱;
基于目标知识图谱,根据目标漏洞类别、目标组件类别、目标组件生产源和相似组件对漏洞组件进行组件漏洞分析,确定候选组件漏洞情报。
示例性的,知识图谱构建模块410具体用于:
通过自然语言处理算法对漏洞分析信息进行信息挖掘,获取漏洞分析信息的通用漏洞披露信息,并基于通用漏洞披露信息建立漏洞分析信息和信息安全漏洞数据集之间的信息关联关系;
对漏洞分析信息进行信息分析,确定漏洞分析信息的可读性指标,并根据可读性指标确定漏洞分析信息的信息评价值;可读性指标包括信息长度、信息关键内容和信息维度;
根据信息安全漏洞数据集、信息关联关系、漏洞分析信息、信息评价值、系统组件的组件描述信息构建漏洞分析知识图谱。
示例性的,组件生产源确定模块440具体用于:
确定漏洞组件对应的候选组件生产源,并根据目标组件类别和候选组件生产源对应的候选组件类别,确定目标组件标识和候选组件标识之间的编辑距离相似度;
根据编辑距离相似度,从候选组件生产源中确定目标组件生产源,并根据目标组件生产源确定漏洞组件的相似组件。
示例性的,目标组件类别确定模块430具体用于:
基于漏洞分析知识图谱,通过自然语言处理算法中的漏洞类别分类模型对搜索查询语句进行语义解析,确定漏洞组件的目标漏洞类别;
基于漏洞分析知识图谱,通过自然语言处理算法中的组件类别分类模型对搜索查询语句进行语义解析,确定漏洞组件的目标组件类别。
本实施例提供的组件漏洞分析装置可适用于上述任意实施例提供的组件漏洞分析方法,具备相应的功能和有益效果。
实施例五
图5示出了可以用来实施本发明的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图5所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如组件漏洞分析方法。
在一些实施例中,组件漏洞分析方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时,可以执行上文描述的组件漏洞分析方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行组件漏洞分析方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (10)

1.一种组件漏洞分析方法,其特征在于,包括:
基于信息安全漏洞数据集、漏洞分析信息和系统组件的组件描述信息构建漏洞分析知识图谱;
根据漏洞组件的组件相关信息确定搜索查询语句;
基于所述漏洞分析知识图谱,通过自然语言处理算法对所述搜索查询语句进行语义解析,确定漏洞组件的目标漏洞类别和目标组件类别;
根据所述目标组件类别,确定所述漏洞组件对应的目标组件生产源,以及所述漏洞组件的相似组件;
基于漏洞分析知识图谱,根据所述目标漏洞类别、所述目标组件类别、所述目标组件生产源和所述相似组件,确定所述漏洞组件的目标组件漏洞情报。
2.根据权利要求1所述的方法,其特征在于,基于漏洞分析知识图谱,根据所述目标漏洞类别、所述目标组件类别、所述目标组件生产源和所述相似组件,确定所述漏洞组件的目标组件漏洞情报,包括:
基于漏洞分析知识图谱,根据所述目标漏洞类别、所述目标组件类别、所述目标组件生产源和所述相似组件对所述漏洞组件进行组件漏洞分析,确定候选组件漏洞情报;
若所述候选组件漏洞情报的情报数量大于数量阈值,则从信息安全漏洞数据集中获取候选组件漏洞情报对应的情报描述信息;
对所述搜索查询语句和所述情报描述信息进行余弦相似度计算,根据计算结果从所述信息安全漏洞数据集和所述漏洞分析信息中确定所述漏洞组件的目标组件漏洞情报。
3.根据权利要求2所述的方法,其特征在于,基于漏洞分析知识图谱,根据所述目标漏洞类别、所述目标组件类别、所述目标组件生产源和所述相似组件对所述漏洞组件进行组件漏洞分析,确定候选组件漏洞情报,包括:
从所述漏洞分析知识图谱中提取出信息评价值大于评价阈值的漏洞分析信息作为目标分析信息,并根据所述搜索查询语句确定所述漏洞组件的漏洞等级;
根据所述目标分析信息和所述漏洞等级,从所述漏洞分析知识图谱中确定目标知识图谱;
基于所述目标知识图谱,根据所述目标漏洞类别、所述目标组件类别、所述目标组件生产源和所述相似组件对所述漏洞组件进行组件漏洞分析,确定候选组件漏洞情报。
4.根据权利要求1所述的方法,其特征在于,基于信息安全漏洞数据集、漏洞分析信息和系统组件的组件描述信息构建漏洞分析知识图谱,包括:
通过自然语言处理算法对漏洞分析信息进行信息挖掘,获取所述漏洞分析信息的通用漏洞披露信息,并基于所述通用漏洞披露信息建立所述漏洞分析信息和所述信息安全漏洞数据集之间的信息关联关系;
对所述漏洞分析信息进行信息分析,确定所述漏洞分析信息的可读性指标,并根据所述可读性指标确定所述漏洞分析信息的信息评价值;所述可读性指标包括信息长度、信息关键内容和信息维度;
根据所述信息安全漏洞数据集、信息关联关系、漏洞分析信息、信息评价值、系统组件的组件描述信息构建漏洞分析知识图谱。
5.根据权利要求1所述的方法,其特征在于,根据所述目标组件类别,确定所述漏洞组件对应的目标组件生产源,以及所述漏洞组件的相似组件,包括:
确定所述漏洞组件对应的候选组件生产源,并根据所述目标组件类别和所述候选组件生产源对应的候选组件类别,确定目标组件标识和候选组件标识之间的编辑距离相似度;
根据所述编辑距离相似度,从所述候选组件生产源中确定目标组件生产源,并根据所述目标组件生产源确定所述漏洞组件的相似组件。
6.根据权利要求1所述的方法,其特征在于,基于所述漏洞分析知识图谱,通过自然语言处理算法对所述搜索查询语句进行语义解析,确定漏洞组件的目标漏洞类别和目标组件类别,包括:
基于所述漏洞分析知识图谱,通过自然语言处理算法中的漏洞类别分类模型对所述搜索查询语句进行语义解析,确定漏洞组件的目标漏洞类别;
基于所述漏洞分析知识图谱,通过自然语言处理算法中的组件类别分类模型对所述搜索查询语句进行语义解析,确定漏洞组件的目标组件类别。
7.一种组件漏洞分析装置,其特征在于,包括:
知识图谱构建模块,用于基于信息安全漏洞数据集、漏洞分析信息和系统组件的组件描述信息构建漏洞分析知识图谱;
搜索查询语句确定模块,用于根据漏洞组件的组件相关信息确定搜索查询语句;
目标组件类别确定模块,用于基于所述漏洞分析知识图谱,通过自然语言处理算法对所述搜索查询语句进行语义解析,确定漏洞组件的目标漏洞类别和目标组件类别;
组件生产源确定模块,用于根据所述目标组件类别,确定所述漏洞组件对应的目标组件生产源,以及所述漏洞组件的相似组件;
组件漏洞情报确定模块,用于基于漏洞分析知识图谱,根据所述目标漏洞类别、所述目标组件类别、所述目标组件生产源和所述相似组件,确定所述漏洞组件的目标组件漏洞情报。
8.根据权利要求7所述的装置,其特征在于,组件漏洞情报确定模块,包括:
候选漏洞情报确定单元,用于基于漏洞分析知识图谱,根据所述目标漏洞类别、所述目标组件类别、所述目标组件生产源和所述相似组件对所述漏洞组件进行组件漏洞分析,确定候选组件漏洞情报;
情报描述信息确定单元,用于若所述候选组件漏洞情报的情报数量大于数量阈值,则从信息安全漏洞数据集中获取候选组件漏洞情报对应的情报描述信息;
目标漏洞情报确定单元,用于对所述搜索查询语句和所述情报描述信息进行余弦相似度计算,根据计算结果从所述信息安全漏洞数据集和所述漏洞分析信息中确定所述漏洞组件的目标组件漏洞情报。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述的组件漏洞分析方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-6中任一项所述的组件漏洞分析方法。
CN202310565953.1A 2023-05-19 2023-05-19 一种组件漏洞分析方法、装置、设备和存储介质 Active CN116305171B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310565953.1A CN116305171B (zh) 2023-05-19 2023-05-19 一种组件漏洞分析方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310565953.1A CN116305171B (zh) 2023-05-19 2023-05-19 一种组件漏洞分析方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN116305171A true CN116305171A (zh) 2023-06-23
CN116305171B CN116305171B (zh) 2023-08-01

Family

ID=86796378

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310565953.1A Active CN116305171B (zh) 2023-05-19 2023-05-19 一种组件漏洞分析方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN116305171B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113239358A (zh) * 2021-03-11 2021-08-10 东南大学 基于知识图谱的开源软件漏洞挖掘方法
CN113609261A (zh) * 2021-08-25 2021-11-05 北京华云安信息技术有限公司 基于网络信息安全的知识图谱的漏洞信息挖掘方法和装置
US20220318396A1 (en) * 2021-04-05 2022-10-06 International Business Machines Corporation Traversing software components and dependencies for vulnerability analysis
CN115658846A (zh) * 2022-09-30 2023-01-31 中国科学院软件研究所 一种适用于开源软件供应链的智能搜索方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113239358A (zh) * 2021-03-11 2021-08-10 东南大学 基于知识图谱的开源软件漏洞挖掘方法
US20220318396A1 (en) * 2021-04-05 2022-10-06 International Business Machines Corporation Traversing software components and dependencies for vulnerability analysis
CN113609261A (zh) * 2021-08-25 2021-11-05 北京华云安信息技术有限公司 基于网络信息安全的知识图谱的漏洞信息挖掘方法和装置
CN115658846A (zh) * 2022-09-30 2023-01-31 中国科学院软件研究所 一种适用于开源软件供应链的智能搜索方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
开放知识图谱: "开源开放 | 开源立体化漏洞情报知识图谱(四维创智)", pages 1 - 5, Retrieved from the Internet <URL:https://blog.csdn.net/TgqDT3gGaMdkHasLZv/article/details/123390820> *

Also Published As

Publication number Publication date
CN116305171B (zh) 2023-08-01

Similar Documents

Publication Publication Date Title
US20220318275A1 (en) Search method, electronic device and storage medium
TW202020691A (zh) 特徵詞的確定方法、裝置和伺服器
CN112989235B (zh) 基于知识库的内链构建方法、装置、设备和存储介质
CN111737966B (zh) 文档重复度检测方法、装置、设备和可读存储介质
CN114692778B (zh) 用于智能巡检的多模态样本集生成方法、训练方法及装置
CN113191145B (zh) 关键词的处理方法、装置、电子设备和介质
CN113963197A (zh) 图像识别方法、装置、电子设备和可读存储介质
CN117632654A (zh) 一种运维风险等级评估方法、装置、电子设备及存储介质
CN116305171B (zh) 一种组件漏洞分析方法、装置、设备和存储介质
CN116841779A (zh) 异常日志检测方法、装置、电子设备和可读存储介质
CN114662469B (zh) 情感分析方法、装置、电子设备及存储介质
CN114722162A (zh) 特征类别确定方法、装置、电子设备及存储介质
CN114443493A (zh) 一种测试案例生成方法、装置、电子设备和存储介质
CN114444087A (zh) 一种越权漏洞检测方法、装置、电子设备及存储介质
CN108009233B (zh) 一种图像还原方法、装置、计算机设备及存储介质
CN116089459B (zh) 数据检索方法、装置、电子设备及存储介质
CN116467722B (zh) 安全漏洞描述的生成方法、装置、介质和电子设备
CN116166501B (zh) 一种日志校验方法、装置、电子设备及存储介质
CN116450832A (zh) 一种信息匹配方法、装置、电子设备和存储介质
CN117609723A (zh) 一种对象识别方法、装置、电子设备及存储介质
CN114676774A (zh) 数据处理方法、装置、设备及存储介质
CN117034315A (zh) 数据检测方法、装置、电子设备及可读存储介质
CN116451092A (zh) 一种文本差异率确定方法、装置及电子设备
CN117744081A (zh) 一种可执行文件检测方法、装置、设备及存储介质
CN117312288A (zh) 数据质检方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant