CN116467722B - 安全漏洞描述的生成方法、装置、介质和电子设备 - Google Patents
安全漏洞描述的生成方法、装置、介质和电子设备 Download PDFInfo
- Publication number
- CN116467722B CN116467722B CN202310729175.5A CN202310729175A CN116467722B CN 116467722 B CN116467722 B CN 116467722B CN 202310729175 A CN202310729175 A CN 202310729175A CN 116467722 B CN116467722 B CN 116467722B
- Authority
- CN
- China
- Prior art keywords
- vulnerability
- description
- knowledge
- entity
- security
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例公开了一种安全漏洞描述的生成方法、装置、介质和电子设备。该方法包括:根据漏洞描述请求,确定待描述的目标安全漏洞;基于预先构建的安全知识图谱和所述漏洞描述请求,为目标安全漏洞构建漏洞描述范式;采用预先训练的大语言模型,基于所述漏洞描述范式输出所述目标安全漏洞的推荐漏洞描述。本申请技术方案,可以提高安全漏洞描述的生成效率,降低安全漏洞描述的生成成本。
Description
技术领域
本申请涉及计算机技术领域,具体涉及网络安全领域,尤其涉及一种安全漏洞描述的生成方法、装置、介质和电子设备。
背景技术
安全漏洞描述是对网络安全漏洞的描述,是网络安全领域中非常重要的情报。所谓网络安全漏洞是指网络节点的系统软件或应用软件在逻辑设计上的缺陷,利用这些缺陷,威胁行为者能够在未获得授权的情况下访问甚至破坏网络节点。
安全漏洞描述可以帮助安全人员识别并解决最可能被威胁行为者利用的网络安全漏洞,保护网络节点免受威胁行为者的威胁。相关技术中,安全漏洞通过安全人员以人工的方式归纳总结,存在安全漏洞描述的生成效率低,生成成本高的问题。
发明内容
本申请提供了一种安全漏洞描述的生成方法、装置、介质和电子设备,可以达到提高安全漏洞描述的生成效率,降低安全漏洞描述的生成成本的目的。
根据本申请的第一方面,提供了安全漏洞描述的生成方法,所述方法包括:
根据漏洞描述请求,确定待描述的目标安全漏洞;
基于预先构建的安全知识图谱和所述漏洞描述请求,为目标安全漏洞构建漏洞描述范式;
采用预先训练的大语言模型,基于所述漏洞描述范式输出所述目标安全漏洞的推荐漏洞描述。
根据本申请的第二方面,提供了安全漏洞描述的生成装置,所述装置包括:
目标安全漏洞确定模块,用于根据漏洞描述请求,确定待描述的目标安全漏洞;
漏洞描述范式构建模块,用于基于预先构建的安全知识图谱和所述漏洞描述请求,为目标安全漏洞构建漏洞描述范式;
推荐漏洞描述输出模块,用于采用预先训练的大语言模型,基于所述漏洞描述范式输出所述目标安全漏洞的推荐漏洞描述。
根据本发明的第三方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请实施例所述的安全漏洞描述的生成方法。
根据本发明的第四方面,本申请实施例提供了一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器运行的计算机程序,所述处理器执行所述计算机程序时实现如本申请实施例所述的安全漏洞描述的生成方法。
本申请技术方案,利用大语言模型生成安全漏洞描述,借助大语言模型的语言理解能力和文本生成能力,采用大语言模型基于漏洞描述范式,输出目标安全漏洞的推荐漏洞描述,提高了安全漏洞描述的生成效率,降低了安全漏洞描述的生成成本。利用预先构建的安全知识图谱和漏洞描述请求,构建大语言模型的漏洞描述范式,为利用大语言模型生成安全漏洞描述提供了数据支持,同时保证了推荐漏洞描述的准确性。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据实施例一提供的安全漏洞描述的生成方法的流程图;
图2是根据实施例二提供的安全漏洞描述的生成方法的流程图;
图3是根据实施例三提供的安全漏洞描述的生成方法的流程图;
图4是根据实施例四提供的安全漏洞描述的生成方法的流程图;
图5是本申请实施例五提供的安全漏洞描述的生成装置的结构示意图;
图6是本申请实施例六提供的一种电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“目标”以及“候选”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1是根据实施例一提供的安全漏洞描述的生成方法的流程图,本实施例可适用于生成安全漏洞描述的情况,该方法可以配置于由安全漏洞描述的生成装置来执行,安全漏洞描述的生成装置采用硬件和/或软件的形式实现,并可集成于运行此系统的电子设备中。
如图1所示,该方法包括:
S110、根据漏洞描述请求,确定待描述的目标安全漏洞;
其中,漏洞描述请求用于为目标安全漏洞请求漏洞描述信息。可选的,漏洞描述请求包括目标安全漏洞的漏洞标识。示例性的,漏洞标识可以是漏洞名称。进一步的,漏洞描述请求还包括问题网络组件的组件标识。其中,问题网络组件是指存在目标安全漏洞的网络组件。示例性的,漏洞描述请求可以是“请描述A组件的反序列化漏洞”。其中待描述的目标安全漏洞是指需要进行漏洞描述的安全漏洞。
可选的,根据漏洞描述请求中的漏洞名称,确定待描述的目标安全漏洞。可选的,对漏洞描述请求进行关键信息提取,从漏洞描述请求中提取关键词语。示例性的,对漏洞描述请求进行分词处理,去除漏洞描述请求中的停用词,得到关键词语。其中,关键词语可以是漏洞标识以及组件标识。继续上例进行说明,从“请描述A组件的反序列化漏洞”中提取到的关键词语可以是“A组件”,“反序列化漏洞”以及“描述”。
值得注意的是,本申请实施例不对漏洞描述请求的所使用的描述语言类型进行限制,也就是说,可以使用任何语言类型表达漏洞描述请求,示例性的,漏洞描述请求可以使用中文表达,也可以使用英文表达,具体根据实际情况确定。
另外,本申请实施例不对漏洞描述请求的文本长度进行限定,也就是说,漏洞描述请求可以是漏洞名称,也可以是漏洞名称和组件名称的组合,具体根据实际情况确定。
S120、基于预先构建的安全知识图谱和所述漏洞描述请求,为目标安全漏洞构建漏洞描述范式;
其中,漏洞描述范式作为大语言模型的输入数据,用于引导大语言模型输出目标安全漏洞的推荐漏洞描述。漏洞描述范式与漏洞描述请求相关,漏洞描述请求是漏洞描述范式的关键参数。除了漏洞描述请求以外,推荐漏洞描述还可以包括其他的约束参数,约束参数可以基于预先构建的安全知识图谱确定。安全知识图谱可以为大语言模型提供背景知识,对大语言模型的漏洞描述生成过程进行约束。
其中,安全知识图谱指的是基于网络安全领域的知识数据构建的知识图谱,可选的,安全知识图谱基于网络安全领域中的全量领域知识预先构建。全量领域知识是与网络安全相关的知识。
可选的,基于网络安全领域的全量领域知识预先构建安全知识图谱的过程如下:针对网络安全领域,首先获取网络安全领域的相关词汇,可选的,通过响应用户的输入词汇,获取目标领域相关词汇;也可以从已有数据库中直接获取;进一步的,确定相关词汇的初始来源数据,可选的,初始来源数据可以是百科页面信息,也可以是网页原始数据。进而基于初始来源数据,经过知识建模、知识抽取、知识融合、知识存储等过程,最终得到安全知识图谱。
S130、采用预先训练的大语言模型,基于所述漏洞描述范式输出所述目标安全漏洞的推荐漏洞描述。
其中,大语言模型(LLM,Large Language Model)是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本的含义。大语言模型可以处理多种自然语言任务,如文本分类、问答、对话等。大语言模型通过训练,从大量标记和未标记的数据中捕获知识,并将知识存储到大量的参数中,其模型参数可达到百亿级别或者千亿级别。
将漏洞描述范式输入预先训练的大语言模型中,通过大语言模型基于漏洞描述范式输出目标安全漏洞的推荐漏洞描述。
本申请技术方案,利用大语言模型生成安全漏洞描述,借助大语言模型的语言理解能力和文本生成能力,采用大语言模型基于漏洞描述范式,输出目标安全漏洞的推荐漏洞描述,提高了安全漏洞描述的生成效率,降低了安全漏洞描述的生成成本。利用预先构建的安全知识图谱和漏洞描述请求,构建大语言模型的漏洞描述范式,为利用大语言模型生成安全漏洞描述提供了数据支持,同时保证了推荐漏洞描述的准确性。
实施例二
图2是根据实施例二提供的安全漏洞描述的生成方法的流程图。本实施例在上述实施例的基础上进行进一步地优化。
如图2所示,该方法包括:
S210、根据漏洞描述请求,确定待描述的目标安全漏洞;
S220、从所述安全知识图谱中候选知识实体中,确定与所述漏洞描述请求对应的第一知识实体;
其中,候选知识实体是指安全知识图谱中包括的知识实体。候选知识实体可能与漏洞描述请求相对应,也可能与漏洞描述请求不相关。其中,第一知识实体是指安全知识图谱中与漏洞描述请求相对应的候选知识实体。
可选的,将漏洞描述请求与安全知识图谱中的候选知识实体进行相似性匹配,将安全知识图谱中与漏洞描述请求相似度最高的候选知识实体确定为第一知识实体。示例性的,可以在词汇维度上或者语义维度上,将漏洞描述请求与候选知识实体进行相似度匹配。
S230、从所述安全知识图谱中提取所述第一知识实体的实体描述信息;
可选的,安全知识图谱中至少包括两个候选知识实体。安全知识图谱中的候选知识实体均存在对应的实体描述信息。其中,实体描述信息用于描述安全知识图谱中候选知识实体的实体特征。基于实体描述信息可以确定知识实体的对象属性和数据属性。其中,对象属性用于描述知识实体之间的关系特征;数据属性用于描述知识实体自身的属性特征。数据属性包括:文本型和数值型。
S240、根据所述漏洞描述请求和所述第一知识实体的实体描述信息,为目标安全漏洞构建漏洞描述范式。
可选的,根据漏洞描述请求和第一知识实体的实体描述信息,确定漏洞描述范式中的关键参数和约束参数。基于关键参数和约束参数为目标安全漏洞构建漏洞描述范式。
S250、采用预先训练的大语言模型,基于所述漏洞描述范式输出所述目标安全漏洞的推荐漏洞描述。
本申请实施例,通过从安全知识图谱中候选知识实体中,确定与漏洞描述请求对应的第一知识实体,将第一知识实体的实体描述信息,和漏洞描述请求,构建大语言模型的漏洞描述范式,为利用大语言模型生成安全漏洞描述提供了数据支持,使得利用大语言模型生成安全漏洞描述成为可能,能够在安全漏洞描述的生成过程中借助大语言模型的语言理解能力和文本生成能力,有利于提高安全漏洞描述的生成效率,降低安全漏洞描述的生成成本。
在一个可选的实施例中,根据所述漏洞描述请求和所述第一知识实体的实体描述信息,为目标安全漏洞构建漏洞描述范式,包括:根据所述漏洞描述请求,确定用于对目标安全漏洞进行描述需使用的描述语言类型;根据所述第一知识实体的实体描述信息,确定用于对目标安全漏洞进行描述需依赖的描述背景知识;根据所述描述语言类型,所述描述背景知识以及所述漏洞描述请求的描述请求文本,为目标安全漏洞构建漏洞描述范式。
其中,漏洞描述请求的描述请求文本,为漏洞描述范式中的关键参数。除了关键参数,漏洞描述请求中还可以包括约束参数。可选的,约束参数包括:语言参数和背景参数。其中,描述语言类型可作为漏洞描述请求中的语言参数。描述语言类型基于漏洞描述请求确定。语言参数用于约束大预言模型对目标安全漏洞进行描述需使用的描述语言类型。示例性的,描述语言类型可以中文或者英文。描述背景知识可以作为漏洞描述请求中的背景参数,描述背景知识基于第一知识实体的实体描述信息确定。背景参数用于约束大预言模型对目标安全漏洞进行描述需依赖的描述背景知识。
根据描述语言类型,描述背景知识以及漏洞描述请求的描述请求文本,为目标安全漏洞构建漏洞描述范式,可选的,基于设定格式将描述语言类型,描述背景知识以及漏洞描述请求进行组合,得到目标安全漏洞的漏洞描述范式。示例性,漏洞描述请求的描述请求文本可以是“请描述A组件的反序列化漏洞”,描述语言类型可以是中文,描述背景知识可以是A组件的定义,反序列化漏洞的定义,反序列化漏洞的解决方法等等。基于上述内容,得到的漏洞描述范式可以是“背景知识:‘A组件的定义,反序列化漏洞的定义和反序列化漏洞的解决方法’,用户指令:‘请描述A组件的反序列化漏洞’,根据用户指令,详细、专业地使用中文生成漏洞描述信息”。上述技术方案,通过将描述背景知识作为漏洞描述范式中的背景参数,约束大语言模型对目标安全漏洞进行描述需依赖的背景知识,使得大语言模型输出的推荐漏洞描述更加准确。通过将描述语言类型作为漏洞描述范式中的语言参数,约束大语言模型对目标安全漏洞进行描述需使用的描述语言,使得大语言模型输出的推荐漏洞描述更加可读。
实施例三
图3是根据实施例三提供的安全漏洞描述的生成方法的流程图。本实施例在上述实施例的基础上进行进一步地优化。
如图3所示,该方法包括:
S310、根据漏洞描述请求,确定待描述的目标安全漏洞;
S320、确定所述漏洞描述请求与所述安全知识图谱中的候选知识实体之间的语义相似度;
其中,语义相似度用于量化漏洞描述请求与候选知识实体之间的语义相似程度。语义相似度越大,漏洞描述请求与候选知识实体之间的语义相似程度越高。
可选的,对漏洞描述请求进行分词处理,去除漏洞描述请求中的停用词,得到关键词语。基于关键词语生成分词列表。其中,分词列表中至少包括一个关键词语。依次从分词列表中取出关键词语,计算关键词语与每个候选知识实体的语义相似度。直到分词列表中的关键词语全部经过语义相似度计算。
S330、根据所述语义相似度,从所述候选知识实体中确定目标知识实体;
其中,目标知识实体是指安全知识图谱中与漏洞描述请求语义相匹配的候选知识实体。
可选的,每个候选知识实体均存在对应的语义相似度,将候选知识实体的语义相似度与相似度阈值进行比较,根据相似度的比较结果确定候选知识实体中确定目标知识实体。具体的,将语义相似度大于等于相似度阈值的候选知识实体,确定目标知识实体。其中,相似度阈值根据实际业务需求确定,在这里不作限定,示例性的,相似度阈值可以是0.9。
可选的,根据语义相似度对候选知识实体进行排序,示例性的,可以按照语义相似度从大到小的顺序,对候选知识实体进行排序,选择预设范围的候选知识实体作为目标知识实体。其中,预设范围根据实际业务需求确定,在这里不作限定。
S340、根据所述安全知识图谱中的实体关联关系,从所述候选知识实体中确定与所述目标知识实体关联的关联知识实体;
其中,关联知识实体与目标知识实体对应,关联知识实体是指安全知识图谱中与目标知识实体存在关联关系的候选知识实体。
安全知识图谱中的实体关联关系,用于确定安全知识图谱中不同知识实体之间的关联关系。安全知识图谱中的实体关联关系可以通过对安全知识图谱进行关系抽取得到。
可选的,实体关联关系包括显示关联关系和隐式关联关系。显示关联关系在安全知识图谱中以连接不同知识实体的边示出。隐式关联关系基于安全知识图谱中候选知识实体的实体特征确定。也就是说,安全知识图谱中未以边连接的两个知识实体之间也可能存在关联关系。
可选的,根据实体关联关系中的显式关联关系和隐式关联关系,从候选知识实体中确定与目标知识实体关联的关联知识实体。
S350、将所述目标知识实体和所述关联知识实体,确定为与所述漏洞描述请求对应的第一知识实体。
目标知识实体与漏洞描述请求语义相匹配,关联知识实体与目标知识实体属于同一安全知识图谱,关联知识实体与目标知识实体相关联。也就是说,目标知识实体和关联知识实体距均与漏洞描述请求相对应,将目标知识实体与关联知识实体,确定为与漏洞描述请求对应的第一知识实体。
S360、从所述安全知识图谱中提取所述第一知识实体的实体描述信息;
S370、根据所述漏洞描述请求和所述第一知识实体的实体描述信息,为目标安全漏洞构建漏洞描述范式。
S380、采用预先训练的大语言模型,基于所述漏洞描述范式输出所述目标安全漏洞的推荐漏洞描述。
本申请实施例,通过在安全知识图谱中确定与漏洞描述请求语义相匹配的目标知识实体,以及与目标知识实体相关联的关联知识实体,将目标知识实体与关联知识实体确定为与漏洞描述请求对应的第一知识实体。将第一知识实体的实体描述信息用于构建漏洞描述范式,为大语言模型生成漏洞描述提供了更加丰富的背景知识,可以使得大语言模型输出的推荐漏洞描述更加准确,保证了推荐漏洞描述的准确性。
在一个可选的实施例中,所述安全知识图谱中的实体关联关系,基于如下方式确定:利用社区发现算法对所述安全知识图谱中的候选知识实体进行社区划分,得到社区划分信息;基于所述社区划分信息,确定候选知识实体的社区归属信息;基于所述候选知识实体的社区归属信息,确定所述安全知识图谱中的实体关联关系。
安全知识图谱是由一些紧密相连的知识实体组成的,并且根据不同知识实体之间连接的紧密程度,安全知识图谱也可视为由不同簇组成。簇内的知识实体之间有着更为紧密的连接,不同簇之间的连接则相对稀疏。这种簇被称为安全知识图谱中的社区结构。社区发现算法用于发现安全知识图谱中的社区结构。
可选的,社区发现算法为基于模块度的社区发现算法。利用基于模块度的社区发现算法对安全知识图谱中的候选知识实体进行社区划分,将安全知识图谱划分为至少两个实体社区,得到社区划分结果。可选的,社区划分结果包括实体社区数量,或者各个实体社区中的知识实体成员。
社区归属信息用于确定知识实体所归属的实体社区。需要说明的是,一个知识实体只能属于一个实体社区,也即不存在同时属于多个实体社区的知识实体。
本申请实施例中,每个实体社区中包括至少一个知识实体,且同一个实体社区中的知识实体之间存在关联关系。根据候选知识实体的社区归属信息,可以确定同属一个实体社区的候选知识实体。
进一步的,针对实体社区中不以边相连接的至少两个知识实体,确定不同知识实体之间的隐式关联关系。不同知识实体之间的显式关联关系,则可以基于安全知识图谱中的不同知识实体之间的边连接关系确定,此处不再赘述。确定安全知识图谱中的实体关联关系,使得后续可以根据安全知识图谱中的实体关联关系进行相关的数据分析。
上述技术方案,提供一种切实可行的实体关联关系确定方法,为使用大语言模型生成漏洞描述信息提供了数据支持。
实施例四
图4是根据实施例四提供的安全漏洞描述的生成方法的流程图。本实施例在上述实施例的基础上进行进一步地优化。
如图4所示,该方法包括:
S410、根据漏洞描述请求,确定待描述的目标安全漏洞;
S420、基于预先构建的安全知识图谱和所述漏洞描述请求,为目标安全漏洞构建漏洞描述范式;
S430、采用预先训练的大语言模型,基于所述漏洞描述范式输出所述目标安全漏洞的推荐漏洞描述。
其中,推荐漏洞描述通过大语言模型输出,推荐漏洞描述可能是有效的,也可能是无效的。需要进一步确定推荐漏洞描述是否具有有效性。可选的,基于推荐漏洞描述的实体分散程度,确定推荐漏洞描述的有效性。
S440、从所述安全知识图谱中候选知识实体中,确定与所述推荐漏洞描述对应的第二知识实体;
区别于第一知识实体,第二知识实体是与推荐漏洞描述对应的候选知识实体。
第一知识实体是与漏洞描述请求对应的候选知识实体。第一知识实体与第二知识实体之间没有必然联系,第一知识实体与第二知识实体之间,可能存在交集也可能不存在交集,具体根据实际情况确定。
可选的,将推荐漏洞描述与安全知识图谱中的候选知识实体进行相似性匹配,将安全知识图谱中与推荐漏洞描述相似度最高的候选知识实体确定为第二知识实体。示例性的,可以在词汇维度上或者语义维度上,将推荐漏洞描述与候选知识实体进行相似度匹配。
S450、根据所述第二知识实体的社区归属信息和所述安全知识图谱的社区划分信息,确定所述推荐漏洞描述在所述安全知识图谱中的社区覆盖范围;
其中,社区归属信息用于确定知识实体所归属的实体社区。第二知识实体为至少两个,第二知识实体可能属于同一实体社区,也可能属于不同的实体社区。
根据第二知识实体的社区归属信息,可以确定第二知识实体属于的目标实体社区。基于安全知识图谱的社区划分信息,可以确定安全知识图谱包括的全部实体社区。根据目标实体社区在全部实体社区中的占比,可以确定推荐漏洞描述在安全知识图谱中的社区覆盖范围。可以理解的是,目标实体社区的数量小于等于全部实体社区的数量。
S460、基于所述社区覆盖范围,对所述推荐漏洞描述进行有效性筛选以得到有效漏洞描述。
其中,社区覆盖范围可以用于衡量推荐漏洞描述所覆盖知识的分散程度,进而可以确定推荐漏洞描述的有效性。有效漏洞描述是指满足有效性要求的推荐漏洞描述。
可选的,根据社区覆盖范围对推荐漏洞描述进行排序,示例性的,可以按照社区覆盖范围从大到小的顺序,对推荐漏洞描述进行排序,选择预设范围的推荐漏洞描述作为有效漏洞描述。其中,预设范围根据实际业务需求确定,在这里不作限定。
可选的,根据用户针对于推荐漏洞描述的有效性评价,对推荐漏洞描述进行有效性筛选以得到有效漏洞描述。
本申请技术方案,通过基于社区覆盖范围,对大语言模型输出的推荐漏洞描述进行有效性筛选,从中选择有效漏洞描述,保证了推荐漏洞描述的有效性和实用性。
在一个可选的实施例中,基于所述社区覆盖范围,对所述推荐漏洞描述进行有效性筛选以得到有效漏洞描述,包括:将所述社区覆盖范围与预设范围阈值进行比较,得到范围比较结果;根据所述范围比较结果,确定所述推荐漏洞描述对应的实体分散程度;基于所述推荐漏洞描述对应的实体分散程度,对所述推荐漏洞描述进行有效性筛选以得到有效漏洞描述。
其中,社区覆盖范围可以用于衡量推荐漏洞描述所覆盖知识的分散程度。预设范围阈值用于确定推荐漏洞描述所覆盖知识的分散程度是否满足业务需求。其中,预设范围阈值根据实际业务需求确定,在这里不作限定。示例性的,预设范围阈值可以是0.2。其中,推荐漏洞描述所覆盖知识的分散程度用实体分散程度进行量化。
将所述社区覆盖范围与预设范围阈值进行比较,得到范围比较结果。范围比较结果根据社区覆盖范围和预设范围阈值的相对大小确定,范围比较结果可以是社区覆盖范围大于等于预设范围阈值,或者小于预设范围阈值。
基于范围比较结果,可以确定推荐漏洞描述对应的实体分散程度。具体的,范围比较结果可以是社区覆盖范围大于等于预设范围阈值,表明实体分散程度尚可;否则,实体过于分散。将实体分散程度尚可的推荐漏洞描述确定为有效漏洞描述;将实体分散程度过大的推荐漏洞描述确定为无效漏洞描述。
实体过于分散,对应于推荐漏洞描述所覆盖的知识过于分散,所谓知识过于分散,举例来说,就一个物理问题而言,如果提供的答案A中既包含电磁力又包含牛顿被苹果砸的故事,则可以确定答案A所覆盖的知识过于分散。
可选的,保留有效漏洞描述,删除无效漏洞描述。若确定推荐漏洞描述为无效漏洞描述,则确定该推荐漏洞描述对应的漏洞描述范式,将该漏洞描述范式作为大语言模型的输入数据,利用大语言模型基于该漏洞描述范式从重新输出新的推荐漏洞描述。
上述技术方案,提供了一种切实可靠的有效漏洞描述确定方法,为使用大语言模型生成漏洞描述信息提供了技术支持,可以保证有效漏洞描述的准确性。
实施例五
图5是本申请实施例五提供的安全漏洞描述的生成装置的结构示意图,本实施例可适用于生成安全漏洞描述的情况,所述装置可由软件和/或硬件实现,并可集成于智能终端等电子设备中。
如图5所示,该装置可以包括:
目标安全漏洞确定模块510,用于根据漏洞描述请求,确定待描述的目标安全漏洞;
漏洞描述范式构建模块520,用于基于预先构建的安全知识图谱和所述漏洞描述请求,为目标安全漏洞构建漏洞描述范式;
推荐漏洞描述输出模块530,用于采用预先训练的大语言模型,基于所述漏洞描述范式输出所述目标安全漏洞的推荐漏洞描述。
本申请技术方案,利用大语言模型生成安全漏洞描述,借助大语言模型的语言理解能力和文本生成能力,采用大语言模型基于漏洞描述范式,输出目标安全漏洞的推荐漏洞描述,提高了安全漏洞描述的生成效率,降低了安全漏洞描述的生成成本。利用预先构建的安全知识图谱和漏洞描述请求,构建大语言模型的漏洞描述范式,为利用大语言模型生成安全漏洞描述提供了数据支持,同时保证了推荐漏洞描述的准确性。
可选的,漏洞描述范式构建模块520,包括:第一知识实体确定子模块,用于从所述安全知识图谱中候选知识实体中,确定与所述漏洞描述请求对应的第一知识实体;实体描述信息提取子模块,用于从所述安全知识图谱中提取所述第一知识实体的实体描述信息;漏洞描述范式构建子模块,用于根据所述漏洞描述请求和所述第一知识实体的实体描述信息,为目标安全漏洞构建漏洞描述范式。
可选的,第一知识实体确定子模块,包括:相似度确定单元,用于确定所述漏洞描述请求与所述安全知识图谱中的候选知识实体之间的语义相似度;目标知识实体确定单元,用于根据所述语义相似度,从所述候选知识实体中确定目标知识实体;关联知识实体确定单元,用于根据所述安全知识图谱中的实体关联关系,从所述候选知识实体中确定与所述目标知识实体关联的关联知识实体;第一知识实体确定单元,用于将所述目标知识实体和所述关联知识实体,确定为与所述漏洞描述请求对应的第一知识实体。
可选的,所述安全知识图谱中的实体关联关系,基于如下方式确定:利用社区发现算法对所述安全知识图谱中的候选知识实体进行社区划分,得到社区划分信息;基于所述社区划分信息,确定候选知识实体的社区归属信息;基于所述候选知识实体的社区归属信息,确定所述安全知识图谱中的实体关联关系。
可选的,漏洞描述范式构建子模块,包括:描述语言类型确定单元,用于根据所述漏洞描述请求,确定用于对目标安全漏洞进行描述需使用的描述语言类型;描述背景知识确定单元,用于根据所述第一知识实体的实体描述信息,确定用于对目标安全漏洞进行描述需依赖的描述背景知识;漏洞描述范式构建单元,用于根据所述描述语言类型,所述描述背景知识以及所述漏洞描述请求的描述请求文本,为目标安全漏洞构建漏洞描述范式。
可选的,所述装置还包括:第二知识实体确定模块,用于在采用预先训练的大语言模型,基于所述漏洞描述范式输出所述目标安全漏洞的推荐漏洞描述之后,从所述安全知识图谱中候选知识实体中,确定与所述推荐漏洞描述对应的第二知识实体;社区覆盖范围确定模块,用于根据所述第二知识实体的社区归属信息和所述安全知识图谱的社区划分信息,确定所述推荐漏洞描述在所述安全知识图谱中的社区覆盖范围;推荐漏洞描述筛选模块,用于基于所述社区覆盖范围,对所述推荐漏洞描述进行有效性筛选以得到有效漏洞描述。
可选的,推荐漏洞描述筛选模块,包括:范围比较子模块,用于将所述社区覆盖范围与预设范围阈值进行比较,得到范围比较结果;实体分散程度确定子模块,用于根据所述范围比较结果,确定所述推荐漏洞描述对应的实体分散程度;推荐漏洞描述筛选子模块,用于基于所述推荐漏洞描述对应的实体分散程度,对所述推荐漏洞描述进行有效性筛选以得到有效漏洞描述。
发明实施例所提供的安全漏洞描述的生成装置可执行本申请任意实施例所提供的安全漏洞描述的生成方法,具备执行安全漏洞描述的生成方法相应的性能模块和有益效果。
本公开的技术方案中,所涉及的用户数据的收集、存储、使用、加工、传输、提供和公开等,均符合相关法律法规的规定,且不违背公序良俗。
实施例六
图6示出了可以用来实施的实施例的电子设备610的结构示意图。电子设备610包括至少一个处理器611,以及与至少一个处理器611通信连接的存储器,如只读存储器(ROM)612、随机访问存储器(RAM)613等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器611可以根据存储在只读存储器(ROM)612中的计算机程序或者从存储单元618加载到随机访问存储器(RAM)613中的计算机程序,来执行各种适当的动作和处理。在RAM613中,还可存储电子设备610操作所需的各种程序和数据。处理器611、ROM 612以及RAM613通过总线614彼此相连。输入/输出(I/O)接口615也连接至总线614。
电子设备610中的多个部件连接至I/O接口615,包括:输入单元616,例如键盘、鼠标等;输出单元617,例如各种类型的显示器、扬声器等;存储单元618,例如磁盘、光盘等;以及通信单元619,例如网卡、调制解调器、无线通信收发机等。通信单元619允许电子设备610通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器611可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器611的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器611执行上文所描述的各个方法和处理,例如安全漏洞描述的生成方法。
在一些实施例中,安全漏洞描述的生成方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元618。在一些实施例中,计算机程序的部分或者全部可以经由ROM 612和/或通信单元619而被载入和/或安装到电子设备610上。当计算机程序加载到RAM 613并由处理器611执行时,可以执行上文描述的安全漏洞描述的生成方法的一个或多个步骤。备选地,在其他实施例中,处理器611可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行安全漏洞描述的生成方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本申请的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本申请的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据处理服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (10)
1.一种安全漏洞描述的生成方法,其特征在于,所述方法包括:
根据漏洞描述请求,确定待描述的目标安全漏洞;
基于预先构建的安全知识图谱和所述漏洞描述请求,为目标安全漏洞构建漏洞描述范式;
采用预先训练的大语言模型,基于所述漏洞描述范式输出所述目标安全漏洞的推荐漏洞描述;
其中,所述漏洞描述范式包括:关键参数和约束参数;所述关键参数为漏洞描述请求的描述请求文本;所述约束参数包括:语言参数和背景参数;所述语言参数用于约束所述大语言模型对所述目标安全漏洞进行描述需使用的描述语言类型;所述背景参数用于约束所述大语言模型对所述目标安全漏洞进行描述需依赖的描述背景知识;所述描述背景知识基于第一知识实体的实体描述信息确定;其中,所述第一知识实体是指所述安全知识图谱中与漏洞描述请求对应的候选知识实体。
2.根据权利要求1所述的方法,其特征在于,所述基于预先构建的安全知识图谱和所述漏洞描述请求,为目标安全漏洞构建漏洞描述范式,包括:
从所述安全知识图谱中候选知识实体中,确定与所述漏洞描述请求对应的第一知识实体;
从所述安全知识图谱中提取所述第一知识实体的实体描述信息;
根据所述漏洞描述请求和所述第一知识实体的实体描述信息,为目标安全漏洞构建漏洞描述范式。
3.根据权利要求2所述的方法,其特征在于,从所述安全知识图谱中候选知识实体中,确定与所述漏洞描述请求对应的第一知识实体,包括:
确定所述漏洞描述请求与所述安全知识图谱中的候选知识实体之间的语义相似度;
根据所述语义相似度,从所述候选知识实体中确定目标知识实体;
根据所述安全知识图谱中的实体关联关系,从所述候选知识实体中确定与所述目标知识实体关联的关联知识实体;
将所述目标知识实体和所述关联知识实体,确定为与所述漏洞描述请求对应的第一知识实体。
4.根据权利要求3所述的方法,其特征在于,所述安全知识图谱中的实体关联关系,基于如下方式确定:
利用社区发现算法对所述安全知识图谱中的候选知识实体进行社区划分,得到社区划分信息;
基于所述社区划分信息,确定候选知识实体的社区归属信息;
基于所述候选知识实体的社区归属信息,确定所述安全知识图谱中的实体关联关系。
5.根据权利要求2所述的方法,其特征在于,根据所述漏洞描述请求和所述第一知识实体的实体描述信息,为目标安全漏洞构建漏洞描述范式,包括:
根据所述漏洞描述请求,确定用于对目标安全漏洞进行描述需使用的描述语言类型;
根据所述第一知识实体的实体描述信息,确定用于对目标安全漏洞进行描述需依赖的描述背景知识;
根据所述描述语言类型,所述描述背景知识以及所述漏洞描述请求的描述请求文本,为目标安全漏洞构建漏洞描述范式。
6.根据权利要求1所述的方法,其特征在于,在采用预先训练的大语言模型,基于所述漏洞描述范式输出所述目标安全漏洞的推荐漏洞描述之后,所述方法还包括:
从所述安全知识图谱中候选知识实体中,确定与所述推荐漏洞描述对应的第二知识实体;
根据所述第二知识实体的社区归属信息和所述安全知识图谱的社区划分信息,确定所述推荐漏洞描述在所述安全知识图谱中的社区覆盖范围;
基于所述社区覆盖范围,对所述推荐漏洞描述进行有效性筛选以得到有效漏洞描述。
7.根据权利要求6所述的方法,其特征在于,基于所述社区覆盖范围,对所述推荐漏洞描述进行有效性筛选以得到有效漏洞描述,包括:
将所述社区覆盖范围与预设范围阈值进行比较,得到范围比较结果;
根据所述范围比较结果,确定所述推荐漏洞描述对应的实体分散程度;
基于所述推荐漏洞描述对应的实体分散程度,对所述推荐漏洞描述进行有效性筛选以得到有效漏洞描述。
8.一种安全漏洞描述的生成装置,其特征在于,所述装置包括:
目标安全漏洞确定模块,用于根据漏洞描述请求,确定待描述的目标安全漏洞;
漏洞描述范式构建模块,用于基于预先构建的安全知识图谱和所述漏洞描述请求,为目标安全漏洞构建漏洞描述范式;
推荐漏洞描述输出模块,用于采用预先训练的大语言模型,基于所述漏洞描述范式输出所述目标安全漏洞的推荐漏洞描述;
其中,所述漏洞描述范式包括:关键参数和约束参数;所述关键参数为漏洞描述请求的描述请求文本;所述约束参数包括:语言参数和背景参数;所述语言参数用于约束所述大语言模型对所述目标安全漏洞进行描述需使用的描述语言类型;所述背景参数用于约束所述大语言模型对所述目标安全漏洞进行描述需依赖的描述背景知识;所述描述背景知识基于第一知识实体的实体描述信息确定;其中,所述第一知识实体是指所述安全知识图谱中与漏洞描述请求对应的候选知识实体。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的安全漏洞描述的生成方法。
10.一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-7中任一项所述的安全漏洞描述的生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310729175.5A CN116467722B (zh) | 2023-06-20 | 2023-06-20 | 安全漏洞描述的生成方法、装置、介质和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310729175.5A CN116467722B (zh) | 2023-06-20 | 2023-06-20 | 安全漏洞描述的生成方法、装置、介质和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116467722A CN116467722A (zh) | 2023-07-21 |
CN116467722B true CN116467722B (zh) | 2023-09-01 |
Family
ID=87182874
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310729175.5A Active CN116467722B (zh) | 2023-06-20 | 2023-06-20 | 安全漏洞描述的生成方法、装置、介质和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116467722B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113987508A (zh) * | 2021-10-25 | 2022-01-28 | 中汽创智科技有限公司 | 一种漏洞处理方法、装置、设备及介质 |
CN115051843A (zh) * | 2022-06-06 | 2022-09-13 | 华北电力大学 | 基于kge的区块链威胁情报知识图谱推理方法 |
CN115827895A (zh) * | 2022-12-12 | 2023-03-21 | 绿盟科技集团股份有限公司 | 一种漏洞知识图谱处理方法、装置、设备及介质 |
CN116108847A (zh) * | 2022-12-17 | 2023-05-12 | 四维创智(北京)科技发展有限公司 | 知识图谱构建方法、cwe社区描述方法以及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11914674B2 (en) * | 2011-09-24 | 2024-02-27 | Z Advanced Computing, Inc. | System and method for extremely efficient image and pattern recognition and artificial intelligence platform |
US10956566B2 (en) * | 2018-10-12 | 2021-03-23 | International Business Machines Corporation | Multi-point causality tracking in cyber incident reasoning |
US20230135179A1 (en) * | 2021-10-21 | 2023-05-04 | Meta Platforms, Inc. | Systems and Methods for Implementing Smart Assistant Systems |
-
2023
- 2023-06-20 CN CN202310729175.5A patent/CN116467722B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113987508A (zh) * | 2021-10-25 | 2022-01-28 | 中汽创智科技有限公司 | 一种漏洞处理方法、装置、设备及介质 |
CN115051843A (zh) * | 2022-06-06 | 2022-09-13 | 华北电力大学 | 基于kge的区块链威胁情报知识图谱推理方法 |
CN115827895A (zh) * | 2022-12-12 | 2023-03-21 | 绿盟科技集团股份有限公司 | 一种漏洞知识图谱处理方法、装置、设备及介质 |
CN116108847A (zh) * | 2022-12-17 | 2023-05-12 | 四维创智(北京)科技发展有限公司 | 知识图谱构建方法、cwe社区描述方法以及存储介质 |
Non-Patent Citations (1)
Title |
---|
Web服务CGI安全漏洞分析与检测;孙百勇等;华中科技大学学报(自然科学版)(第03期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116467722A (zh) | 2023-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11544459B2 (en) | Method and apparatus for determining feature words and server | |
US11227118B2 (en) | Methods, devices, and systems for constructing intelligent knowledge base | |
CN106709345B (zh) | 基于深度学习方法推断恶意代码规则的方法、系统及设备 | |
US11190562B2 (en) | Generic event stream processing for machine learning | |
CN111327608B (zh) | 基于级联深度神经网络的应用层恶意请求检测方法及系统 | |
Layton et al. | Automated unsupervised authorship analysis using evidence accumulation clustering | |
CN111079029B (zh) | 敏感账号的检测方法、存储介质和计算机设备 | |
CN111783903B (zh) | 文本处理方法、文本模型的处理方法及装置、计算机设备 | |
CN111932386A (zh) | 用户账号确定方法及装置、信息推送方法及装置、电子设备 | |
CN112559747A (zh) | 事件分类处理方法、装置、电子设备和存储介质 | |
CN111813960A (zh) | 基于知识图谱的数据安全审计模型装置、方法及终端设备 | |
US11514258B2 (en) | Table header detection using global machine learning features from orthogonal rows and columns | |
US20230114673A1 (en) | Method for recognizing token, electronic device and storage medium | |
CN114244795B (zh) | 一种信息的推送方法、装置、设备及介质 | |
US20150012550A1 (en) | Systems and methods of messaging data analysis | |
CN111984797A (zh) | 客户身份识别装置及方法 | |
CN116467722B (zh) | 安全漏洞描述的生成方法、装置、介质和电子设备 | |
CN111191242A (zh) | 漏洞信息确定方法、装置、计算机可读存储介质及设备 | |
CN114528908B (zh) | 网络请求数据分类模型训练方法、分类方法及存储介质 | |
CN113869904B (zh) | 可疑数据识别方法、装置、电子设备、介质和计算机程序 | |
CN114579876A (zh) | 虚假信息检测方法、装置、设备及介质 | |
CN114662469A (zh) | 情感分析方法、装置、电子设备及存储介质 | |
US20160196619A1 (en) | Homogenizing time-based seniority signal with transition-based signal | |
CN115618857B (zh) | 威胁情报处理方法、威胁情报推送方法及装置 | |
Jiang et al. | R-gram: Inferring message formats of service protocols with relative positional n-grams |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |