一种事件图谱的匹配方法、装置、电子设备及存储介质
技术领域
本申请涉及电网监控技术领域,尤其是涉及一种事件图谱的匹配方法、装置、电子设备及存储介质。
背景技术
近年来,电网监控是保障电网安全、稳定运行的一项重要措施。而监控告警信号的发生频率,具有一定的波动性,将分散的告警信号聚合为有逻辑关联的事件,把对信号的处理转化为对事件的处理,是电网监控业务的主要需求。
目前,已存在将电网告警事件转化为事件图谱的技术方案。每个事件图谱可以指向特定的告警事件,通过分析两个相似度较高的告警事件,有助于业务人员了解各个告警事件对应的规则之间的区别。但是不同告警事件的事件图谱,彼此有较大的重复情况。因此,如何找到相似度较高且不重复的事件图谱成为了亟待解决的问题。
发明内容
有鉴于此,本申请的目的在于提供一种事件图谱的匹配方法、装置、电子设备及存储介质,能够将事件图谱根据维度分解成多个部分,基于每部分的相似度而得到整体的相似度,能够准确的找到与事件图谱相似的图谱,不仅降低了计算复杂度,还提高了图谱对比的准确度。
第一方面,本申请提供了一种事件图谱的匹配方法,所述匹配方法包括:
获取目标事件图谱和多个待匹配图谱;
基于预设维度对所述目标事件图谱进行分解,得到多个目标事件子图谱;
针对每个待匹配图谱,基于所述预设维度对所述每个待匹配图谱进行分解,得到与所述每个待匹配图谱对应的多个待匹配子图谱;
分别获取每个目标事件子图谱与各个所述待匹配图谱中的相同维度下的待匹配子图谱之间的相似度,以确定所述目标事件图谱与各个所述待匹配图谱之间的图谱相似度;
将位于预设的相似事件相似度区间内的图谱相似度所对应的待匹配图谱确定为与所述目标事件图谱相匹配的相似事件图谱。
优选地,所述预设维度包括信号节点维度、非信号节点维度和空间关系维度中的一种或多种的组合。
优选地,当所述预设维度包括信号节点维度时,从所述待匹配图谱中分解出与所述信号节点维度相对应的待匹配子图谱,通过以下步骤确定目标事件子图谱与相同维度下的待匹配子图谱之间的相似度:
获取所述待匹配子图谱中的待匹配有序节点序列和待匹配无序节点,以及所述目标事件子图谱中的目标有序节点序列和目标无序节点;
基于节点顺序特征和节点属性特征,确定与至少部分目标有序节点序列相同的至少部分待匹配有序节点序列,得出相同有序节点数量;
确定所述相同有序节点数量分别与所述待匹配有序节点序列中的节点总数量和所述目标有序节点序列中的节点总数量之间的比值,基于平衡F分数算法确定所述目标有序节点序列与所述待匹配有序节点序列之间的有序信号相似度;
基于节点属性特征,确定与至少部分目标无序节点相同的至少部分待匹配无序节点,得出相同无序节点数量;
计算所述相同无序节点数量分别与所有的待匹配无序节点的节点数量和所有的目标无序节点的节点数量之间的比值,基于平衡F分数算法确定所述目标无序节点与所述待匹配无序节点之间的无序信号相似度;
基于所述有序信号相似度和所述无序信号相似度,以及所述有序信号相似度对应的有序权重值和所述无序信号相似度对应的无序权重值,确定所述目标事件子图谱与相同维度下的待匹配子图谱之间的相似度。
优选地,通过以下步骤确定所述目标事件子图谱与相同维度下的待匹配子图谱之间的相似度:
确定所述待匹配有序节点序列中的节点总数量与所述目标有序节点序列中的节点总数量之间的有序节点数量总值,将所述有序节点数量总值确定为所述有序信号相似度对应的有序权重值;
确定所有的待匹配无序节点的节点数量与所有的目标无序节点的节点数量之间的无序节点数量总值,将所述无序节点数量总值确定为所述无序信号相似度对应的无序权重值;
确定所述有序信号相似度与所述有序权重值的乘积,以及所述无序信号相似度与所述无序权重值的乘积,将两个乘积的求和结果确定为所述目标事件子图谱与相同维度下的待匹配子图谱之间的相似度。
优选地,当所述预设维度包括非信号节点维度时,从所述待匹配图谱中分解出与所述非信号节点维度相对应的待匹配子图谱,通过以下步骤确定所述目标事件子图谱与相同维度下的待匹配子图谱之间的相似度:
获取所述待匹配子图谱中的待匹配非信号节点,以及所述目标事件子图谱中的目标非信号节点;
基于节点属性特征,确定与目标非信号子节点相同的待匹配非信号子节点,得出相同非信号节点的节点数量;
确定所述相同非信号节点的节点数量分别与所有的待匹配非信号节点的节点数量和所有的目标非信号节点的节点数量之间的比值,基于平衡F分数算法确定出所述目标事件子图谱与相同维度下的待匹配子图谱之间的相似度。
优选地,当所述预设维度包括空间关系维度时,从所述待匹配图谱中分解出与所述空间关系维度相对应的待匹配子图谱,通过以下步骤确定所述目标事件子图谱与相同维度下的待匹配子图谱之间的相似度:
确定所述目标事件子图谱与所述待匹配子图谱相匹配的同质信号节点地址集合和同质非信号节点地址集合,其中,所述同质信号节点地址集合包括所述目标事件子图谱与所述待匹配子图谱中的有序信号节点相同的有序信号节点地址和与无序信号节点相同的无序信号节点地址,所述同质非信号节点地址集合包括所述目标事件子图谱与所述待匹配子图谱中非信号节点相同的非信号节点地址;
获取所述待匹配子图谱中的各个信号节点地址分别与各个非信号节点地址之间形成的多个待匹配空间边和待匹配空间边数量,以及所述目标事件子图谱中的各个信号节点地址分别与各个非信号节点地址之间形成的多个目标空间边和目标空间边数量;
确定所述待匹配空间边的信号节点地址在所述同质信号节点地址集合内,且所述待匹配空间边的非信号节点地址在所述同质非信号节点地址集合内的同质待匹配空间边的数量;
确定所述目标空间边的信号节点地址在所述同质信号节点地址集合内,且所述目标空间边的非信号节点地址在所述同质非信号节点地址集合内的同质目标空间边的数量;
基于所述同质待匹配空间边的数量与所述待匹配空间边数量之间的比值,以及所述同质目标空间边的数量与所述目标空间边数量之间的比值,确定所述目标事件子图谱与相同维度下的待匹配子图谱之间的相似度。
优选地,当所述预设维度包括信号节点维度、非信号节点维度和空间关系维度的组合时,分别计算所述信号节点维度下、所述非信号节点维度下和所述空间关系维度下的目标事件子图谱与待匹配子图谱之间的相似度,得到所述信号节点维度对应的信号相似度,所述非信号节点维度对应的非信号相似度,以及所述空间关系维度对应的空间相似度;
通过以下步骤确定所述目标事件图谱与所述待匹配图谱之间的图谱相似度:
获取预设的信号节点维度对应的信号节点权重值、非信号节点维度对应的非信号节点权重值和空间关系维度对应的空间关系权重值;
确定所述信号相似度与所述信号节点权重值的乘积,所述非信号相似度与所述非信号节点权重值的乘积,以及所述空间相似度与所述空间关系权重值的乘积,得到三个乘积相加之后的乘积和结果;
确定所述信号节点权重值、所述非信号节点权重值和所述空间关系权重值相加之后的权重和结果;
确定所述乘积和结果与所述权重和结果之间的比值为所述目标事件图谱与所述待匹配图谱之间的图谱相似度。
优选地,所述匹配方法还包括:
将位于预设的冲突事件相似度区间内的图谱相似度所对应的待匹配图谱确定为与所述目标事件图谱相匹配的冲突事件图谱;
将位于预设的不同事件相似度区间内的图谱相似度所对应的待匹配图谱确定为与所述目标事件图谱相匹配的不同事件图谱。
第二方面,本申请还提供了一种事件图谱的匹配装置,所述匹配装置包括:
图谱获取模块,用于获取目标事件图谱和多个待匹配图谱;
目标图谱分解模块,用于基于预设维度对所述目标事件图谱进行分解,得到多个目标事件子图谱;
匹配图谱分解模块,用于针对每个待匹配图谱,基于所述预设维度对所述每个待匹配图谱进行分解,得到与所述每个待匹配图谱对应的多个待匹配子图谱;
相似度确定模块,用于分别获取每个目标事件子图谱与各个所述待匹配图谱中的相同维度下的待匹配子图谱之间的相似度,以确定所述目标事件图谱与各个所述待匹配图谱之间的图谱相似度;
相似图谱确定模块,用于将位于预设的相似事件相似度区间内的图谱相似度所对应的待匹配图谱确定为与所述目标事件图谱相匹配的相似事件图谱。
第三方面,本申请提供了一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过所述总线通信,所述机器可读指令被所述处理器执行时执行如第一方面所述的事件图谱的匹配方法的步骤。
第四方面,本申请提供了一种计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如第一方面所述的事件图谱的匹配方法的步骤。
本申请实施例提供了一种事件图谱的匹配方法、装置、电子设备及存储介质,其中,所述匹配方法包括:获取目标事件图谱和多个待匹配图谱,进而从多个待匹配图谱中找到与目标事件图谱相匹配的图谱;基于预设维度对目标事件图谱进行分解,得到多个目标事件子图谱,然后针对每个待匹配图谱,基于预设维度对每个待匹配图谱进行分解,得到与每个待匹配图谱对应的多个待匹配子图谱,这样,将目标事件图谱和每个待匹配图谱均分成了多个部分,然后每部分分别进行处理;接着分别获取每个目标事件子图谱与各个待匹配图谱中的相同维度下的待匹配子图谱之间的相似度,以确定目标事件图谱与各个待匹配图谱之间的图谱相似度,基于图谱相似度与预设的相似事件相似度区间之间的大小关系,将位于预设的相似事件相似度区间内的图谱相似度所对应的待匹配图谱确定为与目标事件图谱相匹配的相似事件图谱。
这样一来,本申请能够将事件图谱根据维度分解成多个部分,基于每部分的相似度而得到整体的相似度,能够准确的找到与事件图谱相似的图谱,不仅降低了计算复杂度,还提高了图谱对比的准确度。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种事件图谱的匹配方法的流程图;
图2为本申请实施例提供的一种事件图谱的匹配方法的实施流程图;
图3为本申请实施例提供的一种事件图谱的匹配装置的结构示意图之一;
图4为本申请实施例提供的一种事件图谱的匹配装置的结构示意图之二;
图5为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例,都属于本申请保护的范围。
请参阅图1,图1为本申请实施例提供的一种事件图谱的匹配方法的流程图,如图1中所示,本申请实施例提供了一种事件图谱的匹配方法,所述匹配方法包括:
S110、获取目标事件图谱和多个待匹配图谱。
该步骤中,将分散的告警信号聚合为有逻辑关联的事件,把对信号的处理转化为对事件的处理,将电网告警事件规则转化为知识图谱,从而获取到目标事件图谱和多个待匹配图谱,其中,目标事件图谱和待匹配图谱中存在较多一至两个信号节点的图结构。
这里,目标事件图谱和待匹配图谱均是具有一定规则的知识图谱。
S120、基于预设维度对所述目标事件图谱进行分解,得到多个目标事件子图谱。
该步骤中,预设维度包括信号节点维度、非信号节点维度和空间关系维度中的一种或多种的组合。基于上述维度,将目标事件图谱分解成多个部分,得到多个目标事件子图谱,部分目标事件子图谱是基于信号节点维度分解得到的,部分目标事件子图谱是基于非信号节点维度分解得到的,还有一些目标事件子图谱是基于空间关系维度分解得到的。
S130、针对每个待匹配图谱,基于所述预设维度对所述每个待匹配图谱进行分解,得到与所述每个待匹配图谱对应的多个待匹配子图谱;
该步骤中,执行与S120相同的步骤,每个待匹配图谱也是按照预设维度进行分解,从而获得多个待匹配子图谱。
S140、分别获取每个目标事件子图谱与各个所述待匹配图谱中的相同维度下的待匹配子图谱之间的相似度,以确定所述目标事件图谱与各个所述待匹配图谱之间的图谱相似度;
该步骤中,获取目标事件图谱中的每个目标事件子图谱与各个待匹配图谱中的相同维度下的待匹配子图谱之间的相似度,然后将所有目标事件子图谱与对应的待匹配子图谱之间的相似度进行加权求和,得到目标事件图谱与各个待匹配图谱之间的图谱相似度。
这里,由于不同维度下的目标事件子图谱与对应的待匹配子图谱之间相似度的计算方式存在差别,因此,需要先明确目标事件子图谱对应的维度,然后基于该维度下的相似度计算算法确定目标事件子图谱与对应的待匹配子图谱之间的相似度。
S150、将位于预设的相似事件相似度区间内的图谱相似度所对应的待匹配图谱确定为与所述目标事件图谱相匹配的相似事件图谱。
该步骤中,预先获取相似事件对应的相似事件相似度区间,当目标事件图谱与某个待匹配图谱之间的图谱相似度在相似事件相似度区间内,则认为该待匹配图谱为目标事件图谱的相似事件图谱。
这里,可以指定某个具有规则的目标事件图谱为基础图谱,采用本申请实施例中的方法可以得到与此目标事件图谱在相似事件相似度区间内的其他规则的待匹配图谱的列表。通过目标事件图谱与多个其他规则的待匹配图谱的对比,可以帮助业务人员定量了解规则之间的区别,对于规则的修改和新增有促进作用。
本申请实施例提供了一种事件图谱的匹配方法,其中,所述匹配方法包括:获取目标事件图谱和多个待匹配图谱,基于预设维度对目标事件图谱进行分解,得到多个目标事件子图谱,然后针对每个待匹配图谱,基于预设维度对每个待匹配图谱进行分解,得到与每个待匹配图谱对应的多个待匹配子图谱,分别获取每个目标事件子图谱与各个待匹配图谱中的相同维度下的待匹配子图谱之间的相似度,以确定目标事件图谱与各个待匹配图谱之间的图谱相似度,将位于预设的相似事件相似度区间内的图谱相似度所对应的待匹配图谱确定为与目标事件图谱相匹配的相似事件图谱。这样一来,本申请能够将事件图谱根据维度分解成多个部分,基于每部分的相似度而得到整体的相似度,能够准确的找到与事件图谱相似的图谱,不仅降低了计算复杂度,还提高了图谱对比的准确度。
本申请实施例中,所述预设维度包括信号节点维度、非信号节点维度和空间关系维度中的一种或多种的组合。进而,通过如下所述的匹配方法确定某个维度下的目标事件子图谱与待匹配子图谱之间的相似度。
本申请实施例中,作为一种优选的实施例,当所述预设维度包括信号节点维度时,从所述待匹配图谱中分解出与所述信号节点维度相对应的待匹配子图谱,通过以下步骤确定目标事件子图谱与相同维度下的待匹配子图谱之间的相似度:
获取所述待匹配子图谱中的待匹配有序节点序列和待匹配无序节点,以及所述目标事件子图谱中的目标有序节点序列和目标无序节点。
该步骤中,信号节点包括有序信号节点和无序信号节点,对于有序节点,将每个有序序列作为一个整体参与对比,对于有序序列中的信号,在属性和顺序上均完全一致,对于无序节点,直接进行节点属性的对比。
进而,当节点维度为信号节点维度时,得到待匹配子图谱中的待匹配有序节点序列和待匹配无序节点,以及目标事件子图谱中的目标有序节点序列和目标无序节点。
这里,按照每个节点的节点顺序特征和节点属性特征,将属于有序信号的节点进行排序,得到有序节点序列,进而得到目标有序节点序列和待匹配有序节点序列。
基于节点顺序特征和节点属性特征,确定与至少部分目标有序节点序列相同的至少部分待匹配有序节点序列,得出相同有序节点数量。
该步骤中,在进行比对时,只有节点顺序特征和节点属性特征同时满足相同的要求,才能认为部分目标有序节点序列与部分待匹配有序节点序列相同,从中确定出部分目标有序节点序列或部分待匹配有序节点序列中的相同有序节点数量。
示例性的,该事件图谱为告警事件图谱,应用在电网告警领域,进而,节点属性特征可以包括“同测点”、“同厂站”、“同间隔”、“同母线”、“同主变”和“系统内”等属性特征。
确定所述相同有序节点数量分别与所述待匹配有序节点序列中的节点总数量和所述目标有序节点序列中的节点总数量之间的比值,基于平衡F分数算法确定所述目标有序节点序列与所述待匹配有序节点序列之间的有序信号相似度。
该步骤中,平衡F分数算法是精确率和召回率的调和平均数,最大为1,最小为0。本申请实施例利用该算法计算目标有序节点序列与待匹配有序节点序列之间的有序信号相似度。
基于节点属性特征,确定与至少部分目标无序节点相同的至少部分待匹配无序节点,得出相同无序节点数量。
该步骤中,无序信号的对比无需考虑信号的顺序性,不像有序序列中的信号需要以一个整体进行对比。无序信号在判断是否相同时,只需要存在两个图谱的一个属性特征完全相同的节点即可认为这两个图谱的无序节点是相同的。
计算所述相同无序节点数量分别与所有的待匹配无序节点的节点数量和所有的目标无序节点的节点数量之间的比值,基于平衡F分数算法确定所述目标无序节点与所述待匹配无序节点之间的无序信号相似度。
基于所述有序信号相似度和所述无序信号相似度,以及所述有序信号相似度对应的有序权重值和所述无序信号相似度对应的无序权重值,确定所述目标事件子图谱与相同维度下的待匹配子图谱之间的相似度。
具体地,通过以下步骤确定所述目标事件子图谱与相同维度下的待匹配子图谱之间的相似度:
确定所述待匹配有序节点序列中的节点总数量与所述目标有序节点序列中的节点总数量之间的有序节点数量总值,将所述有序节点数量总值确定为所述有序信号相似度对应的有序权重值;
确定所有的待匹配无序节点的节点数量与所有的目标无序节点的节点数量之间的无序节点数量总值,将所述无序节点数量总值确定为所述无序信号相似度对应的无序权重值;
确定所述有序信号相似度与所述有序权重值的乘积,以及所述无序信号相似度与所述无序权重值的乘积,将两个乘积的求和结果确定为所述目标事件子图谱与相同维度下的待匹配子图谱之间的相似度。
具体地,是将两个乘积的求和结果与有序权重值和无序权重值的求和结果之间的比值确定为目标事件子图谱与相同维度下的待匹配子图谱之间的相似度。这里,有序权重值和无序权重值的求和结果为1,进而,直接将两个乘积的求和结果确定为目标事件子图谱与相同维度下的待匹配子图谱之间的相似度。
示例性的,如图2所示,图2为本申请实施例提供的一种事件图谱的匹配方法的实施流程图。目标事件子图谱与待匹配子图谱执行如图2所示的步骤来确定信号节点相似度,即确定目标事件子图谱与相同维度下的待匹配子图谱之间的相似度。
具体地,有序序列信号,其索引采用“数字”+“_”+“数字”的方式,第一个数字表示有序序列的编号,第二个数字表示某个有序序列内部信号的编号。假设目标事件子图谱为G1,待匹配子图谱为G2,G1和G2均只有一个有序序列,且有序序列中的信号,在属性和顺序上均完全一致。设G1和G2的有序序列分别为G1-0和G2-0,且G1-0与G2-0的相同节点数量为三。由于G1-0与G2-0各自有三个节点,所以相同节点数量与G1-0、G2-0的总节点数量的比值分别为:
其中,node_same_numi表示目标事件子图谱G1对应的有序序列G1-0和待匹配子图谱G2对应的有序序列G2-0之间的相同节点数量,node_num_alli表示目标事件子图谱G1对应的有序序列G1-0或待匹配子图谱G2对应的有序序列G2-0所包括的总节点数量,s1表示G1-0与G2-0之间的相同节点数量与G1-0包括的总结点数量之间的比值,s2表示G1-0与G2-0之间的相同节点数量与G2-0包括的总结点数量之间的比值。进而,可知本申请实施例中的s1=1,s2=1。
采用平衡F分数算法计算有序序列信号的相似度,需要综合利用s1与s2,以免遇到G1-0为G2-0的子集(或反之)的情况。进而,本申请实施例利用式(2.3)计算有序序列信号的相似度。
其中,s3表示有序序列信号的相似度。
进而,本申请实施例利用式(2.3)可以得到有序序列信号的相似度s有序为1。
具体地,无序信号的对比无需考虑信号的顺序性,不像有序序列中的信号需要以一个整体进行对比。G1和G2间的无序信号,只要存在一个各属性特征完全相同的节点,则无序信号的同质节点数量便+1。具体到G1和G2,没有同质的无序信号节点,利用式(2.4)、式(2.5)分别得到s4与s5,由于s4与s5均为0,此特殊情况下无法沿用式(2.3),直接判定无序信号相似度s无序=0。具体地,如下所示:
其中,num_node_same表示G1和G2间的无序信号的同质节点数量,num_nodeG1表示G1的无序信号的节点数量,num_nodeG2表示G2的无序信号的节点数量,s4表示G1和G2间的无序信号的同质节点数量与G1的无序信号的节点数量之间的比值,s5表示G1和G2间的无序信号的同质节点数量与G2的无序信号的节点数量之间的比值。
需要说明的是,同质指的是属性特征完全相同,同质的无序信号节点指的是属性特征完全相同的无序信号节点。
最后,将有序序列信号的相似度与无序信号的相似度进行集成。
采用加权求和方法,进行两种信号相似度的集成,权重分别由有序序列信号和无序信号的数量确定,即:
其中,ssignal表示目标事件子图谱G1与相同维度下的待匹配子图谱G2之间的相似度,num_node有序表示有序权重值,num_node无序表示无序权重值,num_node全部表示有序权重值和无序权重值的求和结果,这里的求和结果为1。
具体到本申请实施例中的G1和G2的情况,目标事件子图谱G1与相同维度下的待匹配子图谱G2之间的相似度ssignal=0.75。
本申请实施例中,作为一种优选的实施例,当所述预设维度包括非信号节点维度时,从所述待匹配图谱中分解出与所述非信号节点维度相对应的待匹配子图谱,通过以下步骤确定所述目标事件子图谱与相同维度下的待匹配子图谱之间的相似度:
获取所述待匹配子图谱中的待匹配非信号节点,以及所述目标事件子图谱中的目标非信号节点;
基于节点属性特征,确定与目标非信号子节点相同的待匹配非信号子节点,得出相同非信号节点的节点数量;
确定所述相同非信号节点的节点数量分别与所有的待匹配非信号节点的节点数量和所有的目标非信号节点的节点数量之间的比值,基于平衡F分数算法确定出所述目标事件子图谱与相同维度下的待匹配子图谱之间的相似度。
该步骤中,非信号节点的相似度计算方法与无序节点的相似度计算方法一致。
如图2所示,目标事件子图谱与待匹配子图谱执行如图2所示的步骤来确定非信号节点的相似度,即确定目标事件子图谱与相同维度下的待匹配子图谱之间的相似度。示例性的,非信号节点的相似度计算,与无序信号的相似度计算类似,也是进行节点的属性匹配。相较于信号节点,非信号节点的属性特征更少,找到同质非信号节点后,利用式(2.4)、式(2.5)分别得到s4与s5,再利用式(2.3)得到非信号节点的相似度s非信号。
本申请实施例中,作为一种优选的实施例,当所述预设维度包括空间关系维度时,从所述待匹配图谱中分解出与所述空间关系维度相对应的待匹配子图谱,通过以下步骤确定所述目标事件子图谱与相同维度下的待匹配子图谱之间的相似度:
确定所述目标事件子图谱与所述待匹配子图谱相匹配的同质信号节点地址集合和同质非信号节点地址集合,其中,所述同质信号节点地址集合包括所述目标事件子图谱与所述待匹配子图谱中的有序信号节点相同的有序信号节点地址和与无序信号节点相同的无序信号节点地址,所述同质非信号节点地址集合包括所述目标事件子图谱与所述待匹配子图谱中非信号节点相同的非信号节点地址。
具体地,有序信号节点相同指的是节点顺序特征和节点属性特征均相同,无序信号节点相同指的是节点属性特征相同,非信号节点相同指的也是节点属性特征相同。
获取所述待匹配子图谱中的各个信号节点地址分别与各个非信号节点地址之间形成的多个待匹配空间边和待匹配空间边数量,以及所述目标事件子图谱中的各个信号节点地址分别与各个非信号节点地址之间形成的多个目标空间边和目标空间边数量。
具体地,信号节点地址和非信号节点地址可以认为是两个点,两点之间的连线称为空间边,进而,待匹配空间边或目标空间边的起点是信号节点地址,待匹配空间边或目标空间边的终点是非信号节点地址。这里,待匹配空间边数量包括形成的所有待匹配空间边的数量,目标空间边数量包括形成的所有目标空间边的数量。
确定所述待匹配空间边的信号节点地址在所述同质信号节点地址集合内,且所述待匹配空间边的非信号节点地址在所述同质非信号节点地址集合内的同质待匹配空间边的数量;
这里,将待匹配空间边的起点地址(信号节点地址)在同质信号节点地址集合内,以及终点地址(非信号节点地址)在同质非信号节点地址集合内的空间边认定为同质待匹配空间边,确定出同质待匹配空间边的数量。
确定所述目标空间边的信号节点地址在所述同质信号节点地址集合内,且所述目标空间边的非信号节点地址在所述同质非信号节点地址集合内的同质目标空间边的数量;
这里,将目标空间边的起点地址(信号节点地址)在同质信号节点地址集合内,以及终点地址(非信号节点地址)在同质非信号节点地址集合内的空间边认定为同质目标空间边,确定出同质目标空间边的数量。
基于所述同质待匹配空间边的数量与所述待匹配空间边数量之间的比值,以及所述同质目标空间边的数量与所述目标空间边数量之间的比值,确定所述目标事件子图谱与相同维度下的待匹配子图谱之间的相似度。
如图2所示,目标事件子图谱与待匹配子图谱执行如图2所示的步骤来确定空间关系的相似度,即确定目标事件子图谱与相同维度下的待匹配子图谱之间的相似度。本申请实施例基于空间边来判断节点的空间关系,将空间关系表示为空间边,即空间边的起点为信号节点地址,空间边的终点为非信号节点地址。因此空间边的对比,需要通过两图的信号节点地址、非信号节点地址的重叠情况,作相应计算。信号节点地址与非信号节点地址之间形成的线即为空间边,主要信息即起点地址、终点地址,确定两个图节点属性一致的信号地址和非信号地址。如果空间边的起点地址、终点地址分别在同质信号节点地址集合和同质非信号节点地址集合中,则认为这样的空间边是相似的。具体到G1和G2,四条空间边中有三条符合同质条件,因此得到s6=0.75,s7=0.75,利用式(2.3),得到空间关系的相似度s空间边=0.75。
本申请实施例中,作为一种优选的实施例,当所述预设维度包括信号节点维度、非信号节点维度和空间关系维度的组合时,分别计算所述信号节点维度下、所述非信号节点维度下和所述空间关系维度下的目标事件子图谱与待匹配子图谱之间的相似度,得到所述信号节点维度对应的信号相似度,所述非信号节点维度对应的非信号相似度,以及所述空间关系维度对应的空间相似度;
通过以下步骤确定所述目标事件图谱与所述待匹配图谱之间的图谱相似度:
获取预设的信号节点维度对应的信号节点权重值、非信号节点维度对应的非信号节点权重值和空间关系维度对应的空间关系权重值;
确定所述信号相似度与所述信号节点权重值的乘积,所述非信号相似度与所述非信号节点权重值的乘积,以及所述空间相似度与所述空间关系权重值的乘积,得到三个乘积相加之后的乘积和结果;
确定所述信号节点权重值、所述非信号节点权重值和所述空间关系权重值相加之后的权重和结果;
确定所述乘积和结果与所述权重和结果之间的比值为所述目标事件图谱与所述待匹配图谱之间的图谱相似度。
该步骤中,图级别的图谱相似度指标通过三个部分的相似度加权求和得到,三个部分包括信号节点维度对应的信号相似度,非信号节点维度对应的非信号相似度,以及空间关系维度对应的空间相似度。
示例性的,在得到三部分的相似度结果后,采用加权求和方式计算目标事件图谱和待匹配图谱的整体相似度,计算方法参见式(2.7)。
其中,s信号表示信号节点的相似度,s非信号表示非信号节点的相似度,s空间边表示空间关系的相似度,a、b、c的设置取决于业务人员认定的重要性,从业务角度,信号节点的属性信息最重要,非信号节点和空间关系次之,本申请实施例中,可以根据实际情况设置a=6,b=2,c=2。
进一步地,所述匹配方法还包括:
将位于预设的冲突事件相似度区间内的图谱相似度所对应的待匹配图谱确定为与所述目标事件图谱相匹配的冲突事件图谱;
将位于预设的不同事件相似度区间内的图谱相似度所对应的待匹配图谱确定为与所述目标事件图谱相匹配的不同事件图谱。
该步骤中,不仅可以从待匹配图谱中确定出相似事件图谱,还可以确定出冲突事件图谱和不同事件图谱。
获取预设的与冲突事件对应的冲突事件相似度区间以及与不同事件对应的不同事件相似度区间,然后将目标事件图谱与待匹配图谱之间的图谱相似度分别与冲突事件相似度区间以及不同事件相似度区间进行对比,从而找出图谱相似度所对应的待匹配图谱所对应的事件图谱类型,这里的事件图谱类型包括相似事件图谱、冲突事件图谱和不同事件图谱。
将事件图谱进行信号节点、非信号节点、空间关系的分解后,采用局部相似度计算后加权求得图结构的整体相似度,进而,给定某一图结构,得到与该图结构在指定相似度大小的所有图结构的列表。由于每个图谱可以指向特定的事件,有助于业务人员了解各个规则事件之间的区别。
综上可知,在节点和边(空间关系)两个维度进行图的分解,在节点维度,进行有序信号、无序信号和非信号节点的区分,并以属性相同作为同质节点的匹配条件;在边的维度,只进行空间边(信号到非信号节点)的对比。其中,同质空间边的定义为起点位于同质信号节点集合、终点位于同质非信号节点集合内。每个维度下,由两个图结构下各自的同质/全量比,经过平衡F分数的计算方式,得到相似度计算结果;图整体的相似度,由各维度相似度加权求和而得。
基于同一发明构思,本申请实施例中提供了与事件图谱的匹配方法对应的事件图谱的匹配装置,由于本申请实施例中的装置解决问题的原理与本申请实施例的上述方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
请参阅图3和图4,图3为本申请实施例所提供的一种事件图谱的匹配装置的结构示意图之一,图4为本申请实施例所提供的一种事件图谱的匹配装置的结构示意图之二。如图3中所示,所述匹配装置300包括:
图谱获取模块310,用于获取目标事件图谱和多个待匹配图谱;
目标图谱分解模块320,用于基于预设维度对所述目标事件图谱进行分解,得到多个目标事件子图谱;
匹配图谱分解模块330,用于针对每个待匹配图谱,基于所述预设维度对所述每个待匹配图谱进行分解,得到与所述每个待匹配图谱对应的多个待匹配子图谱;
相似度确定模块340,用于分别获取每个目标事件子图谱与各个所述待匹配图谱中的相同维度下的待匹配子图谱之间的相似度,以确定所述目标事件图谱与各个所述待匹配图谱之间的图谱相似度;
相似图谱确定模块350,用于将位于预设的相似事件相似度区间内的图谱相似度所对应的待匹配图谱确定为与所述目标事件图谱相匹配的相似事件图谱。
优选地,所述预设维度包括信号节点维度、非信号节点维度和空间关系维度中的一种或多种的组合。
优选地,当所述预设维度包括信号节点维度时,所述匹配图谱分解模块330用于从所述待匹配图谱中分解出与所述信号节点维度相对应的待匹配子图谱,所述相似度确定模块340用于通过以下步骤确定目标事件子图谱与相同维度下的待匹配子图谱之间的相似度:
获取所述待匹配子图谱中的待匹配有序节点序列和待匹配无序节点,以及所述目标事件子图谱中的目标有序节点序列和目标无序节点;
基于节点顺序特征和节点属性特征,确定与至少部分目标有序节点序列相同的至少部分待匹配有序节点序列,得出相同有序节点数量;
确定所述相同有序节点数量分别与所述待匹配有序节点序列中的节点总数量和所述目标有序节点序列中的节点总数量之间的比值,基于平衡F分数算法确定所述目标有序节点序列与所述待匹配有序节点序列之间的有序信号相似度;
基于节点属性特征,确定与至少部分目标无序节点相同的至少部分待匹配无序节点,得出相同无序节点数量;
计算所述相同无序节点数量分别与所有的待匹配无序节点的节点数量和所有的目标无序节点的节点数量之间的比值,基于平衡F分数算法确定所述目标无序节点与所述待匹配无序节点之间的无序信号相似度;
基于所述有序信号相似度和所述无序信号相似度,以及所述有序信号相似度对应的有序权重值和所述无序信号相似度对应的无序权重值,确定所述目标事件子图谱与相同维度下的待匹配子图谱之间的相似度。
优选地,所述相似度确定模块340用于通过以下步骤确定所述目标事件子图谱与相同维度下的待匹配子图谱之间的相似度:
确定所述待匹配有序节点序列中的节点总数量与所述目标有序节点序列中的节点总数量之间的有序节点数量总值,将所述有序节点数量总值确定为所述有序信号相似度对应的有序权重值;
确定所有的待匹配无序节点的节点数量与所有的目标无序节点的节点数量之间的无序节点数量总值,将所述无序节点数量总值确定为所述无序信号相似度对应的无序权重值;
确定所述有序信号相似度与所述有序权重值的乘积,以及所述无序信号相似度与所述无序权重值的乘积,将两个乘积的求和结果确定为所述目标事件子图谱与相同维度下的待匹配子图谱之间的相似度。
优选地,当所述预设维度包括非信号节点维度时,所述匹配图谱分解模块330用于从所述待匹配图谱中分解出与所述非信号节点维度相对应的待匹配子图谱,所述相似度确定模块340用于通过以下步骤确定所述目标事件子图谱与相同维度下的待匹配子图谱之间的相似度:
获取所述待匹配子图谱中的待匹配非信号节点,以及所述目标事件子图谱中的目标非信号节点;
基于节点属性特征,确定与目标非信号子节点相同的待匹配非信号子节点,得出相同非信号节点的节点数量;
确定所述相同非信号节点的节点数量分别与所有的待匹配非信号节点的节点数量和所有的目标非信号节点的节点数量之间的比值,基于平衡F分数算法确定出所述目标事件子图谱与相同维度下的待匹配子图谱之间的相似度。
优选地,当所述预设维度包括空间关系维度时,所述匹配图谱分解模块330用于从所述待匹配图谱中分解出与所述空间关系维度相对应的待匹配子图谱,所述相似度确定模块340用于通过以下步骤确定所述目标事件子图谱与相同维度下的待匹配子图谱之间的相似度:
确定所述目标事件子图谱与所述待匹配子图谱相匹配的同质信号节点地址集合和同质非信号节点地址集合,其中,所述同质信号节点地址集合包括所述目标事件子图谱与所述待匹配子图谱中的有序信号节点相同的有序信号节点地址和与无序信号节点相同的无序信号节点地址,所述同质非信号节点地址集合包括所述目标事件子图谱与所述待匹配子图谱中非信号节点相同的非信号节点地址;
获取所述待匹配子图谱中的各个信号节点地址分别与各个非信号节点地址之间形成的多个待匹配空间边和待匹配空间边数量,以及所述目标事件子图谱中的各个信号节点地址分别与各个非信号节点地址之间形成的多个目标空间边和目标空间边数量;
确定所述待匹配空间边的信号节点地址在所述同质信号节点地址集合内,且所述待匹配空间边的非信号节点地址在所述同质非信号节点地址集合内的同质待匹配空间边的数量;
确定所述目标空间边的信号节点地址在所述同质信号节点地址集合内,且所述目标空间边的非信号节点地址在所述同质非信号节点地址集合内的同质目标空间边的数量;
基于所述同质待匹配空间边的数量与所述待匹配空间边数量之间的比值,以及所述同质目标空间边的数量与所述目标空间边数量之间的比值,确定所述目标事件子图谱与相同维度下的待匹配子图谱之间的相似度。
优选地,当所述预设维度包括信号节点维度、非信号节点维度和空间关系维度的组合时,所述相似度确定模块340用于分别确定所述信号节点维度下、所述非信号节点维度下和所述空间关系维度下的目标事件子图谱与待匹配子图谱之间的相似度,得到所述信号节点维度对应的信号相似度,所述非信号节点维度对应的非信号相似度,以及所述空间关系维度对应的空间相似度;
所述相似度确定模块340用于通过以下步骤确定所述目标事件图谱与所述待匹配图谱之间的图谱相似度:
获取预设的信号节点维度对应的信号节点权重值、非信号节点维度对应的非信号节点权重值和空间关系维度对应的空间关系权重值;
确定所述信号相似度与所述信号节点权重值的乘积,所述非信号相似度与所述非信号节点权重值的乘积,以及所述空间相似度与所述空间关系权重值的乘积,得到三个乘积相加之后的乘积和结果;
确定所述信号节点权重值、所述非信号节点权重值和所述空间关系权重值相加之后的权重和结果;
确定所述乘积和结果与所述权重和结果之间的比值为所述目标事件图谱与所述待匹配图谱之间的图谱相似度。
进一步的,如图4所示,所述匹配装置300还包括:
冲突图谱确定模块360,用于将位于预设的冲突事件相似度区间内的图谱相似度所对应的待匹配图谱确定为与所述目标事件图谱相匹配的冲突事件图谱;
不同图谱确定模块370,用于将位于预设的不同事件相似度区间内的图谱相似度所对应的待匹配图谱确定为与所述目标事件图谱相匹配的不同事件图谱。
本申请实施例提供的事件图谱的匹配装置,包括图谱获取模块、目标图谱分解模块、匹配图谱分解模块、相似度确定模块和相似图谱确定模块,其中,图谱获取模块用于获取目标事件图谱和多个待匹配图谱,目标图谱分解模块用于基于预设维度对目标事件图谱进行分解,得到多个目标事件子图谱,匹配图谱分解模块用于针对每个待匹配图谱,基于预设维度对每个待匹配图谱进行分解,得到与每个待匹配图谱对应的多个待匹配子图谱,相似度确定模块用于分别获取每个目标事件子图谱与各个待匹配图谱中的相同维度下的待匹配子图谱之间的相似度,以确定目标事件图谱与各个待匹配图谱之间的图谱相似度,相似图谱确定模块用于将位于预设的相似事件相似度区间内的图谱相似度所对应的待匹配图谱确定为与目标事件图谱相匹配的相似事件图谱。这样一来,本申请能够将事件图谱根据维度分解成多个部分,基于每部分的相似度而得到整体的相似度,能够准确的找到与事件图谱相似的图谱,不仅降低了计算复杂度,还提高了图谱对比的准确度。
请参阅图5,图5为本申请实施例所提供的一种电子设备的结构示意图。如图5中所示,所述电子设备500包括处理器510、存储器520和总线530。
所述存储器520存储有所述处理器510可执行的机器可读指令,当电子设备500运行时,所述处理器510与所述存储器520之间通过总线530通信,所述机器可读指令被所述处理器510执行时,可以执行如上述图1所述的事件图谱的匹配方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时可以执行如上述图1所述的事件图谱的匹配方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以目标前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。