CN115048529A - 一种路径处理方法、装置、存储介质及电子设备 - Google Patents

一种路径处理方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN115048529A
CN115048529A CN202210552096.7A CN202210552096A CN115048529A CN 115048529 A CN115048529 A CN 115048529A CN 202210552096 A CN202210552096 A CN 202210552096A CN 115048529 A CN115048529 A CN 115048529A
Authority
CN
China
Prior art keywords
path
entity
node
graph
embedding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210552096.7A
Other languages
English (en)
Inventor
尹珂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202210552096.7A priority Critical patent/CN115048529A/zh
Publication of CN115048529A publication Critical patent/CN115048529A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本说明书公开了一种路径处理方法、装置、存储介质及电子设备,其中,方法包括:通过获取目标事务对应的知识图谱,确定针对目标事务的头实体和尾实体,以基于头实体和尾实体从知识图谱中确定参考实体路径上至少两个路径节点对应的节点路径类型,然后基于至少两个节点路径类型对知识图谱进行路径筛选处理,得到至少一条目标实体路径。

Description

一种路径处理方法、装置、存储介质及电子设备
技术领域
本申请涉及计算机技术领域,尤其涉及一种路径处理方法、装置、存储介质及电子设备。
背景技术
随着计算机技术的快速发展,知识图谱的应用越来越广泛;知识图谱是以图的形式表现客观世界中的实体及其之间关系的知识库,实体可以是真实世界中的物体或抽象的概念,关系则表示了实体间的联系。因此,知识图谱能够以结构化的形式表示人类知识,通过知识表示和推理技术,可以给人工智能系统提供可处理的先验知识,让其具有与人类一样的解决复杂任务的能力。
发明内容
本说明书提供了一种路径处理方法、装置、存储介质及电子设备,所述技术方案如下:
第一方面,本说明书提供了一种路径处理方法,所述方法包括:
获取目标事务对应的知识图谱,确定针对所述目标事务的头实体和尾实体;
基于所述头实体和尾实体从所述知识图谱中确定参考实体路径上至少两个路径节点对应的节点路径类型;
基于至少两个所述节点路径类型对所述知识图谱进行路径筛选处理,得到至少一条目标实体路径。
第二方面,本说明书提供了一种路径处理装置,所述装置包括:
实体确定模块,用于获取目标事务对应的知识图谱,确定针对所述目标事务的头实体和尾实体;
类型确定模块,用于基于所述头实体和尾实体从所述知识图谱中确定参考实体路径上至少两个路径节点对应的节点路径类型,所述参考实体路径为所述知识图谱中所述头实体至所述尾实体的路径;
路径筛选模块,用于基于至少两个所述节点路径类型对所述知识图谱进行路径筛选处理,得到至少一条目标实体路径。
第三方面,本说明书提供一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行上述的方法步骤。
第四方面,本说明书提供一种电子设备,可包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行上述的方法步骤。
本说明书一些实施例提供的技术方案带来的有益效果至少包括:
在本说明书一个或多个实施例中,通过获取目标事务对应的知识图谱,基于所述目标事务的头实体和尾实体从所述知识图谱中确定参考实体路径上至少两个路径节点对应的节点路径类型,然后通过至少两个所述节点路径类型对所述知识图谱进行路径筛选处理,就可以得到至少一条目标实体路径。通过基于节点路径类型的路处理方式可以在路径挖掘筛选中为目标实体路径确定提供指引,大幅减少了路径处理的计算量以及路径搜索复杂度;以及整个路径处理过程具有参考价值的长路径不会丢失,提升了高目标实体路径的可用性。
附图说明
为了更清楚地说明本说明书或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本说明书提供的一种路径处理系统的场景示意图;
图2是本说明书提供的一种路径处理方法的流程示意图;
图3是本说明书提供的另一种路径处理方法的流程示意图;
图4是本说明书提供的另一种路径处理方法的流程示意图;
图5是本说明书提供的一种路径挖掘的场景示意图;
图6是本说明书提供的一种路径处理装置的结构示意图;
图7是本说明书提供的一种类型确定模块的结构示意图;
图8是本说明书提供的一种节点确定单元的结构示意图;
图9是本说明书提供的一种路径筛选模的结构示意图;
图10是本说明书提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本说明书中的附图,对本说明书中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。在本申请的描述中,需要说明的是,除非另有明确的规定和限定,“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。此外,在本申请的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
在涉及到知识图谱的应用场景中,常常需要对知识图谱进行路径处理,而受限于计算资源的瓶颈和时间复杂度的不可控,相关技术中的路径处理方法往往无法在实际事务中应用。例如采用类PRA算法的方案在实际事务中,需要设置路径长度的阈值或者热点防止策略才能收敛算法的复杂度,计算量且复杂,容易丢失有价值的长路径,实际事务中无法使用。又例如传统的路径搜索算法,搜索最理想路径计算量较大,使用动态规划方法的时间复杂度很大,实际事务中无法使用。
下面结合具体的实施例对本申请进行详细说明。
请参见图1,为本说明书提供的一种路径处理系统的场景示意图。如图1所示,所述路径处理系统至少可以包括客户端集群和服务平台100。
所述客户端集群可以包括至少一个客户端,如图1所示,具体包括用户1对应的客户端1、用户2对应的客户端2、…、用户n对应的客户端n,n为大于0的整数。
客户端集群中的各客户端可以是具备通信功能的电子设备,该电子设备包括但不限于:可穿戴设备、手持设备、个人电脑、平板电脑、车载设备、智能手机、计算设备或连接到无线调制解调器的其它处理设备等。在不同的网络中电子设备可以叫做不同的名称,例如:用户设备、接入终端、用户单元、用户站、移动站、移动台、远方站、远程终端、移动设备、用户终端、终端、无线通信设备、用户代理或用户装置、蜂窝电话、无绳电话、个人数字处理(personal digital assistant,PDA)、5G网络或未来演进网络中的电子设备等。
所述服务平台100可以是单独的服务器设备,例如:机架式、刀片、塔式、或者机柜式的服务器设备,或采用工作站、大型计算机等具备较强计算能力硬件设备;也可以是采用多个服务器组成的服务器集群,所述服务集群中的各服务器可以是以对称方式组成的,其中每台服务器在事务链路中功能等价、地位等价,各服务器均可单独对外提供服务,所述单独提供服务可以理解为无需另外的服务器的辅助。
在本说明书的一个或多个实施例中,服务平台100与客户端集群中的至少一个客户端可建立通信连接,基于该通信连接完成路径处理过程中数据的交互,诸如线上事务数据交互,如服务平台100可基于本说明书的路径处理方法得到的若干目标实体路径可实现向客户端进行内容推荐;又如,服务平台100可从客户端上获取目标事务场景下的结构化事务数据来构建知识图谱,又如可以基于针对客户端的在目标事务下的应用任务,确定目标事务的头实体以及尾实体,以基于知识图谱实现确定若干目标实体路径。
需要说明的是,服务平台100与客户端集群中的至少一个客户端通过网络建立通信连接进行交互通信,其中,网络可以是无线网络,也可以是有线网络,无线网络包括但不限于蜂窝网络、无线局域网、红外网络或蓝牙网络,有线网络包括但不限于以太网、通用串行总线(universal serial bus,USB)或控制器局域网络。在说明书一个或多个实施例中,使用包括超文本标记语言(Hyper Text Mark-up Language,HTML)、可扩展标记语言(Extensible Markup Language,XML)等的技术和/或格式来代表通过网络交换的数据(如目标压缩包)。此外还可以使用诸如安全套接字层(Secure Socket Layer,SSL)、传输层安全(Transport Layer Security,TLS)、虚拟专用网络(Virtual Private Network,VPN)、网际协议安全(Internet Protocol Security,IPsec)等常规加密技术来加密所有或者一些链路。在另一些实施例中,还可以使用定制和/或专用数据通信技术取代或者补充上述数据通信技术。
本说明书所提供的路径处理系统实施例与一个或多个实施例中的所述路径处理方法属于同一构思,在说明书一个或多个实施例涉及的所述路径处理方法对应的执行主体可以是上述服务平台100;在说明书一个或多个实施例涉及的所述路径处理方法对应的执行主体也可以是客户端所对应的电子设备,具体基于实际应用环境确定。路径处理系统实施例其体现实现过程可详见下述的方法实施例,这里不再赘述。
基于图1所示的场景示意图,下面对本说明书一个或多个实施例提供的路径处理方法进行详细介绍。
请参见图2,为本说明书一个或多个实施例提供了一种路径处理方法的流程示意图,该方法可依赖于计算机程序实现,可运行于基于冯诺依曼体系的背景调查装置上。该计算机程序可集成在应用中,也可作为独立的工具类应用运行。所述模型处理装置可以为服务平台。
具体的,该路径处理方法包括:
S102:获取目标事务对应的知识图谱,确定针对所述目标事务的头实体和尾实体;
可以理解的,在大量不同类型的事务场景下,都积累了大量的结构化数据和信息,进程会涉及到需要将这些结构化的数据和信息进行描述。基于此,在这些实际事务场景下,常会涉及到使用知识图谱技术,将这些大量的信息乃至数据以知识图谱的形式进行结构化表征后进行存储。
可以理解的,在实际应用中,可以采用知识图谱构建技术针对相应的目标事务(如金融事务场景、购物事务场景、即时通讯事务场景等等)来预先构建知识图谱。
具体的,在预先构建好知识图谱之后,在目标事务中会涉及到一些应用任务需要从知识图谱中快速挖掘出相应实体路径,以基于挖掘出的实体路径提供相应事务服务。诸如在涉及到知识问题回答、网络搜索、语义分析、内容推荐、关系提取等目标事务中的应用任务时,会涉及到对知识图谱进行相应路径挖掘。
以下对目标事务所预先构建的知识图谱进行释义。
知识图谱形式的结构化数据被广泛应用在实际目标事务场景,如金融事务场景、购物事务场景等等。在一些实施例中,目标事务对应的知识图谱可视作一种语义网络,具体而言是针对目标事务下的一种基于图形式的数据结构。目标事务对应的知识图谱由点和边组成。在知识图谱里,每个点表示目标事务场景下存在的实体,每条边为实体与实体之间的关系。
在一种可行的实施方式中,可以通过监测实际目标事务下所产生的应用任务,基于应用任务来确定头实体和尾实体。例如,应用任务可以是内容推荐任务,基于内容推荐任务对应的推荐策略可以随之确定进行路径挖掘的头实体以及尾实体;又例如,应用任务可以是网络搜索任务可以网络搜索任务所输入的搜索语句随之确定进行路径挖掘的头实体以及尾实体,等等。
在一种可行的实施方式中,考科一是基于实际目标事务场景下的事务数据进行实体抽取得到,也即通过获取目标事务场景下的待抽取事务数据,对待抽取事务数据进行实体抽取处理,可以得到抽取处理后的头实体以及尾实体。
S104:基于所述头实体和尾实体从所述知识图谱中确定参考实体路径上至少两个路径节点对应的节点路径类型;
可以理解的,在确定头实体以及尾实体之后,在知识图谱中从头实体至尾实体会对应大量的路径;
可选的,在知识图谱中从头实体经若干实体节点至尾实体的路径可称之为参考实体路径,而参考实体路径上的存在的任一实体节点可称之为路径节点,在一些实施例中,参考实体路径包含头实体和尾实体时,参考实体路径可称之为第一参考实体路径。
可选的,在知识图谱中从头实体出发至某一节点且该某一节点至尾实体存在可达路径,则从头实体出发至前述某一节点的路径也可称之为参考实体路径,而参考实体路径上的存在的任一实体节点可称之为路径节点,此时参考实体路径仅包含头实体不含尾实体,此时参考实体路径可称之为第二参考实体路径。
在一些实施例中,基于第一参考实体路径进行路径筛选处理和基于第二参考实体路径进行路径筛选处理的执行过程不一样。
示意性的,基于第一参考实体路径进行路径筛选处理:服务平台通常首先从所述知识图谱中确定由头实体至尾实体的若干第一参考实体路径,然后确定各第一参考实体路径上至少两个路径节点对应的节点路径类型;再基于至少两个所述节点路径类型对所述知识图谱进行路径筛选处理(通常是对第一参考实体路径进行筛选),得到至少一条目标实体路径。可以理解的此时是先确定全部的第一参考实体路径,然后再进行路径筛选。
示意性的,基于第二参考实体路径进行路径筛选处理:1、服务平台通常首先从所述知识图谱中将头实体作为第一路径节点,获取与第一路径节点相链接的至少一个第二路径节点且所述第二路径结点值所述尾实体存在可达路径,第一路径节点与第二路径结点组成为第二参考实体路径;2、确定所述第一路径节点对应的第一节点路径类型和所述第二路径节点对应的第二节点路径类型,确定所述第一节点路径类型对应的第一图嵌入以及所述第二节点路径类型对应的第二图嵌入;3、基于所述第一图嵌入和第二图嵌入确定路径类型权重;4、基于所述路径类型权重对所述至少一个第二路径节点进行排序滤除处理,得到至少一个参考路径节点,获取与所述参考路径节点链接的至少一个第二路径节点;5、若所述第二路径节点不为所述尾实体,则将所述参考路径节点作为所述第一路径节点执行所述获取所述第一路径节点与相链接的至少一个第二路径节点的所述路径类型权重的步骤;若所述第二路径节点为所述尾实体,则将由所述头实体至所述第二路径节点的第二参考实体路径作为目标实体路径。可以理解的此时是逐批路径结点进行筛选路径,最后筛选完成即得到目标实体路径。
所述节点路径类型可以理解为针对知识图谱中的节点所划分的节点类型,例如可以基于节点的节点属性信息来划分节点路径类型。
在本说明书一个或多个实施例,通过执行所述路径处理方法在知识图谱基础上筛选出路径质量较好、参考价值高、可用性好的若干目标实体路径,并非将相关路径全部推荐,以及同时执行所述路径处理方法可兼顾路径挖掘效率,节省路径挖掘时间。
在一种可行的实施方式中,可以预先针对目标事务的知识图谱,获取知识图谱中的每一实体节点,对所有的实体节点划分实体路径类型(在一些实施例中也可称之为参考节点路径类型);
可选的,可以基于知识图谱中所有实体节点的属性信息从语义信息维度对实体节点来划分实体路径类型;
可选的,可以基于知识图谱中所有实体节点的事务功能属性从事务功能维度对实体节点来划分实体路径类型,事务功能属性也即该实体节点在目标事务中所关联的事务功能,也即从具体事务服务中对实体节点进行实体路径类型划分;
可选的,可以采用特征工程方式对实体节点提取节点实体特征进行特征向量化,通过特征工程方式将若干实体节点映射到向量特征空间中,然后对这些实体节点对应的实体特征向量进行特征聚类处理,可以得到若干聚类中心,根据每个聚类中心可以确定一个聚类主题,聚类主题也即实体路径类型。
在一种可行的实施方式,在实际应用中,为了提升路径挖掘的可参考性以及准确性,在对知识图谱中的实体节点划分实体路径类型的过程,可以从实体节点自身以及实体节点所关联的关系这两个维度综合划分实体路径类型,实体节点所关联的关系在知识图谱中也即该实体节点的有向边,实体节点的关系可更深度反馈节点结构,基于此将实体节点的关系也即知识图谱中节点的有向边纳入参考,可极大的提升路径的可参考性以及准确性。
可选的,可以采用特征工程方式对实体节点提取节点实体特征以及对实体节点的有向边提取节点关系特征,然后针对实体节点对节点实体特征和节点关系特征进行特征向量化以及向量融合处理,通过特征工程方式将若干实体节点映射到向量特征空间中,在向量特征空间中,这些实体节点会对应一个实体特征向量,然后对这些实体特征向量进行特征聚类处理,可以得到若干聚类中心,根据每个聚类中心可以确定一个聚类主题,聚类主题也即实体路径类型。
以此进行划分的实体路径类型实现了对路径挖掘流程的优化,通过实体路径类型可更深层次挖掘实体节点的结构化特性,进而在后续路径挖掘环节可大幅提升路径的可参考性以及准确性。
可以理解的,在获取到目标事务的知识图谱,确定了头实体和尾实体,则知识图谱中基于头实体和尾实体所有的参考实体路径可以通过遍历知识图谱的节点结构可以确定,而知识图谱上任一实体节点的实体路径类型已预先确定,基于此,可以获取到参考实体路径上若干路径节点分别对应的节点路径类型,通常可得到至少两个节点路径类型。
在本说明书一个或多个实施例中,可以采用逐批遍历从头实体出发的第二参考实体路径上若干个路径节点对应的节点路径类型,例如,以每两个路径节点为参考逐条对第二参考实体路径进行筛选,满足纳入参考的第二参考实体路径保留(也即保留第二参考实体路径上的中间路径节点),不满足纳入参考的参考实体路径滤除。
采用前述方式,可以理解为:从知识图谱中确定路径节点对应的至少两个节点路径类型,所述至少一个节点路径类型并非指的是参考实体路径上所对应的节点路径类型的总数量,所述至少一个节点路径类型指的是在进行路径筛选处理的过程中,每轮筛选处理所纳入路径筛选的若干节点路径类型,可以理解为每轮筛选处理所纳入路径筛选参考的节点路径类型的指定数量至少为两个,每轮筛选处理所纳入路径筛选的节点路径类型诸如可以是2个、3个等等。
可选的,每轮筛选处理所纳入进行路径筛选的“至少两个节点路径类型”的数量可基于实际任务的需求确定,不同任务类型对应不同的数量。
进一步的,筛选处理所纳入进行路径筛选的为:每条路径上彼此相链接的指定数量的若干路径节点,确定若干路径节点对应的至少两个节点路径类型。可以理解为,彼此相邻的若干路径节点,各路径节点有一条边相链接。
可以理解的,通过将邻近的相链接的若干路径节点所对应的节点路径类型纳入参考,可整体考量某段路径或某节点相关路径的结构特性,以实现准确路径挖掘。
示意性的,以筛选处理所纳入进行路径筛选的为:路径上彼此相链接的两个路径节点,也就是说,所述基于所述头实体和尾实体从所述知识图谱中确定参考实体路径上至少两个路径节点对应的节点路径类型,具体为:服务平台基于头实体和尾实体从知识图谱中来确定参考实体路径上的至少一组相链接的两个路径节点,然后获取至少一组两个路径节点分别对应的节点路径类型。采用前述方式,可以确定筛选处理所纳入路径筛选的节点路径类型为2个。
S106:基于至少两个所述节点路径类型对所述知识图谱进行路径筛选处理,得到至少一条目标实体路径。
所述目标实体路径可以理解为基于知识图谱经路径挖掘所得到的实体路径。
可以理解的,所述路径筛选处理可以是:每轮筛选处理(可以是一轮筛选处理)所纳入的至少两个节点路径类型为参考,衡量每轮“至少两个所述节点路径类型”彼此之间的匹配程度,在每轮路径筛选处理过程中由于参考实体路径为多条,通常会分别计算多组的“至少两个所述节点路径类型”的匹配程度参数,将该匹配程度参数与其对应的参考实体路径进行关联,然后匹配程度高的参考实体路径进行保留,去除匹配程度不高的参考实体路径。在一些实施方式中,可以设置匹配程度阈值,将大于匹配程度阈值的参考实体路径进行保留。
在一种可行的实施方式中,每组的“至少两个所述节点路径类型”的匹配程度参数通过基于知识图谱对节点路径类型进行图嵌入处理,得到节点路径类型对应的图嵌入(embedding),然后基于至少两个节点路径类型的图嵌入计算组内“至少两个节点路径类型”的匹配程度,也即通过计算至少两个图嵌入彼此间的匹配程度。
所述图嵌入通常以特征向量、特征矩阵等形式进行表征。
进一步的,可以采用图嵌入模型基于知识图谱确定相应节点路径类型的图嵌入。所述图嵌入模型可以是基于图嵌入算法所构建的模型,如图嵌入模型可以是TransE模型、神经网络模型等等。
在本说明书一个或多个实施例中,可以采用逐批遍历从头实体出发的至少两个路径节点对应的节点路径类型,基于“至少两个节点路径类型”对所述知识图谱中的参考实体路径进行路径筛选处理,例如,以每两个路径节点为参考逐条对参考实体路径进行筛选,满足纳入参考的参考实体路径保留,不满足纳入参考的参考实体路径滤除。路径筛选直至到尾实体结束,这样剩余的所有参考实体路径即为目标实体路径。
可选的,在实际路径筛选过程中,可能出现每条参考实体路径的长度不一样的情况,例如某些参考实体路径的节点数为3,某些参考实体路径的节点数为4、某些参考实体路径的节点数为5....,
在实际路径筛选过程中,每一轮筛选处理纳入参考的路径节点假设为x个。
第1轮路径筛选:获取所有参考实体路径中第1个实体节点-第x个路径节点纳入参考,获取第1个实体节点-第x个路径节点分别对应的x个实体路径类型,然后基于当前x个实体路径类型进行参考实体路径的筛选,满足纳入参考的参考实体路径保留,不满足纳入参考的参考实体路径滤除。
第2轮路径筛选:获取所有参考实体路径中第x个实体节点-第2x个路径节点纳入参考,获取第x个实体节点-第2x个路径节点分别对应的x个实体路径类型,然后基于当前x个实体路径类型进行参考实体路径的筛选,满足纳入参考的参考实体路径保留,不满足纳入参考的参考实体路径滤除。
....
第i轮路径筛选:获取所有参考实体路径中第(i-1)*x个实体节点-第i*x个路径节点纳入参考,获取第(i-1)*x个实体节点-第i*x个路径节点分别对应的x个实体路径类型,然后基于当前x个实体路径类型进行参考实体路径的筛选,满足纳入参考的参考实体路径保留,不满足纳入参考的参考实体路径滤除。
可选的,在第i轮路径筛选过程中,若第(i-1)*x个实体节点-第i*x个路径节点中存在尾实体,则将存在尾实体的参考实体路径可确定为目标实体路径;将第(i-1)*x个实体节点-第i*x个路径节点中不存在尾实体的参考实体路径纳入筛选。
可以理解的,采用前述方式,可以深度挖掘实体路径,避免丢失有较高参考价值的长路径(也即节点数较长的路径),同时基于实体路径类型而不是单个实体节点来进行筛选可以兼顾筛选效率。
在本说明书一个或多个实施例中,通过获取目标事务对应的知识图谱,基于所述目标事务的头实体和尾实体从所述知识图谱中确定参考实体路径上至少两个路径节点对应的节点路径类型,然后通过至少两个所述节点路径类型对所述知识图谱进行路径筛选处理,就可以得到至少一条目标实体路径。通过基于节点路径类型的路处理方式可以在路径挖掘筛选中为目标实体路径确定提供指引,大幅减少了路径处理的计算量以及路径搜索复杂度;以及整个路径处理过程具有参考价值的长路径不会丢失,提升了高目标实体路径的可用性。
请参见图3,图3是本说明书一个或多个实施例提出的一种路径处理方法的另一种实施例的流程示意图。具体的:
S202:获取目标事务对应的知识图谱,确定针对所述目标事务的头实体和尾实体;
具体可参考本说明书其他实施例的方法步骤,此处不再赘述。
S204:基于所述头实体和尾实体从所述知识图谱中确定参考实体路径上的至少一个第一路径节点;
S206:在所述知识图谱中获取与所述第一路径节点链接的至少一个第二路径节点;所述第一路径节点与所述第二路径节点构成一组相链接的两个路径节点。
所述第一路径节点的数量与参考实体路径的路径数量相对应。也就是说从每条参考实体路径中确定一个第一路径节点,以及与第一路径节点链接的第二路径节点,此时第一路径节点与所述第二路径节点构成一组相链接的两个路径节点。
可以理解的,所述第一路径节点的选取可以是参考实体路径上的任一路径节点,如第一路径节点可以是头实体所处的节点。而第二路径节点可以是第一路径节点的下一相链接的路径节点。
可选的,若涉及到多轮路径筛选,则第一路径节点在每一轮路径筛选中确定一个。例如,第一轮路径筛选确定第一路径节点为头实体,头实体之后的且相链接的路径节点(也即第二个节点)为第二路径节点;第二轮路径筛选确定第二个节点为第一路径节点,与第二个节点相链接的第三个节点为第二路径节点,等等。
S208:获取至少一组第一路径节点和第二路径节点分别对应的节点路径类型;
根据一些实施例中,所述节点路径类型可以理解为针对知识图谱中的节点所划分的节点类型,例如可以基于节点的节点属性信息来划分节点路径类型。
在一种可行的实施方式中,可以预先针对目标事务的知识图谱,获取知识图谱中的每一实体节点,对所有的实体节点划分实体路径类型;
可选的,可以基于知识图谱中所有实体节点的属性信息从语义信息维度对实体节点来划分实体路径类型;
可选的,可以基于知识图谱中所有实体节点的事务功能属性从事务功能维度对实体节点来划分实体路径类型,事务功能属性也即该实体节点在目标事务中所关联的事务功能,也即从具体事务服务中对实体节点进行实体路径类型划分;
可选的,可以采用特征工程方式对实体节点提取节点实体特征进行特征向量化,通过特征工程方式将若干实体节点映射到向量特征空间中,然后对这些实体节点对应的实体特征向量进行特征聚类处理,可以得到若干聚类中心,根据每个聚类中心可以确定一个聚类主题,聚类主题也即实体路径类型。
根据一些实施例中,为了提升路径挖掘的可参考性以及准确性,在对知识图谱中的实体节点划分实体路径类型的过程,可以从实体节点自身以及实体节点所关联的关系这两个维度综合划分实体路径类型,实体节点所关联的关系在知识图谱中也即该实体节点的有向边,实体节点的关系可更深度反馈节点结构,基于此将实体节点的关系也即知识图谱中节点的有向边纳入参考,可极大的提升路径的可参考性以及准确性。
可选的,可以采用特征工程方式对实体节点提取节点实体特征以及对实体节点的有向边提取节点关系特征,然后针对实体节点对节点实体特征和节点关系特征进行特征向量化以及向量融合处理,通过特征工程方式将若干实体节点映射到向量特征空间中,在向量特征空间中,这些实体节点会对应一个实体特征向量,然后对这些实体特征向量进行特征聚类处理,可以得到若干聚类中心,根据每个聚类中心可以确定一个聚类主题,聚类主题也即实体路径类型。
以此进行划分的实体路径类型实现了对路径挖掘流程的优化,通过实体路径类型可更深层次挖掘实体节点的结构化特性,进而在后续路径挖掘环节可大幅提升路径的可参考性以及准确性。
可选的,在确定知识图谱中若干实体节点的实体路径类型之后,可进行保存。在实际应用阶段,即可获取到至少一组第一路径节点和第二路径节点分别对应的节点路径类型
S210:从所述知识图谱中确定至少两个所述节点路径类型分别对应的第一图嵌入和第二图嵌入;
在一些实施例中,第一图嵌入为第一节点路径节点的节点路径类型所对应的图嵌入;第二图嵌入为第二节点路径节点的节点路径类型所对应的图嵌入。
可以理解的,图嵌入通常以特征向量、特征矩阵等形式进行表征,如第一图嵌入为第一图嵌入向量、第二图嵌入为第二图嵌入向量。
进一步的,可以采用图嵌入模型基于知识图谱确定相应节点路径类型的图嵌入。所述图嵌入模型可以是基于图嵌入算法所构建的模型,如图嵌入模型可以是TransE模型、神经网络模型等等。
在一种可行的实施方式中,通过图嵌入模型对知识图谱中某一节点路径类型下的若干同类实体节点进行图嵌入处理,以得到该节点路径类型的图嵌入。
示意性的,通过将知识图谱和节点路径类型输入至图嵌入模型,通过图嵌入模型自动遍历知识图谱中所述节点路径类型下所有的同类实体节点,并从图嵌入图中提取若干同类实体节点的嵌入特征向量(在一些实施例中也可称为实体图嵌入),然后对这些同类实体节点的嵌入特征向量进行特征融合处理,可以得到融合后的融合嵌入特征向量,将该融合嵌入特征向量作为节点路径类型所对应的图嵌入。具体实施中,可将知识图谱以及节点路径类型作为图嵌入模型的输入,图嵌入模型可输出针对该节点路径类型的图嵌入。基于此,可分别确定前述两个节点路径类型所对应的第一图嵌入以及第二图嵌入。
可选的,对这些同类实体节点的嵌入特征向量进行特征融合处理可以是,所有同类实体节点的嵌入特征向量进行向量嵌入平均处理,得到处理后的嵌入特征向量;可以是对所有同类实体节点的嵌入特征向量进行向量拼接,得到处理后的嵌入特征向量,等等。
在一种可行的实施方式中,可以预先在确定知识图谱的实体路径类型时,基于图嵌入模型提取每个实体路径类型下的同类实体节点的节点图嵌入向量(也即前述嵌入特征向量),然后对所有同类实体节点的图嵌入向量进行(特征)融合处理,可以得到融合后的嵌入特征向量,将该嵌入特征向量作为节点路径类型所对应的图嵌入;可选的,可以在知识图谱中将所有实体节点与该实体节点所对应的节点路径类型的图嵌入进行关联,这样在实际应用阶段可以直接基于知识图谱来获取到前述两个节点路径类型所对应的第一图嵌入以及第二图嵌入。
S212:基于所述第一图嵌入和第二图嵌入确定路径类型权重,基于所述路径类型权重对所述知识图谱进行路径筛选处理,得到至少一条目标实体路径。
可以理解的,所述路径筛选处理可以是:每轮筛选处理(可以是一轮筛选处理)所纳入的至少两个节点路径类型为参考,衡量“至少两个所述节点路径类型”彼此之间的匹配程度,在路径筛选处理过程中由于参考实体路径为多条,通常会分别计算多组的“至少两个所述节点路径类型”的匹配程度参数,可以理解的本说明书一个或多个实施例中的匹配程度参数可以是计算第一图嵌入和第二图嵌入的路径类型权重,将该路径类型权重与其对应的参考实体路径进行关联,也即将路径类型权重作为所述路径节点对应的参考实体路径对应的路径权重值,然后权重程度高的参考实体路径进行保留,去除权重程度不高的参考实体路径。前述过程也可视作对参考实体路径的排序滤除处理。
在一些实施方式中,可以设置权重阈值,将大于权重阈值的参考实体路径进行保留。
在一些实施方式中,可以设置目标数量,基于路径类型权重对每条参考实体路径进行优先级排序,以此基于优先级大小获取目标数量指示的至少一条目标实体路径。如参考实体路径为n条,目标数量为k,则从n条参考实体路径中筛选出k条目标实体路径。
在一种可行的实施方式中,服务平台基于所述第一图嵌入和第二图嵌入确定路径类型权重,具体可以是计算所述第一图嵌入与所述第二图嵌入之间的向量嵌入距离,将所述向量嵌入距离作为路径类型权重。
可选的,所述向量嵌入距离可以是基于欧氏距离计算方式、余弦距离计算方式和汉明距离计算方式等方式中的一种或多种的拟合。
以采用余弦距离计算方式计算向量嵌入距离为例,可基于如下公式计算得到:
w(Ei,Ej)=cosine(Ei,Ej)
其中,w(Ei,Ej)表示向量嵌入距离,Ei表示第一图嵌入,Ej表示第二图嵌入。
具体的,将第一图嵌入和第二图嵌入输入至上述式子中可得到向量嵌入距离。
在本说明书一个或多个实施例中,通过获取目标事务对应的知识图谱,基于所述目标事务的头实体和尾实体从所述知识图谱中确定参考实体路径上至少两个路径节点对应的节点路径类型,然后通过至少两个所述节点路径类型对所述知识图谱进行路径筛选处理,就可以得到至少一条目标实体路径。通过基于节点路径类型的路处理方式可以在路径挖掘筛选中为目标实体路径确定提供指引,大幅减少了路径处理的计算量以及路径搜索复杂度;以及整个路径处理过程具有参考价值的长路径不会丢失,提升了高目标实体路径的可用性;以及基于节点路径类型的图嵌入进行路径筛选,可使得路径处理快速进行,极大了降低了对逐个节点进行分析处理的复杂程度,提升了路径搜索效率。
请参见图4,图4是本说明书一个或多个实施例提出的一种路径处理方法的另一种实施例的流程示意图。具体的:
S302:获取目标事务对应的知识图谱,从所述知识图谱中确定至少一个参考节点路径类型,获取所述知识图谱中所述参考节点路径类型对应的至少一个参考实体节点;
根据一些实施例中,可以预先针对目标事务的知识图谱,获取知识图谱中的每一实体节点,对所有的实体节点划分若干参考实体路径类型;
示意性的,可以采用特征工程方式对实体节点提取节点实体特征进行特征向量化,通过特征工程方式将若干实体节点映射到向量特征空间中,然后对这些实体节点对应的实体特征向量进行特征聚类处理,可以得到若干聚类中心,根据每个聚类中心可以确定一个聚类主题,聚类主题也即参考实体路径类型。
示意性的,可以采用特征工程方式对实体节点提取节点实体特征以及对实体节点的有向边提取节点关系特征,然后针对实体节点对节点实体特征和节点关系特征进行特征向量化以及向量融合处理,通过特征工程方式将若干实体节点映射到向量特征空间中,在向量特征空间中,这些实体节点会对应一个实体特征向量,然后对这些实体特征向量进行特征聚类处理,可以得到若干聚类中心,根据每个聚类中心可以确定一个聚类主题,聚类主题也即参考实体路径类型。
以此进行划分的参考实体路径类型实现了对路径挖掘流程的优化,通过实体路径类型可更深层次挖掘实体节点的结构化特性,进而在后续路径挖掘环节可大幅提升路径的可参考性以及准确性。
可选的,在确定知识图谱的若干参考节点路径类型之后,可将知识图谱中参考节点路径类型与其参考节点路径类型下所有的实体节点进行关联,以结构化信息的形式在知识图谱中对相应实体节点进行节点信息更新,这样更新后的知识图谱可反馈任一实体节点的参考节点路径类型。
S304:确定所述参考实体节点对应的实体图嵌入,基于至少一个所述实体图嵌入确定所述参考节点路径类型对应的参考图嵌入;
所述实体图嵌入也即参考实体节点对应的图嵌入(embedding),所述实体图嵌入通常以实体特征向量、实体特征矩阵等形式进行表征。
在本说明书一个或多个实施例中,可基于相关图嵌入技术构建图嵌入模型,以知识图谱作为图嵌入模型的输入,图嵌入模型可基于知识图谱进行图嵌入处理,提取各个参考实体节点的实体图嵌入。
进一步的,由于参考节点路径类型下的若干实体节点已经预先确定,服务平台可以对每个参考节点路径类型下的若干同类实体节点进行分组,对每组同类实体节点对应的实体图嵌入进行融合处理,具体实施中,这些实体图嵌入可以是嵌入特征向量,对这些同类实体节点的嵌入特征向量进行特征融合处理,可以得到融合后的融合嵌入特征向量,将该融合嵌入特征向量作为参考节点路径类型所对应的参考图嵌入。
可选的,所述图嵌入模型可以是基于图嵌入算法所构建的模型,如图嵌入模型可以是TransE模型、神经网络模型等等。
可以理解的,服务平台执行所述基于至少一个所述实体图嵌入确定所述参考节点路径类型对应的参考图嵌入,可以是:通过对至少一个实体图嵌入进行向量嵌入平均处理,得到所述参考节点路径类型对应的参考图嵌入。
可以理解的,服务平台执行所述基于至少一个所述实体图嵌入确定所述参考节点路径类型对应的参考图嵌入,可以是:可以是对所有同类实体节点的嵌入特征向量进行向量拼接,得到处理后的嵌入特征向量,
S306:确定针对所述目标事务的头实体和尾实体;
S308:基于所述头实体和尾实体从所述知识图谱中确定参考实体路径上至少两个路径节点对应的节点路径类型;
S310:基于至少两个所述节点路径类型对所述知识图谱进行路径筛选处理,得到至少一条目标实体路径。
可选的,服务平台通常可以首先从所述知识图谱中确定由头实体至尾实体的若干第一参考实体路径,然后确定各第一参考实体路径上至少两个路径节点对应的节点路径类型;再基于至少两个所述节点路径类型对所述知识图谱进行路径筛选处理(通常是对第一参考实体路径进行筛选),得到至少一条目标实体路径。可以理解的此时是先确定全部的第一参考实体路径,然后再进行路径筛选。
可选的,服务平台通常可以是:
1、服务平台通常首先从所述知识图谱中将头实体作为第一路径节点,获取与第一路径节点相链接的至少一个第二路径节点且所述第二路径结点值所述尾实体存在可达路径,第一路径节点与第二路径结点组成为第二参考实体路径;
2、确定所述第一路径节点对应的第一节点路径类型和所述第二路径节点对应的第二节点路径类型,确定所述第一节点路径类型对应的第一图嵌入以及所述第二节点路径类型对应的第二图嵌入;
3、基于所述第一图嵌入和第二图嵌入确定路径类型权重;
4、基于所述路径类型权重对所述至少一个第二路径节点进行排序滤除处理,得到至少一个参考路径节点,获取与所述参考路径节点链接的至少一个第二路径节点;
示意性的,如图5所示,图5是一种路径挖掘的场景示意图,服务平台根据针对所述目标事务的头实体和尾实体,在知识图谱中确定头实体h和尾实体t,从头实体h至尾实体t存在若干可达路径,服务平台首先将头实体h作为当前的第一路径节点,然后获取第一路径节点相链接的若干第二路径节点,如图5所示,与头实体h相链接的第二路径节点有n个,相当于当前存在从头实体出发的n条第二参考实体路径,然后计算路径类型权重,基于所述路径类型权重对所述n个第二路径节点进行排序滤除处理,得到k个参考路径节点,相当于当前一轮保留了k条。
5、若所述第二路径节点不为所述尾实体,则将所述参考路径节点作为所述第一路径节点执行所述获取所述第一路径节点与相链接的至少一个第二路径节点的所述路径类型权重的步骤;
6、若所述第二路径节点为所述尾实体,则将由所述头实体至所述第二路径节点的第二参考实体路径作为目标实体路径。
可以理解的此时是逐批路径结点进行筛选路径,最后筛选完成即得到目标实体路径。
在本说明书一个或多个实施例中,通过获取目标事务对应的知识图谱,基于所述目标事务的头实体和尾实体从所述知识图谱中确定参考实体路径上至少两个路径节点对应的节点路径类型,然后通过至少两个所述节点路径类型对所述知识图谱进行路径筛选处理,就可以得到至少一条目标实体路径。通过基于节点路径类型的路处理方式可以在路径挖掘筛选中为目标实体路径确定提供指引,大幅减少了路径处理的计算量以及路径搜索复杂度;以及整个路径处理过程具有参考价值的长路径不会丢失,提升了高目标实体路径的可用性;以及基于节点路径类型的图嵌入进行路径筛选,可使得路径处理快速进行,极大了降低了对逐个节点进行分析处理的复杂程度,提升了路径搜索效率。
下面将结合图6,对本说明书提供的路径处理装置进行详细介绍。需要说明的是,图6所示的路径处理装置,用于执行本申请图1~图5所示实施例的方法,为了便于说明,仅示出了与本说明书相关的部分,具体技术细节未揭示的,请参照本申请图1~图5所示的实施例。
请参见图6,其示出本说明书的路径处理装置的结构示意图。该路径处理装置1可以通过软件、硬件或者两者的结合实现成为用户终端的全部或一部分。根据一些实施例,该路径处理装置1包括路径处理模块11、路径处理模块12和路径处理模块13,具体用于:
实体确定模块11,用于获取目标事务对应的知识图谱,确定针对所述目标事务的头实体和尾实体;
类型确定模块12,用于基于所述头实体和尾实体从所述知识图谱中确定参考实体路径上至少两个路径节点对应的节点路径类型;
路径筛选模块13,用于基于至少两个所述节点路径类型对所述知识图谱进行路径筛选处理,得到至少一条目标实体路径。
可选的,如图7所示,所述类型确定模块12,包括:
节点确定单元121,用于基于所述头实体和尾实体从所述知识图谱中确定参考实体路径上的至少一组相链接的两个路径节点;
类型确定单元122,用于获取至少一组所述两个路径节点分别对应的节点路径类型。
可选的,如图8所示,所述节点确定单元121,包括:
第一节点确定子单元1211,用于基于所述头实体和尾实体从所述知识图谱中确定参考实体路径上的至少一个第一路径节点;
第二节点确定子单元1211,用于在所述知识图谱中获取与所述第一路径节点链接的至少一个第二路径节点;所述第一路径节点与所述第二路径节点构成一组相链接的两个路径节点。
可选的,如图9所示,路径筛选模块13,包括:
嵌入确定单元131,用于从所述知识图谱中确定至少两个所述节点路径类型分别对应的第一图嵌入和第二图嵌入;
路径筛选单元132,用于基于所述第一图嵌入和第二图嵌入确定路径类型权重,基于所述路径类型权重对所述知识图谱进行路径筛选处理,得到至少一条目标实体路径。
可选的,所述路径筛选单元132,具体用于:
计算所述第一图嵌入与所述第二图嵌入之间的向量嵌入距离,将所述向量嵌入距离作为路径类型权重。
可选的,所述装置1,还用于:
从所述知识图谱中确定至少一个参考节点路径类型,获取所述知识图谱中所述参考节点路径类型对应的至少一个参考实体节点;
确定所述参考实体节点对应的实体图嵌入,基于至少一个所述实体图嵌入确定所述参考节点路径类型对应的参考图嵌入;
所述嵌入确定单元131,具体用于:
基于所有所述参考节点路径类型对应的参考图嵌入,获取至少两个所述节点路径类型分别对应的第一图嵌入和第二图嵌入。
可选的,所述装置1,还用于:
对至少一个所述实体图嵌入进行向量嵌入平均处理,得到所述参考节点路径类型对应的参考图嵌入。
可选的,所述路径筛选单元132,用于:
基于所述路径类型权重对各所述参考实体路径进行排序滤除处理,得到至少一条目标实体路径。
可选的,所述路径筛选单元132,用于:
将所述路径类型权重作为所述参考实体路径对应的路径权重值;
基于所述路径权重值对各所述参考实体路径进行排序滤除处理,得到至少一条目标实体路径。
可选的,所述路径筛选单元132,用于:
基于所述路径类型权重确定各所述参考实体路径的路径优先级,基于所述参考实体路径的路径优先级,选取目标数量指示的目标实体路径。
需要说明的是,上述实施例提供的路径处理装置在执行路径处理方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的路径处理装置与路径处理方法实施例属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
上述本说明书序号仅仅为了描述,不代表实施例的优劣。
在本说明书一个或多个实施例中,通过获取目标事务对应的知识图谱,基于所述目标事务的头实体和尾实体从所述知识图谱中确定参考实体路径上至少两个路径节点对应的节点路径类型,然后通过至少两个所述节点路径类型对所述知识图谱进行路径筛选处理,就可以得到至少一条目标实体路径。通过基于节点路径类型的路处理方式可以在路径挖掘筛选中为目标实体路径确定提供指引,大幅减少了路径处理的计算量以及路径搜索复杂度;以及整个路径处理过程具有参考价值的长路径不会丢失,提升了高目标实体路径的可用性;以及基于节点路径类型的图嵌入进行路径筛选,可使得路径处理快速进行,极大了降低了对逐个节点进行分析处理的复杂程度,提升了路径搜索效率。
本说明书还提供了一种计算机存储介质,所述计算机存储介质可以存储有多条指令,所述指令适于由处理器加载并执行如上述图1~图5所示实施例的所述路径处理方法,具体执行过程可以参见图1~图5所示实施例的具体说明,在此不进行赘述。
本申请还提供了一种计算机程序产品,该计算机程序产品存储有至少一条指令,所述至少一条指令由所述处理器加载并执行如上述图1~图5所示实施例的所述路径处理方法,具体执行过程可以参见图1~图5所示实施例的具体说明,在此不进行赘述。
请参见图10,为本申请实施例提供了另一种电子设备的结构示意图。如图10所示,所述电子设备2000可以包括:至少一个处理器2001,至少一个网络接口2004,用户接口2003,存储器2005,至少一个通信总线2002。
其中,通信总线2002用于实现这些组件之间的连接通信。
其中,用户接口2003可以包括显示屏(Display),可选用户接口2003还可以包括标准的有线接口、无线接口。
其中,网络接口2004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
其中,处理器2001可以包括一个或者多个处理核心。处理器2001利用各种借口和线路连接整个服务器2000内的各个部分,通过运行或执行存储在存储器2005内的指令、程序、代码集或指令集,以及调用存储在存储器2005内的数据,执行服务器2000的各种功能和处理数据。可选的,处理器2001可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable Logic Array,PLA)中的至少一种硬件形式来实现。处理器2001可集成中心处理器(Central Processing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器2001中,单独通过一块芯片进行实现。
其中,存储器2005可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。可选的,该存储器2005包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器2005可用于存储指令、程序、代码、代码集或指令集。存储器2005可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器2005可选的还可以是至少一个位于远离前述处理器2001的存储装置。如图10所示,作为一种计算机存储介质的存储器2005中可以包括操作系统、网络通信模块、用户接口模块以及应用程序。
在图10所示的电子设备2000中,电子设备2000可以是一种服务平台,用户接口2003主要用于为用户提供输入的接口,获取用户输入的数据;而处理器2001可以用于调用存储器2005中存储的应用程序,并具体执行以下操作:
获取目标事务对应的知识图谱,确定针对所述目标事务的头实体和尾实体;
基于所述头实体和尾实体从所述知识图谱中确定参考实体路径上至少两个路径节点对应的节点路径类型;
基于至少两个所述节点路径类型对所述知识图谱进行路径筛选处理,得到至少一条目标实体路径。
在一个实施例中,所述处理器1001在执行所述基于所述头实体和尾实体从所述知识图谱中确定参考实体路径上至少两个路径节点对应的节点路径类型时,具体执行以下操作:
基于所述头实体和尾实体从所述知识图谱中确定参考实体路径上的至少一组相链接的两个路径节点;
获取至少一组所述两个路径节点分别对应的节点路径类型。
在一个实施例中,所述处理器1001在执行基于所述头实体和尾实体从所述知识图谱中确定参考实体路径上的至少一组相链接的两个路径节点时,具体执行以下操作:
基于所述头实体和尾实体从所述知识图谱中确定参考实体路径上的至少一个第一路径节点;
在所述知识图谱中获取与所述第一路径节点链接的至少一个第二路径节点;所述第一路径节点与所述第二路径节点构成一组相链接的两个路径节点。
在一个实施例中,所述处理器1001在执行所述基于至少两个所述节点路径类型对所述知识图谱进行路径筛选处理,得到至少一条目标实体路径时,具体执行以下步骤:
从所述知识图谱中确定至少两个所述节点路径类型分别对应的第一图嵌入和第二图嵌入;
基于所述第一图嵌入和第二图嵌入确定路径类型权重,基于所述路径类型权重对所述知识图谱进行路径筛选处理,得到至少一条目标实体路径。
在一个实施例中,所述处理器1001在执行所述基于所述第一图嵌入和第二图嵌入确定路径类型权重时,具体执行以下步骤:
计算所述第一图嵌入与所述第二图嵌入之间的向量嵌入距离,将所述向量嵌入距离作为路径类型权重。
在一个实施例中,所述处理器1001在执行所述路径处理方法还执行以下步骤:
从所述知识图谱中确定至少一个参考节点路径类型,获取所述知识图谱中所述参考节点路径类型对应的至少一个参考实体节点;
确定所述参考实体节点对应的实体图嵌入,基于至少一个所述实体图嵌入确定所述参考节点路径类型对应的参考图嵌入;
所述从所述知识图谱中确定至少两个所述节点路径类型分别对应的第一图嵌入和第二图嵌入时,具体执行以下步骤:
基于所有所述参考节点路径类型对应的参考图嵌入,获取至少两个所述节点路径类型分别对应的第一图嵌入和第二图嵌入。
在一个实施例中,所述处理器1001在执行所述基于至少一个所述实体图嵌入确定所述参考节点路径类型对应的参考图嵌入时,具体执行以下步骤:
对至少一个所述实体图嵌入进行向量嵌入平均处理,得到所述参考节点路径类型对应的参考图嵌入。
在一个实施例中,所述处理器1001在执行所述基于所述路径类型权重对所述知识图谱进行路径筛选处理,得到至少一条目标实体路径时,具体执行以下步骤:
基于所述路径类型权重对各所述参考实体路径进行排序滤除处理,得到至少一条目标实体路径。
在一个实施例中,所述处理器1001在执行所述基于所述路径类型权重对各所述参考实体路径进行排序处理,得到至少一条目标实体路径时,具体执行以下步骤:
将所述路径类型权重作为所述参考实体路径对应的路径权重值;
基于所述路径权重值对各所述参考实体路径进行排序滤除处理,得到至少一条目标实体路径。
在一个实施例中,所述处理器1001在执行所述基于所述路径权重值对各所述参考实体路径进行排序滤除处理,得到至少一条目标实体路径时,具体执行以下步骤:
基于所述路径类型权重确定各所述参考实体路径的路径优先级,基于所述参考实体路径的路径优先级,选取目标数量指示的目标实体路径。
在本说明书一个或多个实施例中,通过获取目标事务对应的知识图谱,基于所述目标事务的头实体和尾实体从所述知识图谱中确定参考实体路径上至少两个路径节点对应的节点路径类型,然后通过至少两个所述节点路径类型对所述知识图谱进行路径筛选处理,就可以得到至少一条目标实体路径。通过基于节点路径类型的路处理方式可以在路径挖掘筛选中为目标实体路径确定提供指引,大幅减少了路径处理的计算量以及路径搜索复杂度;以及整个路径处理过程具有参考价值的长路径不会丢失,提升了高目标实体路径的可用性;以及基于节点路径类型的图嵌入进行路径筛选,可使得路径处理快速进行,极大了降低了对逐个节点进行分析处理的复杂程度,提升了路径搜索效率。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体或随机存储记忆体等。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。

Claims (14)

1.一种路径处理方法,所述方法包括:
获取目标事务对应的知识图谱,确定针对所述目标事务的头实体和尾实体;
基于所述头实体和尾实体从所述知识图谱中确定参考实体路径上至少两个路径节点对应的节点路径类型;
基于至少两个所述节点路径类型对所述知识图谱进行路径筛选处理,得到至少一条目标实体路径。
2.根据权利要求1所述的方法,所述基于所述头实体和尾实体从所述知识图谱中确定参考实体路径上至少两个路径节点对应的节点路径类型,包括:
基于所述头实体和尾实体从所述知识图谱中确定参考实体路径上的至少一组相链接的两个路径节点;
获取至少一组所述两个路径节点分别对应的节点路径类型。
3.根据权利要求2所述的方法,所述基于所述头实体和尾实体从所述知识图谱中确定参考实体路径上的至少一组相链接的两个路径节点,包括:
基于所述头实体和尾实体从所述知识图谱中确定参考实体路径上的至少一个第一路径节点;
在所述知识图谱中获取与所述第一路径节点链接的至少一个第二路径节点;所述第一路径节点与所述第二路径节点构成一组相链接的两个路径节点。
4.根据权利要求1所述的方法,所述基于至少两个所述节点路径类型对所述知识图谱进行路径筛选处理,得到至少一条目标实体路径,包括:
从所述知识图谱中确定至少两个所述节点路径类型分别对应的第一图嵌入和第二图嵌入;
基于所述第一图嵌入和第二图嵌入确定路径类型权重,基于所述路径类型权重对所述知识图谱进行路径筛选处理,得到至少一条目标实体路径。
5.根据权利要求4所述的方法,所述基于所述第一图嵌入和第二图嵌入确定路径类型权重,包括:
计算所述第一图嵌入与所述第二图嵌入之间的向量嵌入距离,将所述向量嵌入距离作为路径类型权重。
6.根据权利要求4所述的方法,所述方法还包括:
从所述知识图谱中确定至少一个参考节点路径类型,获取所述知识图谱中所述参考节点路径类型对应的至少一个参考实体节点;
确定所述参考实体节点对应的实体图嵌入,基于至少一个所述实体图嵌入确定所述参考节点路径类型对应的参考图嵌入;
所述从所述知识图谱中确定至少两个所述节点路径类型分别对应的第一图嵌入和第二图嵌入,包括:
基于所有所述参考节点路径类型对应的参考图嵌入,获取至少两个所述节点路径类型分别对应的第一图嵌入和第二图嵌入。
7.根据权利要求6所述的方法,所述基于至少一个所述实体图嵌入确定所述参考节点路径类型对应的参考图嵌入,包括:
对至少一个所述实体图嵌入进行向量嵌入平均处理,得到所述参考节点路径类型对应的参考图嵌入。
8.根据权利要求4所述的方法,所述基于所述路径类型权重对所述知识图谱进行路径筛选处理,得到至少一条目标实体路径,包括:
基于所述路径类型权重对各所述参考实体路径进行排序滤除处理,得到至少一条目标实体路径。
9.根据权利要求8所述的方法,所述基于所述路径类型权重对各所述参考实体路径进行排序处理,得到至少一条目标实体路径,包括:
将所述路径类型权重作为所述参考实体路径对应的路径权重值;
基于所述路径权重值对各所述参考实体路径进行排序滤除处理,得到至少一条目标实体路径。
10.根据权利要求9所述的方法,所述基于所述路径权重值对各所述参考实体路径进行排序滤除处理,得到至少一条目标实体路径,包括:
基于所述路径类型权重确定各所述参考实体路径的路径优先级,基于所述参考实体路径的路径优先级,选取目标数量指示的目标实体路径。
11.一种路径处理装置,所述装置包括:
实体确定模块,用于获取目标事务对应的知识图谱,确定针对所述目标事务的头实体和尾实体;
类型确定模块,用于基于所述头实体和尾实体从所述知识图谱中确定参考实体路径上至少两个路径节点对应的节点路径类型;
路径筛选模块,用于基于至少两个所述节点路径类型对所述知识图谱进行路径筛选处理,得到至少一条目标实体路径。
12.一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如权利要求1~10任意一项的方法步骤。
13.一种计算机程序产品,该计算机程序产品存储有至少一条指令,所述至少一条指令由所述处理器加载并执行如权利要求1~10任意一项的方法步骤。
14.一种电子设备,包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行如权利要求1~10任意一项的方法步骤。
CN202210552096.7A 2022-05-20 2022-05-20 一种路径处理方法、装置、存储介质及电子设备 Pending CN115048529A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210552096.7A CN115048529A (zh) 2022-05-20 2022-05-20 一种路径处理方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210552096.7A CN115048529A (zh) 2022-05-20 2022-05-20 一种路径处理方法、装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN115048529A true CN115048529A (zh) 2022-09-13

Family

ID=83159734

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210552096.7A Pending CN115048529A (zh) 2022-05-20 2022-05-20 一种路径处理方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN115048529A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116760717A (zh) * 2023-08-21 2023-09-15 中信证券股份有限公司 通讯路径查询方法、装置、电子设备和计算机可读介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116760717A (zh) * 2023-08-21 2023-09-15 中信证券股份有限公司 通讯路径查询方法、装置、电子设备和计算机可读介质
CN116760717B (zh) * 2023-08-21 2023-10-27 中信证券股份有限公司 通讯路径查询方法、装置、电子设备和计算机可读介质

Similar Documents

Publication Publication Date Title
CN112543176A (zh) 一种异常网络访问检测方法、装置、存储介质及终端
CN106991617B (zh) 一种基于信息传播的微博社交关系提取算法
CN111860864A (zh) 纵向联邦建模优化方法、设备及可读存储介质
CN114039858B (zh) 一种算网资源融合方法、装置、设备及存储介质
CN109582289B (zh) 规则引擎中规则流的处理方法、系统、存储介质和处理器
CN105300398B (zh) 获取地点信息的方法、装置和系统
CN112214677B (zh) 一种兴趣点推荐方法、装置、电子设备及存储介质
CN111813910A (zh) 客服问题的更新方法、系统、终端设备及计算机存储介质
US20220385739A1 (en) Method and apparatus for generating prediction information, electronic device, and computer readable medium
CN110633843A (zh) 园区巡检方法、装置、设备及存储介质
CN111159577B (zh) 一种社群划分方法、装置、存储介质及电子装置
CN115048529A (zh) 一种路径处理方法、装置、存储介质及电子设备
CN115471307A (zh) 基于知识图谱的审计评估信息生成方法、装置和电子设备
CN112507265B (zh) 基于树结构进行异常侦测的方法、装置及相关产品
CN109598344A (zh) 模型生成方法和装置
CN117150130A (zh) 一种内容生成方法、装置、存储介质及电子设备
CN111191065A (zh) 一种同源图像确定方法及装置
CN113607183B (zh) 一种车辆的运输路线规划方法、装置、存储介质及终端
CN115695280A (zh) 基于边缘节点的路由方法及装置、电子设备、存储介质
CN113783795B (zh) 加密流量分类方法及相关设备
CN115221537A (zh) 一种模型处理方法、装置、存储介质及电子设备
CN114900435A (zh) 一种连接关系预测方法及相关设备
CN112036418A (zh) 用于提取用户特征的方法和装置
CN114393583B (zh) 通过机器人控制设备的方法及装置
CN113608859B (zh) 节点任务的执行方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination