CN112579797A - 针对知识图谱的业务处理方法及装置 - Google Patents
针对知识图谱的业务处理方法及装置 Download PDFInfo
- Publication number
- CN112579797A CN112579797A CN202110191517.3A CN202110191517A CN112579797A CN 112579797 A CN112579797 A CN 112579797A CN 202110191517 A CN202110191517 A CN 202110191517A CN 112579797 A CN112579797 A CN 112579797A
- Authority
- CN
- China
- Prior art keywords
- graph
- service
- node
- knowledge
- path
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书实施例提供一种针对知识图谱的业务处理方法及装置,通过对用于描述业务处理逻辑的业务描述信息进行解析,得到基准图、基准图中的业务节点对应的基准业务结果,其中,基准图包括多个基准节点和至少一个基准连接边,以及描述基准节点和/或基准连接边的约束条件,然后基于约束条件,遍历基准图中的各个基准连接边,从而确定各个基准节点之间经由各个基准连接边的至少一条基准路径,接着,根据至少一条基准路径,生成相应的图查询指令,并利用图查询指令在知识图谱中查询,从而确定知识图谱中各个节点在预定业务下的业务处理结果。以上实施例可以提高基于知识图谱进行业务处理的有效性。
Description
技术领域
本说明书一个或多个实施例涉及计算机技术领域,尤其涉及针对知识图谱的业务处理方法及装置。
背景技术
在知识图谱应用中,通过专家经验和图谱数据相结合,可以产出新的有价值的数据,这个过程可以叫做图推理。举一个简单的例子:父亲的父亲是爷爷,这是一条专家经验。如果有一份具有父亲关系的自然人图谱,那么就可以通过专家经验结合图谱数据推理得到新的爷爷关系数据。
专家经验一般可以认为由图结构信息及其约束条件构成,例如上面的例子,图结构信息可以是A和B之间有父亲关系,B和C之间有父亲关系。约束条件是A的年龄大于B的年龄,B的年龄大于C的年龄,以及A、B、C的性别均为男性等等。
通常,从专家经验到图推理引擎,需要具备专业图计算知识的工程师将专家经验转化为图计算引擎可执行的程序。如何方便快捷的将专家经验转化为图推理引擎可直接执行程序,是图推理中的重要问题。
发明内容
本说明书一个或多个实施例描述了一种针对知识图谱的业务处理方法及装置,用以解决背景技术提到的一个或多个问题。
根据第一方面,提供一种针对知识图谱的业务处理方法,其中,所述知识图谱用于描述多个节点之间的关联关系,各个节点分别对应各个业务实体,对应具有关联关系的业务实体的两两节点之间通过连接边连接;所述方法包括:对用于描述业务处理逻辑的业务描述信息进行解析,得到基准图以及所述基准图中的业务节点对应的基准业务结果,其中,所述基准图包括多个基准节点和至少一个基准连接边,以及用于描述基准节点和/或基准连接边的约束条件;基于所述约束条件,遍历所述基准图中的各个基准连接边,从而确定各个基准节点之间经由各个基准连接边的至少一条基准路径;根据所述至少一条基准路径,生成相应的图查询指令;利用所述图查询指令在所述知识图谱中查询,从而确定所述知识图谱中各个节点与所述基准业务结果相对应的业务处理结果。
在一个实施例中,在所述业务描述信息为计算机语言形式的描述语句的情况下,对用于描述业务处理逻辑的业务描述信息进行解析通过对所述描述语句的编译进行。
在一个实施例中,所述基于所述约束条件,遍历所述基准图中的各个基准连接边,从而确定各个基准节点之间经由各个基准连接边的至少一条基准路径包括:检测所述基准图是否为连通图,其中,连通图是任两个节点之间具有连通路径的图;在所述基准图为连通图的情况下,基于所述约束条件遍历所述基准图中的各个连接边。
在一个实施例中,所述基于所述约束条件,遍历所述基准图中的各个基准连接边,从而确定各个基准节点之间经由各个基准连接边的至少一条基准路径包括:从所述基准图所涉及的各个基准节点中选择当前起始点;检测所述当前起始点是否存在于经由未遍历的基准连接边构成的环路中;并且,若存在,则将相应环路确定为基准路径;若不存在,或者所述当前起始点对应的环路已全部被确定为基准路径,则利用所述起始点和未遍历的基准连接边规划基准路径。
在一个进一步的实施例中,所述约束条件包括各个基准节点的属性约束,所述起始点基于各个基准节点对应的基准连接边数量、各种属性约束对应的约束强度中的至少一项确定。
在另一个进一步的实施例中,所述约束条件包括各个基准连接边对应的连接关系约束,在利用未遍历的基准连接边规划基准路径的过程中,对基准连接边的遍历顺序基于相应连接关系对应的连接边数量确定。
在一个实施例中,所述图查询指令通过gremlin语句描述。
在一个实施例中,所述利用所述图查询指令在所述知识图谱中查询,从而确定所述知识图谱中各个节点在所述预定业务下的业务处理结果包括:利用所述图查询指令在知识图谱中查询,从而得到包含与所述基准图对应的若干子图;基于各个子图分别与所述基准图的对比,确定单个子图中与各个基准节点一一对应的各个目标节点;根据各个基准节点对应的业务结果,确定各个目标节点与所述基准业务结果相对应的业务处理结果。
在一个实施例中,所述知识图谱以分布式方式存储在多个设备,所述利用所述图查询指令在所述知识图谱中查询包括:通过MapReduce方式由各个设备通过所述图查询语句并行查询相关路径;合并各个设备查询到的相关路径。
根据第二方面,提供一种基于知识图谱的业务处理装置,其中,所述知识图谱用于描述多个节点之间的关联关系,各个节点分别对应各个业务实体,对应具有关联关系的业务实体的两两节点之间通过连接边连接;所述装置包括:
解析单元,配置为对用于描述业务处理逻辑的业务描述信息进行解析,得到基准图以及所述基准图中的业务节点对应的基准业务结果,其中,所述基准图包括多个基准节点和至少一个基准连接边,以及用于描述基准节点和/或基准连接边的约束条件;
路径规划单元,配置为基于所述约束条件,遍历所述基准图中的各个基准连接边,从而确定各个基准节点之间经由各个基准连接边的至少一条基准路径;
指令生成单元,配置为根据所述至少一条基准路径,生成相应的图查询指令;
查询单元,配置为利用所述图查询指令在所述知识图谱中查询,从而确定所述知识图谱中各个节点与所述基准业务结果相对应的业务处理结果。
根据第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。
根据第四方面,提供了一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。
通过本说明书实施例提供的方法和装置,通过将专家经验转化成基准图,并在基准图中确定基准路径,再将基准路径转化成计算机可以执行的图查询指令,基于知识图谱执行查询,从而可以完全自动地挖掘知识图谱中相关节点在预定业务下的业务结果。由于以上方法可以由计算机完全自动执行,并且具体场景根据专家经验和知识图谱本身作为输入数据确定,从而具有较强的通用性。总之,以上方法可以提高基于知识图谱进行业务处理的有效性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1示出本说明书技术构思下的一个具体实施架构示意图;
图2示出根据一个实施例的针对知识图谱的业务处理方法流程图;
图3示出根据一个具体例子的基准图示意图;
图4示出根据一个实施例的针对知识图谱的业务处理装置的示意性框图。
具体实施方式
下面结合附图,对本说明书提供的技术方案进行描述。
参考图1,示出了本说明书技术构思下的一个具体实施架构示意图。
首先在图1中,给出了一个知识图谱(Knowledge Graph)的形象化描述。知识图谱也可以称之为关系网络等。本领域技术人员可以理解,知识图谱本质上是一种语义网络。其可以包括与多个业务实体一一对应的各个节点,对于具有连接关系的两两业务实体,相应的两两节点之间可以通过连接边连接。其中的业务实体可以根据具体业务场景确定。例如,在人际关系网络中,业务实体可以是对应真实的人的标识(如姓名+身份证号)或者网络用户标识等,在文档推送、客服问答等领域,业务实体可以是词汇、文章等等。如图1示出的知识图谱中,业务实体可以包括手机号码、用户账号(user ID)、身份证号等等。在连接边具有方向性时,知识图谱还可以为有向图。在有向图中,节点与节点之间的连接边的方向代表着连接关系的走向。例如,商户通过出售的连接关系对应到消费者,用户通过到访的连接关系对应到商家,等等。
知识图谱还可以通过三元组的形式描述。例如三元组(a,r,b)可以描述业务实体a和业务实体b之间具有关联关系r。在图1示出的形象化描述中,业务实体a和业务实体b可以分别对应节点a和节点b,节点a和节点b之间可以通过连接边连接。该连接边可以具有连接关系r。
知识图谱通常具有较大的数据量,并通常根据已知的业务实体间的关联关系进行构建。然而,在一些情况下,业务实体之间还可能存在一些隐藏的关联关系。例如,基于某社交平台或金融平台的用户账号等构建的知识图谱,其中一些用户账号可能被相同用户持有和使用。这种隐藏的关联关系仅从已知的知识图谱中可能无法直观确定,但又对业务处理的准确性等存在较大影响。如果通过人工对知识图谱进一步标注,将消耗巨大的工作量和人工成本。
常规技术中,可以采用图计算框架或者图数据库方式发掘隐藏关系。图计算框架例如有基于Spark的Graphx框架、基于hadoop的Giraph框架,等等。这些计算框架依据专家经验,在知识图谱中推理,从而发掘更多的隐藏关系。专家经验可以理解为隐藏关系的经验依据。例如前文中判断不同业务账号(业务实体)对应着同一个用户的逻辑关系的经验,再例如根据A、B节点之间的父子关系和B、C之间的父子关系判断A、C两个节点对应的人际关系为祖孙关系的经验,等等。图计算框架一般提供Pregel或者GAS等图编程模型,需要具备专业计算机知识和使用特定的编程语言,才能完成针对知识图谱隐藏关系的图推理。图数据库例如有Neo4j、TigerGraph等。图数据库往往以提供图存储和查询为首要目标,通过图查询语言(例如Neo4j提供的Cypher语言)提供服务。这些查询语言也可以具备简单的推理能力,但是其推理能力较弱,不适用于大规模场景,并且图查询语言学习成本较高,推理所依据的专家经验难以直接使用图查询语言表达。
为此,如图1所示,在本说明书提供一种技术构思,可以根据已知业务结果的专家经验中蕴含的业务逻辑,分析专家经验映射到关系网络(基准图)中的路径和约束条件,进而根据约束条件针对知识图谱进行遍历,从而通过对知识图谱的便利挖掘知识图谱中相关节点的隐藏关系。如图1所示,根据专家经验得到基准图,基准图中的虚线表示根据专家经验增加的关联关系。经过路径匹配,可以将这种新增的关联关系推广到知识图谱中,可以在知识图谱中增加如加粗线条的连接边,例如节点a和c之间、节点d和f之间、节点h和j之间的连接边等。
进一步地,这种技术构思还可以不限于挖掘节点之间的隐藏关系,而可以推广到各种业务处理场景。例如,已知知识图谱中某个节点对应的金融平台用户(业务实体)具有洗钱嫌疑,则与该节点具有相同关联路径的其他节点可能都具有洗钱嫌疑。这种技术构思可以解决将专家经验中的业务处理结果应用到整个知识图谱时,技术门槛太高,需要专业计算机知识的问题,并且具备普适性,一次开发可以用于各种业务挖掘需求,从而通过一套系统适配多种业务挖掘引擎。
下面结合图2示出的一个实施例的针对知识图谱的业务处理流程,描述本说明书的技术构思。
图2示出的流程的执行主体可以是具有一定计算能力的计算机、设备或服务器。该流程用于对知识图谱进行处理。这里的知识图谱可以是根据实际业务场景构建的各种知识图谱,如图1示出的知识图谱等,在此不再赘述。
在该流程中,可以根据预定的业务处理逻辑,为基于知识图谱的业务处理提供逻辑参考,或者称为“打样”。之后,按照该业务处理检索知识图谱中相关节点,从而确定相关节点的业务处理结果,完成基于知识图谱的业务处理。如图2所示,该流程包括:步骤201,获取用于描述业务处理逻辑的基准图以及基准图中的业务节点对应的基准业务结果,其中,基准图包括多个基准节点和至少一个基准连接边,以及用于描述基准节点和/或基准连接边的约束条件;步骤202,基于约束条件,遍历基准图中的各个基准连接边,从而确定各个基准节点之间经由各个基准连接边的至少一条基准路径;步骤203,根据至少一条基准路径,生成相应的图查询指令;步骤204,利用图查询指令在知识图谱中查询,从而确定知识图谱中各个节点与基准业务结果相对应的业务处理结果。
首先,通过步骤201,获取用于描述业务处理逻辑的基准图以及基准图中的业务节点对应的基准业务结果。可以理解,知识图谱本身包含着丰富的信息,在实际业务需求中,对已建好的知识图谱还可能挖掘出更多其他信息。在挖掘更多其他信息过程中,通常可以预先确定要挖掘什么样的信息,依据什么逻辑挖掘信息,等等,就可以称为业务处理逻辑。
业务处理逻辑可以由相关专家根据经验人为定义,也可以按照自然规律或事物的发展规律确定,在此不做限定。例如,某个金融平台基于服务器获取的数据,可以构建节点分别对应用户、身份证号、手机号码等业务实体的知识图谱,根据专家经验,发现一些用户为相同人持有。如手机号码、身份证号码均相同的用户,拥有者为同一个人。这种关系是隐藏关系,而不同账号与其他节点产生的关联、发生的状态变化等并不相同。而挖掘这种隐藏关系对于具体业务处理(例如评价用户信用等)具有重要影响。为了便于业务处理,可以预先构建关于这种隐藏关系的业务逻辑,即业务处理逻辑。
根据一个实施例,业务处理逻辑可以通过业务描述信息来描述。业务描述信息可以是自然语言形式的信息,也可以是计算机语言形式的信息,在此不做限定。在通过计算机语言描述的情况下,可以通过Jason、C++之类的计算机通用语言描述,也可以通过某个特定领域内的语言(Domain Specific Language,DSL)描述。本领域技术人员可以理解,各种语言都可以有特定的语句。作为示例,假设知识图谱包含有人际关系中的“父亲”连接关系,要挖掘其中的“祖父”连接关系,一段业务处理逻辑的业务描述信息可以为:
GraphStructure{A,B,C [Person];定义三个元素A、B、C及其属性“人”
A→B [Father]; A到B具有关联关系“父亲”
B→C [Father]}; B到C具有关联关系“父亲”
Rule{A.age>B.age};约束条件A的年龄属性值大于B的年龄属性值
Action{addEdge(A→C [Gandpa])}得到结论,在A、B之间增加连接,用于表示“祖父”关联关系。
本领域技术人员可以理解,这段业务描述信息可以定义出一个图结构,包括三个属性为“人”(或对应业务实体为人)的节点,并且,节点A通过表示父亲连接关系的连接边连接节点B,节点B通过表示父亲的连接关系的连接边连接节点C,并具有约束条件节点A对应的业务实体的年龄属性值大于节点B对应的业务实体的年龄属性值。这种情况下,由专家经验确定节点A和节点C之间可以由表示祖父的连接关系的连接边连接。实践中可选地,业务描述信息中定义的元素(如节点A、B、C)可以与知识图谱实际对应的业务实体没有关联,而仅仅用于描述其中的业务逻辑。
在不同的业务场景下,可以获取不同的业务处理逻辑。通过以上示例的业务处理逻辑,可以挖掘诸如节点A、C的节点之间隐藏的业务关系。换句话说,这样的业务描述信息中的业务处理逻辑可以指示出至少一个节点在预定业务下对应的业务结果。
此时,可以解析业务描述信息中的语义,抽取出其中包含的图结构。由于该业务描述信息描述的业务处理逻辑是基于知识图谱进行业务处理的基准,因此可以将抽取的图结构称为基准图。基准图可以看作描述基准节点之间的关联关系的关系网络。基准图的规模通常远小于知识图谱,基准节点之间的连接边可以称为基准连接边。在可选的实现方式中,基准节点还可以具有节点属性作为约束条件,用于描述相应的业务实体。例如某个节点A,具有节点属性“用户”或“人”、年龄30、性别男,等等。在可选的实现方式中,基准连接边还可以具有连接属性作为约束条件,例如两个节点之间的连接属性可以描述为父子、转账、绑定、通讯录好友,等等。
在业务描述信息通过计算机语言形式描述的情况下,对描述语句的解析可以通过诸如Python、ANTLR之类的编译工具进行。本说明书架构下,编译工具可以把用高级程序设计语言或计算机汇编语言书写的源程序,翻译成等价的关系网络。例如,根据前文示例中的描述语句,可以利用编译工具ANTLR翻译成一个如下的基准图:包括属性为“人(person)”的节点A、B、C;节点A和节点B之间有连接关系为Father的连接边、节点B和节点C之间有连接关系为Father的连接边。另外,还可以解析出约束条件A的年龄属性值大于B的年龄属性值。并且,可以得出业务结果为,节点A和节点B之间有连接关系为Grandpa的连接边。
根据另一个实施例,业务处理逻辑可以直接由基准图描述。也就是说,对于新的具有规律性的连接关系,可以由专家经验构建相关图数据,作为类似于图1的基准图。在基准图中可以包含多个基准节点和至少一个基准连接边,以及用于描述基准节点和/或基准连接边的约束条件。基准图中还可以指出相关基准节点对应的业务处理结果,例如,最终在两个节点a、b之间增加了一条连接边,节点a、b就是相关基准节点,增加的连接边就是对它们的业务处理结果。
为了运用该业务处理逻辑基于知识图谱进行业务处理,可以按照业务描述信息中挖掘到的基准图,在知识图谱中匹配与基准图具有相同结构的子图。为了匹配相应的子图,需要在知识图谱中查询与各个基准节点的对应的各个节点,并且这些节点之间具有与各个基准连接边相应的连接边。为此,在本说明书实施例中,可以结合约束条件对基准图的路径信息进行分析,以便通过路径检索相应的子图。因此,可以在步骤202中,基于上述约束条件,遍历基准图中的各个基准连接边,从而确定各个基准节点之间经由各个基准连接边的至少一条基准路径。
可以理解,基准图中定义基准节点,以及基准节点之间的连接关系,还可以定义有基准节点和/或基准连接边的相关约束条件,基于这些约束条件,可以确定出带约束条件的基准路径。由于基准路径经由基准连接边对基准节点的连接关系构成,因此,可以按照基准连接边构建基准路径。而基准连接变始于基准节点,终于基准节点,因此,单个基准路径可以选择一个基准节点作为起始点,沿基准连接边确定基准路径。在基准连接边遍历完成的情况下,所确定的各个路径为基准路径。
作为示例,假设基准图的结构如图3所示。图3中的业务结果为:账号A和账号B对应同一个平台用户。图3示出的基准图中涉及多个基准节点,这多个基准节点分别对应账号、电话号码、身份证号码等。首先,可以选择一个基准节点作为起始点,遍历其中的规则路径。例如选择账号B作为起始点,遍历各个基准连接边,可以得到基准路径:
账号B—绑定→身份证ID←绑定—账号A—绑定→手机号A←通讯录好友—账号B;
账号B—绑定→手机号B←通讯录好友—账号A。
以上两条规则路径无重复地遍历了基准图中的所有基准连接边,因此,可以认为这两条规则路径包含了基准图中的所有路径。在每个基准连接边均在规划路径中出现且仅出现一次的情况下,可以避免基准连接边交叉导致更高的路径复杂性。实践中,也可以允许单个基准连接边出现在不同连接路径(即在一次遍历中被多次遍历到)中,这样可以减少基准路径的数量。
以上示例中,通过对应账号B的起始点得到的两条基准路径遍历了所有基准连接边。在一些实施例中,还存在其他基准连接边未遍历到的情况下,此时,还可以选择新的起始点遍历未遍历到的基准连接边确定其他基准路径。例如可以以为遍历到的连接边所连接的基准节点为起始点,规划基准路径,直至所有的基准连接边被遍历。
在可选的实现方式中,可以先检测基准图是不是连通图,如果是连通图,按照约束条件遍历基准图,如果不是,则提示错误,或者不继续执行。其中,连通图可以是任两点之间具有连通路径的图。或者说,连通图不能被断开为相互独立(不具有连接路径)的多个图。举例而言,节点A、B、C、D、E、F构成的基准图中,如果A和B、C连接,B、C和D连接,E和F连接,则可以拆分为相互独立的两个图,A、B、C、D构成的图和E、F构成的图,不构成连通图。但是,如果A、B、C、D中任一点和E、F中任一点(如C和F)之间还有一条连接边,则这六个节点可以构成连通图。
在可能的设计中,为了提高基准路径确定效率,还可以对基准图的遍历进行优化。
在一个可选的实现方式中,针对起始点的选择方式进行优化。此时,起始点可以基于各个基准节点对应的基准连接边数量、约束强度中的至少一项确定。例如,优先选择连接边数量较少的基准节点作为起始点。这是因为,连接边越少,相应基准节点作为起始点的基准路径数量越少。这样可以降低后续遍历过程的复杂度。再例如,优先选择约束强度较强的基准节点作为起始点。这是因为,约束性较强的约束条件可以过滤掉许多路径数量。例如图3所示的基准图中,账号B对应的节点具有属性约束“商户”,该约束可以认为是一个强于账号A对应的节点不具有属性限定的约束。在一些实施例中,还可以确定连接边数量、约束强度等的优先级,根据优先级顺序确定起始点。例如,约束强度优先级大于连接边数量优先级的情况下,可以在约束强度最强的基准节点中选择连接边数量最少的基准节点作为起始点。在一些实施例中,还可以将约束强度量化,并和连接边数量按照预定方式加权平均,得到起始点选择指标,按照起始点选择指标选择起始点。
在另一个可选的实现方式中,约束条件包括各个基准连接边对应的连接关系约束,此时,可以针对基准连接边对应的连接关系的选择方式进行优化。换句话说,在利用未遍历的基准连接边规划基准路径的过程中,对基准连接边的遍历顺序基于单个基准连接边对应的连接关系的连接量级确定。例如,一个商户的用户到访约束弱于购买约束,到访连接关系对应的连接边数量通常远大于购买连接关系对应的连接边数量,那么可以先从购买约束的基准连接边选择起始点。这样,会大大减少路径数量。
在又一个可选的实现方式中,在确定好起始点之后,还可以先检测当前的路径起始点是否存在于经由未遍历的基准连接边构成的环路,如果存在,则将相应环路确定为基准路径。这是因为,环路是比较强的约束,优先遍历环路,可以减少后续遍历过程中基准路径数量。如图3所示的基准图中,先遍历环路的情况下,第一条环形基准路径涉及了大部分基准连接边,最终整个图只有两条基准路径。
在其他实施例中,还可以通过其他方式优化基准路径。经过优化,可以大大减少基准路径的数量,降低基准路径规划的复杂度,提高知识图谱处理的效率。
然后,在步骤203中,根据上述至少一条基准路径,生成相应的图查询指令。可以理解,图查询指令可以指示计算机对给定的知识图谱进行查询,从而可以在知识图谱中挖掘与基准图一致的子图,其例如是计算机可执行语言描述的语句。
在一个实施例中,图查询指令可以是计算机可执行语言gremlin形式的指令。例如图3中的基准路径转换成gremlin形式的图查询指令可以为: g.V().hasLabel('账号').has('type', '商户').as('账号B').out('绑定').hasLabel('身份证').as('身份证ID').in('绑定').hasLabel('账号').as('账号A')..out('绑定').hasLabel('手机号').as('手机号A')..in('通讯录好友').hasLabel('账号').where(eq('账户B')).out('绑定').hasLabel('手机号').as('手机号B'). in('通讯录好友').hasLabel('账号').where(eq('账号A')).path()。
可选地,图查询指令中还可以插入预先定义函数UDF(User-Defined Function,用户定义函数)。UDF可以用于进行处理逻辑过滤,例如过滤掉包含基准图中不存在的路径的子图等。作为示例,例如在上述的gremlin形式的图查询指令中,在“g.V().hasLabel('账号').has('type', '商户').as('账号B') .out('绑定').hasLabel('身份证').as('身份证ID')”之后增加“ruleEngine(账号B.性别==身份证ID.性别)”来描述针对账号B的条件约束,这样,可以对账号B对应的性别属性进行约束,从而可以在查询过程中过滤掉一部分不符合该约束的路径。
然后,通过步骤204,利用图查询指令在知识图谱中查询,从而确定知识图谱中各个节点与基准业务结果相对应的业务处理结果。
可以理解,图查询指令是计算机可以执行的指令,因此,可以使用图查询指令可以对知识图谱进行查询。例如“g.V().hasLabel('账号').has('type', '商户').out('绑定').hasLabel('身份证').in('绑定').hasLabel('账号').out('绑定').hasLable('手机')”的查询指令中,首先查询账号对应的类型为商家(节点约束条件)的节点,并且具有以下环路:该节点绑定了身份证,该身份证又被另一个绑定有手机号的账号绑定,out和in表示连接边的方向。通过执行该指令,具有这种路径的子图可以被检索出来。在同时具有多个基准路径的情况下,根据多个基准路径的叠加查询,可以逐渐过滤检索到的子图。最终检索到各个与基准图具有一致结构的子图。可以理解的是,子图的各个节点中还可以具有其他连接边,在检索过程中仅需要将基准图作为必要条件。
假设检索到的子图中的任一与基准图具有相同路径的子图为第一子图,则根据一个实施例,可以获取与基准图具有一致路径的第一子图,然后对比第一子图与基准图,从而确定第一子图中与基准图中指示出业务结果的节点相对应的各个节点,并且第一子图中的相应节点具有与基准图中相应基准节点一致的业务处理结果。因此,其在预定业务下也具有与基准图中相应基准节点一致的业务处理结果。作为示例,假设基准图通过A→父亲→B→父亲→C的基准路径,增加A→祖父→C的连接关系,则可以检索到所有包括A→父亲→B→父亲→C结构的子图,并对该结构的子图中与A、C对应的节点之间增加A→祖父→C的连接关系作为与A、C对应节点的业务处理结果。从而,根据专家经验确定整个知识图谱的相应业务处理结果。
回顾以上过程,本说明书实施例提供的方法,通过对专家经验转化成基准图,并在基准图中确定基准路径,再将基准路径转化成计算机可以执行的图查询指令,基于知识图谱执行查询,从而可以完全自动地挖掘知识图谱中相关节点在预定业务的业务结果。由于以上方法可以由计算机完全自动执行,并且具体场景根据专家经验和知识图谱本身作为输入数据确定,从而具有较强的通用性。总之,以上方法可以提高基于知识图谱进行业务处理的有效性。
根据另一方面的实施例,还提供一种针对知识图谱的业务处理装置。其中,知识图谱用于描述多个节点之间的关联关系,各个节点分别对应各个业务实体,对应具有关联关系的业务实体的两两节点之间通过连接边连接。图4示出了一个实施例的基于知识图谱的业务处理装置400。如图4所示,装置400包括:
获取单元41,配置为获取用于描述业务处理逻辑的基准图以及基准图中的业务节点对应的基准业务结果,其中,基准图包括多个基准节点和至少一个基准连接边,以及用于描述基准节点和/或基准连接边的约束条件;
路径规划单元42,配置为基于约束条件,遍历基准图中的各个基准连接边,从而确定各个基准节点之间经由各个基准连接边的至少一条基准路径;
指令生成单元43,配置为根据至少一条基准路径,生成相应的图查询指令;
查询单元44,配置为利用图查询指令在知识图谱中查询,从而确定知识图谱中各个节点与基准业务结果相对应的业务处理结果。
根据一个实施例,获取单元41进一步配置为:获取用于描述业务处理逻辑的业务描述信息;对用于描述业务处理逻辑的业务描述信息进行解析,得到基准图以及基准图中的业务节点对应的基准业务结果。
在一个进一步的实施例中,在业务描述信息为计算机语言形式的描述语句的情况下,获取单元41对用于描述业务处理逻辑的业务描述信息进行解析通过对描述语句的编译进行。
根据一个实施方式,路径规划单元42进一步配置为:
检测基准图是否为连通图,其中,连通图是任两个节点之间具有连通路径的图;
在基准图为连通图的情况下,基于约束条件遍历基准图中的各个连接边。
在一个实施例中,路径规划单元42还配置为:
从基准图所涉及的各个基准节点中选择当前起始点;
检测当前起始点是否存在于经由未遍历的基准连接边构成的环路中;并且,
若存在,则将相应环路确定为基准路径;
若不存在,或者当前起始点对应的环路完全确认为基准路径,则利用起始点和未遍历的基准连接边规划基准路径。
在一个进一步的实施例中,约束条件包括各个基准节点的属性约束,起始点基于各个基准节点对应的基准连接边数量、各种属性约束对应的约束强度中的至少一项确定。
在另一个进一步的实施例中,约束条件包括各个基准连接边对应的连接关系约束,在利用未遍历的基准连接边规划基准路径的过程中,对基准连接边的遍历顺序基于相应连接关系对应的连接数量确定。
可选地,图查询指令通过gremlin语句描述。
根据一个可能的涉及,查询单元44进一步配置为:
利用图查询指令在知识图谱中查询,从而得到与基准图的若干子图;
基于各个子图分别与基准图的对比,确定单个子图中与各个基准节点一一对应的各个目标节点;
根据各个基准节点对应的业务结果,确定各个目标节点与基准业务结果相对应的业务处理结果。
在一个可选地实现方式中,知识图谱以分布式方式存储在多个设备,查询单元44进一步配置为:
通过MapReduce方式向各个设备分配查询任务,以供各个设备通过图查询语句并行查询相关路径;
合并各个设备查询到的相关路径。
值得说明的是,图4所示的装置400与图2描述的方法相对应,图2的方法实施例中的相应描述同样适用于装置400,在此不再赘述。
根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图2等所描述的方法。
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图2等所描述的方法。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本说明书实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本说明书的技术构思的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本说明书的技术构思的具体实施方式而已,并不用于限定本说明书的技术构思的保护范围,凡在本说明书实施例的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本说明书的技术构思的保护范围之内。
Claims (22)
1.一种针对知识图谱的业务处理方法,其中,所述知识图谱用于描述多个节点之间的关联关系,各个节点分别对应各个业务实体,对应具有关联关系的业务实体的两两节点之间通过连接边连接;所述方法包括:
获取用于描述业务处理逻辑的基准图以及所述基准图中的业务节点对应的基准业务结果,其中,所述基准图包括多个基准节点和至少一个基准连接边,以及用于描述基准节点和/或基准连接边的约束条件;
基于所述约束条件,遍历所述基准图中的各个基准连接边,从而确定各个基准节点之间经由各个基准连接边的至少一条基准路径;
根据所述至少一条基准路径,生成相应的图查询指令;
利用所述图查询指令在所述知识图谱中查询,从而确定所述知识图谱中各个节点与所述基准业务结果相对应的业务处理结果。
2.根据权利要求1所述的方法,其中,所述获取用于描述业务处理逻辑的基准图以及所述基准图中的业务节点对应的基准业务结果包括:
获取用于描述业务处理逻辑的业务描述信息;
对用于描述业务处理逻辑的业务描述信息进行解析,得到基准图以及所述基准图中的业务节点对应的基准业务结果。
3.根据权利要求2所述的方法,其中,在所述业务描述信息为计算机语言形式的描述语句的情况下,对用于描述业务处理逻辑的业务描述信息进行解析通过对所述描述语句的编译进行。
4.根据权利要求1所述的方法,其中,所述基于所述约束条件,遍历所述基准图中的各个基准连接边,从而确定各个基准节点之间经由各个基准连接边的至少一条基准路径包括:
检测所述基准图是否为连通图,其中,连通图是任两个节点之间具有连通路径的图;
在所述基准图为连通图的情况下,基于所述约束条件遍历所述基准图中的各个连接边。
5.根据权利要求1所述的方法,所述基于所述约束条件,遍历所述基准图中的各个基准连接边,从而确定各个基准节点之间经由各个基准连接边的至少一条基准路径包括:
从所述基准图所涉及的各个基准节点中选择当前起始点;
检测所述当前起始点是否存在于经由未遍历的基准连接边构成的环路中;并且,
若存在,则将相应环路确定为基准路径;
若不存在,或者所述当前起始点对应的环路已全部被确定为基准路径,则利用所述起始点和未遍历的基准连接边规划基准路径。
6.根据权利要求5所述的方法,所述约束条件包括各个基准节点的属性约束,所述起始点基于各个基准节点对应的基准连接边数量、各种属性约束对应的约束强度中的至少一项确定。
7.根据权利要求5所述的方法,所述约束条件包括各个基准连接边对应的连接关系约束,在利用未遍历的基准连接边规划基准路径的过程中,对基准连接边的遍历顺序基于相应连接关系对应的连接边数量确定。
8.根据权利要求1所述的方法,其中,所述图查询指令通过gremlin语句描述。
9.根据权利要求1所述的方法,所述利用所述图查询指令在所述知识图谱中查询,从而确定所述知识图谱中各个节点与所述基准业务结果相对应的业务处理结果包括:
利用所述图查询指令在知识图谱中查询,从而得到与所述基准图对应的若干子图;
基于各个子图分别与所述基准图的对比,确定单个子图中与各个基准节点一一对应的各个目标节点;
根据各个基准节点对应的业务结果,确定各个目标节点与所述基准业务结果对应的业务处理结果。
10.根据权利要求1所述的方法,所述知识图谱以分布式方式存储在多个设备,所述利用所述图查询指令在所述知识图谱中查询包括:
通过MapReduce方式由各个设备通过所述图查询语句并行查询相关路径;
合并各个设备查询到的相关路径。
11.一种针对知识图谱的业务处理装置,其中,所述知识图谱用于描述多个节点之间的关联关系,各个节点分别对应各个业务实体,对应具有关联关系的业务实体的两两节点之间通过连接边连接;所述装置包括:
获取单元,配置为获取用于描述业务处理逻辑的基准图以及所述基准图中的业务节点对应的基准业务结果,其中,所述基准图包括多个基准节点和至少一个基准连接边,以及用于描述基准节点和/或基准连接边的约束条件;
路径规划单元,配置为基于所述约束条件,遍历所述基准图中的各个基准连接边,从而确定各个基准节点之间经由各个基准连接边的至少一条基准路径;
指令生成单元,配置为根据所述至少一条基准路径,生成相应的图查询指令;
查询单元,配置为利用所述图查询指令在所述知识图谱中查询,从而确定所述知识图谱中各个节点与所述基准业务结果相对应的业务处理结果。
12.根据权利要求11所述的装置,其中,所述获取单元进一步配置为:
获取用于描述业务处理逻辑的业务描述信息;
对用于描述业务处理逻辑的业务描述信息进行解析,得到基准图以及所述基准图中的业务节点对应的基准业务结果。
13.根据权利要求12所述的装置,其中,在所述业务描述信息为计算机语言形式的描述语句的情况下,所述获取单元还用于对描述业务处理逻辑的业务描述信息进行解析通过对所述描述语句的编译进行。
14.根据权利要求11所述的装置,其中,所述路径规划单元进一步配置为:
检测所述基准图是否为连通图,其中,连通图是任两个节点之间具有连通路径的图;
在所述基准图为连通图的情况下,基于所述约束条件遍历所述基准图中的各个连接边。
15.根据权利要求11所述的装置,所述路径规划单元还配置为:
从所述基准图所涉及的各个基准节点中选择当前起始点;
检测所述当前起始点是否存在于经由未遍历的基准连接边构成的环路中;并且,
若存在,则将相应环路确定为基准路径;
若不存在,或者所述当前起始点对应的环路完全确认为基准路径,则利用所述起始点和未遍历的基准连接边规划基准路径。
16.根据权利要求15所述的装置,所述约束条件包括各个基准节点的属性约束,所述起始点基于各个基准节点对应的基准连接边数量、各种属性约束对应的约束强度中的至少一项确定。
17.根据权利要求15所述的装置,所述约束条件包括各个基准连接边对应的连接关系约束,在利用未遍历的基准连接边规划基准路径的过程中,对基准连接边的遍历顺序基于相应连接关系对应的连接边数量确定。
18.根据权利要求11所述的装置,其中,所述图查询指令通过gremlin语句描述。
19.根据权利要求11所述的装置,所述查询单元进一步配置为:
利用所述图查询指令在知识图谱中查询,从而得到与所述基准图对应的若干子图;
基于各个子图分别与所述基准图的对比,确定单个子图中与各个基准节点一一对应的各个目标节点;
根据各个基准节点对应的业务结果,确定各个目标节点与所述基准业务结果相对应的业务处理结果。
20.根据权利要求11所述的装置,所述知识图谱以分布式方式存储在多个设备,所述查询单元进一步配置为:
通过MapReduce方式向各个设备分配查询任务,以供各个设备通过所述图查询语句并行查询相关路径;
合并各个设备查询到的相关路径。
21.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-10中任一项的所述的方法。
22.一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-10中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110191517.3A CN112579797B (zh) | 2021-02-20 | 2021-02-20 | 针对知识图谱的业务处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110191517.3A CN112579797B (zh) | 2021-02-20 | 2021-02-20 | 针对知识图谱的业务处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112579797A true CN112579797A (zh) | 2021-03-30 |
CN112579797B CN112579797B (zh) | 2021-05-18 |
Family
ID=75113923
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110191517.3A Active CN112579797B (zh) | 2021-02-20 | 2021-02-20 | 针对知识图谱的业务处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112579797B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113468311A (zh) * | 2021-07-20 | 2021-10-01 | 四川启睿克科技有限公司 | 一种基于知识图谱的复杂问句问答方法、装置及存储介质 |
CN113535145A (zh) * | 2021-06-28 | 2021-10-22 | 北京明略软件系统有限公司 | 基于Gremlin的并行扩展方法、系统、电子设备及存储介质 |
CN113590839A (zh) * | 2021-07-30 | 2021-11-02 | 支付宝(杭州)信息技术有限公司 | 知识图谱的构建方法、目标业务的执行方法及装置 |
CN113672740A (zh) * | 2021-08-04 | 2021-11-19 | 支付宝(杭州)信息技术有限公司 | 针对关系网络的数据处理方法及装置 |
CN113704566A (zh) * | 2021-10-29 | 2021-11-26 | 贝壳技术有限公司 | 识别号主体识别方法、存储介质和电子设备 |
CN114385833A (zh) * | 2022-03-23 | 2022-04-22 | 支付宝(杭州)信息技术有限公司 | 更新知识图谱的方法及装置 |
CN114579826A (zh) * | 2022-04-27 | 2022-06-03 | 支付宝(杭州)信息技术有限公司 | 基于知识图谱的任务处理方法及装置 |
CN115344410A (zh) * | 2022-10-14 | 2022-11-15 | 北京奥星贝斯科技有限公司 | 判断事件执行顺序的方法、装置、存储介质及电子设备 |
WO2022237334A1 (zh) * | 2021-05-12 | 2022-11-17 | 华为技术有限公司 | 一种业务逻辑的知识表示和推演方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103512581A (zh) * | 2012-06-28 | 2014-01-15 | 北京搜狗科技发展有限公司 | 一种路径规划方法和装置 |
CN111026874A (zh) * | 2019-11-22 | 2020-04-17 | 海信集团有限公司 | 知识图谱的数据处理方法及服务器 |
US20200364584A1 (en) * | 2015-10-28 | 2020-11-19 | Qomplx, Inc. | Multi-tenant knowledge graph databases with dynamic specification and enforcement of ontological data models |
-
2021
- 2021-02-20 CN CN202110191517.3A patent/CN112579797B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103512581A (zh) * | 2012-06-28 | 2014-01-15 | 北京搜狗科技发展有限公司 | 一种路径规划方法和装置 |
US20200364584A1 (en) * | 2015-10-28 | 2020-11-19 | Qomplx, Inc. | Multi-tenant knowledge graph databases with dynamic specification and enforcement of ontological data models |
CN111026874A (zh) * | 2019-11-22 | 2020-04-17 | 海信集团有限公司 | 知识图谱的数据处理方法及服务器 |
Non-Patent Citations (2)
Title |
---|
HUAXUAN ZHAO等: "Research on Information Extraction of Technical Documents and Construction of Domain Knowledge Graph", 《IEEE ACCESS》 * |
张克宏: "面向图数据的复杂多属性路径查询技术研究", 《中国博士学位论文全文数据库信息科技辑》 * |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022237334A1 (zh) * | 2021-05-12 | 2022-11-17 | 华为技术有限公司 | 一种业务逻辑的知识表示和推演方法及装置 |
CN113535145A (zh) * | 2021-06-28 | 2021-10-22 | 北京明略软件系统有限公司 | 基于Gremlin的并行扩展方法、系统、电子设备及存储介质 |
CN113535145B (zh) * | 2021-06-28 | 2024-03-29 | 南京明略科技有限公司 | 基于Gremlin的并行扩展方法、系统、电子设备及存储介质 |
CN113468311A (zh) * | 2021-07-20 | 2021-10-01 | 四川启睿克科技有限公司 | 一种基于知识图谱的复杂问句问答方法、装置及存储介质 |
CN113468311B (zh) * | 2021-07-20 | 2023-09-19 | 四川启睿克科技有限公司 | 一种基于知识图谱的复杂问句问答方法、装置及存储介质 |
CN113590839A (zh) * | 2021-07-30 | 2021-11-02 | 支付宝(杭州)信息技术有限公司 | 知识图谱的构建方法、目标业务的执行方法及装置 |
CN113672740A (zh) * | 2021-08-04 | 2021-11-19 | 支付宝(杭州)信息技术有限公司 | 针对关系网络的数据处理方法及装置 |
CN113672740B (zh) * | 2021-08-04 | 2023-11-07 | 支付宝(杭州)信息技术有限公司 | 针对关系网络的数据处理方法及装置 |
CN113704566B (zh) * | 2021-10-29 | 2022-01-18 | 贝壳技术有限公司 | 识别号主体识别方法、存储介质和电子设备 |
CN113704566A (zh) * | 2021-10-29 | 2021-11-26 | 贝壳技术有限公司 | 识别号主体识别方法、存储介质和电子设备 |
CN114385833A (zh) * | 2022-03-23 | 2022-04-22 | 支付宝(杭州)信息技术有限公司 | 更新知识图谱的方法及装置 |
CN114385833B (zh) * | 2022-03-23 | 2023-05-12 | 支付宝(杭州)信息技术有限公司 | 更新知识图谱的方法及装置 |
CN114579826A (zh) * | 2022-04-27 | 2022-06-03 | 支付宝(杭州)信息技术有限公司 | 基于知识图谱的任务处理方法及装置 |
CN115344410A (zh) * | 2022-10-14 | 2022-11-15 | 北京奥星贝斯科技有限公司 | 判断事件执行顺序的方法、装置、存储介质及电子设备 |
CN115344410B (zh) * | 2022-10-14 | 2023-02-28 | 北京奥星贝斯科技有限公司 | 判断事件执行顺序的方法、装置、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN112579797B (zh) | 2021-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112579797B (zh) | 针对知识图谱的业务处理方法及装置 | |
Tax et al. | Mining local process models | |
US10936988B2 (en) | Cognitive process enactment | |
CN103164249B (zh) | 用于脚本语言编译器的扩展机制 | |
US11488029B2 (en) | Cognitive process code generation | |
CN107251021B (zh) | 过滤数据沿袭图 | |
US20190087755A1 (en) | Cognitive process learning | |
US20160291972A1 (en) | System and Method for Automated Cross-Application Dependency Mapping | |
Kalenkova et al. | Discovering high-level BPMN process models from event data | |
US10713152B2 (en) | Automated path generator for optimized application testing | |
Kim et al. | Constructing decision trees from process logs for performer recommendation | |
US20170329821A1 (en) | Signature detection | |
Van der Aalst et al. | Process modeling and analysis | |
EP1548581A2 (en) | Methods, apparatus and programs for system development | |
CN112965710A (zh) | 计算图的处理方法、装置和系统 | |
Oluwagbemi et al. | Automatic generation of test cases from activity diagrams for UML based testing (UBT) | |
Baier et al. | Matching of events and activities-an approach using declarative modeling constraints | |
CN109408601B (zh) | 基于图数据的数据模型转换方法及图数据结构转换器 | |
CN110019207B (zh) | 数据处理方法和装置以及脚本显示方法和装置 | |
Pegoraro et al. | Resolving uncertain case identifiers in interaction logs: A user study | |
Florez et al. | iArchiMate: a tool for managing imperfection in enterprise models | |
CN114579826B (zh) | 基于知识图谱的任务处理方法及装置 | |
CN116128525A (zh) | 一种基于模式前缀共享的多模式图匹配查询方法及装置 | |
Thakkar et al. | Towards an integrated graph algebra for graph pattern matching with gremlin (extended version) | |
Ta’a et al. | Goal-ontology approach for modeling and designing ETL processes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |