CN117056482A - 基于知识图谱的问答方法、装置和处理器及电子设备 - Google Patents

基于知识图谱的问答方法、装置和处理器及电子设备 Download PDF

Info

Publication number
CN117056482A
CN117056482A CN202311008267.0A CN202311008267A CN117056482A CN 117056482 A CN117056482 A CN 117056482A CN 202311008267 A CN202311008267 A CN 202311008267A CN 117056482 A CN117056482 A CN 117056482A
Authority
CN
China
Prior art keywords
business
consultation
scene
service
knowledge graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311008267.0A
Other languages
English (en)
Inventor
杨智康
何辉
祝放
于淼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202311008267.0A priority Critical patent/CN117056482A/zh
Publication of CN117056482A publication Critical patent/CN117056482A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种基于知识图谱的问答方法、装置和处理器及电子设备。涉及金融科技领域,该方法包括:获取用户当前输入的业务咨询问题;按照与业务咨询问题相匹配的场景概念化模板,对业务咨询问题的内容进行字段标注,以得到与业务咨询问题相匹配的咨询字段集,其中,咨询字段集包括待处理的咨询内容字段;使用咨询字段集生成查询语句;基于查询语句,在与业务咨询问题所在业务场景相关的业务知识图谱中查找与查询语句相匹配的业务答案。通过本申请,解决了现有技术中存在的问答处理效率较低的技术问题。

Description

基于知识图谱的问答方法、装置和处理器及电子设备
技术领域
本申请涉及金融科技领域,具体而言,涉及一种基于知识图谱的问答方法、装置和处理器及电子设备。
背景技术
银行等金融科技领域的网络平台的每天都会接收到大量的用户所提出的问题,针对这些问题的处理,目前所采用的主要方式是基于知识图谱来获取问题的答案。
然而,由于用户所提出的问题语言形式与知识图谱中实体的语言形式可能存在着较大的差异,因而需要耗费大量的时间才能在知识图谱中获取到问题的答案。
换言之,采用现有技术中提供的问答方式,仍然存在着问答处理效率较低的技术问题。
针对相关技术中存在的问答处理效率较低的技术问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种基于知识图谱的问答方法、装置和处理器及电子设备,以解决现有技术中存在的问答处理效率较低的技术问题。
为了实现上述目的,根据本申请的一个方面,提供了一种基于知识图谱的问答方法。该方法包括:获取用户当前输入的业务咨询问题;按照与上述业务咨询问题相匹配的场景概念化模板,对上述业务咨询问题的内容进行字段标注,以得到与上述业务咨询问题相匹配的咨询字段集,其中,上述咨询字段集包括待处理的咨询内容字段;使用上述咨询字段集生成查询语句;基于上述查询语句,在与上述业务咨询问题所在业务场景相关的业务知识图谱中查找与上述查询语句相匹配的业务答案。
作为一种可选的方案,按照与上述业务咨询问题相匹配的场景概念化模板,对上述业务咨询问题的内容进行字段标注,以得到与上述业务咨询问题相匹配的咨询字段集包括:将以自然语言表达的上述业务咨询问题转化为咨询问题意图;从上述咨询问题意图中提取出所要咨询的业务实体关键词和与上述业务实体关键词相匹配的属性描述信息;利用上述业务实体关键词和上述属性描述信息生成上述咨询内容字段。
作为一种可选的方案,在上述利用上述业务实体关键词和上述属性描述信息生成上述咨询内容字段之后,还包括:获取对上述业务实体关键词配置的约束条件,其中,上述约束条件用于对上述业务实体关键词所指示的应用范畴进行约束;利用上述约束条件生成与上述咨询内容字段所关联的条件字段,其中,上述咨询字段集中还包括上述条件字段。
作为一种可选的方案,上述基于上述查询语句,在与上述业务咨询问题所在业务场景相关的业务知识图谱中查找与上述查询语句相匹配的业务答案包括:获取与上述场景概念化模板对应的场景标识;在与上述场景标识相匹配的配置表中,查找与上述业务场景相关的全局业务知识图谱的存储地址;基于上述全局业务知识图谱中所记录的业务关系,查找出与上述查询语句相匹配的上述业务答案。
作为一种可选的方案,在与上述场景标识相匹配的配置表中,查找与上述业务场景相关的业务知识图谱的存储地址之前,还包括:在目标地址存储的目标知识图谱中查找与上述查询语句相匹配的上述业务答案,其中,上述目标知识图谱是上述全局业务知识图谱中被查询使用的频率高于目标阈值的部分知识图谱;在上述目标知识图谱中并未查找到上述业务答案的情况下,确定在上述配置表中查找与上述业务场景相关的业务知识图谱的上述存储地址。
作为一种可选的方案,在上述获取用户当前输入的业务咨询问题之前,还包括:获取银行业务场景下收集的咨询问题集合,其中,上述咨询问题集合中的每个咨询问题内均各自包括:待咨询的业务实体关键词,以及与上述业务实体关键词相匹配的属性描述信息;将上述咨询问题集合中包含的不同的上述业务实体关键词分别转化为业务知识图谱中的节点;基于上述业务实体关键词和上述属性描述信息之间的关系,生成上述节点之间的连线;将上述节点和上述连线按照schema结构生成上述业务知识图谱,并为上述业务知识图谱生成配置表,其中,上述配置表用于存储上述业务知识图谱的存储地址与上述银行业务场景的场景标识之间的映射关系。
作为一种可选的方案,在所获取银行业务场景下收集的咨询问题集合之后,包括:获取基础场景概念化模板;根据上述咨询问题集合对上述基础场景概念化模板进行扩展或修改,得到与上述银行业务场景相匹配的场景概念化模板。
为了实现上述目的,根据本申请的另一方面,提供了一种基于知识图谱的问答装置。该装置包括:获取单元,用于获取用户当前输入的业务咨询问题;标注单元,用于按照与业务咨询问题相匹配的场景概念化模板,对业务咨询问题的内容进行字段标注,以得到与业务咨询问题相匹配的咨询字段集,其中,咨询字段集包括待处理的咨询内容字段;生成单元,用于使用咨询字段集生成查询语句;查找单元,用于基于查询语句,在与业务咨询问题所在业务场景相关的业务知识图谱中查找与查询语句相匹配的业务答案。
可选地,作为一种可选的方案,上述标注单元包括:第一转化模块,用于将以自然语言表达的业务咨询问题转化为咨询问题意图;第一提取模块,用于从咨询问题意图中提取出所要咨询的业务实体关键词和与业务实体关键词相匹配的属性描述信息;第一生成模块。用于利用业务实体关键词和属性描述信息生成咨询内容字段。
可选地,作为一种可选的方案,上述标注单元还包括:第一获取模块,用于获取对业务实体关键词配置的约束条件,其中,约束条件用于对业务实体关键词所指示的应用范畴进行约束;第二生成模块,用于利用约束条件生成与咨询内容字段那关联所关联的条件字段,其中,咨询字段集中还包括条件字段。
可选地,作为一种可选的方案,上述查找单元包括:第二获取模块,用于获取与场景概念化模板对应的场景标识;第一查找模块,用于在与场景标识相匹配的配置表中,查找与业务场景相关的全局业务知识图谱的存储地址;第二查找模块,用于基于全局业务知识图谱中所记录的业务关系,查找出与查询语句相匹配的业务答案。
可选地,作为一种可选的方案,上述查找单元还包括:第三查找模块,用于在目标地址存储的目标知识图谱中查找与查询语句相匹配的业务答案,其中,目标知识图谱是全局业务知识图谱中被查询使用的频率高于目标阈值的部分知识图谱;第一确定模块,用于在目标知识图谱中并未查找到业务答案的情况下,确定在配置表中查找与业务场景相关的业务知识图谱的存储地址。
可选地,作为一种可选的方案,上述装置还包括:第一获取单元,用于获取银行业务场景下收集的咨询问题集合,其中,咨询问题集合中的每个咨询问题内均各自包括:待咨询的业务实体关键词,以及与业务实体关键词相匹配的属性描述信息;转化单元,用于将咨询问题集合中包含的不同的业务实体关键词分别转化为业务知识图谱中的节点;第一生成单元,用于基于业务实体关键词和属性描述信息之间的关系,生成节点之间的连线;第二生成单元,用于将节点和连线按照schema结构生成业务知识图谱,并为业务知识图谱生成配置表,其中,配置表用于存储业务知识图谱的存储地址与银行业务场景的场景标识之间的映射关系。
可选地,作为一种可选的方案,上述装置还包括:第二获取单元,用于获取基础场景概念化模板;第三获取单元,用于根据咨询问题集合对基础场景概念化模板进行扩展或修改,得到与银行业务场景相匹配的场景概念化模板。
在本申请实施例中,获取用户当前输入的业务咨询问题。然后,按照与业务咨询问题相匹配的场景概念化模板,对业务咨询问题的内容进行字段标注,以得到与业务咨询问题相匹配的咨询字段集,其中,咨询字段集包括待处理的咨询内容字段。接着,使用咨询字段集生成查询语句。进而,基于查询语句,在与业务咨询问题所在业务场景相关的业务知识图谱中查找与查询语句相匹配的业务答案。换言之,在本申请实施例中,通过采用与用户输入的业务咨询问题相匹配的概念化模板,来将业务咨询问题转化为与其所在业务场景相关的业务知识图谱能够识别的查询语句的方式,加快了问答的处理速度。从而实现了提升问答处理效率的技术效果,解决了现有技术中存在的问答处理效率较低的技术问题。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例提供的基于知识图谱的问答方法的流程图;
图2是根据本申请实施例提供的基于知识图谱的问答方法的流程图;
图3是根据本申请实施例提供的基于知识图谱的问答方法的流程图;
图4是根据本申请实施例提供的基于知识图谱的问答方法的流程图;
图5是根据本申请实施例提供的基于知识图谱的问答装置的示意图;
图6是根据本申请实施例提供的基于知识图谱的问答电子设备的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,本公开所涉及的相关信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经过各方充分授权的信息和数据。例如,本系统和相关用户或机构间设置有接口,在获取相关信息之前,需要通过接口向前述的用户或机构发送获取请求,并在接收到前述的用户或机构反馈的同意信息后,获取相关信息。
下面结合优选的实施步骤对本发明进行说明,图1是根据本申请实施例提供的基于知识图谱的问答方法的流程图,如图1所示,该方法包括如下步骤:
S102,获取用户当前输入的业务咨询问题;
S104,按照与业务咨询问题相匹配的场景概念化模板,对业务咨询问题的内容进行字段标注,以得到与业务咨询问题相匹配的咨询字段集,其中,咨询字段集包括待处理的咨询内容字段;
S106,使用咨询字段集生成查询语句;
S108,基于查询语句,在与业务咨询问题所在业务场景相关的业务知识图谱中查找与查询语句相匹配的业务答案。
需要说明的是,上述基于知识图谱的问答方法可以但不限于应用于与银行业务相关的问题的问答场景当中。进一步需要说明的是,上述基于知识图谱的问答方法还可以应用于与除了银行业务以外的其他任意业务场景相关的问题的问答场景当中,在本实施例中对此并不进行任何限定。
进一步地,上述用户当前输入的业务咨询问题可以但不限于用于指示与银行业务,或,其他业务相关的咨询问题,在本实施例中对此并不进行任何限定。假设上述业务咨询问题为与银行业务相关的资源问题,上述获取用户当前输入的业务咨询问题可以但不限于包括:通过与银行相关联的业务APP获取用户输入的业务咨询问题,或,通过银行内的智能问答机器获取用户所输入的业务咨询问题等等。
可选地,在本实施例中,上述场景概念化模板(Knowledge Based QuestionAnswering模板,简称KBQA模板)可以但不限于用于,将上述业务咨询问题转化为与业务场景相关的咨询问题意图,其中,上述咨询问题意图能够简洁明了的描述出上述业务咨询问题所对应的含义。举例而言,假设上述业务咨询问题为与银行业务相关的问题,如,“对A银行的开始时间和结束时间不太清楚,请问A银行什么时候开门什么时候下班呢?”,那么上述场景概念化模板则可以为“A银行的营业时间”。
需要说明的是,可以但不限于通过以下方式来获取上述与业务咨询问题相匹配的场景概念化模板:对业务咨询问题进行分词处理,进而将该业务咨询问题进行分词处理后得到的各个分词进行主语、谓语、宾语的标注,并通过预先配置的KBQA同义词库获取与各个分词相匹配的同义词汇。接着,按照主语、谓语、宾语的结构将上述各个分词以及上述各个分词的同义词汇进行组合,以生成多个KBQA模板。然后,根据预先创建的KBQA优先权重库中存储的实体属性等之间的连接权重,从而将连接权重得分最高的KBQA模板作为与业务咨询问题相匹配的场景概念化模板。
进一步地,上述对业务咨询问题的内容进行字段标注可以但不限于包括:提取业务咨询问题相匹配的场景概念化模板的内容中包括的实体关键词、属性描述信息等,进而对上述实体关键词、属性描述信息进行字段标注。
再进一步地,在上述对业务咨询问题的内容进行字段标注之后,上述方法还包括:获取对业务实体关键词配置的约束条件,其中,约束条件用于对业务实体关键词所指示的应用范畴进行约束;利用约束条件生成与咨询内容字段所关联的条件字段,其中,咨询字段集中还包括条件字段。
需要说明的是,上述使用咨询字段集生成查询语句可以但不限于包括:使用咨询字段集生成gremlin查询语句。可选地,在本实施例中,假设上述业务咨询问题为与银行业务相关的问题,那么上述业务知识图谱可以但不限于为基于hugegraph图库生成的与银行业务场景相关的业务知识图谱。
进一步地,上述基于所述查询语句,在与所述业务咨询问题所在业务场景相关的业务知识图谱中查找与所述查询语句相匹配的业务答案包括:获取与场景概念化模板对应的场景标识;在与场景标识相匹配的配置表中,查找与业务场景相关的全局业务知识图谱的存储地址;基于全局业务知识图谱中所记录的业务关系,查找出与查询语句相匹配的业务答案。
需要说明的是,上述场景标识可以但不限于用于指示场景概念化模板的业务场景ID,具体而言,业务场景ID可以但不限于用于唯一标识一个业务场景,一个业务场景下可以对应多个概念化模板。可选地,上述全局业务知识图谱名称可以但不限于用于唯一标识一个全局业务知识图谱。上述全局业务知识图谱可以但不限于存储在指定的机器中的指定位置中,上述全局业务知识图谱的存储地址可以但不限于用于查询全局业务知识图谱在所存储的机器中所存储的位置。
作为一种可选的实施方式,假设上述业务咨询问题为与银行业务相关的问题,由如图2所示的以下步骤对上述方法进行举例说明:
S202,通过与银行相关联的业务APP获取用户输入的业务咨询问题,或,通过银行内的智能问答机器获取用户输入的业务咨询问题;
S204,基于银行业务场景下的KBQA优先权重库、KBQA同义词库以及KBQA概念化模板库,获取与业务咨询问题匹配的场景概念化模板,其中,上述KBQA优先权重库中存储的实体属性等之间的连接权重,上述KBQA同义词库中存储有在银行业务场景下各个词汇所对应的关键词汇。
S206,提取场景概念化模板的内容中包括的业务实体关键词以及属性描述信息,其中,上述业务实体关键词为场景概念化模板中包括的实体所对应的关键词,上述属性描述信息为用于描述上述实体的描述信息;
S208,对业务实体关键词配置与银行业务场景相关的约束条件,进而生成与业务实体关键词所关联的条件字段,其中,上述约束条件用于指示对实体的应用范畴所做的限定条件;
S210,基于业务实体关键词、属性描述信息以及条件字段,生成gremlin查询语句;
S212,利用上述查询语句,在银行业务场景的业务知识图谱中获取到上述业务咨询语句的业务答案;
S214,利用与银行相关联的业务APP,或,银行内的智能问答机器将业务答案返回给用户。
在本申请实施例中,获取用户当前输入的业务咨询问题。然后,按照与业务咨询问题相匹配的场景概念化模板,对业务咨询问题的内容进行字段标注,以得到与业务咨询问题相匹配的咨询字段集,其中,咨询字段集包括待处理的咨询内容字段。接着,使用咨询字段集生成查询语句。进而,基于查询语句,在与业务咨询问题所在业务场景相关的业务知识图谱中查找与查询语句相匹配的业务答案。换言之,在本申请实施例中,通过采用与用户输入的业务咨询问题相匹配的概念化模板,来将业务咨询问题转化为与其所在业务场景相关的业务知识图谱能够识别的查询语句的方式,加快了问答的处理速度。从而实现了提升问答处理效率的技术效果,解决了现有技术中存在的问答处理效率较低的技术问题。
可选地,作为一种可选的方案,按照与业务咨询问题相匹配的场景概念化模板,对业务咨询问题的内容进行字段标注,以得到与业务咨询问题相匹配的咨询字段集包括:
S1,将以自然语言表达的业务咨询问题转化为咨询问题意图;
S2,从咨询问题意图中提取出所要咨询的业务实体关键词和与业务实体关键词相匹配的属性描述信息;
S3,利用业务实体关键词和属性描述信息生成咨询内容字段。
需要说明的是,上述将以自然语言表达的业务咨询问题转化为咨询问题意图可以但不限于用于指示,将以自然语言表达的业务咨询问题转化为与业务咨询问题匹配的场景概念化模板。上述咨询问题意图可以但不限于用于指示上述场景概念化模板。
进一步地,在上述以自然语言表达的业务咨询问题转化为咨询问题意图之前,上述方法还包括:对业务咨询问题进行分词处理,进而将该业务咨询问题进行分词处理后得到的各个分词进行主语、谓语、宾语的标注,并通过预先配置的KBQA同义词库获取与各个分词相匹配的同义词汇。接着,按照主语、谓语、宾语的结构将上述各个分词以及上述各个分词的同义词汇进行组合,以生成多个KBQA模板。然后,根据预先创建的KBQA优先权重库中存储的实体属性等之间的连接权重,从而将连接权重得分最高的KBQA模板作为与业务咨询问题相匹配的场景概念化模板。举例而言,假设上述业务咨询问为“对A银行的开始时间和结束时间不太清楚,请问A银行什么时候开门什么时候下班呢?”,那么上述场景概念化模板则可以为“A银行的营业时间”。
进一步地,上述业务实体关键词可以但不限于包括与业务相关的实体所对应的关键词,如银行业务场景中的“银行”、“网点”、“交易”等词汇。进一步地,上述与业务关键词匹配的属性描述信息可以但不限于用于指示用于描述业务关键词的属性信息,如,与业务关键词“银行”所匹配的属性描述信息可以包括:“营业时间”、“交易内容”等等。
举例而言,假设上述业务咨询问题是与银行业务场景相关的问题,假设上述业务咨询问题为“对A银行的开始时间和结束时间不太清楚,请问A银行什么时候开门什么时候下班呢?”,由以下步骤对上述方法进行举例说明:将咨询问题,即,“对A银行的开始时间和结束时间不太清楚,请问A银行什么时候开门什么时候下班呢?”,转化为场景概念化模板中所包括的内容,即,“A银行的营业时间”。然后,对“A银行的营业时间”进行标注,提取出“A银行的营业时间”中所包括的实体包括:“A银行”,提取出与“A银行”关联的属性为“营业时间”。进而生成content字段[entity_1](即,实体),[entity_property_ontology_1](即,属性)。
在本申请实施例中,将以自然语言表达的业务咨询问题转化为咨询问题意图。进而,从咨询问题意图中提取出所要咨询的业务实体关键词和与业务实体关键词相匹配的属性描述信息。从而,利用业务实体关键词和属性描述信息生成咨询内容字段。换言之,在本申请实施例中,通过对自然语言表达业务咨询问题进行转化、标注的方式,生成咨询内容字段,从而便于提高后续查询语句的生成效率,进而提升了问答处理的效率。
可选地,作为一种可选的方案,在利用业务实体关键词和属性描述信息生成咨询内容字段之后,还包括:
S1,获取对业务实体关键词配置的约束条件,其中,约束条件用于对业务实体关键词所指示的应用范畴进行约束;
S2,利用约束条件生成与咨询内容字段所关联的条件字段,其中,咨询字段集中还包括条件字段。
需要说明的是,上述应用范畴可以但不限于用于指示上述业务实体在其所对应的业务场景中所对应的应用范畴。举例而言,假设上述业务咨询问题为银行业务场景下的咨询问题,那么上述应用范畴则可以包括:业务实体关键词所对应的实体的所在的城市、所办理的业务类型、所办理业务涉及的金额上限等等,在本实施例中对此并不进行任何限定。
举例而言,假设上述业务咨询问题是与银行业务场景相关的问题,假设上述业务咨询问题为“对A银行的开始时间和结束时间不太清楚,请问A银行什么时候开门什么时候下班呢?”,由以下步骤对上述方法进行举例说明:将咨询问题,即,“对A银行的开始时间和结束时间不太清楚,请问A银行什么时候开门什么时候下班呢?”,转化为场景概念化模板中所包括的内容,即,“A银行的营业时间”。然后,对“A银行的营业时间”进行标注,提取出“A银行的营业时间”中所包括的实体包括:“A银行”,提取出与“A银行”关联的属性为“营业时间”。进而生成content(即,标注)字段[entity_1](即,实体),[entity_property_ontology_1](即,属性)。然后,根据上述标注结果,对标注的元素添加约束条件,使得[entity_1](即,实体)必须为A省的实体。进而生成condition(即,条件)字段{“conditionMap”:{“entity_1”:{“elementConditionMap”:{“label”:[“A省”]}}}}。进一步地,基于上述约束条件以及标注结果获取到gremlin查询语句:g.V().has(‘VERTEX_ID’,‘[entity_1.id]’).as(‘a’).select(‘a’).valueMap(true,‘name’,‘VERTEX_ID’).as(‘b’).select(‘b’)。
在本申请实施例中,获取对业务实体关键词配置的约束条件,其中,约束条件用于对业务实体关键词所指示的应用范畴进行约束。然后,利用约束条件生成与咨询内容字段所关联的条件字段,其中,咨询字段集中还包括条件字段。在本申请实施例中,通过对业务实体关键词配置与实体关键词的应用范畴相关的约束条件的方式,获取到特定应用范畴内的业务实体关键词,进而使得最终获取到的业务答案更加准确。从而实现了提高了问答处理的准确性的技术效果。
可选地,作为一种可选的方案,基于查询语句,在与业务咨询问题所在业务场景相关的业务知识图谱中查找与查询语句相匹配的业务答案包括:
S1,获取与场景概念化模板对应的场景标识;
S2,在与场景标识相匹配的配置表中,查找与业务场景相关的全局业务知识图谱的存储地址;
S3,基于全局业务知识图谱中所记录的业务关系,查找出与查询语句相匹配的业务答案。
需要说明的是,上述配置表中可以但不限于包括以下内容:
Kgid,用于指示场景标识;
GraphID,用于指示全局业务知识图谱标识;
OntoJsonData,用于指示全局业务知识图谱的schema结构;
GraphGremlinUrl,用于指示全局业务知识图谱的存储地址。
进一步地,上述场景标识可以但不限于用于指示场景概念化模板的业务场景ID,具体而言,业务场景ID可以但不限于用于标识唯一一个业务场景,一个业务场景下可以对应多个概念化模板。可选地,上述全局业务知识图谱名称可以但不限于用于唯一标识一个全局业务知识图谱。上述全局业务知识图谱可以但不限于存储在指定的机器中的指定位置中,上述全局业务知识图谱的存储地址可以但不限于用于查询全局业务知识图谱在所存储的机器中所存储的位置。
举例而言,假设上述场景概念化模板对应的场景标为“1”,配置表中存储的Kgid为“1”,上述配置表中存储的GraphGremlinUrl为“地址A”,由以下步骤对上述方法进行举例说明:
获取与场景概念化模板对应的场景标识为“1”,进而在场景标识为“1”的配置表中,确定全局业务知识图谱的存储地址为“地址A”。然后在“地址A”中查找到全局业务知识图谱,从而在全局业务知识图谱中查找到与查询语句相匹配的业务答案。
在本申请实施例中,获取与场景概念化模板对应的场景标识。然后,在与场景标识相匹配的配置表中,查找与业务场景相关的全局业务知识图谱的存储地址。从而,基于全局业务知识图谱中所记录的业务关系,查找出与查询语句相匹配的业务答案。换言之,在申请实施例中,通过采用基于场景标识在与场景标识相匹配的配置表中,查找全局业务知识图谱的存储地址的方式,提升了获取到全局业务知识图谱的速度。进而实现了提升问答处理效率的技术效果。
可选地,作为一种可选的方案,在与场景标识相匹配的配置表中,查找与业务场景相关的业务知识图谱的存储地址之前,还包括:
S1,在目标地址存储的目标知识图谱中查找与查询语句相匹配的业务答案,其中,目标知识图谱是全局业务知识图谱中被查询使用的频率高于目标阈值的部分知识图谱;
S2,在目标知识图谱中并未查找到业务答案的情况下,确定在配置表中查找与业务场景相关的业务知识图谱的存储地址。
需要说明的是,在上述目标地址存储的目标知识图谱中查找与查询语句相匹配的业务答案,其中,目标知识图谱是全局业务知识图谱中被查询使用的频率高于目标阈值的部分知识图谱之前,上述方法还包括:确定场景概念化模板的场景标识所对应的业务机器集群,其中,上述业务机器集群中包括多台机器,每台机器上均通过中间件存储有上述目标知识图谱。进而,通过业务机器集群中的主机器来确定当前处于空闲工作状态的目标机器,从而确认目标知识图谱在目标机器中存储目标知识图谱的目标地址,其中,上述空闲工作状态用于指示正在处理的请求数量小于预定阈值。
进一步地需要说明的是,上述配置表可以但不限于存储有以下内容:
Kgid,用于指示场景标识;
GraphID,用于指示全局业务知识图谱标识;
OntoJsonData,用于指示全局业务知识图谱的schema结构;
GraphGremlinUrl,用于指示全局业务知识图谱的存储地址;
EntityEsIndex,用于指示目标知识图谱中常用实体或关键词的索引。
举例而言,假设上述EntityEsIndex为实体的“名称”所对应的索引,由以下步骤对上述方法进行举例说明:确定场景概念化模板的场景标识所对应的业务机器集群,其中,上述业务机器集群中包括多台机器,每台机器上均通过中间件存储有上述目标知识图谱。进而,通过业务机器集群中的主机器确定当前处于空闲工作状态的目标机器,从而确认目标知识图谱在目标机器中存储目标知识图谱的目标地址。进而利用EntityEsIndex在目标知识图谱中查找到业务答案。接着,在目标知识图谱中查找到业务答案的情况下,利用与银行相关联的业务APP,或,银行内的智能问答机器将业务答案返回给用户。在目标知识图谱中并未查找到业务答案的情况下,确定在配置表中查找与业务场景相关的全局业务知识图谱的存储地址。进而在全局业务知识图谱中查找业务答案。
在本申请实施例中,在目标地址存储的目标知识图谱中查找与查询语句相匹配的业务答案,其中,目标知识图谱是全局业务知识图谱中被查询使用的频率高于目标阈值的部分知识图谱。然后,在目标知识图谱中并未查找到业务答案的情况下,确定在配置表中查找与业务场景相关的业务知识图谱的存储地址。换言之,在本申请实施例中,通过采用优先在目标知识图谱中查找与查询语句相匹配的业务答案,在查找失败的情况下再通过该全局业务知识图谱查找业务答案的方式,减轻了全局业务知识图谱的处理压力,提升了问答的处理效率。
可选地,作为一种可选的方案,在获取用户当前输入的业务咨询问题之前,还包括:
S1,获取银行业务场景下收集的咨询问题集合,其中,咨询问题集合中的每个咨询问题内均各自包括:待咨询的业务实体关键词,以及与业务实体关键词相匹配的属性描述信息;
S2,将咨询问题集合中包含的不同的业务实体关键词分别转化为业务知识图谱中的节点;
S3,基于业务实体关键词和属性描述信息之间的关系,生成节点之间的连线;
S4,将节点和连线按照schema结构生成业务知识图谱,并为业务知识图谱生成配置表,其中,配置表用于存储业务知识图谱的存储地址与银行业务场景的场景标识之间的映射关系。
需要说明的是,上述业务实体关键词可以但不限于包括与业务相关的实体所对应的关键词,如银行业务场景中的“银行”、“网点”、“交易”等词汇。进一步地,上述与业务关键词匹配的属性描述信息可以但不限于用于指示用于描述业务关键词的属性信息,如,与业务关键词“银行”所匹配的属性描述信息可以包括:“营业时间”、“交易内容”等等。
可选地,上述将节点和连线按照schema结构生成业务知识图谱包括:将业务知识图谱中包括的图数据与hugegraph图库中存储的元数据设置映射关系。其中,上述图数据用于指示业务知识图谱中包括的元素(如,实体、属性等等),上述元数据用于指示与业务知识图谱中包括的元素所相近的扩展元素。举例而言,假设上述业务知识图谱中包括的元素为“人”,那么上述元数据则可以为“男人”、“女人”、“成年人”等等。
进一步地,在上述将节点和连线按照schema结构生成业务知识图谱之后,上述方法可以但不限于包括:将业务知识图谱导入至hugegraph图库中。
在本申请实施例中,获取银行业务场景下收集的咨询问题集合,其中,咨询问题集合中的每个咨询问题内均各自包括:待咨询的业务实体关键词,以及与业务实体关键词相匹配的属性描述信息。然后,将咨询问题集合中包含的不同的业务实体关键词分别转化为业务知识图谱中的节点。进而,基于业务实体关键词和属性描述信息之间的关系,生成节点之间的连线。从而,将节点和连线按照schema结构生成业务知识图谱,并为业务知识图谱生成配置表,其中,配置表用于存储业务知识图谱的存储地址与银行业务场景的场景标识之间的映射关系。换言之,在本申请实施例中,通过构建与银行业务场景关联的业务知识图谱的方式,使得基于该业务知识图谱获取到的业务答案更加准确,且获取的速度更加快速。进而实现了提升问答处理的准确性以处理效率的技术效果。
可选地,作为一种可选的方案,在所获取银行业务场景下收集的咨询问题集合之后,包括:
获取基础场景概念化模板;
根据咨询问题集合对基础场景概念化模板进行扩展或修改,得到与银行业务场景相匹配的场景概念化模板。
可选地,在上述获取基础场景概念化模板之前,上述方法还可以但不限于包括以下步骤:
1)配置kbqa_pro_mask_template(即,KBQA概念化模板库)的配置参数,其中,概念化模板库用于提供概念化模板,概念化模板库的配置参数可以但不限于包括:name:概念化模板的内容、content:咨询内容字段、condition:条件字段、gremlin:gremlin查询命令。
2)构建kbqa_ontology_synonym(即,KBQA本体同义词库),其中,KBQA本体同义词库中配置了本体级别的同义词。
3)构建kbqa_prior_probability_weight(即,KBQA权重库),其中,KBQA权重库中配置了不同类型实体的连接权重值。
需要说明的是,上述基础场景概念化模板可以但不限于用于指示初始化的KBQA概念化模板。上述根据咨询问题集合对基础场景概念化模板进行扩展或修改,得到与银行业务场景相匹配的场景概念化模板可以但不限于包括:根据银行业务场景中所涉及的实体以及实体描述信息对初始化的概念化模板中所包括的实体以及属性描述信息进行修改与扩展。举例而言,假设基础场景概念化模板中包括实体“银行”,那么可以对该实体进行扩展如扩展为“储蓄机构”、“金融机构”、“Bank”等等。
在本申请实施例中,获取基础场景概念化模板,进而根据咨询问题集合对基础场景概念化模板进行扩展或修改,得到与银行业务场景相匹配的场景概念化模板。也就是说,在本申请实施例中,通过基于与银行业务场景相关的咨询问题集合,对基础场景概念化模板进行扩展和修改。进而使得后续按照场景概念化模板对业务咨询问题进行处理后的咨询内容字段更加准确,从而实现了提高问答处理的准确性的技术效果。
可选地,作为一种可选的实施方式,由如图3所示的以下步骤对上述基于知识图谱的问答方法进行完整的解释说明:
S302,构建知识图谱,具体而言,构建与业务场景相关的知识图谱。
S304,构建概念化知识库,具体而言,构建与业务场景相关的概念化知识库。
S306,问答处理,具体而言,基于已经构建好的知识图谱以及概念化知识库对用户所提出的问题进行处理,进而生成与该问题匹配的答案。
在本申请实施例中,基于知识图谱以及概念化知识库对用户所提出的问题进行处理,达到了自动化地生成用户所提出问题所对应的答案的目的。进而实现了提高问答处理效率的技术效果。
可选地,作为一种可选的实施方式,由如图4所示的以下步骤对上述基于知识图谱的问答方法进行完整的解释说明:
S402,根据场景与问答需求,构建知识图谱,如,问答需求为网点咨询相关的客服问题,则该图谱中的实体可包含网点、省市、日期等,将联系电话、地址、机构代码等信息作为网点实体的属性,图谱中的关系可包含:网点与日期的营业时间关系、网点与省市的所属关系等,同时需要指定边的起始点以及终止点,如将网点设置为起始点,省市设置为终止点。
S404,将知识图谱的点边关系转换为hugegraph支持的图谱schema结构。
S406,将知识图谱导入到hugegraph图库中,并构建KBQA与知识图谱所对应的映射表。
S408,配置KBQA所需的场景相关参数。
S410,问答处理,具体而言,基于已经构建好的知识图谱以及概念化知识库对用户所提出的问题进行处理,进而生成与该问题匹配的答案。
在本申请实施例中,提供了一站式构建基于hugegraph图库的知识图谱智能问答系统的方法,降低了用户的使用门槛,并通过底层图库使用hugegraph,提供对数据的存储以及毫秒级的关联关系查询能力,使用户可以更为便捷的进行图谱问答配置。
可选地,作为一种可选的实施方式,由以下步骤对上述基于知识图谱的问答方法进行完整的解释说明:
步骤一:根据场景与问答需求,构建相关的知识图谱,即图谱构建。例如,问答需求为网点咨询相关的客服问题,则该图谱中的实体可包含网点、省市、日期等,将联系电话、地址、机构代码等信息作为网点实体的属性。图谱中的关系可包含:网点与日期的营业时间关系、网点与省市的所属关系等,同时需要指定边的起始点以及终止点,如将网点设置为起始点,省市设置为终止点。将这些点边关系转换为hugegraph支持的图谱schema结构。其中图谱schema结构包括图的元数据定义以及图数据和元数据的映射关系。构建好图谱schema后,将数据导入到图谱中,同时生成后续KBQA所需的场景相关参数并写入数据库的配置表中,其中,上述配置表中包括以下内容:
Kgid:KBQA的场景id;
project_id:KBQA的项目idversion_id:与kg_id一致;
EntityEsIndexName:图谱的es索引;
PropertyEsIndexName:图谱的es索引;
GraphID:图谱名称;
OntoJsonData:图的schema结构;
GraphGremlinUrl:场景对应的gremlin查询url。
步骤二:构建概念化知识库。概念化知识库要由以下3部分组成:
1)kbqa_pro_mask_template:KBQA概念化模板库,配置了问题查询模板。KBQA概念化模板库基于基本的模板配置方法进行了扩展与改进,增加了条件、命令参数等。改方法可以快速方便适应复杂场景的需求,同时降低模板的配置数量,提高问答效率。
概念化模板库由以下参数构成:
name:这个问题模板的名称,eg:A网点的营业时间;
content:新增的模板的内,其中包括:
eg:[entity_1]的[relation_ontology_1];
condition:新增模板的模板条件,eg:Ent.id==XXX,Ent.label in[xx,yy,zz];
gremlin:新增模板对应的gremlin查询命令。
2)kbqa_ontology_synonym:KBQA本体同义词库,配置了本体级别的同义词。
3)kbqa_prior_probability_weight:KBQA权重库,配置了实体连接时,不同类型实体的连接权重值。
步骤三:用户进行智能问答体验。用户输入自然语言的查询意图,也就是name参数字段的内容,系统自动生成content、condition以及gremlin参数字段。
1)用户输入问题意图,例如“A网点的营业时间”。
2)用户对意图进行标注,例如选中“A网点”标注为实体,“营业时间”标注为属性。生成content字段:[entity_1][entity_property_ontology_1]。
3)用户选择约束条件,根据(2)中的标注结果,可以对标注的元素添加约束条件,例如[entity_1]必须为网点或省市实体类型,经过这一步,生成condition字段:
{“conditionMap”:{“entity_1”:{“elementConditionMap”:{“label”:[“网点”,“省市”]}}}}。
4)生成gremlin查询语句至hugegraph端查出最终结果,根据2)-3)步骤的结构,自动填充生成gremlin查询语句:g.V().has(‘VERTEX_ID’,‘[entity_1.id]’).as(‘a’).select(‘a’).valueMap(true,‘name’,‘VERTEX_ID’).as(‘b’).select(‘b’)。
在本申请实施例中,提供了一站式构建基于hugegraph图库的知识图谱智能问答系统的方法,降低了用户的使用门槛,并通过底层图库使用hugegraph,提供对数据的存储以及毫秒级的关联关系查询能力,使用户可以更为便捷的进行图谱问答配置。
可选地,作为一种可选的实施方式,以下步骤对上述基于知识图谱的问答方法进行完整的解释说明:
S1,预先基于hugegraph构建知识图谱,将知识图谱中常用的部分内容存在中间件内。
S2,预先构建场景下的KBQA银行场景库,KBQA场景库里面有多个KBQA模板。
S3,获取银行场景下的用户输入的问题A:“也不知道有谁能够告诉我A网络固定点都什么时候开门啊?”。
S4,利用银行场景的KBQA模板1,将问题A转化为“A网点的营业时间”。
S5,提取“A网点的营业时间”中的实体为“A网点”、属性“营业时间”。
S6,为实体“A网点”限定条件为必须隶属于A市。
S7,基于实体“A网点”、属性“营业时间”,限定条件必须隶属于A市,生成gremlin查询语句B。
S8,基于KBQA模板所对应的KBQA银行场景id,找到KBQA场景库所对应的配置表。
S9,在配置表中找到实体的索引,进而基于索引在中间件中查找答案。
S10,如果基于查询语句B在中间件中查找到了用户问题所对应的答案,则将该答案返回给用户。
S11,如果基于查询语句B在中间件中没找到答案,则获取基于hugegraph构建知识图谱的URL地址。
S12,基于该地址找到基于hugegraph构建知识图谱。
S13,基于查询语句B在基于hugegraph构建知识图谱中查询问题的答案为:每天的10:00。
在本申请实施例中,提供了一站式构建基于hugegraph图库的知识图谱智能问答系统的方法,降低了用户的使用门槛,并通过底层图库使用hugegraph,提供对数据的存储以及毫秒级的关联关系查询能力,使用户可以更为便捷的进行图谱问答配置。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例还提供了基于知识图谱的问答装置,需要说明的是,本申请实施例的基于知识图谱的问答装置可以用于执行本申请实施例所提供的用于基于知识图谱的问答方法。以下对本申请实施例提供的基于知识图谱的问答装置进行介绍。
图5是根据本申请实施例的基于知识图谱的问答装置的示意图。如图5所示,该装置包括:
获取单元502,用于获取用户当前输入的业务咨询问题;
标注单元504,用于按照与所述业务咨询问题相匹配的场景概念化模板,对所述业务咨询问题的内容进行字段标注,以得到与所述业务咨询问题相匹配的咨询字段集,其中,所述咨询字段集包括待处理的咨询内容字段;
生成单元506,用于使用所述咨询字段集生成查询语句;
查找单元508,用于基于所述查询语句,在与所述业务咨询问题所在业务场景相关的业务知识图谱中查找与所述查询语句相匹配的业务答案。
可选地,作为一种可选的方案,上述标注单元包括:
第一转化模块,用于将以自然语言表达的业务咨询问题转化为咨询问题意图;
第一提取模块,用于从咨询问题意图中提取出所要咨询的业务实体关键词和与业务实体关键词相匹配的属性描述信息;
第一生成模块。用于利用业务实体关键词和属性描述信息生成咨询内容字段。
可选地,作为一种可选的方案,上述标注单元还包括:
第一获取模块,用于获取对业务实体关键词配置的约束条件,其中,约束条件用于对业务实体关键词所指示的应用范畴进行约束;
第二生成模块,用于利用约束条件生成与咨询内容字段所关联的条件字段,其中,咨询字段集中还包括条件字段。
可选地,作为一种可选的方案,上述查找单元包括:
第二获取模块,用于获取与场景概念化模板对应的场景标识;
第一查找模块,用于在与场景标识相匹配的配置表中,查找与业务场景相关的全局业务知识图谱的存储地址;
第二查找模块,用于基于全局业务知识图谱中所记录的业务关系,查找出与查询语句相匹配的业务答案。
可选地,作为一种可选的方案,上述查找单元还包括:
第三查找模块,用于在目标地址存储的目标知识图谱中查找与查询语句相匹配的业务答案,其中,目标知识图谱是全局业务知识图谱中被查询使用的频率高于目标阈值的部分知识图谱;
第一确定模块,用于在目标知识图谱中并未查找到业务答案的情况下,确定在配置表中查找与业务场景相关的业务知识图谱的存储地址。
可选地,作为一种可选的方案,上述装置还包括:
第一获取单元,用于获取银行业务场景下收集的咨询问题集合,其中,咨询问题集合中的每个咨询问题内均各自包括:待咨询的业务实体关键词,以及与业务实体关键词相匹配的属性描述信息;
转化单元,用于将咨询问题集合中包含的不同的业务实体关键词分别转化为业务知识图谱中的节点;
第一生成单元,用于基于业务实体关键词和属性描述信息之间的关系,生成节点之间的连线;
第二生成单元,用于将节点和连线按照schema结构生成业务知识图谱,并为业务知识图谱生成配置表,其中,配置表用于存储业务知识图谱的存储地址与银行业务场景的场景标识之间的映射关系。
可选地,作为一种可选的方案,上述装置还包括:
第二获取单元,用于获取基础场景概念化模板;
第三获取单元,用于根据咨询问题集合对基础场景概念化模板进行扩展或修改,得到与银行业务场景相匹配的场景概念化模板。
本申请实施例提供的基于知识图谱的问答装置,获取用户当前输入的业务咨询问题。然后,按照与业务咨询问题相匹配的场景概念化模板,对业务咨询问题的内容进行字段标注,以得到与业务咨询问题相匹配的咨询字段集,其中,咨询字段集包括待处理的咨询内容字段。接着,使用咨询字段集生成查询语句。进而,基于查询语句,在与业务咨询问题所在业务场景相关的业务知识图谱中查找与查询语句相匹配的业务答案。换言之,在本申请实施例中,通过采用与用户输入的业务咨询问题相匹配的概念化模板,来将业务咨询问题转化为与其所在业务场景相关的业务知识图谱能够识别的查询语句的方式,加快了问答的处理速度。从而实现了提升问答处理效率的技术效果,解决了现有技术中存在的问答处理效率较低的技术问题。
上述基于知识图谱的问答装置包括处理器和存储器,获取单元、标注单元、生成单元、查找单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来保障质心点选取的均匀性,从而提高聚类的准确性。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现基于知识图谱的问答方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述基于知识图谱的问答方法。
如图6所示,本发明实施例提供了一种电子设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:获取用户当前输入的业务咨询问题;
S1,按照与业务咨询问题相匹配的场景概念化模板,对业务咨询问题的内容进行字段标注,以得到与业务咨询问题相匹配的咨询字段集,其中,咨询字段集包括待处理的咨询内容字段;
S2,使用咨询字段集生成查询语句;
S3,基于查询语句,在与业务咨询问题所在业务场景相关的业务知识图谱中查找与查询语句相匹配的业务答案。
作为一种可选的方案,按照与业务咨询问题相匹配的场景概念化模板,对业务咨询问题的内容进行字段标注,以得到与业务咨询问题相匹配的咨询字段集包括:将以自然语言表达的业务咨询问题转化为咨询问题意图;从咨询问题意图中提取出所要咨询的业务实体关键词和与业务实体关键词相匹配的属性描述信息;利用业务实体关键词和属性描述信息生成咨询内容字段。
作为一种可选的方案,在利用业务实体关键词和属性描述信息生成咨询内容字段之后,还包括:获取对业务实体关键词配置的约束条件,其中,约束条件用于对业务实体关键词所指示的应用范畴进行约束;利用约束条件生成与咨询内容字段所关联的条件字段,其中,咨询字段集中还包括条件字段。
作为一种可选的方案,基于查询语句,在与业务咨询问题所在业务场景相关的业务知识图谱中查找与查询语句相匹配的业务答案包括:获取与场景概念化模板对应的场景标识;在与场景标识相匹配的配置表中,查找与业务场景相关的全局业务知识图谱的存储地址;基于全局业务知识图谱中所记录的业务关系,查找出与查询语句相匹配的业务答案。
作为一种可选的方案,在与场景标识相匹配的配置表中,查找与业务场景相关的业务知识图谱的存储地址之前,还包括:在目标地址存储的目标知识图谱中查找与查询语句相匹配的业务答案,其中,目标知识图谱是全局业务知识图谱中被查询使用的频率高于目标阈值的部分知识图谱;在目标知识图谱中并未查找到业务答案的情况下,确定在配置表中查找与业务场景相关的业务知识图谱的存储地址。
作为一种可选的方案,在获取用户当前输入的业务咨询问题之前,还包括:获取银行业务场景下收集的咨询问题集合,其中,咨询问题集合中的每个咨询问题内均各自包括:待咨询的业务实体关键词,以及与业务实体关键词相匹配的属性描述信息;将咨询问题集合中包含的不同的业务实体关键词分别转化为业务知识图谱中的节点;基于业务实体关键词和属性描述信息之间的关系,生成节点之间的连线;将节点和连线按照schema结构生成业务知识图谱,并为业务知识图谱生成配置表,其中,配置表用于存储业务知识图谱的存储地址与银行业务场景的场景标识之间的映射关系。
作为一种可选的方案,在所获取银行业务场景下收集的咨询问题集合之后,包括:获取基础场景概念化模板;根据咨询问题集合对基础场景概念化模板进行扩展或修改,得到与银行业务场景相匹配的场景概念化模板。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种基于知识图谱的问答方法,其特征在于,包括:
获取用户当前输入的业务咨询问题;
按照与所述业务咨询问题相匹配的场景概念化模板,对所述业务咨询问题的内容进行字段标注,以得到与所述业务咨询问题相匹配的咨询字段集,其中,所述咨询字段集包括待处理的咨询内容字段;
使用所述咨询字段集生成查询语句;
基于所述查询语句,在与所述业务咨询问题所在业务场景相关的业务知识图谱中查找与所述查询语句相匹配的业务答案。
2.根据权利要求1所述的方法,其特征在于,按照与所述业务咨询问题相匹配的场景概念化模板,对所述业务咨询问题的内容进行字段标注,以得到与所述业务咨询问题相匹配的咨询字段集包括:
将以自然语言表达的所述业务咨询问题转化为咨询问题意图;
从所述咨询问题意图中提取出所要咨询的业务实体关键词和与所述业务实体关键词相匹配的属性描述信息;
利用所述业务实体关键词和所述属性描述信息生成所述咨询内容字段。
3.根据权利要求2所述的方法,其特征在于,在所述利用所述业务实体关键词和所述属性描述信息生成所述咨询内容字段之后,还包括:
获取对所述业务实体关键词配置的约束条件,其中,所述约束条件用于对所述业务实体关键词所指示的应用范畴进行约束;
利用所述约束条件生成与所述咨询内容字段所关联的条件字段,其中,所述咨询字段集中还包括所述条件字段。
4.根据权利要求1所述的方法,其特征在于,所述基于所述查询语句,在与所述业务咨询问题所在业务场景相关的业务知识图谱中查找与所述查询语句相匹配的业务答案包括:
获取与所述场景概念化模板对应的场景标识;
在与所述场景标识相匹配的配置表中,查找与所述业务场景相关的全局业务知识图谱的存储地址;
基于所述全局业务知识图谱中所记录的业务关系,查找出与所述查询语句相匹配的所述业务答案。
5.根据权利要求4所述的方法,其特征在于,在与所述场景标识相匹配的配置表中,查找与所述业务场景相关的业务知识图谱的存储地址之前,还包括:
在目标地址存储的目标知识图谱中查找与所述查询语句相匹配的所述业务答案,其中,所述目标知识图谱是所述全局业务知识图谱中被查询使用的频率高于目标阈值的部分知识图谱;
在所述目标知识图谱中并未查找到所述业务答案的情况下,确定在所述配置表中查找与所述业务场景相关的业务知识图谱的所述存储地址。
6.根据权利要求1至5中任一项所述的方法,其特征在于,在所述获取用户当前输入的业务咨询问题之前,还包括:
获取银行业务场景下收集的咨询问题集合,其中,所述咨询问题集合中的每个咨询问题内均各自包括:待咨询的业务实体关键词,以及与所述业务实体关键词相匹配的属性描述信息;
将所述咨询问题集合中包含的不同的所述业务实体关键词分别转化为业务知识图谱中的节点;
基于所述业务实体关键词和所述属性描述信息之间的关系,生成所述节点之间的连线;
将所述节点和所述连线按照schema结构生成所述业务知识图谱,并为所述业务知识图谱生成配置表,其中,所述配置表用于存储所述业务知识图谱的存储地址与所述银行业务场景的场景标识之间的映射关系。
7.根据权利要求6所述的方法,其特征在于,在所获取银行业务场景下收集的咨询问题集合之后,包括:
获取基础场景概念化模板;
根据所述咨询问题集合对所述基础场景概念化模板进行扩展或修改,得到与所述银行业务场景相匹配的场景概念化模板。
8.一种基于知识图谱的问答装置,其特征在于,包括:
获取单元,用于获取用户当前输入的业务咨询问题;
标注单元,用于按照与所述业务咨询问题相匹配的场景概念化模板,对所述业务咨询问题的内容进行字段标注,以得到与所述业务咨询问题相匹配的咨询字段集,其中,所述咨询字段集包括待处理的咨询内容字段;
生成单元,用于使用所述咨询字段集生成查询语句;
查找单元,用于基于所述查询语句,在与所述业务咨询问题所在业务场景相关的业务知识图谱中查找与所述查询语句相匹配的业务答案。
9.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至7中任意一项所述的方法。
10.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至7中任意一项所述的方法。
CN202311008267.0A 2023-08-10 2023-08-10 基于知识图谱的问答方法、装置和处理器及电子设备 Pending CN117056482A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311008267.0A CN117056482A (zh) 2023-08-10 2023-08-10 基于知识图谱的问答方法、装置和处理器及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311008267.0A CN117056482A (zh) 2023-08-10 2023-08-10 基于知识图谱的问答方法、装置和处理器及电子设备

Publications (1)

Publication Number Publication Date
CN117056482A true CN117056482A (zh) 2023-11-14

Family

ID=88652888

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311008267.0A Pending CN117056482A (zh) 2023-08-10 2023-08-10 基于知识图谱的问答方法、装置和处理器及电子设备

Country Status (1)

Country Link
CN (1) CN117056482A (zh)

Similar Documents

Publication Publication Date Title
WO2019200752A1 (zh) 基于语义理解的兴趣点查询方法、装置和计算机设备
CN110321408B (zh) 基于知识图谱的搜索方法、装置、计算机设备和存储介质
US10289717B2 (en) Semantic search apparatus and method using mobile terminal
US8862566B2 (en) Systems and methods for intelligent parallel searching
TWI652584B (zh) 文本資訊的匹配、業務對象的推送方法和裝置
US20100318537A1 (en) Providing knowledge content to users
CN109145110B (zh) 标签查询方法和装置
JP2013541793A (ja) マルチモード検索クエリー入力手法
CN105550206B (zh) 结构化查询语句的版本控制方法及装置
CN111539197A (zh) 文本匹配方法和装置以及计算机系统和可读存储介质
CN116737915B (zh) 基于知识图谱的语义检索方法、装置、设备及存储介质
CN111339277A (zh) 基于机器学习的问答交互方法及装置
CN110969022A (zh) 语义确定方法及相关设备
US12008047B2 (en) Providing an object-based response to a natural language query
CN113254630B (zh) 一种面向全球综合观测成果的领域知识图谱推荐方法
CN111625638B (zh) 一种问句处理方法、装置、设备及可读存储介质
US8700624B1 (en) Collaborative search apps platform for web search
CN112966053A (zh) 一种基于知识图谱的海洋领域专家库构建方法及装置
US10866944B2 (en) Reconciled data storage system
CN114253990A (zh) 数据库查询方法、装置、计算机设备和存储介质
CN117033744A (zh) 数据查询方法、装置、存储介质以及电子设备
CN111783425B (zh) 基于句法分析模型的意图识别方法及相关装置
CN117033534A (zh) 地理信息处理方法、装置、计算机设备和存储介质
CN117112595A (zh) 一种信息查询方法、装置、电子设备及存储介质
US11314793B2 (en) Query processing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination