CN116414996A - 基于知识图谱的问题查询方法、装置及电子设备 - Google Patents

基于知识图谱的问题查询方法、装置及电子设备 Download PDF

Info

Publication number
CN116414996A
CN116414996A CN202111661454.XA CN202111661454A CN116414996A CN 116414996 A CN116414996 A CN 116414996A CN 202111661454 A CN202111661454 A CN 202111661454A CN 116414996 A CN116414996 A CN 116414996A
Authority
CN
China
Prior art keywords
entity
attribute
query
target
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111661454.XA
Other languages
English (en)
Inventor
陶冶
陈伟
谢佳雨
王雅云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
4Paradigm Beijing Technology Co Ltd
Original Assignee
4Paradigm Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 4Paradigm Beijing Technology Co Ltd filed Critical 4Paradigm Beijing Technology Co Ltd
Priority to CN202111661454.XA priority Critical patent/CN116414996A/zh
Publication of CN116414996A publication Critical patent/CN116414996A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开涉及一种基于知识图谱的问题查询方法、装置及电子设备,尤其涉及人工智能技术领域。包括:获取问题查询文本对应的NLP文本分类;根据问题查询文本,获取与NLP文本分类对应的至少一个目标实体;基于至少一个目标实体,从知识图谱数据库中确定匹配的问题查询结果,知识图谱数据库为将数据构建为知识图谱结构的数据库;根据问题查询结果和问题查询文本,生成最终查询结果。

Description

基于知识图谱的问题查询方法、装置及电子设备
技术领域
本公开涉及人工智能技术领域,尤其涉及一种基于知识图谱的问题查询方法、装置及电子设备。
背景技术
目前的智能问答系统已经在多个行业中应用,目前智能问答系统中主要的应用方式为常见问题解答(Frequently Asked Questions,FAQ)对的形式,即提前由人工指定一些问题,以及这些问题的答案,当用户的进行问题查询时,如果提问能与提前准备的FAQ对中的问题匹配上时,则自动为用户输出对应的答案。在实际应用中,FAQ对的形式需要大量的人力梳理问题和答案,该方式实现时需要较高人力成本,并且由于能够存储的FAQ对有限,该方式在实际应用中匹配到答案(即查询结果)的概率较低,因此目前亟需一种低人力成本和高匹配概率的问题查询方法。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种基于知识图谱的问题查询方法、装置及电子设备,可以节省人力成本,并且提高问题匹配到查询结果的概率。
为了实现上述目的,本公开实施例提供的技术方案如下:
第一方面,提供一种基于知识图谱的问题查询方法,包括:
获取问题查询文本对应的NLP文本分类;
根据所述问题查询文本,获取与所述NLP文本分类对应的至少一个目标实体;
基于所述至少一个目标实体,从知识图谱数据库中确定匹配的问题查询结果,所述知识图谱数据库为将数据构建为知识图谱结构的数据库;
根据所述问题查询结果和所述问题查询文本,生成最终查询结果。
作为本公开实施例一种可选的实施方式,所述NLP文本分类包括以下至少一种:
属性值查询、属性比较值查询、属性最值查询、属性判断查询、实体关系查询、实体集合查询。
作为本公开实施例一种可选的实施方式,所述NLP文本分类包括以下至少一种:
所述属性值查询、所述属性比较值查询、所述属性最值查询、所述属性判断查询;
所述方法还包括:
从所述问题查询文本中,提取与所述NLP文本分类对应的至少一个属性,其中,所述至少一个目标实体中每个目标实体对应所述至少一个属性中的一个或多个属性;
所述基于所述至少一个目标实体,从网状知识结构中确定匹配的问题查询结果,包括:
基于所述至少一个目标实体和所述至少一个属性,从所述网状知识结构中确定匹配的所述问题查询结果。
作为本公开实施例一种可选的实施方式,所述NLP文本分类为属性值查询,所述至少一个目标实体为第一实体,所述至少一个属性为第一属性;
所述基于所述至少一个目标实体和所述至少一个属性,从网状知识结构中确定匹配的问题查询结果,包括:
从所述网状知识结构中,确定与所述第一实体匹配的至少一个第二实体,所述至少一个第二实体为与所述第一实体的第一相似度参数大于第一预设参数的实体;
获取所述至少一个第二实体一阶关联的多个关系名称;
分别确定所述多个关系名称与所述第一属性的第二相似度参数;
从所述多个关系名称中,确定总相似度参数的最大值所对应的目标关系名称,所述总相似度参数为所述第一相似度参数与所述第二相似度参数的和;
根据所述目标关系名称对应的第一节点,确定所述第一实体的第一属性值,所述第一属性值为所述第一属性的取值;
将所述第一属性值作为所述问题查询结果。
作为本公开实施例一种可选的实施方式,所述NLP文本分类为属性判断查询,所述至少一个目标实体为第二实体,所述至少一个属性为第二属性;
所述基于所述至少一个目标实体和所述至少一个属性,从网状知识结构中确定匹配的问题查询结果,包括:
在所述网状知识结构中,确定所述第二实体一阶关联的多个第二节点;
基于所述多个第二节点中是否存在与所述第二属性匹配的节点,获取属性判断结果,所述属性判断结果用于表征所述第二实体是否符合所述第二属性;
将所述属性判断结果,作为所述问题查询结果。
作为本公开实施例一种可选的实施方式,所述NLP文本分类包括:属性比较值查询,和/或,属性最值查询;
所述方法还包括:
从所述问题查询文本中,提取与所述NLP文本分类对应的属性关系;
其中,所述属性关系包括:比较关系,和/或,最值关系。
所述基于所述至少一个目标实体,从网状知识结构中确定匹配的问题查询结果,包括:
基于所述至少一个目标实体、所述至少一个属性以及所述属性关系,从所述网状知识结构中确定匹配的所述问题查询结果。
作为本公开实施例一种可选的实施方式,所述NLP文本分类为属性比较值查询,所述至少一个目标实体包括第三实体和第四实体,所述至少一个属性为第三属性,所述属性关系为比较关系;
所述基于所述至少一个目标实体、所述至少一个属性以及所述属性关系,从所述网状知识结构中确定匹配的所述问题查询结果,包括:
从所述知识图谱数据库中,查询所述第三实体的第三属性值,以及所述第四实体的第三属性值,所述第三属性值为所述第三属性的取值;
基于所述比较关系,确定所述第三实体的第三属性值与所述第四实体的第三属性值的比较结果;
将所述比较关系结果作为所述问题查询结果。
作为本公开实施例一种可选的实施方式,所述NLP文本分类为属性最值查询,所述至少一个目标实体为第五实体,所述至少一个属性为第四属性,所述属性关系为最值关系;
所述基于所述至少一个目标实体、所述至少一个属性以及所述属性关系,从所述网状知识结构中确定匹配的所述问题查询结果,包括:
从所述知识图谱数据库中,查询与所述第五实体匹配的目标信息,所述目标信息为描述信息或标签信息;
确定与所述目标信息一阶关联的至少一个第六实体;
从所述至少一个第六实体一阶关联的多个关系名称中,为每个第六实体确定与所述第四属性匹配的第一关系名称;
基于所述最值关系,从所述至少一个第六实体中确定最值实体,所述最值实体为所述第一关系名称对应的节点为最值的第六实体;
将所述最值实体作为所述问题查询结果。
作为本公开实施例一种可选的实施方式,所述NLP文本分类为实体关系查询,所述至少一个目标实体为第七实体和第八实体;
所述基于所述至少一个目标实体,从网状知识结构中确定匹配的问题查询结果,包括:
从所述知识图谱数据库中,确定所述第七实体一阶关联的多个节点;
从所述第七实体一阶关联的多个节点中,确定与所述第八实体匹配的第二节点;
将所述第二节点对应的一阶关联信息,确定为所述第七实体与所述第八实体之间的目标关系信息,将所述目标关系信息作为所述问题查询结果。
作为本公开实施例一种可选的实施方式,所述NLP文本分类为实体集合查询,所述至少一个目标实体为第九实体;
所述基于所述至少一个目标实体,从网状知识结构中确定匹配的问题查询结果,包括:
从所述知识图谱数据库中,确定所述第九实体一阶关联的多个节点;
从所述第九实体一阶关联的多个节点中,确定目标类型的第三节点,所述目标类型包括描述节点类型和标签节点类型;
获取所述第三节点一阶关联的所有实体的实体集合,将所述实体集合作为所述问题查询结果。
作为本公开实施例一种可选的实施方式,所述获取问题查询文本对应的NLP文本分类,包括:
将所述问题查询文本输入预置的NLP分类模型获取所述NLP分类模型输出的,与所述问题查询文本对应的NLP文本分类。
作为本公开实施例一种可选的实施方式,所述基于所述至少一个目标实体,从网状知识结构中确定匹配的问题查询结果,包括:
基于所述至少一个目标实体,生成至少一个查询语句;
从网状知识结构中,确定与所述至少一个查询语句匹配的问题查询结果。
作为本公开实施例一种可选的实施方式,所述基于所述至少一个目标实体,生成至少一个查询语句,包括:
获取与所述NLP文本分类对应的目标查询语句模板;
根据所述至少一个目标实体,以及所述目标查询语句模板,生成所述至少一个查询语句。
作为本公开实施例一种可选的实施方式,所述基于所述至少一个目标实体,生成至少一个查询语句,包括:
将所述至少一个目标实体中每个目标实体进行泛化处理,以得到多个目标实体;
基于所述多个目标实体,生成对应的所述多个查询语句。
作为本公开实施例一种可选的实施方式,所述根据所述问题查询文本,获取与所述NLP文本分类对应的至少一个目标实体,包括:
根据所述问题查询文本,获取与所述NLP文本分类对应的至少一个初始实体;
若存在与目标初始实体对应保存的正确实体,则将所述至少一个初始实体中的所述目标初始实体替换为所述正确实体,以获取所述至少一个目标实体;
其中,所述目标初始实体为所述至少一个初始实体中的任一实体。
作为本公开实施例一种可选的实施方式,所述知识图谱数据库为通过自然语言处理模型,基于大量非结构化数据,和/或,结构化数据进行数据处理后得到的。
第二方面,提供一种问题查询装置,包括:
获取模块,用于获取问题查询文本对应的NLP文本分类;
根据所述问题查询文本,获取与所述NLP文本分类对应的至少一个目标实体;
确定模块,用于基于所述至少一个目标实体,从知识图谱数据库中确定匹配的问题查询结果,所述知识图谱数据库为将数据构建为知识图谱结构的数据库;
根据所述问题查询结果和所述问题查询文本,生成最终查询结果。
第三方面,提供一种电子设备,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如第一方面或其任意一种可选的实施方式所述的基于知识图谱的问题查询方法。
第四方面,提供一种计算机可读存储介质,包括:所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如第一方面或其任意一种可选的实施方式所述的基于知识图谱的问题查询方法。
第五方面,提供一种计算机程序产品,其特征在于,包括:当所述计算机程序产品在计算机上运行时,使得所述计算机实现如第一方面或其任意一种可选的实施方式所述的基于知识图谱的问题查询方法。
本公开实施例提供的技术方案与现有技术相比具有如下优点:可以对问题查询文本进行意图识别,确定问题查询文本对应的自然语言处理(Natural LanguageProcessing,NLP)文本分类,并且会针对该NLP文本分类去从问题查询文本中获取至少一个目标实体,基于这至少一个目标实体,从知识图谱数据库中确定与该问题查询文本对应的问题查询结果,该方案中利用了NLP文本分类的技术,自动实现了对文本进行分类,确定查询的问题类型,从而在对查询问题进行分类后,可以提取相应查询信息(包括但不限于至少一个目标实体),并基于知识图谱数据库进行问题的查询,从而可以针对性的得到准确的问题查询结果,这样无需人力成本,并且可以提高匹配到问题查询结果的概率。进一步的在通过知识图谱数据库获取问题查询结果后,还会结合问题查询文本生成最终查询结果,从而可以提高输出的查询结果的准确性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为一种本公开实施例提供的基于知识图谱的问题查询方法的流程示意图一;
图2为一种为本公开实施例提供的基于知识图谱的问题查询方法的流程示意图二;
图3为一种本公开实施例提供的构建知识图谱数据库的一种流程示意图;
图4为一种本公开实施例提供的知识图谱数据库中的部分数据结构示意图一;
图5为一种本公开实施例提供的知识图谱数据库中的部分数据结构示意图二;
图6为一种本公开实施例提供的知识图谱数据库中的部分数据结构示意图三;
图7为一种本公开实施例提供的知识图谱数据库中的部分数据结构示意图四;
图8为一种本公开实施例提供的知识图谱数据库中的部分数据结构示意图五;
图9为一种本公开实施例提供的问题查询装置的结构框图;
图10为一种本公开实施例提供的电子设备的硬件结构示意图。
具体实施方式
为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
目前的智能问答系统已经在多个行业中应用,目前智能问答系统中主要的应用方式为常见问题解答(Frequently Asked Questions,FAQ)对的形式,即提前由人工指定一些问题,以及这些问题的答案,当用户的进行问题查询时,如果提问能与提前准备的FAQ对中的问题匹配上时,则自动为用户输出对应的答案。在实际应用中,FAQ对的形式需要大量的人力梳理问题和答案,该方式实现时需要较高人力成本,并且由于能够存储的FAQ对有限,该方式在实际应用中匹配到答案(即查询结果)的概率较低,因此目前亟需一种低人力成本和高匹配概率的问题查询方法。
为了解决上述问题,本公开实施例提供了一种基于知识图谱的问题查询方法、装置及电子设备,无需人力成本,可以提高匹配到问题查询结果的概率。
以下先对本公开实施例中所涉及的一些概念和术语进行说明:
知识图谱:
本公开实施例中的知识图谱可以是多种类型的知识图谱,知识图谱指用于增强搜索引擎功能的知识库,旨在描述真实世界中存在的各种实体或概念及其关系,其构成一张巨大的语义网络图,节点表示实体或概念,边则由属性或关系构成。知识图谱本质上是一种语义网络,用图的形式描述客观事物,这里的图指的是数据结构中的图,由节点和边组成。
知识图谱中的实体、属性和关系:
知识图谱中的节点表示概念和实体,概念是抽象出来的事物,实体是具体的事物,边表示事物的关系和属性,事物的内部特征用属性来表示,外部联系用关系来表示。一些情况下人们简化了对知识图谱的描述,将实体和概念统称为实体,将关系和属性统称为关系,这样就可以说知识图谱就是描述实体以及实体之间的关系。实体可以是人,地方,组织机构,概念等等,关系的种类更多,可以是人与人之间的关系,人与组织之间的关系,概念与某个物体之间的关系等等。
属性是人类对于一个对象的抽象方面的刻画,一个具体事物,总是有许许多多的性质与关系,我们把一个事物的性质与关系,都可以叫作事物的属性。事物与属性是不可分的,事物都是有属性的事物,属性也都是事物的属性。一个事物与另一个事物的相同或相异,也就是一个事物的属性与另一事物的属性的相同或相异。由于事物属性的相同或相异,客观世界中就形成了许多不同的事物类。具有相同属性的事物就形成一类,具有不同属性的事物就分别地形成不同的类。属性可以认为是事物的性质与事物之间关系的统称。
本公开实施例中,基于知识图谱的问题查询方法,可以应用于问题查询装置或者电子设备,该问题查询装置可以为该电子设备,或者该问题查询装置可以为该电子设备中用于实现该基于知识图谱的问题查询方法的功能模块或者功能实体。
上述电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本或者个人数字助理(personal digital assistant,PDA)、个人计算机(personal computer,PC)等,本公开实施例对此不作具体限定。
如图1所示,为本公开实施例提供的基于知识图谱的问题查询方法的流程示意图一。
101、获取问题查询文本对应的NLP文本分类。
一些实施例中,将问题查询文本输入预置的NLP分类模型获取NLP分类模型输出的,与问题查询文本对应的NLP文本分类。
上述问题查询文本可以为用户输入的文本形式的查询问题,上述问题查询文本也可以为用户输入的语音形式的查询问题的音频信号,并对该音频信号进行语音识别后得到的文本形式的查询问题。
如图2所示,为本公开实施例提供的基于知识图谱的问题查询方法的流程示意图二,图2中通过接收用户输入问题,得到上述问题查询文本,并针对该问题查询文本进行意图识别,以获知用户查询的意图,通过意图识别可以识别出问题查询文本对应的NLP文本分类,即用户输入问题所属的问题分类。
用户输入问题时,用户可以输入想问的问题对应的询问语句,或想要查询的某一实体名等。
意图识别时,可以内置已完成训练的NLP文本分类模型,该NLP文本分类模型可以将问题分为不同的类别,供后续的查询实体抽取。NLP文本分类模型的输入为自然语言文本,输出为该自然语言文本对应的类别。本公开实施例中,该NLP文本分类模型,无需二次训练,可以直接投入使用。
在一些实施例中,如图2所示,在用户输入问题并进行意图识别后,可以得到多种NLP文本分类,上述NLP文本分类包括但不限于以下(1)至(6)中的至少一种:
(1)属性值查询;
属性值查询这一NLP文本分类的查询意图是:为了获知某个实体的某一属性值为多少。
示例性的,针对这类NLP文本分类,用户输入的问题查询文本的内容可以为:A品牌的1.0款手机的售价是多少?A品牌的2.0款手机的上市时间时什么时候?
(2)属性比较值查询;属性比较值查询这一NLP文本分类的查询意图是:为了获知两个实体中某一属性进行比较的结果。
示例性的,针对这类NLP文本分类,用户输入的问题查询文本的内容可以为:A品牌的1.0款手机和A品牌的2.0款手机谁的售价高?A品牌的1.0款手机和A品牌的2.0款手机哪个的电池容量大?
(3)属性最值查询;
属性最值查询这一NLP文本分类的查询意图是:划定某一类实体集合中,针对某个属性的最值。
示例性的,针对这类NLP文本分类,用户输入的问题查询文本的内容可以为:A品牌的手机中售价最高的是哪款?其中,A品牌的手机是一个实体集合,可以包括:A品牌的1.0款手机、A品牌的2.0款手机,以及A品牌的3.0款手机等。
(4)属性判断查询;
属性判断查询这一NLP文本分类的查询意图是:希望得到某一实体与属性之间“是”或“否”这样的明确答案。
示例性的,针对这类NLP文本分类,用户输入的问题查询文本的内容可以为:A品牌的1.0款手机是5G手机吗?
(5)实体关系查询;
实体关系查询这一NLP文本分类的查询意图是:得到两个实体的关系。
示例性的,针对这类NLP文本分类,用户输入的问题查询文本可以为:A品牌公司和张三有什么关系?其中,A品牌公司和张三是两个实体。
(6)实体集合查询。
实体集合查询这一NLP文本分类的查询意图是:为了获知某个实体或实体集合的标签或描述的全集。
示例性的,针对这类NLP文本分类,用户输入的问题查询文本的内容可以为:A品牌手机。可以将针对A品牌手机相关的标签信息或者描述信息的全集作为查询结果返回。
102、根据问题查询文本,获取与NLP文本分类对应的至少一个目标实体。
如图2中所示,在确定问题查询文本所对应的NLP文本分类之后,可以进行查询实体抽取,具体的,根据意图识别结果,抽取对应的关键实体。
本公开实施例中,针对不同文本分类,从问题查询文本中抽取的实体是不同的。
103、基于至少一个目标实体,从知识图谱数据库中确定匹配的问题查询结果。
其中,知识图谱数据库为将数据构建为知识图谱结构的数据库。
上述知识图谱数据库为通过自然语言处理模型,基于大量非结构化数据,和/或,结构化数据进行数据处理后得到的。
示例性的,如图3所示,为一种本公开实施例提供的构建知识图谱数据库的一种流程示意图,构建知识图谱数据库时,需要先获取结构化数据和非结构化输入,然后通过自然语言处理模型,对这些结构化数据和非结构化数据进行处理,并从处理后的数据中,进行知识抽取,并将抽取得到的知识构建为知识图谱的形式,以形成知识图谱数据库,支撑后续问题查询。
在一些实施例中,基于至少一个目标实体,从网状知识结构中确定匹配的问题查询结果,包括:基于至少一个目标实体,生成至少一个查询语句;从网状知识结构中,确定与至少一个查询语句匹配的问题查询结果。
示例性的,假设针对两个实体:A品牌,以及人物1,可以生成的查询语句为:A品牌和人物1之间的关系是什么?
在一些实施例中,基于至少一个目标实体,生成至少一个查询语句可以为,首先获取与NLP文本分类对应的目标查询语句模板,然后根据至少一个目标实体,以及目标查询语句模板,生成至少一个查询语句。
本公开实施例中,每种NLP文本分类对应的查询语句模板可以不同,也就是说针对不同NLP文本分类会设置有不同的查询语句模板,在生成查询语句时,会根据问题查询文本的NLP文本分类,提取对应的目标实体,并且提取对应的查询语句模板,并将该提取出的目标实体基于该提取的对应的查询语句模板去生成查询语句。
示例性的,如图2中所示,在意图识别之后会进行查询实体抽取,以抽取上述至少一个目标实体,并对该至少一个目标实体进行变换与纠错之后,进行查询语句拼接,以生成查询语句,最后基于该查询语句去知识图谱数据库中搜索查问题查询结果。
在一些实施例中,基于至少一个目标实体,生成至少一个查询语句可以是,首先将所述至少一个目标实体中每个目标实体进行泛化处理,以得到多个目标实体,然后基于多个目标实体,生成对应的多个查询语句。最后会基于这多个查询语句去知识图谱数据库中搜索查问题查询结果。示例性的,假设提取的实体为:A品牌的1.0款手机,那么对该实体进行泛化处理后,可以得到多个目标实体为:A品牌的1.0款手机、A品牌1.0款、A品牌1.0手机、A品牌手机1.0款等。在生成查询语句时,可以基于泛化处理后得到的实体A品牌的1.0款手机、A品牌1.0款、A品牌1.0手机、A品牌手机1.0款等,各自生成一个查询语句,以生成多个查询语句,并基于这多个查询语句去知识图谱数据库中搜索查问题查询结果。
上述生成查询语句过程中,针对实体进行的泛化处理,可以避免单一实体查询时,在知识图谱数据库中无法匹配到查询结果,基于泛化处理后的实体,生成多个查询语句进行查询,可以提高在知识图谱数据库中得到问题查询结果的概率。
在一些实施例中,根据问题查询文本,获取与NLP文本分类对应的至少一个目标实体时,可以根据问题查询文本,获取与NLP文本分类对应的至少一个初始实体;若存在与目标初始实体对应保存的正确实体,则将至少一个初始实体中的目标初始实体替换为正确实体,以获取至少一个目标实体;其中,目标初始实体为至少一个初始实体中的任一实体。
本公开实施例中,从问题查询文本中提取出的实体可以认为是初始实体,可以针对该初始实体进行纠错处理,来确定对应的正确实体,将正确实体,认为是上述目标实体。
本公开实施例中可以预先存储初始实体与正确实体之间的映射对。示例性的,如表1所示,为一种初始实体与正确实体之间的映射对的示意表。假设从问题查询文本中提取出的实体为“小猪佩琪”,那么根据该映射对的示意表可知,可以确定该实体“小猪佩琪”对应的正确实体“小猪佩奇”。
Figure BDA0003449725360000161
表1
上述生成查询语句过程中,针对实体进行的纠错处理,可以提升生成查询语句的准确度,可以提高在知识图谱数据库中得到问题查询结果的概率。
本公开实施例中,针对不同的NLP文本分类,其从问题查询文本中提取的查询信息不同,相应的在知识图谱数据库中查询得到问题查询结果的查询逻辑也有所不同,下面本公开实施例中,将以示例的形式说明本公开实施例中对应于不同NLP文本分类时,从问题查询文本中提取的查询信息,以及对应的查询逻辑。
在一些实施例中,NLP文本分类为属性相关分类,包括上述(1)属性值查询、(2)属性比较值查询、(3)属性最值查询、(4)属性判断查询中的一种或者多种。
基于上述属性相关分类提取的查询信息包括:从问题查询文本中提取上述与NLP文本分类对应的至少一个目标实体,并且提取与NLP文本分类对应的至少一个属性,其中,至少一个目标实体中每个目标实体对应至少一个属性中的一个或多个属性。
相应的,基于上述属性相关分类对应的查询逻辑为:基于至少一个目标实体和至少一个属性,从网状知识结构中确定匹配的问题查询结果。
下面针对上述属性相关分类中不同情况分别进行示例性介绍:
情况1:在一些实施例中,NLP文本分类为属性值查询。
基于上述情况1提取的查询信息包括:至少一个目标实体为第一实体,至少一个属性为第一属性。
相应的,基于上述情况1对应的查询逻辑为:从网状知识结构中,确定与第一实体匹配的至少一个第二实体,至少一个第二实体为与第一实体的第一相似度参数大于第一预设参数的实体;然后获取至少一个第二实体一阶关联的多个关系名称;分别确定多个关系名称与第一属性的第二相似度参数;从多个关系名称中,确定总相似度参数的最大值所对应的目标关系名称,总相似度参数为第一相似度参数与第二相似度参数的和;根据目标关系名称对应的第一节点,确定第一实体的第一属性值,第一属性值为第一属性的取值;将第一属性值作为问题查询结果。
示例性的,针对NLP文本分类为属性值查询的情况,需要从问题查询文本中抽取两个槽位,分别是“实体”和对应的“属性”。具体的,首先根据从问题查询文本中抽取一个实体A和一个属性S,然后在知识图谱数据库中根据实体A的名称,确定与该实体A的名称的第一相似度参数处于前n个的n个实体,之后从该n个实体中再逐个查询每个实体一阶关联的多个关系名称,然后将该n个实体中,每个实体对应的多个关系名称与该属性S进行相似度计算,得到各自的第二相似度参数。确定第一相似度参数和第二相似度参数的和最大值所对应的关系名称,并根据该关系名称对应的节点作为该第一属性值。其中,n大于或等于1。
示例性的,假设问题查询文本为:A品牌的1.0款手机的售价是多少?此时该查询文本属于属性值查询,本公开实施例中从该问题查询文本中会提取实体“A品牌的1.0款手机”,并提取属性:“售价”。如图4所示,为一种本公开实施例提供的知识图谱数据库中的部分数据结构示意图一。在该网状知识图谱数据库中,可以获知与实体“A品牌的1.0款手机”一阶关联的多个关系名称“颜色”、“售价”“内存”以及“电池容量”,图4中的关系名称“售价”与从问题查询文本中提取的属性的相似度最高,那么可以认为图4中“售价”这一关系名称的一阶关联节点“5999元”为售价这一属性的属性值,将其提取出来作为问题查询结果,可以输出最终查询结果为:A品牌的1.0款手机的售价是5999元。
情况2:在一些实施例中,NLP文本分类为属性判断查询。
基于上述情况2提取的查询信息包括:至少一个目标实体为第二实体,至少一个属性为第二属性。
相应的,基于上述情况2对应的查询逻辑为:在网状知识结构中,确定第二实体一阶关联的多个第二节点;基于多个第二节点中是否存在与第二属性匹配的节点,获取属性判断结果,属性判断结果用于表征第二实体是否符合第二属性,将属性判断结果,作为问题查询结果。
示例性的,假设问题查询文本为:A品牌的1.0款手机是否为5G手机?此时问题查询文本是一种属性判断查询,从问题查询文本中可以提取实体“A品牌的1.0款手机”,并提取属性:“5G”,然后从图4中所示的部分数据结构中,确定“A品牌的1.0款手机”这一实体所关联的节点“5999元”、“白色”、“5000毫安”、“4KB”和“5G”,可以看出存在与提取的属性匹配的节点“5G”,那么得到问题查询结果为:是,可以输出最终查询结果为:A品牌的1.0款手机为5G手机。
在一些实施例中,NLP文本分类为属性关系相关分类,包括:(2)属性比较值查询,和/或,(3)属性最值查询。可以理解的是:(2)属性比较值查询、(3)属性最值查询,不仅是属性相关分类,也是属性关系相关分类。
基于上述属性关系相关分类提取的查询信息包括:从问题查询文本中提取上述与NLP文本分类对应的至少一个目标实体,以及从问题查询文本中,提取与NLP文本分类对应的属性关系。
相应的,基于上述属性关系相关分类对应的查询逻辑为:基于至少一个目标实体、至少一个属性以及属性关系,从网状知识结构中确定匹配的问题查询结果。
下面针对上述属性关系相关分类中不同情况分别进行示例性介绍:
情况3:在一些实施例中,NLP文本分类为属性比较值查询。
基于上述情况3提取的查询信息包括:至少一个目标实体包括第三实体和第四实体,至少一个属性为第三属性,属性关系为比较关系。
相应的,基于上述情况3对应的查询逻辑为:从知识图谱数据库中,查询第三实体的第三属性值,以及第四实体的第三属性值,第三属性值为第三属性的取值;基于比较关系,确定第三实体的第三属性值与第四实体的第三属性值的比较结果;将比较关系结果作为问题查询结果。
示例性的,假设问题查询文本为:“A品牌的1.0款手机与A品牌的2.0款手机哪个售价高?”该问题查询文本为属性比较值查询,此时可以从问题查询文本中提取实体“A品牌的1.0款手机”以及“A品牌的2.0款手机”,以及提取属性“售价”,属性关系为:比较售价高低。如图5所示为一种本公开实施例提供的知识图谱数据库中的部分数据结构示意图二。从图5所示的部分数据结构中,可以确定实体“A品牌的1.0款手机”的“售价”这一属性对应取值为“5999元”,实体“A品牌的2.0款手机”的“售价”这一属性对应取值为“6999元”,那么将两个取值相比较,可以得到问题查询结果为:A品牌的2.0款手机的售价高,可以输出最终查询结果为:A品牌的1.0款手机与A品牌的2.0款手机中A品牌的2.0款手机的售价高。
情况4:在一些实施例中,NLP文本分类为属性最值查询。
基于上述情况4提取的查询信息包括:至少一个目标实体为第五实体,至少一个属性为第四属性,属性关系为最值关系。
相应的,基于上述情况4对应的查询逻辑为:从知识图谱数据库中,查询与第五实体匹配的目标信息,目标信息为描述信息或标签信息;确定与目标信息一阶关联的至少一个第六实体;从至少一个第六实体一阶关联的多个关系名称中,为每个第六实体确定与第四属性匹配的第一关系名称;基于最值关系,从至少一个第六实体中确定最值实体,最值实体为第一关系名称对应的节点为最值的第六实体;将最值实体作为问题查询结果。
示例性的,假设问题查询文本为:“A品牌手机中售价最高的是哪一款?”该问题查询文本为属性最值查询,此时可以从问题查询文本中提取实体“A品牌手机”,以及提取属性“售价”,属性关系为:售价最高。如图6所示,为一种本公开实施例提供的知识图谱数据库中的部分数据结构示意图三。从图6所示的部分数据结构中,可以确定“A品牌手机”匹配的目标信息之后,确定其一阶关联的三个实体,分别为“A品牌的1.0款手机”、“A品牌的2.0款手机”,以及“A品牌的3.0款手机”并逐个查询这三个实体对应的关系名称(即图连接节点的边),并确定对应“售价”的边所连接的节点,“A品牌的1.0款手机”连接售价的边对应的节点取值为“5999”、“A品牌的2.0款手机”连接售价的边对应的节点取值为“6999”、“A品牌的3.0款手机”连接售价的边对应的节点取值为“6499”,把这三个值进行比较,可以确定“A品牌的2.0款手机”为最值实体,那么可以得到问题查询结果为:A品牌的2.0款手机售价最高,可以输出最终查询结果为:A品牌手机中A品牌的2.0款手机售价最高。
情况5:在一些实施例中,NLP文本分类为实体关系查询。
基于上述情况5提取的查询信息包括:至少一个目标实体为第七实体和第八实体。
相应的,基于上述情况5对应的查询逻辑为:从知识图谱数据库中,确定第七实体一阶关联的多个节点;从第七实体一阶关联的多个节点中,确定与第八实体匹配的第二节点;将第二节点对应的一阶关联信息,确定为第七实体与第八实体之间的目标关系信息,将目标关系信息作为问题查询结果。
示例性的,如图7所示,为一种本公开实施例提供的知识图谱数据库中的部分数据结构示意图四,假设问题查询文本为:“A品牌公司与人物A有什么关系?”此时可以从问题查询文本中提取实体“A品牌公司”和“人物A”,并从图7中基于“A品牌公司”这一实体,确定其一阶关联的多个节点,并从该多个节点中确定与“人物A”匹配的节点后,获取这两个节点之间目标关系信息为“A品牌公司的创始人”,那么可以得到问题查询结果为:人物A为A品牌公司的创始人,可以输出最终查询结果是:A品牌公司与人物A的关系为:人物A为A品牌公司的创始人。
情况6:在一些实施例中,NLP文本分类为实体集合查询。
基于上述情况6提取的查询信息包括:至少一个目标实体为第九实体。
相应的,基于上述情况6对应的查询逻辑为:从知识图谱数据库中,确定第九实体一阶关联的多个节点;从第九实体一阶关联的多个节点中,确定目标类型的第三节点,目标类型包括描述节点类型和标签节点类型;获取第三节点一阶关联的所有实体的实体集合,将实体集合作为问题查询结果。
示例性的,如图8所示,为一种本公开实施例提供的知识图谱数据库中的部分数据结构示意图五,假设问题查询文本为:“智能设备”此时可以从问题查询文本中提取实体“智能设备”,并在图8中基于“智能设备”这一实体,确定其一阶关联的4个节点,其中,“具有计算处理能力的设备”节点类型为描述节点类型,“智能音箱”“扫地机器人”“智能手机”节点类型可以为标签节点类型,那么可以将这4个节点的信息,一起作为问题查询结果输出,可以输出最终查询结果是:智能设备是指具有计算处理能力的设备,通常可以包括智能音箱、扫地机器人和智能手机等。
104、根据问题查询结果和问题查询文本,生成最终查询结果。
示例性的,假设问题查询文本为“A品牌的1.0款手机的售价是多少?”,从知识图谱数据库中查询到的问题查询结果为“5999元”,此时不是直接输出5999元,而是将问题查询结果和问题查询文本相结合后,输出最终查询结果:查询到A品牌的1.0款手机的售价为5999元。
本公开实施例中,将问题查询结果与问题查询文本相结合,这样得到的最终查询结合,符合人类对话过程中的用语习惯,避免一些信息给用户造成误导,使得信息输出更加准确,智能化。
105、输出最终查询结果。
本公开实施例中,可以对问题查询文本进行意图识别,确定问题查询文本对应的NLP文本分类,并且会针对该NLP文本分类去从问题查询文本中获取至少一个目标实体,基于这至少一个目标实体,从知识图谱数据库中确定与该问题查询文本对应的问题查询结果,该方案中利用了NLP文本分类的技术,自动实现了对文本进行分类,确定查询的问题类型,从而在对查询问题进行分类后,可以提取相应查询信息(包括但不限于至少一个目标实体),并基于知识图谱数据库进行问题的查询,从而可以针对性的得到准确的问题查询结果,这样无需人力成本,并且可以提高匹配到问题查询结果的概率。
进一步的在通过知识图谱数据库获取问题查询结果后,还会结合问题查询文本生成最终查询结果,从而可以提高输出的查询结果的准确性。
如图9所示,为一种本公开实施例提供的问题查询装置的结构框图,该问题查询装置包括:
获取模块901,用于获取问题查询文本对应的NLP文本分类;根据所述问题查询文本,获取与所述NLP文本分类对应的至少一个目标实体;
确定模块902,用于基于所述至少一个目标实体,从知识图谱数据库中确定匹配的问题查询结果,所述知识图谱数据库为将数据构建为知识图谱结构的数据库;
根据所述问题查询结果和所述问题查询文本,生成最终查询结果。
作为本公开实施例一种可选的实施方式,所述NLP文本分类包括以下至少一种:
属性值查询、属性比较值查询、属性最值查询、属性判断查询、实体关系查询、实体集合查询。
作为本公开实施例一种可选的实施方式,所述NLP文本分类包括以下至少一种:
所述属性值查询、所述属性比较值查询、所述属性最值查询、所述属性判断查询;
所述获取模块901,还用于:
从所述问题查询文本中,提取与所述NLP文本分类对应的至少一个属性,其中,所述至少一个目标实体中每个目标实体对应所述至少一个属性中的一个或多个属性;
所述确定模块902,具体用于:
基于所述至少一个目标实体和所述至少一个属性,从所述网状知识结构中确定匹配的所述问题查询结果。
作为本公开实施例一种可选的实施方式,所述NLP文本分类为属性值查询,所述至少一个目标实体为第一实体,所述至少一个属性为第一属性;
所述确定模块902,具体用于:
从所述网状知识结构中,确定与所述第一实体匹配的至少一个第二实体,所述至少一个第二实体为与所述第一实体的第一相似度参数大于第一预设参数的实体;
获取所述至少一个第二实体一阶关联的多个关系名称;
分别确定所述多个关系名称与所述第一属性的第二相似度参数;
从所述多个关系名称中,确定总相似度参数的最大值所对应的目标关系名称,所述总相似度参数为所述第一相似度参数与所述第二相似度参数的和;
根据所述目标关系名称对应的第一节点,确定所述第一实体的第一属性值,所述第一属性值为所述第一属性的取值;
将所述第一属性值作为所述问题查询结果。
作为本公开实施例一种可选的实施方式,所述NLP文本分类为属性判断查询,所述至少一个目标实体为第二实体,所述至少一个属性为第二属性;
所述确定模块902,具体用于:
在所述网状知识结构中,确定所述第二实体一阶关联的多个第二节点;
基于所述多个第二节点中是否存在与所述第二属性匹配的节点,获取属性判断结果,所述属性判断结果用于表征所述第二实体是否符合所述第二属性;
将所述属性判断结果,作为所述问题查询结果。
作为本公开实施例一种可选的实施方式,所述NLP文本分类包括:属性比较值查询,和/或,属性最值查询;
所述获取模块901,还用于:
从所述问题查询文本中,提取与所述NLP文本分类对应的属性关系;
其中,所述属性关系包括:比较关系,和/或,最值关系。
所述确定模块902,具体用于:
基于所述至少一个目标实体、所述至少一个属性以及所述属性关系,从所述网状知识结构中确定匹配的所述问题查询结果。
作为本公开实施例一种可选的实施方式,所述NLP文本分类为属性比较值查询,所述至少一个目标实体包括第三实体和第四实体,所述至少一个属性为第三属性,所述属性关系为比较关系;
所述确定模块902,具体用于:
从所述知识图谱数据库中,查询所述第三实体的第三属性值,以及所述第四实体的第三属性值,所述第三属性值为所述第三属性的取值;
基于所述比较关系,确定所述第三实体的第三属性值与所述第四实体的第三属性值的比较结果;
将所述比较关系结果作为所述问题查询结果。
作为本公开实施例一种可选的实施方式,所述NLP文本分类为属性最值查询,所述至少一个目标实体为第五实体,所述至少一个属性为第四属性,所述属性关系为最值关系;
所述确定模块902,具体用于:
从所述知识图谱数据库中,查询与所述第五实体匹配的目标信息,所述目标信息为描述信息或标签信息;
确定与所述目标信息一阶关联的至少一个第六实体;
从所述至少一个第六实体一阶关联的多个关系名称中,为每个第六实体确定与所述第四属性匹配的第一关系名称;
基于所述最值关系,从所述至少一个第六实体中确定最值实体,所述最值实体为所述第一关系名称对应的节点为最值的第六实体;
将所述最值实体作为所述问题查询结果。
作为本公开实施例一种可选的实施方式,所述NLP文本分类为实体关系查询,所述至少一个目标实体为第七实体和第八实体;
所述确定模块902,具体用于:
从所述知识图谱数据库中,确定所述第七实体一阶关联的多个节点;
从所述第七实体一阶关联的多个节点中,确定与所述第八实体匹配的第二节点;
将所述第二节点对应的一阶关联信息,确定为所述第七实体与所述第八实体之间的目标关系信息,将所述目标关系信息作为所述问题查询结果。
作为本公开实施例一种可选的实施方式,所述NLP文本分类为实体集合查询,所述至少一个目标实体为第九实体;
所述确定模块902,具体用于:
从所述知识图谱数据库中,确定所述第九实体一阶关联的多个节点;
从所述第九实体一阶关联的多个节点中,确定目标类型的第三节点,所述目标类型包括描述节点类型和标签节点类型;
获取所述第三节点一阶关联的所有实体的实体集合,将所述实体集合作为所述问题查询结果。
作为本公开实施例一种可选的实施方式,所述获取模块901,具体用于:
将所述问题查询文本输入预置的NLP分类模型获取所述NLP分类模型输出的,与所述问题查询文本对应的NLP文本分类。
作为本公开实施例一种可选的实施方式,所述确定模块902,具体用于:
基于所述至少一个目标实体,生成至少一个查询语句;
从网状知识结构中,确定与所述至少一个查询语句匹配的问题查询结果。
作为本公开实施例一种可选的实施方式,所述确定模块902,具体用于:
获取与所述NLP文本分类对应的目标查询语句模板;
根据所述至少一个目标实体,以及所述目标查询语句模板,生成所述至少一个查询语句。
作为本公开实施例一种可选的实施方式,所述确定模块902,具体用于:
将所述至少一个目标实体中每个目标实体进行泛化处理,以得到多个目标实体;
基于所述多个目标实体,生成对应的所述多个查询语句。
作为本公开实施例一种可选的实施方式,所述获取模块901,具体用于:
根据所述问题查询文本,获取与所述NLP文本分类对应的至少一个初始实体;
若存在与目标初始实体对应保存的正确实体,则将所述至少一个初始实体中的所述目标初始实体替换为所述正确实体,以获取所述至少一个目标实体;
其中,所述目标初始实体为所述至少一个初始实体中的任一实体。
作为本公开实施例一种可选的实施方式,所述知识图谱数据库为通过自然语言处理模型,基于大量非结构化数据,和/或,结构化数据进行数据处理后得到的。
如图10所示,一种本公开实施例提供的电子设备的硬件结构示意图,该电子设备包括:处理器1001、存储器1002及存储在所述存储器1002上并可在所述处理器1001上运行的计算机程序,所述计算机程序被所述处理器1001执行时实现上述方法实施例中的基于知识图谱的问题查询方法的各个过程。且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例提供一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储计算机程序,该计算机程序被处理器执行时实现上述方法实施例中基于知识图谱的问题查询方法的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,该计算机可读存储介质可以为只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等。
本发明实施例提供一种计算程序产品,该计算机程序产品存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例中基于知识图谱的问题查询方法的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本领域技术人员应明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质上实施的计算机程序产品的形式。
本公开中,处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本公开中,存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
本公开中,计算机可读介质包括永久性和非永久性、可移动和非可移动存储介质。存储介质可以由任何方法或技术来实现信息存储,信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。根据本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个目标实体信息或者操作与另一个目标实体信息或操作区分开来,而不一定要求或者暗示这些目标实体信息或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种基于知识图谱的问题查询方法,其特征在于,包括:
获取问题查询文本对应的自然语言处理NLP文本分类;
根据所述问题查询文本,获取与所述NLP文本分类对应的至少一个目标实体;
基于所述至少一个目标实体,从知识图谱数据库中确定匹配的问题查询结果,所述知识图谱数据库为将数据构建为知识图谱结构的数据库;
根据所述问题查询结果和所述问题查询文本,生成最终查询结果。
2.根据权利要求1所述的方法,其特征在于,所述NLP文本分类包括以下至少一种:
属性值查询、属性比较值查询、属性最值查询、属性判断查询、实体关系查询、实体集合查询。
3.根据权利要求2所述的方法,其特征在于,所述NLP文本分类包括以下至少一种:
所述属性值查询、所述属性比较值查询、所述属性最值查询、所述属性判断查询;
所述方法还包括:
从所述问题查询文本中,提取与所述NLP文本分类对应的至少一个属性,其中,所述至少一个目标实体中每个目标实体对应所述至少一个属性中的一个或多个属性;
所述基于所述至少一个目标实体,从网状知识结构中确定匹配的问题查询结果,包括:
基于所述至少一个目标实体和所述至少一个属性,从所述网状知识结构中确定匹配的所述问题查询结果。
4.根据权利要求3所述的方法,其特征在于,所述NLP文本分类为属性值查询,所述至少一个目标实体为第一实体,所述至少一个属性为第一属性;
所述基于所述至少一个目标实体和所述至少一个属性,从网状知识结构中确定匹配的问题查询结果,包括:
从所述网状知识结构中,确定与所述第一实体匹配的至少一个第二实体,所述至少一个第二实体为与所述第一实体的第一相似度参数大于第一预设参数的实体;
获取所述至少一个第二实体一阶关联的多个关系名称;
分别确定所述多个关系名称与所述第一属性的第二相似度参数;
从所述多个关系名称中,确定总相似度参数的最大值所对应的目标关系名称,所述总相似度参数为所述第一相似度参数与所述第二相似度参数的和;
根据所述目标关系名称对应的第一节点,确定所述第一实体的第一属性值,所述第一属性值为所述第一属性的取值;
将所述第一属性值作为所述问题查询结果。
5.根据权利要求3所述的方法,其特征在于,所述NLP文本分类为属性判断查询,所述至少一个目标实体为第二实体,所述至少一个属性为第二属性;
所述基于所述至少一个目标实体和所述至少一个属性,从网状知识结构中确定匹配的问题查询结果,包括:
在所述网状知识结构中,确定所述第二实体一阶关联的多个第二节点;
基于所述多个第二节点中是否存在与所述第二属性匹配的节点,获取属性判断结果,所述属性判断结果用于表征所述第二实体是否符合所述第二属性;
将所述属性判断结果,作为所述问题查询结果。
6.根据权利要求3所述的方法,其特征在于,所述NLP文本分类包括:属性比较值查询,和/或,属性最值查询;
所述方法还包括:
从所述问题查询文本中,提取与所述NLP文本分类对应的属性关系;
其中,所述属性关系包括:比较关系,和/或,最值关系。
所述基于所述至少一个目标实体,从网状知识结构中确定匹配的问题查询结果,包括:
基于所述至少一个目标实体、所述至少一个属性以及所述属性关系,从所述网状知识结构中确定匹配的所述问题查询结果。
7.根据权利要求6所述的方法,其特征在于,所述NLP文本分类为属性比较值查询,所述至少一个目标实体包括第三实体和第四实体,所述至少一个属性为第三属性,所述属性关系为比较关系;
所述基于所述至少一个目标实体、所述至少一个属性以及所述属性关系,从所述网状知识结构中确定匹配的所述问题查询结果,包括:
从所述知识图谱数据库中,查询所述第三实体的第三属性值,以及所述第四实体的第三属性值,所述第三属性值为所述第三属性的取值;
基于所述比较关系,确定所述第三实体的第三属性值与所述第四实体的第三属性值的比较结果;
将所述比较关系结果作为所述问题查询结果。
8.根据权利要求6所述的方法,其特征在于,所述NLP文本分类为属性最值查询,所述至少一个目标实体为第五实体,所述至少一个属性为第四属性,所述属性关系为最值关系;
所述基于所述至少一个目标实体、所述至少一个属性以及所述属性关系,从所述网状知识结构中确定匹配的所述问题查询结果,包括:
从所述知识图谱数据库中,查询与所述第五实体匹配的目标信息,所述目标信息为描述信息或标签信息;
确定与所述目标信息一阶关联的至少一个第六实体;
从所述至少一个第六实体一阶关联的多个关系名称中,为每个第六实体确定与所述第四属性匹配的第一关系名称;
基于所述最值关系,从所述至少一个第六实体中确定最值实体,所述最值实体为所述第一关系名称对应的节点为最值的第六实体;
将所述最值实体作为所述问题查询结果。
9.根据权利要求2所述的方法,其特征在于,所述NLP文本分类为实体关系查询,所述至少一个目标实体为第七实体和第八实体;
所述基于所述至少一个目标实体,从网状知识结构中确定匹配的问题查询结果,包括:
从所述知识图谱数据库中,确定所述第七实体一阶关联的多个节点;
从所述第七实体一阶关联的多个节点中,确定与所述第八实体匹配的第二节点;
将所述第二节点对应的一阶关联信息,确定为所述第七实体与所述第八实体之间的目标关系信息,将所述目标关系信息作为所述问题查询结果。
10.根据权利要求2所述的方法,其特征在于,所述NLP文本分类为实体集合查询,所述至少一个目标实体为第九实体;
所述基于所述至少一个目标实体,从网状知识结构中确定匹配的问题查询结果,包括:
从所述知识图谱数据库中,确定所述第九实体一阶关联的多个节点;
从所述第九实体一阶关联的多个节点中,确定目标类型的第三节点,所述目标类型包括描述节点类型和标签节点类型;
获取所述第三节点一阶关联的所有实体的实体集合,将所述实体集合作为所述问题查询结果。
基于知识图谱的问题查询方法基于知识图谱的问题查询方法基于知识图谱的问题查询方法。
CN202111661454.XA 2021-12-31 2021-12-31 基于知识图谱的问题查询方法、装置及电子设备 Pending CN116414996A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111661454.XA CN116414996A (zh) 2021-12-31 2021-12-31 基于知识图谱的问题查询方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111661454.XA CN116414996A (zh) 2021-12-31 2021-12-31 基于知识图谱的问题查询方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN116414996A true CN116414996A (zh) 2023-07-11

Family

ID=87056720

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111661454.XA Pending CN116414996A (zh) 2021-12-31 2021-12-31 基于知识图谱的问题查询方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN116414996A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116992862A (zh) * 2023-09-26 2023-11-03 中科航迈数控软件(深圳)有限公司 数控机床异常辅助处理方法、装置、设备及介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116992862A (zh) * 2023-09-26 2023-11-03 中科航迈数控软件(深圳)有限公司 数控机床异常辅助处理方法、装置、设备及介质
CN116992862B (zh) * 2023-09-26 2024-02-20 中科航迈数控软件(深圳)有限公司 数控机床异常辅助处理方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN108345690B (zh) 智能问答方法与系统
CN110442710B (zh) 一种基于知识图谱的短文本语义理解与精准匹配方法及装置
CN111353310B (zh) 基于人工智能的命名实体识别方法、装置及电子设备
WO2021174783A1 (zh) 近义词推送方法、装置、电子设备及介质
CN111708869B (zh) 人机对话的处理方法及装置
CN107885842B (zh) 智能问答的方法、装置、服务器及存储介质
WO2018086401A1 (zh) 自动问答系统中的问题聚类处理方法及装置
CN111782763A (zh) 基于语音语义的信息检索方法、及其相关设备
CN111078837A (zh) 智能问答信息处理方法、电子设备及计算机可读存储介质
CN111309863A (zh) 基于知识图谱的自然语言问答方法及装置
CN112328800A (zh) 自动生成编程规范问题答案的系统及方法
CN110619050A (zh) 意图识别方法及设备
CN113342958B (zh) 问答匹配方法、文本匹配模型的训练方法和相关设备
CN113010660A (zh) 一种基于知识图谱的智能问答方法及装置
CN114528312A (zh) 一种结构化查询语言语句的生成方法和装置
CN112507139A (zh) 基于知识图谱的问答方法、系统、设备及存储介质
CN112507089A (zh) 一种基于知识图谱的智能问答引擎及其实现方法
CN116414996A (zh) 基于知识图谱的问题查询方法、装置及电子设备
CN109684357B (zh) 信息处理方法及装置、存储介质、终端
CN112685544A (zh) 电信信息的查询方法、装置、设备和介质
CN111752922A (zh) 一种建立知识数据库、实现知识查询的方法及装置
CN116340352A (zh) 数据查询方法、装置、存储介质及电子设备
CN115114420A (zh) 一种知识图谱问答方法、终端设备及存储介质
CN110175241B (zh) 问答库构建方法、装置、电子设备及计算机可读介质
CN113742447B (zh) 基于查询路径生成的知识图谱问答方法、介质和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination