CN111611344B - 基于字典和知识图谱的复杂属性查询方法、系统及设备 - Google Patents
基于字典和知识图谱的复杂属性查询方法、系统及设备 Download PDFInfo
- Publication number
- CN111611344B CN111611344B CN202010371192.2A CN202010371192A CN111611344B CN 111611344 B CN111611344 B CN 111611344B CN 202010371192 A CN202010371192 A CN 202010371192A CN 111611344 B CN111611344 B CN 111611344B
- Authority
- CN
- China
- Prior art keywords
- attribute
- standardized
- dictionary
- formula
- entity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本发明公开了一种基于字典和知识图谱的复杂属性查询方法、系统及设备,该方法,包括:步骤1,获取用户输入的问句,通过预先构建的标准化字典对问句中的实体和属性、及其对应的概念进行识别,并构建包括实体、属性和概念的多个数据节点;步骤2,判断所述数据节点中属性的类型,如果属性的类型为公式属性,则对所述公式属性的表达式以递归方式拆分为查询属性和/或常数值属性,通过查询获取对应的属性值或常数值,得到公式计算结果并反馈,如果属性的类型为查询属性或常数值属性,则通过查询直接获取对应的属性值或常数值并反馈。
Description
技术领域
本发明涉及人工智能技术领域,尤其是涉及一种基于字典和知识图谱的复杂属性查询方法、系统及设备。
背景技术
在现有技术中,国内外很多互联网公司都在构建自己的知识图谱,并在此基础上推出搜索、问答等功能来改善服务质量。很多垂直领域也开始有了基于知识图谱的智能问答系统。
但是,知识图谱在某些方面还存在以下不足:
1、目前的基于知识图谱的问答系统大都是对简单的实体及属性的查询,实体和属性在知识图谱中直接存在,通过查询语句直接可以查询到,但是,如果要查询的属性比较复杂,就会比较困难,例如,要计算的属性是一个计算公式,公式中的每个因子都是知识图谱中的属性,或者公式中的某个因子又是另一个计算公式,例如,公式“日产油水平=月产油量/当月日历天数;平均单井日产油水平=日产油水平/油井开井数”中,“平均单井日产油水平”这个属性中又包含“日产油水平”这个属性,因此,目前复杂的属性计算有欠缺。需要说明的是,实体通常是文本中描述的对象,例如人名、地名、机构名等,属性是指实体中属性或者组成成分,例如:性别、姓名、年龄等。
2、对于复杂属性的问答,目前常用的方式是将复杂属性的数学公式写死到代码库中,这种方法虽然能够达到求解的目的,但是对于之后的维护和扩展有着很大的挑战,例如,公式中的某个常量因子需要更改,或者需要添加新的公式都非常的不灵活。
因此,在现有技术中存在复杂公式属性的计算不灵活的问题亟需解决。
发明内容
本发明的目的在于提供一种基于字典和知识图谱的复杂属性查询方法、系统及设备,旨在解决现有技术中的上述问题。
本发明提供一种基于字典和知识图谱的复杂属性查询方法,包括:
步骤1,获取用户输入的问句,通过预先构建的标准化字典对问句中的实体和属性、及其对应的概念进行识别,并构建包括实体、属性和概念的多个数据节点;
步骤2,判断所述数据节点中属性的类型,如果属性的类型为公式属性,则对所述公式属性的表达式以递归方式拆分为查询属性和/或常数值属性,通过查询获取对应的属性值或常数值,得到公式计算结果并反馈,如果属性的类型为查询属性或常数值属性,则通过查询直接获取对应的属性值或常数值并反馈。
本发明提供一种基于字典和知识图谱的复杂属性查询系统,包括:
字典数据层,用于构建标准化字典、属性到类型字典、公式字典、以及公式单位字典;
解析层,用于判断所述数据节点中属性的类型,如果属性的类型为公式属性,则对所述公式属性的表达式以递归方式拆分为查询属性和/或常数值属性,调用应用层,如果属性的类型为查询属性或常数值属性,则直接调用应用层;
应用程,用于通过查询获取对应的属性值或常数值,得到公式计算结果并反馈,或者,通过查询获取对应的属性值或常数值并直接反馈。
本发明实施例还提供一种基于字典和知识图谱的复杂属性查询设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述基于字典和知识图谱的复杂属性查询方法的步骤。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有信息传递的实现程序,所述程序被处理器执行时实现上述基于字典和知识图谱的复杂属性查询方法的步骤。
采用本发明实施例,通过配置字典、知识图谱查询、递归解析复杂公式的属性,实现了基于字典和知识图谱的关于复杂公式属性的计算。能够有效的解决知识图谱中关于复杂公式的问答,丰富了问答案例。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的基于字典和知识图谱的复杂属性查询方法的流程图;
图2是本发明实施例的属性到类型字典的示意图;
图3是本发明实施例的公式字典的示意图;
图4是本发明实施例的公式单位字典的示意图;
图5是本发明实施例的数据节点的示意图;
图6是本发明实施例的属性为公式属性时递归处理的流程图;
图7是本发明实施例的基于字典和知识图谱的复杂属性查询系统的示意图;
图8是本发明实施例的基于字典和知识图谱的复杂属性查询设备的示意图。
具体实施方式
本发明实施例提供了一种基于字典和知识图谱的复杂属性查询方法、系统及设备,通过字典配置、知识图谱查询和递归解析复杂公式属性的方法,实现了复杂公式属性的查询。通过配置公式字典、属性类型字典、公式单位字典,实现对于公式的解析,然后通过递归调用、知识图谱属性查询的方法,求解最终的公式结果。
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“坚直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。此外,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
方法实施例
根据本发明实施例,提供了一种基于字典和知识图谱的复杂属性查询方法,图1是本发明实施例的基于字典和知识图谱的复杂属性查询方法的流程图。
需要说明的是,在本发明实施例中,执行下述步骤101之前,首先需要构建下述步骤执行时所需要的字典,具体包括如下处理:
1、将用户问句中出现的口语化实体映射到知识图谱的标准化实体,构建口语化实体到标准化实体字典;
2、将上一步中得到的标准化实体映射到该实体所对应的标准化概念,以便得到该实体在知识图谱中概念,构建标准化实体到标准化概念字典;
3、将用户问句中出现的口语化属性映射到知识图谱的标准化属性,构建口语化属性到标准化属性字典;
4、将上一步得到的标准化属性映射到该属性所对应的标准化概念,构建标准化属性到标准化概念字典;
5、构建属性到类型字典,如图2所示,其中,类型包括:公式属性(也可以称为如图2所示的指标属性)、查询属性和常数值属性;查询属性指该属性在知识图谱中直接存在,而公式属性说明该属性还需要进行公式计算才能得到,常数值属性表示该属性为常数值。
6、将公式属性映射到该公式属性所对应的表达式,构建公式字典,如图3所示,对于问句中出现的公式属性,该属性的计算公式通过字典配置,这样对于字典的修改和字典的增添非常灵活。
7、对于每个公式属性,计算的结果都会有单位,因此需要构建一个属性到单位的映射字典,如图4所示,将属性映射到该属性所对应的单位,构建公式单位字典。
执行完上述处理之后,如图1所示,根据本发明实施例的基于字典和知识图谱的复杂属性查询方法具体包括:
步骤101,获取用户输入的问句,通过预先构建的标准化字典对问句中的实体和属性、及其对应的概念进行识别,并构建包括实体、属性和概念的多个数据节点;步骤101具体包括如下处理:
步骤1011,对问句进行字符分割,将字符之间进行间隔;具体地,字符和字符之间可以用空格间隔;
步骤1012,对于用户问句,通过口语化实体到标准化实体字典识别出问句中出现的口语化实体,并得到该口语化实体所对应的标准化实体;
步骤1013,对于步骤1012中得到的标准化实体,通过标准化实体到标准概念字典,识别出标准化实体的标准化概念;
步骤1014,对于用户问句,通过口语化属性到标准化属性字典识别出问句中出现的口语化属性,并得到该口语化属性所对应的标准化属性;
步骤1015,对于步骤1014中得到的标准化属性,通过标准化属性到标准概念字典,识别出该标准化属性的标准化概念;
步骤1016,判断实体(此处指标准化实体)对应的概念(此处指标准化概念)和属性(此处指标准化属性)对应的概念(此处指标准化概念)是否相同,若两者概念相同,则把实体(Entity)、属性(Attribute)和对应的概念(Concept)组合成如图5所示的数据节点;若两者概念不相同,则分别组合成两个概念不同的数据节点。
步骤102,判断数据节点中属性的类型,如果属性的类型为公式属性,则对公式属性的表达式以递归方式拆分为查询属性和/或常数值属性,通过查询获取对应的属性值或常数值,得到公式计算结果并反馈,如果属性的类型为查询属性或常数值属性,则通过查询直接获取对应的属性值或常数值并反馈。
步骤102具体包括:
步骤1021,通过预先构建的属性到类型字典依次判断每个数据节点的属性是否为公式属性,如果判断为是,执行步骤1022,否则,执行步骤1023;
步骤1022,通过公式字典获取公式属性所对应的表达式,并对表达式进行拆分解析,获取表达式中的每一个因子属性,分别将每个因子属性、实体和概念封装成新的数据节点,递归执行步骤1021;如图6所示。
步骤1023,判断数据节点的属性是查询属性还是常数值属性,若是查询属性,将查询属性、实体和概念重新封装成数据节点,将新的数据节点转化成数据库查询语句进行查询,获取属性值;若是常数值属性,则通过公式字典获得具体的常数值,执行步骤1024;
步骤1024,如果数据节点的属性不是公式属性,则将查询到的属性值或常数值直接形成问答结果进行反馈,或者,如果数据节点的属性是公式属性,则将查询到的属性值和/或常数值带入公式,得到公式计算结果,并从公式单位字典中查询计算结果的计算单位,将公式、计算结果、以及计算单位进行拼接形成问答结果进行反馈。
综上所述,借助于本发明实施例的技术方案,通过配置字典、知识图谱查询、递归解析复杂公式的属性,实现了基于字典和知识图谱的关于复杂公式属性的计算。通过配置公式字典,实现了公式的灵活更改及增删,便于系统的维护;通过使用递归方法,实现了复杂公式的拆分与解析;本发明实施例能够有效的解决知识图谱中关于复杂公式的问答,丰富了问答案例。
系统实施例
根据本发明实施例,提供了一种基于字典和知识图谱的复杂属性查询系统,图7是本发明实施例的基于字典和知识图谱的复杂属性查询系统的示意图,如图7所示,根据本发明实施例的基于字典和知识图谱的复杂属性查询系统具体包括:
字典数据层70,用于构建标准化字典、属性到类型字典、公式字典、以及公式单位字典;字典数据层70具体用于:
1、将用户问句中出现的口语化实体映射到知识图谱的标准化实体,构建口语化实体到标准化实体字典;
2、将上一步中得到的标准化实体映射到该实体所对应的标准化概念,以便得到该实体在知识图谱中概念,构建标准化实体到标准化概念字典;
3、将用户问句中出现的口语化属性映射到知识图谱的标准化属性,构建口语化属性到标准化属性字典;
4、将上一步得到的标准化属性映射到该属性所对应的标准化概念,构建标准化属性到标准化概念字典;
5、构建属性到类型字典,如图2所示,其中,类型包括:公式属性、查询属性和常数值属性;查询属性指该属性在知识图谱中直接存在,而公式属性说明该属性还需要进行公式计算才能得到,常数值属性表示该属性为常数值。
6、将公式属性映射到该公式属性所对应的表达式,构建公式字典,如图3所示,对于问句中出现的公式属性,该属性的计算公式通过字典配置,这样对于字典的修改和字典的增添非常灵活。
7、对于每个公式属性,计算的结果都会有单位,因此需要构建一个属性到单位的映射字典,如图4所示,将属性映射到该属性所对应的单位,构建公式单位字典。
解析层72,用于判断数据节点中属性的类型,如果属性的类型为公式属性,则对公式属性的表达式以递归方式拆分为查询属性和/或常数值属性,调用应用层,如果属性的类型为查询属性或常数值属性,则直接调用应用层;
也就是说,解析层72主要进行问句解析和公式解析。问句解析为利用字典数据层配置的字典进行实体和属性以及对应概念的识别。公式解析为对公式进行拆解,然后递归计算公式中的各个属性因子。
解析层72具体包括识别模块、判断模块、拆分模块、以及封装模块:
识别模块,用于获取用户输入的问句,通过预先构建的标准化字典对问句中的实体和属性、及其对应的概念进行识别,并构建包括实体、属性和概念的多个数据节点;识别模块具体用于:
对问句进行字符分割,将字符之间进行间隔;具体地,字符和字符之间可以用空格间隔;对于用户问句,通过口语化实体到标准化实体字典识别出问句中出现的口语化实体,并得到该口语化实体所对应的标准化实体;对于标准化实体,通过标准化实体到标准概念字典,识别出标准化实体的标准化概念;对于用户问句,通过口语化属性到标准化属性字典识别出问句中出现的口语化属性,并得到该口语化属性所对应的标准化属性;对于标准化属性,通过标准化属性到标准概念字典,识别出该标准化属性的标准化概念;判断实体(此处指标准化实体)对应的概念(此处指标准化概念)和属性(此处指标准化属性)对应的概念(此处指标准化概念)是否相同,若两者概念相同,则把实体、属性和对应的概念组合成如图5所示的数据节点;若两者概念不相同,则分别组合成两个概念不同的数据节点。
判断模块,用于通过预先构建的属性到类型字典依次判断每个数据节点的属性是否为公式属性,如果判断为是,调用拆分模块,否则,调用封装模块;
拆分模块,通过公式字典获取公式属性所对应的表达式,并对表达式进行拆分解析,获取表达式中的每一个因子属性,分别将每个因子属性、实体和概念封装成新的数据节点,调用判断模块;
封装模块,判断数据节点的属性是查询属性还是常数值属性,若是查询属性,将查询属性、实体和概念重新封装成数据节点,调用应用层,若是常数值属性,则直接调用应用层;
应用层74,用于通过查询获取对应的属性值或常数值,得到公式计算结果并反馈,或者,通过查询获取对应的属性值或常数值并直接反馈。
也就是说,应用层74主要是对解析出来的各个查询属性,实体和概念转换为数据库查询语句进行查询,从而得到问答最终结果。
应用层74具体用于:将新的数据节点转化成数据库查询语句进行查询,获取属性值;通过公式字典获得常数值属性的具体的常数值,将查询到的属性值或常数值直接形成问答结果进行反馈,或者,将查询到的属性值和/或常数值带入公式,得到公式计算结果,并从公式单位字典中查询计算结果的计算单位,将公式、计算结果、以及计算单位进行拼接形成问答结果进行反馈。
本发明实施例是与上述方法实施例对应的装置实施例,可以参照上述方法实施例进行理解,在此不再赘述。
装置实施例一
本发明实施例提供一种基于字典和知识图谱的复杂属性查询设备,如图8所示,包括:存储器80、处理器82及存储在所述存储器80上并可在所述处理器82上运行的计算机程序,所述计算机程序被所述处理器82执行时实现如下方法步骤:
在本发明实施例中,执行下述步骤101之前,首先需要构建下述步骤执行时所需要的字典,具体包括如下处理:
1、将用户问句中出现的口语化实体映射到知识图谱的标准化实体,构建口语化实体到标准化实体字典;
2、将上一步中得到的标准化实体映射到该实体所对应的标准化概念,以便得到该实体在知识图谱中概念,构建标准化实体到标准化概念字典;
3、将用户问句中出现的口语化属性映射到知识图谱的标准化属性,构建口语化属性到标准化属性字典;
4、将上一步得到的标准化属性映射到该属性所对应的标准化概念,构建标准化属性到标准化概念字典;
5、构建属性到类型字典,如图2所示,其中,类型包括:公式属性、查询属性和常数值属性;查询属性指该属性在知识图谱中直接存在,而公式属性说明该属性还需要进行公式计算才能得到,常数值属性表示该属性为常数值。
6、将公式属性映射到该公式属性所对应的表达式,构建公式字典,如图3所示,对于问句中出现的公式属性,该属性的计算公式通过字典配置,这样对于字典的修改和字典的增添非常灵活。
7、对于每个公式属性,计算的结果都会有单位,因此需要构建一个属性到单位的映射字典,如图4所示,将属性映射到该属性所对应的单位,构建公式单位字典。
执行完上述处理之后,如图1所示,根据本发明实施例的基于字典和知识图谱的复杂属性查询方法具体包括:
步骤101,获取用户输入的问句,通过预先构建的标准化字典对问句中的实体和属性、及其对应的概念进行识别,并构建包括实体、属性和概念的多个数据节点;步骤101具体包括如下处理:
步骤1011,对问句进行字符分割,将字符之间进行间隔;具体地,字符和字符之间可以用空格间隔;
步骤1012,对于用户问句,通过口语化实体到标准化实体字典识别出问句中出现的口语化实体,并得到该口语化实体所对应的标准化实体;
步骤1013,对于步骤1012中得到的标准化实体,通过标准化实体到标准概念字典,识别出标准化实体的标准化概念;
步骤1014,对于用户问句,通过口语化属性到标准化属性字典识别出问句中出现的口语化属性,并得到该口语化属性所对应的标准化属性;
步骤1015,对于步骤1014中得到的标准化属性,通过标准化属性到标准概念字典,识别出该标准化属性的标准化概念;
步骤1016,判断实体(此处指标准化实体)对应的概念(此处指标准化概念)和属性(此处指标准化属性)对应的概念(此处指标准化概念)是否相同,若两者概念相同,则把实体、属性和对应的概念组合成如图5所示的数据节点;若两者概念不相同,则分别组合成两个概念不同的数据节点。
步骤102,判断数据节点中属性的类型,如果属性的类型为公式属性,则对公式属性的表达式以递归方式拆分为查询属性和/或常数值属性,通过查询获取对应的属性值或常数值,得到公式计算结果并反馈,如果属性的类型为查询属性或常数值属性,则通过查询直接获取对应的属性值或常数值并反馈。
步骤102具体包括:
步骤1021,通过预先构建的属性到类型字典依次判断每个数据节点的属性是否为公式属性,如果判断为是,执行步骤1022,否则,执行步骤1023;
步骤1022,通过公式字典获取公式属性所对应的表达式,并对表达式进行拆分解析,获取表达式中的每一个因子属性,分别将每个因子属性、实体和概念封装成新的数据节点,递归执行步骤1021;如图6所示。
步骤1023,判断数据节点的属性是查询属性还是常数值属性,若是查询属性,将查询属性、实体和概念重新封装成数据节点,将新的数据节点转化成数据库查询语句进行查询,获取属性值;若是常数值属性,则通过公式字典获得具体的常数值,执行步骤1024;
步骤1024,如果数据节点的属性不是公式属性,则将查询到的属性值或常数值直接形成问答结果进行反馈,或者,如果数据节点的属性是公式属性,则将查询到的属性值和/或常数值带入公式,得到公式计算结果,并从公式单位字典中查询计算结果的计算单位,将公式、计算结果、以及计算单位进行拼接形成问答结果进行反馈。
装置实施例二
本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有信息传输的实现程序,所述程序被处理器1020执行时实现如下方法步骤:
在本发明实施例中,执行下述步骤101之前,首先需要构建下述步骤执行时所需要的字典,具体包括如下处理:
1、将用户问句中出现的口语化实体映射到知识图谱的标准化实体,构建口语化实体到标准化实体字典;
2、将上一步中得到的标准化实体映射到该实体所对应的标准化概念,以便得到该实体在知识图谱中概念,构建标准化实体到标准化概念字典;
3、将用户问句中出现的口语化属性映射到知识图谱的标准化属性,构建口语化属性到标准化属性字典;
4、将上一步得到的标准化属性映射到该属性所对应的标准化概念,构建标准化属性到标准化概念字典;
5、构建属性到类型字典,如图2所示,其中,类型包括:公式属性、查询属性和常数值属性;查询属性指该属性在知识图谱中直接存在,而公式属性说明该属性还需要进行公式计算才能得到,常数值属性表示该属性为常数值。
6、将公式属性映射到该公式属性所对应的表达式,构建公式字典,如图3所示,对于问句中出现的公式属性,该属性的计算公式通过字典配置,这样对于字典的修改和字典的增添非常灵活。
7、对于每个公式属性,计算的结果都会有单位,因此需要构建一个属性到单位的映射字典,如图4所示,将属性映射到该属性所对应的单位,构建公式单位字典。
执行完上述处理之后,如图1所示,根据本发明实施例的基于字典和知识图谱的复杂属性查询方法具体包括:
步骤101,获取用户输入的问句,通过预先构建的标准化字典对问句中的实体和属性、及其对应的概念进行识别,并构建包括实体、属性和概念的多个数据节点;步骤101具体包括如下处理:
步骤1011,对问句进行字符分割,将字符之间进行间隔;具体地,字符和字符之间可以用空格间隔;
步骤1012,对于用户问句,通过口语化实体到标准化实体字典识别出问句中出现的口语化实体,并得到该口语化实体所对应的标准化实体;
步骤1013,对于步骤1012中得到的标准化实体,通过标准化实体到标准概念字典,识别出标准化实体的标准化概念;
步骤1014,对于用户问句,通过口语化属性到标准化属性字典识别出问句中出现的口语化属性,并得到该口语化属性所对应的标准化属性;
步骤1015,对于步骤1014中得到的标准化属性,通过标准化属性到标准概念字典,识别出该标准化属性的标准化概念;
步骤1016,判断实体(此处指标准化实体)对应的概念(此处指标准化概念)和属性(此处指标准化属性)对应的概念(此处指标准化概念)是否相同,若两者概念相同,则把实体、属性和对应的概念组合成如图5所示的数据节点;若两者概念不相同,则分别组合成两个概念不同的数据节点。
步骤102,判断数据节点中属性的类型,如果属性的类型为公式属性,则对公式属性的表达式以递归方式拆分为查询属性和/或常数值属性,通过查询获取对应的属性值或常数值,得到公式计算结果并反馈,如果属性的类型为查询属性或常数值属性,则通过查询直接获取对应的属性值或常数值并反馈。
步骤102具体包括:
步骤1021,通过预先构建的属性到类型字典依次判断每个数据节点的属性是否为公式属性,如果判断为是,执行步骤1022,否则,执行步骤1023;
步骤1022,通过公式字典获取公式属性所对应的表达式,并对表达式进行拆分解析,获取表达式中的每一个因子属性,分别将每个因子属性、实体和概念封装成新的数据节点,递归执行步骤1021;如图6所示。
步骤1023,判断数据节点的属性是查询属性还是常数值属性,若是查询属性,将查询属性、实体和概念重新封装成数据节点,将新的数据节点转化成数据库查询语句进行查询,获取属性值;若是常数值属性,则通过公式字典获得具体的常数值,执行步骤1024;
步骤1024,如果数据节点的属性不是公式属性,则将查询到的属性值或常数值直接形成问答结果进行反馈,或者,如果数据节点的属性是公式属性,则将查询到的属性值和/或常数值带入公式,得到公式计算结果,并从公式单位字典中查询计算结果的计算单位,将公式、计算结果、以及计算单位进行拼接形成问答结果进行反馈。
综上所述,借助于本发明实施例的技术方案,通过配置字典、知识图谱查询、递归解析复杂公式的属性,实现了基于字典和知识图谱的关于复杂公式属性的计算。通过配置公式字典,实现了公式的灵活更改及增删,便于系统的维护;通过使用递归方法,实现了复杂公式的拆分与解析;本发明实施例能够有效的解决知识图谱中关于复杂公式的问答,丰富了问答案例。
本实施例所述计算机可读存储介质包括但不限于为:ROM、RAM、磁盘或光盘等。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.一种基于字典和知识图谱的复杂属性查询方法,其特征在于,包括:
步骤1,获取用户输入的问句,通过预先构建的标准化字典对问句中的实体和属性、及其对应的概念进行识别,并构建包括实体、属性和概念的多个数据节点;
步骤2,判断所述数据节点中属性的类型,如果属性的类型为公式属性,则对所述公式属性的表达式以递归方式拆分为查询属性和/或常数值属性,通过查询获取对应的属性值或常数值,得到公式计算结果并反馈,如果属性的类型为查询属性或常数值属性,则通过查询直接获取对应的属性值或常数值并反馈。
2.根据权利要求1所述的方法,其特征在于,步骤2具体包括:
步骤21,通过预先构建的属性到类型字典依次判断每个数据节点的属性是否为公式属性,如果判断为是,执行步骤22,否则,执行步骤23;
步骤22,通过公式字典获取公式属性所对应的表达式,并对所述表达式进行拆分解析,获取所述表达式中的每一个因子属性,分别将每个因子属性、实体和概念封装成新的数据节点,执行步骤21;
步骤23,判断所述数据节点的属性是查询属性还是常数值属性,若是查询属性,将查询属性、实体和概念重新封装成数据节点,将所述新的数据节点转化成数据库查询语句进行查询,获取属性值;若是常数值属性,则通过公式字典获得具体的常数值,执行步骤24;
步骤24,将查询到的所述属性值或所述常数值直接形成问答结果进行反馈,或者,将查询到的所述属性值和/或所述常数值带入公式,得到公式计算结果,并从公式单位字典中查询所述计算结果的计算单位,将公式、计算结果、以及计算单位进行拼接形成问答结果进行反馈。
3.根据权利要求1所述的方法,其特征在于,所述方法进一步包括:
将用户问句中出现的口语化实体映射到知识图谱的标准化实体,构建口语化实体到标准化实体字典;
将标准化实体映射到该实体所对应的标准化概念,构建标准化实体到标准化概念字典;
将用户问句中出现的口语化属性映射到知识图谱的标准化属性,构建口语化属性到标准化属性字典;
将标准化属性映射到该属性所对应的标准化概念,构建标准化属性到标准化概念字典;
构建属性到类型字典,其中,所述类型包括:公式属性、查询属性和常数值属性;
将公式属性映射到该公式属性所对应的表达式,构建公式字典;
将属性映射到该属性所对应的单位,构建公式单位字典。
4.根据权利要求3所述的方法,其特征在于,所述步骤1具体包括:
对问句进行字符分割,将字符之间进行间隔;
通过口语化实体到标准化实体字典识别出问句中出现的口语化实体,并得到该口语化实体所对应的标准化实体;
通过标准化实体到标准概念字典,识别出所述标准化实体的标准化概念;
通过口语化属性到标准化属性字典识别出问句中出现的口语化属性,并得到该口语化属性所对应的标准化属性;
通过标准化属性到标准概念字典,识别出该标准化属性的标准化概念;
判断实体对应的概念和属性对应的概念是否相同,若两者概念相同,则把实体、属性和对应的概念组合成数据节点;若两者概念不相同,则分别组合成两个概念不同的数据节点。
5.一种基于字典和知识图谱的复杂属性查询系统,其特征在于,包括:
字典数据层,用于构建标准化字典、属性到类型字典、公式字典、以及公式单位字典;
解析层,用于判断数据节点中属性的类型,如果属性的类型为公式属性,则对所述公式属性的表达式以递归方式拆分为查询属性和/或常数值属性,调用应用层,如果属性的类型为查询属性或常数值属性,则直接调用应用层;
应用层,用于通过查询获取对应的属性值或常数值,得到公式计算结果并反馈,或者,通过查询获取对应的属性值或常数值并直接反馈。
6.根据权利要求5所述的系统,其特征在于,
所述解析层具体包括识别模块、判断模块、拆分模块、以及封装模块:
识别模块,用于获取用户输入的问句,通过预先构建的标准化字典对问句中的实体和属性、及其对应的概念进行识别,并构建包括实体、属性和概念的多个数据节点;
判断模块,用于通过预先构建的属性到类型字典依次判断每个数据节点的属性是否为公式属性,如果判断为是,调用拆分模块,否则,调用封装模块;
拆分模块,通过公式字典获取公式属性所对应的表达式,并对所述表达式进行拆分解析,获取所述表达式中的每一个因子属性,分别将每个因子属性、实体和概念封装成新的数据节点,调用判断模块;
封装模块,判断所述数据节点的属性是查询属性还是常数值属性,若是查询属性,将查询属性、实体和概念重新封装成数据节点,调用应用层,若是常数值属性,则直接调用应用层;
所述应用层具体用于:将所述新的数据节点转化成数据库查询语句进行查询,获取属性值;通过公式字典获得常数值属性的具体的常数值,将查询到的所述属性值或所述常数值直接形成问答结果进行反馈,或者,将查询到的所述属性值和/或所述常数值带入公式,得到公式计算结果,并从公式单位字典中查询所述计算结果的计算单位,将公式、计算结果、以及计算单位进行拼接形成问答结果进行反馈。
7.根据权利要求5所述的系统,其特征在于,所述字典数据层具体用于:
将用户问句中出现的口语化实体映射到知识图谱的标准化实体,构建口语化实体到标准化实体字典;
将标准化实体映射到该实体所对应的标准化概念,构建标准化实体到标准化概念字典;
将用户问句中出现的口语化属性映射到知识图谱的标准化属性,构建口语化属性到标准化属性字典;
将标准化属性映射到该属性所对应的标准化概念,构建标准化属性到标准化概念字典;
构建属性到类型字典,其中,所述类型包括:公式属性、查询属性和常数值属性;
将公式属性映射到该公式属性所对应的表达式,构建公式字典;
将属性映射到该属性所对应的单位,构建公式单位字典。
8.根据权利要求6所述的系统,其特征在于,所述识别模块具体用于:
对问句进行字符分割,将字符之间进行间隔;
通过口语化实体到标准化实体字典识别出问句中出现的口语化实体,并得到该口语化实体所对应的标准化实体;
通过标准化实体到标准概念字典,识别出所述标准化实体的标准化概念;
通过口语化属性到标准化属性字典识别出问句中出现的口语化属性,并得到该口语化属性所对应的标准化属性;
通过标准化属性到标准概念字典,识别出该标准化属性的标准化概念;
判断实体对应的概念和属性对应的概念是否相同,若两者概念相同,则把实体、属性和对应的概念组合成数据节点;若两者概念不相同,则分别组合成两个概念不同的数据节点。
9.一种基于字典和知识图谱的复杂属性查询设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至4中任一项所述的基于字典和知识图谱的复杂属性查询方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有信息传递的实现程序,所述程序被处理器执行时实现如权利要求1至4中任一项所述的基于字典和知识图谱的复杂属性查询方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010371192.2A CN111611344B (zh) | 2020-05-06 | 2020-05-06 | 基于字典和知识图谱的复杂属性查询方法、系统及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010371192.2A CN111611344B (zh) | 2020-05-06 | 2020-05-06 | 基于字典和知识图谱的复杂属性查询方法、系统及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111611344A CN111611344A (zh) | 2020-09-01 |
CN111611344B true CN111611344B (zh) | 2023-06-13 |
Family
ID=72199572
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010371192.2A Active CN111611344B (zh) | 2020-05-06 | 2020-05-06 | 基于字典和知识图谱的复杂属性查询方法、系统及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111611344B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112214609B (zh) * | 2020-09-24 | 2023-10-03 | 远光软件股份有限公司 | 一种基于知识图谱的审计方法和系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007002799A1 (en) * | 2005-06-29 | 2007-01-04 | Lightspeed Logic, Inc. | Methods and systems for placement |
WO2010030978A2 (en) * | 2008-09-15 | 2010-03-18 | Aman James A | Session automated recording together with rules based indexing, analysis and expression of content |
CN108075990A (zh) * | 2018-01-30 | 2018-05-25 | 北京邮电大学 | 资源感知的服务链备份节点分配算法及装置 |
CN109672706A (zh) * | 2017-10-16 | 2019-04-23 | 百度在线网络技术(北京)有限公司 | 一种信息推荐方法、装置、服务器及存储介质 |
CN109977291A (zh) * | 2019-03-20 | 2019-07-05 | 武汉市软迅科技有限公司 | 基于物理知识图谱的检索方法、装置、设备及存储介质 |
CN110598006A (zh) * | 2019-09-17 | 2019-12-20 | 南京医渡云医学技术有限公司 | 模型的训练方法、三元组的嵌入方法、装置、介质及设备 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020132209A1 (en) * | 2000-09-21 | 2002-09-19 | Grant Charles Alexander | Method and apparatus for automating tutoring for homework problems |
KR100835291B1 (ko) * | 2007-03-14 | 2008-06-10 | 엔에이치엔(주) | 쿼리 타게팅 방법 및 시스템 |
KR101431530B1 (ko) * | 2010-12-07 | 2014-08-22 | 에스케이텔레콤 주식회사 | 수학문장의 시맨틱거리 추출 및 시맨틱거리에 의한 수학문장의 분류방법과 그를 위한 장치 및 컴퓨터로 읽을 수 있는 기록매체 |
US20160299951A1 (en) * | 2015-04-08 | 2016-10-13 | Vinay BAWRI | Processing a search query and retrieving targeted records from a networked database system |
CN110837586B (zh) * | 2018-08-15 | 2023-05-26 | 阿里巴巴集团控股有限公司 | 问答匹配方法、系统、服务器及存储介质 |
CN109492077B (zh) * | 2018-09-29 | 2020-09-29 | 北京智通云联科技有限公司 | 基于知识图谱的石化领域问答方法及系统 |
CN109657099B (zh) * | 2018-12-12 | 2021-06-01 | 广东小天才科技有限公司 | 一种学习互动方法及学习客户端 |
CN110275947A (zh) * | 2019-05-23 | 2019-09-24 | 中国人民解放军战略支援部队信息工程大学 | 基于命名实体识别的特定领域知识图谱自然语言查询方法及装置 |
CN111008213B (zh) * | 2019-12-23 | 2023-05-26 | 百度在线网络技术(北京)有限公司 | 用于生成语言转换模型的方法和装置 |
-
2020
- 2020-05-06 CN CN202010371192.2A patent/CN111611344B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007002799A1 (en) * | 2005-06-29 | 2007-01-04 | Lightspeed Logic, Inc. | Methods and systems for placement |
WO2010030978A2 (en) * | 2008-09-15 | 2010-03-18 | Aman James A | Session automated recording together with rules based indexing, analysis and expression of content |
CN109672706A (zh) * | 2017-10-16 | 2019-04-23 | 百度在线网络技术(北京)有限公司 | 一种信息推荐方法、装置、服务器及存储介质 |
CN108075990A (zh) * | 2018-01-30 | 2018-05-25 | 北京邮电大学 | 资源感知的服务链备份节点分配算法及装置 |
CN109977291A (zh) * | 2019-03-20 | 2019-07-05 | 武汉市软迅科技有限公司 | 基于物理知识图谱的检索方法、装置、设备及存储介质 |
CN110598006A (zh) * | 2019-09-17 | 2019-12-20 | 南京医渡云医学技术有限公司 | 模型的训练方法、三元组的嵌入方法、装置、介质及设备 |
Non-Patent Citations (2)
Title |
---|
《Path signatures:a way to speed up recuision in relational databases》;J.Teuhola;《IEEE Transactions on Knowledge and Data Engineering》;第8卷(第3期);全文 * |
《个性化教学系统中学生血液能力模型构建的研究与应用》;苏喻;《中国优秀博士学位论文全文数据库》;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111611344A (zh) | 2020-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110457431B (zh) | 基于知识图谱的问答方法、装置、计算机设备和存储介质 | |
CN110750649A (zh) | 知识图谱构建及智能应答方法、装置、设备及存储介质 | |
CN111639190A (zh) | 医疗知识图谱构建方法 | |
CN107491547A (zh) | 基于人工智能的搜索方法和装置 | |
CN112084789B (zh) | 文本处理方法、装置、设备及存储介质 | |
WO2021047169A1 (zh) | 信息查询方法及装置、存储介质、智能终端 | |
CN110166522A (zh) | 服务器识别方法、装置、可读存储介质和计算机设备 | |
CN111611344B (zh) | 基于字典和知识图谱的复杂属性查询方法、系统及设备 | |
CN115858886A (zh) | 数据处理方法、装置、设备及可读存储介质 | |
CN114780701A (zh) | 自动问答匹配方法、装置、计算机设备及存储介质 | |
CN113157875A (zh) | 知识图谱问答系统、方法及装置 | |
CN115210705A (zh) | 具有无效值或等效值的关系表的向量嵌入模型 | |
CN112735564A (zh) | 心理健康状态预测方法、设备、介质及计算机程序产品 | |
CN111611806B (zh) | 一种用于知识图谱问答的语义解析方法、系统及设备 | |
CN111523309A (zh) | 药品信息归一化的方法、装置、存储介质及电子设备 | |
CN108196921B (zh) | 单据开发方法、装置、计算机设备和存储介质 | |
CN113283231B (zh) | 获取签章位的方法、设置系统、签章系统及存储介质 | |
CN115640403A (zh) | 基于知识图谱的知识管控方法及装置 | |
CN114676258A (zh) | 一种基于患者症状描述文本的疾病分类智能服务方法 | |
CN114398903A (zh) | 意图识别方法、装置、电子设备及存储介质 | |
CN111782781A (zh) | 一种语义分析方法、装置、计算机设备及存储介质 | |
CN113392202A (zh) | 基于知识图谱的问答系统和方法 | |
CN112445917A (zh) | 传统医学疾病本体的构建方法及装置 | |
CN112286916A (zh) | 一种数据处理方法、装置、设备及存储介质 | |
CN117473070B (zh) | 智能机器人的多渠道应用方法、智能机器人和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |