CN109684354A - 数据查询方法和装置 - Google Patents

数据查询方法和装置 Download PDF

Info

Publication number
CN109684354A
CN109684354A CN201710974343.1A CN201710974343A CN109684354A CN 109684354 A CN109684354 A CN 109684354A CN 201710974343 A CN201710974343 A CN 201710974343A CN 109684354 A CN109684354 A CN 109684354A
Authority
CN
China
Prior art keywords
target
induction matrix
answer
entity
concept
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710974343.1A
Other languages
English (en)
Inventor
曾祥辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201710974343.1A priority Critical patent/CN109684354A/zh
Publication of CN109684354A publication Critical patent/CN109684354A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种数据查询方法和装置。其中,该方法包括:获取多个问题以及每个问题的答案对应的推理路径,得到样本数据;根据样本数据对问题与推理路径的映射关系模型进行训练,得到训练后的映射关系模型;获取目标问题;根据训练后的映射关系模型计算目标问题的推理路径,得到目标推理路径;根据目标推理路径从知识图谱中查询目标问题的答案。本发明解决了现有技术中司法数据查询准确度低的技术问题。

Description

数据查询方法和装置
技术领域
本发明涉及数据查询领域,具体而言,涉及一种数据查询方法和装置。
背景技术
用户可以在问答系统上进行查询,例如,用户输入“北京有多少人”、“河北省的省会是哪”、“洛阳是哪个省的”、“专利法第一条是什么”、“合同法第三条是什么”等。现有的问答系统从用户输入的问题中提取出关键词,然后根据关键词检索出相应的答案。
这种方式具有以下缺点:一、有时候,用户使用的词汇很口语化或者语法不规范导致问答系统无法正确理解用户想要表达的含义,从而提供的答案不是用户想要的答案;二、传统的问答系统通常会给出一些包含用户想要的信息的答案,而用户需要自己从问答系统提供的答案中提取自己想要的信息,增加了用户的工作量。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种数据查询方法和装置,以至少解决现有技术中司法数据查询准确度低的技术问题。
根据本发明实施例的一个方面,提供了一种数据查询方法,包括:获取多个问题以及每个所述问题的答案对应的推理路径,得到样本数据;根据所述样本数据对问题与推理路径的映射关系模型进行训练,得到训练后的映射关系模型;获取目标问题;根据训练后的映射关系模型计算所述目标问题的推理路径,得到目标推理路径;根据所述目标推理路径从知识图谱中查询所述目标问题的答案。
进一步地,获取多个问题以及每个所述问题的答案对应的推理路径,包括:获取多个所述问题;识别每个所述问题中的实体和概念;根据每个所述问题中的实体和概念标注每个所述问题的答案对应的推理路径。
进一步地,根据训练后的映射关系模型计算所述目标问题的推理路径,得到目标推理路径,包括:识别所述目标问题中的实体和概念;根据所述目标问题中的实体和概念从所述训练后的映射关系模型中获取所述目标问题的推理路径,得到所述目标推理路径。
进一步地,根据所述目标推理路径从知识图谱中查询所述目标问题的答案,包括:根据所述目标推理路径生成用于进行知识图谱查询的图谱查询语言,得到目标图谱查询语言;根据所述目标图谱查询语言从所述知识图谱中查询所述目标问题的答案。
进一步地,在根据所述目标推理路径从知识图谱中查询所述目标问题的答案之后,所述方法还包括:如果查询到多个答案,按照预设排序规则对多个所述答案进行排序;将排序后的多个所述答案进行输出。
根据本发明实施例的一个方面,还提供了一种数据查询装置,包括:第一获取单元,用于获取多个问题以及每个所述问题的答案对应的推理路径,得到样本数据;训练单元,用于根据所述样本数据对问题与推理路径的映射关系模型进行训练,得到训练后的映射关系模型;第二获取单元,用于获取目标问题;计算单元,用于根据训练后的映射关系模型计算所述目标问题的推理路径,得到目标推理路径;查询单元,用于根据所述目标推理路径从知识图谱中查询所述目标问题的答案。
进一步地,所述第一获取单元包括:第一获取子单元,用于获取多个所述问题;第一识别子单元,用于识别每个所述问题中的实体和概念;标注子单元,用于根据每个所述问题中的实体和概念标注每个所述问题的答案对应的推理路径。
进一步地,所述计算单元包括:第二识别子单元,用于识别所述目标问题中的实体和概念;第二获取子单元,用于根据所述目标问题中的实体和概念从所述训练后的映射关系模型中获取所述目标问题的推理路径,得到所述目标推理路径。
进一步地,所述查询单元包括:生成子单元,用于根据所述目标推理路径生成用于进行知识图谱查询的目标图谱查询语言;查询子单元,用于根据所述目标图谱查询语言从所述知识图谱中查询所述目标问题的答案。
进一步地,所述装置还包括:输出单元,用于如果查询到多个答案,按照预设排序规则对多个所述答案进行排序后输出。
根据本发明实施例的一个方面,还提供了一种存储介质,所述存储介质包括存储的程序,其中,所述程序执行上述的数据查询方法。
根据本发明实施例的一个方面,还提供了一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行上述的数据查询方法。
在本申请实施例中,样本数据中包含对于同一个司法问题的不同问法,通过根据样本数据对问题与推理路径的映射关系模型进行训练,得到训练后的映射关系模型,根据训练后的映射关系模型计算目标问题的推理路径,即使目标问题的问法很口语化或者用词不是非常规范,也能正确理解用户想表达的含义,找到目标问题的正确推理路径,根据目标问题的正确推理路径从知识图谱中查询目标问题的答案,达到了提高司法数据查询的准确度的技术效果,进而解决了现有技术中司法数据查询准确度低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的数据查询方法的流程图;
图2是根据本发明实施例的另一种可选的数据查询方法的流程图;
图3是根据本发明实施例的一种可选的数据查询装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
技术术语解释:
知识图谱:一种大规模知识管理的技术。
司法知识图谱:在司法领域内的知识图谱,主要包括案件(文书)信息及其相关信息、实体及概念知识的图谱。
实体:是指现实世界中客观存在的并可以相互区分的对象或事物。就数据库而言,实体往往指某类事物的集合。可以是具体的人事物,也可以是抽象的概念、联系。
命名实体识别(Named Entity Recognition,简称NER):又称作“专名识别”,是自然语言处理(Natural LanguageProcessing,NLP)的一个基础任务,是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。
机器学习:机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径。它的应用已遍及人工智能的各个分支,如专家系统、自动推理、自然语言理解、模式识别、计算机视觉、智能机器人等领域。
根据本发明实施例,提供了一种数据查询方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种可选的数据查询方法的流程图。该方法是由服务器集群执行的。如图1所示,该方法包括如下步骤:
步骤S102,获取多个问题以及每个问题的答案对应的推理路径,得到样本数据。
步骤S104,根据样本数据对问题与推理路径的映射关系模型进行训练,得到训练后的映射关系模型。
步骤S106,获取目标问题。
步骤S108,根据训练后的映射关系模型计算目标问题的推理路径,得到目标推理路径。
步骤S110,根据目标推理路径从知识图谱中查询目标问题的答案。
目标问题可以以文字或者语音等形式输入。
样本数据可以是与司法知识有关的数据。
目标问题可以是与司法知识有关的问题,例如“刑法第5条是什么”、“民法第10条是什么”等。
知识图谱又称为科学知识图谱,在图书情报界称为知识域可视化知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
在本申请实施例中,知识图谱包括了显示司法知识发展进程与司法知识结构关系的一系列图形。
映射关系模型包括了多个问题与其对应的推理路径之间的映射关系。例如,问题“刑法第5条是什么”对应的推理路径是:刑法->第5条,则问题“刑法第5条是什么”与其对应的推理路径之间的映射关系是:问题“刑法第5条是什么”指向推理路径“刑法->第5条”。再例如,问题“刑法第5条是啥”对应的推理路径是:刑法->第5条,则问题“刑法第5条是啥”与其对应的推理路径之间的映射关系是:问题“刑法第5条是啥”指向推理路径“刑法->第5条”。问题“民法第10条第1款是什么”对应的推理路径是:民法->第10条->第1款,则问题“民法第10条第1款是什么”与其对应的推理路径之间的映射关系是:问题“民法第10条第1款是什么”指向推理路径“民法->第10条->第1款”。
在本申请实施例中,样本数据中包含对于同一个司法问题的不同问法,通过根据样本数据对问题与推理路径的映射关系模型进行训练,得到训练后的映射关系模型,根据训练后的映射关系模型计算目标问题的推理路径,即使目标问题的问法很口语化或者用词不是非常规范,也能正确理解用户想表达的含义,找到目标问题的正确推理路径,根据目标问题的正确推理路径从知识图谱中查询目标问题的答案,避免了现有技术中司法数据查询准确度低的问题,达到了提高司法数据查询的准确度的技术效果。
知识图谱以图结构的形式存储了大量的司法相关实体和概念的知识和信息,通过对查询语言的语义分析,对应到知识图谱中的数据库查询语言,从知识图谱中获取到目标问题的答案,直接返回用户需要的信息,用户无需再次提取信息,可以有效地提高知识获取的效率。
本申请实施例提供的数据查询方法既可以接收以文字形式输入的目标问题,也可以接收以语音形式输入的目标问题。
对于以文字形式输入的目标问题,可以根据自然语言处理技术先对目标问题进行分词,然后识别目标问题中的实体和概念。
对于以语音形式输入的目标问题,可以先将语音数据进行处理,将语音转换为文字,然后再识别其中的实体和概念。
可选地,获取多个问题以及每个问题的答案对应的推理路径,包括:获取多个问题;识别每个问题中的实体和概念;根据每个问题中的实体和概念标注每个问题的答案对应的推理路径。
举例来说,“北京有多少人”这个问题的实体是“北京”,概念是“多少人”,“北京有多少人”这个问题的答案对应的推理路径是:北京->多少人。
“北京的人口数量是”这个问题的实体是“北京”,概念是“人口数量”,“北京的人口数量是”这个问题的答案对应的推理路径是:北京->人口数量。
“巴黎有多少人”这个问题的实体是“巴黎”,概念是“多少人”,“巴黎有多少人”这个问题的答案对应的推理路径是:巴黎->多少人。
“巴黎的人口数量是”这个问题的实体是“巴黎”,概念是“人口数量”,“巴黎的人口数量是”这个问题的答案对应的推理路径是:巴黎->人口数量。
“刑法第5条是什么”这个问题的实体是“刑法”,概念是“第5条”,“刑法第5条是什么”这个问题的答案对应的推理路径是:刑法->第5条。
可选地,根据训练后的映射关系模型计算目标问题的推理路径,得到目标推理路径,包括:识别目标问题中的实体和概念;根据目标问题中的实体和概念从训练后的映射关系模型中获取目标问题的推理路径,得到目标推理路径。
由于语言不像数字那样精确,导致用户输入的目标问题可能有多个含义,例如,目标问题为“苹果8多少钱”,由于“苹果”既可以表示一种水果,又可以表示一个手机品牌,因此,需要找到用户最想要的那种含义。在本申请实施例中,结合上下文,可以知道用户指的是第8代苹果手机。
对于同一个问题,有多种不同的问法,例如一个用户想要查询姚明的妻子,那么问题可能是:“姚明的妻子是谁”、“姚明老婆是谁”、“姚明的爱人叫什么名字”,等。
样本数据中包含对于同一个问题的不同问法,通过根据样本数据对问题与推理路径的映射关系模型进行训练,得到训练后的映射关系模型,根据训练后的映射关系模型计算目标问题的推理路径,即使目标问题的问法很口语化或者用词不是非常规范,也能找到目标问题的推理路径。
可选地,根据目标推理路径从知识图谱中查询目标问题的答案,包括:根据目标推理路径生成用于进行知识图谱查询的目标图谱查询语言;根据目标图谱查询语言从知识图谱中查询目标问题的答案。
可选地,在根据目标推理路径从知识图谱中查询目标问题的答案之后,方法还包括:如果查询到多个答案,按照预设排序规则对多个所述答案进行排序后输出。
预设排序规则可以有多种,例如按照预设排序规则对多个答案进行排序可以有多种:
第一种:根据答案在预设时间范围内的热度进行排序,可以将热度高的答案排在前面;
第二种:根据答案中是否包含预设关键词进行排序,例如预设关键词可以是某些黄暴词汇等敏感字词,可以将包含预设关键词的答案排在后面;
第三种:根据经验数据对多个答案进行排序。
通过将多个答案按照预设排序规则进行排序,将用户最有可能想看到的答案排在前面,优先展示给用户,节约了用户的时间,提升了用户体验。
图2是根据本发明实施例的另一种可选的数据查询方法的流程图。如图2所示,该流程包括:
1.对现有的法律问答对数据进行标注,通过命名实体识别及专业概念识别技术,识别每个问题中的实体和概念,并在此基础上,标注每个问题答案对应的推理路径(知识图谱中的属性和关系)。
2.将标注数据作为语料,通过机器学习训练问题与推理路径的映射关系模型。
3.将当前问题(目标问题)作为输入,通过命名实体识别和专业概念识别技术,识别当前问题中的实体和概念,并对应到知识图谱中的实体和概念上;通过映射关系模型,获得该问题的推理路径(目标推理路径)。
4.将推理路径翻译成图谱查询语言,从而获取该问题的答案。
5.若查询到多个答案,则通过业务专家的先验经验对结果进行排序后输出。
本申请实施例引入了自然语言处理与知识图谱技术,实现了司法领域的知识问答系统,可为人们提供高效自然的知识获取接口,可用于法院的自动问答等系统,减少人工工作量,提高司法问答系统的智能化程度。
在本申请实施例中,在语义分析与知识图谱技术的基础上,结合语音识别,实现司法领域的智能问答,为人们提供更好的知识获取接口,提高了知识获取效率,改善用户体验。
本发明实施例还提供了一种数据查询装置,该数据查询装置用于执行数据查询方法。
图3是根据本发明实施例的一种可选的数据查询装置的示意图,如图3所示,该装置包括:第一获取单元10、训练单元20、第二获取单元30、计算单元40、查询单元50。
第一获取单元10,用于获取多个问题以及每个问题的答案对应的推理路径,得到样本数据。
训练单元20,用于根据样本数据对问题与推理路径的映射关系模型进行训练,得到训练后的映射关系模型。
第二获取单元30,用于获取目标问题。
计算单元40,用于根据训练后的映射关系模型计算目标问题的推理路径,得到目标推理路径。
查询单元50,用于根据目标推理路径从知识图谱中查询目标问题的答案。
可选地,第一获取单元10包括:第一获取子单元、第一识别子单元、标注子单元。第一获取子单元,用于获取多个问题。第一识别子单元,用于识别每个问题中的实体和概念。标注子单元,用于根据每个问题中的实体和概念标注每个问题的答案对应的推理路径。
可选地,计算单元40包括:第二识别子单元、第二获取子单元。第二识别子单元,用于识别目标问题中的实体和概念。第二获取子单元,用于根据目标问题中的实体和概念从训练后的映射关系模型中获取目标问题的推理路径,得到目标推理路径。
可选地,查询单元50包括:生成子单元、查询子单元。生成子单元,用于根据目标推理路径生成用于进行知识图谱查询的目标图谱查询语言。查询子单元,用于根据目标图谱查询语言从知识图谱中查询目标问题的答案。
可选地,装置还包括:输出单元。输出单元,用于如果查询到多个答案,按照预设排序规则对多个所述答案进行排序后输出。
所述数据查询装置包括处理器和存储器,上述第一获取单元10、训练单元20、第二获取单元30、计算单元40、查询单元50等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来执行上述数据查询方法。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述数据查询方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述数据查询方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:
获取多个问题以及每个问题的答案对应的推理路径,得到样本数据;根据样本数据对问题与推理路径的映射关系模型进行训练,得到训练后的映射关系模型;获取目标问题;根据训练后的映射关系模型计算目标问题的推理路径,得到目标推理路径;根据目标推理路径从知识图谱中查询目标问题的答案。
获取多个问题;识别每个问题中的实体和概念;根据每个问题中的实体和概念标注每个问题的答案对应的推理路径。
识别目标问题中的实体和概念;根据目标问题中的实体和概念从训练后的映射关系模型中获取目标问题的推理路径,得到目标推理路径。
根据目标推理路径生成用于进行知识图谱查询的目标图谱查询语言;根据目标图谱查询语言从知识图谱中查询目标问题的答案。
在根据目标推理路径从知识图谱中查询目标问题的答案之后,如果查询到多个答案,按照预设排序规则对多个所述答案进行排序后输出。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:
获取多个问题以及每个问题的答案对应的推理路径,得到样本数据;根据样本数据对问题与推理路径的映射关系模型进行训练,得到训练后的映射关系模型;获取目标问题;根据训练后的映射关系模型计算目标问题的推理路径,得到目标推理路径;根据目标推理路径从知识图谱中查询目标问题的答案。
获取多个问题;识别每个问题中的实体和概念;根据每个问题中的实体和概念标注每个问题的答案对应的推理路径。
识别目标问题中的实体和概念;根据目标问题中的实体和概念从训练后的映射关系模型中获取目标问题的推理路径,得到目标推理路径。
根据目标推理路径生成用于进行知识图谱查询的目标图谱查询语言;根据目标图谱查询语言从知识图谱中查询目标问题的答案。
在根据目标推理路径从知识图谱中查询目标问题的答案之后,如果查询到多个答案,按照预设排序规则对多个所述答案进行排序后输出。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种数据查询方法,其特征在于,包括:
获取多个问题以及每个所述问题的答案对应的推理路径,得到样本数据;
根据所述样本数据对问题与推理路径的映射关系模型进行训练,得到训练后的映射关系模型;
获取目标问题;
根据训练后的映射关系模型计算所述目标问题的推理路径,得到目标推理路径;
根据所述目标推理路径从知识图谱中查询所述目标问题的答案。
2.根据权利要求1所述的方法,其特征在于,获取多个问题以及每个所述问题的答案对应的推理路径,包括:
获取多个所述问题;
识别每个所述问题中的实体和概念;
根据每个所述问题中的实体和概念标注每个所述问题的答案对应的推理路径。
3.根据权利要求1所述的方法,其特征在于,根据训练后的映射关系模型计算所述目标问题的推理路径,得到目标推理路径,包括:
识别所述目标问题中的实体和概念;
根据所述目标问题中的实体和概念从所述训练后的映射关系模型中获取所述目标问题的推理路径,得到所述目标推理路径。
4.根据权利要求1所述的方法,其特征在于,根据所述目标推理路径从知识图谱中查询所述目标问题的答案,包括:
根据所述目标推理路径生成用于进行知识图谱查询的目标图谱查询语言;
根据所述目标图谱查询语言从所述知识图谱中查询所述目标问题的答案。
5.根据权利要求1所述的方法,其特征在于,在根据所述目标推理路径从知识图谱中查询所述目标问题的答案之后,所述方法还包括:
如果查询到多个答案,按照预设排序规则对多个所述答案进行排序后输出。
6.一种数据查询装置,其特征在于,包括:
第一获取单元,用于获取多个问题以及每个所述问题的答案对应的推理路径,得到样本数据;
训练单元,用于根据所述样本数据对问题与推理路径的映射关系模型进行训练,得到训练后的映射关系模型;
第二获取单元,用于获取目标问题;
计算单元,用于根据训练后的映射关系模型计算所述目标问题的推理路径,得到目标推理路径;
查询单元,用于根据所述目标推理路径从知识图谱中查询所述目标问题的答案。
7.根据权利要求6所述的装置,其特征在于,所述第一获取单元包括:
第一获取子单元,用于获取多个所述问题;
第一识别子单元,用于识别每个所述问题中的实体和概念;
标注子单元,用于根据每个所述问题中的实体和概念标注每个所述问题的答案对应的推理路径。
8.根据权利要求6所述的装置,其特征在于,所述计算单元包括:
第二识别子单元,用于识别所述目标问题中的实体和概念;
第二获取子单元,用于根据所述目标问题中的实体和概念从所述训练后的映射关系模型中获取所述目标问题的推理路径,得到所述目标推理路径。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序执行权利要求1至5中任意一项所述的数据查询方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至5中任意一项所述的数据查询方法。
CN201710974343.1A 2017-10-18 2017-10-18 数据查询方法和装置 Pending CN109684354A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710974343.1A CN109684354A (zh) 2017-10-18 2017-10-18 数据查询方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710974343.1A CN109684354A (zh) 2017-10-18 2017-10-18 数据查询方法和装置

Publications (1)

Publication Number Publication Date
CN109684354A true CN109684354A (zh) 2019-04-26

Family

ID=66183455

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710974343.1A Pending CN109684354A (zh) 2017-10-18 2017-10-18 数据查询方法和装置

Country Status (1)

Country Link
CN (1) CN109684354A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110532397A (zh) * 2019-07-19 2019-12-03 平安科技(深圳)有限公司 基于人工智能的问答方法、装置、计算机设备及存储介质
CN111309879A (zh) * 2020-01-20 2020-06-19 北京文思海辉金信软件有限公司 基于知识图谱的人机训练场景构建方法和装置
CN111813949A (zh) * 2020-05-18 2020-10-23 中国人民解放军国防科技大学 联合查询的网络空间知识图谱推理方法和装置
CN112035581A (zh) * 2020-08-21 2020-12-04 北京字节跳动网络技术有限公司 基于模型的任务处理方法、装置、设备和介质
CN112131370A (zh) * 2020-11-23 2020-12-25 四川大学 问答模型构建方法及系统、问答方法及装置、审判系统
CN113641805A (zh) * 2021-07-19 2021-11-12 北京百度网讯科技有限公司 结构化问答模型的获取方法、问答方法及对应装置
CN116955592A (zh) * 2023-07-21 2023-10-27 广州拓尔思大数据有限公司 基于可视化推理结果的数据处理方法及系统
CN112035581B (zh) * 2020-08-21 2024-06-11 北京字节跳动网络技术有限公司 基于模型的任务处理方法、装置、设备和介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104866593A (zh) * 2015-05-29 2015-08-26 中国电子科技集团公司第二十八研究所 一种基于知识图谱的数据库搜索方法
US20160171376A1 (en) * 2014-12-12 2016-06-16 International Business Machines Corporation Inferred Facts Discovered through Knowledge Graph Derived Contextual Overlays
CN105701253A (zh) * 2016-03-04 2016-06-22 南京大学 中文自然语言问句语义化的知识库自动问答方法
CN106844368A (zh) * 2015-12-03 2017-06-13 华为技术有限公司 用于人机对话的方法、神经网络系统和用户设备
CN106919655A (zh) * 2017-01-24 2017-07-04 网易(杭州)网络有限公司 一种答案提供方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160171376A1 (en) * 2014-12-12 2016-06-16 International Business Machines Corporation Inferred Facts Discovered through Knowledge Graph Derived Contextual Overlays
CN104866593A (zh) * 2015-05-29 2015-08-26 中国电子科技集团公司第二十八研究所 一种基于知识图谱的数据库搜索方法
CN106844368A (zh) * 2015-12-03 2017-06-13 华为技术有限公司 用于人机对话的方法、神经网络系统和用户设备
CN105701253A (zh) * 2016-03-04 2016-06-22 南京大学 中文自然语言问句语义化的知识库自动问答方法
CN106919655A (zh) * 2017-01-24 2017-07-04 网易(杭州)网络有限公司 一种答案提供方法和装置

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110532397A (zh) * 2019-07-19 2019-12-03 平安科技(深圳)有限公司 基于人工智能的问答方法、装置、计算机设备及存储介质
CN110532397B (zh) * 2019-07-19 2023-06-09 平安科技(深圳)有限公司 基于人工智能的问答方法、装置、计算机设备及存储介质
WO2021012519A1 (zh) * 2019-07-19 2021-01-28 平安科技(深圳)有限公司 基于人工智能的问答方法、装置、计算机设备及存储介质
CN111309879A (zh) * 2020-01-20 2020-06-19 北京文思海辉金信软件有限公司 基于知识图谱的人机训练场景构建方法和装置
CN111813949B (zh) * 2020-05-18 2022-06-24 中国人民解放军国防科技大学 联合查询的网络空间知识图谱推理方法和装置
CN111813949A (zh) * 2020-05-18 2020-10-23 中国人民解放军国防科技大学 联合查询的网络空间知识图谱推理方法和装置
CN112035581A (zh) * 2020-08-21 2020-12-04 北京字节跳动网络技术有限公司 基于模型的任务处理方法、装置、设备和介质
CN112035581B (zh) * 2020-08-21 2024-06-11 北京字节跳动网络技术有限公司 基于模型的任务处理方法、装置、设备和介质
CN112131370B (zh) * 2020-11-23 2021-03-12 四川大学 问答模型构建方法及系统、问答方法及装置、审判系统
CN112131370A (zh) * 2020-11-23 2020-12-25 四川大学 问答模型构建方法及系统、问答方法及装置、审判系统
CN113641805A (zh) * 2021-07-19 2021-11-12 北京百度网讯科技有限公司 结构化问答模型的获取方法、问答方法及对应装置
CN113641805B (zh) * 2021-07-19 2024-05-24 北京百度网讯科技有限公司 结构化问答模型的获取方法、问答方法及对应装置
CN116955592A (zh) * 2023-07-21 2023-10-27 广州拓尔思大数据有限公司 基于可视化推理结果的数据处理方法及系统
CN116955592B (zh) * 2023-07-21 2024-02-09 广州拓尔思大数据有限公司 基于可视化推理结果的数据处理方法及系统

Similar Documents

Publication Publication Date Title
CN109684354A (zh) 数据查询方法和装置
CN110309514A (zh) 一种语义识别方法及装置
CN111984779B (zh) 一种对话文本分析方法、装置、设备和可读介质
CN109934619A (zh) 用户画像标签建模方法、装置、电子设备及可读存储介质
CN111708869B (zh) 人机对话的处理方法及装置
CN110765247B (zh) 一种用于问答机器人的输入提示方法及装置
CN106776503A (zh) 文本语义相似度的确定方法及装置
CN111552766B (zh) 使用机器学习来表征在引用图形上应用的参考关系
CN109086265A (zh) 一种语义训练方法、短文本中多语义词消歧方法
US11461317B2 (en) Method, apparatus, system, device, and storage medium for answering knowledge questions
CN108197177A (zh) 业务对象的监测方法、装置、存储介质和计算机设备
CN112507139B (zh) 基于知识图谱的问答方法、系统、设备及存储介质
CN114510570A (zh) 基于小样本语料的意图分类方法、装置及计算机设备
CN108694183A (zh) 一种检索方法及装置
CN110442730A (zh) 一种基于deepdive的知识图谱构建方法
CN110263817B (zh) 一种基于用户账号的风险等级划分方法及装置
CN109583473A (zh) 一种特征数据的生成方法及装置
CN108550019A (zh) 一种简历筛选方法及装置
CN113392190B (zh) 一种文本识别方法、相关设备及装置
Sangeetha et al. Information retrieval system for laws
CN110008352A (zh) 实体发现方法及装置
CN112328812B (zh) 基于自调参数的领域知识抽取方法与系统、电子设备
CN115129885A (zh) 实体链指方法、装置、设备及存储介质
JP2022168859A (ja) コンピュータ実装方法、コンピュータプログラム、及びシステム(予測クエリ処理)
CN111597306B (zh) 语句识别方法和装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Applicant after: Beijing Guoshuang Technology Co.,Ltd.

Address before: 100086 Beijing city Haidian District Shuangyushu Area No. 76 Zhichun Road cuigongfandian 8 layer A

Applicant before: Beijing Guoshuang Technology Co.,Ltd.

CB02 Change of applicant information
RJ01 Rejection of invention patent application after publication

Application publication date: 20190426

RJ01 Rejection of invention patent application after publication