CN109933653A - 问答系统的问答查询方法、系统及计算机设备 - Google Patents

问答系统的问答查询方法、系统及计算机设备 Download PDF

Info

Publication number
CN109933653A
CN109933653A CN201910069661.2A CN201910069661A CN109933653A CN 109933653 A CN109933653 A CN 109933653A CN 201910069661 A CN201910069661 A CN 201910069661A CN 109933653 A CN109933653 A CN 109933653A
Authority
CN
China
Prior art keywords
question
answer
information
descriptor
candidate answers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910069661.2A
Other languages
English (en)
Inventor
金戈
徐亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910069661.2A priority Critical patent/CN109933653A/zh
Publication of CN109933653A publication Critical patent/CN109933653A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种问答系统的问答查询方法,包括以下步骤:获取用户提问信息,并提取所述提问信息中的主题词及所述主题词的属性信息;根据所述主题词查询问答系统的知识图谱以得到所述提问信息的至少一个候选答案;及基于评估模型对所述至少一个候选答案进行评估以得到所述提问信息对应的答案。本发明实施例还提供了问答查询系统、计算机设备和计算机可存储介质。本发明实施例可以提高搜索得到问答对应的答案的效率。

Description

问答系统的问答查询方法、系统及计算机设备
技术领域
本发明实施例涉及人工智能领域,尤其涉及一种问答系统的问答查询方法、系统及计算机设备。
背景技术
问答系统(Question and Answering,简称QA)综合运用知识表示、信息检索、自然语言处理等技术,能够接收用户以自然语言形式输入问题,即可返回简洁而准确的答案的系统。自动问答系统相比于传统的搜索引擎,具有更方便、更准确的优点。
然而,在传统知识问答系统中,系统中的各个问句的关系为平级,在搜索问句答案时,将各问句转化为数据库语言进行聚合搜索答案,此种搜索方式效率较低。
发明内容
有鉴于此,本发明实施例的目的是提供一种问答系统的问答查询方法、系统、计算机设备及计算机可读存储介质,可提高搜索得到问答对应的答案的效率。
为实现上述目的,本发明实施例提供了一种问答系统的问答查询方法,包括以下步骤:
获取用户提问信息,并提取所述提问信息中的主题词及所述主题词的属性信息;
根据所述主题词查询问答系统的知识图谱以得到所述提问信息的至少一个候选答案;及
基于评估模型对所述至少一个候选答案进行评估以得到所述提问信息对应的答案。
进一步地,所述提取所述提问信息中的主题词及所述主题词的属性信息的步骤包括:
对所述提问信息进行依存句法分析,以得到所述提问信息的依存树;及
从所述依存树中提取所述提问信息的主题词及所述主题词的属性信息。
进一步地,所述基于评估模型对所述至少一个候选答案进行评估以得到所述提问信息对应的答案的步骤包括:
基于评估模型对各个候选答案进行评分;及
选取评分值最高的候选答案作为所述提问信息对应的答案。
进一步地,所述基于评估模型对各个候选答案进行评分的步骤包括:
将所述属性信息与各个候选答案进行比较以确认所述属性信息与各个所述候选答案的相似度值;及
根据所述相似度值确认各个所述候选答案的评分。
进一步地,所述的问答系统的问答查询方法还包括:
构建所述问答系统的知识图谱,其中,所述知识图谱中的节点对应的实体为问句的主题词。
进一步地,所述根据所述主题词搜索问答系统的知识图谱以得到所述提问信息的至少一个候选答案的步骤包括:
将所述主题词与所述知识图谱中的各个节点对应的实体进行比较;及
若所述主题词与所述实体相同,则将所述实体对应的节点的子节点对应的实体作为所述提问信息的候选答案。
进一步地,所述问答系统的问答查询方法还包括:
获取训练样本数据,所述训练样本数据包括多个问句及所述问句对应的答案;及
使用所述训练样本数据对神经网络模型进行训练以得到所述评估模型。
为实现上述目的,本发明实施例还提供了一种问答查询系统,包括:
获取模块,用于获取用户提问信息,并提取所述提问信息中的主题词及所述主题词的属性信息;
查询模块,用于根据所述主题词查询问答系统的知识图谱以得到所述提问信息的至少一个候选答案;及
评估模块,用于基于评估模型对所述至少一个候选答案进行评估以得到所述提问信息对应的答案。
为实现上述目的,本发明实施例还提供了一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述问答系统的问答查询方法的步骤。
为实现上述目的,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序可被至少一个处理器所执行,以使所述至少一个处理器执行如上所述的问答系统的问答查询方法的步骤。
本发明实施例提供的问答系统的问答查询方法、系统、计算机设备及计算机可读存储介质,通过获取用户提问信息,并提取所述提问信息中的主题词及所述主题词的属性信息;根据所述主题词查询问答系统的知识图谱以得到所述提问信息的至少一个候选答案;及基于评估模型对所述至少一个候选答案进行评估以得到所述提问信息对应的答案。这样,利用知识图谱并结合评估模型来搜索问句的答案,从而可以提高搜索得到问答对应的答案的效率。
附图说明
图1为本发明问答系统的问答查询方法第一实施例的实施流程示意图。
图2为本发明问答系统的问答查询方法第二实施例的实施流程示意图。
图3为本发明一实施方式的知识图谱示意图。
图4为本发明问答系统的问答查询方法第三实施例的实施流程示意图。
图5为本发明一实施方式的问答查询系统的程序模块示意图。
图6为本发明一实施方式的计算机设备的硬件结构示意图。
附图标记
问答查询系统 500、604
获取模块 501
查询模块 502
评估模块 503
计算机设备 600
存储器 601
处理器 602
网络接口 603
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参阅图1,示出了本发明实施例一之问答系统的问答查询方法的流程图。可以理解,本方法实施例中的流程图不用于对执行步骤的顺序进行限定。下面以问答查询系统(下文以“查询系统”简称)为执行主体进行示例性描述,所述查询系统可以应用于服务器中。具体如下:
步骤S100,获取用户提问信息,并提取所述提问信息中的主题词及所述主题词的属性信息。
具体地,用户可以通过终端设备输入提问信息,可以理解的是,用户在输入问句时,可以以语音的方式输入,也可以直接以文本的形式输入。终端在接收到用户的问句时,若该该问句为语音,则将该语音转换为文本,然后将转换后的文本上传给计算机设备(以服务器为例),从而使得服务器中的查询系统可以获取用户输入的问句;终端设备在接收到用户的问句时,若该问句为文本,则直接将该文本信息上传给服务器,从而使得服务器中的查询系统可以得到用户输入的问句。在本实施例中,所述终端设备可以为移动电话、智能电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、导航装置、车载装置等等的可移动设备,以及诸如数字TV、台式计算机、笔记本等等的固定终端。
查询系统在获取到提问信息后,可以从提问信息中提取到主题词以及所述主题词的属性信息。所述主题词为提问信息中的主语。所述属性信息为对所提问信息中的主语进行描述的句子。这里的描述性的句子是指在主谓句法结构中对主语进行描述的谓语,或者指在主谓宾句法结构中对主语进行描述的谓语及宾语,即所述属性信息为所述提问信息中的谓语,或者谓语与宾语。
在一实施方式中,所述提取所述提问信息中的主题词及所述主题词的属性信息的步骤包括:
对所述提问信息进行依存句法分析,以得到所述提问信息的依存树;及
从所述依存树中提取所述提问信息的主题词及所述主题词的属性信息。
在本实施例中,在对提问信息进行句法分析时,首先需要对提问信息进行分词处理,以将提问信息转换为多个短语,在转换为短语之后,可以将短语中的停用词去掉,然后根据去掉停用词之后的短语生成提问信息的依存树,根据生成的依存树可以直接提取到提问信息的主题词及所述主题词的属性信息。
步骤S102,根据所述主题词查询问答系统的知识图谱以得到所述提问信息的至少一个候选答案。
具体地,问答系统数据库中的问答对是以知识图谱的形式存储的。知识图谱是一种基于图的数据结构,由节点和边组成。知识图谱是实体间关系的最有效表示方式。通俗地讲,知识图谱就是把所有不同种类的信息连接在一起而得到的一个关系网络。知识图谱由实体,实体属性以及实体关系组成。其中,在知识图谱里,每个节点表示现实世界中存在的“实体”;在知识图谱里,每个节点表示的“实体”的属性;在知识图谱里,每条边为实体与实体之间的“关系”。在本发明实施例中,知识图谱中的节点对应的现实世界中存在的“实体”为问句的主题词。这样,当在查询提问信息的答案时,即可快速根据提问信息中的主题词来查找到提问信息的答案。
步骤S104,基于评估模型对所述至少一个候选答案进行评估以得到所述提问信息对应的答案。
具体地,该评估模型为通过训练样本数据对预设的神经网络模型进行训练后所得到的一个可以从至少一个候选答案中选择中正确答案(提问信息对应的答案)的模型,其中,所述训练样本数据包括若干个问句及所述问句对应的答案。
当评估模型在接收到至少一个候选答案时,会对各个候选答案依次进行评估,最后会根据评估结果确定出提问信息对应的答案。
在一实施方式中,所述基于评估模型对所述至少一个候选答案进行评估以得到所述提问信息对应的答案的步骤包括:
基于评估模型对各个候选答案进行评分;及
选取评分值最高的候选答案作为所述提问信息对应的答案。
具体地,评估模型在对各个候选答案进行评估时,会对各个候选答案进行评分。评估模型在对各个候选答案进行评分时,输入的时提问信息的属性信息与各个所述候选答案,若提问信息具有候选答案r1,r2,…,rk,则在输入时将属性信息q与候选答案ri组成候选问答对输入到评估模型中,即输入q-ri,输出为各个候选答案的评分,每个候选答案都将输出一个评分,在得到各个候选答案的评分之后,选取评分值最高的候选答案作为所述提问信息对应的答案。
在一具体实施方式中,评估模型在对候选答案进行评分时,可以将提问信息的属性信息与各个候选答案依次进行比较,以获取所述属性信息与各个候选答案的相似度值,然后根据得到的各个相似度值来确认候选答案的评分,相似度值越高,评分就越高,反之,相似度值越低,评分就越低。举例如下:
提问信息具有候选答案r1,r2,r3,r4,提问信息的属性信息q与各个候选答案r1,r2,r3,r4的相似度值依次为50%、70%、60%、95%,则可确定各个候选答案r1,r2,r3,r4的评分依次为50、70、60、95。
通过上述步骤S100-S104,本发明所提出的问答系统的问答查询方法,获取用户提问信息,并提取所述提问信息中的主题词及所述主题词的属性信息;根据所述主题词查询问答系统的知识图谱以得到所述提问信息的至少一个候选答案;及基于评估模型对所述至少一个候选答案进行评估以得到所述提问信息对应的答案。这样,利用知识图谱并结合评估模型来搜索问句的答案,从而可以提高搜索得到问答对应的答案的效率。
参阅图2,是本发明问答系统的问答查询方法第二实施例的实施流程示意图。在本实施例中,根据不同的需求,图2所示的流程图中的步骤的执行顺序可以改变,某些步骤可以省略。下面以问答查询系统(下文以“查询系统”简称)为执行主体进行示例性描述,所述查询系统可以应用于服务器中。具体如下:
步骤S200,构建所述问答系统的知识图谱,其中,所述知识图谱中的节点对应的实体为问句的主题词。
具体地,在构建问答系统的知识图谱时,首先需要对问答系统中的各个问答对中的问题进行信息抽取,从而提取出问句中的实体、实体属性以及实体关系。在本抽取到各个问句的实体、实体属性以及实体关系之后,根据各个实体之间的关系构建问答系统的知识图谱。在本实施例中,知识图谱的构建技术为现有技术,在本实施例中不再赘述。
需要说明的是,本实施例在构建知识图谱时,以问句的主题词作为知识图谱中节点对应的实体,问句的答案作为知识图谱中实体的实体属性值。
步骤S202,获取用户提问信息,并提取所述提问信息中的主题词及所述主题词的属性信息。
具体地,上述步骤S202与步骤S100类似,在本实施方式中不再赘述。
步骤S204,根据所述主题词查询问答系统的知识图谱以得到所述提问信息的至少一个候选答案。
具体地,在获取到提问信息的主题词之后,将该主题词在知识图谱中进行搜索,通过将主题词与知识图谱中的各个节点对应的实体进行比较,即可找到提问信息的候选答案。
在一实施方式中,所述根据所述主题词查询问答系统的知识图谱以得到所述提问信息的至少一个候选答案的步骤包括:
将所述主题词与所述知识图谱中的各个节点对应的实体进行比较;及
若所述主题词与所述实体相同,则将所述实体对应的节点的子节点对应的实体作为所述提问信息的候选答案。
具体地,在知识图谱中查找提问信息对应的候选答案时,将提问信息的主题词依次与知识图谱中的各个节点对应的实体进行比较。在本实施例中,在将主题词依次与知识图谱中的各个节点对应的实体进行比较时,是从知识图谱中的根节点对应的实体开始与所述主题词进行比较的,然后再从该根节点的子节点对应的实体与所述主题词进行比较,直到找到与该主题词相同的实体。在找到与所述主题词相同的实体,将该实体对应的节点的子节点对应的实体作为提问信息的候选答案。举例如下:
假设本实施例中构建的问答系统的知识图谱为图3所示,当提问信息为:C罗获得奖项是什么?在对该提问信息进行处理后,获得该提问信息的主题词为“C罗”,获得该提主题词的属性信息为“获得奖项”。
在查找提问信息的候选答案时,将主题词“C罗”从该知识图谱中的根节点对应的实体“C罗”开始查找,由于开始查找时已找到所述主题词在知识图谱中的节点对应的实体,因而,接着将找出该节点对应的子节点所对应的实体,在该知识图谱中,实体“C罗”对应的节点的子节点所对应的实体有“足球运动员”、“运动员”、“皇家马德里”、“葡萄牙”、“人物”以及“金球奖”。在找到这些实体之后,将这些实体作为提问信息的候选答案。
步骤S206,基于评估模型对所述至少一个候选答案进行评估以得到所述提问信息对应的答案。
具体地,上述步骤S206与步骤S104类似,在本实施方式中不再赘述。
通过上述步骤S200-S206,本发明所提出的问答系统的问答查询方法,构建所述问答系统的知识图谱;获取用户提问信息,并提取所述提问信息中的主题词及所述主题词的属性信息;根据所述主题词查询问答系统的知识图谱以得到所述提问信息的至少一个候选答案;及基于评估模型对所述至少一个候选答案进行评估以得到所述提问信息对应的答案。这样,通过预先构建知识图谱,然后结合评估模型来搜索问句的答案,从而可以提高搜索得到问答对应的答案的效率。
参阅图4,是本发明问答系统的问答查询方法第三实施例的实施流程示意图。在本实施例中,根据不同的需求,图4所示的流程图中的步骤的执行顺序可以改变,某些步骤可以省略。下面以问答查询系统(下文以“查询系统”简称)为执行主体进行示例性描述,所述查询系统可以应用于服务器中。具体如下:
步骤S400,获取训练样本数据,所述训练样本数据包括多个问句及所述问句对应的答案。
具体地,所述训练样本数据包括多个问句及所述问句对应的答案,该问句及问句对应的答案包括标准的问答对,以及非标准的问答对,其中,该标准的问答对为与问答系统的数据库所存储的问答对,不标准的问答对为与问答系统的数据库所存储的问答对所不同的问句及问句对应的答案,比如,客服系统中存储的问答对。
步骤S402,使用所述训练样本数据对神经网络模型进行训练以得到所述评估模型。
具体地,该神经网络模型可以为卷积神经网络模型、循环神经网络模型或者包含包含卷积神经网络模型以及循环神经网络模型的模型,在本实施例中不作限定。
在使用训练样本数据对神经网络模型进行训练时,随着样本训练数据的输入,神经网络模型会自动调整神经网络模型中的参数,直到得到符合要求的评估模型为止。
步骤S404,获取用户提问信息,并提取所述提问信息中的主题词及所述主题词的属性信息;
步骤S406,根据所述主题词查询问答系统的知识图谱以得到所述提问信息的至少一个候选答案;及
步骤S408,基于评估模型对所述至少一个候选答案进行评估以得到所述提问信息对应的答案。
具体地,上述步骤S404-S408与步骤S100-S104类似,在本实施方式中不再赘述。
通过上述步骤S400-S408,本发明所提出的问答系统的问答查询方法,获取训练样本数据,所述训练样本数据包括多个问句及所述问句对应的答案;使用所述训练样本数据对神经网络模型进行训练以得到所述评估模型;获取用户提问信息,并提取所述提问信息中的主题词及所述主题词的属性信息;根据所述主题词查询问答系统的知识图谱以得到所述提问信息的至少一个候选答案;及基于评估模型对所述至少一个候选答案进行评估以得到所述提问信息对应的答案。这样,通过预先构建的知识图谱,然后结合评估模型来搜索问句的答案,从而可以提高搜索得到问答对应的答案的效率。
请参阅图5,示出了本发明实施例之问答查询系统500(以下简称为“查询系统”500)的程序模块示意图。在本实施例中,查询系统500可以包括或被分割成一个或多个程序模块,一个或者多个程序模块被存储于存储介质中,并由一个或多个处理器所执行,以完成本发明,并可实现上述问答系统的问答查询方法。本发明实施例所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序本身更适合于描述问答系统的问答查询方法在存储介质中的执行过程。以下描述将具体介绍本实施例各程序模块的功能:
获取模块501,用于获取用户提问信息,并提取所述提问信息中的主题词及所述主题词的属性信息。
用户可以通过终端设备输入提问信息,可以理解的是,用户在输入问句时,可以以语音的方式输入,也可以直接以文本的形式输入。终端在接收到用户的问句时,若该该问句为语音,则将该语音转换为文本,然后将转换后的文本上传给计算机设备(以服务器为例),从而使得服务器中的查询系统中的获取模块501可以获取用户输入的问句;终端设备在接收到用户的问句时,若该问句为文本,则直接将该文本信息上传给服务器,从而使得服务器中的查询系统可以得到用户输入的问句。在本实施例中,所述终端设备可以为移动电话、智能电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、导航装置、车载装置等等的可移动设备,以及诸如数字TV、台式计算机、笔记本等等的固定终端。
查获取模块501在获取到提问信息后,可以从提问信息中提取到主题词以及所述主题词的属性信息。所述主题词为提问信息中的主语。所述属性信息为对所提问信息中的主语进行描述的句子。这里的描述性的句子是指在主谓句法结构中对主语进行描述的谓语,或者指在主谓宾句法结构中对主语进行描述的谓语及宾语,即所述属性信息为所述提问信息中的谓语,或者谓语与宾语。
在一实施方式中,所述提取所述提问信息中的主题词及所述主题词的属性信息的步骤包括:
对所述提问信息进行依存句法分析,以得到所述提问信息的依存树;及
从所述依存树中提取所述提问信息的主题词及所述主题词的属性信息。
在本实施例中,在对提问信息进行句法分析时,首先需要对提问信息进行分词处理,以将提问信息转换为多个短语,在转换为短语之后,可以将短语中的停用词去掉,然后根据去掉停用词之后的短语生成提问信息的依存树,根据生成的依存树可以直接提取到提问信息的主题词及所述主题词的属性信息。
查询模块502,用于根据所述主题词查询问答系统的知识图谱以得到所述提问信息的至少一个候选答案。
具体地,问答系统数据库中的问答对是以知识图谱的形式存储的。知识图谱是一种基于图的数据结构,由节点和边组成。知识图谱是实体间关系的最有效表示方式。通俗地讲,知识图谱就是把所有不同种类的信息连接在一起而得到的一个关系网络。知识图谱由实体,实体属性以及实体关系组成。其中,在知识图谱里,每个节点表示现实世界中存在的“实体”;在知识图谱里,每个节点表示的“实体”的属性;在知识图谱里,每条边为实体与实体之间的“关系”。在本发明实施例中,知识图谱中的节点对应的现实世界中存在的“实体”为问句的主题词。这样,当在查询提问信息的答案时,查询模块502即可快速根据提问信息中的主题词来查找到提问信息的答案。
评估模块503,用于基于评估模型对所述至少一个候选答案进行评估以得到所述提问信息对应的答案。
该评估模型为通过训练样本数据对预设的神经网络模型进行训练后所得到的一个可以从至少一个候选答案中选择中正确答案(提问信息对应的答案)的模型,其中,所述训练样本数据包括若干个问句及所述问句对应的答案。
评估模块503在接收到至少一个候选答案时,会对各个候选答案依次进行评估,最后会根据评估结果确定出提问信息对应的答案。
在一实施方式中,所述基于评估模型对所述至少一个候选答案进行评估以得到所述提问信息对应的答案的步骤包括:
基于评估模型对各个候选答案进行评分;及
选取评分值最高的候选答案作为所述提问信息对应的答案。
具体地,评估模型在对各个候选答案进行评估时,会对各个候选答案进行评分。评估模型在对各个候选答案进行评分时,输入的时提问信息的属性信息与各个所述候选答案,若提问信息具有候选答案r1,r2,…,rk,则在输入时将属性信息q与候选答案ri组成候选问答对输入到评估模型中,即输入q-ri,输出为各个候选答案的评分,每个候选答案都将输出一个评分,在得到各个候选答案的评分之后,选取评分值最高的候选答案作为所述提问信息对应的答案。
在一具体实施方式中,评估模型在对候选答案进行评分时,可以将提问信息的属性信息与各个候选答案依次进行比较,以获取所述属性信息与各个候选答案的相似度值,然后根据得到的各个相似度值来确认候选答案的评分,相似度值越高,评分就越高,反之,相似度值越低,评分就越低。举例如下:
提问信息具有候选答案r1,r2,r3,r4,提问信息的属性信息q与各个候选答案r1,r2,r3,r4的相似度值依次为50%、70%、60%、95%,则可确定各个候选答案r1,r2,r3,r4的评分依次为50、70、60、95。
在本发明另一实施方式中,所述查询系统500还包括:
构建模块,用于构建所述问答系统的知识图谱,其中,所述知识图谱中的节点对应的实体为问句的主题词。
具体地,在构建问答系统的知识图谱时,首先需要对问答系统中的各个问答对中的问题进行信息抽取,从而提取出问句中的实体、实体属性以及实体关系。在本抽取到各个问句的实体、实体属性以及实体关系之后,根据各个实体之间的关系构建问答系统的知识图谱。在本实施例中,知识图谱的构建技术为现有技术,在本实施例中不再赘述。
在本发明另一实施方式中,所述查询模块502,还用于将所述主题词与所述知识图谱中的各个节点对应的实体进行比较;及若所述主题词与所述实体相同,则将所述实体对应的节点的子节点对应的实体作为所述提问信息的候选答案。
具体地,在知识图谱中查找提问信息对应的候选答案时,将提问信息的主题词依次与知识图谱中的各个节点对应的实体进行比较。在本实施例中,在将主题词依次与知识图谱中的各个节点对应的实体进行比较时,是从知识图谱中的根节点对应的实体开始与所述主题词进行比较的,然后再从该根节点的子节点对应的实体与所述主题词进行比较,直到找到与该主题词相同的实体。在找到与所述主题词相同的实体,将该实体对应的节点的子节点对应的实体作为提问信息的候选答案。举例如下:
假设本实施例中构建的问答系统的知识图谱为图3所示,当提问信息为:C罗获得奖项是什么?在对该提问信息进行处理后,获得该提问信息的主题词为“C罗”,获得该提主题词的属性信息为“获得奖项”。
在查找提问信息的候选答案时,将主题词“C罗”从该知识图谱中的根节点对应的实体“C罗”开始查找,由于开始查找时已找到所述主题词在知识图谱中的节点对应的实体,因而,接着将找出该节点对应的子节点所对应的实体,在该知识图谱中,实体“C罗”对应的节点的子节点所对应的实体有“足球运动员”、“运动员”、“皇家马德里”、“葡萄牙”、“人物”以及“金球奖”。在找到这些实体之后,将这些实体作为提问信息的候选答案。
在本发明另一实施方式中,所述查询系统500还包括:
获取模块,用于获取训练样本数据,所述训练样本数据包括多个问句及所述问句对应的答案。
具体地,所述训练样本数据包括多个问句及所述问句对应的答案,该问句及问句对应的答案包括标准的问答对,以及非标准的问答对,其中,该标准的问答对为与问答系统的数据库所存储的问答对,不标准的问答对为与问答系统的数据库所存储的问答对所不同的问句及问句对应的答案,比如,客服系统中存储的问答对。
训练模块,用于使用所述训练样本数据对神经网络模型进行训练以得到所述评估模型。
具体地,该神经网络模型可以为卷积神经网络模型、循环神经网络模型或者包含包含卷积神经网络模型以及循环神经网络模型的模型,在本实施例中不作限定。
在使用训练样本数据对神经网络模型进行训练时,随着样本训练数据的输入,神经网络模型会自动调整神经网络模型中的参数,直到得到符合要求的评估模型为止。
通过上述程序模块501-503,本发明所提出的问答查询系统,获取用户提问信息,并提取所述提问信息中的主题词及所述主题词的属性信息;根据所述主题词查询问答系统的知识图谱以得到所述提问信息的至少一个候选答案;及基于评估模型对所述至少一个候选答案进行评估以得到所述提问信息对应的答案。这样,通过预先构建的知识图谱,然后结合评估模型来搜索问句的答案,从而可以提高搜索得到问答对应的答案的效率。
参阅图6,是本发明实施例三之计算机设备600的硬件架构示意图。在本实施例中,所述计算机设备600是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。如图所示,所述计算机设备600至少包括,但不限于,可通过系统总线相互通信连接存储器601、处理器602、网络接口603、以及问答系统的问答查询604。其中:
本实施例中,存储器601至少包括一种类型的计算机可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器601可以是计算机设备600的内部存储单元,例如该计算机设备600的硬盘或内存。在另一些实施例中,存储器601也可以是计算机设备600的外部存储设备,例如该计算机设备600上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,存储器601还可以既包括计算机设备600的内部存储单元也包括其外部存储设备。本实施例中,存储器601通常用于存储安装于计算机设备600的操作系统和各类应用软件,例如问答查询系统604的程序代码等。此外,存储器601还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器602在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器602通常用于控制计算机设备600的总体操作。本实施例中,处理器602用于运行存储器601中存储的程序代码或者处理数据,例如运行问答查询系统604,以实现实施例一中的问答系统的问答查询方法。
所述网络接口603可包括无线网络接口或有线网络接口,该网络接口603通常用于在所述计算机设备600与其他电子装置之间建立通信连接。例如,所述网络接口603用于通过网络将所述计算机设备600与外部终端相连,在所述计算机设备600与外部终端之间的建立数据传输通道和通信连接等。所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication,GSM)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。
需要指出的是,图6仅示出了具有部件601-604的计算机设备600,但是应理解的是,并不要求实施所有示出的部件,可以替代的实施更多或者更少的部件。
在本实施例中,存储于存储器601中的所述运行问答查询系统604还可以被分割为一个或者多个程序模块,所述一个或者多个程序模块被存储于存储器601中,并由一个或多个处理器(本实施例为处理器602)所执行,以完成本发明问答系统的问答查询方法。
本实施例还提供一种计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,其上存储有计算机程序,程序被处理器执行时实现相应功能。本实施例的计算机可读存储介质用于存储运行问答查询系统500或604,被处理器执行时实现本发明之运行问答系统的问答查询方法。
本发明实施例提供的问答系统的问答查询方法、系统、计算机设备及计算机可读存储介质,可以提高搜索得到问答对应的答案的效率。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种问答系统的问答查询方法,其特征在于,包括以下步骤:
获取用户提问信息,并提取所述提问信息中的主题词及所述主题词的属性信息;
根据所述主题词查询问答系统的知识图谱以得到所述提问信息的至少一个候选答案;及
基于评估模型对所述至少一个候选答案进行评估以得到所述提问信息对应的答案。
2.如权利要求1所述的问答系统的问答查询方法,其特征在于,所述提取所述提问信息中的主题词及所述主题词的属性信息的步骤包括:
对所述提问信息进行依存句法分析,以得到所述提问信息的依存树;及
从所述依存树中提取所述提问信息的主题词及所述主题词的属性信息。
3.如权利要求1所述的问答系统的问答查询方法,其特征在于,所述基于评估模型对所述至少一个候选答案进行评估以得到所述提问信息对应的答案的步骤包括:
基于评估模型对各个候选答案进行评分;及
选取评分值最高的候选答案作为所述提问信息对应的答案。
4.如权利要求3所述的问答系统的问答查询方法,其特征在于,所述基于评估模型对各个候选答案进行评分的步骤包括:
将所述属性信息与各个候选答案进行比较以确认所述属性信息与各个所述候选答案的相似度值;及
根据所述相似度值确认各个所述候选答案的评分。
5.如权利要求1至4任一项所述的问答系统的问答查询方法,其特征在于,所述的问答系统的问答查询方法还包括:
构建所述问答系统的知识图谱,其中,所述知识图谱中的节点对应的实体为问句的主题词。
6.如权利要求5所述的问答系统的问答查询方法,其特征在于,所述根据所述主题词搜索问答系统的知识图谱以得到所述提问信息的至少一个候选答案的步骤包括:
将所述主题词与所述知识图谱中的各个节点对应的实体进行比较;及
若所述主题词与所述实体相同,则将所述实体对应的节点的子节点对应的实体作为所述提问信息的候选答案。
7.如权利要求权利要求1所述的问答系统的问答查询方法,其特征在于,所述问答系统的问答查询方法还包括:
获取训练样本数据,所述训练样本数据包括多个问句及所述问句对应的答案;及
使用所述训练样本数据对神经网络模型进行训练以得到所述评估模型。
8.一种问答查询系统,其特征在于,包括:
获取模块,用于获取用户提问信息,并提取所述提问信息中的主题词及所述主题词的属性信息;
查询模块,用于根据所述主题词查询问答系统的知识图谱以得到所述提问信息的至少一个候选答案;及
评估模块,用于基于评估模型对所述至少一个候选答案进行评估以得到所述提问信息对应的答案。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的问答系统的问答查询方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序可被至少一个处理器所执行,以使所述至少一个处理器执行如权利要求1-7中任一项所述的问答系统的问答查询方法的的步骤。
CN201910069661.2A 2019-01-24 2019-01-24 问答系统的问答查询方法、系统及计算机设备 Pending CN109933653A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910069661.2A CN109933653A (zh) 2019-01-24 2019-01-24 问答系统的问答查询方法、系统及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910069661.2A CN109933653A (zh) 2019-01-24 2019-01-24 问答系统的问答查询方法、系统及计算机设备

Publications (1)

Publication Number Publication Date
CN109933653A true CN109933653A (zh) 2019-06-25

Family

ID=66985219

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910069661.2A Pending CN109933653A (zh) 2019-01-24 2019-01-24 问答系统的问答查询方法、系统及计算机设备

Country Status (1)

Country Link
CN (1) CN109933653A (zh)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110289101A (zh) * 2019-07-02 2019-09-27 京东方科技集团股份有限公司 一种计算机设备、系统及可读存储介质
CN110413636A (zh) * 2019-08-01 2019-11-05 北京香侬慧语科技有限责任公司 一种数据处理方法和装置
CN110413851A (zh) * 2019-07-11 2019-11-05 安徽皖新研学教育有限公司 一种研学旅行的旅行问答系统及方法
CN110457431A (zh) * 2019-07-03 2019-11-15 深圳追一科技有限公司 基于知识图谱的问答方法、装置、计算机设备和存储介质
CN110516060A (zh) * 2019-10-24 2019-11-29 支付宝(杭州)信息技术有限公司 用于确定问题答案的方法及问答装置
CN110727782A (zh) * 2019-10-22 2020-01-24 苏州思必驰信息科技有限公司 问答语料生成方法及系统
CN110750633A (zh) * 2019-10-22 2020-02-04 苏州思必驰信息科技有限公司 用于确定问题的答案的方法及装置
CN110929027A (zh) * 2019-09-30 2020-03-27 珠海格力电器股份有限公司 提示系统、提示方法、计算机及废物容纳装置
CN111177359A (zh) * 2020-04-10 2020-05-19 支付宝(杭州)信息技术有限公司 多轮对话方法和装置
CN111292060A (zh) * 2020-02-03 2020-06-16 支付宝(杭州)信息技术有限公司 信息处理方法及装置
CN111428018A (zh) * 2020-03-26 2020-07-17 中国建设银行股份有限公司 智能问答方法及装置
CN111460116A (zh) * 2020-03-19 2020-07-28 北京百度网讯科技有限公司 问答方法、问答系统、电子设备和存储介质
CN111666399A (zh) * 2020-06-23 2020-09-15 中国平安人寿保险股份有限公司 基于知识图谱的智能问答方法、装置和计算机设备
CN111736738A (zh) * 2020-06-30 2020-10-02 广州小鹏车联网科技有限公司 一种车载系统的控件对象查询方法和装置
CN111767385A (zh) * 2020-07-09 2020-10-13 腾讯科技(深圳)有限公司 一种智能问答方法及装置
CN112231454A (zh) * 2020-10-14 2021-01-15 中国平安人寿保险股份有限公司 提问预测及回答反馈方法、装置、计算机设备及存储介质
CN112749259A (zh) * 2019-10-29 2021-05-04 阿里巴巴集团控股有限公司 商品问答的生成方法、装置及计算机存储介质
CN112765312A (zh) * 2020-12-31 2021-05-07 湖南大学 一种基于图神经网络嵌入匹配的知识图谱问答方法和系统
CN112860867A (zh) * 2021-02-25 2021-05-28 电子科技大学 一种基于卷积神经网络的中文问答系统的属性选择方法及存储介质
CN113392321A (zh) * 2021-06-02 2021-09-14 北京三快在线科技有限公司 一种信息推荐方法、装置、电子设备及存储介质
CN113609274A (zh) * 2021-08-16 2021-11-05 平安银行股份有限公司 智能问答方法、装置、电子设备及存储介质
CN114996429A (zh) * 2022-06-29 2022-09-02 支付宝(杭州)信息技术有限公司 用于自动问答的方法、系统、装置和介质
CN116303919A (zh) * 2022-11-30 2023-06-23 荣耀终端有限公司 一种问答方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105912527A (zh) * 2016-04-19 2016-08-31 北京高地信息技术有限公司 根据自然语言输出答案的方法、装置及系统
CN106919655A (zh) * 2017-01-24 2017-07-04 网易(杭州)网络有限公司 一种答案提供方法和装置
CN107977415A (zh) * 2017-11-22 2018-05-01 北京寻领科技有限公司 自动问答方法及装置
CN108256056A (zh) * 2018-01-12 2018-07-06 广州杰赛科技股份有限公司 智能问答方法与系统
CN108399169A (zh) * 2017-02-06 2018-08-14 阿里巴巴集团控股有限公司 基于问答系统的对话处理方法、装置和系统及移动设备
CN108491421A (zh) * 2018-02-07 2018-09-04 北京百度网讯科技有限公司 一种生成问答的方法、装置、设备和计算存储介质
CN108509519A (zh) * 2018-03-09 2018-09-07 北京邮电大学 基于深度学习的通用知识图谱增强问答交互系统及方法
CN108647233A (zh) * 2018-04-02 2018-10-12 北京大学深圳研究生院 一种用于问答系统的答案排序方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105912527A (zh) * 2016-04-19 2016-08-31 北京高地信息技术有限公司 根据自然语言输出答案的方法、装置及系统
CN106919655A (zh) * 2017-01-24 2017-07-04 网易(杭州)网络有限公司 一种答案提供方法和装置
CN108399169A (zh) * 2017-02-06 2018-08-14 阿里巴巴集团控股有限公司 基于问答系统的对话处理方法、装置和系统及移动设备
CN107977415A (zh) * 2017-11-22 2018-05-01 北京寻领科技有限公司 自动问答方法及装置
CN108256056A (zh) * 2018-01-12 2018-07-06 广州杰赛科技股份有限公司 智能问答方法与系统
CN108491421A (zh) * 2018-02-07 2018-09-04 北京百度网讯科技有限公司 一种生成问答的方法、装置、设备和计算存储介质
CN108509519A (zh) * 2018-03-09 2018-09-07 北京邮电大学 基于深度学习的通用知识图谱增强问答交互系统及方法
CN108647233A (zh) * 2018-04-02 2018-10-12 北京大学深圳研究生院 一种用于问答系统的答案排序方法

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110289101A (zh) * 2019-07-02 2019-09-27 京东方科技集团股份有限公司 一种计算机设备、系统及可读存储介质
CN110457431A (zh) * 2019-07-03 2019-11-15 深圳追一科技有限公司 基于知识图谱的问答方法、装置、计算机设备和存储介质
CN110457431B (zh) * 2019-07-03 2020-12-25 深圳追一科技有限公司 基于知识图谱的问答方法、装置、计算机设备和存储介质
CN110413851A (zh) * 2019-07-11 2019-11-05 安徽皖新研学教育有限公司 一种研学旅行的旅行问答系统及方法
CN110413636A (zh) * 2019-08-01 2019-11-05 北京香侬慧语科技有限责任公司 一种数据处理方法和装置
CN110929027A (zh) * 2019-09-30 2020-03-27 珠海格力电器股份有限公司 提示系统、提示方法、计算机及废物容纳装置
CN110727782A (zh) * 2019-10-22 2020-01-24 苏州思必驰信息科技有限公司 问答语料生成方法及系统
CN110750633B (zh) * 2019-10-22 2022-03-29 思必驰科技股份有限公司 用于确定问题的答案的方法及装置
CN110750633A (zh) * 2019-10-22 2020-02-04 苏州思必驰信息科技有限公司 用于确定问题的答案的方法及装置
CN110516060A (zh) * 2019-10-24 2019-11-29 支付宝(杭州)信息技术有限公司 用于确定问题答案的方法及问答装置
CN110516060B (zh) * 2019-10-24 2020-02-21 支付宝(杭州)信息技术有限公司 用于确定问题答案的方法及问答装置
CN112749259A (zh) * 2019-10-29 2021-05-04 阿里巴巴集团控股有限公司 商品问答的生成方法、装置及计算机存储介质
CN112749259B (zh) * 2019-10-29 2024-01-02 阿里巴巴集团控股有限公司 商品问答的生成方法、装置及计算机存储介质
CN111292060A (zh) * 2020-02-03 2020-06-16 支付宝(杭州)信息技术有限公司 信息处理方法及装置
CN111460116A (zh) * 2020-03-19 2020-07-28 北京百度网讯科技有限公司 问答方法、问答系统、电子设备和存储介质
CN111460116B (zh) * 2020-03-19 2023-07-25 北京百度网讯科技有限公司 问答方法、问答系统、电子设备和存储介质
CN111428018A (zh) * 2020-03-26 2020-07-17 中国建设银行股份有限公司 智能问答方法及装置
CN111428018B (zh) * 2020-03-26 2024-02-06 中国建设银行股份有限公司 智能问答方法及装置
CN111177359A (zh) * 2020-04-10 2020-05-19 支付宝(杭州)信息技术有限公司 多轮对话方法和装置
CN111666399A (zh) * 2020-06-23 2020-09-15 中国平安人寿保险股份有限公司 基于知识图谱的智能问答方法、装置和计算机设备
WO2022001682A1 (zh) * 2020-06-30 2022-01-06 广州橙行智动汽车科技有限公司 一种车载系统的控件对象查询方法和装置
CN111736738A (zh) * 2020-06-30 2020-10-02 广州小鹏车联网科技有限公司 一种车载系统的控件对象查询方法和装置
CN111767385A (zh) * 2020-07-09 2020-10-13 腾讯科技(深圳)有限公司 一种智能问答方法及装置
CN112231454A (zh) * 2020-10-14 2021-01-15 中国平安人寿保险股份有限公司 提问预测及回答反馈方法、装置、计算机设备及存储介质
CN112231454B (zh) * 2020-10-14 2024-02-09 中国平安人寿保险股份有限公司 提问预测及回答反馈方法、装置、计算机设备及存储介质
CN112765312A (zh) * 2020-12-31 2021-05-07 湖南大学 一种基于图神经网络嵌入匹配的知识图谱问答方法和系统
CN112860867A (zh) * 2021-02-25 2021-05-28 电子科技大学 一种基于卷积神经网络的中文问答系统的属性选择方法及存储介质
CN113392321A (zh) * 2021-06-02 2021-09-14 北京三快在线科技有限公司 一种信息推荐方法、装置、电子设备及存储介质
CN113609274A (zh) * 2021-08-16 2021-11-05 平安银行股份有限公司 智能问答方法、装置、电子设备及存储介质
CN113609274B (zh) * 2021-08-16 2024-02-09 平安银行股份有限公司 智能问答方法、装置、电子设备及存储介质
CN114996429A (zh) * 2022-06-29 2022-09-02 支付宝(杭州)信息技术有限公司 用于自动问答的方法、系统、装置和介质
CN116303919A (zh) * 2022-11-30 2023-06-23 荣耀终端有限公司 一种问答方法及系统

Similar Documents

Publication Publication Date Title
CN109933653A (zh) 问答系统的问答查询方法、系统及计算机设备
CN110502608B (zh) 基于知识图谱的人机对话方法及人机对话装置
CN117033608B (zh) 一种基于大语言模型的知识图谱生成式问答方法及系统
CN110825879B (zh) 判案结果确定方法、装置、设备及计算机可读存储介质
CN108763535B (zh) 信息获取方法及装置
CN110457431A (zh) 基于知识图谱的问答方法、装置、计算机设备和存储介质
CN109920414A (zh) 人机问答方法、装置、设备和存储介质
US20210018332A1 (en) Poi name matching method, apparatus, device and storage medium
CN110866093A (zh) 机器问答方法及装置
CN106874441A (zh) 智能问答方法和装置
CN110619050B (zh) 意图识别方法及设备
CN109815318A (zh) 问答系统中的问题答案查询方法、系统及计算机设备
WO2022252636A1 (zh) 基于人工智能的回答生成方法、装置、设备及存储介质
CN110874528B (zh) 文本相似度的获取方法及装置
CN110263133B (zh) 基于知识图谱的问答方法、电子装置、设备及存储介质
CN111078847A (zh) 电力用户意图识别方法、装置、计算机设备和存储介质
CN111078837A (zh) 智能问答信息处理方法、电子设备及计算机可读存储介质
CN110377631A (zh) 案件信息处理方法、装置、计算机设备和存储介质
JP2022073981A (ja) ソースコード取得
CN112559682A (zh) 基于GitHub软件仓库数据集的开源项目个性化检索推荐方法
CN112307048A (zh) 语义匹配模型训练方法、匹配方法、装置、设备及存储介质
CN110399547A (zh) 用于更新模型参数的方法、装置、设备和存储介质
CN114282513A (zh) 文本语义相似度的匹配方法、系统、智能终端及存储介质
CN110502620B (zh) 导诊相似问题对生成方法、系统及计算机设备
CN115658875B (zh) 基于聊天服务的数据处理方法及相关产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination