CN109815318A

CN109815318A - 问答系统中的问题答案查询方法、系统及计算机设备

Info

Publication number: CN109815318A
Application number: CN201811583874.9A
Authority: CN
Inventors: 金戈; 徐亮; 肖京
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2018-12-24
Filing date: 2018-12-24
Publication date: 2019-05-28

Abstract

本发明公开了一种问答系统中的问题答案查询方法，包括：接收用户输入的问句，并获取所述问句的关键词；将所述关键词输入至数据库语言元素判别模型，获取所述关键词对应的数据库语言元素；根据所述数据库语言元素生成SQL查询语句；及通过所述SQL查询语句在所述问答系统的数据库中查询所述问句对应的答案。本发明还提供一种计算机设备及计算机可读存储介质。本发明提供的问答系统中的问题答案查询方法、系统、计算机设备及计算机可读存储介质摆脱了人工定义的繁琐性。同时，由于是直接通过获取关键词对应的数据库元素的方式来查询问句答案，可以更加快速及准确地查询出问句的答案。

Description

问答系统中的问题答案查询方法、系统及计算机设备

技术领域

本发明涉及问答系统中的问题答案查询领域，尤其涉及一种问答系统中的问题答案查询方法、系统、计算机设备及计算机可读存储介质。

背景技术

问答系统(Question and Answering，简称QA)综合运用知识表示、信息检索、自然语言处理等技术，能够接收用户以自然语言形式输入问题，即可返回简洁而准确的答案的系统。自动问答系统相比于传统的搜索引擎，具有更方便、更准确的优点，是当前自然语言处理及人工智能领域的研究热点。

现有的问答系统，常常利用问句中的词语转换成数据库语言元素，再利用 SQL类查询语句得到答案。但这种方法对于有些词语不好操作，而人工定义又成本太高。

发明内容

有鉴于此，本发明提出一种问答系统中的问题答案查询方法，摆脱了人工定义的繁琐性，以更加快速及准确地查询出问句的答案。

首先，为实现上述目的，本发明提出一种计算机设备，所述计算机设备包括存储器、处理器，所述存储器上存储有可在所述处理器上运行的问答系统中的问题答案查询系统，所述问答系统中的问题答案查询系统被所述处理器执行时实现如下步骤：

接收用户输入的问句，并获取所述问句的关键词；

将所述关键词输入至数据库语言元素判别模型，获取所述关键词对应的数据库语言元素；

根据所述数据库语言元素生成SQL查询语句；及

通过所述SQL查询语句在所述问答系统的数据库中查询所述问句对应的答案。

可选地，所述问答系统中的问题答案查询系统被所述处理器执行时，还实现如下步骤：

获取训练样本数据，所述训练样本数据包括问答对以及与所述知识库中的标准问句对应的数据库语言元素；及

使用所述训练样本数据对深度学习网络进行训练，以得到所述数据库语言元素判别模型。

可选地，所述使用所述训练样本数据对深度学习网络进行训练，以得到所述数据库语言元素判别模型的步骤包括：

对所述训练样本数据进行预处理以得到所述训练样本数据对应的特征向量；及

将所述特征向量输入至所述深度学习网络进行训练，以得到所述数据库语言元素判别模型，其中，所述深度学习网络为卷积神经网络，该卷积神经网络分为三层；

第一层为卷积神经网络层，所述卷积神经网络层的输入为各个训练样本数据所转换的特征向量组成的矩阵M，所述卷积神经网络层的卷积核的宽度为所述特征向量的维度，所述卷积核的数量为n1；将所述矩阵M输入到卷积神经网络层，得到n1维的问答对特征向量和n1维的数据库语言元素特征向量；取 n2种高度的卷积核，得到n2个问答对特征向量和数据库语言元素特征向量；将n2个问答对特征向量组合成问答对特征矩阵，将n2个数据库语言元素特征向量组合成数据库语言元素特征矩阵；

第二层为注意力层，所述注意力层用于对所述问答对特征向量和数据库语言元素特征向量进行加权；所述注意力层的输入为问答对特征矩阵和数据库语言元素特征矩阵，输出为问答对向量和数据库语言元素向量；

第三层为全连接层，所述全连接层用于计算问答对向量和数据库语言元素向量之间的匹配度，所述匹配度用匹配度分数值来表示。

可选地，所述将所述关键词输入至数据库语言元素判别模型，获取所述关键词对应的数据库语言元素的步骤包括：

将所述关键词进行预处理以得到所述关键词对应的特征向量；

将所述特征向量输入至所述数据库语言元素判别模型以得到多个匹配度分数值；及

对所述多个匹配度分数值进行排序，选择最高匹配度分数值对应的数据库语言元素作为所述关键词对应的数据库语言元素。

此外，为实现上述目的，本发明还提供一种问答系统中的问题答案查询系统，所述问答系统中的问题答案查询系统包括：

接收模块，用于接收用户输入的问句；

获取模块，用于获取所述问句的关键词；

处理模块，用于将所述关键词输入至数据库语言元素判别模型，获取所述关键词对应的数据库语言元素；

生成模块，用于根据所述数据库语言元素生成SQL查询语句；及

查询模块，用于通过所述SQL查询语句在所述问答系统的数据库中查询所述问句对应的答案。

此外，为实现上述目的，本发明还提供一种问答系统中的问题答案查询方法，应用于计算机设备，所述方法包括：

接收用户输入的问句，并获取所述问句的关键词；

根据所述数据库语言元素生成SQL查询语句；及

可选地，所述获取所述问句的关键词的步骤包括：

对所述问句进行分词处理得到多个词语；及

去除所述多个词语中的停用词，并将余下的词语作为所述关键词。

可选地，所述问答系统中的问题答案查询方法还包括：

进一步地，为实现上述目的，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质存储有问答系统中的问题答案查询系统，所述问答系统中的问题答案查询系统可被至少一个处理器执行，以使所述至少一个处理器执行如上所述任一项所述的问答系统中的问题答案查询方法的步骤。

相较于现有技术，本发明所提出的问答系统中的问题答案查询方法、系统、计算机设备及计算机可读存储介质，获取训练样本数据，所述训练样本数据包括问答对以及与所述知识库中的标准问句对应的数据库语言元素；使用所述训练样本数据对深度学习网络进行训练，以得到所述数据库语言元素判别模型；接收用户输入的问句，并获取所述问句的关键词；将所述关键词输入至数据库语言元素判别模型，获取所述关键词对应的数据库语言元素；根据所述数据库语言元素生成SQL查询语句；及通过所述SQL查询语句在所述问答系统的数据库中查询所述问句对应的答案。这样，通过深度学习技术训练出识别问句中的关键词对应的数据库语言元素，从而不用人工去定义各个词语对应的数据库语言元素，从而可以摆脱了人工定义的繁琐性。

附图说明

图1是本发明各个实施例一可选的应用环境示意图；

图2是本发明计算机设备一可选的硬件架构的示意图；

图3是本发明问答系统中的问题答案查询系统第一实施例的程序模块示意图；

图4是本发明问答系统中的问题答案查询系统第二实施例的程序模块示意图；

图5为本发明问答系统中的问题答案查询方法第一实施例的实施流程示意图；

图6为本发明问答系统中的问题答案查询方法第二实施例的实施流程示意图。

附图标记

终端设备	1
		计算机设备	2
网络	3
		存储器	11
处理器	12
		网络接口	13
问答系统中的问题答案查询系统	100
		接收模块	101
获取模块	102
		处理模块	103
生成模块	104
		查询模块	105
样本获取模块	106
		模型生成模块	107

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，在本发明中涉及“第一”、“第二”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外，各个实施例之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本发明要求的保护范围之内。

参阅图1所示，是本发明各个实施例一可选的应用环境示意图。

在本实施例中，本发明可应用于包括，但不仅限于，终端设备1、计算机设备2、网络3的应用环境中。其中，所述终端设备1可以是移动电话、智能电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、导航装置、车载装置等等的可移动设备，以及诸如数字TV、台式计算机、笔记本等等的固定终端。所述计算机设备2可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器等，该计算机设备2可以是独立的计算机设备，也可以是多个计算机设备所组成的计算机设备集群。所述网络3可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System ofMobile communication，GSM)、宽带码分多址(Wideband Code Division MultipleAccess，WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi、通话网络等无线或有线网络。

其中，所述计算机设备2可以通过所述网络3分别与一个或多个所述终端设备1通信连接，以进行数据传输和交互。

参阅图2所示，是本发明计算机设备2一可选的硬件架构的示意图。

本实施例中，所述计算机设备2可包括，但不仅限于，可通过系统总线相互通信连接存储器11、处理器12、网络接口13。需要指出的是，图2仅示出了具有组件11-13的计算机设备2，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

所述存储器11至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，所述存储器11可以是所述计算机设备2的内部存储单元，例如计算机设备2的内存。在另一些实施例中，所述存储器11也可以是所述计算机设备2的外部存储设备，例如计算机设备2上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。当然，所述存储器11还可以既包括所述计算机设备2的内部存储单元也包括其外部存储设备。本实施例中，所述存储器11通常用于存储安装于所述计算机设备2的操作系统和各类应用软件，例如问答系统中的问题答案查询系统100的程序代码等。此外，所述存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器12在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述计算机设备2的总体操作。本实施例中，所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据，例如运行所述问答系统中的问题答案查询系统100等。

所述网络接口13可包括无线网络接口或有线网络接口，该网络接口13通常用于在所述计算机设备2与其他电子设备之间建立通信连接。本实施例中，所述网络接口13主要用于通过所述网络3将所述计算机设备2与一个或多个所述终端设备1相连，在所述计算机设备2与所述一个或多个终端设备1之间的建立数据传输通道和通信连接。

至此，己经详细介绍了本发明相关设备的硬件结构和功能。下面，将基于上述介绍提出本发明的各个实施例。

首先，本发明提出一种问答系统中的问题答案查询系统100。

参阅图3所示，是本发明问答系统中的问题答案查询系统100第一实施例的程序模块图。

本实施例中，所述问答系统中的问题答案查询系统100包括一系列的存储于存储器11上的计算机程序指令，当该计算机程序指令被处理器12执行时，可以实现本发明各实施例的问答系统中的问题答案查询操作。在一些实施例中，基于该计算机程序指令各部分所实现的特定的操作，问答系统中的问题答案查询系统100可以被划分为一个或多个模块。例如，在图3中，问答系统中的问题答案查询系统100可以被分割成接收模块101、获取模块102、处理模块103、生成模块104及查询模块105。其中：

所述接收模块101用于接收用户输入的问句。

具体地，用户可以通过与计算机设备2连接的终端1的输入提问信息，即输入所述问句，可以理解的是，用户在输入问句时，可以以语音的方式输入，也可以直接以文本的形式输入。终端1在接收到用户的问句时，若该该问句为语音，则将该语音转换为文本，然后将转换后的文本上传给计算机设备2，从而使得计算机设备2可以得到用户输入的问句；终端1在接收到用户的问句时，若该问句为文本，则直接将该文本信息上传给计算机设备2，从而使得计算机设备2可以得到用户输入的问句。

获取模块102，用于获取所述问句的关键词。

具体地，在接收到用户输入的问句之后，需要对该问句进行处理，从而将该问句中一些不必要的词去掉，从而得到该问句的关键词。

在一具体实施方式中，所述获取所述问句的关键词的步骤包括：

对所述问句进行分词处理得到多个词语；及

在本实施例中，当接收到用户的问句之后，使用分词系统将问句切分为多个单独的词语，该分词系统可根据实际需要选用现有分词系统的任意一种，比如，可以选用word分词系统，或者HTTPCWS分词系统等。

其中，word分词系统是一个Java实现的分布式的中文分词组件，提供了多种基于词典的分词算法，并利用ngram模型来消除歧义。能准确识别英文、数字，以及日期、时间等数量词，能识别人名、地名、组织机构名等未登录词。能通过自定义配置文件来改变组件行为，能自定义用户词库、自动检测词库变化、支持大规模分布式环境，能灵活指定多种分词算法，能使用refine功能灵活控制分词结果，还能使用词性标注、同义标注、反义标注、拼音标注等功能。同时还无缝和Lucene、Solr、ElasticSearch、Luke集成。

HTTPCWS分词系统是一款基于HTTP协议的开源中文分词系统，目前仅支持Linux系统。HTTPCWS使用“ICTCLAS 3.0 2009共享版中文分词算法”的 API进行分词处理，得出分词结果。HTTPCWS将取代之前的PHPCWS中文分词扩展。

在使用分词系统对问句进行分词之后，得到的多个词语可以为名词、动词、形容词、助词等。在得到的各个词语后，将该各个词语中的停用词去除，余下的词语即为该问句的关键词。在本实施例中，该停用词为形容词、语气词、助词等不太重用的词语。

示例性的，假设用户输入的问句为：“张三出生在哪”，那么可以对该问句先进行分词处理，得到分词结果为“张三”、“出生”、“在哪”，将这些词中的“在哪”去除，得到关键词为“张三”、“出生”。

所述处理模块103，用于将所述关键词输入至数据库语言元素判别模型，获取所述关键词对应的数据库语言元素。

具体地，该数据库语言元素判别模型为通过深度学习技术训练样本数据所得到的一个可以判别出关键词对应的数据库语言元素的模型，其中，该数据库语言元素为在数据库中查询问句答案所使用的数据库查询语句中的数据元素。例如，数据库查询语句：SQL>select empno as"员工号",ename"姓名",sal薪水,comm奖金,sal*14年薪,sal*14+nvl(comm,0)from emp，在该数据库查询语句中的empno以及ename等即为该数据库查询语句中的数据元素。

在本实施例中，当处理模块103接收到关键词之后，即会输出该关键词对应的数据库语言元素。

在一具体实施方式中，所述将所述关键词输入至数据库语言元素判别模型，获取所述关键词对应的数据库语言元素的步骤包括：

在本实施例中，在将所述关键词输入至数据库语言元素判别模型之前，需要先对该关键词进行预处理从而得到该关键词对应的特征向量。该预处理为对所述关键词进行向量化处理，从而得到该关键词对应的特征向量，该特征向量为所述数据库语言元素判别模型的需求特征向量。

当将该特性向量输入至数据库语言元素判别模型后，该数据库语言元素判别模型将会输出该关键词对应的多个数据库语言元素的匹配度分数值。该匹配度分数值代表所述关键词与各个数据库语言元素的匹配概率。

示例性的，假设输入的关键词为“张三”、“出生”，输出结果为： BarackZhangsan与date()fbirth分数为0.60、BarackZhangsan与place()fbirth分数为0.90、BarackZhangsan与marriage.startdate分数为0.65等。

在得到多个匹配度分数值之后，将各个匹配度分数值进行排序，可以按照从大到小的顺序进行排序，也可以按照从小到大的顺序进行排序，在排好序之后，选择最高匹配度分数值对应的数据库语言元素作为所述关键词对应的数据库语言元素。在本实施例中，即选择数据库语言元素BarackZhangsan与 place()fbirth作为所述关键词对应的数据库语言元素。

所述生成模块104用于根据所述数据库语言元素生成SQL查询语句。

具体地，在得到关键词对应的数据库语言元素之后，根据该数据库语言元素按照预设的SQL查询语句生成规则生成对应的SQL查询语句。

所述查询模块105，用于通过所述SQL查询语句在所述问答系统的数据库中查询所述问句对应的答案。

具体地，在生成SQL查询语句之后，通过该数据库查询语句即可快速及准确地查询到问句对应的答案。

通过上述程序模块101-105，本发明所提出的问答系统中的问题答案查询系统100，接收用户输入的问句，并获取所述问句的关键词；将所述关键词输入至数据库语言元素判别模型，获取所述关键词对应的数据库语言元素；根据所述数据库语言元素生成SQL查询语句；及通过所述SQL查询语句在所述问答系统的数据库中查询所述问句对应的答案。这样，通过深度学习技术训练出识别问句中的关键词对应的数据库语言元素，从而不用人工去定义各个词语对应的数据库语言元素，从而可以摆脱了人工定义的繁琐性。同时，直接通过获取关键词对应的数据库元素的方式来查询问句答案，可以更加快速及准确地查询出问句的答案。

参阅图4所示，是本发明问答系统中的问题答案查询系统100第二实施例的程序模块图。本实施例中，所述问答系统中的问题答案查询系统100包括一系列的存储于存储器11上的计算机程序指令，当该计算机程序指令被处理器12执行时，可以实现本发明各实施例的问答系统中的问题答案查询操作。在一些实施例中，基于该计算机程序指令各部分所实现的特定的操作，问答系统中的问题答案查询系统100可以被划分为一个或多个模块。例如，在图4中，问答系统中的问题答案查询系统100可以被分割成接收模块101、获取模块102、处理模块 103、生成模块104、查询模块105、样本获取模块106及模型生成模块107。所述各程序模块101-105与本发明问答系统中的问题答案查询系统100第一实施例相同，并在此基础上增加样本获取模块106及模型生成模块107。其中：

所述接收模块101用于接收用户输入的问句。

获取模块102，用于获取所述问句的关键词。

所述查询模块105用于通过所述SQL查询语句在所述问答系统的数据库中查询所述问句对应的答案。

上述程序模块101-105与图5中的程序模块101-105类似，在本实施方式中不再赘述。

所述样本获取模块106用于获取训练样本数据，所述训练样本数据包括问答对以及与所述知识库中的标准问句对应的数据库语言元素。

具体地，所述问答对包括知识库中的标准问答对样本数据以及客服系统中的不标准的问答对样本数据。其中，每个问答对包括问句以及问句对应的答案。每个标准的问句具有对应的数据库语言元素，该对应的数据库语言元素为使用 SQL查询语句查询该标准问句对应的答案时所使用的数据库元素。

需要说明的是，本实施例中的标准问句指的是与知识问答系统的数据库所存储的问句相同的问句，不标准的问句指的是与知识问答系统的数据库所存储的问句不一致的问句。

所述模型生成模块107用于使用所述训练样本数据对深度学习网络进行训练，以得到所述数据库语言元素判别模型。

具体地，在获取到样本数据之后，通过样本数据不断地对深度学习网络进行训练，从而不断调整深度学习网络中的参数，直到得到符合要求的数据库语言元素判别模型为止。

在一实施方式中，所述使用所述训练样本数据对深度学习网络进行训练，以得到所述数据库语言元素判别模型的步骤包括：

步骤A、对所述训练样本数据进行预处理以得到所述训练样本数据对应的特征向量。

在本实施例中，该预处理包括对样本数据进行分词处理以得到样本数据的关键词以及对关键词进行向量化处理以得到关键词对应的特征向量，该特征向量即为所述训练样本数据对应的特征向量。

步骤B、将所述特征向量输入至所述深度学习网络进行训练，以得到所述数据库语言元素判别模型。

在本实施例中，所述特征向量为所述深度学习网络的需求特征向量。所述深度学习网络可以为卷积神经网络，该卷积神经网络分为三层。其中，

第一层为卷积神经网络层，所述卷积神经网络层的输入为各个训练样本数据所转换的特征向量组成的矩阵M，所述卷积神经网络层的卷积核的宽度为所述特征向量的维度，所述卷积核的数量为n1；将所述矩阵M输入到卷积神经网络层，得到n1维的问答对特征向量和n1维的数据库语言元素特征向量；取 n2种高度的卷积核，得到n2个问答对特征向量和数据库语言元素特征向量；将n2个问答对特征向量组合成问答对特征矩阵，将n2个数据库语言元素特征向量组合成数据库语言元素特征矩阵。

第二层为注意力层，所述注意力层用于对所述问答对特征向量和数据库语言元素特征向量进行加权；所述注意力层的输入为问答对特征矩阵和数据库语言元素特征矩阵，输出为问答对向量和数据库语言元素向量。

在一具体实施方式中，n1取100；将矩阵M输入到卷积神经网络层，得到 n1维，即100维的问题对特征向量和100维数据库语言元素特征向量。卷积核的高度可视为对词语上下文进行采样的窗口高度，由于不同的窗口高度所采样到的特征存在一定程度的差异性，因此这里取4种高度的卷积核，高度在2至 5之间，每种卷积核的数量为100，以尽可能的采取足够的特征。这里的神经网络的层数一般为1层。每种卷积核在进行采样、最大池化等操作后，得到的是一个100维的特征向量，对于一个句子来说，4种卷积核将会得到4个100 维的特征向量，将这4个特征向量进行拼接，构成一个4×100的矩阵。取4种高度的卷积核，得到4个100维的问题对特征向量和数据库语言元素特征向量，将4个问题对特征向量组合成4×100的问题对特征矩阵Ac，将4个数据库语言元素特征向量组合成4×100的数据库语言元素特征矩阵Qc。

注意力层的输入为问题对特征矩阵Ac和数据库语言元素特征特征矩阵 Qc，输出为问题对向量a和数据库语言元素向量向量b。注意力层的加权公式为：G＝softmax(tanh(IW+b)e)，i＝GI。其中，I为4×100的输入特征矩阵，W 为100×100的加权矩阵，b、e为100维的加权向量，softmax为归一化函数，G 为加权权值向量，i为输出的向量。W，b，e初始均为随机值，在网络训练过程中，由Adam随机优化方法得到优化。经过softmax函数归一化后得到的4 维向量G中的值相加为1。将问题对特征矩阵Ac和数据库语言元素Qc代入上述公式，输出为100维的问题对向量a和数据库语言元素向量b。

全连接层用于问题对向量a和数据库语言元素向量b之间的匹配度，匹配度用匹配度分数值来表示，每个分数值的取值在[0,1]，代表归一化后的余弦相似度。匹配度可以根据问题对向量a和数据库语言元素向量b之间的距离来计算。

通过上述程序模块101-107，本发明所提出的问答系统中的问题答案查询系统100，获取训练样本数据，所述训练样本数据包括问答对以及与所述知识库中的标准问句对应的数据库语言元素；使用所述训练样本数据对深度学习网络进行训练，以得到所述数据库语言元素判别模型；接收用户输入的问句，并获取所述问句的关键词；将所述关键词输入至数据库语言元素判别模型，获取所述关键词对应的数据库语言元素；根据所述数据库语言元素生成SQL查询语句；及通过所述SQL查询语句在所述问答系统的数据库中查询所述问句对应的答案。这样，通过深度学习技术训练出识别问句中的关键词对应的数据库语言元素，从而不用人工去定义各个词语对应的数据库语言元素，从而可以摆脱了人工定义的繁琐性。

此外，本发明还提出一种问答系统中的问题答案查询方法。

参阅图5所示，是本发明问答系统中的问题答案查询方法第一实施例的实施流程示意图。在本实施例中，根据不同的需求，图5所示的流程图中的步骤的执行顺序可以改变，某些步骤可以省略。

步骤S500，接收用户输入的问句，并获取所述问句的关键词。

具体地，用户可以通过与计算机设备连接的终端的输入提问信息，即输入所述问句，可以理解的是，用户在输入问句时，可以以语音的方式输入，也可以直接以文本的形式输入。终端在接收到用户的问句时，若该该问句为语音，则将该语音转换为文本，然后将转换后的文本上传给计算机设备，从而使得计算机设备可以得到用户输入的问句；终端在接收到用户的问句时，若该问句为文本，则直接将该文本信息上传给计算机设备，从而使得服务可以得到用户输入的问句。

在接收到用户输入的问句之后，需要对该问句进行处理，从而将该问句中一些不必要的词去掉，从而得到该问句的关键词。

对所述问句进行分词处理得到多个词语；及

步骤S502，将所述关键词输入至数据库语言元素判别模型，获取所述关键词对应的数据库语言元素。

步骤S504，根据所述数据库语言元素生成SQL查询语句。

具体地，具体地，在得到关键词对应的数据库语言元素之后，根据该数据库语言元素按照预设的SQL查询语句生成规则生成对应的SQL查询语句。

步骤S506，通过所述SQL查询语句在所述问答系统的数据库中查询所述问句对应的答案。

在生成SQL查询语句之后，通过该数据库查询语句即可快速及准确地查询到问句对应的答案。

通过上述步骤S500-S506，本发明所提出的问答系统中的问题答案查询方法，接收用户输入的问句，并获取所述问句的关键词；将所述关键词输入至数据库语言元素判别模型，获取所述关键词对应的数据库语言元素；根据所述数据库语言元素生成SQL查询语句；及通过所述SQL查询语句在所述问答系统的数据库中查询所述问句对应的答案。这样，通过深度学习技术训练出识别问句中的关键词对应的数据库语言元素，从而不用人工去定义各个词语对应的数据库语言元素，从而可以摆脱了人工定义的繁琐性。同时，直接通过获取关键词对应的数据库元素的方式来查询问句答案，可以更加快速及准确地查询出问句的答案。

参阅图6所示，是本发明问答系统中的问题答案查询方法第二实施例的实施流程示意图。在本实施例中，根据不同的需求，图6所示的流程图中的步骤的执行顺序可以改变，某些步骤可以省略。

步骤S600，获取训练样本数据，所述训练样本数据包括问答对以及与所述知识库中的标准问句对应的数据库语言元素。

步骤S602，使用所述训练样本数据对深度学习网络进行训练，以得到所述数据库语言元素判别模型。

在一具体实施方式中，n1取100；将矩阵M输入到卷积神经网络层，得到n1维，即100维的问题对特征向量和100维数据库语言元素特征向量。卷积核的高度可视为对词语上下文进行采样的窗口高度，由于不同的窗口高度所采样到的特征存在一定程度的差异性，因此这里取4种高度的卷积核，高度在2至 5之间，每种卷积核的数量为100，以尽可能的采取足够的特征。这里的神经网络的层数一般为1层。每种卷积核在进行采样、最大池化等操作后，得到的是一个100维的特征向量，对于一个句子来说，4种卷积核将会得到4个100 维的特征向量，将这4个特征向量进行拼接，构成一个4×100的矩阵。取4种高度的卷积核，得到4个100维的问题对特征向量和数据库语言元素特征向量，将4个问题对特征向量组合成4×100的问题对特征矩阵Ac，将4个数据库语言元素特征向量组合成4×100的数据库语言元素特征矩阵Qc。

步骤S604，接收用户输入的问句，并获取所述问句的关键词。

步骤S606，将所述关键词输入至数据库语言元素判别模型，获取所述关键词对应的数据库语言元素。

步骤S608，根据所述数据库语言元素生成SQL查询语句。

步骤S610，通过所述SQL查询语句在所述问答系统的数据库中查询所述问句对应的答案。

上述步骤S604-S610与步骤S500-S506类似，在本实施方式中不再赘述。

通过上述步骤S600-S610，本发明所提出的问答系统中的问题答案查询方法，获取字符数据，并将获取到的各个字符数据与背景图片进行图像合成以得到各个字符数据对应的字符图像；对合成后的字符图像进行随机扰动处理以得到不同类型的字符图像；将所述不同类型的字符图像输入至深度学习网络中进行训练以生成问答系统中的问题答案查询模型；将待识别字符图像输入至所述问答系统中的问题答案查询模型中，输出所述待识别字符图像的识别结果；测试所述问答系统中的问题答案查询模型对字符的识别准确率；及若所述识别准确率低于预设阈值，则对所述问答系统中的问题答案查询模型进行调整。这样，通过在问答系统中的问题答案查询模型达不到识别准确率时，对问答系统中的问题答案查询模型进行微调，从而提高问答系统中的问题答案查询的准确率。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台计算机设备(可以是手机，计算机，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种问答系统中的问题答案查询方法，其特征在于，所述问答系统中的问题答案查询方法包括以下步骤：

接收用户输入的问句，并获取所述问句的关键词；

根据所述数据库语言元素生成SQL查询语句；及

2.如权利要求1所述的问答系统中的问题答案查询方法，其特征在于，所述获取所述问句的关键词的步骤包括：

对所述问句进行分词处理得到多个词语；及

3.如权利要求1所述的问答系统中的问题答案查询方法，其特征在于，所述问答系统中的问题答案查询方法还包括：

4.如权利要求3所述的问答系统中的问题答案查询方法，其特征在于，所述使用所述训练样本数据对深度学习网络进行训练，以得到所述数据库语言元素判别模型的步骤包括：

第一层为卷积神经网络层，所述卷积神经网络层的输入为各个训练样本数据所转换的特征向量组成的矩阵M，所述卷积神经网络层的卷积核的宽度为所述特征向量的维度，所述卷积核的数量为n1；将所述矩阵M输入到卷积神经网络层，得到n1维的问答对特征向量和n1维的数据库语言元素特征向量；取n2种高度的卷积核，得到n2个问答对特征向量和数据库语言元素特征向量；将n2个问答对特征向量组合成问答对特征矩阵，将n2个数据库语言元素特征向量组合成数据库语言元素特征矩阵；

5.如权利要求1至4任一项问答系统中的问题答案查询方法，其特征在于，所述将所述关键词输入至数据库语言元素判别模型，获取所述关键词对应的数据库语言元素的步骤包括：

6.一种计算机设备，其特征在于，所述计算机设备包括存储器、处理器，所述存储器上存储有可在所述处理器上运行的问答系统中的问题答案查询系统，所述问答系统中的问题答案查询系统被所述处理器执行时实现如权利要求1-5中任一项所述的问答系统中的问题答案查询方法的步骤。

7.一种问答系统中的问题答案查询系统，包括：

接收模块，用于接收用户输入的问句；

获取模块，用于获取所述问句的关键词；

8.如权利要求7所述的问答系统中的问题答案查询系统，其特征在于，所述所述的问答系统中的问题答案查询系统还包括：

样本获取模块，用于获取训练样本数据，所述训练样本数据包括问答对以及与所述知识库中的标准问句对应的数据库语言元素；及

模型生成模块，用于使用所述训练样本数据对深度学习网络进行训练，以得到所述数据库语言元素判别模型。

9.如权利要求8所述的问答系统中的问题答案查询系统，其特征在于，所述模型生成模块，还用于对所述训练样本数据进行预处理以得到所述训练样本数据对应的特征向量；以及将所述特征向量输入至所述深度学习网络进行训练，以得到所述数据库语言元素判别模型，其中，所述深度学习网络为卷积神经网络，该卷积神经网络分为三层；

10.一种计算机可读存储介质，所述计算机可读存储介质存储有问答系统中的问题答案查询系统，所述问答系统中的问题答案查询系统可被至少一个处理器执行，以使所述至少一个处理器执行如权利要求1-5中任一项所述的问答系统中的问题答案查询方法的步骤。