CN111831810A

CN111831810A - 智能问答方法、装置、设备及存储介质

Info

Publication number: CN111831810A
Application number: CN202010714922.4A
Authority: CN
Inventors: 勾震; 马丹; 曾增烽
Original assignee: Ping An Life Insurance Company of China Ltd
Current assignee: Ping An Life Insurance Company of China Ltd
Priority date: 2020-07-23
Filing date: 2020-07-23
Publication date: 2020-10-27
Anticipated expiration: 2040-07-23
Also published as: CN111831810B

Abstract

本发明涉及人工智能领域，公开了一种智能问答方法、装置、设备及存储介质。该方法包括：获取问句语料并通过语义角色标注模型进行标注，得到标注短语和对应的角色类型；根据角色类型，确定标注短语对应的短语类别库，短语类别库包括子类别，子类别中包含模板短语；计算标注短语与对应的短语类别库中的模板短语的相似度，确定标注短语的子类别；根据标注短语的角色类型和子类别，从标准问题库中查询出对应的标准问；根据标准问构建对应的标准答案并输出。本发明能快速准确地从标准问答库找到与用户问题语义最近的语句，并进行解答，保证响应的质量和速度，提升用户体验。此外，本发明还涉及区块链技术，用户的问句语料可存储于区块链中。

Description

智能问答方法、装置、设备及存储介质

技术领域

本发明涉及人工智能领域，尤其涉及一种智能问答方法、装置、设备及存储介质。

背景技术

随着国民经济总体平稳增长，IT信息和线上服务快速发展，“互联网+”行业内部的竞争日趋激烈，给互联网行业带来了更高的挑战，企业提高用户满意度和提供用户友好的体验，需提供在线客服引导用户操作，保证客服质量和客服响应速度，因此如何利用系统快速准确为用户提供解答成为了企业的迫切需求。

问答系统(Frequently Asked Question，FAQ)是一种在已有的“问题-答案”对集合中找到与用户提问相匹配的问句，并将其对应的答案返回给用户的问答式检索系统。在该系统中，根据用户提出的问题与问答库中的已有问句记录相似性，进而将对应的答案返回给用户。

目前广泛使用的方法是利用孪生网络来衡量用户问题和标准问题的相似性，是一种基于深度学习、有监督学习的语义理解，需要在大量自然文本上进行人工的语义标注，结合深度神经网络模型，以数据驱动的方式训练语义理解模型。这种方式需要大量的人工标注。同时，金融领域的数据标注要求有很强背景要求和专业性，所以难以标注，需要耗费大量的人力和时间，而且由于金融领域数据更新较快，经常会有新的金融产品推出，标注数据也需同步更新。

发明内容

本发明的主要目的在于解决现有的语义分析方案中，由于人工的语义标注，而导致FAQ问答系统问答匹配的效率和精确度较低的技术问题。

本发明第一方面提供了一种智能问答方法，包括：

获取用户输入的问句语料；

通过预设的语义角色标注模型对所述问句语料进行语义角色标注，得到标注短语和所述标注短语对应的角色类型；

根据所述角色类型，确定所述标注短语对应的短语类别库，所述短语类别库包括至少一个子类别，每个子类别中包含有至少一条模板短语；

计算所述标注短语与对应的短语类别库中的模板短语的相似度，基于所述相似度确定所述标注短语在所述短语类别库中的子类别；

根据所述标注短语的角色类型和子类别，从预置的标准问题库中查询出对应的标准问；

根据所述标准问构建对应的标准答案并输出。

可选的，在本发明第一方面的第一种实现方式中，所述通过预设的语义角色标注模型对所述问句语料进行语义角色标注，得到标注短语和所述标注短语对应的角色类型包括：

根据所述问句语料的字序列，将所述问句语料中的每个字输入到所述语义角色标注模型中；

通过所述语义角色标注模型对所述问句语料中的每个字进行语义角色的标注，得到标注字序列；

筛选所述标注字序列中角色类型相同的标注且字序为连续的字，并将筛选出的字组成标注短语；

根据所述标注短语上的标注确定所述标注短语对应的角色类型。

可选的，在本发明第一方面的第二种实现方式中，所述计算所述标注短语与对应的短语类别库中的模板短语的相似度，基于所述相似度确定所述标注短语在所述短语类别库中的子类别包括：

将所述标注短语和所述模板短语进行向量转换处理，得到标注短语向量和模板短语向量；

计算所述标注短语向量与所述模板短语向量的相似度值；

根据所述相似度值，对所述模板短语向量按照相似度从大到小的顺序进行排序，得到向量序列；

根据从所述相似度值的最大值依次向下选定的筛选规则从所述向量序列中选择N个模板短语向量，基于所述N个模板短语向量确定对应的模板短语集，其中，N为大于1的整数；

提取所述模板短语集中的各模板短语对应的子类别，并从提取到的所有子类别中选择一个子类别作为所述标注短语的子类别。

可选的，在本发明第一方面的第三种实现方式中，所述提取所述模板短语集中的各模板短语对应的子类别，并从提取到的所有子类别中选择一个子类别作为所述标注短语的子类别包括：

根据所述模板短语集中每个模板短语对应的子类别，对所述模板短语进行同类项合并处理，得到所述模板短语集的子类别的数量，其中所述同类项合并处理为将相同子类别的模板短语进行合并；

判断所述模板短语集中各子类别的数量是否相等；

若相等，则从数量相等的子类别中选择所述相似度值最大的模板短语对应的子类别作为所述标注短语的子类别；

若不相等，则将所述数量最大的子类别作为所述标注短语的子类别。

可选的，在本发明第一方面的第四种实现方式中，所述根据所述标注短语的角色类型和子类别，从预置的标准问题库中查询出对应的标准问包括：

根据所述角色类型，确定所述标准问答库中所述标注短语对应的标准问答群；

根据所述子类别，确定所述标准问答群中所述标注短语对应的标准问。

可选的，在本发明第一方面的第五种实现方式中，在所述获取用户输入的问句语料之前，还包括：

获取用户问题作为模型训练样本，并对所述模型训练样本进行人工标注，得到标注信息；

将所述训练样本输入到预置的深度学习模型中，得到预测标注结果；

基于预置损失函数，计算所述预测标注结果和所述标注信息之间的损失值；

将所述损失值反向输入所述深度学习模型，并根据所述损失值对所述深度学习模型的参数进行调整，直至所述深度学习模型收敛，得到语义角色标注模型。

可选的，在本发明第一方面的第六种实现方式中，所述角色类型包括疑问类、动作类、状况类、背景类、槽位类。

本发明第二方面提供了一种智能问答装置，包括：

获取模块，用于获取用户输入的问句语料；

标注模块，用于通过预设的语义角色标注模型对所述问句语料进行语义角色标注，得到标注短语和所述标注短语对应的角色类型；

类别库确定模块，用于根据所述角色类型，确定所述标注短语对应的短语类别库，所述短语类别库包括至少一个子类别，每个子类别中包含有至少一条模板短语；

计算模块，用于计算所述标注短语与对应的短语类别库中的模板短语的相似度，基于所述相似度确定所述标注短语在所述短语类别库中的子类别；

查询模块，用于根据所述标注短语的角色类型和子类别，从预置的标准问题库中查询出对应的标准问；

输出模块，用于根据所述标准问构建对应的标准答案并输出。

可选的，在本发明第二方面的第一种实现方式中，所述标注模块具体用于：

可选的，在本发明第二方面的第二种实现方式中，所述计算模块包括：

向量单元，用于将所述标注短语和所述模板短语进行向量转换处理，得到标注短语向量和模板短语向量；

相似度计算单元，用于计算所述标注短语向量与所述模板短语向量的相似度值；

排序单元，用于根据所述相似度值，对所述模板短语向量按照相似度从大到小的顺序进行排序，得到向量序列；

短语确定单元，用于根据从所述相似度值的最大值依次向下选定的筛选规则从所述向量序列中选择N个模板短语向量，基于所述N个模板短语向量确定对应的模板短语集，其中，N为大于1的整数；

选择单元，用于提取所述模板短语集中的各模板短语对应的子类别，并从提取到的所有子类别中选择一个子类别作为所述标注短语的子类别。

可选的，在本发明第二方面的第三种实现方式中，所述选择单元具体用于：

判断所述模板短语集中各子类别的数量是否相等；

可选的，在本发明第二方面的第四种实现方式中，所述查询模块具体用于：

可选的，在本发明第二方面的第五种实现方式中，所述智能问答装置还包括模型训练模块，所述模型训练模块具体用于：

可选的，在本发明第二方面的第六种实现方式中，所述角色类型包括疑问类、动作类、状况类、背景类、槽位类。

本发明第三方面提供了一种智能问答设备，包括：存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个处理器通过线路互连；所述至少一个处理器调用所述存储器中的所述指令，以使得所述智能问答设备执行上述的智能问答方法。

本发明的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述的智能问答方法。

本发明的技术方案中，通过语义角色标注模型对问句语料进行标注，得到标注短语和对应的角色类型；根据角色类型，确定标注短语对应的短语类别库，短语类别库包括至少一个子类别，每个子类别中包含有至少一条模板短语；计算标注短语与对应的短语类别库中的模板短语的相似度，确定标注短语的子类别；根据标注短语的角色类型和子类别，从标准问题库中查询出对应的标准问；根据标准问构建对应的标准答案并输出。通过本提案，能快速准确地从标准问答库找到与用户问题语义最近的语句，并根据预置的标准答案进行解答，保证客服质量和响应速度，提升用户体验。

附图说明

图1为本发明实施例中智能问答方法的第一个实施例示意图；

图2为本发明实施例中智能问答方法的第二个实施例示意图；

图3为本发明实施例中智能问答方法的第三个实施例示意图；

图4为本发明实施例中智能问答方法的第四个实施例示意图；

图5为本发明实施例中智能问答方法的第五个实施例示意图；

图6为本发明实施例中智能问答装置的一个实施例示意图；

图7为本发明实施例中智能问答装置的另一个实施例示意图；

图8为本发明实施例中智能问答设备的一个实施例示意图。

具体实施方式

本发明实施例提供了一种智能问答方法、装置、设备及存储介质，本发明的技术方案中，通过语义角色标注模型对问句语料进行标注，得到标注短语和对应的角色类型；根据角色类型，确定标注短语对应的短语类别库，短语类别库包括至少一个子类别，每个子类别中包含有至少一条模板短语；计算标注短语与对应的短语类别库中的模板短语的相似度，确定标注短语的子类别；根据标注短语的角色类型和子类别，从标准问题库中查询出对应的标准问；根据标准问构建对应的标准答案并输出。通过本提案，能快速准确地从标准问答库找到与用户问题语义最近的语句，并根据预置的标准答案进行解答，保证客服质量和响应速度，提升用户体验。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”或“具有”及其任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为便于理解，下面对本发明实施例的具体流程进行描述，请参阅图1，本发明实施例中智能问答方法的第一个实施例包括：

101、获取用户输入的问句语料；

可以理解的是，本发明的执行主体可以为智能问答装置，还可以是终端或者服务器，具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。

需要强调的是，为进一步保证上述用户输入的问句语料的私密和安全性，上述问句语料还可以存储于一区块链的节点中。

在该步骤，所述问句语料的获取可以是通过客户端或者通过业务人员向用户提供的网页，其中，通过所述网页，可以在所述用户登陆所述网页时，开始监听页面通讯内容，获得用户在所述网页的聊天窗口中输入的问句语料；通过所述客户端的方式，当所述用户登陆客户端时，可以通过采用Hook技术的专用采集工具监听获取聊天内容，在通过上述两种方法获得问句语料后，将用户发送的问句文本自动生成HTML文件，然后将文件内容解析存入Elasticsearch中作为问句语料供后续使用。通过将用户的聊天内容自动生成HTML文件的方式主要是为了可以和通用网站的格式保持一致，方便与系统进行整合。

在实际应用中，所述问句语料还可以为用户在使用通讯工具时用户的发送的自然语言文本，所述通讯工具可以是企业中的一些企业聊天app等即时通讯工具。如当用户在企业的推送公众号中输入问句进行问答查询，后台会获取用户输入的文本，将所述文本输入到FAQ系统中。本发明在用户输入问句语料后，快速推导出相对应的答案，首先需要获取用户发送的自然语言文本，也就是用户的问句语料。

102、通过预设的语义角色标注模型对问句语料进行语义角色标注，得到标注短语和标注短语对应的角色类型；

在该步骤中，通过预置的语义角色标注模型，对所述问句语料中的每个字进行语义标注，根据标注体系的不同，可以有不同的标注方式，其中所述标注体系有BIOES体系，BIO体系等。这些标注体系都是以单个或间断的英文字符串在待标注的文本上进行编码。BIOES是将标注的类型分为“begin”、“intermediate”、“other”、“end”和“single”，而BIO体系是分为“begin”、“intermediate”和“other”。而每个大的标注下还可分为小标注。

在本方案中，这些小标注就是角色类型，包括question(疑问词)、action(动作)、problem(状况)、background(背景信息)和slot(槽位)，其中所述question(疑问词)代表用户核心行为疑问词，表示具体询问哪方面，action(动作)代表用户的核心行为意图，多为动词，problem(状况)代表用户遇到的状况或者不符合期望的状况，background(背景信息)代表背景情况，一般是可以省略的非关键信息，slot(槽位)代表用户具体询问的对象，对于问句语料“我的平安福明天到期，我要还款，可是找不到还款页面，怎么还？”进行语义角色标注，则其中“还款”标注为action(动作)，“怎么”标注为question(疑问词)，“找不到还款界面”标注为problem(状况)，“平安福”标注为slot(槽位)，“明天到期”标注为slot(槽位)。

103、根据角色类型，确定标注短语对应的短语类别库，短语类别库包括至少一个子类别，每个子类别中包含有至少一条模板短语；

在该步骤中，在对问句语料进行标注得到标注短语后，需要根据所述标注短语的不同角色类别，将所述标注短语归入不同的短语类别库中，以供所述标注短语在对应的短语类别库内确定子类别，其中，所述短语类别库包括了许多预置的模板短语，每个模板短语的角色类别都相同，同时，每个模板短语还有对应的子类别，模板短语之间的子类别可以相同或不同，所述模板短语的子类别需要通过聚类并结合人工调整的方式确定，聚类是指将相似的事务聚集在一起，将不相似的事物划分到不同的类别的过程，从而将复杂数据简化为少数类别，例如对槽位类角色类型的“身份证有效期”“新的身份证”聚类为子类别为“登记证件”。在本实施例中，需要先将事先收集到的样本短语转换成词向量，基于所述词向量之间的距离对所述样本短语进行聚类，得到一个以上的短语簇，分别针对所述短语簇分析主成分特征，以确定个短语簇对应的子类别，包括但不限于K-means聚类、基于分类模型的聚类、卷积神经网络结合词向量的方法。

104、计算标注短语与对应的短语类别库中的模板短语的相似度，基于相似度确定标注短语在短语类别库中的子类别；

在该步骤中，所述计算所述标注短语与对应的短语类别库中的模板短语的相似度主要是通过判断所述标注短语的标注短语向量和所述模板短语向量之间的距离，例如欧式距离算法或者余弦相似度算法，得到与标注短语向量距离最短的预置数目的模板短语向量，在本实施例中，所述预置数目为5，当确定了与所述标注短语最相似的5个模板短语之后，确定这5个模板短语的子类别，并根据这5个模板短语的子类别进行投票，投票结果就是所述标注短语的子类别，投票过程主要是判断5个模板短语中数量最多的子类别，例如5个模板短语分别为“身份证有效期”“新的身份证”“平安福”“身份证件信息”“富强福”，其中“身份证有效期”“新的身份证”“身份证信息”的子类别为“登记证件”，“平安福”“富强福”的子类别为“金融产品”，则这5个模板短语中数量最多的子类别为“登记证件”，也就是说所述标注短语的子类别是“登记证件”。

105、根据标注短语的角色类型和子类别，从预置的标准问题库中查询出对应的标准问；

在该步骤中，所述预置的检索匹配的规则更加灵活，可根据不同的任务场景进行修改，中间结果可视化，可以通过人为修改干预的方式提高匹配的准确性，例如可以根据不同的用户需求，设置不同匹配关系的强弱要求。检索规则可以是要求用户问题的标注短语和标准问题的标注短语，在角色类型上必须全部是一样的，但是在某些角色标签的子类别可以不同，例如background的角色的标签往往不是核心内容，可以根据的场景，来选择参不参与匹配，在本实施例中，所述检索规则为标注短语的角色类型和子类别必须全部相同。

106、根据标注问构建对应的标准答案并输出。

本发明实施例中，通过语义角色标注模型对问句语料进行标注，得到标注短语和对应的角色类型；根据角色类型，确定标注短语对应的短语类别库，短语类别库包括至少一个子类别，每个子类别中包含有至少一条模板短语；计算标注短语与对应的短语类别库中的模板短语的相似度，确定标注短语的子类别；根据标注短语的角色类型和子类别，从标准问题库中查询出对应的标准问；根据标准问构建对应的标准答案并输出。通过本提案，能快速准确地从标准问答库找到与用户问题语义最近的语句，并根据预置的标准答案进行解答，保证客服质量和响应速度，提升用户体验。

请参阅图2，本发明实施例中智能问答方法的第二个实施例包括：

201、获取用户输入的问句语料；

202、根据问句语料的字序列，将问句语料中的每个字输入到语义角色标注模型中；

203、通过语义角色标注模型对问句语料中的每个字进行语义角色的标注，得到标注字序列；

204、筛选标注字序列中角色类型相同的标注且字序为连续的字，并将筛选出的字组成标注短语；

205、根据标注短语上的标注确定标注短语对应的角色类型；

在该步骤中，在获取到所述问句语料后，按照所述问句语料的字序列将问句语料输入到模型中进行标注，也就是说，语义角色标注模型会对输入其中的每个字进行标注，输入的顺序，是按照问句语料中字的排序规定的，只需要简单地将问句语料中的每个字拆分开来，再按照顺序输入即可，例如对问句语料中的“我的平安福”，按照“我”“的”“平”“安”“福”的顺序输入到语义标注模型中进行标注。

在该步骤，通过少量的人工标注训练样本进行训练，可以是使用BERT模型，得到大量的模型标注结果后，使用CRF++等速度较快的模型进行建模，得到语义角色标注模型，将所述问句语料输入到该语义角色标注模型后，所述语义角色标注模型会对所述问句语料进行自动标注。

206、根据角色类型，确定标注短语对应的短语类别库，并计算标注短语与对应的短语类别库中的模板短语的相似度，确定标注短语在短语类别库中的子类别；

在该步骤中，短语类别库包括至少一个子类别，每个子类别中包含有至少一条模板短语。

207、根据标注短语的角色类型和子类别，查询出对应的标准问和标准答案并输出。

本实施例中的步骤206-207与上一实施例中的103-106相似，此处不再赘述。

本发明实施例在上一实施例的机场上，详细描述了语义标注模型对问句语料标注后获得标注短语以及标注短语对应的角色类型的过程，在标注过程中需先将问句短语进行分字处理，再根据每个字在问句语料中的位置，确定问句语料中每个字输入到语义标注模型的顺序，语义标注模型对每个字进行角色类型标注后，将字序连续且角色类型相同的子组合成标注短语，由于标注短语中每个字的角色类型都是相同的，进而也就能够确定了标注短语的角色类型，通过本方案，能够快速对每个字进行标注，同时得到标注短语。

请参阅图3，本发明实施例中智能问答方法的第三个实施例包括：

301、通过预设的语义角色标注模型对用户输入的问句语料进行语义角色标注，得到标注短语和标注短语对应的角色类型，并确定标注短语对应的短语类别库；

在本实施例中，短语类别库包括至少一个子类别，每个子类别中包含有至少一条模板短语。

该步骤与第一实施例中的步骤101-102相似，此处不再赘述。

302、将标注短语和模板短语进行向量转换处理，得到标注短语向量和模板短语向量；

303、计算标注短语向量与模板短语向量的相似度值；

304、根据相似度值，对模板短语向量按照相似度从大到小的顺序进行排序，得到向量序列；

305、根据从相似度值的最大值依次向下选定的筛选规则从向量序列中选择N个模板短语向量，基于N个模板短语向量确定对应的模板短语集，其中，N为大于1的整数；

306、提取模板短语集中的各模板短语对应的子类别，并从提取到的所有子类别中选择一个子类别作为标注短语的子类别；

在该步骤中，所述标注短语和所述模板短语之间的相似度计算可以是将两个短语转换为词向量的形式，并计算两个词向量之间的距离，计算两个词向量距离的方式可以是欧式距离算法或者余弦相似度算法，以欧氏距离算法为例，若所述标注短语的词向量形式为(x₁₁，x₁₂x₁₃，…，x_1n)，模板短语的词向量形式为(x₂₁，x₂₂，x₂₃，…，x_2n)，则所述欧式距离的计算公式为：

其中，D代表两个词向量的欧式距离，n代表词向量的数量，k为标注短语和模板短语的序号。

在该步骤中，在计算得到所述标注短语向量与短语类型库中的模板短语向量的相似度值，需要选取其中n个的模板短语作模板短语库，根据所述模板短语库中各模板短语确定标注短语的子类别，主要是通过排序的方式，例如预置数量为5，标注短语为“身份证件”，相似度排序为“身份证件信息”“身份证有效期”“新的身份证”“身份证照片”“身份证地址”。

307、根据标注短语的角色类型和子类别，查询出对应的标准问和标准答案并输出。

该步骤与第一实施例中的步骤105-106相似，此处不再赘述。

本发明实施例在前实施例的基础上，详细描述了确定标注短语子类别的过程，在得到标注短语的角色类型后，每个角色类型都有对应的短语类别库，通过标注短语的角色类型确定标注短语对应的短语类别库，每个短语类别库中包括至少一个子类别，每个子类别中包含至少一个模板短语，计算模板短语与标注短语的相似度后，通过相识度确定与标注短语最接近的模板短语，模板短语的子类别就是该标注短语的子类别，本发明通过相似度的计算，能过从多个模板短语中确定与标注短语语义最接近的一个模板短语，进而确定标注短语的子类别，同时一个问句语料有多个标注短语，通过多个标注短语的子类别能过更加精确的确定问答库中与用户问句语义最接近的标准问，进而进行精确的解答。

请参阅图4，本发明实施例中智能问答方法的第四个实施例包括：

401、通过预设的语义角色标注模型对用户输入的问句语料进行语义角色标注，得到标注短语和标注短语对应的角色类型，并确定标注短语对应的短语类别库；

该步骤与第一实施例中的步骤101-102相似，此处不再赘述。

402、将标注短语和模板短语进行向量转换处理，得到标注短语向量和模板短语向量；

403、计算标注短语向量与模板短语向量的相似度值；

404、根据相似度值，对模板短语向量按照相似度从大到小的顺序进行排序，得到向量序列；

405、根据从相似度值的最大值依次向下选定的筛选规则从向量序列中选择N个模板短语向量，基于N个模板短语向量确定对应的模板短语集，其中，N为大于1的整数；

406、根据模板短语集中每个模板短语对应的子类别，对模板短语进行同类项合并处理，得到模板短语集的子类别的数量，其中同类项合并处理为将相同子类别的模板短语进行合并；

407、判断各子类别的数量是否相等；

408、若相等，则从数量相等的子类别中选择相似度值最大的模板短语所对应的子类别作为标注短语的子类别；

409、若不相等，则将数量最大的子类别作为标注短语的子类别；

在本实施例中，当确定了与所述标注短语最相似的n个模板短语之后，确定这n个模板短语的子类别，并根据这5个模板短语的子类别进行投票，投票结果就是所述标注短语的子类别，投票过程主要是判断这n个模板短语中数量最多的子类别，例如5个模板短语分别为“身份证有效期”“新的身份证”“平安福”“身份证件信息”“富强福”，其中“身份证有效期”“新的身份证”“身份证信息”的子类别为“登记证件”，“平安福”“富强福”的子类别为“金融产品”，则这5个模板短语中数量最多的子类别为“登记证件”，也就是说所述标注短语的子类别是“登记证件”，当5个模板短语分别为“身份证有效期”“新的身份证”“平安福”“帐号”“富强福”，其中“身份证有效期”“新的身份证”的子类别为“登记证件”，“平安福”“富强福”的子类别为“金融产品”，显然存在两个数量最多的子类别，则选择所述注短语与这5个模板短语中相似度最大的模板短语的子类别为所述标注短语的子类别。

410、根据标注短语的角色类型和子类别，查询出对应的标准问和标准答案并输出。

该步骤与第一实施例中的步骤105-106相似，此处不再赘述。

本实施例在上一实施例的基础上，描述从多个模板短语中确定标注短语子类别的过程，通过相似度的排序，确定与标注短语相似度对接近的N个模板短语，将这N个模板短语作为模板短语集，确定模板短语集中各子类别对应模板短语的数量，通过当有子类别对应模板短语的数量相等时，确定模板短语集中相似度最大的模板短语的子类别作为标注短语的子类别，当不相等时，确定对应模板短语的数量的子类别作为标注短语的子类别。本发明不是简单地选择多个模板短语中相似度最大的模板短语，而是先确定一定数量的相似度最大的模板短语后，得到模板短语集后，再从该模板短语集中确定标注短语的子类别，通过多次选择的方式，得到的标注短语的子类别更加精确。

请参阅图5，本发明实施例中智能问答方法的第五个实施例包括：

501、通过预设的语义角色标注模型对用户输入的问句语料进行语义角色标注，得到标注短语和标注短语对应的角色类型，并确定标注短语对应的短语类别库；

在本实施例中，短语类别库包括至少一个子类别，每个子类别中包含有至少一条模板短语；

502、计算标注短语与对应的短语类别库中的模板短语的相似度，基于相似度确定标注短语在短语类别库中的子类别；

本实施例中的步骤501-502与第一实施例中的步骤101-104相似，此处不再赘述。

503、根据角色类型，确定标准问答库中对应的标准问答群；

504、根据子类别，确定标准问答群中对应的标准问；

在该步骤中，检索的过程需要匹配高一级的内容，再继续匹配下一级的内容，也就是说，先需要根据角色类型，确定所述标准问答库中对应的标准问答群，再根据所述子类别，确定所述标准问答群众对应的标准问，例如问句语料为“身份证有效期到期了怎么样更改”先需要确定问句中的各个角色类型包括了槽位(Slot)，动作(Action)，疑问(Question)，在该问句语料中不包括状况(Problem)，其中“身份证有效期”的角色类型为槽位(Slot)，“怎么样”的角色类型为疑问(Question)，“更改”的角色类型为动作(Action)则确定标准问答库中的包括了槽位(Slot)，动作(Action)，疑问(Question)，不包括状况(Problem)的标准问为标准问答群，再根据“身份证有效期”的子类别“登记信件”，“怎么样”的子类别“怎么”，“更改”的子类别“更改”从标准问答群中寻找子类别包含有“登记证件”“怎么”“更改”的标准问。

505、根据标准问构建对应的标准答案并输出。

该步骤与第一实施例中的步骤106相似，此处不再赘述。

本实施例在前实施例基础上，详细描述了得到用户语料语义最接近的标准问的过程，在得到多个标注短语的以及标注短语对应的角色类型后，通过标注短语在标准问题库中进行检索，检索的过程需要匹配高一级的内容，再继续匹配下一级的内容，通过多层检索的方式，在检索过程不需要每次都对标准问题库中每个问句进行检索比对，减少了检索的运算量，提成了检索效率。

上面对本发明实施例中智能问答方法进行了描述，下面对本发明实施例中智能问答装置进行描述，请参阅图6，本发明实施例中智能问答装置第一个实施例包括：

获取模块601，用于获取用户输入的问句语料；

标注模块602，用于通过预设的语义角色标注模型对所述问句语料进行语义角色标注，得到标注短语和所述标注短语对应的角色类型；

类别库确定模块603，用于根据所述角色类型，确定所述标注短语对应的短语类别库，所述短语类别库包括至少一个子类别，每个子类别中包含有至少一条模板短语；

计算模块604，用于计算所述标注短语与对应的短语类别库中的模板短语的相似度，基于所述相似度确定所述标注短语在所述短语类别库中的子类别；

查询模块605，用于根据所述标注短语的角色类型和子类别，从预置的标准问题库中查询出对应的标准问；

输出模块606，用于根据所述标准问构建对应的标准答案并输出。

本发明实施例中提供一种智能问答装置，所述智能问答装置能够运行所述智能问答方法，包括：获取用户的问句语料；通过语义角色标注模型对问句语料进行标注，得到标注短语和对应的角色类型；根据角色类型，确定标注短语对应的短语类别库，短语类别库包括至少一个子类别，每个子类别中包含有至少一条模板短语；计算标注短语与对应的短语类别库中的模板短语的相似度，确定标注短语的子类别；根据标注短语的角色类型和子类别，从标准问题库中查询出对应的标准问；根据标准问构建对应的标准答案并输出。通过本提案，能快速准确地从标准问答库找到与用户问题语义最近的语句，并根据预置的标准答案进行解答，保证客服质量和响应速度，提升用户体验。

请参阅图7，本发明实施例中智能问答装置的第二个实施例包括：

获取模块601，用于获取用户输入的问句语料；

可选的，所述标注模块602具体用于：

其中，所述计算模块604包括：

向量单元6041，用于将所述标注短语和所述模板短语进行向量转换处理，得到标注短语向量和模板短语向量；

相似度计算单元6042，用于计算所述标注短语向量与所述模板短语向量的相似度值；

排序单元6043，用于根据所述相似度值，对所述模板短语向量按照相似度从大到小的顺序进行排序，得到向量序列；

短语确定单元6044，用于根据从所述相似度值的最大值依次向下选定的筛选规则从所述向量序列中选择N个模板短语向量，基于所述N个模板短语向量确定对应的模板短语集，其中，N为大于1的整数；

选择单元6045，用于提取所述模板短语集中的各模板短语对应的子类别，并从提取到的所有子类别中选择一个子类别作为所述标注短语的子类别。

可选的，所述选择单元6045具体用于：

判断所述模板短语集中各子类别的数量是否相等；

可选的，所述查询模块605具体用于：

可选地，所述智能问答装置还包括模型训练模块606，所述模型训练模块606具体用于：

本发明实施例中，提供了一种智能问答装置，所述智能问答装置在上一实施例的基础上，增加了模型训练模块，将已收集到的并已经解答的用户问题作为模型的训练样本，同时，对训练样本进行人工标注，将标注后的训练样本输入到深度学习模型中得到标注结果，通过标注结果和标注信息之间的损失值调整模型的参数，同时详细描述了各模块的功能，通过各模块的组合，快速准确地从标准问答库找到与用户问题语义最近的语句，并进行解答，保证响应的质量和速度，提升用户体验。

上面图6和图7从模块化功能实体的角度对本发明实施例中的中智能问答装置进行详细描述，下面从硬件处理的角度对本发明实施例中智能问答设备进行详细描述。

图8是本发明实施例提供的一种智能问答设备的结构示意图，该智能问答设备800可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(centralprocessing units，CPU)810(例如，一个或一个以上处理器)和存储器820，一个或一个以上存储应用程序833或数据832的存储介质830(例如一个或一个以上海量存储设备)。其中，存储器820和存储介质830可以是短暂存储或持久存储。存储在存储介质830的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对智能问答设备800中的一系列指令操作。更进一步地，处理器810可以设置为与存储介质830通信，在智能问答设备800上执行存储介质830中的一系列指令操作。

智能问答设备800还可以包括一个或一个以上电源840，一个或一个以上有线或无线网络接口850，一个或一个以上输入输出接口860，和/或，一个或一个以上操作系统831，例如Windows Serve，Mac OS X，Unix，Linux，FreeBSD等等。本领域技术人员可以理解，图8示出的智能问答设备结构并不构成对智能问答设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

本发明还提供一种计算机可读存储介质，该计算机可读存储介质可以为非易失性计算机可读存储介质，该计算机可读存储介质也可以为易失性计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在计算机上运行时，使得计算机执行所述智能问答方法的步骤。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统或装置、单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种智能问答方法，其特征在于，所述智能问答方法包括：

获取用户输入的问句语料；

根据所述标准问构建对应的标准答案并输出。

2.根据权利要求1所述的智能问答方法，其特征在于，所述通过预设的语义角色标注模型对所述问句语料进行语义角色标注，得到标注短语和所述标注短语对应的角色类型包括：

3.根据权利要求1所述的智能问答方法，其特征在于，所述计算所述标注短语与对应的短语类别库中的模板短语的相似度，基于所述相似度确定所述标注短语在所述短语类别库中的子类别包括：

计算所述标注短语向量与所述模板短语向量的相似度值；

4.根据权利要求3所述的智能问答方法，其特征在于，所述提取所述模板短语集中的各模板短语对应的子类别，并从提取到的所有子类别中选择一个子类别作为所述标注短语的子类别包括：

判断所述模板短语集中各子类别的数量是否相等；

5.根据权利要求1所述的智能问答方法，其特征在于，所述根据所述标注短语的角色类型和子类别，从预置的标准问题库中查询出对应的标准问包括：

6.根据权利要求1-5中任一项所述的智能问答方法，其特征在于，在所述获取用户输入的问句语料之前，还包括：

7.根据权利要求6所述的智能问答方法，其特征在于，所述角色类型包括疑问类、动作类、状况类、背景类和槽位类。

8.一种智能问答装置，其特征在于，所述智能问答装置包括：

获取模块，用于获取用户输入的问句语料；

9.一种智能问答设备，其特征在于，所述智能问答设备包括：存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个处理器通过线路互连；

所述至少一个处理器调用所述存储器中的所述指令，以使得所述智能问答设备执行如权利要求1-7中任一项所述的智能问答方法。

10.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的智能问答方法。