CN108563627B

CN108563627B - 启发式语音交互方法及装置

Info

Publication number: CN108563627B
Application number: CN201810175225.9A
Authority: CN
Inventors: 周海
Original assignee: Unisound Intelligent Technology Co Ltd
Current assignee: Unisound Intelligent Technology Co Ltd
Priority date: 2018-03-02
Filing date: 2018-03-02
Publication date: 2021-09-03
Anticipated expiration: 2038-03-02
Also published as: CN108563627A

Abstract

本发明公开了一种启发式语音交互方法及装置，其中方法包括获取用户输入的提问请求；根据所述提问语音进行声纹识别；根据所述提问语音进行语音识别；对所述提问语音数据进行自然语言理解处理；根据知识问答图谱获取与所述提问语音数据相对应的答案数据；根据所述用户标识判断所述用户输入相同的所述提问语音的输入次数；若所述用户的用户年龄段与所述提问语音数据的难易属性相匹配时，根据所述提问语音数据生成相对应的引导式反问数据；接收用户基于所述引导式反问数据输入的回答语音，并判断所述回答语音是否正确。该发明采用启发式语音交互方法启发引导儿童思考，弥补现有技术中智能设备与用户交互无法对思维方式进行引导教育的缺陷。

Description

启发式语音交互方法及装置

技术领域

本发明涉及人机交互技术领域，具体涉及一种启发式语音交互方法及装置。

背景技术

人机交互是一门研究系统与用户之间关系的科学，其中系统可以是各种各样的机器，也可以是计算机化的系统或软件。通过人机交互可以实现智能客户系统、语音控制等各种人工智能系统。

在现有儿童智能产品中，用户向设备提问问题，设备就会做出相应的回答，但从中缺少了儿童在成长中教育角色对儿童思考的启发引导环节，智能设备与用户交互无法对思维方式进行引导教育。

发明内容

本发明提供一种启发式语音交互方法及装置，采用启发式语音交互方法启发引导儿童思考，弥补现有技术中智能设备与用户交互无法对思维方式进行引导教育的缺陷。

一种启发式语音交互方法，包括：

获取用户输入的提问请求，所述提问请求包括提问语音和用户标识；

根据所述提问语音进行声纹识别，确定所述用户的用户年龄段；并根据所述提问语音进行语音识别，确定识别后的提问语音数据；

对所述提问语音数据进行自然语言理解处理，并根据自然语言理解的处理结果判断所述提问语音数据是否属于问答知识类；

当所述提问语音数据属于问答知识类时，根据知识问答图谱获取与所述提问语音数据相对应的答案数据；

根据所述用户标识判断所述用户输入相同的所述提问语音的输入次数，当所述输入次数不小于预设阈值时，将所述答案数据反馈至用户；

当所述输入次数小于预设阈值时，判断所述用户的用户年龄段与所述提问语音数据的难易属性是否相匹配；

当所述用户的用户年龄段与所述提问语音数据的难易属性相匹配时，根据所述提问语音数据生成相对应的引导式反问数据；

接收用户基于所述引导式反问数据输入的回答语音，并判断所述回答语音是否正确，当所述回答语音正确时，将所述答案数据反馈至用户。

优选的，所述根据所述提问语音数据生成相对应的引导式反问数据包括：

根据所述提问语音数据的自然语言理解的处理结果进行简单化处理，提取所述提问语音数据的特征信息，并根据所述特征信息生产对应的简单问句；

当用户基于所述简单问句输入的回答语音正确时，根据所述特征信息生成难易程度更大的简单问句，直至所述简单问句为与所述提问语音数据完全对应的问句。

优选的，所述判断所述回答语音是否正确包括：

根据语音识别算法对所述回答语音进行识别处理，生成对应的回答文本信息；

对所述回答文本信息进行分句处理，获取相应的用户语句；

计算所述用户语句与正确答案的相似度，并判断所述相似度是否超过相似度阈值；若在所述相似度超过相似度阈值，则所述回答语音正确；

若所述相似度未超过相似度阈值，则所述回答语音错误。

优选的，所述计算所述用户语句与所述正确答案的相似度包括：

分别对所述用户语句和所述正确答案进行分词处理，获取对应的关键词集；

根据所述用户语句和所述正确答案的关键词集，计算所述用户语句与所述正确答案的相似度。

在一个实施例中，当所述输入次数小于预设阈值时，在所述将所述答案数据反馈至用户之后，还包括：

根据所述用户的输入次数和所述回答语音对所述用户进行评分，并生成相对应的评分信息；

将所述评分信息转换为语音形式的评分信息，并播放所述语音形式的评分信息。

本发明实施例提供一种启发式语音交互装置，包括：

获取请求模块，用于获取用户输入的提问请求，所述提问请求包括提问语音和用户标识；

识别模块，用于根据所述提问语音进行声纹识别，确定所述用户的用户年龄段；并根据所述提问语音进行语音识别，确定识别后的提问语音数据；

处理模块，用于对所述提问语音数据进行自然语言理解处理，并根据自然语言理解的处理结果判断所述提问语音数据是否属于问答知识类；

获取答案模块，用于当所述提问语音数据属于问答知识类时，根据知识问答图谱获取与所述提问语音数据相对应的答案数据；

第一判断模块，用于根据所述用户标识判断所述用户输入相同的所述提问语音的输入次数，当所述输入次数不小于预设阈值时，将所述答案数据反馈至用户；

第二判断模块，用于当所述输入次数小于预设阈值时，判断所述用户的用户年龄段与所述提问语音数据的难易属性是否相匹配；

引导模块，用于当所述用户的用户年龄段与所述提问语音数据的难易属性相匹配时，根据所述提问语音数据生成相对应的引导式反问数据；

反馈模块，用于接收用户基于所述引导式反问数据输入的回答语音，并判断所述回答语音是否正确，当所述回答语音正确时，将所述答案数据反馈至用户。

优选的，所述引导模块包括：

简单化处理单元，用于根据所述提问语音数据的自然语言理解的处理结果进行简单化处理，提取所述提问语音数据的特征信息，并根据所述特征信息生产对应的简单问句；

循环处理单元，用于当用户基于所述简单问句输入的回答语音正确时，根据所述特征信息生成难易程度更大的简单问句，直至所述简单问句为与所述提问语音数据完全对应的问句。

优选的，所述反馈模块包括：

语音识别单元，用于根据语音识别算法对所述回答语音进行识别处理，生成对应的回答文本信息；

分句单元，用于对所述回答文本信息进行分句处理，获取相应的用户语句；

计算单元，用于计算所述用户语句与正确答案的相似度，并判断所述相似度是否超过相似度阈值；

处理单元，用于若在所述相似度超过相似度阈值，则所述回答语音正确；若所述相似度未超过相似度阈值，则所述回答语音错误。

优选的，所述计算单元包括：

分词子单元，用于分别对所述用户语句和所述正确答案进行分词处理，获取对应的关键词集；

计算子单元，用于根据所述用户语句和所述正确答案的关键词集，计算所述用户语句与所述正确答案的相似度。

在一个实施例中，所述的启发式语音交互装置，还包括评分模块和播放模块；

当所述输入次数小于预设阈值时，在所述反馈模块将所述答案数据反馈至用户之后，所述评分模块用于根据所述用户的输入次数和所述回答语音对所述用户进行评分，并生成相对应的评分信息；

所述播放模块用于将所述评分信息转换为语音形式的评分信息，并播放所述语音形式的评分信息。

一种启发式语音交互方法及装置，通过对用户输入的提问请求进行声纹识别，确定用户的年龄段，并通过语音识别确定识别后的提问语音数据，同时对提问语音数据进行自然语言理解处理，判断提问语音数据所属类型，利用用户标识判断用户提问的次数，在用户第一次提问这类问题时，由系统引导用户给出一个自身思考的答案，并随后播报正确答案。通过这样的方式，在交互中引入一个启发思考的环节。加强儿童产品中，儿童对一个问题的思考，提升儿童思维能力。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1为本发明实施例中启发式语音交互方法流程图；

图2为本发明实施例中启发式语音交互装置结构图。

具体实施方式

下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例

参见图1，本发明实施例提供一种启发式语音交互方法，该方法流程如下，具体包括步骤101-108：

步骤101：获取用户输入的提问请求，所述提问请求包括提问语音和用户标识；

步骤102：根据所述提问语音进行声纹识别，确定所述用户的用户年龄段；并根据所述提问语音进行语音识别，确定识别后的提问语音数据；

步骤103：对所述提问语音数据进行自然语言理解处理，并根据自然语言理解的处理结果判断所述提问语音数据是否属于问答知识类；设有问答知识类的问题库，若所述提问语音数据对应的问题属于该问题库，则所述提问语音数据就属于问答知识类。

步骤104：当所述提问语音数据属于问答知识类时，根据知识问答图谱获取与所述提问语音数据相对应的答案数据；其中所述知识问答图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合，并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到学科融合目的的现代理论。

步骤105：根据所述用户标识判断所述用户输入相同的所述提问语音的输入次数，当所述输入次数不小于预设阈值时，将所述答案数据反馈至用户；

步骤106：当所述输入次数小于预设阈值时，判断所述用户的用户年龄段与所述提问语音数据的难易属性是否相匹配；

步骤107：当所述用户的用户年龄段与所述提问语音数据的难易属性相匹配时，根据所述提问语音数据生成相对应的引导式反问数据；

步骤108：接收用户基于所述引导式反问数据输入的回答语音，并判断所述回答语音是否正确，当所述回答语音正确时，将所述答案数据反馈至用户。

其中假设预设阈值为1，当根据所述用户标识判断所述用户输入相同的所述提问语音的输入次数，且所述输入次数≥1时(所述提问语音被所述用户提问过)，将所述答案数据直接反馈给用户；当所述输入次数＜1时(所述提问语音未被所述用户提问过)，进一步判断用户年龄段与所述提问语音数据难易属性是否匹配，若匹配时，将所述提问语音数据生成相对应的引导式反问数据，所述用户对引导式反问数据进行回答并输入对应的回答语音，若回答语音正确则将答案数据反馈至用户。其中所述提问语音数据难易属性分为简单、一般以及困难三个等级，每个不同等级的属性对应不同的年龄段，比如1-10岁(简单)、10岁-18岁(一般)，18岁以上(困难)等。

本实施例，着重于一种启发式语音交互方法，通过对用户输入的提问请求进行声纹识别，确定用户的年龄段，并通过语音识别确定识别后的提问语音数据，同时对提问语音数据进行自然语言理解处理，判断提问语音数据所属类型，利用用户标识判断用户提问的次数，在用户第一次提问这类问题时，由系统引导用户给出一个自身思考的答案，并随后播报正确答案。通过这样的方式，在交互中引入一个启发思考的环节。加强儿童产品中，儿童对一个问题的思考，提升儿童思维能力。

为了提升儿童思维能力，引导儿童对一个问题的思考，在一个实施例中，所述根据所述提问语音数据生成相对应的引导式反问数据包括：

为了准确判断回答语音是否正确，在一个实施例中，所述判断所述回答语音是否正确包括：

对所述回答文本信息进行分句处理，获取相应的用户语句；

若所述相似度未超过相似度阈值，则所述回答语音错误。

在一个实施例中，对于同一答案用户所表述的用户语句不尽相同，为了判断用户语句是否与正确答案相匹配，优选的技术方案是，所述计算所述用户语句与所述正确答案的相似度包括：

具体的，若所述相似度超过相似度阈值，则所述用户语句在正确答案的关键词集内，所述回答语音正确；若所述相似度未超过相似度阈值，则所述用户语句中未包括正确答案的关键词、或者用户语句中包括的正确答案的关键词数量不够，此时所述回答语音错误。

为了培养儿童独立思考的意识以及培养其独特的思维方式，在一个实施例中，当所述输入次数小于预设阈值时，在所述将所述答案数据反馈至用户之后，还包括：

基于同样的发明构思，本发明实施例提供一种启发式语音交互装置，参见图2所示，包括：

获取请求模块201，用于获取用户输入的提问请求，所述提问请求包括提问语音和用户标识；

识别模块202，用于根据所述提问语音进行声纹识别，确定所述用户的用户年龄段；并根据所述提问语音进行语音识别，确定识别后的提问语音数据；

处理模块203，用于对所述提问语音数据进行自然语言理解处理，并根据自然语言理解的处理结果判断所述提问语音数据是否属于问答知识类；

获取答案模块204，用于当所述提问语音数据属于问答知识类时，根据知识问答图谱获取与所述提问语音数据相对应的答案数据；

第一判断模块205，用于根据所述用户标识判断所述用户输入相同的所述提问语音的输入次数，当所述输入次数不小于预设阈值时，将所述答案数据反馈至用户；

第二判断模块206，用于当所述输入次数小于预设阈值时，判断所述用户的用户年龄段与所述提问语音数据的难易属性是否相匹配；

引导模块207，用于当所述用户的用户年龄段与所述提问语音数据的难易属性相匹配时，根据所述提问语音数据生成相对应的引导式反问数据；

反馈模块208，用于接收用户基于所述引导式反问数据输入的回答语音，并判断所述回答语音是否正确，当所述回答语音正确时，将所述答案数据反馈至用户。

本实施例，着重于一种启发式语音交互装置，利用获取请求模块201对于获取用户输入的提问请求，通过识别模块202对用户输入的提问请求进行声纹识别，确定用户的年龄段，并通过语音识别确定识别后的提问语音数据，同时对提问语音数据进行自然语言理解处理，通过处理模块203判断提问语音数据所属类型，利用获取答案模块204根据知识问答图谱获取与所述提问语音数据相对应的数据数据，利用第一判断模块205判断用户提问的次数、第二判断模块206判断语音数据的难易属性，在用户第一次提问这类问题时，通过引导模块207由系统引导用户给出一个自身思考的答案，并通过反馈模块208随后播报正确答案。通过这样的方式，在交互中引入一个启发思考的环节。加强儿童产品中，儿童对一个问题的思考，提升儿童思维能力。

为了引导儿童对问题进行思考，培养一种面对复杂问题的思维方式，在一个实施例中，优选的，所述引导模块207包括：

为了准确判断用户语音信息是否正确，优选的，所述反馈模块208包括：

在一个实施例中，对于同一答案用户所表述的用户语句不尽相同，为了判断用户语句是否与正确答案相匹配，优选的技术方案是，所述计算单元包括：

为了培养儿童独立思考的意识以及培养其独特的思维方式，在一个实施例中，在一个实施例中，所述的启发式语音交互装置，还包括评分模块和播放模块；

显然，上述实施例仅仅是为清楚地说明所作的举例，而并非对实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims

1.一种启发式语音交互方法，其特征在于，包括：

当所述用户的用户年龄段与所述提问语音数据的难易属性相匹配时，根据所述提问语音数据生成相对应的引导式反问数据，包括：

当用户基于所述简单问句输入的回答语音正确时，根据所述特征信息生成难易程度更大的简单问句，直至所述简单问句为与所述提问语音数据完全对应的问句；

2.如权利要求1所述的启发式语音交互方法，其特征在于，所述判断所述回答语音是否正确包括：

对所述回答文本信息进行分句处理，获取相应的用户语句；

若所述相似度未超过相似度阈值，则所述回答语音错误。

3.如权利要求2所述的启发式语音交互方法，其特征在于，所述计算所述用户语句与所述正确答案的相似度包括：

4.如权利要求1所述的启发式语音交互方法，其特征在于，当所述输入次数小于预设阈值时，在所述将所述答案数据反馈至用户之后，还包括：

5.一种启发式语音交互装置，其特征在于，包括：

引导模块，用于当所述用户的用户年龄段与所述提问语音数据的难易属性相匹配时，根据所述提问语音数据生成相对应的引导式反问数据，包括：

循环处理单元，用于当用户基于所述简单问句输入的回答语音正确时，根据所述特征信息生成难易程度更大的简单问句，直至所述简单问句为与所述提问语音数据完全对应的问句；

6.如权利要求5所述的启发式语音交互装置，其特征在于，所述反馈模块包括：

7.如权利要求6所述的启发式语音交互装置，其特征在于，所述计算单元包括：

8.如权利要求5所述的启发式语音交互装置，其特征在于，还包括评分模块和播放模块；