CN108563627B - 启发式语音交互方法及装置 - Google Patents
启发式语音交互方法及装置 Download PDFInfo
- Publication number
- CN108563627B CN108563627B CN201810175225.9A CN201810175225A CN108563627B CN 108563627 B CN108563627 B CN 108563627B CN 201810175225 A CN201810175225 A CN 201810175225A CN 108563627 B CN108563627 B CN 108563627B
- Authority
- CN
- China
- Prior art keywords
- voice
- user
- question
- answer
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 32
- 238000000034 method Methods 0.000 title claims abstract description 20
- 238000012545 processing Methods 0.000 claims abstract description 57
- 230000011218 segmentation Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000007547 defect Effects 0.000 abstract description 2
- 238000005728 strengthening Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000010225 co-occurrence analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明公开了一种启发式语音交互方法及装置,其中方法包括获取用户输入的提问请求;根据所述提问语音进行声纹识别;根据所述提问语音进行语音识别;对所述提问语音数据进行自然语言理解处理;根据知识问答图谱获取与所述提问语音数据相对应的答案数据;根据所述用户标识判断所述用户输入相同的所述提问语音的输入次数;若所述用户的用户年龄段与所述提问语音数据的难易属性相匹配时,根据所述提问语音数据生成相对应的引导式反问数据;接收用户基于所述引导式反问数据输入的回答语音,并判断所述回答语音是否正确。该发明采用启发式语音交互方法启发引导儿童思考,弥补现有技术中智能设备与用户交互无法对思维方式进行引导教育的缺陷。
Description
技术领域
本发明涉及人机交互技术领域,具体涉及一种启发式语音交互方法及装置。
背景技术
人机交互是一门研究系统与用户之间关系的科学,其中系统可以是各种各样的机器,也可以是计算机化的系统或软件。通过人机交互可以实现智能客户系统、语音控制等各种人工智能系统。
在现有儿童智能产品中,用户向设备提问问题,设备就会做出相应的回答,但从中缺少了儿童在成长中教育角色对儿童思考的启发引导环节,智能设备与用户交互无法对思维方式进行引导教育。
发明内容
本发明提供一种启发式语音交互方法及装置,采用启发式语音交互方法启发引导儿童思考,弥补现有技术中智能设备与用户交互无法对思维方式进行引导教育的缺陷。
一种启发式语音交互方法,包括:
获取用户输入的提问请求,所述提问请求包括提问语音和用户标识;
根据所述提问语音进行声纹识别,确定所述用户的用户年龄段;并根据所述提问语音进行语音识别,确定识别后的提问语音数据;
对所述提问语音数据进行自然语言理解处理,并根据自然语言理解的处理结果判断所述提问语音数据是否属于问答知识类;
当所述提问语音数据属于问答知识类时,根据知识问答图谱获取与所述提问语音数据相对应的答案数据;
根据所述用户标识判断所述用户输入相同的所述提问语音的输入次数,当所述输入次数不小于预设阈值时,将所述答案数据反馈至用户;
当所述输入次数小于预设阈值时,判断所述用户的用户年龄段与所述提问语音数据的难易属性是否相匹配;
当所述用户的用户年龄段与所述提问语音数据的难易属性相匹配时,根据所述提问语音数据生成相对应的引导式反问数据;
接收用户基于所述引导式反问数据输入的回答语音,并判断所述回答语音是否正确,当所述回答语音正确时,将所述答案数据反馈至用户。
优选的,所述根据所述提问语音数据生成相对应的引导式反问数据包括:
根据所述提问语音数据的自然语言理解的处理结果进行简单化处理,提取所述提问语音数据的特征信息,并根据所述特征信息生产对应的简单问句;
当用户基于所述简单问句输入的回答语音正确时,根据所述特征信息生成难易程度更大的简单问句,直至所述简单问句为与所述提问语音数据完全对应的问句。
优选的,所述判断所述回答语音是否正确包括:
根据语音识别算法对所述回答语音进行识别处理,生成对应的回答文本信息;
对所述回答文本信息进行分句处理,获取相应的用户语句;
计算所述用户语句与正确答案的相似度,并判断所述相似度是否超过相似度阈值;若在所述相似度超过相似度阈值,则所述回答语音正确;
若所述相似度未超过相似度阈值,则所述回答语音错误。
优选的,所述计算所述用户语句与所述正确答案的相似度包括:
分别对所述用户语句和所述正确答案进行分词处理,获取对应的关键词集;
根据所述用户语句和所述正确答案的关键词集,计算所述用户语句与所述正确答案的相似度。
在一个实施例中,当所述输入次数小于预设阈值时,在所述将所述答案数据反馈至用户之后,还包括:
根据所述用户的输入次数和所述回答语音对所述用户进行评分,并生成相对应的评分信息;
将所述评分信息转换为语音形式的评分信息,并播放所述语音形式的评分信息。
本发明实施例提供一种启发式语音交互装置,包括:
获取请求模块,用于获取用户输入的提问请求,所述提问请求包括提问语音和用户标识;
识别模块,用于根据所述提问语音进行声纹识别,确定所述用户的用户年龄段;并根据所述提问语音进行语音识别,确定识别后的提问语音数据;
处理模块,用于对所述提问语音数据进行自然语言理解处理,并根据自然语言理解的处理结果判断所述提问语音数据是否属于问答知识类;
获取答案模块,用于当所述提问语音数据属于问答知识类时,根据知识问答图谱获取与所述提问语音数据相对应的答案数据;
第一判断模块,用于根据所述用户标识判断所述用户输入相同的所述提问语音的输入次数,当所述输入次数不小于预设阈值时,将所述答案数据反馈至用户;
第二判断模块,用于当所述输入次数小于预设阈值时,判断所述用户的用户年龄段与所述提问语音数据的难易属性是否相匹配;
引导模块,用于当所述用户的用户年龄段与所述提问语音数据的难易属性相匹配时,根据所述提问语音数据生成相对应的引导式反问数据;
反馈模块,用于接收用户基于所述引导式反问数据输入的回答语音,并判断所述回答语音是否正确,当所述回答语音正确时,将所述答案数据反馈至用户。
优选的,所述引导模块包括:
简单化处理单元,用于根据所述提问语音数据的自然语言理解的处理结果进行简单化处理,提取所述提问语音数据的特征信息,并根据所述特征信息生产对应的简单问句;
循环处理单元,用于当用户基于所述简单问句输入的回答语音正确时,根据所述特征信息生成难易程度更大的简单问句,直至所述简单问句为与所述提问语音数据完全对应的问句。
优选的,所述反馈模块包括:
语音识别单元,用于根据语音识别算法对所述回答语音进行识别处理,生成对应的回答文本信息;
分句单元,用于对所述回答文本信息进行分句处理,获取相应的用户语句;
计算单元,用于计算所述用户语句与正确答案的相似度,并判断所述相似度是否超过相似度阈值;
处理单元,用于若在所述相似度超过相似度阈值,则所述回答语音正确;若所述相似度未超过相似度阈值,则所述回答语音错误。
优选的,所述计算单元包括:
分词子单元,用于分别对所述用户语句和所述正确答案进行分词处理,获取对应的关键词集;
计算子单元,用于根据所述用户语句和所述正确答案的关键词集,计算所述用户语句与所述正确答案的相似度。
在一个实施例中,所述的启发式语音交互装置,还包括评分模块和播放模块;
当所述输入次数小于预设阈值时,在所述反馈模块将所述答案数据反馈至用户之后,所述评分模块用于根据所述用户的输入次数和所述回答语音对所述用户进行评分,并生成相对应的评分信息;
所述播放模块用于将所述评分信息转换为语音形式的评分信息,并播放所述语音形式的评分信息。
一种启发式语音交互方法及装置,通过对用户输入的提问请求进行声纹识别,确定用户的年龄段,并通过语音识别确定识别后的提问语音数据,同时对提问语音数据进行自然语言理解处理,判断提问语音数据所属类型,利用用户标识判断用户提问的次数,在用户第一次提问这类问题时,由系统引导用户给出一个自身思考的答案,并随后播报正确答案。通过这样的方式,在交互中引入一个启发思考的环节。加强儿童产品中,儿童对一个问题的思考,提升儿童思维能力。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中启发式语音交互方法流程图;
图2为本发明实施例中启发式语音交互装置结构图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
参见图1,本发明实施例提供一种启发式语音交互方法,该方法流程如下,具体包括步骤101-108:
步骤101:获取用户输入的提问请求,所述提问请求包括提问语音和用户标识;
步骤102:根据所述提问语音进行声纹识别,确定所述用户的用户年龄段;并根据所述提问语音进行语音识别,确定识别后的提问语音数据;
步骤103:对所述提问语音数据进行自然语言理解处理,并根据自然语言理解的处理结果判断所述提问语音数据是否属于问答知识类;设有问答知识类的问题库,若所述提问语音数据对应的问题属于该问题库,则所述提问语音数据就属于问答知识类。
步骤104:当所述提问语音数据属于问答知识类时,根据知识问答图谱获取与所述提问语音数据相对应的答案数据;其中所述知识问答图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到学科融合目的的现代理论。
步骤105:根据所述用户标识判断所述用户输入相同的所述提问语音的输入次数,当所述输入次数不小于预设阈值时,将所述答案数据反馈至用户;
步骤106:当所述输入次数小于预设阈值时,判断所述用户的用户年龄段与所述提问语音数据的难易属性是否相匹配;
步骤107:当所述用户的用户年龄段与所述提问语音数据的难易属性相匹配时,根据所述提问语音数据生成相对应的引导式反问数据;
步骤108:接收用户基于所述引导式反问数据输入的回答语音,并判断所述回答语音是否正确,当所述回答语音正确时,将所述答案数据反馈至用户。
其中假设预设阈值为1,当根据所述用户标识判断所述用户输入相同的所述提问语音的输入次数,且所述输入次数≥1时(所述提问语音被所述用户提问过),将所述答案数据直接反馈给用户;当所述输入次数<1时(所述提问语音未被所述用户提问过),进一步判断用户年龄段与所述提问语音数据难易属性是否匹配,若匹配时,将所述提问语音数据生成相对应的引导式反问数据,所述用户对引导式反问数据进行回答并输入对应的回答语音,若回答语音正确则将答案数据反馈至用户。其中所述提问语音数据难易属性分为简单、一般以及困难三个等级,每个不同等级的属性对应不同的年龄段,比如1-10岁(简单)、10岁-18岁(一般),18岁以上(困难)等。
本实施例,着重于一种启发式语音交互方法,通过对用户输入的提问请求进行声纹识别,确定用户的年龄段,并通过语音识别确定识别后的提问语音数据,同时对提问语音数据进行自然语言理解处理,判断提问语音数据所属类型,利用用户标识判断用户提问的次数,在用户第一次提问这类问题时,由系统引导用户给出一个自身思考的答案,并随后播报正确答案。通过这样的方式,在交互中引入一个启发思考的环节。加强儿童产品中,儿童对一个问题的思考,提升儿童思维能力。
为了提升儿童思维能力,引导儿童对一个问题的思考,在一个实施例中,所述根据所述提问语音数据生成相对应的引导式反问数据包括:
根据所述提问语音数据的自然语言理解的处理结果进行简单化处理,提取所述提问语音数据的特征信息,并根据所述特征信息生产对应的简单问句;
当用户基于所述简单问句输入的回答语音正确时,根据所述特征信息生成难易程度更大的简单问句,直至所述简单问句为与所述提问语音数据完全对应的问句。
为了准确判断回答语音是否正确,在一个实施例中,所述判断所述回答语音是否正确包括:
根据语音识别算法对所述回答语音进行识别处理,生成对应的回答文本信息;
对所述回答文本信息进行分句处理,获取相应的用户语句;
计算所述用户语句与正确答案的相似度,并判断所述相似度是否超过相似度阈值;若在所述相似度超过相似度阈值,则所述回答语音正确;
若所述相似度未超过相似度阈值,则所述回答语音错误。
在一个实施例中,对于同一答案用户所表述的用户语句不尽相同,为了判断用户语句是否与正确答案相匹配,优选的技术方案是,所述计算所述用户语句与所述正确答案的相似度包括:
分别对所述用户语句和所述正确答案进行分词处理,获取对应的关键词集;
根据所述用户语句和所述正确答案的关键词集,计算所述用户语句与所述正确答案的相似度。
具体的,若所述相似度超过相似度阈值,则所述用户语句在正确答案的关键词集内,所述回答语音正确;若所述相似度未超过相似度阈值,则所述用户语句中未包括正确答案的关键词、或者用户语句中包括的正确答案的关键词数量不够,此时所述回答语音错误。
为了培养儿童独立思考的意识以及培养其独特的思维方式,在一个实施例中,当所述输入次数小于预设阈值时,在所述将所述答案数据反馈至用户之后,还包括:
根据所述用户的输入次数和所述回答语音对所述用户进行评分,并生成相对应的评分信息;
将所述评分信息转换为语音形式的评分信息,并播放所述语音形式的评分信息。
基于同样的发明构思,本发明实施例提供一种启发式语音交互装置,参见图2所示,包括:
获取请求模块201,用于获取用户输入的提问请求,所述提问请求包括提问语音和用户标识;
识别模块202,用于根据所述提问语音进行声纹识别,确定所述用户的用户年龄段;并根据所述提问语音进行语音识别,确定识别后的提问语音数据;
处理模块203,用于对所述提问语音数据进行自然语言理解处理,并根据自然语言理解的处理结果判断所述提问语音数据是否属于问答知识类;
获取答案模块204,用于当所述提问语音数据属于问答知识类时,根据知识问答图谱获取与所述提问语音数据相对应的答案数据;
第一判断模块205,用于根据所述用户标识判断所述用户输入相同的所述提问语音的输入次数,当所述输入次数不小于预设阈值时,将所述答案数据反馈至用户;
第二判断模块206,用于当所述输入次数小于预设阈值时,判断所述用户的用户年龄段与所述提问语音数据的难易属性是否相匹配;
引导模块207,用于当所述用户的用户年龄段与所述提问语音数据的难易属性相匹配时,根据所述提问语音数据生成相对应的引导式反问数据;
反馈模块208,用于接收用户基于所述引导式反问数据输入的回答语音,并判断所述回答语音是否正确,当所述回答语音正确时,将所述答案数据反馈至用户。
其中假设预设阈值为1,当根据所述用户标识判断所述用户输入相同的所述提问语音的输入次数,且所述输入次数≥1时(所述提问语音被所述用户提问过),将所述答案数据直接反馈给用户;当所述输入次数<1时(所述提问语音未被所述用户提问过),进一步判断用户年龄段与所述提问语音数据难易属性是否匹配,若匹配时,将所述提问语音数据生成相对应的引导式反问数据,所述用户对引导式反问数据进行回答并输入对应的回答语音,若回答语音正确则将答案数据反馈至用户。其中所述提问语音数据难易属性分为简单、一般以及困难三个等级,每个不同等级的属性对应不同的年龄段,比如1-10岁(简单)、10岁-18岁(一般),18岁以上(困难)等。
本实施例,着重于一种启发式语音交互装置,利用获取请求模块201对于获取用户输入的提问请求,通过识别模块202对用户输入的提问请求进行声纹识别,确定用户的年龄段,并通过语音识别确定识别后的提问语音数据,同时对提问语音数据进行自然语言理解处理,通过处理模块203判断提问语音数据所属类型,利用获取答案模块204根据知识问答图谱获取与所述提问语音数据相对应的数据数据,利用第一判断模块205判断用户提问的次数、第二判断模块206判断语音数据的难易属性,在用户第一次提问这类问题时,通过引导模块207由系统引导用户给出一个自身思考的答案,并通过反馈模块208随后播报正确答案。通过这样的方式,在交互中引入一个启发思考的环节。加强儿童产品中,儿童对一个问题的思考,提升儿童思维能力。
为了引导儿童对问题进行思考,培养一种面对复杂问题的思维方式,在一个实施例中,优选的,所述引导模块207包括:
简单化处理单元,用于根据所述提问语音数据的自然语言理解的处理结果进行简单化处理,提取所述提问语音数据的特征信息,并根据所述特征信息生产对应的简单问句;
循环处理单元,用于当用户基于所述简单问句输入的回答语音正确时,根据所述特征信息生成难易程度更大的简单问句,直至所述简单问句为与所述提问语音数据完全对应的问句。
为了准确判断用户语音信息是否正确,优选的,所述反馈模块208包括:
语音识别单元,用于根据语音识别算法对所述回答语音进行识别处理,生成对应的回答文本信息;
分句单元,用于对所述回答文本信息进行分句处理,获取相应的用户语句;
计算单元,用于计算所述用户语句与正确答案的相似度,并判断所述相似度是否超过相似度阈值;
处理单元,用于若在所述相似度超过相似度阈值,则所述回答语音正确;若所述相似度未超过相似度阈值,则所述回答语音错误。
在一个实施例中,对于同一答案用户所表述的用户语句不尽相同,为了判断用户语句是否与正确答案相匹配,优选的技术方案是,所述计算单元包括:
分词子单元,用于分别对所述用户语句和所述正确答案进行分词处理,获取对应的关键词集;
计算子单元,用于根据所述用户语句和所述正确答案的关键词集,计算所述用户语句与所述正确答案的相似度。
具体的,若所述相似度超过相似度阈值,则所述用户语句在正确答案的关键词集内,所述回答语音正确;若所述相似度未超过相似度阈值,则所述用户语句中未包括正确答案的关键词、或者用户语句中包括的正确答案的关键词数量不够,此时所述回答语音错误。
为了培养儿童独立思考的意识以及培养其独特的思维方式,在一个实施例中,在一个实施例中,所述的启发式语音交互装置,还包括评分模块和播放模块;
当所述输入次数小于预设阈值时,在所述反馈模块将所述答案数据反馈至用户之后,所述评分模块用于根据所述用户的输入次数和所述回答语音对所述用户进行评分,并生成相对应的评分信息;
所述播放模块用于将所述评分信息转换为语音形式的评分信息,并播放所述语音形式的评分信息。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
Claims (8)
1.一种启发式语音交互方法,其特征在于,包括:
获取用户输入的提问请求,所述提问请求包括提问语音和用户标识;
根据所述提问语音进行声纹识别,确定所述用户的用户年龄段;并根据所述提问语音进行语音识别,确定识别后的提问语音数据;
对所述提问语音数据进行自然语言理解处理,并根据自然语言理解的处理结果判断所述提问语音数据是否属于问答知识类;
当所述提问语音数据属于问答知识类时,根据知识问答图谱获取与所述提问语音数据相对应的答案数据;
根据所述用户标识判断所述用户输入相同的所述提问语音的输入次数,当所述输入次数不小于预设阈值时,将所述答案数据反馈至用户;
当所述输入次数小于预设阈值时,判断所述用户的用户年龄段与所述提问语音数据的难易属性是否相匹配;
当所述用户的用户年龄段与所述提问语音数据的难易属性相匹配时,根据所述提问语音数据生成相对应的引导式反问数据,包括:
根据所述提问语音数据的自然语言理解的处理结果进行简单化处理,提取所述提问语音数据的特征信息,并根据所述特征信息生产对应的简单问句;
当用户基于所述简单问句输入的回答语音正确时,根据所述特征信息生成难易程度更大的简单问句,直至所述简单问句为与所述提问语音数据完全对应的问句;
接收用户基于所述引导式反问数据输入的回答语音,并判断所述回答语音是否正确,当所述回答语音正确时,将所述答案数据反馈至用户。
2.如权利要求1所述的启发式语音交互方法,其特征在于,所述判断所述回答语音是否正确包括:
根据语音识别算法对所述回答语音进行识别处理,生成对应的回答文本信息;
对所述回答文本信息进行分句处理,获取相应的用户语句;
计算所述用户语句与正确答案的相似度,并判断所述相似度是否超过相似度阈值;若在所述相似度超过相似度阈值,则所述回答语音正确;
若所述相似度未超过相似度阈值,则所述回答语音错误。
3.如权利要求2所述的启发式语音交互方法,其特征在于,所述计算所述用户语句与所述正确答案的相似度包括:
分别对所述用户语句和所述正确答案进行分词处理,获取对应的关键词集;
根据所述用户语句和所述正确答案的关键词集,计算所述用户语句与所述正确答案的相似度。
4.如权利要求1所述的启发式语音交互方法,其特征在于,当所述输入次数小于预设阈值时,在所述将所述答案数据反馈至用户之后,还包括:
根据所述用户的输入次数和所述回答语音对所述用户进行评分,并生成相对应的评分信息;
将所述评分信息转换为语音形式的评分信息,并播放所述语音形式的评分信息。
5.一种启发式语音交互装置,其特征在于,包括:
获取请求模块,用于获取用户输入的提问请求,所述提问请求包括提问语音和用户标识;
识别模块,用于根据所述提问语音进行声纹识别,确定所述用户的用户年龄段;并根据所述提问语音进行语音识别,确定识别后的提问语音数据;
处理模块,用于对所述提问语音数据进行自然语言理解处理,并根据自然语言理解的处理结果判断所述提问语音数据是否属于问答知识类;
获取答案模块,用于当所述提问语音数据属于问答知识类时,根据知识问答图谱获取与所述提问语音数据相对应的答案数据;
第一判断模块,用于根据所述用户标识判断所述用户输入相同的所述提问语音的输入次数,当所述输入次数不小于预设阈值时,将所述答案数据反馈至用户;
第二判断模块,用于当所述输入次数小于预设阈值时,判断所述用户的用户年龄段与所述提问语音数据的难易属性是否相匹配;
引导模块,用于当所述用户的用户年龄段与所述提问语音数据的难易属性相匹配时,根据所述提问语音数据生成相对应的引导式反问数据,包括:
简单化处理单元,用于根据所述提问语音数据的自然语言理解的处理结果进行简单化处理,提取所述提问语音数据的特征信息,并根据所述特征信息生产对应的简单问句;
循环处理单元,用于当用户基于所述简单问句输入的回答语音正确时,根据所述特征信息生成难易程度更大的简单问句,直至所述简单问句为与所述提问语音数据完全对应的问句;
反馈模块,用于接收用户基于所述引导式反问数据输入的回答语音,并判断所述回答语音是否正确,当所述回答语音正确时,将所述答案数据反馈至用户。
6.如权利要求5所述的启发式语音交互装置,其特征在于,所述反馈模块包括:
语音识别单元,用于根据语音识别算法对所述回答语音进行识别处理,生成对应的回答文本信息;
分句单元,用于对所述回答文本信息进行分句处理,获取相应的用户语句;
计算单元,用于计算所述用户语句与正确答案的相似度,并判断所述相似度是否超过相似度阈值;
处理单元,用于若在所述相似度超过相似度阈值,则所述回答语音正确;若所述相似度未超过相似度阈值,则所述回答语音错误。
7.如权利要求6所述的启发式语音交互装置,其特征在于,所述计算单元包括:
分词子单元,用于分别对所述用户语句和所述正确答案进行分词处理,获取对应的关键词集;
计算子单元,用于根据所述用户语句和所述正确答案的关键词集,计算所述用户语句与所述正确答案的相似度。
8.如权利要求5所述的启发式语音交互装置,其特征在于,还包括评分模块和播放模块;
当所述输入次数小于预设阈值时,在所述反馈模块将所述答案数据反馈至用户之后,所述评分模块用于根据所述用户的输入次数和所述回答语音对所述用户进行评分,并生成相对应的评分信息;
所述播放模块用于将所述评分信息转换为语音形式的评分信息,并播放所述语音形式的评分信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810175225.9A CN108563627B (zh) | 2018-03-02 | 2018-03-02 | 启发式语音交互方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810175225.9A CN108563627B (zh) | 2018-03-02 | 2018-03-02 | 启发式语音交互方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108563627A CN108563627A (zh) | 2018-09-21 |
CN108563627B true CN108563627B (zh) | 2021-09-03 |
Family
ID=63531306
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810175225.9A Active CN108563627B (zh) | 2018-03-02 | 2018-03-02 | 启发式语音交互方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108563627B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109473101B (zh) * | 2018-12-20 | 2021-08-20 | 瑞芯微电子股份有限公司 | 一种差异化随机问答的语音芯片结构和方法 |
CN109725732B (zh) * | 2019-01-23 | 2022-03-25 | 广东小天才科技有限公司 | 一种知识点的查询方法及家教设备 |
CN110134235B (zh) * | 2019-04-25 | 2022-04-12 | 广州智伴人工智能科技有限公司 | 一种引导式互动的方法 |
CN110610627A (zh) * | 2019-09-29 | 2019-12-24 | 苏州思必驰信息科技有限公司 | 启发式诗词学习方法及装置 |
CN110837549B (zh) * | 2019-11-06 | 2023-08-11 | 腾讯科技(深圳)有限公司 | 一种信息处理方法、装置及存储介质 |
CN111368046B (zh) * | 2020-02-24 | 2021-07-16 | 北京百度网讯科技有限公司 | 人机对话方法、装置、电子设备及存储介质 |
CN112337081B (zh) * | 2020-10-27 | 2022-10-14 | 四川长虹电器股份有限公司 | 用于实现语音竞猜游戏的交互方法 |
CN113920794A (zh) * | 2021-09-09 | 2022-01-11 | 江西台德智慧科技有限公司 | 一种网络交互式教育的方法及智能系统 |
CN115964115B (zh) * | 2023-03-17 | 2023-06-02 | 中科航迈数控软件(深圳)有限公司 | 基于预训练强化学习的数控机床交互方法及相关设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105068661A (zh) * | 2015-09-07 | 2015-11-18 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机交互方法和系统 |
CN106409290A (zh) * | 2016-09-29 | 2017-02-15 | 深圳市唯特视科技有限公司 | 一种基于图像分析的幼儿智能语音教育的方法 |
CN107305769A (zh) * | 2016-04-20 | 2017-10-31 | 斑马网络技术有限公司 | 语音交互处理方法、装置、设备及操作系统 |
CN107656461A (zh) * | 2016-07-26 | 2018-02-02 | 青岛海尔洗衣机有限公司 | 一种基于用户年龄调节语音的方法及洗衣机 |
CN107728780A (zh) * | 2017-09-18 | 2018-02-23 | 北京光年无限科技有限公司 | 一种基于虚拟机器人的人机交互方法及装置 |
CN110610627A (zh) * | 2019-09-29 | 2019-12-24 | 苏州思必驰信息科技有限公司 | 启发式诗词学习方法及装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020013717A1 (en) * | 2000-12-28 | 2002-01-31 | Masahiro Ando | Exercise body monitor with functions to verify individual policy holder and wear of the same, and a business model for a discounted insurance premium for policy holder wearing the same |
US8249914B2 (en) * | 2002-12-27 | 2012-08-21 | Toshihiko Umeda | Service supporting system, service supporting server and service supporting method |
-
2018
- 2018-03-02 CN CN201810175225.9A patent/CN108563627B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105068661A (zh) * | 2015-09-07 | 2015-11-18 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机交互方法和系统 |
CN107305769A (zh) * | 2016-04-20 | 2017-10-31 | 斑马网络技术有限公司 | 语音交互处理方法、装置、设备及操作系统 |
CN107656461A (zh) * | 2016-07-26 | 2018-02-02 | 青岛海尔洗衣机有限公司 | 一种基于用户年龄调节语音的方法及洗衣机 |
CN106409290A (zh) * | 2016-09-29 | 2017-02-15 | 深圳市唯特视科技有限公司 | 一种基于图像分析的幼儿智能语音教育的方法 |
CN107728780A (zh) * | 2017-09-18 | 2018-02-23 | 北京光年无限科技有限公司 | 一种基于虚拟机器人的人机交互方法及装置 |
CN110610627A (zh) * | 2019-09-29 | 2019-12-24 | 苏州思必驰信息科技有限公司 | 启发式诗词学习方法及装置 |
Non-Patent Citations (2)
Title |
---|
"Speech interaction with a rat‘;Zhaohui Wu 等;《Chinese Science Bulletin》;20140722;第59卷(第28期);第3579-3584页 * |
"云终端语音交互中改进型谱减法语音增强算法";王平 等;《计算机集成制造系统》;20130715;第19卷(第7期);第1721-1728页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108563627A (zh) | 2018-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108563627B (zh) | 启发式语音交互方法及装置 | |
Litman et al. | Recognizing student emotions and attitudes on the basis of utterances in spoken tutoring dialogues with both human and computer tutors | |
CN107133303A (zh) | 用于输出信息的方法和装置 | |
CN105206284A (zh) | 疏导青少年心理压力的虚拟聊天方法与系统 | |
CN111415723A (zh) | 一种注意能力提升的个性化内容推荐系统 | |
CN109376360B (zh) | 一种辅助学习语言的方法和装置 | |
CN106558252B (zh) | 由计算机实现的口语练习方法及装置 | |
CN106909686A (zh) | 一种人机交互构建用户画像聚类计算方法 | |
Komatani et al. | User modeling in spoken dialogue systems to generate flexible guidance | |
CN110245253B (zh) | 一种基于环境信息的语义交互方法及系统 | |
CN110309509A (zh) | 一种语义知识库构建方法 | |
Wagner et al. | Applying cooperative machine learning to speed up the annotation of social signals in large multi-modal corpora | |
CN116524932A (zh) | 一种基于人工智能的智能语音交互系统及方法 | |
CN117615182B (zh) | 一种直播互动动态切换方法、系统及终端 | |
CN116401341A (zh) | 面向理解的互动答疑系统 | |
CN104572617A (zh) | 一种口语考试偏题检测方法及装置 | |
CN101739852B (zh) | 基于语音识别的实现自动口译训练的方法和装置 | |
Saunders et al. | Towards using prosody to scaffold lexical meaning in robots | |
CN117131166A (zh) | 一种基于大语言模型的自动出题方法和系统 | |
CN111178043A (zh) | 一种识别学术观点句的方法及系统 | |
CN111563697A (zh) | 一种线上课堂学生情绪分析方法和系统 | |
CN116403583A (zh) | 语音数据处理方法和装置、非易失性存储介质及车辆 | |
CN114241835B (zh) | 一种学生口语质量评测方法和设备 | |
Chughtai et al. | A lecture centric automated distractor generation for post-graduate software engineering courses | |
Vanel et al. | A Survey of Socio-Emotional Strategies for Generation-Based Conversational Agents. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: Room 101, 1st floor, building 1, Xisanqi building materials City, Haidian District, Beijing 100096 Applicant after: Yunzhisheng Intelligent Technology Co.,Ltd. Address before: 12 / F, Guanjie building, building 1, No. 16, Taiyanggong Middle Road, Chaoyang District, Beijing Applicant before: BEIJING UNISOUND INFORMATION TECHNOLOGY Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |