CN107545029A - 智能设备的语音反馈方法、设备及可读介质 - Google Patents

智能设备的语音反馈方法、设备及可读介质 Download PDF

Info

Publication number
CN107545029A
CN107545029A CN201710581343.5A CN201710581343A CN107545029A CN 107545029 A CN107545029 A CN 107545029A CN 201710581343 A CN201710581343 A CN 201710581343A CN 107545029 A CN107545029 A CN 107545029A
Authority
CN
China
Prior art keywords
word speed
speech polling
feedback information
voice
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710581343.5A
Other languages
English (en)
Inventor
王禹
谢波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201710581343.5A priority Critical patent/CN107545029A/zh
Publication of CN107545029A publication Critical patent/CN107545029A/zh
Pending legal-status Critical Current

Links

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

本发明提供一种智能设备的语音反馈方法、设备及可读介质。其方法包括:获取用户输入的语音查询的语速;根据语音查询的语速、语音查询的查询结果和预设的至少两种反馈模板,生成符合语速需求的语音反馈信息;向用户反馈语音反馈信息。本发明的技术方案,与现有技术相比,可以设置至少两种反馈模板,以根据语音查询的语速、语音查询的查询结果和预设的至少两种反馈模板,生成符合语速需求的语音反馈信息,对于用户的各种语速,均可以生成的对应的语音反馈信息,生成的语音反馈信息非常灵活,还能够有效地提高用户的使用体验度。而且本发明的技术方案,能够基于对语速的检测,生成符合语速需求的语音反馈信息,可以进一步地增强智能设备的智能感。

Description

智能设备的语音反馈方法、设备及可读介质
【技术领域】
本发明涉及计算机应用技术领域,尤其涉及一种智能设备的语音反馈方法、设备及可读介质。
【背景技术】
随着科技的发展,智能设备的出现,极大地方便了人们的生活。
例如,现有的很多智能设备可以支持用户的语音输入,并根据用户语音输入的查询(Query),查询Query对应的结果,并根据查询结果生成Query的反馈信息,并将反馈信息进行从文本到语音(TextToSpeech;TTS)的转换,最后向用户反馈的语音反馈信息。例如,现有的智能化的移动终端以及智能音箱等等智能设备,都支持用户的语音输入Query。且现有技术中,智能设备存储有每种Query对应的反馈模板,智能设备可以将获取的查询结果填充至该Query对应的反馈模板中,生成该Query的反馈信息。例如,对于“今天天气怎么样”的类似Query,对应的反馈信息可以为“今天天气(晴朗),白天高温(35)度,夜间低温(22)度,天气有些(热),注意(防晒)哦”。其中括号之外的可以认为是反馈模板的内容,括号内的信息可以为根据Query的查询结果。
现有技术中,每种Query的反馈模板是单一的,包括的内容也非常详细,这样生成的Query的反馈信息必然包括非常丰富的内容。无论用户在语音请求Query时是否着急,智能设备均按照现有的方式生成固定形式的、包括丰富内容的Query的反馈信息,向用户反馈,因此,现有技术的智能设备对语音Query的反馈信息的非常死板,会影响用户的使用体验。
【发明内容】
本发明提供了一种智能设备的语音反馈方法、设备及可读介质,用于提高语音Query反馈信息的灵活性。
本发明提供一种智能设备的语音反馈方法,所述方法包括:
获取用户输入的语音查询的语速;
根据所述语音查询的语速、所述语音查询的查询结果和预设的至少两种反馈模板,生成符合所述语速需求的语音反馈信息;
向所述用户反馈所述语音反馈信息。
进一步可选地,如上所述的方法中,根据所述语音查询的语速、所述语音查询的查询结果和预设的至少两种反馈模板,生成符合所述语速需求的语音反馈信息,具体包括:
根据所述语音查询的语速、所述语音查询的查询结果和预设的至少两种反馈模板,生成符合所述语速需求的反馈信息;
将所述反馈信息进行从文本到语音的转换,得到所述语音反馈信息。
进一步可选地,如上所述的方法中,根据所述语音查询的语速、所述语音查询的查询结果和预设的至少两种反馈模板,生成符合所述语速需求的反馈信息,具体包括:
判断所述语音查询的语速是否大于或者等于第一预设语速阈值;
若是,将所述语音查询的查询结果填充至第一反馈模板中,生成简洁话术的反馈信息。
进一步可选地,如上所述的方法中,根据所述语音查询的语速、所述语音查询的查询结果和预设的至少两种反馈模板,生成符合所述语速需求的反馈信息,具体还包括:
判断所述语音查询的语速是否小于第二预设语速阈值;所述第一预设语速阈值大于或者等于所述第二预设语速阈值;
若是,将所述语音查询的查询结果填充至第二反馈模板中,生成普通话术的反馈信息。
进一步可选地,如上所述的方法中,获取用户输入的语音查询的语速,具体包括:
获取对所述用户输入的所述语音查询的语音识别结果中包括的文字的数量;
获取对所述用户输入的所述语音查询的识别耗时;
根据所述文字的数量和所述识别耗时,计算所述用户输入所述语音查询的语速。
进一步可选地,如上所述的方法中,根据所述语音查询的语速、所述语音查询的查询结果和预设的至少两种反馈模板,生成语音反馈信息之前,所述方法还包括:
接收所述用户输入的语音查询;
对所述语音查询进行语音识别和语义解析,得到语义解析结果;
根据所述语义解析结果查询对应的所述查询结果。
本发明提供一种智能设备,所述设备包括:
语速获取模块,用于获取用户输入的语音查询的语速;
语音反馈信息生成模块,用于根据所述语音查询的语速、所述语音查询的查询结果和预设的至少两种反馈模板,生成符合所述语速需求的语音反馈信息;
反馈模块,用于向所述用户反馈所述语音反馈信息。
进一步可选地,如上所述的设备中,所述语音反馈信息生成模块,包括:
反馈信息生成单元,用于根据所述语音查询的语速、所述语音查询的查询结果和预设的至少两种反馈模板,生成符合所述语速需求的反馈信息;
语音转换单元,用于将所述反馈信息进行从文本到语音的转换,得到所述语音反馈信息。
进一步可选地,如上所述的设备中,所述反馈信息生成单元,具体用于:
判断所述语音查询的语速是否大于或者等于第一预设语速阈值;
若是,将所述语音查询的查询结果填充至第一反馈模板中,生成简洁话术的反馈信息。
进一步可选地,如上所述的设备中,所述反馈信息生成单元,具体还用于:
判断所述语音查询的语速是否小于第二预设语速阈值;所述第一预设语速阈值大于或者等于所述第二预设语速阈值;
若是,将所述语音查询的查询结果填充至第二反馈模板中,生成普通话术的反馈信息。
进一步可选地,如上所述的设备中,所述语速获取模块,具体用于:
获取对所述用户输入的所述语音查询的语音识别结果中包括的文字的数量;
获取对所述用户输入的所述语音查询的识别耗时;
根据所述文字的数量和所述识别耗时,计算所述用户输入所述语音查询的语速。
进一步可选地,如上所述的设备中,所述设备还包括:
接收模块,用于接收所述用户输入的语音查询;
识别与解析模块,用于对所述语音查询进行语音识别和语义解析,得到语义解析结果;
查询模块,用于根据所述语义解析结果查询对应的所述查询结果。
本发明还提供一种智能设备,包括麦克风,用于接收用户输入的语音查询,并向用户反馈根据所述语音查询获取的语音反馈信息;所述设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的智能设备的语音反馈方法。
本发明还提供一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的智能设备的语音反馈方法。
本发明的智能设备的语音反馈方法、设备及可读介质,通过获取用户输入的语音查询的语速;根据语音查询的语速、语音查询的查询结果和预设的至少两种反馈模板,生成符合语速需求的语音反馈信息;向用户反馈语音反馈信息。本发明的技术方案,与现有技术相比,可以设置至少两种反馈模板,以根据语音查询的语速、语音查询的查询结果和预设的至少两种反馈模板,生成符合语速需求的语音反馈信息,对于用户的各种语速,均可以生成的对应的语音反馈信息,生成的语音反馈信息非常灵活,还能够有效地提高用户的使用体验度。而且本发明的技术方案,能够基于对语速的检测,生成符合语速需求的语音反馈信息,可以进一步地增强智能设备的智能感。
【附图说明】
图1为本发明的智能设备的语音反馈方法实施例的流程图。
图2为本发明的智能设备的语音反馈方法的示例图。
图3为本发明的智能设备实施例一的结构图。
图4为本发明的智能设备实施例二的结构图。
图5为本发明的计算机设备实施例的结构图。
图6为本发明提供的一种计算机设备的示例图。
【具体实施方式】
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
图1为本发明的智能设备的语音反馈方法实施例的流程图。如图1所示,本实施例的智能设备的语音反馈方法,具体可以包括如下步骤:
100、获取用户输入的语音查询的语速;
本实施例的智能设备的语音反馈方法的执行主体可以为智能设备。本实施例的智能设备可以为智能移动终端或者智能音箱等等。其中智能移动终端较为常见,本实施例的智能移动终端在现有的移动终端的基础上,增加语音查询的功能,能够对语音的Query进行语音识别、语义解析、内容服务、话术生成、语音TTS播报反馈等功能,实现查音乐、查天气、聊天、对话等等。
智能音箱为近两年涌入市场的一种智能设备,智能音箱与普通音箱的区别在于:普通音箱仅能够播放信号传输过来的内容。而智能音箱设置有处理器,具有连网的功能,同智能移动终端具有类似的功能,也能够查音乐、查天气、聊天、对话等等,因此智能音箱也需要具有语音识别、语义解析、内容服务、话术生成、语音TTS播报反馈等功能。
首先,本实施例的智能设备需要获取用户输入的语音查询的语速。也就是说,该步骤100之前,智能设备需要接收用户输入的语音Query,并基于该语音Query进行自动语音识别(Automatic Speech Recognition;ASR),该ASR过程主要采用设置在智能设备中的解码器来实现,将用户输入的语音Query识别为文字形式的query。本实施例的获取用户输入的语音查询的语速,可以在ASR的过程中获取。例如,可以具体包括:获取对用户输入的语音查询的语音识别结果中包括的文字的数量;获取对用户输入的语音查询的识别耗时;根据文字的数量和识别耗时,计算用户输入的语音查询的语速。由于ASR过程中,将用户的语音Query识别为文字形式的Query即为语音识别结果,该语音识别结果中包括的文字的数量很容易统计出来。在解码器工作正常以及用户与智能设备之间距离较近的情况下,对用户输入的语音Query的识别耗时仅与用户输入的语音Query的时间长度有关。用户输入的语音Query的时间长度越长,对应地对该语音Query的识别耗时就越长,可以表示用户此时语速较为正常,处于不紧不慢的状态,情绪状态较为正常。而若用户输入的语音Query的时间长度越短,对应地对该语音Query的识别耗时就越短,可以表示用户此时语速较快,处于较为着急的状态,情绪状态较为不耐烦,有些着急。该识别耗时可以通过语音端点检测的方式获取到,例如识别耗时等于VAD检测到的语音尾点时间减去检测到的语音起点时间。用户输入语音Query的语速等于文字的数量除以识别耗时,即用户输入的语音Query为每秒多少个字。
本实施例中,用户与智能设备之间的智能对话的语音query基本都能在一句话内表达完毕,所以不存在用户表达时的中间停顿造成时长虚含停顿,因此,本实施例中基于耗时和字数的比值的语速统计是可靠的。
101、根据语音查询的语速、语音查询的查询结果和预设的至少两种反馈模板,生成符合语速需求的语音反馈信息;
102、向用户反馈语音反馈信息。
可选地,本实施例中该步骤101之前,需要包括:接收用户输入的语音Query;对语音Query进行语音识别和语义解析,得到语义解析结果;根据语义解析结果查询对应的查询结果。这样,用户才可以获取到查询Query对应的查询结果,但是该查询结果并不是要最终反馈给用户的,这里的查询结果是包括所有查询Query的结果信息,本实施例中,还需要进一步结合语音Query的语速以及预设的至少两种反馈模板,才可以生成符合语速需求的语音反馈信息。
本实施例中,对于同一种语音Query,可以预先设置至少两种符合不同语速的反馈模板,以满足不同语速的需求。例如对于语速非常快的语音Query,此时可以感知用户的情绪是非常着急,此时可以设置具有简洁话术的反馈模板,仅包括语音Query的主要结果信息即可。而对于语速较为正常的语音Query,此时可以感知用户的情绪较为一般,不慌不急,此时可以设置正常话术的反馈模板,在该反馈模板中不仅包括语音Query的主要结果信息,还可以进一步为用户提供注意事项。例如,对于“今天天气怎么样”的语音Query,若设置两种反馈模板,可以生成符合语速需求的两种语音反馈信息。第一种普通话术的语音反馈信息可以为:今天天气(晴朗),白天高温(35)度,夜间低温(22)度,天气有些(热),注意(防晒)哦,括号内的信息可以为根据语音Query的查询结果在反馈模板中填写的信息。第二种简洁话术的语音反馈信息可以为:(晴朗),(22)到(35)度,同理,括号内的信息为根据语音Query的查询结果在反馈模板中填写的信息。
例如,图2为本发明的智能设备的语音反馈方法的示例图。如图2所示,介绍同一语音Query的两种不同语速(speed;spd)所生成的语音反馈信息。整个过程可以分为三个阶段,第一阶段在ASR中检测用户输入的语音Query的spd,如图2所示,前一种语音Query的识别耗时为5s,spd为1.4。后一种语音Query的识别耗时为3s,spd为2.3。第二阶段可以自然语言理解(Natural Language Understanding;NLU)模块中进行,主要进行语速情绪分析、意图解析以及话术生成。不用的语速代表不同的情绪,语速快了,情绪较为着急,可以解析得知用户的意图希望是简洁的回答,此时生成简洁话术的反馈信息即可;而语速慢了,情绪一般,可以解析得知用户的意图希望是完整全面的回答,此时生成正常话术的反馈信息,可以包括较为丰富的内容。
本实施例中,获取用户输入的语音Query的语速,实质上为一种对用户的情绪分析的过程,可以通过设定至少一个语速快慢门限来分析用户的情绪。若语速快慢门限只有一个,大于该门限值则语速快,小于该语速快慢门限值则语速正常。若语速快慢门限有两个或以上,可以对用户的情绪分为多档,生成多种简洁到复杂版本的话术的反馈信息。
其中,简洁话术的核心是给出最关键的信息点,去掉一切冗余,直达用户所需,举例如下:
A1
-今天天气怎么样?【正常语速】
-今天天气晴朗,白天高温35度,夜间低温22度。
A2
-今天天气怎么样【快语速】
-晴朗,22到35度。
B1
-今天星期几【正常语速】
-今天是星期二,2017年7月4号。
B2
-今天星期几【快语速】
-星期二。
C1
-现在几点了【正常语速】
-现在是14点05分
C2
-现在几点了【快语速】
-14点05分
通过采用上述方式,最终得到的语音反馈信息可以与用户输入语音Query的语速相匹配,用户在输入语音Query的时候越着急,相应的返回的语音反馈信息可以越简洁,可以有效地提高用户的使用体验度。
例如,可选地,步骤101“根据语音查询的语速、语音查询的查询结果和预设的至少两种反馈模板,生成符合语速需求的语音反馈信息”,具体可以包括:根据语音查询的语速、语音查询的查询结果和预设的至少两种反馈模板,生成符合语速需求的反馈信息;将反馈信息进行TTS转换,得到语音反馈信息。
其中“根据语音查询的语速、语音查询的查询结果和预设的至少两种反馈模板,生成符合语速需求的反馈信息”,具体可以包括如下步骤:
(a1)判断语音查询的语速是否大于或者等于第一预设语速阈值;若是,执行步骤(a2);否则,执行步骤(a3);
(a2)将语音查询的查询结果填充至第一反馈模板中,生成简洁话术的反馈信息;
(a3)判断语音查询的语速是否小于第二预设语速阈值;若是,执行步骤(a4);
(a4)将语音查询的查询结果填充至第二反馈模板中,生成普通话术的反馈信息。
本实施例中,若第一预设语速阈值等于第二预设语速阈值,此时对应可以设置两个反馈模板,对应可以生成两种反馈信息,如生成普通话术的反馈信息和简洁话术的反馈信息。其中普通话术是相对于简洁话术而言,普通话术比简洁话术稍微详细一些,包括的内容更丰富,文字更多。而若第一预设语速阈值大于第二预设语速阈值,则还可以存在大于第二预设语速阈值且小于第一预设语速阈值的一个范围,还可以设置一个反馈模板,对应生成的话术简洁程度位于上述的普通话术和简洁话术之间。实际应用中,按照上述方式,对于同一语音Query,可以设置满足不同语速需求的多种反馈模板,生成多种话术版本的语音反馈信息。
本实施例的智能设备的语音反馈方法,通过获取用户输入的语音查询的语速;根据语音查询的语速、语音查询的查询结果和预设的至少两种反馈模板,生成符合语速需求的语音反馈信息;向用户反馈语音反馈信息。本实施例的技术方案,与现有技术相比,可以设置至少两种反馈模板,以根据语音查询的语速、语音查询的查询结果和预设的至少两种反馈模板,生成符合语速需求的语音反馈信息,对于用户的各种语速,均可以生成的对应的语音反馈信息,生成的语音反馈信息非常灵活,还能够有效地提高用户的使用体验度。而且本实施例的技术方案,能够基于对语速的检测,生成符合语速需求的语音反馈信息,可以进一步地增强智能设备的智能感。
图3为本发明的智能设备实施例一的结构图。如图3所示,本实施例的智能设备,具体可以包括:语速获取模块10、语音反馈信息生成模块11和反馈模块12。
其中语速获取模块10用于获取用户输入的语音查询的语速;
语音反馈信息生成模块11用于根据语速获取模块10获取的语音查询的语速、语音查询的查询结果和预设的至少两种反馈模板,生成符合语速需求的语音反馈信息;
反馈模块12用于向用户反馈语音反馈信息生成模块11生成的语音反馈信息。
本实施例的智能设备,通过采用上述模块实现智能设备的语音反馈的实现原理以及技术效果与上述相关方法实施例的实现相同,详细可以参考上述相关方法实施例的记载,在此不再赘述。
图4为本发明的智能设备实施例二的结构图。本实施例的智能设备在上述图3所示实施例的技术方案的基础上,进一步包括如下技术方案。
如图4所示,本实施例的智能设备中,语音反馈信息生成模块11具体可以包括:
反馈信息生成单元111用于根据语速获取模块10获取的语音查询的语速、语音查询的查询结果和预设的至少两种反馈模板,生成符合语速需求的反馈信息;
语音转换单元112用于将反馈信息生成单元111生成的反馈信息进行从文本到语音的转换,得到语音反馈信息。
对应地,反馈模块12用于向用户反馈语音转换单元112生成的语音反馈信息。
进一步可选地,本实施例的智能设备中,反馈信息生成单元111具体用于:
判断语速获取模块10获取的语音查询的语速是否大于或者等于第一预设语速阈值;
若是,将语音查询的查询结果填充至第一反馈模板中,生成简洁话术的反馈信息。
进一步可选地,本实施例的智能设备中,反馈信息生成单元111具体还用于:
判断语速获取模块10获取的语音查询的语速是否小于第二预设语速阈值;第一预设语速阈值大于或者等于第二预设语速阈值;
若是,将语音查询的查询结果填充至第二反馈模板中,生成普通话术的反馈信息。
进一步可选地,本实施例的智能设备中,语速获取模块10具体用于:
获取对用户输入的语音查询的语音识别结果中包括的文字的数量;
获取对用户输入的语音查询的识别耗时;
根据文字的数量和识别耗时,计算用户输入的语音查询的语速。
进一步可选地,如图4所示,本实施例的智能设备中,还包括:
接收模块13用于接收用户输入的语音查询;对应地,语速获取模块10用于获取接收模块13接收的用户输入的语音查询的语速。
识别与解析模块14用于对接收模块13接收的语音查询进行语音识别和语义解析,得到语义解析结果;
查询模块15用于根据识别与解析模块14得到的语义解析结果查询对应的查询结果。
本实施例的智能设备,通过采用上述模块实现智能设备的语音反馈的实现原理以及技术效果与上述相关方法实施例的实现相同,详细可以参考上述相关方法实施例的记载,在此不再赘述。
图5为本发明的智能设备实施例的结构图。如图5所示,本实施例的智能设备,包括:一个或多个处理器30,以及存储器40,存储器40用于存储一个或多个程序,当存储器40中存储的一个或多个程序被一个或多个处理器30执行,使得一个或多个处理器30实现如上图1-图3所示实施例的智能设备的语音反馈方法。图5所示实施例中以包括多个处理器30为例。如图5所示,本实施例的智能设备还包括麦克风(图中未示出),用于接收用户输入的语音查询,并向用户反馈根据语音查询获取的语音反馈信息。该麦克风可以与智能设备为一体化结构,也可以作为外接附件配合智能设备工作。可选地,本实施例的智能设备还可以包括其他硬件,在此不再一一举例。本实施例的智能设备可以为智能终端、智能音箱,或者还可以为其他的能够支持语音查询的大型或者小型的智能设备。
例如,图6为本发明提供的一种智能设备的示例图。图6示出了适于用来实现本发明实施方式的示例性智能设备12a的框图。图6显示的智能设备12a仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,本实施例的智能设备12a以通用计算设备的形式表现,例如可以为一个较为大型的具有类似于计算机外形的设备。智能设备12a的组件可以包括但不限于:一个或者多个处理器16a,系统存储器28a,连接不同系统组件(包括系统存储器28a和处理器16a)的总线18a。
总线18a表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
智能设备12a典型地包括多种计算机系统可读介质。这些介质可以是任何能够被智能设备12a访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28a可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30a和/或高速缓存存储器32a。智能设备12a可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34a可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18a相连。系统存储器28a可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明上述图1-图4各实施例的功能。
具有一组(至少一个)程序模块42a的程序/实用工具40a,可以存储在例如系统存储器28a中,这样的程序模块42a包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42a通常执行本发明所描述的上述图1-图4各实施例中的功能和/或方法。
智能设备12a也可以与一个或多个外部设备14a(例如键盘、指向设备、显示器24a等)通信,还可与一个或者多个使得用户能与该智能设备12a交互的设备通信,和/或与使得该智能设备12a能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22a进行。并且,智能设备12a还可以通过网络适配器20a与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20a通过总线18a与智能设备12a的其它模块通信。应当明白,尽管图中未示出,可以结合智能设备12a使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。例如,本实施例的智能设备12a的外部设备14a还可以包括麦克风,用于接收用户输入的语音查询,并向用户反馈根据语音查询获取的语音反馈信息。可选地,本实施例的智能设备12a的麦克风也可以嵌入在智能设备12a内。
处理器16a通过运行存储在系统存储器28a中的程序,从而执行各种功能应用以及数据处理,例如实现上述实施例所示的智能设备的语音反馈方法。
本实施例的智能设备12a还可以包括解码器,用于对语音查询进行语音识别,还可以包括语义解析模块,还可以包括上网模块,以从互联网上查询语音查询对应的查询结果,还可以包括实现其他功能的硬件模块,在此不再一一举例赘述。
本发明还提供一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例所示的智能设备的语音反馈方法。
本实施例的计算机可读介质可以包括上述图6所示实施例中的系统存储器28a中的RAM30a、和/或高速缓存存储器32a、和/或存储系统34a。
随着科技的发展,计算机程序的传播途径不再受限于有形介质,还可以直接从网络下载,或者采用其他方式获取。因此,本实施例中的计算机可读介质不仅可以包括有形的介质,还可以包括无形的介质。
本实施例的计算机可读介质可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (14)

1.一种智能设备的语音反馈方法,其特征在于,所述方法包括:
获取用户输入的语音查询的语速;
根据所述语音查询的语速、所述语音查询的查询结果和预设的至少两种反馈模板,生成符合所述语速需求的语音反馈信息;
向所述用户反馈所述语音反馈信息。
2.根据权利要求1所述的方法,其特征在于,根据所述语音查询的语速、所述语音查询的查询结果和预设的至少两种反馈模板,生成符合所述语速需求的语音反馈信息,具体包括:
根据所述语音查询的语速、所述语音查询的查询结果和预设的至少两种反馈模板,生成符合所述语速需求的反馈信息;
将所述反馈信息进行从文本到语音的转换,得到所述语音反馈信息。
3.根据权利要求2所述的方法,其特征在于,根据所述语音查询的语速、所述语音查询的查询结果和预设的至少两种反馈模板,生成符合所述语速需求的反馈信息,具体包括:
判断所述语音查询的语速是否大于或者等于第一预设语速阈值;
若是,将所述语音查询的查询结果填充至第一反馈模板中,生成简洁话术的反馈信息。
4.根据权利要求3所述的方法,其特征在于,根据所述语音查询的语速、所述语音查询的查询结果和预设的至少两种反馈模板,生成符合所述语速需求的反馈信息,具体还包括:
判断所述语音查询的语速是否小于第二预设语速阈值;所述第一预设语速阈值大于或者等于所述第二预设语速阈值;
若是,将所述语音查询的查询结果填充至第二反馈模板中,生成普通话术的反馈信息。
5.根据权利要求1-4任一所述的方法,其特征在于,获取用户输入的语音查询的语速,具体包括:
获取对所述用户输入的所述语音查询的语音识别结果中包括的文字的数量;
获取对所述用户输入的所述语音查询的识别耗时;
根据所述文字的数量和所述识别耗时,计算所述用户输入所述语音查询的语速。
6.根据权利要求5所述的方法,其特征在于,根据所述语音查询的语速、所述语音查询的查询结果和预设的至少两种反馈模板,生成语音反馈信息之前,所述方法还包括:
接收所述用户输入的语音查询;
对所述语音查询进行语音识别和语义解析,得到语义解析结果;
根据所述语义解析结果查询对应的所述查询结果。
7.一种智能设备,其特征在于,所述设备包括:
语速获取模块,用于获取用户输入的语音查询的语速;
语音反馈信息生成模块,用于根据所述语音查询的语速、所述语音查询的查询结果和预设的至少两种反馈模板,生成符合所述语速需求的语音反馈信息;
反馈模块,用于向所述用户反馈所述语音反馈信息。
8.根据权利要求7所述的设备,其特征在于,所述语音反馈信息生成模块,包括:
反馈信息生成单元,用于根据所述语音查询的语速、所述语音查询的查询结果和预设的至少两种反馈模板,生成符合所述语速需求的反馈信息;
语音转换单元,用于将所述反馈信息进行从文本到语音的转换,得到所述语音反馈信息。
9.根据权利要求8所述的设备,其特征在于,所述反馈信息生成单元,具体用于:
判断所述语音查询的语速是否大于或者等于第一预设语速阈值;
若是,将所述语音查询的查询结果填充至第一反馈模板中,生成简洁话术的反馈信息。
10.根据权利要求9所述的设备,其特征在于,所述反馈信息生成单元,具体还用于:
判断所述语音查询的语速是否小于第二预设语速阈值;所述第一预设语速阈值大于或者等于所述第二预设语速阈值;
若是,将所述语音查询的查询结果填充至第二反馈模板中,生成普通话术的反馈信息。
11.根据权利要求7-10任一所述的设备,其特征在于,所述语速获取模块,具体用于:
获取对所述用户输入的所述语音查询的语音识别结果中包括的文字的数量;
获取对所述用户输入的所述语音查询的识别耗时;
根据所述文字的数量和所述识别耗时,计算所述用户输入所述语音查询的语速。
12.根据权利要求11所述的设备,其特征在于,所述设备还包括:
接收模块,用于接收所述用户输入的语音查询;
识别与解析模块,用于对所述语音查询进行语音识别和语义解析,得到语义解析结果;
查询模块,用于根据所述语义解析结果查询对应的所述查询结果。
13.一种智能设备,包括麦克风,用于接收用户输入的语音查询,并向用户反馈根据所述语音查询获取的语音反馈信息;其特征在于,所述设备还包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的方法。
14.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的方法。
CN201710581343.5A 2017-07-17 2017-07-17 智能设备的语音反馈方法、设备及可读介质 Pending CN107545029A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710581343.5A CN107545029A (zh) 2017-07-17 2017-07-17 智能设备的语音反馈方法、设备及可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710581343.5A CN107545029A (zh) 2017-07-17 2017-07-17 智能设备的语音反馈方法、设备及可读介质

Publications (1)

Publication Number Publication Date
CN107545029A true CN107545029A (zh) 2018-01-05

Family

ID=60970193

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710581343.5A Pending CN107545029A (zh) 2017-07-17 2017-07-17 智能设备的语音反馈方法、设备及可读介质

Country Status (1)

Country Link
CN (1) CN107545029A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108563633A (zh) * 2018-03-29 2018-09-21 腾讯科技(深圳)有限公司 一种语音处理方法和服务器
CN109033257A (zh) * 2018-07-06 2018-12-18 中国平安人寿保险股份有限公司 话术推荐方法、装置、计算机设备和存储介质
CN109348068A (zh) * 2018-12-03 2019-02-15 咪咕数字传媒有限公司 一种信息处理方法、装置及存储介质
CN109389967A (zh) * 2018-09-04 2019-02-26 深圳壹账通智能科技有限公司 语音播报方法、装置、计算机设备及存储介质
CN109413277A (zh) * 2018-11-20 2019-03-01 维沃移动通信有限公司 一种语音输出方法及终端设备
CN109640164A (zh) * 2018-11-02 2019-04-16 重庆爱奇艺智能科技有限公司 一种用于多个虚拟现实设备间的播放方法与装置
CN109686366A (zh) * 2018-12-12 2019-04-26 珠海格力电器股份有限公司 语音播报方法和装置
CN109697290A (zh) * 2018-12-29 2019-04-30 咪咕数字传媒有限公司 一种信息处理方法、设备及计算机存储介质
CN109726277A (zh) * 2018-12-30 2019-05-07 联想(北京)有限公司 一种数据处理方法及装置
CN110085225A (zh) * 2019-04-24 2019-08-02 北京百度网讯科技有限公司 语音交互方法、装置、智能机器人及计算机可读存储介质
CN111724774A (zh) * 2019-03-22 2020-09-29 阿里巴巴集团控股有限公司 语音交互及车载语音交互方法、装置、设备及存储介质
CN112349299A (zh) * 2020-10-28 2021-02-09 维沃移动通信有限公司 语音播放方法、装置及电子设备
CN113035181A (zh) * 2019-12-09 2021-06-25 斑马智行网络(香港)有限公司 语音数据处理方法、设备和系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7996226B2 (en) * 2005-09-27 2011-08-09 AT&T Intellecutal Property II, L.P. System and method of developing a TTS voice
CN104123938A (zh) * 2013-04-29 2014-10-29 富泰华工业(深圳)有限公司 语音控制系统、电子装置及语音控制方法
CN105279259A (zh) * 2015-10-21 2016-01-27 无锡天脉聚源传媒科技有限公司 一种搜索结果的确定方法及装置
CN105654950A (zh) * 2016-01-28 2016-06-08 百度在线网络技术(北京)有限公司 自适应语音反馈方法和装置
CN105739688A (zh) * 2016-01-21 2016-07-06 北京光年无限科技有限公司 一种基于情感体系的人机交互方法、装置和交互系统
CN106486121A (zh) * 2016-10-28 2017-03-08 北京光年无限科技有限公司 应用于智能机器人的语音优化方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7996226B2 (en) * 2005-09-27 2011-08-09 AT&T Intellecutal Property II, L.P. System and method of developing a TTS voice
CN104123938A (zh) * 2013-04-29 2014-10-29 富泰华工业(深圳)有限公司 语音控制系统、电子装置及语音控制方法
CN105279259A (zh) * 2015-10-21 2016-01-27 无锡天脉聚源传媒科技有限公司 一种搜索结果的确定方法及装置
CN105739688A (zh) * 2016-01-21 2016-07-06 北京光年无限科技有限公司 一种基于情感体系的人机交互方法、装置和交互系统
CN105654950A (zh) * 2016-01-28 2016-06-08 百度在线网络技术(北京)有限公司 自适应语音反馈方法和装置
CN106486121A (zh) * 2016-10-28 2017-03-08 北京光年无限科技有限公司 应用于智能机器人的语音优化方法及装置

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108563633B (zh) * 2018-03-29 2021-05-14 腾讯科技(深圳)有限公司 一种语音处理方法和服务器
CN108563633A (zh) * 2018-03-29 2018-09-21 腾讯科技(深圳)有限公司 一种语音处理方法和服务器
CN109033257A (zh) * 2018-07-06 2018-12-18 中国平安人寿保险股份有限公司 话术推荐方法、装置、计算机设备和存储介质
CN109389967A (zh) * 2018-09-04 2019-02-26 深圳壹账通智能科技有限公司 语音播报方法、装置、计算机设备及存储介质
CN109640164A (zh) * 2018-11-02 2019-04-16 重庆爱奇艺智能科技有限公司 一种用于多个虚拟现实设备间的播放方法与装置
CN109413277A (zh) * 2018-11-20 2019-03-01 维沃移动通信有限公司 一种语音输出方法及终端设备
CN109348068A (zh) * 2018-12-03 2019-02-15 咪咕数字传媒有限公司 一种信息处理方法、装置及存储介质
CN109686366A (zh) * 2018-12-12 2019-04-26 珠海格力电器股份有限公司 语音播报方法和装置
CN109697290A (zh) * 2018-12-29 2019-04-30 咪咕数字传媒有限公司 一种信息处理方法、设备及计算机存储介质
CN109726277A (zh) * 2018-12-30 2019-05-07 联想(北京)有限公司 一种数据处理方法及装置
CN111724774A (zh) * 2019-03-22 2020-09-29 阿里巴巴集团控股有限公司 语音交互及车载语音交互方法、装置、设备及存储介质
CN111724774B (zh) * 2019-03-22 2024-05-17 斑马智行网络(香港)有限公司 语音交互及车载语音交互方法、装置、设备及存储介质
CN110085225A (zh) * 2019-04-24 2019-08-02 北京百度网讯科技有限公司 语音交互方法、装置、智能机器人及计算机可读存储介质
CN110085225B (zh) * 2019-04-24 2024-01-02 北京百度网讯科技有限公司 语音交互方法、装置、智能机器人及计算机可读存储介质
CN113035181A (zh) * 2019-12-09 2021-06-25 斑马智行网络(香港)有限公司 语音数据处理方法、设备和系统
CN112349299A (zh) * 2020-10-28 2021-02-09 维沃移动通信有限公司 语音播放方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN107545029A (zh) 智能设备的语音反馈方法、设备及可读介质
US10236001B2 (en) Passive enrollment method for speaker identification systems
CN110069608B (zh) 一种语音交互的方法、装置、设备和计算机存储介质
CN108877791B (zh) 基于视图的语音交互方法、装置、服务器、终端和介质
JP6848147B2 (ja) 音声インタラクション実現方法、装置、コンピュータデバイス及びプログラム
CN107622770A (zh) 语音唤醒方法及装置
EP2494473B1 (en) Transforming components of a web page to voice prompts
CN107507615A (zh) 界面智能交互控制方法、装置、系统及存储介质
CN110288980A (zh) 语音识别方法、模型的训练方法、装置、设备及存储介质
CN109754778A (zh) 文本的语音合成方法、装置和计算机设备
CN107562850A (zh) 音乐推荐方法、装置、设备及存储介质
CN107134279A (zh) 一种语音唤醒方法、装置、终端和存储介质
CN109036396A (zh) 一种第三方应用的交互方法及系统
CN105869446B (zh) 一种电子阅读装置和语音阅读加载方法
CN107193973A (zh) 语义解析信息的领域识别方法及装置、设备及可读介质
CN108597509A (zh) 智能语音交互实现方法、装置、计算机设备及存储介质
US10824664B2 (en) Method and apparatus for providing text push information responsive to a voice query request
CN108281138A (zh) 年龄判别模型训练及智能语音交互方法、设备及存储介质
CN108885869A (zh) 控制包含语音的音频数据的回放
CN108564944B (zh) 智能控制方法、系统、设备及存储介质
US20190371319A1 (en) Method for human-machine interaction, electronic device, and computer-readable storage medium
CN113674742B (zh) 人机交互方法、装置、设备以及存储介质
CN107943834A (zh) 人机对话的实现方法、装置、设备及存储介质
JP2019133127A (ja) 音声認識方法、装置及びサーバ
CN115394321A (zh) 音频情感识别方法、装置、设备、存储介质及产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180105

RJ01 Rejection of invention patent application after publication