CN108335700A

CN108335700A - 语音调节方法、装置、语音交互设备及存储介质

Info

Publication number: CN108335700A
Application number: CN201810089944.9A
Authority: CN
Inventors: 李承敏; 李封翔; 韩帅; 候健
Original assignee: Shanghai Si Yu Intelligent Technology Co Ltd
Current assignee: Zhejiang Everything Workshop Intelligent Technology Co ltd
Priority date: 2018-01-30
Filing date: 2018-01-30
Publication date: 2018-07-27
Anticipated expiration: 2038-01-30
Also published as: CN108335700B

Abstract

本发明实施例公开了一种语音调节方法、装置、语音交互设备及存储介质。该方法包括：接收输入语音信息，确定所述输入语音信息的第一特征参数；根据所述输入语音信息的第一特征参数，调节待输出语音信息的第二特征参数。本发明实施例避免输出语音的特征参数恒定不变导致输出语音不能满足用户需求，用户体验差的问题，根据输入语音调节输出语音实现了输出语音跟随输入语音的不同而变化，保证输出语音与输入语音相适应，提高用户体验。

Description

语音调节方法、装置、语音交互设备及存储介质

技术领域

本发明实施例涉及语音处理技术，尤其涉及一种语音调节方法、装置、语音交互设备及存储介质。

背景技术

不同用户说话习惯不同，说话音量存在高低不同的差异；说话音量也会随着年龄的增长而变化，年龄越大，听力系统功能越差，导致用户自身说话音量提高。

目前具有语音交互功能的智能设备的应用越来越普遍，为人们的生产和生活带来很大便利。现有的语音交互智能设备在与人交互时，输出的音量大小固定，不能根据不同人的不同说话音量进行调节，存在输出音量过大或过小的情况，导致用户使用体验差。

发明内容

本发明实施例提供一种语音调节方法、装置、语音交互设备及存储介质，解决现有的语音交互智能设备的输出音量不能根据不同人的说话音量进行调节，存在输出音量过大或过小的情况，导致用户使用体验差的问题。

第一方面，本发明实施例提供了一种语音调节方法，该方法包括：

接收输入语音信息，确定所述输入语音信息的第一特征参数；

根据所述输入语音信息的第一特征参数，调节待输出语音信息的第二特征参数。

进一步地，所述第一特征参数包括第一音量，所述第二特征参数包括第二音量；相应地，所述根据所述输入语音信息的第一特征参数，调节待输出语音信息的第二特征参数，包括：

获取所述输入语音信息的第一音量；

根据所述第一音量确定所述第二音量，其中，所述第二音量与所述第一音量相匹配。

进一步地，根据所述第一音量确定所述第二音量，包括：

根据所述输入语音的第一语音振幅确定第一音量等级；

根据所述第一音量等级确定所述待输出语音信息的第二音量等级，并根据所述第二音量等级确定所述待输出语音信息的第二语音振幅，其中，所述第二音量等级与所述第一音量等级相匹配。

进一步地，接收输入语音信息包括基于至少两个语音接收器接收所述输入语音信息；相应地，确定所述输入语音信息的第一特征参数，包括：

根据所述输入语音信息的接收时间差确定发声源的位置信息；

根据所述发声源的位置信息，确定所述发声源的原始语音信息；

将所述输入语音信息更新为所述原始语音信息，并根据所述原始语音信息确定所述第一特征参数。

进一步地，所述第一特征参数包括第一语音周期，所述第二特征参数包括第二语音周期；相应地，所述根据所述输入语音信息的第一特征参数，调节待输出语音信息的第二特征参数，包括：

根据所述输入语音信息的第一语音周期确定第一语速；

根据所述第一语音周期确定所述第二语音周期，并根据所述第二语音周期确定所述待输出语音信息的第二语速，其中，所述第二语音周期与所述第一语音周期相匹配。

进一步地，所述第一特征参数包括时间信息，所述第二特征参数包括第三音量，相应地，所述根据所述输入语音信息的第一特征参数，调节待输出语音信息的第二特征参数，包括：

根据所述输入语音信息的时间信息，确定待输出语音信息的第三音量，所述第三音量与所述时间信息相匹配。

进一步地，根据所述输入语音信息的时间信息，确定待输出语音信息的第三音量，包括：

根据所述时间信息，确定用户的作息状态，其中所述作息状态根据作息学习模型确定；

根据所述作息状态，确定所述待输出语音信息的第三音量。

进一步地，在确定待输出语音信息的第三音量之后，还包括：

根据所述输入语音信息的第四音量对所述第三音量进行校正。

其中，所述第一特征参数包括声纹信息，所述第二特征参数包括第五音量；相应地，所述根据所述输入语音信息的第一特征参数，调节待输出语音信息的第二特征参数，包括：

根据所述输入语音信息的声纹信息确定年龄范围；

根据所述年龄范围确定所述待输出语音信息的第五音量。

进一步地，在根据所述年龄范围确定所述待输出语音信息的第五音量之后，还包括：

将所述声纹信息在预先存储的声纹数据库中进行匹配，确定所述声纹信息对应的用户信息；

根据所述用户信息确定用户的音量范围，并根据所述音量范围对所述第五音量进行校正，其中所述音量范围根据所述用户在预设时间段内历史播放音量确定。

第二方面，本发明实施例还提供了一种语音调节装置，该装置包括：

第一特征参数调节模块，用于接收输入语音信息，确定所述输入语音信息的第一特征参数；

第二特征参数调节模块，用于根据所述输入语音信息的第一特征参数，调节待输出语音信息的第二特征参数。

第三方面，本发明实施例还提供了一种语音交互设备，该设备包括：

至少一个麦克风；

至少一个扬声器；

一个或多个处理器；

存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如本发明实施例第一方面任一所述的语音调节方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明实施例第一方面任一所述的语音调节方法。

本发明实施例通过输入语音的第一特征参数调节输出语音的第二特征参数，避免输出语音的特征参数恒定不变导致输出语音不能满足用户需求，用户体验差的问题，根据输入语音调节输出语音实现了输出语音跟随输入语音的不同而变化，保证输出语音与输入语音相适应，提高用户体验。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图做一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例一提供的一种语音调节方法的流程示意图；

图2是本发明实施例二提供的一种语音调节方法的流程示意图；

图3是本发明实施例三提供的一种语音调节方法的流程示意图；

图4是本发明实施例四提供的一种语音调节方法的流程示意图；

图5是本发明实施例五提供的一种语音调节装置的结构示意图；

图6是本发明实施例六提供的一种语音交互设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，以下将参照本发明实施例中的附图，通过实施方式清楚、完整地描述本发明的技术方案，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例一

图1是本发明实施例一提供的一种语音调节方法的流程图。本实施例的技术方案可以适用于对语音交互设备例如智能音箱的输出语音进行调节的情况。该方法可以由本发明实施例提供的一种语音调节装置来执行，该装置可以采用软件和/或硬件的方式实现，并配置于智能音箱中应用。该方法具体包括如下操作：

S110、接收输入语音信息，确定所述输入语音信息的第一特征参数。

其中，输入语音信息例如可以是用户向音频采集装置发送的语音，音频采集装置例如可以是智能音箱，智能音箱接收输入语音信息，对输入语音进行特征提取，确定输入语音信息的第一特征参数。第一特征参数例如可以是音量、语音周期、输入语音的发生时间等信息。具体的特征提取方法根据第一特征参数的不同而不同。示例性地，第一特征参数为音量时，特征提取的方式可以是根据输入语音的振幅特性，确定输入语音信息的音量，其他确定音量的方式也可以，在此不做具体限定。

S120、根据所述输入语音信息的第一特征参数，调节待输出语音信息的第二特征参数。

智能音箱接收输入语音，根据输入语音和预设规则生成待输出语音，例如输入语音为“请帮我查看A市明天天气”，智能音箱通过查看天气网站的数据，获取到A市明天天气，将A市明天天气用语音的方式播放，A时明天天气的语音即为待输出语音。智能音箱根据输入语音的第一特征参数调节待输出语音的第二特征参数，第一特征参数和第二特征参数可以相同，也可以不相同。

可选地，所述第一特征参数包括第一音量，所述第二特征参数包括第二音量；相应地，所述根据所述输入语音信息的第一特征参数，调节待输出语音信息的第二特征参数，包括：获取所述输入语音信息的第一音量；根据所述第一音量确定所述第二音量，其中，所述第二音量与所述第一音量相匹配。

当第一音量为高音量时，可以将第二音量调节为高音量，当第一音量为低音量时，可以将第二音量调节为低音量。保证第一音量与第二音量相匹配，以便于用户大声说话时，音箱也能大声回应，用户小声说话时，音箱也小声回应，用户大声说话时，可以是用户距离音箱较远，也可以是用户为听力能力较弱的人，还可以是用户所处环境比较嘈杂；用户小声说话时，可以是用户距离音箱较近，用户所处环境较安静，或者用户所处环境有人睡觉。音箱的输出语音音量根据用户的输入语音音量调节，满足不同场景的需求，挺高用户体验。

进一步地，根据所述第一音量确定所述第二音量，包括：

根据所述输入语音的第一语音振幅确定第一音量等级；根据所述第一音量等级确定所述待输出语音信息的第二音量等级，并根据所述第二音量等级确定所述待输出语音信息的第二语音振幅，其中，所述第二音量等级与所述第一音量等级相匹配。

根据输入语音的第一语音振幅可以确定输入语音的音量，根据输入语音的音量确定第一音量等级，第一音量等级可以是包含输入语音音量的一个音量范围。例如输入语音的音量为50分贝，第一音量等级可以是45分贝～55分贝。根据第一音量等级确定第二音量等级，可以是与第一音量等级相同的音量范围，也可以是第二音量等级包含于第一音量等级中，例如第一音量等级是45分贝～55分贝，第二音量等级可以是45分贝～55分贝，第二音量等级还可以是48分贝～52分贝。假设第二音量等级是48分贝～52分贝，则在第二音量等级的音量分为中任选一个音量值作为待输出语音的音量，根据待输出语音的音量确定第二语音振幅。

在本实施例的另一优选实施方式中，接收输入语音信息包括基于至少两个语音接收器接收所述输入语音信息；相应地，确定所述输入语音信息的第一特征参数，包括：根据所述输入语音信息的接收时间差确定发声源的位置信息；根据所述发声源的位置信息，确定所述发声源的原始语音信息；将所述输入语音信息更新为所述原始语音信息，并根据所述原始语音信息确定所述第一特征参数。

语音接收器例如可以是麦克风阵列，配置于智能音箱中，通过至少两个语音接收器接收输入语音，可以根据语音接收器接收输入语音的时间差确定输入语音发声源的位置。由于声波在空气中以一定速度传播，到达设置于不同位置的语音接收器的相位不同，根据多个语音接收器对同一输入语音录制的相位差别，可以计算出同一输入声音到达每对麦克风的时间差值。合适的安排语音接收器的位置，可以使得双曲面的交点只有一个，该点即是输入语音发声源的位置。根据发声源的位置信息结合声音在空气中的衰减模型，将输入语音信息还原为原始语音信息，根据原始语音信息确定第一特征参数。由此可以保证输入语音的发声源距离智能音箱较远时，待输出语音的参数可以与原始语音参数保持一致，避免根据原始语音严重衰减得到的输入语音调节待输出语音不能满足用户需求，由此提高用户体验。

实施例二

图2是本发明实施例二提供的一种语音调节方法的流程图。本发明实施例在上述实施例的基础上，进一步优化了所述第一特征参数包括第一语音周期，所述第二特征参数包括第二语音周期；相应地，优化了所述根据所述输入语音信息的第一特征参数，调节待输出语音信息的第二特征参数的操作。

相应地，本实施例的方法包括：

S210、接收输入语音信息，确定所述输入语音信息的第一特征参数，所述第一特征参数包括第一语音周期。

语音周期可以用语音频率表征，语音频率越大，语音周期越短，语音周期越短表明语速越快。

S220、根据所述输入语音信息的第一语音周期确定第一语速。

S230、根据所述第一语音周期确定第二语音周期，并根据所述第二语音周期确定所述待输出语音信息的第二语速，其中，所述第二语音周期与所述第一语音周期相匹配。

根据第一语音周期确定第二语音周期，第二语音周期可以与第一语音周期相同，也可以是与第一语音周期相差预设阈值范围内的周期值。根据第二语音周期确定第二语速，语速可以具体为每分钟说多少字

本发明实施例通过输入语音信息的第一语音周期确定待输出语音的第二语音周期，根据语音周期可以确定语速，实现待输出语音的语速与输入语音的语速一致，避免输入语音语速和待输出语音语速不一致导致的对话体验感差，从而提高用户体验。

实施例三

图3是本发明实施例三提供的一种语音调节方法的流程图。本发明实施例在上述实施例的基础上，进一步优化了第一特征参数包括时间信息，所述第二特征参数包括第三音量，相应地，优化了所述根据所述输入语音信息的第一特征参数，调节待输出语音信息的第二特征参数的操作。

相应地，本实施例的方法包括：

S310、接收输入语音信息，确定所述输入语音信息的第一特征参数，所述第一特征参数包括时间信息。

智能音箱可以根据接收到输入语音信息的时刻作为输入语音信息的时间信息，用户可以在任意时刻发送输入语音信息，智能音箱接收输入语音信息的时间也是任意的，即时间信息是任意的。

S320、根据所述输入语音信息的时间信息，确定待输出语音信息的第三音量，所述第三音量与所述时间信息相匹配。

凌晨时间多数人进入睡眠模式，道路上行驶车辆的汽笛声变少，周围环境相对寂静，上班时间环境相对嘈杂，中午午休时间环境相对寂静，如果输入语音信息的时间信息为凌晨时间或中午午休时间，则待输出语音信息的第三音量为音量小于预设阈值的小音量，上班时间待输出语音信息的第三音量为音量大于预设阈值的大音量，由此可以保证待输出音量根据时间信息进行自动调整，保证在环境寂静的休息时间音量小，在上班时间音量大，避免待输出语音的第三音量过大扰民或过小听不到的情况。

根据所述时间信息，确定用户的作息状态，其中所述作息状态根据作息学习模型确定；根据所述作息状态，确定所述待输出语音信息的第三音量。

用户的作息状态可以根据学习模型确定，例如可以是，针对某一家庭用户，统计该用户在晚上9点之后熄灯的概率为95％，在早上8点之后起床的概率为93％，在中午午休的概率为90％，且午休的时间的下午1点到下午2点，具体用户熄灯，起床或午休可以根据家庭摄像头确定，也可以检测家庭成员说话语音情况确定。根据输入语音信息的时间信息，可以确定该家庭用户所处的作息状态，根据作息状态确定待输出语音的第三音量，例如作息状态为休息，则第三音量为不能超过预设阈值的小音量，当作息状态为非休息状态时，第三音量为可以超过预设阈值的大音量。由此保证，待输出语音的音量与用户的作息状态相匹配，且待输出语音的音量可以适应不同用户的作息状态不同的情况，更能满足用户个性化需求差异，提高用户体验。

为避免根据输入语音的时间信息确定能够待输出语音的音量存在不能满足特殊场景的情况，例如在凌晨时间，输入语音音量大于待输出语音的音量阈值，此时可以表明用户没有在休息，如果输出语音音量仍然只根据时间信息确定音量则不能满足用户需要大声音的需求，因此，根据输入语音的第四音量对根据时间信息确定的第三音量进行校正，如果第四音量大，则第三音量也大，第四音量小，第三音量也小，保证待输出语音信息的第三音量满足用户需求。

本发明实施例通过输入语音的时间信息确定待输出语音的音量，保证待输出语音的音量根据休息时间而变化，避免对用户的打扰，提高用户体验。

实施例四

图4是本发明实施例四提供的一种语音调节方法的流程图。本发明实施例在上述实施例的基础上，进一步优化了所述第一特征参数包括声纹信息，所述第二特征参数包括第五音量；相应地，优化了所述根据所述输入语音信息的第一特征参数，调节待输出语音信息的第二特征参数的操作。

相应地，本实施例的方法包括：

S410、接收输入语音信息，确定所述输入语音信息的第一特征参数，所述第一特征参数包括声纹信息。

S420、根据所述输入语音信息的声纹信息确定年龄范围。

根据输入语音信息的声纹信息确定输入语音的发声者的年龄范围，具体可以采用声纹识别的方式确定年龄范围。

S430、根据所述年龄范围确定所述待输出语音信息的第五音量。

根据年龄范围确定待输出语音信息的第五音量具体可以是如果年龄范围为老年年龄，第五音量可以是大于预设阈值的大音量，以避免老人听力不好的情况；若年龄范围为中青年年龄，第五音量可以是音量在最大音量和最小音量之间的中音量；若年龄范围为少年年龄，第五音量可以是小于预设阈值的小音量，以避免对儿童听力的损坏。

将所述声纹信息在预先存储的声纹数据库中进行匹配，确定所述声纹信息对应的用户信息；根据所述用户信息确定用户的音量范围，并根据所述音量范围对所述第五音量进行校正，其中所述音量范围根据所述用户在预设时间段内历史播放音量确定。

根据用户在预设时间段内的历史播放音量，可以得到用户在预设时间段内对音量大小的喜好，识别输入语音的声纹信息，确定用户信息，用户信息可以包括用户名称，根据用户名称调取用户在预设时间段内的历史播放音量，根据历史播放音量可以确定音量的最大值和音量的最小值，根据这一音量范围对待输出语音信息的第五音量进行校正，以避免只根据年龄确定的音量不能满足用户需求。通过年龄确定第五音量，根据用户习惯校正第五音量，保证第五音量确定的准确性。

本发明实施例通过对输入语音信息进行声纹识别，确定年龄范围，根据年龄范围确定待输出语音信息的音量，实现了待输出语音信息的音量根据输入语音的年龄不同而不同，提高音量的适应性，满足不同人群的使用需求。

实施例五

图5是本发明实施例五提供的一种语音调节装置的结构框图。该装置用于执行上述任意实施例所提供的一种语音调节方法。该装置包括：

第一特征参数调节模块510，用于接收输入语音信息，确定所述输入语音信息的第一特征参数；

第二特征参数调节模块520，用于根据所述输入语音信息的第一特征参数，调节待输出语音信息的第二特征参数。

进一步地，所述第一特征参数包括第一音量，所述第二特征参数包括第二音量；相应地，所述第二特征参数调节模块520包括：

第一音量获取单元，用于获取所述输入语音信息的第一音量；

第二音量获取单元，用于根据所述第一音量确定所述第二音量，其中，所述第二音量与所述第一音量相匹配。

进一步地，所述第二音量获取单元具体用于：

根据所述输入语音的第一语音振幅确定第一音量等级；

基于至少两个语音接收器接收所述输入语音信息；

进一步地，所述第一特征参数包括第一语音周期，所述第二特征参数包括第二语音周期；相应地，所述第二特征参数调节模块520具体用于：

根据所述输入语音信息的第一语音周期确定第一语速；

进一步地，所述第一特征参数包括时间信息，所述第二特征参数包括第三音量，相应地，所述第二特征参数调节模块520包括：

第三音量确定单元，用于根据所述输入语音信息的时间信息，确定待输出语音信息的第三音量，所述第三音量与所述时间信息相匹配。

进一步地，所述第三音量确定单元具体用于：

根据所述作息状态，确定所述待输出语音信息的第三音量。

进一步地，该装置还包括：

第三音量校正模块，用于在确定待输出语音信息的第三音量之后，根据所述输入语音信息的第四音量对所述第三音量进行校正。

进一步地，所述第一特征参数包括声纹信息，所述第二特征参数包括第五音量；相应地，所述第二特征参数调节模块520具体用于：

根据所述输入语音信息的声纹信息确定年龄范围；

根据所述年龄范围确定所述待输出语音信息的第五音量。

进一步地，该装置还包括：

第五音量校正模块，用于在根据所述年龄范围确定所述待输出语音信息的第五音量之后，将所述声纹信息在预先存储的声纹数据库中进行匹配，确定所述声纹信息对应的用户信息；

本发明实施例五提供的语音调节装置，根据输入语音调节输出语音实现了输出语音跟随输入语音的不同而变化，保证输出语音与输入语音相适应，提高用户体验。

本发明实施例所提供的语音调节装置可执行本发明任意实施例所提供的语音调节方法，具备执行方法相应的功能模块和有益效果。

实施例六

图6为本发明实施例六提供的一种语音交互设备的结构示意图，如图6所示，该语音交互设备包括至少一个麦克风，至少一个扬声器和处理器60、存储器61、输入装置62和输出装置63；设备中处理器60的数量可以是一个或多个，图6中以一个处理器60为例；设备中的处理器60、存储器61、输入装置62和输出装置63可以通过总线或其他方式连接，图6中以通过总线连接为例。

存储器61作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序以及模块，如本发明实施例中的音频处理方法对应的程序指令/模块(例如，第一特征参数调节模块510和第二特征参数调节模块520)。处理器60通过运行存储在存储器61中的软件程序、指令以及模块，从而执行设备的各种功能应用以及数据处理，即实现上述的语音调节方法。

存储器61主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据终端的使用所创建的数据等。此外，存储器61可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储器61可进一步包括相对于处理器60远程设置的存储器，这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置62可用于接收输入的数字或字符信息，以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置63可包括显示屏等显示设备。

实施例七

本发明实施例七还提供一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行一种语音调节方法，该方法包括：

当然，本发明实施例所提供的一种包含计算机可执行指令的存储介质，其计算机可执行指令不限于如上所述的方法操作，还可以执行本发明任意实施例所提供的语音调节方法中的相关操作。

通过以上关于实施方式的描述，所属领域的技术人员可以清楚地了解到，本发明可借助软件及必需的通用硬件来实现，当然也可以通过硬件实现，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种语音调节方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述第一特征参数包括第一音量，所述第二特征参数包括第二音量；相应地，所述根据所述输入语音信息的第一特征参数，调节待输出语音信息的第二特征参数，包括：

获取所述输入语音信息的第一音量；

3.根据权利要求2所述的方法，其特征在于，根据所述第一音量确定所述第二音量，包括：

根据所述输入语音的第一语音振幅确定第一音量等级；

4.根据权利要求1-3任一所述的方法，其特征在于，接收输入语音信息包括基于至少两个语音接收器接收所述输入语音信息；相应地，确定所述输入语音信息的第一特征参数，包括：

5.根据权利要求1所述的方法，其特征在于，所述第一特征参数包括第一语音周期，所述第二特征参数包括第二语音周期；相应地，所述根据所述输入语音信息的第一特征参数，调节待输出语音信息的第二特征参数，包括：

根据所述输入语音信息的第一语音周期确定第一语速；

6.根据权利要求1所述的方法，其特征在于，所述第一特征参数包括时间信息，所述第二特征参数包括第三音量，相应地，所述根据所述输入语音信息的第一特征参数，调节待输出语音信息的第二特征参数，包括：

7.根据权利要求6所述的方法，其特征在于，根据所述输入语音信息的时间信息，确定待输出语音信息的第三音量，包括：

根据所述作息状态，确定所述待输出语音信息的第三音量。

8.根据权利要求6或7所述的方法，其特征在于，在确定待输出语音信息的第三音量之后，还包括：

9.根据权利要求1所述的方法，其特征在于，所述第一特征参数包括声纹信息，所述第二特征参数包括第五音量；相应地，所述根据所述输入语音信息的第一特征参数，调节待输出语音信息的第二特征参数，包括：

根据所述输入语音信息的声纹信息确定年龄范围；

根据所述年龄范围确定所述待输出语音信息的第五音量。

10.根据权利要求9所述的方法，其特征在于，在根据所述年龄范围确定所述待输出语音信息的第五音量之后，还包括：

11.一种语音调节装置，其特征在于，包括：

12.一种语音交互设备，其特征在于，包括：

至少一个麦克风；

至少一个扬声器；

一个或多个处理器；

存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-10中任一所述的语音调节方法。

13.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-10中任一所述的语音调节方法。