WO2013182085A1

WO2013182085A1 - 一种自适应智能语音装置及方法

Info

Publication number: WO2013182085A1
Application number: PCT/CN2013/077225
Authority: WO
Inventors: 李向阳
Original assignee: 中兴通讯股份有限公司
Priority date: 2012-10-12
Filing date: 2013-06-14
Publication date: 2013-12-12
Also published as: EP2908312A1; MY177459A; EP2908312A4; CN103730117A; US9552813B2; US20150262579A1

Abstract

一种自适应智能语音装置及方法，其中所述装置包括语音识别模块（101）、识别结果处理模块（102）、语音播报模块（103）以及播报语音参数生成模块（104），该播报语音参数生成模块（104）设置成：从所述语音识别模块（101）获取提取的语音参数，并根据该提取的语音参数以及预设策略生成播报语音参数，并将该播报语音参数输入至所述语音播报模块（103），上述技术方案使得播报语音更加匹配用户语音。

Description

一种自适应智能语音装置及方法

技术领域

本发明涉及智能语音领域，尤其涉及一种自适应智能语音装置及方法。

背景技术

随着移动通信技术和手机制造技术的发展，智能手机以较高的性能、支持多种业务以及不断下降的成本受到越来越多的消费者的青睐。随着智能手机硬件性能的提高和操作系统功能的强大，越来越多的智能应用能够得以实现，其中包括智能语音业务。相对于传统的手动式人机交互，智能语音由于其更人性化和便捷性的交互方式受到越来越多用户的喜爱，并且在 apple和 android等智能手机平台上都相继出现了诸如 siri等一系列智能语音应用程序。

目前的智能语音应用主要包括三个功能模块：语音识别模块、识别结果处理模块以及语音播报模块：

其中，语音识别模块，用于提取表征人类语音的参数，根据该语音参数将人类语音中的词汇内容转换为机器语言文件，如二级制代码文件等，并将该机器语言文件发送至识别结果处理模块；表征人类语音的参数主要包括共振峰（频率、带宽、幅度）和基音频率等。

识别结果处理模块，用于根据机器语言文件执行相应的操作，并将操作结果发送至语音播报模块；如接收到的机器语言文件表示的词汇内容为 "我在哪里" ，识别结果处理模块会从定位模块中获取用户当前的位置，并将该位置信息发送至语音播^艮模块；

语音播报模块，用于结合播报语音参数将识别结果处理模块发送的操作结果转换为音频文件进行播报。

相关技术中，播报语音参数要么是给出选项让用户自己选择确定，要么是在产品出厂时固化在语音播 ^艮模块中。针对前者，由于用户的差异，不同用户在使用时可能需要重新设置语音播报语音参数的数值，给用户带来了使用上的复杂性和繁瑣性；对于后者，由于对所有用户均釆用相同的语音进行播报，从而造成了用户体验上的单一和枯燥。发明内容

本发明的实施例的目的在于提供了一种自适应地智能语音装置及方法，以解决如何使播 4艮语音更加匹配用户语音的技术问题。

为解决上述技术问题，本发明实施例提供了如下技术方案：

一种自适应智能语音装置，该装置包括语音识别模块、识别结果处理模块以及语音播报模块，其中，所述装置还包括播报语音参数生成模块，所述播报语音参数生成模块设置成：从所述语音识别模块获取提取的语音参数，并根据所述语音参数以及预设策略生成播报语音参数，并将所述播报语音参数输入至所述语音播报模块。

可选地，所述播报语音参数生成模块还设置成：在接收到特定的触发信号后或在该装置上电时，从所述语音识别模块获取所述语音参数。

可选地，所述预设策略包含了所述语音参数与所述播报语音参数的对应关系。

可选地，所述播报语音参数生成模块设置成按照以下方式根据所述语音参数以及预设策略生成播报语音参数：

获得所述语音参数的数值，通过所述预设策略确定与所述语音参数的数值对应的所述播报语音参数的数值。

一种自适应智能语音方法，该方法包括：

通过语音识别从声音中提取语音参数后，根据所述语音参数以及预设策略生成播报语音参数；

以所述播报语音参数生成播报语音。

可选地，所述根据所述语音参数以及预设策略生成播报语音参数的步骤包括：当接收到特定的触发信号后或上电时根据所述语音参数以及所述预设策略生成所述播报语音参数。

可选地，所述根据所述语音参数以及预设策略生成播报语音参数的步骤包括：

上述技术方案通过预设策略建立了播报语音参数与用户输入语音参数的联系，避免了播报语音参数不考虑用户语音特征而釆用固定数据造成的不足；另外上述技术方案生成播报语音参数的动作不需要人工参与，给用户带来了使用上的便利。附图概述

图 1为本发明实施例的自适应智能语音装置模块图；

图 2为本发明实施例的自适应智能语音方法流程图。

本发明的较佳实施方式

为使本发明的目的、技术方案和优点更加清楚明白，下文中将结合附图对本发明的实施例进行详细说明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互任意组合。

图 1为本发明实施例的自适应智能语音装置模块图，如图所示，该装置模块包括语音识别模块 101、识别结果处理模块 102、语音播报模块 103以及播报语音参数生成模块 104。其中，语音识别模块 101、识别结果处理模块 102及语音播报模块 103在相关技术中已经实现，在此不再赘述，播报语音参数生成模块 104为本实施例相对于相关技术新增的模块；

播报语音参数生成模块 104设置成：从所述语音识别模块 101获取提取的语音参数，并根据该提取的语音参数以及预设策略生成播报语音参数，并将该播报语音参数输入至所述语音播报模块 103;

所述预设策略给出了一种输入参数与输出参数的对应关系，其中输入参数为提取的语音参数，输出参数为播报语音参数；该对应关系可以为简单的数值对应关系，也可以为复杂的算法运算；

播报语音参数生成模块 104在获得提取的语音参数的数值后，通过该预设策略确定与提取的语音参数的数值对应的播报语音参数的数值，进而得到播报语音参数；

所述预设策略可以为：当输入的提取的语音参数表征的是男性声音时，输出的播报语音参数表征为女性声音；

当输入的提取的语音参数表征的是童声时，输出的播报语音参数表征为重声；

输出的播报语音参数表征的声音速度与输入的提取的语音参数表征的声音速度处于相同的等级；

输出的播报语音参数表征的声音响度与输入的提取的语音参数表征的声音响度处于相同等级；

该播报语音参数生成模块 104可以在接收到特定的触发信号后（如接收到来自用户的开启自适应智能语音指示信号）或在所述装置上电时，从所述语音识别模块 101获取提取的语音参数。

上述实施例通过在智能语音装置中设置播报语音参数生成模块 104, 使得播报语音时釆用的语音参数考虑了用户输入的语音参数，实现了根据差异化的用户声音特征自适应地改变播报声音的效果，相对于目前的相关技术，既减少了不同用户频繁对语音播报进行设置的复杂性，也提高了语音播报的灵活性和生动性，能够极大提高用户人机交互体验的舒适度。

图 2为本发明实施例的自适应智能语音方法流程图，如图 2所示，该方法主要包括如下步骤：

S201 , 通过语音识别从声音中提取语音参数； 5202 , 根据提取的语音参数以及预设策略生成播报语音参数；该步骤中，可以在接收到特定的触发信号后（如接收到来自用户的开启自适应智能语音指示信号）或上电时，根据提取的语音参数以及预设策略生成播报语音参数；

所述预设策略包含了所述提取的语音参数与所述播报语音参数的对应关系：其中输入参数为提取的语音参数，输出参数为播报语音参数；该对应关系可以为简单的数值对应关系，也可以为复杂的算法运算；

在获得提取的语音参数的数值后，通过该预设策略确定与提取的语音参数的数值对应的播报语音参数的数值，进而得到播报语音参数；

5203 , 以该播报语音参数生成播报语音。

本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成，所述程序可以存储于计算机可读存储介质中，如只读存储器、磁盘或光盘等。可选地，上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现，相应地，上述实施例中的各模块 /单元可以釆用硬件的形式实现，也可以釆用软件功能模块的形式实现。本发明不限制于任何特定形式的硬件和软件的结合。

需要说明的是，本发明还可有其他多种实施例，在不背离本发明精神及和变形，但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

工业实用性

上述技术方案通过预设策略建立了播报语音参数与用户输入语音参数的联系，避免了播报语音参数不考虑用户语音特征而釆用固定数据造成的不足; 另外上述技术方案生成播报语音参数的动作不需要人工参与，给用户带来了使用上的便利。

Claims

权利要求书

1、一种自适应智能语音装置，该装置包括语音识别模块（101 ) 、识别结果处理模块（102 ) 以及语音播报模块（103 ) ，其中，所述装置还包括播报语音参数生成模块（ 104 ) ,

所述播报语音参数生成模块 ( 104 )设置成：从所述语音识别模块 ( 101 ) 获取提取的语音参数，并根据所述语音参数以及预设策略生成播报语音参数，并将所述播报语音参数输入至所述语音播报模块（ 103 ) 。

2、如权利要求 1所述的自适应智能语音装置，其中，所述播报语音参数生成模块（104 )还设置成：在接收到特定的触发信号后或在该装置上电时，从所述语音识别模块（ 101 )获取所述语音参数。

3、如权利要求 1或 2所述的自适应智能语音装置，其中，

所述预设策略包含了所述语音参数与所述播报语音参数的对应关系。

4、如权利要求 3所述的自适应智能语音装置，其中，所述播报语音参数生成模块（ 104 )设置成按照以下方式根据所述语音参数以及预设策略生成播报语音参数：

5、一种自适应智能语音方法，该方法包括：

通过语音识别从声音中提取语音参数 ( S201 )后，根据所述语音参数以及预设策略生成播报语音参数 ( S202 ) ；

以所述播报语音参数生成播报语音（S203 ) 。

6、如权利要求 5所述的自适应智能语音方法，其中，所述根据所述语音参数以及预设策略生成播报语音参数的步骤（S202 ) 包括：

当接收到特定的触发信号后或上电时根据所述语音参数以及所述预设策略生成所述播报语音参数。

7、如权利要求 5或 6所述的自适应智能语音方法，其中，

8、如权利要求 7所述的自适应智能语音方法，其中，所述根据所述语音参数以及预设策略生成播报语音参数的步骤（S202 ) 包括：