CN108389587A

CN108389587A - 基于语音唤醒技术的语音增强器

Info

Publication number: CN108389587A
Application number: CN201810372027.1A
Authority: CN
Inventors: 李瑞鹏; 刘岳
Original assignee: Suzhou Macro Cloud Intelligent Technology Co Ltd
Current assignee: Suzhou Macro Cloud Intelligent Technology Co Ltd
Priority date: 2018-04-24
Filing date: 2018-04-24
Publication date: 2018-08-10

Abstract

本发明公开了一种基于语音唤醒技术的语音增强器，包括由两个以上麦克风组成的麦克风阵列、用于将所述麦克风阵列拾取的语音进行信号放大处理的放大模块、用于将所述放大后的语音信号进行取样处理的动态信号取样模块；还包括用于将动态信号取样的语音信号进行设定音框的线性差异处理模块、用于将经过线性差异处理后的语音信号进行滤波处理的自适应滤波模块、用于增强滤波后的语音信号的语音增强模块、用于确定音源位置的TDOA计算模块及网络通信模块。本发明能够根据音源位置关闭或开启对应的家电设备，避免了传统语音控制位置不精准的缺陷，使智能家居语音交互系统的智能化水平得到提升。

Description

基于语音唤醒技术的语音增强器

技术领域

本发明涉及智能家居领域，特别是涉及一种基于语音唤醒技术的语音增强器。

背景技术

随着科技的发展，智能家居逐渐被普及应用，在智能家居的实施过程中，语音交互是实现智能家居智能化的一项重要技术手段，目前智能家居的语音交互系统，在唤醒语及命令语的拾取过程中，不可避免地会受到外界环境噪音和其他人说话的干扰，如果干扰噪音过强，会严重影响语音交互系统的灵敏性，造成唤醒失灵及语音交互不畅；而且，由于在室内家电产品安装位置比较分散，现有的语音交互不能很精确地根据发声者的位置开启或关闭与人体位置相对应的家电设备，语音控制存在着错控、混控等问题。

发明内容

本发明的目的是克服现有技术中的不足之处，提供一种基于语音唤醒技术的语音增强器，能够根据人体位置用语音控制对应的家电设备，提高语智能家居中音交互的精准性与灵敏性。

为解决上述技术问题，本发明通过下述技术方案来解决：

一种基于语音唤醒技术的语音增强器，包括

语料取样模组、语音前处理模组和语音后处理模组；

所述语料取样模组包括由两个以上麦克风组成的麦克风阵列、用于将所述麦克风阵列拾取的语音进行信号放大处理的放大模块及用于将所述放大后的语音信号进行取样处理的动态信号取样模块；

所述语音前处理模组包括用于将动态取样的语音信号进行设定音框的线性差异处理模块、用于将经过线性差异处理后的语音信号进行自适应滤波处理的滤波模块及用于增强滤波后的语音信号的语音增强模块；

所述语音后处理模组包括用于确定音源位置的TDOA计算模块及用于将所述音源位置信息及语音信号发送至智能终端的网络通信模块；

所述麦克风阵列的输出端连接所述放大模块的输入端，所述放大模块的输出端连接动态信号取样模块的输入端，所述动态取样模块的输出端连接所述线性差异处理模块的输入端，所述线性差异处理模块的输出端连接所述滤波模块的输入端，所述滤波模块的输出端连接所述语音增强模块的输入端，所述语音增强模块的输出端同时连接所述TDOA计算模块的输入端及网络通信模块的输入端，所述TDOA计算模块的输出端还连接所述网络通信模块的输入端，所述网络通信模块的输出端连接所述智能终端的输入端。

进一步地，所述两个以上麦克风分布于房间内的不同位置并且与所述语音增强器电性连接。

进一步地，所述线性差异处理模块还用于将切成音框的语音信号设定音量限值。

进一步地，所述两个以上麦克风与所述语音增强器通过接口可拆卸连接。

进一步地，所述网络通信模块通过ZIGBEE技术进行无线信号传输。

本发明相比现有技术具有以下优点及有益效果：

（1）本发明通过设置在室内不同位置的两个以上麦克风组成的麦克风阵列进行语音的拾取，通过对麦克风阵列拾取的语音进行放大、叠加、增强处理，有效地对原始语音进行了噪声抑制和混响消除，提高了室内不同位置及较低音量的语音识别能力。

（2）本发明的动态信号取样模块通过语音取样算法精确的在混杂的语音环境中提取目标语音信息，提高了干扰噪音环境中的语音识别能力，所述线性差异处理模块通过设定的音量限值滤除目标语音音量较小的部分，避免了一个发声位置对其他较远位置家电设备的语音干扰，使语音控制位置更精准。

（3）所述TDOA计算模块根据方向角算法得出音源的入射的方向角，通过所述方向角确定音源位置，再将所述音源位置及增强数字语音信号通过无线通信模块发送至智能终端，智能终端能够根据所述音源位置信息和增强数字语音信号开启或关闭音源位置附近的家电设备，这样的设计使语音控制更契合人们的真实意愿，提高了语音交互的智能化体验。

（4）本发明的多个麦克风通过接口与所述语音增强器电连接，通过在室内设置不同数量的麦克风及相应阵列结构，能够根据房间的大小，空间结构合理的布局麦克风阵列结构，优化了资源配置，灵活提高了麦克风阵列的拾音效果及语音增强效果。

附图说明

图1为本发明基于语音唤醒技术的语音增强器的原理流程图。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述，但本发明的实施方式不限于此。

如图1所示，一种基于语音唤醒技术的语音增强器，包括：语料取样模组1、语音前处理模组2及语音后处理模组3。

所述语料取样模组包括由两个以上麦克风组成的麦克风阵列4、用于将所述麦克风阵列拾取的语音进行信号放大处理的放大模块5及用于将所述放大后的语音信号进行取样处理的动态信号取样模6；所述语音前处理模组2包括用于将动态信号取样的语音信号进行设定音框的线性差异处理模块7、用于将经过线性差异处理后的语音信号进行自适应滤波处理的滤波模块8及用于增强滤波后的语音信号的语音增强模块9；所述语音后处理模组包括用于确定音源位置的TDOA计算模块10及用于将所述音源位置信息及语音信号发送至智能终端的网络通信模块11。

所述麦克风阵列4的输出端连接所述放大模块5的输入端，所述放大模块5的输出端连接动态信号取样模块6的输入端，所述动态取样模块6的输出端连接所述线性差异处理模块7的输入端，所述线性差异处理模块7的输出端连接所述滤波模块8的输入端，所述滤波模块8的输出端连接所述语音增强模块9的输入端，所述语音增强模块9的输出端同时连接所述TDOA计算模块10的输入端及网络通信模块11的输入端，所述TDOA计算模块10的输出端还连接所述网络通信模块11的输入端，所述网络通信模块11的输出端连接所述智能终端12的输入端。

本实施例的工作原理如下：本实施例的麦克风阵列4进行音源定位是利用麦克风阵列4接收语音信号，判断出音源的位置方向，主要是利用同一音源到麦克风阵列4中每支麦克风的距离的差异，因此同一音源的语音信号传递到每个支麦克风会有时间差TDOA，利用求得的TDOA，代入方向角算法公式即可得到音源入射的方向。首先由麦克风阵列4接收语音信号，麦克风接收的语音信号经过放大模块5放大后，再经由动态信号取样模块6，依设定的取样频率取样语音信号并进行分析，所述线性差异处理模块7将每支麦克风接收的语音信号音量标准化并切割成多个音框，再将切成音框的语音信号设定音量限值，去除音量教小的部份，算出一段语音信号中所有音框的音量，再由滤波模块8将所有音框音量的语音信号进行自适应滤波处理，得到调节数字语音信号，所述语音增强模块9将所述多个音框的调节数字语音信号进行叠加处理，生成增强数字语音信号，同时，根据算法估算所述麦克风阵列中每支麦克风的TDOA，将求得的TDOA代入方向角算法公式，即可得到音源入射的方向角，所述网络通信模块3将TDOA模块计算出的方向角数据信号及增强数字语音信号发送至智能终端12，所述智能终端12根据所述方向角数据信号及增强数字语音信号开启或关闭对应音源位置的家电设备，采用TDOA的定位方式进行音源定位能够更加精准的确定发声者的位置信息，即使在比较小的空间距离范围内，也能准确定位发声者位置。由此，本发明通过确定音源位置，并根据音源位置关闭或开启对应的家电设备，避免了传统语音控制位置不精准的缺陷，语音控制更好地满足了人们实际需求，使智能家居语音交互系统的智能化水平得到提升。

根据本发明技术方案，所述两个以上麦克风分布于房间内的不同位置并且与所述语音增强器电性连接，由于在声源离麦克风较远的情况下，麦克风接收到的信号往往经过距离衰减、噪音干扰和回声造成的混响干扰，导致语音质量的下降，本实施例通过在室内合适的位置布置麦克风阵列结构，有效解决了上述问题，通过多路麦克风指向声源进行波束形成，从而获得高质量的音源输入，提高了语音识别能力。

所述两个以上麦克风与所述语音增强器通过接口可拆卸连接，所述语音增强器可以嵌入式或隐藏式安装于室内的墙壁上，通过接口可拆卸连接能够在室内设置不同数量的麦克风并对不同数量的麦克风设定相应阵列结构，能够根据房间的大小，空间结构合理的布局麦克风阵列结构，优化了资源配置，通过不同的阵列结构灵活的提高了不同房间内的麦克风阵列的拾音效果及语音增强效果。

所述网络通信模块通过ZIGBEE技术进行无线信号传输，采用ZIGBEE网络通信方式使智能终端能够同时连接并控制更多数量的所述语音增强器，并保持良好的信号传输质量，降低了功耗，节省了材料成本。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.一种基于语音唤醒技术的语音增强器，其特征在于：包括

语料取样模组、语音前处理模组及语音后处理模组；

所述语音前处理模组包括用于将动态信号取样的语音信号进行设定音框的线性差异处理模块、用于将经过线性差异处理后的语音信号进行自适应滤波处理的滤波模块及用于增强滤波后的语音信号的语音增强模块；

2.根据权利要求1所述的基于语音唤醒技术的语音增强器，其特征在于：所述两个以上麦克风分布于房间内的不同位置并与所述语音增强器电性连接。

3.根据权利要求1所述的基于语音唤醒技术的语音增强器，其特征在于：所述线性差异处理模块还用于将切成音框的语音信号设定音量限值。

4.根据权利要求1所述的基于语音唤醒技术的语音增强器，其特征在于：所述两个以上麦克风与所述语音增强器通过接口可拆卸连接。

5.根据权利要求1所述的基于语音唤醒技术的语音增强器，其特征在于：所述网络通信模块通过ZIGBEE技术进行无线信号传输。