CN107393546B

CN107393546B - 一种用于语音识别过程的回声消除方法及语音识别设备

Info

Publication number: CN107393546B
Application number: CN201710787113.4A
Authority: CN
Inventors: 郑立科; 徐明亮; 童伟峰
Original assignee: Bestechnic Shanghai Co Ltd
Current assignee: Bestechnic Shanghai Co Ltd
Priority date: 2017-09-04
Filing date: 2017-09-04
Publication date: 2020-10-13
Anticipated expiration: 2037-09-04
Also published as: CN107393546A

Abstract

本发明提供一种用于语音识别过程的回声消除方法，所述方法包括：将数字信号分成第一数字信号和第二数字信号两路，其中所述第一数字信号经过第一DA转换模块转换成第一模拟电信号送至播放器声音信号，麦克风采集所述声音信号并将所述声音信号转换成第三模拟电信号；所述第二数字信号经过滤波器滤波后转换成输出数字信号，所述输出数字信号经过第二DA转换模块转换成第二模拟电信号；所述第二模拟电信号与第三模拟电信号进行耦合叠加，并计算误差电信号；所述误差电信号经过AD转换模块转换成误差数字信号，所述滤波器通过所述误差数字信号进行输出数字信号更新。本发明回声消除的效果好，用于语音识别的语音信号信号的纯净。

Description

一种用于语音识别过程的回声消除方法及语音识别设备

技术领域

本发明涉及语音识别技术领域，特别涉及一种用于语音识别过程的回声消除方法及语音识别设备。

背景技术

随着人们生活智能化的发展，智能音响已经作为重要的智能设备进入普通家庭。智能音响的一个重要功能就是语音识别，为了更好的用户体验，需要在音响播放音乐或者语音提示的时候也进行语音识别。那么这个时候，麦克除了收到用户的语音提示外，也收了音响播放出的音乐或者语音提示。就需要回声消除功能把回声去掉，再进行语音识别。

现有的智能音响在进行语音识别时，一种情况下采用不播放音乐或语音提示时进行语音识别，这种方法牺牲了用户的体验。现有技术中的另一种情况是对智能音响上的麦克进行非常好的声音隔离，这种方法对音响的音腔材料的隔音性能具有较高的要求，不利于腔体的实现，且对于低音也不会有好的效果。现有技术中的再一种情况是降低音乐或提示音，使得AD采进去的声音不失真，在芯片内部的数字域进行回声消除，这种方法除了牺牲播放音乐或提示音的音量以外，还需要降低AD的增益，从而降低了语音的信噪比，也会影响语音识别的准确程度。由此可见，不同的回声消除方法直接影响语音识别的准确率，决定着用户的体验。

因此，需要无需音腔进行高效隔离，无需降低音乐音量或提示音，也无需降低AD增益的情况下，有效提高语音识别率的一种用于语音识别过程的回声消除方法及语音识别设备。

发明内容

本发明的一个方面在于提供一种用于语音识别过程的回声消除方法，所述方法包括：

将数字信号分成第一数字信号和第二数字信号两路，其中所述第一数字信号经过第一DA转换模块转换成第一模拟电信号送至播放器声音信号，麦克风采集所述声音信号并将所述声音信号转换成第三模拟电信号；

所述第二数字信号经过滤波器滤波后转换成输出数字信号，所述输出数字信号经过第二DA转换模块转换成第二模拟电信号；

所述第二模拟电信号与第三模拟电信号进行耦合叠加，并计算误差电信号；

所述误差电信号经过AD转换模块转换成误差数字信号，所述滤波器通过所述误差数字信号进行输出数字信号更新。

优选地，所述麦克风采集语音信号的同时采集所述声音信号；所述语音信号经过AD转换模块转换成语音数字信号用于语音识别。

优选地，所述误差电信号通过如下方法计算：

e(t)＝d(t)-y(t),其中，e(t)为误差电信号，d(t)为麦克风采集的声音信号转换成的第三模拟电信号，y(t)第二模拟电信号。

优选地，所述滤波器数字输出信号的更新通过如下方法进行：

a)将误差电信号经过AD转换模块转换成误差数字信号，

b)更新权向量：w(n+1)＝w(n)+2μe(n)x(n)，其中，w(n)为权向量，e(n)为误差数字信号，x(n)为第二数字信号，μ为步长参数；

c)更新输出数字信号：y(n)＝w^T(n)x(n)，其中，y(n)为输出数字信号，w^T(n)为权向量的转置向量，x(n)为第二数字信号。

优选地，所述步长参数μ满足：0＜μ＜2/MP_in，其中，M为滤波器长度，P_in＝E[x²(n)]为第二数字信号的输入功率。

优选地，所述滤波器为自适应滤波器。

本发明的另一个方面在于提供一种回声消除的语音识别设备，包括音响和麦克风，所述语音识别设备还包括：

数字播放单元，其播放的数字信号分成第一数字信号和第二数字信号两路；

滤波器，用于接收第二数字信号，并将第二数字信号经滤波后转换成输出数字信号，以及通过误差数字信号更新输出数字信号；

第一DA转换模块，用于将第一数字信号转换成第一模拟电信号；

第二DA转换模块，用于将输出数字信号转换成第二模拟电信号；

AD转换模块，用于将麦克风采集语音信号转换成语音数字信号，以及将误差电信号转换成误差数字信号。

语音识别模块，用于对语音数字信号进行语音识别。

优选地，麦克风采集的声音信号转换成第三模拟电信号，与第二模拟电信号与进行耦合叠加。

优选地，所述滤波器为自适应滤波器。

本发明提供的一种用于语音识别过程的回声消除方法及语音识别设备，将数字信号分成第一数字信号和第二数字信号，第一数字信号直接转换成第一模拟电信号，第二数字信号经过滤波转换成第二模拟电信号，在模拟电路上进行回声消除，解决了现有技术中在数字域消除噪声的缺陷，在无需音腔进行高效隔离，无需降低音乐音量或提示音，也无需降低AD增益的情况下，有效提高了语音识别率。同时本发明在滤波过程中利用第一模拟电信号和第二模拟电信号耦合叠加的误差电信号指导滤波器输出数字信号，有效提高了回声消除的效果，提高语音信号的纯净性。

应当理解，前述大体的描述和后续详尽的描述均为示例性说明和解释，并不应当用作对本发明所要求保护内容的限制。

附图说明

参考随附的附图，本发明更多的目的、功能和优点将通过本发明实施方式的如下描述得以阐明，其中：

图1示意性示出了本发明回声消除的语音设备框图；

图2示出了本发明用于语音识别过程的回声消除方法的信号路径示意图；

图3示出了本发明滤波器更新输出数字信号的信号路径示意图。

具体实施方式

通过参考示范性实施例，本发明的目的和功能以及用于实现这些目的和功能的方法将得以阐明。然而，本发明并不受限于以下所公开的示范性实施例；可以通过不同形式来对其加以实现。说明书的实质仅仅是帮助相关领域技术人员综合理解本发明的具体细节。

在下文中，将参考附图描述本发明的实施例，相关技术术语应当是本领域技术人员所熟知的。在附图中，相同的附图标记代表相同或类似的部件，或者相同或类似的步骤，除非另有说明。下面结合具体的实施例对本发明的内容进一步的阐释，为了使本发明的内容得以更加清晰的说明，首先对本发明的一个方面实现回声消除的语音识别设备说明。如图1所示本发明回声消除的语音设备框图，本发明的实现回声消除的语音设备具有模拟电路200和数字域100，在数字域100中所有信号以数学信号进行通信。在模拟电路200中所有信号以模拟电信号进行信号传输。实施例中，一种回声消除的语音识别设备，包括音响201和麦克风202，以及：

数字播放单元101，其播放的数字信号分成第一数字信号和第二数字信号两路。

滤波器103，用于接收第二数字信号，并将第二数字信号经滤波后转换成输出数字信号，以及通过误差数字信号更新输出数字信号。优选地，滤波器103为自适应滤波器。

语音识别模块102，用于对语音数字信号进行语音识别。

第一DA转换模块301，用于将第一数字信号转换成第一模拟电信号。

第二DA转换模块302，用于将输出数字信号转换成第二模拟电信号。

AD转换模块303，用于将麦克风采集语音信号转换成语音数字信号，以及将误差电信号转换成误差数字信号。

根据本发明，数字播放单元101、滤波器103、语音识别模块102位于数字域100，进行数字信号通信；音响201和麦克风202位于模拟电路200，进行模拟电信号传输。第一DA转换模块301、第二DA转换模块302和AD转换模块303完成数字域100中数字信号与模拟电路200中模拟电信号的转换。麦克风202采集的声音信号转换成第三模拟电信号，与第二模拟电信号与进行耦合叠加。应当理解，音箱201将第一模拟电信号转换成声音信号，麦克风202采集声音信号并将其转换成成第三模拟电信号。

如图2所示本发明用于语音识别过程的回声消除方法的信号路径示意图，根据本发明本，实施例中一种用于语音识别过程的回声消除方法包括：

将数字播放单元101播放的数字信号分成第一数字信号和第二数字信号两路，其中第一数字信号经过第一DA转换模块301转换成第一模拟电信号，音箱201将第一模拟电信号转换成声音信号进行播放，使用者400收听音箱201播放的声音信号，同时麦克风采集声音信号并转换成第三模拟电信号。应当理解，音箱201将第一模拟电信号转换成声音信号，麦克风202采集声音信号并将其转换成第三模拟电信号d(t)。

麦克风202在采集声音信号转换成第三模拟电信号的同时采集使用者400发出的语音信号。

第二数字信号x(n)经过滤波器103滤波后转换成输出数字信号y(n)，输出数字信号y(n)经过第二DA转换模块302转换成第二模拟电信号y(t)。优选地，滤波器为自适应滤波器。

第二模拟电信号y(t)与所述麦克风采集的第一模拟电信号d(t)进行耦合叠加，在模拟电路中完成回声信号消除，并计算误差电信号，其中所述误差电信号通过如下方法计算：

误差电信号e(t)经过AD转换模块303转换成误差数字信号e(n)，滤波器103通过误差数字信号e(n)进行输出数字信号y(n)更新。

上述过程中滤波器103数字输出信号y(n)的更新通过如下方法进行：

S1、将误差电信号e(t)经过AD转换模块303转换成误差数字信号e(n)。

S2、更新权向量：w(n+1)＝w(n)+2μe(n)x(n)，其中，w(n)为权向量，e(n)为误差数字信号，x(n)为第二数字信号，μ为步长参数。

S3、更新输出数字信号：y(n)＝w^T(n)x(n)，其中，y(n)为输出数字信号，w^T(n)为权向量的转置向量，x(n)为第二数字信号。

上述输出数字信号y(n)更新过程中，为了保证滤波器稳定性和收敛速度，步长参数μ满足：0＜μ＜2/MP_in，其中，M为滤波器长度，P_in＝E[x²(n)]为第二数字信号的输入功率。

根据本发明，实施例中利用数字播放单元101播放的信号进行回声消除。在滤波过程中，利用第三模拟电信号d(t)和第二模拟电信号y(t)耦合叠的加误差电信号e(t)转换成误差数字信号e(n)指导滤波器输出数字信号y(n)的更新，利用更新后的误差信号在模拟电路中进行回声消除，有效提高了回声消除的效果。

实施例中麦克风202采集语音信号的同时采集声音信号，并将声音信号转换成第三模拟电信号，将第三模拟电信号进行耦合叠加后对回声进行消除，语音信号经过AD转换模块转换成语音数字信号传输至语音识别模块进行语音识别。本发明中由于通过数字播放单元自身的信号指导滤波器输出数字信号，同时在模拟电路中进行回声消除。

本发明提供的一种用于语音识别过程的回声消除方法及语音识别设备，将数字信号分成第一数字信号和第二数字信号，第一数字信号转换成第一模拟电信号，第二数字信号经过滤波转换成第二模拟电信号，在模拟电路上对第三模拟电信号进行耦合叠加进行回声消除，解决了现有技术中在数字域消除噪声的缺陷，在无需音腔进行高效隔离，无需降低音乐音量或提示音，也无需降低AD增益的情况下，有效提高了语音识别率。同时本发明在滤波过程中利用第三模拟电信号和第二模拟电信号耦合叠加的误差电信号指导滤波器输出数字信号，有效提高了回声消除的效果，提高语音信号的纯净性。

结合这里披露的本发明的说明和实践，本发明的其他实施例对于本领域技术人员都是易于想到和理解的。说明和实施例仅被认为是示例性的，本发明的真正范围和主旨均由权利要求所限定。

Claims

1.一种用于语音识别过程的回声消除方法，其特征在于，所述方法包括：

将数字信号分成第一数字信号和第二数字信号两路，其中所述第一数字信号经过第一DA转换模块转换成第一模拟电信号送至播放器播放声音信号，麦克风采集所述声音信号并将所述声音信号转换成第三模拟电信号；

所述误差电信号经过AD转换模块转换成误差数字信号，所述滤波器通过所述误差数字信号进行输出数字信号更新；

所述麦克风采集语音信号的同时采集所述声音信号；所述语音信号经过AD转换模块转换成语音数字信号用于语音识别。

2.根据权利要求1所述的回声消除方法，其特征在于，所述误差电信号通过如下方法计算：

3.根据权利要求1所述的回声消除方法，其特征在于，所述滤波器数字输出信号的更新通过如下方法进行：

a)将误差电信号经过AD转换模块转换成误差数字信号，

4.根据权利要求3所述的回声消除方法，其特征在于，所述步长参数μ满足：0＜μ＜2/MP_in，其中，M为滤波器长度，P_in＝E[x²(n)]为第二数字信号的输入功率。

5.根据权利要求1所述的回声消除方法，其特征在于，所述滤波器为自适应滤波器。

6.一种回声消除的语音识别设备，包括音响和麦克风，其特征在于，所述语音识别设备还包括：

AD转换模块，用于将麦克风采集语音信号转换成语音数字信号，以及将误差电信号转换成误差数字信号；

语音识别模块，用于对语音数字信号进行语音识别；

其中，所述麦克风采集的声音信号转换成第三模拟电信号，与所述第二模拟电信号进行耦合叠加，计算得到误差电信号；

所述误差电信号经过所述AD转换模块转换成误差数字信号，所述滤波器通过所述误差数字信号进行输出数字信号更新。

7.根据权利要求6所述的语音识别设备，其特征在于，所述滤波器为自适应滤波器。