CN110913310A

CN110913310A - 一种播音失真纠正的回声消除方法

Info

Publication number: CN110913310A
Application number: CN201811072932.1A
Authority: CN
Inventors: 何云鹏; 高君效; 余杰
Original assignee: Chipintelli Technology Co Ltd
Current assignee: Chipintelli Technology Co Ltd
Priority date: 2018-09-14
Filing date: 2018-09-14
Publication date: 2020-03-24

Abstract

一种播音失真纠正的回声消除方法,包括如下步骤:纠正前的采集失真系数矩阵C(K，M),其中变量K，M表征音频信号和电学信号的频域子带序号，所述失真系数矩阵C(K，M)=D（K）/d（M）,其中D（K）表示设备麦克风采集到的音频信号，d（M）表示设备播放前的电学信号；纠正时,采集设备播放前的电学信号d（M）及麦克风采集到的混合音频信号Y（K）；所述混合音频信号Y（K）包括原声信号X（K）和设备系统回音S（K）；则原声信号

=Y（K）‑G（K）*D（K）=Y（K）‑G（K）*ΣC（K,M）*d(M)。本发明所述回声消除方法，通过计算采集失真系数C(K，M)对设备系统噪声进行修正计算，提高了回声消除精度。

Description

一种播音失真纠正的回声消除方法

技术领域

本发明属于人工智能语音识别技术领域，具体涉及一种播音失真纠正的回声消除方法。

背景技术

当前众多语音识别设备都通过麦克风等装置进行声音的采集，需要从采集的声音中提取出干净的原声信号，用于语音识别，以提升语音识别的识别率。但有部分设备在工作时，自身会发出声音，这样通过麦克风采集的声音需要去除设备自身发音的部分信息，才能准确甄别出原声用于识别，该方法即目前常用的回声消除技术。

现有的回声消除技术基本是利用相干相消原理,将麦克风等装置采集的声音信号转化为电学信号，该声音信号包含了原声和设备通过喇叭等装置播放出来的自身音频信号的叠加；同时需要同步采集设备自身的音频信号，转化为电学信号；再将麦克风等装置采集到的叠加的音频信号通过频域计算，在各个频域子带中去除采集到的设备自身的音频信号，即可得到原声信号。其计算公式如下：

设声音频域中有多个频谱子带，麦克风采集到的声音的混合音频信号为Y（K），原声信号为X（K），采集设备自身的音频矢量信号为S（K），如图1所示，其中K表示频率,则可得到其相关计算式为：

Y（K）=X（K）+ S（K）；

按现有做法，只需要采集到Y和S，再将这些音频电信号转化为频域矢量，通过上述计算公式，X（K）=Y（K）-S（K），就可以通过频域去除掉设备自身发音的影响，得到干净的原声X，用于语音识别。

在消回声时，设备喇叭发出音频信号往往无法和原声信号X（K）分开采集得到，而是将设备送到喇叭前的线路音频电学信号d(K)作为参考信号，由公式

，其中G(K)为回声泄漏因子，由

估算得到,分子为作为参考信号的d(K)与混合音频信号Y（K）的互相关函数，取决于麦克混合音频信号中喇叭音频分量和电子线路音频信号的相关性，分母为d(K)信号的自相关函数,其中d(K)^*表示d(K)的共轭函数。

在实际使用中，由于设备自身发音推送的电信号是通过喇叭发音的，上述方法在使用时需保证喇叭在播放设备自身发音的电信号时不存在失真，否则麦克混合音频信号中喇叭音频分量和线路音频信号的相关性就会被破坏，Y中包含的S信号就不能准确地由线路信号估算出来，会极大的影响回声消除的效果。但在现实中,由于喇叭质量参差不齐，同时音量较大时会产生非线性失真，谐波失真等现象，造成声音信号转化的失真；同时不同设备由于外界因素如供电电压或电路板设计布局等，都会对声音这类的模拟信号产生波动，对音频信号与电学信号的相互转换过程存在系统误差,这个误差直接导致了现有技术中回声消除效果变差。

发明内容

为克服现有技术存在的技术缺陷，本发明公开了一种播音失真纠正的回声消除方法。

本发明所述播音失真纠正的回声消除方法,包括如下步骤:

纠正前的采集失真系数矩阵C(K，M), 其中变量K，M表征音频信号和电学信号的频域子带序号，所述失真系数矩阵C(K，M)=D（K）/ d（M）,其中D（K）表示设备麦克风采集到的音频信号，d（M）表示设备播放前的电学信号；

纠正时,采集设备播放前的电学信号d（M）及麦克风采集到的混合音频信号Y（K）；所述混合音频信号Y（K）包括原声信号X（K）和设备系统回音S（K）；

Y（K）= X（K）+ S（K），

则原声信号

= Y（K）- G（K）* D（K）= Y（K）- G（K）* ΣC（K,M）* d(M),其中

。

优选的，所述纠正前采集失真系数C(K，M)的方法具体为：将设备放置在静音环境下,正常开机,依次遍历K= 0,1…Kmax; M= 0,1…Kmax;Kmax为最大频率子带,采集D（K）和d（M）,利用C(K，M)=D（K）/ d（M）计算每一矩阵参数,构造出失真系数矩阵C(K，M)。

本发明所述回声消除方法，通过计算采集失真系数C(K，M)对设备系统噪声进行修正计算，提高了回声消除精度。

附图说明

图1为本发明所述设备在进行播音时的信号传输示意图；

图2为本发明一个具体实施方式的流程示意图。

具体实施方式

下面对本发明的具体实施方式作进一步的详细说明。

本发明所述回声消除方法，包括纠正前的采集失真系数矩阵C(K，M),其中变量K，M表征音频信号和电学信号的频域子带序号，所述失真系数C(K)=D（K）/ d（M）,其中D（K）表示设备麦克风采集到的音频信号，d（M）表示喇叭播放前的音频电学信号；纠正前环境中可以不存在其他声源;

纠正时,环境中存在原声声源,采集设备播放前的线路电学信号d（K）及麦克风采集到的混合音频信号Y（K）;所述混合音频信号Y（K）包括了原声信号X（K）和设备系统噪音即喇叭音频信号S（K）;

即Y（K）= X（K）+ S（K）;

对于S（K）由公式S（K）=G(K)*D(K)

经过校正后

，作为校正后的参考信号,代入上式；可以得到

原声信号X（K）= Y（K）- S（K）= Y（K）- G（K）* Σ C（K,M）* d(M)。此处求和为对M进行求和。

本发明针对由于设备自身原因如因喇叭和电路板干扰等问题导致的设备自身的音频矢量信号在信号传输路径及播音中失真造成的影响。

设在没有信号源和环境干扰状态下，设备线路在输入喇叭前的音频电学信号为 d（M）,M为音频电学信号的频域语音子带序号，麦克风采集到的自身喇叭音频信号为D（K），K为音频信号的频域语音子带序号,频域子带为将全频带划分为多个连续分布的包含一定频率区间的子带,各个频域子带组成完成的全频带。

完全理想状态下,当K = M时，D（K）与d（M）完全成线性关系,即D（K）=

* d（K）其中

为一常数，上式为与频率无关的正比关系 ;理想状态下也不存在不同频率间影响，即K不等于M时，D（K）= 0。

但实际中，经过喇叭失真和电路板干扰等实际情况，各种干扰对信号造成的影响，其影响因子由失真系数C(K，M)描述，C（K,M ）表现形式通常为一个包括各个频域子带K,M下的矩阵系数， C（K,M ）矩阵中的行列元素既包含了同一子带下（即K=M时）的失真系数，也包含线路音频信号某个频率子带对喇叭音频信号其他频率子带的影响(即K不等于M时)。

则此时可得到：

C（K,M ）=D(K)/d(K)

对于不同的设备，或者不同的工作状态下都可能存在不同的失真系数C(K,M);对于失真系数的一种优选采集方法是：将该设备放置到完全安静或尽可能安静的场合中正常开机，所谓正常开机是使设备工作在通常状态下；此时麦克风采集到的混合音频信号Y（K）信号中没有原声信号X（K），只有系统自身噪音，即Y（K）= D（K）。

设备喇叭前端线路音频电学信号为d（M），设定一个M值,根据Y（K）= D（K）= C（K，M）* d（M），依次取K覆盖全部频率子带，其中K= 0,1…Kmax;Kmax为最大频率子带，可得到C（K，M）= D（K）/ d（M）；此时让设备连续播放针对覆盖所有子带的不同频率子带M的参考声音信号，就可以通过麦克风测量在不同频率子带M下的D（K）信号，及采集到的d（M）信号，利用C（K，M）= D（K）/ d（M）得到当前子带频率M下的C（K，M）信号。

按照上述步骤遍历所有M值,M= 0,1…Kmax,将所有子带的C（K，M）参数汇总为矩阵，即可以得到该设备自身的采集失真系数C（K，M）矩阵，此时在实际使用中，只需要将该已知的C（K，M）带入计算公式

，就可以得到和喇叭声音S完全相关的更精准的参考信号。原声信号X（K）= Y（K）- S（K）= Y（K）- G（K）*C（K,M）* d(M)，可以精准的消除该设备由于喇叭及主电路板传播失真等因素造成的失真和电路干扰等问题，得到准确的原声。其中G（K）可以由

计算得到,D(K)在纠正时根据

获得。

前文所述的为本发明的各个优选实施例，各个优选实施例中的优选实施方式如果不是明显自相矛盾或以某一优选实施方式为前提，各个优选实施方式都可以任意叠加组合使用，所述实施例以及实施例中的具体参数仅是为了清楚表述发明人的发明验证过程，并非用以限制本发明的专利保护范围，本发明的专利保护范围仍然以其权利要求书为准，凡是运用本发明的说明书及附图内容所作的等同结构变化，同理均应包含在本发明的保护范围内。

Claims

1.一种播音失真纠正的回声消除方法,其特征在于,包括如下步骤:

纠正前的采集失真系数矩阵C(K，M), 其中变量K，M分别表征音频信号和电学信号的频域子带序号，所述失真系数矩阵C(K，M)=D（K）/ d（M）,其中D（K）表示设备麦克风采集到的音频信号，d（M）表示设备播放前的电学信号；

Y（K）= X（K）+ S（K），

则原声信号

= Y（K）- G（K）* D（K）= Y（K）- G（K）* ΣC（K,M）* d(M),其中

。

2.如权利要求1所述的回声消除方法，其特征在于，所述纠正前采集失真系数C(K，M)的方法具体为：将设备放置在静音环境下,正常开机,依次遍历K= 0,1…Kmax; M= 0,1…Kmax;Kmax为最大频率子带,采集D（K）和d（M）,利用C(K，M)=D（K）/ d（M）计算每一矩阵参数,构造出失真系数矩阵C(K，M)。