CN105989850A - 一种回声对消方法及装置 - Google Patents

一种回声对消方法及装置 Download PDF

Info

Publication number
CN105989850A
CN105989850A CN201610499011.8A CN201610499011A CN105989850A CN 105989850 A CN105989850 A CN 105989850A CN 201610499011 A CN201610499011 A CN 201610499011A CN 105989850 A CN105989850 A CN 105989850A
Authority
CN
China
Prior art keywords
array
microphone array
reference signal
determining
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610499011.8A
Other languages
English (en)
Other versions
CN105989850B (zh
Inventor
李健
张连毅
武卫东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING INFOQUICK SINOVOICE SPEECH TECHNOLOGY CORP
Original Assignee
BEIJING INFOQUICK SINOVOICE SPEECH TECHNOLOGY CORP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING INFOQUICK SINOVOICE SPEECH TECHNOLOGY CORP filed Critical BEIJING INFOQUICK SINOVOICE SPEECH TECHNOLOGY CORP
Priority to CN201610499011.8A priority Critical patent/CN105989850B/zh
Publication of CN105989850A publication Critical patent/CN105989850A/zh
Application granted granted Critical
Publication of CN105989850B publication Critical patent/CN105989850B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明实施例提供了一种回声对消方法及装置,其中的方法具体包括:根据参考信号及麦克风阵列各阵元采集的数据,确定所述各阵元对应通道的滤波系数;根据所述滤波系数及所述参考信号对所述麦克风阵列各阵元采集的数据进行滤波,以完成所述麦克风阵列各阵元采集的数据的回声对消,得到各阵元对应通道的目标数据。本发明实施例能够提升回声对消的速度,且得到较好的回声对消效果。

Description

一种回声对消方法及装置
技术领域
本发明涉及数据处理技术领域,尤其涉及一种回声对消方法及装置。
背景技术
目前在智能家居、智能音箱等场景下使用的麦克风阵列,在音箱播放音乐或其他声音的情况下采集用户的语音信息时,一般会将智能家居、智能音箱的音箱或喇叭播放的声音一起采集进麦克风,从而影响对用户语音信息的识别,进而影响对声源方向的估计,这样就需要在音箱播放音乐或其他声音的情况下进行麦克风的回声对消过程。
现有的一种回声对消方法为以LMS(最小均方误差,least mean square)为代表的一系列迭代方法,该迭代方法具体包括:归一化LMS,分块LMS,频域LMS等等方法,其回声对消的过程是对麦克风阵列的多路输入信号分别进行回声对消。
上述现有的回声对消方法的问题是需要一直进行多路信号的回声对消,这样一来,将耗费大量的计算资源,低端的电路或芯片难以实时完成;且由于回声对消的方法是迭代算法,因此若仅在需要时再进行回声对消,则算法很难理立刻完成收敛,回声对消的效果较差。
发明内容
本发明实施例提供一种回声对消方法,以解决现有的回声对消方法耗费大量的计算资源,低端的电路或芯片难以实时完成,回声对消的效果较差的问题。
第一方面,本发明实施例提供了一种回声对消方法,所述方法包括:
根据参考信号及麦克风阵列各阵元采集的数据,确定所述各阵元对应通道的滤波系数;
根据所述滤波系数及所述参考信号对所述麦克风阵列各阵元采集的数据进行滤波,以完成所述麦克风阵列各阵元采集的数据的回声对消,得到各阵元对应通道的目标数据。
优选的,所述根据参考信号及麦克风阵列各阵元采集的数据,确定所述各阵元对应通道的滤波系数的步骤,包括:
确定所述参考信号的自相关矩阵;
根据所述麦克风阵列各阵元采集的数据及所述参考信号,确定所述麦克风阵列各阵元对应通道与所述参考信号的互相关向量;
根据所述自相关矩阵的逆矩阵及所述互相关向量确定所述滤波系数。
优选的,所述根据所述滤波系数及所述参考信号对所述麦克风阵列各阵元采集的数据进行滤波的步骤,包括:
对所述滤波系数进行补偿,以得到补偿滤波系数,并对所述补偿滤波系数进行快速傅里叶变换,得到补偿滤波系数变换结果;其中,所述补偿滤波系数为2的整数次幂;
分别对所述麦克风阵列各阵元采集的数据进行补偿,以得到补偿麦克风阵列数据,并对所述补偿麦克风阵列数据进行快速傅里叶变换,得到补偿麦克风阵列数据变换结果;其中,所述补偿麦克风阵列数据为2的整数次幂;
对所述参考信号进行补偿,以得到补偿参考信号,并对所述补偿参考信号进行快速傅里叶变换,得到补偿参考信号变换结果;其中,所述补偿参考信号为2的整数次幂;
根据所述补偿滤波系数变换结果、所述补偿麦克风阵列数据变换结果、及所述补偿参考信号变换结果,得到所述各阵元对应通道的目标数据。
优选的,所述根据所述补偿滤波系数变换结果、所述补偿麦克风阵列数据变换结果、所述补偿参考信号变换结果得到所述各阵元对应通道的目标数据的步骤,包括:
确定所述补偿滤波系数变换结果与所述补偿参考信号变换结果的乘积为第一乘积结果;
确定所述补偿麦克风阵列数据变换结果与所述第一乘积结果的差值为所述各阵元对应通道的目标数据。
优选的,所述方法还包括:
根据所述各阵元对应通道的目标数据对声源方向进行定位;
其中,所述根据所述各阵元对应通道的目标数据对声源方向进行定位的步骤,包括:
根据所述麦克风阵列中相邻的两个阵元对应的通道所对应的所述目标数据确定所述相邻的两个阵元对应的通道的广义相关函数;其中,所述广义相关函数的个数为N-1个,所述N为所述麦克风阵列中阵元的个数;
确定所述广义互相关函数中最大值对应的频点索引值为估计结果;其中,所述估计结果的个数为N-1个;
确定所述N-1个所述估计结果的平均值;
根据所述平均值及所述补偿麦克风阵列数据确定所述时延值;
根据所述时延值及所述麦克风阵列中阵元的间距确定所述声源方向。
第二方面,本发明实施例还提供了一种回声对消装置,所述装置包括:
第一确定模块,用于根据参考信号及麦克风阵列各阵元采集的数据,确定所述各阵元对应通道的滤波系数;
滤波模块,用于根据所述滤波系数及所述参考信号对所述麦克风阵列各阵元采集的数据进行滤波,以完成所述麦克风阵列各阵元采集的数据的回声对消,得到各阵元对应通道的目标数据。
优选的,所述第一确定模块,包括:
第一确定单元,用于确定所述参考信号的自相关矩阵;
第二确定单元,用于根据所述麦克风阵列各阵元采集的数据及所述参考信号,确定所述麦克风阵列各阵元对应通道与所述参考信号的互相关向量;
第三确定单元,用于根据所述自相关矩阵的逆矩阵及所述互相关向量确定所述滤波系数。
优选的,所述滤波模块,包括:
第一补偿单元,用于对所述滤波系数进行补偿,以得到补偿滤波系数,并对所述补偿滤波系数进行快速傅里叶变换,得到补偿滤波系数变换结果;其中,所述补偿滤波系数为2的整数次幂;
变换单元,用于分别对所述麦克风阵列各阵元采集的数据进行补偿,以得到补偿麦克风阵列数据,并对所述补偿麦克风阵列数据进行快速傅里叶变换,得到补偿麦克风阵列数据变换结果;其中,所述补偿麦克风阵列数据为2的整数次幂;
第二补偿单元,用于对所述参考信号进行补偿,以得到补偿参考信号,并对所述补偿参考信号进行快速傅里叶变换,得到补偿参考信号变换结果;其中,所述补偿参考信号为2的整数次幂;
目标数据获得单元,用于根据所述补偿滤波系数变换结果、所述补偿麦克风阵列数据变换结果、及所述补偿参考信号变换结果,得到所述各阵元对应通道的目标数据。
优选的,所述目标数据获得单元包括:
第一确定子单元,用于确定所述补偿滤波系数变换结果与所述补偿参考信号变换结果的乘积为第一乘积结果;
第二确定子单元,用于确定所述补偿麦克风阵列数据变换结果与所述第一乘积结果的差值为所述各阵元对应通道的目标数据。
优选的,所述装置还包括:
定位模块,用于根据所述各阵元对应通道的目标数据对声源方向进行定位;
其中,所述定位模块,包括:
第四确定单元,用于根据所述麦克风阵列中相邻的两个阵元对应的通道所对应的所述目标数据确定所述相邻的两个阵元对应的通道的广义相关函数;其中,所述广义相关函数的个数为N-1个,所述N为所述麦克风阵列中阵元的个数;
第五确定单元,用于确定所述广义互相关函数中最大值对应的频点索引值为估计结果;其中,所述估计结果的个数为N-1个;
第六确定单元,用于确定所述N-1个所述估计结果的平均值;
第七确定单元,用于根据所述平均值及所述补偿麦克风阵列数据确定所述时延值;
第八确定单元,用于根据所述时延值及所述麦克风阵列中阵元的间距确定所述声源方向。
综上,本发明实施例提供的一种回声对消方法及装置,采用滤波器滤波的方式同时对麦克风阵列采集的多路数据进行滤波,通过参考信号及麦克风阵列各阵元采集的数据确定所述各阵元对应通道的滤波系数,并根据所述滤波系数完成上述麦克风阵列采集的多路数据的回声对消;相对于现有的回声对消方法对麦克风阵列的多路输入信号分别进行回声对消,本发明实施例采用滤波器滤波的方式同时对麦克风阵列采集的多路数据进行滤波,也即能够同时对麦克风阵列采集的多路数据进行回声对消过程,因此可以节约计算量;且由于本发明实施例对各类数据信号(滤波系数、参考信号、麦克风阵列阵元采集的数据)进行快速傅里叶变换,使得各类数据信号由时域信号变换为频域信号,之后采用频域乘积的方式完成时域卷积的滤波运算,提升了计算速度,进而提升了回声对消的速度;并且由于上述多路数据的回声对消过程可以一次完成,能够使得上述回声对消过程不受迭代算法的收敛影响,因此回声对消的效果较好。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的一种回声对消方法实施例一的流程图;
图2是本发明的一种回声对消方法实施例二的流程图;
图3是本发明的一种回声对消装置实施例一的结构示意图;
图4是本发明的一种回声对消装置实施例二的结构示意图;
图5是本发明的一种回声对消装置实施例三的结构示意图;及
图6是本发明的一种回声对消装置实施例四的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
方法实施例一
参照图1,示出了本发明的一种回声对消方法实施例一的流程图,具体可以包括如下步骤:
步骤101、根据参考信号及麦克风阵列各阵元采集的数据确定所述各阵元对应通道的滤波系数;
本发明实施例可以应用于安装有麦克风阵列的终端及场景中,例如:智能手机、平板电脑、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、穿戴式设备等等终端中,及声呐探测、视频电话会议、人工智能、语音追踪与识别、监控系统等场景中,用以对麦克风采集的数据进行回声对消,以得到目标数据。
本发明实施例中,上述麦克风阵列各阵元采集的数据包括用户的语音信息及对用户的语音信息产生干扰的声音信息,例如:音箱或喇叭播放的声音;上述参考信息为上述麦克风阵列各阵元采集的数据中包含的对用户的语音信息产生干扰的声音信息,例如:音箱或喇叭播放的声音,其可以通过linein的方式接入麦克风阵列中。
本发明实施例中,麦克风阵列中呈线性均匀分布有M个麦克风,该M个麦克风即为麦克风阵列中的M个阵元,该M个阵元的序列号依次分别为1、2、3、……;该M个阵元对应的通道的序列号也分别为1、2、3、……;则本发明实施例中可以根据参考信号及上述M个阵元采集的数据确定所述M个阵元对应M个通道的M个滤波系数。
在本发明的一种可选实施例中,上述根据参考信号及麦克风阵列各阵元采集的数据确定所述各阵元对应通道的滤波系数的步骤,具体可以包括:
步骤A1、确定所述参考信号的自相关矩阵;
本发明实施例中,可以采用维纳解的方式进行滤波器估计,假设参考信号为r(n),其中,n为大于等于0且小于等于N-1的整数,其中,N可以表示上述参考信号采样点的总数;本发明实施例中,上述确定的参考信号的自相关矩阵参照下述矩阵1:
其中,上述Rrr可以表示上述参考信号的自相关矩阵;上述J表示滤波器的滤波器阶数;上述其中,上述j可以用于表示1-J至J-1中的整数。
步骤A2、根据所述麦克风阵列各阵元采集的数据及所述参考信号,确定所述麦克风阵列各阵元对应通道与所述参考信号的互相关向量;
本发明实施例中,假设麦克风阵列各阵元采集的数据为xm(n),其中,m=0,1,...,M-1是各阵元对应的通道的通道号;M为总的通道数;确定所述麦克风阵列各阵元对应通道与所述参考信号的互相关向量可以参照下述矩阵2:
R x m r = R x m r ( 0 ) R x m r ( 1 ) . . . R x m r ( J - 1 ) - - - ( 2 )
其中,上述可以表示通道号为m的通道与所述参考信号的互相关向量;上述其中,上述j为0至J-1范围内的整数。
步骤A3、根据所述自相关矩阵的逆矩阵及所述互相关向量确定所述滤波系数。
本发明实施例中,可以确定上述Rrr的逆矩阵为需要说明的是,由上述Rrr至逆矩阵的计算过程参照现有根据对矩阵求逆的过程即可,本发明实施例在此对上述逆矩阵的计算过程不加以赘述。
本发明实施例中,根据所述逆矩阵及所述互相关向量确定所述滤波系数的过程可以参照下述公式一:
其中,上述hm可以表示通道号为m的通道对应的滤波系数;上述可以表示上述逆矩阵,上述可以表示通道号为m的通道与所述参考信号的互相关向量。
步骤102、根据所述滤波系数及所述参考信号对所述麦克风阵列各阵元采集的数据进行滤波,以完成所述麦克风阵列各阵元采集的数据的回声对消,得到各阵元对应通道的目标数据。
在本发明的一种可选实施例中,上述根据所述滤波系数及所述参考信号对所述麦克风阵列各阵元采集的数据进行滤波的步骤,具体可以包括:
步骤B1、对所述滤波系数进行补偿,以得到补偿滤波系数,并对所述补偿滤波系数进行快速傅里叶变换,得到补偿滤波系数变换结果;其中,所述补偿滤波系数为2的整数次幂;
本发明实施例中,对上述滤波系数进行补偿,直至补偿该滤波系数至大于等于J+N-1且为2的整数次幂为止,以得到补偿滤波系数,其中,上述N可以表示上述参考信号采样点的总数,上述J表示滤波器的滤波器阶数;并对该补偿滤波系数进行快速傅里叶变换,得到补偿滤波系数变换结果Hm(k);其中,上述对补偿滤波系数进行快速傅里叶变换,得到补偿滤波系数变换结果Hm(k)的过程,调用数字信号处理领域成熟的FFT函数完成即可,本发明实施例对此不再赘述。
步骤B2、分别对所述麦克风阵列各阵元采集的数据进行补偿,以得到补偿麦克风阵列数据,并对所述补偿麦克风阵列数据进行快速傅里叶变换,得到补偿麦克风阵列数据变换结果;其中,所述补偿麦克风阵列数据为2的整数次幂;
本发明实施例中,对上述麦克风阵列数据进行补偿,直至补偿该麦克风阵列数据至大于等于J+N-1且为2的整数次幂为止,其中,上述N可以表示上述参考信号采样点的总数,上述J表示滤波器的滤波器阶数;并对该补偿麦克风阵列数据进行快速傅里叶变换,得到补偿麦克风阵列数据变换结果Xm(k);其中,上述对补偿该麦克风阵列数据进行快速傅里叶变换,得到补偿麦克风阵列数据变换结果Xm(k)的过程,调用数字信号处理领域成熟的FFT函数完成即可,本发明实施例对此不再赘述。
步骤B3、对所述参考信号进行补偿,以得到补偿参考信号,并对所述补偿参考信号进行快速傅里叶变换,得到补偿参考信号变换结果;其中,所述补偿参考信号为2的整数次幂;
本发明实施例中,对上述参考信号进行补偿,直至补偿该参考信号至大于等于J+N-1且为2的整数次幂为止,其中,上述N可以表示上述参考信号采样点的总数,上述J表示滤波器的滤波器阶数;并对该补偿参考信号进行快速傅里叶变换,得到补偿参考信号变换结果Um(k);其中,上述对补偿参考信号进行快速傅里叶变换,得到补偿参考信号变换结果Xm(k)的过程,调用数字信号处理领域成熟的FFT函数完成即可,本发明实施例对此不再赘述。
步骤B4、根据所述补偿滤波系数变换结果、所述补偿麦克风阵列数据变换结果、及所述补偿参考信号变换结果得到所述各阵元对应通道的目标数据。
在本发明的一种可选实施例中,上述所述根据所述补偿滤波系数变换结果、所述补偿麦克风阵列数据变换结果、所述补偿参考信号变换结果得到所述各阵元对应通道的目标数据的步骤,具体可以包括:
步骤C1、确定所述补偿滤波系数与所述补偿参考信号的乘积为第一乘积结果;
步骤C2、确定所述补偿麦克风阵列数据与所述第一乘积结果的差值为所述各阵元对应通道的目标数据。
本发明实施例中,可以根据公式(2)完成上述步骤C1及步骤C2的过程:
Ym(k)=Xm(k)-U(k)Hm(k) (2)
其中,上述Ym(k)可以表示上述通道号为m的通道对应的目标数据;上述U(k)Hm(k)可以表示上述第一乘积结果;
本发明实施例中,当麦克风阵列中存在m个阵元时,相应的通道即为m个,则最终确定的目标数据即为m个。
综上,本发明实施例提供的一种回声对消方法,采用滤波器滤波的方式同时对麦克风阵列采集的多路数据进行滤波,通过参考信号及麦克风阵列各阵元采集的数据确定所述各阵元对应通道的滤波系数,并根据所述滤波系数完成上述麦克风阵列采集的多路数据的回声对消;相对于现有的回声对消方法对麦克风阵列的多路输入信号分别进行回声对消,本发明实施例采用滤波器滤波的方式同时对麦克风阵列采集的多路数据进行滤波,也即能够同时对麦克风阵列采集的多路数据进行回声对消过程,因此可以节约计算量;且由于本发明实施例对各类数据信号(滤波系数、参考信号、麦克风阵列阵元采集的数据)进行快速傅里叶变换,使得各类数据信号由时域信号变换为频域信号,之后采用频域乘积的方式完成时域卷积的滤波运算,提升了计算速度,进而提升了回声对消的速度;并且由于上述多路数据的回声对消过程可以一次完成,能够使得上述回声对消过程不受迭代算法的收敛影响,因此回声对消的效果较好。
方法实施例二
参照图2,示出了本发明一种回声对消方法实施例二的步骤流程图,具体可以包括:
步骤201、根据参考信号及麦克风阵列各阵元采集的数据确定所述各阵元对应通道的滤波系数;
步骤202、根据所述滤波系数及所述参考信号对所述麦克风阵列各阵元采集的数据进行滤波,以完成所述麦克风阵列各阵元采集的数据的回声对消,得到各阵元对应通道的目标数据。
步骤203、根据所述各阵元对应通道的目标数据对声源方向进行定位。
在本发明的一种可选实施例中,上述根据所述各阵元对应通道的目标数据对声源方向进行定位的步骤,具体可以包括:
步骤D1、根据所述麦克风阵列中相邻的两个阵元对应的通道所对应的所述目标数据确定所述相邻的两个阵元对应的通道的广义相关函数;其中,所述广义相关函数的个数为N-1个,所述N为所述麦克风阵列中阵元的个数;
本发明实施例中,假设麦克风阵列中相邻的两个阵元为序列号为m及m+1的阵元,则所述序列号为m及m+1的阵元的广义相关函数为:
GCC m , m + 1 ( k ) = I F F T { Y m ( k ) Y m + 1 * ( k ) | Y m ( k ) Y m + 1 * ( k ) | } - - - ( 3 )
其中,上述GCCm,m+1(k)可以表示上述序列号为m及m+1的阵元的广义相关函数;上述IFFT可以表示对上述进行傅里叶逆变换;上述Ym(k)可以表示上述通道号为m的通道的频谱;上述可以表示当前阵元对应通道号为m+1的通道的频谱的共轭。
本发明实施例中分别确定麦克风阵列中的相邻的两个阵元确定该相邻的两个阵元对应的通道的广义相关函数,假设当前的麦克风阵列中存在m+1个阵元,且阵元的序列号为由1递增的,分别1、2、3、……m,m+1,也即分别确定通道号为1和通道号为2、通道号为2和通道号为3、通道号为3和通道号为4、……通道号为m和通道号为m+1的m个广义相关函数;
步骤D2、确定所述广义互相关函数中最大值对应的频点索引值为估计结果;其中,所述估计结果的个数为N-1个;
本发明实施例中,可以根据下述公式(4)确定上述广义互相关函数中的最大值对应的频点索引值,以确定估计结果;
k m , m + 1 max = arg max k | GCC m , m + 1 ( k ) | - - - ( 4 )
其中,上述可以表示上述广义互相关函数中的最大值对应的频点索引值,也即估计结果。
步骤D3、确定所述N-1个所述估计结果的平均值;
本发明实施例中,麦克风阵列中的阵元的个数为N个,则相邻的阵元对即为N-1个,则确定的广义相关函数的个数为N-1个,也即估计结果的个数为N-1个,对上述N-1个估计结果进行平均值的计算过程可以参照下述公式(5):
k ‾ = 1 N - 1 Σ m = 0 N - 2 k m , m + 1 max - - - ( 5 )
其中,上述可以表示上述估计结果的平均值;
步骤D4、根据所述平均值及所述补偿麦克风阵列数据确定所述时延值;
本发明实施例中,可以根据下述公式(6)确定麦克风阵列中的阵元对应的通道相对于所述基础阵元对应的通道的时延值:
τ = k ‾ - N F F T / 2 f s - - - ( 6 )
其中,上述τ可以用于表示时延值;上述fs可以表示语音的采样频率;上述NFFT可以表示上述补偿麦克风阵列数据。
步骤D5、根据所述时延值及所述麦克风阵列中阵元的间距确定所述声源方向。
本发明实施例中,可以根据下述公式(7)确定所述声源方向:
θ = a r c c o s { c τ d } - - - ( 7 )
其中,上述θ可以表示声源方向相对于麦克风阵列的角度方向;上述c可以表示为声速,取值为340m/s;上述d可以表示麦克风阵列中阵元之间的间距;上述τ可以用于表示时延值。
综上,本发明实施例提供的一种回声对消方法,由于将各类数据信号进行快速傅里叶变换后,获得的目标数据,而进行快速傅里叶变换后,各数据信号均变换为频域数据信号,因此目标数据也为频域数据信号;在根据目标数据进行声源方向的定位时,直接在频域上进行广义互相关的计算,进而求得声源方向,由于避免了在滤波之后将目标数据从频域数据信号变换为时域数据信号,而在计算广义互相关时又从时域数据信号变换到频域数据信号的过程,因此减少了对声源进行定位的过程的复杂度,提升了定位的效率。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请实施例并不受所描述的动作顺序的限制,因为依据本申请实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本申请实施例所必须的。
装置实施例一
参照图3,示出了本发明一种回声对消装置实施例一的结构框图,具体可以包括如下模块:第一确定模块301及滤波模块302;其中,
上述第一确定模块301,可以用于根据参考信号及麦克风阵列各阵元采集的数据,确定所述各阵元对应通道的滤波系数;
滤波模块302,可以用于根据所述滤波系数及所述参考信号对所述麦克风阵列各阵元采集的数据进行滤波,以完成所述麦克风阵列各阵元采集的数据的回声对消,得到各阵元对应通道的目标数据。
装置实施例二
参照图4,示出了本发明一种回声对消装置实施例二的结构框图,具体可以包括如下模块:第一确定模块401及滤波模块402;其中,
上述第一确定模块401,可以用于根据参考信号及麦克风阵列各阵元采集的数据,确定所述各阵元对应通道的滤波系数;
滤波模块402,可以用于根据所述滤波系数及所述参考信号对所述麦克风阵列各阵元采集的数据进行滤波,以完成所述麦克风阵列各阵元采集的数据的回声对消,得到各阵元对应通道的目标数据;
其中,上述第一确定模块401,具体可以包括:
第一确定单元4011,可以用于确定所述参考信号的自相关矩阵;
第二确定单元4012,可以用于根据所述麦克风阵列各阵元采集的数据及所述参考信号,确定所述麦克风阵列各阵元对应通道与所述参考信号的互相关向量;
第三确定单元4013,可以用于根据所述自相关矩阵的逆矩阵及所述互相关向量确定所述滤波系数。
装置实施例三
参照图5,示出了本发明一种回声对消装置实施例三的结构框图,具体可以包括如下模块:第一确定模块501及滤波模块502;其中,
上述第一确定模块501,可以用于根据参考信号及麦克风阵列各阵元采集的数据,确定所述各阵元对应通道的滤波系数;
滤波模块502,可以用于根据所述滤波系数及所述参考信号对所述麦克风阵列各阵元采集的数据进行滤波,以完成所述麦克风阵列各阵元采集的数据的回声对消,得到各阵元对应通道的目标数据;
其中,上述滤波模块502,具体可以包括:
第一补偿单元5021,可以用于对所述滤波系数进行补偿,以得到补偿滤波系数,并对所述补偿滤波系数进行快速傅里叶变换,得到补偿滤波系数变换结果;其中,所述补偿滤波系数为2的整数次幂;
变换单元5022,可以用于分别对所述麦克风阵列各阵元采集的数据进行补偿,以得到补偿麦克风阵列数据,并对所述补偿麦克风阵列数据进行快速傅里叶变换,得到补偿麦克风阵列数据变换结果;其中,所述补偿麦克风阵列数据为2的整数次幂;
第二补偿单元5023,可以用于对所述参考信号进行补偿,以得到补偿参考信号,并对所述补偿参考信号进行快速傅里叶变换,得到补偿参考信号变换结果;其中,所述补偿参考信号为2的整数次幂;
目标数据获得单元5024,可以用于根据所述补偿滤波系数变换结果、所述补偿麦克风阵列数据变换结果、及所述补偿参考信号变换结果,得到所述各阵元对应通道的目标数据。
在本发明的一种可选实施例中,所述目标数据获得单元5024,具体可以包括:
第一确定子单元,可以用于确定所述补偿滤波系数变换结果与所述补偿参考信号变换结果的乘积为第一乘积结果;
第二确定子单元,可以用于确定所述补偿麦克风阵列数据变换结果与所述第一乘积结果的差值为所述各阵元对应通道的目标数据。
装置实施例四
参照图6,示出了本发明一种回声对消装置实施例四的结构框图,具体可以包括如下模块:第一确定模块601、滤波模块602及定位模块603;其中,
上述第一确定模块601,可以用于根据参考信号及麦克风阵列各阵元采集的数据,确定所述各阵元对应通道的滤波系数;
滤波模块602,可以用于根据所述滤波系数及所述参考信号对所述麦克风阵列各阵元采集的数据进行滤波,以完成所述麦克风阵列各阵元采集的数据的回声对消,得到各阵元对应通道的目标数据;
定位模块603,可以用于根据所述各阵元对应通道的目标数据对声源方向进行定位;
本发明实施例中,上述定位模块603,具体可以包括:
第四确定单元,可以用于根据所述麦克风阵列中相邻的两个阵元对应的通道所对应的所述目标数据确定所述相邻的两个阵元对应的通道的广义相关函数;其中,所述广义相关函数的个数为N-1个,所述N为所述麦克风阵列中阵元的个数;
第五确定单元,可以用于确定所述广义互相关函数中最大值对应的频点索引值为估计结果;其中,所述估计结果的个数为N-1个;
第六确定单元,可以用于确定所述N-1个所述估计结果的平均值;
第七确定单元,可以用于根据所述平均值及所述补偿麦克风阵列数据确定所述时延值;
第八确定单元,可以用于根据所述时延值及所述麦克风阵列中阵元的间距确定所述声源方向。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域普通技术人员可以意识到,结合本发明实施例中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种回声对消方法,其特征在于,所述方法包括:
根据参考信号及麦克风阵列各阵元采集的数据,确定所述各阵元对应通道的滤波系数;
根据所述滤波系数及所述参考信号对所述麦克风阵列各阵元采集的数据进行滤波,以完成所述麦克风阵列各阵元采集的数据的回声对消,得到各阵元对应通道的目标数据。
2.根据权利要求1所述的方法,其特征在于,所述根据参考信号及麦克风阵列各阵元采集的数据,确定所述各阵元对应通道的滤波系数的步骤,包括:
确定所述参考信号的自相关矩阵;
根据所述麦克风阵列各阵元采集的数据及所述参考信号,确定所述麦克风阵列各阵元对应通道与所述参考信号的互相关向量;
根据所述自相关矩阵的逆矩阵及所述互相关向量确定所述滤波系数。
3.根据权利要求1所述的方法,其特征在于,所述根据所述滤波系数及所述参考信号对所述麦克风阵列各阵元采集的数据进行滤波的步骤,包括:
对所述滤波系数进行补偿,以得到补偿滤波系数,并对所述补偿滤波系数进行快速傅里叶变换,得到补偿滤波系数变换结果;其中,所述补偿滤波系数为2的整数次幂;
分别对所述麦克风阵列各阵元采集的数据进行补偿,以得到补偿麦克风阵列数据,并对所述补偿麦克风阵列数据进行快速傅里叶变换,得到补偿麦克风阵列数据变换结果;其中,所述补偿麦克风阵列数据为2的整数次幂;
对所述参考信号进行补偿,以得到补偿参考信号,并对所述补偿参考信号进行快速傅里叶变换,得到补偿参考信号变换结果;其中,所述补偿参考信号为2的整数次幂;
根据所述补偿滤波系数变换结果、所述补偿麦克风阵列数据变换结果、及所述补偿参考信号变换结果,得到所述各阵元对应通道的目标数据。
4.根据权利要求3所述的方法,其特征在于,所述根据所述补偿滤波系数变换结果、所述补偿麦克风阵列数据变换结果、所述补偿参考信号变换结果得到所述各阵元对应通道的目标数据的步骤,包括:
确定所述补偿滤波系数变换结果与所述补偿参考信号变换结果的乘积为第一乘积结果;
确定所述补偿麦克风阵列数据变换结果与所述第一乘积结果的差值为所述各阵元对应通道的目标数据。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述各阵元对应通道的目标数据对声源方向进行定位;
其中,所述根据所述各阵元对应通道的目标数据对声源方向进行定位的步骤,包括:
根据所述麦克风阵列中相邻的两个阵元对应的通道所对应的所述目标数据确定所述相邻的两个阵元对应的通道的广义相关函数;其中,所述广义相关函数的个数为N-1个,所述N为所述麦克风阵列中阵元的个数;
确定所述广义互相关函数中最大值对应的频点索引值为估计结果;其中,所述估计结果的个数为N-1个;
确定所述N-1个所述估计结果的平均值;
根据所述平均值及所述补偿麦克风阵列数据确定所述时延值;
根据所述时延值及所述麦克风阵列中阵元的间距确定所述声源方向。
6.一种回声对消装置,其特征在于,包括:
第一确定模块,用于根据参考信号及麦克风阵列各阵元采集的数据,确定所述各阵元对应通道的滤波系数;
滤波模块,用于根据所述滤波系数及所述参考信号对所述麦克风阵列各阵元采集的数据进行滤波,以完成所述麦克风阵列各阵元采集的数据的回声对消,得到各阵元对应通道的目标数据。
7.根据权利要求6所述的装置,其特征在于,所述第一确定模块,包括:
第一确定单元,用于确定所述参考信号的自相关矩阵;
第二确定单元,用于根据所述麦克风阵列各阵元采集的数据及所述参考信号,确定所述麦克风阵列各阵元对应通道与所述参考信号的互相关向量;
第三确定单元,用于根据所述自相关矩阵的逆矩阵及所述互相关向量确定所述滤波系数。
8.根据权利要求6所述的装置,其特征在于,所述滤波模块,包括:
第一补偿单元,用于对所述滤波系数进行补偿,以得到补偿滤波系数,并对所述补偿滤波系数进行快速傅里叶变换,得到补偿滤波系数变换结果;其中,所述补偿滤波系数为2的整数次幂;
变换单元,用于分别对所述麦克风阵列各阵元采集的数据进行补偿,以得到补偿麦克风阵列数据,并对所述补偿麦克风阵列数据进行快速傅里叶变换,得到补偿麦克风阵列数据变换结果;其中,所述补偿麦克风阵列数据为2的整数次幂;
第二补偿单元,用于对所述参考信号进行补偿,以得到补偿参考信号,并对所述补偿参考信号进行快速傅里叶变换,得到补偿参考信号变换结果;其中,所述补偿参考信号为2的整数次幂;
目标数据获得单元,用于根据所述补偿滤波系数变换结果、所述补偿麦克风阵列数据变换结果、及所述补偿参考信号变换结果,得到所述各阵元对应通道的目标数据。
9.根据权利要求8所述的装置,其特征在于,所述目标数据获得单元包括:
第一确定子单元,用于确定所述补偿滤波系数变换结果与所述补偿参考信号变换结果的乘积为第一乘积结果;
第二确定子单元,用于确定所述补偿麦克风阵列数据变换结果与所述第一乘积结果的差值为所述各阵元对应通道的目标数据。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括:
定位模块,用于根据所述各阵元对应通道的目标数据对声源方向进行定位;
其中,所述定位模块,包括:
第四确定单元,用于根据所述麦克风阵列中相邻的两个阵元对应的通道所对应的所述目标数据确定所述相邻的两个阵元对应的通道的广义相关函数;其中,所述广义相关函数的个数为N-1个,所述N为所述麦克风阵列中阵元的个数;
第五确定单元,用于确定所述广义互相关函数中最大值对应的频点索引值为估计结果;其中,所述估计结果的个数为N-1个;
第六确定单元,用于确定所述N-1个所述估计结果的平均值;
第七确定单元,用于根据所述平均值及所述补偿麦克风阵列数据确定所述时延值;
第八确定单元,用于根据所述时延值及所述麦克风阵列中阵元的间距确定所述声源方向。
CN201610499011.8A 2016-06-29 2016-06-29 一种回声对消方法及装置 Active CN105989850B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610499011.8A CN105989850B (zh) 2016-06-29 2016-06-29 一种回声对消方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610499011.8A CN105989850B (zh) 2016-06-29 2016-06-29 一种回声对消方法及装置

Publications (2)

Publication Number Publication Date
CN105989850A true CN105989850A (zh) 2016-10-05
CN105989850B CN105989850B (zh) 2019-06-11

Family

ID=57044381

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610499011.8A Active CN105989850B (zh) 2016-06-29 2016-06-29 一种回声对消方法及装置

Country Status (1)

Country Link
CN (1) CN105989850B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106548783A (zh) * 2016-12-09 2017-03-29 西安Tcl软件开发有限公司 语音增强方法、装置及智能音箱、智能电视
CN110111802A (zh) * 2018-02-01 2019-08-09 南京大学 基于卡尔曼滤波的自适应去混响方法
CN111863017A (zh) * 2020-07-20 2020-10-30 上海汽车集团股份有限公司 一种基于双麦克风阵列的车内定向拾音方法及相关装置
CN112820311A (zh) * 2021-04-16 2021-05-18 成都启英泰伦科技有限公司 一种基于空间预测的回声消除方法及装置
CN113409810A (zh) * 2021-08-19 2021-09-17 成都启英泰伦科技有限公司 一种联合去混响的回声消除方法及装置
US11495241B2 (en) * 2021-01-22 2022-11-08 Qnap Systems, Inc. Echo delay time estimation method and system thereof

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101315772A (zh) * 2008-07-17 2008-12-03 上海交通大学 基于维纳滤波的语音混响消减方法
US20140316775A1 (en) * 2012-02-10 2014-10-23 Mitsubishi Electric Corporation Noise suppression device
CN104935293A (zh) * 2015-06-25 2015-09-23 国网山东省电力公司莱芜供电公司 大功率变压器自适应有源降噪控制方法及控制系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101315772A (zh) * 2008-07-17 2008-12-03 上海交通大学 基于维纳滤波的语音混响消减方法
US20140316775A1 (en) * 2012-02-10 2014-10-23 Mitsubishi Electric Corporation Noise suppression device
CN104935293A (zh) * 2015-06-25 2015-09-23 国网山东省电力公司莱芜供电公司 大功率变压器自适应有源降噪控制方法及控制系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106548783A (zh) * 2016-12-09 2017-03-29 西安Tcl软件开发有限公司 语音增强方法、装置及智能音箱、智能电视
CN110111802A (zh) * 2018-02-01 2019-08-09 南京大学 基于卡尔曼滤波的自适应去混响方法
CN110111802B (zh) * 2018-02-01 2021-04-27 南京大学 基于卡尔曼滤波的自适应去混响方法
CN111863017A (zh) * 2020-07-20 2020-10-30 上海汽车集团股份有限公司 一种基于双麦克风阵列的车内定向拾音方法及相关装置
US11495241B2 (en) * 2021-01-22 2022-11-08 Qnap Systems, Inc. Echo delay time estimation method and system thereof
CN112820311A (zh) * 2021-04-16 2021-05-18 成都启英泰伦科技有限公司 一种基于空间预测的回声消除方法及装置
CN113409810A (zh) * 2021-08-19 2021-09-17 成都启英泰伦科技有限公司 一种联合去混响的回声消除方法及装置
CN113409810B (zh) * 2021-08-19 2021-10-29 成都启英泰伦科技有限公司 一种联合去混响的回声消除方法

Also Published As

Publication number Publication date
CN105989850B (zh) 2019-06-11

Similar Documents

Publication Publication Date Title
CN105989850B (zh) 一种回声对消方法及装置
Tan et al. Audio-visual speech separation and dereverberation with a two-stage multimodal network
CN104699445A (zh) 一种音频信息处理方法及装置
EP1919251A1 (en) Beamforming weights conditioning for efficient implementations of broadband beamformers
CN111863015B (zh) 一种音频处理方法、装置、电子设备和可读存储介质
JP6604331B2 (ja) 音声処理装置および方法、並びにプログラム
CN110556125B (zh) 基于语音信号的特征提取方法、设备及计算机存储介质
CN110379439A (zh) 一种音频处理的方法以及相关装置
CN112201273B (zh) 一种噪声功率谱密度计算方法、系统、设备及介质
CN113687305A (zh) 声源方位的定位方法、装置、设备及计算机可读存储介质
CN106199607B (zh) 一种麦克风阵列的声源方向定位方法及装置
CN103688187A (zh) 使用相位谱的声音源定位
CN111698026B (zh) 偏振态变化监测方法、装置和接收机
CN110890099B (zh) 声音信号处理方法、装置以及存储介质
CN113362848B (zh) 音频信号处理方法、装置及存储介质
CN107919136B (zh) 一种基于高斯混合模型的数字语音采样频率估计方法
CN113948101B (zh) 一种基于空间区分性检测的噪声抑制方法及装置
CN108353241B (zh) 渲染系统
Zeller et al. Coefficient pruning for higher-order diagonals of Volterra filters representing Wiener-Hammerstein models
CN111724808A (zh) 音频信号处理方法、装置、终端及存储介质
KR101558397B1 (ko) 반향필터 추정방법, 반향제거필터 추정방법 및 이를 이용한 단일채널 반향제거방법
CN111863017B (zh) 一种基于双麦克风阵列的车内定向拾音方法及相关装置
CN113689869B (zh) 语音增强方法、电子设备以及计算机可读存储介质
JP2018191255A (ja) 収音装置、その方法、及びプログラム
CN118474625A (zh) 音频信号处理方法、电子设备和计算机可读存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant