CN105957536A - 基于通道聚合度频域回声消除方法 - Google Patents

基于通道聚合度频域回声消除方法 Download PDF

Info

Publication number
CN105957536A
CN105957536A CN201610260050.2A CN201610260050A CN105957536A CN 105957536 A CN105957536 A CN 105957536A CN 201610260050 A CN201610260050 A CN 201610260050A CN 105957536 A CN105957536 A CN 105957536A
Authority
CN
China
Prior art keywords
rightarrow
gamma
voice
echo
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610260050.2A
Other languages
English (en)
Other versions
CN105957536B (zh
Inventor
唐明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Yajin Smart Technology Co ltd
Original Assignee
Nanjing Qiyinshi Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Qiyinshi Information Technology Co Ltd filed Critical Nanjing Qiyinshi Information Technology Co Ltd
Priority to CN201610260050.2A priority Critical patent/CN105957536B/zh
Publication of CN105957536A publication Critical patent/CN105957536A/zh
Application granted granted Critical
Publication of CN105957536B publication Critical patent/CN105957536B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明公开了一种基于通道聚合度频域回声消除方法,包括以下步骤:步骤1、麦克风通道聚合度评估,去除冗余信息;步骤2、回声响应函数估计及回声消除;步骤3、系统噪声消除及目标语音增强。本发明采用频域滤波器,可以适应于长混响情况下,回声残留能量低,语音扭曲小;可以同时抑制多通道回声和系统的平稳噪声,语音通讯质量更高;增加了语音扭曲抑制模块,可以处理双端说话人同时说话的应用场景,语音纯净度更高。

Description

基于通道聚合度频域回声消除方法
技术领域
本发明涉及语音信号处理领域,具体涉及一种基于通道聚合度频域回声消除方法。
背景技术
有关回声消除:
所谓回声是指任一同时内置麦克风和扬声器的终端设备,麦克风在采集目标用户语音的同时也会接收到有扬声器发出的声音。对于语音通讯设备,如果不把回声消除掉会在通讯回路内多次迭代并形成啸叫,造成通讯设备无法使用。对于内置语音控制中枢的智能音箱等应用,如果回声不被抑制,则会影响语音识别的准确性,降低了语音控制的智能化水平。
从原理上讲,回声消除可以算作是一种特殊的噪音抑制技术,其特殊性体现在终端设备上可以获取关于回声信号的参照信号。但是,参照信号和回声并不完全一样。这是由于从麦克风到扬声器的声音传播路径通常被混响所干扰。麦克风与扬声器的距离越大,则混响冲击响应越长,回声消除的难度也越大。随着用户位置的变换,也都会造成房间冲击响应的变换,增加回声消除的难度。
有关多麦克风语音通讯系统:
由于智能硬件、计算机网络等领域的技术发展,产生了许多对高质量远程语音通讯的技术需求,比如视频会议系统。为了保证语音信号的清晰度,通常采用多个麦克风,即麦克风阵列,采集近场语音信号。同时扬声器也至少有两个。
和传统的单麦克风-单扬声器语音通讯系统相比,多麦克风语音通讯系统可以看作Multi-Input Multi Output(MIMO)系统,对于回声消除的技术需求更高。
在一定时间区域可以假设语音来自一个方向的点声源,多麦克风采集到的信号有很强的相关性,这多路信号存在冗余信息,不能全部用作参照信号。另一个不同之处在于,多麦克风语音通讯系统,在物理位置上会存在一定的稳定性,可以采用系统辨识的方法进行回声消除。
语音通讯系统必须要求回声消除能够实时处理,如果不能做到实时处理,会造成数据包的拥塞。对于许多内置语音控制功能的终端设备,还需要在回声消除的同时,不会造成目标语音的扭曲。
回声消除技术的现状和不足:
目前,基于最小均方误差准则的自适应滤波技术是当前业界采用主流回声消除技术,在基于电话通讯等通讯终端中有了比较成熟的应用,然后在多麦克风回声消除技术中存在如下几个技术不足:
长混响情况下存在很强的回声残留。在传统的电话通讯系统中,一方面麦克风与扬声器的距离比较短,混响比较小,采用自适应滤波技术可以很好的解决回声消除问题;另一方面扬声器的声音通常远低于用户的声音能量,即便存在回声残留也不至于被感知。然而,采用多麦克风语音采集系统,麦克风与扬声器的距离比较远,混响大,采用传统算法回声残留更多。
为了适应多麦克风阵列这一需求,自适应滤波器的长度成倍增加,倍数与麦克风数量相同,相当于计算复杂度也成倍的增加,很难保证实时性。在回声相对目标信号能量比率比较高的情况下,在消除回声的同时也会一定程度上破坏目标语音。
通讯系统除了回声之外还自带了白噪声,传统算法对系统噪声比较敏感,容易被噪声所干扰。因此,高质量的语音通讯回声系统对噪声有很强的鲁棒性需求。
传统的回声消除技术在双端同时都在发出语音的应用场景下(即Double-Talk问题)效果不好,会造成目标语音扭曲严重。如果Double-Talk时间段没有被及时检测,会破坏目标语音频谱结构,严重影响语音通讯质量。诸如视频会议系统诸多应用的回声消除系统也需要对Double-Talk时间段鲁棒。
发明内容
针对现有技术的不足,本发明公开了一种基于通道聚合度频域回声消除方法。
本发明的技术方案如下:
一种基于通道聚合度频域回声消除方法,包括以下步骤:
步骤1、麦克风通道聚合度评估;设定共有M路扬声器信号,N个近场麦克风信号;M路扬声器参考信号由远场同一点源信号所发出;假设从第一帧开始,一直到第lS=50帧,一直没有目标语音,1<<L<<ls;则对每一个频带k,计算参考信号的自相关矩阵的特征值分解;之后对特征值进行降序排列,构造N个近场麦克风信号中各语音通道的聚合度评估函数:
J ( i ) = Σ k = 1 i λ R , k k Σ k = 1 M L λ R , k k ,
根据如下准则评估聚合度及冗余信息:
J(I)>0.95,J(I-1)<0.95,
即只保留前I个特征向量所构成的自相关矩阵,剩余信息作为冗余信息;
步骤2、回声响应函数估计及回声消除;对所有的N个麦克风,构造回声预测滤波器为:
W i ( l , k ) = &Gamma; P P - 1 ( l , k ) &Gamma; P Y , i ( l , k ) ,
上式中,是参考信号向量在前I个特征空间的投影向量的自相关矩阵,ΓPY,i是投影向量与麦克风接收信号的互相关向量;i=1,2,...,N;
在每一个麦克风上估计回声并消除回声,信号输出为:
Z i ( l , k ) = Y i ( l , k ) - W i H ( l , k ) R &RightArrow; P ( l , k ) ;
步骤3、系统噪声消除及目标语音增强;
构造语音拾取滤波器:
W D S ( k ) = 1 1 + &Sigma; i = 2 N H i 2 ( k ) &lsqb; 1 , H 2 ( k ) , H 3 ( k ) , ... , H N ( k ) &rsqb; T ,
上式中,Hi为房间冲击响应估计;
构造噪音拾取滤波器组:
计算目标语音估计:
S ^ ( l , k ) = W D S ( k ) - ( &Gamma; U - 1 ( l , k ) &Gamma; U , D S ( l , k ) ) H W U ( k ) ,
上式中,ΓU为噪音拾取自相关估计,ΓU,DS为语音拾取互相关估计。
其进一步的技术方案为,所述步骤1具体为:
设定共有M路扬声器参考信号,N个近场麦克风信号;M路扬声器参考信号由远场同一点源信号所发出,分别表示为r1(t),r2(t),...,rM(t);N个麦克风采集到的信号记为y1(t),y2(t),...,yN(t),可以表示为:
y i ( t ) = &Sigma; m = 1 M h i , m ( t ) * r m ( t ) + g i ( t ) * s ( t ) + u i ( t ) , i = 1 , 2 , ... , N , - - - ( 1 )
式(1)中,hi,m(t)代表扬声器m到麦克风i的房间冲击响应,gi(t)代表目标语音到麦克风i的房间冲击响应,ui(t)代表系统白噪声和环境噪声,“*”代表卷积运算;
步骤10、参考信号r1(t),r2(t),...,rM(t)写缓冲区,缓冲区大小为M个1024B,其中每一个参考信号通道为1024个浮点数据;
步骤11、对每一个通道数据进行加窗傅里叶变换,窗函数w(t)为1024长度的汉明窗,T=1024:
R m ( l , k ) = &Sigma; t w ( t ) r m ( t ) exp ( - j 2 &pi; t T k ) , - - - ( 2 )
式(2)中,l和k分别代表时间帧和频带;
步骤12、对每一个频带,当前帧及前L帧组成向量:
R &RightArrow; m ( l , k ) = &lsqb; R m ( l , k ) , R m ( l - 1 , k ) , ... , R m ( l - L + 1 , k ) &rsqb; T R &RightArrow; ( l , k ) = &lsqb; R &RightArrow; 1 T ( l , k ) , R &RightArrow; 2 T ( l , k ) , ... , R &RightArrow; M T ( l , k ) &rsqb; T , - - - ( 3 )
式(3)中上标“T”代表转置算子;
步骤13、假设从第一帧开始,一直到第lS=50帧,一直没有目标语音,迭代更新参考信号的自相关矩阵:
&Gamma; R R ( l , k ) = &alpha;&Gamma; R R ( l - 1 , k ) + ( 1 - &alpha; ) R &RightArrow; ( l , k ) R &RightArrow; H ( l , k ) , - - - ( 4 )
式(4)中,α为平滑因子,上标‘H’代表共轭转置算子;
即重复步骤10至步骤13,直至lS=50,再进行步骤14;
步骤14、每一个频带k,计算其自相关矩阵的特征值分解:
&Gamma; R R ( l , k ) = P R , k &Lambda; R , k P R , k - 1 , - - - ( 5 )
式(5)中,PR,k是特征向量构成的矩阵,为特征值构成的对角矩阵,特征值与特征向量一一对应;
步骤15、对特征值进行降序排列,构造各通道聚合度评估函数:
J ( i ) = &Sigma; k = 1 i &lambda; R , k k &Sigma; k = 1 M L &lambda; R , k k , - - - ( 6 )
步骤16、根据如下准则评估聚合度及冗余信息:
J(I)>0.95,J(I-1)<0.95, (7)
即只保留前I个特征向量所构成的自相关矩阵,剩余信息作为冗余信息;
步骤17、选择前I个特征值对应的特征向量构造新的自相关矩阵:
&Gamma; ^ R R ( l , k ) = P R , k , 1 - I &Lambda; R , k , 1 - I P R , k , 1 - I - 1 . - - - ( 8 )
其进一步的技术方案为,所述步骤2还包括行Double-Talk监测步骤,监测准则如下所示:
&psi; i ( l ) = 10 log 10 ( &Sigma; k Y i 2 ( l , k ) &Sigma; k Z i 2 ( l , k ) ) ,
如果ψi(l)>3则表示目标语音为0,不属于Double-Talk情况;否则,目标语音不为0,判断为Double-Talk情况;
如果为Double-Talk时间帧,计算语音扭曲控制因子:
&nu; ( l , k ) = ( 1 - &alpha; ) R &RightArrow; P H ( l , k ) &Gamma; P P - H ( l , k ) R &RightArrow; P ( l , k ) ,
更新目标语音估计如下:
Z ^ i ( l , k ) = Z i ( l , k ) &nu; ( l , k ) .
其进一步的技术方案为,所述步骤2具体为:
步骤20、在每一个频带,对当前时间帧构建参考信号向量:
R &RightArrow; m ( l , k ) = &lsqb; R m ( l , k ) , R m ( l - 1 , k ) , ... , R m ( l - L + 1 , k ) &rsqb; T R &RightArrow; ( l , k ) = &lsqb; R &RightArrow; 1 T ( l , k ) , R &RightArrow; 2 T ( l , k ) , ... , R &RightArrow; M T ( l , k ) &rsqb; T , - - - ( 9 )
步骤21、计算参考信号在前I个特征空间的投影向量:
R &RightArrow; P ( l , k ) = P R , k , 1 - I R &RightArrow; ( l , k ) , - - - ( 10 )
步骤22、计算投影向量的自相关矩阵:
&Gamma; P P ( l , k ) = &alpha;&Gamma; P P ( l - 1 , k ) + ( 1 - &alpha; ) R &RightArrow; P ( l , k ) R &RightArrow; P H ( l , k ) , - - - ( 11 )
步骤23、对所有的N个麦克风,计算投影向量与麦克风接收信号的互相关向量:
&Gamma; P Y , i ( l , k ) = &alpha;&Gamma; P Y , i ( 1 - 1 , k ) + ( 1 - &alpha; ) R &RightArrow; P ( l , k ) Y i H ( l , k ) , - - - ( 12 )
式(12)中,i=1,2,...,N;
步骤24、计算各个麦克风信号,回声预测滤波器为:
W i ( l , k ) = &Gamma; P P - 1 ( l , k ) &Gamma; P Y , i ( l , k ) , - - - ( 13 )
步骤25、在每一个麦克风上估计回声并消除回声,信号输出为:
Z i ( l , k ) = Y i ( l , k ) - W i H ( l , k ) R &RightArrow; P ( l , k ) , - - - ( 14 )
步骤26、进行Double-Talk监测,监测准则如下所示:
&psi; i ( l ) = 10 log 10 ( &Sigma; k Y i 2 ( l , k ) &Sigma; k Z i 2 ( l , k ) ) , - - - ( 15 )
如果ψi(l)>3则表示目标语音为0,不属于Double-Talk情况;否则,目标语音不为0,判断为Double-Talk情况;
步骤27、如果为Double-Talk时间帧,计算语音扭曲控制因子:
&nu; ( l , k ) = ( 1 - &alpha; ) R &RightArrow; P H ( l , k ) &Gamma; P P - H ( l , k ) R &RightArrow; P ( l , k ) , - - - ( 16 )
步骤28、更新目标语音估计,估计如下:
Z ^ i ( l , k ) = Z i ( l , k ) &nu; ( l , k ) , - - - ( 17 )
步骤29、更新互相关矩阵估计,估计如下:
&Gamma; P Y , i ( l , k ) = &Gamma; P Y , i ( l , k ) - ( 1 - &alpha; ) R &RightArrow; P ( l , k ) Z ^ i H ( l , k ) - - - ( 18 )
其进一步的技术方案为,所述步骤3具体为:
在步骤2中的估计输出中还包括系统噪声,在频谱域表示如下:
Z ^ i ( l , k ) = G i ( k ) S ( l , k ) + U i ( l , k ) , - - - ( 19 )
其中,Ui(l,k)为系统噪声的频谱,S(l,k)为目标语音的频谱;Gi(k)为目标语音的房间冲击响应Gi(k);
步骤30、对于时间帧位于lW>l>lS区间,更新迭代与第一麦克风信号的互相关系数:
步骤31、计算第一通道的自相关系数:
步骤32、自相关及互相关系数在区间lW>l>lS内的平均值:
步骤33、根据相关系数的平均值计算目标语音房间冲击响应估计:
H i ( k ) = &rho; i , 1 ( k ) - &rho; i , 2 ( k ) &rho; i , 4 ( k ) - &rho; i , 3 2 ( k ) , - - - ( 23 )
步骤34、根据上述房间冲击响应估计,构造语音拾取滤波器:
W D S ( k ) = 1 1 + &Sigma; i = 2 N H i 2 ( k ) &lsqb; 1 , H 2 ( k ) , H 3 ( k ) , ... , H N ( k ) &rsqb; T , - - - ( 24 )
步骤35、构造噪音拾取滤波器组:
步骤36、计算语音拾取估计及噪音拾取估计:
Z ^ D S ( l , k ) = W D S T ( k ) &lsqb; Z ^ 1 ( l , k ) , Z ^ 2 ( l , k ) , ... , Z ^ N ( l , k ) &rsqb; Z ^ U ( l , k ) = W U T ( k ) &lsqb; Z ^ 1 ( l , k ) , Z ^ 2 ( l , k ) , ... , Z ^ N ( l , k ) &rsqb; , - - - ( 26 )
步骤37、噪音拾取自相关估计和语音拾取的互相关估计:
&Gamma; U ( l , k ) = &alpha;&Gamma; U ( l - 1 , k ) + ( 1 - &alpha; ) Z ^ U ( l , k ) Z ^ U H ( l , k ) &Gamma; U , D S ( l , k ) = &alpha;&Gamma; U , D S ( l - 1 , k ) + ( 1 - &alpha; ) Z ^ U ( l , k ) Z ^ D S H ( l , k ) , - - - ( 27 )
步骤38、计算目标语音估计:
S ^ ( l , k ) = W D S ( k ) - ( &Gamma; U - 1 ( l , k ) &Gamma; U , D S ( l , k ) ) H W U ( k ) , - - - ( 28 )
步骤39、根据拟傅里叶变换,计算时域目标语音信号估计为:
s ^ ( t ) = 1 T &Sigma; k = 1 T w ( k ) S ^ ( l , k ) exp ( j 2 &pi; t T k ) - - - ( 29 )
本发明的有益技术效果是:
本发明涉及一种基于通道聚合度频域回声消除技术。回声抑制是语音通讯、会议系统、智能语音控制领域最基本的问题之一,随着计算机网络、嵌入式系统相关领域的技术进展,应用场景变得更为复杂,回声抑制的难度也随之增大。本项发明针对当前复杂的应用场景,设计了一种可以处理多麦克风、强混响情况下的回声消除技术,复杂度低,对系统白噪声有着很强的适应性和鲁棒性,可以做到实时处理,有着巨大的商业应用潜力。
本项发明和传统的回声消除技术相比,通过聚合度指标对不同麦克风通道的信号相关性进行建模,有限去除了冗余信息;增加了平稳噪声评估模块,有效对网络系统噪声进行建模;采用频域并行处理框架,复杂度低;设计了回声与系统噪声统一消除框架;增加了扭曲抑制模块,降低了目标语音的扭曲程度。相比于现有回声抑制技术,本项发明的优势包括:
1、采用频域滤波器,可以适应于长混响情况下,回声残留能量低,语音扭曲小。
2、可以同时抑制多通道回声和系统的平稳噪声,语音通讯质量更高。
3、增加了语音扭曲抑制模块,可以处理多说话人同时说话的应用场景,语音纯净度更高。
此外,本发明的应用领域广。本发明的一个重要应用是面向企业的高质量视频会议系统。此类,视频会议系统价格昂贵,利润率高,市场需求迫切,有着很大的应用前景。本发明的另外一个重要应用是车载语音控制中枢,用以抑制行车过程中用户播放的音乐回声信号。车载语音控制中枢是这几年新兴的产业,发展迅速,潜力巨大。智能硬件是这两年来发展比较迅速的新兴行业,许多集成语音控制功能的智能终端走进人民的生活,比如陪伴型机器人、Wifi音箱等,由于这些智能设备也集成了扬声器以支持语音播放、音乐播放等功能,因此也迫切需要本项技术。如果该扬声器产生的回声信号得不到抑制,后续的语音识别会受到抑制而无法实现智能控制的目的。
附图说明
图1是目标语音通道传输函数估计流程图。
图2是回声响应函数估计及回声消除处理流程图。
图3是系统噪音消除与目标语音增强处理流程图。
具体实施方式
本发明的回声消除处理流程主要包括三个核心步骤,具体为:
步骤1、麦克风通道聚合度评估;
设定共有M路扬声器参考信号,N个近场麦克风信号。M路扬声器参考信号由远场同一点源信号所发出,分别表示为r1(t),r2(t),...,rM(t)。N个麦克风采集到的信号记为y1(t),y2(t),...,yN(t),可以表示为:
y i ( t ) = &Sigma; m = 1 M h i , m ( t ) * r m ( t ) + g i ( t ) * s ( t ) + u i ( t ) , i = 1 , 2 , ... , N , - - - ( 1 )
式(1)中,hi,m(t)代表扬声器m到麦克风i的房间冲击响应,gi(t)代表目标语音到麦克风i的房间冲击响应,ui(t)代表系统白噪声和环境噪声,“*”代表卷积运算。
回声消除的第一个重要任务是,评估M个参考信号的聚合度,去除冗余信息。
图1是目标语音通道传输函数估计流程图,在此流程中,包括了评估参考信号的聚合度这一步骤。如图1所示,其具体步骤为:
步骤10、参考信号r1(t),r2(t),...,rM(t)写缓冲区,缓冲区大小为M个1024B,其中每一个参考信号通道为1024个浮点数据。
步骤11、对每一个通道数据进行加窗傅里叶变换,窗函数w(t)为1024长度的汉明窗,T=1024:
R m ( l , k ) = &Sigma; t w ( t ) r m ( t ) exp ( - j 2 &pi; t T k ) , - - - ( 2 )
式(2)中,l和k分别代表时间帧和频带。
步骤12、对每一个频带,当前帧及前L帧组成向量如下:
R &RightArrow; m ( l , k ) = &lsqb; R m ( l , k ) , R m ( l - 1 , k ) , ... , R m ( l - L + 1 , k ) &rsqb; T R &RightArrow; ( l , k ) = &lsqb; R &RightArrow; 1 T ( l , k ) , R &RightArrow; 2 T ( l , k ) , ... , R &RightArrow; M T ( l , k ) &rsqb; T , - - - ( 3 )
式(3)中,1<<L<<ls,上标“T”代表转置算子。
步骤13、假设从第一帧开始,一直到第lS=50帧,一直没有目标语音,迭代更新参考信号的自相关矩阵:
&Gamma; R R ( l , k ) = &alpha;&Gamma; R R ( l - 1 , k ) + ( 1 - &alpha; ) R &RightArrow; ( l , k ) R &RightArrow; H ( l , k ) , - - - ( 4 )
式(4)中,α=0.995为平滑因子,上标‘H’代表共轭转置算子。
即重复步骤10至步骤13,直至lS=50,再进行步骤14。
步骤14、每一个频带k,计算其自相关矩阵的特征值分解:
&Gamma; R R ( l , k ) = P R , k &Lambda; R , k P R , k - 1 , - - - ( 5 )
式(5)中,PR,k是特征向量构成的矩阵,为特征值构成的对角矩阵,特征值与特征向量一一对应。
步骤15、对特征值进行降序排列,构造各通道聚合度评估函数:
J ( i ) = &Sigma; k = 1 i &lambda; R , k k &Sigma; k = 1 M L &lambda; R , k k , - - - ( 6 )
步骤16、根据如下准则评估聚合度及冗余信息:
J(I)>0.95,J(I-1)<0.95, (7)
即只保留前I个特征向量所构成的自相关矩阵,剩余信息作为冗余信息。
步骤17、选择前I个特征值对应的特征向量构造新的自相关矩阵:
&Gamma; ^ R R ( l , k ) = P R , k , 1 - I &Lambda; R , k , 1 - I P R , k , 1 - I - 1 , - - - ( 8 )
该更新后的自相关矩阵去除了在小特征值方向上的相关信息,避免了后续回声消除陷入病态解。
步骤2、回声响应函数估计及回声消除
各个麦克风采集到的回声信号存在不同,需要分别进行降回声处理。利用前lS=50帧数据估计出的回声自相关矩阵及特征向量,分别更新自相关矩阵估计及相关回声响应函数。图2是回声响应函数估计及回声消除处理流程图,如图2所示,估计流程如下所示:
步骤20、在每一个频带,对当前帧及前L帧构建参考信号向量:
R &RightArrow; m ( l , k ) = &lsqb; R m ( l , k ) , R m ( l - 1 , k ) , ... , R m ( l - L + 1 , k ) &rsqb; T R &RightArrow; ( l , k ) = &lsqb; R &RightArrow; 1 T ( l , k ) , R &RightArrow; 2 T ( l , k ) , ... , R &RightArrow; M T ( l , k ) &rsqb; T , - - - ( 9 )
步骤21、计算参考信号向量在前I个特征空间的投影向量:
R &RightArrow; P ( l , k ) = P R , k , 1 - I R &RightArrow; ( l , k ) , - - - ( 10 )
由式(10)得到的投影向量基于上一模块的聚合度评估分析,去除了多通道冗余信息,后续自相关矩阵可以进行逆运算。
步骤22、计算投影向量的自相关矩阵:
&Gamma; P P ( l , k ) = &alpha;&Gamma; P P ( l - 1 , k ) + ( 1 - &alpha; ) R &RightArrow; P ( l , k ) R &RightArrow; P H ( l , k ) , - - - ( 11 )
步骤23、对所有的N个麦克风,计算投影向量与麦克风接收信号的互相关向量:
&Gamma; P Y , i ( l , k ) = &alpha;&Gamma; P Y , i ( l - 1 , k ) + ( 1 - &alpha; ) R &RightArrow; P ( l , k ) Y i H ( l , k ) , - - - ( 12 )
式(24)中,i=1,2,...,N。
步骤24、对于各个麦克风信号,计算回声预测滤波器为:
W i ( l , k ) = &Gamma; P P - 1 ( l , k ) &Gamma; P Y , i ( l , k ) , - - - ( 13 )
该滤波器基于最小均方误差准则估计得出,该滤波器输出可以使得无目标语音时间帧回声残留在均方误差评价指标下最小。该滤波器即为回声冲击响应估计。
步骤25、在每一个麦克风上估计回声并消除回声,信号输出为:
Z i ( l , k ) = Y i ( l , k ) - W i H ( l , k ) R &RightArrow; P ( l , k ) , - - - ( 14 )
基于该步骤,回声的大部分能量得到了抑制。
步骤26、在Double-Talk情况下单纯基于上述公式会扭曲语音,因此需要增加一个Double-Talk监测过程,监测准则如下所示:
&psi; i ( l ) = 10 log 10 ( &Sigma; k Y i 2 ( l , k ) &Sigma; k Z i 2 ( l , k ) ) , - - - ( 15 )
如果ψi(l)>3则表示目标语音为0,不属于Double-Talk情况;否则,判断为Double-Talk情况,目标语音不为0,回声消除所引入的扭曲需要进一步抑制。
步骤27、如果为Double-Talk时间帧,计算语音扭曲控制因子:
&nu; ( l , k ) = ( 1 - &alpha; ) R &RightArrow; P H ( l , k ) &Gamma; P P - H ( l , k ) R &RightArrow; P ( l , k ) , - - - ( 16 )
步骤28、更新目标语音估计,估计如下:
Z ^ i ( l , k ) = Z i ( l , k ) &nu; ( l , k ) , - - - ( 17 )
步骤29、更新互相关矩阵估计,估计如下:
&Gamma; P Y , i ( l , k ) = &Gamma; P Y , i ( l , k ) - ( 1 - &alpha; ) R &RightArrow; P ( l , k ) Z ^ i H ( l , k ) , - - - ( 18 )
经过本模块处理流程,回声能量的大部分受到抑制。
上述步骤完成后得到的语音谱估计中依然包括一小部分残留的噪声和系统白噪声,还需要进一步抑制以提高语音通讯质量。
步骤3、系统噪声消除及目标语音增强
在步骤2中的估计输出中还包括系统噪声,在频谱域表示如下:
Z ^ i ( l , k ) = G i ( k ) S ( l , k ) + U i ( l , k ) , - - - ( 19 )
其中,Ui(l,k)为系统噪声的频谱,这一模块的目的就是抑制系统噪声,并增强目标语音S(l,k)。如果目标语音的房间冲击响应Gi(k)已知,可以采用常规的beamforming方法对目标语音进行增强。然而本项发明的应用场景,Gi(k)未知,所以本步骤的第一个目标是对Gi(k)进行追踪和估计。图3是系统噪音消除与目标语音增强处理流程图。如图3所示,以第一个麦克风为对准通道,估计流程如下:
步骤30、对于时间帧位于lW>l>lS区间,更新迭代与第一麦克风信号的互相关系数:
步骤31、计算第一通道的自相关系数:
步骤32、自相关及互相关系数在区间lW>l>lS内的平均值:
步骤33、根据相关系数的平均值计算目标语音房间冲击响应估计:
H i ( k ) = &rho; i , 1 ( k ) - &rho; i , 2 ( k ) &rho; i , 4 ( k ) - &rho; i , 3 2 ( k ) , - - - ( 23 )
该估计是最小均方误差准则下的最优估计。
步骤34、根据上述房间冲击响应估计,构造语音拾取滤波器:
W D S ( k ) = 1 1 + &Sigma; i = 2 N H i 2 ( k ) &lsqb; 1 , H 2 ( k ) , H 3 ( k ) , ... , H N ( k ) &rsqb; T , - - - ( 24 )
步骤35、构造噪音拾取滤波器组:
步骤36、计算语音拾取估计及噪音拾取估计:
Z ^ D S ( l , k ) = W D S T ( k ) &lsqb; Z ^ 1 ( l , k ) , Z ^ 2 ( l , k ) , ... , Z ^ N ( l , k ) &rsqb; Z ^ U ( l , k ) = W U T ( k ) &lsqb; Z ^ 1 ( l , k ) , Z ^ 2 ( l , k ) , ... , Z ^ N ( l , k ) &rsqb; , - - - ( 26 )
步骤37、噪音拾取自相关估计和语音拾取的互相关估计:
&Gamma; U ( l , k ) = &alpha;&Gamma; U ( l - 1 , k ) + ( 1 - &alpha; ) Z ^ U ( l , k ) Z ^ U H ( l , k ) &Gamma; U , D S ( l , k ) = &alpha;&Gamma; U , D S ( l - 1 , k ) + ( 1 - &alpha; ) Z ^ U ( l , k ) Z ^ D S H ( l , k ) , - - - ( 27 )
步骤38、计算目标语音估计:
S ^ ( l , k ) = W D S ( k ) - ( &Gamma; U - 1 ( l , k ) &Gamma; U , D S ( l , k ) ) H W U ( k ) , - - - ( 28 )
此步骤对语音谱估计最小化了背景噪音,同时语音拾取保证了目标语音无损失,无扭曲。
步骤39、根据拟傅里叶变换,计算时域目标语音信号估计为:
s ^ ( t ) = 1 T &Sigma; k = 1 T w ( k ) S ^ ( l , k ) exp ( j 2 &pi; t T k ) , - - - ( 29 )
步骤39输出即为回声抑制和噪音抑制后的时域目标语音信号估计。经过了回声抑制和系统噪声抑制,语音通讯质量得到明显的改善。
以上所述的仅是本发明的优选实施方式,本发明不限于以上实施例。可以理解,本领域技术人员在不脱离本发明的精神和构思的前提下直接导出或联想到的其他改进和变化,均应认为包含在本发明的保护范围之内。

Claims (5)

1.一种基于通道聚合度频域回声消除方法,其特征在于,包括以下步骤:
步骤1、麦克风通道聚合度评估;设定共有M路扬声器信号,N个近场麦克风信号;M路扬声器参考信号由远场同一点源信号所发出;假设从第一帧开始,一直到第lS=50帧,一直没有目标语音,1<<L<<ls;则对每一个频带k,计算参考信号的自相关矩阵的特征值分解;之后对特征值λ进行降序排列,构造N个近场麦克风信号中各语音通道的聚合度评估函数:
J ( i ) = &Sigma; k = 1 i &lambda; R , k k &Sigma; k = 1 M L &lambda; R , k k ,
根据如下准则评估聚合度及冗余信息:
J(I)>0.95,J(I-1)<0.95,
即只保留前I个特征向量所构成的自相关矩阵,剩余信息作为冗余信息;
步骤2、回声响应函数估计及回声消除;对所有的N个麦克风,构造回声预测滤波器为:
W i ( l , k ) = &Gamma; P P - 1 ( l , k ) &Gamma; P Y , i ( l , k ) ,
上式中,是参考信号向量在前I个特征空间的投影向量的自相关矩阵,ΓPY,i是投影向量与麦克风接收信号的互相关向量;i=1,2,...,N;
在每一个麦克风上估计回声并消除回声,信号输出为:
Z i ( l , k ) = Y i ( l , k ) - W i H ( l , k ) R &RightArrow; P ( l , k ) ;
步骤3、系统噪声消除及目标语音增强;
构造语音拾取滤波器:
W D S ( k ) = 1 1 + &Sigma; i = 2 N H i 2 ( k ) &lsqb; 1 , H 2 ( k ) , H 3 ( k ) , ... , H N ( k ) &rsqb; T ,
上式中,Hi为房间冲击响应估计;
构造噪音拾取滤波器组:
计算目标语音估计:
S ^ ( l , k ) = W D S ( k ) - ( &Gamma; U - 1 ( l , k ) &Gamma; U , D S ( l , k ) ) H W U ( k ) ,
上式中,ΓU为噪音拾取自相关估计,ΓU,DS为语音拾取互相关估计。
2.如权利要求1所述的基于通道聚合度频域回声消除方法,其特征在于,所述步骤1具体为:
设定共有M路扬声器参考信号,N个近场麦克风信号;M路扬声器参考信号由远场同一点源信号所发出,分别表示为r1(t),r2(t),...,rM(t);N个麦克风采集到的信号记为y1(t),y2(t),...,yN(t),可以表示为:
y i ( t ) = &Sigma; m = 1 M h i , m ( t ) * r m ( t ) + g i ( t ) * s ( t ) + u i ( t ) , i = 1 , 2 , ... , N , - - - ( 1 )
式(1)中,hi,m(t)代表扬声器m到麦克风i的房间冲击响应,gi(t)代表目标语音到麦克风i的房间冲击响应,ui(t)代表系统白噪声和环境噪声,“*”代表卷积运算;
步骤10、参考信号r1(t),r2(t),...,rM(t)写缓冲区,缓冲区大小为M个1024B,其中每一个参考信号通道为1024个浮点数据;
步骤11、对每一个通道数据进行加窗傅里叶变换,窗函数w(t)为1024长度的汉明窗,T=1024:
R m ( l , k ) = &Sigma; t w ( t ) r m ( t ) exp ( - j 2 &pi; t T k ) , - - - ( 2 )
式(2)中,l和k分别代表时间帧和频带;
步骤12、对每一个频带,当前帧及前L帧组成向量:
R &RightArrow; m ( l , k ) = &lsqb; R m ( l , k ) , R m ( l - 1 , k ) , ... , R m ( l - L + 1 , k ) &rsqb; T R &RightArrow; ( l , k ) = &lsqb; R &RightArrow; 1 T ( l , k ) , R &RightArrow; 2 T ( l , k ) , ... , R &RightArrow; M T ( l , k ) &rsqb; T , - - - ( 3 )
式(3)中上标“T”代表转置算子;
步骤13、假设从第一帧开始,一直到第lS=50帧,一直没有目标语音,迭代更新参考信号的自相关矩阵:
&Gamma; R R ( l , k ) = &alpha;&Gamma; R R ( l - 1 , k ) + ( 1 - &alpha; ) R &RightArrow; ( l , k ) R &RightArrow; H ( l , k ) , - - - ( 4 )
式(4)中,α为平滑因子,上标‘H’代表共轭转置算子;
即重复步骤10至步骤13,直至lS=50,再进行步骤14;
步骤14、每一个频带k,计算其自相关矩阵的特征值分解:
&Gamma; R R ( l , k ) = P R , k &Lambda; R , k P R , k - 1 , - - - ( 5 )
式(5)中,ΡR,k是特征向量构成的矩阵,为特征值构成的对角矩阵,特征值与特征向量一一对应;
步骤15、对特征值进行降序排列,构造各通道聚合度评估函数:
J ( i ) = &Sigma; k = 1 i &lambda; R , k k &Sigma; k = 1 M L &lambda; R , k k , - - - ( 6 )
步骤16、根据如下准则评估聚合度及冗余信息:
J(I)>0.95,J(I-1)<0.95, (7)即只保留前I个特征向量所构成的自相关矩阵,剩余信息作为冗余信息;
步骤17、选择前I个特征值对应的特征向量构造新的自相关矩阵:
&Gamma; ^ R R ( l , k ) = P R , k , 1 - I &Lambda; R , k , 1 - I P R , k , 1 - I - 1 . - - - ( 8 )
3.如权利要求1所述的基于通道聚合度频域回声消除方法,其特征在于,所述步骤2还包括行Double-Talk监测步骤,监测准则如下所示:
&psi; i ( l ) = 10 log 10 ( &Sigma; k Y i 2 ( l , k ) &Sigma; k Z i 2 ( l , k ) ) ,
如果ψi(l)>3则表示目标语音为0,不属于Double-Talk情况;否则,目标语音不为0,判断为Double-Talk情况;
如果为Double-Talk时间帧,计算语音扭曲控制因子:
v ( l , k ) = ( 1 - &alpha; ) R &RightArrow; P H ( l , k ) &Gamma; P P - H ( l , k ) R &RightArrow; P ( l , k ) ,
更新目标语音估计如下:
Z ^ i ( l , k ) = Z i ( l , k ) v ( l , k ) .
4.如权利要求1所述的基于通道聚合度频域回声消除方法,其特征在于,所述步骤2具体为:
步骤20、在每一个频带,对当前时间帧构建参考信号向量:
R &RightArrow; m ( l , k ) = &lsqb; R m ( l , k ) , R m ( l - 1 , k ) , ... , R m ( l - L + 1 , k ) &rsqb; T R &RightArrow; ( l , k ) = &lsqb; R &RightArrow; 1 T ( l , k ) , R &RightArrow; 2 T ( l , k ) , ... , R &RightArrow; M T ( l , k ) &rsqb; T , - - - ( 9 )
步骤21、计算参考信号在前I个特征空间的投影向量:
R &RightArrow; P ( l , k ) = P R , k , 1 - I R &RightArrow; ( l , k ) , - - - ( 10 )
步骤22、计算投影向量的自相关矩阵:
&Gamma; P P ( l , k ) = &alpha;&Gamma; P P ( l - 1 , k ) + ( 1 - &alpha; ) R &RightArrow; P ( l , k ) R &RightArrow; P H ( l , k ) , - - - ( 11 )
步骤23、对所有的N个麦克风,计算投影向量与麦克风接收信号的互相关向量:
&Gamma; P Y , i ( l , k ) = &alpha;&Gamma; P Y , i ( l - 1 , k ) + ( 1 - &alpha; ) R &RightArrow; P ( l , k ) Y i H ( l , k ) , - - - ( 12 )
式(12)中,i=1,2,...,N;
步骤24、计算各个麦克风信号,回声预测滤波器为:
W i ( l , k ) = &Gamma; P P - 1 ( l , k ) &Gamma; P Y , i ( l , k ) , - - - ( 13 )
步骤25、在每一个麦克风上估计回声并消除回声,信号输出为:
Z i ( l , k ) = Y i ( l , k ) - W i H ( l , k ) R &RightArrow; P ( l , k ) , - - - ( 14 )
步骤26、进行Double-Talk监测,监测准则如下所示:
&psi; i ( l ) = 10 log 10 ( &Sigma; k Y i 2 ( l , k ) &Sigma; k Z i 2 ( l , k ) ) , - - - ( 15 )
如果ψi(l)>3则表示目标语音为0,不属于Double-Talk情况;否则,目标语音不为0,判断为Double-Talk情况;
步骤27、如果为Double-Talk时间帧,计算语音扭曲控制因子:
v ( l , k ) = ( 1 - &alpha; ) R &RightArrow; P H ( l , k ) &Gamma; P P - H ( l , k ) R &RightArrow; P ( l , k ) , - - - ( 16 )
步骤28、更新目标语音估计,估计如下:
Z ^ i ( l , k ) = Z i ( l , k ) v ( l , k ) , - - - ( 17 )
步骤29、更新互相关矩阵估计,估计如下:
&Gamma; P Y , i ( l , k ) = &Gamma; P Y , i ( l , k ) - ( 1 - &alpha; ) R &RightArrow; P ( l , k ) Z ^ i H ( l , k ) . - - - ( 18 )
5.如权利要求1所述的基于通道聚合度频域回声消除方法,其特征在于,所述步骤3具体为:
在步骤2中的估计输出中还包括系统噪声,在频谱域表示如下:
Z ^ i ( l , k ) = G i ( k ) S ( l , k ) + U i ( l , k ) , - - - ( 19 )
其中,Ui(l,k)为系统噪声的频谱,S(l,k)为目标语音的频谱;Gi(k)为目标语音的房间冲击响应Gi(k);
步骤30、对于时间帧位于lW>l>lS区间,更新迭代与第一麦克风信号的互相关系数:
步骤31、计算第一通道的自相关系数:
步骤32、自相关及互相关系数在区间lW>l>lS内的平均值:
步骤33、根据相关系数的平均值计算目标语音房间冲击响应估计:
H i ( k ) = &rho; i , 1 ( k ) - &rho; i , 2 ( k ) &rho; i , 4 ( k ) - &rho; i , 3 2 ( k ) , - - - ( 23 )
步骤34、根据上述房间冲击响应估计,构造语音拾取滤波器:
W D S ( k ) = 1 1 + &Sigma; i = 2 N H i 2 ( k ) &lsqb; 1 , H 2 ( k ) , H 3 ( k ) , ... , H N ( k ) &rsqb; T , - - - ( 24 )
步骤35、构造噪音拾取滤波器组:
步骤36、计算语音拾取估计及噪音拾取估计:
Z ^ D S ( l , k ) = W D S T ( k ) &lsqb; Z ^ 1 ( l , k ) , Z ^ 2 ( l , k ) , ... , Z ^ N ( l , k ) &rsqb; Z ^ U ( l , k ) = W U T ( k ) &lsqb; Z ^ 1 ( l , k ) , Z ^ 2 ( l , k ) , ... , Z ^ N ( l , k ) &rsqb; , - - - ( 26 )
步骤37、噪音拾取自相关估计和语音拾取的互相关估计:
&Gamma; U ( l , k ) = &alpha;&Gamma; U ( l - 1 , k ) + ( 1 - &alpha; ) Z ^ U ( l , k ) Z ^ U H ( l , k ) &Gamma; U , D S ( l , k ) = &alpha;&Gamma; U , D S ( l - 1 , k ) + ( 1 - &alpha; ) Z ^ U ( l , k ) Z ^ D S H ( l , k ) , - - - ( 27 )
步骤38、计算目标语音估计:
S ^ ( l , k ) = W D S ( k ) - ( &Gamma; U - 1 ( l , k ) &Gamma; U , D S ( l , k ) ) H W U ( k ) , - - - ( 28 )
步骤39、根据拟傅里叶变换,计算时域目标语音信号估计为:
s ^ ( t ) = 1 T &Sigma; k = 1 T w ( k ) S ^ ( l , k ) exp ( j 2 &pi; t T k ) . - - - ( 29 )
CN201610260050.2A 2016-04-25 2016-04-25 基于通道聚合度频域回声消除方法 Active CN105957536B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610260050.2A CN105957536B (zh) 2016-04-25 2016-04-25 基于通道聚合度频域回声消除方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610260050.2A CN105957536B (zh) 2016-04-25 2016-04-25 基于通道聚合度频域回声消除方法

Publications (2)

Publication Number Publication Date
CN105957536A true CN105957536A (zh) 2016-09-21
CN105957536B CN105957536B (zh) 2019-11-12

Family

ID=56916556

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610260050.2A Active CN105957536B (zh) 2016-04-25 2016-04-25 基于通道聚合度频域回声消除方法

Country Status (1)

Country Link
CN (1) CN105957536B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107017004A (zh) * 2017-05-24 2017-08-04 建荣半导体(深圳)有限公司 噪声抑制方法、音频处理芯片、处理模组及蓝牙设备
CN109505741A (zh) * 2018-12-20 2019-03-22 浙江大学 一种基于矩形麦克风阵列的风力发电机破损叶片检测方法及装置
CN111341303A (zh) * 2018-12-19 2020-06-26 北京猎户星空科技有限公司 一种声学模型的训练方法及装置、语音识别方法及装置
CN112201262A (zh) * 2020-09-30 2021-01-08 珠海格力电器股份有限公司 一种声音处理方法及装置
CN112201262B (zh) * 2020-09-30 2024-05-31 珠海格力电器股份有限公司 一种声音处理方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101192411A (zh) * 2007-12-27 2008-06-04 北京中星微电子有限公司 大距离麦克风阵列噪声消除的方法和噪声消除系统
CN101510426A (zh) * 2009-03-23 2009-08-19 北京中星微电子有限公司 一种噪声消除方法及系统
CN102377454A (zh) * 2010-08-25 2012-03-14 杭州华三通信技术有限公司 一种回声消除的方法和装置
WO2012102977A1 (en) * 2011-01-24 2012-08-02 Continental Automotive Systems, Inc. Method and apparatus for masking wind noise
US9031838B1 (en) * 2013-07-15 2015-05-12 Vail Systems, Inc. Method and apparatus for voice clarity and speech intelligibility detection and correction
CN105206281A (zh) * 2015-09-14 2015-12-30 胡旻波 基于分布式麦克风阵列网络的语音增强方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101192411A (zh) * 2007-12-27 2008-06-04 北京中星微电子有限公司 大距离麦克风阵列噪声消除的方法和噪声消除系统
CN101510426A (zh) * 2009-03-23 2009-08-19 北京中星微电子有限公司 一种噪声消除方法及系统
CN102377454A (zh) * 2010-08-25 2012-03-14 杭州华三通信技术有限公司 一种回声消除的方法和装置
WO2012102977A1 (en) * 2011-01-24 2012-08-02 Continental Automotive Systems, Inc. Method and apparatus for masking wind noise
US9031838B1 (en) * 2013-07-15 2015-05-12 Vail Systems, Inc. Method and apparatus for voice clarity and speech intelligibility detection and correction
CN105206281A (zh) * 2015-09-14 2015-12-30 胡旻波 基于分布式麦克风阵列网络的语音增强方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JASON WUNG,ET.AL.: ""Inter-Channel Decorrelation by Sub-Band"", 《IEEE TRANSACTIONS ON SIGNAL PROCESSING》 *
TED S. WADA,ET.AL.: ""DECORRELATION BY RESAMPLING IN FREQUENCY DOMAIN FOR MULTI-CHANNEL"", 《IEEEWORKSHOP ON APPLICATIONS OF SIGNAL PROCESSING TO AUDIO AND ACOUSTICS》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107017004A (zh) * 2017-05-24 2017-08-04 建荣半导体(深圳)有限公司 噪声抑制方法、音频处理芯片、处理模组及蓝牙设备
CN111341303A (zh) * 2018-12-19 2020-06-26 北京猎户星空科技有限公司 一种声学模型的训练方法及装置、语音识别方法及装置
CN111341303B (zh) * 2018-12-19 2023-10-31 北京猎户星空科技有限公司 一种声学模型的训练方法及装置、语音识别方法及装置
CN109505741A (zh) * 2018-12-20 2019-03-22 浙江大学 一种基于矩形麦克风阵列的风力发电机破损叶片检测方法及装置
CN112201262A (zh) * 2020-09-30 2021-01-08 珠海格力电器股份有限公司 一种声音处理方法及装置
CN112201262B (zh) * 2020-09-30 2024-05-31 珠海格力电器股份有限公司 一种声音处理方法及装置

Also Published As

Publication number Publication date
CN105957536B (zh) 2019-11-12

Similar Documents

Publication Publication Date Title
CN109727604B (zh) 用于语音识别前端的频域回声消除方法及计算机储存介质
CN105825864B (zh) 基于过零率指标的双端说话检测与回声消除方法
CN107123430B (zh) 回声消除方法、装置、会议平板及计算机存储介质
US9768829B2 (en) Methods for processing audio signals and circuit arrangements therefor
US9343056B1 (en) Wind noise detection and suppression
JP3506138B2 (ja) 複数チャンネルエコーキャンセル方法、複数チャンネル音声伝送方法、ステレオエコーキャンセラ、ステレオ音声伝送装置および伝達関数演算装置
CN106782590B (zh) 基于混响环境下麦克风阵列波束形成方法
EP2237271B1 (en) Method for determining a signal component for reducing noise in an input signal
CN102739886B (zh) 基于回声频谱估计和语音存在概率的立体声回声抵消方法
US8682006B1 (en) Noise suppression based on null coherence
CN107993670A (zh) 基于统计模型的麦克风阵列语音增强方法
CN107636758A (zh) 声学回声消除系统和方法
CN103632675A (zh) 个人通信中降噪和回波消除时的噪声估计
Yoshioka et al. Dereverberation for reverberation-robust microphone arrays
CN110265054A (zh) 语音信号处理方法、装置、计算机可读存储介质和计算机设备
CN105957536A (zh) 基于通道聚合度频域回声消除方法
Koldovský et al. Noise reduction in dual-microphone mobile phones using a bank of pre-measured target-cancellation filters
Song et al. An integrated multi-channel approach for joint noise reduction and dereverberation
Zhang et al. Lcsm: A lightweight complex spectral mapping framework for stereophonic acoustic echo cancellation
JP2003309493A (ja) 反響低減方法、反響低減装置、反響低減プログラム
Homer Adaptive echo cancellation in telecommunications
Comminiello et al. A novel affine projection algorithm for superdirective microphone array beamforming
Aroudi et al. TRUNet: Transformer-recurrent-U network for multi-channel reverberant sound source separation
Miyazaki et al. Theoretical analysis of parametric blind spatial subtraction array and its application to speech recognition performance prediction
CN100588212C (zh) 基于simo信道盲辨识的多路回波消除系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20170330

Address after: Dong Qi Road in Jiangning District of Nanjing City, Jiangsu Province, No. 33 B block 211100

Applicant after: Nanjing fast fire Mdt InfoTech Ltd.

Address before: Dong Qi Road in Jiangning District of Nanjing City, Jiangsu Province, No. 33 211100

Applicant before: NANJING QIYINSHI INFORMATION TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
CB03 Change of inventor or designer information

Inventor after: Cai Ganglin

Inventor before: Tang Ming

CB03 Change of inventor or designer information
TA01 Transfer of patent application right

Effective date of registration: 20170816

Address after: 518109 Guangdong city of Shenzhen province Longhua Dalang District Dragon Peak three road Jinhua building 1811-1812

Applicant after: SHENZHEN YONSZ INFORMATION TECHNOLOGY CO.,LTD.

Address before: Dong Qi Road in Jiangning District of Nanjing City, Jiangsu Province, No. 33 B block 211100

Applicant before: Nanjing fast fire Mdt InfoTech Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20221130

Address after: 2C1, Plant 2, Baimenqian Industrial Zone, No. 215, Busha Road, Nanlong Community, Nanwan Street, Longgang District, Shenzhen, Guangdong 518000

Patentee after: Shenzhen Yajin Smart Technology Co.,Ltd.

Address before: 518109 1811-1812, Jinhua building, Longfeng Third Road, Dalang street, Longhua District, Shenzhen City, Guangdong Province

Patentee before: SHENZHEN YONSZ INFORMATION TECHNOLOGY CO.,LTD.

TR01 Transfer of patent right