CN110246516A - 一种语音通信中小空间回声信号的处理方法 - Google Patents
一种语音通信中小空间回声信号的处理方法 Download PDFInfo
- Publication number
- CN110246516A CN110246516A CN201910678449.6A CN201910678449A CN110246516A CN 110246516 A CN110246516 A CN 110246516A CN 201910678449 A CN201910678449 A CN 201910678449A CN 110246516 A CN110246516 A CN 110246516A
- Authority
- CN
- China
- Prior art keywords
- signal
- indoor
- echo
- acoustical environment
- echo signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004891 communication Methods 0.000 title claims abstract description 22
- 238000003672 processing method Methods 0.000 title claims abstract description 12
- 230000004044 response Effects 0.000 claims abstract description 28
- 238000000926 separation method Methods 0.000 claims abstract description 24
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 15
- 238000012546 transfer Methods 0.000 claims abstract description 7
- 238000012545 processing Methods 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 7
- 230000000306 recurrent effect Effects 0.000 claims description 4
- 230000035939 shock Effects 0.000 abstract description 9
- 238000000034 method Methods 0.000 description 21
- 238000010586 diagram Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 239000013598 vector Substances 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 238000004088 simulation Methods 0.000 description 6
- 230000007613 environmental effect Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000010521 absorption reaction Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000005086 pumping Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 210000001367 artery Anatomy 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004080 punching Methods 0.000 description 1
- 238000007634 remodeling Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0264—Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
- H04M9/082—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
- H04M9/085—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using digital techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02165—Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明涉及一种语音通信中小空间回声信号的处理方法,首先根据所使用的电声系统对室内输入白噪声脉冲,充分激励起室内的驻波响应,获得室内冲击响应并转换为数字信号;然后估算室内声环境AR模型的阶数,进行线性预测,获取室内声环境AR模型的传递函数参数,建立室内的AR模型传递函数H(z),形成全极点滤波器。其次对麦克风拾音信号进行盲源分离算法,获得语音信号和回声信号。最后依据H(z)建立远端语音源信号(电路获取)的回声估算,再依据相关性判断回声信号并去除的算法结构。本发明能够获得理想的麦克风语音拾音,消除“双讲”的回声干扰。
Description
技术领域
本发明涉及室内声信号处理技术领域,特别是一种语音通信中小空间回声信号的处理方法。
背景技术
室内声信号用于听音包括两部分信号组成:一是声源直接传达到接收位置的直达声,它随传输距离增大而衰减;二是声源激励起的室内声环境驻波,它充满于室内。因此在小空间中往往比大空间存在较强烈的环境驻波(强反射声)的影响。
对于实际听音空间中的电声通信系统,往往由于声环境驻波的影响造成两个方面影响:一是在双方同时讲话时造成回声干扰,造成音质下降,没有近端语音时也有回声送到远端播放;二是由于通信信道和双方室内构成闭环回声正反馈系统,严重时造成反馈激励的自激啸叫。因此,在电声通信系统中,通常针对回声造成的反馈啸叫的处理方法有:采用均衡处理;或是采用移频处理;或是采用自适应滤波器抵消环境回声。但这些处理在某种程度上都将对音质又引起一定的影响,或者处理不够彻底的问题。
发明内容
有鉴于此,本发明的目的是提出一种语音通信中小空间回声信号的处理方法,用于获得理想的麦克风语音拾音,消除“双讲”的回声干扰。
本发明采用以下方案实现:一种语音通信中小空间回声信号的处理方法,包括以下步骤:
步骤S1:获取室内声环境的脉冲响应信号,并转换成数字信号,该数字信号即室内冲击响应信号y(n);
步骤S2:进行线性预测,利用下式获得室内声环境AR模型的p阶结构参数:
y(n)=a1y(n-1)+a2y(n-2)+···+ap(n-p)+e(n);
式中e(n)称为残差,a1,a2,...ap为室内声环境AR模型的p阶结构参数;
步骤S3:设在z域,室内输入声源信号为x(z),输出为y(z),根据阶数p和室内声环境AR模型的p阶结构参数确定相应的全极点滤波器结构,其系统传递函数如下:
步骤S4:获取近端两路麦克风输入声源在数字域的信号s1(n)和s2(n),同时获取远端送来的电路信号s3(n);将s1(n)和s2(n)采用盲源信号分离处理算法,获得两个分离信号x1(n)与x2(n);将s3(n)送入步骤S3构建的全极点滤波器中,获得场所回声估算信号x3(n);
步骤S5:将x3(n)分别与两个分离信号x1(n)、x2(n)做相关性计算,将与x3(n)之间相似度较高的分离信号视为场所回声信号;
步骤S6:重复步骤S1至步骤S5,对具有一定语音数据采用点的信号段连续进行处理,由此持续取出回声信号,用于消除其对近端麦克风拾取信号的回声干扰。
进一步地,步骤S1中,利用电声系统对室内声环境输入激励信号,从而获取室内声环境的脉冲响应信号;其中所述输入激励信号为白噪声脉冲、周期脉冲或赝噪声。该噪声应在双方会议的语音通信前分别送进相应场所播放,以便获取模拟相应场所的全极点滤波器。
进一步地,步骤S2中,阶数p的取值为2dN,其中dN的计算采用下式:
式中,f为估算的频率,λ为相应波长,dω为估算的带宽,c为声速,Λ=4V/S,V为室内容积,S为室内总表面积。
较佳的,步骤S4中,由于场所环境的布置材料具有对不同声波频率的吸声和反射效果,对于固定扬声器布置和扩声麦克风之间来说,是一个线性时不变系统,对于扬声器到麦克风之间相当于一个声波滤波效应,因此,在麦克风处,语音通信中远端语音通过扬声器在场所激励的回声与讲话人的语音分别具备独立语音源的效果进行混合。对于体积不是太大的声空间来说,实际测试结果,环境的回声能量主要集中在500Hz以下分立的低频驻波,而高频成分几乎不存在。据此,采用基于信号源统计独立的盲源分离算法后,可以获得两个分离信号,分别为人语音信号和回声信号,设为x1(n)与x2(n),在下一个步骤中进行区分。
较佳的,小空间语音通信采用两个麦克风(无特别距离限制,因为盲源分离可以针对任何的信号混合比例),对两个麦克风各自的混合信号(有用的近端语音信号或室内本底噪声和远端语音在室内的回声信号)进行分离,是采用盲源信号分离方法获取。该方法可以采用现有技术中的多种算法,较佳可以采用基于发明专利《一种比例微分控制的混合信号自适应快速分离方法》(CN201810868388.5)中的方法获取。
较佳的,假设对于两个数字信号L1(n)和L2(n)具有相同数据采样点N,则它们分别组成了N维向量,它们分别为每个有限信号段的特征向量。在两个向量之间,它们的夹角A越小就说明两个信号波形的相似度越高(相关度越高)。评价两个信号间的波形相似度(相关度),可以计算两个信号向量间夹角A的余弦值如下:
显然,该余弦取值将在0和1之间,即夹角在0°到90°间;余弦值越大夹角越小,该系数R越大,两者波形相似度(相关度)越高。因此,步骤S5中,本发明的x3(n)分别和x1(n)、x2(n)采用相同的采样点数N,将x3(n)和x1(n)通过信号相关性系数R1的计算;将x3(n)和x2(n)也通过信号相关性系数R2的计算,它们之间相似度判断的具体计算公式如下:
则相似度系数较高一组中的分离信号为场所回声信号。
与现有技术相比,本发明有以下有益效果:
1、很多通信中的小空间往往都是不经过专门建筑声学处理的空间,本发明的方法尤其适用于无专门声环境设计的小空间中进行语音通信中。由于小空间往往均比大空间明显存在较强的反射声(较强的低频段室内驻波)影响,均应及时处理其不利于通话的危害。因此,当检测到远端有电路信号时就施行本发明的方法,持续识别出麦克风拾取信号中的回声信号,并去除,则麦克风输出的是干净的近端语音信号或正常本底噪声信号,彻底消除回声的不利影响。
2、本发明由于采用了DSP(数字信号处理)构架,具有高度的灵活性,可以实时修改,因而实时性强,且易于应用到智能设备中。
附图说明
图1为本发明实施例的方法原理框图。
图2为本发明实施例的小室内冲击响应、频率响应和616极点模型的频率响应仿真处理结果示意图。其中(a)为房间冲击响应处理结果示意图,(b)为频率响应和616极点模型的频率响应仿真处理结果示意图。
图3为本发明实施例的两路麦克风的混合观察信号s1和s2。其中(a)为麦克风混合信号1,(b)为麦克风混合信号2。
图4为本发明实施例的经过盲源分离算法从两路麦克风混合信号获得的两路分离信号x1和x2,及经过相似度判断抽取的有用语音信号x1。其中(a)为分离信号1,(b)为分离信号2,(c)为相似度判断抽取的信号。其中分离信号1的相似度系数0.8304;分离信号2的相似度系数5.2459e-04。
图5为本发明实施例的远端语音源信号s3通过极点滤波器核对的回声估算x3。其中(a)为远端的电路信号,(b)为远端电路信号的场所回声估算。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
本实施例提供了一种语音通信中小空间回声信号的处理方法,首先要获取室内声环境的室内冲击响应y(n)和确定室内声环境自回归AR模型(以下简称:室内声环境AR模型)的阶数p,用于线性预测室内声环境AR模型的p阶结构参数。
在离散域,线性预测是依据室内冲击响应的时域信号y(n)与y(n-1),甚至更早值y(n-i),(i=2,3,...,q)的相关性提出的。因此,可将y(n)表示为其以前数据的线性组合,即:
y(n)=a1y(n-1)+a2y(n-2)+···+ap(n-p)+e(n);
该式称为y的p阶自回归预测模型,e(n)称为残差,为室内声环境AR模型p阶结构参数,这里的线性预测的主要任务就是获取该参数。AR模型就是一个p阶的全极点滤波器,因此预测获得的室内声环境AR模型参数就是相应的全极点滤波器结构参数。
一般的,e(n)包括三部分:一是输入信号,也称激励信号;二是由于模型的不准确引起的误差;三是噪声。实际应用中,信号是随机且带噪声的,预测误差不可能为零。预测误差的特点是开始时衰减很快,随着预测器阶数p越来越接近正确阶数,衰减会变慢,最后e(n)是与y(n)不相关的零均值随机过程。正确预测室内声环境AR模型的条件为:获取室内声环境冲击响应y(n)和正确确定室内声环境AR模型的阶数p。
如图1所示,本实施例具体包括以下步骤:
步骤S1:获取室内声环境的脉冲响应信号,并转换成数字信号,该数字信号即室内冲击响应信号y(n);
步骤S2:进行线性预测,利用下式获得室内声环境AR模型的p阶结构参数:
y(n)=a1y(n-1)+a2y(n-2)+···+ap(n-p)+e(n);
式中e(n)称为残差,a1,a2,...ap为室内声环境AR模型的p阶结构参数;
步骤S3:设在z域,室内输入声源信号为x(z),输出为y(z),根据阶数p和室内声环境AR模型的p阶结构参数确定相应的全极点滤波器结构,其系统传递函数如下:
步骤S4:获取近端两路麦克风输入声源在数字域的信号s1(n)和s2(n),同时获取远端送来的电路信号s3(n);将s1(n)和s2(n)采用盲源信号分离处理算法,获得两个分离信号x1(n)与x2(n);将s3(n)送入步骤S3构建的全极点滤波器中,获得场所回声估算信号x3(n);
步骤S5:将x3(n)分别与两个分离信号x1(n)、x2(n)做相关性计算,将与x3(n)相似度较高的分离信号视为场所回声信号;
步骤S6:重复步骤S1至步骤S5,对具有一定语音数据采用点的信号段连续进行处理,由此持续取出回声信号,用于消除其对近端麦克风拾取信号的回声干扰。
在本实施例中,步骤S1中,利用电声系统对室内声环境输入激励信号,从而获取室内声环境的脉冲响应信号;其中所述输入激励信号为白噪声脉冲、周期脉冲或赝噪声。该噪声应在双方会议的语音通信前分别送进相应场所播放,以便获取模拟相应场所的全极点滤波器。
在本实施例中,步骤S2中,阶数p的取值为2dN,其中dN的计算采用下式:
式中,f为估算的频率,λ为相应波长,dω为估算的带宽,c为声速,Λ=4V/S,V为室内容积,S为室内总表面积。
较佳的,在本实施例中,步骤S4中,由于场所环境的布置材料具有对不同声波频率的吸声和反射效果,对于固定扬声器布置和扩声麦克风之间来说,是一个线性时不变系统,对于扬声器到麦克风之间相当于一个声波滤波效应,因此,在麦克风处,语音通信中远端语音通过扬声器在场所激励的回声与讲话人的语音分别具备独立语音源的效果进行混合。对于体积不是太大的声空间来说,实际测试结果,环境的回声能量主要集中在500Hz以下分立的低频驻波,而高频成分几乎不存在。据此,采用基于信号源统计独立的盲源分离算法后,可以获得两个分离信号,分别为人语音信号和回声信号,设为x1(n)与x2(n),在下一个步骤中进行区分。
较佳的,小空间语音通信采用两个麦克风(无特别距离限制,因为盲源分离可以针对任何的信号混合比例),对两个麦克风各自的混合信号(有用的近端语音信号或室内本底噪声和远端语音在室内的回声信号)进行分离,是采用盲源信号分离方法获取。该方法可以采用现有技术中的多种算法,较佳可以采用基于发明专利《一种比例微分控制的混合信号自适应快速分离方法》(CN201810868388.5)中的方法获取。
较佳的,假设对于两个数字信号L1(n)和L2(n)具有相同数据采样点N,则它们分别组成了N维向量,它们分别为每个有限信号段的特征向量。在两个向量之间,它们的夹角A越小就说明两个信号波形的相似度越高(相关度越高)。评价两个信号间的波形相似度(相关度),可以计算两个信号向量间夹角A的余弦值如下:
显然,该余弦取值将在0和1之间,即夹角在0°到90°间;余弦值越大夹角越小,该系数R越大,两者波形相似度(相关度)越高。因此,本发明的x3(n)分别和x1(n)、x2(n)采用相同的采样点数N。因此步骤S5中,将x3(n)和x1(n)通过信号相似度系数R1的计算;将x3(n)和x2(n)也通过信号相似度系数R2的计算,具体计算公式如下:
则相似度系数较高一组中的分离信号为场所回声信号x2(n)。本发明的x3(n)和x1(n)、x2(n)做相似度判断的数据采样点N均为15000。
图1为本发明实施例的方法原理框图。应用于不同声用房的声系统时,首先根据所使用的电声系统对室内输入白噪声脉冲,充分激励起室内的驻波响应,获得室内冲击响应并转换为数字信号;然后估算室内声环境AR模型的阶数,进行线性预测,获取室内声环境AR模型的传递函数参数,建立室内的AR模型传递函数H(z)。其次对麦克风拾音信号进行盲源分离算法,获得语音信号和回声信号。最后依据H(z)建立远端语音源信号(电路获取)的回声估算,再依据相关性判断回声信号并去除的算法结构。
如图2所示,图2为本实施例小室内冲击响应、频率响应和616极点模型的频率响应仿真处理结果示意图。首先用电声系统向小声用房播放适当的声环境激励信号(白噪声脉冲、周期脉冲、赝噪声等),获取声场脉冲响应,并转换为数字信号。其中结果是对室内尺寸为6.3×3.6×2.8(m3)的小房间冲击响应(100Hz-400Hz)及其仿真处理结果。由驻波数估算式得简正频率数约为308个,根据上述分析,建模需要极点数约为616(p=2×308)个。针对该室内冲击响应,应用Levinson-durbin递推算法求解,通过仿真获取其室内声信道616个极点预测模型的频率响应,并与原室内脉冲响应的频率响应相比较,结果显示它们的峰值(谷值)均获得很好吻合。那么,获得信道估算的方法如下:
据上述获得的预测条件,通过线性预测算法获得室内声环境AR模型的系数,确立室内声环境AR模型的传递函数:
建立相应的全极点滤波器。
图3、图4和图5为一个仿真处理实例及结果。其中,分离信号中被抽取的有用信号与估算回声信号相似度系数5.2459e-04,另一个作为回声本身的分离信号与估算回声信号相似度系数0.8304。可见室内声环境AR模型的阶数选择方法满足要求,说明算法正确地获得了对回声信号的有效识别处理,达到预期要求。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅是本发明的较佳实施例而已,并非是对本发明作其它形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例。但是凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与改型,仍属于本发明技术方案的保护范围。
Claims (4)
1.一种语音通信中小空间回声信号的处理方法,其特征在于,包括以下步骤:
步骤S1:获取室内声环境的脉冲响应信号,并转换成数字信号,该数字信号即室内冲击响应信号y(n);
步骤S2:进行线性预测,利用下式获得室内声环境AR模型的p阶结构参数:
y(n)=a1y(n-1)+a2y(n-2)+···+ap(n-p)+e(n);
式中e(n)称为残差,a1,a2,...ap为室内声环境AR模型的p阶结构参数;
步骤S3:设在z域,室内输入声源信号为x(z),输出为y(z),根据阶数p和室内声环境AR模型的p阶结构参数确定相应的全极点滤波器结构,其系统传递函数如下:
步骤S4:获取近端两路麦克风输入声源在数字域的信号s1(n)和s2(n),同时获取远端送来的电路信号s3(n);将s1(n)和s2(n)采用盲源信号分离处理算法,获得两个分离信号x1(n)与x2(n);将s3(n)送入步骤S3构建的全极点滤波器中,获得场所回声估算信号x3(n);
步骤S5:将x3(n)分别与两个分离信号x1(n)、x2(n)做相关性计算,将与x3(n)相似度较高的分离信号视为场所回声信号;
步骤S6:重复步骤S1至步骤S5,对具有一定语音数据采用点的信号段连续进行处理,由此持续取出回声信号,用于消除其对近端麦克风拾取信号的回声干扰。
2.根据权利要求1所述的一种语音通信中小空间回声信号的处理方法,其特征在于,步骤S1中,利用电声系统对室内声环境输入激励信号,从而获取室内声环境的脉冲响应信号;其中所述输入激励信号为白噪声脉冲、周期脉冲或赝噪声。
3.根据权利要求1所述的一种语音通信中小空间回声信号的处理方法,其特征在于,步骤S2中,阶数p的取值为2dN,其中dN的计算采用下式:
式中,f为估算的频率,λ为相应波长,dω为估算的带宽,c为声速,Λ=4V/S,V为室内容积,S为室内总表面积。
4.根据权利要求1所述的一种语音通信中小空间回声信号的处理方法,其特征在于,步骤S5中,将x3(n)和x1(n)通过信号相关性系数R1的计算;将x3(n)和x2(n)也通过信号相关性系数R2的计算,具体计算公式如下:
令相似度系数较高一组中的分离信号为场所回声信号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910678449.6A CN110246516B (zh) | 2019-07-25 | 2019-07-25 | 一种语音通信中小空间回声信号的处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910678449.6A CN110246516B (zh) | 2019-07-25 | 2019-07-25 | 一种语音通信中小空间回声信号的处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110246516A true CN110246516A (zh) | 2019-09-17 |
CN110246516B CN110246516B (zh) | 2022-06-17 |
Family
ID=67893497
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910678449.6A Active CN110246516B (zh) | 2019-07-25 | 2019-07-25 | 一种语音通信中小空间回声信号的处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110246516B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111404542A (zh) * | 2020-03-31 | 2020-07-10 | 四川新先达测控技术有限公司 | 一种双指数核信号计数方法及装置 |
Citations (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080075270A1 (en) * | 2006-09-21 | 2008-03-27 | Oki Electric Industry Co., Ltd. | Double-talk detection method |
US20080175375A1 (en) * | 2007-01-24 | 2008-07-24 | Oki Electric Industry Co., Ltd. | Echo canceler and echo canceling method |
WO2009029076A1 (en) * | 2007-08-31 | 2009-03-05 | Tellabs Operations, Inc. | Controlling echo in the coded domain |
CN101719969A (zh) * | 2009-11-26 | 2010-06-02 | 美商威睿电通公司 | 判断双端对话的方法、系统以及消除回声的方法和系统 |
CN101820302A (zh) * | 2009-02-27 | 2010-09-01 | 比亚迪股份有限公司 | 一种回声消除装置和方法 |
CN101826891A (zh) * | 2008-10-27 | 2010-09-08 | 北方电讯网络有限公司 | 增强回波消除 |
CN102065190A (zh) * | 2010-12-31 | 2011-05-18 | 杭州华三通信技术有限公司 | 一种回声消除方法及其装置 |
CN102592606A (zh) * | 2012-03-23 | 2012-07-18 | 福建师范大学福清分校 | 一种补偿小空间听音声环境的均衡信号处理方法 |
US20130129078A1 (en) * | 2010-07-05 | 2013-05-23 | Alcatel Lucent | Echo canceller |
CN103700374A (zh) * | 2013-12-25 | 2014-04-02 | 宁波菊风系统软件有限公司 | 确定声学回声消除中系统延时的方法及声学回声消除方法 |
US20140334620A1 (en) * | 2013-05-13 | 2014-11-13 | Christelle Yemdji | Method for processing an audio signal and audio receiving circuit |
CN104157293A (zh) * | 2014-08-28 | 2014-11-19 | 福建师范大学福清分校 | 一种增强声环境中目标语音信号拾取的信号处理方法 |
US20150011266A1 (en) * | 2013-07-05 | 2015-01-08 | Sennheiser Communications A/S | Communication device with echo suppression |
EP2905778A1 (en) * | 2012-10-12 | 2015-08-12 | Huawei Technologies Co., Ltd. | Echo cancellation method and device |
CN105791611A (zh) * | 2016-02-22 | 2016-07-20 | 腾讯科技(深圳)有限公司 | 回声消除方法及装置 |
CN105957520A (zh) * | 2016-07-04 | 2016-09-21 | 北京邮电大学 | 一种适用于回声消除系统的语音状态检测方法 |
CN107622242A (zh) * | 2017-09-22 | 2018-01-23 | 福建师范大学福清分校 | 一种工程中盲源混合信号的加速分离方法 |
CN108711433A (zh) * | 2018-05-18 | 2018-10-26 | 歌尔科技有限公司 | 一种回声消除方法和装置 |
CN109192220A (zh) * | 2018-08-02 | 2019-01-11 | 福建师范大学福清分校 | 一种比例微分控制的混合信号自适应快速分离方法 |
CN109348072A (zh) * | 2018-08-30 | 2019-02-15 | 湖北工业大学 | 一种应用于回声抵消系统的双端通话检测方法 |
CN109547655A (zh) * | 2018-12-30 | 2019-03-29 | 广东大仓机器人科技有限公司 | 一种网络语音通话的回声消除处理的方法 |
-
2019
- 2019-07-25 CN CN201910678449.6A patent/CN110246516B/zh active Active
Patent Citations (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080075270A1 (en) * | 2006-09-21 | 2008-03-27 | Oki Electric Industry Co., Ltd. | Double-talk detection method |
US20080175375A1 (en) * | 2007-01-24 | 2008-07-24 | Oki Electric Industry Co., Ltd. | Echo canceler and echo canceling method |
WO2009029076A1 (en) * | 2007-08-31 | 2009-03-05 | Tellabs Operations, Inc. | Controlling echo in the coded domain |
CN101826891A (zh) * | 2008-10-27 | 2010-09-08 | 北方电讯网络有限公司 | 增强回波消除 |
CN101820302A (zh) * | 2009-02-27 | 2010-09-01 | 比亚迪股份有限公司 | 一种回声消除装置和方法 |
CN101719969A (zh) * | 2009-11-26 | 2010-06-02 | 美商威睿电通公司 | 判断双端对话的方法、系统以及消除回声的方法和系统 |
US20130129078A1 (en) * | 2010-07-05 | 2013-05-23 | Alcatel Lucent | Echo canceller |
CN102065190A (zh) * | 2010-12-31 | 2011-05-18 | 杭州华三通信技术有限公司 | 一种回声消除方法及其装置 |
CN102592606A (zh) * | 2012-03-23 | 2012-07-18 | 福建师范大学福清分校 | 一种补偿小空间听音声环境的均衡信号处理方法 |
EP2905778A1 (en) * | 2012-10-12 | 2015-08-12 | Huawei Technologies Co., Ltd. | Echo cancellation method and device |
US20140334620A1 (en) * | 2013-05-13 | 2014-11-13 | Christelle Yemdji | Method for processing an audio signal and audio receiving circuit |
US20150011266A1 (en) * | 2013-07-05 | 2015-01-08 | Sennheiser Communications A/S | Communication device with echo suppression |
CN103700374A (zh) * | 2013-12-25 | 2014-04-02 | 宁波菊风系统软件有限公司 | 确定声学回声消除中系统延时的方法及声学回声消除方法 |
CN104157293A (zh) * | 2014-08-28 | 2014-11-19 | 福建师范大学福清分校 | 一种增强声环境中目标语音信号拾取的信号处理方法 |
CN105791611A (zh) * | 2016-02-22 | 2016-07-20 | 腾讯科技(深圳)有限公司 | 回声消除方法及装置 |
CN105957520A (zh) * | 2016-07-04 | 2016-09-21 | 北京邮电大学 | 一种适用于回声消除系统的语音状态检测方法 |
CN107622242A (zh) * | 2017-09-22 | 2018-01-23 | 福建师范大学福清分校 | 一种工程中盲源混合信号的加速分离方法 |
CN108711433A (zh) * | 2018-05-18 | 2018-10-26 | 歌尔科技有限公司 | 一种回声消除方法和装置 |
CN109192220A (zh) * | 2018-08-02 | 2019-01-11 | 福建师范大学福清分校 | 一种比例微分控制的混合信号自适应快速分离方法 |
CN109348072A (zh) * | 2018-08-30 | 2019-02-15 | 湖北工业大学 | 一种应用于回声抵消系统的双端通话检测方法 |
CN109547655A (zh) * | 2018-12-30 | 2019-03-29 | 广东大仓机器人科技有限公司 | 一种网络语音通话的回声消除处理的方法 |
Non-Patent Citations (4)
Title |
---|
M. MAGADAN ET AL: "ICA for Acoustic Echo Control", 《2002 11TH EUROPEAN SIGNAL PROCESSING CONFERENCE》 * |
王正腾: "基于预测残差和自适应阶数的回声消除方法研究", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 * |
陈国钦等: "一种基于AR模型的小室内扩声增益提高方法", 《福建师范大学学报(自然科学版)》 * |
陈国钦等: "基于回声状态网络的声环境中目标信号增强方法", 《福建师范大学学报( 自然科学版)》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111404542A (zh) * | 2020-03-31 | 2020-07-10 | 四川新先达测控技术有限公司 | 一种双指数核信号计数方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110246516B (zh) | 2022-06-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6157403A (en) | Apparatus for detecting position of object capable of simultaneously detecting plural objects and detection method therefor | |
Zhang et al. | Why does PHAT work well in lownoise, reverberative environments? | |
KR102132500B1 (ko) | 조화성 기반 단일 채널 음성 품질 추정 기법 | |
US20170365255A1 (en) | Far field automatic speech recognition pre-processing | |
JP2017021385A (ja) | シングルチャンネル音声残響除去方法及びその装置 | |
CN107071636B (zh) | 对带麦克风的设备的去混响控制方法和装置 | |
CN108172231A (zh) | 一种基于卡尔曼滤波的去混响方法及系统 | |
CN104157293A (zh) | 一种增强声环境中目标语音信号拾取的信号处理方法 | |
CN111048061B (zh) | 回声消除滤波器的步长获取方法、装置及设备 | |
CN106161820B (zh) | 一种用于立体声声学回声抵消的通道间去相关方法 | |
CN109712637B (zh) | 一种混响抑制系统及方法 | |
CN113470685B (zh) | 语音增强模型的训练方法和装置及语音增强方法和装置 | |
CN112489679B (zh) | 声学回声消除算法的评估方法、装置及终端设备 | |
CN110246516A (zh) | 一种语音通信中小空间回声信号的处理方法 | |
CN115171703B (zh) | 分布式语音唤醒方法和装置、存储介质及电子装置 | |
WO2020078210A1 (zh) | 混响语音信号中后混响功率谱的自适应估计方法及装置 | |
CN113921007B (zh) | 提升远场语音交互性能的方法和远场语音交互系统 | |
Tourbabin et al. | Direction of arrival estimation in highly reverberant environments using soft time-frequency mask | |
CN112489680B (zh) | 声学回声消除算法的评估方法、装置及终端设备 | |
CN113160842B (zh) | 一种基于mclp的语音去混响方法及系统 | |
JP4622713B2 (ja) | エコーキャンセラを備える拡声集音通信装置 | |
WO2014097470A1 (ja) | 残響除去装置 | |
Peled et al. | Study of speech intelligibility in noisy enclosures using spherical microphones arrays | |
Clifford | Reducing microphone artefacts in live sound | |
CN114242092A (zh) | 一种监控环境中提高语音播报扩声增益的智能处理方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |