CN101322323B - 回声检测方法和装置 - Google Patents
回声检测方法和装置 Download PDFInfo
- Publication number
- CN101322323B CN101322323B CN2006800456997A CN200680045699A CN101322323B CN 101322323 B CN101322323 B CN 101322323B CN 2006800456997 A CN2006800456997 A CN 2006800456997A CN 200680045699 A CN200680045699 A CN 200680045699A CN 101322323 B CN101322323 B CN 101322323B
- Authority
- CN
- China
- Prior art keywords
- signal
- pitch period
- uplink signal
- downlink signal
- echo
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000001514 detection method Methods 0.000 title claims description 24
- 238000005259 measurement Methods 0.000 claims description 28
- 238000000034 method Methods 0.000 claims description 19
- 238000009826 distribution Methods 0.000 claims description 18
- 238000002592 echocardiography Methods 0.000 claims description 18
- 238000012360 testing method Methods 0.000 claims description 8
- 238000009827 uniform distribution Methods 0.000 claims 4
- 208000012322 Raynaud phenomenon Diseases 0.000 claims 1
- 230000001934 delay Effects 0.000 abstract description 11
- 230000005540 biological transmission Effects 0.000 description 6
- 230000003111 delayed effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 101001005166 Homo sapiens Lens fiber membrane intrinsic protein Proteins 0.000 description 4
- 102100026038 Lens fiber membrane intrinsic protein Human genes 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000005315 distribution function Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011524 similarity measure Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 238000003657 Likelihood-ratio test Methods 0.000 description 1
- 241001652065 Trigonopeltastes delta Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000009738 saturating Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B3/00—Line transmission systems
- H04B3/02—Details
- H04B3/46—Monitoring; Testing
- H04B3/493—Testing echo effects or singing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B3/00—Line transmission systems
- H04B3/02—Details
- H04B3/20—Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
- Radar Systems Or Details Thereof (AREA)
- Telephone Function (AREA)
- Mobile Radio Communication Systems (AREA)
- Telephonic Communication Services (AREA)
Abstract
一种回声检测器,包括部件(34),用于在第一信号的基音估计和相对于所述第一信号存在预定延迟的第二信号的基音估计之间形成一组距离测量值。选择器(36)从该组中选择与第一和第二信号之间的最高相似性相对应的距离测量值。分类器(32)在所选择的距离测量值与相似性阈值(TH)具有预定关系的情况下,将第二信号分类为包括回声。
Description
技术领域
本发明一般涉及信号相似性的检测,特别是涉及电信系统中的回声检测。
背景技术
在一些应用中,有必要检测在所接收的可能由若干语音和噪声分量组成的信号中已知的语音信号的可能的修正版本的存在并且估计所关心的分量的相对延迟。这样的应用的例子是回声控制、网络统计数据收集以及多方会议桥(multi-party conference bridge)。
图1说明了潜在的问题。已知的语音信号在延迟框10中被延迟,并且在去往求和点的途中受到未知的转换12的影响。已知的语音信号可能或者可能不能到达求和点(开关16可能打开或者关闭)。在求和点,该信号与其它的语音信号和噪声混合。在返回到最初信号被发送的点的途中,来自求和点14的信号再次被未知的转换18和延迟框20改变。问题是检测在所接收的信号中是否存在最初已知的语音信号的可能的修正版本,并且如果存在,就估计该版本的信号相对于已知的语音信号的相对延迟。这是由检测和延迟估计框22执行的。
人们对自己的声音的听觉延迟反射的现象被称作回声。在电话网络中,回声的主要来源是在连接该网络的四线制(4-wire)部分和二线制用户线的所谓的混合电路中的电反射。这种电回声通常由安装在电话系统中的网络回声消除器来处理。网络回声消除器通常应当安装在接近回声源的位置。例如,在将分组网络(IP或ATM)接到PSTN网络的媒体网关或者将移动网络接到PSTN网络的移动业务交换中心中需要 网络回声消除器。类似的网络回声消除器应当安装在国际交换中,并且在一些情况下如果端到端的传输延迟超过25ms,类似的网络回声消除器应当安装在一个国家内部的电话交换中,见文献[1]。然而,在一些情况下,在网络的适当位置,即,接近回声源的电话交换中,可以没有回声消除器。如果是这种情况,对该位置的长距离呼叫以及来自该位置的长距离呼叫就会产生回声问题。在另一个国家中的国际运营商可能想通过检测具有远距离位置中产生的回声的呼叫并且采取适当的措施来消除该回声,以便为它自己的消费者解决这个问题。为了实现该目的,有必要检测回声并且估计该回声的延迟。
另一个回声源是在电话(终端)的扩音器和麦克风之间的声学耦合。这种类型的回声可以从例如移动终端或IP电话返回。理想地,终端应当以这样的方式处理它们自己的回声:没有回声被传送回系统。即使当前使用的终端中的许多终端能够适当地处理它们自己的回声,也仍然存在不能适当处理它们自己的回声的模型。
声学的回声问题在网络中不容易解决,见文献[2],因为回声路径包括语音编码器和解码器。而且,在移动网络的情况下,信号通过在信号中引入了误码的无线电信道传输。这使得回声路径是非线性且不固定的,并且在回声路径中引入了未知的延迟,因此普通的网络回声消除器通常不能应付从移动终端返回的声学的回声。再有,为了应付回声,首先需要检测在呼叫中是否存在回声,并且如果存在的话,就估计该回声的延迟。另一个这种类型的检测有用的应用是网络统计数据收集。电信运营商可能希望收集与它的网络中的电话呼叫的质量有关的各种统计数据。所关心的一部分统计数据是从终端(例如,移动电话或IP电话)返回的回声的存在以及与这些回声相关联的延迟。为了完成这个任务,统计数据收集单元可能包括检测和延迟估计框22,如图1所示。在这个例子中,检测和估计结果将被存储在数据库中供以后使用,这与先前的例子中立即将所述结果用于回声控制的情况相反。存储在数据库中的统计数据可用于当前聚集的网络统计数据。如 果运营商接到消费者关于通话质量的抱怨,那么存储在数据库中的统计数据还可用于问题解答。
再一种应用是多方会议桥,见文献[3]。在用于电信系统的多方桥中,来自不同方的入局麦克风信号被数字混合并且传送到不同方的扩音器。作为例子,在基本的实施例中,来自所有方的入局信号可以被混合并且传送到所有方。由于某些原因,例如,为了降低所传送信号的背景噪声级,多方桥的一些实现仅仅混合来自多方的固定子集的入局信号。这个选择通常基于信号电平和不同方的扬声器活动来执行,其中,如果任何其它的方没有扬声器活动存在,则保留最近的活跃讲话者。对基本操作的进一步修改是来自A方的麦克风信号可以从信号传送回A方的信号的总和中排除。这样做的原因是来自A方的麦克风信号已经存在于讲话者A的扩音器内(由于电话机中的侧音),以及如果系统中存在明显的传输延迟,那么麦克风信号将作为不希望有的回声而被感知。
随着各种移动终端(例如,蜂窝电话)的使用的增加,在一个会议呼叫中的两个或两个以上用户可能处在相同的位置这样的情形将变得越来越常见。在这些情况下,来自用户A的语音将同样作为对用户B的麦克风的输入而存在。由于明显的传输延迟,因此来自用户B的麦克风的信号将不希望有的讲话者回声引入给用户A。此外,来自用户A的麦克风信号将传送给用户B的扩音器。由于在讲话者A和用户B之间的语音的直接路径,以及由于在系统中的显著的传输延迟,这可能使用户B感受到讲话者A的受话回声。类似地,如果来自用户A和B的两个麦克风信号都传送到其它方,那么这个信号可能包含不希望有的讲话者A的受话回声。因此,需要检测至多方会议桥的两个入局线路之间的串音,并且控制基于该检测到的串音来控制对相应用户的传送。
在本说明书中,产生于已知的信号的所接收的信号的分量将被称作回声。
检测回声信号有几种方式。例如,人们可以使用跨越所关心的延迟范围的一组短自适应滤波器以及关联的柱状图来确定回声信号是否存在并估计回声信号的延迟。在文献[1]中描述了这个解决方案。这个解决方案的问题在于它的高计算成本。
另一种已知的方法是使上行链路和下行链路信号功率对于所关心的若干延迟相互关联。可以基于对一段时间内上行链路和下行链路之间功率相关性观测来检测回声。如果对于特定延迟的功率相关性已存在足够长的一段时间,则检测到回声。如果对若干延迟检测到回声,则其中功率相关性最大的延迟被选作延迟估计,见文献[5]。这个解决方案的问题是它的慢收敛(功率相关性必须存在足够长的时间以便检测回声并估计回声的延迟可靠性)。
上述的两种方法的共同缺点是它们都不能在没有首先解码语音信号的条件下直接应用于编码的语音。由于无码型变换器操作(TrFO)和无二次编解码操作(TFO)在网络中的引入,直接用于解码的比特流的能力变得越来越重要。
发明内容
本发明的一个目的是提供简化的回声检测,特别是适合于解码的比特流的应用的回声检测。
另一个目的是提供适合于表示两个信号之间的相似性测量。
这些目的根据所附的权利要求来实现。
本发明基于基音(pitch)比较。简言之,本发明形成在第一信号的基音估计和与第一信号存在预定延迟的第二信号的基音估计之间一组距离测量值。从该组中选择对应于第一和第二信号之间的最高相似性的距离测量值。如果所选择的距离测量值与相似性阈值具有一定的关联,则第二信号被分类为包括来自第一信号的回声。如果已经发现了回声,则与所选择的距离测量值相对应的延迟可以用作回声延迟估计。
附图说明
可以通过参考以下结合附图进行的描述来对本发明以及本发明的其它目的和优点作最好的理解,其中:
图1是说明通常的回声产生和检测的框图;
图2是根据本发明的相似性检测装置的实施例的框图;
图3是根据本发明的回声检测器的一实施例的框图;
图4是流程图,说明根据本发明的回声检测方法的实施例;
图5是根据本发明的相似性检测装置的另一个实施例的框图;
图6是根据本发明的回声检测器的另一个实施例的框图;以及
图7是根据本发明的回声检测器的再一个实施例的框图。
具体实施方式
在下述描述中,对执行相同或相似功能的元件配以相同的参考名称。
为了检测回声(回声是信号的反射),需要下行链路和上行链路信号之间的相似性测量。由移动手机产生的回声的回声路径是非线形且不固定的,这使得使用直接应用于信号的波形的传统相似性测量很困难。
在下述说明中,GSM AMR(自适应多速率)语音编解码器将作为范例使用,但是可采用许多其它的语音编解码器进行相似的论述,特别是那些基于CELP(码激励线性预测)的语音编解码器。AMR编解码器对被分成4个5ms(40个样本)的子帧的20ms(160个样本)的帧起作用。在AMR解码的比特流中可用的参数是LSP(线谱对)向量,分数基音周期迟滞(基音周期),创新的代码向量,以及基音和创新的增益[6]。根据本发明,基音周期是用于回声检测的选择的参数。相信语音信号的基音周期或基频具有比在AMR编码器中用来表示语音的其它参数更多的机会来通过未知的非线形系统而未被改变或只有很少的改变。该结论的直觉原因是,非线形系统有可能产生谐波,但是不会改变通过该系统的正弦波的基频。此外,在无线电通信系统中,基音周期通常受信道编码保护。
Tul(t)表示子帧t的上行链路(见图1)基音周期,Tdl(t-Δ)表示子帧t-Δ的下行链路基音周期。由于测量误差的影响和来自移动方的真实信号的影响,上行链路基音周期将被看作是随机变量。
通过下式来表示上行链路和下行链路基音周期之间的差:
w(t,Δ)=Tul(t)-Tdl(t-Δ)(1)
通过这些定义,现在有可能使用假设检验。因此,建立以下假设:
H1:上行链路信号包含上行链路和下行链路基音周期的相似性表示的回声。
H0:回声不存在,并且上行链路基音周期仅基于存在于移动方的信号来形成。
在假设H1的情况下,过程w(t,Δ)对驻留在移动电话中的语音编解码器中的基音估计误差以及来自真实移动信号的影响进行建模。仿真显示,估计误差的分布可以由拉普拉斯分布来近似并且来自近端信号的影响对分布函数给出均匀底部(uniform floor)。因此,假定在假设H1的情况下,w(t,Δ)的分布函数由下式给出:
其中:
β是设计参数(通常在0.1和0.3之间),可以用于加权拉普拉斯和均匀分量。
δ是拉普拉斯分布的参数(通常在1和3之间)。
a,b是由在语音编解码器中能够表示基音周期的界限确定的变量。在AMR编解码器的12.2kbit/s模式中,基音周期的范围是从18到143,并且在其它模式中的范围是从20到143。这里给定在12.2kbit/s模式中a=-125,b=125,并且在其它模式中a=-123,b=123。
α是对概率密度函数进行标准化使得它整合成一个整体的常量。这个常量通过对下式求解获得:
其中给定:
公式(2)可以以更方便的形式重写来进一步推导出:
在假设H0的情况下,w(t,Δ)的分布假定在区间[a,b]内是均匀的,即:
假定由随机过程w(t,Δ)在不同的时间情况下得到的值是统计上独立的。则N个这样的密度的(对应于N个子帧;通常N是100或更大值)联合概率密度是单独密度的乘积:
现在可以为上述的假设H0和H1设计似然比检验,见文献[7]。假定两个假设都具有相同的先验概率。则该检验由下式给出:
取对数并简化(8),得到下列检验:
注意到(9)式右侧仅包括已知的常量。因此(9)式右侧可以由阈值表示:
同样,(9)式中的最小函数的第二自变量可以由极限常量表示:
因此,(9)式可以写为(使用w(t,Δ)的定义):
距离D(Δ)表示具有延迟Δ的回声的存在/不存在的测量值。D(Δ)超过阈值TH越多,则具有延迟Δ的回声(假设H1)的存在就会变得越肯定。然而,应当注意到D(Δ)仅仅表示在特定的时间场合下回声的存在/不存在的测量值。对于任意时间场合,对应于(12)的一般性表达式是:
等式(13)现在也可以用作检测具有延迟Δ的回声的存在/不存在的回声延迟检测器的基础。该检测器需要针对延迟Δ来计算上行链路和下行链路基音周期之间的绝对距离,将绝对距离限定(饱和)为小于LIM,对所有的N个时间场合的结果求和并且将求和结果与阈值TH 进行比较。这样的检测器的结构如图2所示。该检测器包括一减法器24,它接收上行链路基音Tul(t)和延迟的下行链路基音Tdl(t-Δ)。距离或差信号w(t,Δ)被发送给连接到限幅器28与求和单元30的绝对值单元26,其中最后的N个结果相加并且被N除。然后将总和发送给分类器或比较器32,其中该总和与阈值TH作比较。如果超过阈值,则认为假设H1有效,即,对于延迟Δ,回声已经被检测到,否则认为假设H0有效,即,不存在回声。
图2显示了对具有延迟Δ的单个延迟信道的检测。为了能够检测具有未知延迟的回声,并且估计该延迟,需要实现并行操作的若干延迟信道,如图3所示。回声延迟对应于具有最大关联的距离测量值D(t,Δ)的延迟Δ。在图3中,一组信号相似性检测器34,可以具有图2中说明的结构,对一组延迟ΔMIN,ΔMIN+1,...,ΔMAX确定距离测量值D(t,ΔMIN),D(t,ΔMIN+1),...,D(t,ΔMAX)。延迟取决于应用(其中认为存在回声)。对于在GSM系统中的移动回声检测,ΔMIN位于区间100-160ms且ΔMAX位于区间300-360ms。如果选择的测量值超过阈值TH,则选择器36选择对应于最大距离测量值D(t,Δ)的延迟Δ(t),并且分类器32输出对应的延迟。如果选择的测量值没有超过阈值,则表明没有回声存在,则生成“哑元(dummy)”值,例如0。
在备选的实施例中,回声检测器可以实现为运行总和,即,在时间t,我们对各个所关心的延迟计算以下的距离测量值并且将其与0作比较:
其中TH和LIM与(13)式中常量相对应,并且λ是加权因子,用来“忘记”对D(t,Δ)的较旧的影响。例如,对于所述常量,适当的值是TH=7(TH通常位于区间[4.7,10.9])以及LIM=9(LIM通常位于区间[7.1,18.0])。加权因子λ通常位于区间[0.9,0.99]。注意,由于在(14)中引入了具有负号的绝对基音周期距离,因此大的距离测量值意味着 在上行链路和下行链路信号之间存在着相似性,并且反之亦然,小的距离测量值表明没有发现相似性。如果距离测量值的任何一个都超过了零级,则检测到回声。对应于Δ的回声延迟具有超过零的最大的关联距离测量值D(t,Δ)。
图4是流程图,说明了根据本发明的回声延迟检测方法的一实施例。在特定的时刻t,步骤S1对于m和m-Δ的可能值来确定Tul(t-m)和Tdl(t-m-Δ)。通常较旧的值存储在缓冲存储器中。步骤S2根据(13)对于各个延迟Δ确定距离测量值D(t,Δ)。步骤S3选择最大的D(t,Δ)。步骤S4测试选择的距离测量值是否超过阈值TH。如果超过,则步骤S5输出对应于所选择的距离测量值D(t,Δ)的延迟Δ。否则,步骤S6输出表明“没有回声”的值,例如值0。
应当注意,计算上行链路和下行链路基音周期之间的距离测量值D(t,Δ)的特定的方式对于本发明并不是关键的。本发明的另一个实施例是将估计误差w(t,Δ)的分布建模为高斯而不是拉普拉斯。在这种情况下,如上文提出的相似的推导将导致与上述缩短的(truncated)绝对距离测量值相反的二次距离测量值。
根据该实施例,对于不同的信号延迟Δ,使用N个子帧(例如,N=16)的矩形窗来计算上行和下行链路信号基音周期之间的距离,如下:
如果{DG(t,Δ)}ΔMIN ΔMAX的最小值小于预定义的阈值THG(例如10),则检测到回声的存在并且可以根据对应于最小值DG(t,Δ)的延迟来发现信号延迟。图5和6说明了这个实施例。在图5中,平方单元40对上行链路基音Tul(t)和延迟的下行链路基音Tdl(t-Δ)之间的差求平方。这些平方在求和单元42中相加,并且得到的总和DG(t,Δ)被传送到分类器或比较器44中,分类器或比较器44将总和与阈值THG进行比较(THG 通常位于区间[8,12]中)。如果超过阈值,则不存在回声;否则就检测到回声。
在图6说明的实施例中,一组信号相似性检测器46,可以具有图5说明的结构,对于一组预定的延迟ΔMIN,ΔMIN+1,...,ΔMAX确定距离测量值DG(t,ΔMIN),DG(t,ΔMIN+1),...,DG(t,ΔMAX)。选择器48选择最小的距离测量值DG(t,Δ),并且如果所选择的距离测量值没有超过阈值THG,则分类器44输出相应的延迟Δ(t)。如果所选择的距离测量值超过阈值,则表明没有回声存在,就生成“哑元”值,例如0。
在对应于等式(14)的备选实施例中,高斯实施例可以按下式实现:
本发明的另一个实施例是将估计误差w(t,Δ)的分布建模为雷维阿尔法-稳定分布,见文献[8]。适当的分布的重要特征是该分布应当相对于0对称并且该分布应当具有相当窄的最大值。
即使本发明在语音信号被编码(TrFO或TFO用于传输)时尤其有用,本发明也能处理非编码的信号的情况,例如,在ITU-T G.711 A-law或μ-law的格式。在这种情况下,需要将已知的语音信号的基音估计器和所接收的信号添加到检测器。例如在文献[6]中描述了适当的基音估计器。图7中示出了这种配置。在这个实施例中,基音估计器50已经被插入到图3的已知的和接收的信号与回声检测器之间。
在上述的实施例中,选择一个距离测量值并且将其与阈值比较。然而,另一种可能是首先将各个距离测量值与阈值作比较,并且然后从已经通过阈值比较的一组测量值中选择一个测量值(最大或最小,取决于实施例)。
存在若干的实用性能够被添加到上文导出的基本的检测器结构中:
语音信号是不稳定的,并且如果下行链路语音缺失或由于太安静而不能生成任何的回声,则不必运行回声检测器。在实际的实施例中,例如,仅当下行链路信号功率超过40dBm0时才可以更新距离测量值。
同样,下行链路基音增益上可能存在阈值。例如对于AMR编解码器,阈值可以设定为10000。
检测仅可以对“好的”上行链路帧执行,即,SID(无声插入描述符)帧,并且可以排除破坏的帧。
为了允许快速检测伪回声突发(spurious echo burst),距离测量值可以在例如-200处饱和,即我们始终有D(t,Δ)≥-200。
众所周知的事实是基音估计中最常见的误差导致两倍的实际基音周期。这个特征可以用来增强回声检测器。在等式(14)的特定实现中,可以考虑通过将检测器增加到最初的检测器来考虑这个因素,其中下行链路基音周期与上行链路基音周期的一半相比较。例如,等式(14)可以修正为:
其中λ2、TH2、LIM2相应于等式(14)中的λ1、TH、LIM,但是可能具有不同的值。因此我们现在考虑与在移动电话中的编码器产生的最有可能的基音估计误差有关的信道,选择比(14)中的TH,LIM小的常量TH2,LIM2是合理的。例如,该常量的适当值是TH2=4(TH2通常位于区间[3,5]中)以及LIM2=6(LIM2通常位于区间[5,7]中)。通常λ2=λ给出相同的“存储器长度”,但是这并不是确实必要的。在解释性的实施例中,在时刻t仅使用通过(14)和(17)给出的更新中的一个。这通过下文的伪码来论证:
然后使用(14)来更新D(t,Δ)
否则,使用(17)来更新D(t,Δ)
其它相似性的基音估计误差,例如实际基音的一半,都可以类似地被处理。
信号相似性和回声检测器的不同框的功能性通常可以通过一个或若干微处理器或微/信号处理器的结合以及相应的软件来实现。虽然本发明已经参考回声检测作了描述,这意味着有关的信号之间的一定的延迟,但是要理解,相同的原理事实上可以用来检测两个一般信号(相互具有或不具有延迟)之间的相似性。
此外,虽然参考语音信号描述了本发明,但是要理解,相同的原理也适用于更多的具有谐波内容的一般音频信号,例如音乐。事实上相同的原理适用于任何类型的能够部分地由基音估计表征的信号。
所描述的发明具有若干优点:
它允许在若干语音和/或音频信号和噪声的混合中的已知语音或音频信号的延迟的和可能的失真的副本的快速检测和延迟估计。例如它允许移动回声的快速检测和延迟估计。
它能够应对非线形回声路径。
它能够对编码的语音起作用(仅要求基音周期的提取(extraction))。
本领域的技术人员将会理解,可在不背离由所附的权利要求确定的本发明的范围的前提下,对本发明进行各种修改和改变。
参考文献
ITU-T Recommendation G.131,Control of talker echo
A.Eriksson et al.,Mobile Crosstalk Control-Enhancing speech qualityin mobile systems,Ericsson Review 1998,No.2.
US Patent 6,771,779,Reducing acoustic crosstalk in multi-microphoneconference system by inverting estimated crosstalk matrix for filtering
US Patent 6,256,384,Method and apparatus for cancelling echooriginating from a mobile terminal.
US Patent 6,466,666,Echo power estimation method for telephonysystem
3GPP TS 26.090 V6.0.0(2004-12)3rd Generation Partnership Project;Technical Specification Group Services and System Aspects;MandatorySpeech Codec speech processing functions;Adaptive Multi-Rate(AMR)speech codec;Transcoding functions(Release 6)
L.Van Trees,Detection,Estimation,and Modulation Theory,Wiley &Sons,1971,pp.19-33.
Wikipedia,http://answers.com/topic/l-vy-distribution.
Claims (18)
1.一种回声检测方法,包括以下步骤:
通过假设检验,在上行链路信号与相对于所述上行链路信号存在预定延迟的下行链路信号的基音周期之间形成一组距离测量值,其中假定所述上行链路信号的基音周期和所述下行链路信号的基音周期之间的差异当回声存在时遵循结合均匀底部的拉普拉斯分布、高斯分布或雷维阿尔法-稳定分布以及当回声不存在时遵循均匀分布;
从所述组中选择与所述上行链路信号和下行链路信号之间的最高相似性相对应的距离测量值;
如果所选择的距离测量值超过预定相似性阈值,则将所述下行链路信号分类为包括来自所述上行链路信号的回声。
2.如权利要求1所述的方法,包括以下步骤:如果所述下行链路信号已经被分类为包括回声,则指示对应于所选择的距离测量值的延迟。
3.如权利要求1或2所述的方法,其中与采样所述上行链路信号的时刻t和所述上行链路信号与所述下行链路信号之间的延迟Δ相关联的距离测量值D(t,Δ)与下式成比例:
其中,
Tul是所述上行链路信号的基音周期,
Tdl是所述下行链路信号的基音周期,
LIM是底限,
N是所述距离测量值中包括的各个基音周期的数量。
4.如权利要求1或2所述的方法,其中与采样所述上行链路信号的时刻t和所述上行链路信号与所述下行链路信号之间的延迟Δ相关联的距离测量值D(t,Δ)与下式成比例:
D(t,Δ)=λD(t-1,Δ)-(1-λ)(TH+min(|Tul(t)-Tdl(t-Δ)|,LIM))
其中,
Tul是所述上行链路信号的基音周期,
Tdl是所述下行链路信号的基音周期,
LIM是底限,
TH是预定常量,
λ是预定加权因子。
5.如权利要求1或2所述的方法,其中与采样所述上行链路信号
的时刻t和所述上行链路信号与所述下行链路信号之间的延迟Δ相关联的距离测量值DG(t,Δ)与下式成比例:
其中,
Tul是所述上行链路信号的基音周期,
Tdl是所述下行链路信号的基音周期,
N是所述距离测量值中包括的各个基音周期的数量。
6.如权利要求1或2所述的方法,其中与采样所述上行链路信号的时刻t和所述上行链路信号与所述下行链路信号之间的延迟Δ相关联的距离测量值DG(t,Δ)与下式成比例:
DG(t,Δ)=λDG(t-1,Δ)-(1-λ)((Tul(t)-Tdl(t-Δ))2-THG)
其中,
Tul是所述上行链路信号的基音周期,
Tdl是所述下行链路信号的基音周期,
THG是预定常量,
λ是预定加权因子。
7.如权利要求1或2所述的方法,包括以下步骤:从编码的比特流中获得所述基音周期。
8.如权利要求1或2所述的方法,包括以下步骤:从未编码的数据流中得到所述基音周期。
9.一种确定上行链路信号和下行链路信号之间的相似性的方法,包括以下步骤:通过假设检验,在所述上行链路信号和所述下行链路信号的基音周期之间形成距离测量值,其中假定所述上行链路信号的基音周期和所述下行链路信号的基音周期之间的差异当所述信号相似时遵循结合均匀底部的拉普拉斯分布、高斯分布或雷维阿尔法-稳定分布以及当所述信号不相似时遵循均匀分布。
10.如权利要求9所述的方法,其中与采样所述上行链路信号的时刻t和所述上行链路信号与所述下行链路信号之间的延迟Δ相关联的距离测量值D(t,Δ)与下式成比例:
其中,
Tul是所述上行链路信号的基音周期,
Tdl是所述下行链路信号的基音周期,
LIM是底限,
N是所述距离测量值中包括的各个基音周期的数量。
11.如权利要求9所述的方法,其中与采样所述上行链路信号的时刻t和所述上行链路信号与所述下行链路信号之间的延迟Δ相关联的距离测量值D(t,Δ)与下式成比例:
D(t,Δ)=λD(t-1,Δ)-(1-λ)(TH+min(|Tul(t)-Tdl(t-Δ)|,LIM))
Tul是所述上行链路信号的基音周期,
Tdl是所述下行链路信号的基音周期,
LIM是底限,
TH是预定常量,
λ是预定加权因子。
12.如权利要求9所述的方法,其中与采样所述上行链路信号的时刻t和所述上行链路信号与所述下行链路信号之间的延迟Δ相关联的距离测量值DG(t,Δ)与下式成比例:
其中,
Tul是所述上行链路信号的基音周期,
Tdl是所述下行链路信号的基音周期,
N是所述距离测量值中包括的各个基音周期的数量。
13.如权利要求9所述的方法,其中与采样所述上行链路信号的时刻t和所述上行链路信号与所述下行链路信号之间的延迟Δ相关联的距离测量值DG(t,Δ)与下式成比例:
DG(t,Δ)=λDG(t-1,Δ)+(1-λ)((Tul(t)-Tdl(t-Δ))2-THG)
其中,
Tul是所述上行链路信号的基音周期,
Tdl是所述下行链路信号的基音周期,
THG是预定常量,
λ是预定加权因子。
14.如权利要求9所述的方法,包括以下步骤:从编码的数据流中获得所述基音周期。
15.如权利要求9所述的方法,包括以下步骤:从未编码的数据流中得到所述基音周期。
16.一种回声检测器,包括:
检测器部件(34,46),用于在上行链路信号和相对于所述上行链路信号存在预定延迟的下行链路信号的基音周期之间形成一组距离测量值,所述检测器部件(34,46)设置成使用假设检验,其中假定所述上行链路信号的基音周期和所述下行链路信号的基音周期之间的差异当回声存在时遵循结合均匀底部的拉普拉斯分布、高斯分布或雷维阿尔法-稳定分布以及当回声不存在时遵循均匀分布;
选择器(36,48),用于从所述组中选择对应于所述上行链路信号和下行链路信号之间的最高相似性的距离测量值;
分类器(32,44),用于在所选择的距离测量值超过预定相似性阈值(TH,THG)的情况下,将所述下行链路信号分类为包括来自所述上行链路信号的回声。
17.如权利要求16所述的回声检测器,其中所述分类器(32,44)设置成在所述下行链路信号已经被分类为包括回声的情况下,指示对应于所选择的距离测量值的延迟。
18.一种用于确定上行链路信号和下行链路信号之间的相似性的设备,包括检测器部件(34,46),用于在所述上行链路信号和所述下行链路信号的基音周期之间形成距离测量值,所述检测器部件(34,46)设置成使用假设检验,其中假定所述上行链路信号的基音周期和所述下行链路信号的基音周期之间的差异当所述信号相似时遵循结合均匀底部的拉普拉斯分布、高斯分布或雷维阿尔法-稳定分布以及当所述信号不相似时遵循均匀分布。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US74190305P | 2005-12-05 | 2005-12-05 | |
US60/741,903 | 2005-12-05 | ||
PCT/SE2006/001358 WO2007067125A2 (en) | 2005-12-05 | 2006-11-28 | Echo detection |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101322323A CN101322323A (zh) | 2008-12-10 |
CN101322323B true CN101322323B (zh) | 2013-01-23 |
Family
ID=38123322
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2006800456997A Expired - Fee Related CN101322323B (zh) | 2005-12-05 | 2006-11-28 | 回声检测方法和装置 |
Country Status (10)
Country | Link |
---|---|
US (1) | US8130940B2 (zh) |
EP (1) | EP1958341B1 (zh) |
JP (1) | JP4955696B2 (zh) |
KR (1) | KR101300327B1 (zh) |
CN (1) | CN101322323B (zh) |
AU (1) | AU2006323242B2 (zh) |
BR (1) | BRPI0619402B8 (zh) |
CA (1) | CA2630635C (zh) |
RU (1) | RU2427077C2 (zh) |
WO (1) | WO2007067125A2 (zh) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7809129B2 (en) * | 2007-08-31 | 2010-10-05 | Motorola, Inc. | Acoustic echo cancellation based on noise environment |
US20090168673A1 (en) * | 2007-12-31 | 2009-07-02 | Lampros Kalampoukas | Method and apparatus for detecting and suppressing echo in packet networks |
JP5167871B2 (ja) * | 2008-03-05 | 2013-03-21 | 沖電気工業株式会社 | 伝搬遅延時間推定器、プログラム及び方法、並びにエコーキャンセラ |
US8488745B2 (en) * | 2009-06-17 | 2013-07-16 | Microsoft Corporation | Endpoint echo detection |
US9343073B1 (en) * | 2010-04-20 | 2016-05-17 | Knowles Electronics, Llc | Robust noise suppression system in adverse echo conditions |
EP2444967A1 (en) * | 2010-10-25 | 2012-04-25 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Echo suppression comprising modeling of late reverberation components |
US9307321B1 (en) | 2011-06-09 | 2016-04-05 | Audience, Inc. | Speaker distortion reduction |
JP5235226B2 (ja) * | 2011-06-28 | 2013-07-10 | 日本電信電話株式会社 | エコー消去装置及びそのプログラム |
GB2501234A (en) * | 2012-03-05 | 2013-10-23 | Microsoft Corp | Determining correlation between first and second received signals to estimate delay while a disturbance condition is present on the second signal |
JP6343585B2 (ja) * | 2015-05-14 | 2018-06-13 | 日本電信電話株式会社 | 未知伝達系推定装置、未知伝達系推定方法、およびプログラム |
KR101842777B1 (ko) * | 2016-07-26 | 2018-03-27 | 라인 가부시키가이샤 | 음질 개선 방법 및 시스템 |
JP6833616B2 (ja) * | 2017-05-29 | 2021-02-24 | 株式会社トランストロン | エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム |
CN108881652B (zh) * | 2018-07-11 | 2021-02-26 | 北京大米科技有限公司 | 回音检测方法、存储介质和电子设备 |
CN112534800B (zh) * | 2018-07-18 | 2021-10-15 | 谷歌有限责任公司 | 一种回波检测的方法和系统 |
KR20200024066A (ko) * | 2018-08-27 | 2020-03-06 | 서강대학교산학협력단 | 스테레오 노이즈 제거 장치 및 스테레오 노이즈 제거 방법 |
CN109688284B (zh) * | 2018-12-28 | 2021-10-08 | 广东美电贝尔科技集团股份有限公司 | 一种回音延时检测方法 |
CN111681667B (zh) * | 2020-06-23 | 2021-05-04 | 青岛科技大学 | 基于自适应窗口滤波和小波阈值优化的水声信号去噪方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004021679A2 (en) * | 2002-02-21 | 2004-03-11 | Tecteon Plc | Echo detector having correlator with preprocessing |
CN1510891A (zh) * | 2002-10-25 | 2004-07-07 | �ż��� | 回声的检测和监视 |
US6804203B1 (en) * | 2000-09-15 | 2004-10-12 | Mindspeed Technologies, Inc. | Double talk detector for echo cancellation in a speech communication system |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK140611B (da) * | 1976-03-24 | 1979-10-08 | Rovsing As Christian | Apparat til detektering af ekkosignaler. |
ZA95599B (en) * | 1994-02-28 | 1996-02-06 | Qualcomm Inc | Doubletalk detection by means of spectral content |
US6912277B1 (en) * | 1997-08-29 | 2005-06-28 | Anip, Inc. | Assigning telecommunications services to matchable classes |
JP3591068B2 (ja) * | 1995-06-30 | 2004-11-17 | ソニー株式会社 | 音声信号の雑音低減方法 |
JP3508978B2 (ja) * | 1997-05-15 | 2004-03-22 | 日本電信電話株式会社 | 音楽演奏に含まれる楽器音の音源種類判別方法 |
US6826350B1 (en) * | 1998-06-01 | 2004-11-30 | Nippon Telegraph And Telephone Corporation | High-speed signal search method device and recording medium for the same |
US6226606B1 (en) * | 1998-11-24 | 2001-05-01 | Microsoft Corporation | Method and apparatus for pitch tracking |
US6260016B1 (en) * | 1998-11-25 | 2001-07-10 | Matsushita Electric Industrial Co., Ltd. | Speech synthesis employing prosody templates |
SE516143C2 (sv) * | 1999-05-10 | 2001-11-26 | Ericsson Telefon Ab L M | Skattning av ren fördröjning |
US6643337B1 (en) * | 2000-06-02 | 2003-11-04 | The United States Of America As Represented By The Secretary Of The Navy | Codifference correlator for impulsive signals and noise |
EP1301018A1 (en) * | 2001-10-02 | 2003-04-09 | Alcatel | Apparatus and method for modifying a digital signal in the coded domain |
EP2068308B1 (en) * | 2003-09-02 | 2010-06-16 | Nippon Telegraph and Telephone Corporation | Signal separation method, signal separation device, and signal separation program |
JP2005326673A (ja) | 2004-05-14 | 2005-11-24 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識方法、その装置およびプログラム、その記録媒体 |
US7852792B2 (en) * | 2006-09-19 | 2010-12-14 | Alcatel-Lucent Usa Inc. | Packet based echo cancellation and suppression |
EP2043278B1 (en) * | 2007-09-26 | 2013-03-20 | Psytechnics Ltd | Signal processing |
-
2006
- 2006-11-28 RU RU2008127412/09A patent/RU2427077C2/ru not_active IP Right Cessation
- 2006-11-28 WO PCT/SE2006/001358 patent/WO2007067125A2/en active Application Filing
- 2006-11-28 JP JP2008543234A patent/JP4955696B2/ja active Active
- 2006-11-28 CA CA2630635A patent/CA2630635C/en not_active Expired - Fee Related
- 2006-11-28 EP EP06824491.2A patent/EP1958341B1/en not_active Not-in-force
- 2006-11-28 AU AU2006323242A patent/AU2006323242B2/en not_active Ceased
- 2006-11-28 CN CN2006800456997A patent/CN101322323B/zh not_active Expired - Fee Related
- 2006-11-28 BR BRPI0619402A patent/BRPI0619402B8/pt not_active IP Right Cessation
- 2006-11-28 US US12/095,856 patent/US8130940B2/en active Active
- 2006-11-28 KR KR1020087013659A patent/KR101300327B1/ko active IP Right Grant
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6804203B1 (en) * | 2000-09-15 | 2004-10-12 | Mindspeed Technologies, Inc. | Double talk detector for echo cancellation in a speech communication system |
WO2004021679A2 (en) * | 2002-02-21 | 2004-03-11 | Tecteon Plc | Echo detector having correlator with preprocessing |
CN1510891A (zh) * | 2002-10-25 | 2004-07-07 | �ż��� | 回声的检测和监视 |
Also Published As
Publication number | Publication date |
---|---|
KR20080082624A (ko) | 2008-09-11 |
BRPI0619402B8 (pt) | 2020-09-24 |
AU2006323242A1 (en) | 2007-06-14 |
CA2630635A1 (en) | 2007-06-14 |
EP1958341B1 (en) | 2015-01-21 |
WO2007067125A3 (en) | 2007-08-16 |
US20080292109A1 (en) | 2008-11-27 |
KR101300327B1 (ko) | 2013-08-28 |
EP1958341A2 (en) | 2008-08-20 |
BRPI0619402A2 (pt) | 2011-10-04 |
CA2630635C (en) | 2015-04-28 |
JP4955696B2 (ja) | 2012-06-20 |
US8130940B2 (en) | 2012-03-06 |
AU2006323242B2 (en) | 2010-08-05 |
RU2008127412A (ru) | 2010-01-20 |
RU2427077C2 (ru) | 2011-08-20 |
CN101322323A (zh) | 2008-12-10 |
EP1958341A4 (en) | 2014-01-01 |
WO2007067125A2 (en) | 2007-06-14 |
JP2009518663A (ja) | 2009-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101322323B (zh) | 回声检测方法和装置 | |
US7539615B2 (en) | Audio signal quality enhancement in a digital network | |
De Rango et al. | Overview on VoIP: Subjective and objective measurement methods | |
US8184537B1 (en) | Method and apparatus for quantifying, predicting and monitoring the conversational quality | |
US7436822B2 (en) | Method and apparatus for the estimation of total transmission delay by statistical analysis of conversational behavior | |
Ding et al. | Non-intrusive single-ended speech quality assessment in VoIP | |
Rodríguez et al. | Speech quality parametric model that considers wireless network characteristics | |
US8009825B2 (en) | Signal processing | |
KR101035736B1 (ko) | 이동통신 시스템의 단말 장치에서 반향 제거 장치 및 방법 | |
Szwoch et al. | A low complexity double-talk detector based on the signal envelope | |
Ding et al. | Nonintrusive measurement of echo-path parameters in VoIP environments | |
Werner | Quality of Service in IP Telephony: An End to End Perspective | |
Kajackas et al. | Investigation the ability of objective measures of the perceptual speech quality in mobile networks | |
Brandstätter | perception oriented, delay-controlled echo cancellation in IP based telephone networks | |
Cermak | Verbal descriptors for VoIP speech sounds | |
Hamidia et al. | Improving network echo cancellation in VoIP using packet loss concealment | |
Rodrıguez et al. | VoIP quality improvement with a rate-determination algorithm | |
Trump | Detection of echo generated in mobile phones using pitch distance | |
Möller et al. | Towards a universal value scale for quantifying the quality of speech communication across services | |
BRPI0619402B1 (pt) | Método de detecção de eco, e, detector de eco | |
Reynolds et al. | Achieving VoIP voice quality | |
Kauffman | An algorithm to evaluate the echo signal and the voice quality in VoIP networks | |
Sun et al. | End-To-End Speech Quality Analysis for VoIP | |
Fricsson | Detection of echo generated in mobile phones | |
Mousa et al. | VoIP Quality Assessment Technologies |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130123 Termination date: 20191128 |