CN102318328A - 延迟估计器 - Google Patents

延迟估计器 Download PDF

Info

Publication number
CN102318328A
CN102318328A CN2009801566112A CN200980156611A CN102318328A CN 102318328 A CN102318328 A CN 102318328A CN 2009801566112 A CN2009801566112 A CN 2009801566112A CN 200980156611 A CN200980156611 A CN 200980156611A CN 102318328 A CN102318328 A CN 102318328A
Authority
CN
China
Prior art keywords
value
signal
delay
point value
cost
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2009801566112A
Other languages
English (en)
Other versions
CN102318328B (zh
Inventor
W.B.克雷恩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN102318328A publication Critical patent/CN102318328A/zh
Application granted granted Critical
Publication of CN102318328B publication Critical patent/CN102318328B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B3/00Line transmission systems
    • H04B3/02Details
    • H04B3/46Monitoring; Testing

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Telephonic Communication Services (AREA)
  • Paper (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)
  • Radar Systems Or Details Thereof (AREA)

Abstract

本发明提供一种用于找到在两个点之间行进的信号的延迟的估计的方法和装置。在参考点和接收点二者处在最终数目的时刻由该信号估计一个量。通过与适合于该量的典型大小的阈值相比较来量化该值。如果来自于接收点的量化值相对于来自于参考点的量化值向后移位了真实的延迟,则量化值的某些共生具有非常低的概率。因此,最佳延迟估计是输出最小数目的低概率共生的那个移位。

Description

延迟估计器
技术领域
本发明一般涉及用在通信网络中的方法和设备。更精确地,它涉及一种用于在通信网络中估计两个点之间的信号行进(travel)的延迟的方法和设备。本发明可以具体地用在用于在通信设备中估计或减轻回波(echo)的应用中。
背景技术
考虑在参考点处已知并且在有限时间中通过系统行进到接收点的声波或电信号。延迟是所述特征信号特性在参考点处出现与它在接收点处重现之间经过的时间。在系统是通信网络的具体情况下,延迟可以是在各种传导材料中的传播时间、在解码器和编码器(具体地是模拟和数字格式之间的转换)中的处理时间、在分组交换网中的路由期间的等待时间、以及当信号在路径的一些段中以声波形式发送时可能的在空气中的传播时间。
通过系统行进的声波或电信号的延迟的准确估计在许多应用中是很有价值的,例如在通信设备中的回波消除和回波抑制、去混响、回波定位、为了指纹识别目的的音频文件的校准、以及在录音室中的音频信号的校准。
延迟估计的一个重要应用是在电话中的回波抑制和回波消除。关于这一点,远端方和近端方使用电信网通信。近端方想要只接收由远端说话者说的语音信号。但是,由于声波回波或由于网络回波,近端方可能另外接收到由他或她自己说的(失真的和延迟的)语音信号。向近端方行进的信号中的此信号分量被称为回波信号。在声波回波的情况下,反馈路径是声波并且包括远端处的声波扬声器和获得回波信号的麦克风。在网络回波的情况下,反馈路径是电子的并且由有缺陷的传输线终端负载引起。
为了减少由近端方感觉到的回波,必须减少或消除回波信号。这通常通过使用自适应滤波(回波消除)的数字计算机制和/或通过增益控制(回波抑制)来完成。回波消除的自适应滤波器被优化以通过从向近端方行进的信号中减去向远端方行进的信号来去除与向远端方行进的信号相关的信号分量。发现向远端行进的信号与回波信号的相对延迟(主体延迟(bulk delay))隐含在此优化中并且一般基于相关性,即使有时是从广义上来说的。主体延迟的初始估计通常用于减少回波消除所需的相关性计算数量。在回波抑制的情况下,每当向近端行进的信号主要由近端方说的信号构成时,试探(heuristic)规则一般用于抑制它。回波抑制需要知道向远端行进的信号和回波信号之间的相对延迟。相对延迟的估计通常通过互相关性来计算。
用于回波消除的可用的延迟估计方法,诸如在国际专利申请PCT/FI94/00577(作为WO 95/17784公开)中公开的方法,一般直接或间接地基于互相关性。但是互相关性运算具有缺陷。这些缺陷包括,对于长序列以及如果使用可能的延迟的大的搜索范围,则该方法具有高的计算复杂度。第二缺陷是,如果通过线性滤波运算不能准确地描述回波信号和向远端行进的信号之间的关系,则基于互相关性的方法的性能一般会恶化。也就是说,如果反馈路径引入了非线性失真,则性能降低。第三个缺陷适用于具有随时间变化的延迟的系统:它难以平衡关于延迟的旧的和新的信息。使用长的但有限的估计间隔强化了大容量存储器和计算要求。可替换地,必须使用更旧的数据的隐含的指数衰减,诸如通过迭代乘以小于一的因子,其一般执行得不那么好。
高计算工作量、对反馈路径中的非线性失真敏感、以及去除旧的信息的困难性推动了替代的延迟估计方法。替代的延迟估计方法可以用于减小回波消除中的搜索范围并且作为用于回波抑制的延迟的第一或最终的估计。
发明内容
本发明的目的是完全或部分克服现有技术的上述缺点和缺陷并且提供用于延迟估计的改进的方法和设备。另一个目的是提供对反馈路径中的非线性失真的低敏感性。期望以相对低的计算工作量获得具有相对高的精度的估计。
因此,如所附的独立权利要求所限定的,本发明提供一种用于找到在空间中分开的两个点之间的信号的延迟的估计的方法和设备。本发明的当前优选的实施例由从属权利要求限定。
尽管本发明不需要稳定的统计量,但是它的公式化基于参考点处的信号的测量的值和接收点处的信号的测量的值的联合概率的概念,作为测量之间的时间延迟的函数。测量可以具有任何合适的量,诸如瞬时或平均的能量内容。用于延迟估计的现有方法一般使用互相关性的平均值或测量之间的差的平均值来估计延迟。相反,本发明基于对两个测量集合中的值的范围的共生进行计数,其形成向具有稳定的统计量的数据的联合概率的离散近似。本领域技术人员公知联合概率比平均互相关性或平均差提供关于两个变量之间的关系的更多的信息。因而,联合概率的使用便于延迟的更好估计。
有利地,通过与适合在参考点和接收点处估计的量的通常大小(magnitude)的阈值比较,测量值被量化到简化的、优选地是二进制的形式。在信号的通常的衰减或放大之后,该方法可以向给定的量的值在两个点处应用不同的阈值。因此,获得两个二进制序列,由在参考点和接收点处估计的量的一位量化的值(即,布尔值)构成。在音频信号的具体情况下,二进制1表示强的音频活性,诸如说话者说话,而二进制0表示弱的音频活性,诸如静默或接近静默。存在四个可能的量化值的共生:
(0,0),(0,1),(1,0),(1,1)            (1)
这里(0,1)表示在参考点处的0(低的值)和在接收点处的1(高的值)。相似的对可以由接收点和参考点处的同时测量值形成或由时移的测量值形成。
考虑以自然方式选择阈值的本发明构思的实施例。首先,假如信号在参考点和接收点之间没有延迟地传播。然后与对(1,0)对应的接收点处的强音频活性和参考点处的弱音频活性的组合应该不可能成一对,因为在参考点处测量的高的值应当也已经引起接收点处的高的值。在实践中,这意味着(1,0)具有低的出现概率。现在,如果延迟为D,D为非零的数字,则对(1,0)可以以同时测量的值的对出现。但是,当延迟已经通过向后移位、至少向后移位D或接近于D的数字而被适当地补偿时,有理由期望它具有低的出现概率。对于除D外的其他的向后移位,对(1,0)具有更高的出现概率。因而,可以通过对于不同的向后移位对共生(1,0)进行计数并选择具有最低的计数的延迟(相对频率)来得到延迟D。为了更好的性能,也可以考虑其他的共生。
通过如权利要求1所限定的根据本发明的第一方面的方法,此过程可以被概括为,不确定相对频率,而是将代价(penalty)分配给最小可能的共生(或多个共生)并存储在表中。在定义候选延迟的集合之后,从该表中读取在向后移位候选延迟之一时关于二进制序列中的相应量化值的代价并求和。通过在合适的时间间隔内比较对于不同的候选延迟的各个平均代价,可以选择与最可能的真正延迟对应的候选延迟。在上面讨论的示范性情况下,本领域技术人员因此可以向共生(1,0)分配代价-1并向另外三个分配代价0。
在不同的具体实施例中,从信号中估计的量可以是瞬时值或在有限长度的时间片段内的平均值。适当地,长度在50和1000毫秒之间。在一些实施例中,两个或多个这样的时间片段可以重叠。
在适合具体操作情况的实施例中,本领域技术人员优选使用易于估计并且引出已经具有少量测量的延迟的区别指示的量。除了如前提到的信号能量之外,各种实施例可以使用:
·编码的音频或视频格式中的分量,诸如MPEG格式,
·预定频带中的信号的功率,
·信号的绝对值,
·信号的幅度,
·时域信号包络的幅度,
·信号的绝对值随时间的积分,或
·信号的时间导数的绝对值随时间的积分。
对于上述量中的每一个,非零代价将与四个可能的共生(见公式(1))中的一个或多个有关,以使得分配的代价反映信号的测量的两个并行序列的同步程度。代价分数可以具有相当简单的结构,用正的常数处罚最小可能的共生,如上所述,或者可以是与期望的概率大致对应的负值(即,反代价或品质因数)。不论哪一种情况,具有最大似然性的候选延迟将与最小的(带符号的)代价平均值有关。
根据具体实施例,从信号中可以估计多于一个的量。由于更多的信息因而可用于给定数目的时刻,因此将以增大瞬时计算负载为代价更快地获得最有可能的候选延迟的指示。
在一个实施例中,关于多个频带中的窗口信号片段(windowed signalsegment)的信号功率被用作量。然后有益的是在估计信号功率之前将信号通过滤波器组。滤波器可以是数字的,优选地应用一些傅里叶变换方法,或者可以是模拟的。作为频带的函数的窗口信号片段的信号功率被称为周期图。如果然后将周期图中的每个分量与阈值比较,则获得具有和周期图一样多的分量的二进制矢量。这意味着,如果使用32个波段,则表示信号的短时功率谱的每个周期图可以被存储在单个32位整数中,因此存储要求是可忽略的。
根据另一个实施例,除两个步长外,可以以更多的步长来量化该量的值,因此获得多位量化的值。如果例如将值与三个不同的阈值相比较,则每个值可以位于四个间隔之一中,四个间隔的端点对应于阈值。如所公知的,四个间隔中包含所述值的那个间隔可以由它的序号的两位二进制表示来表征。用于参考值的阈值的数目可以不同于用于接收值的数目。尽管可用的计算机一般以二进制形式存储信息,但是本发明的实施例可以同样包括不是2的幂的量化电平数。虽然优选地阈值的数目较小,但是一些应用可能使用在参考点处或接收点处或这二者处增大数目的阈值是有益的。
根据本发明的第二方面,提供一种如在所附权利要求7中限定的延迟估计设备。
在一个实施例中,延迟估计设备包括至少一个阈值电路,用于量化至少一个量的测量值,其中阈值的值是可变的并且由指定电路提供。在延迟估计设备的另一个实施例中,阈值电路被适配为相对于用于每一个量的多于一个阈值来量化该量或多个量(在参考点、接收点或二者处测量的)的值。在延迟估计设备的进一步的实施例中,参考点和接收点中的至少一个位于通信网络中。在其他的实施例中,类似于根据本发明的第一方面的方法,延迟估计设备可以被适配为测量作为瞬时值的至少一个量或作为在有限时间间隔内的时间平均值的至少一个量。这样的时间间隔可以或可以不在时间上重叠。
根据本发明的第三方面,根据本发明的延迟估计设备可以是由权利要求15限定的回波消除电路中的一个组件。该回波消除电路可以例如包含前馈自适应滤波器,其数量特征是作为由根据本发明的设备估计的延迟的函数的变量。
当考虑以下详细公开、附图和所附权利要求书时,本发明的进一步的目的、特性和优点将变得清楚。本领域技术人员将认识到,本发明的不同的特征可以被组合以产生除了描述的实施例之外的其他实施例。
附图说明
通过以下详细描述和附图,本发明的上述以及附加的目的、特性和优点将得到更好的理解,其中:
图1示出了可以应用本发明的说明性的情况;
图2示出了根据本发明的实施例的用于延迟估计的设备;
图3示出了根据本发明的实施例的用于预处理信号数据的装置;
图4是根据本发明的实施例的用于估计信号的延迟的方法的流程图;和
图5示出了用于评定量化值的同时性的算法。
所有图是示意性的并且一般仅仅示出为了说明本发明必要的部分,其中其他部分可以被省略或仅仅暗示。
具体实施方式
图1示出了通常存在于诸如经由IP的语音扬声器电话的计算机的非手持式通信设备或非手持式电话之类中的声反馈环路。要被解决的技术问题可以由涉及一个近端方和一个远端方的电话呼叫的情况示范。输入信号500是近端方说的语音信号。它以数字格式到达远端,并且可以以压缩比特流的形式。解码器211包含将信号转换成连续时间模拟信号的数模转换器。如果信号是压缩的,则解码器211也使用解码算法来解压缩信号。模拟信号501被发送给一个或多个扬声器212,其产生服从房间传递函数213的声学信号502。麦克风214获得修改的声学信号503。麦克风214可以另外具有由远端方说的输入504和其他远端产生的声学信号。形成麦克风的输出的模拟信号505被发送给编码器215,其或者执行模数转换或者执行模数转换以及之后通过任何合适的算法进行压缩。结果得到的比特流510被发送到近端方。
本领域技术人员将清楚,甚至当信号504不是有效的(为零)时,信号510的幅度和光谱色一般也与信号500显著不同,并且被延迟。在没有合适的补偿的情况下,近端方将接收由他或她自己说的语音信号的延迟和失真的副本。近端方听见的此回波使得谈话困难。为了消除该问题,使用回波消除和/或抑制。如果信号510相对于信号500的延迟是已知的话,则执行回波消除和抑制的计算工作量显著减少。本发明适合于仅仅使用信号500和510作为估计过程的输入来估计从近端发送的信号500和在近端处接收的信号510之间的延迟。回波消除和抑制是本发明的重要应用。
在显示适于执行本发明方法的设备之前,将就接收和处理的信息方面描述基础的方法。在说明性的示例中,用于估计信号之间的延迟的量将是不同频带中的信号功率。更精确地,在参考点处的信号510的测量和在接收点处的信号500的测量被分别建模为连续时间的函数x(t)、y(t)。为了处理的目的,该方法将考虑时间间隔
Figure BDA0000082869760000071
p=1,...,P和频带(这些可以对应于傅里叶变换滤波器的频率窗口(bin))
Figure BDA0000082869760000072
q=1,...,Q。通过传统的模拟滤波或数字处理,对于每一个信号和每个时间间隔计算周期图。在时间间隔Tp中,x(t)的周期图是非负的实数矢量ξp=(ξ1,p,ξ2,p,...,ξQ,p),其中
ξ q , p = ∫ F q | ∫ T p e - j 2 πft x ( t ) w ( t ) dt | 2 df (2)
其中w(t)是窗,其有利地可以被选择为汉宁(Hann)窗。对于离散时间处理,用求和来代替时间积分,并且不使用频率上的积分;然后q简单地为频率窗口编索引。类似地,y(t)的周期图是ηp=(η1,p,η2,p,...,ηQ,p),其中
η q , p = ∫ F q | ∫ T p e - j 2 πft y ( t ) w ( t ) dt | 2 df (3)
为了后面方便,定义术语“信道”,以意指矢量ξq=(ξq,1,ξq,2,...,ξq,P)和它在接收点处的信号的对应矢量。
固定阈值
Figure BDA0000082869760000075
其每个表示信号功率的最低有效电平,每个周期图被量化为二进制Q矢量Xp=(X1,p,X2,p,...,XQ,p),其中
X q , p = 1 if &xi; q , p &GreaterEqual; &xi; ~ q 0 &xi; q , p < &xi; ~ q - - - ( 3 )
类似地,本领域技术人员可以固定对于其他信号的阈值以获得
Y q , p = 1 if &eta; q , p &GreaterEqual; &eta; ~ q 0 &eta; q , p < &eta; ~ q - - - ( 4 )
阈值也可以是平均信道值、中间信道值或信道的任何其他分位值(quantile value)。缓冲器将这些二进制矢量收集到有限序列中,换言之是二进制矩阵
Figure BDA0000082869760000078
和Y=(Y1,...,YK);不久将定义用在索引中的常数。
如上面建立的,现在根据四个可能的共生的每一个的期望概率来分配它们的代价,该期望概率由经验学习是先验已知的或者是可以利用足够的精度估计的。对于如上所述的示范性情况,可以将代价选择为表1的第四列中每个,这将在下面进一步讨论。注意,周期图值Xq,p和Yq,p′一般表示不同的时间间隔。此外,注意可以定义概率分布的工作并不是实施例所必需的。该方法的强项在于它甚至在测量的统计量是时变时也可以工作。
表1
 Xq,p Yq,p′   概率   代价  代价,第1替换  代价,第2替换
  0   0   0.25   0   1   -0.25
  0   1   0.30   0   0   -0.30
  1   0   0.05   1   2   -0.05
  1   1   0.40   0   -1   -0.40
需要强调的是,此方法不同于计算两个信号之间的互相关性。互相关性是时移的函数,其最大值准确出现在时移的信号呈现最大相似度的时候。换句话说,共生(1,1)和(0,0)对互相关性的值有贡献,而共生(0,1)和(1,0)则没有贡献。此对于相似性的简单搜索不适合于任意情况。例如,当反馈路径是非线性时,互相关性执行得很差。此外,甚至当延迟稍微随时间变化时,本方法也将执行得很好,而互相关性方法由于缺少在时间上稳定的概率分布而一般将失败。
然后定义M个候选延迟D1<D2<...<DM,每个被表示为连续的时刻的距离的倍数。然后,计算对于每一个候选延迟的平均代价。对于第q个量、第m个候选延迟和在K个时刻内的平均,平均代价由下式给出
&Delta; q , m = 1 K &Sigma; k = 1 K penalty ( X q , k + D m , Y q , k ) . - - - ( 5 )
如果在K个时刻内执行平均并且最长的候选延迟是DM,则如上所指出的,二进制矩阵X和Y分别需要具有K+DM个和K个列。不需要利用K个时刻来对所有候选延迟计算Δq,m。如果在一些实施例中,期望在矩阵中使用相等的列数,则该方法可以对于更大的候选延迟在更少的时刻数内执行平均,因此不需要在X的右边包括附加列。
在图5中示意地示出平均代价的计算,图5示出了在Q=3、K=44且DM=4的情况下的矩阵X和Y。每个方块元素对应于一个矩阵项,并且它的颜色示出了它的(布尔)值。通过看这些图式,人们可以猜想矩阵X延迟(即,右移)2个单位并加上一些噪声即是矩阵Y,并且本发明的方法被适配为在这种情况下返回2作为估计的延迟。曲线箭头的序列示出了对于候选延迟2(由“D=2?”表示)、3(由“D=3?”表示)和4(由“D=4?”表示)将比较哪些列。省略号指示箭头的序列应当继续下去直到最外面的列,以便利用所有可用的信息。应当注意,当计算对于候选延迟2的平均代价时,不使用X中的两个最右边的列。
本发明的具体实施例不比较连续的时刻对,而是比较每隔一个的对、每隔两个的对等等。为了有所不同,由修改的平均代价替代等式(5):
&Delta; q , m &prime; = 1 K &Sigma; k = 1 K penalty ( X q , kN + D m , Y q , kN ) - - - ( 6 )
其中N是定义要被比较的时刻对的间隔的整数。代替分别具有K+DM个和K个列,矩阵X和Y于是具有KN+DM个和KN个列。此实施例由于它减小的计算工作量负担而是有益的。
在平均代价的全部集合已被确定之后,可以按照下式形成加权和:
&Delta; m = &Sigma; q = 1 Q c q &Delta; q , m - - - ( 7 )
其中系数c1,c2,...,cQ优选地反映归因于每个量的重要性。例如,如果量是不同频带中的音频能量,具体地如果期望信号的能量含量(energycontent)在此频带中相对较高,则可听范围中的频带应当被给定更大的重要性。假定相对重要的量的代价一般比相对次要的量具有更大的数值,则当然可以通过在(6)中使用相等的系数对平均代价求和来实现类似的效果。
在生成了加权和Δ1,Δ2,...,ΔM之后,现在得到最小的(带符号的)值就很简单了。候选延迟D1,D2,...,DM当中的相应延迟是获得的延迟,并且将是最好的估计。
上面的表1示出了除了在发明内容部分讨论的代价的集合之外的两个可替换的代价集合,在发明内容部分讨论的代价的集合仅仅处罚最小可能的事件(1,0)。因为预期(1,0)对于正确的延迟具有被处罚的低的概率,所以它与出现的次数成比例。只要代价是反映对于(0,0)、(0,1)和(1,1)预期的不相等的计数的整数,则第一可替换的代价集合是简单的。再一次,因为对于正确的延迟,(1,0)不应该出现,所以它被最强有力地处罚。共生(0,0)和(1,1)是弱的指示符,其指示延迟是正确的,并且因此接收负的代价。共生(0,1)不提供关于候选延迟的正确性的信息,因此被分配中性代价。应当注意,对于开头两个代价集合,不需要知道共生的概率分布。表1中的第二可替换的代价集合由概率自身构成。对于稳定的统计量,如果观察结果具有正确的概率分布,即如果观察结果向后移位正确的延迟,则此选择导致平均代价的最小值。
现在将参考图2描述根据本发明的延迟估计电路。两个信号500和510形成输入。这两个信号可以对应于图1示出的声学回波反馈路径,或者对应于形成物理系统的输入和输出的任何其他的信号集合。更一般地,它们可以是任何两个信号以使得第二个信号包含第一个信号的延迟的副本。
输入信号510和500的每一个在具有相等的功能的预处理器1110和1111中被分开预处理。每个预处理器的输出是矢量(或标量)的序列。有利地,即,如果多个频带中的信号能量被用作量,则矢量序列512和513分别是输入信号510和500的周期图的序列。
图3更详细地示出了预处理器1110的操作。预处理器1111功能类似。输入信号510首先在分段器311中被分段成可以重叠的时间片段。有利地,由分段器311创建的连续的片段在时间上隔开10ms,并且片段具有20ms的长度。变换器312执行窗口和傅里叶变换运算。变换器312的输出是离散的、短时复频谱。周期图计算器313获得此复频谱并且将绝对运算符应用于每个频谱分量并将结果求平方以得到周期图512,周期图512是短期功率谱估计。周期图是作为分段器311的输出的信号片段的矢量属性。
返回到图2,指定电路112存储信道的什么子集将要用于延迟估计。因而,指定电路112指定有效信道。指定电路112还存储要被应用于有效信道的阈值。第一和第二阈值电路1130和1131对于每一个有效信道确定当前片段的值是在阈值之上还是之下。此操作等效于一位量化。矢量信号514和515是位矢量的时间序列,其中每一位分量表示周期图(表示短期功率谱)的有效部分相对于由指定器112设置的阈值的值。
有利地并且作为本发明的创新部分,矢量信号514和515的每个矢量可以存储在单个数字整数中,以显著减少对大多数计算设备的存储需求。如果32或64个信道是有效的话,则此方法特别有效,因为许多计算设备上的组合的硬件和软件适合于处理32和64位整数。还注意到,此使用整数来表示一位量化索引的方法便于多个阈值的概括。输出然后是将要描述的需要m个阈值log2(m+1)位的索引。因而,每个矢量具有log2(m+1)个位平面,每个位平面可以由一个整数描述。下面,以单个整数的形式写入的位矢量(一位量化)将被称为频谱整数。但是,应当理解,在某些应用中并且对于某些信道数目,在不存储为频谱整数的情况下使用位矢量。
缓冲器指定器114指定第一和第二移位寄存器1150、1151的长度。出于已经说明过的理由,第二移位寄存器1151可以比第一移位寄存器1150短。因而,缓冲器指定器指定对于每一个有效信道将多少频谱整数存储在移位寄存器1150和1151中。每当获得新的频谱整数时,就丢弃最不新的频谱整数。最近丢弃的频谱整数的寿命(移位寄存器的长度)由缓冲器指定器114指定。有利地,此寿命对于信号514中的所有信道都是一样的,并且单独地,对于信号515中的所有信道是一样的。
使用的实际寿命取决于对其估计延迟的信号。如果延迟是常数,则延迟估计的精度随着缓冲器的长度而增加。如果延迟是变化的,则必须选择对于延迟的变化速率是良好的折衷的寿命。在此实施例中,这由系统的设计者确定,但是自动过程也可以用于此目的。由上面可见,可以基于最大的候选延迟、期望的要被比较的时刻数目、以及在可应用时它们的连续的间隔来计算缓冲器的长度。
可以以许多不同的方式实施的延迟评定电路118被适配为对于每一个候选延迟计算平均代价。在构思上最简单的实施中,延迟评定电路118从缓冲器1150、1151中接收整个缓冲器内容516、517,并且根据等式(5)进行计算。由计算的结果,评定电路118输出指示所估计的延迟的信号(518)。
图4示出了根据本发明的用于估计参考点和接收点之间的信号的延迟的方法400的实施例。图4是描述在三个量和五个候选延迟的情况下该方法的步骤的流程图。在步骤410中,定义三个量。接着,在步骤412中,在多个时刻在参考点和接收点估计每个量。在步骤414中,通过与阈值比较来量化三个量的值。对于每一个量,相等的阈值用于所有的时刻,在这个意义上说,阈值是时不变。随后,在步骤416中,存储最新的量化值。代价分配给每个可能的排序的同时量化值对;这是步骤418。在步骤420中,定义五个候选延迟的集合。然后,在步骤422中,对于每一个候选延迟计算平均代价。该平均值基于这三个量和多个量化值对。最后,在步骤424中,基于计算的平均代价从候选延迟的集合中选择估计延迟。应当注意,步骤418可以在定义量的步骤410之后且在计算平均代价的步骤422之前的任何时刻执行。
虽然已经在附图和前面的描述中详细示出和描述了本发明,但是这样的示出和描述将被认为是说明性的或示范性性的而非限制性的;本发明不局限于公开的实施例。应当理解,包括在公开的实施例中的一些组件是可选的。例如,如果在根据较旧的标准的公共电话网中实施本发明,则可以不存在解码器和编码器。
其他对公开的实施例的改变可以被本领域技术人员在实践所请求保护的本发明中通过对附图、公开和所附的权利要求书的研究而理解和实行。仅有的事实是,在相互不同的从属权利要求中记载的某些测量不表示这些测量的组合不能带来益处。权利要求书中的任何参考标记不应该被理解为限制范围。

Claims (15)

1.一种用于估计参考点和接收点之间的信号的延迟的方法,包括步骤:
定义所述信号的至少一个量;
对于每一个量,执行下述步骤:
在多个时刻估计在该参考点(510)和在该接收点处的该量,从而分别输出参考点值和接收点值;
通过比较所述参考点值的每一个与第一时不变阈值来量化所述参考点值,以及通过比较所述接收点值的每一个与第二时不变阈值来量化所述接收点值,从而分别输出量化的参考点值和量化的接收点值(514、515);
存储最新的量化的参考点值和最新的接收点值(516、517);
向所有可能的量化值对的每一个分配代价,每个对由量化的参考点值以及之后的量化的接收点值构成,所述代价基于在正确地估计延迟时所述对的值的同时事件的期望概率;以及
对于来自于候选延迟的集合的每一个候选延迟,每个候选延迟被表示为连续的时刻之间的时间距离的倍数,通过将多个所存储的量化值对的代价求平均来计算平均代价,每对由存储的在第一时刻估计的量化的参考点值以及之后的存储的在第二时刻估计的量化的接收点值构成,其中第一时刻和第二时刻时移了该候选延迟;以及
基于计算的平均代价从候选延迟的集合中选择估计的延迟(518)。
2.根据权利要求1所述的方法,其中,对于特定的量,将第一恒定代价分配给高量化的参考点值和低量化的接收点值的同时事件,并且将第二代价分配给所有其他的事件,其中第一代价大于第二代价。
3.根据权利要求2所述的方法,其中,所述特定的量是预定频带中的信号功率。
4.根据前述权利要求中任何一个所述的方法,其中,从包括下述的组中选择至少一个量:
编码的音频或视频格式的分量,
预定频带中的信号的功率,
信号的绝对值,
信号的幅度,
信号包络的幅度,信号的绝对值随时间的积分,和
信号的时间导数的绝对值随时间的积分。
5.根据前述权利要求中任何一个所述的方法,其中,所述量化的步骤还包括:将所述至少一个量的值与至少一个另外的时不变阈值相比较,从而输出多位量化值。
6.根据权利要求5所述的方法,其中,另外的时不变阈值的数目最多为20。
7.一种用于估计参考点(510)和接收点(500)之间的信号的延迟的设备,包括:
第一和第二预处理器(1110、1111),用于在多个时刻估计来自该参考点(510)和该接收点(500)处的信号的至少一个量,以分别输出参考点值(512)和接收点值(513);
第一和第二阈值电路(1130、1131),用于相对于第一阈值量化所述参考点值以及相对于第二阈值量化所述接收点值,其值分别从所述第一和第二预处理器(1110、1111)接收到;
第一和第二移位寄存器(1150、1151),用于存储最新的量化的参考点值和最新的量化的接收点值(514、515),其量化值分别从所述第一和第二阈值电路(1130、1131)接收到;和
延迟评定电路(118),用于从所述第一和第二移位寄存器(1150、1151)接收存储的量化值(516、517),其中预定代价与所有可能的量化值对的每一个有关,每个对由量化的参考点值以及之后的量化的接收点值构成,所述代价基于在正确地估计延迟时所述对的值的同时事件的期望概率,以及所述电路(118)被配置为:
对于候选延迟的集合中的每一个候选延迟,每个候选延迟被表示为连续的时刻之间的时间距离的倍数,通过将多个对存储的量化值的代价求平均来计算平均代价,每对由存储的在第一时刻估计的量化的参考点值以及存储的在第二时刻估计的量化的接收点值构成,其中第一时刻和第二时刻时移了该候选延迟;以及
基于计算的平均代价从候选延迟的集合中选择估计的延迟(518)。
8.根据权利要求7所述的设备,还包括指定电路(112),用于分别为所述第一和第二阈值电路(1130、1131)提供所述第一和第二阈值。
9.根据权利要求7或8所述的设备,其中,所述第一和第二阈值电路的每一个被适配为分别相对于至少一个另外的第一阈值以及相对于至少一个另外的第二阈值来量化所述至少一个量的值(512、513)。
10.根据权利要求7至9中的任何一个所述的设备,其中,该参考点(500)和接收点(510)位于通信系统中。
11.根据权利要求7至10中的任何一个所述的设备,其中,所述至少一个量是瞬时值。
12.根据权利要求7至10中的任何一个所述的设备,其中,对于每一个时刻,在有限时间间隔内将所述至少一个量求平均。
13.根据权利要求12所述的设备,其中,所述间隔中的两个在时间上重叠。
14.根据权利要求12或13所述的设备,其中,所述间隔的长度在50毫秒和1000毫秒之间。
15.一种包括根据权利要求7至14中的任何一个所述的设备的回波消除电路。
CN2009801566112A 2008-12-12 2009-10-20 延迟估计器 Active CN102318328B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US12219608P 2008-12-12 2008-12-12
EP08171468.5 2008-12-12
EP08171468A EP2197190B1 (en) 2008-12-12 2008-12-12 Delay estimator
US61/122,196 2008-12-12
PCT/EP2009/063707 WO2010066496A1 (en) 2008-12-12 2009-10-20 Delay estimator

Publications (2)

Publication Number Publication Date
CN102318328A true CN102318328A (zh) 2012-01-11
CN102318328B CN102318328B (zh) 2013-12-18

Family

ID=40432396

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009801566112A Active CN102318328B (zh) 2008-12-12 2009-10-20 延迟估计器

Country Status (7)

Country Link
US (2) US8320552B2 (zh)
EP (3) EP2352274B1 (zh)
CN (1) CN102318328B (zh)
AT (1) ATE508579T1 (zh)
CA (1) CA2746794C (zh)
DE (1) DE602008006754D1 (zh)
WO (1) WO2010066496A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104364844A (zh) * 2012-06-08 2015-02-18 英特尔公司 针对长延迟回声的回声消除算法
CN105472189A (zh) * 2014-09-30 2016-04-06 想象技术有限公司 声回波消除的检测
CN108664424A (zh) * 2017-03-30 2018-10-16 炬芯(珠海)科技有限公司 一种确定最优延时的方法及设备
CN115088236A (zh) * 2020-02-07 2022-09-20 瞻博网络公司 用于估计通信时延的方法和系统

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8718275B2 (en) 2011-12-22 2014-05-06 Google Inc. Low complex and robust delay estimation
US9888330B1 (en) * 2016-07-28 2018-02-06 Getgo, Inc. Detecting signal processing component failure using one or more delay estimators

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0650525B1 (en) 1992-06-30 2004-05-19 SmithKline Beecham plc D-n-carbamoyl-amino acid amidohydrolase and hydantoinase
FI935834A (fi) 1993-12-23 1995-06-24 Nokia Telecommunications Oy Menetelmä kaikukohtaan sovittautumiseksi kaiunpoistajassa
US5959500A (en) * 1998-01-26 1999-09-28 Glenayre Electronics, Inc. Model-based adaptive feedforward amplifier linearizer
US6324170B1 (en) * 1998-09-10 2001-11-27 Nortel Networks Limited Echo controller with compensation for variable delay networks
US6859531B1 (en) * 2000-09-15 2005-02-22 Intel Corporation Residual echo estimation for echo cancellation
US20040252652A1 (en) * 2003-06-10 2004-12-16 Alexander Berestesky Cross correlation, bulk delay estimation, and echo cancellation
US6961862B2 (en) * 2004-03-17 2005-11-01 Rambus, Inc. Drift tracking feedback for communication channels
US7444268B1 (en) * 2004-03-25 2008-10-28 Sun Microsystems, Inc. Method and apparatus for identifying a drift in a quantized signal in a computer system
CN1691716A (zh) * 2004-04-23 2005-11-02 北京三星通信技术研究有限公司 回声消除装置
US7912158B2 (en) * 2005-11-08 2011-03-22 Navcom Technology, Inc. Sampling threshold and gain for satellite navigation receiver
CN101026659B (zh) * 2006-02-23 2010-04-07 中兴通讯股份有限公司 一种回声延时定位的实现方法
US8213598B2 (en) * 2008-02-26 2012-07-03 Microsoft Corporation Harmonic distortion residual echo suppression

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104364844A (zh) * 2012-06-08 2015-02-18 英特尔公司 针对长延迟回声的回声消除算法
CN105472189A (zh) * 2014-09-30 2016-04-06 想象技术有限公司 声回波消除的检测
US10841431B2 (en) 2014-09-30 2020-11-17 Imagination Technologies Limited Detection of acoustic echo cancellation
US11601554B2 (en) 2014-09-30 2023-03-07 Imagination Technologies Limited Detection of acoustic echo cancellation
CN108664424A (zh) * 2017-03-30 2018-10-16 炬芯(珠海)科技有限公司 一种确定最优延时的方法及设备
CN108664424B (zh) * 2017-03-30 2020-06-23 炬芯(珠海)科技有限公司 一种确定最优延时的方法及设备
CN115088236A (zh) * 2020-02-07 2022-09-20 瞻博网络公司 用于估计通信时延的方法和系统
CN115088236B (zh) * 2020-02-07 2024-05-17 瞻博网络公司 用于估计通信时延的方法和系统

Also Published As

Publication number Publication date
CN102318328B (zh) 2013-12-18
EP2533511A1 (en) 2012-12-12
CA2746794C (en) 2015-02-24
US8320552B2 (en) 2012-11-27
US20120063572A1 (en) 2012-03-15
EP2352274A2 (en) 2011-08-03
US20110249810A1 (en) 2011-10-13
EP2197190A1 (en) 2010-06-16
ATE508579T1 (de) 2011-05-15
CA2746794A1 (en) 2010-06-17
DE602008006754D1 (de) 2011-06-16
WO2010066496A1 (en) 2010-06-17
EP2533511B1 (en) 2015-04-22
EP2197190B1 (en) 2011-05-04
EP2352274B1 (en) 2018-02-14
US8290143B2 (en) 2012-10-16
EP2352274A3 (en) 2011-08-24

Similar Documents

Publication Publication Date Title
US11817108B2 (en) Methods for parametric multi-channel encoding
CN102318328B (zh) 延迟估计器
US8271051B2 (en) Method and system for double-end talk detection, and method and system for echo elimination
EP0970462B1 (en) Recognition system
JP2008146081A (ja) 冗長性低減方法
CN102723082A (zh) 基于保持语音信息的单耳音频处理系统和方法
CN112687288B (zh) 回声消除方法、装置、电子设备和可读存储介质
US20100111290A1 (en) Call Voice Processing Apparatus, Call Voice Processing Method and Program
US20150310870A1 (en) Systems and methods for analyzing audio characteristics and generating a uniform soundtrack from multiple sources
US8718275B2 (en) Low complex and robust delay estimation
CN101406064A (zh) 量化和反量化输入信号的方法和设备以及对输入信号编码和解码的方法和设备
CN107452391B (zh) 音频编码方法及相关装置
US20090157400A1 (en) Speech recognition system and method with cepstral noise subtraction
CN1605186A (zh) 具有频谱回波尾部估计器的回波消除器
CN1355916A (zh) 通过时域频谱相减的信号噪声减小
CN112802487A (zh) 回声处理方法、装置及系统
Heusdens et al. Bit-rate scalable intraframe sinusoidal audio coding based on rate-distortion optimization
KR100940628B1 (ko) 윈도우 기반 누적분포함수 추정에 의한 히스토그램 등화기법을 이용한 음성인식 시스템 및 방법
Martinez et al. Robust distributed speech recognition using histogram equalization and correlation information.
Orglmeister Data reduction in high-quality audio signals
Wolters Enhancement of differentially coded speech signals by means of quantization error correction

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee
CP01 Change in the name or title of a patent holder

Address after: American California

Patentee after: Google Inc.

Address before: American California

Patentee before: Google Inc.

CP01 Change in the name or title of a patent holder

Address after: American California

Patentee after: Google limited liability company

Address before: American California

Patentee before: Google Inc.

CP01 Change in the name or title of a patent holder