CN102301748A - 检测信号延迟的方法、检测装置及编码器 - Google Patents

检测信号延迟的方法、检测装置及编码器 Download PDF

Info

Publication number
CN102301748A
CN102301748A CN2009801547910A CN200980154791A CN102301748A CN 102301748 A CN102301748 A CN 102301748A CN 2009801547910 A CN2009801547910 A CN 2009801547910A CN 200980154791 A CN200980154791 A CN 200980154791A CN 102301748 A CN102301748 A CN 102301748A
Authority
CN
China
Prior art keywords
delay
correlation function
value
cumulative cross
cross
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2009801547910A
Other languages
English (en)
Other versions
CN102301748B (zh
Inventor
吴文海
苗磊
郎玥
胡晨
刘泽新
张清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN102301748A publication Critical patent/CN102301748A/zh
Application granted granted Critical
Publication of CN102301748B publication Critical patent/CN102301748B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

一种能够提高准确性的检测信号延迟的方法、检测装置及编码器。该方法包括:根据声道信号间的互相关函数获取第一累积互相关函数;确定所述第一累积互相关函数对应的声道信号间的第一延迟;根据所述声道信号间的第一延迟和第二延迟的关系调整所述第二累积互相关函数,所述第二延迟在调整所述第二累积互相关函数时获得且所述第二延迟的首次确定值根据第二累积互相关函数的第二加权系数的初始值确定;确定所述调整后的第二累积互相关函数对应的第二延迟为检测的声道信号间的延迟。

Description

检测信号延迟的方法、 检测装置及编码器
技术领域
本发明涉及信号处理技术领域,具体涉及一种检测信号延迟的方法、检测 装置及编码器。
背景技术
目前随着计算机技术、数字信号处理技术等的发展,使立体声技术有较大 的发展。 立体声技术中目前较为常用的立体声编码方法是参数立体声编码。
在参数立体声编码中, 一般是将左、 右声道信号进行下混, 对生成的下混 信号进行编码。 一般而言, 左、 右声道信号会有一定的延迟, 因此对左、 右声 道信号的延迟进行正确的检测, 就可以根据该延迟对信号进行同步处理,从而 有利于提升立体声合成信号的质量。 现有技术提供一种检测信号延迟的方法: 假设左声道相对于右声道在前的时候,信号的延迟为正,反之信号的延迟为负。 那么在生成下混信号之前, 获取左、 右声道信号的互相关函数, 确定该互相关 函数的累积互相关函数, 然后确定累积互相关函数的最大值,将该最大值所对 应的时间确定为左、 右声道信号之间的延迟。
在对此方法的研究和实践过程中, 本发明的发明人发现:
当左、右声道信号的声场发生变化即从一个方向转换到另外一个方向的时 候,信号的延迟的正负性就发生变化,但现有技术中所利用的互相关函数的累 积函数不能反映出该变化, 导致检测出的信号延迟的准确性差。
发明内容
本发明实施例提供一种能够提高准确性的检测信号延迟的方法、检测装置 及编码器。
一种检测信号延迟的方法, 包括:
根据声道信号间的互相关函数获取第一累积互相关函数;
确定所述第一累积互相关函数对应的声道信号间的第一延迟;
根据所述声道信号间的第一延迟和第二延迟的关系调整第二累积互相关 函数,所述第二延迟在调整所述第二累积互相关函数时获得且所述第二延迟的 首次确定值根据第二累积互相关函数的第二加权系数的初始值确定;
确定所述调整后的第二累积互相关函数对应的第二延迟为检测的声道信 号间的延迟。
一种检测装置, 包括:
获取单元, 用于根据获取声道信号间的互相关函数获取第一累积互相关 函数;
第一延迟处理单元, 用于确定所述第一累积互相关函数对应的声道信号 间的第一延迟;
调整单元, 用于根据所述声道信号间的第一延迟和第二延迟的关系调整 所述第二累积互相关函数,所述第二延迟在调整所述第二累积互相关函数时获 得且所述第二延迟的首次确定值根据第二累积互相关函数的第二加权系数的 初始值确定;
第二延迟处理单元, 用于确定所述调整后的第二累积互相关函数对应的 第二延迟为检测的声道信号间的延迟。
一种编码器, 包括:
信号获取装置, 用于获取声道信号;
检测装置,用于根据声道信号间的互相关函数获取第一累积互相关函数; 确定所述第一累积互相关函数对应的声道信号间的第一延迟;根据所述声道信 号间的第一延迟和第二延迟的关系调整所述第二累积互相关函数,所述第二延 迟在调整所述第二累积互相关函数时获得且所述第二延迟的首次确定值根据 第二累积互相关函数的第二加权系数的初始值确定;确定所述调整后的第二累 积互相关函数对应的第二延迟为检测的声道信号间的延迟。
上述技术方案可以看出, 本发明实施例技术方案通过根据声道信号间的 互相关函数获取第一累积互相关函数;确定所述第一累积互相关函数对应的声 道信号间的第一延迟;根据所述声道信号间的第一延迟和第二延迟的关系调整 所述第二累积互相关函数,所述第二延迟在调整所述第二累积互相关函数时获 得且所述第二延迟的首次确定值根据第二累积互相关函数的第二加权系数的 初始值确定; 在调整所述第二累积互相关函数后, 就可以确定其对应的第二延 迟为检测的声道信号间的延迟,该确定的延迟就可以反映出声道信号的延迟的 正负性发生变化的情况, 从而提高了检测出的信号延迟的准确性。
附图说明 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施 例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地, 下面描述 中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付 出创造性劳动的前提下, 还可以根据这些附图获得其他的附图。
图 1是本发明实施例一检测信号延迟的方法的流程图;
图 2是本发明实施例二检测信号延迟的方法的流程图;
图 3是本发明实施例二调整加权系数《2的流程图;
图 4是本发明实施例二检测信号延迟的信号跟踪波形示意图;
图 5是本发明实施例三检测信号延迟的方法的流程图;
图 6是本发明实施例三调整加权系数《2的流程图;
图 Ί是本发明实施例四检测信号延迟的方法的流程图;
图 8是本发明实施例四对不同声道信号的延迟变化的有效性进行检测的 流程图;
图 9是本发明实施例四对延迟变化的有效性进行检测的信号跟踪波形示 意图;
图 10是本发明实施例的检测装置结构一示意图;
图 11是本发明实施例的检测装置结构二示意图;
图 12是本发明实施例的编码器结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清 楚、 完整地描述, 显然, 所描述的实施例仅仅是本发明一部分实施例, 而不是 全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造 性劳动前提下所获得的所有其他实施例, 都属于本发明保护的范围。
本发明实施例提供一种能够提高准确性的检测信号延迟的方法、检测装置 及编码器。
图 1是本发明实施例一检测信号延迟的方法的流程图, 包括步骤: 步骤 101、 根据声道信号间的互相关函数获取第一累积互相关函数; 步骤 102、 确定所述第一累积互相关函数对应的声道信号间的第一延迟; 步骤 103、根据所述声道信号间的第一延迟和第二延迟的关系调整第二累 积互相关函数,所述第二延迟在调整所述第二累积互相关函数时获得且所述第 二延迟的首次确定值根据第二累积互相关函数的第二加权系数的初始值确定; 步骤 104、确定所述调整后的第二累积互相关函数对应的第二延迟为检测 的声道信号间的延迟。
其中,根据声道信号间的第一延迟和第二延迟的关系调整第二累积互相关 函数包括: 获取第二累积互相关函数的第二加权系数的初始值; 在判断第一延 迟和第二延迟不相等时 ,将第二加权系数的初始值进行减小处理得到减小后的 值; 根据减小后的第二加权系数的值更新第二累积互相关函数。
或者 ,根据声道信号间的第一延迟和第二延迟的关系调整第二累积互相关 函数包括:根据第一累积互相关函数的声场信息设置第二累积互相关函数的第 二加权系数的值;在判断第一延迟和第二延迟不相等时,将设置的第二加权系 数的值进行减小处理得到减小后的值。
其中, 第一累积互相关函数可以为短时累积互相关函数, 第二累积互相 关函数为可以长时累积互相关函数。
从该实施例一可以看出, 本发明实施例技术方案通过根据声道信号间的 互相关函数获取第一累积互相关函数;确定所述第一累积互相关函数对应的声 道信号间的第一延迟;根据所述第一延迟和第二延迟的关系调整第二累积互相 关函数,所述第二延迟在调整所述第二累积互相关函数时获得且所述第二延迟 的首次确定值根据第二累积互相关函数的第二加权系数的初始值确定;在调整 所述第二累积互相关函数后,就可以确定其对应的第二延迟为检测的声道信号 间的延迟,该确定的延迟就可以反映出声道信号的延迟的正负性发生变化的情 况, 从而提高了检测出的信号延迟的准确性。
图 2是本发明实施例二检测信号延迟的方法的流程图,实施例二相比于实 施例一, 更具体介绍本发明实施例的方法。 如图 2所示, 包括步骤:
步骤 201、 获取左、 右声道信号的当前互相关函数。
左、 右声道信号的互相关函数为 可以按以下公式(1 )计算: ccf (d) = ¾ /(") * r n― d) I sqrt /(") * /(") ^ r{n - d) * r{n - d)) 公式( 1 ) 其中, 公式中的字母 d表示延迟, 属于常量; 字母 n表示信号帧的样点个 数, 属于变量; N为自然数。 字母 r表示右声道的信号; 字母 1表示左声道的 信号。
需要说明的是, 互相关函数 cc/W)只是按上述公式( 1 )进行计算举例说 明但不局限于此, 也可以通过其他的公式得到, 例如按以下公式(2)计算:
N-1
如果( l(n) * r(n - d) > 0)
n = 0
公式 (2) 如果( l{n)* r{n - d) <= 0) nccf(d) = 0)
其中公式中的各字母含义与上述描述相同。
步骤 202、 获取短时累积互相关函数, 确定短时累积互相关函数对应的第 —延迟。
累积互相关函数是一级 MA函数。 设累积互相关函数为 "_cc/(< ), 加 权系数为", "_cc/(< )可以按以下公式(3)计算: a _ ccf {d) = a_ ccf (d)*a + ccf (d) ^≥ 公式(3) 累积互相关函数可以进一步分为短时累积互相关函数和长时累积互相关 函数, 所说的短时互相函数和长时累积互相关函数是一个相对的概念,设短时 累积互相关函数为 S— Cc/(i ), 加权系数"设为《1。 设长时累积互相关函数 为 /— Cc/(i ), 加权系数"设为 2, 其中, 1≥«2>"1>0。 s _ ccf id) = s _ ccf (d) * 1 + ccf (d) I ccf(d) = I ccf(d) * a2 + ccf(d) 根据短时累积互相关函数进行计算, 其中加权系数 "1可以根据经验取值, 则可以得到短时累积互相关函数的不同取值 ,从这些取值中选取较大的值例如 最大值或次大值,确定该最大值或次大值所对应的时间为短时累积互相关函数 的第一延迟。
步骤 203、 根据第一延迟与下一步骤确定的第二延迟, 调整长时累积互相 关函数的加权系数《2
该步骤参见下面图 3所示流程。
步骤 204、根据加权系数《2更新长时累积互相关函数,确定长时累积互相 关函数对应的第二延迟, 并将第二延迟确定为左、 右声道信号的延迟。
长时累积互相关函数的计算公式如前所述。 该步骤根据加权系数《2更新 长时累积互相关函数,可以得到长时累积互相关函数的不同取值,从这些取值 中选取较大的值例如最大值或次大值,确定该最大值或次大值所对应的时间为 长时累积互相关函数的第二延迟 ,并将第二延迟确定为左、右声道信号的延迟。 对于首次确定第二延迟, 可以为加权系数《2设置一个初始值后计算长时累积 互相关函数得到。 之后的第二延迟, 根据调整后的加权系数《2计算长时累积 互相关函数得到。
通过上述步骤确定的第二延迟就可以反映出信号的延迟的正负性发生变 化的情况。
在确定第二延迟后, 可以输出, 用于进行左、 右声道信号的同步调整。 图 3是本发明实施例二调整加权系数《2的流程图, 包括步骤:
步骤 301、 初始化加权系数《2;
对加权系数《2进行初始化, 例如可以设置初始值为 1, 获取初始化互的初 始值。
步骤 302、判断第一延迟与第二延迟是否相等,若是,进入步骤 304,若否, 进入步骤 303。
该步骤根据第一延迟与第二延迟, 判断第一延迟与第二延迟是否相等,根 据判断结果进入不同步骤。
步骤 303、 将加权系数《2进行减小处理。
该步骤可以是将加权系数《2与大于零且小于 1 的调整系数相乘。 该调整 系数可以直接根据经验进行设置; 或者,根据长时累积互相关函数最大值不同 选择不同的调整系数。
步骤 304、 维持加权系数《2不变。
图 4是本发明实施例二检测信号延迟的信号跟踪波形示意图。
如图 4所示, 波形 a为现有技术的信号跟踪图, 波形 b为本发明实施例的 信号跟踪图, 当说话的位置从说话 1位置切换到说话 2位置时, 也即左、 右声 道信号的声场从一个方向转换到另外一个方向的时候,本发明实施例的波形图 中的波形及时发生变化, 从而可以跟踪到说话人位置的变化。
从该实施例二可以看出,本发明实施例技术方案通过将左、右声道信号的 累积互相关函数分为短时累积互相关函数和长时累积互相关函数,根据声道信 号间的互相关函数获取短时累积互相关函数;确定所述短时累积互相关函数对 应的第一延迟;根据所述第一延迟和第二延迟的关系调整所述长时累积互相关 函数, 所述第二延迟在调整所述长时累积互相关函数时获得; 在调整所述长时 累积互相关函数后 , 就可以确定其对应的第二延迟为检测的声道信号间的延 迟,该确定的延迟就可以反映出声道信号的延迟的正负性发生变化的情况,从 而提高了检测出的信号延迟的准确性。
图 5是本发明实施例三检测信号延迟的方法的流程图。实施例三与实施例 二不同的地方主要在于调整加权系数《2的过程有所不同 , 同时参考了声场信 如图 5所示, 包括步骤:
步骤 501、 获取左、 右声道信号的当前互相关函数。
步骤 502、 获取短时累积互相关函数, 确定短时累积互相关函数对应的第 —延迟。
上述步骤 501 - 502与实施例二中的步骤 201 - 202的描述相同。
步骤 503、 根据第一延迟与下一步骤确定的第二延迟, 调整长时累积互相 关函数的加权系数《2
步骤 504、根据加权系数《2更新长时累积互相关函数,确定长时累积互相 关函数对应的第二延迟, 并将第二延迟确定为左、 右声道信号的延迟。
该步骤与步骤 204描述相同, 此处不再赞述。 通过上述步骤确定的第二延迟就可以反映出信号的延迟的正负性发生变 化的情况。 图 6是本发明实施例三调整加权系数《2的流程图 , 包括步骤:
步骤 601、 根据累积互相关函数的声场信息, 确定加权系数 "2的值; 该步骤与实施例二不同, 不是对加权系数 进行初始化, 而是根据累积 互相关函数的声场信息计算加权系数《2的值。 当前帧互相关函数以 Cc/(") , -: Γ< Γ,Γ>0为例。 具体过程可以如下:
1 ) 求延迟大于等于零的当前帧互相关函数的和与延迟小于等于零的当
T-1 0
cur _ ratio = Ccf (") I ^ Ccf (") 前帧互相关函数的和的比值(cur— ratio) : ― «=° "=-™ ; 在该步骤中, 可以将 cur— ratio限制在某一范围, 比如<¾101,11^ >, 其中 min 和 max的值可以根据经验来设定, 也可以将 min的值可以设置为 0, 而将 max的 值设置可以为无穷大, 本实施例不做限制, 其中, 设置<11101,11^ >的目的是为 了防止 cur— ratio过大或过小。
2) 求延迟大于等于零的短时累积互相关函数的和与延迟小于等于零的 短时累积互相关函数的和的比值(prev— ratio) :
τ-ι 0
prev _ ratio =^_iac _ Ccf (n) I ^ c _ Ccf (n) 、 、
"=o "=- +i ; prev— ratio可以 P艮制 <min,max>"^j I , 其<11101,11^ >上述 cur— ratio的限定范围相同, 在此不再赘述。 3 ) 根据所述求出的 cur— ratio与 prev— ratio计算加权系数 "2
一种方式为: 通过下述公式求出长时累积互相关函数的加权系数《2, 但并 不限于此: (2 H cur _ratio- prev _ratio \ I k+b 其中, k和 b为常数。 比如, 在实际应用中, 上述计算加权系数中的一组参 数为: min =0.5, max =1.5, k = -0.2, b=l, 但并不限于此。 需要说明的是, 还可以采用以下方法:
1 )求出延迟大于等于零的当前帧互相关函数的和与延迟小于等于零的当 前帧互相关函数的和的差, 该差值称为第一差值;
2 )求出延迟大于等于零的短时累积互相关函数的和与延迟小于等于零的 短时累积互相关函数的和的差, 该差值称为第二差值;
3 )求第一差值与第二差值之差的绝对值, 得到长时累积互相关函数的加 权系数 "2 ; 通过下述公式求出长时累积互相关函数的加权系数《2 , 但并不限于此:
"2—第一差值-第二差值 | + b , 也可以通过其他的公式来计算。 步骤 602、 判断第一延迟与第二延迟是否相等, 若是, 进入步骤 604, 若否, 进入步骤 603。
该步骤根据第一延迟与第二延迟, 判断第一延迟与第二延迟是否相等, 根 据判断结果进入不同步骤。
步骤 603、 将步骤 601中确定的加权系数《2减小。
该步骤可以是将步骤 601 中确定的加权系数《2与大于零且小于 1的调整 系数相乘。 该调整系数可以直接根据经验进行设置; 或者, 根据长时累积互相 关函数最大值不同选择不同的调整系数。
步骤 604、 维持加权系数《2不变。
实施例三技术方案同样具有实施例二技术方案的效果,另外是可同时参考 累积互相关函数的声场信息。
图 7是本发明实施例四检测信号延迟的方法的流程图。实施例四与实施例 二不同的地方主要在于增加对不同声道信号的延迟变化的有效性进行检测的 过程。
如图 7所示, 包括步骤:
步骤 701 - 704, 与实施例二中的步骤 201 - 204的描述相同。
步骤 705、 对不同声道信号的延迟变化的有效性进行检测。
该步骤内容参见图 8, 图 8是本发明实施例四对不同声道信号的延迟变化 的有效性进行检测的流程图 , 包括步骤:
步骤 801、 获取长时累积互相关函数的平均值 ave、 最大值 peak, 及最大值 对应的第二延迟。
步骤 802、确定门限值 peakO, 统计长时累积互相关函数的取值超过门限值 peakO的数目 count;。
可以根据长时累积互相关函数的平均值 ave和最大值 peak, 确定一个门限 值 peak0。 然后, 统计长时累积互相关函数的取值超过该门限值 peakO的数目 count;。
步骤 803、 获取上一次输出的左、 右声道信号的延迟与第二延迟的差值 Diff。
步骤 804、在差值 Diff小于第一阔值 T1时, 将 count增大例如加 1, 在差 值 Diff大于第二阔值 T2时, 将 count减小例如减 1。
步骤 805、 根据 count及 peak判断第二延迟是否有效。
可以设置与 count相关的第一门限值,与 peak相关的第二门限值,第一门 限值和第二门限值可以根据经验进行取值。 如果 peak大于第二门限值, count 小于第一门限值, 则确定第二延迟为有效, 是稳定的延迟, 可以输出用于后续 的左、 右声道信号的同步调整处理。
需要说明的是, 在实施例三的基础上, 同样可以增加图 8所示的步骤。 图 9是本发明实施例四对延迟变化的有效性进行检测的信号跟踪波形示 意图。
如图 9所示, 波形 a为现有技术的信号跟踪图, 波形 b为本发明实施例的 信号跟踪图, 在位置 c看波形 a, 比较难判断出不同声道信号的延迟变化是否 稳定, 而在位置 c看波形 b, 就比较容易判断出不同声道信号的延迟变化是稳 定。
该实施例四内容可以看出,本发明实施例技术方案通过获取上一次输出的 左、右声道信号的延迟与第二延迟的差值 Diff,根据差值 Diff与第一阔值和第 二阔值的比较关系, 对 count进行调整, 从而使得根据 count及 peak判断第二 延迟是否有效时更为准确 , 避免输出不稳定的延迟进行过多的不必要的切换。 上述内容伴细介绍了本发明实施例检测信号延迟的方法,相应的,本发明 实施例提供一种检测装置及编码器。
图 10是本发明实施例的检测装置结构一示意图。
如图 10所示, 检测装置包括: 获取单元 1001、 第一延迟处理单元 1002、 调整单元 1003、 第二延迟处理单元 1004。
获取单元 1001 , 用于根据获取声道信号间的互相关函数获取第一累积互 目关函数;
第一延迟处理单元 1002, 用于确定所述第一累积互相关函数对应的声道 信号间的第一延迟;
调整单元 1003 , 用于根据所述声道信号间的第一延迟和第二延迟的关系 调整第二累积互相关函数,所述第二延迟在调整所述第二累积互相关函数时获 得且所述第二延迟的首次确定值根据第二累积互相关函数的第二加权系数的 初始值确定;
第二延迟处理单元 1004, 用于确定所述调整后的第二累积互相关函数对 应的第二延迟为检测的声道信号间的延迟。
图 11是本发明实施例的检测装置结构二示意图。
如图 11所示, 所述检测装置的调整单元 1003进一步包括: 第一加权处 理单元 1101、 第二加权处理单元 1102、 更新单元 1103。
其中, 第一加权处理单元 1101 , 用于获取第二累积互相关函数的第二加 权系数的初始值;
第二加权处理单元 1102, 用于在判断所述声道信号间的第一延迟和所述 第二延迟不相等时,将所述第二加权系数的初始值进行减小处理得到减小后的 值;
更新单元 1103 , 根据所述减小后的第二加权系数的值更新所述第二累积 互相关函数。
或者,
第一加权处理单元 1101 , 用于根据所述第一累积互相关函数的声场信息 设置第二累积互相关函数的第二加权系数的值;
第二加权处理单元 1102 , 用于在判断所述声道信号间的第一延迟和所述 第二延迟不相等时, 将所述设置的第二加权系数的值减小得到减小后的值; 更新单元 1103 , 用于根据所述减小后的第二加权系数的值更新所述所述 第二累积互相关函数。
所述第一加权处理单元 1101 可以包括: 第一数值确定单元 1201、 第二 数值确定单元 1202、 数值处理单元 1203。
第一数值确定单元 1201 ,用于确定延迟大于等于 0的当前帧互相关函数的 和与延迟小于等于 0的当前帧互相关函数的和的比值或差值, 作为第一数值; 第二数值确定单元 1202, 用于确定延迟大于等于 0的第一累积互相关函数 的和与延迟小于等于 0的第一累积互相关函数的和的比值或差值, 作为第二数值; 数值处理单元 1203, 用于确定所述第一数值和第二数值之差的绝对值为 所述第二累积互相关函数的第二加权系数的值。
所述检测装置还可以包括: 稳定检测单元 1005。
稳定检测单元 1005可以包括: 第三数值确定单元 1301、 第四数值确定 单元 1302、第四数值确定单元 1302、数值调整单元 1303、有效性判断单元 1304。
第三数值确定单元 1301 , 用于确定所述第二累积互相关函数的取值超过 门限值的数目作为第三数值;
第四数值确定单元 1302, 用于确定已输出的声道信号间的延迟与所述第 二延迟的差值作为第四数值;
数值调整单元 1303 , 用于根据所述第四数值与预设的第一阔值、 第二阐 值的比较关系, 对所述第三数值进行调整;
有效性判断单元 1304, 用于根据调整后的第三数值与对应门限值的比较 关系,及所述第二累积互相关函数的取值中的一个取值与对应门 P艮值的比较关 系, 确定所述第二延迟的有效性。
图 12是本发明实施例的编码器结构示意图。
如图 12所示, 编码器包括: 信号获取装置 121、 检测装置 122。
信号获取装置 121 , 用于获取声道信号;
检测装置 122, 用于根据声道信号间的互相关函数获取第一累积互相关 函数; 确定所述第一累积互相关函数对应的声道信号间的第一延迟;根据所述 声道信号间的第一延迟和第二延迟的关系调整第二累积互相关函数,所述第二 延迟在调整所述第二累积互相关函数时获得且所述第二延迟的首次确定值根 据第二累积互相关函数的第二加权系数的初始值确定;确定所述调整后的第二 累积互相关函数对应的第二延迟为检测的声道信号间的延迟。
检测装置 122具有图 10或 11所述的结构, 具体参见前面的描述, 此处 不再赘述。
综上所述,本发明实施例技术方案通过根据声道信号间的互相关函数获取 第一累积互相关函数;确定所述第一累积互相关函数对应的声道信号间的第一 延迟;根据所述声道信号间的第一延迟和第二延迟的关系调整第二累积互相关 函数,所述第二延迟在调整所述第二累积互相关函数时获得且所述第二延迟的 首次确定值根据第二累积互相关函数的第二加权系数的初始值确定;在调整所 述第二累积互相关函数后 ,就可以确定其对应的第二延迟为检测的声道信号间 的延迟, 该确定的延迟就可以反映出声道信号的延迟的正负性发生变化的情 况, 从而提高了检测出的信号延迟的准确性。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤 是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可 读存储介质中, 例如只读存储器, 磁盘或光盘等。
以上对本发明实施例所提供的检测信号延迟的方法、检测装置及编码器进 述, 以上实施例的说明只是用于帮助理解本发明的方法及其核心思想; 同时, 对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围 上均会有改变之处, 综上所述, 本说明书内容不应理解为对本发明的限制。

Claims (10)

  1. 权 利 要 求
    1、 一种检测信号延迟的方法, 其特征在于, 包括:
    根据声道信号间的互相关函数获取第一累积互相关函数;
    确定所述第一累积互相关函数对应的声道信号间的第一延迟;
    根据所述声道信号间的第一延迟和第二延迟的关系调整第二累积互相关 函数,所述第二延迟在调整所述第二累积互相关函数时获得且所述第二延迟的 首次确定值根据第二累积互相关函数的第二加权系数的初始值确定;
    确定所述调整后的第二累积互相关函数对应的第二延迟为检测的声道信 号间的延迟。
  2. 2、 根据权利要求 1所述的检测信号延迟的方法, 其特征在于: 所述根据声道信号间的第一延迟和第二延迟的关系调整第二累积互相关 函数包括:
    获取第二累积互相关函数的第二加权系数的初始值;
    在判断所述第一延迟和所述第二延迟不相等时 , 将所述第二加权系数的 初始值进行减小处理得到减小后的值;
    根据所述减小后的第二加权系数的值更新所述第二累积互相关函数。 3、 根据权利要求 1所述的检测信号延迟的方法, 其特征在于: 所述根据声道信号间的第一延迟和第二延迟的关系调整第二累积互相关 函数包括:
    根据所述第一累积互相关函数的声场信息设置第二累积互相关函数的第 二加权系数的值;
    在判断所述第一延迟和所述第二延迟不相等时, 将所述设置的第二加权 系数的值进行减小处理得到减小后的值;
    根据所述减小后的第二加权系数的值更新所述第二累积互相关函数。 4、 根据权利要求 3所述的检测信号延迟的方法, 其特征在于: 所述根据第一累积互相关函数的声场信息设置第二累积互相关函数的第 二加权系数的值包括:
    确定延迟大于等于 0的当前帧互相关函数的和与延迟小于等于 0的当前帧 互相关函数的和的比值或差值, 作为第一数值; 确定延迟大于等于 0的第一累积互相关函数的和与延迟小于等于 0的第一 累积互相关函数的和的比值或差值, 作为第二数值;
    确定所述第一数值和第二数值之差的绝对值为所述第二累积互相关函数 的第二加权系数的值。
  3. 5、 根据权利要求 2或 3所述的检测信号延迟的方法, 其特征在于: 所述进行减小处理具体为: 乘以大于零且小于 1的调整系数。
  4. 6、根据权利要求 1至 4任一项所述的检测信号延迟的方法,其特征在于: 所述确定所述调整后的第二累积互相关函数的第二延迟为检测的延迟之 后还包括:
    确定所述第二累积互相关函数的取值超过门 P艮值的数目作为第三数值; 确定已输出的声道信号间的延迟与所述第二延迟的差值作为第四数值; 根据所述第四数值与预设的第一阔值、 第二阔值的比较关系, 对所述第 三数值进行调整;
    根据调整后的第三数值与对应门 P艮值的比较关系 , 及所述第二累积互相 关函数的取值中的一个取值与对应门限值的比较关系,确定所述第二延迟的有 效性。
  5. 7、根据权利要求 1至 4任一项所述的检测信号延迟的方法,其特征在于: 所述第一累积互相关函数为短时累积互相关函数, 所述第二累积互相关 函数为长时累积互相关函数。
  6. 8、 一种检测装置, 其特征在于, 包括:
    获取单元, 用于根据获取声道信号间的互相关函数获取第一累积互相关 函数;
    第一延迟处理单元, 用于确定所述第一累积互相关函数对应的声道信号 间的第一延迟;
    调整单元, 用于根据所述声道信号间的第一延迟和第二延迟的关系调整 第二累积互相关函数,所述第二延迟在调整所述第二累积互相关函数时获得且 所述第二延迟的首次确定值根据第二累积互相关函数的第二加权系数的初始 值确定;
    第二延迟处理单元, 用于确定所述调整后的第二累积互相关函数对应的 第二延迟为检测的声道信号间的延迟。
    9、 根据权利要求 8所述的检测装置, 其特征在于, 所述调整单元包括: 第一加权处理单元 , 用于获取第二累积互相关函数的第二加权系数的初 始值;
    第二加权处理单元, 用于在判断所述声道信号间的第一延迟和所述第二 延迟不相等时 , 将所述第二加权系数的初始值进行减小处理得到减小后的值; 更新单元, 根据所述减小后的第二加权系数的值更新所述第二累积互相 关函数。
  7. 10、根据权利要求 8所述的检测装置, 其特征在于, 所述调整单元包括: 第一加权处理单元, 用于根据所述第一累积互相关函数的声场信息设置 第二累积互相关函数的第二加权系数的值;
    第二加权处理单元, 用于在判断所述声道信号间的第一延迟和所述第二 延迟不相等时, 将所述设置的第二加权系数的值减小得到减小后的值;
    更新单元, 用于根据所述减小后的第二加权系数的值更新所述所述第二 累积互相关函数。
  8. 11、根据权利要求 10所述的检测装置, 其特征在于, 所述第一加权处理 单元包括:
    第一数值确定单元,用于确定延迟大于等于 0的当前帧互相关函数的和与 延迟小于等于 0的当前帧互相关函数的和的比值或差值, 作为第一数值;
    第二数值确定单元, 用于确定延迟大于等于 0的第一累积互相关函数的和 与延迟小于等于 0的第一累积互相关函数的和的比值或差值, 作为第二数值; 数值处理单元, 用于确定所述第一数值和第二数值之差的绝对值为所述 第二累积互相关函数的第二加权系数的值。
  9. 12、根据权利要求 8至 11任一项所述的检测装置, 其特征在于, 所述检 测装置还包括:
    第三数值确定单元, 用于确定所述第二累积互相关函数的取值超过门限 值的数目作为第三数值;
    第四数值确定单元 , 用于确定已输出的声道信号间的延迟与所述第二延 迟的差值作为第四数值; 数值调整单元, 用于根据所述第四数值与预设的第一阔值、 第二阔值的 比较关系, 对所述第三数值进行调整;
    有效性判断单元,用于根据调整后的第三数值与对应门 P艮值的比较关系, 及所述第二累积互相关函数的取值中的一个取值与对应门 P艮值的比较关系 ,确 定所述第二延迟的有效性。
  10. 13、 一种编码器, 其特征在于, 包括:
    信号获取装置, 用于获取声道信号;
    检测装置 ,用于根据声道信号间的互相关函数获取第一累积互相关函数; 确定所述第一累积互相关函数对应的声道信号间的第一延迟;根据所述声道信 号间的第一延迟和第二延迟的关系调整所述第二累积互相关函数,所述第二延 迟在调整所述第二累积互相关函数时获得且所述第二延迟的首次确定值根据 第二累积互相关函数的第二加权系数的初始值确定;确定所述调整后的第二累 积互相关函数对应的第二延迟为检测的声道信号间的延迟。
CN2009801547910A 2009-05-07 2009-05-07 检测信号延迟的方法、检测装置及编码器 Expired - Fee Related CN102301748B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2009/071669 WO2010127489A1 (zh) 2009-05-07 2009-05-07 检测信号延迟的方法、检测装置及编码器

Publications (2)

Publication Number Publication Date
CN102301748A true CN102301748A (zh) 2011-12-28
CN102301748B CN102301748B (zh) 2013-08-07

Family

ID=43049908

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009801547910A Expired - Fee Related CN102301748B (zh) 2009-05-07 2009-05-07 检测信号延迟的方法、检测装置及编码器

Country Status (5)

Country Link
US (1) US20120053714A1 (zh)
EP (1) EP2429218A4 (zh)
KR (1) KR101373594B1 (zh)
CN (1) CN102301748B (zh)
WO (1) WO2010127489A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105448312A (zh) * 2014-06-12 2016-03-30 华为技术有限公司 音频同步播放方法、装置及系统

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010091555A1 (zh) * 2009-02-13 2010-08-19 华为技术有限公司 一种立体声编码方法和装置
US10074373B2 (en) * 2015-12-21 2018-09-11 Qualcomm Incorporated Channel adjustment for inter-frame temporal shift variations
US10891960B2 (en) * 2017-09-11 2021-01-12 Qualcomm Incorproated Temporal offset estimation
US10872611B2 (en) * 2017-09-12 2020-12-22 Qualcomm Incorporated Selecting channel adjustment method for inter-frame temporal shift variations

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0255431A (ja) * 1988-08-19 1990-02-23 Matsushita Electric Ind Co Ltd 情報伝送装置
US6035045A (en) * 1996-10-22 2000-03-07 Kabushiki Kaisha Kawai Gakki Seisakusho Sound image localization method and apparatus, delay amount control apparatus, and sound image control apparatus with using delay amount control apparatus
CN1605225A (zh) * 2001-03-27 2005-04-06 1...有限公司 产生声场的方法和装置
CN1867208A (zh) * 2005-05-18 2006-11-22 索尼株式会社 音频再现设备
JP2007079483A (ja) * 2005-09-16 2007-03-29 Nippon Telegr & Teleph Corp <Ntt> ステレオ信号符号化装置、ステレオ信号復号化装置、ステレオ信号符号化方法、ステレオ信号復号化方法、プログラム及び記録媒体
CN1961511A (zh) * 2004-06-02 2007-05-09 松下电器产业株式会社 声音数据发送/接收装置及声音数据发送/接收方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4890065A (en) * 1987-03-26 1989-12-26 Howe Technologies Corporation Relative time delay correction system utilizing window of zero correction
US6408327B1 (en) * 1998-12-22 2002-06-18 Nortel Networks Limited Synthetic stereo conferencing over LAN/WAN
US6973184B1 (en) * 2000-07-11 2005-12-06 Cisco Technology, Inc. System and method for stereo conferencing over low-bandwidth links
KR20050075254A (ko) * 2004-01-16 2005-07-20 현대모비스 주식회사 음성 신호 딜레이 장치 및 그 검출 방법
US7180537B2 (en) * 2004-02-18 2007-02-20 Tektronix, Inc. Relative channel delay measurement

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0255431A (ja) * 1988-08-19 1990-02-23 Matsushita Electric Ind Co Ltd 情報伝送装置
US6035045A (en) * 1996-10-22 2000-03-07 Kabushiki Kaisha Kawai Gakki Seisakusho Sound image localization method and apparatus, delay amount control apparatus, and sound image control apparatus with using delay amount control apparatus
CN1605225A (zh) * 2001-03-27 2005-04-06 1...有限公司 产生声场的方法和装置
CN1961511A (zh) * 2004-06-02 2007-05-09 松下电器产业株式会社 声音数据发送/接收装置及声音数据发送/接收方法
CN1867208A (zh) * 2005-05-18 2006-11-22 索尼株式会社 音频再现设备
JP2007079483A (ja) * 2005-09-16 2007-03-29 Nippon Telegr & Teleph Corp <Ntt> ステレオ信号符号化装置、ステレオ信号復号化装置、ステレオ信号符号化方法、ステレオ信号復号化方法、プログラム及び記録媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105448312A (zh) * 2014-06-12 2016-03-30 华为技术有限公司 音频同步播放方法、装置及系统
US10180981B2 (en) 2014-06-12 2019-01-15 Huawei Technologies Co., Ltd. Synchronous audio playback method, apparatus and system
CN105448312B (zh) * 2014-06-12 2019-02-19 华为技术有限公司 音频同步播放方法、装置及系统

Also Published As

Publication number Publication date
KR101373594B1 (ko) 2014-03-12
EP2429218A4 (en) 2012-03-28
EP2429218A1 (en) 2012-03-14
WO2010127489A1 (zh) 2010-11-11
US20120053714A1 (en) 2012-03-01
CN102301748B (zh) 2013-08-07
KR20120020147A (ko) 2012-03-07

Similar Documents

Publication Publication Date Title
EP3703052A1 (en) Echo cancellation method and apparatus based on time delay estimation
CN101320559B (zh) 一种声音激活检测装置及方法
CN102301748A (zh) 检测信号延迟的方法、检测装置及编码器
CN113470671B (zh) 一种充分利用视觉与语音联系的视听语音增强方法及系统
EP1887831A2 (en) Method, apparatus and program for estimating the direction of a sound source
CN103650040A (zh) 使用多特征建模分析语音/噪声可能性的噪声抑制方法和装置
CN108364659A (zh) 基于多目标优化的频域卷积盲信号分离方法
CN102089809A (zh) 用于提供改进的音频处理的方法、装置及计算机程序产品
US20190116422A1 (en) Noise estimation for dynamic sound adjustment
CN103700375B (zh) 语音降噪方法及其装置
WO2010083641A1 (zh) 双端通话检测方法及装置
WO2012158705A1 (en) Adaptive audio processing based on forensic detection of media processing history
CN113870893B (zh) 一种多通道双说话人分离方法及系统
AU2010227994A1 (en) Method and device for audio signal classifacation
CN107331393B (zh) 一种自适应语音活动检测方法
CN104900232A (zh) 一种基于双层gmm结构和vts特征补偿的孤立词识别方法
JPH03273722A (ja) 音声・モデム信号識別回路
CN103856877A (zh) 一种声控信息检测方法及电子设备
CN112435683B (zh) 基于t-s模糊神经网络的自适应噪声估计及语音降噪方法
JPWO2009069662A1 (ja) 音声検出システム、音声検出方法および音声検出プログラム
CN103268766A (zh) 双麦克风语音增强方法及装置
CN107969164B (zh) 适应性信道间判别再缩放滤波器
EP2413598B1 (en) Method for estimating inter-channel delay and apparatus and encoder thereof
CN110491411A (zh) 结合麦克风声源角度和语音特征相似度分离说话人的方法
CN114566152B (zh) 一种基于深度学习的语音端点检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130807

CF01 Termination of patent right due to non-payment of annual fee