CN1149535C - 带有改进的编码器的音频传输系统 - Google Patents

带有改进的编码器的音频传输系统 Download PDF

Info

Publication number
CN1149535C
CN1149535C CNB008017328A CN00801732A CN1149535C CN 1149535 C CN1149535 C CN 1149535C CN B008017328 A CNB008017328 A CN B008017328A CN 00801732 A CN00801732 A CN 00801732A CN 1149535 C CN1149535 C CN 1149535C
Authority
CN
China
Prior art keywords
signal
component
link
continuous
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB008017328A
Other languages
English (en)
Other versions
CN1320257A (zh
Inventor
R
R·陶里
˹¬���ض�
R·J·斯卢伊特尔
���Dz��ֿ�
A·C·登布林克尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1320257A publication Critical patent/CN1320257A/zh
Application granted granted Critical
Publication of CN1149535C publication Critical patent/CN1149535C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

在传输系统内,音频信号由编码器(4)进行编码,并且由发射装置(6)通过媒介(8)发送到接收机(10)。在音频编码器(4)中,音频分段由多个正弦信号来表示,其中每一个正弦信号都拥有自己的频率和幅度。为了把音频分段链接在一起,链接连续分段中的正弦信号是有利的。分段链接过程中的问题是发现哪一个正弦信号应该被链接。现有技术中,是在信号分量的频率差值(最近频率相邻准则)基础上链接信号分量。根据本发明,采用分析-合成方法来进行链接。为了减小搜索的复杂性,最好进行预选。这种预选可以在最近频率相邻准则的基础上进行。

Description

带有改进的编码器的音频传输系统
技术领域
本发明涉及传输系统,其中包含带有音频编码器的发射机,该音频编码器包括用于把输入音频信号划分为连续信号分段的分割装置,该编码器还包含用于确定连续信号分段内出现的链接信号分量的跟踪判定装置,该发射机还包括发射装置用于通过传输媒介向接收机发送代表该被链接信号分量的信号,该接收机包括用于从传输媒介中接收代表该信号分量的信号的接收装置和用于从代表该信号分量的信号中得到重构的音频信号的解码器。
本发明还进一步涉及发射机、编码器、编码方法、承载计算机程序的有形媒介以及承载计算机程序的信号。
背景技术
从US4885790可以了解到一种依照前序部分的传输系统。这种传输系统以及音频编码器被用于如下应用:其中音频信号必须要通过传输容量受限的传输媒介来传输,或者必须要被存储在存储容量受限的存储介质中。这种应用的实例包括通过互联网传输音频信号、从移动电话向基站传输音频信号及其反向传输,以及在CD-ROM、固态存储器或者硬盘驱动器中存储音频信号。
在适当比特率情况下,试图采用不同的音频编码器工作原理去获得良好的音频质量。在其中一种操作方法中,被传输的音频信号要被分割成为多个分段,每个分段拥有5-50ms的固定或者与分段相关的长度。在各所述分段中,音频信号都是由多个信号分量来代表的,所述信号分量可以是由其幅度、频率以及可能还有其相位来定义的正弦信号。
发射装置向接收机发送信号分量的幅度和频率表示。发射机所执行的操作可以包括信道编码、交织和调制。
接收装置从传输信道中接收代表音频信号的信号,并且执行类似解调、去交织和信道解码的操作。解码器从接收机得到音频信号的表示,并且根据该表示来通过生成多个由编码信号所描述的正弦信号并且把它们组合形成输出信号,而得到重构的音频信号。
音频信号中,当前信号分段内的信号分量与前一分段内的信号分量之间通常都存在一定的关系。音频信号可以包括例如对多个信号分段的持续时间的正弦分量的频率扫描。这种信号的存在可以被用于编码过程,对第一个信号分段之后出现的信号分段的频率和幅度进行差分编码。这意味着只需要传输当前信号分段内信号分量的频率与前一信号分量的频率之间的差值,而不传输该信号分段的频率和幅度。对连续两个分段的幅度也可以采用相同的方法。
为了做到这一点,编码器内包含跟踪判定装置,用于判定需要链接哪一个信号分量。根据上面提到的美国专利,在传输系统内利用当前帧内与前一帧内信号分量之间的频率差别去决定应该链接哪一个频率分量,以及哪个信号分量不应该被链接。然而实验表明:这样做并不总能保证重构音频信号有最佳质量。
发明内容
本发明的目的在于提供一种具有提高的重构音频信号质量的传输系统。
为实现该目的,依照前序部分的传输系统具备如下特点:在跟踪装置内包括选择装置,用于选择被链接的信号分量,使得在该被链接信号分量基础上判定的合成音频信号与该输入音频信号之间的误差测量达到最小。
通过尝试多个候选的被链接信号分量并选择其中一组能够使得误差测量达到最小的被链接信号分量,可以使得重构音频信号的质量得到提高。误差测量可以包括例如均方误差或感性加权误差测量。可以看到通常都有必要真正地生成合成语音信号,但是也可以根据误差信号表达方式,利用分析方法去决定信号分量的最佳参数。
本发明实施例的特征在于编码器中包含合成装置,用于在连续两个信号分段内,基于该候选链接信号分量的至少一个参数得到合成信号。
通过在连续两个信号分段的至少一个参数(频率、幅度)的基础上得到合成信号,合成信号内该参数的变化会更加平稳,这能更好地与输入音频信号的特性相对应。
本发明的另外一个实施例的特征在于:设计合成装置以便根据对应于至少两个连续信号分段的信号分量参数得到内插信号分量参数,以及在该内插信号分量参数的基础上得到合成信号。
通过使用根据两个(或多个)连续信号分段的信号分量参数的内插信号分量参数,可以得到听起来更加自然的合成音频信号。
本发明的另外一个实施例的特征在于跟踪装置内包含预选装置,用于从所有可能的链接信号分量当中选择有限数量的候选链接信号分量。
通过在真正选择链接信号分量之前进行预选,可以使得所要求的计算资源大大地减少。
本发明的另外一个实施例的特征在于设计预选装置去选择那些频率偏差小于预定值的信号分量做为候选的链接信号分量。
一种预选候选信号分量的适当方法是:选择频率偏差相对较小的候选信号分量。被允许的频率偏差是在质量和计算复杂度之间的折衷。然而可以观察到,如果允许频率偏差高于给定值,则重构语音信号的质量几乎不会得到改善。
本发明的另外一个实施例的特征在于设计跟踪装置以便在已经确定的链接信号分量参数的基础上扩展跟踪。
由于免除了对大量候选信号分量要进行的处理,所以通过外推方式来扩展当前跟踪会大大降低跟踪判定装置的复杂度。
附图说明
下面将参考附图来解释本发明。
图1给出其中可应用本发明的传输系统;
图2给出根据本发明、用于依照图1中的传输系统内的编码器第一实施例;
图3给出根据本发明、用于依照图1中的传输系统内的编码器第二实施例;
图4给出依照图3中的编码器内的跟踪模块44可能的实施方案。
具体实施方式
在根据图1的传输系统内,要被传输的音频信号被加到发射机2内的编码器4。编码器4对输入信号进行编码,形成对被链接信号分量的跟踪。该跟踪可以这样表示:第一个信号分段的起始频率、起始幅度以及起始相位,随后是跟踪中下一个分段的频率和幅度差值。
表示该跟踪的信号被加到发射装置6。发射装置6的操作可以包括信道编码、交织和调制。发射机2的输出通过传输媒介(或记录媒介)8被发送到接收机10。在接收机10内,接收信号被送到接收装置12。接收装置10的操作可以包括解调、去交织和信道解码。接收装置12的输出与解码器14的输入相连,该解码器被设计对编码的音频信号进行解码。解码器14的操作原理在上面提到的美国专利内有描述。
在根据图2的编码器4中,输入信号被加到分割装置20,后者把输入信号分割成为拥有从5-50ms范围内的固定或与信号有关的长度的信号分段。这些分段可以是部分相互重叠的,但也可能没有重叠。分割装置20选择部分信号,其中包含做为频谱分析装置22输入的数据以及做为闭环跟踪
块44输入的数据。通过在各自的单元中进行开窗口来得到任一单元内的适当数据。分割装置20还生成时间标记Tk,用于标记当前信号分段内与要被基于当前信号分段计算的瞬时跟踪参数相对应的时刻,Tk-1对应于当前分段内前一次迭代过程中已经计算的瞬时跟踪参数的时刻。在第k个分段内经过闭环跟踪之后得到的参数由下标k来表示,例如Ak。分割装置20的输出与频谱分析仪22的输入以及减法器36的第一输入相连。
频谱分析仪22对其输入信号频谱进行粗略判定。该频谱构成一个用于确定被链接信号分量的基础。这种由频谱分析仪22来完成的粗略搜索可以基于中等尺寸的FFT,然后选择振幅谱中的主要峰值。频谱分析仪22的输出信号被传送到分量标识装置24,其中执行对信号分量参数的精确搜索。这种精确搜索可以在频谱分析仪22所确定的主要峰值附近进行,从而获得更加准确的参数(幅度、频率以及相位)估计。不同信号分量的幅度和频率的起始值可以通过振幅谱内的对应峰值的幅度和频率来确定。
分量标识装置24的输出信号被送到跟踪装置28的第一输入,以及送到延时单元26(有一帧时段的时延)。延时单元26的输出被连接到跟踪装置28的第二输入。在开始时,跟踪装置28确定有限数量的候选链接分量。选择有限数量的候选链接分量可以在幅度和频率差值的基础上进行。对于前一帧内的每一个信号分量来说,当前帧内所有幅度和频率差值小于预定门限值的分量都被添加到候选链接分量表中。可以根据可用的幅度和频率数据,以及另外根据更新速率(即1/Tk-Tk-1)来设定门限值。因此可以得到包含多个组且每个组内包含两个被链接信号分量的表。这种表的实例随后给出。
Figure C0080173200091
每一组内信号分量的幅度与频率都被加到合成器32,用于根据被链接的信号分量生成合成音频信号。
可以通过在帧边界之间对频率和幅度进行线性内插来计算合成音频信号Ci,j(链接第k-1帧内的第i个分量与第k帧内的第j个分量)。对应一个跟踪i,j的合成信号可以根据下式来计算:
Figure C0080173200101
在式(1)内,M[n]由下式给出:
M [ n ] = T k - n T k - T k - 1 A i , k - 1 + n - T k - 1 T k - T k - 1 A j , k ; T k - 1 ≤ n ≤ T k - - - - ( 2 )
以及β等于:
β = θ j , k - 1 - θ i , k T k - T k - 1 - - - - ( 3 )
其中θ=2πf/fs。相位可以被设为φi,k-1,表示前一帧末尾的相位。相位也可以通过导致最小误差测量的相位值φi,k得到。
上述合成器的另外一个方案可以是例如公知的重叠相加合成器。
合成器32的输出连接到减法器36的第二输入。减法器36判定分割装置20的输出信号与合成器32的输出信号之间的差值。减法器36的输出被连接到MSE单元34的输入。该MSE单元34判定一帧内减法器36输出信号的均方值。或者在MSE单元34内可以包括加权滤波器,用于对前一次判定的均方值进行感性加权。MSE单元34的输出被连接到跟踪装置28的第三输入。
跟踪装置28利用MSE单元34的输出信号去判定哪一组链接信号分量的组合可以使得MSE单元34的输出信号达到最小。这可以通过对所有可能的链接组合进行全面合成来实现,但是也可能执行次优的搜索,后者所需要的计算资源会大大地减小。在次优搜索过程中,仅对一个分量进行合成,并且计算输入信号与该合成分量之间的均方误差。对于所有可能的跟踪都这样做,并且构造所谓的误差矩阵。在这个矩阵中,所有可能的跟踪都与其对应的误差一起被标识。下面给出这种矩阵的一个实例。
在该矩阵中只包括对应于预选链接的分量的误差。
尽管上述实例中给出了所有链接,但是仍然可能省略那些导致误差增加而非减少的链接。当决定了可能的链接之后,情况必须是这样的,即:当前帧内信号分量在前一帧内只有单个的对应分量,而且前一帧的信号分量在当前帧内也只有单个的对应分量。在上述矩阵中,这就意味着行和列内不会有多个项。
一种可能的搜索最终结果的次优方法是:首先选择每一列内误差最小的元素,然后选择每一行内误差最小的元素。选择列中的单一元素之后,矩阵变化为:
随后选择行内的单一元素,得到最终的链接矩阵。
也可以先选择每一行内误差最小的元素,然后选择每一列内误差最小的元素。还可以尝试这两种选择方法,然后选择那种能够导致均方误差(=所有矩阵元素之和)最小的选择方法的结果。
在过程的最后,能够得到要被继续的跟踪。前一帧内没有被链接的信号分量可以是跟踪终点或独立点。当前帧内没有被链接的分量可以是新出现的跟踪或独立点。在要被传输的信号中包括独立点的参数可以基于例如屏蔽门限值的主观测量,或者基于例如减小误差的客观测量,或者联合使用两种方法。由于包括这些独立分量也对比特率有影响,所以在这一过程中也要考虑比特预算。
在选择装置已经选定要被发送的被链接信号分量以及独立点之后,表示链接分量跟踪的信号被加到复用器30中,后者把它们组成适于传输的复用信号。
在根据图3的编码器4中,分割单元20(其功能前面已经描述)选择部分信号,其中包含做为频谱分析装置22输入的数据以及做为闭环跟踪模块44输入的数据。通过在各自的单元中进行开窗口来得到任一单元内的适当数据。
存储器单元32保存来自前一分段k-1的相关信息描述。控制单元40利用从存储器单元32接收到的输入信号以及可能从频谱分析装置22接收到的输入,去估计跟踪继续参数。继续数据包括有关哪一个跟踪应该被继续以及那些不应该被继续的信息。对于每一个要被继续的跟踪来说,要提供至少一个将要继续的频率位置的估计。
控制单元40的输出与当前输入分段一起做为闭环跟踪模块44的输入。闭环跟踪模块44的输出由继续跟踪和新出现跟踪的跟踪数据(图3内使用TD标识)组成。图3中跟踪模块44的输出FD中除了包括跟踪数据TD之外,还包括有辅助信息。辅助信息内包含完成本地合成所必要的信息,并且还可能包括附加信息(例如得到的误差减小)。
跟踪数据TD被送到复用器30,其中对信息进行组合,形成适合于传输的复用信号。
控制单元40的其中一个任务就是决定在当前分段内是否有跟踪要被继续。该判定是在包括辅助信息的可用跟踪信息的基础上进行的。另外一个任务是为每一个被继续的跟踪计算Tk时刻的一个或者多个初始频率估计。这种计算可以在各种复杂度级别上进行,从零阶外推开始(只要求Tk-1时刻的频率信息)一直到更高阶的预测(使用Ti(i<k-1)时刻的频率信息)。在此计算过程中,可以利用频谱分析装置22输出的可用附加信息。
图4中给出了跟踪模块44的一种可能的实施方案。控制单元40以及分割单元20的输出做为继续跟踪装置50的输入。继续跟踪装置进行搜索过程,使其能够传递与连续跟踪相对应的最佳参数以及辅助信息。利用这一点,可以由合成器52对信号进行合成。合成器52的输出与分割单元20的输出一起以及可能还有控制单元40的输出都可以被新出现分量的跟踪装置54所利用,去传递用于新出现跟踪的最佳参数和辅助信息。跟踪装置50和54的输出都被用于分离器56,进行跟踪数据(TD)和反馈数据(FD)的传递。
继续跟踪装置50实施搜索过程,以便传递Tk时刻的频率θm的改善估计连同最佳幅度Am和相位m,以及辅助信息。搜索本身基于加权平方误差最小化,可以表达如下:
E = Σ n w k ( n ) · [ x ( n ) - s ( n ) ] 2 - - - - ( 4 )
其中wk是第k个分段的加权函数,x[n]是输入分段,s[n]是合成分段,n表示加权函数所定义的间隔。在分段长度和标记符Tk-Tk-1的基础上生成加权函数。令s(n)根据下式表示合成信号:
s ( n ) = Σ m = 1 v ( T k - 1 ) a m ( n ) cos ( φ m ( n ) ) + b m ( n ) sin ( φ m ( n ) ) - - - - ( 5 )
在公式(5)中,v是当前帧内继续跟踪的个数,式(7)中的系数am(n)、bm(n)和φm(n)由下列公式计算:
a m ( n ) = a m ( T k - 1 ) + { a m ( T k ) - a m ( T k - 1 ) } n - T k - 1 T k - T k - 1 - - - - ( 6 )
b m ( n ) = b m ( T k ) n - T k - 1 T k - T k - 1 - - - - ( 7 )
θ m ( n ) = θ m ( T k - 1 ) + { θ m ( T k ) - θ m ( T k - 1 ) } n - T k - 1 T k - T k - 1 - - - - ( 8 )
φ m ( n ) = φ m ( T k - 1 ) + Σ 1 = T k - 1 n - 1 θ ( 1 ) - - - - ( 9 )
φm(Tk-1)=m(Tk-1)                 (10)
am(Tk-1)=Am(Tk-1)                   (11)
这样公式(6)的最小值可以表达如下:
min E θ m ( T k ) , a m ( T k ) , b m ( T k ) - - - - ( 12 )
其中根据1≤m≤v(Tk-1),对所有m取最小值。然而值得注意的是,在s(n)中am(Tk)和bm(Tk)都是以线性方式出现的。这意味着根据给定的最小化准则,它们的最佳值就是一组常规方程的解,因此可以简化搜索过程,并且把问题简化成为对θm(Tk)进行最小化。
利用(7)到(12),(4)可以被重新写为:
E = Σ n w k ( n ) ·[x ( n ) - Σ m = 1 v ( T k - 1 ) a m ( T k - 1 ) ( 1 - n - T k - 1 T k - T k - 1 ) cos ( φ m ( n ) ) - - - - ( 13 )
- Σ m = 1 v ( T k - 1 ) a m ( T k ) ( n - T k - 1 T k - T k - 1 ) cos ( φ m ( n ) ) - Σ m = 1 v ( T k - 1 ) b m ( T k ) ( n - T k - 1 T k - T k - 1 ) sin ( φ m ( n ) ) ] 2
搜索过程的每一次迭代都是从选择θm(Tk)值并计算am(Tk)和bm(Tk)的最佳对应值开始的。为了计算am(Tk)和bm(Tk)值,需要进行如下的替换:
x ~ ( n ) = x ( n ) - Σ m = 1 v ( T k - 1 ) a m ( T k - 1 ) ( 1 - n - T k - 1 T k - T k - 1 ) cos ( φ m ( n ) ) - - - - ( 14 )
p 2 m - 1 ( n ) = n - T k - 1 T k - T k - 1 cos ( φ m ( n ) ) - - - - ( 15 )
p 2 m ( n ) = n - T k - 1 T k - T k - 1 sin ( φ m ( n ) ) - - - - ( 16 )
c2m-1=am(Tk)                         (17)
c2m=bm(Tk)                           (18)
把(15)-(19)代入到(14)当中,得到如下要被最小化的准则:
E = Σ n w k ( n ) · [ x ~ ( n ) - Σ m = 1 2 v ( T k - 1 ) c m · p m ( n ) ] 2 - - - - ( 19 )
使公式(19)对每一个值cm进行微分,并且令导数为零,可以求得E的最小值。这会得到下列一组方程,根据这些方程必须确定常量c1,c2,…,c2v-1,c2v
Σ n w k ( n ) · x ~ ( n ) · p 1 ( n ) - Σ n w k ( n ) · Σ m = 1 2 v ( T k - 1 ) c m · p m ( n ) · p 1 ( n ) = 0
Σ n w k ( n ) · x ~ ( n ) · p 2 ( n ) - Σ n w k ( n ) · Σ m = 1 2 v ( T k - 1 ) c m · p m ( n ) · p 2 ( n ) = 0
                                (20)
Σ n w k ( n ) · x ~ ( n ) · p 2 v - 1 ( n ) - Σ n w k ( n ) · Σ m = 1 2 v ( T k - 1 ) c m · p m ( n ) · p 2 v - 1 ( n ) = 0
Σ n w k ( n ) · x ~ ( n ) · p 2 v ( n ) - Σ n w k ( n ) · Σ m = 1 2 v ( T k - 1 ) c m · p m ( n ) · p 2 v ( n ) = 0
根据 d → - A c → = 0 → , 把(21)写成矩阵形式,其中
Figure C00801732001410
A、
Figure C00801732001411
等于:
d → = Σ n w ( n ) · x ~ ( n ) · p 1 ( n ) Σ n 1 w ( n ) · x ~ ( n ) · p 2 ( n ) · · · Σ n w ( n ) · x ~ ( n ) · p 2 v - 1 ( n ) Σ n w ( n ) · x ~ ( n ) · p 2 v ( n ) - - - - ( 21 )
c → = c 1 c 2 · · · c 2 v - 1 c 2 v - - - - ( 23 )
现在可以根据下式来计算
Figure C0080173200155
c → = A - 1 · d → - - - - ( 24 )
最佳化过程可以对所有跟踪同时进行,也可以逐条跟踪的进行。在后一种情况中,最优化块可以根据一定的顺序来进行判定。这种判定可以是例如根据在Am中所表达的前一次强度来进行。可以使用常规技术来终止该搜索过程。根据Tk时刻的am、bm以及φm可以根据下式计算Tk时刻的Am值和m值:
A m = a m 2 + b m 2 - - - - ( 25 )
m=φmm
其中ψm对应复数am+jbm的幅角。
新出现分量跟踪装置54在功能上类似继续跟踪装置50。它们的不同之处在于:新出现分量跟踪装置54识别的是新出现的跟踪,而不是继续跟踪。因此,根据迄今合成的分段、s[n]以及输入分段x[n],可以得到误差最小的目标信号。在最简单的形式中,这可以通过从x中减去s的方法得到。此外,Tk时刻的幅度Am与相位m都被设定为零。在新出现跟踪期间,必须要基于当前分段中的频率或相位的跟踪来进行假设。在初始阶段假设频率保持不变是合理的。这样以最简单的形式,可以根据不变的频率跟踪来设定Tk-1时刻的频率值θm
可以看到本发明可以以专用硬件形式、DSP上运行的软件形式或者通用计算机的形式来实施。本发明可以被包含在有形媒介中(例如CD-ROM或者DVD-ROM)来实施,后者承载用于执行根据本发明的编码方法的计算机程序。本发明还可以具体化成在数据网(例如互联网)中传输的信号,或者通过广播服务发送的信号。

Claims (20)

1.一种传输系统,其中包含带有音频编码器的发射机,该音频编码器包括用于把输入的音频信号划分为连续信号分段的分割装置,该编码器还包含用于确定连续信号分段内出现的链接信号分量的跟踪判定装置,发射机还包括发射装置用于通过传输媒介向接收机发送代表该被链接信号分量的信号,该接收机包括用于从传输媒介接收代表信号分量的信号的接收装置,以及用于从该代表信号分量的信号中得到重构的音频信号的解码器,该传输系统的特征在于跟踪装置内包括选择装置,用于选择被链接信号分量,使得在该被链接信号分量基础上判定到的合成音频信号与该输入音频信号之间的误差测量达到最小。
2.权利要求1中的传输系统,其特征在于编码器中包含合成装置,用于在连续两个信号分段内,基于至少其中一个该候选链接信号分量的参数得到合成信号。
3.权利要求2中的传输系统,其特征在于设计合成装置以便根据对应于至少两个连续信号分段的信号分量参数得到内插信号分量参数,以及在该内插信号分量参数的基础上得到合成信号。
4.权利要求1、2或3中的传输系统,其特征在于跟踪装置内包含预选装置,用于从所有可能的链接信号分量当中选择有限数量的候选链接信号分量。
5.权利要求4中的传输系统,其特征在于设计预选装置去选择那些频率偏差小于预定值的信号分量做为候选的链接信号分量。
6.权利要求1中的传输系统,其特征在于设计跟踪装置以便在已经确定的链接信号分量参数的基础上扩展跟踪。
7.权利要求6中的传输系统,其特征在于设计跟踪装置以便在对一个跟踪合成的基础上确定被链接的信号分量。
8.包含音频编码器的发射机,该音频编码器包括用于把输入的音频信号划分为连续信号分段的分割装置,该编码器还包含用于确定连续信号分段内出现的链接信号分量的跟踪判定装置,发射机还包括发射装置用于发射代表该被链接信号分量的信号,其特征在于跟踪装置内包括选择装置,用于选择被链接信号分量,使得在该被链接信号分量的基础上判定的合成音频信号与该输入音频信号之间的误差测量达到最小。
9.权利要求8中的发射机,其特征在于编码器中包含合成装置,用于在连续两个信号分段内,基于至少其中一个该候选链接信号分量的参数得到合成信号。
10.权利要求9中的发射机,共特征在于合成装置包括加权装置,用于根据对应加权函数对连续两个信号分段内的信号分量进行加权,以及该合成装置还包括用于把加权信号分段组合成为合成音频信号的组合装置。
11.权利要求8、9或10中的发射机,其特征在于跟踪装置内包含预选装置,用于从所有可能的链接信号分量当中选择有限数量的候选链接信号分量。
12.权利要求8中的发射机,其特征在于设计跟踪装置以便在已经确定的链接信号分量参数的基础上扩展跟踪。
13.一种音频编码器,包括用于把输入音频信号划分为连续信号分段的分割装置,该编码器还包含用于确定连续信号分段内出现的链接信号分量的跟踪判定装置,该音频编码器还包括发射装置用于发射代表该被链接信号分量的信号,其特征在于跟踪装置内包括选择装置,用于选择被链接信号分量,使得在该被链接信号分量基础上判定的合成音频信号与该输入音频信号之间的误差测量达到最小。
14.权利要求13中的音频编码器,其特征在于该编码器包括合成装置,用于在连续两个信号分段内,基于至少其中一个该候选链接信号分量的参数得到合成信号。
15.权利要求13中的音频编码器,其特征在于设计合成装置以便根据对应于至少两个连续信号分段的信号分量参数得到内插信号分量参数,以及设计该合成装置以便在该内插信号分量参数的基础上得到合成信号。
16.权利要求13、14或15中的音频编码器,其特征在于跟踪装置内包含预选装置,用于从所有可能的链接信号分量当中选择有限数量的候选链接信号分量。
17.权利要求16中的音频编码器,其特征在于设计预选装置去选择那些频率偏差小于预定值的信号分量做为候选的链接信号分量。
18.权利要求13、14或15中的音频编码器,其特征在于设计跟踪装置以便在已经确定的链接信号分量参数的基础上扩展跟踪。
19.权利要求18中的音频编码器,其特征在于设计跟踪装置以便在对一个跟踪合成的基础上确定被链接的信号分量。
20.一种编码方法,包括把输入音频信号分割成为连续信号分段,确定出现在连续信号分段之内的链接信号分量,发射表示该被链接信号分量的信号,其特征在于,该方法内包括选择被链接信号分量,使得在该被链接信号分量基础上判定的合成音频信号与该输入音频信号之间的误差测量达到最小。
CNB008017328A 1999-06-18 2000-06-08 带有改进的编码器的音频传输系统 Expired - Fee Related CN1149535C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP99201959 1999-06-18
EP99201959.6 1999-06-18

Publications (2)

Publication Number Publication Date
CN1320257A CN1320257A (zh) 2001-10-31
CN1149535C true CN1149535C (zh) 2004-05-12

Family

ID=8240322

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB008017328A Expired - Fee Related CN1149535C (zh) 1999-06-18 2000-06-08 带有改进的编码器的音频传输系统

Country Status (6)

Country Link
EP (1) EP1105869B1 (zh)
JP (1) JP2003502703A (zh)
KR (1) KR20010072778A (zh)
CN (1) CN1149535C (zh)
DE (1) DE60001904T2 (zh)
WO (1) WO2000079519A1 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR0109237A (pt) * 2001-01-16 2002-12-03 Koninkl Philips Electronics Nv Codificador paramétrico, método de codificação paramétrica, decodificador paramétrico, método de decodificação, fluxo de dados incluindo dados de código senoidais, e, meio de armazenamento
JP2004518162A (ja) 2001-01-16 2004-06-17 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ パラメトリック符号化における信号成分の連結
KR100927842B1 (ko) 2001-04-18 2009-11-23 아이피지 일렉트로닉스 503 리미티드 오디오 신호를 인코딩하고 디코딩하는 방법, 오디오 코더, 오디오 플레이어, 그러한 오디오 코더와 그러한 오디오 플레이어를 포함하는 오디오 시스템 및 오디오 스트림을 저장하기 위한 저장 매체
EP1446796A1 (en) * 2001-10-26 2004-08-18 Koninklijke Philips Electronics N.V. Tracking of sinusoidal parameters in an audio coder
ATE356404T1 (de) * 2002-07-08 2007-03-15 Koninkl Philips Electronics Nv Sinusoidale audio-kodierung
EP1568010B1 (en) * 2002-11-28 2006-12-13 Koninklijke Philips Electronics N.V. Coding an audio signal
WO2005024783A1 (en) * 2003-09-05 2005-03-17 Koninklijke Philips Electronics N.V. Low bit-rate audio encoding
CN101213592B (zh) * 2005-07-06 2011-10-19 皇家飞利浦电子股份有限公司 用于参量多声道解码的设备和方法
KR101346771B1 (ko) * 2007-08-16 2013-12-31 삼성전자주식회사 심리 음향 모델에 따른 마스킹 값보다 작은 정현파 신호를효율적으로 인코딩하는 방법 및 장치, 그리고 인코딩된오디오 신호를 디코딩하는 방법 및 장치
US8620660B2 (en) * 2010-10-29 2013-12-31 The United States Of America, As Represented By The Secretary Of The Navy Very low bit rate signal coder and decoder
CN103346830B (zh) * 2013-07-03 2016-05-11 深圳中科智星通科技有限公司 基于北斗卫星的语音传输方法和装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4937873A (en) * 1985-03-18 1990-06-26 Massachusetts Institute Of Technology Computationally efficient sine wave synthesis for acoustic waveform processing
US4885790A (en) * 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
US5179626A (en) * 1988-04-08 1993-01-12 At&T Bell Laboratories Harmonic speech coding arrangement where a set of parameters for a continuous magnitude spectrum is determined by a speech analyzer and the parameters are used by a synthesizer to determine a spectrum which is used to determine senusoids for synthesis
US5504833A (en) * 1991-08-22 1996-04-02 George; E. Bryan Speech approximation using successive sinusoidal overlap-add models and pitch-scale modifications

Also Published As

Publication number Publication date
EP1105869A1 (en) 2001-06-13
CN1320257A (zh) 2001-10-31
KR20010072778A (ko) 2001-07-31
EP1105869B1 (en) 2003-04-02
DE60001904T2 (de) 2004-05-19
DE60001904D1 (de) 2003-05-08
WO2000079519A1 (en) 2000-12-28
JP2003502703A (ja) 2003-01-21

Similar Documents

Publication Publication Date Title
CN1149535C (zh) 带有改进的编码器的音频传输系统
CN1249517A (zh) 用于在音频数据中插入附加信息的系统
CN1279512C (zh) 用于改善高频重建的方法和装置
RU2393552C2 (ru) Комбинированное аудиокодирование, минимизирующее воспринимаемое искажение
CN1308913C (zh) 编码设备、解码设备及其方法
CN1133151C (zh) 纠正传输差错的声频信号解码方法
CN1143265C (zh) 具有改进的语音编码器的传输系统
CN1241170C (zh) 语音编解码器中用于线频谱频率矢量量化的方法和系统
CN1816848A (zh) 通过增加噪声改善解码音频的质量
CN1575490A (zh) 音频编码器内正弦参数的跟踪
CN1114279C (zh) 复杂度减小的信号传输系统
US20070250310A1 (en) Audio Encoding Device, Audio Decoding Device, and Method Thereof
WO2005114655A1 (ja) 音声・楽音復号化装置および音声・楽音復号化方法
CN1148232A (zh) 改善增强语声的滤波器,用该滤波器的装置、系统和方法
CN102044250A (zh) 频带扩展方法及装置
CN1146129C (zh) 降低了复杂度的信号传输系统和方法
CN1826634A (zh) 低比特率音频编码
CN1145925C (zh) 具有改进语音编码器和解码器的发射机
CN1163868C (zh) 一种转换话音重现速率的方法及其装置
JP2001228898A (ja) 音響波形のコード化方式
CN101053020A (zh) 利用信号属性的有效音频编码
KR101230691B1 (ko) 공간정보 기반의 다객체 오디오 부호화에서의 오디오 객체 편집 방법 및 그 장치
CN1647186A (zh) 多媒体信号的时域加水印
CN1227646C (zh) 音频信号传输系统
KR20040055788A (ko) 정현파 모델 파라미터들의 주파수 차동 인코딩

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee