CN1319292A - 利用重复传输包部分的音频编码器 - Google Patents

利用重复传输包部分的音频编码器 Download PDF

Info

Publication number
CN1319292A
CN1319292A CN99811227A CN99811227A CN1319292A CN 1319292 A CN1319292 A CN 1319292A CN 99811227 A CN99811227 A CN 99811227A CN 99811227 A CN99811227 A CN 99811227A CN 1319292 A CN1319292 A CN 1319292A
Authority
CN
China
Prior art keywords
data
signal
subband
relevant
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN99811227A
Other languages
English (en)
Other versions
CN1144411C (zh
Inventor
罗里·斯图尔特·特恩布尔
安德鲁·戈登·戴维斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
British Telecommunications PLC
Original Assignee
British Telecommunications PLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by British Telecommunications PLC filed Critical British Telecommunications PLC
Publication of CN1319292A publication Critical patent/CN1319292A/zh
Application granted granted Critical
Publication of CN1144411C publication Critical patent/CN1144411C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/08Arrangements for detecting or preventing errors in the information received by repeating transmission, e.g. Verdan system

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Transmitters (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

编码器(13)产生提供第一数据S1(n)的第一输出和第二增强数据S2(n)的第二输出,利用该第一数据译码器可以产生一个重建的信号,由此,接收第一与第二数据的译码器可以产生一个更高质量的重建信号。组装数据包以便于传输,每个包包含主要数据、次要数据,其中该主要数据包括有关该信号的时间部分的第一数据S1(n)和有关该信号的同一部分的第二数据S2(n),而次要数据包含有关该信号的不同时间部分的第一数据S1(n+1)。

Description

利用重复传输包部分的音频编码器
本发明涉及离散包中的信号传输,并且尤其是涉及音频信号的发送,尽管它也适用于其它的信号如视频信号等,并且本发明尤其是涉及数字编码音频信号的传输,其中在这样的音频信号中,有关该音频信号的连续帧的信息是以所发送信号的连续的、离散的包形式发送的,该信号随后被一个接收器使用来复制原始信号(为了便于讨论,这里假定在音频帧与传输包之间是一对一对应的,但这不是必须的)。本发明致力于解决当传输的信息丢失或毁坏时所出现的问题,以致于其中一个或多个包对该接收器来说是不可用的。在很多的发送系统中都有可能存在这种情况的丢失,例如由于噪声或(在无线系统中的)衰减。在很多类型的系统中,如因特网这样的无线服务-可以在不同的路径上发送不同的包,因此就可能存在不同的延迟,这种延迟很大以致会导致包到达的顺序与它们被发送的顺序有很大的不同。常规地,可以通过提供给该接收器一个引入了延迟的缓冲器来解决:该接收器把所接收的包存储在该缓冲器中,并且如果这些包在发送器已经进行了编号,那么接收器就可以按照原始的顺序将这些包从缓冲器中读出,对于很多应用来说,如果整个延迟不是太多的话,来自该缓冲器的延迟可以被保持得合理地短,并且在超出该缓冲器延迟周期时一个包也要进行延迟的可能性一直存在。在这种情况下,由于该接收器不能使用这个包,于是就把该包合理地丢失。还有人提出(如见J.Bolot和A.Garcia的‘ControlMechanisms for Packet Audio in the Inernet’(在因特网中音频包的控制机制),proceedings of IEEEINFOCOM’96,Conference on ComputerCommunications,March 1996,pp232-9以及V.Hardman,M.Sasse,M.Handly和A.Watson的‘Reliable Audio for use over the Internet’(用在因特网上的可靠的音频),Poceedings of INET’95,June 1995,pp-27-30)一种在信号中提供冗余度的方法,其中每个包不仅携带有关该音频信号一个帧的数据,也携带有关该音频信号的前一个帧的数据,并使用一个低位(bit)率编码算法进行编码,以便如果一个单一帧丢失了,可以解码来自下一个帧的冗余数据以便填充否则可能在解码的音频信号中发生的缺陷。但是这种处理非常复杂,而且由于不连续的译码器操作可能会产生困难,导致失真。
按照本发明的一个方面,提供了一种传输信号的设备,包括:(a)编码器,用于产生提供第一数据的第一输出以及提供第二增强数据的第二输出,利用该第一数据译码器可以产生可重建的信号,由此接收第一与第二数据的译码器可以产生更高质量的重建信号;以及(b)运行以组装用于传输的数据包的装置,每个包包括:
主要数据,包含有关该信号的时间(temporal)部分的第一数据以及有关该信号的同一部分的第二数据;以及
次要数据,包含有关该信号的不同的时间部分的第一数据,但缺少有关该部分的第二数据。
所述的不同的时间部分可以是迟于由该主要数据所代表的一部分,例如紧随着由该主要数据代表的部分的部分,或者也可以是早于由该主要数据所代表的部分。最好该组装装置被布置成在每个包中都包含有一个序列码以便指示包含在数据包中的主要数据的时间序列。在一个优选配置中,该编码器运行产生多个提供增强数据、代表对重建信号质量连续改进的增强数据集的输出,该主要数据包含这样的输出,而次要数据包含有关信号多个类似的不同时间部分的第一数据以及有关这些部分的逐渐增多的更少量的第二数据集。
这些信号可以音频信号,编码器是音频信号编码器,例如子带编码器,其中第一数据包含有关低频编码器子带的数据以及第二拉强数据包括有关更高频率子带的数据。
不管是否使用子带编码器,第一数据可包含代表数字值的二进制,而第二数据包含代表所述数字值的更优分辨率的附加位。
适用于本传输设备(尽管还有其它的应用)的一个特定优选的子带编码器包括:
(a)滤波器装置,接收采样的音频信号并把该信号分成多个子带信号,每个子带信号对应各自的频率子带;
(b)用于量化该子带信号的量化器;
(c)位分配装置,用于根据信号的特性,有适应性的确定由该量化器使用的量化级别数(number);
其中,该量化器具有用于提供所述的第一数据的第一输出,所述的第一数据包括用于一个或多个所述子带的量化值,以及具有用于提供所述的第二数据的第二输出,对于相对于其在该第一输出中提供了量化值的至少一个子带,该第二输出包括代表针对该一个子带或一些子带的低粗糙(coarse)量化值的增强位,以及该位分配装置用于执行第一分配操作,在该操作中,用于第一输出的第一预定限额位被在这些子带之间进行分配,随后是第二分配操作,在第二分配操作中,用于第二输出处的额外位的第二预定限额位被在这些子带之间进行分配。
如果需要的话,该第二输出也可以为至少一个子带(在该第一输出处没有提供与该子带相关的量化值)提供量化值。在一个优选实施例中,该量化器至少还具有另外一个输出,该第二输出与该另外一个输出为没有在任何低次(order)输出中表现的这些子带提供值,和/或为没有在低次输出中表现的子带提供附加位,该位分配装置可以执行与输出数量相等数量的多个分配操作,每个操作用于为该输出分配一个各自的限额位给这些子带。
在本发明的另一方面,提供了一种用于接收信号的设备,包括:
(a)用于接收数据包的装置,每个包包含:
主要数据,包含有关该信号的时间部分的第一数据以及有关该信号的同一部分的第二增强数据;以及
次要数据,包含有关该信号的不同的时间部分的第一数据;
(b)用于存储所接收的数据包的缓冲器;
(c)译码器,单独利用该第一数据产生一个可重建的信号,并且能同时利用第一与第二数据产生高质量的重建信号;
(d)控制装置,运行从该缓冲器中读取有关该信号的连续时间部分的主要数据,并把它们转发给译码器;以及当该缓冲器中没有有关语音的时间部分的主要数据时,读取有关该时间部分的第二数据并将它转发给该译码器。
最好,当该缓冲器中没有有关语音的时间部分的第二数据时,读取有关该语音信号的不同时间部分的第二增强数据,并将其转发给译码器。
如果每个包都包含一个序列码以指示包含在其中的该主要数据的时间序列,则该控制装置可以被配置成通过参考该序列码确定这些包的时间序列,而不必管这些包的实际接收顺序。
下面参照附图通过举例的形式详细地描述本发明的实施例,其中,
图1是在本发明的第一实施例中使用的子带语音编码器的方框图;
图2是与图1的编码器一起使用的子带语音译码器的方框图;
图3是按照本发明第一实施例的一个发送器的方框图;
图4是与图3的发送器一起使用的一个接收器的方框图;
图5是在本发明的第二实施例中使用的子带语音编码器的方框图;
图6是与图5的编码器一起使用的子带语音译码器的方框图;
图7是按照本发明第二实施例的发送器的方框图。
图1示出了用于本发明第1实施例的简单子带语音编码器。在输入端1接收了数字样本序列形式的输入音频信号,一般地可以使用16kHz的采样率,每样本16位,它被滤波器组2分成32个子带,每个带宽是250Hz,因此,最低子带的频率范围是0-250Hz,而最高的频率范围是7.75-8Hz。每个子带随后以3-500Hz的采样率进行子采样。
子带编码的合理性是不同子带对所解码的音频信号的整个质量的相对重要性是不同的,以及可通过为每个子带分配与其感觉有效位调整(perceptual significance justifies)一样多的每样本位数来达到压缩。在本编码器中,给每个子带的分配是固定的,以便例如最低的子带总是被每样本分配8位,而第15个子带总是被每样本分配4位。这样固定的分配是基于该语音信号的已知特性,在方框4的框图中说明了位分配,但是实际上,它仅是包含了从这些样本中丢弃相应数量的较低的几位。如目前所描述的,这种配置完全是常规的,要注意,该编码器是作为一个语音编码器介绍的,因为语音特定的固定的位分配;如后面所知的,可以使用更精密的、适应性位分配策略以获得改进的语音压缩,以及其它类型的语音信号。而且,由于该编码器简单,它本身并不要求一个帧结构;但是,假定1152样本的引入语音帧,其16kHz采样率意味着72秒的周期。
由位分配4输出的样本被分组成两个流,第一个包含来自较低16个子带B0...B15的样本,而第二包含来自较高16个子带B16....B31的样本。很明显,在每个流中每帧的实际位取决于所分配的实际位数。
图2示出一种相应的译码器(常规结构),其中子带B0...B31被以5(back)-16kHz进行上采样并反馈给一个滤波器组6,而其输出在加法器7中进行相加。
如果把两个流反馈给该译码器,则可以恢复0-8kHz带宽的语音信号。很明显,第二个流包含仅关于位于4-8kHz频率范围内信号部分的信息。因此,如果第二流被丢失的话,仅利用第一流被解码产生一个有用的语音信号,虽然频带被限于0-4kHz。因此,该编码器可以认为是分层的,在于它接收一个输入音频信号并具有一个传送该信号的编码版本的第一输出以及携带增强信息的第二输出,该第二输出可以与第一输出一起被解码以产生高质量的解码的信号。在本说明中,单独的第一个流被称作第一层,而两个流一起被称作第二层。
图3给出一种用于传输语音信号的设备。输入10接收模拟语音信号,该信号通过一个模-数转换器(ADC)11在来自时钟发生器12的16kHz时钟脉冲φs的控制下以16kHz的采样率被转换成数字形式,并被馈送到上面参照图1描述的子带编码器13。该子带编码器13具有两个分别用于携带编码位的第一个流(‘流1’)和第二个流(‘流2’)的输出,它们被延迟14和15延迟了一个帧周期(72ms),并在来自‘÷1152’电路17的13.89Hz的帧脉冲φF控制下被每隔72ms装载进一个并行输入、串行输出的移位寄存器16,以便组装用于传输的包。同时,用于随后帧的流1位从该编码器13传导但不通过延迟15并且也装载进该寄存器16。这意味着每个传输的包被也包含该流1的复制信息的包(当然第一个包除外)领先。如果需要的话,通过再排列这些延迟,这些复制信息也可以在随后的包中携带,或者实际上在与有疑问的包空间上间隔开二个或更多包的较早或稍后的包中携带。一个帧计数器18周期性从0-255进行计数,它以φF为时钟,以产生一个也要装载进该移位寄存器的帧号fn。该移位寄存器的内容可以任意希望的速率在行时钟(lineclock)φL控制下被时钟读出到输出端19。很明显,该时钟速率足够高以便存储在该寄存器中的整个包可以在72ms或更少时间内(当然没有上限)被时钟读出。在实际中,所传输的包必须包含一个成帧的码以及可能需要包含寻址信息,但这些是传统技术所要求的。帧n的第一与第二流在下面分别被称作S1(n)和S2(n)。
图4给出一个用于接收来自图3的发送器的传输的接收器,在此所接收的包被输入(在通过图中未示出的装置恢复行时钟和成帧信息后)一个串行输入、并行输出的移位寄存器30。为了适应在传输延迟中各种变化,所接收的流被存储在具有‘外附(build-out)’延迟的循环缓冲器31中,写控制单元32接收该寄存器30的内容并把这些包写进缓冲器31中。这些包在缓冲器中按照由序列号所确定的顺序排列。如果所希望的包没有接收到,则留下一个间隙,以便如果它在稍后到达且仍在该外附周期内则将其插进正确的序列。
数据从该缓冲器中的读出是借助于与发送器处的帧计数器18相类似的帧计数器33来执行的,通过本地时钟34每隔72ms增加一次。由于在一个接收周期开始时是用所接收的帧号fn减6(或其它的附加值),它落后于该输入帧一个外附周期(一般地从1-10个帧,如根据该连接特性以及延迟所允许的程度可以是6)。如果由于在72ms时钟与该发送器时钟φF之间的漂移发生了缓冲器的溢出与下溢,则通过重新装载计数器而复位系统。正常情况下,一个读出控制单元35访问计数器33以获得当前的计数值fnr并从缓冲器中读出来自具有该帧号的包的S1(n)和S2(n)数据,并将其传递给上面参照图2描述的语音译码器36。如果没有包丢失,并且相对于先前发送的包没有包延迟超过6×72=432ms时,就可以确保给译码器363的连续的数据供应。
如果存在丢失或有过度的延迟发生时,则具有等于计数器内容fnr的帧号fn的希望的包不会出现在该缓冲器中。在这种情况下,读出控制单元34从该缓冲器中读出来自具有帧号(fnr-l)的包的S1(n)数据,也就是说,对于在紧靠前的包中携带的帧fnr的复制的流1信息,并将它转发给译码器。以这种方式该译码器连续地正常运行,除非它针对该帧没有接收到任何的流2数据,以便对于一个帧周期有一个暂时的带宽降低,该读取控制单元35通过一个连接37向译码器36发送信号通知这样一个事实,并且该译码器禁止较高的16个子带。
在一个修改的版本中,这种降低可通过重复针对流2的先前的帧数据而得到缓解-也就是说,该读出控制单元从包(fnr-l)中读出S1(n)和S2(n)。
需要注意的是,没有必要让编码器13是一个子带编码器或者它的第二流代表比第一流更高频率成分的信息。原则上可以使用任何其它的分层的编码器,例如PCM(脉冲码调制)编码器,其中第一流由粗糙量化的样本组成,而第二流由同一样本的附加的、较低位组成,这样理所当然地会降低由一个译码器在仅接收第一个流时所产生的量化噪声级。但是应注意到,这种由前一个帧替代所缺少的上一个流的可能性仅当前一个帧数据与所丢失的第二个流数据具有足够的相关性才有可能;这种情形是对于上面描述的子带系统而不会出现在PCM示例中。
可以观察到,尽管用于一个某一帧的复制流1是在携带有关该帧的全部信息的包之前的包中所携带的,但这不是必须的,例如它可以在下一个中携带;也就是说,包n可以携带S1(n),S2(n),S1(n-1)。这意味着对于同样的性能,该接收器外附延迟应大于先前的一个,这会在接收器端增加信号延迟72ms,但是另一方面会在发送器端减少信号延迟72ms。而且,针对某一帧的复制流1并不是必须地在一个与携带针对该帧的完整信息的包是连续的包中携带的。可以选择该延迟偏移以便适应某一传输信道或网络的特性;例如在易于突发错误的广播系统中延迟一个或更多的帧可能是比较合适的。
图5示出一种比图1中所示的更复杂的子带编码器,这是基于且类似于在移动图像专家组(MPEG)标准ISO 13813-3中定义的编码器,现在只详细描述与该标准不同的该编码器的某些方面,该MPEG标准只是针对在多个不同输入音频采样速率下的操作;下列描述假定采用16kbps的采样率,当然在需要时可以调整到其它的采样率,一个多相分析滤波器40接收1152个输入样本的帧,产生36个样本中的32个子带的分析帧,这些样本由使用可变调整因子的量化器41进行量化,这些因子由调整因子计算42进行控制,这些调整因子按照在MPEG标准中描述的进行计算,并以同样的方式进行编码,尽管为了简便,我们更喜欢以恒定的每个子带12位(对每个帧)对这些调整因子进行编码,而不是使用由该标准规定的可变长度调整因子表述。(如果使用固定的长度,则由在图5中框42到45的连接就不是必须的)。
利用一个适应的位分配程序按照为每个帧确定的位分配量化这些样本,以使用同时屏蔽(masking)现象以便最小化样本量化的可听影响。当在某些频率附近由同时激发(occur)更强成分使得低级信号成分变得不可听时就会发生同时屏蔽。单元43对信号使用快速傅里叶变换(FFT),并把结果提供给屏蔽单元44,在此使用心里声学模型估计每个音频帧的屏蔽特性(如在MPEG标准中所描述的),并针对第k个子带用一个屏蔽函数mask(k)进行表示(k=0,......,31)。该屏蔽函数对下面的子带k给出信号级别的估计,其中信号变得不可听或其上面的噪声是不可听的,它用于对32个子带中的每一个子带确定信号-屏蔽比smr。
Smr(k)=sig(k)-mask(k)
其中sig(k)是在子带k中的信号能量,所有这些量化用dB表示。
实际的位分配是由一个从屏蔽单元44接收smr(k)值的位分配单元45执行的,它是通过迭代过程来进行分配的,在该过程中有步骤地分配可用的位容量,把进一步的容量分配给具有是最低屏蔽-噪声比mnr的任何一个子带(这是根据给它的位容量分配)。除了可把这些位表示为多个分配位外,该标准以及图5中的设备使用一个整数位分配码,这些分配码可由一个相应的位分配表进行翻译;分配进一步的容量包括简单地增加该码。
可以通过简单地用6dB乘以所分配的位数或使用一个相应的查找表以合理的精度估计信噪比smr(k)(这是位分配计算所必须的),可替换地,信噪比也可以考虑在子带k中的实际信号以及用于表述它所分配的位数进行计算。
在该标准中,每个帧仅需要执行一次位分配。但在图5的编码器中,较高的流除了服务于没有在较低的流中出现的其它子带外,还可以为已经表表述过的子带携带其它的位。因此,该位分配程序必须以现在要描述的方式被执行4次(对于这种4个流的例子),以便对于流1,该第一个子带可以被量化成20级(举例),因此,流1可以为该子带携带4.3个位,但是为下一层量化成80级,以便流2可以为该子带携带两个其他位。也应注意到,该程序的结果是一个代码集,其中每一个按照包含在位分配单元45内的查找表(其内容见下面表1)为每个子流定义样本量化,随后由任何一个流携带的实际位数是针对该流表示的位数与针对下面的流表示的位数之差。
位分配码AllocCodej(k) 0  1  2  3  4  5  6  7
量化级别Qlevelj(k) 0  5  10  20  40  80  160  320
位/样本Bitsj(k) 0  2.3  3.3  4.3  5.3  6.3  7.3  8.3
位(差动)B -  2.3  1  1  1  1  1  1
表1
需要定义下列变量:
K          子带的数量(在本例中是32个);
BitTotj   对于层j(对于流j以及任何较低的流,结合在一起)可用的位数(在表2中给出了本例中的值);
BitsAvailable可分配给当前流的当前可用位数;
SFLen        调整因子的长度(以位表示)(在本例中是12);
AllocBNumj(k) 对于子带k在流j中使用的位分配码
             的长度(以位表示);
AllocMaxj(k)(=2j AllocBNum(k)-1)在子带K中用于流j的最大允许分
             配码值;
AllocLimj   在子带K、层j中使用的最大的子带数量;
AllocCode(k)对于一个层的子带k的当前分配码值;
AllocCodej(k)对于子带k、层j的分配码结果;
Qlevelj(k)  用于子带k、流j的量化级别数;
Bitsj(k)    为编码Qlevelj(k)级所要求的位数。
 层1  层2  层3  层4
 位-率  8  16  32  64
 位/帧  576  1152  2304  4608
 子带号AllocLimj  5  10  20  30
 位分配码长(位)AllocBNumj(k)  2,2,2,2,2,0,…0  3,3,3,3,2,2,2,2,2,2,0,…0  3,3,3,3,3,3,3,3,3,3,2,2,2,2,2,2,2,2,2,2,0,…0  3,3,3,3,3,3,3,3,3,3,3,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,0,0
位分配码大小(级)AllocMaxj(k)  3,3,3,3,3,0,…0  7,7,7,7,3,3,3,3,3,3,0,…0  7,7,7,7,7,7,7,7,7,7,3,3,3,3,3,3,3,3,3,3,0,…0  7,7,7,7,7,7,7,7,7,7,7,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,0,0
 带宽(kHz)  1.25  2.5  5  7.5
表2
其过程如下,以标准中所规定的方式对所有的k(k=0..k-1)计算smr(k)。
1.对所有的k,设置AllocCode(k)和snr(k)等于0;
2.对所有的k初始化mnr(k)=snr(k)-smr(k);
3.设j=1;
4.如果j=1那么设置 BitsAvailable = BitTo t j - Σ k = 0 k - 1 AllocBNu m j ( k ) 否则设置 BitsAvailable = BitTo t j - BitTo t j - 1 - Σ k = 0 k - 1 AllocBNu m j ( k ) (即可用的容量减少了传输位分配码本身所需的额外开销);
5.对所有的k初始化FullFlag(k),以便如果AllocCode(k)<AllocMaxj(k),则FullFlag(k)=0,否则FullFlag(k)=1,设置FullFlag(k)=0将允许对当前流j把位分配给子带k,而FullFlag(k)=1则禁止这种分配;
6.如果对所有k,FullFlag(k)=1,则进到步骤19;
7.标识对应最小mnr值的K值km(即,以便mnr(km)≤mnr(k)),k≠km(注意忽略FullFlag(k)=1时的k的值);
8.在表1中查找对应所提出的分配码(AllocCode(km))增加的位数B;
9.设置BitsRemaining=BitsAvailable-B*36
10.如果AllocCode(km)=0则设置
BitsRemaining=BitsReamining-SFLen(为该子带进行分配的第一次,必须考虑到这样一个事实,即量化器调整因子需要被传输)。
11.如果BitsRemaining<0那么设置FullFlag(km)=1并且进到步骤7,否则继续进行(如果没有足够的位来增加给子带km的分配,则FullFlag(km)被设置成进一步防止分配给该子带)。
12.AllocCode(km)加1
13.设置BitsAvailable=BitsRemaining
14.确定新的snr(km)(通过测量或估计);
15.利用mnr(km)=snr(km)-smr(km)为新的分配计算mnr(km);
16.如果AllocCode(km)=AllocMaxj(km),则设置FullFlag(km)=1以防止进一步的分配。
17.进到步骤7;
18.为所有的k设置AllocCodej(k)=AllocCode(k)(这是针对流j的位分配设置);
19.为下一个流增加j,并重复步骤5直到处理完所有的流,特别要注意的是AllocCode(k)不被复位。
由量化器41对该子带样本进行量化,把需要的位数输出进每个流中。因此,针对流1,它就会为第k个子带产生Bitsj(k),而更高的流产生Bitsj(k)-Bitsj-1(k)位/样本。这些位被编码并由单元46与调整因子和位分配码一起进行多路复用。在此,如针对流1,使用了非整数的位/样本数,该量化器很自然地输出一个整数数量的位/帧。对于分配码1(5级),它输出代表在0-4范围内的数的qcod5(3位);对于分配码2(10级),它输出qcod5加上附加的位qbit10,同时对于分配码3(20级),它输出这些并再加一个另外位qbit20等。对于一个帧的这36个值qcod5(n)(n=0…35)被组合在3组中以给出12个值:
grp5(i)=qcod5(3*i)+5*qcod5(3*i+1)+25*qcod5(3*i+2)
其中(i=0...11)并且操作符*表示乘法。
这些值的范围是0-124并且利用7位进行编码。
4层的样本量化过程通过使用第4层的位分配码以定义量化分辨率开始,所得的量化样码随后被按照4位分配码序列进行编码。首先,比较第4层与第3层的分配码,如果第3层的分配是0,则使用上面描述的5级分组加n位增强机制对整个第4层流编码所量化的样本;如果第3层分配不是0,则在分配码中的差异用于确定为第4层流要被编码的增强位数。对第3层与第2层重复进行该过程以产生相应的编码流。对于第1层,一个非零的分配以一个5级分组编码开始。
该过程产生4个独立的量化流集合,这些可以在编码器中累积(build up)以产生4个所要求编码的样本序列,其中每个编码的样本序列解码以给出一个特定的标准样本层。
多路复用器46利用该位分配、调整因子和量化的样本参数建立4个输出流,所得到的子流分配示于表3中,其中针对调整因子的数据(figure)是基于这些位被分配给所有可用的子带的假设。如果该子带样本量化不能使用所有的被分配的位,则多路复用器利用0位值进行包装。
    子流
    1     2     3     4
位分配(位/帧)     10     24     50     71
调整因子(位/帧)     60     60     120     120
子带样本(位/帧)     506     492     982     2113
全部位/帧     576     576     1152     2304
位速率(kbps)     8     8     16     16
表3
单元46为每一层编码一个位分配码集,流1包含针对标准0-4的所有层1位分配码,而流2包含针对子带0-9的层2位分配码。在为流1与2解码层2时,没有使用层1的位分配码,这可以认为是10位/帧的额外开销(overhead)(见图9)。类似地,用于层1、2和3整个84位/帧的位分配对于层4解码来说也是一个额外开销。位分配的流内差分编码可用于降低层2、3和4的额外开销,并因此也允许为层4子带样本编码施加额外的1或2位/帧。
与图5的编码器一起使用的译码器示于图6中。一个注册器50从图5的编码器接收(在传输或记录后)流1。如果这些是可用的话,它也有用于接收流2、3、4的输入;连同指示有多少个流被实际上接收的层码。这些层码通过开关51选择合适的位分配码集以及,按照由所选择集的对应位分配码指示的量化级别数,针对每一个子带控制样本量化器52的运行。
由去量化器52输出的样本随后通过一个以常规方式运行的合成滤波器53。
图7给出一个发送器,它在很多方面类似于图3,但使用图5的编码器,如在60处所示接收数字音频输入信号。从编码器输出的4个输出流S1、S2、S3、S4分别每帧具有576、576、1152、2304位,它们被延迟61、62、63在三个72ms阶段进行了延迟。来自延迟63的输出的所有4个流在一个多路复用器64中进行组合以产生一个要被装载进与图3中的移位寄存器16相类似的移位寄存器65的4608-位/帧层4信号Enc4(n)。来自延迟62的输出的流S1-S3在一个多路复用器66中进行组合以产生一个要被装载进移位寄存器65的2304-位层3信号Enc3(n+1);注意索引n+1,由于有一个较少的延迟,因此该数据保留到随后的帧,类似地,来自延迟61的流S1、S2在66处进行组合以给出1152位中的Enc2(n+2),未延迟的流S1产生576位中的Enc1(n+3)。所有这些连同上面描述的八位帧数fn在寄存器65中组装(整个是4608+2304+1152+576+8=8648位,加上任何期望的监视信息),并按照先前描述的以行速率时钟读出。为了进一步参考,在移位寄存器中组装的包的字段标记为F0-F4。虽然这些配置随着以专用的不连续的硬件建立而表示出来,它们当然也可以由一个或多个合适的被编程的数字信号处理设备来实现。
相应的接收器与在图4中表示的接收器具有相同的结构,并以与前面描述相同的方式运行,除了寄存器30中的内容现在对应于图7中的寄存器50的内容之外,并且读出控制单元34的操作更复杂。正常情况下,读出控制单元34从缓冲器31读取来自携带该帧数fnr的包的Enc4(n)数据。在缓冲器中没有帧fnr的情况下,读出控制单元34从该缓冲器中读取来自具有帧数(fnr-1)的包的Enc3(n)数据。但是如果该包也丢失,它就从该缓冲器中读取来自具有帧数(fnr-2)的包的Enc2(n)数据,对于连续的音频帧同时丢失三个包的情况,它就从具有帧数(fnr-3)的包中读取Enc1(n)数据。这在从前会导致由译码器35输出的信号的带宽的降低,它可以通过由前面的音频替代一个流而得到减轻,也就是:
对于帧丢失的包     读 来自字段 来自携带帧数的包
 Enc4(n)  F4  fnr
Fnr  Enc3(n)Enc4(n-1)*的S4  F3F4  fnr-1fnr-1
fnr和fnr-1  Enc2(n)Enc3(n-1)*的S3Enc4(n-2)*的S4  F2F3F4  fnr-2fnr-2fnr-2
fnr和fnr-1和fnr-2  Enc1(n)Enc2(n-1)*的S2Enc3(n-2)*的S3Enc4(n-3)*的S4  F1F2F3F4  fnr-3fnr-3fnr-3fnr-3
注意,与较低的流相比,较高的流S2,S3,S4每一个都包含:(a)关于另外子带的信息,和(b)用于减少子带中量化错误的附加位,对于该子带数据已经存在于该较低的流中。用于关于较早帧(在上表中标记‘*’的)的数据进行替代仅适用于(a),附加位(b)没有用,因为它们的值与所丢失的数据几乎没有相关性。如图6中所示的译码器将进行这样的替代,并且在工作时仅引入较小量的附加噪声。为了避免它,也可以安排成:当针对一个或更多的上一个流替代先前的音频帧信息时,该读出控制单元35可以发信号通知这样的事实给译码器,这时选择器51也要进行修改以便,对于仅由替代流携带的子带,它从流4中获取位分配信息,但是对于信息包含在非替代流内的子带来说,它从更高的非替代流中获取该位分配信息。

Claims (16)

1.一种用于传输信号的设备,包括:
(a).编码器,运行产生提供第一数据的第一输出以及提供第二增强数据的第二输出,利用第一数据一个译码器可以产生重建的信号,由此接收第一数据和第二数据的译码器可以产生高质量的重建信号;以及
(b).运行组装用于传输的数据包的装置,每个数据包包含:
主要数据,包含有关该信号的时间部分的第一数据以及有关该信号的同一部分的第二数据;以及
次要数据,包含有关该信号的不同的时间部分的第一数据,但缺少有关该部分的第二数据。
2.如权利要求1所述的设备,其中所述的不同的时间部分是指迟于由该主要数据表示的部分的部分。
3.如权利要求2所述的设备,其中所述的不同的时间部分是指直接跟随由该主要数据表示的部分的部分。
4.如权利要求1所述的设备,其中所述的不同的时间部分是指早于由该主要数据表示的部分的部分。
5.如前述任一权利要求所述的设备,其中该组装装置被布置成在每一个包中包含一个序列码以指示包含在该包中的主要数据的时间序列。
6.如前述任一权利要求所述的设备,其中该编码器运行产生能提供增强数据、代表对重建信号质量有连续改进的连续增强数据集的多个输出,并且其中该主要数据包括所有这样的输出和次要数据包括有关该信号的多个类似不同时间部分的第一数据以及有关这些部分的逐渐增多的更少数的第二数据集。
7.如前述任一权利要求所述的设备,其中该信号是音频信号并且该编码器是音频信号编码器。
8.如权利要求7所述的设备,其中该编码器是一个子带编码器,其中该第一数据包含有关该编码器子带中低频部分的数据,以及第二增强数据包含有关高频子带的数据。
9.如前述任一权利要求所述的设备,其中第一数据包含数字值的二进制表述,第二数据包含代表所述数字值的出色分辨率的附加数据。
10.如权利要求8所述的设备,其中该子带音频编码器包括:
(a).滤波器装置,用于接收采样的音频信号并且把该信号分成多个子带信号,每个对应各自的频率子带;
(b).用于量化所述的子带信号的量化器;
(c).位分配装置,用于适应性根据信号特性确定由该量化器使用的量化级别数;
以及其中该量化器具有用于提供所述第一数据的第一输出以及用于提供所述第二数据的第二输出,所述的第一数据包括用于所述的一个或多个子带的量化值,对于相对于其在该第一输出处提供量化值的至少一个子带,所述的第二数据包括代表针对该子带的较粗糙的量化值的附加增强数据,以及其中该位分配装置执行第一分配操作,在该第一操作中把用于第一输出的预定限额的位在这些子带之间进行分配,随后执行第二分配操作,在该第二操作中,把用于第二输出处的附加位的第二预定限额的位在这些子带之间进行分配。
11.按照权利要求10所述的编码器,其中该第二输出为相对于其在该第一输出处没有提供量化值的至少一个子带提供量化值。
12.按照权利要求10或11所述的编码器,其中该量化器具有至少另外一个输出,其中该第二与另外一个输出在各种情形下为这些子带提供在任何低次输出中没有表示的值,和/或为这些子带提供在低次输出中表示的附加位,以及其中该该位分配装置执行与输出数量相等数量的分配操作,每个操作用于为其输出在这些子带间分配各自的限额位。
13、一种用于接收信号的设备,包括:
(a).用于接收数据包的装置,每个数据包包括:
主要数据,包含有关该信号的时间部分的第一数据以及有关该信号的同一部分的第二增强数据;以及
次要数据,包含有关该信号的不同的时间部分的第一数据;
(b).用于存储的接收的数据包的缓冲器;
(c).能利用单独的第一数据产生重建信号、并且能利用第一数据与第二数据一起产生高质量的重建信号的译码器;
(d).控制装置,其运行从该缓冲器中读取有关该信号的连续时间部分的主要数据并将它们转发给该译码器;以及在该缓冲器中没有有关该语音的时间部分的主要数据时读取有关该时间部分的第二数据并将其转发给该译码器。
14.按照权利要求13所述的设备,其中当在该缓冲器中没有有关该语音的时间部分的第二数据时该控制装置运行读取有关该语音信号的不同时间部分的第二增强数据并将其转发给该译码器。
15.按照权利要求13或14所述的设备,其中每个包包含一个序列码以指示包含在其中的主要数据的时间序列,并且该控制装置运行以参照该序列码确定这些包的时间序列,而不必管包的实际接收顺序。
16、按照权利要求13-15中任一个所述的设备,其中该信号是音频信号并且该译码器是音频信号译码器。
CNB998112275A 1998-09-22 1999-09-14 用于发送和接收信号的装置 Expired - Lifetime CN1144411C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB9820655.0 1998-09-22
GBGB9820655.0A GB9820655D0 (en) 1998-09-22 1998-09-22 Packet transmission

Publications (2)

Publication Number Publication Date
CN1319292A true CN1319292A (zh) 2001-10-24
CN1144411C CN1144411C (zh) 2004-03-31

Family

ID=10839284

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB998112275A Expired - Lifetime CN1144411C (zh) 1998-09-22 1999-09-14 用于发送和接收信号的装置

Country Status (12)

Country Link
US (1) US6957182B1 (zh)
EP (1) EP1116354B1 (zh)
JP (1) JP4447782B2 (zh)
CN (1) CN1144411C (zh)
AT (1) ATE311703T1 (zh)
AU (1) AU751077B2 (zh)
CA (1) CA2344259C (zh)
DE (1) DE69928682T2 (zh)
ES (1) ES2253912T3 (zh)
GB (1) GB9820655D0 (zh)
HK (1) HK1040336B (zh)
WO (1) WO2000018057A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6757654B1 (en) * 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
JP4016709B2 (ja) 2002-04-26 2007-12-05 日本電気株式会社 オーディオデータの符号変換伝送方法と符号変換受信方法及び装置とシステムならびにプログラム
US20040064308A1 (en) * 2002-09-30 2004-04-01 Intel Corporation Method and apparatus for speech packet loss recovery
JP4456601B2 (ja) 2004-06-02 2010-04-28 パナソニック株式会社 音声データ受信装置および音声データ受信方法
US7706415B2 (en) * 2004-07-29 2010-04-27 Microsoft Corporation Packet multiplexing multi-channel audio
WO2006067988A1 (ja) * 2004-12-22 2006-06-29 Matsushita Electric Industrial Co., Ltd. Mpegオーディオデコード方法
US8069035B2 (en) * 2005-10-14 2011-11-29 Panasonic Corporation Scalable encoding apparatus, scalable decoding apparatus, and methods of them
WO2009010674A1 (fr) * 2007-07-06 2009-01-22 France Telecom Codage hierarchique de signaux audionumeriques
DE102010005702A1 (de) * 2010-01-26 2011-07-28 Fachhochschule Kaiserslautern, 67657 Codieren und Decodieren von Daten zur Übertragung über einen fehlerhaften Übertragungskanal

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2681727B1 (fr) 1991-09-20 1993-11-05 Thomson Tubes Electroniques Tube intensificateur d'image a correction de brillance.
US5384793A (en) * 1992-01-28 1995-01-24 Ericsson Ge Mobile Communications Inc. Fading and random pattern error protection method for dynamic bit allocation sub-band coding
WO1995006368A1 (en) * 1993-08-26 1995-03-02 Ntp Incorporated Information transmission system and method of operation
US5692102A (en) * 1995-10-26 1997-11-25 Motorola, Inc. Method device and system for an efficient noise injection process for low bitrate audio compression
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JP2907104B2 (ja) * 1996-03-27 1999-06-21 日本電気株式会社 時間ダイバーシティ通信方法及び通信装置
JP3622365B2 (ja) * 1996-09-26 2005-02-23 ヤマハ株式会社 音声符号化伝送方式
EP0861001B1 (en) * 1997-02-07 2012-05-23 Texas Instruments Incorporated Error resilient video encoding

Also Published As

Publication number Publication date
JP4447782B2 (ja) 2010-04-07
CN1144411C (zh) 2004-03-31
DE69928682D1 (de) 2006-01-05
JP2002525693A (ja) 2002-08-13
AU5874599A (en) 2000-04-10
EP1116354A1 (en) 2001-07-18
HK1040336A1 (en) 2002-05-31
GB9820655D0 (en) 1998-11-18
ES2253912T3 (es) 2006-06-01
ATE311703T1 (de) 2005-12-15
CA2344259C (en) 2011-06-21
CA2344259A1 (en) 2000-03-30
WO2000018057A1 (en) 2000-03-30
US6957182B1 (en) 2005-10-18
AU751077B2 (en) 2002-08-08
DE69928682T2 (de) 2006-07-20
HK1040336B (zh) 2006-08-11
EP1116354B1 (en) 2005-11-30

Similar Documents

Publication Publication Date Title
US6378101B1 (en) Multiple program decoding for digital audio broadcasting and other applications
US6438525B1 (en) Scalable audio coding/decoding method and apparatus
CN1151705C (zh) 多声道低比特率编码解码方法和设备
CN1031090C (zh) 一种数字传送系统
CN1282154C (zh) 比特流信号的数据处理设备和方法
US6357029B1 (en) Joint multiple program error concealment for digital audio broadcasting and other applications
JP4242516B2 (ja) サブバンド符号化方式
CN1153365C (zh) 采用不同编码原理的传送系统
CN1527306A (zh) 使用带宽扩展技术编码和/或解码数字数据的方法和装置
CN1370357A (zh) 在数字音频广播中发送和接收具有优先等级消息的压缩音频帧的方法与装置
JPH11317675A (ja) オ―ディオ情報処理方法
CN1109408C (zh) 移动通信系统中的用于语音传输的方法和设备
CN1116348A (zh) 自适应数字音频编码系统
CN1735928A (zh) 用于可变速率音频编解码的方法
CN1144411C (zh) 用于发送和接收信号的装置
JP4287545B2 (ja) サブバンド符号化方式
CN1029902C (zh) 传输系统以及用于该系统的接收机
KR100783298B1 (ko) 디지털 오디오 방송 및 다른 응용들을 위한 결합 다중프로그램 코딩 방법 및 장치
CN1157853C (zh) 数字信息信号接收装置、发送装置及发送方法
CN1202513C (zh) 音频编码、译码方法和装置及其应用
Naik et al. Joint encoding and decoding methods for digital audio broadcasting of multiple programs

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1066655

Country of ref document: HK

CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20040331