CN1286087C - 音频解码装置和音频解码方法 - Google Patents

音频解码装置和音频解码方法 Download PDF

Info

Publication number
CN1286087C
CN1286087C CNB038014920A CN03801492A CN1286087C CN 1286087 C CN1286087 C CN 1286087C CN B038014920 A CNB038014920 A CN B038014920A CN 03801492 A CN03801492 A CN 03801492A CN 1286087 C CN1286087 C CN 1286087C
Authority
CN
China
Prior art keywords
signal
subband
amplitude
frequency
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CNB038014920A
Other languages
English (en)
Other versions
CN1585972A (zh
Inventor
津岛峰生
田中直也
则松武志
张国成
柯金汉
梁世丰
野村俊之
嶋田修
高见泽雄一郎
芹泽昌宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Panasonic Holdings Corp
Original Assignee
NEC Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=31492144&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN1286087(C) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by NEC Corp, Matsushita Electric Industrial Co Ltd filed Critical NEC Corp
Publication of CN1585972A publication Critical patent/CN1585972A/zh
Application granted granted Critical
Publication of CN1286087C publication Critical patent/CN1286087C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

用少量运算以低比特率对宽频带、高质量音频信号解码。利用实数值操作构造的合成子带滤波器,通过将抑制信号插入到与要注入正弦波的子带相邻近的子带,抑制伴随正弦信号注入的多余频谱分量。这使得能够用少量的运算,注入所期望的正弦波。

Description

音频解码装置和音频解码方法
技术领域
本发明涉及一种音频带宽扩展系统的解码装置和解码方法,其用于通过添加包含少量信息的附加信息从窄带音频信号中产生宽带音频信号,以及涉及到使该系统能够提供具有少量运算的高音频质量的重放技术。
背景技术
众所周知,有许多用于将音频信号编码成较小数据量,然后从编码的比特流再产生音频信号的音频编码技术。尤其是,国际ISO/IEC 13818-7(MPEG-2AAC)标准被认为是一种具有小的编码量的高音频质量重放的高级方法。这种AAC编码方法还被用于最近的ISO/IEC 14496-3(MPEG-4音频)系统中。
像AAC这样的音频编码方法,通过以特定的时间间隔采样时域信号将时域的离散音频信号转换到频域信号,再将转换的频率信息分解成多个频带,然后根据适当的数据分布通过量化每个频带来编码该信号。为了解码,该频率信息从编码流中复原,而且通过将频率信息转换成时域信号而获得重放声音。如果提供编码的信息量较小(例如,低比特率的编码),那么在编码处理过程中分配给每段频带的数据量则减小,从而某些频带可能不包含信息。在这种情况下,该解码处理在不包含信息的频带的频率分量内产生没有声音的重放音频。
通常,因为对于近似10kHz以上的频率的声音的灵敏度比对于较低频率的声音的灵敏度低,如果音频编码方案通过根据人耳的听觉特性来分配信息,则高频分量数据通常下降以至于提供窄带的音频重放。
如果以近似96kbps的比特率提供数据,即使AAC方法也能够将44.1kHz的立体声信号编码到近似16kHz的频带,但是如果数据是利用以这个速率的一半(即,48kbps)提供的数据来编码,那么在保持声音质量的同时,可以量化和编码的频带宽度减少到至多近似10kHz。由于频带窄,所以用较低的48Kbps比特率编码的声音重放声音听起来会模糊不清。
例如,在欧洲无线电通讯标准协会(ETSI)公布的数字无线电广播(Digital Radio Mondiale(DRM)系统规范(ETSI TS 101 980)中,公布了一种通过添加少量附加信息到用于窄带音频重放的编码流而使重放频带加宽的方法。。例如,在AES(美国音频工程学会)会议论文5553、5559、5560(2002年5月10日到13日,德国慕尼黑举行的第112次会议)中描述了类似的被称为SBR(频谱带宽复制)的技术。
图2是使用SBR扩展频带的解码器例子的方框图。由比特流信号分离器201将输入比特流206分离为低频分量信息207、高频分量信息208和正弦波添加信息209。例如,低频分量信息207是利用MPEG-4 AAC或者其它编码方法编码的信息,并且由低频带解码器202解码,从而产生表示低频分量的时域信号。这个表示低频分量的时域信号由分析滤波器组(analysis filter bank)203分成多个(M)子带并且输入到高频信号发生器204。
高频信号发生器204通过复制表示低频分量的低频子带信号到高频子带来补偿由于频带宽度限制而损失的高频分量。输入到高频信号发生器204的高频分量信息208包含为了补偿高频子带的增益信息,以至于为每个生成的高频子带调整增益。
附加信号发生器211产生注入信号212,从而控制增益的正弦波被添加到每个高频子带。然后,由高频信号发生器204产生的高频子带信号与低频子带信号一起输入到合成滤波器组205,以实现频带合成并且产生输出信号210。在合成滤波器组一侧计算的子带不需要与分析滤波器组一侧的子带数目相同。例如,如果在图2中N=2M,输出信号的采样频率将是输入到分析滤波器组的时域信号采样频率的两倍。
在这种结构中,包含在高频分量信息208或者正弦波添加信息209中的信息仅仅与增益控制有关,因此所需的信息数量与其中还包含频谱信息的低频分量信息207相比较非常少。所以,这种方法适合于以低比特率来编码宽带信号。
图2中的合成滤波器组205由对每个子带都采用实数输入和虚数输入并且执行复数运算的滤波器组成。
具有如上所述结构的用于扩展频带的解码器具有执行复值运算的两种滤波器,即分析滤波器组和合成滤波器组,解码需要进行大量的运算。当解码器是由大规模集成电路(LSI)器件构成时,主要问题是功率消耗的增加以及在给定电源容量下重放时间可能减小。因为我们所听到的从合成滤波器组输出的信号是实数信号,所以合成滤波器组可以用实数滤波器组来构成以减少运算量。虽然这减少了运算量,但是如果使用与合成滤波器组执行复值运算时相同的方法添加正弦波,则实际上没有添加纯正弦波而且在再现的音频中也没有获得预期的结果。
发明内容
本发明的目的是要解决已有技术的这些问题,提供通过使用实值运算滤波器组,将频带扩展系统操作用少量运算操作而成时,其通过给将要被添加到复值运算滤波器组中的附加正弦波产生信号以微小变化,从而获得预期的音频重放的解码装置和方法。
本发明提供一种用于由比特流解码音频信号的音频解码装置,该比特流包含有关窄带音频信号的编码信息和用于将该窄带信号扩展为宽带信号的附加信息,而附加信息包含表示比编码信息的频带更高的频带的特征的高频分量信息,和表示添加到特定频带的正弦信号的正弦波添加信息,该音频解码装置包括:
用于由比特流多路分解编码信息和附加信息的比特流多路分解器;
用于从多路分解的编码信息中解码窄带音频信号的解码装置;
用于将窄带音频信号分离成由多个子频带信号组成的第一子带信号的分解子带滤波器;
正弦信号添加装置,其根据来自多路分解的附加信息的正弦波添加信息,添加比所述编码信息频带更高的特定的子带生成正弦信号;
补偿信号发生器,其根据正弦信号的相位特性和振幅特性,产生用于抑制在所述特定子带附近的子带产生的混叠分量信号生成添加在附近子带的补偿信号;
频带扩展器,从第一子带信号和被分离的附加信息的高频分量信息生成比所述编码信息的频带更高的频带的多个子带信号所组成的第二子带信号,将所述正弦信号和所述补偿信号添加到第二子带信号中;和实值运算的合成子带滤波器,其用于合成所述第一子带信号与所述第二子带信号得到宽带音频信号。
因此,能够以低比特率使用少量运算来获得高质量的音频重放。
附图说明
图1是显示根据本发明的音频解码装置的例子的方框图;
图2显示已有技术音频解码装置结构的例子;
图3显示用于描述本发明原理的附加信号发生器的例子;
图4显示本发明第一实施例中附加信号发生器的例子;
图5A与5B,每个显示注入的复值信号的例子;
图6显示由图3中所示附加信号发生器产生的注入信号的例子;
图7仅仅显示由图3中所示附加信号发生器产生的注入信号的实数部分;
图8显示由图4中所示附加信号发生器和补偿信号发生器产生的注入信号和补偿信号的例子;
图9是当正弦波只有实数值部分注入实数值合成滤波器时的频谱图;
图10是当只有正弦波实数值部分和补偿信号注入到实数值合成滤波器时的频谱图;
图11显示图8中举例所示注入信号和补偿信号的另一个例子;
图12显示本发明第二实施例中附加信号发生器的例子;
图13是显示本发明原理的方框图。
具体实施方式
图13是显示本发明原理的方框图。音乐和其它音频信号包含低频分量和高频分量。编码的音频信号信息由低频分量发送而来,而音调信息(正弦信息)和增益信息则由高频分量发送而来。接收器由低频分量解码音频信号,而高频分量则利用音调信息和增益信息复制和加工低频带分量以合成伪音频信号。为了合成这个伪音频信号需要相位信息和幅度信息,而合成则要求进行复值运算。因为复值运算需要进行实数部和虚数部的运算,所以该运算处理复杂而且耗时。为了简化这些运算处理,本发明仅仅使用实数部分操作。然而,如果这些运算在某些子带内仅仅使用实数值部分,则在与该子带相邻的较高和较低子带中将会出现噪声信号。用于消除这些噪声信号的补偿信号是利用包含在音调信息中的相位信息、幅度信息和时间信息来产生的。
根据本发明优选实施方式的音频解码装置和方法将参考附图描述如下。
(实施方式1)
图1是显示根据本发明第一实施方式的、利用频带复制(SBR)来实现带宽扩展的解码装置示意图。
由比特流信号多路分解器101将输入比特流106多路分解为低频分量信息107、高频分量信息108和正弦信号添加信息109。例如,低频分量信息107是利用例如MPEG-4 AAC编码方法编码的信息,由低频解码器102被解码,产生表示低频分量的时域信号。由此产生的表示低频分量的时域信号由分析滤波器组103分成多个(M)子带,并且输入到带宽扩展装置(高频信号发生器)104。高频信号发生器104将表示低频分量的低频子带信号复制到高频子带,以补偿由于频带宽度限制而造成的高频分量损失。输入到高频信号发生器104的高频分量信息108包含将要产生的高频子带的增益信息,而且对于每个产生的高频子带该增益会得到调整。
附加信号发生器111,根据正弦信号添加信息(也称作音调信息)109,产生注入信号112,以使增益控制的正弦波添加到每个高频子带。由高频信号发生器104产生的高频子带信号与低频子带信号一起输入到合成滤波器组105并进行频带合成,产生输出信号110。在合成滤波器组中子带的数量不一定与分析滤波器组一侧的子带数量相匹配。例如,如果在图1中,N=2M,输出信号的采样频率将是输入到分析滤波器组的时域信号采样频率的两倍。
输入比特流106包含对于音频信号(即,低频分量信息107)的窄带编码信息和用于将该窄带信号扩展成宽带信号(即,高频分量信息108和正弦信号添加信息109)的附加信息。
图1中所示解码装置的合成滤波器组105由实值运算滤波器组成。显然,可以使用能够执行实值运算的复值运算滤波器。
图1中所示解码装置还具有产生补偿信号113的补偿信号发生器114,该补偿信号113用于补偿由正弦信号添加而引起的差值。
由比特流信号多路分解器101将输入比特流106多路分解为低频分量信息107、高频分量信息108和正弦信号添加信息109。
低频频分量信息107,例如,是MPEG-4 AAC、MPEG-1音频或者是MPEG-2音频等编码的比特流,它由具备兼容解码功能的低频解码器102解码,并且产生表示低频分量的时域信号。产生的表示低频分量的时域信号由分析滤波器组103分成多个(M)第1子带S1,并且输入到高频信号发生器104。如下所述的分析滤波器组103和合成滤波器组105是由多相位滤波器组或者MDCT转换器构成的。频带分割滤波器组则为该领域中的一种常规技术。
对于来自分析滤波器组103的低频信号分量的第一子带信号S1由高频信号发生器104直接输出,并且还发送到合成部分。高频信号发生器104的高频信号产生部分接收第一子带信号S1,并且利用高频分量信息108、注入信号112和补偿信号113产生多个第二子带信号S2。第二子带信号S2是处在高于第一子带信号S1的频带。高频分量信息108包括指示哪个第一子带信号S1信息将要复制和哪个第二子带信号S2将要产生的信息,以及指示复制的第一子带信号S1应该放大多少的增益控制信息。
如果没有正弦信号添加信息109或者没有利用该正弦信号添加信息109实际产生的信号,具有N个(其中N大于或等于M)子带合成滤波器的合成滤波器组105将从高频信号发生器104输出的扩展频带子带信号和来自分析滤波器组103的低频信号分量结合,产生宽频带的输出信号110。
在本发明的第一实施方式中,合成滤波器组105是实值运算滤波器组。即,合成滤波器组105不使用虚数输入,只有实数输入部分,而且使用执行实值运算的滤波器。因此该合成滤波器组105与利用复值运算的工作滤波器相比简单且工作速度快。
如果存在正弦信号添加信息109,该正弦信号添加信息109输入到附加信号发生器111从而产生注入信号112,并且被添加到来自高频信号发生器104的输出信号。正弦信号添加信息109还输入到补偿信号发生器114从而产生补偿信号113,而且同样地被添加到高频信号发生器104的输出信号。
来自高频信号发生器104的输出信号被输入到合成滤波器组105。合成滤波器组105不管是否存在基于正弦信号添加信息109的添加信号都将输出信号110输出。
将利用图3和图4在下面更进一步详细地描述根据正弦信号添加信息109产生注入信号112和补偿信号113。
图3显示在描述本发明基本原理的音频解码方法中使用的附加信号发生器111,而图4显示本发明第一实施例中的附加信号发生器111和补偿信号发生器114。
首先参考图3描述附加信号发生器111。包含在正弦信号添加信息109中的信息包括表示被注入正弦波的那个合成滤波器组的注入子带编号信息,表示注入的正弦信号起始相位的相位信息,表示注入正弦信号起始时间的时间信息,以及表示注入正弦信号振幅的幅度信息。
注入子带信息提取装置406提取注入的子带编号。如果该相位信息包含在正弦信号添加信息109中,相位信息提取装置402根据相位信息来确定注入正弦信号的起始相位。如果相位信息没有包含在正弦信号添加信息109中,相位信息提取装置402考虑利用先前时间帧的相位连续性来确定注入正弦信号的起始相位。
幅度提取装置403提取幅度信息。时间提取装置404提取,在正弦波注入到合成滤波器组时,表示何时开始正弦波注入与何时结束注入的时间信息。
根据来自相位信息提取装置402、幅度提取装置403、和时间提取装置404的信息,正弦波产生装置405产生要注入的正弦波(音调信号)。应该注意到,产生的正弦波频率可以设置为,例如,子带的中心频率,或者偏离中心频率的一预定频偏的一个频率上。此外,该频率可以根据注入子带的子带编号预先设置。例如,可以根据子带编号的奇偶来产生子带上或下限频率的正弦波。下面假设产生具有子带中心频率的正弦波,即,产生具有四个子带信号取样周期的周期信号。
正弦波注入装置407将由正弦波产生装置405输出的正弦波插入到与注入子带信息提取装置406获得的编号相匹配的合成滤波器子带。正弦波注入装置407的输出信号是注入信号112。
考虑注入到子带K的具有四个周期和振幅S的复值信号如图6中表格所示。表格中用(a、b)表示的数值意指复值的信号a+jb,其中j是虚数单位。参考图5A,图6中插入到子带K的信号是周期信号,由于实部和虚部之间的关系,在图5A中,该周期信号如图501、502、503、504变化。
不同于本发明,如果合成滤波器组是采用复值输入并且执行复值运算的滤波器,那么通过这种注入信号获得的解码系统的输出信号具有单一的频谱并且为注入所谓的纯正弦波。然而,如果合成滤波器组是在本发明中只采用实数值输入而且仅仅执行实数值运算的滤波器,那么不含图6中所示虚数部分的如图7所示的实数信号则被注入到子带K。而对于这个注入信号,由使用只输入实数值的合成滤波器的解码系统所输出的,有如图9所示的单一频谱(注入正弦波的频谱902),以及输出在该正弦波频谱之上和之下频带中的不希望要的频谱(不希望要的频谱903)。这是因为在使用实值运算的合成滤波器中,由于滤波器特性曲线,不能完全地消除渗漏到相邻子带的频谱,这些频谱漏表现为混叠分量。
在使用实值运算只有实值输入的合成滤波器组中,图3中所示的附加信号发生器111再加上如图4所示的补偿信号发生器114,可以消除图9中所示的多余的频谱分量。
接下来参考图4描述根据本发明的附加信号发生器111和补偿信号发生器114。在图4中,正弦信号添加信息401、相位信息提取装置402、幅度提取装置403、时间提取装置404、正弦波产生装置405、注入子带信息提取装置406、正弦波注入装置407,和注入信号408都与参考图3所描述的相同。不同于图3的是增加了补偿子带信息确定装置409和补偿信号发生器410。
补偿子带信息确定装置409根据通过注入子带信息提取装置406获得的信息(表示正弦波要被注入的合成滤波器组的编号)来确定要补偿的子带。要补偿的子带是正弦波要注入的子带附近的子带,可以是高频子带或者低频子带。要补偿的高频子带和低频子带因根据合成滤波器组105的特征而不同,在这里以与注入正弦波的子带相邻的子带为对象。例如,当正弦波注入到子带K时,子带K+1和子带K-1分别是要补偿的高频子带和低频子带。
根据相位信息提取装置402、幅度提取装置403和时间提取装置404的输出,补偿信号发生器410产生消除补偿子带内的混叠频谱的信号,而且输出这个信号作为补偿信号113。该补偿信号113,例如,用与注入信号112同样的方法添加到输入给合成滤波器组105的输入信号。补偿信号113的振幅S和相位,如图8中的表格所示,按子带K-1和子带K+1进行调整。
在图8中,α和β是根据特定合成滤波器组的特性而确定的值,而且尤其是考虑到渗漏到滤波器组中的相邻子带的频谱泄漏量而确定。
如从图8所知,如果正弦信号被添加到子带K,循环周期T的正弦信号的振幅在时间0处是幅度S,在时间1T/4处是幅度0,在时间2T/4处是幅度-S,在时间3T/4处是幅度0。补偿信号被施加到子带K-1和子带K+1。在这些附图中,时间0、1、2和3分别对应于时间0、1T/4、2T/4和3T/4。
施加到子带K-1的补偿信号在时间0处是幅度0、在时间1T/4是幅度α*S、在时间2T/4是幅度0,而在时间3T/4是幅度β*S。
施加到子带K+1的补偿信号在时间0是幅度0、在时间1T/4是幅度β*S、在时间2T/4是幅度0,而在时间3T/4是幅度α*S。
图10是根据本发明优选实施方式注入的正弦波的频谱图。如从图10中所知,图9中观察到的不需要的频谱分量903被抑制。
通过引入补偿信号,即使正弦信号被注入到实数值滤波器组也不会产生多余的频谱分量,而且可以用最少的运算将正弦波注入到期望的子带。
已经参考注入到子带K的正弦信号对本发明进行了描述,其中初始相位是0而且实数值部分或虚数值部分为零0,如图5A所示。然而如5B所示,当相位从图5A所示的状态改变δ时,本发明仍然可以适用。在这种情况下,注入信号与补偿信号之间的关系可以描述为诸如图11中的表格所示,其中S、P、和Q的值考虑到滤波器组的相邻子带的频谱泄漏量,并根据滤波器组的特性来确定。
此外,对于正弦波要注入的子带K,补偿信号注入到相邻的子带K-1与K+1,但是除了K-1与K+1之外的相邻子带可能需要根据合成滤波器的特性来修正。在这种情况下,补偿信号简单地注入到需要修正的子带。
(实施方式2)
图12显示本发明第二实施方式中附加信号发生器的例子。这个附加信号发生器与图4中所示的附加信号发生器111的不同点为,其中由正弦波产生装置405计算的插入信息1201被输入到补偿信号发生器410,然后根据插入信息1201来算出补偿信号113。
上述第一实施例中的正弦波产生装置405仅仅根据幅度提取装置403提取的当前帧幅度信息调整生成正弦波的幅度。然而,第二实施方式的正弦波产生装置405利用来自相邻帧的幅度信息插入(interpolate)该幅度信息,并且根据这个插入的幅度信息调整产生正弦波的幅度。
因为该处理结果使产生的正弦波幅度平滑地变化,所以输出信号的所听到的声音质量可以得到改善。
因为生成的正弦波幅度按照具有这种结构的插入而改变,所以相应的补偿信号的幅度也必须调整。因此,由正弦波产生装置405输出的插入信息也输入到补偿信号发生器410,以便与插入的正弦波幅度变化同步地调整补偿信号113的幅度。
即使在产生的正弦波的幅度被插入时,本发明的这种结构能够正确地计算补偿信号并且抑制多余的频谱分量。
显然,图1所示的音频解码装置的处理方法还可以使用程序设计语言写入软件中。此外,这种软件程序可以通过一种数据记录媒体来记录与分配。
当使用仅仅通过实值的运算减少操作次数的合成滤波器组时,可以抑制伴随正弦波添加而引起的不多余的频谱分量,而且通过注入补偿信号到要添加正弦波的子带的低频或者高频子带,从而实现只注入所期望的正弦波。

Claims (12)

1.一种用于从比特流中解码音频信号的音频解码装置,其中:
所述比特流包含关于窄带音频信号的编码信息和用于将窄带信号扩展为宽带信号的附加信息,
所述附加信息包含表示比编码信息的频带更高的频带的特征的高频分量信息,和表示添加到一特定频带的正弦信号的正弦波添加信息,
所述音频解码装置包括:
用于从比特流中多路分解编码信息和附加信息的比特流多路分解器;
用于从多路分解的编码信息中解码窄带音频信号的解码装置;
用于将窄带音频信号分离成由多个子频带信号组成的第一子带信号的分解子带滤波器;
正弦信号添加装置,其根据来自多路分解的附加信息的正弦波添加信息,生成添加于比所述编码信息频带高的频带的特定子带的正弦信号;
补偿信号发生器,其根据正弦信号的相位特性和振幅特性,生成添加于附近子带的补偿信号,用于抑制在所述特定子带附近的子带内产生的混叠分量信号;
频带扩展器,从第一子带信号和被分离的附加信息的高频分量信息生成由比所述编码信息的频带更高的频带的多个子带信号所组成的第二子带信号,将所述正弦信号和所述补偿信号添加到第二子带信号中;以及
实值运算合成子带滤波器,其用于合成所述第一子带信号与所述第二子带信号以得到宽带音频信号。
2.根据权利要求1所述的音频解码装置,其特征在于所述混叠分量至少包含由执行复值运算的合成子带滤波器合成之后被抑制的分量。
3.根据权利要求1所述的音频解码装置,其特征在于所述第一子带信号是低频子带信号,而所述第二子带信号是高频子带信号。
4.根据权利要求1所述的音频解码装置,其特征在于由所述补偿信号发生器产生的所述补偿信号抑制在与添加正弦信号的子带相邻的子带内产生的混叠分量信号。
5.根据权利要求1所述的音频解码装置,其特征在于由所述补偿信号发生器产生的所述补偿信号的幅度是与正弦信号的幅度同步地调整的。
6.根据权利要求4所述的音频解码装置,其特征在于当所述正弦信号被添加到子带K时,周期T的所述正弦信号在时间0具有幅度S、在时间1T/4具有幅度0、在时间2T/4具有幅度-S、而在时间3T/4具有幅度0,而所述补偿信号被施加到子带K-1和子带K+1,
施加到子带K-1的补偿信号在时间0具有幅度0、在时间1T/4具有幅度α*S、在时间2T/4具有幅度0、而在时间3T/4具有幅度β*S,
施加到子带K+1的补偿信号在时间0具有幅度0、在时间1T/4具有幅度β*S、在时间2T/4具有幅度0、以及在时间3T/4具有幅度α*S,其中α和β是常数。
7.一种用于从比特流中解码音频信号的音频解码方法,所述比特流包含关于窄带音频信号的编码信息和用于将窄带信号扩展为宽带信号的附加信息,
所述附加信息包含表示比编码信息的频带更高频带的特征的高频分量信息,和表示添加到特定频带的正弦信号的正弦波添加信息,
所述音频解码方法包括:
用于从比特流中多路分解编码信息和附加信息的步骤;
用于从多路分解的编码信息中解码窄带音频信号的步骤;
用于将窄带音频信号分解成由多个子频带信号组成的多路第一子带信号的步骤;
正弦信号生成步骤,根据多路分解的附加信息的正弦波添加信息,生成添加于比所述编码信息频带高的频带的特定子带的正弦信号;
补偿信号产生步骤,其根据正弦信号的相位特性和振幅特性,产生添加于附近子带的补偿信号,以抑制在所述特定子带附近的子带内产生的混叠分量信号;
频带扩展步骤,从第一子带信号和被分离的附加信息的高频分量信息生成比所述编码信息的频带更高的频带的多个子带信号所组成的第二子带信号,将所述正弦信号和所述补偿信号添加到第二子带信号中;和
实值运算合成步骤,用于合成所述第一子带信号与所述第二子带信号得到宽带音频信号。
8.根据权利要求7所述的音频解码方法,其特征在于所述混叠分量至少包含由执行复值运算的合成步骤合成之后被抑制的分量。
9.根据权利要求7所述的音频解码方法,其特征在于第一子带信号是低频子带信号,而第二子带信号是高频子带信号。
10.根据权利要求7所述的音频解码方法,其特征在于由所述补偿信号产生步骤产生的所述补偿信号抑制在与要添加正弦信号的子带相邻的子带内产生的混叠分量信号。
11.根据权利要求7所述的音频解码方法,其特征在于由所述补偿信号产生步骤产生的所述补偿信号的幅度是与所述正弦信号的幅度同步地调整的。
12.根据权利要求10所述的音频解码方法,其特征在于当所述正弦信号被添加到子带K时,周期T的正弦信号在时间0具有幅度S、在时间1T/4具有幅度0、在时间2T/4具有幅度-S、而在时间3T/4具有幅度0,而所述补偿信号施加到子带K-1和子带K+1,
施加到子带K-1的补偿信号在时间0具有幅度0、在时间1T/4具有幅度α*S、在时间2T/4具有幅度0、而在时间3T/4具有幅度β*S,和
施加到子带K+1的补偿信号在时间0具有幅度0、在时间1T/4具有幅度β*S、在时间2T/4具有幅度0、而在时间3T/4具有幅度α*S,其中α和β是常数。
CNB038014920A 2002-08-01 2003-07-30 音频解码装置和音频解码方法 Expired - Lifetime CN1286087C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002225068 2002-08-01
JP225068/2002 2002-08-01

Publications (2)

Publication Number Publication Date
CN1585972A CN1585972A (zh) 2005-02-23
CN1286087C true CN1286087C (zh) 2006-11-22

Family

ID=31492144

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB038014920A Expired - Lifetime CN1286087C (zh) 2002-08-01 2003-07-30 音频解码装置和音频解码方法

Country Status (14)

Country Link
US (1) US7058571B2 (zh)
EP (1) EP1527442B1 (zh)
JP (1) JP3646938B1 (zh)
KR (1) KR100723753B1 (zh)
CN (1) CN1286087C (zh)
AT (1) ATE322735T1 (zh)
AU (1) AU2003252727A1 (zh)
BR (2) BR0305710A (zh)
CA (1) CA2464408C (zh)
DE (1) DE60304479T2 (zh)
ES (1) ES2261974T3 (zh)
HK (1) HK1073525A1 (zh)
TW (1) TWI303410B (zh)
WO (1) WO2004013841A1 (zh)

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
WO2003046891A1 (en) 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
SE0202770D0 (sv) * 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
WO2006049205A1 (ja) * 2004-11-05 2006-05-11 Matsushita Electric Industrial Co., Ltd. スケーラブル復号化装置およびスケーラブル符号化装置
US8082156B2 (en) * 2005-01-11 2011-12-20 Nec Corporation Audio encoding device, audio encoding method, and audio encoding program for encoding a wide-band audio signal
WO2006090852A1 (ja) * 2005-02-24 2006-08-31 Matsushita Electric Industrial Co., Ltd. データ再生装置
UA92742C2 (ru) * 2005-04-01 2010-12-10 Квелкомм Инкорпорейтед Способ и устройство для кодирования речевых сигналов с расщеплением полосы
US7917561B2 (en) * 2005-09-16 2011-03-29 Coding Technologies Ab Partially complex modulated filter bank
CN100568863C (zh) * 2005-09-30 2009-12-09 中国科学院上海微系统与信息技术研究所 基于多子带滤波器组的发射、接收装置及其方法
WO2007043648A1 (ja) 2005-10-14 2007-04-19 Matsushita Electric Industrial Co., Ltd. 変換符号化装置および変換符号化方法
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
AU2008215231B2 (en) 2007-02-14 2010-02-18 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
US8214200B2 (en) * 2007-03-14 2012-07-03 Xfrm, Inc. Fast MDCT (modified discrete cosine transform) approximation of a windowed sinusoid
KR101080421B1 (ko) * 2007-03-16 2011-11-04 삼성전자주식회사 정현파 오디오 코딩 방법 및 장치
KR101411900B1 (ko) * 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
KR101380170B1 (ko) * 2007-08-31 2014-04-02 삼성전자주식회사 미디어 신호 인코딩/디코딩 방법 및 장치
KR101425355B1 (ko) * 2007-09-05 2014-08-06 삼성전자주식회사 파라메트릭 오디오 부호화 및 복호화 장치와 그 방법
EP2212884B1 (en) * 2007-11-06 2013-01-02 Nokia Corporation An encoder
CN102568489B (zh) * 2007-11-06 2015-09-16 诺基亚公司 编码器
CN101896968A (zh) * 2007-11-06 2010-11-24 诺基亚公司 音频编码装置及其方法
WO2009059632A1 (en) * 2007-11-06 2009-05-14 Nokia Corporation An encoder
RU2443028C2 (ru) * 2008-07-11 2012-02-20 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Устройство и способ расчета параметров расширения полосы пропускания посредством управления фреймами наклона спектра
CN101751925B (zh) * 2008-12-10 2011-12-21 华为技术有限公司 一种语音解码方法及装置
EP2380172B1 (en) 2009-01-16 2013-07-24 Dolby International AB Cross product enhanced harmonic transposition
KR101599884B1 (ko) * 2009-08-18 2016-03-04 삼성전자주식회사 멀티 채널 오디오 디코딩 방법 및 장치
US8515768B2 (en) * 2009-08-31 2013-08-20 Apple Inc. Enhanced audio decoder
JP5754899B2 (ja) * 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
WO2011114192A1 (en) * 2010-03-19 2011-09-22 Nokia Corporation Method and apparatus for audio coding
JP5651980B2 (ja) 2010-03-31 2015-01-14 ソニー株式会社 復号装置、復号方法、およびプログラム
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US8762158B2 (en) * 2010-08-06 2014-06-24 Samsung Electronics Co., Ltd. Decoding method and decoding apparatus therefor
US9514768B2 (en) 2010-08-06 2016-12-06 Samsung Electronics Co., Ltd. Audio reproducing method, audio reproducing apparatus therefor, and information storage medium
JP5552988B2 (ja) * 2010-09-27 2014-07-16 富士通株式会社 音声帯域拡張装置および音声帯域拡張方法
JP2011059714A (ja) * 2010-12-06 2011-03-24 Sony Corp 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP5743137B2 (ja) * 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5569476B2 (ja) * 2011-07-11 2014-08-13 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US9472199B2 (en) 2011-09-28 2016-10-18 Lg Electronics Inc. Voice signal encoding method, voice signal decoding method, and apparatus using same
CN103493130B (zh) * 2012-01-20 2016-05-18 弗劳恩霍夫应用研究促进协会 用以利用正弦代换进行音频编码及译码的装置和方法
KR101248125B1 (ko) 2012-10-15 2013-03-27 (주)알고코리아 주변소음 소거와 주파수 채널별 압축 기능을 가진 보청기
WO2014081736A2 (en) * 2012-11-20 2014-05-30 Dts, Inc. Reconstruction of a high frequency range in low-bitrate audio coding using predictive pattern analysis
CN107545900B (zh) * 2017-08-16 2020-12-01 广州广晟数码技术有限公司 带宽扩展编码和解码中高频弦信号生成的方法和装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4691292A (en) * 1983-04-13 1987-09-01 Rca Corporation System for digital multiband filtering
DE3510573A1 (de) * 1985-03-23 1986-09-25 Philips Patentverwaltung Digitale analyse-synthese-filterbank mit maximaler taktreduktion
JP2906646B2 (ja) * 1990-11-09 1999-06-21 松下電器産業株式会社 音声帯域分割符号化装置
FR2680924B1 (fr) * 1991-09-03 1997-06-06 France Telecom Procede de filtrage adapte d'un signal transforme en sous-bandes, et dispositif de filtrage correspondant.
US5508949A (en) 1993-12-29 1996-04-16 Hewlett-Packard Company Fast subband filtering in digital signal coding
US5654952A (en) * 1994-10-28 1997-08-05 Sony Corporation Digital signal encoding method and apparatus and recording medium
JPH08162964A (ja) 1994-12-08 1996-06-21 Sony Corp 情報圧縮装置及び方法、情報伸張装置及び方法、並びに記録媒体
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP3437421B2 (ja) 1997-09-30 2003-08-18 シャープ株式会社 楽音符号化装置及び楽音符号化方法並びに楽音符号化プログラムを記録した記録媒体
EP0957579A1 (en) 1998-05-15 1999-11-17 Deutsche Thomson-Brandt Gmbh Method and apparatus for sampling-rate conversion of audio signals
US6539355B1 (en) * 1998-10-15 2003-03-25 Sony Corporation Signal band expanding method and apparatus and signal synthesis method and apparatus
US6718300B1 (en) 2000-06-02 2004-04-06 Agere Systems Inc. Method and apparatus for reducing aliasing in cascaded filter banks
US6889182B2 (en) 2001-01-12 2005-05-03 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech

Also Published As

Publication number Publication date
ES2261974T3 (es) 2006-11-16
EP1527442B1 (en) 2006-04-05
TWI303410B (en) 2008-11-21
JP3646938B1 (ja) 2005-05-11
HK1073525A1 (en) 2005-10-07
DE60304479T2 (de) 2006-12-14
AU2003252727A8 (en) 2004-02-23
JP2005520217A (ja) 2005-07-07
CA2464408C (en) 2012-02-21
US20050080621A1 (en) 2005-04-14
BRPI0305710B1 (pt) 2017-11-07
ATE322735T1 (de) 2006-04-15
US7058571B2 (en) 2006-06-06
WO2004013841A1 (en) 2004-02-12
EP1527442A1 (en) 2005-05-04
KR20050042020A (ko) 2005-05-04
BR0305710A (pt) 2004-09-28
CN1585972A (zh) 2005-02-23
CA2464408A1 (en) 2004-02-12
KR100723753B1 (ko) 2007-05-30
DE60304479D1 (de) 2006-05-18
AU2003252727A1 (en) 2004-02-23
TW200405267A (en) 2004-04-01

Similar Documents

Publication Publication Date Title
CN1286087C (zh) 音频解码装置和音频解码方法
CA2286068C (en) Method for coding an audio signal
JP5291815B2 (ja) 階層的フィルタバンクを用いたスケール調節可能なコーディング
KR101238239B1 (ko) 인코더
CN1154087C (zh) 提高低比特率音频编码系统音质的方法、编码器和译码器
TWI545560B (zh) 具有在頻譜域填充有智慧間隙之音頻訊號之編碼或解碼裝置與方法
CN100395817C (zh) 编码设备、解码设备和解码方法
KR101586317B1 (ko) 신호 처리 방법 및 장치
CN101443842B (zh) 信息信号编码
US20080312759A1 (en) Flexible frequency and time partitioning in perceptual transform coding of audio
JP6100164B2 (ja) オーディオ信号を処理し、音声音響統合符号化方式(usac)のためにより高い時間粒度を供給するための装置および方法
MX2014010098A (es) Control de coherencia de fase para señales armonicas en codecs de audio perceptual.
US8983830B2 (en) Stereo signal encoding device including setting of threshold frequencies and stereo signal encoding method including setting of threshold frequencies
CN102194458B (zh) 频带复制方法、装置及音频解码方法、系统
KR20240038819A (ko) 오디오 인코더 및 디코더
CN110660401B (zh) 一种基于高低频域分辨率切换的音频对象编解码方法
CN101241736A (zh) 用于解码参数编码音频信号的方法和装置
JP3191257B2 (ja) 音響信号符号化方法、音響信号復号化方法、音響信号符号化装置、音響信号復号化装置
CN101308657B (zh) 一种基于先进音频编码器的码流合成方法
KR101786863B1 (ko) 고 주파수 복원 알고리즘들을 위한 주파수 대역 테이블 설계
CN105261373A (zh) 用于带宽扩展编码的自适应栅格构造方法和装置
JP2004252068A (ja) デジタルオーディオ信号の符号化装置及び方法
JP4403721B2 (ja) ディジタルオーディオデコーダ
Chen et al. Fast time-frequency transform algorithms and their applications to real-time software implementation of AC-3 audio codec
Cavagnolo et al. Introduction to Digital Audio Compression

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1073525

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20050223

Assignee: GUANGZHOU HUADUO NETWORK TECHNOLOGY Co.,Ltd.

Assignor: Via licensing Co.

Contract record no.: 2014990000616

Denomination of invention: Audio decoding apparatus and audio decoding method

Granted publication date: 20061122

License type: Common License

Record date: 20140804

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model
CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20061122