CN1232950C - 性能增强的使用高频重建方法的编码系统和方法 - Google Patents

性能增强的使用高频重建方法的编码系统和方法 Download PDF

Info

Publication number
CN1232950C
CN1232950C CNB018189725A CN01818972A CN1232950C CN 1232950 C CN1232950 C CN 1232950C CN B018189725 A CNB018189725 A CN B018189725A CN 01818972 A CN01818972 A CN 01818972A CN 1232950 C CN1232950 C CN 1232950C
Authority
CN
China
Prior art keywords
frequency
envelope
frequency band
core encoder
transition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CNB018189725A
Other languages
English (en)
Other versions
CN1475010A (zh
Inventor
弗雷德里克·翰
安德烈亚斯·埃雷特
迈克·舒格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Coding Technologies Sweden AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Coding Technologies Sweden AB filed Critical Coding Technologies Sweden AB
Publication of CN1475010A publication Critical patent/CN1475010A/zh
Application granted granted Critical
Publication of CN1232950C publication Critical patent/CN1232950C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
  • Optical Communication System (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Surface Acoustic Wave Elements And Circuit Networks Thereof (AREA)
  • Transmitters (AREA)

Abstract

本发明涉及使用高频重建(HFR)方法的数字音频编码系统。它教导了如何通过在核心编解码器编码的低频带和HFR系统编码的高频带之间的过渡频率的时间上的一个匹配来改进此类系统的总体性能。建立过渡频率瞬时最佳选择的各种方法被介绍。

Description

性能增强的使用高频重建方法的编码系统和方法
技术领域
本发明涉及使用高频重建(HFR)方法的数字音频编码系统。它实现一个更相容的核心编解码性能,并且获得组合的核心编解码器和HFR系统的改良音频质量。
背景技术
音频信源编码技术可以被分成两类:正常的音频编码和语音编码。正常的音频编码通常以介质比特率来用于音乐或随机信号。语音编解码器基本上被局限于语音再现,但是另一方面能够以非常低的比特率而被使用。在两类中,信号通常被分开成两个主要信号成分,一个频谱包络和一个相应的残余信号。使用这种划分的编解码器利用了频谱包络可以比残余信号更加有效地被编码的这一事实。在使用高频重建方法的那些系统中,没有与高频带相应的残余信号被发射。替代为:一个高频带在解码器处从被核心编解码器覆盖的低频带中产生并且被整形以便获得期望的高频带频谱包络。在双端HFR系统中,与较高频率范围相应的包络数据被发射,而在单端HFR系统中高频带包络从低频带中得到。在任一情况中,现有技术的音频编解码器在核心编解码器频率范围和HFR频率范围之间应用一个时间恒定的过渡频率。因此,在一个给定比特率处,过渡频率被选择如此以使对于典型程序材料获得在核心编解码器引入的人工产物和HFR系统引入的人工产物之间的一个优良交换。清楚地,这样一个静态设置可能远离一个特定信号的最佳值:核心编解码器或者被过载,导致比必需的低频带人工产物更高,HFR方法固有的此现象也衰落了高频带质量;或者不被用于它的整个位势,即,比必需的HFR频率范围更大的一个被使用。因此,只是偶而通过现有技术系统达到联合编码系统的最大性能。此外,对准具有不同频谱性质的区域(例如声音的和类似噪声的区域)之间的转换交叉的可能性未被利用。
发明内容
本发明提供一种新方法和一种设备用于改善使用高频重建方法(HFR)的编码系统。通过在由低频带编解码器和HFR系统分别引入的人工产物之间产生最佳值折衷的过渡频率的继续估计和应用,本发明从使用传统编码方案(例如MPEG层3或AAC)的低频带和使用HFR编码方案的高频带之间的一个固定过渡频率的传统使用中分离出来。根据本发明,该选择可以以如下为基础:利用核心编解码器编码一个信号的难度测量、一个短时比特需求检测以及一个频谱音调分析或者它们的任意组合。难点测量可以从知觉熵或者心理学相关的核心编解码器失真中得到。由于最佳选择经常在时间上改变,所以可变过渡频率的应用导致一个基本上改良的音频质量,这也较少依靠程序材料特性。本发明适用于单端以及双端HFR系统。
根据本发明的一个方面,这里提供一种用于编码音频信号以获得一种编码音频信号的装置,该编码音频信号由一个解码器使用,所述的解码器具有一个高频重建模块,用以对高于一个过渡频率的一个频率范围执行高频重建,其特征在于,所述装置包括:一个核心编码器,用于对直到所述过渡频率的所述音频信号的一个较低频带进行编码,其中所述的过渡频率是可变的,且其中所述的核心编码器以帧为基础在一帧上操作;和一个过渡频率控制模块,根据由所述核心编码器编码所述音频信号的难度和/或根据所述音频信号的音调的和噪声的频率范围之间的边界,来估计由所述核心编码器为一个当前帧所选择的过渡频率,因此所述的过渡频率在时间上是自适应地被选择的。
根据本发明的另一方面,这里提供一种用于编码音频信号以获得一种编码音频信号的方法,该编码音频信号由一个解码器使用,所述的解码器具有一个高频重建模块,用于对高于一个过渡频率的频率范围执行高频重建,其特征在于,所述的方法包括以下步骤:对于直到一个过渡频率的所述音频信号的一个较低频带进行核心编码,其中所述的过渡频率是可变的,并且其中所述的核心编码是以帧的基础在一帧上发生;和根据在所述的核心编码步骤中对于音频信号编码的难度和/或根据所述音频信号的音调的和噪声的频率范围之间的边界,来估计在所述核心编码步骤中为一个当前帧所选择的一个过渡频率,因此所述的过渡频率在时间上是自适应地被选择的。
根据本发明的再一方面,这里提供一种用于解码一种编码音频信号的装置,所述的编码音频信号已经利用一个可变过渡频率而被编码,所述的编码音频信号包括:关于在时间上自适应地变化的一个过渡频率的信息,其特征在于,所述的用于解码的装置包括:一个比特流去复用器,用于将一个比特流分离成为核心编码解码器数据和包络数据;一个核心解码器,用于接收来自所述比特流去复用器的所述核心编码解码器数据和用于输出低频带数据;一个高频再生包络检波器,用于接收来自所述比特流去复用器中的所述包络数据和用于产生一个频谱包络输出;一个置换模块,用于根据关于所述可变过渡频率的信息来从所述低频带数据中产生一个复制的高频带信号;一个增益控制模块,响应所述高频再生包络检波器,用于调整所述复制的高频带信号到所述高频再生包络检波器输出的一个频谱包络以获得一个包络调整了的高频带信号;和一个加法器,用于把经过延迟了的所述低频带数据和所述包络调整了的高频带信号相加以获得一种数字宽带信号。
根据本发明的又一方面,这里提供一种用于解码一种编码音频信号所述的方法,所述的编码音频信号已经利用一个可变过渡频率而被编码,所述的编码音频信号包括:关于在时间上自适应变化的一个过渡频率的信息,其特征在于,所述的用于解码的方法包括以下步骤:将一个比特流分离成为核心编码解码器数据和包络数据;利用一个核心解码器接收来自所述比特流去复用器的核心编码解码器数据和输出低频带数据;利用一个高频再生包络检波器接收所述包络数据和产生一个频谱包络输出;利用一个置换模块,根据关于所述可变过渡频率的信息,从所述的低频带数据中产生一个复制的高频带信号;响应所述高频再生包络解码器,利用一个增益控制模块调整所述复制的高频带信号到所述高频率再生包络解码器输出的一个频谱包络,以获得一个包络调整了的高频带信号;和将经过延迟了的所述低频带数据和所述包络调整了的高频带信号相加,以获得一个数字宽带信号。
附图说明
现在将参考附图通过不限制本发明范围或精神的说明示例来描述本发明,附图中:
图1是说明各项低频带、高频带以及过渡频率的曲线图。
图2是说明核心编解码器工作负载测量的曲线图。
图3是说明恒定比特率编解码器的短时比特需求变化的曲线图。
图4是说明信号划分成为声音和类似噪声的频率范围的曲线图。
图5是被一个过渡频率控制模块增强的一个基于HFR的编码器框图。
图6是详细地说明过渡频率控制模块的一个框图。
图7是相应的基于HFR的解码器框图。
具体实施方式
下面描述的实施例只是说明本发明的原理。不言而喻,在此描述的配置和细节的改进与变化对本领域技术人员来说是显而易见的。因此,想要仅仅通过随后的专利权利要求范围来限制而非通过在此的实施例说明和解释呈现的具体细节来限制。
在如图1给出的低频带或低频范围101被核心编解码器编码、并且高频带或高频范围102被一个适当的HFR方法适用的一个系统中,两个范围之间的边界可以被定义为过渡频率103。因为编码方案按块规一帧帧的基础进行操作,所以人们可对于每个被处理帧自由地改变过渡频率。根据本发明,可设置一种适应过渡频率的检测算法如此以使获得组合编码系统的最佳质量。它的配置在下文中被称为过渡频率控制模块。
考虑核心编解码器的音频质量也是重建高频带质量的根据,很明显,在低频带范围中的一个优良且恒定的音频质量被期望。通过减低过渡频率,核心编解码器不得不对付的频率范围变小,并因此容易编码。因此,通过测量编码一个帧的难度并相应地调整过渡频率,则可以获得核心编码器的一个更恒定的音频质量。
作为如何测量难度的一个示例,知觉熵[ISO/TEC 13818-7附件B.2.1]可以被使用:在这里,一个基于频谱分析的心理学模型被应用。通常,分析滤波器组的谱线被归组到频带中,在此一个频带内的线数取决于频带中心频率并且根据熟知的bark scale来被选择,目的是全频带的一个知觉固定频率解决方案。通过使用一个利用诸如频谱或暂时屏蔽之类的效果的心理学模式,则获得对于每个频带的听觉阈值。一个频带内的知觉熵然后如下给出:
e ( b ) = 1 2 Σ i = 0 L ( b ) - 1 log 2 ( r ( i ) ) + 1 (公式1)
其中
r ( i ) = s ( i ) 2 L ( b ) t ( b )
并且
i-当前频带内的谱线指标
s(i)=线路i的频谱值
L(b)=当前频带中的线路数
t(b)=当前频带的心理学阈值
b=频带指标
l=当前频带中的线数如此以致r(i)>1.0
并且只是项如此以致r(i)>1.0被用于累加中。
通过总计在低频带范围中不得不被编码的所有频带的知觉熵,则获得当前帧的编码难点的一个测量。
根据等式2,则一种类似的方法通过总计每个频带的失真能量来计算在核心编解码器编码处理最后的失真能量。
n tot = Σ b = 0 B - 1 n ( b ) (公式2)
在此
n ( b ) = n q ( b ) - t ( b ) for n q ( b ) / t ( b ) > 1.0 0 otherwise
并且
nq(b)=量化噪声能量
t(b)=心理学阈值
b=频带指标
B=频带数
此外,失真能量可以被一个音量曲线加权,以便把实际的失真加权到它的心理学相关性上。作为一个示例,等式2中的累加可以被修改为
n tot ′ = Σ b = 0 B - 1 ( n ( b ) ) 0.23 (公式3)
在此按照Zwicker的音量函数的一个简化形式得到了使用[“Psychoacoustics”,Eberhard Zwicker和Hugo Fastl,Springer-Verlag,Berlin 1990]。
一个编码难点或工作负载测量因此可以被定义为总失真的一个函数。图2给出了一个知觉音频编解码器的失真能量以及一个相应工作负载测量的例子,在此,一个非线性递归已被用来计算工作负载。可以看到工作负载示出了时间上的高漂移并且取决于输入材料特性。
高知觉熵或高度失真能量表示一个信号心理声学上难以以一个有限比特率来编码,并且低频带中的可听人工产物可能出现。在这种情况下,过渡频率控制模块将指令使用一个较低的过渡频率以便对于知觉音频编码器更容易对付给定信号。同时,低知觉熵或低失真能量指示一个易编码信号。因此,过渡频率将被选择更高以便对于低频带允许一个更宽频率范围,从而减少由于任何现有HFR方法有限性能而可能在高频带中引入的人工产物。如果过渡频率的调整已经在分析阶段被指令过的话,则两种方法都还允许通过重新编码当前帧来使用一种分析合成方法。可是,因为重叠转换被使用于最新科技的音频编解码器中,所以系统性能可以通过在时间上应用分析输入参数的一个平滑而被改良,以免过渡频率的太频繁切换,其可能引起抑制效应。如果实际的设备不需要就处理延迟方面被最佳化,则通过使用时间上的一个更大预见、提供查找在时间上的点(在该时间点处可以进行具有切换人工产物最小值的偏移)可以进一步改良该检测算法。非实时应用表示这种特定情况:如果期望的话,则要被编码的整个文件可以被分析。
在恒定比特率(CBR)音频编解码器的情况下,一个短时比特需求变化分析可以被使用作为交叉判断中的一个附加输入参数:诸如MPEG层3或MPEG 2 AAC之类的最新科技的音频编码器使用一个比特储藏技术以便补偿每一帧从可用比特平均数中的短时峰值比特需求偏移。此类比特储藏的满度表示核心编码器是否能够解决好即将来临的难以编码的帧。每一帧被使用的比特数以及时间上的比特储藏满度的实际例子在图3中给出。因此,如果比特储藏满度为高,则核心编码器将能够处理一个困难的帧并且不需要选择一个较低的过渡频率。同时,如果比特储藏满度为低,则通过减低过渡频率在随后的帧中结果的音频质量可以基本上被改良,如此以致由于不得不被编码的频率范围较小而可以填满比特储藏。再一次,由于可以很好地预先预知比特储藏满度的特性,所以一个大的预见能够改善检测方法。
除当前帧的编码难点之外,基于过渡频率选择的另外一个重要的参数被描述如下:诸如语音或一些乐器之类的大量音频信号示出这样一个性质:即,频谱范围可以被分成一个音调或音频范围和一个类似噪音范围。图4示出了此性质被清楚显示的一个音频输入信号的频谱。在频谱域中使用音调和/或噪声分析方法,可以检测两个范围,其可以被分别分类为声音的和类似噪声的。例如在AAC标准中给出的,音调可以被计算出[ISO/EEC 13818-7:1997(E),pp.96-98,sectionB.2.1.4”Steps in threshold calculation”]。诸如频谱均匀性测量之类的其它熟知的音调或噪声检测算法也适合于本目的。因此,在这些范围之间的过渡频率被使用作为本发明环境中的过渡频率以便更好地分开声音的和类似噪声的频谱范围并且把它们分别馈送给核心编码器,分别的HFR方法。因此组合编解码器系统的整个音频质量在这些情况下能基本上被改良。
显然,上面的方法同样适用于双端和单端HFR系统。在后一种情况中,被核心编解码器编码的变化带宽的仅仅一个低频带被发射。HFR解码器然后推断来自低频带截止频率以上的一个包络。此外,本发明可应用到通过与被用于低频带编码的方法不同的任意方法来产生高频带的那些系统中。
当应用诸如频率转换之类的传统置换方法时,把HFR开始频率适应到低频带信号的变化带宽将是一个非常冗长乏味的任务。那些方法通常包括引起频移的低频带信号的滤波以便提取一个低通或带通信号,其随后在时域中被调制。因此,一个适配将合并低通或带通滤波器的切换并且在调制频率中变化。此外,滤波器的一个改变引起输出信号中的不连续性,这推动窗口技术的使用。可是,在一个基于滤波器组的系统中,通过从一组连续的滤波频带中提取次能带信号来自动地获得滤波。然后通过在滤波器组内修补提取的次能带信号获得时域调制的一个等价物。修补很容易适合变化的过渡频率,并且前述的窗口为次能带域所固有,因此转换参数的改变以很少的附加复杂性而被实现。
图5示出了一个根据本发明增强的基于HFR的编解码器的编码器侧的示例。模拟输入信号被馈送给一个A/D转换器501,形成一个数字信号。数字音频信号被馈送给一个核心编码器502,在此源编码被执行。另外,数字信号被馈送给一个HFR包络编码器503。HFR包络编码器的输出表示覆盖起始于图1中说明的过渡频率103的高频带102的包络数据。在包络编码器中包络数据所需要的比特数被传递到核心编码器以便对于一个给定帧从总有效比特中减去之。核心编码器然后将编码剩余低频带频率范围直到过渡频率。正如本发明所教导的,一个过渡频率控制模块504被加到编码器。输入信号以及核心编解码器状态信号的一个时域和/或频域表示被馈送给过渡频率控制模块。模块504的输出,以过渡频率的最佳选择的形式,被馈送给核心和包络编码器以便指令将被编码的频率范围。两个编码方案每一个的频率范围例如也通过一个有效表格查寻方案进行编码。如果在两个后续帧之间的频率范围未变化,则这可以被一个单个比特发送信号以便保持尽可能小的比特率开销。因此频率范围不必在每一帧中都被明确发射。两个编码器的编码数据然后被馈送给多路复用器,形成被发射或储存的一个串行比特流。
图6分别给出了在过渡频率控制模块504和601内的子系统示例。一个编码器工作负载测量分析模块602例如使用如上所述的知觉熵或失真能量方法来探测对于核心编码器编码当前帧多么难。倘若核心编解码器使用一个比特储藏,则一个缓存器满度分析模块可以被包括,603。当可应用时,一个音调分析模块604指令一个目标过渡频率与声音的/噪声的过渡频率相应。当计算为了获得最大总体性能而使用的过渡频率时,根据所使用的核心和HFR编解码器的实际设备合并并均衡联合判断模块606的所有输入参数。
相应的解码器侧如图7所示。去复用器701把比特流信号分离成为核心编解码器数据、包络数据,核心编解码器数据被馈送给核心解码器702,包络数据被馈送给HFR包络解码器703。核心解码器产生一个覆盖低频带频率范围的信号。同样地,HFR包络解码器把数据解码成为高频带频率范围的频谱包络的一个表示。解码的包络数据然后被馈送给增益控制模块704。来自核心解码器中的低频带信号被路由到置换模块705,它根据过渡频率产生来自低频带中的一个重复的高频带信号。该高频带信号被馈送给增益控制模块以便把高频带频谱包络调整到发射包络的上面。输出因此是一个包络调整了的高频带音频信号。此信号被加到来自延迟单元706中的输出上,其用低频带音频信号馈送然而该延迟补偿了高频带信号的处理时间。最后,所获得的数字宽带信号在D/A转换器707中被转换成一个模拟音频信号。

Claims (8)

1.一种用于编码音频信号以获得一种编码音频信号的装置,该编码音频信号由一个解码器使用,所述的解码器具有一个高频重建模块,用以对高于一个过渡频率的一个频率范围执行高频重建,其特征在于,所述装置包括:
一个核心编码器(502),用于对直到所述过渡频率的所述音频信号的一个较低频带进行编码,其中所述的过渡频率是可变的,且其中所述的核心编码器以帧为基础在一帧上操作;和
一个过渡频率控制模块(504),根据由所述核心编码器(502)编码所述音频信号的难度和/或根据所述音频信号的音调的和噪声的频率范围之间的边界,来估计由所述核心编码器(502)为一个当前帧所选择的过渡频率,因此所述的过渡频率在时间上是自适应地被选择的。
2.根据权利要求1所述的装置,其特征在于,所述的难度是以所述音频信号的知觉熵为基础的。
3.根据权利要求1所述的装置,其特征在于,所述的难度是以在用所述核心编码器编码之后的一个失真能量为基础的。
4.根据权利要求1所述的装置,其特征在于,所述的难度是以在与所述核心编码器相关的一个比特储藏状态为基础的。
5.根据权利要求1所述的装置,其特征在于,知觉熵、核心编码器失真能量和核心编码器比特储藏状态的任意组合被用来获得由所述核心编码器(502)为一个帧所选择的过渡频率。
6.一种用于编码音频信号以获得一种编码音频信号的方法,该编码音频信号由一个解码器使用,所述的解码器具有一个高频重建模块,用于对高于一个过渡频率的频率范围执行高频重建,其特征在于,所述的方法包括以下步骤:
对于直到一个过渡频率的所述音频信号的一个较低频带进行核心编码,其中所述的过渡频率是可变的,并且其中所述的核心编码是以帧的基础在一帧上发生;和
根据在所述的核心编码步骤中对于音频信号编码的难度和/或根据所述音频信号的音调的和噪声的频率范围之间的边界,来估计在所述核心编码步骤中为一个当前帧所选择的一个过渡频率,因此所述的过渡频率在时间上是自适应地被选择的。
7.一种用于解码一种编码音频信号的装置,所述的编码音频信号已经利用一个可变过渡频率而被编码,所述的编码音频信号包括:关于在时间上自适应地变化的一个过渡频率的信息,其特征在于,所述的用于解码的装置包括:
一个比特流去复用器(701),用于将一个比特流分离成为核心编码解码器数据和包络数据;
一个核心解码器(702),用于接收来自所述比特流去复用器的所述核心编码解码器数据和用于输出低频带数据;
一个高频再生包络检波器,用于接收来自所述比特流去复用器(701)中的所述包络数据和用于产生一个频谱包络输出;
一个置换模块(705),用于根据关于所述可变过渡频率的信息来从所述低频带数据中产生一个复制的高频带信号;
一个增益控制模块(704),响应所述高频再生包络检波器,用于调整所述复制的高频带信号到所述高频再生包络检波器输出的一个频谱包络以获得一个包络调整了的高频带信号;和
一个加法器,用于把经过延迟了的所述低频带数据和所述包络调整了的高频带信号相加以获得一种数字宽带信号。
8.一种用于解码一种编码音频信号所述的方法,所述的编码音频信号已经利用一个可变过渡频率而被编码,所述的编码音频信号包括:关于在时间上自适应变化的一个过渡频率的信息,其特征在于,所述的用于解码的方法包括以下步骤:
将一个比特流分离成为核心编码解码器数据和包络数据(701);
利用一个核心解码器(702)接收来自所述比特流去复用器的核心编码解码器数据和输出低频带数据;
利用一个高频再生包络检波器接收所述包络数据和产生一个频谱包络输出;
利用一个置换模块(705),根据关于所述可变过渡频率的信息,从所述的低频带数据中产生一个复制的高频带信号;
响应所述高频再生包络解码器,利用一个增益控制模块(704),调整所述复制的高频带信号到所述高频率再生包络解码器输出的一个频谱包络,以获得一个包络调整了的高频带信号;和
将经过延迟了的所述低频带数据和所述包络调整了的高频带信号相加,以获得一个数字宽带信号。
CNB018189725A 2000-11-15 2001-11-14 性能增强的使用高频重建方法的编码系统和方法 Expired - Lifetime CN1232950C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
SE00041871 2000-11-15
SE0004187A SE0004187D0 (sv) 2000-11-15 2000-11-15 Enhancing the performance of coding systems that use high frequency reconstruction methods

Publications (2)

Publication Number Publication Date
CN1475010A CN1475010A (zh) 2004-02-11
CN1232950C true CN1232950C (zh) 2005-12-21

Family

ID=20281835

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB018189725A Expired - Lifetime CN1232950C (zh) 2000-11-15 2001-11-14 性能增强的使用高频重建方法的编码系统和方法

Country Status (15)

Country Link
US (1) US7050972B2 (zh)
EP (1) EP1334484B1 (zh)
JP (6) JP3983668B2 (zh)
KR (1) KR100551862B1 (zh)
CN (1) CN1232950C (zh)
AT (1) ATE267445T1 (zh)
AU (1) AU2002215282A1 (zh)
DE (1) DE60103424T2 (zh)
DK (1) DK1334484T3 (zh)
ES (1) ES2218462T3 (zh)
HK (1) HK1058096A1 (zh)
PT (1) PT1334484E (zh)
SE (1) SE0004187D0 (zh)
TR (1) TR200401631T4 (zh)
WO (1) WO2002041302A1 (zh)

Families Citing this family (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPR433901A0 (en) 2001-04-10 2001-05-17 Lake Technology Limited High frequency signal construction method
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
DE60202881T2 (de) * 2001-11-29 2006-01-19 Coding Technologies Ab Wiederherstellung von hochfrequenzkomponenten
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
KR100605824B1 (ko) 2002-05-13 2006-07-31 삼성전자주식회사 부호분할다중접속 이동통신시스템의 방송서비스 방법
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
US7318027B2 (en) 2003-02-06 2008-01-08 Dolby Laboratories Licensing Corporation Conversion of synthesized spectral components for encoding and low-complexity transcoding
FR2852172A1 (fr) * 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
JP2004309921A (ja) * 2003-04-09 2004-11-04 Sony Corp 符号化装置、符号化方法及びプログラム
US7318035B2 (en) * 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
DE10328777A1 (de) * 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
US20050018796A1 (en) * 2003-07-07 2005-01-27 Sande Ravindra Kumar Method of combining an analysis filter bank following a synthesis filter bank and structure therefor
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
DE102004009949B4 (de) 2004-03-01 2006-03-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes
NZ562182A (en) * 2005-04-01 2010-03-26 Qualcomm Inc Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal
TWI324336B (en) 2005-04-22 2010-05-01 Qualcomm Inc Method of signal processing and apparatus for gain factor smoothing
CN101167126B (zh) * 2005-04-28 2011-09-21 松下电器产业株式会社 语音编码装置和语音编码方法
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
US7831434B2 (en) 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US20080109215A1 (en) * 2006-06-26 2008-05-08 Chi-Min Liu High frequency reconstruction by linear extrapolation
EP2062255B1 (en) * 2006-09-13 2010-03-31 Telefonaktiebolaget LM Ericsson (PUBL) Methods and arrangements for a speech/audio sender and receiver
JP4918841B2 (ja) 2006-10-23 2012-04-18 富士通株式会社 符号化システム
US8295507B2 (en) 2006-11-09 2012-10-23 Sony Corporation Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium
KR101355376B1 (ko) 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
CN101939782B (zh) * 2007-08-27 2012-12-05 爱立信电话股份有限公司 噪声填充与带宽扩展之间的自适应过渡频率
KR101235830B1 (ko) * 2007-12-06 2013-02-21 한국전자통신연구원 음성코덱의 품질향상장치 및 그 방법
ATE518224T1 (de) 2008-01-04 2011-08-15 Dolby Int Ab Audiokodierer und -dekodierer
CN101281748B (zh) * 2008-05-14 2011-06-15 武汉大学 用编码索引实现的空缺子带填充方法及编码索引生成方法
MX2011000367A (es) 2008-07-11 2011-03-02 Fraunhofer Ges Forschung Un aparato y un metodo para calcular una cantidad de envolventes espectrales.
WO2010003521A1 (en) 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and discriminator for classifying different segments of a signal
CA2730232C (en) * 2008-07-11 2015-12-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. An apparatus and a method for decoding an encoded audio signal
EP4372744A1 (en) 2008-07-11 2024-05-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
US8326640B2 (en) * 2008-08-26 2012-12-04 Broadcom Corporation Method and system for multi-band amplitude estimation and gain control in an audio CODEC
JP2010079275A (ja) * 2008-08-29 2010-04-08 Sony Corp 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム
PL4231291T3 (pl) 2008-12-15 2024-04-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy
JP5446258B2 (ja) 2008-12-26 2014-03-19 富士通株式会社 オーディオ符号化装置
CA3162807C (en) 2009-01-16 2024-04-23 Dolby International Ab Cross product enhanced harmonic transposition
JP4977157B2 (ja) * 2009-03-06 2012-07-18 株式会社エヌ・ティ・ティ・ドコモ 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム
CA2949616C (en) 2009-03-17 2019-11-26 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
TWI556227B (zh) 2009-05-27 2016-11-01 杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
CN102754159B (zh) 2009-10-19 2016-08-24 杜比国际公司 指示音频对象的部分的元数据时间标记信息
BR112012026502B1 (pt) * 2010-04-16 2022-10-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V Aparelho, método para gerar um sinal de banda larga usando extensão de largura de guiada e extensão de largura de banda cega
SG10201505469SA (en) 2010-07-19 2015-08-28 Dolby Int Ab Processing of audio signals during high frequency reconstruction
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
EP2466580A1 (en) * 2010-12-14 2012-06-20 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Encoder and method for predictively encoding, decoder and method for decoding, system and method for predictively encoding and decoding and predictively encoded information signal
CN102208188B (zh) 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
US9437213B2 (en) * 2012-03-05 2016-09-06 Malaspina Labs (Barbados) Inc. Voice signal enhancement
EP2830062B1 (en) 2012-03-21 2019-11-20 Samsung Electronics Co., Ltd. Method and apparatus for high-frequency encoding/decoding for bandwidth extension
EP2682941A1 (de) * 2012-07-02 2014-01-08 Technische Universität Ilmenau Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne
CN104781877A (zh) * 2012-10-31 2015-07-15 株式会社索思未来 音频信号编码装置以及音频信号解码装置
PT2951814T (pt) 2013-01-29 2017-07-25 Fraunhofer Ges Forschung Ênfase de baixa frequência para codificação com base em lpc em domínio de frequência
CN110265047B (zh) * 2013-04-05 2021-05-18 杜比国际公司 音频信号的解码方法和解码器、介质以及编码方法
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
BR122021009025B1 (pt) * 2013-04-05 2022-08-30 Dolby International Ab Método de decodificação para decodificar dois sinais de áudio e decodificador para decodificar dois sinais de áudio
JP6305694B2 (ja) * 2013-05-31 2018-04-04 クラリオン株式会社 信号処理装置及び信号処理方法
RU2632585C2 (ru) * 2013-06-21 2017-10-06 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Способ и устройство для получения спектральных коэффициентов для заменяющего кадра аудиосигнала, декодер аудио, приемник аудио и система для передачи аудиосигналов
KR20220156112A (ko) 2013-09-12 2022-11-24 돌비 인터네셔널 에이비 Qmf 기반 처리 데이터의 시간 정렬
CN104681029B (zh) * 2013-11-29 2018-06-05 华为技术有限公司 立体声相位参数的编码方法及装置
US20150194157A1 (en) * 2014-01-06 2015-07-09 Nvidia Corporation System, method, and computer program product for artifact reduction in high-frequency regeneration audio signals
MX2018010753A (es) * 2016-03-07 2019-01-14 Fraunhofer Ges Forschung Método de ocultamiento híbrido: combinación de ocultamiento de pérdida paquete de dominio de frecuencia y tiempo en códecs de audio.
CN114946192A (zh) * 2020-01-15 2022-08-26 杜比国际公司 利用比特率切换自适应流式传输媒体内容
CN116348951A (zh) * 2020-07-30 2023-06-27 弗劳恩霍夫应用研究促进协会 用于编码音频信号或用于解码经编码音频场景的设备、方法及计算机程序

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4158751A (en) * 1978-02-06 1979-06-19 Bode Harald E W Analog speech encoder and decoder
JPS595297A (ja) * 1982-07-01 1984-01-12 日本電気株式会社 帯域分割型ボコ−ダ
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
JP3297750B2 (ja) * 1992-03-18 2002-07-02 ソニー株式会社 符号化方法
JP3218679B2 (ja) * 1992-04-15 2001-10-15 ソニー株式会社 高能率符号化方法
US5404377A (en) * 1994-04-08 1995-04-04 Moses; Donald W. Simultaneous transmission of data and audio signals by means of perceptual coding
JP3277692B2 (ja) * 1994-06-13 2002-04-22 ソニー株式会社 情報符号化方法、情報復号化方法及び情報記録媒体
JP3557674B2 (ja) * 1994-12-15 2004-08-25 ソニー株式会社 高能率符号化方法及び装置
US5646961A (en) * 1994-12-30 1997-07-08 Lucent Technologies Inc. Method for noise weighting filtering
JPH09172376A (ja) * 1995-12-20 1997-06-30 Hitachi Ltd 量子化ビット割当て装置
JP3255022B2 (ja) * 1996-07-01 2002-02-12 日本電気株式会社 適応変換符号化方式および適応変換復号方式
US6490562B1 (en) * 1997-04-09 2002-12-03 Matsushita Electric Industrial Co., Ltd. Method and system for analyzing voices
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US5928342A (en) * 1997-07-02 1999-07-27 Creative Technology Ltd. Audio effects processor integrated on a single chip with a multiport memory onto which multiple asynchronous digital sound samples can be concurrently loaded
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
US6385548B2 (en) * 1997-12-12 2002-05-07 Motorola, Inc. Apparatus and method for detecting and characterizing signals in a communication system
US6757395B1 (en) * 2000-01-12 2004-06-29 Sonic Innovations, Inc. Noise reduction apparatus and method
AU2001296459A1 (en) * 2000-10-02 2002-04-15 Clarity, L.L.C. Audio visual speech processing

Also Published As

Publication number Publication date
HK1058096A1 (en) 2004-04-30
JP2007293354A (ja) 2007-11-08
KR100551862B1 (ko) 2006-02-13
AU2002215282A1 (en) 2002-05-27
KR20030076576A (ko) 2003-09-26
PT1334484E (pt) 2004-09-30
ES2218462T3 (es) 2004-11-16
JP6592148B2 (ja) 2019-10-16
JP2016189015A (ja) 2016-11-04
JP2004514180A (ja) 2004-05-13
JP4991397B2 (ja) 2012-08-01
DE60103424D1 (de) 2004-06-24
DE60103424T2 (de) 2005-06-16
DK1334484T3 (da) 2004-08-09
US7050972B2 (en) 2006-05-23
CN1475010A (zh) 2004-02-11
EP1334484A1 (en) 2003-08-13
ATE267445T1 (de) 2004-06-15
JP2014089472A (ja) 2014-05-15
JP6368740B2 (ja) 2018-08-01
JP3983668B2 (ja) 2007-09-26
JP2012093774A (ja) 2012-05-17
EP1334484B1 (en) 2004-05-19
JP2018185530A (ja) 2018-11-22
JP6207404B2 (ja) 2017-10-04
SE0004187D0 (sv) 2000-11-15
JP5933965B2 (ja) 2016-06-15
US20020103637A1 (en) 2002-08-01
WO2002041302A1 (en) 2002-05-23
TR200401631T4 (tr) 2004-09-21

Similar Documents

Publication Publication Date Title
CN1232950C (zh) 性能增强的使用高频重建方法的编码系统和方法
DE69633633T2 (de) Mehrkanaliger prädiktiver subband-kodierer mit adaptiver, psychoakustischer bitzuweisung
JP3926399B2 (ja) オーディオ信号コーディング中にノイズ置換を信号で知らせる方法
KR100242864B1 (ko) 디지탈 신호 부호화 장치 및 방법
CN1702974B (zh) 用于对数字信号编码/解码的方法和设备
CN101933086A (zh) 处理音频信号的方法和设备
KR20080093074A (ko) 오디오신호들의 분류
CN101896968A (zh) 音频编码装置及其方法
CN1945695A (zh) 对音频信号编码/解码的方法和设备
US20080071551A1 (en) Sound encoder and sound decoder
CN1470048A (zh) 在感知上改善的声信号编码
CN1252678C (zh) 可缩放的立体声音频编码/解码方法及装置
CN1140894C (zh) 可变位速率语音传输系统
KR102486258B1 (ko) 스테레오 신호 인코딩 방법 및 인코딩 장치
CN1318187A (zh) 具备背景噪声再现的语音编码
JP2014509408A (ja) オーディオ符号化方法および装置
CN1273955C (zh) 采用带宽扩展技术编码和/或解码音频数据的方法和装置
Malvar Enhancing the performance of subband audio coders for speech signals
JP2000151413A (ja) オーディオ符号化における適応ダイナミック可変ビット割り当て方法
Ramprashad High quality embedded wideband speech coding using an inherently layered coding paradigm
JP3617804B2 (ja) Pcm信号符号化装置及び復号化装置
Kokes et al. A wideband speech codec based on nonlinear approximation
CN102226945A (zh) 一种多速率语音频编码的方法
JP2002229598A (ja) ステレオ符号化信号復号化装置及び復号化方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee

Owner name: DUBI SWEDEN STOCK CO., LTD.

Free format text: FORMER NAME: ENCODING TECHNOLOGY STOCK CO., LTD.

CP03 Change of name, title or address

Address after: Stockholm

Patentee after: Dolby Sweden AG

Address before: Stockholm

Patentee before: Coding Technologies Sweden AB

C56 Change in the name or address of the patentee

Owner name: DOLBY INTERNATIONAL COMPANY

Free format text: FORMER NAME: DOLBY SWEDEN AB COMPANY

CP03 Change of name, title or address

Address after: Amsterdam

Patentee after: Dolby International AB

Address before: Stockholm

Patentee before: Dolby Sweden AG

EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20040211

Assignee: Guangzhou Huaduo Network Technology Co., Ltd.

Assignor: Via licensing company

Contract record no.: 2014990000616

Denomination of invention: Enhancing performance of coding system that use high frequency reconstruction methods

Granted publication date: 20051221

License type: Common License

Record date: 20140804

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model
CX01 Expiry of patent term

Granted publication date: 20051221

CX01 Expiry of patent term