CN101903944A - 用于处理音频信号的方法和装置 - Google Patents

用于处理音频信号的方法和装置 Download PDF

Info

Publication number
CN101903944A
CN101903944A CN2008801214655A CN200880121465A CN101903944A CN 101903944 A CN101903944 A CN 101903944A CN 2008801214655 A CN2008801214655 A CN 2008801214655A CN 200880121465 A CN200880121465 A CN 200880121465A CN 101903944 A CN101903944 A CN 101903944A
Authority
CN
China
Prior art keywords
band
frequency
frequency band
spectrum data
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2008801214655A
Other languages
English (en)
Other versions
CN101903944B (zh
Inventor
李显国
金东秀
尹圣龙
房熙锡
林宰显
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN101903944A publication Critical patent/CN101903944A/zh
Application granted granted Critical
Publication of CN101903944B publication Critical patent/CN101903944B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

公开了一种处理音频信号的方法。本发明包括在包括第一频带和第二频带的频带中接收与第一频带相对应的频谱数据,基于与第一频带的部分频带相对应的复制频带的频率信息来确定复制频带,以及使用复制频带的频谱数据来产生与第二频带相对应的目标频带的频谱数据,其中复制频带存在于第一频带的上部分中。

Description

用于处理音频信号的方法和装置
技术领域
本发明涉及用于处理信号的装置及其方法。虽然本发明适用于宽的应用范围,但是它特别适用于使用信号的频谱数据来编码和解码音频信号。
背景技术
通常,在使用信号特性来处理音频信号中,该音频信号是基于来自不同频带的信号之间的特性处理的。
发明内容
技术问题
常规的技术不足以基于来自不同频带的信号之间的特性有效地处理音频信号。
技术解决方案
本发明针对一种用于处理信号的装置及其方法,它们基本上消除了由于相关技术的限制和缺点而造成的一个或多个问题。
本发明的一个目的是提供一种用于处理信号的装置及其方法,由此可以基于来自不同频带的信号之间的特性来处理音频信号。
本发明的另一个目的是提供一种用于处理信号的装置及其方法,由此可以以从特定频带的多个频谱数据中选择适宜的频谱数据的方式获得在不同的频带上的频谱数据。
本发明的进一步的目的是提供一种用于处理信号的装置及其方法,尽管通过适合于相应的特性的方案处理诸如语音信号、音频信号等等这样具有不同的特性的信号,但是由此可以使比特率最小化。
有益效果
本发明提供以下的效果或者优点。
第一,本发明将具有语音信号特性的信号解码为语音信号,并且将具有音频信号特性的信号解码为音频信号。因此,本发明可以自适应地选择匹配每个信号特性的解码方案。
第二,本发明通过从传输的频谱数据中选择最适宜的频谱数据来获得不同频带的频谱数据,从而提高音频信号的重建速率。
第三,本发明使用从编码器传输的开始频带信息来选择频谱数据。因此,本发明提高了在选择频谱数据方面的精度,但是降低了执行操作所需要的复杂度。
第四,本发明省略了与部分频带相对应的频谱数据的传输,从而显著地降低频谱数据传输所需要的比特。
附图说明
附图被包括以提供对本发明进一步的理解,并且被结合在本说明书中和构成本说明书的一部分,附图图示了本发明的实施例并且与该说明书一起用于解释本发明的原理。
在附图中:
图1是根据本发明实施例的音频信号编码装置的框图;
图2是在图1中示出的部分频带编码单元的详细框图;
图3是根据本发明的复制频带、目标频带和开始频带之中的关系的示意图;
图4是根据本发明不同的实施例的用于部分频带扩展的视图;
图5是根据本发明一个实施例的音频信号解码装置的框图;
图6是在图5中示出的部分频带解码单元的详细框图;
图7是用于目标频带的频谱数据的数目大于复制频带的频谱数据的数目的情形的视图;以及
图8是用于目标频带的频谱数据的数目小于复制频带的频谱数据的数目的情形的视图。
具体实施方式
本发明的附加特点和优点将在后面的描述中阐述,并且从该描述中部分将显而易见,或者可以通过本发明的实施获悉。通过在书面说明书及其权利要求以及附图中特别指出的结构,将实现和获得本发明的目的和其他优点。
为了实现这些和其他优点,以及按照本发明的目的,如在此处体现和广义地描述的,根据本发明的信号处理装置包括:复制频带确定单元、频带扩展信息接收单元和目标频带产生单元。并且,该目标频带产生单元包括时间扩张/压缩单元和抽取单元。另外,目标频带产生单元可以进一步包括滤波单元。
复制频带确定单元接收在包括低频频带和高频频带的频带中与低频频带相对应的频谱数据。然后,复制频带确定单元基于与低频频带的部分频带相对应的复制频带的频率信息来确定复制频带。
频带扩展信息获得单元从复制频带中获得用于产生目标频带的边信息。在这种情况下,该边信息可以从比特流中获得,并且可以包括增益信息、谐波信息等等。
目标信息产生单元使用复制频带的频谱数据来产生与高频频带相对应的目标频带的频谱数据。在这种情况下,复制频带可以存在于低频频带之上。它能够使用存在于低频频带上的复制频带来产生高频频带。以同样的方法,还可以使用存在于高频频带上的复制频带来产生低频频带。
目标频带产生单元包括时间扩张/压缩单元和抽取单元,并且能够进一步包括滤波单元。特别地,复制频带可以从比特流中获得,或者可以通过对所接收到的频谱数据滤波来获得。
在这种情况下,复制频带的频率信息表示开始频率、开始频带和表示开始频带的索引信息中的至少一个。并且,目标频带的频谱数据可以使用与复制频带的频谱数据和目标频带的频谱数据之间的增益相对应的增益信息和复制频带的谐波信息中的至少一个来产生。低频频带的频谱数据可以通过音频信号和语音信号中的一个来解码。
本发明适用于AAC、AC3、AMR等等的核心编码或者未来的核心编码。以下的描述主要地涉及下混合信号,但是不限制于此。
应当理解,上文的概述和下面的详细说明是示例性和解释性的,并且意在对所请求保护的本发明提供进一步的解释。
具体实施方式
现在将详细地参考本发明的优选实施例,这些优选实施例的例子附图中被图示。
本发明中的术语可以被解释为以下的参考。在本说明书中没有公开的术语可以被解释为匹配本发明的想法的概念。应当理解,“编码”在特定的情形下可以解释为编码或者解码两者。在本公开中,“信息”通常地可以意指值、参数、系数、元素等等,并且偶尔其含义可以被解释为不同的,本发明不受限于此。
图1是根据本发明的实施例的音频信号编码装置的框图,并且图2是在图1中示出的部分频带编码单元的详细框图。
参考图1,根据本发明一个实施例的音频信号编码装置包括多信道编码单元110、部分频带编码单元120、音频信号编码单元130、语音信号编码单元140和复用器150。
多信道编码单元110接收多个信道信号(在下文中称为多信道信号),并且然后通过下混合多信道信号来产生下混合信号。多信道编码单元110产生将下混合信号上混合为多信道信号所需要的空间信息。在这种情况下,空间信息可以包括信道电平差信息、信道间相关性信息、信道预测系数和下混合增益信息等等。
同时,这个下混合信号可以包括在时域中的信号(例如,残余数据),或者频率变换的频率域的信息(例如,比例因子系数、频谱数据)。
部分频带编码单元120从宽带信号中产生窄带信号和频带扩展信息。
在这种情况下,包括多个频带的原始信号被称作宽带信号,并且多个频带中的至少一个被称作窄带信号。例如,在包括二个频带(低频带和高频带)的宽带信号中,频带中的任一个被称作窄带信号。另外,部分频带表示整个窄带信号的一部分,并且在以下的描述中将被称作复制频带。
频带扩展信息是用于使用复制频带来产生目标频带的信息。并且,频带扩展信息可以包括频率信息、增益信息、谐波信息等等。在解码器中,宽带信号是由合成目标频带与窄带信号来产生的。
如果下混合信号(窄带下混合信号DMXn)的特定的帧或者分段具有很大的音频特性,则音频信号编码单元130根据音频编码方案来编码该下混合信号。在这种情况下,音频信号可以符合AAC(高级音频编码)标准或者HE-AAC(高效高级音频编码)标准,本发明不受限于此。另外,音频信号编码单元130可以对应于MDCT(修改的离散变换)编码器。
如果下混合信号(窄带下混合信号DMXn)的特定的帧或者分段具有很大的语音特性,则语音信号编码单元140根据语音编码方案来编码该下混合信号。在这种情况下,语音信号可以包括G.7XX或者AMR-系列,语音信号的例子不受限于此。同时,语音信号编码单元140可以进一步使用线性预测编码(LPC)方案。如果谐波信号在时间轴上具有高的冗余度,则可以通过用于从过去的信号预测当前信号的线性预测来对其进行建模。在这种情况下,如果采用线性预测编码方案,则能够提高编码效率。另外,语音信号编码单元140可以对应于时间域编码器。
因此,窄带下混合通过音频信号编码单元130或者语音信号编码单元140编码每个帧或者分段。
并且,复用器150通过复用由多信道编码单元110产生的空间信息、由部分频带编码单元120产生的频带扩展信息和编码的窄带下混合信号来产生比特流。
在以下的描述中,参考图2解释部分频带编码单元120的详细的配置。
参考图2,部分频带编码单元120包括频谱数据获得单元122、复制频带确定单元124、增益信息获得单元126、谐波分量信息获得单元128和频带扩展信息传输单元129。
如果接收到的宽带信号不是频谱数据,则频谱数据获得单元122以将下混合转换为频谱系数、用比例因子按比例缩放频谱系数,并且然后执行量化的方式来产生频谱数据。在这种情况下,频谱数据包括与宽带下混合相对应的宽带的频谱数据。
复制频带确定单元124基于宽带的频谱数据来确定复制频带和目标频带,并且产生用于频带扩展的频率信息。在这种情况下,频率信息可以包括开始频率、开始频带信息等等。在以下的描述中,参考图3和图4解释复制频带等等。
图3是根据本发明的用于复制频带、目标频带和开始频带之中的关系的示意图,并且图4是根据本发明的第二至第四实施例的用于部分频带扩展的视图。
参考图3,存在总共n个比例因子频带(sfb)0至n-1,并且存在分别与比例因子频带sfb0至sfbn-1相对应的频谱数据。属于特定频带的频谱数据sdi可以意指多个频谱数据sdi-0至sdi_m-1的集合。可以产生该频谱数据的数目mi以对应于频谱数据单元、频带单元或者在以前的单元上的单元。在这个例子中,第0个比例因子频带sfb0对应于低频带,并且第(n-1)个比例因子频带sfbn-1对应于上部分,即,高频带。替代地,与这个例子相反的配置是可能的。
与宽带信号相对应的频谱数据是与包括第一频带和第二频带的总的频带sfb0至sfbn-1相对应的频谱数据。与窄带下混合DMXn相对应的频谱数据是与第一频带相对应的频谱数据,并且包括第0个频带sfb0的频谱数据至第(i-1)个频带sfbi-1的频谱数据。特别地,窄带频谱数据被传输给解码器,而没有向其传输余下的频带sfb1至sfbn-1的频谱数据。
因此,解码器产生不携带频谱数据的频带。并且,这个频带被称作目标频带tb。同时,复制频带cb是在产生目标频带tb的频谱数据中使用的频谱数据的比例因子频带。复制频带包括与窄带下混合相对应的频带sfb0至sfbi-1的部分sfbs至sfbi-1。复制频带cb从其中开始的频带是开始频带sb,并且该开始频带的频率是开始频率。换句话说,复制频带cb可以是开始频带sb本身,可以包括开始频带和比该开始频带更高的频带,或者可以包括开始频带和比该开始频带更低的频带。
根据本发明,编码器使用宽带频谱数据来产生窄带频谱数据和频带扩展信息,而解码器使用在窄带频谱数据之中的复制频带的频谱数据来产生目标频带的频谱数据。
图4示出部分频带扩展的三种实施例。复制频带可以作为整个窄带的部分频带来产生目标频带。在这种情况下,复制频带可以位于较高的频带上。至少一个复制频带可以存在,并且在存在多个复制频带的情况下,频带可以相等地或者可变地相互间隔开。
参考图4的(A),示出了在复制频带的带宽等于目标频带的带宽的情况下的部分频带扩展。特别地,复制频带cb包括与开始频带sb相对应的第S频带sfbs、第(n-4)频带sfbn-4和第(n-2)个频带sfbn-2。编码器能够使用复制频带的频谱数据来省略位于复制频带的右边的目标频带的频谱数据的传输。同时,它能够产生增益信息(g),该增益信息(g)是在复制频带的频谱数据和目标频带的频谱数据之差。稍后将对此进行解释。
图4的(B)表示复制频带和目标频带,它们在带宽上不同。目标频带的带宽等于或者大于复制频带的二个带宽(tb和tb′)。在这种情况下,目标频带的带宽可以通过分别地将不同的增益gs和gs+1施加于复制频带带宽的频谱数据和目标频带的tb来产生。
参考图4的(C),在已经使用复制频带的频谱数据产生目标频带的频谱数据之后,能够使用与邻近第二开始频带的sfbk的频带sfbk0至sfbk-1相对应的频谱数据来产生第二目标频带sfbk至sfbn-1的频谱数据。在这种情况下,开始频带的频带对应于1/8的采样频率fs,并且辅助开始频带可以对应于1/4的采样频率fs,本发明的例子不受限于此。
先前解释了根据本发明的各种实施例的目标频带、复制频带和开始频带的相关度。其余的元素参考图2解释如下。
如在先前的描述中提及的,复制频带确定单元124确定复制频带、该复制频带的目标频带和开始频带sb。开始频带可以每个帧可变地确定。这还可以根据每个帧信号的特性来确定。特别地,开始频带可以根据信号是瞬态还是稳态来确定。例如,当信号是瞬态的时候,由于信号具有比当其是稳态的时候更少的谐波分量,所以开始频带可以被确定为低频率。
同时,开始频带可以使用频谱质心被确定为声音亮度的数值。例如,如果声音相对高(当高音调占主要地位的时候),则开始频带可以以高频带形成。如果声音相对低(当低音调占主要地位的时候),开始频带可以以低频带形成。虽然每个帧可变地确定开始频带,但是优选通过考虑在音质和比特率之间的折衷方案来形成开始频带。
复制频带确定单元124输出窄带下混合DMXn,或者除去目标频带的频谱数据的窄带的频谱数据。这个窄带下混合被输入到在图1中描述的音频信号编码单元或者语音信号编码单元。
复制频带确定单元124产生开始频带信息或者复制频带cb的开始频带信息,开始频带信息表示在开始频率上的开始频率信息,复制频带cb从开始频率开始。开始频带信息可以不仅表示为实际的值,而且可以表示为索引信息。当开始频带信息表示为索引信息的时候,与该索引相对应的开始频带信息被存储在表中,并且可以在解码器中使用。开始频带信息被转发到频带扩展信息传输单元129,并且然后作为频带扩展信息包括。
增益信息获得单元126使用目标频带和复制频带的频谱数据来产生增益信息。在这种情况下,增益信息可以被定义为目标频带对复制频带的能量比,并且可以被定义为以下的公式。
[公式1]
Figure BPA00001160955000101
在公式1中,“gi”表示增益,并且“i”表示当前的目标频带。
这个增益信息可以如先前示出的对于每个目标频带来确定。增益信息被转发到频带扩展信息传输单元129,并且然后同样作为频带扩展信息包括。
谐波分量信息获得单元128通过分析复制频带的谐波分量来产生谐波分量信息。谐波分量信息被转发到频带扩展信息传输单元129,并且然后同样作为频带扩展信息包括。
频带扩展信息传输单元129输出具有其中包括开始频带信息、增益信息和谐波分量信息的频带扩展信息。这个频带扩展信息被输入到参考图1描述的复用器。
因此,窄带下混合和频带扩展信息是通过以上描述的方法产生的。在以下的描述中,解释用于在解码器中使用频带扩展信息和窄带下混合来产生宽带下混合的过程。
图5是根据本发明的实施例的音频信号解码装置的框图,并且图6是在图5中示出的部分频带解码单元的详细框图。
参考图5,根据本发明的实施例的音频信号解码装置200包括解复用器210、音频信号解码单元220、语音信号解码单元230、部分频带解码单元240和多信道解码单元250。
解复用器210从比特流中提取窄带下混合DMXn、频带扩展信息和空间信息。如果窄带下混合信号具有更多的音频特性,则音频信号解码单元220通过音频编码方案来解码窄带下混合信号。在这种情况下,如在先前的描述中提及的,音频信号可以符合AAC或者HE-AAC标准。如果窄带下混合信号具有更多的语音特性,则语音信号解码单元230通过语音编码方案来解码窄带下混合信号。
部分频带解码单元240通过将频带扩展信息应用于窄带下混合来产生宽带信号,将参考图6对其进行详细解释。
多信道解码单元250使用宽带下混合和空间信息来产生输出信号。
参考图6,部分频带解码单元240包括频带扩展信息接收单元242、复制频带确定单元244和目标频带信息产生单元246。部分频带解码单元240可以进一步包括信号重建单元248。
频带扩展信息接收单元242从频带扩展信息中提取开始频带信息、增益信息和谐波分量信息,它们被转发给复制频带确定单元244和目标频带信息产生单元246。
复制频带确定单元244使用窄带下混合DMXn和开始频带信息来确定复制频带。在这种情况下,如果窄带下混合DMXn不是窄带的频谱数据,则将其转换为频谱数据。另外,复制频带可以等于或者不同于开始频带。如果复制频带不同于开始频带,则从与开始频带信息相对应的频带到具有频谱数据的频带被确定为复制频带。由复制频带确定的频谱数据被转发给目标频带信息产生单元246。
目标频带信息产生单元246使用复制频带的频谱数据、增益信息等等来产生目标频带的频谱数据。目标频带的数据可以通过以下的公式产生。
[公式2]
sd(target_band)=gi×sd(copy_band)
在公式2中,“gi”表示当前频带的增益,“sd(target_band)”表示目标频带的频谱数据,并且“sd(copy_band)”表示复制频带的频谱数据。
在图4的(A)中示出的以前的实施例的情况下,增益(gs,gs-4,gs-2等等)可以应用于复制频带,该复制频带位于目标频带的左侧。在图4的(B)中示出的以前的实施例的情况下,对于第一目标频带tb,能够将增益(gs,gn-3)应用于复制频带的频谱数据。对于第二目标频带tb′,不同的增益(gs*gs+1,gn-3*gn-2)可以应用于复制频带的频谱数据。在图4的(C)示出的以前的实施例的情况下,在增益(gs)已经应用于与窄带的部分区域相对应的复制频带的频谱数据Sds之后,辅助目标频带(tb)的频谱数据是通过将不同的增益(g2nd)应用于整个窄带产生的。
同时,目标频带Nt的频谱数据的数目可以不同于复制频带Nc的频谱数据的数目。这个情形解释如下。图7是用于目标频带Nt的频谱数据的数目大于复制频带Nc的频谱数据的数目情形的视图,并且图8是用于目标频带Nt的频谱数据的数目小于复制频带Nc的频谱数据的数目情形的视图。
参考图7的(A),可以观察到,目标频带sfbi的频谱数据的数目Nt是36,并且还可以观察到,复制频带sfbs的频谱数据的数目Nc是24。在该图中,数据的数目越大,则频带的水平长度变得越长。由于目标频带的数据的数目大于其它的,所以能够使用复制频带的数据至少两次。例如,如图7的(B1)所示,目标频带的低频首先以复制频带的24个数据填充,并且然后其余的目标频带在复制频带的前部分或者后部分中以12个数据填充。当然,同样能够应用传输增益信息。
参考图8的(A),可以观察到,目标频带sfbi的频谱数据的数目Nt是24,并且复制频带sfbs的频谱数据的数目Nc是36。由于目标频带的数据的数目小于其它的,所以能够仅仅部分地使用复制频带的数据。例如,如图8的(B)所示,能够在复制频带sfbs的前面区域中使用24个频谱数据来产生目标频带sfbi的频谱数据,或者如图8的(C)所示,在目标频带sfbi的后面区域中使用24个频谱数据。
现在参考图6,目标信息产生单元246通过在以上提及的各种方法中应用增益来产生目标频带的频谱数据。在产生目标频带的频谱数据中,目标频带信息产生单元246能够进一步使用谐波分量信息。特别地,使用由编码器传输的谐波分量信息,能够通过相位合成等等来产生与目标频带的大小数目相对应的子谐波信号。
目标频带信息产生单元246能够通过时间扩张/压缩步骤和抽取步骤的组合来产生频谱数据。在这种情况下,时间扩张/压缩步骤可以包括在时间方向上扩大时域信号的步骤,并且这个扩张步骤可以使用相位语音编码器方案。抽取步骤可以包括将时间扩大的信号压缩为原始时间的步骤。能够将时间扩张/压缩步骤和抽取步骤应用于目标频带频谱数据。
信号重建单元248使用目标频带频谱数据和窄带信号来产生宽带信号。在这种情况下,宽带信号可以包括宽带的频谱数据,或者可以对应于在时间域中的信号。
根据本发明的音频信号处理方法可以在计算机可读程序中实现,并且可以存储在可记录介质中。具有本发明的数据结构的多媒体数据还可以存储在计算机可读可记录介质中。可记录介质包括能够存储由计算机系统可读的数据的各种各样的存储设备。可记录介质例如包括ROM、RAM、CD-ROM、磁带、软盘、光数据存储设备等等,并且还包括载波型实现(例如,经由因特网的传输)。通过编码方法产生的比特流可以存储在计算机可读可记录介质中,或者经由有线/无线通信网络来传送。
工业实用性
因此,本发明适用于音频/视频信号的编码/解码。
虽然在此处参考本发明的优选实施例已经描述和说明了本发明,但是对于本领域技术人员来说显而易见的是,在不脱离本发明的精神和范围的情况下,可以在其中进行各种修改和变化。因此,本发明意在覆盖归入权利要求和其等同物的范围之内的本发明的修改和变化。

Claims (15)

1.一种处理音频信号的方法,包括:
从包括第一频带和第二频带的频带中接收与所述第一频带相对应的频谱数据;
基于与所述第一频带的部分频带相对应的复制频带的频率信息来确定所述复制频带;以及
使用所述复制频带的频谱数据来产生与所述第二频带相对应的目标频带的频谱数据,
其中,所述复制频带存在于所述第一频带的上部分中。
2.根据权利要求1所述的方法,其中,所述目标频带的频谱数据是通过时间扩张/压缩步骤和抽取步骤的组合产生的。
3.根据权利要求1所述的方法,其中,所述复制频带的频率信息包括开始频率、开始频带和表示所述开始频带的索引信息中的至少一个。
4.根据权利要求1所述的方法,其中,所述目标频带的频谱数据是通过使用与增益相对应的增益信息中的至少一个产生的,所述增益是所述复制频带和所述目标频带的频谱数据和所述复制频带的谐波信息之间的增益。
5.根据权利要求1所述的方法,其中,所述第一频带的频谱数据是基于由音频编码方案或者语音编码方案解码的信号产生的。
6.一种用于处理音频信号的装置,包括:
复制频带确定单元,所述复制频带确定单元在包括第一频带和第二频带的频带中接收与所述第一频带相对应的频谱数据,所述复制频带确定单元基于与所述第一频带的部分频带相对应的复制频带的频率信息来确定所述复制频带;以及
目标频带信息产生单元,所述目标频带信息产生单元使用所述复制频带的频谱数据来产生与所述第二频带相对应的目标频带的频谱数据,
其中,所述复制频带存在于所述第一频带的上部分中。
7.根据权利要求6所述的装置,其中,所述目标频带的频谱数据是通过滤波步骤、时间扩张/压缩步骤和抽取步骤的组合产生的。
8.根据权利要求6所述的装置,其中,所述复制频带的频率信息包括开始频率、开始频带和表示所述开始频带的索引信息中的一个。
9.根据权利要求6所述的装置,其中,所述目标频带的频谱数据是使用与增益相对应的增益信息中的至少一个产生的,所述增益是所述复制频带和所述目标频带的频谱数据和所述复制频带的谐波信息之间的增益。
10.根据权利要求6所述的装置,其中,所述第一频带的频谱数据是基于由音频编码方案或者语音编码方案解码的信号产生的。
11.一种处理音频信号的方法,包括:
获得包括第一频带和第二频带的频带的频谱数据;
使用所述频带的频谱数据来确定复制频带和目标频带;
产生所述复制频带的频率信息,所述频率信息表示所述复制频带的频率;以及
通过从所述频带的频谱数据中除去所述目标频带的频谱数据来产生所述第一频带的频谱数据。
12.根据权利要求11所述的装置,进一步包括产生与所述复制频带和所述目标频带的频谱数据之间的增益相对应的增益信息。
13.一种用于处理音频信号的装置,包括:
频谱数据获得单元,所述频谱数据获得单元获得宽带的频谱数据;以及
复制频带确定单元,所述复制频带确定单元使用所述宽带的频谱数据来确定复制频带和目标频带,所述复制频带确定单元输出所述复制频带的开始频率信息或者与所述复制频带的开始频带索引信息相对应的开始频带信息,所述复制频带确定单元通过从所述宽带的频谱数据中除去所述目标频带的频谱数据来输出窄带的频谱数据。
14.根据权利要求13所述的装置,进一步包括增益信息获得单元,所述增益信息获得单元产生与所述复制频带和所述目标频带的频谱数据之间的增益相对应的增益信息。
15.一种包括其中存储的数字音频数据的计算机可读存储介质,所述数字音频数据包括与频带中的第一频带相对应的频谱数据和频带扩展信息,
其中,所述频带包括所述第一频带和第二频带,
其中,用于产生所述第二频带的目标频带的复制频带被包括在所述第一频带的上部分中,并且
其中,所述频带扩展信息包括所述复制频带的频率信息、所述复制频带的增益信息和谐波信息中的至少一个。
CN2008801214655A 2007-12-18 2008-12-18 用于处理音频信号的方法和装置 Active CN101903944B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US1444107P 2007-12-18 2007-12-18
US61/014,441 2007-12-18
US11864708P 2008-11-30 2008-11-30
US61/118,647 2008-11-30
PCT/KR2008/007522 WO2009078681A1 (en) 2007-12-18 2008-12-18 A method and an apparatus for processing an audio signal

Publications (2)

Publication Number Publication Date
CN101903944A true CN101903944A (zh) 2010-12-01
CN101903944B CN101903944B (zh) 2013-04-03

Family

ID=40795707

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008801214655A Active CN101903944B (zh) 2007-12-18 2008-12-18 用于处理音频信号的方法和装置

Country Status (9)

Country Link
US (1) US9275648B2 (zh)
EP (1) EP2229677B1 (zh)
JP (1) JP5400059B2 (zh)
KR (1) KR20100086000A (zh)
CN (1) CN101903944B (zh)
AU (1) AU2008339211B2 (zh)
CA (1) CA2708861C (zh)
RU (1) RU2439720C1 (zh)
WO (1) WO2009078681A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103548080A (zh) * 2012-05-11 2014-01-29 松下电器产业株式会社 声音信号混合编码器、声音信号混合解码器、声音信号编码方法以及声音信号解码方法
CN105531759A (zh) * 2013-09-12 2016-04-27 杜比实验室特许公司 用于下混合音频内容的响度调整
CN108269584A (zh) * 2013-04-05 2018-07-10 杜比实验室特许公司 使用高级频谱延拓降低量化噪声的压扩装置和方法
WO2021208792A1 (zh) * 2020-04-15 2021-10-21 华为技术有限公司 音频信号编码方法、解码方法、编码设备以及解码设备

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2704807A1 (en) * 2007-11-06 2009-05-14 Nokia Corporation Audio coding apparatus and method thereof
CA2704812C (en) * 2007-11-06 2016-05-17 Nokia Corporation An encoder for encoding an audio signal
EP2239732A1 (en) 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
RU2452044C1 (ru) 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
CO6440537A2 (es) * 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
US9536529B2 (en) * 2010-01-06 2017-01-03 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
PL3570278T3 (pl) 2010-03-09 2023-03-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Rekonstrukcja wysokiej częstotliwości wejściowego sygnału audio przy użyciu kaskadowych banków filtrów
CN102934164B (zh) 2010-03-09 2015-12-09 弗兰霍菲尔运输应用研究公司 改变回放速度或音调时处理音频信号中瞬态声音事件的设备和方法
RU2596033C2 (ru) 2010-03-09 2016-08-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство и способ получения улучшенной частотной характеристики и временного фазирования способом расширения полосы аудио сигналов в фазовом вокодере
CA3027803C (en) * 2010-07-19 2020-04-07 Dolby International Ab Processing of audio signals during high frequency reconstruction
US9674052B2 (en) 2012-09-20 2017-06-06 Hewlett Packard Enterprise Development Lp Data packet stream fingerprint
CN106847297B (zh) 2013-01-29 2020-07-07 华为技术有限公司 高频带信号的预测方法、编/解码设备
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
EP2830051A3 (en) * 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
RU2750644C2 (ru) * 2013-10-18 2021-06-30 Телефонактиеболагет Л М Эрикссон (Пабл) Кодирование и декодирование положений спектральных пиков
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
EP3067887A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
KR102219752B1 (ko) 2016-01-22 2021-02-24 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 채널 간 시간 차를 추정하기 위한 장치 및 방법
EP3288031A1 (en) * 2016-08-23 2018-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding an audio signal using a compensation value
KR20180056032A (ko) 2016-11-18 2018-05-28 삼성전자주식회사 신호 처리 프로세서 및 신호 처리 프로세서의 제어 방법
CN111383646B (zh) * 2018-12-28 2020-12-08 广州市百果园信息技术有限公司 一种语音信号变换方法、装置、设备和存储介质

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69428030T2 (de) 1993-06-30 2002-05-29 Sony Corp Digitales signalkodierungsgerät, dazugehöriges dekodiergerät und aufzeichnungsträger
JP3317470B2 (ja) 1995-03-28 2002-08-26 日本電信電話株式会社 音響信号符号化方法、音響信号復号化方法
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JPH09281995A (ja) * 1996-04-12 1997-10-31 Nec Corp 信号符号化装置及び方法
US5912976A (en) 1996-11-07 1999-06-15 Srs Labs, Inc. Multi-channel audio enhancement system for use in recording and playback and methods for providing same
US6131084A (en) 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP3211762B2 (ja) * 1997-12-12 2001-09-25 日本電気株式会社 音声及び音楽符号化方式
JP4170459B2 (ja) * 1998-08-28 2008-10-22 ローランド株式会社 波形信号の時間軸圧縮伸長装置
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
JP3576936B2 (ja) * 2000-07-21 2004-10-13 株式会社ケンウッド 周波数補間装置、周波数補間方法及び記録媒体
SE0004818D0 (sv) 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
SE522553C2 (sv) * 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandbreddsutsträckning av akustiska signaler
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
JP3926726B2 (ja) 2001-11-14 2007-06-06 松下電器産業株式会社 符号化装置および復号化装置
DE60214027T2 (de) * 2001-11-14 2007-02-15 Matsushita Electric Industrial Co., Ltd., Kadoma Kodiervorrichtung und dekodiervorrichtung
JP4313993B2 (ja) 2002-07-19 2009-08-12 パナソニック株式会社 オーディオ復号化装置およびオーディオ復号化方法
JP3861770B2 (ja) * 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP2004198485A (ja) * 2002-12-16 2004-07-15 Victor Co Of Japan Ltd 音響符号化信号復号化装置及び音響符号化信号復号化プログラム
WO2004072956A1 (en) * 2003-02-11 2004-08-26 Koninklijke Philips Electronics N.V. Audio coding
ATE355590T1 (de) 2003-04-17 2006-03-15 Koninkl Philips Electronics Nv Audiosignalsynthese
DE602004005846T2 (de) * 2003-04-17 2007-12-20 Koninklijke Philips Electronics N.V. Audiosignalgenerierung
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
EP1683133B1 (en) 2003-10-30 2007-02-14 Koninklijke Philips Electronics N.V. Audio signal encoding or decoding
FI119533B (fi) * 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
JP2005352396A (ja) * 2004-06-14 2005-12-22 Matsushita Electric Ind Co Ltd 音響信号符号化装置および音響信号復号装置
WO2006022190A1 (ja) 2004-08-27 2006-03-02 Matsushita Electric Industrial Co., Ltd. オーディオエンコーダ
BRPI0517246A (pt) * 2004-10-28 2008-10-07 Matsushita Electric Ind Co Ltd aparelho de codificação escalável, aparelho de decodificação escalável e métodos para os mesmos
DE102005032724B4 (de) * 2005-07-13 2009-10-08 Siemens Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
JP2007110565A (ja) 2005-10-14 2007-04-26 Matsushita Electric Ind Co Ltd マルチチャンネル音響復号化装置及び方法
BRPI0520729B1 (pt) * 2005-11-04 2019-04-02 Nokia Technologies Oy Método para a codificação e decodificação de sinais de áudio, codificador para codificação e decodificador para decodificar sinais de áudio e sistema para compressão de áudio digital.
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US20080300866A1 (en) * 2006-05-31 2008-12-04 Motorola, Inc. Method and system for creation and use of a wideband vocoder database for bandwidth extension of voice
KR20070115637A (ko) * 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
US20080109215A1 (en) * 2006-06-26 2008-05-08 Chi-Min Liu High frequency reconstruction by linear extrapolation
WO2008035949A1 (en) * 2006-09-22 2008-03-27 Samsung Electronics Co., Ltd. Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
US8036903B2 (en) * 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
US8295507B2 (en) * 2006-11-09 2012-10-23 Sony Corporation Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103548080A (zh) * 2012-05-11 2014-01-29 松下电器产业株式会社 声音信号混合编码器、声音信号混合解码器、声音信号编码方法以及声音信号解码方法
CN103548080B (zh) * 2012-05-11 2017-03-08 松下电器产业株式会社 声音信号混合编码器、声音信号混合解码器、声音信号编码方法以及声音信号解码方法
CN108269584A (zh) * 2013-04-05 2018-07-10 杜比实验室特许公司 使用高级频谱延拓降低量化噪声的压扩装置和方法
CN108269584B (zh) * 2013-04-05 2022-03-25 杜比实验室特许公司 使用高级频谱延拓降低量化噪声的压扩装置和方法
US11423923B2 (en) 2013-04-05 2022-08-23 Dolby Laboratories Licensing Corporation Companding system and method to reduce quantization noise using advanced spectral extension
CN105531759A (zh) * 2013-09-12 2016-04-27 杜比实验室特许公司 用于下混合音频内容的响度调整
US10368181B2 (en) 2013-09-12 2019-07-30 Dolby Laboratories Licensing Corporation Loudness adjustment for downmixed audio content
CN105531759B (zh) * 2013-09-12 2019-11-26 杜比实验室特许公司 用于下混合音频内容的响度调整
US10674302B2 (en) 2013-09-12 2020-06-02 Dolby Laboratories Licensing Corporation Loudness adjustment for downmixed audio content
US10993062B2 (en) 2013-09-12 2021-04-27 Dolby Laboratories Licensing Corporation Loudness adjustment for downmixed audio content
US11533575B2 (en) 2013-09-12 2022-12-20 Dolby Laboratories Licensing Corporation Loudness adjustment for downmixed audio content
WO2021208792A1 (zh) * 2020-04-15 2021-10-21 华为技术有限公司 音频信号编码方法、解码方法、编码设备以及解码设备

Also Published As

Publication number Publication date
RU2439720C1 (ru) 2012-01-10
JP5400059B2 (ja) 2014-01-29
CN101903944B (zh) 2013-04-03
EP2229677A1 (en) 2010-09-22
JP2011507050A (ja) 2011-03-03
CA2708861A1 (en) 2009-06-25
CA2708861C (en) 2016-06-21
US20100292994A1 (en) 2010-11-18
AU2008339211B2 (en) 2011-06-23
US9275648B2 (en) 2016-03-01
AU2008339211A1 (en) 2009-06-25
KR20100086000A (ko) 2010-07-29
WO2009078681A1 (en) 2009-06-25
EP2229677A4 (en) 2010-12-08
EP2229677B1 (en) 2015-09-16

Similar Documents

Publication Publication Date Title
CN101903944B (zh) 用于处理音频信号的方法和装置
JP4934427B2 (ja) 音声信号復号化装置及び音声信号符号化装置
CN104885149B (zh) 用于隐藏帧错误的方法和设备以及用于对音频进行解码的方法和设备
KR101346120B1 (ko) 오디오 인코딩 및 디코딩
US5651090A (en) Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor
EP1943643B1 (en) Audio compression
CN103765509B (zh) 编码装置及方法、解码装置及方法
EP2212884B1 (en) An encoder
CN101518083B (zh) 通过使用带宽扩展和立体声编码对音频信号编码和/或解码的方法和系统
KR101646650B1 (ko) 최적의 저-스루풋 파라메트릭 코딩/디코딩
US20100076774A1 (en) Audio decoder
CN105190747A (zh) 用于空间音频对象编码中时间/频率分辨率的反向兼容动态适应的编码器、解码器及方法
CN101568959B (zh) 用带宽扩展进行编码和/或解码的方法
CA2527971A1 (en) Fidelity-optimised variable frame length encoding
KR20090083070A (ko) 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치
KR102380370B1 (ko) 오디오 인코더 및 디코더
CN104838442A (zh) 用于反向兼容多重分辨率空间音频对象编码的编码器、译码器及方法
US20110238424A1 (en) Method and apparatus for encoding and decoding excitation patterns from which the masking levels for an audio signal encoding and decoding are determined
CN105378832A (zh) 利用对象特定时间/频率分辨率从混合信号分离音频对象
CN104919524A (zh) 用于确定编码模式的方法和设备、用于对音频信号进行编码的方法和设备以及用于对音频信号进行解码的方法和设备
CN1237507C (zh) 音频信号的编辑
CN102460574A (zh) 用于使用层级正弦脉冲编码对音频信号进行编码和解码的方法和设备
UA126393C2 (uk) Зворотно сумісне компонування гармонічного транспозера для реконструкції високих частот звукових сигналів
CN101292285B (zh) 编码和解码多声道音频信号的方法及其装置
JP4578145B2 (ja) 音声符号化装置、音声復号化装置及びこれらの方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant