CN1905010B - 编码音频数据的设备和方法及解码音频数据的设备和方法 - Google Patents

编码音频数据的设备和方法及解码音频数据的设备和方法 Download PDF

Info

Publication number
CN1905010B
CN1905010B CN2006100995477A CN200610099547A CN1905010B CN 1905010 B CN1905010 B CN 1905010B CN 2006100995477 A CN2006100995477 A CN 2006100995477A CN 200610099547 A CN200610099547 A CN 200610099547A CN 1905010 B CN1905010 B CN 1905010B
Authority
CN
China
Prior art keywords
signal
flow
produce
decoding
spectrum signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2006100995477A
Other languages
English (en)
Other versions
CN1905010A (zh
Inventor
大沼孝至
户栗康裕
渡边秀明
藤田式曜
鲍海峰
内野学
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN1905010A publication Critical patent/CN1905010A/zh
Application granted granted Critical
Publication of CN1905010B publication Critical patent/CN1905010B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一种编码音频数据的设备和方法及解码音频数据的设备和方法,该方法和设备能够分别产生和解码可扩展无损流并且能够缩短产生和解码无损流所需的时间。有损核心编码器单元对输入音频信号进行有损压缩,产生核心流。简化有损核心解码器单元仅解码指定带例如低频带的谱信号,以产生有损解码音频信号。减法器从延迟的输入音频信号中减去有损解码音频信号以产生残差信号。舍入单元进行构成残差信号的位数的舍入处理。无损增强编码器单元对残差信号进行无损压缩以产生增强流。流组合单元组合核心流和增强流以产生可扩展无损流。

Description

编码音频数据的设备和方法及解码音频数据的设备和方法
技术领域
本发明涉及一种音频数据编码设备、音频数据编码方法、音频数据解码设备、音频数据解码方法,其中的每一种对于有损压缩和无损压缩实现可扩展性(scalability)。
背景技术
已经提出一种音频编码设备,该设备对输入音频信号进行有损压缩以产生核心流,对残差信号进行无损压缩以产生增强流,并对这两种流组合以实现对于有损压缩和无损压缩的可扩展性(见专利文献1:美国专利申请公开2003/0171919号)。音频解码设备可将核心流解码从而产生有损解码音频信号,并且能够解码核心流和增强流,并将这两种解码的流相加以产生无损解码音频信号。
图1示意性地示出了过去使用的这种音频数据编码设备的结构的例子。如图1所示,音频数据编码设备100包括:有损核心编码器单元101,有损核心解码器单元102,延迟校正单元103,减法器104,无损增强编码器单元105,以及流组合单元106。
在音频数据编码设备100中,有损核心编码器单元101对输入音频信号进行有损压缩以产生核心流,该输入音频信号为脉冲编码调制(PCM)信号。有损核心解码器单元102解码核心流,以产生有损解码音频信号。延迟校正单元103将输入音频信号延迟该输入音频信号已在有损核心编码器单元101和有损核心解码器单元102中延迟的时间。减法器104从被延迟校正单元103延迟的输入音频信号中减去有损解码音频信号,以产生残差信号。无损增强编码器单元105对残差信号进行无损压缩,以产生增强流。流组合单元106将核心流和增强流组合以产生可扩展的无损流。
图2示意性地示出了被设计为与上述音频数据编码设备100结合使用的音频数据解码设备110的结构。如图2所示,音频数据解码设备110包括流划分单元111,有损核心解码器单元112,无损增强解码器单元113和加法器114。
在音频数据解码设备110中,流划分单元111将输入的可扩展无损流划分为核心流和增强流。有损核心解码器单元112将核心流解码产生作为有损PCM信号的解码音频信号。此时,无损增强解码器单元113将增强流解码以产生残差信号。加法器114在相同的时间轴上将残差信号加到有损音频信号上以产生作为无损PCM信号的解码音频信号。该解码音频信号从音频数据解码设备110输出。
图3示意性地示出了在音频数据编码设备100中有损核心编码器单元101可能具有的结构。如图3所示,有损核心编码器单元101可能包括带划分滤波器121,正弦波信号抽取单元122,时间-频率转换单元123,位分配单元124和多路复用器单元125。
在有损核心编码器单元101中,带划分滤波器121将输入音频信号划分为多个频带。正弦波信号抽取单元122从频带的时间信号中抽取正弦波信号,并向多路复用器单元125提供用来构成正弦波信号的参数。时间-频率转换单元123对已被抽取正弦波的各频带的时间信号进行变形的离散余弦变换(modified discrete cosinetransform,MDCT)。因此,单元123将这些时间信号转换为各频带的谱信号。位分配单元124将位分配给谱信号以产生量化的谱信号。多路复用器单元125组合用来构造正弦波信号的参数和量化谱信号以产生核心流。
图4示意性地示出了在上述音频数据编码设备100中有损核心解码器单元102可能具有的结构。注意,在音频数据解码设备110中设置的有损核心解码器单元112可以具有与有损核心解码器单元102相同的结构。如图4所示,有损核心解码器单元102包括:解多路复用器单元131,正弦波信号重构单元132,谱信号重构单元133,频率-时间转换单元134,增益控制单元135,正弦波信号相加单元136以及带合成滤波器137。
在有损核心解码器单元102中,解多路复用器单元131接收核心流,并将该流划分为用来构造正弦波信号的参数和量化谱信号。正弦波信号重构单元132从用来构造正弦波信号的参数重构正弦波信号。谱信号重构单元133将量化的谱信号解码以产生频带的谱信号。频率-时间转换单元134对谱信号进行逆MDCT(IMDCT),将这些信号转换为频带的时间信号。增益控制单元135调整每个时间信号的增益。正弦波信号相加单元136将正弦波加到已被调整增益的时间信号上。带合成滤波器137对频带的时间信号进行带合成以产生解码有损音频信号。
发明内容
对于解码有损流的大多数解码器所解码的信号规定了音质标准。换言之,大多数这种类型的解码器必须被设计为满足音质标准。
到目前为止,即使在产生和解码通常被无损压缩但包含有损压缩数据部分的可扩展无损流时,核心流被解码以产生并解码增强流。为了解码增强流,使用有损核心解码器(例如,在图1和图2中分别示出的有损核心解码器单元102和112)。因此,对于被设计用来处理可扩展无损流的任意音频信号编码器和任意音频信号解码器来说,需要比仅被设计用来处理无损流的音频信号编码器和音频信号解码器花费更长的时间来产生并解码无损流。
本发明鉴于上面所述内容做出。希望提供一种用于编码音频数据的方法和设备以及一种用于解码音频数据的方法和设备,该方法和设备能够分别产生和解码可扩展无损流并且能够缩短产生和解码无损流所需的时间。
根据本发明的实施例,提供一种音频数据编码设备(方法),包括:核心流编码部件(步骤),用于将输入音频信号划分为多个频带,对各频带的信号进行时间-频率转换以产生谱信号,对谱信号进行有损压缩以产生核心流;核心流解码部件(步骤),用于仅将核心流中指定频带的谱信号解码以产生解码信号;减法部件(步骤),用于从输入音频信号中减去解码信号以产生残差信号;增强流编码部件(步骤),用于对残差信号进行无损压缩以产生增强流;以及流组合部件(步骤),用于将核心流与增强流组合以产生可扩展无损流。
根据本发明的实施例,还提供一种音频数据解码设备(方法),包括:流划分部件(步骤),用于将可扩展无损流划分为核心流和增强流,可扩展无损流是通过组合核心流和增强流而产生的,核心流是通过将输入音频信号划分为多个频带、对各频带的信号进行时间-频率转换以产生谱信号、对谱信号进行有损压缩而获得的,增强流是通过对从输入音频信号中减去解码信号而产生的残差信号进行无损压缩而获得的;第一核心流解码部件(步骤),用于解码全部频带的谱信号以产生有损解码音频信号;第二核心流解码部件(步骤),用于仅解码核心流中指定频带的谱信号,从而产生解码信号;增强流解码部件(步骤),用于解码增强流以产生残差信号;以及加法部件(步骤),用于将残差信号加到解码信号以产生无损解码音频信号。
根据本发明的实施例,还提供一种音频数据解码设备(方法),包括:流划分部件(步骤),用于将可扩展无损流划分为核心流和增强流,可扩展无损流是通过组合核心流和增强流而产生的,核心流是通过将输入音频信号划分为多个频带、对频带的信号进行时间-频率转换以产生谱信号、对谱信号进行有损压缩而获得的,增强流是通过对从输入音频信号中减去解码信号而产生的残差信号进行无损压缩而获得的;核心流解码部件(步骤),用于在解码全部频带的谱信号以产生有损解码音频信号或仅解码指定频带的谱信号以产生解码信号之间切换;增强流解码部件(步骤),用于解码增强流以产生残差信号;以及加法部件(步骤),用于在通过仅解码指定频带的谱信号来产生所述解码信号的情况下,将残差信号加到解码信号以产生无损解码音频信号。
在每个根据本发明的用于编码音频数据的方法和设备以及用于解码音频数据的方法和设备中,为了产生和解码增强流,仅解码指定频带的谱信号。因此,产生和解码增强流所需的时间缩短。
附图说明
图1是示意性地示出过去使用的音频数据编码设备的图;
图2是示意性地示出过去使用的音频数据解码设备的图;
图3是示意性地示出包含在过去使用的音频数据编码设备中的有损核心编码器单元的图;
图4是示意性地示出包含在过去使用的音频数据编码设备中的有损核心解码器单元的图;
图5是示意性地示出根据本发明的第一实施例的音频数据编码设备的图;
图6是描述图5的音频数据编码设备中所设置的无损增强编码器的内部结构的图;
图7是示出在图5的设备中所产生的可扩展无损流的结构的图;
图8是示意性地示出根据本发明的第一实施例的音频数据解码设备的图;
图9是描述图8的音频数据解码设备中所设置的无损增强编码器的内部结构的图;
图10是表示以2的余数表达的有符号整数和整数的低n位之间关系的图;
图11是示意性地示出在图1的音频数据编码设备中使用的简化有损核心解码器单元的图;
图12是示意性地示出根据本发明的第二实施例的音频数据解码设备的图;
图13是示意性地示出包含在图12的音频数据解码设备中的整体有损核心解码器单元的图;
图14是示意性地示出在整体有损核心解码器单元中设置的谱信号重构单元的图;以及
图15A和15B是示出定点运算和小数点位置之间关系的概念图。
具体实施方式
参考附图描述本发明的实施例。
第一实施例
图5示出根据本发明的第一实施例的音频数据编码设备。如图5所示,音频数据编码设备10包括:有损核心编码器单元11,简化有损核心解码器单元12,延迟校正单元13,减法器14,舍入单元15,无损增强编码器单元16,以及流组合单元17。
在音频数据编码设备10中,具有如图3所示结构的有损核心编码器单元11对输入音频信号进行有损压缩以产生核心流,该输入音频信号为脉冲编码调制(PCM)信号。核心流由用来构造正弦波信号的参数和量化谱信号组成。有损核心编码器单元11为简化有损核心解码器单元12和流组合单元17提供核心流。
简化有损核心解码器单元12从有损核心编码器单元11接收核心流,并将其解码以产生提供给减法器14的有损解码音频信号。简化有损核心解码器单元12进行比图4中所示的过去使用的有损核心解码器单元的处理简单的处理。这点将在后面说明。
减法器14从输入音频信号中减去有损解码音频信号,该输入音频信号已被延迟校正单元13延迟在简化有损核心解码器单元12中所延迟的时间。因此,减法器14产生残差信号,该残差信号提供给舍入单元15。
舍入单元15将残差信号舍入为与输入音频信号和解码信号具有相同位数的信号。舍入过的残差信号提供到无损增强编码器单元16。更具体地,如果输入音频信号和解码信号为n位信号,则残差信号即减法的结果为n+1位信号。但是,舍入单元15将残差信号转变为n位信号。舍入单元15所进行的处理将在后面描述。
无损增强编码器单元16对残差信号进行无损压缩以产生增强流。增强流提供到流组合单元17。如图6所示,无损增强编码器单元16具有预测器21和熵编码单元22。预测器21通过使用线性预测编码(LPC)从残差信号中产生预测参数,并产生代表残差信号与预测信号之差的差信号。熵编码单元22对预测参数和差信号进行例如Golomb-Rice编码以产生增强流。
流组合单元17将核心流和增强流组合以产生可扩展无损流。可扩展无损流从音频数据编码设备10输出到外部设备。
图7示出所产生的可扩展无损流的结构。如图7所示,可扩展无损流由流头(stream header)和音频数据组成。音频数据跟在流头之后。流头由元数据与音频数据头组成。音频数据由多个音频数据帧组成。除了开头的音频数据帧之外的所有音频数据帧由同步信号、帧头、核心层帧数据和增强层帧数据组成。由于在有损核心编码器单元11和简化有损核心解码器单元12中产生的延迟,开头的音频数据帧没有增强层帧数据。
在音频数据编码设备10中,以1024个样本或2048个样本为处理单位处理音频信号。以哪个处理单位处理音频信号取决于有损核心编码器单元11处理数据的处理单位。即,如果有损核心编码器单元11以1024个样本为处理单位处理数据,则音频数据编码设备10也以1024个样本为处理单位处理数据。如果有损核心处理器单元11以2048个样本为处理单位处理数据,音频数据编码设备10也以2048个样本为处理单位处理数据。
图8示意性地示出根据本发明的第一实施例的音频数据解码设备。如图8所示,音频数据解码设备30包括:流划分单元31,普通有损核心解码器单元32,简化有损核心解码器单元33,开关34,无损增强解码器单元35,加法器36,舍入单元37。
在音频数据解码设备30中,流划分单元31接收可扩展无损流并且将其划分为核心流和增强流。核心流提供给普通有损核心解码器单元32或简化有损核心解码器单元33。同时,增强流提供给无损增强解码器单元35。有损核心解码器单元32或33中的哪一个接收核心流取决于开关34怎样操作。更具体地,为了产生有损解码音频信号,核心流提供给普通有损核心解码器单元32,或者为了产生无损解码音频信号,核心流提供给简化有损核心解码器单元33。
普通有损核心解码器单元32具有如图4所示的结构。该单元32从流划分单元31接收核心流并且将其解码以产生解码音频信号,该解码音频信号为有损PCM信号。有损PCM信号输出到外部设备。
简化有损核心解码器单元33从流划分单元31接收核心流并将其解码以产生解码信号。解码信号提供给加法器36。简化有损核心解码器单元33进行比图4所示的过去使用的有损核心解码器单元简单的处理。这点将在后面说明。
无损增强解码器单元35从流划分单元31接收增强流并将其解码以产生残差信号。残差信号提供给加法器36。如图9所示,无损增强解码器单元35具有熵解码单元41以及逆预测器42。熵解码单元41将通过Golomb-Rice编码部件所获得的增强流解码。逆预测器42对解码增强流进行例如LPC合成,以产生残差信号。
加法器36在相同的时间轴上将残差信号加到解码信号上以产生解码音频信号,该解码音频信号为无损PCM信号。无损PCM信号提供给舍入单元37。
舍入单元37将无损解码音频信号舍入为与残差信号和解码信号具有相同位数的信号。因此,舍入单元37产生有损解码音频信号,该音频信号输出到外部设备。如果残差信号和解码信号为n位信号,则无损解码音频信号即加法器36的输出为n+1位信号。舍入单元37将该无损解码音频信号舍入为n位信号。下面将描述由舍入单元37对无损解码音频信号的舍入处理。
下面说明在舍入单元15和37中进行的处理。
如果输入音频信号和解码信号为n位信号,则残差信号即减法的结果将为n+1位信号。舍入单元15将该残差信号转换为n位信号。从而残差信号能有效地进行熵编码。因此,音频数据解码设备30能容易地在定点LSI中实现,其中数据以n位或者更少位为单位处理。
在舍入单元15中将信号舍入为n位信号的方法例如下面所示:
Z=R-2M(R≥M)
Z=R+2M(R<-M)
其中,R为残差信号(即,有符号的n+1位整数),Z为舍入后的残差信号(即,有符号的n位整数),M=2n-1
残差信号可以表示为2的余数。于是,仅通过获取作为有符号整数R的低n位可以得到Z。图10表示以2的余数表达的有符号整数与该整数的低n位之间的关系。在上半个圆中表示任意正值,沿着顺时针的方向增加,而在下半个圆中表示任意负值,沿着逆时针的方向增加。+M和-M具有相同的记数法。当R超过+M或-M时,颠倒符号。
舍入单元37以上述相同的方式进行n+1位无损解码音频信号的舍入处理。
n=16位并且M=32768的情况将作为例子进行说明。
如果音频数据编码设备10接收输入音频信号X并且输出解码信号Y,X=32000,Y=-6000,则由减法器14产生的残差信号为R=X-Y=38000(二进制记数法:1001 0100 0111 0000)。舍入单元15抽取R的低16位,将它们转换为有符号整数。因此,残差信号能够容易地舍入为舍入残差信号Z,Z=-27536(二进制记数法:1001 0100 0111 0000)。
在音频数据解码设备30中,通过加法器36产生的无损解码音频信号为残差信号Z和解码信号Y的和,即Z+Y=-33536(二进制记数法:1011 1101 0000 0000)。舍入单元37抽取和的低16位,从而恢复音频信号X,即,X=32000(二进制记数法:0111 1101 00000000),其与输入音频信号相同。
图11示意性地示出用于音频数据编码设备10中的简化有损核心解码器单元12。注意,包含在音频数据解码设备30中的简化有损核心解码器单元33具有与简化有损核心解码器单元12相同的结构。如图11所示,简化有损核心解码器单元12包括:解多路复用器单元41,谱信号重构单元42,频率-时间转换单元43,增益控制单元44,以及带合成滤波器45。
在简化有损核心解码器单元12中,解多路复用器单元41接收核心流,并将该流划分为用于构造正弦波信号的参数和量化谱信号。解多路复用器单元41仅将量化谱信号提供到谱信号重构单元42。
谱信号重构单元42从解多路复用器单元41接收量化谱信号并将它们解码以产生频带的谱信号。谱信号提供到频率-时间转换单元43。
频率-时间转换单元43仅对指定带例如低频带的谱信号进行IMDCT,该谱信号从谱信号重构单元42提供。单元43将这些谱信号转换为时间信号。频率-时间转换单元43将指定带的时间信号提供到增益控制单元44。
增益控制单元44调整从频率-时间转换单元43提供的每个指定带的时间信号的增益。被调整增益的时间信号提供到带合成滤波器45。
带合成滤波器45对从增益控制单元44提供的指定带的时间信号进行带合成,产生解码信号。
在根据本实施例的简化有损核心解码器单元12和33中,仅对指定频带的谱信号进行如上所述的解码。它们不重构正弦波信号。如果数据处理的结果具有小于数据保持记录器(未示出)的分辨率的小数的值,则不进行舍入处理。因此,在简化有损核心解码器12和33中的处理比在过去使用的有损核心解码器单元中的处理轻松。
分别具有简化有损核心解码器单元12和33的音频数据编码设备10和音频数据解码设备30,能用比过去所用设备短的时间编码和解码增强流。
第二实施例
根据第一实施例的简化有损核心解码器单元12和33进行简单的处理。因此,没有产生满足预定音质标准的有损解码音频信号。因此,对于音频数据解码设备30来说,为了产生有损解码音频信号,除了简化有损核心解码器单元33之外,需要具有普通有损核心解码器单元32。具有两种类型有损核心解码器的音频数据解码设备30具有更大的数据存储容量。这不可避免地增加了音频数据解码设备30的制造成本。
为了解决这个问题,普通有损核心解码器单元和简化有损核心解码器单元集成在根据本发明的第二实施例的音频数据解码设备中。
图12示出了根据本发明第二实施例的音频数据解码设备50。对与图8所示的音频数据解码设备30中相似的部件指定了相同的附图标记,并不再详细描述。如图12所示,音频数据解码设备50包括:流划分单元31,操作模式控制单元51,整体有损核心解码器单元52,无损增强解码器单元35,加法器36和舍入单元37。
在音频数据解码设备50中,操作模式控制单元51将操作模式信号提供到整体有损核心解码器单元52。操作模式信号代表输出到外部设备的有损解码音频信号或无损解码音频信号的模式。
根据从操作模式控制单元51提供的操作模式信号,整体有损核心解码器单元52进行普通处理以产生有损解码音频信号(如图8中所示的普通有损核心解码器单元32)或进行简化处理以产生解码信号(如图8中所示的简化有损核心解码器单元33)。如果整体有损核心解码器单元52进行普通处理,则其将有损解码音频信号输出到外部设备。如果其进行简化处理,则其将解码信号提供到加法器36。
图13示意性地示出了整体有损核心解码器单元52。对与图11所示的简化有损核心解码器单元33中相似的部件指定了相同的附图标记,并不再详细描述。如图13所示,整体有损核心解码器单元52包括:解多路复用器单元41,开关控制单元61,正弦波信号重构单元62,谱信号重构单元63,开关64,频率-时间转换单元43,增益控制单元44,正弦波信号相加单元65以及带合成滤波器45。
在整体有损核心解码器单元52中,开关控制单元61接收来自操作模式控制单元51的操作模式信号。根据操作模式信号,单元52向正弦波信号重构单元62、谱信号重构单元63和开关64提供开关信号,切换正弦波信号重构单元62和谱信号重构单元63的操作,并打开或关闭开关64。
正弦波信号重构单元62根据来自开关控制单元61的开关信号切换其操作模式。更具体地,正弦波信号重构单元62重构正弦波信号以产生无损解码音频信号,并且正弦波信号重构单元62不使用将正弦波信号构造为有损解码音频信号的参数。
谱信号重构单元63接收来自解多路复用器单元41的量化谱信号,并将其解码以产生频带的谱信号。为了产生谱信号,谱信号重构单元63根据从开关控制单元61提供的开关信号,从一个逆量化表切换到另一个。下面详细描述谱信号重构单元63进行的处理。
通过从开关控制单元61所提供的开关信号打开或关闭开关64。更具体地,开关64断开,从而产生有损解码音频信号;开关64接通,从而产生无损解码音频信号。因此,为了产生有损解码音频信号,仅指定带例如低频带的谱信号被提供到下一级部件。为了产生无损解码音频信号,所有频带的谱信号被提供到下一级部件。
当正弦波信号相加单元65接收来自正弦波信号重构单元62的正弦波信号时,其将正弦波信号加到每一个频带的时间信号上。
图14示出了谱信号重构单元63。如图14所示,谱信号重构单元63包括:信号重构单元71,表存储单元72,开关73和数据偏移单元74。
信号重构单元71通过使用从表存储单元72提供的32位系数表或从数据偏移单元74提供的24位系数表,对谱信号进行逆量化。通过开关73的操作确定从表存储单元72提供的表或从数据偏移单元74提供的表中的哪一个系数表提供到单元71。更具体地,存储于表存储单元72中的32位系数表为了产生有损解码音频信号而被提供到数据偏移单元74,或者为了产生无损解码音频信号而被提供到信号重构单元71。在数据偏移单元74中,32位系数表的系数数据向右滤除8位以产生24位系数表。24位系数表被提供到信号重构单元71。因此,系数表在谱信号重构单元63中公用地处理。这节省了所用存储器的存储区域。
在谱信号重构单元63中,基于定点运算的基本思想,不但系数表而且源代码也被公用地处理。图15A和15B示出了定点运算和小数点位置之间的关系。如上所述,在谱信号重构单元63中,24位系数表用来产生有损解码音频信号,32位系数表用来产生无损解码音频信号。由于信号字长的差别,小数点的位置变化,不可避免地改变小数值。但是,如果小数点位于0位或者更高位所代表的位置,则整数的精度不会改变。即,通过改变小数点的位置可以控制运算的精度。谱信号重构单元63利用了定点运算的这个特性,因此源代码被公用地处理。
如上所述,普通有损核心解码器单元和简化有损核心解码器单元集成在整体有损核心解码器单元52中。因此,音频数据解码设备50不再必须具有两种类型的有损核心解码器单元。因此,在音频数据解码设备50中某些存储区域能被节省。实际上,通过集成普通和简化有损核心解码器单元,存储区域能被减少到不集成所需区域的约一半(约55%)。
本发明不局限于上述实施例。当然可以实现各种变化和变形而不脱离本发明的范围和精神。
例如,本发明不局限于例如上述实施例的硬件结构。任何处理可以通过使中央处理单元(CPU)执行计算机程序来进行。在这种情况下,计算机程序可以以记录介质的形式提供或者通过例如英特网的传输网络获取。
本领域的技术人员应该可以理解,可以依赖于设计要求和其它因素进行各种变形、组合、子组合以及变化,只要它们在所附权利要求或其等同的范围内即可。
本发明含有与2005年7月29日在日本专利局提交的日本专利申请JP2005-221524有关的主题,在此引入其全部内容作为参考。

Claims (12)

1.一种音频数据编码设备,其包括:
核心流编码部件,用于将输入音频信号划分为多个频带,对各所述频带的所述信号进行时间-频率转换以产生谱信号,对所述谱信号进行有损压缩以产生核心流;
核心流解码部件,用于仅将所述核心流中指定频带的谱信号解码以产生解码信号;
减法部件,用于从所述输入音频信号中减去所述解码信号以产生残差信号;
增强流编码部件,用于对所述残差信号进行无损压缩以产生增强流;以及
流组合部件,用于将所述核心流与所述增强流组合以产生可扩展无损流。
2.根据权利要求1所述的音频数据编码设备,其特征在于,
所述核心流编码部件对已被抽取了正弦波信号的每个频带的分量进行时间-频率转换以产生谱信号,量化所述谱信号以产生量化谱信号,将所述量化谱信号与所述正弦波信号的信息组合以产生所述核心流,以及
所述核心流解码部件对所述量化谱信号进行逆量化以产生所述频带的谱信号,仅对所述指定频带的所述谱信号进行频率-时间转换,进行带合成以产生所述解码信号。
3.根据权利要求1所述的音频数据编码设备,其特征在于,还包括舍入部件,该舍入部件用于将所述残差信号的位数舍入为与所述输入音频信号和所述解码信号中的每一个的位数相同,其中
所述增强流编码部件对舍入后的残差信号进行无损压缩以产生所述增强流。
4.根据权利要求1所述的音频数据编码设备,其特征在于,所述核心流解码部件仅解码所述核心流中低频带的谱信号。
5.一种音频数据编码方法,其包括:
核心流编码步骤,用于将输入音频信号划分为多个频带,对各所述频带的所述信号进行时间-频率转换以产生谱信号,对所述谱信号进行有损压缩以产生核心流;
核心流解码步骤,用于仅将所述核心流中指定频带的谱信号解码以产生解码信号;
减法步骤,用于从所述输入音频信号中减去所述解码信号以产生残差信号;
增强流编码步骤,用于对所述残差信号进行无损压缩以产生增强流;以及
流组合步骤,用于将所述核心流与所述增强流组合以产生可扩展无损流。
6.一种音频数据解码设备,其包括:
流划分部件,用于将可扩展无损流划分为核心流和增强流,所述可扩展无损流是通过组合所述核心流和所述增强流而产生的,所述核心流是通过将输入音频信号划分为多个频带、对各所述频带的信号进行时间-频率转换以产生谱信号、对所述谱信号进行有损压缩而获得的,所述增强流是通过对从所述输入音频信号中减去解码信号而产生的残差信号进行无损压缩而获得的;
第一核心流解码部件,用于解码全部频带的谱信号以产生有损解码音频信号;
第二核心流解码部件,用于仅解码所述核心流中指定频带的谱信号,从而产生解码信号;
增强流解码部件,用于解码所述增强流以产生所述残差信号;以及
加法部件,用于将所述残差信号加到所述解码信号以产生无损解码音频信号。
7.根据权利要求6所述的音频数据解码设备,其特征在于,
所述核心流是通过对被抽取了正弦波信号的频带的信号进行时间-频率转换以产生谱信号、量化所述谱信号以产生量化谱信号、并组合所述量化谱信号和所述正弦波信号的信息而获得的,以及
所述第二核心流解码部件对所述量化谱信号进行逆量化以产生各频带的谱信号,仅对所述指定频带的所述谱信号进行频率-时间变换,进行带合成,从而产生所述解码信号。
8.根据权利要求6所述的音频数据解码设备,其特征在于,还包括舍入部件,该舍入部件用于将构成所述无损解码音频信号的位数舍入为与构成所述解码信号和所述残差信号中的每一个相同的位数。
9.根据权利要求6所述的音频数据解码设备,其特征在于,所述第二核心流解码部件仅解码所述核心流中低频带的谱信号。
10.一种音频数据解码方法,其包括:
流划分步骤,用于将可扩展无损流划分为核心流和增强流,所述可扩展无损流是通过组合所述核心流和所述增强流而产生的,所述核心流是通过将输入音频信号划分为多个频带、对各所述频带的信号进行时间-频率转换以产生谱信号、对所述谱信号进行有损压缩而获得的,所述增强流是通过对从所述输入音频信号中减去解码信号而产生的残差信号进行无损压缩而获得的;
第一核心流解码步骤,用于解码全部频带的谱信号以产生有损解码音频信号;
第二核心流解码步骤,用于仅解码所述核心流中指定频带的谱信号,以产生解码信号;
增强流解码步骤,用于解码所述增强流以产生所述残差信号;以及
加法步骤,用于将所述残差信号加到所述解码信号以产生无损解码音频信号。
11.一种音频数据解码设备,其包括:
流划分部件,用于将可扩展无损流划分为核心流和增强流,所述可扩展无损流是通过组合所述核心流和所述增强流而产生的,所述核心流是通过将输入音频信号划分为多个频带、对各所述频带的信号进行时间-频率转换以产生谱信号、对所述谱信号进行有损压缩而获得的,所述增强流是通过对从所述输入音频信号中减去解码信号而产生的残差信号进行无损压缩而获得的;
核心流解码部件,用于在解码全部频带的谱信号以产生有损解码音频信号或仅解码指定频带的谱信号以产生解码信号之间切换;
增强流解码部件,用于解码所述增强流以产生所述残差信号;以及
加法部件,用于在通过仅解码指定频带的谱信号来产生所述解码信号的情况下,将所述残差信号加到所述解码信号以产生无损解码音频信号。
12.一种音频数据解码方法,其包括:
流划分步骤,用于将可扩展无损流划分为核心流和增强流,所述可扩展无损流是通过组合所述核心流和所述增强流而产生的,所述核心流是通过将输入音频信号划分为多个频带、对各所述频带的信号进行时间-频率转换以产生谱信号、对所述谱信号进行有损压缩而获得的,所述增强流是通过对从所述输入音频信号中减去解码信号而产生的残差信号进行无损压缩而获得的;
核心流解码步骤,用于在解码全部频带的谱信号以产生有损解码音频信号或仅解码指定频带的谱信号以产生解码信号之间切换;
增强流解码步骤,用于解码所述增强流以产生所述残差信号;以及
加法步骤,用于在通过仅解码指定频带的谱信号来产生所述解码信号的情况下,将所述残差信号加到所述解码信号以产生无损解码音频信号。
CN2006100995477A 2005-07-29 2006-07-28 编码音频数据的设备和方法及解码音频数据的设备和方法 Expired - Fee Related CN1905010B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2005-221524 2005-07-29
JP2005221524 2005-07-29
JP2005221524A JP4640020B2 (ja) 2005-07-29 2005-07-29 音声符号化装置及び方法、並びに音声復号装置及び方法

Publications (2)

Publication Number Publication Date
CN1905010A CN1905010A (zh) 2007-01-31
CN1905010B true CN1905010B (zh) 2010-10-27

Family

ID=37674259

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006100995477A Expired - Fee Related CN1905010B (zh) 2005-07-29 2006-07-28 编码音频数据的设备和方法及解码音频数据的设备和方法

Country Status (3)

Country Link
US (1) US8566105B2 (zh)
JP (1) JP4640020B2 (zh)
CN (1) CN1905010B (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7536305B2 (en) * 2002-09-04 2009-05-19 Microsoft Corporation Mixed lossless audio compression
EP1883067A1 (en) * 2006-07-24 2008-01-30 Deutsche Thomson-Brandt Gmbh Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
US7385532B1 (en) * 2007-02-16 2008-06-10 Xilinx, Inc. Extended bitstream and generation thereof for dynamically configuring a decoder
CN101325058B (zh) * 2007-06-15 2012-04-25 华为技术有限公司 语音编码发送和接收解码的方法及装置
JP4973422B2 (ja) * 2007-09-28 2012-07-11 ソニー株式会社 信号記録再生装置及び方法
US8386271B2 (en) 2008-03-25 2013-02-26 Microsoft Corporation Lossless and near lossless scalable audio codec
CN102341844B (zh) * 2009-03-10 2013-10-16 日本电信电话株式会社 编码方法、解码方法、编码装置、解码装置
EP2348504B1 (en) * 2009-03-27 2014-01-08 Huawei Technologies Co., Ltd. Encoding and decoding method and device
ES2644520T3 (es) 2009-09-29 2017-11-29 Dolby International Ab Decodificador de señal de audio MPEG-SAOC, método para proporcionar una representación de señal de mezcla ascendente usando decodificación MPEG-SAOC y programa informático usando un valor de parámetro de correlación inter-objeto común dependiente del tiempo/frecuencia
CN101964188B (zh) 2010-04-09 2012-09-05 华为技术有限公司 语音信号编码、解码方法、装置及编解码系统
CN104170007B (zh) * 2012-06-19 2017-09-26 深圳广晟信源技术有限公司 对单声道或立体声进行编码的方法
US9711150B2 (en) 2012-08-22 2017-07-18 Electronics And Telecommunications Research Institute Audio encoding apparatus and method, and audio decoding apparatus and method
WO2014030938A1 (ko) * 2012-08-22 2014-02-27 한국전자통신연구원 오디오 부호화 장치 및 방법, 오디오 복호화 장치 및 방법
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
CN106233112B (zh) * 2014-02-17 2019-06-28 三星电子株式会社 信号编码方法和设备以及信号解码方法和设备
WO2015122752A1 (ko) 2014-02-17 2015-08-20 삼성전자 주식회사 신호 부호화방법 및 장치와 신호 복호화방법 및 장치
US9779739B2 (en) * 2014-03-20 2017-10-03 Dts, Inc. Residual encoding in an object-based audio system
SG11202004389VA (en) 2017-11-17 2020-06-29 Fraunhofer Ges Forschung Apparatus and method for encoding or decoding directional audio coding parameters using quantization and entropy coding
WO2021145105A1 (ja) * 2020-01-15 2021-07-22 ソニーグループ株式会社 データ圧縮装置、およびデータ圧縮方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1547708A (zh) * 2001-07-19 2004-11-17 �����ɷ� 以无损方式对数字图像和音频数据解码的系统和方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0756386B1 (en) * 1995-07-27 2003-09-17 Victor Company Of Japan, Limited Method and apparatus for coding a digital, acoustic signal
US6675148B2 (en) * 2001-01-05 2004-01-06 Digital Voice Systems, Inc. Lossless audio coder
JP2003115765A (ja) * 2001-10-04 2003-04-18 Sony Corp 符号化装置及び符号化方法、復号装置及び復号方法、並びに編集装置及び編集方法
KR100908114B1 (ko) * 2002-03-09 2009-07-16 삼성전자주식회사 스케일러블 무손실 오디오 부호화/복호화 장치 및 그 방법
JP2003280694A (ja) * 2002-03-26 2003-10-02 Nec Corp 階層ロスレス符号化復号方法、階層ロスレス符号化方法、階層ロスレス復号方法及びその装置並びにプログラム
US20040230425A1 (en) * 2003-05-16 2004-11-18 Divio, Inc. Rate control for coding audio frames
DE102004007184B3 (de) * 2004-02-13 2005-09-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zum Quantisieren eines Informationssignals
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1547708A (zh) * 2001-07-19 2004-11-17 �����ɷ� 以无损方式对数字图像和音频数据解码的系统和方法

Also Published As

Publication number Publication date
US20070043575A1 (en) 2007-02-22
JP2007034230A (ja) 2007-02-08
JP4640020B2 (ja) 2011-03-02
US8566105B2 (en) 2013-10-22
CN1905010A (zh) 2007-01-31

Similar Documents

Publication Publication Date Title
CN1905010B (zh) 编码音频数据的设备和方法及解码音频数据的设备和方法
JP5200028B2 (ja) 符号化および復号化のための装置
JP4801160B2 (ja) 逐次改善可能な格子ベクトル量子化
JP4081447B2 (ja) 時間離散オーディオ信号を符号化する装置と方法および符号化されたオーディオデータを復号化する装置と方法
JP4506039B2 (ja) 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
TW201007699A (en) Compression of audio scale-factors by two-dimensional transformation
WO2006030865A1 (ja) スケーラブル符号化装置、スケーラブル復号化装置、スケーラブル符号化方法、スケーラブル復号化方法、通信端末装置および基地局装置
JP2012226375A (ja) 無損失オーディオ復号化方法及び無損失オーディオ復号化装置
JP2007193043A (ja) 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法
JP3900000B2 (ja) 符号化方法及び装置、復号方法及び装置、並びにプログラム
JP2002335161A (ja) 信号処理装置及び方法、信号符号化装置及び方法、並びに信号復号装置及び方法
JP4978539B2 (ja) 符号化装置、符号化方法及びプログラム。
JPH10285048A (ja) デジタルデータの符号化/復号化方法及び装置
Geiger et al. ISO/IEC MPEG-4 high-definition scalable advanced audio coding
JP2001044847A (ja) 可逆符号化方法、可逆復号化方法、これらの装置及びその各プログラム記録媒体
JP5303074B2 (ja) 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
JPH1020897A (ja) 適応変換符号化方式および適応変換復号方式
JP3557164B2 (ja) オーディオ信号符号化方法及びその方法を実行するプログラム記憶媒体
JP4918103B2 (ja) 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
JP4369140B2 (ja) オーディオ高能率符号化装置、オーディオ高能率符号化方法、オーディオ高能率符号化プログラム及びその記録媒体
JP2004246038A (ja) 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム
WO2010067799A1 (ja) 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
JP4848049B2 (ja) 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
Dunn Scalable bitplane runlength coding
Geiger et al. Scalable perceptual and lossless audio coding based on MPEG-4 AAC

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20101027

Termination date: 20210728

CF01 Termination of patent right due to non-payment of annual fee