CN1774957A - 音频信号生成 - Google Patents
音频信号生成 Download PDFInfo
- Publication number
- CN1774957A CN1774957A CNA2004800102851A CN200480010285A CN1774957A CN 1774957 A CN1774957 A CN 1774957A CN A2004800102851 A CNA2004800102851 A CN A2004800102851A CN 200480010285 A CN200480010285 A CN 200480010285A CN 1774957 A CN1774957 A CN 1774957A
- Authority
- CN
- China
- Prior art keywords
- subband
- signal
- audio signal
- input
- delay
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 61
- 230000003111 delayed effect Effects 0.000 claims abstract description 11
- 150000001875 compounds Chemical class 0.000 claims description 18
- 238000000034 method Methods 0.000 claims description 9
- 230000001934 delay Effects 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 5
- 230000008676 import Effects 0.000 claims description 2
- 238000010189 synthetic method Methods 0.000 claims description 2
- 230000007704 transition Effects 0.000 description 14
- 238000005070 sampling Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 102000004127 Cytokines Human genes 0.000 description 4
- 108090000695 Cytokines Proteins 0.000 description 4
- 239000002131 composite material Substances 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- PEIBAWRLFPGPAT-UHFFFAOYSA-N 1-(diazomethyl)pyrene Chemical compound C1=C2C(C=[N+]=[N-])=CC=C(C=C3)C2=C2C3=CC=CC2=C1 PEIBAWRLFPGPAT-UHFFFAOYSA-N 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 229920002939 poly(N,N-dimethylacrylamides) Polymers 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 206010019133 Hangover Diseases 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000005316 response function Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 230000003245 working effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
Abstract
基于一个输入音频信号生成了一个输出音频信号(L,R),该输入音频信号包括多个输入子带信号(N)。这些输入子带信号在多个延迟单元(76)中被延迟以获得多个延迟的子带信号,其中至少一个输入子带信号要比另一个较高频率的输入子带信号被延迟得更多,并且其中输出音频信号是从输入音频信号和多个延迟的子带信号的组合中导出(77)的。
Description
本发明涉及基于一个输入音频信号生成一个输出音频信号,特别涉及一种用于供应输出音频信号的设备。
Eric Schuijers,Werner Oomen,Bert den Brinker和JeroenBreebaat在2003年3月22-25日在荷兰阿姆斯特丹召开的第114届美国电化学协会(AES)大会的未定稿版5852上的“用于高质量音频的参数编码进展”一文中,公布了一种使用用于立体影像的有效参数表示的参数编码方案。两个输入信号被合并成了一个单声道音频信号。在知觉上相关的空间提示被明确地建模。使用单声道参数编码器对合并信号进行编码。立体声参数通道间强度差(IID)、通道间时间差(ITD)和通道间互相关(ICC)被量化、编码,并与经量化编码的单声道音频信号一起被多路复用成一个比特流。在解码器侧,该比特流被多路分解成一个编码的单声道信号和立体声参数。该编码的单声道音频信号被解码以获得一个解码的单声道音频信号m`(见图1)。使用产生最佳知觉去相关的滤波器D10,能够从单声道时域信号中计算出一个去相关信号。单声道时域信号m`和去相关信号d都被变换到频域。接着,为了获得解码的立体声对1`和r`,在参数处理单元11中借助IID、ITD和ICC参数,分别通过缩放、相位修改和混合来处理频域立体声信号。所得的频域表示被变换回时域。
在MPEG-4(ISO/IEC 14496-3:2002)建议的草案修正案(PDAM)2的第5.4.6节,通过借助一个预定义的脉冲响应来对单声道信号进行卷积/滤波,来获得这样一种去相关信号。
新近公布的欧洲专利申请02077863.5(代理人案号PHNL020639)描述了例如梳状滤波器的全通滤波器的使用,包括导出这种去相关信号的一种依赖频率的延迟。在高频上,使用相对小的延迟,导致粗糙的频率分辨率。在低频上,大的延迟导致梳状滤波器的密集间隔。可以结合一个带宽限制滤波器进行滤波,从而将去相关应用到一个或多个频带。
本发明的一个目的是基于一个输入音频信号来有利地生成一个输出音频信号。为此,本发明提供了如在独立权利要求中定义的一种装置、一种方法和一种设备。在从属权利要求中定义了有利的实施例。
根据本发明的第一个方面,基于一个输入音频信号生成了一个输出音频信号,该输入音频信号包括多个输入子带信号,其中至少部分的输入子带信号被延迟以获得多个延迟的子带信号,其中至少一个输入子带信号要比另外一个较高频率的输入子带信号被延迟得更多,并且其中输出音频信号是从输入音频信号和多个延迟的子带信号的组合中导出的。通过在子带域中提供这种依赖频率的延迟,可以有利地实现参数立体声,特别是在那些核心解码器已经包括一个子带滤波器组的音频解码器中。滤波器组通常被用在音频编码环境中,例如MPEG-1/2的I,II,III层都利用32频带的精密采样子带滤波器。多个延迟的子带信号可被用作上面描述的去相关信号的子带域等价物。在理想的情况下,多个延迟的子带信号和输入音频信号的相关性为零。然而,在实际的实施例中,对于可以接受的音频质量,相关性可达40%,对于中等到高质量的音频,相关性可达10%,并且对于高音频质量,相关性可达2%或3%。
在本发明的一个实施例中,输出音频信号包括多个输出子带信号。为了获得多个输出子带信号,在子带域实现延迟的子带信号和输入子带信号的合并是相对容易的。在实际的实施例中,在一个合成子带滤波器组中从多个输出子带信号中合成了一个时域输出音频信号。
为了获得一个有效的实现,提供了多个延迟单元,其中延迟单元的数量比输入子带信号的数量要少,并且其中输入子带信号在多个延迟上被细分成组。
在多个延迟单元中的延迟从高频到低频单调递增的实施例中,获得了最佳音频质量。
在本发明的一个有利的实施例中,使用了一个复合的滤波器组,它以因子2被有效地过采样,因为对于每个实输入采样都生成了一个复输出采样,该输出采样由两个值构成:一个实值和一个复值。这消除了MPEG-1和MPEG-2精密采样滤波器组所遭受的大的重叠部分。
在生成输出音频信号的一个有效的实施例中,使用了一个正交镜像滤波器(QMF)组。这种滤波器本质上是从Per Ekstrand在MPCA-2002上发表的“通过频谱带复制扩展音频信号的带宽”(Proc.lstIEEE Benelux Workshop on Model based Processing and Coding ofAudio,pp.53-58,Leuven,Belgium,November 15,2002)一文而周知的。图2示出了这种复合QMF分析与合成滤波器组的一个方框图。分析组30将信号分成了N个复值子带,这些子带在内部以因子N被下采样。图3示出了一个程式化的频率响应。合成QMF滤波器组31将N个复合子带信号作为输入,并生成一个实值PCM输出信号。根据发明人的理解,当使用一个复合QMF滤波器组时,可以创建一个在知觉上与理想情形非常接近的去相关信号。对于这种复合QMF滤波器组,存在着比MPEG-4 PDMA 2第5.4.6节使用的卷积更加有效的实现;从计算负载和存储器使用方面而言,这种卷积相对昂贵。作为一个附加的优点,使用复合QMF滤波器组还允许有效组合参数立体声和谱带复制(SBR)。SBR背后的思想是,可以仅仅使用非常少的帮助信息就可从较低的频率中重建出较高的频率。在实践中,这种重建是依靠复合正交镜像滤波器(QMF)滤波器组实现的。为了在子带域中有效地获得去相关信号,本发明的实施例在子带域中使用依赖频率(或子带索引)的延迟。因为复合QMF滤波器组不是精密采样的,无须采用附加的措施来解决重叠。此外,因为延迟很小,本实施例的整体RAM使用很低。注意在Ekstrand公布的SBR解码器中,分析QMF组仅由32个频带构成,而合成QMF组由64个频带构成,因为与整个音频解码器相比,核心解码器以一半的采样频率运行。然而在相应的解码器中,使用了一个64频带的分析QMF组来覆盖整个频率范围。
使用延迟了整数个子带采样的信号做为去相关信号会引起时域拖尾,即信号在时间上的位置不被保持。这可能会引起瞬变周围的假象,即在信号强度变化超过预定门限的这些场合中。可以用幅度、功率等测量信号强度。在本发明的一个有利的实施例中,通过使用分数延迟而不是整数延迟在瞬变环境中导出去相关信号来减轻瞬变周围的假象。分数延迟指少于两个相继的子带采样间的时间的延迟,并且可以通过相位旋转很容易地实现。从分数延迟到整数延迟的转变,以及相反的转变,都可能导致去相关信号的不连续。为了防止这种不连续,本发明的一个有利的实施例提供了一种交叉衰落技术来使分数延迟的去相关信号回到整数延迟的去相关信号。
参考下文描述的实施例本发明的这些以及其它方面将显而易见,并且参考下文描述的实施例将说明本发明的这些以及其它方面。
在附图中,
图1示出了一个参数立体声解码器的方框图;
图2示出了一个N频带复合QMF分析(左侧)和合成(右侧)滤波器组的方框图;
图3示出了一个图2中N频带QMF滤波器组的程式化频率响应;
图4示出了一个用在MPEG-4 PDAM 2的第5.4.6节生成去相关信号的脉冲响应的频谱图,其中x轴表示时间(采样),y轴表示归一化的频率;
图5示出了一个根据本发明实施例的装置的方框图;
图6示出了以子带采样表示的延迟,根据本发明的一个实施例,该延迟是子带索引的函数;
图7示出了一个根据本发明实施例的有利的音频解码器,它对参数立体声和谱带复制进行了组合;并且
图8示出了由整数延迟去相关信号混合引起的瞬变之后的后回声出现;
图9示出了一个混合系数的例子,值1表示使用了一个整数延迟的去相关信号,值0表示使用了一个分数延迟的去相关信号;
图10示出了一个使用图9的混合因子时产生的输出音频信号;并且
图11示出了图7的音频解码器,其中使用了又一个具有分数延迟的延迟单元。
附图仅仅示出了那些对于理解本发明所必需的元件。
在下文中,描述了本发明的一个有利的实施例,该实施例通过使用参数立体声基于一个单声道输入音频信号来生成了一个立体声输出音频信号。该输入音频信号包括多个输入子带信号。多个输入子带信号在多个延迟单元中被延迟,延迟单元为较低频率子带提供比为较高频率子带更多的延迟。延迟的子带信号作为生成立体声输出信号所需的去相关信号的子带域版本。
在MPEG-4 PDMA 2的第5.4.6节,去相关信号是这样获得的:首先计算相位特征,对于44.1kHz的采样频率fs,等于:
其中0的值为π/2,K等于256,并且k=0...256。根据这个相位响应函数,就可以使用逆FFT计算出滤波器脉冲响应。它类似于一个线性延迟。该延迟可被近似表示为:
其中d是以采样为单位的延迟,f是以弧度为单位的频率。
优选地,输入子带信号是在复合QMF分析滤波器组中获得的,该分析滤波器组可以存在于远端的编码器中,但也可以存在于解码器中。由于复合QMF滤波器组的输出是以因子N而被下采样的,所以不太可能将一个期望的时域延迟确切地映射到每个子带内的延迟。可以通过使用前面描述的延迟函数(2)的取整版本来获得一个在知觉上良好的近似。作为例子,在图6中示出了N=64个子带中每个子带的延迟。对于这个特定的实现,为了形成去相关信号,仅仅需要保存136个复值。注意,尽管上面的延迟函数以一半的采样频率描述了一个0值,对于较高频率依然应用了一个单个子带采样的延迟。单个子带采样的延迟确保了信号被最大程度地去相关。
图5示出了根据本发明实施例的用于生成多个延迟子带信号的装置50的方框图。装置50被放置在QMF分析滤波器组30和QMF合成滤波器组31之间的某个位置,并且包括多个延迟单元501,502,503和504。延迟单元501为所有的子带提供了一个单位延迟。一组较高频率子带,例如子带40-64,在没有进一步延迟的情况下就被供给给合成QMF滤波器组31。相对低频率的一组子带,例如子带0-40,在延迟单元502中被进一步延迟。该组中的部分,例如子带0-24,在延迟单元503和504中被进一步延迟(后者仅仅用于子带0-8)。因此,有效地创建了典型的4组不同的延迟的示范性的量,分别具有1,2,3或4个单位延迟的延迟。图6示出了作为子带索引函数的、以子带采样表示的延迟。QMF分析滤波器组30通常存在于音频编码器中,虽然对于SBR,在解码器中也使用一个较小的M频带分析QMF滤波器组。
图7示出了一个根据本发明实施例的有利的音频解码器700,它组合了参数立体声工具和SBR。比特流多路分解器70接收编码的音频比特流并且导出SBR参数、立体声参数以及核心编码音频信号。核心编码音频信号被核心解码器71解码,该解码器可以是例如标准的MPEG-1第III层(mp3)或AAC解码器。典型地,这种解码器以一半的输出采样频率(fs/2)运行。所得的核心解码音频信号被馈送给M子带复合QMF滤波器组72。该滤波器组72每M个实输入采样输出M个复合采样,因此有效地以因子2被过采样,如前面所解释的。在高频(HF)发生器73中,未被核心解码音频信号覆盖的较高频率子带N-M,是通过复制M个子带(某部分)生成的。高频发生器73的输出与较低的M个子带被合并成N个复合子带信号。随后,包络调节器74将复制的高频子带信号调节到期望的包络,并且附加分量加法单元75如SBR参数所指示的将那样附加的正弦和噪声分量相加。为了生成延迟的子带信号,全部N个子带信号被提供给延迟单元76,该延迟单元可以与图5所示的装置50相同。根据诸如ICC参数之类的立体声参数在合并单元77中对N个延迟子带信号和N个输入子带信号进行了处理,从而为第一输出通道导出N个输出子带信号和为第二输出通道导出N个输出子带信号。第一输出通道的N个输出子带信号通过N频带复合QMF合成滤波器78馈送,以形成左侧L的第一PCM输出信号。第二输出通道的N个输出子带信号通过N频带复合QMF合成滤波器79馈送,以形成右侧R的第一PCM输出信号。在实际的实施例中,N=64,M=32。
上面提供的方法特别适用于稳定信号。然而,对于非稳定信号,即类似瞬变的信号,使用这种方法会发生问题。这一点在图8进行了说明,该图示出了一个响板信号通道的结果,该响板信号的获得使用了图5和图6的整数延迟去相关信号作为导出输出音频信号的基础。典型地,在具有强瞬变的信号中,例如响板,瞬变后的左右通道之间的相关性相对较低,因为信号主要由回响构成。因而去相关信号被非常突起地混合。这在实际响板瞬变之后产生了一个清晰的后回声。虽然由于时域中的后遮蔽,这不会被当成是第二瞬变,但它仍然引起了不期望的声音着色。在本发明的一个有利的实施例中,通过使用分数延迟在瞬变环境中形成一个去相关信号来减轻这种假象。可以使用相位旋转来有效地实现这种分数延迟。在又一个实施例中,为了防止整个去相关信号中的不连续性,分数延迟的去相关信号或相位旋转信号在时间上(缓慢地)与整数延迟去相关信号交叉衰落。
因此,从瞬变位置开始,建议使用原始信号的分数延迟或相位旋转版本而不是使用依赖频率的整数延迟。因为人类听觉系统的时间后遮蔽属性,如何计算这个去相关信号不是非常关键。同样地,可以例如通过在原始信号的每个子带信号中应用90度的相移来获得去相关信号。
为了防止去相关信号中从瞬变开始的不连续性,在整数延迟信号和相位旋转信号之间优选地施加一种交叉衰落。这种交叉衰落可被如下执行:
dhybrid[n]=m[n]ddelay[n]+(1-m[n])drotation[n]
其中,n是(子带)采样索引,m[n]是混合或交叉衰落因子,ddelay[n]是由依赖频率的整数延迟形成的去相关(子带)信号,drotation[n]是由分数延迟或相位旋转形成的去相关子带信号,dhybrid[n]是所得的混合去相关信号。在瞬变的开始处,混合因子m[n]变为零。接着它在一段时间期间保持为零,通常大概相当于20ms左右(大概12ms用于延迟长度,8ms用于瞬变长度)。从0到1的淡入通常大概是10-20ms。混合因子m[n]可以,但不限于是线性或分段线性的。注意,该混合因子m[n]还可以依赖频率的。因为对于较高频率,延迟通常较短,较高频率比较低频率具有一个较短的交叉衰落在感觉上是可取的。
图11示出了图7的音频解码器,其中具有分数延迟的分数延迟单元110被用于导出分数延迟的子带信号。延迟单元76产生了依赖频率的延迟子带信号。实际上,分数延迟单元110可以与延迟单元76并行工作,虽然也可以在延迟单元76运行时关闭另外的延迟单元110,反之亦然。优选地,在切换单元111中,在分数延迟子带信号和依赖频率的延迟子带信号之间执行切换。切换单元111优选地执行了一种前面解释的交叉衰落操作,尽管硬切换也是可能的。交叉衰落操作取决于瞬变的检测。优选地在瞬变检测器113中执行瞬变检测。可替换地,在编码器中有可能在编码的音频比特流中包括一个切换指示符。接着比特流多路分解器70从比特流中导出切换指示符,并将该切换指示符供应给切换单元111,其中跟据切换指示符执行切换。
应该注意到,上述的实施例是对本发明进行说明而不是限制,本领域的技术人员将能够在不背离所附权利要求的范围的情况下设计出许多可替换的实施例。在权利要求中,置于括号之间的任何参考符号都不应该被解释成对权利要求的限制。“包括”一词并不排出在权利要求中所列举以外的其它元件或步骤的存在。本发明可以通过包括几个不同元件的硬件实现,还可以被适当编程的计算机实现。在一个枚举了几种方法的装置权利要求中,这些方法中的几种可以被一个相同的硬件实施。某些措施在彼此不同的从属权利要求中被陈述的事实并不表示不能有利地使用这些措施的组合。
Claims (18)
1.一种基于输入音频信号生成输出音频信号(L,R)的装置,该输入音频信号包括多个输入子带信号(N),该装置包括:
多个延迟单元(76,501,...,504),用延迟至少部分的输入子带以便获得多个延迟的子带信号,其中至少一个输入子带信号要比另外一个较高频率的输入子带信号被延迟得更多,并且
一个组合单元(77),用于从输入音频信号和多个延迟子带信号的组合中导出输出音频信号。
2.如权利要求1所述的装置,其中输出音频信号包括多个输出子带信号。
3.如权利要求2的所述装置,该装置还包括一个子带滤波器组(78,79),用于从多个输出子带信号合成一个时域输出音频信号(L,R)。
4.如权利要求1所述的装置,其中输入音频信号是一个单声道音频信号,并且输出音频信号是一个立体声音频信号。
5.如权利要求1所述的装置,其中延迟单元的数量小于输入子带信号的数量,并且其中输入子带信号在多个延迟单元上被细分成组。
6.如权利要求5所述的装置,其中多个延迟单元包括第一延迟单元(501),用于将一组相对高频的子带延迟一个子带采样,以及至少又一个延迟单元(502,...504),用于将一组相对低频的子带延迟至少又一个子带采样。
7.如权利要求1所述的装置,其中延迟单元提供了从高频到低频单调递增的延迟。
8.如权利要求1的所述装置,其中子带滤波器组是一种复合子带滤波器组。
9.如权利要求8所述的装置,其中复合子带滤波器组是一种复合正交镜像滤波器组。
10.如权利要求1所述的装置,该装置进一步包括:
一个输入(70),用于获得一个相关参数,该相关参数表示在输出音频信号(L,R)的第一通道(L)和第二通道(R)之间的期望相关性,以及
其中组合单元(77)被配置为根据相关参数通过组合输入音频信号和多个延迟子带信号来获得第一通道(L)和第二通道(R)。
11.如权利要求10所述的装置,其中第一通道(L)和第二通道(R)各自包括多个输出子带信号,并且其中该装置进一步包括耦合到组合单元(77)的输出的两个合成子带滤波器组(78,79),用于根据输出子带信号分别生成第一时域通道(L)和第二时域通道(R)。
12.如权利要求1所述的装置(700),其中该装置(700)进一步包括:
一个基于时域核心音频信号生成M个滤波子带信号的M子带分析滤波器组(72),
一个用于生成高频信号分量的高频发生器(73,74),该高频信号分量是从M个滤波子带信号中导出的,该高频信号分量具有N-M个子带信号,其中N>M,N-M个子带信号包括比M个子带中的任何子带的频率都要高的子带信号,M个滤波子带和N-M个子带一起形成了多个输入子带信号(N)。
13.如权利要求1所述的装置,其中多个延迟单元被设置为对至少部分的输入子带信号延迟整数个子带采样,其中至少一个输入子带信号比另一个较高频率的输入子带信号被延迟得更多,并且其中该装置进一步包括:
一个分数延迟单元,用于对至少部分的输入子带信号延迟两个相继的子带采样之间一部分的时间,并且对于所有至少部分的输入子带信号,该延迟可以是个常数,并且
一个切换单元,用于在多个延迟单元和分数延迟单元之间切换以便获得多个延迟子带信号。
14.如权利要求13所述的装置,其中切换单元通过在多个延迟输出和分数延迟输出之间交叉衰落来进行切换。
15.如权利要求13所述的装置,其中该装置进一步包括一个用于检测输入音频信号的信号强度的检测单元,并且其中切换装置被设置为在信号强度高于预定门限的情况下切换到分数延迟,以及在信号强度低于预定门限的情况下切换到多个延迟单元。
16.如权利要求13所述的装置,其中输入音频信号包括一个切换指示符,并且其中切换单元被配置为根据切换指示符进行切换。
17.一种基于输入音频信号提供输出音频信号(L,R)的方法,该输入音频信号包括多个输入子带信号(N),该方法包括:
延迟(501...504)至少部分的输入子带信号以便获得多个延迟子带信号,其中至少一个子带信号比另外一个较高频率的输入子带信号被延迟得更多,并且
从输入音频信号和多个延迟子带信号的组合中导出输出音频信号。
18.一种用于供应输出音频信号的设备(700),该设备包括:
一个输入单元(70),用于获得编码音频信号,
一个解码器(71),用于对编码音频信号解码以获得包括多个子带信号的解码信号,
一个如权利要求1所述的装置,用于基于解码信号获得输出音频信号,以及
一个输出单元,用于供应输出音频信号。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP03076134.0 | 2003-04-17 | ||
EP03076134 | 2003-04-17 | ||
EP03076166 | 2003-04-18 | ||
EP03076280.1 | 2003-04-29 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1774957A true CN1774957A (zh) | 2006-05-17 |
Family
ID=33300979
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200480009976XA Expired - Lifetime CN1774956B (zh) | 2003-04-17 | 2004-04-14 | 音频信号合成 |
CNA2004800102851A Pending CN1774957A (zh) | 2003-04-17 | 2004-04-14 | 音频信号生成 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200480009976XA Expired - Lifetime CN1774956B (zh) | 2003-04-17 | 2004-04-14 | 音频信号合成 |
Country Status (12)
Country | Link |
---|---|
US (1) | US8311809B2 (zh) |
EP (1) | EP1618763B1 (zh) |
JP (1) | JP4834539B2 (zh) |
KR (2) | KR101200776B1 (zh) |
CN (2) | CN1774956B (zh) |
AT (1) | ATE355590T1 (zh) |
BR (1) | BRPI0409337A (zh) |
DE (1) | DE602004005020T2 (zh) |
ES (1) | ES2281795T3 (zh) |
PL (1) | PL1618763T3 (zh) |
RU (1) | RU2005135650A (zh) |
WO (1) | WO2004093495A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101790756B (zh) * | 2007-08-27 | 2012-09-05 | 爱立信电话股份有限公司 | 瞬态检测器以及用于支持音频信号的编码的方法 |
CN102934161A (zh) * | 2010-06-14 | 2013-02-13 | 松下电器产业株式会社 | 音频混合编码装置以及音频混合解码装置 |
US8504377B2 (en) | 2007-11-21 | 2013-08-06 | Lg Electronics Inc. | Method and an apparatus for processing a signal using length-adjusted window |
CN105659630A (zh) * | 2013-09-17 | 2016-06-08 | 韦勒斯标准与技术协会公司 | 用于处理多媒体信号的方法和设备 |
Families Citing this family (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
JP4834539B2 (ja) | 2003-04-17 | 2011-12-14 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号合成 |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
KR100707177B1 (ko) * | 2005-01-19 | 2007-04-13 | 삼성전자주식회사 | 디지털 신호 부호화/복호화 방법 및 장치 |
JP5107574B2 (ja) * | 2005-02-24 | 2012-12-26 | パナソニック株式会社 | データ再生装置、データ再生方法、プログラム、および集積回路 |
WO2007004828A2 (en) | 2005-06-30 | 2007-01-11 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
JP2009500656A (ja) | 2005-06-30 | 2009-01-08 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号をエンコーディング及びデコーディングするための装置とその方法 |
US7917561B2 (en) * | 2005-09-16 | 2011-03-29 | Coding Technologies Ab | Partially complex modulated filter bank |
US8443026B2 (en) | 2005-09-16 | 2013-05-14 | Dolby International Ab | Partially complex modulated filter bank |
US7653533B2 (en) | 2005-10-24 | 2010-01-26 | Lg Electronics Inc. | Removing time delays in signal paths |
US8190425B2 (en) * | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
US7953604B2 (en) * | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
JP2007221445A (ja) * | 2006-02-16 | 2007-08-30 | Sharp Corp | サラウンドシステム |
KR100754220B1 (ko) | 2006-03-07 | 2007-09-03 | 삼성전자주식회사 | Mpeg 서라운드를 위한 바이노럴 디코더 및 그 디코딩방법 |
PL2052548T3 (pl) | 2006-12-12 | 2012-08-31 | Fraunhofer Ges Forschung | Koder, dekoder oraz sposoby kodowania i dekodowania segmentów danych reprezentujących strumień danych w dziedzinie czasu |
FR2910752B1 (fr) * | 2006-12-22 | 2009-03-20 | Commissariat Energie Atomique | Procede de codage spatio-temporel pour systeme de communication multi-antenne de type uwb impulsionnel |
US8515759B2 (en) | 2007-04-26 | 2013-08-20 | Dolby International Ab | Apparatus and method for synthesizing an output signal |
KR101411900B1 (ko) * | 2007-05-08 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 장치 |
KR101411901B1 (ko) * | 2007-06-12 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화/복호화 방법 및 장치 |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
GB2453117B (en) * | 2007-09-25 | 2012-05-23 | Motorola Mobility Inc | Apparatus and method for encoding a multi channel audio signal |
DE102007048973B4 (de) * | 2007-10-12 | 2010-11-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung |
US8548615B2 (en) * | 2007-11-27 | 2013-10-01 | Nokia Corporation | Encoder |
CA2708861C (en) | 2007-12-18 | 2016-06-21 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
EP2260487B1 (en) * | 2008-03-04 | 2019-08-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Mixing of input data streams and generation of an output data stream therefrom |
EP2124486A1 (de) * | 2008-05-13 | 2009-11-25 | Clemens Par | Winkelabhängig operierende Vorrichtung oder Methodik zur Gewinnung eines pseudostereophonen Audiosignals |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
KR101227729B1 (ko) * | 2008-07-11 | 2013-01-29 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | 샘플 오디오 신호의 프레임을 인코딩하기 위한 오디오 인코더 및 디코더 |
JP5551693B2 (ja) | 2008-07-11 | 2014-07-16 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | エイリアシングスイッチスキームを用いてオーディオ信号を符号化/復号化するための装置および方法 |
EP2154911A1 (en) * | 2008-08-13 | 2010-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An apparatus for determining a spatial output multi-channel audio signal |
BRPI0914056B1 (pt) * | 2008-10-08 | 2019-07-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Esquema de codificação/decodificação de áudio comutado multi-resolução |
US8762158B2 (en) * | 2010-08-06 | 2014-06-24 | Samsung Electronics Co., Ltd. | Decoding method and decoding apparatus therefor |
KR101517446B1 (ko) | 2010-08-12 | 2015-05-04 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 직각 대칭 필터 기반 오디오 코덱들의 출력 신호들의 리샘플링 |
EP2523473A1 (en) | 2011-05-11 | 2012-11-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an output signal employing a decomposer |
US9237870B2 (en) * | 2011-10-28 | 2016-01-19 | Koninklijke Philips N.V. | Device and method for processing heart sounds for ausculation |
ES2549953T3 (es) * | 2012-08-27 | 2015-11-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para la reproducción de una señal de audio, aparato y método para la generación de una señal de audio codificada, programa de ordenador y señal de audio codificada |
BR112015025092B1 (pt) * | 2013-04-05 | 2022-01-11 | Dolby International Ab | Sistema de processamento de áudio e método para processar um fluxo de bits de áudio |
EP2830056A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain |
CN111292757B (zh) | 2013-09-12 | 2024-05-24 | 杜比国际公司 | 基于qmf的处理数据的时间对齐 |
KR101805327B1 (ko) | 2013-10-21 | 2017-12-05 | 돌비 인터네셔널 에이비 | 오디오 신호들의 파라메트릭 재구성을 위한 역상관기 구조 |
DE112015003108B4 (de) * | 2014-07-01 | 2021-03-04 | Electronics And Telecommunications Research Institute | Verfahren und Vorrichtung zur Verarbeitung eines Mehrkanal-Audiosignals |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5235646A (en) * | 1990-06-15 | 1993-08-10 | Wilde Martin D | Method and apparatus for creating de-correlated audio output signals and audio recordings made thereby |
GB9107011D0 (en) * | 1991-04-04 | 1991-05-22 | Gerzon Michael A | Illusory sound distance control method |
JP3127600B2 (ja) * | 1992-09-11 | 2001-01-29 | ソニー株式会社 | ディジタル信号復号化装置及び方法 |
US5774844A (en) * | 1993-11-09 | 1998-06-30 | Sony Corporation | Methods and apparatus for quantizing, encoding and decoding and recording media therefor |
JP2953347B2 (ja) * | 1995-06-06 | 1999-09-27 | 日本ビクター株式会社 | サラウンド信号処理装置 |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US5835375A (en) * | 1996-01-02 | 1998-11-10 | Ati Technologies Inc. | Integrated MPEG audio decoder and signal processor |
DE19632734A1 (de) * | 1996-08-14 | 1998-02-19 | Thomson Brandt Gmbh | Verfahren und Vorrichtung zum Generieren eines Mehrton-Signals aus einem Mono-Signal |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6199039B1 (en) * | 1998-08-03 | 2001-03-06 | National Science Council | Synthesis subband filter in MPEG-II audio decoding |
TW390104B (en) * | 1998-08-10 | 2000-05-11 | Acer Labs Inc | Method and device for down mixing of multi-sound-track compression audio frequency bit stream |
DE19900819A1 (de) * | 1999-01-12 | 2000-07-13 | Bosch Gmbh Robert | Verfahren zum Dekodieren gestörter Funksignale von Mehrkanal-Audiosendungen |
US6487574B1 (en) * | 1999-02-26 | 2002-11-26 | Microsoft Corp. | System and method for producing modulated complex lapped transforms |
US6175631B1 (en) * | 1999-07-09 | 2001-01-16 | Stephen A. Davis | Method and apparatus for decorrelating audio signals |
US7006636B2 (en) * | 2002-05-24 | 2006-02-28 | Agere Systems Inc. | Coherence-based audio coding and synthesis |
JP3776004B2 (ja) * | 2001-05-28 | 2006-05-17 | シャープ株式会社 | ディジタルデータの符号化方法 |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
JP4834539B2 (ja) | 2003-04-17 | 2011-12-14 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号合成 |
-
2004
- 2004-04-14 JP JP2006506843A patent/JP4834539B2/ja not_active Expired - Lifetime
- 2004-04-14 KR KR1020117005550A patent/KR101200776B1/ko active IP Right Grant
- 2004-04-14 DE DE602004005020T patent/DE602004005020T2/de not_active Expired - Lifetime
- 2004-04-14 KR KR1020057019770A patent/KR101169596B1/ko active IP Right Grant
- 2004-04-14 US US10/552,772 patent/US8311809B2/en active Active
- 2004-04-14 CN CN200480009976XA patent/CN1774956B/zh not_active Expired - Lifetime
- 2004-04-14 BR BRPI0409337-2A patent/BRPI0409337A/pt not_active IP Right Cessation
- 2004-04-14 EP EP04727357A patent/EP1618763B1/en not_active Expired - Lifetime
- 2004-04-14 CN CNA2004800102851A patent/CN1774957A/zh active Pending
- 2004-04-14 RU RU2005135650/09A patent/RU2005135650A/ru not_active Application Discontinuation
- 2004-04-14 AT AT04727357T patent/ATE355590T1/de active
- 2004-04-14 WO PCT/IB2004/050436 patent/WO2004093495A1/en active IP Right Grant
- 2004-04-14 PL PL04727357T patent/PL1618763T3/pl unknown
- 2004-04-14 ES ES04727357T patent/ES2281795T3/es not_active Expired - Lifetime
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101790756B (zh) * | 2007-08-27 | 2012-09-05 | 爱立信电话股份有限公司 | 瞬态检测器以及用于支持音频信号的编码的方法 |
US8504377B2 (en) | 2007-11-21 | 2013-08-06 | Lg Electronics Inc. | Method and an apparatus for processing a signal using length-adjusted window |
US8527282B2 (en) | 2007-11-21 | 2013-09-03 | Lg Electronics Inc. | Method and an apparatus for processing a signal |
US8583445B2 (en) | 2007-11-21 | 2013-11-12 | Lg Electronics Inc. | Method and apparatus for processing a signal using a time-stretched band extension base signal |
CN101868821B (zh) * | 2007-11-21 | 2015-09-23 | Lg电子株式会社 | 用于处理信号的方法和装置 |
CN102934161A (zh) * | 2010-06-14 | 2013-02-13 | 松下电器产业株式会社 | 音频混合编码装置以及音频混合解码装置 |
CN102934161B (zh) * | 2010-06-14 | 2015-08-26 | 松下电器产业株式会社 | 音频混合编码装置以及音频混合解码装置 |
US9275650B2 (en) | 2010-06-14 | 2016-03-01 | Panasonic Corporation | Hybrid audio encoder and hybrid audio decoder which perform coding or decoding while switching between different codecs |
CN105659630A (zh) * | 2013-09-17 | 2016-06-08 | 韦勒斯标准与技术协会公司 | 用于处理多媒体信号的方法和设备 |
CN105659630B (zh) * | 2013-09-17 | 2018-01-23 | 韦勒斯标准与技术协会公司 | 用于处理多媒体信号的方法和设备 |
Also Published As
Publication number | Publication date |
---|---|
US20070112559A1 (en) | 2007-05-17 |
EP1618763A1 (en) | 2006-01-25 |
JP4834539B2 (ja) | 2011-12-14 |
KR20050122267A (ko) | 2005-12-28 |
JP2006523859A (ja) | 2006-10-19 |
RU2005135650A (ru) | 2006-03-20 |
CN1774956B (zh) | 2011-10-05 |
PL1618763T3 (pl) | 2007-07-31 |
KR101200776B1 (ko) | 2012-11-13 |
ES2281795T3 (es) | 2007-10-01 |
KR20110044281A (ko) | 2011-04-28 |
BRPI0409337A (pt) | 2006-04-25 |
ATE355590T1 (de) | 2006-03-15 |
KR101169596B1 (ko) | 2012-07-30 |
DE602004005020D1 (de) | 2007-04-12 |
DE602004005020T2 (de) | 2007-10-31 |
US8311809B2 (en) | 2012-11-13 |
EP1618763B1 (en) | 2007-02-28 |
WO2004093495A1 (en) | 2004-10-28 |
CN1774956A (zh) | 2006-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1774957A (zh) | 音频信号生成 | |
AU2019213424B2 (en) | Apparatus and Method for Encoding or Decoding a Multi-Channel Signal Using Frame Control Synchronization | |
US20220246155A1 (en) | Selectable linear predictive or transform coding modes with advanced stereo coding | |
CN102177426B (zh) | 多分辨率切换音频编码/解码方案 | |
CN103119647B (zh) | 基于改进型离散余弦变换的复数预测立体声编码 | |
RU2388068C2 (ru) | Временное и пространственное генерирование многоканальных аудиосигналов | |
CN105190747B (zh) | 用于空间音频对象编码中时间/频率分辨率的反向兼容动态适应的编码器、解码器及方法 | |
CN105453176B (zh) | 智能间隙填充框架内使用双声道处理的音频编码器、音频解码器及相关方法 | |
EP1851997B1 (en) | Near-transparent or transparent multi-channel encoder/decoder scheme | |
EP2950308B1 (en) | Bandwidth expansion parameter-generator, encoder, decoder, bandwidth expansion parameter-generating method, encoding method, and decoding method | |
US8433583B2 (en) | Audio decoding | |
RU2646375C2 (ru) | Выделение аудиообъекта из сигнала микширования с использованием характерных для объекта временно-частотных разрешений | |
CA2813859C (en) | Apparatus and method for processing an audio signal and for providing a higher temporal granularity for a combined unified speech and audio codec (usac) | |
Den Brinker et al. | An overview of the coding standard MPEG-4 audio amendments 1 and 2: HE-AAC, SSC, and HE-AAC v2 | |
KR20170039245A (ko) | 전체 대역 갭 채움을 이용하는 주파수 도메인 프로세서와 시간 도메인 프로세서를 사용하는 오디오 인코더 및 디코더 | |
CN103531203A (zh) | 编码和解码语音与音频统合信号的方法 | |
CN102460570A (zh) | 用于对音频信号进行编码和解码的方法及设备 | |
CN116741187A (zh) | 立体声音频编码器和解码器 | |
CN104838442A (zh) | 用于反向兼容多重分辨率空间音频对象编码的编码器、译码器及方法 | |
KR20080109299A (ko) | 오디오 신호의 부호화/복호화 방법 및 장치 | |
Lindblom et al. | Flexible sum-difference stereo coding based on time-aligned signal components | |
Chen et al. | Estimating spatial cues for audio coding in MDCT domain | |
CN102074242A (zh) | 语音音频混合分级编码中核心层残差提取系统及方法 | |
Mathew et al. | Modified MP3 encoder using complex modified cosine transform | |
RU2804032C1 (ru) | Устройство обработки звуковых сигналов для кодирования стереофонического сигнала в сигнал битового потока и способ декодирования сигнала битового потока в стереофонический сигнал, осуществляемый с использованием устройства обработки звуковых сигналов |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20060517 |