CN1774956B - 音频信号合成 - Google Patents
音频信号合成 Download PDFInfo
- Publication number
- CN1774956B CN1774956B CN200480009976XA CN200480009976A CN1774956B CN 1774956 B CN1774956 B CN 1774956B CN 200480009976X A CN200480009976X A CN 200480009976XA CN 200480009976 A CN200480009976 A CN 200480009976A CN 1774956 B CN1774956 B CN 1774956B
- Authority
- CN
- China
- Prior art keywords
- signal
- subband
- conversion
- audio signal
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 40
- 230000015572 biosynthetic process Effects 0.000 title claims description 4
- 238000003786 synthesis reaction Methods 0.000 title claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 50
- 238000000034 method Methods 0.000 claims description 18
- 230000009466 transformation Effects 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 9
- 150000001875 compounds Chemical class 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims 3
- 238000010189 synthetic method Methods 0.000 claims 1
- 230000003111 delayed effect Effects 0.000 abstract description 4
- 230000002194 synthesizing effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 5
- 230000002349 favourable effect Effects 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 230000010076 replication Effects 0.000 description 3
- 239000002131 composite material Substances 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
Abstract
在输入音频信号的基础上提供合成输出音频信号,该输入信号包括多个输入子带信号,其中至少一个输入子带信号被从子带域变换(T)到频域,以获得至少一个相应变换的信号,其中至少一个输入子带信号被延迟和被变换(D,T),以获得至少一个相应变换的延迟信号,其中从至少一个变换的信号和至少一个变换的延迟信号中推导出(P)至少两个处理的信号,其中这些处理的信号从频域逆变换(T-1)到子带域,以获得相应处理的子带信号,并且其中从这些处理的子带信号中合成输出音频信号。
Description
技术领域
本发明涉及合成音频信号,并且尤其涉及提供输出音频信号的设备。
背景技术
Erik Schuijers、Werner Oomen、Bert den Brinker和JeroenBreebaart的文章“Advances in Parametric Coding for High-Quality Audio”,Preprint 5852,114th AES Convention,Amsterdam,The Netherlands,22-25 March 2003(2003年三月于荷兰阿姆斯特丹举行的第114届AES大会的预印本5852)公开了一种使用立体图像的有效参数表示法的参数编码方案。两个输入信号被合并成一个单声道音频信号。感知上相关的空间提示信号(cue)被显式地模型化。利用单参数编码器对合并的信号进行编码。将立体参数信道间强度差(Interchannel Intensity Difference)(IID)、信道间时差(Interchannel Time Difference)(ITD)和信道间互相关(Interchannel Cross-Correlation)(ICC)量化、编码并和量化与编码的单声道音频信号一起多路复用为比特流。在解码器侧上,该比特流被多路分用为编码的单声道信号和立体声参数。对编码的单声道信号进行解码,以获得解码的单声道音频信号m’(见图1)。从单声道时域信号中,利用滤波器D 10计算去相关的信号,产生最佳感知的去相关。单声道时域信号m’和去相关的信号d被变换到频域。然后在参数处理单元11中分别通过定标、相位修改和混合利用IID、ITD和ICC参数处理频域立体声信号,以获得解码的立体声对l’和r’。所得到的频域表示被变换回到时域。
发明内容
本发明的一个目标是在输入音频信号的基础上有利地合成输出音频信号。为此,本发明提供如独立权利要求中所定义的方法、装置、设备和计算机程序产品。在从属权利要求中定义有利的实施方案。
依照本发明的第一方面,在输入音频信号的基础上提供合成输出音频信号,该输入音频信号包括多个输入子带信号,其中至少一个输入子带信号被从子带域变换到频域,以获得至少一个相应变换的信号,其中至少一个输入子带信号被延迟并被变换,以获得至少一个相应变换的延迟信号,其中至少两个处理的信号是从至少一个变换的信号和至少一个变换的延迟信号中导出的,其中处理过的信号被从频域逆变换到子带域,以获得相应处理的子带信号,并且其中输出音频信号是从处理过的子带信号中合成的。通过提供子带中子带-频率变换,增加频率分辨率。这样增加的频率分辨率具有的优势是:变得有可能以高效的实现方式(因为只有少量频带必须进行变换)获得高的音频质量(单个子带信号的带宽通常远远高于人类听觉系统的关键波段的带宽)。在子带中合成立体声信号具有的进一步优势是:它可以容易地和已有的基于子带的音频编码器进行组合。在音频编码的环境中通常使用滤波器组。所有的MPEG-1/2层I、II和III都使用32-频带临界取样的子带滤波器。
本发明的实施方案特别用于利用光谱带复制(Spectral BandReplication)(“SBR”)技术增加较低子带的频率分辨率。
在一种有效的实施方案中,使用了正交镜像滤波器(QuadratureMirror Filter)(“QMF”)组。这种滤波器组本身从Per Ekstrand的文章“Bandwidth extension of audio signals by spectral bandreplication”,Proc.lst IEEE Benelux Workshop on Model basedProcessing and Coding of Audio(MPCA-2002),pp.53-58 Leuven,Belgium,November 15,2002中公知。合成QMF滤波器组采用N个复合子带信号作为输入并生成实值PCM输出信号。SBR背后的思想是仅用很少的帮助信息(helper information)就能够从较低频率中重构较高频率。实践中,这种重构是利用复合正交镜像滤波器(QMF)组完成的。为了有效地在子带域中得到去相关信号,本发明的实施方案在子带域中使用频率(或子带索引)-相关的延迟,如同以申请人名义于2003年4月17日提交的题为“Audio signal generation”的欧洲专利申请(代理人记录PHNL030447)中更具体公开的。因为没有对复QMF滤波器组临界地进行采样,所以不需要采用任何额外的规定来考虑假频。注意:在Ekstrand公开的SBR解码器中,分析QMF组仅包含了32个波段,而合成QMF组包含64个波段,因为核心解码器与整个音频解码器相比运行在采样频率的一半上。但是,在对应的编码器中,使用64-频带分析QMF组来覆盖整个频率范围。
图2是使用MPEG-4标准ISO/IEC 14496-3:2001/FDAM1,JTC1/SC29/WG11,Coding of Moving Pictures and Audio(运动图像和音频的编码),Bandwidth Extension(带宽扩展)中公开的光谱带复制(SBR)技术的带宽增强(BWE)解码器的方框图。比特流的核心部分利用核心解码器来解码,其中核心解码器可以是例如标准MPEG-1层III(mp3)或AAC解码器。通常,这种解码器在输出采样频率的一半(fs/2)上运行。为了合成SBR数据与核心数据,引入了延迟‘D’(在MPEG-4标准中288个PCM样本)。得到的信号被馈送给32-频带复合正交镜像滤波器(QMF)。这个滤波器每32个实输入样本输出32个复样本,并因而被利用2的因数过采样。在高频(HF)发生器(见图1)中,没有被核心编码器覆盖的较高频率通过复制较低频率(的某些部分)而生成。高频发生器的输出与较低32个子带组合成64个复合子带信号。接下来,包络调节器调节复制的高频子带信号到期望的包络并添加如比特流的SBR部分所指示的附加的正弦和噪音分量。总共64个子带信号通过64-频带复合QMF合成滤波器被馈送,以形成(实)PCM输出信号。
子带信道中附加变换的应用引入了某一延迟。在不包括任何变换和逆变换的子带中,应引入延迟以保持子带信号的对准。如果没有特殊的措施,子带信号中这样引入的额外延迟导致了核心数据和侧或帮助数据例如SBR数据或参数立体声数据之间的不对准(即,失步)。在带有附加变换/逆变换的子带和没有附加变换的子带的情况下,应该对没有变换的子带添加附加的延迟。在SBR内,由于变换和逆变换操作导致的额外延迟可以从延迟D中推断出。
本发明的这些和其它方面从下文中所述的实施例中是显而易见的并将参考下文中所描述的实施例进行阐明。
附图说明
附图中:
图1是参数立体声解码器的方框图;
图2是使用SBR技术的音频解码器的方框图;
图3示出依照本发明一种实施方案的子带域中的参数立体声处理;
图4是说明由于图3的变换-逆变换TT-1引起的延迟的方框图;
图5示出依照本发明一种实施方案提供参数立体声的一种有利的音频解码器;和
图6示出依照本发明一种实施方案组合参数立体声和SBR的一种有利的音频解码器。
这些附图仅仅示出了理解本发明所必需的那些元素。
具体实施方式
图3示出依照本发明一种实施方案的子带域中的参数立体声处理。输入信号包括N个输入子带信号。在实际的实施方案中,N为32或64。较低的频率利用变换T进行了变换,以获得较高的频率分辨率,利用延迟DT延迟较高的频率,以补偿由于变换而引入的延迟。从每个子带信号中,还利用延迟-序列Dx创建去相关的子带信号,其中x是子带索引。方块P表示从一个输入子带信号到两个子带的处理,该处理是在输入子带信号的一个变换版本上以及在输入子带信号的一个延迟并变换的版本上执行的。该处理可以包括混合(例如,通过矩阵变换和/或旋转)变换的版本和变换并延迟的版本。变换T-1表示逆变换。DT可以在块P之前和在块P之后进行分割。变换T可以具有不同的长度,通常低频有较长的变换,这意味着在变换比最长变换短的路径中应该附加地引入延迟。在滤波器组之前的延迟D可以移到滤波器组之后。当它被放置在滤波器组之后时,因为变换已经吸收延迟,所以它可以被部分去除。尽管也可以使用其它的变换,如快速傅立叶变换,但变换优选为修改的离散余弦变换(“MDCT”)类型。处理P通常不会引起额外的延迟。
图4是说明由图3的变换-逆变换TT-1导致的延迟的方框图。在图4中,利用窗口h[n]对18个复合子带样本进行窗口化(window)。复合信号随后被分成实部和虚部,利用MDCT将它们都变换成2乘9个实值。两组9个值的逆变换又得到18个复合子带样本,将这18个复合子带样本窗口化并和先前的18个复合子带样本重叠相加。如此图中所示,最后9个复合子带样本没有被完全处理(即,重叠相加),导致变换长度一半的有效延迟,即9个(子带)样本。结果,应该在没有应用变换的所有其它子带中补偿单个子带滤波器中的延迟。但是,在SBR处理(即,HF生成和包络调节)之前对子带信号引入额外的延迟导致核心数据和SBR数据的不对准。为了保持这种对准,能够将图2中所示的PCM延迟D刚好放置在M-频带复合分析QMF之后,这在每个子带中有效地得到D/M的延迟。因而,核心数据和SBR数据的对准的要求是所有子带中的延迟量达到D/M。因此,只要附加变换的延迟DT等于或小于D/M,就能保持同步。注意:子带域中的延迟元素变成了复合类型。在实际的SBR实施方案中,M=32。M也可以等于N。
注意:在实际的实施方案中,每个变换T包括两个MDCT,并且每个逆变换T-1包括两个IMDCT,如上所述。
其中引入了变换T的较低子带被核心解码器覆盖。但是,尽管它们不被SBR工具的包络调节器处理,但SBR工具的高频发生器在复制处理中仍然需要它们的样本。因此,这些较低子带的样本也需要可用作“未变换的”。这需要这些子带中DT子带样本的额外(又是复合)延迟。对复合样本的实值和复值执行的混合操作可以是相等的。
图5示出了依照本发明实施方案的提供参数立体声的一种有利的音频解码器。比特流被分割成单声道参数/系数和立体声参数。首先,使用常规的单声道解码器来获得(向后兼容)单声道信号。利用子带滤波器组分析这个信号,将该信号分成多个子带信号。立体声参数用来将这些子带信号处理为两组子带信号,一组用于左声道,一组用于右声道。使用两个子带合成滤波器,将这些信号变换到时域,得到立体声(左和右)信号。在图3中示出了立体声处理方框。
图6示出依照本发明一种实施方案的组合参数立体声和SBR的一种有利的音频解码器。比特流被分割成单声道参数/系数、SBR参数和立体声参数。首先,使用常规的单声道解码器来获得(向后兼容)单声道信号。利用子带滤波器组分析这个信号,将该信号分成多个子带信号。通过使用SBR参数,生成更多HF内容,有可能使用比分析滤波器组更多的子带。立体声参数用来将这些子带信号处理成两组子带信号,一组用于左声道,一组用于右声道。使用两个子带合成滤波器,将这些信号变换到时域,得到立体声(左和右)信号。在图3的方框图中示出了立体声处理方框。
应该注意:上述实施方案是为了说明而不是限制本发明,并且本领域的技术人员将能够在不偏离所附权利要求的范围的前提下设计出很多替代实施方案。在权利要求中,放置在括号之间的任何引用符号都不应看作是限制该权利要求。在元素或步骤之前的不定冠词“一”或“一个”的使用并不排除多个这种元素或步骤的存在。动词“包括”及其各种时态形式的使用并不排除除了权利要求中所陈述的那些之外的元素或步骤的存在。本发明可以利用包括几个不同元素的硬件来实现,并且利用适当编程的计算机来实现。在列举了若干装置的设备权利要求中,这些装置中的若干可以利用同一个硬件来实现。在互不相同的从属权利要求中列举了特定措施的唯一事实并不表示不能使用这些措施的组合以获得优势。
Claims (12)
1.一种在输入音频信号的基础上合成输出音频信号的方法,该输入音频信号包括多个输入子带信号,该方法包括下列步骤:
将至少一个输入子带信号从子带域变换到较高分辨率频域,以获得至少一个相应变换的信号,其中所述变换是余弦变换;
延迟并变换、或变换并延迟至少一个输入子带信号,以获得至少一个相应变换的延迟信号,其中选择所述延迟以提供去相关,并且所述延迟并变换、或变换并延迟中的变换是在将至少一个输入子带信号从子带域变换到较高分辨率频域中的变换;
从至少一个变换的信号和至少一个变换的延迟信号中导出至少两个处理的信号,其中导出包括矩阵变换操作和/或旋转操作;
将处理的信号从较高分辨率频域逆变换到子带域,以获得相应处理的子带信号,其中所述逆变换是所述余弦变换的逆变换;和
从处理的子带信号中合成输出音频信号。
2.权利要求1中所述的方法,其中至少一个输入子带信号包括具有最低频率的子带信号。
3.权利要求2中所述的方法,其中至少一个输入子带信号由2到8个子带信号构成。
4.权利要求1中所述的方法,其中合成步骤是在子带滤波器组中执行的,用于从处理的子带信号中合成输出音频信号的时域版本。
5.权利要求4中所述的方法,其中子带滤波器组是复合子带滤波器组。
6.权利要求5中所述的方法,其中复合子带滤波器组是复合正交镜像滤波器组。
7.权利要求1中所述的方法,其中输入音频信号是单声道音频信号,并且输出音频信号是立体声音频信号。
8.权利要求1中所述的方法,该方法还包括下列步骤:
获得表示输出音频信号的第一信道和第二信道之间的期望相关的相关参数,其中处理被安排为通过根据相关参数组合至少一个变换的信号和至少一个变换的延迟信号来获得第一组处理的信号和第二组处理的信号,并且其中第一信道是从第一组处理的信号中导出的,而第二信道是从第二组处理的信号中导出的。
9.权利要求8中所述的方法,其中输出音频信号的第一信道和第二信道分别地在相应的合成子带滤波器组中在第一组处理的信号和第二组处理的信号的基础上进行合成。
10.权利要求1中所述的方法,其中该方法还包括下列步骤:
导出M个子带,以便在时域核心音频信号的基础上生成M个滤波的子带信号,
生成从M个滤波的子带信号中导出的高频信号分量,所述高频信号分量具有N-M个子带信号,其中N>M,N-M个子带信号包括具有比M个子带中任意一个子带都高的频率的子带信号,M个滤波的子带信号和N-M个子带信号一起形成多个输入子带信号。
11.一种用于在输入音频信号的基础上合成输出音频信号的设备,该输入音频信号包括多个输入子带信号,该设备包括:
用于将至少一个输入子带信号从子带域变换到较高分辨率频域以获得至少一个相应变换的信号的装置,其中所述变换是余弦变换;
用于延迟并变换、或变换并延迟至少一个输入子带信号以获得至少一个相应变换的延迟信号的装置,其中选择所述延迟以提供去相关,并且所述的用于延迟并变换、或变换并延迟的装置中的变换是在变换装置中使用的变换;
用于从至少一个变换的信号和至少一个变换的延迟信号中导出至少两个处理的信号的装置,其中导出包括矩阵变换操作和/或旋转操作;
用于将处理的信号从较高分辨率频域逆变换到子带域以获得相应处理的子带信号的装置,其中所述逆变换是所述余弦变换的逆变换;和
用于从处理的子带信号中合成输出音频信号的装置。
12.一种用于提供输出音频信号的设备,该设备包括:
输入单元,用于获得编码的音频信号,
解码器,用于将编码的音频信号解码,以获得包括多个子带信号的解码信号,
如权利要求11中所述的设备,用于在解码信号的基础上获得输出音频信号,和
输出单元,用于提供输出音频信号。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP03076134.0 | 2003-04-17 | ||
EP03076134 | 2003-04-17 | ||
EP03076166 | 2003-04-18 | ||
EP03076166.2 | 2003-04-18 | ||
PCT/IB2004/050436 WO2004093495A1 (en) | 2003-04-17 | 2004-04-14 | Audio signal synthesis |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1774956A CN1774956A (zh) | 2006-05-17 |
CN1774956B true CN1774956B (zh) | 2011-10-05 |
Family
ID=33300979
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2004800102851A Pending CN1774957A (zh) | 2003-04-17 | 2004-04-14 | 音频信号生成 |
CN200480009976XA Expired - Lifetime CN1774956B (zh) | 2003-04-17 | 2004-04-14 | 音频信号合成 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2004800102851A Pending CN1774957A (zh) | 2003-04-17 | 2004-04-14 | 音频信号生成 |
Country Status (12)
Country | Link |
---|---|
US (1) | US8311809B2 (zh) |
EP (1) | EP1618763B1 (zh) |
JP (1) | JP4834539B2 (zh) |
KR (2) | KR101169596B1 (zh) |
CN (2) | CN1774957A (zh) |
AT (1) | ATE355590T1 (zh) |
BR (1) | BRPI0409337A (zh) |
DE (1) | DE602004005020T2 (zh) |
ES (1) | ES2281795T3 (zh) |
PL (1) | PL1618763T3 (zh) |
RU (1) | RU2005135650A (zh) |
WO (1) | WO2004093495A1 (zh) |
Families Citing this family (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
KR101169596B1 (ko) | 2003-04-17 | 2012-07-30 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 신호 합성 |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
KR100707177B1 (ko) * | 2005-01-19 | 2007-04-13 | 삼성전자주식회사 | 디지털 신호 부호화/복호화 방법 및 장치 |
KR101194902B1 (ko) * | 2005-02-24 | 2012-10-25 | 파나소닉 주식회사 | 데이터 재생장치 |
JP5227794B2 (ja) | 2005-06-30 | 2013-07-03 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号をエンコーディング及びデコーディングするための装置とその方法 |
US8073702B2 (en) | 2005-06-30 | 2011-12-06 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
US8443026B2 (en) | 2005-09-16 | 2013-05-14 | Dolby International Ab | Partially complex modulated filter bank |
US7917561B2 (en) * | 2005-09-16 | 2011-03-29 | Coding Technologies Ab | Partially complex modulated filter bank |
US7653533B2 (en) * | 2005-10-24 | 2010-01-26 | Lg Electronics Inc. | Removing time delays in signal paths |
US8190425B2 (en) * | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
US7953604B2 (en) * | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
JP2007221445A (ja) * | 2006-02-16 | 2007-08-30 | Sharp Corp | サラウンドシステム |
KR100754220B1 (ko) | 2006-03-07 | 2007-09-03 | 삼성전자주식회사 | Mpeg 서라운드를 위한 바이노럴 디코더 및 그 디코딩방법 |
KR101016224B1 (ko) | 2006-12-12 | 2011-02-25 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | 인코더, 디코더 및 시간 영역 데이터 스트림을 나타내는 데이터 세그먼트를 인코딩하고 디코딩하는 방법 |
FR2910752B1 (fr) * | 2006-12-22 | 2009-03-20 | Commissariat Energie Atomique | Procede de codage spatio-temporel pour systeme de communication multi-antenne de type uwb impulsionnel |
ES2452348T3 (es) * | 2007-04-26 | 2014-04-01 | Dolby International Ab | Aparato y procedimiento para sintetizar una señal de salida |
KR101411900B1 (ko) * | 2007-05-08 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 장치 |
KR101411901B1 (ko) * | 2007-06-12 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화/복호화 방법 및 장치 |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
CN101790756B (zh) * | 2007-08-27 | 2012-09-05 | 爱立信电话股份有限公司 | 瞬态检测器以及用于支持音频信号的编码的方法 |
GB2453117B (en) * | 2007-09-25 | 2012-05-23 | Motorola Mobility Inc | Apparatus and method for encoding a multi channel audio signal |
DE102007048973B4 (de) * | 2007-10-12 | 2010-11-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung |
US8504377B2 (en) * | 2007-11-21 | 2013-08-06 | Lg Electronics Inc. | Method and an apparatus for processing a signal using length-adjusted window |
US8548615B2 (en) * | 2007-11-27 | 2013-10-01 | Nokia Corporation | Encoder |
EP2229677B1 (en) | 2007-12-18 | 2015-09-16 | LG Electronics Inc. | A method and an apparatus for processing an audio signal |
JP5302980B2 (ja) * | 2008-03-04 | 2013-10-02 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 複数の入力データストリームのミキシングのための装置 |
EP2124486A1 (de) * | 2008-05-13 | 2009-11-25 | Clemens Par | Winkelabhängig operierende Vorrichtung oder Methodik zur Gewinnung eines pseudostereophonen Audiosignals |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
WO2010003663A1 (en) * | 2008-07-11 | 2010-01-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding frames of sampled audio signals |
ES2401487T3 (es) * | 2008-07-11 | 2013-04-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y procedimiento para la codificación/decodificación de una señal de audio utilizando un esquema de conmutación de generación de señal ajena |
EP2154911A1 (en) * | 2008-08-13 | 2010-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An apparatus for determining a spatial output multi-channel audio signal |
EP2345030A2 (en) * | 2008-10-08 | 2011-07-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-resolution switched audio encoding/decoding scheme |
CN102934161B (zh) * | 2010-06-14 | 2015-08-26 | 松下电器产业株式会社 | 音频混合编码装置以及音频混合解码装置 |
US8762158B2 (en) * | 2010-08-06 | 2014-06-24 | Samsung Electronics Co., Ltd. | Decoding method and decoding apparatus therefor |
JP5665987B2 (ja) | 2010-08-12 | 2015-02-04 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | Qmfベースのオーディオコーデックの出力信号のリサンプリング |
EP2523473A1 (en) * | 2011-05-11 | 2012-11-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an output signal employing a decomposer |
EP2744413B1 (en) * | 2011-10-28 | 2017-03-29 | Koninklijke Philips N.V. | A device and method for processing heart sounds for auscultation |
EP2704142B1 (en) * | 2012-08-27 | 2015-09-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal |
WO2014161996A2 (en) * | 2013-04-05 | 2014-10-09 | Dolby International Ab | Audio processing system |
EP2830064A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
RU2665281C2 (ru) | 2013-09-12 | 2018-08-28 | Долби Интернэшнл Аб | Временное согласование данных обработки на основе квадратурного зеркального фильтра |
EP3806498B1 (en) * | 2013-09-17 | 2023-08-30 | Wilus Institute of Standards and Technology Inc. | Method and apparatus for processing audio signal |
SG11201602628TA (en) | 2013-10-21 | 2016-05-30 | Dolby Int Ab | Decorrelator structure for parametric reconstruction of audio signals |
CN110895943B (zh) * | 2014-07-01 | 2023-10-20 | 韩国电子通信研究院 | 处理多信道音频信号的方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5235646A (en) * | 1990-06-15 | 1993-08-10 | Wilde Martin D | Method and apparatus for creating de-correlated audio output signals and audio recordings made thereby |
US6005946A (en) * | 1996-08-14 | 1999-12-21 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for generating a multi-channel signal from a mono signal |
CN1250293A (zh) * | 1998-08-10 | 2000-04-12 | 扬智科技股份有限公司 | 压缩多声道音频位元流的解码装置及方法 |
EP1024679A2 (de) * | 1999-01-12 | 2000-08-02 | Robert Bosch Gmbh | Verfahren zum Dekodieren gestörter Funksignale von Mehrkanal-Audiosendungen |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9107011D0 (en) * | 1991-04-04 | 1991-05-22 | Gerzon Michael A | Illusory sound distance control method |
JP3127600B2 (ja) * | 1992-09-11 | 2001-01-29 | ソニー株式会社 | ディジタル信号復号化装置及び方法 |
WO1995013660A1 (fr) * | 1993-11-09 | 1995-05-18 | Sony Corporation | Appareil de quantification, procede de quantification, codeur a haute efficacite, procede de codage a haute efficacite, decodeur, supports d'enregistrement et de codage a haute efficacite |
JP2953347B2 (ja) * | 1995-06-06 | 1999-09-27 | 日本ビクター株式会社 | サラウンド信号処理装置 |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US5835375A (en) * | 1996-01-02 | 1998-11-10 | Ati Technologies Inc. | Integrated MPEG audio decoder and signal processor |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6199039B1 (en) * | 1998-08-03 | 2001-03-06 | National Science Council | Synthesis subband filter in MPEG-II audio decoding |
US6487574B1 (en) * | 1999-02-26 | 2002-11-26 | Microsoft Corp. | System and method for producing modulated complex lapped transforms |
US6175631B1 (en) * | 1999-07-09 | 2001-01-16 | Stephen A. Davis | Method and apparatus for decorrelating audio signals |
US7006636B2 (en) * | 2002-05-24 | 2006-02-28 | Agere Systems Inc. | Coherence-based audio coding and synthesis |
JP3776004B2 (ja) * | 2001-05-28 | 2006-05-17 | シャープ株式会社 | ディジタルデータの符号化方法 |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
KR101169596B1 (ko) | 2003-04-17 | 2012-07-30 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 신호 합성 |
-
2004
- 2004-04-14 KR KR1020057019770A patent/KR101169596B1/ko active IP Right Grant
- 2004-04-14 CN CNA2004800102851A patent/CN1774957A/zh active Pending
- 2004-04-14 AT AT04727357T patent/ATE355590T1/de active
- 2004-04-14 RU RU2005135650/09A patent/RU2005135650A/ru not_active Application Discontinuation
- 2004-04-14 EP EP04727357A patent/EP1618763B1/en not_active Expired - Lifetime
- 2004-04-14 WO PCT/IB2004/050436 patent/WO2004093495A1/en active IP Right Grant
- 2004-04-14 CN CN200480009976XA patent/CN1774956B/zh not_active Expired - Lifetime
- 2004-04-14 US US10/552,772 patent/US8311809B2/en active Active
- 2004-04-14 BR BRPI0409337-2A patent/BRPI0409337A/pt not_active IP Right Cessation
- 2004-04-14 KR KR1020117005550A patent/KR101200776B1/ko active IP Right Grant
- 2004-04-14 JP JP2006506843A patent/JP4834539B2/ja not_active Expired - Lifetime
- 2004-04-14 ES ES04727357T patent/ES2281795T3/es not_active Expired - Lifetime
- 2004-04-14 DE DE602004005020T patent/DE602004005020T2/de not_active Expired - Lifetime
- 2004-04-14 PL PL04727357T patent/PL1618763T3/pl unknown
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5235646A (en) * | 1990-06-15 | 1993-08-10 | Wilde Martin D | Method and apparatus for creating de-correlated audio output signals and audio recordings made thereby |
US6005946A (en) * | 1996-08-14 | 1999-12-21 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for generating a multi-channel signal from a mono signal |
CN1250293A (zh) * | 1998-08-10 | 2000-04-12 | 扬智科技股份有限公司 | 压缩多声道音频位元流的解码装置及方法 |
EP1024679A2 (de) * | 1999-01-12 | 2000-08-02 | Robert Bosch Gmbh | Verfahren zum Dekodieren gestörter Funksignale von Mehrkanal-Audiosendungen |
Also Published As
Publication number | Publication date |
---|---|
EP1618763A1 (en) | 2006-01-25 |
KR101200776B1 (ko) | 2012-11-13 |
KR20110044281A (ko) | 2011-04-28 |
CN1774956A (zh) | 2006-05-17 |
KR20050122267A (ko) | 2005-12-28 |
DE602004005020T2 (de) | 2007-10-31 |
US20070112559A1 (en) | 2007-05-17 |
JP4834539B2 (ja) | 2011-12-14 |
RU2005135650A (ru) | 2006-03-20 |
CN1774957A (zh) | 2006-05-17 |
ATE355590T1 (de) | 2006-03-15 |
JP2006523859A (ja) | 2006-10-19 |
BRPI0409337A (pt) | 2006-04-25 |
WO2004093495A1 (en) | 2004-10-28 |
PL1618763T3 (pl) | 2007-07-31 |
DE602004005020D1 (de) | 2007-04-12 |
ES2281795T3 (es) | 2007-10-01 |
EP1618763B1 (en) | 2007-02-28 |
US8311809B2 (en) | 2012-11-13 |
KR101169596B1 (ko) | 2012-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1774956B (zh) | 音频信号合成 | |
RU2705007C1 (ru) | Устройство и способ для кодирования или декодирования многоканального сигнала с использованием сихронизации управления кадрами | |
CN101540171B (zh) | 音频信号编码或解码 | |
CN1914668B (zh) | 用于信号时间标度的方法及设备 | |
TWI550598B (zh) | 使用聯合編碼殘餘信號之音訊編碼器、音訊解碼器、方法及電腦程式 | |
TWI483244B (zh) | 用於將信號編碼/解碼之裝置與方法 | |
CN110047496B (zh) | 立体声音频编码器和解码器 | |
CN101401151B (zh) | 根据主分量分析的可分级多通道音频编码的设备和方法 | |
CN105378832B (zh) | 解码器、编码器、解码方法、编码方法和存储介质 | |
JP6285939B2 (ja) | 後方互換性のある多重分解能空間オーディオオブジェクト符号化のためのエンコーダ、デコーダおよび方法 | |
TWI486950B (zh) | 用以針對聯合統一語音與音訊編解碼器處理音訊信號與提供較高時間粒度之裝置與方法 | |
CN104798131A (zh) | 用于空间音频对象编码中信号相依缩放变换的编码器、解码器及方法 | |
JP4988717B2 (ja) | オーディオ信号のデコーディング方法及び装置 | |
Helmrich | Efficient Perceptual Audio Coding Using Cosine and Sine Modulated Lapped Transforms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder | ||
CP01 | Change in the name or title of a patent holder |
Address after: Holland Ian Deho Finn Patentee after: KONINKLIJKE PHILIPS N.V. Address before: Holland Ian Deho Finn Patentee before: Koninklijke Philips Electronics N.V. |
|
CX01 | Expiry of patent term | ||
CX01 | Expiry of patent term |
Granted publication date: 20111005 |