CN103460282A - 用于利用传送的相位信息产生去相关信号的装置 - Google Patents

用于利用传送的相位信息产生去相关信号的装置 Download PDF

Info

Publication number
CN103460282A
CN103460282A CN201180051640XA CN201180051640A CN103460282A CN 103460282 A CN103460282 A CN 103460282A CN 201180051640X A CN201180051640X A CN 201180051640XA CN 201180051640 A CN201180051640 A CN 201180051640A CN 103460282 A CN103460282 A CN 103460282A
Authority
CN
China
Prior art keywords
signal
instantaneous
composition
decorrelator
phase information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201180051640XA
Other languages
English (en)
Other versions
CN103460282B (zh
Inventor
阿希姆·昆茨
萨沙·迪施
于尔根·赫莱
法比安·库奇
约翰内斯·希尔珀特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=44509236&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN103460282(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of CN103460282A publication Critical patent/CN103460282A/zh
Application granted granted Critical
Publication of CN103460282B publication Critical patent/CN103460282B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching

Abstract

一种用于产生一去相关信号的装置,该装置包含一用于接收相位信息的接收单元(650)、一瞬时分离器(310;410;510;610;710;910)、一瞬时去相关器(320;420;520;620;720;920)、一第二去相关器(330;430;530;630;730;930)以及一组合单元(330;430;530;630;730;930),其中,该瞬时分离器(310;410;510;610;710;910)适于将一输入信号分离成为一第一信号成分以及成为一第二信号成分,使得该第一信号成分包含该输入信号的瞬时信号部分,并且该第二信号成分包含该输入信号的非瞬时信号部分。该瞬时去相关器(320;420;520;620;720;920)适于将利用接收单元(650)所接收的相位信息施加至一瞬时信号成分上。

Description

用于利用传送的相位信息产生去相关信号的装置
技术领域
本发明涉及音频处理以及音频解码的领域,尤其涉及对包含瞬时的一信号进行解码。
背景技术
音频处理和/或解码以许多方式发展。尤其是,空间音频应用已变得越来越重要。音频信号处理时常被用于去相关或表达信号。此外,信号的去相关以及表达被采用在单声道至立体声上混、单声道/立体声至多频道上混、人工式混响、立体声加宽或使用者互动混合/表达的处理程序中。
许多音频信号处理系统采用去相关器。一重要范例是应用去相关系统在参数空间音频解码器中以恢复在自一个或多个下混合信号被重建的二个或多个信号之间的特定去相关性质。去相关器的应用主要地改进输出信号的感知质量,例如,当与强度立体声相比较时。明确地说,去相关器的利用使得空间声音能够与宽的声音影像、许多同时发生的声音物体和/或周遭环境而适当地合成。但是,去相关器也是传统地引介在时间信号结构、音质等等中的类似人为效应的改变。
音频处理中的去相关器的其它应用范例是,例如,人工式混响的产生以改变空间效果或在多频道音响回音取消系统中利用去相关器以改进收敛行为。
在图1中示出了在单声道至立体声上混合器(例如,应用在参数立体声(PS)中)中的去相关器的一般最近应用,其中,一单声道输入信号M(一“干(dry)”信号)被提供至一去相关器110。去相关器110根据一去相关方法而将单声道输入信号M去相关以在它的输出提供一去相关信号D(一“湿(wet)”信号)。该去相关信号D作为一第一混合器输入信号与干单声道信号M作为一第二混合器输入信号一起被馈送进入混合器120中。更进一步地,一上混控制单元130馈送上混控制参数进入混合器120中。混合器120接着根据一混合矩阵H而产生二个输出频道L以及R(L=左方立体声输出频道;R=右方立体声输出频道)。混合矩阵的系数可被固定、信号相依或利用使用者来控制。
另外,混合矩阵通过侧信息被控制,该侧信息与含有如何上混该下混合的信号以形成所需的多频道输出上的一参数说明的下混合一起被发送。该空间侧信息通常在单声道下混合处理程序期间而在一调谐的信号编码器中产生。
该原理广泛地被应用在空间音频编码中,例如,参数立体声,参看例如,在2004年5月在德国Preprint6072,柏林举行的AES第116届会议的论文集中,J.Breebaart、S.vandePar、A.Kohlrausch、E.Schuijers等人发表的“低位率的高质量参数空间音频编码”文件。
参数立体声解码器的进一步的一般最近技术结构被示出在图2中,其中一去相关处理在一转换域中被进行。一分析滤波器组210将一单声道输入信号转换成为一转换域,例如,转换成为一频域。被转换的单声道输入信号M的去相关接着利用产生去相关信号D的去相关器220被进行。被转换的单声道输入信号M以及去相关信号D皆被馈送进入一混合矩阵230中。混合矩阵230接着考虑利用参数修改单元240所提供的上混合参数而产生二个输出信号L以及R,其中,该参数修改单元240被提供空间参数并且被耦合至参数控制单元250。在图2中,空间参数可通过使用者或另外的工具所修改,例如,用于立体音响表达/呈现之后处理。在该范例中,上混合参数与来自立体音响滤波器的参数组合以形成供用于上混合矩阵的输入参数。最后,利用混合矩阵230产生的输出信号被馈送进入决定立体声输出信号的合成滤波器组260。
混合矩阵230的输出L/R根据一混合规则自单声道输入信号M以及去相关信号D被计算出,例如,通过应用下面的公式:
L R = h 11 h 12 h 21 h 22 M D
在该混合矩阵中,被馈送至输出的去相关声音总量基于发送参数而被控制,例如,频道间相关/一致性(ICC)和/或固定的或使用者定义的设置。
在概念上,去相关器输出D的输出信号取代一余留信号,其将理想上允许原始L/R信号完全地解码。在上混合器中利用去相关器输出D取代余留信号将导致节省在其它方面发送余留信号所需的位率。去相关器的目的因此是自单声道信号M产生信号D,其展示如同以D取代的余留信号的相似性质。
对应地,在编码器侧上,二种型式的空间参数被抽取:一第一族群参数,其包含代表在二个将被编码的输入频道之间的一致性或交相关的相关/一致性参数(例如,ICC=频道间相关/一致性参数)。一第二族群参数,其包含代表在二个输入频道之间的位准差的位准差参数(例如,ILD=频道间位准差参数)。
更进一步地,一下混合信号通过将二个输入频道加以向下混合而被产生。此外一余留信号被产生。余留信号是可被使用于通过另外地采用该下混合信号以及一上混矩阵而再产生原始信号的信号。例如,当N个信号被下混合至1个信号时,该下混合一般为N个成分之1,其产生自N个输入信号的映射。自映射(例如,N-1个成分)产生的其余成分是余留信号并且允许通过一逆映射而重建原始的N个信号。该映射,例如,可以是一转动操作。该映射将被进行,使得下混合信号被最大化并且余留信号被最小化,例如,相似于一主轴转换。例如,下混合信号的能量将被最大化并且余留信号的能量将被最小化。当将2个信号下混合至1个信号时,下混合通常是自2个输入信号的映射产生的二个成分之一。自映射产生的其余成分是余留信号并且允许通过一逆映射而重建原始的2个信号。
在一些情况中,余留信号可利用它们的下混合以及去相关的参数而表示关联于所代表的二个信号的一误差。例如,余留信号可能为一误差信号,其代表在原始频道L、R以及频道L’、R’之间的误差,而这些频道L’、R’是由于将根据原始频道L以及R所产生的下混合信号加以上混合所产生的。
换言之,余留信号可被考虑作为时域或一频域或一次频域中的信号,其仅与下混合信号或与下混合信号以及参数信息一起允许一原始频道的正确的或近乎正确的重建。必须了解所谓近乎正确系指,比较至利用下混合而不需余留信号或利用下混合以及参数信息而不需余留信号的重建,与具有较大于零的能量的余留信号的重建较接近于原始频道。
考虑到MPEG环场(MPS),相似于PS而被称为一对二匣(OTT匣)的结构,被采用于空间音频解码树中。这可被看为是单声道-对-立体声上混至多频道空间音频编码/解码机构的概念的一般化。在MPS中,取决于TTT操作模式,可施加去相关器的二-对-三上混合系统(TTT匣)也是存在的。其细节在2007年5月在奥地利,维也纳举行的第122届AES会议的论文集中,J.Herre、K.J.Breebaart等人的”MPEG环场—用于有效以及可兼容的多频道音频编码的ISO/MPEG标准”一文中被说明。
关于方向性音频编码(DirAC),DirAC涉及一参数音域编码机构,其不限于具有固定扩音机位置的一固定数目音频输出频道。DirAC在DirAC形成器中施加去相关器,也即,在空间音频解码器中施加去相关器以合成音域的非一致性成分。关于方向性音频编码的更多信息可在J.Audio Eng.Soc.的2007年第6号,第55卷中的Pulkki,Ville的“具方向性音频编码的空间声音重现”一文中发现。
关于空间音频解码器中的去相关器的最近技术,可参考至:2007年,ISO/IEC23003-1,ISO/IEC国际标准,“信息技术-MPEG音频技术–第一部分:MPEG环场”、以及参考至2004年5月,柏林,Preprint,AES第116届会议的论文集中的J.Engdegard、H.Purnhagen、J.
Figure BDA00003104360000042
L.Liljeryd,“参数立体声编码中的合成环境”。IIR格子式全通结构被使用作为在相同于MPS的空间音频解码器中的去相关器,如同在2007年5月在奥地利,维也纳举行的第122届AES会议的论文集中,J.Herre、
Figure BDA00003104360000043
J.Breebaart等人所说明的“MPEG环场—用于有效以及可兼容的多频道音频编码的ISO/MPEG标准“一文,并且如同在2007年ISO/IEC23003-1,ISO/IEC国际标准中所说明的“信息技术-MPEG音频技术–第一部分:MPEG环场”。其它最近技术去相关器应用(可能频率相依)延迟至去相关信号或旋积输入信号,例如,以指数方式衰减噪声丛爆。对于空间音频上混合系统的最近技术去相关器的叙述,参看2004年5月于柏林,Preprint举行的AES第116届会议的论文集中的“参数立体声编码中的合成周围环境”。
处理信号的另一技术是“语义上混合处理”。语义上混合处理是将信号分解成为具有不同语义性质(也即,信号等级)的成分的技术且施加不同的上混合策略至不同的信号成分上。不同的上混合算法可根据不同的语义性质被最佳化,以便改进全面的信号处理机构。这概念在2009年8月11日的国际专利申请案号,PCT/EP2009/005828,11.6.2010(FH090802PCT),专利WO/2010/017967案“用于决定一空间输出多频道-频道音频信号的装置”中被说明。
进一步的一空间音频编码机构是“时间排列方法”,如Hotho,G.,vandePar,S.,及Breebaart,J.的下列文件中的说明:信号处理的进展期刊EURASIP,标题是“喝采信号的多频道编码”,2008年1月,art.10.DOI=http://dx.doi.org/10.1155/2008/。在该文件中,适用于类似喝采信号的编码/解码的空间音频编码机构被提出。该方案依赖单声道音频信号,一空间音频编码器的一下混合信号的片段的感知相似性。该单声道音频信号被分割成为重迭的时间片段。这些片段时间上在一“超级”区块的内假性随机地(对于n个输出频道相互独立地)被排列以形成去相关输出频道。
进一步的一空间音频编码技术是“时间延迟以及交换方法”。在2007年4月17日的DE102007018032A案:20070417,Erzeugung dekorrelierterSignale,23.10.2008(FH070414PDE),同时也适合于形成立体音响演出的类似喝采信号的编码/解码的一方案被提出。这方案也是依赖单声道音频信号片段的感知相似性并且彼此在输出频道延迟。为了避免向领先频道的局域偏化,领先以及延后频道周期性地被交换。
一般,在参数空间音频编码器中被编码/被解码的立体声或多频道的类似喝采信号是传统地导致降低信号质量(参看,例如,Hotho,G.,vandePar,S.,及Breebaart,J.:“喝采信号的多频道编码”,信号处理的进展期刊EURASIP,2008年1月,art.10.DOI=http://dx.doi.org/10.1155/2008/531693,同时参看DE102007018032A案)。类似的喝采信号特征地含有来自不同方向的时间密集的瞬时混合。对于这些信号的范例如喝采、下雨声、马之奔驰声等等。类似的喝采信号时常也含有来自远方的声音来源的声音成分,其感知地被融合进入一类似噪声、平顺的背景音域中。
在类似MPEG环场的空间音频解码器中被采用的最近去相关技术含有格子式的全通结构。这些作用如同人工式混响产生器并且因此是很好地适用于产生同质、平顺、类似噪声,低沉的声音(类似于室内混响尾声)。但是,仍然有使收听者觉得声音低沉的具有非同质空间时间结构的音域范例:一重要范例是,不仅仅是利用同质类似噪声音域,但有些也利用来自不同方向的单一拍击声的密集序列,而产生环绕收听者的类似喝采的音域。因此,喝采音域的非同质成分可特征在于一空间分布的瞬时混合。显然地,这些不同的拍击声根本上是不同质、平顺、并且是类似噪声的。
由于它们类似混响的性能,格子式全通去相关器不能产生具有,例如,喝采特性的低沉音域。然而,当应用至类似喝采信号时,它们有助于时间上抹除信号中的瞬时。非所需的结果是类似噪声的低沉音域,而不具有类似喝采音域的特殊空间-时间结构。进一步地,类似于单一手拍击声的瞬时事件可能引起去相关器滤波器的混响式人工音效。
根据Hotho,G.,vandePar,S.,以及Breebaart,J“喝采信号的多频道编码”的一系统,信号处理的进展期刊EURASIP,2008年1月,art.10.DOI=http://dx.doi.org/10.1155/2008/531693,其展示由于输出音频信号中的某一反复质量的可感知输出声音的降低。这是因为事实上一个输入信号以及它的片段不变的出现在每个输出频道中(尽管在一不同的时间点)。更进一步地,为避免增加喝采密度,一些原始频道必须在上混合中被舍弃并且因此一些重要听觉事件可能在产生的上混合中被失去。该方法仅是可应用于假设其是可能找出共享相同感知性质的信号片段,也即:声音相似的信号片段。该方法一般严重地改变信号的时间结构,其可能仅对于非常少的信号是可接受的。在施加该机构至类似非喝采信号的情况中(例如,由于信号的错分类),时间的排列将更时常导致不可接受的结果。时间的排列进一步限定适用于许多信号片段可一起被混合而无类似人工式的回声或梳理过滤的情况中。相似的缺点出现在DE102007018032A中所说明的方法中。
WO/2010/017967案中所说明的语义上混合处理在去相关器应用之前分离信号瞬时成分。其余(无瞬时)的信号被馈送至常规去相关器以及上混处理器,因而瞬时信号不同地被处理:后者(例如,随机地)通过应用振幅扫视技术而被分布至立体声或多频道输出信号的不同频道上。振幅扫视展示许多缺点:
振幅扫视(amplitude panning)不必定得产生接近于原始的输出信号。如果原始信号中的瞬时分配可利用振幅扫视法规被说明,则该输出信号可以是仅接近于该原始信号。也即:该振幅扫视可仅正确地完全复制振幅扫视事件,但是在不同输出频道中的瞬时成分之间无相位或时间差异。
此外,在MPS中的振幅扫视方法的应用将不仅仅是需要旁通去相关器,同时也需要旁通上混合矩阵。因为上混合矩阵反映合成展示正确空间性质的一上混合输出所必须的空间参数(频道间相关性:ICC、频道间位准差:ILD),扫视系统它本身必须应用一些规则以合成具有正确空间性质的输出信号。用于如此处理的一般法则不是公知的。进一步地,这结构增加复杂性,因为空间参数必须被注意二次:一次是对于信号的非瞬时部分,以及第二次是对于信号的振幅扫视瞬时部分。
发明内容
因此本发明的一目的是提供用于产生供解码一信号的去相关信号的改进概念。本发明的目的通过根据权利要求1的用于产生去相关信号的装置、根据权利要求11所述的用于编码一音频信号的装置、以及根据权利要求14的用于产生一去相关信号的方法以及通过根据权利要求15的计算机程序被解决。
根据一实施例的一装置包含瞬时分离器,该瞬时分离器用于将输入信号分离成为第一信号成分以及成为第二信号成分,使得该第一信号成分包含该输入信号的瞬时信号部分,并且使得该第二信号成分包含该输入信号的非瞬时信号部分。该瞬时分离器可将不同的信号成分相互分离,以允许除了不包含瞬时的信号成分之外,包含瞬时的信号成分也可不同地被处理。
该装置更进一步地包含一瞬时去相关器,其用于根据一去相关方法而将包含瞬时的信号成分去相关,其尤其适用于将包含瞬时的信号成分去相关。此外,该装置包含用于将不包含瞬时的信号成分去相关的一第二去相关器。
因此,该装置能够利用标准去相关器处理信号成分或利用尤其适用于处理瞬时信号成分的瞬时去相关器而不同地处理信号成分。在一实施例中,瞬时分离器决定一信号成分是否被馈送进入标准去相关器或进入瞬时去相关器的任一者中。
更进一步地,该装置可适于分离一信号成分,使得该信号成分部分地被馈送进入瞬时去相关器中,并且部分地被馈送进入第二去相关器中。
此外,该装置包含一组合单元,其用于组合利用标准去相关器以及瞬时去相关器所输出的信号成分以产生一去相关组合信号。
在一实施例中,该装置包含用于接收相位信息的一接收单元,其中,该瞬时去相关器适于施加该相位信息至第一信号成分。该相位信息可通过一适当的编码器被产生。
在一实施例中,瞬时分离器被调适,以根据指示包含一瞬时的所考虑信号部分或其指示不包含一瞬时的所考虑信号部分的任一者的瞬时分离信息,而馈送一装置输入信号的所考虑信号部分进入瞬时去相关器或馈送所考虑信号部分进入第二去相关器。该实施例允许瞬时分离信息的容易处理。
在另一实施例中,瞬时分离器适于部分地馈送一装置输入信号的一所考虑信号部分进入瞬时去相关器并且部分地馈送该所考虑信号部分进入第二去相关器。被馈送进入瞬时分离器的所考虑信号部分总量以及被馈送进入第二去相关器的所考虑信号部分总量取决于瞬时分离信息。由此,瞬时强度可被考虑。
在进一步的一实施例中,瞬时分离器适于分离在一频率领域中被表示的一装置输入信号。这允许频率相依瞬时处理(分离以及去相关)。因此,第一频带的特定信号成分可根据一瞬时去相关方法被处理,而另一频带的信号成分可根据另一方法(例如,传统的去相关方法)被处理。因此,在一实施例中,瞬时分离器适于根据频率相依瞬时分离信息而分离一装置输入信号。但是,在另一实施例中,瞬时分离器适于根据频率相依分离信息而分离一装置输入信号。这允许更有效的瞬时信号处理。
在另一实施例中,瞬时分离器可适于分离在一频率领域中被表示的一装置输入信号,使得在一第一频率范围之内的装置输入信号的所有信号部分被馈送进入第二去相关器。一对应的装置因此适于限定瞬时信号处理于具有在一第二频率范围中的信号频率的信号成分,而同时没有在第一频率范围中的信号频率的信号成分被馈送进入瞬时去相关器(但却是进入第二去相关器)。
在进一步的一实施例中,瞬时去相关器可适于通过施加代表在一余留信号以及一下混合信号之间的一相位差的相位信息而将该第一信号成分去相关。在编码器侧上,一“反向”混合矩阵可被采用于产生下混合信号以及余留信号,例如,自一立体声信号的二个频道,如已在上面说明的。尽管下混合信号可被发送至解码器,余留信号可被摒弃。根据一实施例,被瞬时去相关器所采用的相位差可以是在余留信号以及下混合信号之间的相位差。因此其可通过在下混合的上施加余留的原始相位,而重建“人工式”余留信号。在一实施例中,相位差可与某一频带相关,也即,可能是频率相依的。另外地,一相位差可能不与某些频带相关,但是可被施加作为一频率无关多频带参数。
在一进一步的实施例中,一相位项可通过将相位项与第一信号成分相乘而被施加至第一信号成分。
在一进一步的实施例中,第二去相关器可以是传统的去相关器,例如,格子式IIR去相关器。
在一实施例中,该装置包含一混合器,其适于接收输入信号和更适于根据该输入信号以及根据一混合规则以产生输出信号。一装置输入信号被馈送进入一瞬时分离器并且随后利用一瞬时分离器和/或一第二去相关器如上所述地被去相关。组合单元以及混合器可被配置因而该去相关组合信号被馈送进入混合器作为一第一混合器输入信号。一第二混合器输入信号可以是装置输入信号或是自该装置输入信号导出的一信号。由于当去相关组合信号被馈送进入混合器时去相关处理程序已被完成,故混合器不需要考虑瞬时去相关。因此,一常规的混合器可被采用。
在一进一步的实施例中,混合器适于接收指示在二个信号之间的相关性或一致性的相关性/一致性参数资料,且适于根据该相关性/一致性参数数据而产生输出信号。在另一实施例中,混合器适于接收指示在二个信号之间的能量差异的位准差参数数据,且适于根据位准差参数数据而产生输出信号。在该实施例中,由于混合器将负责处理对应的资料,因此瞬时去相关器、第二去相关器、以及组合单元不需要适于处理这些参数数据。另一方面,具有常规相关性/一致性以及位准差参数处理的常规混合器可被采用于该一实施例中。
附图说明
接着将参考图形更详细地说明各实施例,其中:
图1说明在一单声道至立体声上混合器中的去相关器的现有技术的应用;
图2说明在单声道至立体声上混合器中的去相关器的进一步的最近技术的应用;
图3说明根据一实施例的用于产生去相关信号的装置;
图4说明根据一实施例用于解码信号的装置;
图5是根据一实施例的一对二(OTT)系统的概况图;
图6说明根据进一步的一实施例用于产生包含接收单元的去相关信号的装置;
图7是根据进一步的另一实施例的一对二系统概况图;
图8是说明自相位一致性量测映射至瞬时分离强度的范例;
图9是根据进一步的另一实施例的一对二系统概况图;
图10说明用于编码具有多个频道的音频信号的装置。
具体实施方式
图3说明了根据一实施例用于产生一去相关信号的装置。该装置包含一瞬时分离器310、一瞬时去相关器320、一常规去相关器330以及一组合单元340。这实施例的瞬时处理方法是用于自类似喝采音频信号产生去相关信号,例如,对于空间音频解码器的上混合处理中的应用。
在图3中,一输入信号被馈送进入一瞬时分离器310。该输入信号可能,例如,通过施加一混合QMF滤波器排组而被转换至一频率领域。瞬时分离器310可决定对于输入信号的各考虑信号成分是否包含一瞬时。更进一步地,该瞬时分离器310可被配置,如果所考虑信号部分包含一瞬时(信号成分s1),则馈送任一考虑信号部分进入瞬时去相关器320,或如果考虑信号部分不包含一瞬时(传信号成分s2),则其可馈送考虑信号部分进入常规去相关器330。瞬时分离器310也可被配置为根据考虑信号部分中的一瞬时的存在而分切考虑信号部分且部分地提供它们至瞬时去相关器320并且部分被提供至常规去相关器330。
在一实施例中,瞬时去相关器320根据一瞬时去相关方法以将信号成分s1去相关,该去相关方法尤其是适用于将瞬时信号成分去相关。例如,瞬时信号成分的去相关可通过施加相位信息,例如,通过施加相位项而被实施。其中,相位项被施加在瞬时信号成分上的一去相关方法将参看图5实施例在下面被说明。该去相关方法也可被采用作为图3实施例的瞬时去相关器320的瞬时去相关方法。
信号成分s2,其包含非瞬时信号部分,被馈送进入常规去相关器330。该常规去相关器330接着可根据一常规去相关方法以将信号成分s2去相关,例如,通过施加格子式全通结构,例如,一格子式IIR(无限脉冲响应)滤波器。
在利用常规去相关器330被去相关之后,去相关信号成分自常规去相关器330被馈送进入组合单元340。去相关瞬时信号成分也自瞬时去相关器320被馈送进入组合单元340。组合单元340接着组合两个去相关信号成分,例如,通过相加两个信号成分,以得到一去相关组合信号。
一般,根据一实施例以将包含瞬时信号去相关的方法可如下面所述地被进行:
在一分离步骤中,输入信号被分离成为二个成分:一个成分s1包含输入信号的瞬时,另一成分s2包含输入信号的其余(非瞬时)部分。信号的非瞬时成分s2可在系统中相同地被处理而不必施加这实施例的瞬时去相关器的去相关方法。也即:无瞬时信号s2可被馈送至相同于格子式IIR全通机构的一个或多个常规去相关信号处理机构。
此外,包含瞬时的信号成分(瞬时流s1)被馈送至一”瞬时去相关器”机构,其将瞬时流去相关而保持较佳于常规去相关机构的特殊信号性质。瞬时流的去相关通过施加一高时间解析的相位信息而被实施。最好是,相位信息包含相位项。更进一步地,较佳的是,相位信息可利用编码器被提供。
进一步地,常规去相关器以及瞬时去相关器两者的输出信号被组合以形成去相关信号,其可被采用于空间音频编码器的上混合处理中。空间音频解码器的混合-矩阵(Mmix)的元素(h11、h12、h21、h22)可保持不变。
图4示出了根据一实施例用于解码一装置输入信号的装置,其中,该装置输入信号被馈送进入瞬时分离器410。装置包含瞬时分离器410、一瞬时去相关器420、一常规去相关器430、组合单元440、以及混合器450。这实施例的瞬时分离器410、瞬时去相关器420、常规去相关器430、以及组合单元440可分别与图3实施例的瞬时分离器310、瞬时去相关器320、常规去相关器330以及组合单元340相似。利用组合单元440产生的去相关组合信号被馈送进入混合器450作为一第一混合器输入信号。更进一步地,已被馈送进入瞬时分离器410的装置输入信号也被馈送进入混合器450作为一第二混合器输入信号。另外地,装置输入信号不直接地被馈送进入混合器450,但是自装置输入信号导出的一信号被馈送进入混合器450。一信号可自装置输入信号被导出,例如,通过施加一常规信号处理方法至装置输入信号,例如,施加一滤波器。图4实施例的混合器450根据输入信号以及一混合法则适于产生输出信号。该混合法则可以是,例如,相乘输入信号以及一混合矩阵,例如,通过应用下列公式:
L R = h 11 h 12 h 21 h 22 M D
混合器450可基于相关/一致性参数数据,例如,频道间相关/一致性(ICC),和/或位准差参数数据,例如,频道间位准差(ILD),而产生输出频道L、R。例如,一混合矩阵的系数可取决于相关/一致性参数资料和/或位准差参数资料。在图4的实施例中,混合器450产生二个输出频道L以及R。但是,在另外的实施例中,混合器可产生多个输出信号,例如,3个、4个、5个、或9个输出信号,其可以是环场声音信号。
图5示出了一实施例的1-对-2(OTT)上混合系统中的瞬时处理方法的系统概况图,例如,MPS(MPEG环场)空间音频解码器的1-对-2匣。根据一实施例供用于分别的瞬时的平行信号路线被包含在U-形瞬时处理匣中。一装置输入信号DMX被馈送进入瞬时分离器510。装置输入信号可在一频域中被表示。例如,一时域输入信号可能已通过如在MPEG环场中被使用地施加一QMF滤波器排组而被转换成为一频域信号。瞬时分离器510接着可馈送装置输入信号DMX的成分进入瞬时去相关器520和/或进入格子式IIR去相关器530。装置输入信号成分接着利用瞬时去相关器520和/或格子式IIR去相关器530被去相关。随后,去相关信号成分D1以及D2利用组合单元540被组合,例如,通过相加两个信号成分,以得到去相关组合信号D。去相关组合信号被馈送进入混合器552作为第一混合器输入信号D。更进一步地,装置输入信号DMX(或另外地:自装置输入信号DMX导出的信号)也被馈送进入混合器552作为第二混合器输入信号。混合器552接着根据装置输入信号DMX,而产生第一以及第二“干(dry)”信号。混合器552也根据去相关组合信号D而产生第一以及第二“湿(wet)”信号。利用混合器552产生的信号,也可根据发送的参数,例如,相关/一致性参数数据、例如,频道间相关/一致性(ICC)、和/或位准差参数数据,例如,频道间位准差(ILD)而被产生。在一实施例中,利用混合器552所产生的信号可被提供至成形单元554,其根据被提供的时间成形数据而形成所提供的信号。在其它实施例中,没有信号成形发生。产生的信号接着被提供至第一加法单元556或第二加法单元558,其组合被提供的信号以分别地产生第一输出信号L以及第二输出信号R。
图5所示的处理原理可被应用于单声道-至-立体声上混合系统(例如,立体声音频编码器)中以及于多频道结构(例如,MPEG环场)中。在实施例中,所提议的瞬时处理机构可作为一升级被施加至现存的上混合系统中,而不必上混合系统的大的概念的改变,因为仅一平行的去相关器信号路线被引介,而不必改变上混合处理程序本身。
信号分离成为瞬时以及非瞬时成分利用可在编码器和/或空间音频解码器中被产生的参数被控制。瞬时去相关器520采用相位信息,例如,可在编码器中或空间音频解码器中被得到的相位项。用于得到瞬时处理参数(也即:诸如瞬时位置或分离强度的瞬时分离参数以及诸如相位信息的瞬时去相关参数)的可能变化将在下面被说明。
输入信号可在一频域中被表示。例如,一信号可通过采用一分析滤波器排组而被转换至一频域信号。一QMF滤波器排组可被施加以自时域信号得到多个次频带信号。
对于最佳的感知质量,瞬时信号处理最好是可将信号频率限制在一限定的频率范围中。一范例是将处理范围限定在混合QMF滤波器排组的频带指数k≧8,如在MPS中的使用,相似于MPS中的引导封装成形(GES)的频带限定。
在下面,瞬时分离器520实施例将更详细地被说明。瞬时分离器510分切输入信号DMX分别地成为瞬时以及非瞬时成分s1、s2。瞬时分离器510可采用瞬时分离信息以供切割输入信号DMX,例如,瞬时分离参数β[n]。输入信号DMX的分切可以一种方式被完成,使得成分总和,s1+s2,等于输入信号DMX:
s1[n]=DMX[n]·β[n]
s2[n]=DMX[n]·(1-β[n])
其中,n为向下取样次频带信号的时间指数及对于时间变化瞬时分离参数β[n]的有效数值是在范围[0,1]中。β[n]可以是频率无关参数。根据频率无关分离参数适于分离一装置输入信号的瞬时分离器510,可根据β[n]数值而馈送所有具有时间指数n的次频带信号部分至瞬时去相关器520或进入第二去相关器。
另外地,β[n]可以是频率相依参数。根据一频率相依瞬时分离信息适于分离一装置输入信号的瞬时分离器510,如果它们对应的瞬时分离信息不同,则可不同地处理具有相同时间指数的次频带信号部分。
更进一步地,频率相依可以,例如,被使用于限定瞬时处理的频率范围,如上面部分说明的。
在一实施例中,瞬时分离信息可以是一参数,其指示输入信号DMX的考虑信号部分包含一瞬时或其指示考虑信号部分不包含一瞬时。如果瞬时分离信息指示考虑信号部分包含一瞬时,则瞬时分离器510馈送考虑信号部分进入瞬时去相关器520。另外地,如果瞬时分离信息指示考虑信号部分包含一瞬时,则瞬时分离器510馈送考虑信号部分进入第二去相关器,例如,格子式IIR去相关器530。
例如,一瞬时分离参数β[n]可被采用作为瞬时分离信息,其可以是一个二元参数。N是输入信号DMX的考虑信号部分的时间指数。β[n]可以是1(指示考虑信号部分将被馈送进入瞬时去相关器)或0(指示考虑信号部分将被馈送进入第二去相关器)。限定β[n]至β∈{0,1}导致硬性的瞬时/非瞬时决定,也即:被处理如瞬时的成分是完全地自输入(β=1)被分离。
在另一实施例中,瞬时分离器510适于部分地馈送装置输入信号的考虑信号部分进入瞬时去相关器520并且部分地馈送考虑信号部分进入第二去相关器530。被馈送进入瞬时分离器520的考虑信号部分总数以及被馈送进入第二去相关器530的考虑信号部分总数取决于瞬时分离信息。在一实施例中,β[n]必须在范围[0,1]中。在进一步的实施例中,β[n]可被限定至β[n]∈[0,βmax],其中,βmax<1,形成瞬时的部分分离,导致瞬时处理机构较小明显的影响。因此,改变βmax将允许在常规无瞬时处理的上混合处理输出及包括瞬时处理的上混合处理之间的衰褪。
接着,将根据一实施例更详细地说明一瞬时去相关器520。
根据一实施例,瞬时去相关器520产生与输入充分地去相关的一输出信号。其不改变单一拍击声/瞬时的时间结构(无时间抹除、无延迟)。然而,其导致瞬时信号成分的空间分配(在上混处理程序之后),其是相似于原始(无编码)信号中的空间分配。瞬时去相关器520可允许位率相对质量的折衷(例如,在低位率的完全地随机空间瞬时分配
Figure BDA00003104360000151
在高位率的接近至原始(近乎明晰))。更进一步地,这利用低的计算复杂性被达成。
如已在上面说明的,在编码器侧上,一“反向”混合矩阵可被采用于产生一下混合信号以及一余留信号,例如,自一立体声信号的二个频道。虽下混合信号可被发送至解码器时,余留信号可被摒弃。根据一实施例,在余留信号以及下混合信号之间的相位差可被决定,例如,通过一编码器,并且当将一信号去相关时,可被一解码器所采用。利用这点,接着通过将余留原始相位应用在下混合上,可重建一“人工式”余留信号。
根据一实施例的瞬时去相关器520的一对应去相关方法,接着将在下面被说明:
根据一瞬时去相关方法,一相位项可被采用。去相关通过简单地相乘瞬时流与高时间解析(例如,在相同于MPS的转换领域系统中的次频带信号时间解析)的相位项而被达成:
Figure BDA00003104360000161
在这方程式中,n是下取样次频带信号的时间指数。
Figure BDA00003104360000162
理想上反映在下混合以及余留者之间的相位差。因此,瞬时余留被来自下混合的瞬时复制所取代、被修改,使得它们具有原始相位。
应用相位信息将在上混处理程序中固有地导致至原始位置的一瞬时扫视。展示的范例考虑到ICC=0,ILD=0的情况:输出信号的瞬时部分接着为:
Figure BDA00003104360000164
对于
Figure BDA00003104360000165
这导致L=2c*s,R=0,而
Figure BDA00003104360000166
导致L=0,R=2c*s。其它的
Figure BDA00003104360000167
ICC、以及ILD数值将导致在产生的瞬时之间的不同位准以及相位关系。
Figure BDA00003104360000168
数值可被施加作为频率无关多频带参数或作为频率相依参数。在类似喝采信号而无音调成分的情况中,由于较低数据率要求以及多频带瞬时的一致处理(在频率上的一致性),多频带数值可以是有利的。
图5的瞬时处理结构被配置为使得仅常规去相关器530关于瞬时信号成分被旁通,而混合矩阵则保持不变。因此,对于瞬时信号,空间参数(ICC,ILD)也固有地被考虑,例如:ICC自动地控制产生的瞬时分配的宽度。
考虑到如何得到相位信息方面,在一实施例中,相位信息可自一编码器被接收。
图6示出了用于产生一去相关信号的装置实施例。该装置包含瞬时分离器610、瞬时去相关器620、常规去相关器630、组合单元640以及接收单元650。瞬时分离器610、常规去相关器630以及组合单元640是相似在图3示出的实施例的瞬时分离器310、常规去相关器330以及组合单元340。但是,图6更进一步地展示接收单元650,其适于接收相位信息。该相位信息可利用编码器(未被展示)被发送。例如,编码器可计算在余留的以及下混合信号之间的相位差(有关一下混合的余留信号的相对相位)。对于某些频带或多频带(例如,在时间领域中),相位差可被计算。编码器可适当地通过均匀或非均匀量化而编码相位数值且可能无损编码。随后,编码器可发送该编码相位数值至空间音频解码系统。自编码器得到相位信息是有利的,因原始的相位信息是接着可供利用于解码器中(除了对于量化误差之外)。
接收单元650馈送相位信息进入瞬时去相关器620中,其当将一信号成分去相关时将使用该相位信息。例如,相位信息可以是一相位项并且瞬时去相关器620可将一接收的瞬时信号成分与该相位项相乘。
在自编码器发送相位信息
Figure BDA00003104360000171
至解码器的情况中,所需的数据率可如下面所述被降低:
相位信息可仅被施加至解码器中的瞬时信号成分。因此,相位信息仅需只要在信号中有瞬时成分将被去相关可供用于解码器中即可。相位信息的发送因此可能受编码器的限定,使得仅必须的信息被发送至解码器。这可通过在编码器中施加一瞬时检测而被完成,如在下面说明的。相位信息
Figure BDA00003104360000173
仅被发送于已在编码器中检测瞬时的时间n中的时间点。
考虑到瞬时分离方面,在一实施例中,瞬时分离可以是编码器驱动方式。
根据一实施例,瞬时分离信息(也被称为“瞬时信息”)可自编码器被得到。如于2007年5月在奥地利维也纳举行的第122届AES会议的论文集中,Andreas Walther、Christian Uhle、Sascha Disch的“利用瞬时抑制于隐藏式多频道上混合算法”一文中的说明,编码器可施加瞬时检测方法至编码器输入信号或至下混合信号。瞬时信息接着被发送至解码器并且最好是例如以向下取样次频带信号的时间解析被得到。
瞬时信息最好可包含供用于时间中的各个信号取样的一简单二元(瞬时/非瞬时)决定。这信息最好也可利用时间中的瞬时位置以及瞬时持续被表示。
瞬时信息可无损地被编码(例如,行程长度编码、熵编码)以降低自编码器将瞬时信息发送至解码器所必须的数据率。
瞬时信息可依某一频率解析被发送作为多频带信息或作为频率相依信息。发送该瞬时信息作为多频带参数,将由于多频带瞬时的一致性的处理而降低瞬时信息数据率并且可能改进音频质量。
取代二元(瞬时/非瞬时)决定,瞬时强度也可被发送,例如,以二个或四个级距被量化。瞬时强度接着可控制在空间音频解码器中的瞬时分离,如下面所述:强的瞬时自IIR格子式去相关器输入完全地被分离,而较弱的瞬时仅部分地被分离。
瞬时信息可仅被发送,如果编码器检测到类似喝采信号,例如,利用喝采检测系统,如在2009年纽约举行的音频工程师协会第127届会议中,Christian Uhle的“具有低潜伏期的喝采声音的检测”一文的说明。
对于输入信号对类似喝采信号的相似性的检测结果也可以较低的时间解析(例如,在MPS中的空间参数更新率)被发送至解码器以控制瞬时分离强度。该喝采检测结果可被发送作为二元参数(也即,作为硬性决定)或作为非二元参数(也即,作为软性决定)。这参数控制空间音频解码器中的分离强度。因此,允许(几乎不或逐渐地)导通/切断解码器中的瞬时处理。这允许,例如,当应用一多频带瞬时处理机构至含有音调成分的信号时,将避免可能发生的人工产物。
图7示出了根据一实施例的用于解码一信号的装置。该装置包含瞬时分离器710、瞬时去相关器720、格子式IIR去相关器730、组合单元740、混合器752、选用成形单元754、第一加法单元756以及第二加法单元758,其分别地对应至图5实施例的瞬时分离器510、瞬时去相关器520、格子式IIR去相关器530、组合单元540、混合器552、选用成形单元554、第一加法单元556以及第二加法单元558。在图7的实施例中,一编码器得到相位信息以及瞬时位置信息并且发送该信息至用于解码的装置。没有余留信号被发送。图7示出了与MPS中的OTT匣相同的1-对-2上混合组态。其可根据一实施例被应用在供用于自单声道下混合至立体声输出的上混合的立体声编解码中。在图7的实施例中,三个瞬时处理参数作为频率无关参数而自编码器被发送至解码器,如可从图7中所见到的:
将被发送的一第一瞬时处理参数是在编码器中执行的一瞬时检测器的二元瞬时/非瞬时决定。其被使用于控制解码器中的瞬时分离。在一简单机构中,二元瞬时/非瞬时决定可被发送作为每个次频带时间取样的二元旗标,而不必进一步的编码。
将被发送的进一步的一瞬时处理参数是瞬时去相关器所需要的相位数值(或多个相位数值)
Figure BDA00003104360000191
仅对于其瞬时已于编码器中被检测的时间n而发送。
Figure BDA00003104360000192
数值被发送作为具有,例如,每个取样3位的分辨率的量化器指数。
将被发送的另一瞬时处理参数为分离强度(也即,瞬时处理机构的效应强度)。这信息以如空间参数ILD、ICC相同的时间分辨率被发送。
用于自编码器将瞬时分离决定以及多频带相位信息发送至解码器的必须的位率BR可对于类似MPS系统被估计,如下所述:
Figure BDA00003104360000193
其中σ为瞬时密度(被标记为瞬时的时槽片段(=次频带时间取样)),Q是每个发送相位数值的位数,且fs是取样率。应注意到,(fs/64)是下取样次频带信号的取样率。
E{σ}<0.25对于一组许多表示喝采项目被量测,其中,E{.}指示在项目持续上的平均值。在相位数值精确度以及参数字元率之间的合理折衷是Q=3。为降低参数数据率,ICC以及ILD可被发送作为多频带提示。作为多频带提示的ICC以及ILD的发送是格外地可适用于诸如喝采的非音调信号。
另外地,用于传信分离强度的参数以ICC/ILD的更新率被发送。对于MPS中的长空间讯框(32乘64取样)以及4-级距量化分离强度,这导致BRtransientseparationstrength=(fs/(64·32))·2的另外位率。
分离强度参数可在编码器中自信号分析算法结果被导出,该信号分析算法结果评估对于类似喝采信号、声调或指示当施加实施例的瞬时去相关时可能的优势或问题的其它信号特性的相似性。
被发送以供瞬时处理的参数可接受无损编码以降低冗余量,而导致较低的参数字元率(例如,瞬时分离信息的行程长度编码,熵编码)。
返回至得到相位信息的论点,在一实施例中,相位信息可在解码器中被得到。
在该实施例中,用于解码的装置不从编码器得到相位信息,但是可决定相位信息本身。因此,不须发送相位信息而导致降低全面的传输率。
在一实施例中,相位信息在MPS为基础的解码器中从“引导封装成形(GES)”数据得到。这仅适用于假设GES数据被发送,也即,如果GES特点在编码器中被致动的话。GES特点是可用的,例如,在MPS系统中。在输出频道之间的GES封装数值比率反映在高时间分辨率的瞬时的扫视位置。GES封装数值比率(GESR)可被映射至瞬时处理所需要的相位信息上。在GES中,映射可根据一映射法则被进行,该映射法则是凭经验地从对于一组适当测试信号表示的相位-相对-至-GESR-分配的建构统计得到。决定映射法则是用于设计瞬时处理系统的步骤,而不是当应用瞬时处理系统时的一进行时间处理程序。因此,无论如何,如果GES数据是GES特点应用所需的,则其是有利地不需要花费另外的发送相位数据的成本。比特流回溯兼容性通过MPS比特流/解码器达成。但是,自GES数据抽取的相位信息不是如可在编码器中被得到的相位信息那样一般地精确(例如:估计相位的符号是未知的)。
在进一步的一实施例中,相位信息也可在解码器中被得到,但是自发送的非满频带余留者。这是适用于,例如,如果频带受限余留信号在MPS编码机构中被发送(一般涵盖高至某一转变频率的频率范围)。在该实施例中,在下混合以及余留频带中被发送的余留信号之间的相位关系被计算,也即,对于余留信号被发送的频率。更进一步地,自余留频带至非余留频带的相位信息被外插(和/或可能被内插)。一个可能性是将在余留频带中所得到的相位关系映射至一广域频率无关相位关系数值,其接着被使用于瞬时去相关器中。总之,如果无满频带余留被发送的话,这将导致没有另外的发送相位数据的成本的优势。但是,必须考虑到,相位估计正确性是取决于其中余留信号被发送的频带宽度。该相位估计的正确性也取决于在沿着频率轴的下混合以及余留信号之间的相位关系的一致性。对于明确瞬时信号,通常遭遇高的一致性。
在进一步的一实施例中,相位信息采用自编码器被发送的另外的更正信息在解码器中被得到。该实施例是相似于先前的二个实施例(来自GES的相位、来自余留的相位),但另外地,其必须在编码器中产生被发送至解码器的更正数据。更正数据允许降低可能发生在先前说明的不同的二者(来自GES的相位、来自余留的相位)中的相位估计误差。更进一步地,更正数据可在编码器中自估计的解码器侧的相位估计误差被导出。更正数据可以是这(可能被编码)估计的估计误差。更进一步地,有关相位-估计-自-GES-数据方法,更正数据可简单地是编码器-产生相位数值的正确符号。这允许在解码器中产生具有正确符号的相位项。该方法的优势是由于有更正数据,在解码器中的相位信息可恢复的精确性是更接近于编码器产生的相位信息。但是,更正信息的熵是较低于正确相位信息本身的熵。因此,当比较至直接地发送在编码器中所得到的相位信息时,参数字元率被降低。
在另一实施例中,相位信息/项目在解码器中自一(假性-)随机处理程序被得到。该方法的优势不需要发送任何具有高时间分辨率的相位信息。这导致数据率被降低。在一实施例中,一简单方法是在[-180°,180°]范围中产生具有均匀随机分配的相位数值。
在进一步的一实施例中,编码器中的相位分配的统计性质被量测。这些性质被编码并且接着被发送(低时间分辨率)至解码器。受支于发送统计性质的随机相位数值在解码器中被产生。这些性质可以是统计相位分布的平均值、变量、或其它的统计量测。
当多于一个去相关器实例平行地被进行时(例如,对于一多频道上混合),必须要小心以确保相互地去相关的去相关器输出。在一实施例中,其中(假性-)随机相位数值的多个向量(非一单一向量)对于第一去相关器实例之外的所有者被产生,一组向量被选择而导致在所有去相关器实例相位数值的最少的相关性。
在自编码器发送相位更正信息至解码器的情况中,所需的数据率可如下所述地被降低:
相位更正信息仅在将被去相关的信号中有瞬时成分,则需要可在解码器中供其所用。相位更正信息的发送可因此受限于编码器,使得仅必须的信息被发送至解码器。这可如上所述地,通过在编码器中施加一瞬时检测而被完成。相位更正信息仅对于其中瞬时在编码器中被检测的时间n中的点被发送。
返回至瞬时分离方面,在一实施例中,瞬时分离可以为解码器驱动式。
在该实施例中,瞬时分离信息也可在解码器中被得到,例如,通过在上混合至一立体声或多频道输出信号之前将一瞬时检测方法施加至可供用于空间音频解码器中的下混合信号,该瞬时检测方法如在2007年5月在奥地利维也纳举行的第122届AES会议的论文集中,Andreas Walther、Christian Uhle、Sascha Disch的“利用瞬时抑制于隐藏式多频道上混合算法中”中说明的。在该情况中,没有瞬时信息必须被发送,其节省发送数据率。
但是,进行解码中的瞬时检测可以导致争议,例如,当标准化瞬时处理机构时:例如,可能是难以找到一瞬时检测算法,当于涉及不同的数值精确性、舍入机构等等的不同的结构/平台上被实施时,其将确切地导致相同瞬时检测结果。此一可预料的解码器性能通常对标准化是强制性。更进一步地,标准化的瞬时检测算法可能对于一些输入信号造成失败,而在输出信号中导致不能忍受的失真。其接着可能是不易于在标准化之后不用建构不符合标准的解码器而更正失败的算法。如果控制瞬时分离强度的至少一参数以低时间分辨率(例如,在MPS的空间参数更新率)自编码器被发送至解码器的话,则这议题将可能是较不严重。
在进一步的一实施例中,瞬时分离也是解码器驱动式并且非满频带余留者被发送。在这实施例中,解码器驱动瞬时分离可通过采用自被发送的非满频带余留者所得到的相位估计而被精致化(如上所述)。注意到,这精致化可被应用在解码器中,而不必自编码器发送另外的数据至解码器。
在这实施例中,被施加在瞬时去相关器中的相位项通过外插自余留频带至没有可供用的余留的频率的正确相位数值而被得到。一个方法是,自可被计算对于余留信号是可供使用的那些频率的相位数值而计算(可能是,例如,信号功率加权)一平均相位数值。平均相位数值接着可被应用作为在瞬时去相关器中的一频率无关参数。
只要在下混合以及余留之间的正确相位关系是频率无关的,则平均相位数值代表正确相位数值的一良好的估计。但是,在沿着频率轴的一相位关系不是一致的情况中,平均相位数值可能是较不正确的估计,而可能导致不正确的相位数值以及听得到的人工产物式声音。
沿着频率轴在下混合以及发送的余留之间的相位关系的一致性可因此被使用作为被施加在瞬时去相关器中的外插相位估计的可靠度量测。为了降低听得到的人工式声音风险,在解码器中所得到的一致性量测可被使用于控制解码器中的瞬时分离强度,例如,如下面所述的:
其对应的相位信息(也即,对于相同时间指数n的相位信息)是与频率一致的瞬时,是完全地与常规去相关器输入分离且是完全地被馈送进入瞬时去相关器中。因为大的相位估计误差是不太可能,所以瞬时处理的完全可能性被使用。
其对应的相位信息是与频率较不一致的瞬时,仅是部分地分离,而导致瞬时处理机构较不显著的效应。
其对应的相位信息是与频率非常一致的瞬时,不被分离,而导致常规无所建议的瞬时处理上混合系统的标准行为。因此,没有由于大的相位估计误差的人工式产物可能发生。
对于相位信息的一致性量测可被减除,例如,自(可能地信号功率加权)沿着频率的相位信息标准偏差的变异量。
因为仅少数频率可供用于余留信号的发送,一致性量测可能必须仅自沿着频率的少数取样被估计,导致仅很少的达到极端数值(“完全地一致”或“完全地不一致”)的一致性量测。因此,一致性量测在被使用于控制瞬时分离强度之前可能是线性地或非线性地变形。在一实施例中,一临界特性被实施,如图8的右方范例所说明的。
图8示出了自相位一致性量测映射至瞬时分离强度的不同范例,其展示用于在瞬时错误分类的强健度上得到瞬时处理参数的变化冲击。用于得到上面列出的瞬时分离信息以及相位信息的变化是不同于参数数据率,并且以实施所提议的瞬时处理技术的一编解码器的所有位率角度而言,其因此代表不同的操作点。此外,用于得到相位信息的来源的选择也影响诸如对于错误瞬时分类的强健度:如果正确相位信息被施加在瞬时处理中,处理一非瞬时信号作为一瞬时将引起更少听得见的失真。因此,当比较至解码器中的随机相位产生情节时,在发送相位数值情节中,信号分类错误引起较不严重的人工式产物。
图9是根据进一步的实施例而具有瞬时处理的一对二系统概况图,其中窄频带余留信号被发送。相位数据
Figure BDA00003104360000241
自余留信号频带中在下混合(DMX)以及余留信号之间的相位关系而被估计。可选择地,相位更正数据被发送以降低相位估计误差。
图9示出了瞬时分离器910、瞬时去相关器920、格子式IIR去相关器(lattice IIR decorrelator)930、组合单元940、混合器952、选用成形单元954、第一加法单元956以及第二加法单元958,其是分别地对应至图5实施例的瞬时分离器510、瞬时去相关器520、格子式IIR去相关器530、组合单元540、混合器552、选用成形单元554、、第一加法单元556以及第二加法单元558。图8的实施例更进一步地包含相位估计单元960。相位估计单元960接收输入信号DMX、余留信号”余留”以及可选择地,相位更正数据。根据接收的信息,相位信息单元计算相位数据可选择地,相位估计单元也决定相位一致性信息并且传送该相位一致性信息至瞬时分离器910。例如,相位一致性信息可被瞬时分离器所使用于控制瞬时分离强度。
图9的实施例应用一些发现,如果余留者是在一非满频带形式的编码机构之内被发送,则在余留的以及下混合()之间的信号功率加权平均相位差可作为多频带相位信息被施加至分别的瞬时()。在该情况中,没有另外的相位信息必须被发送,而降低对于瞬时处理的位率要求。在图9的实施例中,自余留频带的相位估计可能自可供用于编码器中的更精确的多频带相位估计大量偏离。一选择是因此发送相位更正数据(例如,),因而正确的
Figure BDA00003104360000254
是可在解码器中得到。但是,因为
Figure BDA00003104360000255
可展示较低于
Figure BDA00003104360000256
的熵,所须的参数数据率可以是较低于用于发送
Figure BDA00003104360000257
所需要的数据率。(这概念是相似于编码中预测的一般使用:取代直接地编码数据,具有较低熵的预测误差被编码。在图9的实施例中,预测步骤是自余留频带至非余留频带的相位外插)。在沿着频率轴的余留频带(
Figure BDA00003104360000258
)中的相位差一致性可被使用于控制瞬时分离强度。
在实施例中,解码器可自编码器接收相位信息,或解码器它本身可决定相位信息。更进一步地,解码器可自编码器接收瞬时分离信息,或解码器它本身可决定瞬时分离信息。
在实施例中,瞬时处理的一论点是,在与“瞬时去相关器”一起的WO/2010/017967案中所说明的“语义去相关”概念的应用,其是根据将输入与相位项相乘。产生的类似喝采信号的感知质量被的改进,因两个处理步骤避免改变瞬时信号的时间结构。更进一步地,瞬时的空间分配以及在该等瞬时之间的相位关系在输出频道中被重建。更进一步地,实施例也是有计算效益的并且可容易地被整合于PS-或MPS-类似上混合系统。在实施例中,瞬时处理不影响混合矩阵处理程序,因而通过混合矩阵被定义的所有空间产生的性质也被施加至瞬时信号上。
在实施例中,一新颖的去相关机构被应用,其尤其适用于上混合系统中的应用,其尤其是适用于类似于PS或MPS的空间音频编码机构的应用并且其改进类似喝采信号情况的输出信号感知质量,也即,于含有空间分布瞬时的密集混合的信号和/或可被视为特别地提升的一般“语义去相关”架构的实施例的情况。更进一步地,在实施例中,一新颖的去相关机构被组合,其重建相似于原始信号中的分配的瞬时空间/时间分配,保存瞬时信号的时间结构,允许变化位率对质量的折衷和/或理想地适用于与类似在非满频带余留或GES的MPS特点的组合。该等组合是互补的,也即:标准MPS特点的信息供重复用于瞬时处理。
图10示出了用于编码具有多个频道的音频信号的装置。二个输入频道L、R被馈送进入一下混合器1010并且进入一余留信号计算器1020。在其它实施例中,多个频道被馈送进入下混合器1010以及余留信号计算器1020,例如,3个、5个或9个环场频道。下混合器1010接着向下混合二个频道L、R,以得到一下混合信号。例如,下混合器1010可采用一混合矩阵并且进行该混合矩阵与二个输入频道L、R的一矩阵乘法运算,以得到下混合信号。下混合信号可被发送至解码器。
更进一步地,余留信号产生器1020适于计算进一步的信号,其被称为余留信号。余留信号是可被使用于通过另外地采用下混合信号以及一上混合矩阵而重新产生原始信号的信号。例如,当N个信号被下混合至1个信号时,该下混合一般是自N个输入信号的映射产生的N个成分之1。自映射产生的其余成分(例如,N–1个成分)是余留信号并且允许通过一反向映射而重建原始N个信号。映射可能例如是一转动操作。映射将被进行,使得下混合信号被最大化并且使余留信号最小化,例如,与一主轴转换相似。例如,下混合信号的能量将被最大化并且将使余留信号的能量最小化。当将2个信号下混合至1个信号时,下混合通常是自2个输入信号的映射所产生的二个成分之一者。从映射产生的其余成分是余留信号,并且允许通过一反向映射而重建原始2个信号。
在一些情况中,余留信号可代表关联于通过它们的下混合以及关联参数而代表二个信号的一误差。例如,余留信号可以是一误差信号,其代表在原始频道L、R以及自根据原始频道L以及R所产生的下混合信号加以上混合所产生的频道L’、R’之间的误差。
换言之,余留信号可被考虑作为时域或频域或次频域中的信号,其与下混合信号或与下混合信号以及参数信息一起而允许正确或近乎正确的原始频道的重建。必须了解,比较至利用下混合而不必余留信号或利用下混合以及参数信息而不必余留信号的重建,利用余留信号的近乎正确的重建,具有接近于原始频道的较大于零的能量。
更进一步地,编码器包含一相位信息计算器1030。下混合信号以及余留信号被馈送进入相位信息计算器1030。相位信息计算器接着计算在下混合以及余留信号之间的相位差上的信息以得到相位信息。例如,相位信息计算器可应用计算下混合以及余留信号的交相关的功能。
此外,编码器包含输出产生器1040。利用相位信息计算器1030产生的相位信息被馈送进入输出产生器1040。输出产生器1040接着输出该相位信息。
在一实施例中,该装置进一步包含用于量化相位信息的相位信息量化器。利用相位信息计算器产生的相位信息可被馈送进入相位信息量化器。相位信息量化器接着量化该相位信息。例如,该相位信息可被映射至8个不同的数值,例如,映射至数值0、1、2、3、4、5、6、或7之一者。该等数值可分别地代表相位差0、π/4、π/2、3π/4、π、5π/4、3π/2以及7π/4。被量化的相位信息接着可被馈送进入输出产生器1040。
在进一步的一实施例中,该装置更包含一无损编码器。来自相位信息计算器1040的相位信息或来自相位信息量化器的量化相位信息可被馈送进入该无损编码器。该无损编码器适于通过应用无损编码而编码相位信息。任何类型的无损编码机构均可被采用。例如,编码器可采用算术编码。该无损编码器接着馈送无损地被编码的相位信息进入输出产生器1040。
下面将提到所说明的实施例的有关的解码器、编码器以及方法:
虽然一些论点已在装置的说明文中被说明,应清楚的是,这些论点也代表对应的方法的说明,其中,一区块或设备对应至一方法步骤或一方法步骤的特点。类似地,在方法步骤本文中所说明的论点也代表对应的装置所对应的区块或项目或特点的说明。
取决于某些实施需要,本发明实施例可以硬件或软件被实施。该实施可利用具有电子式可读取控制信号储存在其上的数字储存媒体而被进行,例如,软磁盘、DVD、CD、ROM、PROM、EPROM、EEPROM或闪存,其与可编程计算机系统配合(或能够配合),使得分别的方法被进行。
根据本发明的一些实施例包含具有电子式可读取控制信号的数据载体(data carrier),其可与可编程计算机系统配合,使得此处说明的方法的一者被进行。
通常,本发明的实施例可被实施如具有程序代码的计算机程序产品,当在计算机上执行该计算机程序产品时,该程序代码是可供用于进行该等方法之一者的操作。该程序代码,例如,可被储存在一机器可读取载体上。
其它实施例包含用于进行此处说明的方法之一者的计算机程序,其被储存在机器可读取载体或非瞬时储存媒体上。
换言之,因此,本发明方法的一实施例是当在一计算机上执行一计算机程序时,该计算机程序是用于进行此处说明的方法之一者的程序代码的计算机程序。
本发明方法的一进一步的实施例因此是一数据载体(或数字储存媒体,或计算机可读取媒体),其包含被记录其上而用于进行此处说明的方法之一者的计算机程序。
本发明方法的进一步的实施例,因此是一数据流或一信号序列,其代表用于进行此处说明的方法之一者的计算机程序。该数据流或信号序列,例如,可被组态以经由数据通讯连接(例如,经由因特网)而被传输。
一进一步的实施例包含一处理构件,例如,计算机、或可编程逻辑装置,其被组态或适于进行此处说明的方法之一者。
一进一步的实施例包含一计算机,其具有被安装在其上的用于进行此处说明的方法之一者的计算机程序。
在一些实施例中,一可编程逻辑设备(例如,场式可编程门阵列)可被使用于进行此处说明的方法的一些或所有的功能。在一些实施例中,一场式可编程门阵列可与微处理器共同操作以便进行此处说明的方法的一者。通常,这些方法最好是利用任何的硬件装置被进行。
上面说明的实施例仅供说明本发明的原理。熟悉本技术者应了解,本发明的配置以及此处说明的细节可有各种的修改与变化。因此,其旨在由本发明待决的专利权利要求的范围限定,而不由本文的实施例的说明以及叙述所给出的特定细节限定。

Claims (15)

1.一种用于产生一去相关信号的装置,所述装置包含:
一用于接收相位信息的接收单元(650);
一瞬时分离器(310;410;510;610;710;910),用于将一输入信号分离成为一第一信号成分以及一第二信号成分,使得所述第一信号成分包含所述输入信号的瞬时信号部分,并且使得所述第二信号成分包含所述输入信号的非瞬时信号部分;
一瞬时去相关器(320;420;520;620;720;920),用于根据一第一去相关方法而将所述第一信号成分去相关以得到一第一去相关信号成分;
一第二去相关器(330;430;530;630;730;930),用于根据一第二去相关方法而将所述第二信号成分去相关以得到一第二去相关信号成分,其中,所述第二去相关方法不同于所述第一去相关方法;以及
一组合单元(340;440;540;640;740;940),用于组合所述第一去相关信号成分以及所述第二去相关信号成分以得到一去相关输出信号;
其中,所述瞬时去相关器(320;420;520;620;720;920)适于将所述相位信息施加至所述第一信号成分。
2.根据权利要求1所述的装置,
其中,所述接收单元(650)适于从一编码器接收相位信息;并且其中,所述瞬时去相关器(320;420;520;620;720;920)适于将所述相位信息施加至所述第一信号成分。
3.根据权利要求1或2所述的装置,
其中,所述瞬时分离器(310;410;510;610;710;910)适于分离在频域中被表示的一输入信号。
4.根据以上任一权利要求所述的装置,
其中,所述相位信息指示在一余留信号以及一下混合信号之间的一相位差,并且其中,所述瞬时去相关器(320;420;520;620;720;920)适于通过施加所述相位信息至所述第一信号成分而将所述第一信号成分去相关。
5.根据权利要求4所述的装置,
其中,所述相位信息指示相对于一特定频带的在一余留信号以及一下混合信号之间的一相位差,并且其中,所述瞬时去相关器(320;420;520;620;720;920)适于通过施加所述相位信息至所述第一信号成分而将所述第一信号成分去相关。
6.根据权利要求1至3中任一项所述的装置,
其中,所述相位信息指示在一余留信号以及一下混合信号之间的一相位差,其中,所述相位差为一频率无关宽带参数,并且其中,所述瞬时去相关器(320;420;520;620;720;920)适于通过施加所述相位信息至所述第一信号成分而将所述第一信号成分去相关。
7.根据以上任一权利要求所述的装置,
其中,所述瞬时去相关器(320;420;520;620;720;920)适于从所述相位信息得到一相位项;并且其中,所述瞬时去相关器(320;420;520;620;720;920)更进一步地适于施加所述相位项至所述第一信号成分。
8.根据权利要求7所述的装置,
其中,所述瞬时去相关器(320;420;520;620;720;920)适于通过将所述相位项与所述第一信号成分相乘而施加所述相位项至所述第一信号成分。
9.根据以上任一权利要求所述的装置,
其中,所述装置更进一步地适于接收指示所述输入信号的一信号部分是否包含一瞬时的瞬时分离信息;并且
其中,所述瞬时分离器(310;410;510;610;710;910)根据所述瞬时分离信息而将一输入信号分离成为第一信号成分以及第二信号成分。
10.根据以上任一权利要求所述的装置,
其中,所述组合单元(340;440;540;640;740;940)适于通过相加所述第一去相关信号成分以及所述第二去相关信号成分,来组合所述第一去相关信号成分以及所述第二去相关信号成分。
11.一种用于编码具有多个频道的一音频信号的装置,包括:
一下混合器(1010),用于下混合所述多个频道以得到一下混合信号;
一适于计算一余留信号的余留信号计算器(1020);
一相位信息计算器(1030),适于计算关于所述下混合以及所述余留信号之间的相位差的信息以得到相位信息;以及
一用于输出所述相位信息的输出产生器(1040)。
12.一种用于编码一音频信号的装置,
其中,所述装置进一步包含用于使所述相位信息量化的一相位信息量化器。
13.一种用于编码一音频信号的装置,
其中,所述装置进一步包含适于通过应用无损编码而无损地编码相位信息的无损编码器。
14.一种用于产生一去相关信号的方法,包括:
接收相位信息;
将一输入信号分离成为一第一信号成分以及一第二信号成分,使得所述第一信号成分包含所述输入信号的瞬时信号部分,并且使得所述第二信号成分包含所述输入信号的非瞬时信号部分;
根据一第一去相关方法而将所述第一信号成分去相关以得到一第一去相关信号成分;
根据一第二去相关方法而将所述第二信号成分去相关以得到一第二去相关信号成分,其中,所述第二去相关方法不同于所述第一去相关方法;并且,
组合所述第一去相关信号成分以及所述第二去相关信号成分以得到一去相关输出信号;
其中,所述接收到的相位信息被施加至所述第一信号成分。
15.一种计算机程序,实施根据权利要求14所述的方法。
CN201180051640.XA 2010-08-25 2011-07-06 用于利用传送的相位信息产生去相关信号的装置 Active CN103460282B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US37698010P 2010-08-25 2010-08-25
US61/376,980 2010-08-25
PCT/EP2011/061361 WO2012025283A1 (en) 2010-08-25 2011-07-06 Apparatus for generating a decorrelated signal using transmitted phase information

Publications (2)

Publication Number Publication Date
CN103460282A true CN103460282A (zh) 2013-12-18
CN103460282B CN103460282B (zh) 2015-08-19

Family

ID=44509236

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201180051699.9A Active CN103180898B (zh) 2010-08-25 2011-07-06 用于利用合成单元和混频器解码包括瞬时的信号的设备
CN201180051640.XA Active CN103460282B (zh) 2010-08-25 2011-07-06 用于利用传送的相位信息产生去相关信号的装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201180051699.9A Active CN103180898B (zh) 2010-08-25 2011-07-06 用于利用合成单元和混频器解码包括瞬时的信号的设备

Country Status (21)

Country Link
US (3) US9431019B2 (zh)
EP (5) EP2609591B1 (zh)
JP (3) JP5775582B2 (zh)
KR (2) KR101445291B1 (zh)
CN (2) CN103180898B (zh)
AR (3) AR082542A1 (zh)
AU (2) AU2011295368B2 (zh)
BR (2) BR112013004365B1 (zh)
CA (3) CA2887939C (zh)
ES (3) ES2544077T3 (zh)
HK (2) HK1186833A1 (zh)
MX (2) MX2013002187A (zh)
MY (3) MY180970A (zh)
PL (3) PL2609590T3 (zh)
PT (2) PT3144932T (zh)
RU (3) RU2573774C2 (zh)
SG (3) SG187950A1 (zh)
TR (1) TR201900417T4 (zh)
TW (2) TWI457912B (zh)
WO (2) WO2012025282A1 (zh)
ZA (1) ZA201302050B (zh)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MY180970A (en) 2010-08-25 2020-12-14 Fraunhofer Ges Forschung Apparatus for generating a decorrelated signal using transmitted phase information
JP5681290B2 (ja) * 2010-09-28 2015-03-04 ホアウェイ・テクノロジーズ・カンパニー・リミテッド デコードされたマルチチャネルオーディオ信号またはデコードされたステレオ信号を後処理するためのデバイス
US9064318B2 (en) 2012-10-25 2015-06-23 Adobe Systems Incorporated Image matting and alpha value techniques
US9355649B2 (en) * 2012-11-13 2016-05-31 Adobe Systems Incorporated Sound alignment using timing information
US10638221B2 (en) 2012-11-13 2020-04-28 Adobe Inc. Time interval sound alignment
US9201580B2 (en) 2012-11-13 2015-12-01 Adobe Systems Incorporated Sound alignment user interface
US9076205B2 (en) 2012-11-19 2015-07-07 Adobe Systems Incorporated Edge direction and curve based image de-blurring
US10249321B2 (en) 2012-11-20 2019-04-02 Adobe Inc. Sound rate modification
US9451304B2 (en) 2012-11-29 2016-09-20 Adobe Systems Incorporated Sound feature priority alignment
US10455219B2 (en) 2012-11-30 2019-10-22 Adobe Inc. Stereo correspondence and depth sensors
US9135710B2 (en) 2012-11-30 2015-09-15 Adobe Systems Incorporated Depth map stereo correspondence techniques
US10249052B2 (en) 2012-12-19 2019-04-02 Adobe Systems Incorporated Stereo correspondence model fitting
US9208547B2 (en) 2012-12-19 2015-12-08 Adobe Systems Incorporated Stereo correspondence smoothness tool
US9214026B2 (en) 2012-12-20 2015-12-15 Adobe Systems Incorporated Belief propagation and affinity measures
JP6046274B2 (ja) * 2013-02-14 2016-12-14 ドルビー ラボラトリーズ ライセンシング コーポレイション 上方混合されたオーディオ信号のチャネル間コヒーレンスの制御方法
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
WO2014126688A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
US9659569B2 (en) 2013-04-26 2017-05-23 Nokia Technologies Oy Audio signal encoder
PT3022949T (pt) 2013-07-22 2018-01-23 Fraunhofer Ges Forschung Descodificador de áudio multicanal, codificador de áudio de multicanal, métodos, programa de computador e representação de áudio codificada usando uma descorrelação dos sinais de áudio renderizados
EP2838086A1 (en) * 2013-07-22 2015-02-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment
EP2830334A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
EP2830052A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
EP2830053A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
WO2015017223A1 (en) 2013-07-29 2015-02-05 Dolby Laboratories Licensing Corporation System and method for reducing temporal artifacts for transient signals in a decorrelator circuit
JP6212645B2 (ja) * 2013-09-12 2017-10-11 ドルビー・インターナショナル・アーベー オーディオ・デコード・システムおよびオーディオ・エンコード・システム
CA2926243C (en) * 2013-10-21 2018-01-23 Lars Villemoes Decorrelator structure for parametric reconstruction of audio signals
KR102231755B1 (ko) 2013-10-25 2021-03-24 삼성전자주식회사 입체 음향 재생 방법 및 장치
JP6235725B2 (ja) 2014-01-13 2017-11-22 ノキア テクノロジーズ オサケユイチア マルチ・チャンネル・オーディオ信号分類器
KR102244612B1 (ko) * 2014-04-21 2021-04-26 삼성전자주식회사 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법
EP2963646A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal
EP2980789A1 (en) 2014-07-30 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhancing an audio signal, sound enhancing system
KR20160101692A (ko) 2015-02-17 2016-08-25 한국전자통신연구원 다채널 신호 처리 방법 및 상기 방법을 수행하는 다채널 신호 처리 장치
US11234072B2 (en) 2016-02-18 2022-01-25 Dolby Laboratories Licensing Corporation Processing of microphone signals for spatial playback
TWI616095B (zh) * 2016-08-26 2018-02-21 配信裝置、配信系統、配信方法、電子機器、播放裝置及接收程式
WO2018086946A1 (en) * 2016-11-08 2018-05-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downmixer and method for downmixing at least two channels and multichannel encoder and multichannel decoder
CA3042580C (en) 2016-11-08 2022-05-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for downmixing or upmixing a multichannel signal using phase compensation
EP3382702A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a predetermined characteristic related to an artificial bandwidth limitation processing of an audio signal
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
JP7257975B2 (ja) 2017-07-03 2023-04-14 ドルビー・インターナショナル・アーベー 密集性の過渡事象の検出及び符号化の複雑さの低減
AU2018308668A1 (en) 2017-07-28 2020-02-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for encoding or decoding an encoded multichannel signal using a filling signal generated by a broad band filter
US10306391B1 (en) 2017-12-18 2019-05-28 Apple Inc. Stereophonic to monophonic down-mixing
EP3550561A1 (en) 2018-04-06 2019-10-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downmixer, audio encoder, method and computer program applying a phase value to a magnitude value
EP3899929A1 (en) * 2018-12-20 2021-10-27 Telefonaktiebolaget LM Ericsson (publ) Method and apparatus for controlling multichannel audio frame loss concealment
FR3136099A1 (fr) * 2022-05-30 2023-12-01 Orange Codage audio spatialisé avec adaptation d’un traitement de décorrélation

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070140499A1 (en) * 2004-03-01 2007-06-21 Dolby Laboratories Licensing Corporation Multichannel audio coding
WO2007109338A1 (en) * 2006-03-21 2007-09-27 Dolby Laboratories Licensing Corporation Low bit rate audio encoding and decoding
US20090287495A1 (en) * 2002-04-22 2009-11-19 Koninklijke Philips Electronics N.V. Spatial audio
US20090326959A1 (en) * 2007-04-17 2009-12-31 Fraunofer-Gesellschaft zur Foerderung der angewand Forschung e.V. Generation of decorrelated signals

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999041947A1 (en) * 1998-02-13 1999-08-19 Koninklijke Philips Electronics N.V. Surround sound reproduction system, sound/visual reproduction system, surround signal processing unit and method for processing an input surround signal
KR101016251B1 (ko) 2002-04-10 2011-02-25 코닌클리케 필립스 일렉트로닉스 엔.브이. 스테레오 신호의 코딩
KR101049751B1 (ko) * 2003-02-11 2011-07-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
US20090299756A1 (en) 2004-03-01 2009-12-03 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
JP4521633B2 (ja) * 2004-03-12 2010-08-11 直樹 末広 符号分割多重信号の相関分離識別方式
BRPI0509100B1 (pt) * 2004-04-05 2018-11-06 Koninl Philips Electronics Nv Codificador de multicanal operável para processar sinais de entrada, método paracodificar sinais de entrada em um codificador de multicanal
JP5032977B2 (ja) 2004-04-05 2012-09-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マルチチャンネル・エンコーダ
EP1768107B1 (en) * 2004-07-02 2016-03-09 Panasonic Intellectual Property Corporation of America Audio signal decoding device
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
US7283634B2 (en) * 2004-08-31 2007-10-16 Dts, Inc. Method of mixing audio channels using correlated outputs
SE0402649D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
MX2007015118A (es) 2005-06-03 2008-02-14 Dolby Lab Licensing Corp Aparato y metodo para codificacion de senales de audio con instrucciones de decodificacion.
RU2393550C2 (ru) * 2005-06-30 2010-06-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. Устройство и способ кодирования и декодирования звукового сигнала
KR101277041B1 (ko) 2005-09-01 2013-06-24 파나소닉 주식회사 멀티 채널 음향 신호 처리 장치 및 방법
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
PL1999997T3 (pl) * 2006-03-28 2011-09-30 Fraunhofer Ges Forschung Udoskonalony sposób kształtowania sygnału podczas rekonstrukcji wielokanałowego sygnału audio
KR20080052813A (ko) * 2006-12-08 2008-06-12 한국전자통신연구원 채널별 신호 분포 특성을 반영한 오디오 코딩 장치 및 방법
US8064624B2 (en) * 2007-07-19 2011-11-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for generating a stereo signal with enhanced perceptual quality
CN101884065B (zh) * 2007-10-03 2013-07-10 创新科技有限公司 用于双耳再现和格式转换的空间音频分析和合成的方法
JP5266332B2 (ja) 2008-01-01 2013-08-21 エルジー エレクトロニクス インコーポレイティド 信号処理方法及び装置
KR101183127B1 (ko) * 2008-02-14 2012-09-19 돌비 레버러토리즈 라이쎈싱 코오포레이션 스테레오 입력을 수정하기 위한 방법 및 음향 재생 시스템
WO2009116280A1 (ja) 2008-03-19 2009-09-24 パナソニック株式会社 ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
EP2144229A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient use of phase information in audio encoding and decoding
EP2154911A1 (en) 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
MY180970A (en) * 2010-08-25 2020-12-14 Fraunhofer Ges Forschung Apparatus for generating a decorrelated signal using transmitted phase information

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090287495A1 (en) * 2002-04-22 2009-11-19 Koninklijke Philips Electronics N.V. Spatial audio
US20070140499A1 (en) * 2004-03-01 2007-06-21 Dolby Laboratories Licensing Corporation Multichannel audio coding
WO2007109338A1 (en) * 2006-03-21 2007-09-27 Dolby Laboratories Licensing Corporation Low bit rate audio encoding and decoding
US20090326959A1 (en) * 2007-04-17 2009-12-31 Fraunofer-Gesellschaft zur Foerderung der angewand Forschung e.V. Generation of decorrelated signals

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ANDERSEN, ROBERT L.ET AL: "Introduction to Dolby Digital Plus, an Enhancement to the Dolby Digital Coding System", 《AES CONVENTION 117》 *

Also Published As

Publication number Publication date
TWI457912B (zh) 2014-10-21
CN103180898B (zh) 2015-04-08
RU2013112903A (ru) 2014-09-27
WO2012025283A1 (en) 2012-03-01
US20130173273A1 (en) 2013-07-04
EP2924687B1 (en) 2016-11-02
MX2013002187A (es) 2013-03-18
EP3471091A1 (en) 2019-04-17
US8831931B2 (en) 2014-09-09
TW201214414A (en) 2012-04-01
AR098078A2 (es) 2016-04-27
ES2544077T3 (es) 2015-08-27
AU2011295368B2 (en) 2015-05-07
AU2011295368A1 (en) 2013-03-28
ES2585402T3 (es) 2016-10-05
TW201214417A (en) 2012-04-01
SG2014006738A (en) 2014-03-28
EP2609591B1 (en) 2016-06-01
US9431019B2 (en) 2016-08-30
SG187950A1 (en) 2013-03-28
TWI459380B (zh) 2014-11-01
WO2012025282A1 (en) 2012-03-01
PL3144932T3 (pl) 2019-04-30
KR101445291B1 (ko) 2014-09-29
EP2609590B1 (en) 2015-05-20
AU2011295367B2 (en) 2014-07-31
RU2015102326A (ru) 2015-06-10
US20130173274A1 (en) 2013-07-04
CA2809437A1 (en) 2012-03-01
MY156770A (en) 2016-03-31
AR082542A1 (es) 2012-12-12
CA2887939C (en) 2017-11-07
EP2609590A1 (en) 2013-07-03
RU2013112853A (ru) 2014-09-27
BR112013004362A2 (pt) 2017-09-19
HK1186833A1 (zh) 2014-03-21
CN103180898A (zh) 2013-06-26
CN103460282B (zh) 2015-08-19
BR112013004362B1 (pt) 2020-12-01
US20140222441A1 (en) 2014-08-07
JP5775583B2 (ja) 2015-09-09
CA2809404A1 (en) 2012-03-01
AR082543A1 (es) 2012-12-12
MY180970A (en) 2020-12-14
ZA201302050B (en) 2013-12-23
AU2011295367A1 (en) 2013-04-11
RU2580084C2 (ru) 2016-04-10
BR112013004365A2 (pt) 2020-06-02
MX2013002188A (es) 2013-03-18
HK1187144A1 (zh) 2014-03-28
PT3144932T (pt) 2019-02-04
JP2013539554A (ja) 2013-10-24
JP2015129953A (ja) 2015-07-16
EP2609591A1 (en) 2013-07-03
JP6196249B2 (ja) 2017-09-13
BR112013004365B1 (pt) 2021-01-12
KR20130079507A (ko) 2013-07-10
CA2887939A1 (en) 2012-03-01
US9368122B2 (en) 2016-06-14
RU2640650C2 (ru) 2018-01-10
SG188254A1 (en) 2013-04-30
JP2013539553A (ja) 2013-10-24
JP5775582B2 (ja) 2015-09-09
ES2706490T3 (es) 2019-03-29
CA2809404C (en) 2016-06-21
EP2924687A1 (en) 2015-09-30
EP3144932B1 (en) 2018-11-07
EP3144932A1 (en) 2017-03-22
PL2609591T3 (pl) 2016-11-30
CA2809437C (en) 2016-06-21
PT2609591T (pt) 2016-07-12
KR20130069770A (ko) 2013-06-26
PL2609590T3 (pl) 2015-10-30
RU2573774C2 (ru) 2016-01-27
TR201900417T4 (tr) 2019-02-21
MY178197A (en) 2020-10-06
KR101445293B1 (ko) 2014-09-29

Similar Documents

Publication Publication Date Title
CN103460282B (zh) 用于利用传送的相位信息产生去相关信号的装置
JP6641018B2 (ja) チャネル間時間差を推定する装置及び方法
JP5193070B2 (ja) 主成分分析に基づくマルチチャネルオーディオ信号の段階的な符号化のための装置および方法
US8817991B2 (en) Advanced encoding of multi-channel digital audio signals
EP2467850B1 (en) Method and apparatus for decoding multi-channel audio signals
KR101290461B1 (ko) 다운믹스 오디오 신호를 업믹싱하는 업믹서, 방법 및 컴퓨터 프로그램
CN103620677B (zh) 音频信号帧中事件时隙位置的编码与译码技术
CN102084418B (zh) 用于调整多通道音频信号的空间线索信息的设备和方法
US11074920B2 (en) Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding
CN105378832B (zh) 解码器、编码器、解码方法、编码方法和存储介质
KR20140130464A (ko) 멀티-채널 오디오 신호의 적응적 다운-믹싱 및 업-믹싱을 수행하기 위한 방법 및 장치
AU2015201672B2 (en) Apparatus for generating a decorrelated signal using transmitted phase information

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee
CP01 Change in the name or title of a patent holder

Address after: Munich, Germany

Patentee after: Fraunhofer Application and Research Promotion Association

Address before: Munich, Germany

Patentee before: Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V.