CN105556601B - 用于使用交叠范围中的组合来处理音频信号的装置及方法 - Google Patents

用于使用交叠范围中的组合来处理音频信号的装置及方法 Download PDF

Info

Publication number
CN105556601B
CN105556601B CN201480046726.7A CN201480046726A CN105556601B CN 105556601 B CN105556601 B CN 105556601B CN 201480046726 A CN201480046726 A CN 201480046726A CN 105556601 B CN105556601 B CN 105556601B
Authority
CN
China
Prior art keywords
piece
modified
aliasing
signal
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201480046726.7A
Other languages
English (en)
Other versions
CN105556601A (zh
Inventor
萨沙·迪施
弗雷德里克·纳格尔
拉尔夫·盖格尔
克里斯蒂·纽卡姆
贝恩德·埃德勒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of CN105556601A publication Critical patent/CN105556601A/zh
Application granted granted Critical
Publication of CN105556601B publication Critical patent/CN105556601B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/147Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Optimization (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Algebra (AREA)
  • Discrete Mathematics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Quality & Reliability (AREA)
  • Complex Calculations (AREA)
  • Peptides Or Proteins (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

一种用于处理包含一系列频谱值块(114)的音频信号的装置,包含:处理器(100),用于使用针对第一块的至少一个修改值(102)来处理所述一系列块以在交叠范围(170)中获得混迭减少的或不含混迭的第一结果信号,以及使用针对所述一系列块中的第二块的至少一个第二不同修改值(106)来处理所述一系列块以在交叠范围(170)中获得混迭减少的或不含混迭的第二结果信号(108);以及组合器(110),用于在交叠范围(170)中组合第一结果信号(104)与第二结果信号(108)以针对该交叠范围(170)获得处理后的信号(112)。

Description

用于使用交叠范围中的组合来处理音频信号的装置及方法
技术领域
本发明涉及音频处理,具体地,涉及在对音频信号进行混迭影响处理的情况下的音频处理。
背景技术
在正常操作中,改进的离散余弦变换(MDCT)具有多个特征,使其成为针对音频编码应用的较适合工具。MDCT根据交叠的帧产生临界采样频谱信号表示,并提供完美重建构。这样意味着可以根据在交叠区中应用逆变换及交叠相加运算,来根据前向变换的频谱系数重建构输入信号。然而,如果对频谱系数应用附加处理,则相比于过采样取样表示(例如,基于DFT的交叠处理),MDCT具有一些缺点。诸如用于动态范围控制或削波预防的更加相对简单的依赖于时间及频率的增益控制可以产生不需要的副作用。因此,尽管基于MDCT的频谱表示可用于解码器中,但将对音频解码的基于DFT的单独后处理应用于需要这种类型信号修改的若干应用中。除计算复杂性以外的一个缺点是由这种后处理引入的附加延迟。
用于减少MDCT时域混迭的常见方法是重新建立过采样调制型复数交迭变换(modulated complex lapped transform,MCLT)。MCLT是通过组合MDCT与其复数对应物,改进的离散正弦变换(MDST)而产生。MCLT提供诸如信号的DFT表示的类似特征,且因此MCLT对抗由频谱操纵引起的时域混迭(TDA)的鲁棒性可比得上DFT表示。但不幸地,通过MDCT频谱来计算MDST频谱在计算上极其复杂,且产生显著的信号延迟。因此,现有技术提供用于减少延迟及复杂性两者之技术【2-3】。在这些方法中,实数到复数(R2C)变换被用于近似所需的MDST值。然后,在MCLT域,应用对频谱系数的操控。因此,通过再次使用复数到实数(C2R)变换,来将复数值转变为MDCT域。尽管这种方法在混迭鲁棒性方面示出较好的结果,然而它具有一些缺点。首先,估计MDST系数,通过计算复杂性的数值来限定它们的准确性。其次,变换链R2C-C2R依然产生延迟。
【1】H.S.Malvar,“A modulated complex lapped transform and itsapplications to audio processing”,in Proc.IEEE Int.Conf.on Acoustics,Speech,and Signal Processing(ICASSP),Phoenix,March 1999.
【2】Kuech,F.;Edler,B.,“Aliasing Reduction for Modified Discrete CosineTransform Domain Filtering and its Application to Speech Enhancement”,in IEEEWorkshop on Applications of Signal Processing to Audio and Acoustics,21-24Oct.2007.
【3】Edler,B.,“Aliasing Reduction for Gain Control with CriticallySampled Filter Banks”,in First International Conference on Communications andElectronics,ICCE′06,10-11Oct.2006.
【4】E.Larsen and R.M.Aarts.Audio Bandwidth Extension-Application topsychoacoustics,Signal Processing and Loudspeaker Design.John Wiley&Sons,Ltd,2004.
【5】M.Dietz,L.Liljeryd,K.and O.Kunz,“Spectral BandReplication,a novel approach in audio coding,”in l l2th AES Convention,Munich,May 2002.
【6】P.Ekstrand,“Bandwidth Extension of Audio Signals by Spectral BandReplication”,in Proceedings of 1st IEEE Benelux Workshop on MPCA,Leuven,November 2002
发明内容
本发明的目的是提供一种用于处理音频信号的改善型构思。
通过权利要求1的用于处理音频信号的装置、权利要求15的处理音频信号的方法或权利要求16的计算机程序来实现该目的。
在本发明的一方面,一种用于处理包含一系列频谱值块的音频信号的装置,包含:处理器,用于使用针对第一块的至少一个修改值来处理所述一系列频谱值块以在交叠范围中获得混迭减少的或不含混迭的第一结果信号,并使用来自所述一系列频谱值块的第二块的至少一个第二不同修改值来处理所述一系列频谱值块以在该交叠范围中获得混迭减少的或不含混迭的第二结果信号。然后,组合在交叠范围内的两个信号以针对所述交叠范围获得处理后的信号,其中这两个信号二者都构成同一信号部分之一的某一表示。
优选地,这种组合依赖于自一个结果信号至另一结果信号的平滑转换(cross-fade),即,第一结果信号的淡出(fadeout)且同时第二结果信号的淡入(fade-in)。
优选地,处理器包含:修改器,用于使用所述至少一个第一修改值来修改所述一系列块中的第一块以获得第一经修改块,用于使用至少一个第二修改值来修改所述一系列块中的第二块以获得第二经修改块,用于使用该至少一个第一修改值来修改第二块以获得第三经修改块,以及用于使用该至少一个第二修改值来修改第一块以获得第四经修改块。频谱-时间转换器配置为用于将所述第一至第四经修改块转换成其时间表示,并且设置有交叠加法器,用于将第一和第三经修改块交叠相加以获得结果信号,且用于将第二和第四经修改块的时间表示交叠相加以获得第二结果信号。因此,执行两个基本上平行的逆变换操作,一个操作具有第一增益修改值,另一操作具有第二增益修改值。
当增益修改值仅是时变性的(即,在整个频率范围内是恒定的)时,仅将单个增益修改值用于对块进行修改。然而,如果增益修改值随频率改变,则根据多个增益修改值来修改每个频谱值块。增益修改值可适用于每个单独的频谱值或适用于频谱值组(诸如,2、3、4或5个频率相邻的频谱值)。然而,一般状况下,针对各频谱线及每频谱线可存在单个的增益修改值,采用多个增益修改值来修改频谱值块,其中增益修改值的数目等于频谱值块中的频谱值的数目。
因此,根据这个方面,针对所述交叠区中产生两个混迭减少的或不含混迭的输出信号,且优选在这两个输出或结果信号之间执行平滑转换。
根据本发明的另一方面,一种用于处理音频信号的装置包含:处理器,用于使用针对所述一系列块中的第一块的至少一个第一修改值及针对所述一系列频谱块中的第二块的至少一个第二不同修改值,来计算受混迭影响的信号。然后,估计混迭误差信号,其中这种混迭误差信号被包括在所述受混迭影响的或经受混迭的音频信号中。然后,组合所述受混迭影响的信号与所述混迭误差信号,使得通过组合获得的信号是混迭减少的或不含混迭的信号。
换言之,另一方面依赖于对受混迭影响的信号及混迭误差信号的计算以及对这两个信号的后续组合,以便获得所述混迭减少的或不含混迭的信号。优选地,通过进行如下操作来消除混迭:通过针对两个块用相同增益进行附加频率时间变换来在交叠区域中重构输入信号;与窗口函数或相关函数的乘法;时间反转;与两个增益或修改值之间的增益差的乘法;以及与具有不同增益的处理的输出的减法。
优选地,所使用的变换算法是改进的离散余弦变换MDCT,且逆变换操作是改进的离散余弦逆变换。备选地,可使用其他这种引入混迭的变换,诸如MDST(改进的离散正弦变换)或改进的离散正弦逆变换(IMDST)或任何其他这种变换,其中在分析侧上,时间部分中的样本数目大于频谱值的数目,或备选性地,其中两个后续时间部分之间存在交叠区,导致两个后续的频谱值块(即,在时间上是后续的频谱值块)。文中,这两个频谱值块二者至少部分地与同一个交叠区相关,即,在最后导致两个时间后续的频谱值块的两个时间部分之间的交叠区。这样意味着:在该分析侧上,样本或帧中之时域样本的数目大于频域表示块中之频域值的数目,且在合成侧上,合成时域样本之数目大于用于合成时域样本之交叠块的块中之频谱值的数目。
然而,作为合成侧上的最后级,执行交叠相加处理,使得最后,该交叠范围中的样本数目小于合成帧中的时域样本数目,且优选地,等于频谱值块的频谱值的数目。在后者状况下,获得临界采样变换,且这种变换对本发明而言是优选的,但本发明还可应用于非临界采样变换,尽管相比于临界采样变换,这种变换具有某种附加的额外开销。
本发明方面不仅可用于补偿由时间-频率变化的增益修改引起的混迭,还可用于带宽扩展(BWE)。在这种使用情况下,由BWE算法的向上复制(copy-up)级产生的复制频谱必须整形为具有尽可能接近地匹配原始频谱包络的频谱包络[4-6]。这种频谱包络通常是时间和频率依赖性的。尽管在大部分现有的BWE技术中,向上复制方案是恒定的,但仍有可能执行导致附加混迭的时变向上复制。新提出的混迭消除技术还能够处理这些BWE假影(artifact)。
附图说明
以下在附图的背景下讨论了本发明的优选实施例,附图中:
图1a是第一方面的优选实施例;
图1b是第二方面的优选实施例;
图1c是一系列频谱值块的示意性表示;
图1d是导致图1c的一系列块的一系列交叠时间部分的示意性表示;
图2a示出了引入混迭的前向变换的实现方案;
图2b示出了混迭减少的逆变换的实现方案;
图3a示出了第二方面的另一实施例;
图3b示出了第二方面的另一实施例;
图3c示出了针对第一和第二方面的带宽扩展应用的示意图;
图4示出了用于第二方面的混迭误差分量;
图5a示出了第一方面的实施例;
图5b示出了第二方面的实施例;
图6示出了与第二方面相关的根据重建构、时间反转及开窗口产生的混迭项;
图7示出了帧中的变化的增益因子;
图8示出了MDCT逆处理之前的增益因子的应用;及
图9示出了与图8的处理相关的信号。
具体实施方式
图1a示出根据第一方面的用于处理包含一系列频谱值块的音频信号的装置。所述用于处理的装置包含:处理器100,用于使用针对第一块的至少一个修改值102来处理所述一系列频率值块以获得混迭减少的或不含混迭的第一结果信号104。此外,该处理器使用不同于第一修改值的至少一个第二不同修改值(即,第二修改值106)来处理所述一系列块中的第二块(所述第二块从时间上在第一块之后或从时间上在第一块之前且紧邻第一块),以获得交叠范围中的混迭减少的或不含混迭的第二结果信号108。因此,处理器针对相同交叠范围产生两个不含混迭的或至少混迭减少的时域信号。将这种信号108输入至组合器110中,以便在交叠范围中组合第一和第二结果信号以获得针对交叠范围的处理后的信号112。优选地,该处理器配置用于产生针对交叠区的两个不含混迭的输出信号,然后,优选地在这两个不含混迭的输出信号之间执行平滑转换。所述处理器实现此操作的一个实现方案是提供完全逆变换处理,诸如,针对这两块或所述块的两个不同修改值的IMDCT处理。换言之,处理器针对第一块的交叠范围、针对第一及第二块的同一修改值,产生完全IMDCT处理。此外,该处理器针对第一及第二块执行完全IMDCT处理,但现在使用第二修改值。这种完全IMDCT处理操作均导致交叠范围中的两个不含混迭的或至少混迭减少的时域结果信号,然后由组合器来组合。
随后,在图1b的背景下描述第二方面。图1b示出了根据相对第二方面的本发明实施例的用于处理包含一系列频谱值块的音频信号的装置。该装置包含处理器150,用于使用针对一系列频谱值块114中的第一块的至少一个第一修改值102和使用针对所述一系列频谱值块114中的第二块的至少一个不同第二修改值106,来计算受混迭影响的信号154。除受混迭影响的信号154之外,该处理器配置用于估计混迭误差信号158。此外,该装置包含组合器152,用于组合受混迭影响的信号与混迭误差信号,使得通过由组合器152进行组合获得的处理后的音频信号112是混迭减少的或不含混迭的信号。
具体地,根据图1b所示出的第二方面,使用针对属于同一交叠范围内的不同块的不同修改值来执行所述处理,这样导致了受混迭影响的信号154。然而,与现有技术(在现有技术中,将这种受混迭影响的信号用于进一步处理,且现有技术容许混迭诱发的误差)相比,本发明中并不进行此处理。实际上,处理器150附加地计算混迭误差信号158,然后通常通过减法或基本加权型的线性组合,来将混迭误差信号与受混迭影响的信号相结合,使得处理后的音频信号优选为是不含混迭的,即使在并未完全准确计算所述组合或特定混迭误差信号的情况下,所述组合仍然使得处理后的音频信号的混迭误差小于受混迭影响的信号154。
在许多应用中,需要的是通过在将频谱系数馈送至IMDCT之前对所述频谱系数应用增益因子,来修改所述频谱系数,使得:
Yj(k)=gj(k)·Xj(k)
其中Xj(k)是第j个帧的MDCT频谱,k为频率索引,gj(k)是依赖于时间和频率的频谱加权函数,且Yj(k)是滤波后的MDCT频谱。图8也示出了增益因子的这种应用。
具体地,图8示出了典型现有技术的MDCT合成系统,其中由乘法器802将时间索引为j-1的在先块800的频谱值乘以至少一个增益因子gj-1。此外,将时间索引为j的当前块804乘以805处所指示的针对当前块的增益因子gj或由该增益因子修改。具体地,801处所指示的针对时间索引为j-1的在先块的增益因子801与针对当前块的增益因子gj805是彼此不同的。此外,如图8所述,增益因子可以是频率依赖性的。由频率索引k表示这种情况。因此,根据增益因子属于块800还是804,将索引为k的每个频谱值乘以对应第一或第二增益因子801、805。因此,由于所述两个块的增益因子是时变的和/或频变的的事实,当应用图8的处理时,在处理中产生混迭误差。这种处理包括针对在先块800的IMDCT操作807和针对当前块804的另一IMDCT操作808。IMDCT操作包括频率时间变换和后续迭出(fold-out)操作,其中将在图2b的背景下进一步描述后续迭出操作。然后,由块809执行交叠相加处理,以便最后获得在810处所指示的受混迭影响的信号y(n),其中所述交叠相加处理在实际相加之前,附加地包含合成开窗口器。因此,受混迭影响的信号810通常恰好与图154的154所示的受混迭影响的信号相同。
如果两个后续帧中的增益不同,则混迭项不再彼此抵消,如图9中可看出(右边),其中增益因子在频率上是恒定的,但在时间上不恒定。在该示例中,增益为g0(k)=1及g1(k)=0.7,使得剩余混迭分量为与因子0.3相乘的来自帧0的混迭。
应注意,对于这种简单状况(主要选择该状况来进行说明),频域处理是并非必要的,这是由于可以通过应用合适的时间包络来在没有混迭问题的情况下实现类似效应。然而,这种示例有助于解释混迭减少方案的基本构思。文中,剩余混迭分量是经时间反转且经开窗口的输入信号,其中所述输入信号与两个增益因子的差值(在示例中,为0.3)相乘。因此,可以通过以下步骤来消除混迭:
●通过针对所述两个块具有相等增益的附加IMDCT,来重建构交叠区中的输入信号
●乘以函数w(n)·w(N+n)
●时间反转
●乘以增益差0.3
●与具有不同增益的处理的输出的减法
图6示出了前三个步骤的输出。
在第一方面,计算针对交叠区的两个不含混迭的输出信号,然后在该两个输出信号之间执行平滑转换。图5a示出了实施例的框图。
通过用相等增益因子集gj-1(k)对具有频谱系数Xj-1(k)和Xj(k)的两个受影响帧进行IMDCT处理,来获得第一信号p1,j(n)。两个帧的时域混迭分量彼此消除,这是由于不存在增益差。相应地,根据Xj-1(k)和Xj(k)产生第二信号p2,j(n),但现在使用增益因子gj(k)。现在可以根据在交叠区内执行从p1,j(n)向p2,j(n)的平滑转换,获得频谱形状的变化:
y(jN+n)=f(n)·p1,j(n)+(1-f(n))·p2,j(n)
其中f(n)通常在区间0≤n<N中自1至0地单调递减。对于f(n)=1-w2(n)的情况,可以示出两个方法产生恰好相同的输出(详见附录)。然而,独立于MDCT窗口来选择平滑转换函数(cross fade function)的自由性为这个方法提供了优点,其中图5a示出了此方法。
对于纯增益变化,第二过程可以通过产生两个不含混迭的信号并执行平滑转换,来减少混迭分量。这里,通过在两个对应帧中使用相等修补(patching)和相等增益因子,获得两个信号中的每个信号(参见图5b)。对于恒定且固定的修补,无需进行专门区分。恒定修补将针对所有帧仅推断相等映射Pj(k)=P(k)。
如果增益因子不仅随时间变化,而且随频率变化,则处理变得更复杂。在这种情况下,不再可能经由时间包络进行替换,产生时间反转的输入信号也无法提供用于减少混迭分量的合适信号。在以下示例中示出这种情况,其中第一帧中的增益再次在频率上是恒定的(g0(k)=1),但在第二帧中,g1(k)如图7所示地变化。
这种情况导致未消除的混迭分量,然而该未消除的混迭分量的形状不同于图9中所示的形状(右边)。如第一示例中可见,增益差导致未消除的混迭分量。因此,图3a示出了该过程。
通过图3a所示的以下步骤来执行混迭减少:
●通过用增益差对原始系数进行加权(307、308),产生附加频谱系数:
Uj-1(k)=(gj(k)-gj-1(k))·Xj-1(k)
Uj(k)=(gj(k)-gj-1(k))·Xj(k)
●通过用Uj-1(k)和Uj(k)进行附加IMDCT,对交叠区中的输入信号进行重构(303、304、306)。
●与函数w(n)·w(N+n)相乘(330)
●时间反转(340)
●对具有不同增益的处理的输出进行组合,例如,加法或减法
对于具体示出的MDCT实现方案,增益差项(gj(k)-gj-1(k))的顺序确定是否必须将时间反转的输出与常规IMDCT输出相加或相减。对于其他MDCT实现方案,符号可以是不同:
(gj(k)-gj-1(k)):将时间反转的输出与常规IMDCT输出相加。
(gj-1(k)-gj(k)):从常规IMDCT输出减去时间反转的输出。
因此,对于上文所述的实施例和对于图3a所示的情况(其中示出了(gj(k)-gj-1(k))),组合器341被实现为将两个输入相加的加法器。
应注意,对于交迭变换的不同实现方案,需要的符号可以不同。例如,对于奇数堆栈MDCT,存在至少四个实施例。此外,对于偶数堆栈MDCT或具有多个交叠的ELT,存在其他实施例。对于奇数堆栈MDCT,校正项的符号是不同的。因此,块341中执行的组合可包括加法或减法。
图4示出了当前示例的混迭校正项与混迭的IMDCT输出。
通过映射函数P(k)来描述BWE算法的向上复制级。对于将频谱系数的下半部分复制至上半部分,应如下所示:
增益函数在下半部分中可以是恒定的且等于1:
gj(k)=1针对0≤k<N/2
如果增益因子可以在频谱上半部分中改变,则可以再次出现未消除的混迭。然而,可以恰好以与在上文所述的第一方法中所描述的相同方式来执行混迭减少,差别仅在于在产生补偿信号时还必须考虑修补。可以通过在将经映射频谱系数馈送至IMDCT时使用所述系数及用增益差适当地对所述系数进行加权,来实现此操作。在这种情况下,下半部分中的所有增益差将为零。
更先进的带宽扩展可以应用在帧与帧之间有所不同的修补。可通过针对每个帧定义单独的映射函数Pj(k)来描述这种情况。在这种情况下,混迭减少必须考虑到可以将不同分量复制到影响常见交叠区的两个帧的相同频率索引。在产生混迭减少分量时必须考虑这种情况。为此,上文将第一帧中的修补视作在帧j-1中具有为gj-1(k)的增益,且在帧j中具有为0的增益,假定帧j中的修补在帧j-1中具有为0的增益且在帧j中具有为gj(k)的增益。用于产生混迭减少信号的所得频谱系数如下所示:
Uj(k)=-gj-1(k)·Xj-1(Pj-1(k))+gj(k)·Xj-1(Pj(k))
Uj-1(k)=-gj-1(k)·Xj(Pj-1(k))+gj(k)·Xj(Pj(k))
图3b示出了这种配置的框图。
在以下部分中,考虑到类似性,更详细地论述图3a以及图5a和5b中的两个方面。
通过下式,来定义MDCT,其中所述MDCT的频率分辨率为包括自样本位置jN开始的2N个样本的帧xj(n)的N个频谱系数:
其中w(n)是长度2N的窗口函数,k是频率索引,n是时域中的样本索引。时间信号x(n)的帧xj(n)被定义为:
xj(n)=x(jN+n),0≤n<2N
通过对频谱分量Yj(k)进行反向变换,来获得中间输出帧
通过将交叠片段相加来计算MDCT逆处理(IMDCT)的最终输出:
其中缩写且窗口条件为
w(N-1-n)=w(N+n)
w2(n)=1-w2(N+n)
交叠区中的IMDCT在应用增益因子之后的输出为:
其中
交叠相加、开窗口及时问反转之后,结合图1b、3a所描述的第二方面的混迭校正项为:
其中
余弦项具有以下对称性:
代入这种对称性得到:
从yk(n)减去rk(n)给出构成混迭减少的输出的项:
这与根据参考图1a、5a及5b所示和所述的第一方面用增益gj-1(k)和gj(k)重建构出的信号之间的平滑转换相对应。
随后,参考图1c及1d,以便示出时间部分与块(无论在编码器或分析侧上还是在解码器或合成侧上)的关系。
图1d示出了第0时间部分至第3时间部分的示意性表示,且这种后续时间部分的每个时间部分具有特定交叠范围170。基于这种时间部分,通过参考图2a详细所述的处理(示出了引入混迭的变换操作的分析侧),来产生表示交叠时间部分的一系列块的块。
具体地,当图1d应用于分析侧时,通过应用分析窗口的开窗口器201来对图1d所示的时域信号开窗口。因此,为了获得例如第0时间部分,开窗口器将分析窗口应用于例如2048个样本(具体地,应用于样本1至样本2048)。因此,N等于1024,窗口的长度为2N个样本(在该示例中,为2048)。然后,开窗口器应用另一分析操作,但并非将样本2049作为该块的第一样本,而是将样本1025作为该块中的第一样本,以便获得第一时间部分。因此,获得第一交叠范围170,所述第一交叠范围是50%交叠的1024个样本长。附加地,针对第二和第三时间部分应用这种过程,但该过程始终具有交叠以便获得特定交叠范围170。
应强调,交叠未必必须为50%交叠,交叠还可以是更高和更低程度,且甚至可以存在多交叠(即,多余两个窗口的交叠),使得时域音频信号的样本并非仅有助于两个窗口和相应的频谱值块,且样本还有助于超过两个的窗口/频谱值块。另一方面,本领域技术人员还应理解,存在可以由图2a的开窗口器201应用的其他窗口形状,所述其他窗口形状具有0个部分及/或具有单一值的部分。对于这种具有单一值的部分,似乎这种部分通常与在先窗口或后续窗口的0个部分相交叠,因此位于具有单一值的窗口的恒定部分中的特定音频样本仅有助于单个频谱值块。
然后,将由图1d获得的窗口型时间部分传送至用于执行迭入操作的折迭器202。这种迭入操作可以例如执行迭入,使得在折迭器202的输出处,仅存在每块具有N个样本的采样值的块。然后,在折迭器202执行的折迭操作之后,应用时间-频率转换器,所述时间-频率转换器例如是将输入处的每块N个样本转换为在时间-频率转换器203的输出处的N个频谱值的DCT-IV转换器。
因此,图1c示出了在块203的输出处获得的一系列频谱值块,具体示出了与在图1a和1b的102处所示的第一修改值相关联的第一块191和与例如在图1a和1b的106所示的第二修改值相关联的第二块192。自然地,如图所示,该序列在第二块之前或甚至在第一块之前具有更多块193或194。第一和第二块191、192是例如通过变换图1d的窗口型第一时间部分以获得第一块而获得的,且第二块是通过经由图2a的时间-频率转换器203变换图1d的窗口型第二时间部分而获得的。因此,一系列频谱值块中彼此相邻的两个频谱值块代表被第一时间部分和第二时间部分覆盖的交叠范围。
随后,讨论图2b以便示出对图2a的编码器或分析侧处理的结果进行的合成侧或解码器侧处理。将由图2a的频率转换器203输出的一系列频谱值块输入到修改器211。如已概述,对于图1c至2b所示的示例,每个频谱值块具有N个频谱值。每个块与其修改值相关联,诸如,图1a和1b所示的102、104。然后,在典型IMDCT操作或典型冗余减少合成变换中,执行由频率-时间转换器212、用于迭出的折迭器213、用于应用合成窗口的开窗口器214所示的操作以及由块215所示的交叠/加法器操作,以便获得在交叠范围中的时域信号。在该示例中,上述信号每块具有2N个值,使得在每个交叠和加法运算之后,如果修改值102、104不可随时间或频率变化,则获得N个新的不含混迭的时域样本。然而,如果这些值可随时间及频率变化,则块215的输出信号并非是不含混迭的,但是可以通过在图1b和1a的背景下讨论的及在本说明中其它附图的背景下讨论的本发明的第一与第二方面来解决该问题。
随后,给出由图2a和2b的块执行的过程的另一说明。
尽管参考MDCT来例示所述说明,但是可以以类似及相似方式来处理其他引入混迭的变换。作为交迭变换,MDCT相比于其他傅里叶相关变换的不同之处在于:它的输出是输入的一半(而非相同数目)。具体地,MDCT为线性函数F:R2N→RN(其中R表示实数集)。根据下式将2N个实数x0、……、x2N-1变换成N个实数X0、……、XN-1:
(这种变换前面的归一化系数(文中,具备统一性)是任意约定的并且在处理之间是不同的。下文仅约束MDCT和IMDCT的归一化的乘积。)
逆MDCT被称为IMDCT。因为存在不同数目的输入和输出,所以乍看之下可能认为MDCT不应是可逆的。然而,通过将时间相邻的交叠块的交叠IMDCT相加,来实现完美可逆性,从而消除误差且获取原始数据;这种技术被称为时域混迭消除(TDAC)。
IMDCT根据下式将N个实数X0、……、XN-1变换成2N个实数y0、……、y2N-1:
(与DCT-IV、正交变换相似,逆变换与前向变换具有相同形式。)在具有一般窗口归一化的窗口型MDCT的状况下(参见下文),应将IMDCT前面的归一化系数乘以2(即,变成2/N)。
在典型信号压缩应用中,通过使用与上述MDCT和IMDCT公式中的xn和yn相乘的窗口函数wn(n=0,...,2N-1)来进一步改善变换特性,以便通过使该函数在n=0及2N的点处平滑地归零,来避免在这些点的边界处的不连续性。(也就是说,可以在MDCT之前和IMDCT之后对数据进行开窗口。)原则上,x和y可以具有不同窗口函数,且所述窗口函数还可以从一个块改变至下一块(尤其是在组合不同大小的数据块的情况下),但是为了简单起见,考虑针对大小相等的块使用相同窗口函数的常见状况。
对于对称窗口wn=w2N-1-n,只要w满足以下Princen-Bradley条件,则所述变换保持可逆的(也就是说,TDAC起作用):
使用各种窗口函数。下式给出产生被称作调制型交迭变换的形式的窗口:
该窗口被用于MP3及MPEG-2AAC,且
针对Vorbis。AC-3使用凯赛-贝塞尔导出(KBD)窗口,且MPEG-4AAC也可以使用KBD窗口。
应注意,应用于MDCT的窗口与针对一些其他类型的信号分析使用的窗口不同,这是由于所述窗口必须满足Princen-Bradley条件。这种区别的原因之一是将MDCT窗口应用了两次,用于MDCT(分析)及IMDCT(合成)两者。
通过检查定义可以看出,对于偶数N,MDCT基本上等效于DCT-IV,其中将输入移位N/2并且一次变换两个N个数据块。通过更仔细地检查这种等效,可以容易地导出诸如TDAC的重要特性。
为了定义与DCT-IV的精确关系,必须认识到DCT-IV与交替的偶数/奇数边界条件相对应:偶数在其左边界处(约n=-1/2),奇数在其右边界处(约n=N-1/2)等等(而不是针对DFT的周期性边界)。这种情况遵循标识。因此,如果其输入是:
因此,如果其输入是长度为N的阵列x,则可以想到将该阵列扩展为(x、-xR、-x、xR……)等,其中xR表示逆序下的x。
考虑具有2N个输入和N个输出的MDCT,其中将所述输入划分为四个块(a,b,c,d),每个块具有N/2的大小。如果将这些数据向右移位N/2(在MDCT定义下,从+N/2项起),则(b,c,d)扩展经过N个DCT-IV输入的端部,因此必须根据上文所述的边界条件来将所述输入“折叠”回去。
因此,2N个输入(a,b,c,d)的MDCT恰好等效于N个输入的DCT-IV:(-cR-d,a-bR),其中R表示如上所述的反转(reversal)。
针对图2a的窗口函数202例示出这种情况,a是部分204b、b是部分205a、c是部分205b且d是部分206a。
(这样,可以将计算DCT-IV的任何算法一般地(trivially)应用于MDCT。)
类似地,上述IMDCT公式恰好是DCT-IV的1/2(该公式是其自身的逆公式),其中输出被扩展至(经由边界条件)长度为2N且往回向左移位N/2。根据上述过程,逆DCT-IV将仅回送所述输入(-cR-d,a-bR)。当经由边界条件对所述输入进行扩展和移位时,将得到:
IMDCT(MDCT(a,b,c,d))=(a-bR,b-aR,c+dR,d+cR)/2.
因此,一半的IMDCT输出是冗余的,这是由于b-aR=-(a-bR)R,且对于最后两项同样也是如此。如果将输入分组成大小为N的较大块A、B,其中A=(a,b)且B=(c,d),则可以以更简单的方式写出该结果:
IMDCT(MDCT(A,B))=(A-AR,B+BR)/2
现在可以理解TDAC是如何工作的。假设计算时间相邻、50%交叠的2N个块(B,C)的MDCT。那么,将得到与上文相似的IMDCT:(B-BR,C+CR)/2。当将该结果与在一半交叠中的先前IMDCT结果相加时,相反项消除且仅获得B,从而恢复原始数据。
现在清楚术语“时域混迭消除”的由来。使用扩展超出逻辑DCT-IV的边界的输入数据导致所述数据将以超出奈奎斯特频率的频率与较低频率进行混迭的相同方式进行混迭,不同之处在于这种混迭出现在时域中而不是频域中:无法区分a和bR对(a,b,c,d)的MDCT、或等效地,对IMDCT的结果(MDCT(a,b,c,d))=(a-bR,b-aR,c+dR,d+cR)/2的贡献。当将组合c-dR等相加时,所述组合等恰好具有正确的符号以供进行组合的抵消。
对于奇数N(实际上很少使用),N/2并非整数,所以MDCT并非是仅对DCT-IV的移位置换(shift permutation)。在这种情况下,附加移位半个样本意味着MDCT/IMDCT变得等同于DCT-III/II,且分析与上文相似。
从上文已经看出:2N个输入(a,b,c,d)的MDCT等效于N个输入(-cR-d,a-bR)的DCT-IV。DCT-IV是针对如下情况设计的:右边界处的函数是奇数的,因此靠近右边界的值接近于0。如果输入信号是平滑的,则情况如下:a和bR的最右侧分量在输入序列(a,b,c,d)中是连续的,因此它们的差较小。观察所述区间的中部:如果将以上表述重写为(-cR-d,a-bR)=(-d,a)-(b,c)R,则第二项(b,c)R在中部给出平滑转变。然而,在第一项(-d,a)中,在-d的右端与a的左端相遇的情况下,存在潜在不连续性。这是使用减少靠近朝向0的输入序列(a,b,c,d)的边界的分量的窗口函数的原因。
上文中,已证明TDAC特性能用于普通MDCT,示出了将时间相邻块(所述时间相邻块交叠一半)的IMDCT相加能恢复原始数据。窗口型MDCT的这种反转特性的推导仅略微复杂。
针对大小为N的块A、B、C考虑2N个输入(A,B)和(B,C)的交叠连续集合。回顾上文,当将(A,B)和(B,C)输入至MDCT、IMDCT中且在它们交叠一半的情况下相加时,获得原始数据(B+BR)/2+(B-BR)/2=B。
现在假设将MDCT输入和IMDCT输出两者都乘以长度为2N的窗口函数。如上所述,假定对称窗口函数,该函数因此具有(W,WR)的形式,其中W为长度N的向量且R如前所述地表示反转。然后,可将Princen-Bradley条件写为其中从元素方面执行平方及加法。
因此,替代对(A,B)执行MDCT,现在对(WA,WRB)进行MDCT,其中从元素方面执行所有乘法。当将该结果输入至IMDCT中并再次乘以(从元素方面)窗口函数时,后一半N变成:
WR·(WRB+(WRB)R)=WR·(WRB+WBR)=WR 2B+WWRBR
(应注意,上式不再具有与1/2的乘法,这是因为IMDCT归一化与窗口型的情况下相差2倍。)
类似地,对(B,C)进行窗口型MDCT和IMDCT,在其前一半N中得到:
W·(WB-WRBR)=W2B-WWRBR
当将这两个半部分相加在一起时,恢复原始数据。当两个交叠窗口对半地满足Princen-Bradley条件时,在窗口切换的背景下,重构仍是有可能的。在这种情况下,混迭减少可以恰好以与上文所述方式相同的方式进行。对于具有多个交叠的变换,使用所有涉及的增益值,将需要超过两个的分支。
随后,通过参考图5a和5b来详细讨论第一方面。具体地,图1a所示的处理器100可以包括由附图标记100限定的框中图5a所示的元件501至506的全部或仅其一部分。优选地,处理器100包含修改器,用于通过使用至少一个第一修改值102来修改被示出为Xj-1的序列中的第一块,以获得第一经修改块551。优选地,由增益乘法器510执行所述修改,其中增益乘法器510可以用数字或模拟方式或以任何其他合适方式实现。此外,该修改器配置为使用至少一个第二修改值106来修改被示出为Xj(k)的第二块,以获得第二经修改块552。优选地,再次由乘法器509来执行这种修改,其中可以用与乘法器510相同或不同的方式来实现乘法器509。此外,将修改器配置用于使用至少一个第一修改值102来修改第二块Xj(k)以获得第三经修改块553,其中可以再次由乘法器508来执行这种修改,可以用相对乘法器510或509相同或不同的方式来实现乘法器508。
此外,所述修改器配置为使用至少一个第二修改值106(即,Xj(k))来修改第一块xj-1以获得第四经修改块554。优选地,由乘法器507来再次产生所述第四经修改块554,其中可以用相对乘法器510、509、508相同或不同的方式来实现乘法器507。
此外,处理器100优选地包含频谱-时间转换器,用于将第一至第四经修改块551至554转换成对应时间表示561、562、563、564。具体地,该频谱-时间转换器实现为包含产生对应第一至第四经修改块561至564的IMDCT块501、502、503、504。该频谱-时间转换器可以实现为包含图2b的真实元件212(频率-时间转换器)、213(用于迭出的折迭器)和214(合成开窗口器)的IMDCT算法。然而,该频谱-时间转换器可以实现为任何其他混迭减少的变换器,所述变换器在其输出处产生时域采样值块,所述时域采样值块相较于所述变换器输入处的样本数目,具有更多数目的样本。
备选地,对于计算高效的实现方案,无法可以计算完整IMDCT或整个混迭减少的逆变换,而是仅计算含有混迭减少的或混迭消除的信号的时间片段。根据此思路,例如,在IMDCT的情况下,可以省略一个迭出操作及一半的合成开窗口操作。因此,该处理器可以配置为用于执行具有交叠范围的交迭变换,其中该处理器配置为仅用于执行影响交叠范围中的值的操作,而不用于执行不影响交叠范围中的值的操作。结合图2b,不影响交叠范围的操作是影响在先块的第一半部分和当前块的第二半部分的块213的迭出操作。此外,对于这种高效的实现方案,针对在先块的第一半部分和当前块的第二半部分的对应开窗口操作并非是必要的。这是由于仅将在先块的第二半部分和当前块的第一半部分用于交叠范围的事实。
在图5a的实施例中,输入至IMDCT块的样本的数目等于N,由IMDCT块输出的样本的数目是2N。然而,只要由频谱-时间转换器输出的样本的数目大于输入至相应频谱-时间转换器的频域样本的数目,就可以实现与其他交叠因子相对应的其他数值比率。
此外,频谱-时间转换器可以实现为含有针对待转换的每个单独信号的单独频谱时间转换器,或可以包含单个频谱时间转换器(诸如,只有图5a的块501)和对应序列控制器,以便依次逐个地变换经修改块。
此外,处理器100包含交叠加法器,用于将第一经修改块561与第三经修改块563的表示交叠相加,以获得不含混迭的或至少混迭减少的第一结果信号104。
此外,交叠加法器配置为用于将第二经修改块562与第四经修改块564的时间表示交叠相加,以获得同样不含混迭的或至少混迭减少的第二结果信号108。由交叠加法块505来执行针对第一和第三时间表示的交叠相加操作,并由另一交叠相加块506来执行针对第二和第四经修改块的时间表示(即,针对线缆562及564上的信号)的另一交叠相加操作。此外,交叠加法器可以具有单独的这种块或单个块以及对应序列控制,或可以以任何其他可想象方式来实现以便获得所定义结果。优选地,块505、506的每一个都实现为在图2b的背景下描述的对应块215。
优选地,图5a的组合器110配置为通过淡出第一结果信号104并通过淡入第二结果信号108,来组合第一结果信号与第二结果信号。为此,提供针对第一结果信号104的淡出块520和针对第二结果信号的淡入块521。可以由在图5a中被示出为单独组件的加法器522来执行实际组合。然而,应强调的是,组合器510的实际操作优选是加权线性组合,其中对于每个样本,淡出函数520提供特定加权因子,然后将用该加权因子进行加权的对应样本与通过用淡入函数521针对所述对应样本提供的加权因子进行加权的另一结果信号的对应样本相加。
如所概述,处理器100配置为在执行频谱-时间转换时执行IMDCT操作,且这种IMDCT操作可以包含块212、213、214的功能,但可以以任何其他方式来实现该IMDCT操作,且熟知许多有效IMDCT算法,所述算法基本上获得与在图2a和2b的背景下讨论的结果相同的结果。
此外,处理器100配置为在计算如图1d的170所示的交叠范围中的第一和第二结果信号时,执行交叠相加处理操作505、506。此外,组合器104被配置为在组合范围中(即,例如,在这种组合范围等于交叠范围的情况下,是交叠相加范围)组合所述第一和第二结果信号。
因此,应强调,还可以将图1d视为表示由合成侧上的块215执行的交叠相加操作。那么,图1d中的每个“时间部分”表示由图2b的合成开窗口器214输出的块,并且将在一个经开窗口块的交叠范围中的样本与在下一经开窗口块的交叠范围中的样本相加。此外,根据需要,用由诸如520的淡出函数和淡入函数522提供的加权因子对对应样本进行加权。例如,当第一时间部分与经开窗口块相对应时,那么在图1d的交叠范围170中,第一时间部分可以在交叠范围期间淡出,与此同时第二时间部分可以在交叠范围内淡入。因此,淡出函数可以提供优选地以线性方式从1减小至0并在从1至N的样本数目上均等分布的淡出因子。因此,当经开窗口块的长度为2N时,则可以将1与0之间的区间分成N个相等的区间,且对于每个区间,可以将淡出因子确定为例如每个区间的中心。类似地,淡入函数可以是提供同样具有N个相等的区间的从0至1线性增加的淡入因子的函数。
然而,可以应用除了线性函数之外的其他函数,且优选的是对于每个样本,样本的淡入因子与所述样本的淡出因子的总和等于1,使得淡入/淡出(或总体上,平滑转换)并不导致音频信号的振幅或响度变化。因此,针对平滑转换范围中的每个样本的淡出部分与淡入部分的总和是恒定的,且优选等于1。
优选地,在图5b的背景下,将本发明应用于带宽填充功能性的背景中。带宽扩展意味着扩展输入信号的带宽,使得由带宽扩展技术产生的输出信号通常具有比输入信号更高的带宽。然而,另一方面,还存在带宽填充技术,所述带宽填充技术未必增加带宽但填充输入信号内的频谱洞。当将上频率带视为“频谱洞”时,则带宽填充功能性与带宽扩展技术相似。然而,如果存在相对于频率位于频谱值范围下方的输入信号频谱洞,则带宽填充功能性不扩展带宽,该技术的结果与输入具有相同带宽。在这种背景下,例如,SBR是带宽扩展技术的示例,智能间隙填充(IGF)是不必增加输入信号的带宽的一般带宽填充功能性的示例。
优选地,处理器100配置为应用具有修补函数的带宽填充功能性,以将频谱值自源范围300修补至目标范围334,且该处理器配置为在计算第一和第二结果信号时应用该修补函数。例示性地,图3c示出用于根据具有高分辨率或表示源范围的一系列频谱值块产生在带宽填充范围或目标范围内的一系列频谱值块334的修补器。该修补器在图3c中被表示为332,并且可以实现为应用如上所示的修补函数P(k)。可选性地,如图3c所示,在应用带宽填充功能性的情况下,处理器100与组合器110的结构在不考虑以下事实的情况下与未应用带宽填充时的结构相同:图5b中的334所示的一系列频谱值块是图3c的修补器的输出,且增益因子102、106,或概括性地,针对每个块的修改因子,是由诸如频带复制、智能间隙填充或任何其他带宽填充功能性的一些带宽填充功能性来定义的。因此,修补器332可以是处理器的一部分或可以实现为应用于处理器的输入处的预处理级。
因此,用于处理音频信号的装置包含修补器,该修补器作为处理器100的一部分或作为在图1a的处理器100之前应用于信号处理方向的块,其中该修补器配置为用于根据针对第一块的修补函数在使用来自不同频率范围(即,来自源范围)的频谱值的带宽填充范围中产生第一块,且该修补器附加地配置为根据针对第二块的修补函数(其可以是相同的修补函数或不同的修补函数)在使用来自不同频率区或源区的频谱范围的带宽填充范围或目标范围中产生第二频谱值块。
此外,如在图5a或5b的背景下已讨论地,该处理器配置为执行类似乘法的功能性510、509、508、507,以便通过使用作为修改值的增益函数或增益值来修改第一和第二块。
在图3a和3b的背景下讨论了本发明的第二方面的另一实施例。
图3a和3b都示出了用于处理包含一系列频谱值块114的音频信号的装置。每个实现方案均包含处理器150,用于使用针对一系列块114中的第一块的至少一个第一修改值102和针对所述一系列块中的第二块的至少一个不同第二修改值来计算受混迭影响的信号154。优选地,用于计算受混迭影响的信号的处理器的功能性包含增益修改器,用于使用至少一个第一修改值来修改第一块以获得第一经修改块351。优选地,由乘法器310来执行这种修改,但是仍可以如在图5的对应乘法器510的背景下所讨论地实现乘法器310。此外,增益修改器配置为用于使用至少一个第二修改值106来修改第二块Xj(k)以获得第二经修改块352。可以再次由乘法器309来执行这种修改,其中同样可以如乘法器510的背景下所讨论地实现乘法器309。为了产生受混迭影响的信号,处理器150包含用于将第一和第二经修改块转换成时域表示361、362的频谱-时间转换器,且附加地包含配置为用于将第一和第二块的时域表示(即,361和362)交叠相加以获得受混迭影响的信号154的交叠加法器。
此外,该处理器还配置为用于估计混迭误差信号。为此,处理器150包含被示出为乘法器308和307的增益修改器的另一功能性,以便使用至少一个第一修改值102或至少一个第二修改值106来修改第一块和第二块,以获得第三经修改块353和第四经修改块354。
此外,示出为303和304的频谱-时间转换器分别将第三经修改块353和第四经修改块354转换成时域表示363和364,然后由用于将第三和第四经修改块的时域表示交叠相加的交叠加法器来处理这种第三和第四经修改块,以便获得混迭误差信号158。
为了操控混迭误差信号158以获得与受混迭影响的信号158的良好组合,组合器包含用于应用窗口函数的开窗口器330及用于对信号进行时间反转的时间反转块340。
在频域中(即,在执行块303和304的频谱-时间转换之前的处理器中)应用增益修改值之间的差。为此,参考图3a。具体地,在该实施例中,处理器包含增益修改器,增益修改器配置为用于使用至少一个第一修改值与至少一个第二修改值之间的差经由乘法器307来修改第一块xj-1,其中优选的,针对每个频率值或频谱值(如由图3a的索引k所示)计算所述差。此外,增益修改器配置为用于在乘法器308内使用所述差125来修改第二块,以便获得第三经修改块353和第四经修改块354。在图3a所示的实施例中,组合器包含窗口330和时间反转340。
尽管示出了组合器内的处理操作的顺序,使得开窗口器330在时间反转340之前沿信号流方向进行操作,但应清楚,这种元件的操作的顺序还可以是反转的。
因此,图3a的处理器150使得增益修改器使用至少一个第一修改值或至少一个第二修改值来修改第一块和第二块。图3a的修改由于如下事实引发两个修改值:实际上将两个修改值之间的差用于例如由乘法器308、307执行的修改,其中增益差在图3a中由125标识。
此外,如所概述,优选地,应用开窗口操作330和时间反转操作340。然而,对于其他实现方案(例如,当以不同方式实现频谱-时间变换时),可能完全不必要应用时间反转340。此外,当未应用分析窗口或合成窗口时,且当仅应用例如“矩形窗口”时,则也可以免除开窗口330。
然而,在优选实施例中,示出了开窗口器和时间反转器运算符,且这两者是按照所示出的顺序定位的。
随后,更详细地讨论图3b。图3b与图3a的相似之处在于增益“差”的应用被应用于频域。然而,由于应用修补操作的事实,不能直接地应用增益差,但是,不同修补操作优选地对此进行补偿。
因此,为了获得混迭误差信号,在带宽填充功能性(如图3c的背景下所讨论)的背景下的修补操作中,优选地应用以下过程。首先,计算频谱值块306a(其为第一块),但经由针对第二块的修补操作来修补第一块,然后将该第一块306a乘以针对第二块的增益因子106。
此外,如图所示,产生第一频谱值块306b,该块与第一块304b相同(即,应用与第一块相关联的修补操作的第一块),然后将信号乘以第一修改因子102。然后,将由乘法器产生的信号相组合,诸如,在可以实现为减法器或具有负值输入的加法器等的329中进行减法或加法。然后,获得基本上对应于块353的第三经修改块。以类似方式获得块354,即,通过用针对第二块的修补操作来修补第二块Xj,即,通过使用块304b并将该块乘以第二修改因子106。然而,也向第二块应用与第一块相关联的修补算法,如项306d所示,然后经由乘法器307b将结果乘以第一乘法因子。接着,在加法器328中将乘法器307a和307b的输出信号加在一起以便最后获得第四经修改块354。然后,第三和第四经修改块353和354受到在图3a的背景下所讨论的频谱-时间变换,然后使用如图3b所示的块306对所述经修改块进行交叠相加。接着,执行组合器中的相同操作(诸如,开窗口330、时间反转340及最后组合152),以便最后获得不含混迭的信号112。
尽管已在框图的背景(其中,所述框表示真实的或逻辑的硬件组件)下描述了本发明,但本发明也可以实现为计算机实施方法。在后者的情况下,块表示对应方法步骤,其中这种步骤代表由对应逻辑或实体硬件块执行的功能性。
尽管已在装置的背景下描述了一些方面,但应清楚的是这种方面还代表对相应方法的描述,其中块或器件与方法步骤或方法步骤的特征相对应。类似地,在方法步骤的背景下描述的多个方面也代表对相应块或项或相应装置的特征的描述。可以通过(或使用)硬件装置(诸如,微处理器、可编程计算机或电子电路)来执行方法步骤中之一部分或全部。在一些实施例中,可以由这种装置来执行最重要方法步骤中的某个方法步骤或多个方法步骤。
本发明的经传输或经编码的信号可以存储在数字存储媒体上或可以在诸如无线传输媒体的传输媒体或诸如因特网的有线传输媒体上传输。
根据特定实施方案的要求,本发明的实施例可以实现为硬件或软件。可以通过使用其上存储有电子可读控制信号的数字存储媒体(例如,软盘、DVD、Blu-Ray、CD、ROM、PROM和EPROM、EEPROM或闪存)来执行所述实现方案,所述控制信号与可编程计算机系统合作(或能够与之合作),使得执行各个方法。因此,数字存储媒体可以是计算机可读的。
根据本发明的一些实施例包含具有电子可读控制信号的数据载体,所述控制信号能够与可编程计算机系统合作,使得执行本文所述的方法之一。
总言之,本发明的实施例可以实现为具有程序代码的计算机程序产品,程序代码可操作用于在在计算机上执行计算机程序产品时执行所述方法之一。程序代码可以例如存储在机器可读载体上。
其他实施例包含存储在机器可读载体上的用于执行本文所述的方法之一的计算机程序。
因此,换言之,本发明方法的实施例是具有程序代码的计算机程序,其中当在计算机上运行该计算机程序时,所述程序代码执行本文所述的方法之一。
因此,本发明方法的另一实施例是数据载体(或诸如数字存储媒体或计算机可读媒体的非暂时性存储媒体),包含记录于其上的用于执行本文所述方法之一的计算机程序。数据载体、数字存储媒体或记录媒体通常是有形的及/或非暂时性的。
因此,本发明方法的另一实施例是表示用于执行本文所述的方法之一的计算机程序的数据流或一系列信号。所述数据流或一系列信号可以例如配置为经由数据通信连接(例如,经由因特网)进行传送。
另一实施例包含处理装置,例如,配置为或用于执行本文所述的方法之一的计算机或可编程逻辑器件。
另一实施例包含将计算机程序安装在其上的计算机,所述计算机程序用于执行本文所述的方法之一。
根据本发明的另一实施例包含配置为将用于执行本文所述的方法之一的计算机程序传送(例如,用电子方式或光学方式)至接收器的装置或系统。接收器可以是例如计算机、移动设备、存储设备等。所述装置或系统可以例如包含用于将计算机程序传送至接收器的文件服务器。
在一些实施例中,可编程逻辑器件(例如,场可编程门阵列)可以用于执行本文所述的方法的功能性中的一部分功能性或全部功能性。在一些实施例中,场可编程门阵列可以与微处理器合作以便执行本文所述的方法之一。通常,优选地,由任何硬件装置执行所述方法。
上文所述的实施例仅示出本发明的原理。应理解,本文所述的配置和细节的修改和变型对于本领域技术人员是显而易见的。因此,本发明仅受限于后附专利权利要求书的范围,而不受限于通过描述和解释本文实施例而呈现出的具体详情。

Claims (15)

1.一种用于处理包含一系列频谱值块(114)的音频信号的装置:所述装置包括:
处理器(100),用于使用针对第一块的至少一个第一修改值(102)来处理所述一系列块,以在交叠范围(170)中获得混迭减少的或不含混迭的第一结果信号,并使用针对所述一系列块中的第二块的至少一个第二不同修改值(106)来处理所述一系列块,以在交叠范围(170)中获得混迭减少的或不含混迭的第二结果信号(108);以及
组合器(110),用于在交叠范围(170)中组合所述第一结果信号(104)与所述第二结果信号(108)以获得针对所述交叠范围(170)的处理后的信号(112),
其中所述处理器(100)包含:
修改器(510,509,508,507),用于使用所述至少一个第一修改值(102)来修改所述一系列块中的第一块以获得第一经修改块(551),用于使用所述至少一个第二修改值(106)来修改所述一系列块中的第二块以获得第二经修改块(552),用于使用所述至少一个第一修改值(102)来修改所述第二块以获得第三经修改块(553),以及用于使用所述至少一个第二修改值(106)来修改所述第一块以获得第四经修改块(554);
频谱-时间转换器(501,502,503,504),用于将所述第一至第四经修改块转换为对应时间表示(561,562,563,564);以及
交叠加法器(505,506),用于将所述第一和第三经修改块(551,553)的时间表示(561,563)交叠相加以获得所述第一结果信号(104),以及用于将所述第二和第四经修改块(552,554)的时间表示(562,564)交叠相加以获得所述第二结果信号(108)。
2.根据权利要求1所述的装置,其中所述组合器(110)配置为通过对所述第一结果信号进行淡出(520)并通过对所述第二结果信号进行淡入(521)以及将两个信号相加(522),来组合所述第一结果信号(104)与所述第二结果信号(108)。
3.根据权利要求1所述的装置,
其中所述处理器(100)配置为在执行频谱-时间转换时执行改进的离散余弦反变换操作。
4.根据权利要求1所述的装置,
其中所述处理器(100)配置为当在所述交叠范围中计算所述第一和所述第二结果信号时执行交叠相加处理操作(505,506),且
其中所述组合器(110)配置为在组合范围中组合所述第一和第二结果信号,其中所述组合范围与所述交叠范围(170)相同。
5.根据权利要求1所述的装置,
其中所述组合器(110)配置为执行平滑转换函数,其中所述平滑转换函数包含淡出部分(520)和淡入部分(521),其中针对平滑转换范围中的样本,所述淡出部分(520)的加权系数与所述淡入部分(521)的加权系数的总和(522)是恒定的。
6.根据权利要求1所述的装置,
其中所述组合器(110)配置为执行平滑转换操作,其中所述平滑转换操作包含单调递减的淡出部分(520)和单调递增的淡入部分(521)。
7.根据权利要求1所述的装置,
其中所述处理器(100)配置为应用具有修补函数的带宽填充操作(332)以将频谱值从源范围(300)修补至目标范围(334),且
其中所述处理器(100)配置为在计算所述第一和第二结果信号时应用所述修补函数。
8.根据权利要求1所述的装置,还包含:
修补器(332),用于根据针对所述第一块的修补函数,使用来自不同频率范围的频谱值在带宽填充范围中产生所述第一块,以及用于根据与所述第二块相关联的修补函数,在具有针对不同频率区的频谱值的带宽填充范围中产生所述第二块。
9.根据权利要求1所述的装置,
其中所述处理器(100)配置为使用作为修改值的增益函数,对所述第一块和所述第二块执行乘法运算。
10.根据权利要求1所述的装置,
其中所述处理器(100)配置为处理所述一系列块,其中所述第一块与所述第二块在时间上相邻,且其中所述第一块和所述第二块以交叠程度等于时间部分的55%至45%的方式在时间上相邻。
11.根据权利要求1所述的装置,
其中所述处理器(100)配置为应用具有频谱-时间变换部分(212)和合成窗口部分(214)的频谱-时间转换操作,其中合成窗口部分(214)应用于所述频谱-时间变换部分(212,213)的输出。
12.根据权利要求1所述的装置,
其中所述处理器(100)配置为使用随时间和频率变化的修改值进行操作。
13.根据权利要求1所述的装置,其中所述处理器配置为执行具有交叠范围的交迭变换,且其中所述处理器配置为仅执行影响所述交叠范围中的值的操作,而不执行不影响所述交叠范围中的值的操作。
14.一种用于处理包含一系列频谱值块(114)的音频信号的方法,所述方法包括:
使用针对第一块的至少一个第一修改值(102)来处理(100)所述一系列块,以在交叠范围(170)中获得混迭减少的或不含混迭的第一结果信号,并使用针对所述一系列块中的第二块的至少一个第二不同修改值(106)来处理所述一系列块,以在所述交叠范围(170)中获得混迭减少的或不含混迭的第二结果信号(108);以及
在所述交叠范围(170)中组合(110)所述第一结果信号(104)与所述第二结果信号(108),以获得针对所述交叠范围(170)的处理后的信号(112),
其中所述处理(100)包括:
使用所述至少一个第一修改值(102)来修改所述一系列块中的第一块以获得第一经修改块(551);
使用所述至少一个第二修改值(106)来修改所述一系列块中的第二块以获得第二经修改块(552);
使用所述至少一个第一修改值(102)来修改所述第二块以获得第三经修改块(553);
使用所述至少一个第二修改值(106)来修改所述第一块以获得第四经修改块(554);
将所述第一至第四经修改块转换为对应时间表示(561,562,563,564);以及
将所述第一和第三经修改块(551,553)的时间表示(561,563)交叠相加以获得第一结果信号(104);以及
将所述第二和第四经修改块(552,554)的时间表示(562,564)交叠相加以获得所述第二结果信号(108)。
15.一种计算机可读介质,所述计算机可读介质上具有计算机程序,当运行在计算机或处理器上时,所述计算机程序用于执行根据权利要求14所述的方法。
CN201480046726.7A 2013-08-23 2014-08-22 用于使用交叠范围中的组合来处理音频信号的装置及方法 Active CN105556601B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP13181507 2013-08-23
EP13181507.8 2013-08-23
PCT/EP2014/067944 WO2015025051A1 (en) 2013-08-23 2014-08-22 Apparatus and method for processing an audio signal using a combination in an overlap range

Publications (2)

Publication Number Publication Date
CN105556601A CN105556601A (zh) 2016-05-04
CN105556601B true CN105556601B (zh) 2019-10-11

Family

ID=51392261

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201480046719.7A Active CN105556600B (zh) 2013-08-23 2014-08-22 用于混迭误差信号来处理音频信号的装置及方法
CN201480046726.7A Active CN105556601B (zh) 2013-08-23 2014-08-22 用于使用交叠范围中的组合来处理音频信号的装置及方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201480046719.7A Active CN105556600B (zh) 2013-08-23 2014-08-22 用于混迭误差信号来处理音频信号的装置及方法

Country Status (18)

Country Link
US (2) US10157624B2 (zh)
EP (2) EP3036738B1 (zh)
JP (2) JP6333379B2 (zh)
KR (2) KR101820028B1 (zh)
CN (2) CN105556600B (zh)
AR (2) AR097443A1 (zh)
AU (2) AU2014310548B2 (zh)
BR (1) BR112016003029B1 (zh)
CA (2) CA2921195C (zh)
ES (2) ES2693559T3 (zh)
MX (2) MX352576B (zh)
MY (2) MY184723A (zh)
PL (1) PL3028275T3 (zh)
PT (1) PT3028275T (zh)
RU (2) RU2643662C2 (zh)
SG (2) SG11201601032RA (zh)
TW (2) TWI570708B (zh)
WO (2) WO2015025051A1 (zh)

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6124895A (en) * 1997-10-17 2000-09-26 Dolby Laboratories Licensing Corporation Frame-based audio coding with video/audio data synchronization by dynamic audio frame alignment
JP4281131B2 (ja) * 1998-10-22 2009-06-17 ソニー株式会社 信号符号化装置及び方法、並びに信号復号装置及び方法
US6226608B1 (en) * 1999-01-28 2001-05-01 Dolby Laboratories Licensing Corporation Data framing for adaptive-block-length coding system
US6658383B2 (en) * 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
US6963842B2 (en) 2001-09-05 2005-11-08 Creative Technology Ltd. Efficient system and method for converting between different transform-domain signal representations
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
WO2004082288A1 (en) * 2003-03-11 2004-09-23 Nokia Corporation Switching between coding schemes
DE102004021403A1 (de) * 2004-04-30 2005-11-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalverarbeitung durch Modifikation in der Spektral-/Modulationsspektralbereichsdarstellung
CN1862969B (zh) * 2005-05-11 2010-06-09 尼禄股份公司 自适应块长、常数变换音频解码方法
EP1895511B1 (en) * 2005-06-23 2011-09-07 Panasonic Corporation Audio encoding apparatus, audio decoding apparatus and audio encoding information transmitting apparatus
DE102006010212A1 (de) * 2006-03-06 2007-09-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Simulation von WFS-Systemen und Kompensation von klangbeeinflussenden WFS-Eigenschaften
EP2002426B1 (en) 2006-04-04 2009-09-02 Dolby Laboratories Licensing Corporation Audio signal loudness measurement and modification in the mdct domain
DE102006047197B3 (de) * 2006-07-31 2008-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines reellen Subband-Signals zur Reduktion von Aliasing-Effekten
DE102006051673A1 (de) * 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
ES2383217T3 (es) * 2006-12-12 2012-06-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador, descodificador y métodos para codificar y descodificar segmentos de datos que representan una corriente de datos de dominio de tiempo
CN101046964B (zh) * 2007-04-13 2011-09-14 清华大学 基于重叠变换压缩编码的错误隐藏帧重建方法
EP2186088B1 (en) * 2007-08-27 2017-11-15 Telefonaktiebolaget LM Ericsson (publ) Low-complexity spectral analysis/synthesis using selectable time resolution
KR101408183B1 (ko) * 2007-12-21 2014-06-19 오렌지 적응적 윈도를 갖는 변환 기반 코딩/디코딩
WO2010003532A1 (en) * 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme
PL2234103T3 (pl) * 2009-03-26 2012-02-29 Fraunhofer Ges Forschung Urządzenie i sposób manipulacji sygnałem audio
RU2557455C2 (ru) * 2009-06-23 2015-07-20 Войсэйдж Корпорейшн Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала
RU2591661C2 (ru) * 2009-10-08 2016-07-20 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Многорежимный декодировщик аудио сигнала, многорежимный кодировщик аудио сигналов, способы и компьютерные программы с использованием кодирования с линейным предсказанием на основе ограничения шума
MY166169A (en) * 2009-10-20 2018-06-07 Fraunhofer Ges Forschung Audio signal encoder,audio signal decoder,method for encoding or decoding an audio signal using an aliasing-cancellation
BR122020024236B1 (pt) 2009-10-20 2021-09-14 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E. V. Codificador de sinal de áudio, decodificador de sinal de áudio, método para prover uma representação codificada de um conteúdo de áudio, método para prover uma representação decodificada de um conteúdo de áudio e programa de computador para uso em aplicações de baixo retardamento
CN102770912B (zh) * 2010-01-13 2015-06-10 沃伊斯亚吉公司 使用线性预测滤波的前向时域混叠消除
EP2372703A1 (en) * 2010-03-11 2011-10-05 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Signal processor, window provider, encoded media signal, method for processing a signal and method for providing a window
EP2375409A1 (en) * 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
PL2591470T3 (pl) * 2010-07-08 2019-05-31 Fraunhofer Ges Forschung Koder wykorzystujący kasowanie aliasingu w przód
FR2969804A1 (fr) * 2010-12-23 2012-06-29 France Telecom Filtrage perfectionne dans le domaine transforme.
PL2550653T3 (pl) * 2011-02-14 2014-09-30 Fraunhofer Ges Forschung Reprezentacja sygnału informacyjnego z użyciem transformacji zakładkowej

Also Published As

Publication number Publication date
BR112016003029A2 (pt) 2017-09-12
US10157624B2 (en) 2018-12-18
TWI570708B (zh) 2017-02-11
TW201523593A (zh) 2015-06-16
CN105556600A (zh) 2016-05-04
BR112016003029B1 (pt) 2023-04-04
AU2014310547A1 (en) 2016-04-07
CA2921195A1 (en) 2015-02-26
TW201523592A (zh) 2015-06-16
AR097443A1 (es) 2016-03-16
JP2016532157A (ja) 2016-10-13
US20160163324A1 (en) 2016-06-09
MY175355A (en) 2020-06-22
AR097444A1 (es) 2016-03-16
KR20160045822A (ko) 2016-04-27
SG11201601298WA (en) 2016-03-30
EP3036738B1 (en) 2018-07-18
KR101820028B1 (ko) 2018-02-28
AU2014310548B2 (en) 2017-04-20
EP3028275A1 (en) 2016-06-08
US10210879B2 (en) 2019-02-19
RU2016110398A (ru) 2017-09-28
WO2015025051A1 (en) 2015-02-26
CA2921192C (en) 2019-04-30
TWI570709B (zh) 2017-02-11
PL3028275T3 (pl) 2018-02-28
US20160163323A1 (en) 2016-06-09
MX354372B (es) 2018-02-28
MX2016001961A (es) 2016-06-02
RU2643662C2 (ru) 2018-02-02
AU2014310548A1 (en) 2016-04-07
CA2921192A1 (en) 2015-02-26
CN105556600B (zh) 2019-11-26
JP6286552B2 (ja) 2018-02-28
RU2641253C2 (ru) 2018-01-16
EP3028275B1 (en) 2017-09-13
MY184723A (en) 2021-04-19
KR20160045821A (ko) 2016-04-27
CN105556601A (zh) 2016-05-04
AU2014310547B2 (en) 2017-01-12
EP3036738A1 (en) 2016-06-29
MX352576B (es) 2017-11-29
MX2016001856A (es) 2016-05-16
WO2015025052A1 (en) 2015-02-26
JP6333379B2 (ja) 2018-05-30
PT3028275T (pt) 2017-11-21
RU2016110408A (ru) 2017-09-28
ES2650117T3 (es) 2018-01-17
CA2921195C (en) 2018-07-17
SG11201601032RA (en) 2016-03-30
KR101831286B1 (ko) 2018-02-22
ES2693559T3 (es) 2018-12-12
JP2016528562A (ja) 2016-09-15

Similar Documents

Publication Publication Date Title
JP6728209B2 (ja) 符号化されたオーディオ信号を復号するためのデコーダおよびオーディオ信号を符号化するためのエンコーダ
CN102985970B (zh) 在用于音频信号的基于相角声码器的带宽扩展中改善的幅值响应和时间对准
CN104851429A (zh) 叉积增强的基于子带块的谐波换位
CN104318930A (zh) 子带处理单元以及生成合成子带信号的方法
CN105556601B (zh) 用于使用交叠范围中的组合来处理音频信号的装置及方法
Kozuka et al. Investigation on wavelet basis function of DNN-based time domain audio source separation inspired by multiresolution analysis
Hsu et al. Novel Decimation-Whitening Filter in Spectral Band Replication

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant