CN103559889B - 组合换位滤波器组的过采样 - Google Patents

组合换位滤波器组的过采样 Download PDF

Info

Publication number
CN103559889B
CN103559889B CN201310423103.4A CN201310423103A CN103559889B CN 103559889 B CN103559889 B CN 103559889B CN 201310423103 A CN201310423103 A CN 201310423103A CN 103559889 B CN103559889 B CN 103559889B
Authority
CN
China
Prior art keywords
window
analysis
synthesis
transposition
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310423103.4A
Other languages
English (en)
Other versions
CN103559889A (zh
Inventor
L·威勒姆斯
P·埃斯特兰德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB filed Critical Dolby International AB
Publication of CN103559889A publication Critical patent/CN103559889A/zh
Application granted granted Critical
Publication of CN103559889B publication Critical patent/CN103559889B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Abstract

本发明涉及组合换位滤波器组的过采样。描述了一种用于对于音频信号产生高频分量的系统,其包括:分析窗单元,用于对音频信号应用长度为LA个样本的分析窗;M阶的分析变换单元,具有频率分辨率Δf,用于将LA个样本变换为M个复数系数;非线性处理单元,用于通过使用换位阶T来改变复数系数的相位;M阶的分析变换单元,具有频率分辨率QΔf,用于将经改变的系数变换为时域样本;以及合成窗单元,用于将长度为LS个样本的合成窗应用于时域样本;其中变换阶M依赖于换位阶T、分析窗尺寸LA、和合成窗尺寸Ls

Description

组合换位滤波器组的过采样
本分案申请是基于申请号为201080043407.2(国际申请号为PCT/EP2010/057156),申请日为2010年5月25日,发明名称为“组合换位滤波器组的过采样”的中国专利申请的分案申请。
技术领域
本发明涉及音频信号的编码,尤其涉及包括频域谐波换位器(transposer)的高频重建方法。
背景技术
HFR技术(例如谱带复制(SBR)技术)使得能够显著提高传统感知音频编解码器的编码效率。与MPEG-4高级音频编码(AAC)组合,HFR技术形成非常高效的音频编解码器,其已用在XM卫星无线电系统和全球数字无线电系统(Digital RadioMondiale)中,而且还在3GPP、DVD论坛和其他组织中得到标准化。AAC与SBR的组合被称作aacPlus。它是MPEG-4标准的一部分,其中其被称作高效AAC规格(HE-ACC)。通常,HFR技术可被以后向兼容以及前向兼容的方式与任何感知音频编解码器组合,因此提供了升级已建立的广播系统(类似于Eureka DAB系统中使用的MPEG层-2)的可能性。HFR换位方法也可以与语音编解码器组合以允许超低比特率的宽带语音。
HFR背后的基本理念是观测到信号的高频率范围的特性与同一信号的低频率范围的特性之间通常存在强相关性。因此,通过从低频率范围至高频率范围的信号换位可以实现对于信号的原始输入高频率范围的表示的良好近似。
在通过引用并入的WO98/57436中,此换位概念建立作为从音频信号的较低频带重建高频带的方法。通过在音频编码和/或语音编码中使用此概念,可以获得比特率的显著节省。下文中,将参考音频编码,但应当注意,所描述的方法和系统同样可应用于语音编码和统一的语音和音频编码(USAC)中。
在基于HFR的音频编码系统中,低带宽信号被提供给用于编码的核心波形编码器,使用附加辅助信息和该低带宽信号的换位在解码器侧再生较高频率,该附加辅助信息通常以非常低的比特率被编码并且描述目标谱形状。对于经核心编码的信号的带宽窄的低比特率,再现或合成具有感知愉悦特性的高频带(即音频信号的高频率范围)变得愈加重要。
谐波HFR方法存在的潜在问题中的一个是,为了获得稳定声音的高质量换位的预期的高频分辨率和系统对于瞬态声音或震音的时间响应的相反的约束。换句话说,虽然使用高频率分辨率对稳定信号的换位有利,但是这样的高频分辨率通常需要大的窗尺寸,而这在处理信号的瞬态部分时是有害的。处理该问题的一个方法可根据输入信号特性例如通过使用窗切换来自适应地改变换位器的窗。典型地,将对信号的稳定部分使用长窗以便实现高频率分辨率,而对于信号的瞬态部分使用短窗以便实现换位器良好的瞬态响应、即良好的时间分辨率。但是,该方法具有的缺点在于,不得不将信号分析措施诸如瞬态检测或类似措施并入换位系统中。这样的信号分析措施常常涉及触发信号处理的切换的判定步骤,例如对瞬态的存在的判定。此外,这样的措施通常影响系统的可靠性,以及当切换信号处理时,例如当在窗尺寸之间切换时,这样的措施可能引入信号伪像。
为了实现改进的音频质量以及为了合成高频带信号的所需带宽,谐波HFR方法通常采用若干换位阶(transposition order)。为了实施具有不同的换位阶的多个换位,现有技术的解决方案在分析级中或在合成级中或在这两个级中需要多个滤波器组。通常,针对各不同的换位阶需要不同的滤波器组。此外,在核心波形编码器以低于最终输出信号的采样率的采样率运行的情况下,通常还需要将核心信号转化为输出信号的采样率,且通常通过添加又一个滤波器组实现核心信号的此上取样。总而言的,计算的复杂度随不同换位阶的增加而显著增大。
本发明解决了上述的与谐波换位的瞬态性能有关的以及与计算复杂度相关的问题。因此,以低的追加的复杂度实现改进的谐波换位。
发明内容
根据一个方面,描述了一种被配置用于从信号的低频分量产生该信号的高频分量的系统。该系统可包括分析滤波器组,该分析滤波器组包括具有频率分辨率Δf的分析变换单元。该分析变换单元可以被配置用于执行例如傅里叶(Fourier)变换、快速傅里叶变换、离散傅里叶变换或小波变换。分析滤波器组还可以包括分析窗,该分析窗具有持续时间DA。分析窗可以具有例如高斯(Gaussian)窗;余弦窗;汉明(Hamming)窗;汉宁(Hann)窗;矩形窗;巴特利特(Bartlett)窗;或勃勒克曼(Blackman)窗的形状。分析滤波器组可以被配置用于从信号的低频分量提供一组分析子带信号。
该系统可包括非线性处理单元,该非线性处理单元被配置用于基于该组分析子带信号的一部分来确定一组合成子带信号,其中通过换位阶T使该组分析子带信号的该部分相移。具体地说,子带信号可以包括复数值,并且相移可包括将复数子带值的相位乘以阶T。
该系统可包括合成滤波器组,该合成滤波器组包括具有频率分辨率QΔf的合成变换单元。合成变换单元可以被配置用于执行与分析变换单元所执行的变换对应的逆变换。此外,合成滤波器组可以包括具有持续时间DS且具有上文列举的形状中的任何一个的合成窗。Q为频率分辨率因子,Q≥1且小于换位阶T。在特定实施方案中,频率分辨率因子选为Q>1。合成滤波器组可以被配置用于从该组合成子带信号产生信号的高频分量。
通常,基于频率分辨率因子Q选择分析滤波器组的频率分辨率Δf与持续时间DA的乘积的值。特别地,乘积ΔfDA可与成比例。在一个实施方案中,乘积ΔfDA的值小于或等于此外,乘积ΔfDA可大于分析滤波器组的乘积ΔfDA的值可等于合成滤波器组的乘积QΔfDs的值。通过根据上述规则中的任何一个选择分析和/或合成滤波器组,可减小或完全去除信号瞬态上的由谐波换位所导致的假象,同时允许谐波换位器的计算复杂度降低。
系统还可以包括第二非线性处理单元,该第二非线性处理单元被配置用于使用第二换位阶T2从该组分析子带信号确定第二组合成子带信号;其中基于该组分析子带信号的一部分确定第二组合成子带信号以及其中通过第二换位阶T2使该组分析子带信号的该部分相移。换位阶T与第二换位阶T2可以不同。系统还可以包括组合单元,该组合单元被配置用于组合该组合成子带信号与该第二组合成子带信号;从而产生组合的一组合成子带信号作为到合成滤波器组的输入。组合单元可被配置用于将来自该组合成子带信号与该第二组合成子带信号的对应子带信号进行相加和/或平均。换句话说,组合单元可被配置用于叠加对应于交叠频率范围的该组合成子带信号和该第二组合成子带信号的合成子带信号。
在一个实施方案中,分析滤波器组可以具有KA个分析子带,KA>1,其中k为分析子带指数,k=0,...,KA-1。合成滤波器组可以具有NS个合成子带,NS>0,其中n为合成子带指数,n=0,...,NS-1。在此情况下,非线性处理单元可以被配置用于从该组分析子带信号的第k个分析子带信号与第k+1个分析子带信号确定该组合成子带信号的第n个合成子带信号。特别地,非线性处理单元可以被配置用于确定第n个合成子带信号的相位为第k个分析子带信号的经移位的相位与第k+1个分析子带信号的经移位的相位之和。此外,非线性处理单元可以被配置用于确定第n个合成子带信号的量值为第k个分析子带信号的经取幂的量值与第k+1个分析子带信号的经取幂(exponentiate)的量值的乘积。
对于具有合成子带指数n的合成子带作贡献(contribution)的分析子带信号的分析子带指数k可以由对表达式截取(truncate)而取得的整数给出;其中余数r可由给出。在此情况下,非线性处理单元可以被配置用于确定第n个合成子带信号的相位为第k个分析子带信号的相位乘以T(1-r)与第k+1个分析子带信号的相位乘以T(r)之和,即通过执行相位的线性内插来进行确定。此外,非线性处理单元可以被配置用于确定第n个合成子带信号的量值为第k个分析子带信号的量值的(1-r)次幂与第k+1个分析子带信号的量值的r次幂的乘积,即通过确定量值的几何平均数进行确定。
分析滤波器组与合成滤波器组可偶堆叠,使得分析子带的中心频率由kΔf给出并且合成子带的中心频率由nQΔf给出。在一个替代实施方案中,分析滤波器组与合成滤波器组可以奇堆叠,使得分析子带的中心频率由给出并且合成子带的中心频率由给出;并且换位阶T与分辨率因子Q之间的差值为偶数。
低频分量的采样率可为fA。分析变换单元可执行离散M点变换。分析窗可以具有LA个样本的长度,和/或分析窗可以通过ΔsA个样本的分析跃距尺寸沿着低频分量移位。在此情况下,分析窗的频率分辨率可由给出,持续时间可由给出,和/或分析滤波器组的物理时间步幅可由给出。
高频分量的采样率可以为fS=QfA。合成变换单元可执行离散M点变换,特别地,其可执行分析变换单元的对应逆变换。合成窗可以具有LS个样本的长度,和/或合成窗可以通过ΔsS个样本的合成跃距尺寸沿着高频分量移位。在此情况下,合成窗的频率分辨率可由给出,持续时间可由给出,和/或合成滤波器组的物理时间步幅可由给出。
根据又一方面,描述了一种使用换位阶T从包括低频分量的输入信号产生包括高频分量的输出信号的系统。该系统可包括分析窗单元,该分析窗单元被配置用于应用长度为LA个样本的分析窗,从而提取输入信号的帧。系统可包括M阶的具有频率分辨率Δf的分析变换单元,该分析变换单元被配置用于将LA个样本变换为M个复数系数。该系统可包括非线性处理单元,该非线性处理单元被配置用于通过使用换位阶T来改变复数系数的相位。相位的改变可包括如本文所述的复数系数的相移。该系统可包括M阶的具有频率分辨率QΔf的分析变换单元,分析变换单元被配置用于将改变的系数变换为M个改变的样本;其中Q为小于换位阶T的频率分辨率因子。此外,该系统可包括合成窗单元,该合成窗单元被配置用于将样本长度Ls的合成窗应用于M个改变的样本,从而产生输出信号的帧。
M可基于频率分辨率因子Q。特别地,M与分析窗和合成窗(612)的平均长度之间的差值可与(Q-1)成比例。在一个实施方案中,M大于或等于(QLA+Ls)/2。此外,M可以小于(TLA+Ls)/2。
根据另一个方面,描述了一种用于从信号的低频分量产生该信号的高频分量的方法。方法可包括使用分析滤波器组从信号的低频分量提供一组分析子带信号的步骤,该分析滤波器组包括具有频率分辨率Δf的分析变换单元和具有持续时间DA的分析窗。此外,该方法可包括基于该组分析子带信号的一部分来确定一组合成子带信号的步骤,其中通过换位阶T使该组分析子带信号的该部分相移。最后,该方法可包括使用合成滤波器组从该组合成子带信号产生信号的高频分量的步骤,该合成滤波器组包括具有频率分辨率QΔf的分析变换单元和具有持续时间DS的分析窗。Q为频率分辨率因子,Q≥1且小于换位阶T。可基于分辨率因子Q选择分析滤波器组的频率分辨率Δf与持续时间DA的乘积的值。
根据又一方面,描述了一种使用换位阶T从包括低频分量的输入信号中产生包括高频分量的输出信号的方法。该方法可包括下列步骤:应用长度为LA个样本的分析窗,从而提取输入信号的帧;以及使用M阶的具有频率分辨率Δf的分析变换将输入信号的LA个样本的帧变换为M个复数系数。此外,该方法可包括使用换位阶T来改变复数系数的相位的步骤。可根据本文所述的方法执行相位的改变。此外,该方法可包括下列步骤:使用M阶的具有频率分辨率QΔf的合成变换将改变的系数变换为M个改变的样本,其中Q为小于换位阶T的频率分辨率因子;以及将长度为Ls个样本的合成窗应用于M个改变的样本,从而产生输出信号的帧。M可基于频率分辨率因子Q。
根据另一个方面,描述了一种用于设计被配置用于从信号的低频分量产生该信号的高频分量的谐波换位器的方法。该方法可包括提供分析滤波器组的步骤,该分析滤波器组包括具有频率分辨率Δf的分析变换单元和具有持续时间DA的分析窗;分析滤波器组被配置用于从信号的低频分量提供一组分析子带信号。此外,该方法可包括提供非线性处理单元的步骤,该非线性处理单元被配置用于基于该组分析子带信号的一部分确定一组合成子带信号,其中通过换位阶T使该组分析子带信号的该部分相移。此外,该方法可包括提供合成滤波器组的步骤,该合成滤波器组包括具有频率分辨率QΔf的合成变换单元和具有持续时间DS的合成窗;合成滤波器组被配置用于从该组合成子带信号产生信号的高频分量;其中Q为频率分辨率因子,Q≥1且小于换位阶T。此外,该方法可包括基于频率分辨率因子Q选择分析滤波器组的频率分辨率Δf与持续时间DA的乘积的值的步骤。
根据另一个方面,描述了一种用于设计被配置用于使用换位阶T从包括低频分量的输入信号产生包括高频分量的输出信号的换位器的方法。该方法可包括下列步骤:提供分析窗单元,该分析窗单元被配置用于应用长度为LA个样本的分析窗,从而提取输入信号的帧;和提供M阶的具有频率分辨率Δf的分析变换单元,该分析变换单元被配置用于将LA个样本变换为M个复数系数。此外,该方法可包括提供非线性处理单元的步骤,该非线性处理单元被配置用于使用换位阶T改变复数系数的相位。此外,该方法可包括下列步骤:提供M阶的具有频率分辨率QΔf的合成变换单元,该合成变换单元被配置用于将改变的系数变换为M个改变的样本;其中Q为小于换位阶T的频率分辨率因子;以及提供合成窗单元,该合成窗单元被配置用于将长度为Ls个样本的合成窗应用于M个改变的样本,从而产生输出信号的帧。最后,该方法可包括基于频率分辨率因子Q选择M的步骤。
应当注意,包括如本专利申请中所概述的优选实施方案的该方法和系统可以独立使用或与本文中所公开的其他方法和系统组合使用。此外,本专利申请所概述的方法和系统的所有方面可任意地组合。特别地,权利要求书的特征可以任意方式互相组合。
附图说明
现在将参考附图,经由说明性的示例在不限制本发明的范围或精神的情况下来描述本发明,其中:
图1图示了示例单阶频域(FD)谐波换位器的操作;
图2图示了使用若干阶的示例谐波换位器的操作;
图3图示了在使用公共的分析滤波器组的同时使用若干换位阶的示例谐波换位器的现有技术操作;
图4图示了在使用公共的合成滤波器组的同时使用若干换位阶的示例谐波换位器的现有技术操作;
图5a图示了在使用公共的分析滤波器组和公共的合成滤波器组的同时使用若干换位阶的示例谐波换位器的操作;
图5b图示了针对根据图5a的多路换位器方案的子带信号的映射的实施例;
图6a图示了使用公共的分析滤波器组和单独的合成滤波器组的阶T=2、3、4的示例多路换位器;
图6b图示了使用公共的分析滤波器组和公共的合成滤波器组的阶T=2、3、4的示例多路换位器;
图7图示了针对根据图6b的多路换位器的子带信号的映射的实施例;
图8图示了当出现在谐波换位器的分析窗和合成窗中时处于特定位置的迪拉克脉冲(Dirac);
图9图示了当出现在谐波换位器的分析窗和合成窗中时处于不同位置的迪拉克脉冲;并且
图10图示了当在使用频域过采样时将出现时针对图9的位置的迪拉克脉冲。
具体实施方式
下述实施方案仅说明用于组合换位滤波器组中过采样的本发明的原理。应当了解,本文所述的布置和细节的修改和变型对于本领域的其他技术人员是明显的。因此,本发明仅受限于随附的专利权利要求书的范围而不受限于作为对本文中的实施方案的描述和说明而提供的具体细节。
图1图示了频域(FD)谐波换位器100的操作。在基本形式中,第T阶谐波转换器是将输入信号的所有信号分量H(f)(即频域中的信号的子带)移位至H(Tf)的单元。即,输入信号的频率分量H(f)移位至T倍的更高频率。为了在频域中实施此换位,分析滤波器组101将输入信号从时域变换到频域,并且输出复合子带或子带信号(也被称作分析子带或分析子带信号)。分析滤波器组通常包括分析变换(例如FFT、DFT或小波变换)和滑动分析窗。分析子带信号被提交到根据所选择的换位阶T修改相位和/或振幅的非线性处理102。通常,非线性处理输出多个子带信号,其数量等于输入子带信号的数量,即等于分析子带信号的数量。修改后的子带或子带信号(也被称作合成子带或合成子带信号)被馈送到合成滤波器组103,该合成滤波器组103将子带信号从频域变换到时域并且输出换位的时域信号。合成滤波器组103通常包括与滑动合成窗组合的逆变换(例如逆FFT、逆DFT或逆小波变换)。
通常,各滤波器组具有按赫兹计的物理频率分辨率Δf和按秒计的物理时间步幅(stride)参数Δt,其中物理频率分辨率Δf通常与变换函数的频率分辨率相关,而物理时间步幅参数Δt通常与连续的窗函数之间的时间间隔相关。这两个参数(即频率分辨率和时间步幅)定义了滤波器组在给定所选择的采样率的情况下的离散时间参数。通过将分析滤波器组和合成滤波组的物理时间步幅参数(即,按时间单位例如秒计的时间步幅参数)选择成相同的,可获得换位器100的输出信号,该输出信号具有与输入信号相同的采样率。此外,通过省略非线性处理102,可以在输出端实现输入信号的完美重建。这需要仔细设计分析滤波器组和合成滤波组。另一方面,如果将输出采样率选择成不同于输入采样率,那么可以获得采样率转换。在输出信号y的所需要的带宽大于输入信号x的采样率的一半的情况下(即,当所需要的输出带宽超过输入信号的奈奎斯特(Nyqvist)频率时),可需要这种操作模式。
图2图示了包括数个不同阶的谐波换位器201-1、...、201-P的多路换位器或多路换位器系统200的操作。待换位的输入信号传递到P个单独的换位器201-1、201-2、...、201-P的组。单独的换位器201-1、201-2、...、201-P如图1的上下文中所述地执行输入信号的谐波换位。通常,各单独的换位器201-1、201-2、...、201-P执行不同换位阶T的谐波换位。举例来说,换位器201-1可执行阶T=1的换位;换位器201-2可执行阶T=2的换位;...;以及换位器201-P可执行阶T=P的换位。但是,总得来说,任一换位器201-1、201-2、...、201-P可执行任意换位阶T的谐波换位。单独的换位器201-1、201-2、...、201-P的贡献(即输出信号)可在组合器202中被合计(sum)以产生组合的换位器输出。
应当注意,各换位器201-1、201-2、...、201-P需要如图1所示的分析滤波器组和合成滤波器组。此外,单独的换位器201-1、201-2、...、201-P的常规实施通常会以不同的量改变经过处理的输入信号的采样率。举例来说,换位器201-P的输出信号的采样率可为到换位器201-P的输入信号的采样率的T倍,其中T是换位器201-P所应用的换位阶。这可能是由于换位器201-P内所使用的带宽扩展系数T导致的,即由于具有为分析滤波器组的T倍的子通道的合成滤波器组的使用所导致的。通过这样做,使采样率和Nyqvist频率增大T倍。所以,需对单独的时域信号进行重取样,以允许在组合器202中组合不同的输出信号。可在各单独的换位器201-1、201-2、...、201-P的输入侧或输出侧执行时域信号的重采样。
图3图示了执行若干阶换位的并且使用公共的分析滤波器组301的多路谐波换位器或多路换位器系统300的示例配置。多路换位器300的设计的起点可为设计图2的单独的换位器201-1、201-2、...、201-P使得所有的换位器201-1、201-2、...、201-P的分析滤波器组(图1的附图标记101)相同并且可由单个分析滤波器组301取代。所以,时域输入信号变换成单组频域子带信号、即单组分析子带信号。这些子带信号被提交给用于不同的换位阶的不同的非线性处理单元302-1、302-2、...、302-P。如在图1的上下文中所述的,各非线性处理单元执行子带信号的相位和/或振幅的修改,并且这种修改对于不同的换位阶不同。随后,被不同地修改的子带信号或子带须提交到对应于不同的非线性处理单元302-1、302-2、...、302-P的不同的合成滤波器组303-1、303-2、...、303-P。作为结果,获得P个被不同地换位的时域输出信号,它们在组合器304中被合计以产生组合换位器输出。
应当注意,如果对应于不同的换位阶的合成滤波器组303-1、303-2、...、303-P例如通过使用不同的带宽扩展程度以不同的采样率操作,那么不同的合成滤波器组303-1、303-2、...、303-P的时域输出信号在组合器304中进行合计之前,需要被不同地重取样以将P个输出信号与一个公共的时间网格对齐。
图4图示了使用若干换位阶且同时使用公共的合成滤波器组404的多路谐波换位器400的示例操作。这种多路换位器400的设计的起点可为设计图2的单独的换位器201-1、201-2、...、201-P使得所有的换位器的合成滤波器组相同且可由单个合成滤波器组404取代。应当注意,以与图3所示情形类似的方式,对于每一换位阶,非线性处理单元402-1、402-2、...、402-P不同。此外,对于不同的换位阶,分析滤波器组401-1、401-2、...、401-P不同。因而,一组P个分析滤波器组401-1、401-2、...、401-P确定P组分析子带信号。这P组分析子带信号被提交给对应非线性处理单元401-1、401-2、...、401-P以产生P组修改的子带信号。这P组子带信号可在组合器403中组合以产生组合的一组子带信号作为单个合成滤波器组404的输入。组合器403中的这种组合可包括将被不同地处理的子带信号馈送到不同的子带范围中和/或将子带信号的对于交叠的子带范围的贡献叠加。换句话说,已用不同的换位阶处理的不同的分析子带信号可覆盖交叠的频率范围。举例来说,二阶换位器可将分析子带[2A,2B]换位到子带范围[4A,4B]。同时,四阶换位器可将分析子带[A,B]换位到同一子带范围[4A,4B]。在此情况下,可通过组合器403将叠加贡献组合,例如相加和/或平均化。从公共的合成滤波器组404中获得多路换位器400的时域输出信号。与上文所述方式类似,如果分析滤波器组401-1、401-2、...、401-P按不同的采样率运行,那么输入不同的分析滤波器组401-1、401-2、...、401-P的时域信号需被重采样以将不同的非线性处理单元402-1、402-2、...、401-P的输出信号与同一时间网格对齐。
图5a图示了使用若干换位阶并且包括单个公共的分析滤波器组501和单个公共的合成滤波器组504的多路谐波换位器500的操作。在此情况下,图2的单独的换位器201-1、201-2、...、201-P应当设计为使得所有P个谐波换位器的分析滤波器组和合成滤波器组都相同。如果满足对于不同的P个谐波换位器分析滤波器组和合成滤波组相同的条件,那么相同的滤波器组可由单个分析滤波器组501和单个合成滤波器组504取代。高级非线性处理单元502-1、502-2、...、502-P输出到部分交叠的频率范围的不同贡献,该不同贡献在组合器503中被组合以产生到合成滤波器组504的对应子带的组合输入。类似于图4所示的多路谐波换位器400,组合器503中的组合可包括将多个非线性处理单元502-1、502-2、...、502-P的不同输入信号馈送到不同的子带范围,并且叠加对于交叠子带范围的多个贡献输出。
如上文所述,非线性处理102通常在其输出处提供对应于输入处的多个子带的多个子带。非线性处理102通常根据潜在(underlying)的换位阶T修改子带或子带信号的相位和/或振幅。举例来说,输入处的子带被转换为输出处的具有T倍的频率的子带,即,非线性处理102的输入处的子带(即,分析子带,)可被换位到非线性处理102的输出处的子带(即,合成子带,),其中k是子带指数(index),而Δf是分析滤波器组的频率分辨率。为了允许使用公共的分析滤波器组501和公共的合成滤波器组504,高级处理单元502-1、502-2、...、502-P中的一个或多个可被配置用于提供与输入子带的数量不同的多个输出子带。
下文中,将概述非线性处理单元502-1、502-2、...、502-P中的高级非线性处理的原理。为此目的,假设:
●分析滤波器组和合成滤波器组共用相同的物理时间步幅参数Δt。
●分析滤波器组具有物理频率分辨率Δf。
●合成滤波器组具有物理频率分辨率QΔf,其中分辨率因子Q≥1是整数。
此外,假设滤波器组被偶堆叠(evenly stacked),即具有指数零的子带以零频率为中心,使得分析滤波器组中心频率由kΔf给出,其中分析子带指数k=1,...,KA-1和KA是分析滤波器组的子带数。合成滤波器组中心频率由kQΔf给定,其中合成子带指数n=1,...,NS-1和NS是合成滤波器组的子带数。
在执行如图1所示的传统整数阶T≥1的换位时,将分辨率因子Q选择成Q=T并且将经过非线性处理的分析子带映射到具有相同指数n=k的合成子带。非线性处理102通常包括将子带或子带信号的相位乘以因子T。即,对于滤波器组子带的各个样本,可写作:
θS(k)=TθA(k), (1)
其中θA(k)是分析子带k的(复数)样本的相位,而θS(k)是合成子带k的(复数)样本的相位。子带的样本的量值(magnitude)或振幅可以保持不变,或可通过常数增益因子增大或减小。由于T是整数,等式(1)的运算独立于相角的定义。
在传统的多路换位器中,将分析滤波器组/合成滤波器组的分辨率因子Q选择成等于对应的换位器的换位阶T,即Q=T。在此情况下,合成滤波器组的频率分辨率是TΔf,所以依赖于换位阶T。所以,在分析级或合成级中,对于不同的换位阶T需使用不同的滤波器组。这是由于以下事实导致的,即换位阶T定义了物理频率分辨率的商(quotient),即分析滤波器组的频率分辨率Δf与合成滤波器组的频率分辨率TΔf的商。
为了能够针对多个不同的换位阶T使用公共的分析滤波器组501和公共的合成滤波器组504,提出将合成滤波器组504的频率分辨率设置成QΔf,即提出使合成滤波器组504的频率分辨率独立于换位阶T。随后,出现如下这样的问题,即当分辨率因子Q(即分析滤波器组与合成滤波组的物理频率分辨率的商Q)无需遵循关系Q=T时如何实施换位阶T。
如上所述,谐波换位的原理是具有中心频率nQΔf的合成滤波器组子带n的输入被从在低T倍的中心频率(即在中心频率nQΔf/T)处的分析子带确定。分析子带的中心频率通过分析子带指数k被标识为kΔf。分析子带指数的中心频率的两个表达式、即nQΔf/T和kΔf可设成相等。考虑到指数n是整数值,表达式是有理数,其可表达为整数分析子带指数k与余数r∈{0,1/T,2/T,...,(T-1)/T}之和,
因而,可规定可以使用换位阶T从具有由等式(2)给出的指数k的分析子带导出到具有合成子带指数n的合成子带的输入。由于是有理数这一事实,余数r可以不等于0,而值k+r可大于分析子带指数k并且小于分析子带指数k+1,即k≤k+r≤k+1。所以,应使用换位阶T从具有分析子带指数k和k+1的分析子带导出到具有合成子带指数n的合成子带的输入,其中k由等式(2)给出。换句话说,合成子带的输入可从两个连续的分析子带中导出。
作为上文的结果,在非线性处理单元502-1、502-2、...、502-P中执行的高级非线性处理可包括下列步骤:考虑具有指数k和k+1的两个相邻分析子带以提供合成子带n的输出。对于换位阶T,由非线性处理单元502-1、502-2、...、502-P所执行的相位修改可例如由线性插值规则定义:
θS(n)=T(1-r)θA(k)+TrθA(k+1), (3)
其中θA(k)是分析子带k的样本的相位;θA(k+1)是分析子带k+1的样本的相位;而θS(n)是合成子带n的样本的相位。如果余数r接近零即如果值k+r接近k,那么合成子带样本的相位的主要成分(contribution)从子带k的分析子带样本的相位导出。另一方面,如果余数r接近1,即如果k+r值接近k+1,那么合成子带样本的相位的主要成分从子带k+1的分析子带样本的相位导出。应当注意,相位乘数T(1-r)和Tr都是整数,使得等式(3)的相位修改含义明确并且独立于相角的定义。
关于子带样本的量值,可选择下列的几何平均值用于确定合成子带样本的量值,
aS(n)=aA(k)(1-r)aA(k+1)r, (4)
其中aS(n)表示合成子带n的样本的量值;aA(k)表示分析子带k的样本的量值;而aA(k+1)表示分析子带k+1的样本的量值。应当注意可考虑相位和/或量值的其他插值规则。
对于分析滤波器组中心频率由给出,k=1,...,KA-1以及合成滤波器组中心频率由给出,n=1,...,NS-1的奇堆叠(oddly stacked)的滤波器组的情况,可通过使换位的合成滤波器组中心频率与分析滤波器组中心频率相等而导出对应于等式(2)的等式。假设整数指数k和余数r∈[0,1[,可导出奇堆叠的滤波器组的下列等式:
技术人员了解如果T-Q(即换位阶与分辨率因子之间的差值)是偶数,那么T(1-r)和Tr都是整数,并且可使用等式(3)和(4)的插值规则。
图5b图示了分析子带到合成子带的映射。图5b示出不同的换位阶T=1至T=4的四个图。各图图示了源频段510即分析子带如何被映射到目标频段530即合成子带。为便于说明,假设分辨率因子Q等于1。换句话说,图5b图示了使用等式(2)和(3)将分析子带信号映射到合成子带信号。在示例中,分析/合成滤波器组偶堆叠,Q=1并且最大换位阶T=4。
在图示的情况中,等式(2)可写作因此,对于换位阶T=1,具有指数k的分析子带被映射到对应合成子带n并且余数r始终为0。图5b中可见此情况,其中例如源频段511被一对一地映射到目标频段531。
在换位阶T=2的情况下,余数r取值为0和1/2,而源频段被映射到多个目标频段。换个角度,可叙述为各个目标频段532、535接收多达两个源频段的贡献。图5b中可见这种情况,其中目标频段535接收来自源频段512和515的贡献。但是,目标频段532只接收来自源频段512的贡献。如果假设目标频段532具有偶数指数n,例如n=10,那么等式(2)规定目标频段532接收来自具有指数k=n/2(例如k=5)的源频段512的贡献。余数r为0,即不存在来自具有指数k+1(例如k+1=6)的源频段515的贡献。对于具有奇数指数n(例如n=11)的目标频段535,此情况不同。在此情况下,等式(2)规定目标频段535接收来自源频段512(指数k=5)和源频段515(指数k+1=6)的贡献。如图5b所示,这类似地适用于更高的换位阶T,例如T=3和T=4。
上述高级非线性处理的进一步说明如下。高级非线性处理可以理解为以给定阶T的到中间频率网格TΔf上的中间子带信号的换位与随后该中间子带信号到由公共的合成滤波器组(即频率网格QΔf)所定义的频率网格的映射的组合。为了图示此说明,再次参考图5b。但是,为了此说明,将源频段510视作使用换位阶T从分析子带导出的中间子带。这些中间子带具有由TΔf给出的频率网格。为了在目标频段530所给出的预定义的频率网格QΔf上产生合成子带信号,源频段510(即具有频率网格TΔf的中间子带)需被映射到预定义的频率网格QΔf上。这可以通过插值一个或两个源频段510(即频率网格TΔf上的中间子带信号)而确定目标频段530(即频率网格QΔf上的合成子带信号)而被执行。在优选实施方案中,使用线性插值,其中插值的权重与目标频段530和对应源频段510的中心频率之间的差值成反比。举例来说,如果差值为0,那么权重为1,而如果差值为TΔf,那么权重为0。
总而言之,已描述非线性处理方法,其使得可通过若干分析子带的换位确定到合成子带的贡献。非线性处理方法使得能够对于不同的换位阶使用单个公共的分析子带滤波器组和合成子带滤波器组,从而大大降低多路谐波换位器的计算复杂度。
图6a和图6b图示了对于多个换位阶T=2,3,4使用M=1024个点的FFT/DFT(快速傅立叶变换或离散傅立叶变换)的示例分析滤波器组/合成滤波器组。图6a图示了对于各换位因子T=2,3,4使用一个公共的分析滤波器组601和单独的合成滤波器组602、603、604的多路谐波换位器600的传统情况。图6a示出分别应用于分析滤波器组601和合成滤波器组602、603、604的分析窗vA611和合成窗vS612、613、614。在示例中,分析窗vA611具有长度LA=1024,其等于分析滤波器组/合成滤波器组601、602、603、604的FFT或DFT的尺寸M。类似地,合成窗vS612、613、614具有等于该FFT或DFT的尺寸M的长度LS=1024。
图6a还分别图示了分析滤波器组601所采用的跃距尺寸(hop size)ΔsA以及合成滤波器组602、603、604所采用的跃距尺寸ΔsS。跃距尺寸Δs对应于各个窗611、612、613、614在连续的变换步骤之间移动通过的数据样本的数量。跃距尺寸Δs经由潜在信号的采样率与物理时间步幅Δt相关,即Δs=fsΔt,其中fs是采样率。
可见,分析窗611移动通过128个样本的跃距尺寸621。对应于换位阶T=2的合成窗612通过移动256个样本的跃距尺寸622(即,为分析窗611的跃距尺寸621两倍的跃距尺寸622)。如上所述,这导致以因子T=2对信号进行时间伸展。可替换地,如果假设T=2倍的采样率,那么分析跃距尺寸621与合成跃距尺寸622之间的差值导致T=2阶的谐波换位。即,可通过执行阶次T的采样率转换将以阶次T的时间伸展转换为谐波换位。
类似地,可见,与T=3阶的谐波换位器相关的合成跃距尺寸623是分析跃距尺寸621的T=3倍,而与T=4的阶谐波换位器相关的合成跃距尺寸624是分析跃距尺寸621的T=4倍。为了将第三阶换位器和第四阶换位器的采样率与第二阶换位器的输出采样率匹配,第三阶换位器和第四阶换位器分别包括因子3/2-下采样器633和因子2-下采样器634。一般来说,如果请求为输入采样率的两倍的输出采样率,那么第T阶换位器可包括因子T/2-下采样器。即,对于T=2阶的谐波换位器无需下采样。
最后,图6a分别图示了用于换位阶T=2、3、4的单独的相位修改单元642、643、644。这些相位修改单元642、643、644分别执行对应子带信号的相位与换位阶T=2、3、4相乘(见等式(1))。
可以通过将图6a的多路换位器限于单个分析滤波器组601和单个合成滤波器组602而获得换位器的高效组合的滤波器组结构。随后如图6b所示,在第二阶滤波器组内的非线性处理单元650中产生第三阶和第四阶谐波。图6b示出分析滤波器组,其包括1024点的正向FFT单元601和具有分析跃距尺寸621的应用在输入信号上的分析窗611。合成滤波器组包括1024点的逆FFT单元602和具有合成跃距尺寸622的被应用的合成窗612。在示例中,合成跃距尺寸622是分析跃距尺寸621的两倍。此外,假设输出信号y的采样率是输入信号x的采样率的两倍。
图6b的分析滤波器组/合成滤波器组包括单个分析滤波器组和单个合成滤波器组。通过使用根据图5a和图5b的上下文中所述的方法的高级非线性处理650(即单元502-1、...、502-P中所执行的高级非线性处理),此分析滤波器组/合成滤波器组可用于提供多路换位器,即针对多个换位阶T的谐波换位器。
如图5a和图5b的上下文中所述,涉及将子带信号的相位乘以对应换位阶T的分析子带到对应合成子带的一对一映射可一般化为涉及一或多个子带信号的插值规则(见等式(3)和(4))。已概述,如果合成滤波器组的物理间隔QΔf是分析滤波器组的物理间隔Δf的Q倍,那么从具有指数k和k+1的分析带中获得具有指数n的合成带的输入。根据滤波器组是偶堆叠或非偶堆叠,指数n和k之间的关系由等式(2)或(5)给出。通过1-r次幂和r次幂应用量值的几何插值(等式(4)),且相位与权重T(1-r)和Tr线性组合(等式(3))。对于Q=2的图示情况,在图7中图示了各换位因子的相位映射。
与图5a所示的Q=1的情况类似,目标子带或目标频段730接收来自多达两个源子带或源频段710的贡献。在T=Q=2的情况中,每一经相位修改的源频段711被分配到对应目标频段7310对于更高的换位阶T>Q,可以从一个对应的经相位修改的源频段715获得目标频段735。这是从等式(2)或(5)中获得的余数r为零的情况。否则,通过对两个经相位修改的源频段712和715进行插值而获得目标频段732。
在多路换位器单元650中执行上述非线性处理,该多路换位器单元650使用高级非线性处理单元502-2、502-3、502-4对于不同的换位阶T=2、3、4确定目标频段730。随后,在组合单元503中组合对应目标频段730以产生单组合成子带信号,该单组合成子带信号被馈送到合成滤波器组。如上所述,组合单元503被配置用于组合来自不同的非线性处理单元502-2、502-3、502-4的输出的在交叠频率范围中的多个贡献。
下文中,概述使用谐波换位器的瞬态信号的谐波换位。在此情况下,应当注意,可将使用分析滤波器组/合成滤波器组的T阶的谐波换位解释为以整数换位因子T对潜在信号进行时间伸展,随后进行下采样和/或采样率转换。执行时间伸展从而保持组成输入信号的正弦曲线的频率。可结合基于换位阶T的子带信号的相位的中间修改使用分析滤波器组/合成滤波器组而执行这种时间伸展。如上所述,分析滤波器组可以是具有分析窗vA的加窗的DFT滤波器组,而合成滤波器组可以是具有合成窗vS的加窗的逆DFT滤波器组。此分析/合成变换也被称作短时傅立叶变换(STFT)。
对时域输入信号x执行短时傅立叶变换以获得一系列交叠的谱帧。为了使可能的边带效应最小化,应当选择适当的分析窗/合成窗,例如高斯窗、余弦窗、汉明窗、汉宁窗(Hann windows)、矩形窗、巴特利特窗(Bartlett windows)、勃勒克曼窗(Blackmanwindows)和其他窗。从输入信号x拾取各谱帧的延时被称作跃距尺寸Δs或物理时间步幅Δt。输入信号x的STFT被称作分析级并且导致输入信号x的频域表示。频域表示包括多个子带信号,其中各个子带信号表示输入信号的特定的频率分量。
为了对输入信号进行时间伸展,可例如通过将子带信号样本延迟来对各个子带信号进行时间伸展。这可通过使用大于分析跃距尺寸的合成跃距尺寸来实现。通过对全部帧执行逆(快速)傅立叶变换,接着以对帧进行相继的累积,可重建时域信号。分析级的此操作被称为交叠相加操作。得到的输出信号是输入信号的时间伸展形式,其包括与输入信号相同的频率分量。换句话说,得到的输出信号具有与输入信号相同的谱组成,但是慢于输入信号,即得到的输出信号的行进(progression)在时间上被延长了。
接着,随后可通过对伸展的信号进行下采样或通过对经时间伸展的输出信号进行采样率转换依次地或者以结合的方式获得到更高频率的换位。因此,经换位的信号具有初始信号的时间长度,但是包括通过预定义的换位因子向上移位的频率分量。
鉴于上述内容,通过作为出发点考虑如下的原型瞬态信号(即,时刻t=t0处的离散时间迪拉克(Dirac)脉冲,描述使用谐波换位器的瞬态信号的谐波换位:
这样的迪拉克脉冲的傅立叶变换具有单位量值和线性相位,该线性相位具有与t0成比例的斜率:
其中是STFT分析的第m个子带信号的中心频率,而M是离散傅立叶变换(DFT)的尺寸。可将这样的傅立叶变换视作上述分析滤波器组的分析级,其中使用无限大持续时间的平的分析窗vA。为了生成以因子T进行时间伸展的输出信号y,即时刻t=Tt0处的迪拉克脉冲δ(t-Tt0),应当将分析子带信号的相位乘以因子T以获得合成子带信号Y(Ωm)=exp(-jΩmTt0),该合成子带信号产生需要的迪拉克脉冲δ(t-Tt0)作为逆傅立叶变换的输出。
但是,应当注意,以上的考虑涉及使用具有无限长长度的分析窗和合成窗的分析级/合成级。实际上,具有无限长持续时间的窗的理论换位器将给出迪拉克脉冲δ(t-t0)的正确伸展。对于有限长持续时间的加窗的分析,该情形被这样的事实扰乱:各分析块要被解释为具有等于DFT的尺寸的周期的周期信号的一个周期间隔。
这在图8中被图示,图8示出迪拉克脉冲δ(t-t0)的分析和合成800。图8的上部示出了到分析级810的输入,而图8的下部示出了合成级820的输出。上部图示和下部图示表示时域。特定类型(stylized)的分析窗811和合成窗821被图示为三角形(巴特利特)窗。时刻t=t0处的输入脉冲δ(t-t0)812在上部图示810上被图示为垂直箭头。假设,DFT变换块具有尺寸M=L=LA=LS,即,将DFT变换的尺寸选择成等于窗的尺寸。子带信号与因子T的相位相乘将产生在t=Tt0处的迪拉克脉冲δ(t-Tt0)的DFT分析,但是,被周期化成具有周期L的迪拉克脉冲序列的迪拉克脉冲。这是由于所应用的窗的有限长长度和傅立叶变换导致的。在下部图上由虚线箭头823、824来图示具有周期L的周期化的脉冲序列。
在现实世界的系统中,脉冲序列实际上仅包含一些脉冲(取决于换位因子):一个主脉冲(即,想要的项),一些前脉冲和一些后脉冲(即,不想要的项)。因为DFT是周期性的(具有L),所以显现前脉冲和后脉冲。当脉冲位于分析窗内,使得复合相位当被乘以T时被卷绕(wrapped)(即,脉冲被移位到窗的末端以外以及卷绕回到开头),合成窗内显现不想要的脉冲。取决于在分析窗中的位置和换位因子,不想要的脉冲可具有或不具有与输入脉冲相同的极性。
在图8的示例中,合成窗使用有限窗vS821。有限合成窗821拾取如实箭头822所图示的在t=Tt0处的需要的脉冲δ(t-Tt0),并且消除如虚箭头823、824所示的其它不想要的贡献。
当分析级和合成级根据跃距因子Δs或时间步幅Δt沿时间轴移动时,脉冲δ(t-t0)812将具有相对于对应分析窗811的中心的另一位置。如上所述,实现时间伸展的操作在于将脉冲812移动到其相对于窗中心的位置的T倍处。只要该位置在窗821内,该时间伸展操作就确保全部贡献总计为在t=Tt0处的单个时间伸展的合成脉冲δ(t-Tt0)。
但是,对于图9的情形发生问题,其中脉冲δ(t-t0)912进一步朝DFT块的边缘更远地向外移动。图9图示了与图8类似的分析配置/合成配置900。上部图示910示出了到分析级和分析窗911的输入,而下部图示920图示了合成级和合成窗921的输出。当通过因子T对输入迪拉克脉冲912进行时间伸展时,经时间伸展的迪拉克脉冲922、即δ(t-Tt0)位于合成窗921外。同时,通过合成窗拾取脉冲序列的另一迪拉克脉冲924,即在时刻t=Tt0-L处的δ(t-Tt0+L)。换句话说,输入迪拉克脉冲912没有被延迟到晚T倍的时刻,而是向前移动到位于输入迪拉克脉冲912之前的时刻。对音频信号的最终影响是在相当长的换位器窗的标度的时间距离处,即在比输入迪拉克脉冲912早L-(T-1)t0的时刻t=Tt0-L处发生前回波。
参考图10描述该问题的解决方案的原理。图10图示了与图9类似的分析/合成情况1000。上部图示1010示出了到具有分析窗1011的分析级的输入,而下部图示1020示出了具有合成窗1021的合成级的输出。调整DFT尺寸从而避免前回波。这可通过以下方式来实现:设置DFT的尺寸M,使得合成窗不拾取来自结果脉冲序列的不想要的迪拉克脉冲图像。将DFT变换1001的尺寸增到M=FL,其中L是窗函数1002的长度,而因子F是频域过采样因子。换句话说,将DFT变换1001的尺寸选择成大于窗尺寸1002。特别地,可将DFT变换1001的尺寸选择成大于合成窗的窗尺寸1002。由于DFT变换的增加的长度1001,包括迪拉克脉冲1022、1024的脉冲序列的周期是FL。通过选择具有足够大的值的F,即通过选择足够大的频域过采样因子,可消除对于脉冲伸展的不想要的贡献。这在图10中被示出,其中在时刻t=Tt0-FL处的迪拉克脉冲1024位于合成窗1021外。所以,迪拉克脉冲1024不被合成窗1021拾取,因此可避免前回波。
应当注意,在优选实施方案中,合成窗和分析窗具有相等的“标称”长度(按样本数量计)。但是,当通过在变换或滤波器组的频带中丢弃或插入样本来使用对输出信号的隐含重采样时,取决于重采样和/或换位因子,合成窗尺寸(按样本数量计)通常将不同于分析尺寸。
可从图10推导F的最小值,即最小的频域过采样因子。可如下地阐述不拾取不希望的迪拉克脉冲图像的条件:对于在位置处的任何输入脉冲δ(t-t0),即对于包括在分析窗1011内的任何输入脉冲,在时刻t=Tt0-FL处的不希望的图像δ(t-Tt0+FL)必须位于在处的合成窗的左边缘的左边。等价地,必须满足条件其得到规则:
如从公式(6)可见,最小的频域过采样因子F是换位阶T的函数。更具体地,最小的频域过采样因子F与换位阶T成比例。
通过针对分析窗和合成窗具有不同长度的情况重复以上思路,获得更通用的公式。分别用LA和LS表示分析窗的长度和合成窗的长度(以样本数量计),并且用M表示所采用的DFT尺寸。则,对公式(6)进行扩展所得的通用规则为:
通过将M=FL、和LA=LS=L代入到(7)中、以及在所得到的等式的两边除以L,可验证该规则实际上是(6)的扩展。
针对相当特殊的瞬态模型、即迪拉克脉冲来执行上述分析。但是,可将该推论扩展以示出当使用上述时间伸展和/或谐波换位方案时,具有接近于平的谱包络和在时间区间[a,b]外消失的输入信号将被伸展成在区间[Ta,Tb]外小的输出信号。其也可通过研究真实音频和/或语音信号的频谱图而被验证,其中,当遵守上述用于选择适当的频域过采样因子的规则时,在伸展或换位的信号中前回波消失。更定量的分析还揭示:当使用稍微劣于由公式(6)或(7)的条件限定的值的频域过采样因子时,仍然减少前回波。这是由于以下事实:典型的窗函数vS在其边缘附近是小的,从而衰减位于窗函数的边缘附近的不希望的前回波。
总之,通过引入其中过采样的量是所选择的换位因子的函数的过采样的变换,描述了改进频域谐波换位器或时间伸展器的瞬态响应的方式。通过频域过采样获得换位器的改进的瞬态响应。
在图6的多路换位器中,可通过使用长度1024F的DFT核601、602、603、604以及通过对称于该长度对分析窗和合成窗进行零填充(zero padding)来实施频域过采样。应当注意,出于复杂度的原因,保持低过采样量有利。如果将公式(6)应用于图6的多路换位器,那么应当应用过采样因子F=2.5以覆盖所有换位因子T=2、3、4。但是,可以表明,使用F=2.0已导致真实音频信号的显著质量改进。
下文,描述在例如图5a或图6b的上下文中所述的在组合分析滤波器组/合成滤波器组的上下文中的频域过采样的使用。
通常,对于其中合成滤波器组子带的物理间隔QΔf是分析滤波器组的物理间隔Δf的Q倍并且物理分析窗持续时间DA(按时间单位计,例如按秒计)也是合成滤波器组的持续时间的Q倍DA=QDS的组合换位滤波器组,如上所述的迪拉克脉冲的分析可应用于所有换位因子T=Q,Q+1,Q+2,...,如同T=Q一样。换句话说,组合换位滤波器组中所需的频域过采样的程度的规则由下式给出
特别地,应当注意,对于T>Q,频域过采样因子足够,且同时仍确保对T阶的谐波换位所导致的瞬态信号上的伪像的抑制。即,使用组合滤波器组的上述过采样规则,可见即使当使用更高换位阶T>Q时,仍无需进一步增大过采样因子F。如等式(6b)所示,为了避免前回波的发生,在图6b的组合滤波器组实现中使用过采样因子F=1.5是足够的。这个值低于图6的多路换位器所需的过采样因子F=2.5。因此,当使用组合分析滤波器组/合成滤波器组(而不是用于不同的换位阶的单独的分析滤波器组和/或合成滤波器组)时,可进一步减小为了提高多路谐波换位器的瞬态性能而执行频域过采样的复杂度。
在更一般的情况下,可分别任意地选择分析窗和合成窗DA和DS的物理时间持续时间。然后,分析滤波器组子带的物理间隔Δf应当满足
以避免所述的由谐波换位所导致的伪像。应当注意,窗的持续时间D通常不同于窗的长度L。窗的长度L对应于窗所覆盖的信号样本的数量,而窗的持续时间D对应于窗所覆盖的信号的时间间隔。如图6a所示,窗611、612、613、614具有相同长度L=1024个样本。但是分析窗611的持续时间DA是合成窗612、613、614的持续时间DS的T倍,其中T是对应合成滤波器组的对应换位阶和分辨率因子。类似地,图6b中的分析窗611的持续时间DA是合成窗612的持续时间DS的Q倍,其中Q是该合成滤波器组的分辨率因子。窗的持续时间D经由采样频率fs与窗的长度L相关,即,特别地类似地,变换的频率分辨率Δf经由采样频率fs与变换的点数或长度M相关,即,特别地此外,滤波器组的物理时间步幅Δt经由采样频率fs与滤波器组的跃距尺寸Δs相关,即,特别地
使用上述关系,等式(6b)可写作:
即,分析滤波器组的频率分辨率与窗长度的乘积和/或合成滤波器组的频率分辨率与窗长度的乘积应被选择成小于或等于对于T>Q,可将乘积ΔfDA和/或QΔfDs选择成大于从而减小滤波器组的计算复杂度。
在本文献中,已描述了用于执行信号(优选为音频和/或语音信号)的谐波换位的多种方法。已尤其关注多路谐波换位器的计算复杂度上。在此情况下,描述了如下这样的多路换位器,该多路换位器被配置用于使用组合分析/合成滤波器组、即包括单个分析滤波器组和单个合成滤波器组的滤波器组执行多阶换位。与传统多路换位器相比,使用组合分析/合成滤波器组的多路换位器的计算复杂度减小。此外,已在组合分析/合成滤波器组的上下文中描述频域过采样。频域过采样可用于减少或去除由谐波换位导致的瞬态信号上的伪像。已表明与传统多路换位器实现相比,可在组合分析/合成滤波器组内以减小的计算复杂度实施频域过采样。
虽然本文描述了本发明的特定实施方案和本发明的应用,但是本领域一般技术人员应明了,在不脱离本文所述以及通过权利要求保护的本发明的范围的情况下,可存在本文所述的实施方案和应用的许多变型。应当了解,虽然已示出和描述本发明的若干形式,但是本发明不限于所描述和示出的特定实施方案或所描述的特定方法。
本文所述的方法和系统可实现为软件、固件和/或硬件。一些组件可例如实现为在数字信号处理器或微处理器上运行的软件。其他组件可例如实现为硬件和/或专用集成电路。在所描述的方法和系统中遇到的信号可存储在诸如随机存取存储器或光存储介质的介质上。可经由诸如无线电网络、卫星网络、无线网络或有线网络的网络来传输信号,例如经由因特网来传输信号。使用本文中所描述的方法的典型装置是例如对音频信号进行解码的媒体播放器或机顶盒。在编码侧,该系统和方法可用于例如广播站和多媒体制作地点。

Claims (13)

1.一种用于对于包括低频分量的音频信号产生高频分量的系统,包括:
-分析窗单元,用于对音频信号应用长度为LA个样本的分析窗(611);
-M阶的分析变换单元(601),具有频率分辨率Δf,用于将LA个样本变换为M个复数系数;
-非线性处理单元(643、644、650),用于通过使用换位阶T来改变复数系数的相位;
-M阶的合成变换单元(602),具有频率分辨率QΔf,用于将经改变的系数变换为M个改变的时域样本,其中Q为小于或等于所述换位阶T的频率分辨率因子;以及
-合成窗单元,用于将长度为LS个样本的合成窗(612)应用于所述M个改变的时域样本;
其中变换阶M基于所述频率分辨率因子Q。
2.根据权利要求1所述的系统,其中变换阶M为:M=F·LS并且其中其中F是频域过采样因子。
3.根据权利要求2所述的系统,其中
4.根据权利要求1-3中的任一项所述的系统,其中变换阶M满足:
5.根据权利要求1-3中的任一项所述的系统,其中
-所述分析变换单元(601)执行傅立叶变换、快速傅立叶变换、离散傅立叶变换、小波变换中的一个;并且
-所述合成变换单元(602)执行相应的逆变换。
6.根据权利要求1-3中的任一项所述的系统,其中所述分析窗(611)和/或合成窗(612)是下列中的一个:
-高斯窗;
-余弦窗;
-汉明窗;
-汉宁窗;
-矩形窗;
-巴特利特窗;
-勃勒克曼窗。
7.根据权利要求1-3中的任一项所述的系统,进一步包括:
-第二非线性处理单元(502),用于通过使用第二换位阶T2改变所述复数系数的相位,其中所述换位阶T和所述第二换位阶T2不同;以及
-组合单元(503),其被配置用于组合通过所述换位阶T和所述第二换位阶T2改变的复数系数,作为所述合成变换单元(602)的输入。
8.根据权利要求7所述的系统,其中:
-所述组合单元(503)被配置用于叠加对应于交叠频率范围的通过所述换位阶T和所述第二换位阶T2改变的复数系数。
9.根据权利要求1-3中的任一项所述的系统,其中:
-所述音频信号的采样率为fA
-所述分析窗(611)沿着所述音频信号移位ΔsA个样本的分析跃距尺寸;
-所述分析变换单元(601)的频率分辨率为
-分析窗(611)的持续时间为
-分析窗(611)的物理时间步幅为
10.根据权利要求9所述的系统,其中:
-所述高频分量的采样率为fS=QfA
-所述合成窗(612)沿着所述高频分量移位ΔsS个样本的合成跃距尺寸;
-所述合成变换单元(602)的频率分辨率为
-所述合成窗(612)的持续时间为以及
-所述合成窗(612)的物理时间步幅为
11.根据权利要求1-3中的任一项所述的系统,其中所述系统被用于统一的语音和音频编码或解码。
12.一种对于包括低频分量的音频信号产生高频分量的方法,所述方法包括:
-对音频信号应用长度为LA个样本的分析窗(611);
-使用M阶的频率分辨率为Δf的分析变换将LA个样本变换为M个复数系数;
-通过使用换位阶T改变所述复数系数的相位;
-使用M阶的频率分辨率为QΔf的合成变换将经改变的系数变换为M个改变的时域样本,其中Q为小于或等于所述换位阶T的频率分辨率因子;以及
-将长度为LS个样本的合成窗(612)应用于所述M个改变的时域样本;
其中变换阶M基于所述频率分辨率因子Q。
13.一种用于设计用于对于包括低频分量的音频信号产生高频分量的换位器的方法,所述方法包括:
-提供分析窗单元,所述分析窗单元用于对音频信号应用长度为LA个样本的分析窗(611);
-提供M阶的具有频率分辨率Δf的分析变换单元(601),所述分析变换单元(601)用于将LA个样本变换为M个复数系数;
-提供非线性处理单元(643、644、650),所述非线性处理单元(643,644,650)用于通过使用换位阶T改变所述复数系数的相位;
-提供M阶的具有频率分辨率QΔf的合成变换单元(602),所述合成变换单元(602)用于将经改变的系数变换为M个改变的时域样本,其中Q为小于或等于所述换位阶T的频率分辨率因子;
-提供合成窗单元,所述合成窗单元用于将长度为LS个样本的合成窗(612)应用于所述M个改变的时域样本;和
-基于所述频率分辨率因子Q来选择变换阶M。
CN201310423103.4A 2009-10-21 2010-05-25 组合换位滤波器组的过采样 Active CN103559889B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US25377509P 2009-10-21 2009-10-21
US61/253,775 2009-10-21
US33078610P 2010-05-03 2010-05-03
US61/330,786 2010-05-03
CN2010800434072A CN102576541B (zh) 2009-10-21 2010-05-25 组合换位滤波器组的过采样

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN2010800434072A Division CN102576541B (zh) 2009-10-21 2010-05-25 组合换位滤波器组的过采样

Publications (2)

Publication Number Publication Date
CN103559889A CN103559889A (zh) 2014-02-05
CN103559889B true CN103559889B (zh) 2017-05-24

Family

ID=42542966

Family Applications (3)

Application Number Title Priority Date Filing Date
CN2010800434072A Active CN102576541B (zh) 2009-10-21 2010-05-25 组合换位滤波器组的过采样
CN201310423105.3A Active CN103559890B (zh) 2009-10-21 2010-05-25 组合换位滤波器组的过采样
CN201310423103.4A Active CN103559889B (zh) 2009-10-21 2010-05-25 组合换位滤波器组的过采样

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CN2010800434072A Active CN102576541B (zh) 2009-10-21 2010-05-25 组合换位滤波器组的过采样
CN201310423105.3A Active CN103559890B (zh) 2009-10-21 2010-05-25 组合换位滤波器组的过采样

Country Status (11)

Country Link
US (8) US8886346B2 (zh)
EP (7) EP4276823A3 (zh)
JP (3) JP5345737B2 (zh)
KR (1) KR101309671B1 (zh)
CN (3) CN102576541B (zh)
BR (2) BR112012009375B1 (zh)
ES (6) ES2805349T3 (zh)
HK (2) HK1168189A1 (zh)
PL (5) PL3723090T3 (zh)
RU (1) RU2494478C1 (zh)
WO (1) WO2011047887A1 (zh)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7928310B2 (en) * 2002-11-12 2011-04-19 MediaLab Solutions Inc. Systems and methods for portable audio synthesis
EP4231291B1 (en) * 2008-12-15 2023-11-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio bandwidth extension decoder, corresponding method and computer program
US8971551B2 (en) 2009-09-18 2015-03-03 Dolby International Ab Virtual bass synthesis using harmonic transposition
ES2805349T3 (es) * 2009-10-21 2021-02-11 Dolby Int Ab Sobremuestreo en un banco de filtros de reemisor combinado
JP5649084B2 (ja) * 2010-03-09 2015-01-07 フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. 再生速度またはピッチを変更する際にオーディオ信号における過渡音声事象を処理するための装置および方法
WO2011110494A1 (en) * 2010-03-09 2011-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Improved magnitude response and temporal alignment in phase vocoder based bandwidth extension for audio signals
KR101414736B1 (ko) 2010-03-09 2014-08-06 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 캐스케이드 필터뱅크들을 이용한 입력 오디오 신호를 처리하는 장치 및 방법
CN102947882B (zh) * 2010-04-16 2015-06-17 弗劳恩霍夫应用研究促进协会 使用制导带宽扩展和盲带宽扩展生成宽带信号的装置、方法
US8958510B1 (en) * 2010-06-10 2015-02-17 Fredric J. Harris Selectable bandwidth filter
KR102026677B1 (ko) 2010-07-19 2019-09-30 돌비 인터네셔널 에이비 고주파 복원 동안 오디오 신호들의 프로세싱
JP6155274B2 (ja) 2011-11-11 2017-06-28 ドルビー・インターナショナル・アーベー 過剰サンプリングされたsbrを使ったアップサンプリング
EP2717261A1 (en) * 2012-10-05 2014-04-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding
US9494035B2 (en) 2012-11-06 2016-11-15 Evolution Engineering Inc. Fluid pressure pulse generator and method of using same
US9714569B2 (en) 2012-12-17 2017-07-25 Evolution Engineering Inc. Mud pulse telemetry apparatus with a pressure transducer and method of operating same
US10753201B2 (en) 2012-12-17 2020-08-25 Evolution Engineering Inc. Mud pulse telemetry apparatus with a pressure transducer and method of operating same
WO2014094150A1 (en) 2012-12-17 2014-06-26 Evolution Engineering Inc. Downhole telemetry signal modulation using pressure pulses of multiple pulse heights
EP2830056A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain
FR3011408A1 (fr) * 2013-09-30 2015-04-03 Orange Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard
US9577798B1 (en) * 2014-04-30 2017-02-21 Keysight Technologies, Inc. Real-time separation of signal components in spectrum analyzer
US9306606B2 (en) * 2014-06-10 2016-04-05 The Boeing Company Nonlinear filtering using polyphase filter banks
CA2895681A1 (en) 2014-06-27 2015-12-27 Evolution Engineering Inc. Fluid pressure pulse generator for a downhole telemetry tool
CA2895680A1 (en) 2014-06-27 2015-12-27 Evolution Engineering Inc. Fluid pressure pulse generator for a downhole telemetry tool
US9670774B2 (en) 2014-06-27 2017-06-06 Evolution Engineering Inc. Fluid pressure pulse generator for a downhole telemetry tool
EP2980791A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US9704497B2 (en) * 2015-07-06 2017-07-11 Apple Inc. Method and system of audio power reduction and thermal mitigation using psychoacoustic techniques
CN107919136B (zh) * 2017-11-13 2021-07-09 河海大学 一种基于高斯混合模型的数字语音采样频率估计方法
DE102018206159B3 (de) * 2018-04-20 2019-09-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Paket-Detektor/Decoder für ein Funkübertragungssystem
IL310202A (en) * 2018-04-25 2024-03-01 Dolby Int Ab Combining high-frequency audio reconstruction techniques
US11322127B2 (en) * 2019-07-17 2022-05-03 Silencer Devices, LLC. Noise cancellation with improved frequency resolution
US11889280B2 (en) * 2021-10-05 2024-01-30 Cirrus Logic Inc. Filters and filter chains

Family Cites Families (137)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4060848A (en) * 1970-12-28 1977-11-29 Gilbert Peter Hyatt Electronic calculator system having audio messages for operator interaction
US4016540A (en) * 1970-12-28 1977-04-05 Gilbert Peter Hyatt Apparatus and method for providing interactive audio communication
JPS5237465B2 (zh) 1973-03-28 1977-09-22
US4395700A (en) * 1980-08-15 1983-07-26 Environmental Research Institute Of Michigan Image analyzer with variable line storage
FR2628918B1 (fr) * 1988-03-15 1990-08-10 France Etat Dispositif annuleur d'echo a filtrage en sous-bandes de frequence
US5297236A (en) * 1989-01-27 1994-03-22 Dolby Laboratories Licensing Corporation Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder
US5357594A (en) * 1989-01-27 1994-10-18 Dolby Laboratories Licensing Corporation Encoding and decoding using specially designed pairs of analysis and synthesis windows
EP0428156B1 (en) * 1989-11-14 1996-08-21 Nec Corporation Adaptive transform coding by selecting optimum block lengths according to variations between successive blocks
US5408580A (en) * 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
US5732389A (en) * 1995-06-07 1998-03-24 Lucent Technologies Inc. Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures
US5890106A (en) * 1996-03-19 1999-03-30 Dolby Laboratories Licensing Corporation Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation
US6073100A (en) * 1997-03-31 2000-06-06 Goodridge, Jr.; Alan G Method and apparatus for synthesizing signals using transform-domain match-output extension
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
RU2256293C2 (ru) * 1997-06-10 2005-07-10 Коудинг Технолоджиз Аб Усовершенствование исходного кодирования с использованием дублирования спектральной полосы
US6026356A (en) * 1997-07-03 2000-02-15 Nortel Networks Corporation Methods and devices for noise conditioning signals representative of audio information in compressed and digitized form
JP3164038B2 (ja) * 1997-11-05 2001-05-08 日本電気株式会社 音声帯域分割復号装置
US6449590B1 (en) * 1998-08-24 2002-09-10 Conexant Systems, Inc. Speech encoder using warping in long term preprocessing
US6493665B1 (en) * 1998-08-24 2002-12-10 Conexant Systems, Inc. Speech classification and parameter weighting used in codebook search
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6363338B1 (en) * 1999-04-12 2002-03-26 Dolby Laboratories Licensing Corporation Quantization in perceptual audio coders with compensation for synthesis filter noise spreading
US6246345B1 (en) * 1999-04-16 2001-06-12 Dolby Laboratories Licensing Corporation Using gain-adaptive quantization and non-uniform symbol lengths for improved audio coding
US6298322B1 (en) * 1999-05-06 2001-10-02 Eric Lindemann Encoding and synthesis of tonal audio signals using dominant sinusoids and a vector-quantized residual tonal signal
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
DE10030583A1 (de) * 2000-06-21 2002-01-10 Marconi Comm Gmbh Vorrichtung und Verfahren zum Verarbeiten von Frequenzsignalen
US20020016698A1 (en) * 2000-06-26 2002-02-07 Toshimichi Tokuda Device and method for audio frequency range expansion
SE0004818D0 (sv) * 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US6900381B2 (en) * 2001-05-16 2005-05-31 Telefonaktiebolaget Lm Ericsson (Publ) Method for removing aliasing in wave table based synthesizers
DE60118800T2 (de) * 2001-06-08 2007-04-26 Stmicroelectronics Asia Pacific Pte Ltd. Einheitsfilterbank zur Audiocodierung
EP1421579B1 (en) * 2001-08-21 2006-04-05 Koninklijke Philips Electronics N.V. Audio coding with non-uniform filter bank
EP1440432B1 (en) * 2001-11-02 2005-05-04 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device
FI20012313A (fi) * 2001-11-26 2003-05-27 Genelec Oy Menetelmä matalataajuista ääntä muokkaavan modaalisen ekvalisaattorin suunnittelemiseksi
AU2002352182A1 (en) * 2001-11-29 2003-06-10 Coding Technologies Ab Methods for improving high frequency reconstruction
US7146313B2 (en) * 2001-12-14 2006-12-05 Microsoft Corporation Techniques for measurement of perceptual audio quality
US20030138117A1 (en) * 2002-01-22 2003-07-24 Goff Eugene F. System and method for the automated detection, identification and reduction of multi-channel acoustical feedback
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
FI20020865A (fi) * 2002-05-07 2003-11-08 Genelec Oy Menetelmä matalataajuisen modaalisen ekvalisaattorin suunnittelemiseksi erityisesti lähekkäin sijaitsevia moodeja varten
CA2388352A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
JP4649208B2 (ja) * 2002-07-16 2011-03-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオコーディング
BRPI0311601B8 (pt) * 2002-07-19 2018-02-14 Matsushita Electric Ind Co Ltd "aparelho e método decodificador de áudio"
JP3881943B2 (ja) * 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
JP3879922B2 (ja) * 2002-09-12 2007-02-14 ソニー株式会社 信号処理システム、信号処理装置および方法、記録媒体、並びにプログラム
EP1543307B1 (en) 2002-09-19 2006-02-22 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and method
US7248711B2 (en) 2003-03-06 2007-07-24 Phonak Ag Method for frequency transposition and use of the method in a hearing device and a communication device
JP4076887B2 (ja) * 2003-03-24 2008-04-16 ローランド株式会社 ボコーダ装置
DE10328777A1 (de) * 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
US20050018796A1 (en) * 2003-07-07 2005-01-27 Sande Ravindra Kumar Method of combining an analysis filter bank following a synthesis filter bank and structure therefor
FI118550B (fi) * 2003-07-14 2007-12-14 Nokia Corp Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä
EP1507334A1 (fr) * 2003-08-12 2005-02-16 STMicroelectronics S.A. Composant électronique permettant notamment le décodage de signaux modulés par une modulation numérique en quadrature sur un grand nombre de porteuses orthogonales
KR20050027179A (ko) * 2003-09-13 2005-03-18 삼성전자주식회사 오디오 데이터 복원 방법 및 그 장치
US7519538B2 (en) * 2003-10-30 2009-04-14 Koninklijke Philips Electronics N.V. Audio signal encoding or decoding
KR20050064442A (ko) * 2003-12-23 2005-06-29 삼성전자주식회사 이동통신 시스템에서 입체음향 신호 생성 장치 및 방법
CN1910656B (zh) * 2004-01-20 2010-11-03 杜比实验室特许公司 基于块分组的音频编码
US6980933B2 (en) * 2004-01-27 2005-12-27 Dolby Laboratories Licensing Corporation Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
CN1662100B (zh) * 2004-02-24 2010-12-08 三洋电机株式会社 低音强调电路以及低音强调处理方法
ATE527654T1 (de) * 2004-03-01 2011-10-15 Dolby Lab Licensing Corp Mehrkanal-audiodecodierung
US7587254B2 (en) * 2004-04-23 2009-09-08 Nokia Corporation Dynamic range control and equalization of digital audio using warped processing
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
FR2875351A1 (fr) * 2004-09-16 2006-03-17 France Telecom Procede de traitement de donnees par passage entre domaines differents de sous-bandes
US7937271B2 (en) * 2004-09-17 2011-05-03 Digital Rise Technology Co., Ltd. Audio decoding using variable-length codebook application ranges
US7630902B2 (en) * 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
JP4580210B2 (ja) * 2004-10-19 2010-11-10 ソニー株式会社 音声信号処理装置および音声信号処理方法
CN101061533B (zh) * 2004-10-26 2011-05-18 松下电器产业株式会社 语音编码装置和语音编码方法
WO2006049205A1 (ja) * 2004-11-05 2006-05-11 Matsushita Electric Industrial Co., Ltd. スケーラブル復号化装置およびスケーラブル符号化装置
KR100657916B1 (ko) * 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
US20070147518A1 (en) * 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
CA2603246C (en) * 2005-04-01 2012-07-17 Qualcomm Incorporated Systems, methods, and apparatus for anti-sparseness filtering
KR100818268B1 (ko) * 2005-04-14 2008-04-02 삼성전자주식회사 오디오 데이터 부호화 및 복호화 장치와 방법
EP1722360B1 (en) * 2005-05-13 2014-03-19 Harman Becker Automotive Systems GmbH Audio enhancement system and method
EP1742509B1 (en) * 2005-07-08 2013-08-14 Oticon A/S A system and method for eliminating feedback and noise in a hearing device
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
US7197453B2 (en) * 2005-07-29 2007-03-27 Texas Instruments Incorporated System and method for optimizing the operation of an oversampled discrete Fourier transform filter bank
JP4701931B2 (ja) 2005-09-02 2011-06-15 日本電気株式会社 信号処理の方法及び装置並びにコンピュータプログラム
US20070083377A1 (en) * 2005-10-12 2007-04-12 Steven Trautmann Time scale modification of audio using bark bands
CN101288117B (zh) * 2005-10-12 2014-07-16 三星电子株式会社 对音频数据和扩展数据进行编码/解码的方法和设备
US8326638B2 (en) * 2005-11-04 2012-12-04 Nokia Corporation Audio compression
US7774396B2 (en) * 2005-11-18 2010-08-10 Dynamic Hearing Pty Ltd Method and device for low delay processing
KR100717058B1 (ko) * 2005-11-28 2007-05-14 삼성전자주식회사 고주파 성분 복원 방법 및 그 장치
CN101356573B (zh) * 2006-01-09 2012-01-25 诺基亚公司 对双耳音频信号的解码的控制
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
FR2897977A1 (fr) * 2006-02-28 2007-08-31 France Telecom Procede de limitation de gain d'excitation adaptative dans un decodeur audio
US8920343B2 (en) * 2006-03-23 2014-12-30 Michael Edward Sabatino Apparatus for acquiring and processing of physiological auditory signals
US20070299655A1 (en) * 2006-06-22 2007-12-27 Nokia Corporation Method, Apparatus and Computer Program Product for Providing Low Frequency Expansion of Speech
US7876904B2 (en) * 2006-07-08 2011-01-25 Nokia Corporation Dynamic decoding of binaural audio signals
WO2008035949A1 (en) * 2006-09-22 2008-03-27 Samsung Electronics Co., Ltd. Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
EP2958106B1 (en) * 2006-10-11 2018-07-18 The Nielsen Company (US), LLC Methods and apparatus for embedding codes in compressed audio data streams
CN101163240A (zh) * 2006-10-13 2008-04-16 国际商业机器公司 一种滤波装置及其方法
US8126721B2 (en) * 2006-10-18 2012-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US7647229B2 (en) * 2006-10-18 2010-01-12 Nokia Corporation Time scaling of multi-channel audio signals
US8041578B2 (en) * 2006-10-18 2011-10-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US7953595B2 (en) * 2006-10-18 2011-05-31 Polycom, Inc. Dual-transform coding of audio signals
PL2109098T3 (pl) * 2006-10-25 2021-03-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie i sposób do generowania próbek audio w dziedzinie czasu
JPWO2008053970A1 (ja) * 2006-11-02 2010-02-25 パナソニック株式会社 音声符号化装置、音声復号化装置、およびこれらの方法
US7756350B2 (en) * 2006-11-13 2010-07-13 Global Ip Solutions, Inc. Lossless encoding and decoding of digital data
US20080243518A1 (en) * 2006-11-16 2008-10-02 Alexey Oraevsky System And Method For Compressing And Reconstructing Audio Files
JP5103880B2 (ja) * 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
JP4967618B2 (ja) * 2006-11-24 2012-07-04 富士通株式会社 復号化装置および復号化方法
EP2096632A4 (en) * 2006-11-29 2012-06-27 Panasonic Corp DECODING DEVICE AND AUDIO DECODING METHOD
KR101377135B1 (ko) * 2007-01-02 2014-03-21 삼성전자주식회사 오디오 신호의 저주파 및 중주파 성분 보강 방법 및 그장치
SG144752A1 (en) * 2007-01-12 2008-08-28 Sony Corp Audio enhancement method and system
JP4708446B2 (ja) * 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
JP4984983B2 (ja) * 2007-03-09 2012-07-25 富士通株式会社 符号化装置および符号化方法
GB0710211D0 (en) * 2007-05-29 2007-07-11 Intrasonics Ltd AMR Spectrography
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
EP2015293A1 (en) * 2007-06-14 2009-01-14 Deutsche Thomson OHG Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
EP2026597B1 (en) * 2007-08-13 2009-11-11 Harman Becker Automotive Systems GmbH Noise reduction by combined beamforming and post-filtering
US7522074B2 (en) * 2007-09-17 2009-04-21 Samplify Systems, Inc. Enhanced control for compression and decompression of sampled signals
EP2192415A4 (en) * 2007-09-20 2013-03-20 Nat Univ Corp Univ Toyama SIGNAL ANALYSIS METHOD, SIGNAL ANALYSIS DEVICE, AND SIGNAL ANALYSIS PROGRAM
KR101373004B1 (ko) * 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
US8515767B2 (en) * 2007-11-04 2013-08-20 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs
ATE456908T1 (de) * 2007-11-12 2010-02-15 Harman Becker Automotive Sys Mischung von ersten und zweiten tonsignalen
US8600740B2 (en) * 2008-01-28 2013-12-03 Qualcomm Incorporated Systems, methods and apparatus for context descriptor transmission
KR101413967B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치
US8000487B2 (en) * 2008-03-06 2011-08-16 Starkey Laboratories, Inc. Frequency translation by high-frequency spectral envelope warping in hearing assistance devices
US8060042B2 (en) * 2008-05-23 2011-11-15 Lg Electronics Inc. Method and an apparatus for processing an audio signal
KR20100008749A (ko) * 2008-07-16 2010-01-26 삼성전자주식회사 스위칭 파워 증폭 장치 및 그 제어 방법
JP4818335B2 (ja) * 2008-08-29 2011-11-16 株式会社東芝 信号帯域拡張装置
US8532983B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
EP2224433B1 (en) * 2008-09-25 2020-05-27 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
EP4231291B1 (en) * 2008-12-15 2023-11-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio bandwidth extension decoder, corresponding method and computer program
CN101430882B (zh) * 2008-12-22 2012-11-28 无锡中星微电子有限公司 一种抑制风噪声的方法及装置
BR122019023684B1 (pt) * 2009-01-16 2020-05-05 Dolby Int Ab sistema para gerar um componente de frequência alta de um sinal de áudio e método para realizar reconstrução de frequência alta de um componente de frequência alta
EP2380363B1 (en) * 2009-01-20 2015-09-30 MED-EL Elektromedizinische Geräte GmbH High accuracy tonotopic and periodic coding with enhanced harmonic resolution
EP3246919B1 (en) * 2009-01-28 2020-08-26 Dolby International AB Improved harmonic transposition
PL3751570T3 (pl) * 2009-01-28 2022-03-07 Dolby International Ab Ulepszona transpozycja harmonicznych
US8526650B2 (en) * 2009-05-06 2013-09-03 Starkey Laboratories, Inc. Frequency translation by high-frequency spectral envelope warping in hearing assistance devices
US8971551B2 (en) * 2009-09-18 2015-03-03 Dolby International Ab Virtual bass synthesis using harmonic transposition
TWI484481B (zh) * 2009-05-27 2015-05-11 杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
CA2763793C (en) * 2009-06-23 2017-05-09 Voiceage Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain
CA2862715C (en) * 2009-10-20 2017-10-17 Ralf Geiger Multi-mode audio codec and celp coding adapted therefore
MY166169A (en) * 2009-10-20 2018-06-07 Fraunhofer Ges Forschung Audio signal encoder,audio signal decoder,method for encoding or decoding an audio signal using an aliasing-cancellation
ES2805349T3 (es) * 2009-10-21 2021-02-11 Dolby Int Ab Sobremuestreo en un banco de filtros de reemisor combinado
KR101341115B1 (ko) * 2009-10-21 2013-12-13 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 적응식 오버샘플링을 사용하는 고주파수 오디오 신호를 발생시키기 위한 장치 및 방법
CN102667920B (zh) * 2009-12-16 2014-03-12 杜比国际公司 Sbr比特流参数缩混

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A HARMONIC BANDWIDTH EXTENSION METHOD FOR AUDIO CODECS;FREDERIK NAGEL ET AL.;《Audio Engineering Society Convention Paper 7711,at the 126th CONVENTION》;20090510;全文 *
A HARMONIC BANDWIDTH EXTENSION METHOD FOR AUDIO CODECS;Frederik Nagel et al;《IEEE International Conference on Acoustics, Speech and Signal Processing, 2009》;20090424;全文 *

Also Published As

Publication number Publication date
CN103559889A (zh) 2014-02-05
HK1168189A1 (zh) 2012-12-21
CN102576541B (zh) 2013-09-18
EP3291231B1 (en) 2020-06-10
PL3291231T3 (pl) 2020-09-21
US9830928B2 (en) 2017-11-28
EP3723090A1 (en) 2020-10-14
PL2800094T3 (pl) 2018-03-30
PL4152320T3 (pl) 2024-02-19
ES2936307T3 (es) 2023-03-16
EP4152320B1 (en) 2023-10-18
PL3998606T3 (pl) 2023-03-06
CN102576541A (zh) 2012-07-11
PL3723090T3 (pl) 2022-03-21
US20190119753A1 (en) 2019-04-25
US20150058025A1 (en) 2015-02-26
US20160275965A1 (en) 2016-09-22
US11591657B2 (en) 2023-02-28
KR101309671B1 (ko) 2013-09-23
EP3723090B1 (en) 2021-12-15
EP4276823A3 (en) 2023-12-20
JP5613802B2 (ja) 2014-10-29
EP2491557B1 (en) 2014-07-30
US10186280B2 (en) 2019-01-22
KR20120054083A (ko) 2012-05-29
HK1198561A1 (zh) 2015-05-15
US20200270696A1 (en) 2020-08-27
US20230160015A1 (en) 2023-05-25
US20120195442A1 (en) 2012-08-02
ES2963061T3 (es) 2024-03-25
BR112012009375A2 (pt) 2016-06-07
CN103559890A (zh) 2014-02-05
EP4276823A2 (en) 2023-11-15
WO2011047887A8 (en) 2011-06-23
ES2507165T3 (es) 2014-10-14
US10947594B2 (en) 2021-03-16
BR112012009375B1 (pt) 2020-09-24
EP3998606B1 (en) 2022-11-02
EP2800094B1 (en) 2017-11-22
US8886346B2 (en) 2014-11-11
ES2656668T3 (es) 2018-02-28
EP4152320A1 (en) 2023-03-22
ES2805349T3 (es) 2021-02-11
JP5345737B2 (ja) 2013-11-20
JP5950974B2 (ja) 2016-07-13
JP2013257591A (ja) 2013-12-26
EP2491557A1 (en) 2012-08-29
US9384750B2 (en) 2016-07-05
BR122020007866B1 (pt) 2021-06-01
ES2906085T3 (es) 2022-04-13
EP3998606B8 (en) 2022-12-07
CN103559890B (zh) 2017-05-24
EP3998606A1 (en) 2022-05-18
JP2013506148A (ja) 2013-02-21
EP2800094A1 (en) 2014-11-05
US20180047411A1 (en) 2018-02-15
RU2494478C1 (ru) 2013-09-27
US20210269880A1 (en) 2021-09-02
EP3291231A1 (en) 2018-03-07
US10584386B2 (en) 2020-03-10
WO2011047887A1 (en) 2011-04-28
JP2015018273A (ja) 2015-01-29

Similar Documents

Publication Publication Date Title
CN103559889B (zh) 组合换位滤波器组的过采样
KR102020334B1 (ko) 고조파 전위에 기초하여 개선된 서브밴드 블록
AU2015203065A1 (en) Improved subband block based harmonic transposition

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant