CN104851429A - 叉积增强的基于子带块的谐波换位 - Google Patents
叉积增强的基于子带块的谐波换位 Download PDFInfo
- Publication number
- CN104851429A CN104851429A CN201510245547.2A CN201510245547A CN104851429A CN 104851429 A CN104851429 A CN 104851429A CN 201510245547 A CN201510245547 A CN 201510245547A CN 104851429 A CN104851429 A CN 104851429A
- Authority
- CN
- China
- Prior art keywords
- subband
- signal
- frame
- sample
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000017105 transposition Effects 0.000 title claims abstract description 112
- 238000012545 processing Methods 0.000 claims abstract description 138
- 238000004458 analytical method Methods 0.000 claims abstract description 122
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 71
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 64
- 239000000523 sample Substances 0.000 claims description 183
- 238000000034 method Methods 0.000 claims description 91
- 230000000875 corresponding effect Effects 0.000 claims description 59
- 238000000605 extraction Methods 0.000 claims description 33
- 238000005070 sampling Methods 0.000 claims description 31
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims description 21
- FEPMHVLSLDOMQC-UHFFFAOYSA-N virginiamycin-S1 Natural products CC1OC(=O)C(C=2C=CC=CC=2)NC(=O)C2CC(=O)CCN2C(=O)C(CC=2C=CC=CC=2)N(C)C(=O)C2CCCN2C(=O)C(CC)NC(=O)C1NC(=O)C1=NC=CC=C1O FEPMHVLSLDOMQC-UHFFFAOYSA-N 0.000 claims description 21
- 238000011144 upstream manufacturing Methods 0.000 claims description 6
- 230000002596 correlated effect Effects 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 238000004886 process control Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 4
- 238000012986 modification Methods 0.000 abstract description 3
- 230000004048 modification Effects 0.000 abstract description 3
- 230000008569 process Effects 0.000 description 32
- 230000006870 function Effects 0.000 description 17
- 238000001228 spectrum Methods 0.000 description 14
- 238000012937 correction Methods 0.000 description 13
- 238000013461 design Methods 0.000 description 10
- 238000011161 development Methods 0.000 description 7
- 210000001747 pupil Anatomy 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- RVRCFVVLDHTFFA-UHFFFAOYSA-N heptasodium;tungsten;nonatriacontahydrate Chemical compound O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[W].[W].[W].[W].[W].[W].[W].[W].[W].[W].[W] RVRCFVVLDHTFFA-UHFFFAOYSA-N 0.000 description 5
- 238000002156 mixing Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000002349 favourable effect Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000001172 regenerating effect Effects 0.000 description 3
- 238000007493 shaping process Methods 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 210000000162 simple eye Anatomy 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000004304 visual acuity Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/3089—Control of digital or coded signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Superconductors And Manufacturing Methods Therefor (AREA)
- Golf Clubs (AREA)
- Vibration Dampers (AREA)
- Complex Calculations (AREA)
- Selective Calling Equipment (AREA)
Abstract
本发明提供一种叉积增强高频重建(HFR)的高效实现,其中,基于Ω和Ω+Ω0处的现有分量生成频率QΩ+rΩ0处的新分量。本发明提供一种基于块的谐波换位,其中,使用公共相位修正来处理复子带样本的时间块。若干经修正的样本的叠加具有限制不期望的互调制乘积的净效应,因此使得能够使用粗频率分辨率和/或较低程度的过采样。在一种实施方式中,本发明还包括适合于与基于块的叉积增强HFR使用的窗口函数。本发明的硬件实施方式可以包括分析滤波器组(101)、可由控制数据(104)配置的子带处理单元(102)和合成滤波器组(103)。
Description
本申请是申请日为2011年9月5日、申请号为“201180044307.6”、发明名称为“叉积增强的基于子带块的谐波换位”的发明专利申请的分案申请。
技术领域
本发明涉及使用用于高频重建(HFR)的谐波换位方法的音频源编码系统,数字效果处理器如生成谐波失真以向所处理的信号添加亮度的激励器,以及用所维护的频谱内容来延长信号持续时间的时间拉伸器。
背景技术
在WO98/57436中,将换位的概念建立为根据音频信号的较低频带重建高频带的方法。通过在音频编码中使用该概念,可以获得比特率的实质性节省。在基于HFR的音频编码系统中,向核心波形编码器呈现低带宽信号,并且在解码器侧使用换位和描述目标频谱形状的非常低的比特率的附加侧信息来重新生成较高的频率。对于核心编码信号的带宽窄的低比特率,重建具有感知上舒适的特性的高带变得越来越重要。在WO98/57436中定义的谐波换位在具有低交叉频率的情形下对于合成音乐材料表现很好。谐波换位的原则是,将频率为ω的正弦波映射到频率为的正弦波,其中是定义换位的阶次的整数。与此相反,基于单边带调制(SSB)的HFR将频率为ω的正弦波映射到频率为ω+Δω的正弦波,其中Δω是固定频移。给定具有低带宽的核心信号,由于SSB换位会产生不协调的振铃假声(ringing artifact)。
为了达到可能的最优音频质量,目前发展水平的高质量的谐波HFR方法使用非常精细频率分辨率和高度过采样的复调制滤波器组来达到所需的音频质量。需要精细分辨率以避免由正弦波之和的非线性处理而引起的不希望的互调制失真。使用足够窄的子带,高质量的方法的目的在于在每个子带中最多具有一个正弦波。为了避免混杂类失真(alias typedistortion),需要时间上的高度过采样,而为了避免瞬态信号的前回声,需要频率上的一定程度的过采样。明显的缺点是计算复杂度变得非常高。
对于具有显著的周期性结构的信号,与谐波换位器相关联的另一常见的缺点变得明显。这些信号为频率为Ω,2Ω,3Ω的谐波相关的正弦波的叠加,其中Ω为基频。根据阶次的谐波换位,在的情况下,具有频率的输出正弦波仅是期望的全谐波序列的严格子集。在所得到的音频质量方面,通常可以感知到与换位的基频相对应的“鬼影”音调。通常,谐波换位产生编码音频信号和解码音频信号的“金属”声音特性。
在通过引用合并到本文中的WO 2010/081892中,开发出了叉积方法以在高质量换位情况下解决上述鬼影音调问题。假定关于要换位的信号的主要的谐波部分的基频值的部分信息或所发送的完全信息具有较高的保真度,使用至少两个不同的分析子带的非线性组合来补充非线性子带修正,其中分析子带索引之间的间距与基频相关。结果是在经换位的输出中重新生成丢失的部分,然而这需要相当大的计算代价。
发明内容
鉴于现有的HFR方法的上述缺点。本发明的目的是提供叉积增强的HFR的更高效的实现。具体地,目的是提供这样的方法:使得与现有技术相比,能够以减少的计算工作量再现高保真度音频。
本发明通过提供如在独立权利要求中所阐述的装置和方法来实现这些目的中的至少一个。
在第一方面,本发明提供了一种被配置成根据输入信号来生成时间拉伸和/或频率换位信号的系统。该系统包括:
●分析滤波器组,被配置成根据输入信号得到数量Y个分析子带信号,其中,每个分析子带信号包括多个复值分析样本,每个复值分析样本具有相位和幅值;
●子带处理单元,被配置成使用子带换位因数Q和子带拉伸因数S,根据Y个分析子带信号来确定合成子带信号,Q和S中的至少一个大于1,其中,该子带处理单元包括:
○块提取器,被配置成:
■i)形成L个输入样本的Y个帧,每帧被从分析子带信号中的所述多个复值分析样本中提取并且帧长度L>1;以及
■ii)在形成L个输入样本的后续帧之前,对所述多个分析样本应用h个样本的块跳跃大小,由此生成输入样本的一系列帧;
○非线性帧处理单元,被配置成通过确定帧的每个经处理的样本的相位和幅值,基于由块提取器形成的输入样本的Y个相应帧来生成经处理的样本的帧,其中,对于至少一个经处理的样本:
■i)经处理的样本的相位基于输入样本的Y个帧中的每个帧中的相应输入样本的各自的相位;以及
■ii)经处理的样本的幅值基于输入样本的Y个帧中的每个帧中的相应输入样本的幅值;
以及
○重叠及相加单元,被配置成通过将经处理的样本的一系列帧的样本进行重叠及相加来确定合成子带信号;以及
●合成滤波器组,被配置成根据合成子带信号来生成时间拉伸信号和/或频率换位信号。
该系统可以用于Y的任何正整数值。然而,其至少可用于Y=2。
在第二方面,本发明提供一种用于根据输入信号来生成时间拉伸和/或频率换位信号的方法。该方法包括:
●根据输入信号得到数量Y≥2个分析子带信号,其中,每个分析子带信号包括多个复值分析样本,每个复值分析样本具有相位和幅值;
●形成L个输入样本的Y个帧,每个帧被从分析子带信号中的所述多个复值分析样本中提取并且帧长度L>1;
●在得到L个输入样本的后续帧之前,对所述多个分析样本应用h个样本的块跳跃大小,由此生成输入样本的一系列帧;
●通过确定帧的每个经处理的样本的相位和幅值,基于输入样本的Y个相应帧来生成经处理的样本的帧,其中,对于至少一个经处理的样本:
○经处理的样本的相位基于输入样本的Y个帧中至少一个帧中的相应输入样本的各自的相位;以及
○经处理的样本的幅值基于输入样本的Y个帧中的每个帧中的相应输入样本的幅值;
●通过将经处理的样本的一系列帧的样本进行重叠及相加来确定合成子带信号;以及
●根据合成子带信号来生成时间拉伸信号和/或频率换位信号。
在本文中,Y为大于1的任意整数。根据第一方面的系统可用于执行至少针对Y=2的方法。
本发明的第三方面提供一种包括存储用于使可编程计算机执行根据第二方面的方法的软件指令的计算机可读介质(或数据载体)的计算机程序产品。
本发明基于当数据被处理成以复子带样本的块布置时叉积增强的HFR的一般概念将提供改进的结果的实现。尤其,这使得可以对样本应用逐帧(frame-wise)相位偏移,这已经被发现在一些情形下减小互调制乘积。还可以应用幅值调整,这可以产生类似的有利的效果。叉积增强的HFR的发明实现包括可以显著减小互调制乘积的基于子带块的谐波换位。因此,可以使用具有粗频率分辨率和/或较低程度的过采样的滤波器组(例如,QMF滤波器组)而同时保持高的输出质量。在基于子带块的处理中,使用常见的相位修正处理复子带样本的时间块,并且形成输出子带样本的若干经修正的样本的叠加具有抑制互调制乘积的净效应(neteffect),当输入子带信号由若干正弦波组成时,这将以其他方式出现。以以基于块的子带处理为基础的换位与高分辨率换位器相比具有低得多的计算复杂度并且对于很多信号几乎达到相同的质量。
出于本公开内容的目的,指出在其中Y≥2的实施方式中,非线性处理单元在帧为同步或近似同步的意义上使用输入样本的Y个“相应”帧作为输入。例如,各自帧中的样本可以与具有帧之间的实质时间重叠的时间间隔有关。关于样本,也使用术语“相应”表示这些样本是同步的或近似同步的。此外,术语“帧”将与“块”可交换地使用。因此,“块跳跃大小”可以等于帧长度(如果应用下采样,则可能关于下采样被调整)或可以小于帧长度(如果应用下采样,则了能关于下采样被调整),在这种情况下,在输入样本可以属于多于一个帧的意义上,连续的帧重叠。该系统不必须通过基于输入样本的所有的Y个相应帧的相位和幅值确定其相位和幅值,来生成帧中的每个经处理的样本;在不偏离本发明的情况下,该系统可以生成基于较小数量的相应输入样本或仅基于一个输入样本来生成一些经处理的样本的相位和/或幅值。
在一种实施方式中,分析滤波器组为具有任意数量的抽头和点的正交镜像滤波器(QMF)或伪QMF组。例如,可以是64点QMF组。分析滤波器组还可以选自加窗离散傅立叶变换或者小波变换类别。有利地,合成滤波器组通过分别为逆QMF组、逆伪QMF组等来与分析滤波器组匹配。已知这样的滤波器组可以具有相对粗频率分辨率和/或相对低程度过采样。与现有技术不同,使用相对简单的部件而不必须遭受降低的输出质量;因此,这样的实施方式比现有技术表现出经济优势。
在一种实施方式中,下面的一项或更多项符合分析滤波器组:
●分析时间跨步为ΔtA;
●分析频率间隔为ΔfA;
●分析滤波器组包括由分析子带索引n=0,...,N-1指示的N>1个分析子带;
●分析子带与输入信号的频带相关联。
在一种实施方式中,下面的一项或更多项符合合成滤波器组:
●合成时间跨步为ΔtS;
●合成频率间隔为ΔfS;
●合成滤波器组包括由合成子带索引m=0,...,M-1指示的M>1个合成子带;
●合成子带与经时间拉伸和/或频率换位的信号的频带相关联。
在一种实施方式中,非线性帧处理单元适合于输入两个帧(Y=2)以生成经处理的样本的一个帧,并且子带处理单元包括用于生成交叉处理控制数据的交叉处理控制单元。因此,通过指定子带处理的数量和/或质量特性,本发明获得灵活性和适应性。控制数据可以通过输入信号的基频来指定频率不同的子带(例如,由索引标识的子带)。换言之,标识子带的索引可以相差近似于由分析频率间隔划分的基频的比率的整数。因为由谐波换位生成的新的频谱内容可以与自然的谐波序列兼容,所以这可以产生心理声学上舒适的输出。
在前述的实施方式的进一步的发展中,选择(输入)分析和(输出)合成子带索引以满足下面的方程式(16)。在该方程式中出现的参数σ使得可适用于成偶数或奇数地堆叠的滤波器组。当获得的子带索引作为方程式(16)的近似(例如,最小二乘)解时,由谐波换位获得的新的频谱成分将有可能与自然的谐波的序列兼容。因此,HFR将有可能提供已经将其高频内容去除的原始信号的可靠的重建。
前述实施方式的进一步的发展提供一种选择出现在方程式(16)中并且表示叉积换位的阶次的参数r的方法。给定输出子带索引m,换位阶次r的每个值将确定两个分析子带索引n1、n2。进一步的发展估算针对数量r个选项的两个子带的幅值并且选择给出使两个分析子带幅值的最小值最大化的值。该选择索引的方法可以通过放大输入信号的弱分量来避免存储足够的幅值的必要,弱分量可以导致差的输出质量。关于这一点,可以以本身已知的方式计算子带幅值,例如,通过计算形成帧(块)或帧的一部分的输入样本的平方的平方根。也可以计算子带幅值作为帧中的中心样本或近似中心样本的幅值。这样的计算可以提供简单又精确的幅值测量。
在前述的实施方式的进一步的发展中,合成子带可以接收来自根据直接处理和基于叉积的处理两者的谐波换位示例的贡献。在这一点上,可以应用确定标准来确定是否要使用通过基于叉积的处理重新生成丢失的部分的具体可能性。例如,该进一步的发展适合于如果下面的情况中的一种情况满足则制止使用一个交叉子带处理单元,这些情况为:
a)产生合成子带的直接源项分析子带的幅值MS与产生合成子带的交叉源项的最优对中的最小的幅值Mc的比率大于预定的常数;
b)分析子带已经接收来自直接处理单元的显著的贡献;
c)基频Ω0小于分析滤波器组间隔ΔfA。
在一种实施方式中,本发明包括输入信号的下采样(抽取)。实际上,因为可能受块提取器的影响,可以通过对子带中的复值分析样本进行下采样来确定输入样本的帧中的一个或更多个帧。
在前述的实施方式的进一步的发展中,要应用的下采样因数满足下面的方程式(15)。不是两个下采样因数均被允许为0,因为这对应于不重要的情况。方程式(15)定义下采样因数D1、D2与子带拉伸因数S和子带换位因数Q以及与在用于确定经处理的样本的相位的方程式(13)中出现的相位系数T1、T2之间的关系。这确保经处理的样本的相位与输入信号的其他的分量匹配,经处理的样本被添加至该输入信号。
在一种实施方式中,经处理的样本的帧在他们被重叠和相加到一起之前被加窗。加窗单元可以适合于对经处理的样本的帧应用有限长度窗口函数。在所附权利要求中列举了适当的窗口函数。
发明人已经认识到在WO 2010/081892中公开的类型的叉积方法从一开始就不完全与基于子带块的处理技术兼容。尽管这样的方法可以令人满意地被应用于块中的子带样本之一,如果以直接的方式扩展到块的其他的样本,可能导致混杂假象。为此,一种实施方式对实质性常数序列应用包括当由复权重进行加权和由跳跃大小进行偏移时相加在一起的窗口样本的窗口函数。跳跃大小可以是块跳跃大小h与子带拉伸因数S的乘积。这样的窗口函数的应用可以降低混杂假象的影响。可替代地或附加地,这样的窗口函数也可以允许其他的用于降低假象的手段,例如经处理的样本的相位旋转。
优选地,被应用于估算关于窗口样本的条件的连续的复权重仅相差固定的相位旋转。更优选地,所述固定的相位旋转与输入信号的基频成比例。相位旋转还可以与要应用的叉积换位的阶次和/或与物理相位参数和/或与下采样因数的差和/或与分析时间拉伸成比例。至少以近似的意义,相位旋转可以由方程式(21)给出。
在一种实施方式中,本发明通过响应于基频参数来修正合成加窗来使能叉积增强的谐波换位。
在一种实施方式中,经处理的样本的连续的帧以一定的重叠被相加。为了实现适当的重叠,通过作为由子带拉伸因数S放大的块跳跃大小h将经处理的帧中的帧适当地偏移。因此,如果输入样本的连续帧的重叠为L-h,那么经处理的样本的连续的帧的重叠可以为S(L-h)。
在一种实施方式中,根据本发明的系统不仅可以基于Y=2个输入样本来生成经处理的样本,还可以仅基于Y=1个样本。因此,该系统可以不仅通过基于叉积的方法(例如,通过方程式(13))还通过直接子带方法(例如,通过方程式(5)或(11))重新生成丢失的部分。优选地,控制单元被配置成控制系统的操作,包括要用于重新生成特定丢失部分的方法。
在前述的实施方式的进一步的发展中,该系统还适合于基于多于三个样本即Y≥3来生成经处理的样本。例如,经处理的样本可以通过可贡献于经处理的样本的基于叉积的谐波换位的大量实例,通过直接子带处理的多个实例或通过叉积换位与直接换位的组合来获得。适合换位方法的选项提供强大的和通用的HFR。因此,该实施方式可以用于执行根据本发明的第二方面的针对Y=3、4、5等的方法。
一种实施方式被配置成将经处理的样本作为具有作为相应输入样本的各自的幅值的平均值的幅值的复数。该平均值可以是两个或更多个输入信号的(加权)算法、(加权)几何或(加权)谐波平均值。在Y=2的情况下,平均基于两个复输入样本。优选地,经处理的样本的幅值为加权几何值。更优选地,该几何值如在方程式(13)中由参数ρ和1-ρ加权。在本文中,几何幅值加权参数ρ是与子带换位因数Q成反比的实数。该参数ρ还可以与拉伸因数S成反比。
在一种实施方式中,系统适用于将经处理的样本确定为相位是作为输入样本的帧中的相应的输入样本的各自的相位的线性组合的复数。特别地,线性组合可以包括与两个输入样本(Y=2)有关的相位。两个相位的线性组合可以应用整数非零系数,系数的总和等于拉伸系数S乘以子带换位因数Q。可选地,由这样的线性组合获得的相位进一步由固定的校正参数调整。经处理的样本的相位可以由方程式(13)给出。
在一种实施方式中,块提取器(或根据本发明的方法中的模拟步骤)适合于从分析子带信号插值(interpolate)两个或更多个分析样本以获得将包括在帧(块)中的一个输入样本。这样的插值可以使得能够通过非整数因子进行输入信号的下混合。要插值的分析样本可以是连续的或不连续的。
在一种实施方式中,子带处理的配置可以由从影响处理的单元之外提供的控制数据控制。控制数据可以与输入信号的瞬间声学性质有关。例如,系统本身可以包括适用于确定信号的瞬间声学性质的部件,例如,信号的(主要的)基频。基频的知识提供在选择要从其得到经处理的样本的分析子带方面的指导。适当地,分析子带的间隔与输入信号的这样的基频成比例。作为替选的,控制数据也可以优选地通过被包括在以适合于传送作为数字通信网络上的位流的编码格式中而从系统之外被提供。除了控制数据之外,该编码格式可以包括与信号的低频分量(例如,图7中的位置701处的分量)有关的信号。然而,出于带宽经济的利益的考虑,该格式优选地不包括与高频分量(位置702)有关的完整信息,该完整信息可以由本发明重新生成。本发明可以特别地提供具有控制数据接收单元的解码系统,该控制数据接收单元被配置成接收无论是否包括在接收的位流中的这样的控制数据并且还对输入信号或接收的作为分离的信号或位流进行解码。
一种实施方式提供一种用于高效地执行由本发明方法引起的计算的技术。为此,硬件实现可以包括预归一化器。用于重新缩放经处理样本的帧所要基于的Y个帧中的一些帧中的相应输入信号的幅值。在这样的重新缩放之后,经处理的样本可以被计算为重新缩放后的以及可能地非重新缩放的输入样本的(加权)复乘积。表现为乘积中的重新缩放的因数的输入样本通常不需要重新表现为非重新缩放的因数。对于相位校正参数θ的可能的例外,可以估算方程式(13)作为(可能重新缩放的)复输入样本的乘积。这表示与经处理的样本的幅值和相位的单独处理相比的计算优势。
在一种实施方式中,被配置成针对Y=2的情况的系统包括适合于在并行操作中各自形成输入样本的一个帧的两个块提取器。
在表示Y≥3的实施方式的进一步的发展中,系统可以包括多个子带处理单元,每个子带处理单元被配置成使用不同的子带换位因数和/或不同的子带拉伸因数和/或根据基于叉积或直接而不同的换位方法来确定中间合成子带信号。子带处理单元可以被并行地布置以用于并行操作。在该实施方式中,系统还可以包括被布置在子带处理单元的下游和合成滤波器组的上游的合并单元。该合并单元可以适用于将相应中间合成子带信号合并(例如,通过混合在一起)以获得的合成子带信号。如已经指出的,被合并的中间合成子带可以已经由直接的和基于叉积的谐波换位获得。根据该实施方式的系统还可以包括用于将位流解码至输入信号的核心解码器。还可以包括适用于显著地通过执行频谱成形来应用谱带信息的HFR处理单元。HFR处理单元的操作可以由在位流中编码的信息控制。
一种实施方式提供例如用于以包括Z个通道(例如,左、右、中心、环绕等)的立体格式再现音频的系统中的多维信号的HFR。在用于使用多个通道处理输入信号的一种可能的实现中,每个通道的经处理的样本基于相同数量的输入样本,尽管关于每个带的拉伸因数S和换位因数Q可以在通道之间变化。为此,该实现可以包括用于从每个通道产生Y分析子带信号的分析滤波器组、用于生成Z个子带信号的子带处理单元和用于生成形成输出信号的Z个时间拉伸和/或频率换位信号的合成滤波器组。
在前述实施方式的变化中,输出信号可以包括基于不同数量的分析子带信号的输出通道。例如,可能可取的是对声学显著的通道的HFR贡献较大量的计算资源;例如,可以相比于环绕或后面的通道偏好要由位于听者前面的声源再现的通道。
要强调的是,本发明涉及上述的特征的所有的组合,即使这些特征被记载在不同的权利要求中。
附图说明
现在将参照附图,通过不限制本发明的范围或精神的说明性示例来描述本发明。
图1示出了基于子带块的谐波换位的原理。
图2示出了具有一个子带输入的非线性子带块处理的操作。
图3示出了具有两个子带输入的非线性子带块处理的操作。
图4示出了叉积增强的基于子带块的谐波换位的操作。
图5示出了在HFR增强的音频编解码器中使用若干阶次的换位的基于子带块的换位的应用的示例场景。
图6示出了应用64带QMF分析滤波器组的多阶基于子带块的换位的操作的示例场景。
图7和图8示出了所描述的基于子带块的换位方法的实验结果。
图9示出了图2的非线性处理单元的细节,包括预归一化器和乘法器。
具体实施方式
下面所描述的实施方式仅说明本发明——叉积增强的基于子带块的谐波换位——的原理。应当理解的是,本文所描述的布置和细节的修改和变化对于本领域的其他技术人员是明显的。因此,其意图是,本发明仅由所附专利权利要求的范围所限制,而不是由通过本文的实施方式的描述和说明所呈现的具体细节所限制。
图1示出了基于子带块的换位、时间拉伸或者换位和时间拉伸的组合的原理。将输入的时域信号馈送到提供大量复值子带信号的分析滤波器组101。将这些子带信号馈送到子带处理单元102,控制数据104可以影响子带处理单元102操作。可以通过一个输入子带或两个输入子带的处理,或者甚至通过对若干这种经处理的子带的结果的叠加来获得每个输出子带。将大量复值输出子带馈送到合成滤波器组103,合成滤波器组103继而输出经修改的时域信号。可选的控制数据104描述子带处理的配置和参数,该配置和参数可以适合于要被换位的信号。对于叉积增强的换位的情况,该数据可以携带关于主要基频的信息。
图2示出了具有一个子带输入的非线性子带块的操作。给定物理时间拉伸和换位的目标值以及分析滤波器组101和合成滤波器组103的物理参数,针对每个目标子带索引推导出子带时间拉伸参数和换位参数以及源子带索引。然后子带处理的目的是实现复值源子带信号的相应换位、时间拉伸或者换位和时间拉伸的组合,以生成目标子带信号。
块提取器201对来自复值输入信号的样本的有限帧进行采样。帧由输入指针位置和子带换位因数定义。该帧在处理部件202中经过非线性处理,随后由加窗部件203中的有限且可能可变长度的窗口进行加窗。将产生的样本与重叠及相加单元204中的先前输出的样本相加,其中输出帧位置由输出指针位置定义。将输入指针增大固定量,并且将输出指针增大相同量的子带拉伸因数倍。该操作链的迭代将产生输出信号,该输出信号的持续时间是输入子带信号的持续时间的子带拉伸因数倍,上至合成窗口的长度,并且复频率以子带换位因数换位。控制信号104可以影响三个部件201、202、203中的每个。
图3示出了具有两个子带输入的非线性子带块处理的操作。给定物理时间拉伸和换位的目标值以及分析滤波器组101和合成滤波器组103的物理参数,针对每个目标子带索引推导出子带时间拉伸和换位参数以及两个源子带索引。在非线性子带块处理要用于通过叉积相加来产生丢失的部分的情况下,部件301-1、301-2、302、303的配置以及两个源子带索引的值可以取决于交叉处理控制单元404的输出403。子带块处理的目的是实现两个复值源子带信号的组合的相应换位、时间拉伸、或换位和时间拉伸的组合,以产生目标子带信号。第一块提取器301-1对来自第一复值源子带的样本的有限时间帧进行采样,而第二块提取器301-2对来自第二复值源子带的样本的有限帧进行采样。帧由公共输入指针位置和子带换位因数定义。两个帧在302中经过非线性处理,随后由加窗部件303中的有限长度窗口进行加窗。重叠及相加单元204可以具有与图2中示出的结构相似或相同的结构。该操作链的迭代将产生持续时间是两个输入子带信号中的最长的输入子带信号的子带拉伸因数倍(上至合成窗口的长度)的输出信号。在两个输入子带信号携带相同的频率的情况下,输出信号将具有以子带换位因数换位的复频率。在两个子带信号携带不同的频率的情况下,本发明教示如下:加窗303可以适合于生成输出信号,该输出信号具有适于生成换位信号中的丢失的部分的目标频率。
图4示出了叉积增强的基于子带块的换位、时间拉伸、或换位和时间拉伸的组合的原理。直接子带处理单元401可以是已经参照图2(部件202)或图3描述的种类。交叉子带处理单元402也被馈送以大量复值子带信号,并且其操作受交叉处理控制数据403的影响。交叉子带处理单元402执行具有图3中所描述的两个子带输入的类型的非线性子带块处理,并且输出的目标子带与来自直接子带处理401的那些子带在加法器405中相加。交叉处理控制数据403可以关于每个输入指针位置而变化并且至少包括:
●目标子带索引的所选择的列表;
●关于每个所选择的目标子带索引的一对源子带索引;以及
●有限长度合成窗口。
交叉处理控制单元404提供给定描述基频和从分析滤波器组101输出的大量复值子带信号的控制数据104的一部分的交叉处理控制数据403。控制数据104也可以携带依赖于影响叉积处理的配置参数的其他信号。
在下面的文本中,通过添加适当的数学术语,参照图1至图4来列出对叉积增强的基于子带块的时间拉伸和换位的原理的描述。
总体谐波换位器和/或时间拉伸器的两个主要配置参数是:
●期望的物理时间拉伸因数;以及
●期望的物理换位因数。
滤波器组101和滤波器组103可以是任意复指数调制类型,例如QMF或加窗的DFT或小波变换。可以在调制中成偶数或奇数地堆叠分析滤波器组101和合成滤波器组103,并且可以根据宽范围的原型滤波器和/或窗口来定义分析滤波器组101和合成滤波器组103。然而,所有这些二阶选择影响后续设计中的诸如相位校正和子带映射管理的细节,一般可以根据下面全部以物理单位度量的四个滤波器组参数的两个商ΔtS/ΔtA和ΔfS/ΔfA来获得子带处理的主要系统设计参数。在上述商中,
●ΔtA是分析滤波器组101的子带样本时间步长或时间跨步(例如以秒[s]为单位度量);
●ΔfA是分析滤波器组101的子带频率间隔(以赫兹[1/s]为单位度量);
●ΔtS是合成滤波器组103的子带采样的时间步长或时间跨步(例如以秒[s]为单位度量);
●ΔfS是合成滤波器组103的子带频率间隔(以赫兹[1/s]为单位度量);
对于子带处理单元102的配置,应当计算以下参数:
●S:子带拉伸因数,即,为了实现时域信号的因数倍的总体物理时间拉伸而在子带处理单元102内应用的作为输入样本与输出样本的比率的拉伸因数;
●Q:子带换位因数,为了实现对时域信号的因数倍的总体物理频率换位而在子带处理单元102内应用的换位因数;以及
●源子带索引和目标子带索引之间的对应关系,其中n表示进入子带处理单元102的分析子带的索引,m表示子带处理单元102的输出处的相应合成子带的索引。
为了确定子带拉伸因数S,观察到分析滤波器组101的物理持续时间为D的输入信号对应于子带处理单元102的输入处的数量D/ΔtA的分析子带样本。这D/ΔtA个样本将被应用子带拉伸扩展因数S的子带处理单元102拉伸扩展为S·D/ΔtA个样本。在合成滤波器103的输出处,这S·D/ΔtA个样本产生物理持续时间为ΔtS·S·D/ΔtA的输出信号。由于该后者的持续时间应当满足指定值即,由于时域输出信号的持续时间应当是与时域输入信号相比拉伸了物理时间拉伸因数的时间,因此获得下面的设计规则:
为了确定为实现物理换位而在子带处理单元102内应用的子带换位因数Q,观察到分析滤波器组101的物理频率为Ω的输入正弦波将产生具有离散时间角频率ω=2πΩ·ΔtA的复分析子带信号,并且在索引为n≈Ω/ΔfA的分析子带内产生主要贡献。将通过向索引为的合成子带馈送具有离散角频率的复子带信号而产生合成滤波器组103的输出处的希望的经换位的物理频率为的输出正弦波。在这种情境下,应当注意避免具有不同于的混杂输出频率的合成。一般来说,如所讨论的,这可以通过进行适当的二阶选择,例如通过选择适当的分析/合成滤波器组来避免。子带处理单元102的输出处的离散频率应当对应于子带处理单元102的输入处的离散时间频率ω=2πΩ·ΔtA乘以子带换位因数Q。即,通过设置相等的2πQΩΔtA和可以确定物理换位因数和子带换位因数Q之间的以下关系:
类似地,给定目标的子带处理单元102的适当的源或分析子带索引n或者合成子带索引m应当遵守
在一种实施方式中,成立,即,合成滤波器组103的频率间隔对应于分析滤波器组101的频率间隔乘以物理换位因数,并且可以应用分析子带索引到合成子带索引的一对一映射n=m。在其它实施方式中,子带索引映射可以依赖于滤波器组参数的细节。特别地,如果合成滤波器组103和分析滤波器组101的频率间隔的分数不同于物理换位因数则可以对给定目标子带分配一个或两个源子带。在两个源子带的情况下,优选地分别使用索引为n、n+1的两个相邻源子带。也就是说,由(n(m),n(m)+1)或者(n(m)+1,n(m))给定第一源子带和第二源子带。
现在,将图2的使用单个源子带的子带处理描述为子带处理参数S和Q的函数。设x(k)是块提取器201的输入信号,并且设h是输出块跨步。即,x(k)是索引为n的分析子带的复值分析子带信号。在不失一般性的情况下,由块提取器201提取的块可以被认为由L=R1+R2个样本定义
xi(k)=x(Qk+hl),k=-R1,...R2-1, (4)
其中,整数l是块计数索引,L是块长度而R1、R2为非负整数。注意,对于Q=1,从连续样本中提取块,而对于Q>1,以将输入地址拉伸因数Q的方式进行下采样。如果Q是整数,则一般直接进行该操作,而对于非整数值的Q,可能需要插值方法。该表述还与增量h,即输入块跨步的非整数值相关。在实施方式中,可以对复值子带信号应用短插值滤波器,例如具有两个滤波器抽头的滤波器。例如,如果需要小数时间索引k+0.5处的样本,则x(k+0.5)≈ax(k)+bx(k+1)形式的2抽头插值可以保证足够的质量,其中a、b可以为常数或可以取决于子带索引(例如参见WO 2004/097794和WO 2007/085275)。
方程式(4)的令人感兴趣的特殊情况是R1=0、R2=0,其中,所提取的块由单个样本构成,即块长度L=1。
使用复数z=|z|exp(i∠z)的极坐标表示,其中,|z|是该复数的幅值,∠z是该复数的相位,由相位修正因数T=SQ通过下式有利地定义非线性处理单元202根据输入帧xl生成输出帧yl
其中,ρ∈[0,1]是几何幅值加权参数。情况ρ=0对应于所提取的块的纯相位修正。幅值加权的特别引人注意的值为ρ=1-1/T,对于其获得无关块长度L的一定的计算复杂度的缓解,并且所获得的瞬时响应相对于情况ρ=0在一定程度上提高。相位校正参数θ取决于滤波器组细节以及源和目标子带索引。在实施方式中,可以通过扫描一组输入正弦波来试验地确定相位校正参数θ。此外,可以通过研究相邻目标子带复正弦波的相位差,或者通过优化输入信号的狄拉克(Dirac)脉冲类型的性能,来得出相位校正参数θ。最终,随着分析滤波器组101和合成滤波器组103的适当的设计,相位校正参数θ可以被设置为0或省略。相位修正因数T应当是整数,从而使方程式(5)的第一行中的相位的线性组合中系数T-1和1为整数。在这种假设下,即在相位修正因数T是整数的假设下,即使由于识别模量2π而使相位不明确,也良好地定义非线性修正的结果。
换句话说,方程式(5)明确了通过将相应输入帧样本的相位偏移恒定偏移值,来确定输出帧样本的相位。该恒定偏移值可以取决于修正因数T,修正因数T本身取决于子带拉伸因数和/或子带换位因数。此外,恒定偏移值可以取决于来自输入帧的特定输入帧样本的相位。对于给定块的所有输出帧样本的相位的确定,该特定输入帧样本保持固定。在方程式(5)的情况下,使用输入帧的中心样本的相位作为特定输入帧样本的相位。
方程式(5)的第二行明确了输出帧的样本的幅值可以取决于输入帧的相应样本的幅值。此外,输出帧的样本的幅值可以取决于特定输入帧样本的幅值。该特定输入帧样本可以用于所有输出帧样本的幅值的确定。在方程式(5)的情况下,使用输入帧的中心样本作为特定输入帧样本。在实施方式中,输出帧的样本的幅值可以对应于输入帧的相应样本和特定输入帧样本的幅值的几何平均值。
在加窗单元203中,对输出帧应用长度为L的窗口w,得到加窗的输出帧
zl(k)=w(k)yl(k),k=-R1,...R2-1。 (6)
最后,假设将所有帧拉伸了零,重叠及相加操作204由下式定义
其中,应注意,重叠及相加单元204应用块跨步Sh,即,比输入块跨步h大S倍的时间跨步。由于方程式(4)和(7)的时间跨步的该区别,输出信号z(k)的持续时间是输入信号x(k)的持续时间的S倍,即,与分析子带信号相比,合成子带信号被拉伸了子带拉伸因数S倍。应注意,如果与信号持续时间相比窗口的长度L可以忽略,则一般应用这种观察。
对于使用复正弦波作为到子带处理102的输入,即,分析子带信号对应于如下复正弦波的情况
x(k)=Cexp(iωk), (8)
可以通过应用方程式(4)至(7)来确定子带处理102的输出,即相应合成子带信号不依赖于ρ地由下式给出
因此,假设对于所有k,跨步为Sh的窗口偏移的总和为同一恒定值K,则将具有离散时间频率ω的复正弦波变换为具有离散时间频率Qω的复正弦波,
考虑S=1并且T=Q的纯换位的特殊情况来进行说明。如果输入块跨步h=1并且R1=0、R2=0,则所有上述,即,明显地方程式(5)降低为逐点的或者基于样本的相位修正规则
子带处理单元102可以使用控制数据104设置某些处理参数,例如,块提取器的块长度。
下面,将子带处理的描述扩展到覆盖图3的具有两个子带输入的情况。设x(1)(k)是到第一块提取器301-1的输入子带信号,并且设x(2)(k)是到第二块提取器301-2的输入子带信号。每个块提取器可以使用不同的下采样因数,使得所提取的块满足
非线性处理302生成输出帧yl,其可以由下式定义
由(6)和(7)再次描述303中的处理并且204与在单个输入情况的情境中描述的处理相同。
非负实数参数D1、D2、ρ和非负整数参数T1、T2以及合成窗口w现在取决于所期望的操作模式。注意,如果相同的子带被被馈送两个输入,x(1)(k)=x(2)(k)以及D1=Q、D2=0,T1=1,T2=T-1,则(12)和(13)中的操作减小到单个输入情况下的(4)和(5)中的操作。
在一种实施方式中,其中,合成滤波器组103的频率间隔ΔfS与分析滤波器组101的频率间隔ΔfA之比不同于希望的物理换位因数根据索引分别为n、n+1的两个分析子带确定索引为m的合成子带的样本是有利的。对于给定索引m,可以由通过对方程式(3)所给定的分析索引值n取整而获得的整数值来给定相应的索引n。将分析子带信号之一,例如与索引n相对应的分析子带信号馈送到第一块提取器301-1中,而将另一个分析子带信号,例如与索引n+1相对应的分析子带信号馈送到第二块提取器301-2中。基于这两个分析子带信号,根据上面概述的处理确定与索引m相对应的合成子带信号。相邻分析子带信号到两个块提取器301-1和301-2的分配可以基于在对方程式(3)的索引值取整时获得的余量,即,基于由方程式(3)给定的准确索引值与从方程式(3)获得的取整后的整数值n的差。如果余量大于0.5,则可以将与索引n相对应的分析子带信号分配给第二块提取器301-2,否则可以将该分析子带信号分配给第一块提取器301-1。在这种操作模式下,可以设计参数使得输入子带信号共享相同的复频率ω,
产生作为具有离散时间频率Qω的复正弦波的输出子带信号,证实如果下面的关系成立则上述情况发生:
对于借助于叉积生成丢失的部分的操作模式,设计标准不同。返回到物理换位参数叉积相加的目的是产生给定频率Ω和Ω+Ω0处的输入的情况下频率处的输出,其中Ω0为属于输入信号的主要音调(dominant pitched)成分的基频。如在WO 2010/081892中所描述的,这些术语的选择性的相加将导致谐波序列的完成和鬼影音调假象的明显的减少。
现在将概述用于操作交叉处理控制404的构造算法。给定目标输出子带索引m,参数以及基频Ω0,通过在近似的意义上解下面的方程式系统可以推导出适当的源子带索引n1和n2,
其中,对于奇数地堆叠的滤波器组调制(如经常用于QMF和MDCT滤波器组)σ=1/2,而对于偶数地堆叠的滤波器组调制(如经常用于FF T滤波器组)σ=0。
使用下面的定义
●p=Ω0/ΔfA:以分析滤波器组频率间隔为单位测量的基频;
●F=ΔfS/ΔfA:合成子带频率间隔与分析子带频率间隔的商;以及
●关于整数值较低的源索引的实数值目标,
通过选择n1作为最接近于nf的整数,n2作为最接近于nf+p的整数,给出(16)的有利的近似解的示例。
如果基频小于分析滤波器组间隔,即如果p<1,则可以有利地取消叉积的相加。
如在WO 2010/081892中所教示的,叉积不应当与已经具有来自没有叉积的换位的明显的主要贡献的输出子带相加。而且,几乎情况 中的一种情况应当贡献于叉积输出。因此,通过进行针对每个目标输出子带索引m的下面的三个步骤可以执行这些规则:
1.计算中心时隙k=hl(的邻居)中估算的候选源子带幅值|x(1)|和|x(2)|的最小值的关于的所有选择的最大值MC,其中,可以通过如方程式(16)中的索引n1和n2给出源子带x(1)和x(2);
2.计算从索引为(参见方程式3)的源子带获得的直接源项|x|的相应幅值MS;
3.仅当MC>qMS,根据上面的第1点中的MC的成功选择来激活交叉项,其中q为预定阈值。
该过程的变化可以期望地取决于特定的系统配置参数。一种该变化为取决于商MC/MS使用软规则来替代第3点的硬阈值。另一变化为将第1点的最大值扩展到多于个选择,例如,由关于以分析频率间隔为单位p测量的基频的候选值的有限列表来定义。又一变化为应用子带幅值的不同的测量值,例如,固定样本的幅值、最大幅值、平均幅值、lp规范(lp-norm)意义上的幅值等等。
被选择用于将叉积与n1和n2的值相加在一起的一系列目标源子带m构成交叉处理控制数据403的主要部分。剩下要描述的是配置参数D1、D2、ρ,出现在相位旋转(13)中的非负整数参数T1、T2以及在交叉子带处理402中要使用的合成窗口w。插入用于叉积情形的正弦波模型导致下面的源子带信号:
其中,ω=2πΩΔtA且ω0=2πΩ0ΔtA。同样地,所期望的输出子带为下面的形式
如果(15)连同下面的方程式被满足,计算显示可以实现该目标输出
条件(15)和(19)等同于
该方程式定义用于(13)中的相位修正的整数因数T1、T2并且在设置下采样因数D1、D2的值方面提供一些设计自由。可以有利地选择幅值加权参数为可以看出,这些配置参数通过r的选择仅取决于基频Ω0。然而,为了(18)成立,关于合成窗口w的新的条件出现,即,
满足(21)的合成窗口w精确地或近似地被设置为交叉处理控制数据403的最后片段。
注意,上面的用于基于输入参数(例如,目标输出子带索引m和基频Ω0)计算交叉处理控制数据403的算法具有纯粹的举例说明性质,因此不限制本发明的范围。在普通技术人员的知识和常规实验内的本公开内容的变化,例如,响应于输入信号(17)提供信号(18)作为输出的另外的基于子带块的处理方法,完全落入本发明的范围内。
图5示出了在HFR增强的音频编解码器中使用若干阶次的换位的基于子带块的换位的应用的示例场景。在核心解码器501处接收发送的位流,核心解码器501以采样频率fs提供低带宽解码的核心信号。通过复调制的32带QMF分析组502,之后通过64带QMF合成组(逆QMF)505,将该低带宽解码的核心信号再采样为输出采样频率2fs。两个滤波器组502和505共享相同的物理参数ΔtS=ΔtA和ΔfS=ΔfA,HFR处理单元504简单地使与低带宽核心信号相对应的未修正的较低子带通过。通过向64带QMF合成组505的较高子带馈送来自多重换位器单元503的输出带来获得输出信号的高频内容,来自多重换位器单元503的该输出带经过由HFR处理单元504进行的谱成形和修正。多重换位器503把经解码的核心信号作为输入,并且输出表示若干经换位的信号分量的叠加或组合的64QMF带分析的大量子带信号。目的在于如果HFR处理被旁路,则每个分量对应于核心信号没有时间拉伸(和)的情况下的整数物理换位。在本发明的场景中,换位器控制信号104包括描述基频的数据。该数据可以从相应的音频解码器经由位流被传送,通过解码器中的音调检测被推导出或根据传送的和检测的信息的组合获得。
图6示出了应用单个64带QMF分析滤波器组的多阶基于子带块的换位的操作的示例场景。这里,要在以输出采样速率2fs工作64带QMF的域中产生和传递三个换位阶次合并单元603根据每个换位因数分支简单地选择相关的子带并且将其组合成要馈送至HFR处理单元的单个大量QMF子带。目的具体是64带QMF分析601、子带处理单元和64带QMF合成505的处理链产生(即,没有拉伸)的的物理换位。用图1的101、102和103标识这三个块,发现ΔtA=64fs且ΔfA=fs/128,所以ΔtS/ΔtA=1/2且F=ΔfS/ΔfA=2。将针对的每个情况分别地描述关于的具体配置参数的设计。对于所有的情况,分析跨步被选择为h=1,且假设归一化的基频参数p=Ω0/ΔfA=128Ω0/fs已知。
首先考虑的情况。那么602-2必须执行S=2的子带拉伸、Q=1(即,没有拉伸)的子带换位,并且关于该直接子带处理,源n与目标子带m之间的对应关系由n=m给出。在叉积相加的本发明的场景下,仅存在一种类型的叉积要考虑,即r=1(参见上文,方程式15之后),并且方程式(20)简化为T1=T2=1和D1+D2=1。示例性的解由选择D1=0和D2=1组成。对于直接处理合成窗口,R1=R2=5的偶数长度L=10的矩形窗口当其满足条件(10)可以使用。对于交叉处理合成窗口,可以使用R1=R2=1的短的L=2的抽头窗口以将叉积相加的额外的复杂度保持到最小。最终,对于子带处理使用长的块的有利效果在复音频信号的情况下最显著,其中抑制了不想要的互调制项;对于主要音调的情况,这样的假象较不可能出现。由于h=1且S=2,L=2的抽头窗口是能够满足(10)的最短的窗口。然而,通过本发明,窗口有利地满足(21)。对于所考虑的参数,这相当于
该式通过选择w(0)=1和w(-1)=exp(iα)=exp(iπp/2)来满足。
对于情况由(1)至(3)给出的关于602-3的规范为602-3必须执标S=2的子带拉伸,关于直接项处理,Q=3/2的子带换位和源子带n与目标子带m之间的对应关系由n≈2m/3给出。存在两种类型的叉积项r=1,2,并且方程式(20)简化为
示例性的解由如下选择下采样参数组成:
●对于r=1,D1=0且D2=3/2;
●对于r=2,D1=3/2且D2=0。
对于直接处理合成窗口,可以使用R1=R2=4的偶数长度L=8的矩形窗口。对于交叉处理合成窗口,可以使用R1=R2=1、满足下式的短的L=2的抽头窗口:
该式通过选择w(0)=1和w(-1)=exp(iα)来实现。
对于情况由(1)至(3)给出的关于602-4的规范为602-4必须执行S=2的子带拉伸,关于直接项处理,Q=2的子带换位和源n子带与目标子带m之间的对应关系由n≈2m给出。存在的三种类型的叉积项r=1,2,3,并且方程式(20)简化为
示例性的解由如下选择组成:
●对于r=1,D1=0且D2=2;
●对于r=2,D1=0且D2=1;
●对于r=3,D1=2且D2=0。
对于直接处理合成窗口,可以使用R1=R2=3的偶数长度L=6的矩形窗口。对于交叉处理合成窗口,可以使用R1=R2=1、满足下式的短的L=2的抽头窗口:
该式通过选择w(0)=1和w(-1)=exp(iα)来满足。
在上面的情况中的每种情况中,其中多于一个的r值可应用,例如类似于之前的方程式(17)所描述的三步骤过程来进行选择。
图7描绘了基频为Ω0=564.7Hz的谐波信号的幅度谱。信号的低频部分701要用作多重换位器的输入。换位器的目的为生成尽可能接近输入信号的高频部分702的信号,使得高频部分702的换位变得非必要并且可以经济地使用可得到的位速率。
图8描绘了来自换位器的输出的幅度谱,换位器使得图7的信号的低频部分701作为输入。使用64带QMF滤波器组、fs=14400Hz的输入采样频率以及根据图5的描述来构造多重换位器。然而,为了清楚起见,仅考虑两个换位阶次三个不同的面板801至803表示通过使用交叉处理控制数据的不同的设置而获得的最终输出。
上部面板801描绘了当所有的叉积处理被取消并且仅直接子带处理401有效的时所获得的输出谱。这将是交叉处理控制404没有接收到音调或p=0的情形。的换位生成4至8kHz范围内的输出而的换位生成8至12kHz范围内的输出。可以看出,创建的部分逐渐远离并且输出显著偏离目标高频信号702。听得见的二次或三次“鬼影”音调假象将出现在所获得的音频输出中。
中间面板802描绘了当叉积处理有效,使用音调参数p=5(为128Ω0/fs=5.0196的近似)但是对于交叉子带处理使用w(0)=w(-1)=1、满足条件(10)的简单的2抽头合成窗口时所获得的输出谱。这相当于基于子带块的处理和叉积增强谐波换位的直接组合。可以看出,相比于801,额外的输出信号分量没有与所期望的谐波序列很好地对准。这示出了对于叉积处理使用从直接子带处理的设计继承的过程,导致不足够的音频质量。
下部面板803描绘了从与中间面板802相同的场景中获得的输出谱,但现在使用由图5的情况下描述的公式给出的交叉子带处理合成窗口。也就是说,w(0)=1且w(-1)=exp(iα)的、满足(21)并且具有本发明所教示的特征的取决于p的值的形式的2抽头窗口。可以看出,组合的输出信号与702的所期望的谐波序列很好地对准。
图9示出了非线性处理帧处理单元202的一部分,该部分包括被配置成接收两个输入样本u1、u2并且基于这些输入样本生成经处理的样本w的部件,样本w的幅值由输入样本的幅值的几何平均值给出并且样本w的相位为输入样本的相位的线性组合,即,
根据本说明书,通过在各自的预归一化器901、902处将输入样本u1、u2中的每个样本预归一化并且在加权乘法器910处将经预归一化的输入样本v1=u1/|u1|a、v2=u2/|u2|b相乘,加权乘法器910输出可以获得经处理的样本w。清楚地,预归一化器901、902和加权乘法器910的操作由输入参数a、b、α和β确定。容易证明如果α=T1,β=T2,a=1-ρ/T1,b=1-(1-ρ)/T2则可以满足方程式(22)。技术人员将容易地能够将该设计推广到任意数量N0个输入样本,其中乘法器被提供有N0个输入样本,这些输入样本中的一些或全部已经经过预归一化。然后,观察到如果参数ρ被设置为ρ=T1/(T1+T2)则公共预归一化(a=b,意味着预归一化器901、902产生相同的结果)是可能的。当考虑很多子带时这产生计算上的优势,因为在相乘之前公共预归一化步骤可以影响所有的候选子带。在优势的硬件实现中,多个相同功能的预归一化器被单个单元替代,该单个单元以时分方式在来自不同子带的样本之间交替。
在阅读上面的说明之后,对于本领域技术人员而言,本发明的其他的实施方式将变得明显。即使本说明书和附图公开了实施方式和示例,本发明不受这些具体的示例的约束。在不偏离由所附权利要求所定义的本发明的范围的情况下,可以做出大量的修改和变化。
上文所公开的系统和方法可以被实现为软件、固件、硬件或其组合。某些部件或所有的部件可以被实现为由数字信号处理器或微处理器执行的软件,或可以被实现为硬件或专用集成电路。这样的软件可以分布在计算机可读介质上,该计算机可读介质可以包括计算机存储介质(或非瞬态介质)和通信介质(或瞬态介质)。如本领域技术人员已知的,计算机存储介质包括以任何方法或技术实现的用于信息(例如,计算机可读指令、数据结构、程序模块或其他数据等)的存储的易失或非易失的、可移动或不可移动的介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪速存储技术或其他存储技术、CD-ROM、数字多用途盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或可以用于存储所期望的信息并且可以由计算机访问的任何其他的介质。此外,本领域技术人员已知,通信介质通常实现为计算机可读指令、数据结构、程序模块或调制数据信号中的其他数据例如载波或其他的传递机制,并且包括任何信息传输介质。
此外,本发明还包括以下实施方式:
(1)一种被配置成根据输入信号生成时间拉伸信号和/或频率换位信号的系统,所述系统包括:
分析滤波器组(101),被配置成根据所述输入信号得到数量Y≥1个分析子带信号,其中,每个分析子带信号包括多个复值分析样本,每个复值分析样本具有相位和幅值;
子带处理单元(102),被配置成使用子带换位因数Q和子带拉伸因数S根据所述Y个分析子带信号来生成合成子带信号,Q和S中的至少一个大于1,其中,所述子带处理单元(102)包括:
块提取器(201),被配置成:
i)形成Y个L个输入样本的帧,每个帧是从分析子带信号中的所述多个复值分析样本提取的,并且帧长度L>1;以及
ii)在形成后续的L个输入样本的帧之前,对所述多个分析样本应用h个样本的块跳跃大小,由此生成输入样本的一系列帧;
非线性帧处理单元(202),被配置成基于由所述块提取器形成的输入样本的Y个相应帧,通过确定所述帧的每个经处理的样本的相位和幅值来生成经处理的样本的帧,其中,对于至少一个经处理的样本:
i)所述经处理的样本的相位基于输入样本的所述Y个帧中的每个帧中的相应输入样本的各自的相位;以及
ii)所述经处理的样本的幅值基于输入样本的所述Y个帧中的每个帧中的相应输入样本的幅值;
以及
重叠及相加单元(204),被配置成通过将经处理的样本的一系列帧的样本进行重叠及相加来确定所述合成子带信号;
以及
合成滤波器组(103),被配置成根据所述合成子带信号来生成所述时间拉伸信号和/或频率换位信号,
其中,所述系统至少对于Y=2可操作。
(2)根据(1)所述的系统,其中,
所述分析滤波器组(101)是正交镜像滤波器组、加窗离散傅立叶变换或者小波变换之一;以及
所述合成滤波器组(103)是相应的逆滤波器组或变换。
(3)根据(2)所述的系统,其中,所述分析滤波器组(101)是64点正交镜像滤波器组,并且所述合成滤波器组(103)是逆64点正交镜像滤波器组。
(4)根据前述项中的任一项所述的系统,其中,
所述分析滤波器组(101)对所述输入信号应用分析时间跨步ΔtA;
所述分析滤波器组具有分析频率间隔ΔfA;
所述分析滤波器组具有数量N个分析子带,其中,N>1,并且n是分析子带索引,其中n=0,...,N-1;
所述N个分析子带中的分析子带与所述输入信号的频带相关联;
所述合成滤波器组(103)对所述合成子带信号应用合成时间跨步ΔtS;
所述合成滤波器组具有合成频率间隔ΔfS;
所述合成滤波器组具有数量M个合成子带,其中M>1,并且m是合成子带索引,其中m=0,...,M-1;以及
所述M个合成子带中的合成子带与所述时间拉伸信号和/或频率换位信号的频带相关联。
(5)根据(4)所述的系统,其中,所述子带处理单元(102)针对Y=2被配置,并且还包括被配置成生成交叉处理控制数据(403)的交叉处理控制单元(404),所述交叉处理控制数据(403)以如下方式定义与所述分析子带信号相关联的子带索引n1、n2:所述子带索引相差整数p,所述整数p近似于所述输入信号的基频Ω0与所述分析频率间隔ΔfA之比。
(6)根据(4)所述的系统,其中,所述子带处理单元(102)针对Y=2被配置,并且还包括被配置成生成交叉处理控制数据(403)的交叉处理控制单元(404),所述交叉处理控制数据(403)定义与所述分析子带信号相关联的子带索引n1、n2和所述合成子带索引m,所述子带索引通过作为下式的近似整数解而相关,
其中,Ω0为所述输入信号的基频,
σ=0或1/2,
以及
r为满足的整数。
(7)根据(6)所述的系统,其中,所述交叉处理控制单元(404)被配置成生成处理控制数据使得所述子带索引n1、n2基于r的值,所述r的值使得通过从所述分析子带信号中提取分析样本而形成的两个帧的子带幅值的最小值最大化。
(8)根据(7)所述的系统,其中,每个L个输入样本的帧的所述子带幅值为中心样本或近中心样本的幅值。
(9)根据前述项中的任一项所述的系统,其中,所述块提取器(201)被配置成通过对分析子带信号中的所述复值分析样本进行下采样来得到输入样本的至少一个帧。
(10)根据(9)所述的针对Y=2配置系统,其中,所述块提取器被配置成通过分别由满足 且满足D1≥0,D2>0或D1>0,D2≥0的下采样因数D1和D2对第一分析子带信号和第二分析子带信号中的所述复值分析样本进行下采样来得到输入样本的第一帧和第二帧,
并且其中,所述非线性帧处理单元(202)被配置成使用输入样本的所述第一帧和所述第二帧中的所述相应输入样本的各自的相位的非负整数系数T1、T2,基于线性组合来确定所述经处理的样本的相位。
(11)根据前述项中的任一项所述的系统,其中,所述子带处理单元(102)还包括加窗单元(203),所述加窗单元(203)位于所述重叠及相加单元(204)的上游并且被配置成对所述经处理的样本的帧应用有限长度窗口函数。
(12)根据(11)所述的系统,其中,所述窗口函数具有与所述帧长度L相对应的长度并且所述窗口函数是下列之一:
高斯窗口,
余弦窗口,
升余弦窗口,
汉明窗口,
汉窗口,
矩形窗口,
巴特兰窗口,以及
布莱克曼窗口。
(13)根据(11)所述的系统,其中,所述窗口函数包括多个窗口样本,并且其中多个窗口函数的重叠及相加的窗口样本当由复权重加权并且以Sh跳跃大小偏移时形成实质上恒定的序列。
(14)根据(13)所述的系统,其中,连续的复权重仅相差固定的相位旋转。
(15)根据(14)所述的系统,其中,所述相位旋转与所述输入信号的基频成比例。
(16)根据前述项中的任一项所述的系统,其中,所述重叠及相加单元(204)对经处理的样本的连续的帧应用跳跃大小,所述跳跃大小等于所述块跳跃大小h乘以所述子带拉伸因数S。
(17)根据前述项中的任一项所述的系统,其至少对于Y=1和Y=2可操作。
(18)根据(17)所述的系统,其对于至少一个另外的值Y≥3可操作。
(19)根据前述项中的任一项所述的针对Y=2配置的系统,其中,所述帧处理单元(202)被配置成将所述经处理的样本的幅值确定为输入样本的第一帧中的相应输入样本的幅值和输入样本的第二帧中的相应输入样本的幅值的平均值。
(20)根据(19)所述的系统,其中,所述非线性帧处理单元(202)被配置成将所述经处理的样本的幅值确定为加权几何平均值。
(21)根据(20)所述的系统,其中,几何幅值加权参数为ρ和(1-ρ),其中ρ为与所述子带换位因数Q成反比的实数。
(22)根据前述项中的任一项所述的针对Y=2配置的系统,其中,所述非线性帧处理单元(202)被配置成基于输入样本的第一帧和第二帧中的相应输入样本的各自相位的使用非负整数系数(T1,T2)的线性组合来确定所述经处理的样本的相位。
(23)根据(22)所述的系统,其中,所述整数系数的和为所述拉伸系数与所述换位系数的乘积Q×S。
(24)根据(22)所述的系统,其中,所述经处理的样本的相位对应于相位的所述线性组合加上相位校正参数θ。
(25)根据前述项中的任一项所述的系统,其中,所述块提取器(201)被配置成插值两个或更多个分析样本以得到输入样本。
(26)根据前述项中的任一项所述的系统,还包括被配置成接收控制数据(104)的控制数据接收单元,其中,所述子带处理单元(102)被配置成通过考虑所述控制数据来确定所述合成子带信号。
(27)根据(26)所述的针对Y=2配置的系统,所述控制数据(104)包括所述输入信号的基频Ω0,其中,所述子带处理单元(102)被配置成以如下方式确定要根据其获得所述经处理的样本的所述分析子带信号:所述分析子带信号的频率间隔与所述基频成比例。
(28)根据前述项中的任一项所述的系统,其中,所述非线性处理单元(102)包括:
预归一化器(901,902),被配置成重新缩放输入信号的所述Y帧中的至少一帧中的所述相应输入样本的所述幅值以及
复乘法器(910),被配置成通过计算与输入信号的所述Y帧中的至少两帧中的所述相应输入样本相等的因数的加权复乘积所述因数中的至少一个因数根据具有被所述预归一化器重新缩放的幅值的样本获得。
(29)根据前述项中的任一项所述的针对Y=2配置的系统,包括:
分析滤波器组(101),被配置成根据所述输入信号得到第一分析子带信号和第二分析子带信号;
子带处理单元(102),被配置成根据所述第一分析子带信号和所述第二分析子带信号确定合成子带信号,其中,所述子带处理单元(102)包括:
第一块提取器(301-1),被配置成:
i)根据所述第一分析子带信号中的所述多个复值分析样本来形成L个输入样本的第一帧,帧长度L>1;以及
ii)在形成后续的L个输入样本的帧之前,对所述多个分析样本应用h个样本的块跳跃大小,由此生成所述输入样本的第一系列帧;
第二块提取器(301-2),被配置成:
i)根据所述第二分析子带信号中的所述多个复值分析样本来形成L个输入样本的第二帧;以及
ii)在形成后续的L个输入样本的帧之前,对所述多个分析样本应用h个样本的块跳跃大小,由此生成所述输入样本的第二系列帧;
非线性帧处理单元(302),被配置成基于输入样本的所述第一帧和所述第二帧来生成经处理的样本的帧;
以及
重叠及相加单元(204),被配置成形成所述合成子带信号;
以及
合成滤波器组(103),被配置成根据所述合成子带信号来生成所述时间拉伸信号和/或频率换位信号。
(30)根据前述项中的任一项所述的系统,还包括:
多个子带处理单元(401,402;503;602-2,602-3,602-4),每个子带处理单元被配置成使用所述子带换位因数Q和/或所述子带拉伸因数S的不同值来确定中间合成子带信号;以及
合并单元(405;603),其被布置在所述多个子带处理单元的下游和所述合成滤波器组(103)的上游,被配置成将相应中间合成子带信号合并以确定所述合成子带信号。
(31)根据(30)所述的系统,还包括:
核心解码器(501),其被布置在所述分析滤波器组(101)的上游,并且被配置成将位流解码为所述输入信号;以及
高频重建HFR处理单元(504),其被布置在所述合并单元(405;603)的下游和所述合成滤波器组(103;505)的上游,被配置成例如通过执行所述合成子带信号的频谱成形来对所述合成子带信号应用根据所述位流得出的谱带信息。
(32)根据(30)所述的系统,其中,所述子带处理单元中的至少一个为直接子带处理单元(401),所述直接子带处理单元(401)被配置成使用子带换位因数Q和子带拉伸因数S根据一个分析子带信号确定一个合成子带信号,并且所述子带处理单元中的至少一个为交叉子带处理单元(402),所述交叉子带处理单元(402)被配置成使用独立于前面两个因数的子带换位因数Q和子带拉伸因数S根据两个分析子带信号确定一个合成子带信号。
(33)根据(32)所述的针对Y=2配置的系统,其中:
所述分析滤波器组(101)对所述输入信号应用分析时间跨步ΔtA;
所述分析滤波器组具有分析频率间隔ΔfA;
所述分析滤波器组具有数量N个分析子带,其中N>1,并且n是分析子带索引,其中n=0,...,N-1;所述N个分析子带中的分析子带与所述输入信号的频带相关联;
所述合成滤波器组(103)对所述合成子带信号应用合成时间跨步ΔtS;
所述合成滤波器组具有合成频率间隔ΔfS;
所述合成滤波器组具有数量M个合成子带,其中M>1,并且m是合成子带索引,其中m=0,...,M-1;以及
所述M个合成子带中的合成子带与所述时间拉伸信号和/或频率换位信号的频带相关联,
所述系统被配置成如果对于给定的合成子带满足下面的条件之一则停用至少一个交叉子带处理单元(402):
a)产生所述合成子带的直接源项分析子带的幅值MS与产生所述合成子带的交叉源项的最优对中的最小的幅值MC之比大于预定的常数q;
b)所述分析子带具有来自直接处理单元的显著的贡献;
c)基频Ω0小于所述分析滤波器组间隔ΔfA。
(34)根据前述项中的任一项所述的系统,其中:
所述分析滤波器组(101)被配置成根据所述输入信号形成Y×Z个分析子带信号;
所述子带处理单眼(102)被配置成应用一个合成子带信号所基于的每组Y个分析子带信号的一对S和Q值,根据所述Y×Z个分析子带信号来生成Z个合成子带信号;以及
所述合成滤波器组(103)被配置成根据所述Z个合成子带信号来生成Z个时间拉伸信号和/或频率换位信号。
(35)一种用于根据输入信号来生成时间拉伸信号和/或频率换位信号的方法,所述方法包括:
根据所述输入信号得到数量Y≥2个分析子带信号,其中,每个分析子带信号包括多个复值分析样本,每个复值分析样本具有相位和幅值;
形成Y个L个输入样本的帧,每个帧从分析子带信号中的所述多个复值分析样本被提取,并且帧长度L>1;
在形成后续的L个输入样本的帧之前,对所述多个分析样本应用h个样本的块跳跃大小,由此生成输入样本的一系列帧;
基于输入样本的Y个相应帧,通过确定所述帧的每个经处理的样本的相位和幅值来生成经处理的样本的帧,其中,对于至少一个经处理的样本:
i)所述经处理的样本的相位基于输入样本的所述Y个帧中的每个帧中的相应输入样本的各自的相位;以及
ii)所述经处理的样本的幅值基于输入样本的所述Y个帧中的每个帧中的相应输入样本的幅值;
通过将经处理的样本的一系列帧的样本进行重叠及相加来确定所述合成子带信号;以及
根据所述合成子带信号来生成所述时间拉伸信号和/或频率换位信号。
(36)根据(35)所述的方法,其中,经处理的样本的帧基于输入样本的Y=2个相应帧,所述输入样本的Y=2个相应帧是通过如下方式形成的:从表示近似相差所述输入信号的基频Ω0的频率的两个分析子带信号中提取样本。
(37)根据(35)或(36)所述的方法,其中,
经处理的样本的帧基于输入样本的Y=2个相应帧,所述输入样本的Y=2个相应帧是通过从近似表示频率Ω和Ω+Ω0的两个分析子带信号中提取样本而形成的;以及
所述合成子带信号近似表示频率其中r为满足 的整数并且其中ΔtA和ΔtS分别为分析时间跨步和合成时间跨步。
(38)根据(37)所述的方法,其中,所述频率Ω被选择以使得从表示频率为Ω和Ω+Ω0的分析子带信号中提取的输入样本的两个帧的子带幅值中的较小者最大化。
(39)根据(38)所述的方法,其中,输入样本的帧的所述子带幅值为中心样本或近中心样本的幅值。
(40)根据(35)至(39)中任一项所述的方法,其中,所述形成输入样本的帧包括对分析子带信号中的复值分析样本进行下采样。
(41)根据(40)所述的方法,其中:
经处理的样本的帧基于输入样本的Y=2个相应帧;
输入样本的第一帧是在应用下采样因数D1的情况下从第一分析子带信号中提取的;
输入样本的第二帧是在应用下采样因数D2的情况下从第二分析子带信号中提取的;
所述下采样因数满足 并且满足D1≥0,D2>0或D1>0,D2≥0;以及
所述经处理的样本的相位基于输入样本中的所述第一帧和所述第二帧中的所述相应输入样本的各自相位的使用非负整数系数T1、T2的线性组合。
(42)根据(35)至(41)中任一项所述的方法,其中,所述确定所述合成子带信号还包括在重叠及相加之前对经处理的样本的一系列帧中的每个帧应用有限长度窗口函数。
(43)根据(42)所述的方法,其中,所述窗口函数具有与所述帧长度L相对应的长度,并且所述窗口函数是下列之一:
高斯窗口,
余弦窗口,
升余弦窗口,
汉明窗口,
汉窗口,
矩形窗口,
巴特兰窗口,以及
布莱克曼窗口。
(44)根据(42)所述的方法,其中,所述窗口函数包括多个窗口样本,并且其中,多个窗口函数的重叠及相加的窗口样本当由复权重加权并且以Sh的跳跃大小偏移时,形成实质上恒定的序列。
(45)根据(44)所述的方法,其中,连续的复值权重仅相差固定的相位旋转。
(46)根据(45)所述的方法,其中,所述相位旋转与所述输入信号的基频成比例。
(47)根据(35)至(46)中任一项所述的方法,其中,所述确定所述合成子带信号包括通过应用等于所述块跳跃大小h乘以所述子带拉伸因数S的跳跃大小将经处理的样本的连续的帧重叠。
(48)根据(35)至(47)中任一项所述的方法,其中:
经处理的样本的帧基于输入样本的Y=2个相应帧;
将所述经处理的样本的幅值确定为输入样本的第一帧中的所述相应输入样本的幅值和输入样本的第二帧中的所述相应输入样本的幅值的平均值。
(49)根据(48)所述的方法,其中,幅值的所述平均值为加权几何平均值。
(50)根据(49)所述的方法,其中,几何幅值加权参数为ρ和1-ρ,其中所述ρ为与所述子带换位因数Q成反比的实数。
(51)根据(35)至(50)中任一项所述的方法,其中:
经处理的样本的帧基于输入样本的Y=2个相应帧;以及
其中,将所述经处理的样本的相位确定为输入样本的第一帧和第二帧中的所述相应输入样本的各自相位的使用非负整数系数(T1,T2)的线性组合。
(52)根据(51)所述的方法,其中,所述非负整数系数的和为所述拉伸系数与所述换位系数的乘积Q×S。
(53)根据(51)所述的方法,其中,所述经处理的样本的相位对应于所述线性组合加上相位校正参数θ。
(54)根据(35)至(53)中任一项所述的方法,其中,通过插值两个或更多个分析样本来得到至少一个输入样本。
(55)根据(35)至(54)中任一项所述的方法,还包括接收在所述生成经处理的样本的帧的过程中要考虑的控制数据。
(56)根据(55)所述的方法,其中:
经处理的样本的帧基于输入样本的Y=2个相应帧;
所述控制数据包括所述输入信号的基频Ω0;以及
从其中提取每个帧中的所述输入样本的所述两个分析子带表示相差所述基频的频率。
(57)根据(35)至(56)中任一项所述的方法,其中,所述生成经处理的样本的帧包括:
重新缩放至少一个输入样本的幅值;以及
将经处理的样本计算为与输入样本的所述Y个帧中的至少两帧中的所述相应输入样本相等的因数的加权复乘积其中所述因数中的至少一个因数为具有重新缩放的幅值的输入样本。
(58)根据(35)至(57)中任一项所述的方法,包括生成多个中间合成子带信号,其中基于输入信号的多个相应帧并且使用所述子带换位因数Q和/或所述子带拉伸因数S的不同值来生成每个中间合成子带信号,
其中,所述确定所述合成子带信号包括合并相应中间合成子带信号。
(59)根据(58)所述的方法,还包括
将位流解码以获得所述输入信号,根据所述输入信号获得所述分析子带信号;以及
例如通过执行所述合成子带信号的频谱成形,将根据所述位流获得的谱带信息应用于所述合成子带信号。
(60)根据(58)所述的方法,其中,通过基于一个分析子带信号和使用子带换位因数Q和子带拉伸因数S的直接子带处理来生成所述中间合成子带信号中的至少一个,并且通过基于两个分析子带信号、使用独立于前面两个因数的子带换位因数Q和子带拉伸因数S的叉积处理来生成所述中间合成子带信号中的至少一个。
(61)根据(60)所述的方法,其中,所述通过叉积处理生成中间合成子带信号响应于满足下面条件中的一个条件而被中止:
a)产生所述合成子带的直接源项分析子带的幅值MS与产生所述合成子带的交叉源项的最优对中的最小的幅值MC之比大于预定的常数q;
b)所述分析子带具有来自直接处理单元的显著的贡献;
c)基频Ω0小于所述分析滤波器组间隔ΔfA。
(62)根据(35)至(61)中任一项所述的方法,其中:
获得Y×Z个分析子带信号;
形成输入样本的Y×Z个帧;
使用输入样本的Y×Z个相应帧生成经处理的样本的Z个帧;
确定Z个合成子带信号;以及
生成Z个时间拉伸信号和/或频率换位信号。
(63)一种存储用于执行(35)至(62)中任一项所述的方法的计算机可读指令的数据载体。
Claims (14)
1.一种被配置成根据输入信号生成时间拉伸信号和/或频率换位信号的系统,所述系统包括:
分析滤波器组(101),被配置成根据所述输入信号得到数量Y≥1个分析子带信号,其中,每个分析子带信号包括多个复值分析样本,每个复值分析样本具有相位和幅值;
子带处理单元(102),被配置成使用子带换位因数Q和子带拉伸因数S根据所述Y个分析子带信号来生成合成子带信号,Q和S中的至少一个大于1,其中,所述子带处理单元(102)包括:
块提取器(201),被配置成针对所述Y个分析子带中的每个分析子带执行以下操作:
i)形成从所述分析子带信号中的所述多个复值分析样本提取的L个输入样本的帧,帧长度L>1;以及
ii)在形成后续的L个输入样本的帧之前,对所述多个分析样本应用h个样本的块跳跃大小;
非线性帧处理单元(202),被配置成基于由所述块提取器形成的输入样本的Y个相应帧,通过确定所述帧的每个经处理的样本的相位和幅值来生成经处理的样本的帧,其中,对于至少一个经处理的样本:
i)所述经处理的样本的相位基于输入样本的所述Y个帧中的相应输入样本的各自的相位;以及
ii)所述经处理的样本的幅值基于输入样本的所述Y个帧中的相应输入样本的幅值;
加窗单元(203),被配置成对所述经处理的样本的帧应用有限长度窗口函数,所述窗口函数包括多个窗口样本,其中多个窗口函数的重叠及相加的窗口样本当由复权重加权并且以Sh跳跃大小偏移时形成实质上恒定的序列;以及
重叠及相加单元(204),被配置成通过将加窗的经处理的样本的一系列帧的样本进行重叠及相加来确定所述合成子带信号;
以及
合成滤波器组(103),被配置成至少根据由所述子带处理单元输出的所述合成子带信号来生成所述时间拉伸信号和/或频率换位信号,
其中,所述系统至少对于Y=2可操作。
2.根据权利要求1所述的系统,其中,
所述分析滤波器组(101)是正交镜像滤波器组、加窗离散傅立叶变换或者小波变换之一;并且
所述合成滤波器组(103)是相应的逆滤波器组或变换。
3.根据前述权利要求中的任一项所述的系统,其中,
所述分析滤波器组(101)对所述输入信号应用分析时间跨步ΔtA;
所述分析滤波器组具有分析频率间隔ΔfA;
所述分析滤波器组具有数量N个分析子带,其中,N>1,并且n是分析子带索引,其中n=0,...,N-1;
所述N个分析子带中的分析子带与所述输入信号的频带相关联;
所述合成滤波器组(103)对所述合成子带信号应用合成时间跨步ΔtS;
所述合成滤波器组具有合成频率间隔ΔfS;
所述合成滤波器组具有数量M个合成子带,其中M>1,并且m是合成子带索引,其中m=0,...,M-1;并且
所述M个合成子带中的合成子带与所述时间拉伸信号和/或频率换位信号的频带相关联。
4.根据权利要求3所述的系统,其中,所述子带处理单元(102)针对Y=2被配置,并且还包括被配置成生成交叉处理控制数据(403)的交叉处理控制单元(404),所述交叉处理控制数据(403)定义与所述分析子带信号相关联的子带索引n1、n2和所述合成子带索引m,所述子带索引通过作为下式的近似整数解而相关,
其中,Ω0为所述输入信号的基频,
σ=0或1/2,
是换位因数,并且
r为满足的整数。
5.根据权利要求4所述的系统,其中,所述交叉处理控制单元(404)被配置成生成处理控制数据使得所述子带索引n1、n2基于r的值,所述r的值使得通过从所述分析子带信号中提取分析样本而形成的两个帧的子带幅值的最小值最大化。
6.根据权利要求5所述的系统,其中,每个L个输入样本的帧的所述子带幅值为中心样本或近中心样本的幅值。
7.根据前述权利要求中的任一项所述的系统,其中,所述块提取器(201)被配置成通过对分析子带信号中的所述复值分析样本进行下采样来得到输入样本的至少一个帧。
8.根据权利要求7所述的系统,其针对Y=2来配置,并且所述块提取器被配置成通过分别由满足 且满足D1≥0,D2>0或D1>0,D2≥0的下采样因数D1和D2对第一分析子带信号和第二分析子带信号中的所述复值分析样本进行下采样来得到输入样本的第一帧和第二帧,
并且其中,所述非线性帧处理单元(202)被配置成使用输入样本的第一帧和第二帧中的相应输入样本的各自的相位的非负整数系数T1、T2,基于线性组合来确定所述经处理的样本的相位。
9.根据前述权利要求中的任一项所述的系统,其中,连续的复权重仅相差固定的相位旋转,诸如与所述输入信号的基频成比例的相位旋转。
10.根据前述权利要求中的任一项所述的系统,其中,所述重叠及相加单元(204)对经处理的样本的连续的帧应用跳跃大小,所述跳跃大小等于所述块跳跃大小h乘以所述子带拉伸因数S。
11.根据前述权利要求中的任一项所述的系统,其针对Y=2来配置,其中,所述帧处理单元(202)被配置成:将所述经处理的样本的幅值确定为输入样本的第一帧中的相应输入样本的幅值和输入样本的第二帧中的相应输入样本的幅值的平均值,以及/或者基于输入样本的第一帧和第二帧中的相应输入样本的各自相位的使用非负整数系数T1,T2的线性组合来确定所述经处理的样本的相位。
12.根据前述权利要求中的任一项所述的系统,还包括:
多个子带处理单元(401,402;503;602-2,602-3,602-4),每个子带处理单元被配置成使用所述子带换位因数Q和/或所述子带拉伸因数S的不同值来确定中间合成子带信号;以及
合并单元(405;603),其被布置在所述多个子带处理单元的下游和所述合成滤波器组(103)的上游,所述合并单元(405;603)被配置成将相应中间合成子带信号合并以确定所述合成子带信号。
13.根据前述权利要求中的任一项所述的系统,其中:
所述分析滤波器组(101)被配置成根据所述输入信号形成Y×Z个分析子带信号;
所述子带处理单元(102)被配置成应用一个合成子带信号所基于的每组Y个分析子带信号的一对S和Q值,根据所述Y×Z个分析子带信号来生成Z个合成子带信号;并且
所述合成滤波器组(103)被配置成根据所述Z个合成子带信号来生成Z个时间拉伸信号和/或频率换位信号。
14.一种用于根据输入信号来生成时间拉伸信号和/或频率换位信号的方法,所述方法包括:
根据所述输入信号得到数量Y≥2个分析子带信号,其中,每个分析子带信号包括多个复值分析样本,每个复值分析样本具有相位和幅值;
针对所述Y个分析子带中的每个:
形成从分析子带信号中的所述多个复值分析样本提取的L个输入样本的帧,帧长度L>1;以及
在形成后续的L个输入样本的帧之前,对所述多个分析样本应用h个样本的块跳跃大小;
基于这样形成的输入样本的Y个相应帧,通过确定所述帧的每个经处理的样本的相位和幅值来生成经处理的样本的帧,其中,对于至少一个经处理的样本:
i)所述经处理的样本的相位基于输入样本的所述Y个帧中的相应输入样本的各自的相位;并且
ii)所述经处理的样本的幅值基于输入样本的所述Y个帧中的相应输入样本的幅值;
通过对经处理的样本的每个帧应用有限长度窗口函数然后将所述系列的样本进行重叠及相加来确定合成子带信号,其中,所述窗口函数包括多个窗口样本,并且其中多个窗口函数的重叠及相加的窗口样本当由复权重加权并且以Sh跳跃大小偏移时形成实质上恒定的序列;以及
至少根据所述合成子带信号来生成所述时间拉伸信号和/或频率换位信号。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US38344110P | 2010-09-16 | 2010-09-16 | |
US61/383,441 | 2010-09-16 | ||
US41916410P | 2010-12-02 | 2010-12-02 | |
US61/419,164 | 2010-12-02 | ||
CN201180044307.6A CN103262164B (zh) | 2010-09-16 | 2011-09-05 | 叉积增强的基于子带块的谐波换位 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201180044307.6A Division CN103262164B (zh) | 2010-09-16 | 2011-09-05 | 叉积增强的基于子带块的谐波换位 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104851429A true CN104851429A (zh) | 2015-08-19 |
CN104851429B CN104851429B (zh) | 2018-10-19 |
Family
ID=44720852
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201180044307.6A Active CN103262164B (zh) | 2010-09-16 | 2011-09-05 | 叉积增强的基于子带块的谐波换位 |
CN201510245547.2A Active CN104851429B (zh) | 2010-09-16 | 2011-09-05 | 叉积增强的基于子带块的谐波换位 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201180044307.6A Active CN103262164B (zh) | 2010-09-16 | 2011-09-05 | 叉积增强的基于子带块的谐波换位 |
Country Status (18)
Country | Link |
---|---|
US (8) | US9172342B2 (zh) |
EP (6) | EP3975178B1 (zh) |
JP (9) | JP5951614B2 (zh) |
KR (11) | KR101863035B1 (zh) |
CN (2) | CN103262164B (zh) |
AU (1) | AU2011304113C1 (zh) |
BR (4) | BR122019025121B1 (zh) |
CA (10) | CA3220202A1 (zh) |
CL (1) | CL2013000717A1 (zh) |
DK (3) | DK3975177T3 (zh) |
ES (3) | ES2938725T3 (zh) |
IL (11) | IL303921A (zh) |
MX (1) | MX2013002876A (zh) |
MY (2) | MY155990A (zh) |
PL (3) | PL3975177T3 (zh) |
RU (6) | RU2671619C2 (zh) |
SG (3) | SG10202103492XA (zh) |
WO (1) | WO2012034890A1 (zh) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8958510B1 (en) * | 2010-06-10 | 2015-02-17 | Fredric J. Harris | Selectable bandwidth filter |
EP2682941A1 (de) | 2012-07-02 | 2014-01-08 | Technische Universität Ilmenau | Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne |
TWI557727B (zh) | 2013-04-05 | 2016-11-11 | 杜比國際公司 | 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品 |
WO2015041477A1 (ko) | 2013-09-17 | 2015-03-26 | 주식회사 윌러스표준기술연구소 | 오디오 신호 처리 방법 및 장치 |
US10204630B2 (en) | 2013-10-22 | 2019-02-12 | Electronics And Telecommunications Research Instit Ute | Method for generating filter for audio signal and parameterizing device therefor |
US10163447B2 (en) * | 2013-12-16 | 2018-12-25 | Qualcomm Incorporated | High-band signal modeling |
BR112016014892B1 (pt) | 2013-12-23 | 2022-05-03 | Gcoa Co., Ltd. | Método e aparelho para processamento de sinal de áudio |
EP4294055A1 (en) | 2014-03-19 | 2023-12-20 | Wilus Institute of Standards and Technology Inc. | Audio signal processing method and apparatus |
CN108966111B (zh) | 2014-04-02 | 2021-10-26 | 韦勒斯标准与技术协会公司 | 音频信号处理方法和装置 |
US9306606B2 (en) * | 2014-06-10 | 2016-04-05 | The Boeing Company | Nonlinear filtering using polyphase filter banks |
WO2016142002A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
TWI758146B (zh) * | 2015-03-13 | 2022-03-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
EP3171362B1 (en) * | 2015-11-19 | 2019-08-28 | Harman Becker Automotive Systems GmbH | Bass enhancement and separation of an audio signal into a harmonic and transient signal component |
CN110266287B (zh) * | 2019-05-05 | 2023-06-23 | 深圳信息职业技术学院 | 电子耳蜗分数延迟滤波器构造方法、存储介质及电子耳蜗 |
US10938444B2 (en) * | 2019-07-12 | 2021-03-02 | Avago Technologies International Sales Pte. Limited | Apparatus and method for noise reduction in a full duplex repeater |
US11344298B2 (en) | 2019-12-06 | 2022-05-31 | Covidien Lp | Surgical stapling device |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1315033A (zh) * | 1998-08-28 | 2001-09-26 | 西格玛音声研究有限公司 | 用于音频信号的时标和/或间距修改的信号处理技术 |
CN1606687A (zh) * | 2002-09-19 | 2005-04-13 | 松下电器产业株式会社 | 音频解码设备和方法 |
WO2010081892A2 (en) * | 2009-01-16 | 2010-07-22 | Dolby Sweden Ab | Cross product enhanced harmonic transposition |
WO2010086461A1 (en) * | 2009-01-28 | 2010-08-05 | Dolby International Ab | Improved harmonic transposition |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5774837A (en) | 1995-09-13 | 1998-06-30 | Voxware, Inc. | Speech coding system and method using voicing probability determination |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
JP3518737B2 (ja) * | 1999-10-25 | 2004-04-12 | 日本ビクター株式会社 | オーディオ符号化装置、オーディオ符号化方法、及びオーディオ符号化信号記録媒体 |
SE0004163D0 (sv) * | 2000-11-14 | 2000-11-14 | Coding Technologies Sweden Ab | Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering |
CA2365203A1 (en) * | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
JP3537807B2 (ja) * | 2002-02-28 | 2004-06-14 | 株式会社神戸製鋼所 | デジタルデータ処理装置,およびその方法 |
SE0301273D0 (sv) | 2003-04-30 | 2003-04-30 | Coding Technologies Sweden Ab | Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods |
KR101106026B1 (ko) | 2003-10-30 | 2012-01-17 | 돌비 인터네셔널 에이비 | 오디오 신호 인코딩 또는 디코딩 |
US7460990B2 (en) | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
US20090299756A1 (en) * | 2004-03-01 | 2009-12-03 | Dolby Laboratories Licensing Corporation | Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners |
KR100608062B1 (ko) * | 2004-08-04 | 2006-08-02 | 삼성전자주식회사 | 오디오 데이터의 고주파수 복원 방법 및 그 장치 |
KR100956877B1 (ko) * | 2005-04-01 | 2010-05-11 | 콸콤 인코포레이티드 | 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치 |
US20070078645A1 (en) * | 2005-09-30 | 2007-04-05 | Nokia Corporation | Filterbank-based processing of speech signals |
EP4372743A2 (en) | 2006-01-27 | 2024-05-22 | Dolby International AB | Efficient filtering with a complex modulated filterbank |
JP2007316254A (ja) * | 2006-05-24 | 2007-12-06 | Sony Corp | オーディオ信号補間方法及びオーディオ信号補間装置 |
WO2008022181A2 (en) | 2006-08-15 | 2008-02-21 | Broadcom Corporation | Updating of decoder states after packet loss concealment |
JP4918841B2 (ja) * | 2006-10-23 | 2012-04-18 | 富士通株式会社 | 符号化システム |
EP3273442B1 (en) * | 2008-03-20 | 2021-10-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for synthesizing a parameterized representation of an audio signal |
US9142221B2 (en) * | 2008-04-07 | 2015-09-22 | Cambridge Silicon Radio Limited | Noise reduction |
KR101239812B1 (ko) * | 2008-07-11 | 2013-03-06 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 대역폭 확장 신호를 생성하기 위한 장치 및 방법 |
EP2214165A3 (en) | 2009-01-30 | 2010-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
PL3564954T3 (pl) * | 2010-01-19 | 2021-04-06 | Dolby International Ab | Ulepszona transpozycja harmonicznych oparta na bloku podpasma |
CA2792452C (en) | 2010-03-09 | 2018-01-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for processing an input audio signal using cascaded filterbanks |
-
2011
- 2011-09-05 CA CA3220202A patent/CA3220202A1/en active Pending
- 2011-09-05 CN CN201180044307.6A patent/CN103262164B/zh active Active
- 2011-09-05 CA CA2808353A patent/CA2808353C/en active Active
- 2011-09-05 KR KR1020177014269A patent/KR101863035B1/ko active IP Right Grant
- 2011-09-05 SG SG10202103492XA patent/SG10202103492XA/en unknown
- 2011-09-05 BR BR122019025121-5A patent/BR122019025121B1/pt active IP Right Grant
- 2011-09-05 EP EP21204206.3A patent/EP3975178B1/en active Active
- 2011-09-05 CA CA3137515A patent/CA3137515C/en active Active
- 2011-09-05 KR KR1020197013601A patent/KR102014696B1/ko active IP Right Grant
- 2011-09-05 EP EP22202637.9A patent/EP4148732B1/en active Active
- 2011-09-05 KR KR1020187033935A patent/KR101980070B1/ko active IP Right Grant
- 2011-09-05 DK DK21204205.5T patent/DK3975177T3/da active
- 2011-09-05 DK DK21204206.3T patent/DK3975178T3/da active
- 2011-09-05 KR KR1020237026369A patent/KR20230119038A/ko active IP Right Grant
- 2011-09-05 BR BR122019025115-0A patent/BR122019025115B1/pt active IP Right Grant
- 2011-09-05 ES ES21204205T patent/ES2938725T3/es active Active
- 2011-09-05 EP EP21204205.5A patent/EP3975177B1/en active Active
- 2011-09-05 EP EP11763872.6A patent/EP2617035B1/en active Active
- 2011-09-05 KR KR1020207002646A patent/KR102312475B1/ko active IP Right Grant
- 2011-09-05 BR BR112013005676-2A patent/BR112013005676B1/pt active IP Right Grant
- 2011-09-05 ES ES21204206T patent/ES2933477T3/es active Active
- 2011-09-05 KR KR1020197023879A patent/KR102073544B1/ko active IP Right Grant
- 2011-09-05 EP EP18198247.1A patent/EP3503100A1/en active Pending
- 2011-09-05 WO PCT/EP2011/065318 patent/WO2012034890A1/en active Application Filing
- 2011-09-05 SG SG2013011804A patent/SG188229A1/en unknown
- 2011-09-05 KR KR1020187014134A patent/KR101924326B1/ko active IP Right Grant
- 2011-09-05 RU RU2015105671A patent/RU2671619C2/ru active
- 2011-09-05 CA CA3102325A patent/CA3102325C/en active Active
- 2011-09-05 MX MX2013002876A patent/MX2013002876A/es active IP Right Grant
- 2011-09-05 PL PL21204205.5T patent/PL3975177T3/pl unknown
- 2011-09-05 PL PL11763872T patent/PL2617035T3/pl unknown
- 2011-09-05 IL IL303921A patent/IL303921A/en unknown
- 2011-09-05 KR KR1020147026155A patent/KR101744621B1/ko active IP Right Grant
- 2011-09-05 CA CA3067155A patent/CA3067155C/en active Active
- 2011-09-05 MY MYPI2013000542A patent/MY155990A/en unknown
- 2011-09-05 SG SG10201506914PA patent/SG10201506914PA/en unknown
- 2011-09-05 AU AU2011304113A patent/AU2011304113C1/en active Active
- 2011-09-05 IL IL291501A patent/IL291501B2/en unknown
- 2011-09-05 CN CN201510245547.2A patent/CN104851429B/zh active Active
- 2011-09-05 ES ES11763872T patent/ES2699750T3/es active Active
- 2011-09-05 CA CA3043428A patent/CA3043428C/en active Active
- 2011-09-05 US US13/822,601 patent/US9172342B2/en active Active
- 2011-09-05 EP EP22202639.5A patent/EP4145445A1/en active Pending
- 2011-09-05 PL PL21204206.3T patent/PL3975178T3/pl unknown
- 2011-09-05 KR KR1020137009361A patent/KR101610626B1/ko active IP Right Grant
- 2011-09-05 IL IL296448A patent/IL296448A/en unknown
- 2011-09-05 MY MYPI2014003119A patent/MY176574A/en unknown
- 2011-09-05 CA CA2961088A patent/CA2961088C/en active Active
- 2011-09-05 KR KR1020217032100A patent/KR102439053B1/ko active IP Right Grant
- 2011-09-05 JP JP2013528595A patent/JP5951614B2/ja active Active
- 2011-09-05 CA CA3191597A patent/CA3191597C/en active Active
- 2011-09-05 DK DK11763872.6T patent/DK2617035T3/da active
- 2011-09-05 RU RU2013117038/08A patent/RU2551817C2/ru active
- 2011-09-05 KR KR1020227029790A patent/KR102564590B1/ko active IP Right Grant
- 2011-09-05 CA CA3168514A patent/CA3168514C/en active Active
- 2011-09-05 CA CA3239279A patent/CA3239279A1/en active Pending
- 2011-09-05 IL IL298230A patent/IL298230B2/en unknown
- 2011-09-05 BR BR122019025142-8A patent/BR122019025142B1/pt active IP Right Grant
-
2013
- 2013-02-18 IL IL224785A patent/IL224785A/en active IP Right Grant
- 2013-03-15 CL CL2013000717A patent/CL2013000717A1/es unknown
-
2015
- 2015-07-21 IL IL240068A patent/IL240068A/en active IP Right Grant
- 2015-09-15 US US14/854,498 patent/US9735750B2/en active Active
-
2016
- 2016-06-08 JP JP2016114659A patent/JP6218889B2/ja active Active
-
2017
- 2017-04-06 US US15/480,859 patent/US9940941B2/en active Active
- 2017-07-10 IL IL253387A patent/IL253387B/en active IP Right Grant
- 2017-09-26 JP JP2017184543A patent/JP6429966B2/ja active Active
-
2018
- 2018-02-26 US US15/904,702 patent/US10192562B2/en active Active
- 2018-05-01 IL IL259070A patent/IL259070A/en active IP Right Grant
- 2018-10-10 RU RU2018135675A patent/RU2682340C1/ru active
- 2018-10-30 JP JP2018203461A patent/JP6736634B2/ja active Active
- 2018-12-06 US US16/211,563 patent/US10446161B2/en active Active
-
2019
- 2019-01-16 RU RU2019101031A patent/RU2685993C1/ru active
- 2019-03-25 RU RU2019108565A patent/RU2694587C1/ru active
- 2019-03-31 IL IL265722A patent/IL265722B/en active IP Right Grant
- 2019-06-10 RU RU2019117896A patent/RU2720495C1/ru active
- 2019-08-20 US US16/545,359 patent/US10706863B2/en active Active
-
2020
- 2020-04-01 JP JP2020065607A patent/JP6755426B2/ja active Active
- 2020-06-30 US US16/917,171 patent/US11355133B2/en active Active
- 2020-08-25 JP JP2020141616A patent/JP6849847B2/ja active Active
- 2020-11-04 IL IL278478A patent/IL278478B/en unknown
-
2021
- 2021-03-04 JP JP2021034191A patent/JP7053912B6/ja active Active
- 2021-08-02 IL IL285298A patent/IL285298B/en unknown
-
2022
- 2022-03-31 JP JP2022058101A patent/JP7273218B2/ja active Active
- 2022-06-01 US US17/829,733 patent/US11817110B2/en active Active
-
2023
- 2023-04-27 JP JP2023072979A patent/JP2023086885A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1315033A (zh) * | 1998-08-28 | 2001-09-26 | 西格玛音声研究有限公司 | 用于音频信号的时标和/或间距修改的信号处理技术 |
CN1606687A (zh) * | 2002-09-19 | 2005-04-13 | 松下电器产业株式会社 | 音频解码设备和方法 |
WO2010081892A2 (en) * | 2009-01-16 | 2010-07-22 | Dolby Sweden Ab | Cross product enhanced harmonic transposition |
WO2010086461A1 (en) * | 2009-01-28 | 2010-08-05 | Dolby International Ab | Improved harmonic transposition |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103262164B (zh) | 叉积增强的基于子带块的谐波换位 | |
CN102741921B (zh) | 改进的基于子带块的谐波换位 | |
CN102576541B (zh) | 组合换位滤波器组的过采样 | |
AU2020200340B2 (en) | Cross Product Enhanced Subband Block Based Harmonic Transposition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
EXSB | Decision made by sipo to initiate substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |