CN103270553B - 对正交镜像滤波器式音频编译码器的输出信号的重新取样 - Google Patents
对正交镜像滤波器式音频编译码器的输出信号的重新取样 Download PDFInfo
- Publication number
- CN103270553B CN103270553B CN201180049599.2A CN201180049599A CN103270553B CN 103270553 B CN103270553 B CN 103270553B CN 201180049599 A CN201180049599 A CN 201180049599A CN 103270553 B CN103270553 B CN 103270553B
- Authority
- CN
- China
- Prior art keywords
- signal
- filter row
- sub
- sampling rate
- composite filter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012952 Resampling Methods 0.000 title claims description 23
- 238000005070 sampling Methods 0.000 claims abstract description 205
- 238000004458 analytical method Methods 0.000 claims abstract description 134
- 239000002131 composite material Substances 0.000 claims abstract description 126
- 230000005236 sound signal Effects 0.000 claims abstract description 124
- 238000000034 method Methods 0.000 claims abstract description 76
- 230000008569 process Effects 0.000 claims abstract description 47
- 230000015572 biosynthetic process Effects 0.000 claims description 52
- 238000003786 synthesis reaction Methods 0.000 claims description 51
- 230000010076 replication Effects 0.000 claims description 14
- 230000003595 spectral effect Effects 0.000 claims description 14
- 238000002156 mixing Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 2
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical class OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 abstract 1
- 238000006243 chemical reaction Methods 0.000 description 11
- 238000004590 computer program Methods 0.000 description 8
- 230000008859 change Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 239000000853 adhesive Substances 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 235000017060 Arachis glabrata Nutrition 0.000 description 1
- 241001553178 Arachis glabrata Species 0.000 description 1
- 235000010777 Arachis hypogaea Nutrition 0.000 description 1
- 235000018262 Arachis monticola Nutrition 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010205 computational analysis Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 235000020232 peanut Nutrition 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
- H03H17/0211—Frequency selective networks using specific transformation algorithms, e.g. WALSH functions, Fermat transforms, Mersenne transforms, polynomial transforms, Hilbert transforms
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
- H03H17/0248—Filters characterised by a particular frequency response or filtering method
- H03H17/0264—Filter sets with mutual related characteristics
- H03H17/0272—Quadrature mirror filters
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
- H03H17/06—Non-recursive filters
- H03H17/0621—Non-recursive filters with input-sampling frequency and output-delivery frequency which differ, e.g. extrapolation; Anti-aliasing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
- H03H17/0294—Variable filters; Programmable filters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Algebra (AREA)
- Computing Systems (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
Abstract
提供一种用以处理音频信号的装置。此装置包含一个可配置式第一音频信号处理器(110),其依据不同的配置设定值(conf)处理该音频信号(s0),得到一个处理过的音频信号(s1),其中,该装置经调适使不同的配置设定值(conf)造成该处理过的音频信号(s1)的不同取样率(sr1)。该装置进一步包含:具有第一数目(c1)的分析滤波器排组通道的分析滤波器排组(120);具有第二数目(c2)的合成滤波器排组通道的合成滤波器排组(130);经调适可接收及处理一个具有某一预定的取样率(sr2)的音频信号(s2)的第二音频处理器;和控制器(150),其可依据一个配置设定值(conf)来控制分析滤波器排组通道的第一数目(c1)或合成滤波器排组频道的第二数目(c2)。
Description
技术领域
本发明是有关音频处理技术,以及是特别涉及一种用以重新取样一个正交镜像滤波器式(QMF)音频编译码器的输出信号的装置与方法。
背景技术
大部分低端音频消费性电子产品,由于成本的理由,会使用具有固定取样率的数模转换器。但当需要多媒体使能装置支持不同类型的音频来源时,重新取样的处理便不可避免,因为媒体文件或许会使用不同的取样率来编码,以及一些通信编译码器会使用到不同的取样率。选择不同的取样率,就不同音频编译码器的运作和处理方法而言,是一项重要的课题。需要支持的不同取样率愈多,其取样率调适性和重新取样任务便愈复杂。
举例而言,在当前的MPEG-D USAC(USAC=统一语音和音频编码)参考模型中,所采用的是某些不常见(非16000Hz或22050Hz的整数倍)的取样率。这些速率是在以下两方面间妥协的结果:第一,为其专属设计且在某种程度上支配着整体系统取样率的集成ACELP编码工具的标称取样率;和第二,增加取样率连同要能编码更大音频带宽及/或要实现可缩放性的位率的心愿。
部份地,该等不常见的取样率亦为AMR-WB+系统的一个传代物,该参考模型有部份是由其演绎出。而且,正如在低位率音频编码的实践中所常见,该取样率和因而的音频带宽在一些低位率USAC的运作点处大大地降低。
在低USAC位率下,特别是当前所采用的取样率,会有上述两者的问题出现。这些与廉价的硬件D/A转换器并不兼容,并且或将需要一个附 加的后重新取样步骤。音频带宽是受限于尼奎斯特(Nyquist)频率,其是十分低于人类可闻范围的上限。
为调适一个音频处理器的输出取样率,有一些附加的重新取样功能模块会被用作此一目的,需要相当数量的附加计算资源。就此目的所用的技术,已许久未做改变,基本上包括一个内插器和一些可选的上取样器和下样器模块。
发明内容
本发明的一个目的为提供一种可重新取样音频信号的先进概念。本发明的目的,是通过根据本发明的处理音频信号的装置和方法、以及相应的程序,来加以解决。
依据本发明,提供有一个用以处理音频信号的装置。此装置包含有一个可配置式第一音频信号处理器,其可依据不同的配置设定值,来处理该音频信号,从而得到一个处理过的音频信号,其中,该装置经调适,可使不同的配置设定值造成该处理过的音频信号的不同取样率。该装置进一步包含有:一个具有第一数目的分析滤波器排组通道的分析滤波器排组;一个具有第二数目的合成滤波器排组通道的合成滤波器排组;和一个经调适可接收及处理一个具有某一预定的取样率的音频信号的第二音频处理器。
此外,该装置包含有一个控制器,其可依据一个提供给该可配置式第一音频信号处理器的配置设定值,来控制第一数目的分析滤波器排组通道,或第二数目的合成滤波器排组通道,从而使该合成滤波器排组所输出的音频信号具有该预定的取样率或具有不同于该预定的取样率但比一个分析滤波器排组的输入信号的取样率更接近该预定的取样率的一取样率。
本发明基于的研究结果是,通过改变该频域表示信号带宽,其等效产生的时域信号将具有不同的取样率,使如同在频域中并无带宽被改变的情况。该带宽变更的运作很低廉,因为其可通过删除或添加频域数据来加以完成。
自频域至时域的转换步骤势必要加以修改,以便能处置不同的频域带宽(变换长度)。
该经修改的带宽频域信号表示亦可延伸至整个信号处理方法,而非受限于该滤波器排组,因而可允许其整体处理利用到其实际的目标输出信号特性。
即使不是使所有的音频信号来源为一个单一输出取样率,降低不同输出取样率的数量早已在一个给定的装置方面省下了大量计算上的资源。
一个滤波器排组的复杂性是直接与其长度相关。若一个滤波器排组时域信号合成变换针对下取样加以修改,则通过降低该变换长度,其复杂性将会被降低。若其是就上取样加以使用,则通过扩大其变换长度,其复杂性将会增加,但仍是远低于一个具有等效信号失真特性的附加的重新取样器所需的复杂性。而且,总信号失真将会比较小,因为一个附加的重新取样器所引起的任何附加的信号失真将会被消除。
依据一个实施例,该分析滤波器排组经调适可将在一个时域中所表示的分析滤波器排组输入信号变换成一个具有多个第一子频带信号的第一时频域音频信号,其中,第一子频带信号的数目等于分析滤波器排组通道的第一数目。依据此实施例,该装置进一步包含有一个信号调整器单元,其经调适可基于该配置设定值(conf)由该第一时频域音频信号产生一个具有多个第二子频带信号的第二时频域音频信号,使该第二时频域音频信号的第二子频带信号的数目等于合成滤波器排组通道的数目。该第二时频域音频信号的第二子频带信号的数目不同于该第一时频域音频信号的子频带信号的数目。此外,该合成滤波器排组经调适,可将该第二时频域音频信号变换成一个时域音频信号,作为该合成滤波器排组的音频信号输出。
在另一个实施例中,该信号调整器单元可能经调适,使通过产生至少一个附加的子频带信号来产生该第二时频域音频信号。在又一个实施例中,该信号调整器单元经调适,可通过进行光频带复制来产生至少一个附加的子频带信号,从而产生至少一个附加的子频带信号。在另一个实施例中,该信号调整器单元经调适,可产生一个零信号作为一个附加的子频带信号。
依据一个实施例,该分析滤波器排组是一个QMF(正交镜像滤波器)分析滤波器排组,以及该合成滤波器排组是一个QMF合成滤波器排组。在一个可替换实施例中,该分析滤波器排组是一个MDCT(改进型离散余弦转换)分析滤波器排组,以及该合成滤波器排组是一个MDCT合成滤波器排组。
在一个实施例中,该装置可能包含有一个附加的重新取样器,其经调适可接收一个具有第一合成取样率的合成滤波器排组输出信号。该附加的重新取样器可能重新取样该合成滤波器排组输出信号,从而接收一个具有第二合成取样率的重新取样式输出信号。通过结合上述依据一个实施例的装置和一个附加的重新取样器,上述被采用的重新取样器的复杂性可能降低。可能采用两个低复杂性重新取样器,而非采用一个高复杂性重新取样器。
在另一个实施例中,该装置经调适,可能将一个具有第一合成取样率的合成滤波器排组输出信号作为一个分析滤波器排组输入信号馈入一个分析滤波器排组内。藉此,再一次,上述依据一个实施例的装置的复杂性可能降低。并非采用一个分析滤波器排组和一个具有为数庞大的分析和合成滤波器排组通道的合成滤波器排组,滤波器排组通道数目将会显著地降低。此是通过一次或多次重复该分析和合成变换来达成。依据一个实施例中,这些分析和合成滤波器排组经调适,可能使这些分析和合成滤波器排组通道数目针对每一个变换周期(一个变换周期包含一个分析步骤和一个合成步骤)是可能加以改变。
该控制器经调适可接收一个包含一项指数的配置设定值。此外,该控制器接着可能经调适以基于该指数和一个查找表,来决定上述经处理的音频信号的取样率或该预定的取样率。依据这些实施例,并非必需在每个配置设定值内传输显式数目的分析和合成滤波器排组通道,取而代之的是,传输一个可识别该特定的配置的单一指数。此可降低传输一个配置设定值所需的位率。
依据一个实施例,该控制器经调适,可基于某一容许误差来决定分析滤波器排组通道的第一数目或合成滤波器排组通道的第二数目。在一个实 施例中,该控制器可能包含有一个可使该实际误差与一个容许误差做比较的误差比较器。此外,该装置可能经调适,从而自该配置设定值得到该容许误差。依据这些实施例,可能指明该重新取样的准确度。理应察觉到的是,在某一定的情况中,该重新取样的准确度是可降低的,而另一方面亦可降低该分析和合成滤波器排组的复杂性,因而可降低其计算的复杂性。
依据另一个实施例,提供了一个用于上混合环绕信号的装置。该装置包含有一个分析滤波器排组,其可将一个下混合式时域信号变换成一个时频域,从而产生多个下混合式子频带信号。此外,该装置包含有至少两个上混合器,其可上混合这些多个子频带信号从而得到多个环绕子频带信号。此外,该装置包含有至少两个信号调整器单元,用于调整环绕子频带信号的数目。该至少两个信号调整器单元经调适,可接收第一多个的输入环绕子频带信号。该至少两个信号调整器单元经调适,可输出第二多个的输出环绕子频带信号,以及其中,该第一多个的输入环绕子频带信号的数目和该第二多个的输出环绕子频带信号的数目是不相同。此外,该装置包含有多个合成滤波器排组单元,用于使多个输出环绕子频带信号自一个时频域变换至一个时域,从而得到一些时域环绕输出信号。此外,该装置包含有一个经调适可接收一个配置设定值的控制器。而且,此控制器经调适,可基于该接收到的配置设定值,来控制分析滤波器排组的通道数目,来控制合成滤波器排组单元的信道数目,来控制该信号调整器单元的第一多个输入环绕子频带信号的数目,以及来控制该信号调整器单元的第二多个的输出环绕子频带信号的数目。
附图说明
本发明的较佳实施例,随继是参照所附诸图加以讨论,其中:
图1是例示依据一个实施例用以处理音频信号的一个装置;
图2a至图2c是描述时域样本至时频域样本的变换;
图3a至图3b是例示时频域样本至时域样本的变换;
图4是以进一步的实例来描述时频域样本至时域样本的变换;
图5是例示两个用以描述一个实施例的基本观念的简图;
图6是例示依据又一实施例的一个装置;
图7a至图7b是显示一些依据一个实施例的查找表;
图8是例示依据一个采用SBR处理的实施例的一个装置;
图9是描述依据另一个实施例采用QMF分析和合成滤波器排组以依据一个实施例的重新取样式取样率来上混合MPEG环绕信号的一个装置;
图10是例示依据另一个实施例而采用SBR处理的一个装置;
图11是描述依据另一个实施例而包含有一个附加的重新取样器的装置;
图12是例示依据一个实施例而采用QMF作为重新取样器的一个装置;
图13是显示依据一个实施例而采用一个附加的重新取样器的装置;
图14是例示依据另一个实施例而采用QMF作为重新取样器的一个装置;
图15是描述依据又一个实施例的一个装置,其中,该装置经调适可将合成滤波器排组输出馈入该分析滤波器排组内,从而进行另一个变换周期;
图16是例示依据另一个实施例而包含有一个误差比较器的控制器;
图17是显示一个用以描述分别决定分析和合成滤波器排组通道数目的方法的流程图;以及
图18则是例示依据又一个实施例包含有一个误差比较器的一个控制器。
具体实施方式
图1是例示依据一个实施例用以处理音频信号的一个装置。一个音频信号s0馈入该装置内。在另一个实施例中,s0可能是一个比特流,特别地,一个音频数据比特流。此外,该装置可接收一个配置设定值conf。该装置包含有一个可配置式第一音频信号处理器110,用于依据该配置设定值conf来处理该音频信号s0,从而得到一个处理过的音频信号s1。此外,上述用以处理一个音频信号的装置经调适可使不同的配置设定值conf造成该处理过的音频信号的不同的取样率。该装置进一步包含有一个具有第一数目c1的分析滤波器排组通道的分析滤波器排组120,和一个具有第二数 目c2的合成滤波器排组通道的合成滤波器排组130。此外,该装置包含有一个经调适可接收及处理一个具有某一预定的取样率的音频信号s2的第二音频处理器140。此外,该装置包含有一个控制器150,其可依据一个提供给该可配置式第一音频信号处理器110的配置设定值conf,来控制分析滤波器排组通道的第一数目c1,或合成滤波器排组频道的第二数目c2,从而使经由该合成滤波器排组130的音频信号输出s2具有该预定的取样率或具有某一取样率(其不同于该预定的取样率,但比起一个进入该分析滤波器排组120内的输入信号s1更接近该预定的取样率的取样率)。
该分析滤波器排组和合成滤波器排组或许会加以调适,使该分析通道数目和该合成信道数目是可配置式的,以及其数目或许会由该可配置式参数来加以决定。
在图2a至图2c中,示出了时域样本成为时频域样本的变换。图2a的左侧是例示一个时域中的(处理过的)音频信号的多个样本。在图2a的左侧,例示640个时间样本(最后的64个时间样本被称为“新时间样本”,而剩余的576个时间样本被称为旧时间样本)。在图2a所描述的实施例中,是进行一个短时间傅立叶变换(STFT)的第一步骤。该576个旧时间样本和该64个新时间样本被变换成64个频率值,亦即,有64个子频带样本值产生。
在图2b所例示的后继步骤中,所考虑的640个时间样本中的最旧的64个时间样本被舍弃。取而代之的是,64个新时间样本连同图2a所例示的处理步骤中可得的剩余576个早已被纳入考虑的时间取样一起加以考虑。此可被视为使一个具有640个时间样本的长度的滑行窗口,在每个处理步骤中逐64个时间样本进行取样。再一次,而且,在图2b内所描述的处理步骤中,由上述纳入考虑的640个时间样本产生出进一步的64个子频带样本(第一次考虑的是576个旧时间样本和64个新时间样本)。藉此,会有第二组的64个子频带值产生。64个新子频带样本,可以说是通过将64个新时间样本纳入考虑而产生出。
在图2c所描述的后继步骤中,再一次,该滑行窗口偏移了64个时间样本,亦即,最旧的64个时间值会被舍弃,以及64个新时间样本会被纳 入考虑。64个新子频带样本是基于576个旧时间样本和64个新时间样本而产生出。诚如可由图2c的右侧看出,已有一个新组的64个新子频带值通过进行STFT而产生出。
图2a至图2c中所例示的处理会重复地进行,从而自一些额外的时间样本产生一些额外的子频带样本。
以一般性术语来解译,要产生64个新子频带样本需要64个新时间样本。
在图2a至图2c所例示的实施例中,每一组所产生的子频带样本表示时频域中的特定时间指数处的子频带样本。亦即,时间指数j的第32个子频带样本表示时频域中的信号样本S[32,j]。关于该时频域中的某一定时间指数,就该时间指数有64个子频带值存在,而就该时域中的每个时间点(point-in-time),最多有单一信号值存在。反之,64个频带的各取样率在该时域中仅为该信号的1/64。
本领域的专业人士可了解的是,一个分析滤波器排组所产生的子频带信号的数目是取决于该分析滤波器排组的通道数目。举例而言,该分析滤波器排组或许会包含有16、32、96、或128个通道,使得可能分别自以16、32、96、或128个为例的时间样本产生时频域中的16、32、96、或128个子频带信号。
图3a至图3b是例示时频域样本成为时域样本的变换:
图3a的左侧,例示一个时频域中的子频带样本的多个组。更明确而言,图3a中的每个矩形方块表示时频域中的多个的64个子频带样本。该时频域中的一个滑行窗口涵盖了10个各包含该时频域中的64个子频带样本的时间指数。通过进行一个逆短时间傅立叶变换(ISTFT),如图3a的右侧中所描述,会由该纳入考虑的(10乘64)子频带样本产生出64个时间样本。
在图3b内所例示的后继处理步骤中,舍弃最旧组的64个子频带值。取而代之的是,该滑行窗口如今是涵盖一个新组的64个子频带值,其具有一个在该时频域中的不同的时间指数。64个新时间样本,是在该时域中,由该纳入考虑的640个子频带样本(第一次考虑的是576个旧时间样本和 64个新时间样本)产生出。图3b的右侧,例示在该时域中的情况。图3b是描述通过进行如图3a中所例示的ISTFT而产生出的64个旧时间样本,连同图3b的处理步骤中所产生的64个新时间样本。
图3a至图3b中所例示的处理被重复进行,从而自一些附加的子频带样本产生出一些附加的时间样本。
要以一般性术语来解释该合成滤波器排组130的概念,需要时频域中的64个新子频带样本从而在一个时域中产生64个新时间样本。
本领域的专业人士可了解的是,一个合成滤波器排组所产生的时间样本的数目是取决于该合成滤波器排组的通道数目。举例而言,该合成滤波器排组或许会包含有16、32、96、或128个通道,以致一个时频域中的16、32、96、或128个子频带信号可能分别产生自一个时频域中以16、32、96、或128个为例的时间样本。
图4是展示另一个用以描述时频域样本成为时域样本的变换的实例。在每个处理步骤中,有一个附加的64个子频带样本会纳入考虑(亦即,在一个时频域中的下一时间指数的64个子频带样本)。将最近的64个子频带样本纳入考虑,可产生出64个新时间样本。该时域中的信号的取样率是各个64个子频带信号的取样率的64倍。
图5是例示两个用以描述一个实施例的基本观念的简图。图5的上部是描述一个时频域中的信号的多个子频带样本。其横坐标表示时间。其纵线表示频率。图5不同于图4之处在于,就每个时间指数而言,该时频域中的信号包含有三个附加的子频带样本(以“x”标示)。亦即,已加进该三个附加的子频带,使得该时频域中的信号并非仅具有64个子频带信号,而是如今确实具有67个子频带信号。图5的底部处所例示的简图,是例示在进行一个逆短时间傅立叶变换(ISTFT)之后在该时域中的同一信号的时间样本。由于有3个频带已加入该时频域中,该时频域中的一个特定的时间指数的67个附加的子频带样本可被用来产生该时域内的音频信号的67个新时间样本。由于已使用该时频域中的一个单一时间指数的67个附加的子频带样本在该时域中产生新的67个时间样本,该时域中作为该合成滤波器排组130所输出的音频信号s2的取样率是每个该子频带信号的 取样率的67倍。诚如由上文可看出,在该分析滤波器排组120中采用64个通道会造成每个子频带信号的取样率为馈入该分析滤波器排组120内而经处理的音频信号s1的取样率的1/64。就该分析滤波器排组120和合成滤波器排组130共同而论,上述具有64个通道的分析滤波器排组120和上述具有67个通道的合成滤波器排组130,会造成该合成滤波器排组所输出的信号s2的取样率为上述输入该分析滤波器排组120内的音频信号s1的取样率的67/64倍。
以下的观念是可被推导出:考虑一个馈入该分析滤波器排组120内的(处理过的)音频信号s1。假定该滤波器排组具有c1个通道,以及进一步假定该处理过的音频信号的取样率为sr1,则每个子频带信号的取样率是sr1/c1。进一步假定该合成滤波器排组具有c2个通道,以及假定每个子频带信号的取样率为sr子频带,则该合成滤波器排组130所输出的音频信号s2的取样率是c2·sr子频带。此意谓的是,该合成滤波器排组130所输出的音频信号的取样率是c2/c1·sr1。选择不同于c1的c2意谓的是,该合成滤波器排组130所输出的音频信号s2的取样率可与输入该分析滤波器排组120内的音频信号的取样率做不同的设定。
选择不同于c1的c2不仅意味着该分析滤波器排组通道的数目不同于该合成滤波器排组通道的数目。此外,该分析滤波器排组120通过该ISTFT所产生的子频带信号的数目不同于该合成滤波器排组130在进行STFT时所需的子频带信号的数目。
有三种不同的情况可被区别:
若c1和c2相等,该分析滤波器排组120所产生的子频带信号的数目等于该合成滤波器排组130就该STFT所需的子频带信号的数目。子频带调整是无必要。
若c2小于c1,该分析滤波器排组120所产生的子频带信号的数目大于该合成滤波器排组130就合成所需的子频带信号的数目。依据一个实施例,该最高频率子频带信号或许会被删除。举例而言,若该分析滤波器排组120产生64个子频带信号,以及若该合成滤波器排组130仅需要61个子频带信号,该具有最高频率的三个子频带信号或许会被舍弃。
若c2大于c1,则该分析滤波器排组120所产生的子频带信号的数目小于该合成滤波器排组130就合成所需的子频带信号的数目。
依据一个实施例,通过加入一些零信号作为附加的子频带信号,或许会产生一些附加的子频带信号。一个零信号是其中的每个子频带样本的波幅值等于零的信号。
依据另一个实施例中,一些附加的子频带信号或许是通过加入一些虚拟随机子频带信号作为一些附加的子频带信号而产生出。一个虚拟随机子频带信号是以下信号:其中的每个子频带样本的值包含有虚拟随机数据,其中,该虚拟随机数据势必要自某一被允许的值范围以虚拟随机方式来加以决定。举例而言,一个样本的虚拟随机选取的波幅值势必要小于最大的波幅值,以及一个样本的相位值势必要在0与2π(包含在内)间的范围内。
在另一个实施例中,附加的子频带信号或许是通过复制该最高的子频带信号的样本值来产生,以及使用其作为附加的子频带信号的样本值。在另一个实施例中,该最高的子频带的相位值会被复制,以及被用作一个附加的子频带有关的样本值,而该最高的子频带信号的波幅值乘以一个加权因子,举例而言,降低其权重,以及接着被用作该附加的子频带信号的子频带样本的波幅值。举例而言,一个附加的子频带信号的所有波幅值或许会乘以一个加权因子0.9。若需要两个附加的子频带信号,该最高的子频带信号的波幅值或许会乘以一个加权因子0.9,从而产生第一附加的子频带信号,而所有的波幅值或许会乘以一个加权因子0.8,从而产生第二附加的子频带信号。
最高效率的音频编译码器使用参数式信号增强,其转而频繁地使用QMF(正交镜像滤波器)(亦即,MPEG-4HE-AAC),上述诸实施例中所提议的观念可能加以采用。QMF式编译码器通常是使用Nnominal=64个频带多相滤波器结构,从而将子频带转换成一个标称取样频率fs,nominal的时域输出信号。通过加入内含一个零信号的子频带,或移除某些较高的频带(其总之或许会为空的),来改变输出频带的量,该输出取样率fs可如下所示以Δfs逐步改变。
其造成整体输出取样频率fs是:
并非加入一个额外的取样率变换器,此功能性可植入该早已存在的QMF合成滤波器内。
工作负荷量增加是低于具有相当的准确度的取样率变换器,但该取样率比不能为任意值。基本上,其是由QMF分析滤波器排组和QMF合成滤波器排组中所用的频带数目的比值来加以决定。通常,较佳的是使用若干可允许该合成QMF能快速计算的输出频带,举例而言,60、72、80、48、…。
与在采用QMF时可改变该输出取样率的方式相同,该相同的方式是可调整一个音频信号编译码器的取样率,其使用另一种类型的滤波器排组,举例而言,一个MDCT(改进型离散余弦变换)。
图6是例示依据一个实施例的一个装置。此装置包含有一个信号调整器125。一个分析滤波器排组120经调适,可将时域中所表示的分析滤波器排组输入信号s1变换成具有以3个为例的多个的第一子频带信号s11、s12、s13的第一时频域音频信号。第一子频带信号的数目等于分析滤波器排组通道的第一数目c1。
该信号调整器125经调适,可基于该配置设定值conf,自该第一时频域音频信号产生第二时频域音频信号。该第二时频域音频信号具有以4个为例的多个的第二子频带信号s21、s22、s23、s24。产生该第二时频域音频信号,使得该第二子频带信号的数目等于该合成滤波器排组通道的数目c2。该第二时频域音频信号的第二子频带信号的数目可能不同于该时频域音频信号的第一子频带信号的数目。所以,子频带信号的数目可能势必要加以调整,举例而言,依据上述诸观念中的一个。
该合成滤波器排组130经调适,可将该第二时频域音频信号变换成一个时域音频信号,作为该合成滤波器排组130的音频信号输出s2。
然而,在其它的实施例中,可能并未包含一个信号调整器125。若该分析滤波器排组120提供比该合成滤波器排组130所需更多的通道,该合成滤波器排组本身便可能舍弃非必需的通道。此外,若该分析滤波器排组120所提供的子频带信号的数目小于该合成滤波器排组通道数目,该合成滤波器排组130可能会被配置为使其本身使用一个零子频带信号或一个包含有虚拟随机数据的信号。
上述依据该实施例的装置特别适合对不同的情况做调适。举例而言,该第一音频信号处理器110或许会需要处理该音频信号s0,从而使该处理过的音频信号s1在一个情况中具有第一取样率sr1,以及使该处理过的音频信号s1在一个第二情况中具有不同于第一取样率的第二取样率sr1’。举例而言,该第一音频信号处理器110或许会采用一个以16000Hz为例的第一取样率工作的ACELP(代数码激励线性预测)译码器,而在一个不同的第二种情况中,该第一音频信号处理器或许会采用一个AAC(先进音频编码)译码器,举例而言具有以48000Hz为例的取样率。此外,有种情况或许会出现,该第一音频信号处理器会采用一个在不同的取样率间切换的AAC译码器。或者,该第一信号处理器110或许经调适会在一个具有第一取样率sr1的第一立体音频信号s1与一个作为MPEG环绕信号而具有第二取样率sr1’的第二音频信号s1’间切换。
此外,其或许必需提供一个音频信号给该具有某一定的预定取样率sr2的第二音频信号处理器140。举例而言,一个被采用的数模转换器或许会需要某一定的取样率。在此情况中,该第二信号处理器140或许总会以一个固定的第二取样率sr2来工作。然而,在其它情况中,该第二音频处理器140处的音频信号s2的取样率在运行期间或许会被改变。举例而言,在一个第一情况中,该第二音频信号处理器140或许会在一个可支持以24000Hz为例的相对低的取样率的第一低音频质量D/A(数字至模拟)转换器间进行切换,而在其它情况中,该第二音频信号处理器140或许会采用一个具有以96000Hz为例的取样率的第二D/A转换器。举例而言,在该第一音频信号处理器110已处理的经处理的音频信号sr2的原始取样率具有一个以4000Hz为例的相对低的取样率的情况中,其或许非必需采用 上述具有以96000Hz为例的取样率的高质量第二D/A转换器,而取而代之的是,采用上述需要较少的计算资源的第一D/A转换器便已足够。所以,提供一个具有可调整性取样率的装置是值得重视。
依据一个实施例,提供有一个装置,其包含有一个控制器150,其可依据一个提供给该可配置式第一音频信号处理器的配置设定值conf来控制第一数目c1的分析滤波器排组通道和/或第二数目c2的合成滤波器排组频道,以致该合成滤波器排组130所输出的音频信号具有该预定的取样率sr2或某一取样率sr2(其不同于该预定的取样率sr2,但比起一个进入该分析滤波器排组120的处理过的输入信号s1的取样率sr1更接近该预定的取样率sr2)。
在一个实施例中,该配置设定值或许会包含有一个有关该第一取样率sr1和/或第二取样率sr2的显式信息。举例而言,该配置设定值或许会显式地加以定义,一个第一取样率sr1被设定成9000Hz,以及一个第二取样率sr2被设定成24000Hz。
然而,在另一个实施例中,该配置设定值conf可能不会明确地指明一个取样率。取而代之的是,有一个指数或许会指明,该控制器或许会使用其来决定该第一取样率sr1和/或第二取样率sr2。
在一个实施例中,该配置设定值conf可能是由一个附加的单元(未示出)在运行期间提供给该控制器。举例而言,该附加的单元可能会在该配置设定值conf中指明是采用一个ACELP译码器还是采用AAC译码器。
在一个可替换实施例中,该配置设定值conf在运行时间下并不会由一个附加的单元提供,但该配置设定值conf一旦被储存,以致其可永久供一个控制器150利用。该配置设定值conf接着会有一段较长的时间保持不变。
依据此项决定,该附加的单元可能会将包含在该配置设定值conf中的该显式取样率传送给该控制器。
在一个可替换实施例中,该附加的单元可传送一个配置设定值conf,其可指明一个第一情况是否存在(通过传输一个指数值“0”:指明“使用 的是ACELP译码器”,或者通过传输一个指数值“1”:指明“使用的是AAC译码器”)。此是参照图7a和图7b来加以解译:
图7a和图7b是例示依据一个实施例而可供一个控制器利用的查找表。举例而言,该查找表可能为一个储存在该控制器内而作为一个固定表的预定式查找表。在另一个实施例中,该查找表可能是提供为来自一个附加单元的元信息。同时举例而言,该查找表信息仅会一段较长时间传送一次,一个用以指明该当前的取样率配置的指数值会更频繁地被更新。
图7a是描述一个可允许分解一个单一的取样率的简单的查找表,在图7a的实施例中,指明该第一音频信号处理器110的取样率。通过接收一个包含在该第一配置设定值conf中的指数值,该控制器150是可决定被该第一音频信号处理器110处理的处理过的音频信号s1的取样率。在图7a的查找表中,并无有关该第二取样率sr2的信息可供利用。在一个实施例中,该第二取样率是一个固定的取样率,以及是为该控制器150所知晓。在另一个实施例中,该第二取样率是通过采用与第7a图中所例示的查找表相类似的另一个查找表来加以决定。
图7b是例示另一个查找表,其包含有关该处理过的音频信号s1的第一取样率sr1加上该合成滤波器排组所输出的音频信号s2的第二取样率sr2的信息。一个附加的单元会将一个包含有某一指数值的配置设定值conf传输给该控制器150。该控制器150会在图7b的查找表中查找该指数值,以及因而会决定该处理过的音频信号s1的第一期望取样率,和该合成滤波器排组140所产生的音频信号s2的第二期望取样率sr2。
图8是例示上述有关SBR处理的观念的一个组合。若该QMF合成频带是一个SBR模块的一部分,该重新取样功能性可整合进该系统内。具体地,其接着是可能传输一些SBR参数,使该活动中的SBR范围扩展超过平常的2:1或4:1重新取样比,而具有以下额外优点,即,有可能通过适度选择该QMF滤波器排组的适当的M和N来实现几乎任意的重新取样比,因而增加整体的重新取样特性(见图8)有关的自由度。
举例而言,若合成频带的数目高于64,它们并非必然要填满零。取而代之的是,针对该SBR补丁的范围亦可扩展,以便利用此较高的频率范围。
在图8中,该产生的QMF输出取样频率为:
举例而言,在该USAC8kbps运作测试点的情况中,该内部取样频率fs,Core通常是被选为9.6kHz。在遵循M=32频带QMF分析滤波器排组之际,该合成可被一个N=80频带QMF排组取代。此将会造成的一个输出取样频率为:
通过如此做,SBR可涵盖的潜在可能的音频带宽可增加至12kHz。与此同时,一个至合适的48kHz的潜在可能的后重新取样步骤可相当便宜地加以实现,因为该剩余的重新取样比是一个简单的1:2关系。
更多的组合是想得到的,其可允许一个(较)宽的SBR范围,同时可维持允许该核心编码器在略不寻常或不常见的取样频率上运行的可能性。
图9是例示依据另一个实施例的装置,其可采用一些QMF分析和合成滤波器排组,使一个MPEG环绕信号与依据一个实施例的一个重新取样的取样率上混合。就一些例示性目的而言,该分析滤波器排组被描述为从该输入的信号仅产生3个子频带信号,以及每个QMF合成滤波器排组被描述为将一个仅包含有四个子频带信号的时频域信号变换回至该时域。然而,可了解的是,在其它的实施例中,分别地,该分析滤波器排组(举例而言)包含有45个通道,以及该合成滤波器排组(举例而言)包含有60个通道。
在图9中,一个下混合式音频信号s1馈入一个QMF分析滤波器排组910内。该QMF分析滤波器排组910可将该下混合式时域音频信号变换 进一个时频域内,使得到三个(下混合式)子频带信号s11、s12、s13。该三个下混合式子频带信号s11、s12、s13接着会分别馈入三个上混合器921、922、923内。每个该些上混合器921、922、923会产生五个分别为左侧子频带信号、右侧子频带信号、中央子频带信号、左环绕子频带信号、和右环绕子频带信号的环绕子频带信号。该三个产生的左侧子频带信号接着会馈入一个左侧信号调整器931内,作为该左侧子频带信号。该左侧信号调整器931会从该三个左侧环绕子频带信号产生四个左侧子频带信号,以及会将其馈入一个左侧合成滤波器排组941内,其可将该些子频带信号自该时频域变换至该时域,使产生一个时域中的环绕信号的左侧信道s21。同样,有一个右侧信号调整器932和一个右侧合成滤波器排组942会被用来产生一个在该时域内的环绕信号的右侧通道s22,有一个中央信号调整器933和一个中央合成滤波器排组943会被采用来产生一个中央通道s23,有一个左侧环绕信号调整器934和一个左侧环绕合成滤波器排组944会被采用来产生一个左侧环绕通道s24,以及有一个右侧环绕信号调整器935和一个右侧环绕合成滤波器排组945会被采用来产生一个在该时域内的环绕信号的右侧环绕信道s25。
有一个控制器(950)接收一个配置设定值conf,以及经调适可基于此接收到的配置设定值conf来控制分析滤波器排组910的通道数目。该控制器进一步经调适,可基于该接收到的配置设定值conf来控制该些合成滤波器排组单元941、942、943、944、945的信道数目、该些信号调整器单元931、932、933、934、935的第一多个的输入环绕子频带信号的数目、和该些信号调整器单元931、932、933、934、935的第二多个的输出环绕子频带信号的数目。
图10是例示依据另一个实施例的装置。图10的实施例不同于图8的实施例之处在于,该信号调整器125进一步包含有一个频带复制器128,用于进行该分析滤波器排组120所导出的子频带信号的频带复制(SBR),从而得到一些附加的子频带信号。
习惯上,通过进行频带复制,有多个的子频带信号会被“复制”,以致该频带复制所导出的子频带信号的数目是两倍或四倍于在频谱复制上 可得的子频带信号的数目。在一个传统式频带复制(SBR)中,该可供利用的子频带信号的数目会被复制,以致举例而言,有32个子频带信号(产生自一个分析滤波器排组变换)会被复制,以及因而有64个子频带信号可供该合成步骤利用。该等子频带信号会被复制,以致该等可供利用的子频带信号会形成该等较低的子频带信号,而从该等较高的子频带信号的频谱复制地子频带信号是位于高过该早已可供利用的子频带信号的频率范围内。
依据图10中所描述的实施例,该等可供利用的子频带信号会被复制,以致由SBR所产生的子频带信号的数目并非必然为该等复制的子频带信号的整数倍(或同数目)。举例而言,有32个子频带信号或许会被复制,以致导出的不是32个附加的子频带信号,而是举例而言,有36个附加的子频带信号会被导出,以及举例而言,可得总数为68个而非64个来自合成的子频带信号。图10的实施例的合成滤波器排组130经调整可处理68个而非64个通道。
依据图10中所例示的实施例,由该频带复制所复制的通道数目和可被复制的通道数目是可调整的,从而使所复制通道的数目非必然为该频带复制中所用的通道的整数倍(或同数目)。在图10的实施例中,该控制器不仅可控制该合成滤波排组140的通道数目,以及亦确实可控制要被该频带复制所复制成的通道数目。举例而言,若该控制器已经决定该分析滤波器排组120具有c1个通道,以及该合成滤波器排组具有c2个通道(c2>c1),该频带复制势必要导出的附加的通道的数目便为c2-c1。
若c2>2·c1,所浮现的问题是如何在一个频带复制的背景中产生一些附加的子频带信号。依据一个实施例中,一个零子频带信号(所有子频带样本的波幅值为零)可能就每个额外想要的子频带信号而被加入。在另一个实施例中,虚拟随机数据会被用作要产生的附加的子频带信号的样本值。在又一个实施例中,自该频带复制产生出的最高的子频带信号本身会被复制:举例而言,该最高的子频带信号的波幅值会被复制,使形成该附加的一个或多个子频带信号的波幅值。该波幅值可能乘以一个加权因子。 举例而言,该第一附加的子频带信号的每一个波幅值或许会乘以0.95。该第二附加的子频带信号的每一个波幅值或许会乘以0.90,等等。
在再有的一个实施例中,该频带复制被扩展从而产生一些附加的子频带信号。频谱包络信息或许会被使用,从而自一些可供利用的较低的子频带信号产生一些附加的子频带信号。该频谱包络信息或许会被用来推导一些加权因子(其被用来乘以该频带复制中所考虑的较低的子频带信号的波幅值)而产生一些附加的子频带信号。
图11是例示依据另一个实施例的一个装置。该装置不同于图1中所例示的装置在于,图11的装置进一步包含有一个附加的重新取样器170。该附加的重新取样器170被用来进行一个附加的重新取样步骤。该重新取样器可能为一个传统式重新取样器,或者可替换地为一个用以处理一个音频信号的装置,其可依据本发明来进行重新取样。举例而言,若一个依据本发明的装置被用作附加的重新取样器,则依据本发明的第一装置可将具有一个第一取样率的音频信号重新取样成一个取样率sr2=c2/c1·sr1。接着,该附加的重新取样器会重新取样该音频信号,使自一个取样率sr2成为一个取样率sr2’=c4/c3·sr2=c4/c3·c2/c1·sr1。通过采用两个重新取样器,避免了一个依据上述诸实施例中的重新取样器必需具有c1·c3个分析通道和c4·c2个合成通道。举例而言,若想要的是一个998000/996003的重新取样因子(该重新取样因子是合成后的音频信号的取样率对分析前的音频信号的取样率的比值),则包含有两个重新取样器的装置会避开需要996003个分析滤波器排组通道和998000个合成滤波器排组通道。取而代之的是,第一重新取样可能由一个具有999个滤波器排组通道的分析滤波器排组和一个具有1000个通道的合成滤波器排组来进行,以及第二重新取样可能由一个具有997个通道的分析滤波器排组和一个具有998个通道的合成滤波器排组来加以进行。
在此实施例中,该控制器150可能经调适,使操纵如何将该重新取样因子分离成适当的分析和合成滤波器排组信道值。
图12是例示作为依据一个实施例的重新取样器的QMF。所描述是一个具有附接的后重新取样器的QMF合成级的一个范例,藉以调整该QMF输出取样率。
若QMF合成后的输出取样率并不遵从一个“标准”的取样率,一个QMF式重新取样和一个附加的重新取样器的组合是仍可加以使用,使就万一需要一个重新取样器,而达成更佳的运作条件(举例而言,渐进性小整数重新取样比,或者采用一个以之为例的拉格朗日(Lagrange)内插器,而内插于一些接近的取样率间)。
在图13中,描述了一个重新取样器,其包含有一个分析器和一个合成器。但由于此类构件块早已存在于最新的音频编译码器中,这些早已存在的构件块可通过一个控制实体使略做改变,以便完成该重新取样任务,而不需要一些添加给该译码器系统的附加的分析/合成级。此解决方案是显示在图14内。在某些系统中,fs是有可能做些许改变,以便就该总体的每十个抽取一个和上取样实现更合适的运作点,以及克服一些实现限制条件。
图13中所显示的“滤波器排组控制”区块将会操纵该译码器的因子M和N,以便得到该想要的输出取样频率fs,final。其采纳该想要的输出取样频率fs,final、该核心译码器输出取样频率、和其它有关该译码器的知识,作为输入。该取样频率fs,final可能希望为常数,以及与该输出装置硬件相匹配,而由该编译码器的观点,因编码效率的特征所致,其或许希望有所改变。通过将该重新取样器合并进该译码器,该输出端处的固定输出取样率和该音频编译码器的最佳运作取样率这两者必要条件因附加的重新取样器处理所致是可在几乎无额外的复杂性和无信号降格下被满足。
针对不同长度的QMF原型,是可通过内插法而自64个频带QMF中的一个来建立。
一个滤波器排组的复杂性是直接与其长度相关。若一个滤波器排组时域信号合成变换通过缩短该变换长度,就下取样而加以修改,其复杂性将会降低。若其通过扩大其的变换长度而就上取样加以使用,其复杂性将会 增加,但仍然远低于一个具有等效的信号失真特性的附加的重新取样器所需要的复杂性。
图15是例示依据又一个实施例的装置,其中,该装置经调适可将一个合成滤波器排组输出馈入一个分析滤波器排组内,从而进行另一个变换周期。如同在图1的实施例中,一个处理过的音频信号s1会馈入一个分析滤波器排组120内,其中,该音频信号会自一个时域转移至一个时频域内。该合成滤波器排组接着会将该时频域信号变换回至该时域,其中,该合成滤波器排组通道的数目c2不同于分析滤波器排组通道的数目c1,从而产生一个具有不同于该输入信号的取样率的输出信号s2。然而,与图1的实施例相反,该输出信号可能并不会馈入该第二音频信号处理器140内,而取而代之的是,可能会再次馈入一个分析滤波器排组内,使通过一个分析滤波器排组和一个合成滤波器排组来进行该音频信号的额外重新取样。不同的分析滤波器排组和合成滤波器排组(举例而言,分析滤波器排组实例和合成滤波器排组实例)可能会被采用在后继的分析/合成步骤中。该控制器150可能会控制分析和合成滤波器排组通道的数目c1、c2,以致该数目在该第二分析/合成步骤中不同于在该第一分析/合成步骤中的数目。藉此,该总重新取样比可能任意加以选择,以使其产生(c2·c4·c6·c8·…)/(c1·c3·c5·c7·…),其中,c1、c2、c3、…是一些整数值。
重新取样具有第一取样率sr1的音频信号,使其具有一个第二取样率sr2,这在重新取样之后或许会不容易实现。举例而言,在22050Hz的取样频率应被重新取样至23983Hz的取样频率的情况中,要实现一个具有22050个通道的分析滤波器排组和一个具有23983个通道的合成滤波器排组在计算上或许会很昂贵。然而,虽然其或许会希望精确地实现23983Hz的输出取样频率,该使用者(或者另一个应用程序)或许会容许有误差,只要该误差在可接收的范围内。
图16是例示依据另一个实施例的控制器。一个第一取样率sr1和一个第二取样率sr2馈入该控制器内。该第一取样率指明馈入一个分析滤波器排组内(处理过的)的音频信号s1的取样率。该第二想要的取样率sr2指明一个想要的取样率,该音频信号s2将会展现何时自一个合成滤波器排组 输出。此外,一个容许误差e亦会馈入该控制器内。该容许误差e会指明该合成滤波器排组所输出的信号的实际取样率sr2’或许会偏离该想要的取样率sr2至何种程度。
该第一取样率sr1和该第二想要的取样率sr2馈入一个合成通道数目选取器1010内。该合成通道数目选取器1010选择该合成滤波器排组的通道的适当的数目c2。合成滤波器排组通道的某些数目c2或许会特别适合允许自一个时频域至一个时域的信号变换的快速计算,举例而言,60、72、80、或48个通道。该合成通道数目选择器1010或许会依据该第一和第二取样率sr1、sr2来选择该合成通道数目c2。举例而言,若该重新取样比为一个整数,举例而言3(产生自所举为例的取样率sr1=16000Hz和sr2=48000Hz),该合成通道数目是一个小数目(举例而言30)或许便足够。在其它情况中,选择一个较大的合成通道数目或许会更加有用,举例而言,若该取样率很高且若该取样率比并非为一个整数(举例而言,若sr1=22050Hz,以及sr2为24000Hz):在此种情况中,该合成通道数目(举例而言)或许会被选为c2=2000)。
在可替换实施例中,仅有该第一sr1或第二取样率sr2馈入该合成通道数目选择器1010内。在又一实施例中,既非该第一取样率sr1亦非该第二取样率sr2馈入该合成通道数目选择器1010内,以及该合成通道数目选择器1010接着会独立于该取样率sr1、sr2而选择一个合成通道数目c2。
该合成通道数目选择器1010将该选定的合成通道数目c2馈入一个分析通道数目计算器1020内。此外,该第一取样率sr1和第二取样率sr2亦会馈入该分析通道数目计算器1020内。依据如下的公式,该分析通道数目计算器会依据该等第一取样率sr1和第二取样率sr2以及合成通道数目c2来计算分析滤波器排组通道的数目c1:
c1=c2·sr1/sr2.
经常地,可能浮现的情况是,该计算出的数目c1并非为一个整数,而为一个不同于整数的值。然而,分析滤波器排组通道的数目(加上合成滤波器排组通道的数目)势必要为一个整数。举例而言,若一个第一取样率sr1为sr1=22050Hz,该第二想要的取样率sr2为sr2=24000Hz,以及合 成滤波器排组通道的数目c2是早经选定,以致c2=2000,则分析通道的计算出的数目c1便为c1=c2·sr1/sr2=2000·22050/24000=1837.5个分析通道。所以,势必要做出一个决断,该分析滤波器排组是否应包含1837或1838个通道。
有不同的舍位策略可能会被应用:
依据一个实施例,若该计算出的值并非为一个整数,便会有一个第一舍位策略被应用,依据它便会选择次一较低的整数值作为分析通道数目。举例而言,一个计算出的值1837.4或1837.6,将会被舍位为1837。
依据另一个实施例,若该计算出的值并非为一个整数,便会有一个第二舍位策略被应用,依据它便会选择次一较高的整数值作为分析通道数目。举例而言,一个计算出的值1837.4或1837.6,将会被舍位为1838。
依据又一个实施例,算术舍位会被应用。举例而言,一个计算出的值1837.5,将会被舍位为1838,以及一个计算出的值1837.4,将会被舍位为1837。
然而,由于在“1837.5”范例中,不可能应用该计算的准确值作为分析滤波器排组通道的数目,将会得到一个偏离实际的第二取样率sr2’,而非该想要的第二取样率sr2。
图16的实施例的控制器包含有一个取样率二计算器1030,其会依据以下公式,基于该第一取样率sr1、该合成滤波器排组通道的被选定的数目c2、和该分析滤波器排组通道的计算出的数目c1,来计算实际的第二取样率sr2’:
sr2’=c2/c1·sr1.
举例而言,在上述的范例中,假定该第一取样率sr1为sr1=22050Hz,以致该合成滤波器排组通道的数目为c2=2000以及选择分析滤波器排组通道的数目c1为1838,此会产生一个实际的第二取样比,为:
sr2’=c2/c1·sr1=2000/1838·22050Hz=23993.47Hz,而非该想要的24000Hz。
应用一个具有1837个通道的分析滤波器排组将会产生一个实际的第二取样率为:
sr2’=c2/c1·sr1=2000/1837·22050Hz=24006.53Hz,而非该想要的24000Hz。
该合成滤波器排组所输出的音频信号的实际的第二取样率sr2’和该想要的取样率sr2接着会馈入一个误差计算器1040内。该误差计算器会依据该选定的分析和合成滤波器排组通道设定值来计算一个实际误差e’,其表示该想要的取样率sr2与该实际的取样率sr2’间的差异。
在一个实施例中,依据以下公式,该实际误差e’或许为该想要的取样率sr2与该实际的取样率间的差异的绝对值:
e’=|sr2-sr2’|.
在另一个实施例中,该实际误差e’或许为一个相对值,举例而言,依据以下公式计算:
e’=|(sr2-sr2’)/sr2|
该误差计算器接着会将该实际误差e’传递给一个误差比较器1050。此误差比较器接着会使该实际误差e’与该容许误差e做比较。若该实际误差e’在该容许误差所界定的范围内,举例而言,若|e’|≤|e|,则该误差比较器1050会指示一个通道数目传递器1060分别地将分析滤波器排组通道的实际计算的数目传递给该分析滤波器排组,以及会将该合成滤波器排组通道的被决定的数目传递给该合成滤波器排组。
然而,若该实际误差e’在该容许误差所界定的范围内,举例而言,若|e’|>|e|,则该误差比较器1060会自起点开始该决定处理,以及会指示该合成通道数目选择器1010选择一个不同的合成通道数目,作为合成滤波器排组通道的数目。
不同的实施例可能实现不同的策略,使选择一个新合成通道数目。举例而言,在一个实施例中,一个合成通道数目可能会任意地加以选择。在另一个实施例中,会有一个较高的通道数目被选定,举例而言,一个两倍于该合成通道数目选择器1010之前选定的合成信道数目的数量的信道数目。举例而言,sr2:=2·sr2。举例而言,在上述的范例中,该信道数目sr2=2000由sr2=2·sr2=2·2000=4000来取代。
该处理会继续,直至已找到一个具有可接受的实际误差e’的合成频道数目。
图17是例示用以描述一个对应的方法的流程图。在步骤1110中,会选定一个合成通道数目c2。在步骤1120中,会基于该选定的合成通道数目c2、该第一取样率sr1、和该想要的取样率sr2来计算该分析通道数目c1。若有必要,便会执行舍位从而决定该分析通道数目c1。在步骤1130中,基于该第一取样率sr1、合成滤波器排组通道的选定的数目c2、和分析滤波器排组通道的计算出的数目c1来计算该实际的第二取样率。此外,在步骤1140中,会计算一个实际误差e’,其表示该实际的第二取样率sr2’与该想要的第二取样率sr2间的差异。在步骤1150中,该实际误差e’与一个界定成的容许误差e做比较。假如该误差是可容许,该处理会继续至步骤1160:分别地,该选定的合成通道数目会传递给该合成滤波器排组,以及该计算出的分析通道数目会传递给该分析滤波器排组。若该误差为不可容许,该处理便会继续至步骤1110,有一个新合成通道数目会被选定,以及该处理会一再重复直至有一个适当的分析和合成滤波器排组通道的数目已被决定为止。
图18是例示依据进一步的实施例的控制器。图18的实施例不同于图16的实施例在于,该合成通道数目选择器1010是由一个分析通道数目选择器1210来取代,以及该分析通道数目计算器1020是由一个合成通道数目计算器1220来取代。并非选择一个合成通道数目c2,该分析通道数目选择器1210选择一个分析通道数目c1。接着,该合成通道数目计算器1220会依据公式c2=c1·sr2/sr1来计算一个合成通道数目c2。该计算出的合成通道数目c2接着会传递给该取样率二计算器1230,其亦会接收该选定的分析通道数目c1、该第一取样率sr1、和该想要的第二取样率sr2。除此之外,该取样率二计算器1230、误差计算器1240、误差比较器1250、和通道数目传递器1260分别对应于图16的实施例的取样率二计算器1030、误差计算器1040、误差比较器1050、和通道数目传递器1060。
虽然某些特征已在一个装置的背景中加以描述,这些特征很显然亦表示该对应方法的描述,其中,一个区块或装置对应于一个方法步骤或一个 方法步骤的特性。类似地,一些在一个方法步骤的背景中所描述的特征亦表示一个对应的装置的对应的区块或项目或特征的描述。
该原创性分解信号可储存在一个数字储存介质上,或者可在一个类似无线传输媒介等传输媒介上传输,或者在一个类似因特网等有线传输媒介上传输。依据某些体现必要条件,本发明的实施例可在硬件或软件中体现。该体现在执行上,可使用一个在其上面储存有电子可读取式控制信号的数字储存介质,举例而言,软盘、DVD、CD、ROM、PROM、EPROM、EEPROM、或闪存,其是与一个可编程序计算机系统合作(或有能力合作),藉以执行对应的方法。
依据本发明的某些实施例,包含有一个具有电子可读取式控制信号的非暂时性数据载体可与一个可编程序计算机系统合作,藉以执行本说明书所描述的诸多方法中的一个。
通常,本发明的实施例,可被体现为一个具有程序码的计算机程序产品,该程序码在运作上,可于该计算机程序产品,在一个计算机上面运行时,执行该等方法中的一个。该程序码举例而言,可能储存在一个机器可读取式载体上面。
其它的实施例,包含有储存在一个机器可读取式载体上面的计算机程序,使执行本说明书所描述的诸多方法中的一个。
换言的,该原创性方法的一个实施例,因而是一个具有程序码的计算机程序,以便当该计算机程序,在一个计算机上面运行时,执行本说明书所描述的诸多方法中的一个。
该原创性方法的又一实施例,因而是一个数据载体(或一个数字储存媒体、或一个计算机可读取式媒体),其上记录有该计算机程序,使执行本说明书所描述的诸多方法中的一个。
该原创性方法的又一实施例,因而是一个代表该计算机程序的数据流或信号序列,使执行本说明书所描述的诸多方法中的一个。该数据流或信号序列,举例而言,可能使配置而经由一个数据相通信连接,举例而言,经由因特网,而加以转移。
一个又一实施例,包含有一个以计算机为例的处理构件、或一个可编程序逻辑装置,使配置或调适而执行本说明书所描述的诸多方法中的一个。
一个又一实施例,包含有一个计算机,其上安装有该计算机程序,使执行本说明书所描述的诸多方法中的一个。
在某些实施例中,一个可编程序逻辑装置(举例而言,一个现场可编程逻辑门阵列),可能被用来执行本说明书所描述的方法的某些或全部功能性。在某些实施例中,一个现场可编程逻辑门阵列,可能会与一个微处理器合作,藉以执行本说明书所描述的诸多方法中的一个。通常,该等方法较佳的是由任何的硬件装置来执行。
上述的实施例,是仅为例示本发明的原理。理应了解的是,该等布置的修饰体和变更形式和本说明书所描述的细节,将为本领域的专业人士所明了。所以,其意图仅受限于接续而来的申请专利范围,而非通过本说明书的实施例的描述和解译所展现的特定细节。
Claims (13)
1.一种用以处理音频信号的装置,包含有:
一个可配置式第一音频信号处理器(110),用于依据不同的配置设定值(conf)来处理所述音频信号(s0),从而得到一个处理过的音频信号(s1),其中,所述装置经调适,使得不同的配置设定值(conf)造成所述处理过的音频信号的不同取样率(sr1);
一个具有第一数目(c1)的分析滤波器排组通道的分析滤波器排组(120);
一个具有第二数目(c2)的合成滤波器排组通道的合成滤波器排组(130);
一个经调适为接收及处理一个具有一预定的取样率(sr2)的音频信号(s2)的第二音频处理器(140),和
一个控制器(150),用于依据一个提供给所述可配置式第一音频信号处理器(110)的配置设定值(conf)来控制分析滤波器排组通道的所述第一数目(c1)和合成滤波器排组频道的所述第二数目(c2),使得所述合成滤波器排组(140)的音频信号输出(s2)具有所述预定的取样率(sr2)或不同于所述预定的取样率(sr2)但比起一个分析滤波器排组输入信号(s1)的取样率(sr1)更接近所述预定的取样率(sr2)的取样率(sr2’)。
2.根据权利要求1所述的装置,
其中,所述分析滤波器排组(120)经调适为将表示在一个时域中的分析滤波器排组输入信号(s1)变换成一个具有多个的第一子频带信号的第一时频域音频信号,其中,第一子频带信号的数目等于分析滤波器排组通道的第一数目(c1),
其中,所述装置进一步包含有一个信号调整器(125),所述信号调整器经调适为基于所述配置设定值(conf)自所述第一时频域音频信号产生一个具有多个的第二子频带信号的第二时频域音频信号,使得所述第二时频域音频信号的第二子频带信号的数目等于合成滤波器排组通道的数目(c2),其中,所述第二时频域音频信号的第二子频带信号的数目不同于所述第一时频域音频信号的子频带信号的数目,
其中,所述合成滤波器排组(130)经调适为将所述第二时频域音频信号变换成一个时域音频信号,作为所述合成滤波器排组(130)的音频信号输出(s2)。
3.根据权利要求2所述的装置,其中,所述信号调整器(125)经调适为通过产生至少一个附加的子频带信号来产生所述第二时频域音频信号。
4.根据权利要求3所述的装置,其中,所述信号调整器(125)经调适为通过进行频带复制来产生至少一个附加的子频带信号,从而产生至少一个附加的子频带信号。
5.根据权利要求3所述的装置,其中,所述信号调整器(125)经调适为产生一个零信号作为一个附加的子频带信号。
6.根据权利要求1所述的装置,其中,所述分析滤波器排组是一个QMF分析滤波器排组,以及其中,所述合成滤波器排组是一个QMF合成滤波器排组。
7.根据权利要求1所述的装置,其中,所述分析滤波器排组是一个MDCT分析滤波器排组,以及其中,所述合成滤波器排组是一个MDCT合成滤波器排组。
8.根据权利要求1所述的装置,其中,所述装置进一步包含有一个附加的重新取样器(170),所述附加的重新取样器经调适为接收一个具有第一合成取样率的合成滤波器排组输出信号(s2),以及其中,所述附加的重新取样器重新取样所述合成滤波器排组的输出信号从而产生一个具有第二合成取样率的重新取样的输出信号。
9.根据权利要求1所述的装置,其中,所述装置经调适为将一个具有第一合成取样率的合成滤波器排组输出信号馈入一个分析滤波器排组内,作为一个分析滤波器排组输入信号。
10.根据权利要求1所述的装置,其中,所述控制器经调适为基于一容许误差(e)来决定分析滤波器排组通道的第一数目(c1)或合成滤波器排组通道的第二数目(c2)。
11.根据权利要求10所述的装置,其中,所述控制器包含有一个用于使实际误差(e’)与一个容许误差(e)做比较的误差比较器(1050)。
12.一种用于上混合环绕信号的装置,包含有:
一个分析滤波器排组(910),用于将一个下混合式时域信号(s1)变换成一个时频域,从而产生多个下混合式子频带信号(s11,s12,s13);
至少两个上混合器(921,922,923),用于上混合所述多个子频带信号,从而得到多个环绕子频带信号;
至少两个用于调整环绕子频带信号的数目的信号调整器单元(931,932,933,934,935),其中,所述至少两个信号调整器单元(931,932,933,934,935)经调适为接收第一多个输入环绕子频带信号,其中,所述至少两个信号调整器单元(931,932,933,934,935)经调适为输出第二多个输出环绕子频带信号,以及其中,所述第一多个输入环绕子频带信号的数目与所述第二多个输出环绕子频带信号的数目是不相同的;
多个合成滤波器排组单元(941,942,943,944,945),用于使多个的输出环绕子频带信号自一个时频域变换至一个时域,从而得到一些时域环绕输出信号(s21,s22,s23,s24);
一个控制器(950),其经调适为接收一个配置设定值(conf)以及经调适为基于接收到的所述配置设定值(conf)来控制分析滤波器排组(910)的通道数目,来控制合成滤波器排组单元(941,942,943,944,945)的信道数目,来控制所述信号调整器单元(931,932,933,934,935)的第一多个输入环绕子频带信号的数目,以及来控制所述信号调整器单元(931,932,933,934,935)的第二多个输出环绕子频带信号的数目。
13.一种用以处理音频信号的方法,其包括:
依据不同的配置设定值来处理一个音频信号,从而得到一个第一处理过的音频信号,使不同的配置设定值产生所述第一处理过的音频信号的不同取样率;
依据一个配置设定值来控制一个分析滤波器排组的分析滤波器排组通道的第一数目和一个合成滤波器排组的合成滤波器排组通道的第二数目,从而使所述合成滤波器排组的音频信号输出具有所述预定的取样率或不同于所述预定的取样率但比起一个进入所述分析滤波器排组的输入信号的取样率更接近所述预定的取样率的一取样率;以及
处理具有所述预定的取样率的音频信号输出。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US37312610P | 2010-08-12 | 2010-08-12 | |
US61/373,126 | 2010-08-12 | ||
PCT/EP2011/063848 WO2012020090A1 (en) | 2010-08-12 | 2011-08-11 | Resampling output signals of qmf based audio codecs |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103270553A CN103270553A (zh) | 2013-08-28 |
CN103270553B true CN103270553B (zh) | 2015-08-12 |
Family
ID=44630032
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201180049599.2A Active CN103270553B (zh) | 2010-08-12 | 2011-08-11 | 对正交镜像滤波器式音频编译码器的输出信号的重新取样 |
Country Status (18)
Country | Link |
---|---|
US (11) | US9595265B2 (zh) |
EP (1) | EP2603913B1 (zh) |
JP (1) | JP5665987B2 (zh) |
KR (1) | KR101517446B1 (zh) |
CN (1) | CN103270553B (zh) |
AR (1) | AR082671A1 (zh) |
AU (1) | AU2011288406B2 (zh) |
BR (5) | BR112013003303B1 (zh) |
CA (1) | CA2807889C (zh) |
ES (1) | ES2501493T3 (zh) |
HK (1) | HK1186832A1 (zh) |
MX (1) | MX2013001650A (zh) |
MY (1) | MY156027A (zh) |
PL (1) | PL2603913T3 (zh) |
RU (1) | RU2562434C2 (zh) |
SG (1) | SG187743A1 (zh) |
TW (1) | TWI460719B (zh) |
WO (1) | WO2012020090A1 (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013142650A1 (en) * | 2012-03-23 | 2013-09-26 | Dolby International Ab | Enabling sampling rate diversity in a voice communication system |
WO2013186343A2 (en) | 2012-06-14 | 2013-12-19 | Dolby International Ab | Smooth configuration switching for multichannel audio |
BR122016011963B1 (pt) * | 2013-01-21 | 2022-02-08 | Dolby Laboratories Licensing Corporation | Codificador e decodificador de áudio com sonoridade de programa e metadados de limite |
JP6305694B2 (ja) * | 2013-05-31 | 2018-04-04 | クラリオン株式会社 | 信号処理装置及び信号処理方法 |
CA2940657C (en) | 2014-04-17 | 2021-12-21 | Voiceage Corporation | Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates |
FR3023646A1 (fr) * | 2014-07-11 | 2016-01-15 | Orange | Mise a jour des etats d'un post-traitement a une frequence d'echantillonnage variable selon la trame |
EP3107096A1 (en) | 2015-06-16 | 2016-12-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Downscaled decoding |
KR102083200B1 (ko) | 2016-01-22 | 2020-04-28 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 스펙트럼-도메인 리샘플링을 사용하여 멀티-채널 신호를 인코딩 또는 디코딩하기 위한 장치 및 방법 |
US10770082B2 (en) | 2016-06-22 | 2020-09-08 | Dolby International Ab | Audio decoder and method for transforming a digital audio signal from a first to a second frequency domain |
EP3276620A1 (en) * | 2016-07-29 | 2018-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain aliasing reduction for non-uniform filterbanks which use spectral analysis followed by partial synthesis |
CN111986685B (zh) * | 2020-08-31 | 2024-06-21 | 北京百瑞互联技术股份有限公司 | 一种实现高采样率的音频编解码方法及系统 |
CN116778950B (zh) * | 2023-08-18 | 2023-11-17 | 玖益(深圳)医疗科技有限公司 | 用于音频数据传输的采样率匹配方法、系统及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101069233A (zh) * | 2004-09-16 | 2007-11-07 | 法国电信公司 | 通过不同子带域之间通道进行数据处理的方法 |
CN101501760A (zh) * | 2006-07-31 | 2009-08-05 | 弗劳恩霍夫应用研究促进协会 | 处理实子带信号以减少混叠影响的设备和方法 |
EP2172931A1 (en) * | 2003-09-30 | 2010-04-07 | Panasonic Corporation | Sampling rate conversion apparatus, coding apparatus, decoding apparatus and methods thereof |
Family Cites Families (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6252909B1 (en) * | 1992-09-21 | 2001-06-26 | Aware, Inc. | Multi-carrier transmission system utilizing channels of different bandwidth |
DE19706516C1 (de) * | 1997-02-19 | 1998-01-15 | Fraunhofer Ges Forschung | Verfahren und Vorricntungen zum Codieren von diskreten Signalen bzw. zum Decodieren von codierten diskreten Signalen |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6940973B1 (en) * | 1999-06-07 | 2005-09-06 | Bell Canada | Method and apparatus for cancelling common mode noise occurring in communications channels |
SE0001926D0 (sv) * | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
EP1503371B1 (en) * | 2000-06-14 | 2006-08-16 | Kabushiki Kaisha Kenwood | Frequency interpolating device and frequency interpolating method |
CA2354808A1 (en) * | 2001-08-07 | 2003-02-07 | King Tam | Sub-band adaptive signal processing in an oversampled filterbank |
KR100935961B1 (ko) | 2001-11-14 | 2010-01-08 | 파나소닉 주식회사 | 부호화 장치 및 복호화 장치 |
KR100728428B1 (ko) * | 2002-09-19 | 2007-06-13 | 마츠시타 덴끼 산교 가부시키가이샤 | 오디오 디코딩 장치 및 오디오 디코딩 방법 |
PL1618763T3 (pl) | 2003-04-17 | 2007-07-31 | Koninl Philips Electronics Nv | Synteza sygnału audio |
SE0301273D0 (sv) * | 2003-04-30 | 2003-04-30 | Coding Technologies Sweden Ab | Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods |
KR20060023974A (ko) * | 2003-05-28 | 2006-03-15 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 서브-대역 필터링을 사용하여 워터마크를 임베딩하는 장치및 방법 |
US20050018796A1 (en) * | 2003-07-07 | 2005-01-27 | Sande Ravindra Kumar | Method of combining an analysis filter bank following a synthesis filter bank and structure therefor |
US7451091B2 (en) * | 2003-10-07 | 2008-11-11 | Matsushita Electric Industrial Co., Ltd. | Method for determining time borders and frequency resolutions for spectral envelope coding |
JP4966013B2 (ja) * | 2003-10-30 | 2012-07-04 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号のエンコードまたはデコード |
JP4396233B2 (ja) * | 2003-11-13 | 2010-01-13 | パナソニック株式会社 | 複素指数変調フィルタバンクの信号分析方法、信号合成方法、そのプログラム及びその記録媒体 |
EP1711938A1 (en) * | 2004-01-28 | 2006-10-18 | Koninklijke Philips Electronics N.V. | Audio signal decoding using complex-valued data |
US7272567B2 (en) * | 2004-03-25 | 2007-09-18 | Zoran Fejzo | Scalable lossless audio codec and authoring tool |
US7391870B2 (en) * | 2004-07-09 | 2008-06-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V | Apparatus and method for generating a multi-channel output signal |
EP1810281B1 (en) | 2004-11-02 | 2020-02-26 | Koninklijke Philips N.V. | Encoding and decoding of audio signals using complex-valued filter banks |
US7177804B2 (en) * | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
US8032368B2 (en) * | 2005-07-11 | 2011-10-04 | Lg Electronics Inc. | Apparatus and method of encoding and decoding audio signals using hierarchical block swithcing and linear prediction coding |
US8295362B2 (en) | 2006-01-05 | 2012-10-23 | Broadcom Corporation | Method and system for redundancy-based decoding of video content |
US7917561B2 (en) | 2005-09-16 | 2011-03-29 | Coding Technologies Ab | Partially complex modulated filter bank |
US8700387B2 (en) * | 2006-09-14 | 2014-04-15 | Nvidia Corporation | Method and system for efficient transcoding of audio data |
US8036903B2 (en) * | 2006-10-18 | 2011-10-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system |
JP5186510B2 (ja) | 2007-03-19 | 2013-04-17 | ドルビー ラボラトリーズ ライセンシング コーポレイション | スピーチ明瞭度強化方法と装置 |
CN100522920C (zh) | 2007-05-11 | 2009-08-05 | 上海康鹏化学有限公司 | 4-溴-2,6-二氟苯甲酸的制备方法 |
US7865291B2 (en) | 2007-07-12 | 2011-01-04 | Delphi Technologies, Inc. | System and method for a volumetric efficiency model for all air induction configurations |
US8548815B2 (en) * | 2007-09-19 | 2013-10-01 | Qualcomm Incorporated | Efficient design of MDCT / IMDCT filterbanks for speech and audio coding applications |
EP2045801B1 (en) * | 2007-10-01 | 2010-08-11 | Harman Becker Automotive Systems GmbH | Efficient audio signal processing in the sub-band regime, method, system and associated computer program |
KR101373004B1 (ko) * | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 장치 및 방법 |
DE102008024490B4 (de) | 2008-05-21 | 2011-09-22 | Siemens Medical Instruments Pte. Ltd. | Filterbanksystem für Hörgeräte |
CA2730232C (en) * | 2008-07-11 | 2015-12-01 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | An apparatus and a method for decoding an encoded audio signal |
CA2749239C (en) | 2009-01-28 | 2017-06-06 | Dolby International Ab | Improved harmonic transposition |
TWI618350B (zh) * | 2009-02-18 | 2018-03-11 | 杜比國際公司 | 用於高頻重建或參數立體聲之複指數調變濾波器組 |
US8392200B2 (en) * | 2009-04-14 | 2013-03-05 | Qualcomm Incorporated | Low complexity spectral band replication (SBR) filterbanks |
TWI556227B (zh) * | 2009-05-27 | 2016-11-01 | 杜比國際公司 | 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體 |
DE102009036610B4 (de) * | 2009-07-09 | 2017-11-16 | Sivantos Pte. Ltd. | Filterbankanordnung für eine Hörvorrichtung |
CN105017600A (zh) | 2014-12-10 | 2015-11-04 | 淄博龙沙高分子材料科技有限公司 | 增粘母料生产工艺 |
-
2011
- 2011-08-11 JP JP2013523621A patent/JP5665987B2/ja active Active
- 2011-08-11 EP EP11741598.4A patent/EP2603913B1/en active Active
- 2011-08-11 KR KR1020137005759A patent/KR101517446B1/ko active IP Right Grant
- 2011-08-11 BR BR112013003303-7A patent/BR112013003303B1/pt active IP Right Grant
- 2011-08-11 BR BR122021003884-8A patent/BR122021003884B1/pt active IP Right Grant
- 2011-08-11 WO PCT/EP2011/063848 patent/WO2012020090A1/en active Application Filing
- 2011-08-11 RU RU2013110507/08A patent/RU2562434C2/ru active
- 2011-08-11 CA CA2807889A patent/CA2807889C/en active Active
- 2011-08-11 ES ES11741598.4T patent/ES2501493T3/es active Active
- 2011-08-11 AU AU2011288406A patent/AU2011288406B2/en active Active
- 2011-08-11 CN CN201180049599.2A patent/CN103270553B/zh active Active
- 2011-08-11 MY MYPI2013000400A patent/MY156027A/en unknown
- 2011-08-11 MX MX2013001650A patent/MX2013001650A/es active IP Right Grant
- 2011-08-11 SG SG2013009204A patent/SG187743A1/en unknown
- 2011-08-11 PL PL11741598T patent/PL2603913T3/pl unknown
- 2011-08-11 BR BR122021003886-4A patent/BR122021003886B1/pt active IP Right Grant
- 2011-08-11 BR BR122021003887-2A patent/BR122021003887B1/pt active IP Right Grant
- 2011-08-11 BR BR122021003688-8A patent/BR122021003688B1/pt active IP Right Grant
- 2011-08-12 TW TW100128888A patent/TWI460719B/zh active
- 2011-08-12 AR ARP110102938A patent/AR082671A1/es active IP Right Grant
-
2013
- 2013-02-08 US US13/762,614 patent/US9595265B2/en active Active
- 2013-12-18 HK HK13114034.4A patent/HK1186832A1/zh unknown
-
2017
- 2017-02-03 US US15/424,625 patent/US10311886B2/en active Active
-
2019
- 2019-04-30 US US16/398,669 patent/US11361779B2/en active Active
-
2021
- 2021-02-10 US US17/172,335 patent/US11804232B2/en active Active
- 2021-02-10 US US17/172,281 patent/US11810584B2/en active Active
- 2021-02-10 US US17/172,254 patent/US11790928B2/en active Active
-
2022
- 2022-05-05 US US17/737,949 patent/US11961531B2/en active Active
- 2022-05-05 US US17/737,941 patent/US11676615B2/en active Active
- 2022-05-05 US US17/737,924 patent/US11475905B2/en active Active
- 2022-05-05 US US17/737,935 patent/US11475906B2/en active Active
-
2023
- 2023-10-09 US US18/378,028 patent/US20240046942A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2172931A1 (en) * | 2003-09-30 | 2010-04-07 | Panasonic Corporation | Sampling rate conversion apparatus, coding apparatus, decoding apparatus and methods thereof |
CN101069233A (zh) * | 2004-09-16 | 2007-11-07 | 法国电信公司 | 通过不同子带域之间通道进行数据处理的方法 |
CN101501760A (zh) * | 2006-07-31 | 2009-08-05 | 弗劳恩霍夫应用研究促进协会 | 处理实子带信号以减少混叠影响的设备和方法 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103270553B (zh) | 对正交镜像滤波器式音频编译码器的输出信号的重新取样 | |
CN101925950B (zh) | 音频编码器和解码器 | |
CN103403799B (zh) | 用于针对合成统一语音和音频编解码器(usac)处理音频信号和提供较高时间粒度的设备和方法 | |
CN105247613A (zh) | 音频处理系统 | |
CN101401305A (zh) | 利用复调制滤波器组的高效滤波 | |
CN101777348A (zh) | 局部复合调制的滤波器组 | |
CN100590712C (zh) | 编码装置和译码装置 | |
CN106165013A (zh) | 用于在具有不同采样速率的各帧之间的过渡时的声音信号的线性预测编码和解码的方法、编码器和解码器 | |
WO2023153228A1 (ja) | 符号化装置、及び、符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C56 | Change in the name or address of the patentee | ||
CP01 | Change in the name or title of a patent holder |
Address after: Munich, Germany Patentee after: Fraunhofer Application and Research Promotion Association Address before: Munich, Germany Patentee before: Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. |