CN101069233B - 通过不同子带域之间通道进行数据处理的方法 - Google Patents
通过不同子带域之间通道进行数据处理的方法 Download PDFInfo
- Publication number
- CN101069233B CN101069233B CN200580034793.8A CN200580034793A CN101069233B CN 101069233 B CN101069233 B CN 101069233B CN 200580034793 A CN200580034793 A CN 200580034793A CN 101069233 B CN101069233 B CN 101069233B
- Authority
- CN
- China
- Prior art keywords
- mrow
- msub
- vector
- math
- msubsup
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000003672 processing method Methods 0.000 title claims 4
- 239000013598 vector Substances 0.000 claims abstract description 165
- 239000011159 matrix material Substances 0.000 claims abstract description 125
- 238000006243 chemical reaction Methods 0.000 claims abstract description 87
- 238000001914 filtration Methods 0.000 claims abstract description 31
- 238000012545 processing Methods 0.000 claims abstract description 25
- 238000000034 method Methods 0.000 claims description 91
- 238000004458 analytical method Methods 0.000 claims description 62
- 230000015572 biosynthetic process Effects 0.000 claims description 61
- 238000003786 synthesis reaction Methods 0.000 claims description 61
- 230000008569 process Effects 0.000 claims description 45
- 230000009466 transformation Effects 0.000 claims description 37
- 238000005070 sampling Methods 0.000 claims description 22
- 238000012546 transfer Methods 0.000 claims description 21
- 230000014509 gene expression Effects 0.000 claims description 18
- 230000004044 response Effects 0.000 claims description 18
- 230000006835 compression Effects 0.000 claims description 15
- 238000007906 compression Methods 0.000 claims description 15
- 238000000354 decomposition reaction Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 12
- 230000000737 periodic effect Effects 0.000 claims description 6
- 238000012952 Resampling Methods 0.000 claims description 5
- 230000001364 causal effect Effects 0.000 claims description 2
- 230000000875 corresponding effect Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 14
- OVOUKWFJRHALDD-UHFFFAOYSA-N 2-[2-(2-acetyloxyethoxy)ethoxy]ethyl acetate Chemical compound CC(=O)OCCOCCOCCOC(C)=O OVOUKWFJRHALDD-UHFFFAOYSA-N 0.000 description 9
- 230000005236 sound signal Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 230000001934 delay Effects 0.000 description 4
- 230000000873 masking effect Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 230000001131 transforming effect Effects 0.000 description 4
- 102100036305 C-C chemokine receptor type 8 Human genes 0.000 description 3
- 102100026191 Class E basic helix-loop-helix protein 40 Human genes 0.000 description 3
- 101710130550 Class E basic helix-loop-helix protein 40 Proteins 0.000 description 3
- 101000837299 Euglena gracilis Trans-2-enoyl-CoA reductase Proteins 0.000 description 3
- 101000716063 Homo sapiens C-C chemokine receptor type 8 Proteins 0.000 description 3
- 101000591286 Homo sapiens Myocardin-related transcription factor A Proteins 0.000 description 3
- 102100034099 Myocardin-related transcription factor A Human genes 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 101150012579 ADSL gene Proteins 0.000 description 1
- 102100020775 Adenylosuccinate lyase Human genes 0.000 description 1
- 108700040193 Adenylosuccinate lyases Proteins 0.000 description 1
- 102100026190 Class E basic helix-loop-helix protein 41 Human genes 0.000 description 1
- 101000765033 Homo sapiens Class E basic helix-loop-helix protein 41 Proteins 0.000 description 1
- 241000764238 Isis Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 229920001690 polydopamine Polymers 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Processing (AREA)
Abstract
本发明涉及通过第一数目L到第二数目M的子带分量的不同子带域之间的通道进行数据处理。在确定第三数目K,即第一数目L和第二数目M之间的最小公倍数以后,a)如果K不同于L,输入矢量X(z)通过串/并转换进行区块排列以得到p2个多相分量矢量(p2=K/L);b)将K×K维方阵滤波T(z)应用到所述p2多相分量矢量以得到p1多相分量矢量,用于形成输出矢量Y(z),其中p1=K/M,以及如果第三数目K不同于第二数目M,通过并/串转换进行区块排列来得到所述输出矢量Y(z)。
Description
技术领域
本发明涉及一种通过不同子带域之间转换的数据处理,具体来说,但不以任何方式排外,涉及一种两种类型的压缩编码/解码之间的代码转换。
背景技术
目前用于多媒体信号的数字编码格式的发展允许高的压缩率。此外,传输和访问网络的容量的增加保证每天由公众使用大量的数字多媒体内容(语音、音频、图像、视频等等)。该内容的消费在各种类型的终端上(计算机、移动终端、个人助理(PDA)、电视解码终端(“机顶盒”)等等)并通过各种类型的网络(IP、ADSL、DVB、UMTS等等)实现。这种由用户对多媒体内容的访问在这些各种终端上并经过这些网络必须以透明的方式完成。然后有人提出“universal access to multimedia content(多媒体内容的通用接入)”或表示“Universal Multimedia Access(通用多媒体接入)”的“UMA”,其示意图如图1所示。
由于终端的不同引起的主要问题之一涉及它们能够解释的编码格式的多样性。一种可能的解决方案将会是在以兼容的格式传输内容之前恢复终端的容量。根据考虑(下载、流或广播)的多媒体内容的传输的任务,该解决方案可以证实是更有效或有效性更低。在某些情况下其变得不适用,例如对于多播模式的广播或流。代码转换(或改变编码格式)的概念因此被证明很重要。该操作可能在传输链的各层发生。其可能在服务器层发生用于在存储至例如数据库中之前改变内容的格式,或者在网络的网关中发生,等等。
代码转换直接和惯用的方法包括解码内容并且重新编码以得到新的编码格式的表示。这种方法一般具有使用大量计算机能量、由于处理增加算法延迟以及有时增加多媒体信号的感观质量的辅助下降的缺点。这些参数在多媒体应用中非常重要。其改进(减少复杂性和延迟并保持质量)是这些应用成功的重要因素。该因素有时成为实现的重要条件。
以改进这些参数为目的,所谓的“智能”代码转换的原则已经形成。这类代码转换包括执行初始编码格式的最小可能的部分解码,来提取允许重建新编码格式的参数。因此通过该方法减少算法复杂性和算法延迟以及保持或者甚至增加感观质量的能力评估这种方法的成功。
在图像和视频编码中,已经完成了许多有关代码转换的工作。我们引用示例,如图片大小从CIF到QCIF,或者MPEG-2到MPEG-4格式的改变。对于语音信号的代码转换,典型的在电话中,正在进行解决关于编码格式问题的工作。另一方面,很少或者几乎没有工作解决音频信号处理。现有的工作保持限制在一个和相同格式之中减少比特率或当在非常类似的结构的某些编码格式之间转换时减少比特率的情况。主要原因在于最广泛使用的音频编码器是变换(或子带)类型,并且一般来说,这些编码器使用不同的变换或滤波器组。这样,可以理解在涉及音频领域的智能代码转换的任何其他问题能够攻克之前,用于在这些变换域或滤波器组中的信号的表示之间转换的系统实现因此是要克服的第一困难。
下面在简要提示感观音频子带编码的原理之后,给出音频代码转换的定义和其引起的主要问题。
现有专为各种类型的应用和广泛的比特率以及质量而设计的大量类型的语音编码。这些编码可以称为构造器(或“专用”),或者由国际组织确定的其它标准。此外,这些都具有共同的基本结构并且依靠同样的原理。
感观频率音频编码的基本原理包括通过利用人类听觉系统的特性减少信息的比特率。音频信号的非相关分量被除去。该操作利用所谓的“掩蔽”的现象。由于这种掩蔽效果的说明主要在频域实现,信号的表示在频域实现。
具体的,编码和解码系统的基本示意图如图2a和2b所示。参照图2a,数字音频输入信号Se首先由一组分析滤波器20分解。得到的频谱分量之后由模块22量化然后编码。该量化采用感观模块24的结果从而来自该处理的噪音听不到了。最后,由模块26执行各种编码参数的多路复用并且从而构建了一个音频帧Sc。
参照图2b,以双重方式执行解码。由模块21进行音频帧的解复用,各种参数被解码然后信号的频谱分量由模块23解量化。
最后,通过一组合成滤波器25重构暂时音频信号。
因此任何感观音频编码系统的第一部分包括一组分析滤波器20,用于时间/频率变换。大量的滤波器组和变换已经被开发并用于音频编码器。可以建议利用伪QMF(正交镜像滤波器)滤波器组、混合滤波器组、MDCT(修正离散余弦变换)变换器组。在本文中MDCT变换目前证明是最有效的。这是最新最有效的音频编码算法的基础,例如那些在来自法国电信的UIT-T标准G.722.1的TDAC编码器/解码器(“时域混叠消除”的标准)中,用于MPEG-4AAC,TwinVQ和BSAC,Dolby AC-3标准的那些算法。
虽然已经分别开发这些各种变换,可以通过类似的通用数学方法以及从各种观点说明这些变换:调制余弦滤波器组、重叠正交变换(或“LOT”)以及更一般的对于具有最大抽取的滤波器组,也就是说用临界采样。滤波器组的临界采样的特性在于子采样/过采样因子等于子带的数目。
图3a和3b分别示出了在根据第一编码格式的编码器CO1和根据第二编码格式的解码器DEC2之间,传统代码转换和智能代码转换在通信链中的示意图。在传统代码转换的情况下,由根据第一格式(图3a)的解码器模块DEC1执行完整的解码操作,接着由根据第二格式的编码器模块CO2的再编码,从而最终以第二编码格式结束。
在图3b的示例中,图3a的两个模块DEC1和CO2在另一方面以一个集成后的模块31代替,该集成后的模块31被称为“智能”代码转换模块。
图4表示的是合并入智能代码转换的实现的操作的详细情况。这主要包括在模块31中集成了传统代码转换的合成滤波器组BS1和分析滤波器组BA2的功能模块从而最后在一个系统中子带域之间直接转换。
各种类型滤波器组(不同的大小,尤其是按照子带的数目,以及不同的结构)的编码器的使用是主要和首先要克服的问题。因此这涉及一帧的整组采样从初始滤波器组的域到目标滤波器组的域的转换。这种转换是在任何智能音频代码转换系统中完成的第一步操作。
下面的表1总结了关于在众所周知的基于转换的音频编码器中使用的滤波器组的类型,以及其特性。可以看到,除了最广泛采用的MDCT(修正离散余弦变换)变换以外,还有伪QMF(正交镜像滤波器)组。此外,他们都形成最大抽取和调制余弦组的族的一部分,其正好或几乎满足完全重构的特性。
表1:在音频编码中应用最广泛的滤波器组及其特性
编码器 | 滤波器组 | 特性 |
MPEG-1 Layer I & II | 伪QMF | 子带数目M=32 |
MPEG-1 Layer III | 伪-QMF/MDCT (混合) | 32个子带,各自有大小为18的MDCT |
MPEG-2/4 AAC | MDCT | 对于长窗M=1024个子带对于短窗M=128个子带。KBD(凯塞-贝塞尔推导的)窗 对于固定状态α=4对于变换状态α=6。 |
MPEG-4 BSAC | MDCT | 对于长窗M=1024个子带对于短窗M=128个子带。 |
MPEG-4 TwinVQ | MDCT | 对于长窗M=1024个子带对于短窗M=128个子带。 采用KBD窗或正弦窗的可能性。 |
Dolby AC-3 | MDCT | 对于长窗M=256个子带对于短窗M=128个子带KBD窗α=5 |
FTR&D TDAC | MDCT | 正弦窗M=320个子带 |
G.722 | QMF | 两个子带 |
G.722.1 | MDCT | 正弦窗M=320个子带 |
表1显示出AAC和AC-3格式之间的转换目前引起大量兴趣。
下面的表2重复说明表1中的某些类型的子带编码,详细说明其一些应用。
表2:用于音频信号和语音信号的子带编码器的示例及其主要应用的一些示例。
编码器 | 应用 | 说明 |
MPEG-1/2 Layer I | 广播 | |
MPEG-1/2 Layer II | 广播 | 用于欧洲DAB广播(“数字音频广播”,ETSI ETS300 401标准)。还用于欧洲射频 数字电视广播(DVB标准) |
MPEG-1 Layer III (MP3) | 下载, 流 | |
MPEG-2/4 | 广播, | MPEG-2 AAC音频编码器 |
AAC | 下载, 流 | (ISO/IEC13818-7)是指定用于日本ISDB(综合业务数字广播)业务中广播的唯一音频编码器,业务包括:-ISDB-T(地面),-ISDB-S(卫星),-以及ISDB-C(有线).DVB-IP采用MPEG-2 AAC编码器 |
MPEG-4BSAC | 广播 | 该编码器用于韩国数字电视广播 |
Dolby AC-3 | 广播 | 用于美国数字电视广播 |
SonyATTRAC3 | 用于日本(iTunes类型的在线音乐频道) | |
法国电信:TDAC | 电话会议 | |
UIT-T G.722 | 电话会议 | |
UIT-T G.722.1 | 电话会 议,H.323 | 组通信系统(电话会议,音频会议) |
在现有技术的音频代码转换中,文献US-6,134,523介绍了对于由MPEG-1层I或层II编码的音频信号在编码域减少比特率的处理。即使该处理类似于音频代码转换处理,但是其在编码器格式之间不能实施任何改变并且子带的信号改变保留为一个并且相同变换域的表示,即伪QMF滤波器组的表示。这里,所述信号根据新的比特分配非常简单的重新量化。
此外,在文献US-2003/0149559中,建议在代码转换操作期间减少心理声学模型的复杂性。这样,从而在代码转换期间不必采取计算掩蔽阈值的操作,该新系统使用存储在失真模板数据库中的值。即使该过程处理代码转换的问题,其仍然远离关于在滤波器组域之间的转换的目标。
在文献US-2003/014241中,提出一种用于在MPEG-1层II和MPEG-1层III音频编码格式之间的代码转换的系统。具体来说,MPEG-1层II格式采用伪QMF分析滤波器组而MPEG-1层3格式采用相同的滤波器组接着对所述滤波器组的输出子带信号应用大小为18的MDCT变换。有人称为“混合滤波器组”。该文献中提出的这种转换系统在于在MPEG-1层II帧的子带采样的反量化之后施加这种转换。因此该系统得益于两种编码格式的相似性。
关于在本发明的意义之中广受欢迎的目的,注意下面的说明:
●这种现有技术只能应用于这种特殊情况的代码转换。
●这种技术不是真正在新的不同的子带域中执行转换的处理。其简单包
含级联新的缺少的分析滤波器组,其使得可能增加频率分辨率。
在转换域中的多速率处理和滤波在图像和/或视频数据处理的其它情况中已经知道,尤其是通过该会议:“2-D Transform-Domain ResolutionTranslation”,J.-B.Lee和A.Eleftheriadis,IEEE Trans.On Circuit and Systemsfor Video Technology(IEEE学报,视频技术电路和系统),Vol.10,No.5,2000年8月。
说明了一种在变换后的域(TDF表示“变换域滤波器”)中线性滤波处理的概述。具体来说,该概述建立在下述情况下:即第一变换(反向)T1和第二变换(正向)T2是相同大小。该概述首先在于扩展所述处理到变换不是相同大小的情况。然后这种处理称为“非一致TDF”(或NTDF)。之后扩展到除了滤波,在变换后的域中加入多速率处理操作(子采样和过采样)的情况,这产生“多速率TDF”(MTDF)。
推荐的应用为改变变换域中的分辨率(TDRT代表“变换域分辨率转换”),特别是图像和视频应用(CIF和QCIF图像格式之间的转换),其中变换是DCT(代表“离散余弦变化”)。因此,该引用仅仅对变换后的域中的滤波感兴趣。提出的这种处理仅仅限于没有重叠的变换的情况,例如DCT、DST等等,但是通常不能应用于有重叠的变换例如MLT(代表“调制重叠变换”)以及,更一般的,应用于任何类型的具有最大抽取的滤波器组,这些滤波器甚至具有有限或无限冲激响应。
关于不同大小的DCT域之间的变换,仍旧是用于图像和视频的代码转换,可以引用下面的文献作为参考:“Direct Transform to Transform Computation″,A.N.Skodras,IEEE Signal Processing Letters(IEEE信号处理快报),Vol.6,No.8,1999年8月,页码:202-204。
在该文献中提出用于在DCT域中为图像子采样的不同大小的DCT变换之间转换的处理。该处理的应用之一是代码转换。此外,该处理限于由两个相邻的各自大小为N/2的变换矢量构成一个大小为N的变换矢量。
文献US-2003/0093282中介绍了在MDCT域中和DFT(离散傅立叶变换)域中信号表示之间转换的处理。
这是为了将音频信号转换成可以方便修改的表示而开发的。具体的,与DFT滤波器组相反,TDAC滤波器组是更实用的并且在音频编码器中用的很多。此外,由于存在频谱混叠部分,该变换域中的信号分量执行处理或修改既不充分也不足够灵活。另一方面,当对音频信号作修改,例如时标变化或基音平移时,DFT表示更有用。因此该参考文献提出了一种用于MDCT和DFT域之间转换的直接处理代替采用传统的处理,传统的处理在于通过逆MDCT合成暂时信号,然后应用DFT。因此该处理允许在编码的域直接进行修改。该文献还提出用于在DFT和MDCT域之间转换的双处理,其在修改之后需要重编码音频信号的情况下将很有用。
在该参考文献中,与传统变换过程相比在复杂性方面没有减少。此外,证明内存的少量增加允许数据的存储。
然而,
●在该参考文献中提出的的处理解决特殊情况。其仅限于在MDCT和DFT域之间变换的情况,反之亦然。
●该处理限于这两个滤波器组是相同大小的情况。
还可以引用出版物“An Efficient VLSI/FPGA Architecture for Combining anAnalysis Filter Bank following a Synthesis Filter Bank”,Ravindra Sande,Anantharaman Balasubramanian,IEEE International Symposium on Circuits andSystems(IEEE电路和系统国际讨论会),Vancouver,British Columbia,Canada,2004年5月23日到26日。
该出版物公开了一种用于实现由具有L个子带的合成滤波器组后面接着具有M个子带的分析滤波器组构成的系统的有效的结构,其中M和L一个是另一个的倍数。该结构对于以VLSI(“超大规模集成”)集成技术或FPGA(“现场可编程门阵列”)或并行处理器实现有效。其需要更少的逻辑块、低电耗以及使得可以扩展并联的级数。在基于子带的一个处理接着另一个子带处理的情况下以及并且在不需要中间的合成信号的情况下可以应用该提子网掩码处理。
然而:
●上述的处理做限制性假设,即考虑的滤波器组是调制的并且可以分解成为多相结构。
●该处理仅限于其中M和L一个是另一个的倍数的特殊情况。
应当指出,用于在子带域之间转换的该方案的结构展示了与复用转换问题某些相似性,尤其是在“Multirate Systems and Filter Banks”(多速率系统和滤波器组),P.P.Vaidyanathan,Prentice Hall,Englewood Cliffs,NJ,1993,第148-151页中介绍的复用转换。
具体的,在从TDM到FDM(表示从“时域复用”到“频域复用”)的复用转换中,采用了合成滤波器组。为了重构交错时域信号(也就是说执行从FDM到TDM的复用反变换操作),采用分析滤波器组。因此TDM->FDM->TDM系统的结构等于是合成滤波器组和分析滤波器组的级联,这正好对应也在传统代码转换系统中使用的结构。在这些复用变换系统中一般提出的问题是在TDM->FDM->TDM操作之后没有失真地重构初始信号。这主要涉及在这些滤波器组中,消除由于采用非理想带通滤波器引起的串音干扰现象引起的失真。合成滤波器和分析滤波器的一种明智的设计如同在下述参考文献中所示:“Multirate Systems and Filter Banks”(多速率系统和滤波器组),P.P.Vaidyanathan,Prentice Hall,Englewood Cliffs,NJ,1993,第259-266页,该设计使得可能克服该问题。在这些滤波器的设计建议中,给出了合并合成滤波器组和分析滤波器组的处理,从而考虑提出一种智能变换系统。
然而:
●在该文献建议的多路复用结构中,合成滤波器组和分析滤波器组具有相同的子带数目(M=L)。
●没有构建一个合并合成滤波器组和分析滤波器组的复用变换系统,正如在代码转换中。这两个滤波器组是独立左级联。
发明内容
本发明寻求相对上述现有技术改进其状况。
为了该目的,本发明提出了一种由计算机资源实现的通过在多媒体信号的不同子带域之间转换来处理数据的方法,在于在同一处理中紧缩包括:将含有第一数目L个单独的子带分量的第一矢量X(z)应用到一组合成滤波器,然后应用到一组分析滤波器,以获得包括第二数目M个单独的子带分量的第二矢量Y(z),其中X(z)和Y(z)分别为矢量X和矢量Y根据其z变换的表达式。
在本发明意义内的方法包括以下步骤,在确定第三数目K,即第一数目L 和第二数目M之间的最小公倍数之后:
a)如果第三数目K不同于第一数目L,通过以因子p2子采样进行第一矢量X(z)的串/并变换,以进行区块排列以得到p2个多相分量矢量,其中p2=K/L,
b)选择的包括K×K维方阵T(z)的矩阵滤波应用到所述p2多相分量矢量以获得第二矢量Y(z)的p1个多相分量矢量,其中p1=K/M,
c)如果第三数目K不同于第二数目M,通过给p1个多相分量矢量施加按照因子p1的过采样进行并/串变换,以进行区块排列以得到所述第二矢量Y(z),
-p=M/L,
-k是l/L的整数部分,并且
-数字j由j=l-kL给定,
e)如果第一数目L是第二数目M的倍数,方阵T(z)的元素Tml(z)表示为: m和l在0和L-1之间,并且其中:
-k是m/M的整数部分,并且
-数字i由i=m-kM给定,
-n在0和M-1之间而k在0和L-1之间,并且
-Hn(z)和Fk(z),分别与分析滤波器组和合成滤波器组关联的传递函数的矢量的第n和第k分量。
本发明还提供一种将第一类型的压缩编码/解码代码转换到至少一个第二类型的压缩编码/解码的设备,该设备包括在同一处理中的:
-根据所述第一类型,以包括第一数目L个单独子带分量的第一矢量X(z)的形式至少部分解码以恢复数据的装置,
-将第一矢量X(z)应用到根据所述第一类型的合成滤波器组,然后应用到根据第二类型的分析滤波器组的装置,以及
-恢复包括第二数目M个单独子带分量的第二矢量Y(z)的装置,该第二矢量Y(z)能应用于后来的根据第二类型的编码;
其中X(z)和Y(z)分别为矢量X和矢量Y根据其z变换的表达式,并且所述的将第一矢量X(z)应用到根据所述第一类型的合成滤波器组,然后应用到根据第二类型的分析滤波器组的装置进一步包括由计算机资源实现通过在多媒体信号的不同子带域之间转换的数据处理装置,所述数据处理装置用于在同一处理中将含有第一数目L个单独的子带分量的第一矢量X(z)应用到合成滤波器组,然后应用到分析滤波器组,以获得含有第二数目M个单独的子带分量的第二矢量Y(z),
所述数据处理装置包括用于确定第三数目K,即第一数目L和第二数目M的最小公倍数的装置,并且还包括如下装置:
a)用于如果第三数目K不同于第一数目L,通过以因子p2子采样进行第一矢量X(z)的串/并转换,以进行区块排列以得到p2个多相分量矢量的装置,其中p2=K/L,
b)用于将选择的涉及K×K维方阵T(z)的矩阵滤波应用到所述p2个多相分量矢量以获得第二矢量Y(z)的p1个多相分量矢量的装置,其中p1=K/M,
c)用于如果第三数目K不同于第二数目M,通过给p1个多相分量矢量施加按照因子p1的过采样进行并/串转换,以进行区块排列以得到所述第二矢量Y(z)的装置,
d)用于如果第二数目M是第一数目L的倍数,将方阵T(z)的元素Tml(z)表示为: 的装置,其中m和l在0和M-1之间,并且其中:
-p=M/L,
-k是l/L的整数部分,并且
-数字j由j=l-kL给定,
-k是m/M的整数部分,并且
-数字i由i=m-kM给定,
其中所述方阵T(z)的元素表示为由Gnk(z)=Hn(z)Fk(z)给出的乘积滤波器Gnk(z)的K阶的多相分量的函数,其中:
-n在0和M-1之间而k在0和L-1之间,并且
-Hn(z)和Fk(z),分别与分析滤波器组和合成滤波器组关联的传递函数的矢量的第n和第k分量。
这样,本发明尤其提出,但如下所示并不排除,从任何第一类型编码到任何第二类型编码的代码转换。还可以理解子带的各自的数目M和L是任何自然整数并且在最通用的情况下不需要成比例的关系。
这样,本发明的意思中的方法可以有利地应用于从第一类型的压缩编码/解码到至少一种第二类型的压缩编码/解码的代码转换。该应用典型地在于同一处理中紧缩有如下步骤:
-根据所述第一类型,以包括第一数目L个单独子带分量的第一矢量X(z)的形式至少部分解码恢复数据,
-将第一矢量X(z)应用到根据所述第一类型的合成滤波器组,然后应用到根据第二类型的分析滤波器组,以及
-恢复包括第二数目M个单独子带分量的第二矢量Y(z)并且该第二矢量Y(z)可以应用到后来的根据第二类型的编码步骤。
本发明的目的还在于一种计算机程序产品,存储在通信网络中例如服务器、网关、或其它终端的一项设备的内存中,并且包括用于实现如本发明所述方法的全部或部分的指令。
本发明的目的还在于一种用于通信网络的设备例如服务器、网关、或其他终端,并且包括用于实现本发明所述方法的计算机资源。
附图说明
本发明的其他特征和优点将在研究下面的详细说明和附图之后变得明显,其中:
图1示出了对多媒体内容(UMA)的通用访问的概念;
图2a和2b示出了分别在编码和解码过程中的感观频率音频压缩系统的基本方案;
图3a和3b图示了分别使用传统代码转换和智能代码转换的通信链;
图4示出了上述的传统代码转换的框图(图的上部分)和智能代码转换的框图(图的下部分);
图5a和5b图示了说明暂时信号的合成和用新滤波器组的分析(图5a)与两个子带域之间的直接转换(图5b)等效的框图;
图6示出了子带域之间的传统转换的多速率区块图;
图7示出了本发明意义内的子带域之间转换的系统的多速率区块图;
图8示出了本发明意义内的在转换系统中滤波的方法;
图9示出了在M=pL的特定情况下本发明意义内的转换系统的多速率区块图;
图10示出了在M=pL的特定情况下本发明意义内的转换系统中滤波的方法;
图11示出了在L=pM的特定情况下本发明意义内的转换系统的多速率区块图;
图12示出了在L=pM的特定情况下的转换系统中滤波的方法;
图13示出了以LPTV系统为例,L=pM的情况下的转换系统中滤波的方法,其中输入比特率与输出比特率不同;
图14示出了在LPTV系统M=pL的情况下的转换系统图,其中输入比特率与输出比特率不同;
图15示出了在M和L不以特定比例关系相关的一般情况下以LPTV系统为例,本发明意义内的转换系统的图;
图16示出了在N=3的情况下通过变换和叠加运算(术语OLA代表“重叠和相加”)的本发明意义内的转换系统的实施;
图17示出了本发明意义内在对应于变换和具有叠加OLA的实施方式中的的转换系统,用于允许飞速处理的高效实施;
图18示出了在M=pL的特定情况下,本发明意义内在对应于变换和叠加OLA的实施方式中的转换系统,用于允许飞速处理的高效实施;
图19示出了在L=pM的特定情况下,本发明意义内在对应于变换和叠加OLA的实施方式中的转换系统,用于允许飞速处理的高效实施;
图20a和20b分别示出了本发明意义内的与子带域之间的转换结合在一起 的滤波以及等效的整个系统;
图21a和21b分别示出了传统的和本发明意义内的采样频率变化(或“重采样”)与子带域之间的转换的结合;
图22示出了本发明意义内结合了重采样的子带域之间的转换的系统的多速率区块图;
图23示出了本发明意义内的系统,以LPTV应用了结合有重采样的转换的LPTV系统为例;
图24示出了对应于变换和叠加OLA的优选实施方式,用于允许图23的转换系统飞速处理的高效实施;
图25示出了本发明的可能应用的插入通信网络的网关GW中的代码转换;
图26示出了直接插入服务器SER的代码转换;以及
图27示出了在特定情况的编码格式下本发明意义内的转换系统的参数表。
具体实施方式
在下面以本发明普通代表的方式描述子带域之间转换的方法。
由第一压缩编码系统使用并由其滤波器限定的L-带合成组,其表示为Fk(z),0≤k≤L-1,以及在第二压缩系统中使用并由其滤波器限定的M-带分析滤波器组,其表示为Hn(z),0≤n≤M-1。如下所述,假设在两个压缩系统中使用的两个滤波器组为优先最大抽取系统(或“临界采样系统”)。
用X(z)=[X0(z)X1(z)...XL-1(z)]T和Y(z)=[Y0(z)Y1(z)...YM-1(z)]T来表示分别代表第一和第二滤波器组的域中的信号的子带的信号矢量。
图5a和5b示出子带域之间转换的原理。包括查找相当于合成组BS1和分析组BA2(图5a)的级联的系统51,该系统51用于在子带信号矢量X(z)和Y(z)之间转换(图5b)的系统51。目的是合并这两个滤波器组之间的一定数学计算运算以降低算法复杂性(即,计算运算的数量和所需内存的数量)。另一目的在于将由该变换带来的算法延迟降低到最小。
通过使用多速率块,图5a中的方案可以表示为图6中的图,其中分析滤波器组在合成滤波器组之后。具有L子带的合成滤波器组在各子带k, 0≤k≤L-1中由按照因子L的过采样的运算组成,所述过采样之后是合成滤波器Fk(z)的滤波。对应于输入矢量X(z)的第k分量的子带信号首先被过采样然后由滤波器Fk(z)滤波。随后通过0≤k≤L-1的这些滤波结果相加得到在该合成组的输出合成的暂时信号
该暂时信号随后构成具有M子带的分析组的输入。在各子带n,0≤n≤M-1上,由分析滤波器Hn(z)进行滤波,随后是按照因子M的过采样运算。然后在该分析组的输出处获得在z变换的域中用Y(z)表示的大小为M的子带信号的矢量。在该传统转换系统中通常必须要进行时域信号的合成,这是与本发明意义中的下述转换系统相比的区别之处。
现在根据普通表达描述本发明意义中的转换系统。
用M和L的最小公倍数K(即,K=1cm(M,L))以及p1和p2表示自然整数,从而:
K=p1M且K=p2L. (1)
认为 是通过信号矢量X(z)分解为p2多相分量而得到的矢量,并且认为 是通过信号矢量Y(z)分解为p1多相分量而得到的矢量。
用g(z)表示合成和分析滤波器之间的乘积,大小为M×L的矩阵。该矩阵的元素可以写为如下:
Gnk(z)=Hn(z)Fk(z),0≤n≤M-1,0≤k≤L-1. (2)
并且,矩阵形式为:
g(z)=h(z)fT(z), (3)
其中,h(z)=[H0(z)H1(z)...HM-1(z)]T和(z)=[F0(z)F1(z)...FL-1(z)]T分别是第二滤波器组的分析滤波器的矢量和第一滤波器组的合成滤波器的矢量。
用下面公式表示子带域之间的转换:
V(z)=T(z)U(z) (4)
转换矩阵T(z)的大小为K×K。其可以按如下表示:
其中,v(z)是大小为p1×p2的矩阵,其元素定义为如下:
vij(z)=ziM-jL,0≤i≤p1-1且0≤j≤p2-1 (6)
运算↓K表示按因子K的抽取,相当于在K个样本中仅有一个样本被保留的子采样。
如下所述,转换系统可以示意性地表示为如图7所示,其中示出了系统有利地是所谓的“线性周期时变”或者LPTV系统。
在图7中,输入框71包含超前zp2-1和系列延迟,接着是按照因子p2的抽取72_p2-1至72_0,该输入框被解释为用于排列p2输入矢量的各序列的机制,表示为X[n],如单个矢量U[k]的K个区块。后面的矢量U[k]应用到滤波矩阵T(z)(模块74),并且结果是与矢量U[k]大小相同的矢量V[k]。
符号X(z)简单地涉及矢量X根据其z变换的表达式,而符号X[n]为矢量X在时域中的表达式,这点对于本领域技术人员来说是惯例。
图7的最后一框73_p1-1至73_0最终能够串行地设置矢量V[k]的各大小为M的p1连续子矢量,从而产生输出矢量Y[r]。
图7的输入和输出框最终与图8的在框81中进行排列并随后在框82串行设置的机制几乎相同,图8总结了本发明意义内的主要方法步骤。
优选地,本发明意义内的转换系统具有最小延迟。
具体地,子带域转换系统的目的之一是使引起的算法延迟最小。因此,必须引入超前减少延迟。如果:
-在合成滤波器组的输入处增加超前/延迟za,a∈Z,
-并且在两个滤波器组之间增加超前/延迟zb,b∈Z,
那么上述公式(5)变为:
指数eij=aL+b+(iM-jL),0≤i≤p1-1,0≤j≤p2-1在下面两个极值之间变化:
当i=0,j=p2-1时,emin=aL+b-(p2-1)L=aL+b-K+L, (9)
和
当i=p1-1,j=0时,emax=aL+b+(p1-1)M=aL+b+K-M (10)
矩阵T(z)的元素滤波器都是因果滤波器,如果并且仅如果:
emax≤K-1, (11)
即:aL+b≤M-1. (12)
本发明意义内的转换系统因此可以用各种延迟并且通过做出关于参数a和b的不同选择构造,但是条件是优选地满足不等式(12)。
参数a和b因此被看作调整参数,其可以对用于子带域之间转换的系统所引起的算法延迟方面起作用。
对于具有最小算法延迟的转换系统,应当引入最大可能超前。因此优选地以下述方式做出a和b的选择:
emax=K-1, (13)
即:aL+b=M-1. (14)
对于该选择,公式(8)变为:
否则:
其中,在这里,v(z)是元素按如下定义的矩阵:
vij(z)=zM-1+iM-jL,0≤i≤p1-1且0≤j≤p2-1. (17)
关系式(16)因此是转换矩阵T(z)的通用公式,其能够将由本发明意义内的转换系统所引起的算法延迟减少到最小。
接下来,应当考虑具有最小延迟的转换系统的情况。
注意到,关系式(18)中考虑的多相分量对应于类型1至K阶的分解,如前述参考文件:″Multirate Systems and Filter Banks″,P.P.Vaidyanathan,PrenticeHall,Englewood Cliffs,NJ,1993中所描述的。
该解释因此能够从乘积滤波器Gnk(z)=Hn(z)Fk(z)(0≤n≤M-1且0≤k≤L-1)和通过增加延迟构造的相应滤波器的类型1至K阶的多相分量直接构造矩阵T(z)。
为了更清楚地表达矩阵T(z)的元素,写出:
T(z)=[Tml(z)]0≤m,l≤K-1 (19)
因此,矩阵T(z)的元素滤波器当0≤m,l≤K-1可以写为:
在后的公式(20)中,整数i,n和j,k与l和m的关系如下:
符号Gnk r(z)(其中0≤r≤K-1)表示从类型1至K阶的分解得到的滤波器Gnk(z)的多相分量数r。
如果合成滤波器和分析滤波器具有有限冲激响应(或“FIR”),可以直接确定多相分量Gnk r(z)(其中0≤r≤K-1)。在一个或两个滤波器组使用递归滤波器(具有无限冲激响应或“IIR”)的情况下,乘积滤波器Gnk(z)也具有无限冲激响应。在来自参考文件:″Traitement du signal audio dans le domaine codé:techniques et applications″[Audio signal processing in the coded domain:techniques and applications],A.Benjelloun Touimi,doctoral thesis from the écolenationale supérieure des télécommunications de Paris,May 2001的题为“Polyphase decomposition of recursive filters(递归滤波器的多相分解)”的附录 A中描述用于进行该分解的通用过程。
以下描述在M=pL的特定情况下的本发明意义内的方案。
在M=pL的情况下,出现K=1cm(M,L)=M且p1=1同时p2=p。那么公式(4)变为:
Y(z)=T(z)U(z). (23)
其中, 是矢量信号X(z)的p阶的多相分量的矢量。
在该情况下的转换矩阵是大小为M×M,并且可以写为:
因此,根据合成和分析滤波器的乘积的矩阵g(z)的类型1至M阶的分解,该矩阵是分别由通用指数(p-k)L-1(其中0≤k≤p-1)的多相分量的行矢量。
更清楚地,矩阵T(z)的元素滤波器可以写为如下:
其中,j和k是通过下面的关系式由l获得的整数:
符号Gmj r(z)(其中0≤r≤M-1)表示由M阶的分解得到的滤波器Gmj(z)的普通标号r的多相分量。
下面给出了转换系统的方案,其中图9为多速率表达,图10示出了滤波方法的主要步骤。
下面描述在L=pM的特定情况下的本发明意义内的方案。
在该特定情况下,出现K=1cm(M,L)=L且p1=p同时p2=1。那么公式(4)变为:
V(z)=T(z)X(z), (27)
其中, 是矢量信号Y(z)的p阶的多相分量的矢量。
在该情况下的转换矩阵是大小为L×L,并且可以写为:
根据合成和分析滤波器的乘积矩阵g(z)的类型1至L阶的分解,该矩阵是分别包含通用标号(k+1)M-1(其中0≤k≤p-1)的多相分量的列矢量。
更清楚地,矩阵T(z)的元素滤波器可以写为如下:
其中,i和k是通过下面的关系式从m获得的整数:
符号Gil r(z)(其中0≤r≤L-1)表示从L阶的分解得到的滤波器Gil(z)的通用标号r的多相分量。
参数a和b的可能选择包括采用a=0且b=M-1。在优先满足等式(14)的条件下可以设想其他选择,从而获得具有最小延迟的系统。
下面给出了在L=pM的特定情况下的转换系统的方案,其中图11为多速率表达,并且图12示出了滤波方法的主要步骤。
现在根据线性周期时变系统的方案将描述本发明意义内的转换系统。在该情况下,合成和分析组的滤波器优先地是临界采样滤波器。
图7给出的转换系统的方案显示,这是在下述参考文件意义内的线性周期时变或“LPTV”系统:“Multirate Systems and Filter Banks (多速率系统和滤波器组)”,P.P.Vaidyanathan,Prentice Hall,Englewood Cliffs,NJ,1993中的章节10.1。
为了确定该系统的周期并找到清楚说明其性质的等效结构,首先按以下设定特定情况L=pM且M=pL。
用fs表示时域中信号的采样频率,并且用fs1和fs2分别表示在第一和第二滤波器组的域中的采样频率。而且用Ts,Ts1和Ts2分别表示相应的采样周期。这些参数满足下列关系式:
在L=pM的特定情况下,考虑图7的方案和转换矩阵的公式(28),可以从中推导出转换系统是周期pTs2=Ts1的线性周期时变系统。用图13的结构可以表达。其特征是由下式定义的p传递矩阵Ak(z)(其中0≤k≤p-1)的组:
该系统在输入和输出不具有相同的比特率。输入的比特率是fs1,并且输出的比特率是fs2=pfs1。传递矩阵Ak(z)以采样频率fs1运算,并且系统整体工作好像在系统输出处开关130(图13)以循环方式以该相同频率fs1从一个矩阵框Ak(z)的输出到另一个的输出之间转换。
在M=pL的其他特定情况下,考虑在该情况下采用的转换矩阵的公式(24),图7的方案变为图14的方案。
该转换系统可以被视为LPTV系统,其中周期pTs1=Ts2,特征是由关系式(33)定义的p矩阵Ak(z)(其中0≤k≤p-1)的组并接下来对所有其输出的求各:
在该系统的输入,比特率是fs1=pfs2,且输出比特率是fs2。传递矩阵Ak(z)以采样频率fs2工作,并且系统整体工作好像在系统的输入处开关140(图14)以循环方式以该相同的频率fs2从一个矩阵Ak(z)的输入到另一个矩阵的输入之间转换。
另外指出,在时刻nTs2,转换系统Y[n]的输出等于在各时刻由X[(n-1)p+k+1]反馈的Ak(z)(其中0≤k≤p-1)的输出的和:
((n-1)p+k+1)Ts1=(n-1)Ts2+(k+1)Ts1.
现在描述在M和L不必通过比例关系相关的普通情况下的系统的工作方式。考虑图7的方案和上面给出的两个特定情况L=pM且M=pL的说明由关系式(15)给出的矩阵T(z)的形式,普通情况下的转换系统可以概括为图15所示的表达。普通系统包括周期各为p2Ts1的多个p1线性周期时变子系统。 来自该组的阶数i(其中0≤i≤p1-1)的LPTV子系统的特征是下面的p2传递矩阵Aij(z):
这些子系统的整个组并行运算,并且其输出之一被周期性地选择作为周期为p1Ts1的系统的输出。整个系统也是周期为KTs的线性周期时变系统。具体地:
K=p2L=p1M,且
因此,
在时刻nTs2,系统Y[n]的输出等于在时刻nTs2,LPTV子系统i的输出,其中i=n modp1。在时刻kTs1,系统X[k]的输入转向各p1 LPTV子系统中第j子系统的输入,其中j=k modp2。
在该系统输入比特率是fs1,且输出比特率是fs2,这使得本发明意义内的转换系统能够飞速处理输入数据。
回想滤波器Aij,nk(z)(其中0≤n≤M-1且0≤k≤L-1)的表达式,传递矩阵Aij(z)的元素取决于eij,因此取决于标号i和j,并且可以写为:
且 如果eij≤0 (38)
下面描述本发明意义内的转换系统的有利实施。
用N1表示滤波器Fk(z)(其中0≤k≤L-1)的长度,并且用N2表示滤波器Hn(z)(其中0≤n≤L-1)的长度。这些符号仅在这些滤波器具有有限冲激响应并对于两个滤波器组的每个具有相同长度的情况下使用。
下面的表达式将用于基于T(z)的矩阵滤波模块的输入和输出的矢量:
U(z)=[U0(z)U1(z)…UK-1(z)]T (39)
且 V(z)=[V0(z)V1(z)…VK-1(z)]T (40)
基于矩阵滤波的实施从公式(4)和图8的转换系统的方案代表直接得出。因而,矢量V[k]的分量的各信号Vm[k]是通过滤波器Tml(z)的每个信号Ul[k]的滤波结果的和,其中0≤m≤K-1,0≤l≤K-1。
在有限冲激响应合成和分析滤波器组的情况下,矩阵T[z)的所有元素滤波器也是有限冲激响应滤波器。通常,在该情况下可以使用基于卷积相乘特性的快速滤波处理。
在无限冲激响应滤波器的情况下,表示在实施中能够分解出矩阵T(z)的元素之间的一定分母。
现在描述使用重叠变换的实施。这里假设合成和分析组的滤波器是有限冲激响应并且为最大抽取类型。
转换矩阵T(z)表达如下:
其中,Pn是大小为K×K的矩阵,并且N相当于T(z)的元素的滤波器Tml(z)的最大长度。
在最普通的情况下,该长度N通过下面的表达式给出:
其中,r0通过下式给出:
r0=(N1+N2-2)mod K. (43)
接下来,考虑情况之间的变化,长度N使用下面的定义:
通过矩阵T(z)的滤波运算可以写为如下:
考虑大小为NK×K的通过下式定义的矩阵P:
系统因此可以通过矩阵变换P来构造,接下来是叠加运算。该实施与重叠变换″LT″的合成部分相似,所述重叠变换″LT″具体描述在″Signal Processingwith Lapped Transforms(重叠变换的信号处理)″,H.S.Malvar,Artech House,Inc.1992。
图16示出了N=3的特定情况。矩阵P将被称为“转换变换矩阵”。
在子带域之间转换的计算过程可以总结如下:
1.U[n]的构建基于输入至转换系统的p2连续矢量并对应于第一滤波器组的子带信号X[k]的矢量。
2.通过转换变换矩阵P变换矢量U[n]以获得矢量W[n]:
W[n]=PU[n]. (47)
3.如图16中示出的N连续矢量W[n-N+1],...,W[n-1]和W[n]上的叠加的运算。该运算的输出是矢量V[n]。
4.将矢量V[n]的大小为M的连续子矢量串行设置以获得第二滤波器组的域的子带信号Y[r]的矢量。
下面描述根据优选实施方式基于LPTV系统的表达的实施。
以下示出的方法提供了在该方法的实施中的计算机资源(软件或硬件)的处理和高效利用中的平行性。因此至少在有限冲激响应滤波器组的情况下,这是一个当前优选的实施方式。
大小为NM×L的矩阵Bij,(其中0≤i≤p1-1且0≤j≤p2-1)是与上面定义的传递矩阵Aij(z)的每个相关的变换后的矩阵。如果这些矩阵表达为 其中矩阵Bij,n大小为M×L,那么矩阵Bij可以按下如下定义:
因为各传递矩阵Aij(z)包含取决于eij的值并且相同长度的滤波器,那么相应的矩阵Bij也取决于eij。矩阵Bij包含零子矩阵并且其形式按如下给出:
·当0≤eij≤K-1,
○如果0≤eij≤r0-1那么:
○如果r0≤eij≤K-1那么:
·当eij<0,
○如果0≤K+eij≤r0-1那么:
注意到,仅当K+emin≤r0-1时存在该情况。现在,emin=M+L-1-K,从而该情况的存在条件是r0≥M+L。
○如果r0≤K+eij≤K-1那么:
其中,0L×M表示大小为L×M的零矩阵。
有利地,矩阵Bij的零区块使得通过该矩阵输入矢量变换中的计算减少。
应当注意P的子矩阵Pn和子矩阵Bij,n之间的下述关系式:
图17中示出了在子带域之间转换的计算过程,并且按如下进行:
1.各新的输入矢量X[k]指向特征是变换后的矩阵Bij的子系统的公共内存,其中0≤i≤p1-1,从而j=k modp2。
2.对于各固定的i,其中,0≤i≤p1-1
a、对于j=k modp2,对矢量X[k]应用变换Bij。在该变换中,优点在于 矩阵Bij的零区块。
b、对于j=0,...,p2-1从步骤2.a得到的所有变换矢量求和。
c、在从步骤2.b得到的和矢量上进行叠加“OLA”(代表“重叠并相加”),以构造LPTV子系统i的输出Yi[n]。
3.转换系统的输出Y[n]对应于LPTV子系统i的输出Yi[n],从而i=n modp1。
用(N-1)M个元素的重叠对长度为NM的矢量进行步骤2.c的叠加。
注意到,该过程仍然是基于图15的方案的原理。
在M=pL的特定情况下, 其中0≤j≤p-1,并且用Bj表示相应的变矩阵。该矩阵具有下面的形式:
如图18所示,在子带域之间转换的计算步骤按如下进行:
1、各新的输入矢量X[k]指向特征为变换矩阵Bj的子系统的内存,从而j=k modp。
2、对于j=k modp,对矢量X[k]应用变换Bj。
3、对步骤2得到的矢量,即通过特征为变换矩阵Bj的子系统的输出进行求和,其中0≤j≤p-1。
4、转换系统的输出Y[n]对应于在从步骤3得到的和矢量上进行叠加后的结果。
在L=pM的特定情况,写为:
并且用Bi表示相应的变换矩阵。该矩阵具有下面的形式:
图19中示出了在子带域之间转换的计算步骤,并且优先地按如下进行:
1、各新的输入矢量X[k]指向特征为传递矩阵Ai(z)的所有子系统的公共内存,其中0≤i≤p-1。
2、对于各固定的i,从而0≤i≤p-1,对矢量X[k]应用变换Bi,随后进行叠加以得到矢量Yi[n]。
3、转换系统的输出Y[n]对应于特征为传递矩阵Ai(z)的子系统的输出Yi[n],从而i=n modp。
下面描述广泛用于音频编码中的滤波器组。在图27中给出了在使用该编码格式的滤波器组之间转换的各种情况的转换系统的参数,其中通过上面的公式(56)给出了参数N。
对于余弦调制FIR滤波器组之间的转换,滤波器组的特征是通过低通的原型滤波器H(z)的余弦调制获得分析和合成滤波器。对于具有M带的滤波器组,通过下面给出分析和合成滤波器的冲激响应的表达式:
其中0≤n≤N-1,且 并且h[n]是长度为N的原型滤波器的冲激响应。
如果额外满足下面的条件,该类型的滤波器组拥有完全重构属性:
-滤波器的长度为N=2mM,其中m是整数,
-合成滤波器为fk[n]=hk[N-1-n],
-原型滤波器具有线性相位h[n]=h[N-1-n],并且
-原型滤波器H(z)的2M阶的多相分量另外满足功率互补条件(powercomplementarity condition),从而使其能够被设计为原型滤波器。
等式(57)、(58)和上述条件能够完整地表达余弦调制和完全重构滤波器组的特征。
这些余弦调制和完全重构滤波器组是当代音频编码器的所有滤波器组的基础。甚至MPEG-1/2层I&II编码器的伪-QMF滤波器组都与该种类有关,假设原型滤波器充分好地设计为考虑满足完全重构。
对于不同大小的MDCT变换之间的转换,建立余弦调制和完全重构滤波器组的特定情况,一个实例是TDAC滤波器组,其中N=2M且m=1。后面的一个可以被认为是MLT变换(代表“调制重叠变换”),其已被称为MDCT(代表“修正DCT”)。该变换用于大多数现代频率音频编码器中(MPEG-2/4AAC,PAC,MSAudio,TDAC等)。
通过下式给出合成和分析滤波器组的表达式:
且hk[n]=fk[2M-1-n] (60)
为了保证完全重构,窗h[n]必须满足对称条件:h[l]=h[2M-1-l],以及功率互补条件:h2[l]+h2[l+M]=1。
通过下面的正弦窗给出满足这些条件的原型滤波器的可能且简单的选择:
该窗的选择使用在TDAC和G.722.1编码器中。另一选择包含采用由凯塞一贝塞尔窗(Kaiser-Bessel窗或者“KBD”)衍生出的窗,如在MPEG-4 AAC,BSAC,Twin VQ和AC-3编码器的情况下。
应当理解,公式(59)和(60)以及窗h[n]的选择完整地定义了对应于MDCT变型的滤波器组。
考虑在MPEG-1的PQMF滤波器组和MDCT之间的转换,在MPEG-1/2层I&II编码器中的滤波器组是具有M=32带的伪-QMF。这些分析和合成滤波器按如下定义:
其中0≤k≤31且0≤n≤511。
原型滤波器的冲激响应的系数h[n]可以在下面的参考文件中找到:″Introduction to Digital Audio and Standards″,M.Bosi,R.E.Goldberg,pp 92-93,Kluwer Academic Publishers(2002)。
在MPEG-1音频层I-II标准中提供的值对应于窗(-1)lh(2lM+j),其中0≤j≤2M-1,且0≤l≤m-1。
下面描述根据将与滤波处理结合的子带域之间的转换的本发明的技术方案。
在代码转换运算中,能够在将解码后的信号重新编码成新格式之前,对解码后的信号进行中间处理。多媒体信号处理(音频、图像和视频)的几种情况基于线性滤波。可以引用下面的例子:
·用于重新采样的图像或视频滤波(从CIF格式切换到QCIF格式)。
·用于声音空间化的通过HRTF滤波器(“头部相关传递函数”)的音频滤波。这是结合代码转换和空间化的有趣情况之一。可能的应用典型地是在电信会议音频桥中的处理。
参考图5a的方框图,在两个合成和分析滤波器组以及所等效的系统之间引进滤波器S(z)。在图20a和20b中示出了方框图。
结合有滤波的转换系统可以通过图5b中示出的一个和相同类型的方案来模拟。然而,其特征是由下式定义的新的滤波器矩阵
在上面的表达式(64)中,矩阵v(z)对应于公式(17)的定义。更清楚地,公式(64)可以写为:
现在描述结合有采样频率变化的子带域之间的转换。
这里考虑在合成的暂时信号被第二分析组重新分析之前对合成的暂时信号进行采样频率的变化的情况。本发明意义内的系统因此结合子带域之间的转换和采样频率的变化,如图21a和21b中所示。
在该系统中,滤波器SPB(z)是低通滤波器,其标准化后的截止频率为 并且通频带增益为Q。
这里将K′定义为QL和RM的最小公倍数(K′=1cm(QL,RM)),并且q1,q2 为两个自然整数,从而:
K′=q1RM且K′=q2QL. (67)
注意到,q1和q2是互质的。
在该情况下,考虑由信号矢量X(z)分解为q2多相分量得到的矢量 以及由信号矢量Y(z)分解为q1多相分量得到的矢量
结合有采样频率变化的转换系统可以通过图22的图表来模拟。其特征是按如下定义的大小为q1M×q2L的滤波器矩阵
并且 是其元素按如下定义的矩阵:
同时也符合下面的关系式:
其中cmax=max{n∈N从而h≤RM-1且n是被gcd(L,R)可除尽的}。
其中,0≤m≤q1M-1且0≤l≤q2L-1,并且e′ij=cmax+iRM-jQL。整数i,n和j,k通过下式从l和m直接获得:
在用 替代矩阵T(z)并且考虑以其为特征的参数时对于子带域之间转换的系统给出的相同开发和说明对于该新的结合系统保持有效。系统采用线性周期时变系统(LPTV)的形式。也可以在该应用中设想上述实施的优选过程以及特定情况中的系统简化。然而,注意到与本系统不同的特定情况涉及RM和QL是彼此的倍数的情况。
在使用重叠变换的实施的情况下,优选地在合成和分析滤波器组以及用于重新采样的低通滤波器具有有限冲激响应的假设下,从而:
其中矩阵 的大小为M×L,
通常,应当理解本发明给出用于将信号表示从一个子带域转换(或变换)到另一个的一般方案。如上所述,该方法优先地应用在两个压缩系统所使用的滤波器组是最大抽取类型的情况下。
虽然上述详细的说明基本上是关于音频编码的,但是可以对于多媒体信号的所有子带或基于变换的编码器都设想上述实施方式,尤其是在视频、图像、语音编码等中使用的那些编码器。这些实施方式也可以表现为合成组和分析组的级联的任何设备实施,尤其是在下面的例子中:
·子带语音的质量改进,接下来是子带回波消除,反之亦然。
·回波消除或子带噪音抑制算法,接下来是子带编码器。
·子带解码器,接下来是回波消除或子带抑制算法。
·用于通过例如SBR(代表“谱带复制”)重构音频中的高频带的处理,因为该处理实施分析组并且其输入是音频解码器的输出。
应当理解,本发明的应用绝不局限于两种不同编码格式之间的简单代码转换。
然而,下面将描述对音频代码转换的一些应用。
音频编码格式之间的代码转换在关于现有终端以及传输和访问网络的当前多样性方面变得越来越重要。
根据音频内容的服务和交付情况,代码转换可以插入传输链中的不同点。接下来,区分一些可能的情况。
广播涉及使用各种类型音频编码器的数字广播系统。因而,在欧洲(DVB标准),需要MPEG-2 BC音频层II编码器。另一方面,在美国,提倡Dolby AC-3编码器。在日本,选择MPEG-2 AAC编码器。如图25所示,代码转换机制TRANS优选地在网络RES的网关GW中,该网络RES用于将来自服务器SER的音频内容发送到配置有解码器DEC1的第一终端TER1和配置有另一解码器DEC2的另一终端TER2的目的地。
在所谓的多播流应用中,单一内容由于传输网络RES中的带宽优化而优选地发送到几个终端TER1,TER2。对于各终端用户在网络的最后节点的层级上进行私人适配。如前面的图25所示,这些用户可以具有支持不同解码器的终端,因此在网络节点中进行代码转换是有用的。
在单播流的情况下,可以在服务器SER进行代码转换TRANS(图26) 以使内容适用于终端TER1,TER2的容量。服务器SER已经接收并分析关于终端容量的信息。
在“下载”模式中,以给定编码格式存储音频内容。实时进行代码转换从而在下载前与用户的各请求的终端兼容。
在组通信(电话会议、音频会议等)中,涉及的终端在编码器/解码器方面具有不同容量。在集中式电话会议架构中,实施音频桥,代码转换可以插在桥的层级。
下面的表3表示了根据应用领域音频编码格式之间的一些可能的、有利的代码转换。
表3:感兴趣的代码转换及其应用领域的一些类型的实施例。
MPEG-1/2 LII | MPEG-2/4 AAC | DolbyAC-3 | MSAudio | G.722 | G.722.1 | MPEG- 1/2LIII | 法国 电信TDAC | |
MPEG-1/2LII | 广播 | 广播 | ||||||
MPEG-2/4 AAC | 在DVB和IP之间的广 播切换 | 广播 | ||||||
DolbyAC3 | 广播 | 广播 | ||||||
MS-Audio | ||||||||
G.722 | 电话 会议 | |||||||
G.722.1 | 电话 会议 | |||||||
MPEG-1/2LIII | ||||||||
法国电信TDAC |
图27示出了用于这些特定情况的编码格式下本发明意义内的转换系统的参数。
Claims (22)
1.一种将第一类型的压缩编码/解码代码转换到至少一个第二类型的压缩编码/解码的方法,其特征在于,在同一处理中执行如下步骤:
-根据所述第一类型,以包括第一数目L个单独子带分量的第一矢量X(z)的形式至少部分解码以恢复数据,
-将第一矢量X(z)应用到根据所述第一类型的合成滤波器组,然后应用到根据第二类型的分析滤波器组,以及
-恢复包括第二数目M个单独子带分量的第二矢量Y(z),并且该第二矢量Y(z)能应用于后来的根据第二类型的编码步骤;
其中X(z)和Y(z)分别为矢量X和矢量Y根据其z变换的表达式,并且所述的将第一矢量X(z)应用到根据所述第一类型的合成滤波器组,然后应用到根据第二类型的分析滤波器组的步骤执行由计算机资源实现通过在多媒体信号的不同子带域之间转换的数据处理方法,所述数据处理方法在于在同一处理中包括:将含有第一数目L个单独的子带分量的第一矢量X(z)应用到合成滤波器组,然后应用到分析滤波器组,以获得含有第二数目M个单独的子带分量的第二矢量Y(z),所述数据处理方法包括以下步骤,在确定第三数目K,即第一数目L和第二数目M的最小公倍数以后:
a)如果第三数目K不同于第一数目L,通过以因子p2子采样进行第一矢量X(z)的串/并转换,以进行区块排列以得到p2个多相分量矢量,其中p2=K/L,
b)选择的涉及K×K维方阵T(z)的矩阵滤波应用到所述p2个多相分量矢量以获得第二矢量Y(z)的p1个多相分量矢量,其中p1=K/M,
c)如果第三数目K不同于第二数目M,通过给p1个多相分量矢量施加按照因子p1的过采样进行并/串转换,以进行区块排列以得到所述第二矢量Y(z),
d)如果第二数目M是第一数目L的倍数,方阵T(z)的元素Tml(z)表示为:m和l在0和M-1之间,并且其中:
-p=M/L,
-k是l/L的整数部分,并且
-数字j由j=l-KL给定,
-k是m/M的整数部分,并且
-数字i由i=m-kM给定,
其中所述方阵T(z)的元素表示为由Gnk(z)=Hn(z)Fk(z)给出的乘积滤波器Gnk(z)的K阶的多相分量的函数,其中:
-n在0和M-1之间而k在0和L-1之间,并且
-Hn(z)和Fk(z),分别与分析滤波器组和合成滤波器组关联的传递函数的矢量的第n和第k分量。
3.根据权利要求1和2之一所述的方法,其特征在于,所述步骤c)中的并/串转换包括施加给p1个多相分量矢量的按照因子p1的过采样,对应于p1阶的分解,所述p1个多相分量矢量用于形成第二矢量Y(z)。
4.根据权利要求1所述的方法,其特征在于,所述方阵T(z)是通过对由p1×p2个各自由ziM-jLg(z)表示的子矩阵进行按照因子K的抽取产生的,其中:
-zX根据X的符号表示超前或延迟,
-i在0和p1-1之间,
-j在0和p2-1之间,并且
-g(z)是M×L维矩阵,该矩阵是由h(z).fT(z)的乘积产生的,其中h(z)和f(z)是分别与分析滤波器组和合成滤波器组关联的传递函数的矢量。
5.根据权利要求4所述的方法,其特征在于,超前zM-1也应用到所有p1×p2子矩阵,来获得所述方阵T(z)的元素,所述元素各自对应因果滤波器并且一起定义具有最小算法延迟的转换系统。
6.根据权利要求5所述的方法,其特征在于,分析滤波器组和合成滤波器组之间,还提供了一个补充滤波器S(z),方阵T(z)的元素表示为由Gnk(z)=Hn(z)S(z)Fk(z)给出的乘积滤波器Gnk(z)的K阶的多相分量的函数,其中:
-n在0和M-1之间而k在0和L-1之间,并且
-Hn(z)和Fk(z),分别与分析滤波器组和合成滤波器组关联的传递函数的矢量的第n和第k分量。
8.根据权利要求1所述的方法,其特征在于,采用线性周期时变型的转换系统,并且周期T由T=K·Ts定义,其中Ts=Ts1/L=Ts2/M,其中Ts1和Ts2是在合成滤波器组和分析滤波器组的域中在临界采样下各自的采样周期。
9.根据权利要求8所述的方法,其特征在于,采用p1个线性周期时变子系统,各周期为p2·Ts1,并且以周期p1·Ts2周期性地选择连续子系统的输出。
10.根据权利要求9所述的方法,其特征在于,整个转换系统的输入的比特率是1/Ts1,而其输出比特率是1/Ts2,用于飞速处理输入数据。
12.根据权利要求1所述的方法,其特征在于,合成滤波器组和分析滤波器组的滤波器具有有限冲激响应,所述选择的矩阵滤波表示为由NK×K维的矩阵P的叠加变换,从而:
子矩阵Pn是K×K维并且方阵T(z)满足如下关系:
其中N对应T(z)的元素的最大长度。
13.根据权利要求12所述的方法,其特征在于,包括以下步骤,用于子带域之间的转换:
-在p2个第一矢量X[k]的基础上,在合成滤波器组的子带域中构造矢量U[n],其中X[k]为矢量X在时域中的表达式,
-对矢量U[n]应用变换后的转换矩阵P,以获得矢量W[n]=P·U[n],
-对N个连续矢量W[n-N+1],W[n-N+2],...,W[n-1],W[n]进行叠加,以形成矢量V[n],
-串行排列矢量V[n]的连续子矢量,这些子矢量各自的维数对应第二数目M,以形成第二矢量Y[n],其中Y[n]为矢量Y在时域中的表达式。
14.根据权利要求13所述的方法,其特征在于,包括以下步骤:
-在合成滤波器组的子带域中表示的第一矢量X[k]应用到包括变换矩阵Bij的子系统,其中i在0和p1-1之间并且j=kmod p2,
-对于范围在从0到p1-1各个固定i:
*对第一矢量X[k]应用矩阵Bij的变换,j=kmod p2,各矩阵Bij表示如下:
其中对于在0和N-1之间的任意n,元素Bij,n使得:
*对于j=0,...,p2-1,变换所产生的所有矢量进行求和;
*对求和产生的矢量进行叠加,以在标号为i的子系统的输出端构建矢量Yi[n],
-在整个转换系统的输出端得到对应标号为i的子系统的矢量Yi[n]的第二矢量Y[n],从而i=n mod p1,
符号mod n表示对数字n的模。
17.根据权利要求16所述的方法,其特征在于,包括以下步骤:
-合成滤波器组的子带域中表示的第一矢量X[k]应用到含有变换矩阵Bj的子系统,其中j=k mod p,
-对于0≤j≤p-1的任意j,对应用变换矩阵Bj产生的矢量进行求和,
-通过对所述求和产生的矢量进行叠加在整个转换系统的输出获得第二矢量Y[n],
-符号mod n表示对数字n的模。
19.根据权利要求18所述的方法,其特征在于,包括以下步骤:
-在合成滤波器组的子带域中表示的第一矢量X[k]应用到包括传递矩阵Ai(z)的子系统,其中0≤i≤p-1,
-对于任何固定的i,0≤i≤p-1,对第一矢量X[k]应用矩阵Bi的变换,并且叠加以得到输出矢量Yi[n],
-得到对应矢量Yi[n]的整个转换系统的输出的第二矢量Y[n],其中i=n mod p,
-符号mod n表示对数字n的模。
20.根据权利要求4所述的方法,其特征在于,所述分析滤波器组和合成滤波器组的滤波器是余弦调制且有限冲激响应类型,其中,分析滤波器和/或合成滤波器由低通原型滤波器H(z)的余弦调制得到,从而对于具有M个带的滤波器组,按下式分别表示分析滤波器和/或合成滤波器的冲激响应,分别形成传递函数h(z)和/或f(z)的矢量:
和/或
其中:
-h[n]是长度为N的原型滤波器的冲激响应,
-n是0≤n≤N-1。
22.一种将第一类型的压缩编码/解码代码转换到至少一个第二类型的压缩编码/解码的设备,该设备包括在同一处理中的:
-根据所述第一类型,以包括第一数目L个单独子带分量的第一矢量X(z)的形式至少部分解码以恢复数据的装置,
-将第一矢量X(z)应用到根据所述第一类型的合成滤波器组,然后应用到根据第二类型的分析滤波器组的装置,以及
-恢复包括第二数目M个单独子带分量的第二矢量Y(z)的装置,该第二矢量Y(z)能应用于后来的根据第二类型的编码;
其中X(z)和Y(z)分别为矢量X和矢量Y根据其z变换的表达式,并且所述的将第一矢量X(z)应用到根据所述第一类型的合成滤波器组,然后应用到根据第二类型的分析滤波器组的装置进一步包括由计算机资源实现通过在多媒体信号的不同子带域之间转换的数据处理装置,所述数据处理装置用于在同一处理中将含有第一数目L个单独的子带分量的第一矢量X(z)应用到合成滤波器组,然后应用到分析滤波器组,以获得含有第二数目M个单独的子带分量的第二矢量Y(z,所述数据处理装置包括用于确定第三数目K,即第一数目L和第二数目M的最小公倍数的装置,并且还包括如下装置:
a)用于如果第三数目K不同于第一数目L,通过以因子p2子采样进行第一矢量X(z)的串/并转换,以进行区块排列以得到p2个多相分量矢量的装置,其中p2=K/L,
b)用于将选择的涉及K×K维方阵T(z)的矩阵滤波应用到所述p2个多相分量矢量以获得第二矢量Y(z)的p1个多相分量矢量的装置,其中p1=K/M,
c)用于如果第三数目K不同于第二数目M,通过给p1个多相分量矢量施加按照因子p1的过采样进行并/串转换,以进行区块排列以得到所述第二矢量Y(z)的装置,
-p=M/L,
-k是l/L的整数部分,并且
-数字j由j=l-kL给定,
-k是m/M的整数部分,并且
-数字i由i=m-kM给定,
其中所述方阵T(z)的元素表示为由Gnk(z)=Hn(z)Fk(z)给出的乘积滤波器Gnk(z)的K阶的多相分量的函数,其中:
-n在0和M-1之间而k在0和L-1之间,并且
-Hn(z)和Fk(z),分别与分析滤波器组和合成滤波器组关联的传递函数的矢量的第n和第k分量。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0409820 | 2004-09-16 | ||
FR0409820A FR2875351A1 (fr) | 2004-09-16 | 2004-09-16 | Procede de traitement de donnees par passage entre domaines differents de sous-bandes |
PCT/FR2005/002127 WO2006032740A1 (fr) | 2004-09-16 | 2005-08-23 | Procede de traitement de donnees par passage entre domaines differents de sous-bandes |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101069233A CN101069233A (zh) | 2007-11-07 |
CN101069233B true CN101069233B (zh) | 2011-05-18 |
Family
ID=34951876
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200580034793.8A Expired - Fee Related CN101069233B (zh) | 2004-09-16 | 2005-08-23 | 通过不同子带域之间通道进行数据处理的方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US8639735B2 (zh) |
EP (1) | EP1794748B1 (zh) |
JP (1) | JP4850837B2 (zh) |
CN (1) | CN101069233B (zh) |
AT (1) | ATE458242T1 (zh) |
DE (1) | DE602005019431D1 (zh) |
FR (1) | FR2875351A1 (zh) |
WO (1) | WO2006032740A1 (zh) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7422840B2 (en) * | 2004-11-12 | 2008-09-09 | E.I. Du Pont De Nemours And Company | Apparatus and process for forming a printing form having a cylindrical support |
GB2439685B (en) | 2005-03-24 | 2010-04-28 | Siport Inc | Low power digital media broadcast receiver with time division |
US7916711B2 (en) * | 2005-03-24 | 2011-03-29 | Siport, Inc. | Systems and methods for saving power in a digital broadcast receiver |
WO2006138598A2 (en) * | 2005-06-16 | 2006-12-28 | Siport, Inc. | Systems and methods for dynamically controlling a tuner |
US8335484B1 (en) | 2005-07-29 | 2012-12-18 | Siport, Inc. | Systems and methods for dynamically controlling an analog-to-digital converter |
US8599841B1 (en) | 2006-03-28 | 2013-12-03 | Nvidia Corporation | Multi-format bitstream decoding engine |
US8593469B2 (en) * | 2006-03-29 | 2013-11-26 | Nvidia Corporation | Method and circuit for efficient caching of reference video data |
FR2901433A1 (fr) | 2006-05-19 | 2007-11-23 | France Telecom | Conversion entre representations en domaines de sous-bandes pour des bancs de filtres variant dans le temps |
US8700387B2 (en) * | 2006-09-14 | 2014-04-15 | Nvidia Corporation | Method and system for efficient transcoding of audio data |
US8015368B2 (en) * | 2007-04-20 | 2011-09-06 | Siport, Inc. | Processor extensions for accelerating spectral band replication |
US8199769B2 (en) | 2007-05-25 | 2012-06-12 | Siport, Inc. | Timeslot scheduling in digital audio and hybrid audio radio systems |
FR2918228A1 (fr) * | 2007-06-29 | 2009-01-02 | France Telecom | Conversion entre domaines de sous-bandes pour bancs de filtres modules. |
EP2099027A1 (en) * | 2008-03-05 | 2009-09-09 | Deutsche Thomson OHG | Method and apparatus for transforming between different filter bank domains |
US8335080B2 (en) * | 2009-04-20 | 2012-12-18 | Infortrend Technology, Inc. | Sliding rail having anti-tilting mechanism |
US8320823B2 (en) * | 2009-05-04 | 2012-11-27 | Siport, Inc. | Digital radio broadcast transmission using a table of contents |
ES2936307T3 (es) | 2009-10-21 | 2023-03-16 | Dolby Int Ab | Sobremuestreo en un banco de filtros de reemisor combinado |
US8958510B1 (en) * | 2010-06-10 | 2015-02-17 | Fredric J. Harris | Selectable bandwidth filter |
BR122021003688B1 (pt) | 2010-08-12 | 2021-08-24 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. | Reamostrar sinais de saída de codecs de áudio com base em qmf |
US8489053B2 (en) | 2011-01-16 | 2013-07-16 | Siport, Inc. | Compensation of local oscillator phase jitter |
DE102013212840B4 (de) * | 2013-07-02 | 2022-07-07 | Robert Bosch Gmbh | Modellberechnungseinheit und Steuergerät zur Berechnung eines datenbasierten Funktionsmodells mit Daten in verschiedenen Zahlenformaten |
CN104656494A (zh) * | 2013-11-19 | 2015-05-27 | 北大方正集团有限公司 | 一种信号实时性处理装置 |
US9898286B2 (en) * | 2015-05-05 | 2018-02-20 | Intel Corporation | Packed finite impulse response (FIR) filter processors, methods, systems, and instructions |
EP3182411A1 (en) * | 2015-12-14 | 2017-06-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an encoded audio signal |
EP3206353B1 (en) * | 2016-02-09 | 2020-02-05 | Technische Universität München | Filter banks and methods for operating filter banks |
US20210384892A1 (en) * | 2020-06-09 | 2021-12-09 | The Mathworks, Inc. | Parallel implementations of frame filters with recursive transfer functions |
CN111968658B (zh) * | 2020-06-30 | 2024-02-06 | 北京百度网讯科技有限公司 | 语音信号的增强方法、装置、电子设备和存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1425177A (zh) * | 2000-04-18 | 2003-06-18 | 法国电信有限公司 | 频谱的增强方法和装置 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5508949A (en) * | 1993-12-29 | 1996-04-16 | Hewlett-Packard Company | Fast subband filtering in digital signal coding |
JP2985675B2 (ja) * | 1994-09-01 | 1999-12-06 | 日本電気株式会社 | 帯域分割適応フィルタによる未知システム同定の方法及び装置 |
US5610942A (en) * | 1995-03-07 | 1997-03-11 | Chen; Keping | Digital signal transcoder and method of transcoding a digital signal |
US5950151A (en) * | 1996-02-12 | 1999-09-07 | Lucent Technologies Inc. | Methods for implementing non-uniform filters |
JP3283200B2 (ja) | 1996-12-19 | 2002-05-20 | ケイディーディーアイ株式会社 | 符号化音声データの符号化レート変換方法および装置 |
US6947509B1 (en) * | 1999-11-30 | 2005-09-20 | Verance Corporation | Oversampled filter bank for subband processing |
GB0003954D0 (en) | 2000-02-18 | 2000-04-12 | Radioscape Ltd | Method of and apparatus for converting a signal between data compression formats |
US6963842B2 (en) * | 2001-09-05 | 2005-11-08 | Creative Technology Ltd. | Efficient system and method for converting between different transform-domain signal representations |
US7020603B2 (en) | 2002-02-07 | 2006-03-28 | Intel Corporation | Audio coding and transcoding using perceptual distortion templates |
KR100499047B1 (ko) * | 2002-11-25 | 2005-07-04 | 한국전자통신연구원 | 서로 다른 대역폭을 갖는 켈프 방식 코덱들 간의 상호부호화 장치 및 그 방법 |
US20050018796A1 (en) * | 2003-07-07 | 2005-01-27 | Sande Ravindra Kumar | Method of combining an analysis filter bank following a synthesis filter bank and structure therefor |
FR2901433A1 (fr) * | 2006-05-19 | 2007-11-23 | France Telecom | Conversion entre representations en domaines de sous-bandes pour des bancs de filtres variant dans le temps |
EP2099027A1 (en) * | 2008-03-05 | 2009-09-09 | Deutsche Thomson OHG | Method and apparatus for transforming between different filter bank domains |
-
2004
- 2004-09-16 FR FR0409820A patent/FR2875351A1/fr active Pending
-
2005
- 2005-08-23 JP JP2007531786A patent/JP4850837B2/ja not_active Expired - Fee Related
- 2005-08-23 CN CN200580034793.8A patent/CN101069233B/zh not_active Expired - Fee Related
- 2005-08-23 DE DE602005019431T patent/DE602005019431D1/de active Active
- 2005-08-23 US US11/662,980 patent/US8639735B2/en not_active Expired - Fee Related
- 2005-08-23 WO PCT/FR2005/002127 patent/WO2006032740A1/fr active Application Filing
- 2005-08-23 AT AT05798240T patent/ATE458242T1/de not_active IP Right Cessation
- 2005-08-23 EP EP05798240A patent/EP1794748B1/fr not_active Ceased
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1425177A (zh) * | 2000-04-18 | 2003-06-18 | 法国电信有限公司 | 频谱的增强方法和装置 |
Non-Patent Citations (2)
Title |
---|
Sande R K et al,.An efficient VLSI/FPGA architecture for combining an analysis filterbank following a synthesis filterbank.Proceedings of the 2004 International Symposium, Circuits and Systems.2005,3517-520. * |
SandeRKetal .An efficient VLSI/FPGA architecture for combining an analysis filterbank following a synthesis filterbank.Proceedings of the 2004 International Symposium |
Also Published As
Publication number | Publication date |
---|---|
DE602005019431D1 (de) | 2010-04-01 |
FR2875351A1 (fr) | 2006-03-17 |
US20090198753A1 (en) | 2009-08-06 |
EP1794748A1 (fr) | 2007-06-13 |
WO2006032740A1 (fr) | 2006-03-30 |
ATE458242T1 (de) | 2010-03-15 |
JP4850837B2 (ja) | 2012-01-11 |
CN101069233A (zh) | 2007-11-07 |
EP1794748B1 (fr) | 2010-02-17 |
US8639735B2 (en) | 2014-01-28 |
JP2008514071A (ja) | 2008-05-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101069233B (zh) | 通过不同子带域之间通道进行数据处理的方法 | |
US7275036B2 (en) | Apparatus and method for coding a time-discrete audio signal to obtain coded audio data and for decoding coded audio data | |
KR100892152B1 (ko) | 시간-이산 오디오 신호를 부호화하기 위한 장치 및 방법그리고 부호화 오디오 데이터를 복호화하기 위한 장치 및방법 | |
EP1810281B1 (en) | Encoding and decoding of audio signals using complex-valued filter banks | |
CN102016983B (zh) | 用于对多个输入数据流进行混合的设备 | |
US6219458B1 (en) | Overlapped reversible transforms for unified lossless/lossy compression | |
CN1860527B (zh) | 一种处理具有离散值序列的信号的设备和方法 | |
CN102656628B (zh) | 优化的低吞吐量参数编码/解码 | |
JP3814611B2 (ja) | 時間離散オーディオサンプル値を処理する方法と装置 | |
JP2012226375A (ja) | 無損失オーディオ復号化方法及び無損失オーディオ復号化装置 | |
TW200836492A (en) | Device and method for postprocessing spectral values and encoder and decoder for audio signals | |
CN101317217A (zh) | 子带编码装置和子带编码方法 | |
Britanak et al. | Cosine-/Sine-Modulated Filter Banks | |
WO2023241222A1 (zh) | 音频处理方法、装置、设备、存储介质及计算机程序产品 | |
CN115116457B (zh) | 音频编码及解码方法、装置、设备、介质及程序产品 | |
EP2022046A1 (fr) | Conversion entre representations en domaines de sous-bandes pour des bancs de filtres variant dans le temps | |
US6549147B1 (en) | Methods, apparatuses and recorded medium for reversible encoding and decoding | |
EP1421579A1 (en) | Audio coding with non-uniform filter bank | |
Lam et al. | Digital filtering for audio coding | |
EP4453931A1 (en) | Ivas spar filter bank in qmf domain | |
WO2023118138A1 (en) | Ivas spar filter bank in qmf domain | |
EP1564650A1 (en) | Method and apparatus for transforming a digital audio signal and for inversely transforming a transformed digital audio signal | |
Feerick | How much delay is too much delay? | |
CN117198301A (zh) | 音频编码方法、音频解码方法、装置、可读存储介质 | |
Amutha et al. | Low power fpga solution for dab audio decoder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110518 Termination date: 20180823 |
|
CF01 | Termination of patent right due to non-payment of annual fee |