CN1662958A - 使用频谱孔填充的音频编码系统 - Google Patents
使用频谱孔填充的音频编码系统 Download PDFInfo
- Publication number
- CN1662958A CN1662958A CN038139677A CN03813967A CN1662958A CN 1662958 A CN1662958 A CN 1662958A CN 038139677 A CN038139677 A CN 038139677A CN 03813967 A CN03813967 A CN 03813967A CN 1662958 A CN1662958 A CN 1662958A
- Authority
- CN
- China
- Prior art keywords
- signal
- spectrum
- group
- subband signal
- component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000003595 spectral effect Effects 0.000 title claims abstract description 78
- 238000000034 method Methods 0.000 claims abstract description 82
- 230000005236 sound signal Effects 0.000 claims abstract description 65
- 238000013139 quantization Methods 0.000 claims abstract description 35
- 230000008569 process Effects 0.000 claims abstract description 6
- 238000001228 spectrum Methods 0.000 claims description 229
- 230000000873 masking effect Effects 0.000 claims description 30
- 238000006243 chemical reaction Methods 0.000 claims description 28
- 239000002131 composite material Substances 0.000 claims description 25
- 230000006870 function Effects 0.000 claims description 20
- 238000004458 analytical method Methods 0.000 claims description 17
- 230000004044 response Effects 0.000 claims description 12
- 238000011002 quantification Methods 0.000 claims description 10
- 230000002123 temporal effect Effects 0.000 claims description 10
- 238000012986 modification Methods 0.000 claims description 7
- 230000004048 modification Effects 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 4
- 238000013519 translation Methods 0.000 claims description 4
- 108010076504 Protein Sorting Signals Proteins 0.000 claims 4
- 238000001831 conversion spectrum Methods 0.000 claims 3
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims 1
- 230000015556 catabolic process Effects 0.000 abstract 1
- 238000006731 degradation reaction Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 18
- 238000012545 processing Methods 0.000 description 15
- 238000005516 engineering process Methods 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000009795 derivation Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000007667 floating Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000003340 mental effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000002266 amputation Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003071 parasitic effect Effects 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Optical Elements Other Than Lenses (AREA)
- Stereophonic System (AREA)
- Adornments (AREA)
- Optical Communication System (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Optical Recording Or Reproduction (AREA)
- Spectrometry And Color Measurement (AREA)
- Stereo-Broadcasting Methods (AREA)
- Optical Filters (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
Abstract
音频编码过程如量化能够使得编码信号的频谱分量被设置为零,从而在信号中产生频谱孔。这些频谱孔会降低由音频编码系统再生的音频信号的感知质量。一种改进的解码器通过用合成频谱分量填充频谱孔避免或减轻了恶化。一种改进的编码器还可以用于实现解码器的进一步改进。
Description
技术领域
本发明通常涉及音频编码系统,尤其涉及改善得自音频编码系统的音频信号的感知质量。
背景技术
音频编码系统用于将音频信号编码为适合于传输或存储的编码信号,然后接收或检索编码信号并解码以获得用于回放的原始音频信号的一个版本。感知音频编码试图将原始音频信号编码为比原始音频信号信息容量要求更低的编码信号,然后将编码信号解码并提供在感知上与原始音频信号难以区别的输出。感知音频编码系统的一个实例参见高级电视标准化委员会(ATSC)A52文件(1994),称之为杜比AC-3。另一个实例参见Bodi等人的文献,“ISO/IEC MPEG-2Advanced Audio Coding,”J.AES,vol.45,no.10,October 1997,pp.789-814,称之为高级音频编码(AAC)。这两个编码系统和其它许多感知编码系统都对音频信号使用分析滤波器组以获得按聚类或频带排列的频谱分量。其带宽通常是变化的并且通常与人类听觉系统所谓临界带的宽度相当。
感知编码系统可以用于减少音频信号的信息容量需求同时保留音频质量的主观或感知度量,所以音频信号的编码表示能够以更少的带宽通过信道传输或以更少的空间存储在记录媒体上。通过量化频谱分量可以减少信息容量需求,量化将噪声引入被量化信号,但是感知音频编码系统通常使用心理声学模型控制量化噪声的幅度,以通过信号中的频谱分量掩蔽噪声或使其不可闻。
已知频带中的频谱分量通常以相同的量化分辨率进行量化,并使用心理声学模型确定最大的最小量化分辨率或最小信噪比(SNR),引入听不见的量化噪声是可能的。该技术在窄带下运行得相当好,但该技术在较宽频带下,当信息容量需求促使编码系统采用相对粗糙的量化分辨率时就不能很好的运行。在宽带中较大值的频谱分量通常量化为所需精度的非零值,而如果频带中较小值的频谱分量幅度小于最小量化水平则被量化为零。随着带宽的增加,随着频带内最大和最小频谱分量差值的增加以及随着最小量化水平的增加,频带内量化为零的频谱分量的数目随之增加。
不幸的是,即使保持最终的量化噪声充分低于可听阈或通过信号的频谱分量在心理声学上被掩蔽了,编码信号中量化为零(QTZ)频谱分量的大量存在仍然会降低音频信号的感知质量。质量降低的原因至少有三个,第一个原因是因为心理声学掩蔽的水平实际上低于用于确定量化分辨率的心理声学模型的预测,量化噪声并不是听不见的;第二个原因是与原始音频信号的功率或能量相比,大量QTZ频谱分量的产生实际在听觉上降低了解码音频信号的功率或能量;第三个原因与使用失真抵消滤波器组的编码过程有关,如量化镜像滤波器(QMF)或修改的离散余弦变换(DCT)和修改的离散余弦逆变换(IDCT),即所谓的时域假信号抵消(TDAC)变换,其说明参见Princen等人的文献,“Subband/Transform Coding Using Filter BankDesigns Based on Time Domain Aliasing Cancellation,”ICASSP 1987Conf.Proc.,May 1987,pp.2161-64。
使用失真抵消滤波器组如QMF或TDAC变换的编码系统在编码过程中使用了分析滤波器组,从而在编码信号中引入了失真或寄生分量,但在解码过程中使用合成滤波器至少在理论上可以消除失真。但在实践中如果一个或更多频谱分量的值在编码的过程中发生重大的变化,那么合成滤波器消除失真的能力就会大大削弱。为此,因为频谱分量的值会削弱合成滤波器组消除由分析滤波器组引入的失真的能力,QTZ频谱分量即使在听不见量化噪声的情况下也会降低解码音频信号的感知质量。
已知编码系统采用的技术提供了部分解决这些问题的方法。例如,杜比AC-3和AAC变换编码系统在解码器中用噪声代替该特定QTZ频谱分量,从而在某种程度上能够从保留了原始音频信号幅度的编码信号中产生输出信号。这两种系统都在编码信号中提供了频带的功率指示并在解码器中利用功率指示用适当水平的噪声代替频带中的该特定QTZ频谱分量。杜比AC-3编码器提供了短时功率谱的粗略估计,可以用于产生噪声的适当水平。当频带所有的频谱分量都设置为零时,解码器用在短时功率谱中粗略估计所指示的近似相同功率的噪声填充该频带。AAC系统采用称为感知噪声替代(PNS)的技术明确传递给定频带的功率。解码器用该信息添加与该功率匹配的噪声。两种系统都仅仅在那些没有非零频谱分量的频带添加噪声。
不幸的是,这些系统不能在那些混合了QTZ与非零频谱分量的频带中保留功率水平。表1示出了频谱分量一个假设频带的原始音频信号,每个频谱分量合成在编码信号中的3比特量化表示以及用解码器从编码信号中获得的相应频谱分量。在编码信号中量化频带包含QTZ与非零频谱分量的组合。
表1
原始信号分量 | 量化分量 | 去量化分量 |
10101010 | 101 | 10100000 |
00000100 | 000 | 00000000 |
00000010 | 000 | 00000000 |
00000001 | 000 | 00000000 |
00011111 | 000 | 00000000 |
00010101 | 000 | 00000000 |
00001111 | 000 | 00000000 |
01010101 | 010 | 01000000 |
11110000 | 111 | 11100000 |
表的第一列显示的是一组无符号二进制数,表示原始音频信号中分布在单个频带中的频谱分量。第二列显示的是量化为三比特的频谱分量表示。在该例子中每个频谱分量低于3比特精度的部分被截除。量化频谱分量传递给解码器后通过补零恢复原始信号分量的长度完成去量化。第三列显示的就是去量化分量。因为频谱分量的大部分量化为零,去量化频谱分量所包含的能量小于原始频谱分量频带的能量且能量集中在少数几个非零频谱分量中。如前所述,能量的减少降低了解码信号的感知质量。
发明内容
本发明的一个目的就是通过避免或减轻与零值量化频谱分量相关的恶化以修改得自音频编码系统的音频信号的感知质量。
本发明的一个方面,通过以下步骤获得音频信息:接收输入信号并从中获得一组子带信号,每个子带信号包含代表音频信号频谱内容的一个或多个频谱分量;从该组子带信号中识别该特定子带信号,其中的一个或多个频谱分量具有非零值并用最小量化水平对应于一个阈值的量化器将其量化,其中的多个频谱分量的值是零;生成分别对应于该特定子波带中零值频谱分量的合成频谱分量,并按照小于或等于阈值的比例包络进行量化;在该特定子带信号中用合成频谱分量代替相应的零频谱分量生成一组修改的子带信号;用合成滤波器组针对修改的子带信号生成音频信息。
本发明的另一个方面,通过以下步骤提供输出信号,最好是编码输出信号:将分析滤波器组应用于音频信息获得量化信息并用该量化信息生成一组子带信号,每个子带信号包含代表音频信号频谱内容的一个或多个频谱分量;从该组子带信号中识别该特定子带信号,其中的一个或多个频谱分量具有非零值并用最小量化水平对应于一个阈值的量化器将其量化,其中的多个频谱分量的值是零;从音频信号的频谱内容中导出比例控制信息,其中比例控制信息控制合成频谱分量的量化以用于合成和代替接收机中的零频谱分量,该接收机产生对应于输出信号的音频信息;将比例控制信息和代表该组子带信号的信息合成在一起以产生输出信号。
通过参考下面的说明和附图,可以更好的理解本发明的各分量特征及其最佳实施例,附图的几个图中相同的编号是指相同的单元。下面说明的内容仅仅作为实例而不能理解为对本发明范畴的限定。
附图简述
图1a是一个音频编码器的示意框图。
图1b是一个音频解码器的示意框图。
图2a-2c是量化函数的示意图。
图3是一假设音频信号的频谱示意图。
图4是一假设音频信号有几个频谱分量设置为零时的频谱示意图。
图5是一假设音频信号用合成频谱分量代替零值频谱分量时的频谱示意图。
图6是分析滤波器组中的一滤波器的假设频率响应示意图。
图7示出了与图6所示频谱泄漏衰减近似的比例包络。
图8示出了由可适应滤波器的输出导出的比例包络。
图9是一假设音频信号的频谱示意图,其合成频谱分量用近似于图6所示频谱泄漏衰减的比例包络加权。
图10是假设心理声学掩蔽阈值的示意图。
图11是一假设音频信号的频谱示意图,其合成频谱分量用近似于心理声学掩蔽阈值的比例包络加权。
图12是一假设子带信号的示意图。
图13是一假设子带信号有几个频谱分量设置为零时的频谱示意图。
图14是一假设时间心理声学掩蔽阈值的示意图。
图15是一假设子带信号的频谱示意图,其合成频谱分量用近似于时间心理声学掩蔽阈值的比例包络加权。
图16是一假设音频信号当含有通过谱复制产生的合成频谱分量时的频谱图。
图17是一个可以用于在编码器或解码器中实现本发明各个方面的装置的示意框图。
具体实施方式
A.概述
本发明的各个方面可以与各种信号处理技术和包括如同图1a和图1b所示那些装置的装置广泛地结合在一起。有些方面可以仅仅在解码技术或装置中得以实施。其它方面则需要在编码和解码技术或装置中共同处理。下面提供可以用于实施本发明这些方面的过程说明,随后提出可以用于执行这些过程的典型装置的综述。
1.编码器
图1a示出了分频带音频编码器的一个实施例,其中分析滤波器组12接收来自通道11代表音频信号的音频信息,并作为响应提供代表音频信号频率子带的数字化信息。每个频率子带的数字化信息用各自的量化器14,15,16量化并传递给编码器17。编码器17生成量化信息的编码表示并传递给格式器18。图中所示的特殊实施例中,量化器14,15,16的量化函数与从模型13接收的比例控制信息相适应,模型13针对从通道11接收的音频信息生成比例控制信息。格式器18将量化信息的编码表示和比例控制信息合成为适合于传输或存储的输出信号,并将输出信号沿通道19传递。
许多音频应用使用均匀的线性量化函数q(x),如图2a所示的3-比特中趋势(mid-tread)非对称量化函数;但是对于本发明重要的是量化的非精确形式。可以采用的另外两个函数q(x)的例子如图2b和图2c所示。在每个例子中,量化函数q(x)对于任何在点30的值与点31的值之间的输入值x的输出值都等于零。在许多应用中,点30,31的值相等且符号相反;但这不是必需的,如图2b所示。为了便于论述,用该特定量化函数q(x)量化为零(QTZ)的输入值区间内的值x是指小于该量化函数最小量化水平的值。
在本说明中,如“编码器”和“编码”的术语不是特意暗示信息处理的任何类型。例如,编码通常用于减少信息容量需求;但是这些术语不是必须指这种处理类型。编码器17可以执行基本上所需的任何处理类型。在一种实施例中,将量化信息编码为具有相同比例因子的量化值的集合。例如在杜比AC-3系统中,将量化频谱分量安排在浮点数的集合或频带中,每个频带的数值都分享一个浮点指数。在AAC编码系统中采用了熵编码,如哈夫曼编码。在其它实施例中,编码器17就不存在了,而量化信息直接合成到输出信号中。对于本发明任何特殊类型的编码都是不重要的。
模型13可以执行基本上所需的任何处理类型。一个例子是对音频信息应用心理声学模型估计音频信号中不同频谱分量的心理声学掩蔽效应。可能有许多变化,例如,模型13可以生成对应于频率子带信息的在分析滤波器组12的输出端有效的比例控制信息,以代替或附加于在滤波器组输入端有效的音频信息。对另一个例子,模型13可以不存在而量化器14、15、16使用不经过适应的量化函数。对于本发明任何特殊建模过程都是不重要的。
2.解码器
图1b示出了分频带音频解码器的一个实施例,其中解格式器22接收来自通道21的输入信号,该信号是表征音频信号频率子带的量化数字信息的编码表示。解格式器从输入信号得到编码表示并将其传递给解码器23。解码器将编码表示解码为量化信息的频率子带。用各自的去量化器25,26,27将每个频率子带的量化数字信息去量化并传递给合成滤波器组28,该滤波器组产生代表音频信号的音频信息并沿通道29传递。在如图所示的特殊实施例中,去量化器25,26,27的去量化函数与从模型24接收的比例控制信息相适应,该模型针对解格式器22从输入信号获得的控制信息生成比例控制信息。
在本说明中,如“解码器”和“解码”的术语不是特意暗示信息处理的任何类型。解码器23可以执行基本上所需的任何处理类型。在一种实施例中它与上面描述的编码过程相反,在浮点数集合中具有共享指数的量化信息解码为不再共享指数的单个量化分量。在另一个实施例中,解码器23不存在且量化信息直接由解格式器22得到。对于本发明任何特殊类型的解码都是不重要的。
模型24可以执行基本上所需的任何处理类型。一个例子是对音频信息应用心理声学模型估计音频信号中不同频谱分量的心理声学掩蔽效应。对另一个例子,模型24可以不存在而去量化器25,26,27可以使用不经过适应的量化函数或使用与解格式器22直接从输入信号得到的比例控制信息相适应的量化函数。对于本发明任何特殊的处理都是不重要的。
3.滤波器组
图1a和1b中的装置示出了三个频率子带分量。在应用中通常使用更多的子带,但为了解释清楚仅仅示出三个。对于本发明任何特殊数字都是不重要的。
分析和合成滤波器组基本上可以用所需的任何方法实现,包括数字滤波器技术,块变换和小波变换等很宽的范围。在一个含有如前所述编码器和解码器的音频编码系统中,分析滤波器组12是由TDAC修改的DCT实现的而合成滤波器组28是由前面提及的TDAC修改IDCT实现的。但原则上没有特殊实现是重要的。
用块变换实现的分析滤波器组将输入信号的一块或一段分为代表该段信号频谱内容的一组变换系数。一个或多个相邻变换系数的集合表征了该特定频率子带内的频谱内容,该子带的带宽与该集合中系数的数目相当。
用某种类型的数字滤波器如多相位滤波器,而不是块变换实现的分析滤波器组将输入信号分为一组子带信号。每个子带信号是该特定频率子带内的频谱内容基于时间的表示。子带信号最好按十分之一抽取以使每个子带信号的带宽与单位时间内子带信号样本的数目相当。
下面的论述尤其是指使用如同前面提及的TDAC变换的块变换实现。在该论述中,术语“子带信号”是指一个或多个相邻变换系数的集合,术语“频谱分量”是指变换系数。但是本发明的原理可以应用于其它类型的实现,所以术语“子带信号”通常也可以理解为表征信号该特定频率子带频谱内容的基于时间的信号,而术语“频谱分量”通常也可以理解为基于时间的子带信号的样本。
4.实施
本发明的各个方面可以用很多种方法实施,包括通用计算机中或其它一些装置中的软件,这些装置包括更专门化的器件如数字信号处理(DSP)电路,其元件类似于通用计算机中的那些元件。图17是可以用于实施本发明在音频编码器或音频解码器中各个方面的装置70的框图,DSP 72提供计算资源;RAM 73是信号处理时DSP 72使用的系统随机存取存储器(RAM);ROM 74表示永久存储的某种结构,如只读存储器(ROM),它存储操作装置70以及实施本发明各个方面所需的程序。I/O控制器75表示的是通过通信信道76,77接收和发送信号的接口电路。当需要接收和/或发送模拟音频信号时,I/O控制器75可以包含模-数转换器或数-模转换器。如实施例所示,所有主要的系统组件都与总线71相连,该总线代表的物理总线可能不止一种;但总线结构对于本发明的实施不是必需的。
在通用计算机系统中实施例中,可以包含附加的元件,如连接键盘或鼠标以及显示器等装置的接口,以及含有存储媒体的存储控制装置如磁带或磁盘或光学媒体等。存储媒体可以用于记录操作系统,应用程序及应用的指令程序,可以包含实施本发明各个方面的程序本身。
实践本发明各个方面所需的功能可以通过由很多种方法实现的元器件来完成,这包括离散逻辑元件,一个或多个ASIC和/或可编程控制器。这些元器件的实现方式对于本发明都是不重要的。
本发明的软件实施可以通过多种机器可读媒介传输,如覆盖从超声到紫外频段频率范围的基带或调制通信线路,或通过使用基本上任何磁性或光学记录技术且包含那些传送信息的存储媒体传送,包括磁带,磁盘和光盘。也可以在计算机系统70的各个组件中采用处理电路实施各个方面,如ASIC,通用集成电路,由包含在各种ROM或RAM中的嵌入程序控制的微处理器以及其它技术。
B.解码器
本发明在解码器中实施的各个方面不需要任何来自编码器的特殊处理或信息。本说明书在本节说明这些方面,其它需要来自编码器的特殊处理或信息的方面将在下一节说明。
1.频谱孔
图3是一段用变换编码系统编码的假设音频信号的频谱示意图。频谱41表示变换系数或频谱分量幅值的包络。在编码过程中,所有幅值低于阈值40的频谱分量都量化为零。如果使用如图2a所示q(x)函数作为量化函数,阈值40对应于最小量化水平30,31。为便于说明,整个频率范围内阈值40都显示为统一的值,这在许多编码系统中并不特殊。例如,在每个子带信号内均匀量化频谱分量的感知音频编码系统中,阈值40在每个频率子带中是统一的但在子带与子带之间是变化的。在其它实施例中,阈值40也可以在给定的频率子带内变化。
图4是用量化频谱分量表示的假设音频信号频谱示意图。频谱42表示量化频谱分量幅值的包络。该图与其它图所示的频谱没有显示频谱分量的幅值大于或等于阈值40时的量化效果。量化信号中QTZ频谱分量与原始信号中相应的频谱分量之间的差用阴影显示,这些阴影区域代表了在量化表示中需要用合成频谱分量填充的“频谱孔”。
在本发明的一个实施例中,解码器接收的输入信号表达了如图4所示量化子带信号的编码表示。解码器对该编码表示进行解码并识别出这些子带信号中一个或多个频谱分量是非零值而多个频谱分量的值是零。所有子带信号的频率范围最好对解码器是先验已知的或定义在输入信号的控制信息中。使用如下所述的处理过程,解码器产生对应于零频谱分量的合成频谱分量。合成分量按照低于或等于阈值40的比例包络进行调整,然后用调整的合成频谱分量代替子带信号的零频谱分量。如果用于量化频谱分量的量化函数的最小量化水平30,31是已知的,那么解码器不需要来自编码器明确指示阈值40水平的任何信息。
2.按比例缩放
建立比例包络的方法可以有很多种,下面将说明几种方法。可以使用多种方法,例如复合比例包络的导出可以是从多种途径获得的所有包络的最大值,或者用不同的方法建立比例包络的上界和/或下界。这些方法可以与编码信号向适应或进行选择,也可以作为频率的函数进行适应或选择。
a)均匀包络
建立比例包络的第一种方法适合于音频变换编码系统和使用其它滤波器组实现的系统中的解码器。该方法通过设定包络等于阈值40建立均匀比例包络。这种比例包络的一个实例如图5所示,它用阴影区域表示用合成频谱分量填充的频谱孔。频谱43表示音频信号的频谱分量包络,它含有用合成频谱分量填充的频谱孔。该图与上图所示的阴影区域上界不代表合成频谱分量本身的实际等级,而仅仅代表合成频谱分量的按比例包络。用于填充频谱孔的合成频谱分量的频谱等级不超过比例包络
b)频谱泄漏
建立比例包络的第二种方法非常适合于块变换音频编码系统的解码器,但是其原理可以应用于滤波器组的其它实现类型。该方法提供随着块变换中原型滤波器频率响应的频谱泄漏特征变化的非均匀比例包络。
图6所示响应50示出了一个变换原型滤波器的假设频率响应图形,显示了系数间的频谱损耗。该响应包括一个主瓣,通常是指原型滤波器的通带,和一些与主瓣相邻的旁瓣,其大小随着频率离开通带中心而减小。旁瓣表示频谱能量从通带泄漏至相邻的频带。这些旁瓣的大小减小的比率称为频谱泄漏的衰减比。
滤波器的频谱泄漏特征制约了相邻频率子带的频谱隔离。如果滤波器具有大量的频谱泄漏,那么相邻子带的频谱水平就不能象频谱泄漏较低的滤波器那样区分开。图7所示的包络51是图6所示频谱泄漏衰减的近似。合成频谱分量可以用这样一个包络调整或者可以将该包络用作比例包络的下界以用于其它技术的导出。
图9中的频谱44示出了假设音频信号含有按近似频谱泄漏衰减包络调整的合成频谱分量的频谱图。频谱孔通过能量在每边进行限制,其比例包络是两个单独包络的复合,一边一个。该复合的构成是取两个单独包络较大一方。
c)滤波器
建立比例包络的第三种方法非常适合于块变换音频编码系统的解码器,但是其原理可以应用于滤波器组的其它实现类型。该方法提供的非均匀比例包络是由频域滤波器的输出导出的,该滤波器用于频域中变换系数。该滤波器可以是一个预测滤波器,低通滤波器或提供所需比例包络的其它任何滤波器。该方法通常需要比上面描述的两种方法所需更多的的计算资源,但它允许比例包络按照频率的函数变化。
图8示出了从可适应频域滤波器输出导出的两个比例包络。例如,比例包络52可以用于填充信号或更像音调的部分信号中的频谱孔,而比例包络53可以用于填充信号或更像噪声的部分信号中的频谱孔。信号的音调和噪声特性可以用多种方法估计,后面将论述其中的一些方法。另一方面,比例包络52可以用于填充较低频率处的频谱孔,其音频信号通常更象音调;而比例包络53可以用于填充较高频率处的频谱孔,其音频信号通常更象噪声。
d)感知掩蔽
建立比例包络的第四种方法可以应用于用块变换滤波器组和其它类型滤波器组实现的音频编码系统的解码器。该方法提供了非均匀比例包络,其变化符合估计的心理声学掩蔽效应。
图10示出了两个假设心理声学掩蔽阈值。阈值61表示较低频率频谱分量60的心理声学掩蔽效应,阈值64表示较高频率频谱分量63的心理声学掩蔽效应。类似的这些掩蔽阈值可以用于导出比例包络的形状。
图11中的频谱45示出了假设音频信号含有按照基于心理声学的包络调整的合成频谱替代分量的频谱图。该实施例显示,低频频谱孔中的比例包络是由掩蔽阈值61的较低部分导出。中间频谱孔中的比例包络是掩蔽阈值61的较高部分与掩蔽阈值64的较低部分复合而成。最高频率的频谱孔中的比例包络是由掩蔽阈值64的较高部分导出。
e)音调
建立比例包络的第五种方法是基于对整个音频信号或信号的一部分入一个或多个子带信号的音调估计。音调可以用多种方法估计,包括频谱平坦度量(SFM)的计算,即信号样本的算术平均值除以信号样本的几何平均值的规格化商。该值接近1表明信号非常象噪声,而该值接近于零表明信号非常象音调。SFM可直接用于调整比例包络。当SFM等于零时,就不用合成分量填充频谱孔。当SFM等于1时,用允许的最大合成频谱分量填充频谱孔。但通用来说,因为编码器在编码之前可以访问整个原始音频信号所以能够计算一个更好的SFM值。因为QTZ频谱分量的出现解码器可能计算不出一个准确的SFM值。
解码器通过分析非零值和零频谱分量的排列或分布也可以估计音调。在一个实施例中,如果在几个大的非零值频谱乡之间分布着一长段零频谱分量,那么可以认为该信号更可能是音调而不是噪声,这是因为这种排列意味着一个谱峰结构。
在另一个实施例中,解码器将预测滤波器应用于一个或多个子带信号并确定预测增益。当预测增益增加时可以认为该信号更可能是音调。
f)时间按比例调整
图12示出了一个待编码的假设子带信号。线条46表示频谱分量幅值的时间包络。该子带信号可以由通用的频谱分量或者由从方块变换分析滤波器组获得的块序列中的变换系数组成,或者它可以是另一种类型的分析滤波器组得到的子带信号,该滤波器组是用数字滤波器而不是类似QMF的块变换实现的。在编码过程中,所有幅值低于阈值40的频谱分量量化为零。为便于说明,整个时间间隔内阈值40都显示为统一的值,这在许多使用方块变换滤波器组的编码系统中并不特殊。
图13示出了用量化频谱分量表示的假设子带信号。线条47表示量化频谱分量幅值的时间包络。该图和其它图所示的线条没有显示频谱分量的幅值大于或等于阈值40时的量化效果。量化信号中QTZ频谱分量与原始信号中相应的频谱分量之间的差用阴影显示,这些阴影区域代表了在一段时间中需要用合成频谱分量填充的频谱孔。
在本发明的一个实施例中,解码器接收的输入信号表达了如图13所示量化子带信号的编码表示。解码器对该编码表示进行解码并识别出这些子带信号中多个频谱分量的值是零,其前面和/或后面是具有非零值的频谱分量。使用如下所述的处理过程,解码器产生对应于零频谱分量的合成频谱分量。合成分量按照比例包络进行调整。该比例包络最好考虑到人类听觉系统的时间隐蔽特征。
图14示出了一种假设的时间心理声学掩蔽阈值。阈值68表示频谱分量67的时间心理声学掩蔽效应。该阈值在频谱分量67左边的部分表示预-时间掩蔽特征,或领先于频谱分量出现的掩蔽。该阈值在频谱分量67右边的部分表示后-时间掩蔽特征,或跟随频谱分量出现的掩蔽。后-掩蔽效应的持续时间通用大大长于预-掩蔽效应。这样的时间掩蔽阈值可以用于导出比例包络的时间形状。
图15的线条48是含有按照基于时间心理声学掩蔽效应的包络调整的合成频谱替代分量的假设子带信号图形。该实施例显示,比例包络是两个单独包络的组合。频谱孔低频部分的单独包络是由阈值68的后-掩蔽部分导出的,频谱孔高频部分的单独包络是由阈值68的预-掩蔽部分导出的。
3.合成分量的产生
合成频谱分量可以由多种方法产生。下面说明两种方法,可以采用多种方法。例如,不同方法的选择可以对应于编码信号的特征或者作为频率的函数。
第一种方法产生类似噪声的信号。产生伪噪声信号的很多种方法基本上都可以使用。
第二种方法使用一种称为谱平移或谱复制的技术,从一个或多个频率子带中复制频谱分量。因为较高频率分量通常以某种方式与较低频率分量相联系,所以较低频率的频谱分量通常复制并填充较高频率的频谱孔。但原则上,频谱分量可以复制到较低或较高的频率。
图16中的频谱49一假设音频信号当含有通过谱复制产生的合成频谱分量时的频谱图。谱峰的一部分在频率上下复制了多次以分别填充低频和中间频率的频谱孔。接近频谱高端频谱分量的一部分在频率上方复制并填充了频谱高端的频谱孔。在所示的实例中,复制分量用统一的比例包络进行调整;但是基本上可以采用任何形式的比例包络。
C.编码器
前面描述的本发明多个方面可以在不对现存编码器作任何修改的前提下在解码器中实施。如果修改编码器以提供附加的控制信息则可以增强这些方面,否则该信息对解码器是不可靠的。附加的控制信息可以用于修改解码器中合成频谱分量产生和按比例调整的方法。
1.控制信息
编码器可以提供多种解码器用于调整合成频谱分量比例包络的比例控制信息。下面说明的每个实例都可以用于整个信号和/或该信号的频率子带。
如果子带包含的频谱分量都大大低于最小量化水平,那么编码器可以为解码器提供指示该状态的信息。该信息可以是一种索引,解码器可以用它从两个或多个缩放比例中选择,或者该信息可以传达某种频谱幅度的度量,如平均或均方根(RMS)功率。解码器可以针对这个信息调整比例包络。
如前所述,解码器可以针对由编码信号本身估计的心理声学掩蔽效应调整比例包络。但是当编码器可以访问那些在编码过程中丢失的信号特征时,就有可能由编码器提供这些掩蔽效应的更佳估计。为此可以由模型13为格式器18提供心理声学信息,否则来自编码信号的信息是不可靠的。使用这种信息,解码器能够调整比例包络以按照一个或多个心理声学标准约束合成频谱分量的形状。
还可以针对信号或子带信号象噪声或象音调的估计调整比例包络。这种估计可以由编码器或者解码器以多种方式进行,但是编码器通常能获得更好的估计。该估计结果可以与编码信号合成在一起。一种估计就是前面描述的SFM。
解码器还可以使用SFM指示选择用于生成合成频谱分量的过程。如果SFM接近于1,可以采用噪声生成技术。如果SFM接近于零,可以采用谱复制技术。
编码器可以针对非零和QTZ频谱分量提供功率的某种指示,如这两个功率的比值。解码器可以计算非零频谱分量的功率,然后使用该比值或其它指示适当调整比例包络。
2.零频谱系数
因为在编码信号中量化是零值分量的通用来源,前面的论述有时将零值频谱分量称为QTZ(量化为零)分量。实质上不是这样,基本上任何处理都可能将编码信号中频谱分量的值设置为零。例如,编码器可以在高于该特定频率的每个子带信号中识别出一个或两个频谱分量,然后将那些子带信号的中其它频谱分量设置为零。另外,编码器可以将低于该特定阈值的该特定子带中的所有频谱分量设置为零。结合如前所述本发明各个方面的解码器能够填充不管是哪个处理过程造成的频谱孔。
Claims (45)
1.一种产生音频信息的方法,其中该方法包括:
接收输入信号并从中获得一组子带信号,每个子带信号包含代表音频信号的频谱内容的一个或多个频谱分量;
在该组子带信号中识别一个特定子带信号,其中的一个或多个频谱分量具有非零值并用具有对应于一个阈值的最小量化水平的量化器将其量化,其中的多个频谱分量的值是零;
生成对应于该特定子波带中各零值频谱分量的合成频谱分量,并按照小于或等于阈值的比例包络进行比例调整;
通过在该特定子带信号中用合成频谱分量代替相应的零值频谱分量来生成一组修改的子带信号;以及
通过将合成滤波器组应用于该修改的子带信号来生成音频信息。
2.权利要求1的方法,其中比例包络是均匀的。
3.权利要求1或2的方法,其中合成滤波器组由在相邻频谱分量之间存在频谱泄漏的块变换实现,比例包络按照一个基本上等于块变换频谱泄漏的衰减率的比率变化。
4.权利要求1至3中任一个的方法,其中合成滤波器组由块变换实现,该方法包括:
对该组子带信号的一个或多个频谱分量使用频域滤波器;以及
由频域滤波器的输出导出比例包络。
5.权利要求4的方法,包括随着频率改变频域滤波器的响应。
6.权利要求1至5中任何一个的方法,包括:
获得由该组子带信号代表的音频信号音调的度量;以及
根据音调的度量适配比例包络。
7.权利要求6的方法,从输入信号中获得音调的度量。
8.权利要求6的方法,包括由零值频谱分量在该特定子带信号中的排列方式导出音调的度量。
9.权利要求1至8中任何一个的方法,其中合成滤波器组由块变换实现,该方法包括:
从输入信号获得一序列子带信号组;
在子带信号组序列中识别出通用子带信号,其中对于序列中的每一组有一个或多个频谱分量是非零值而多个频谱分量的值是零。
在通用子带信号中识别出通用频谱分量,其值在序列的多个相邻组中为零,所述多个相邻组或者其前面或后面是具有非零值的通用频谱分量;
按照比例包络比例调整对应于零频谱分量的合成频谱分量,比例包络按照人类听觉系统的时间掩蔽特征随序列中的组变化。
通过在各组子带信号中用合成频谱分量代替相应的零值频谱分量来生成修改的子带信号组序列;以及
通过将合成滤波器组应用于该修改的子带信号组序列来生成音频信息。
10.权利要求1至9中任何一个的方法,其中合成滤波器组由块变换实现,并且该方法通过子带信号中其它频谱分量的谱平移生成合成频谱分量。
11.权利要求1至10中任何一个的方法,其中比例包络按照人类听觉系统的时间掩蔽特征变化。
12.一种生成输出信号的方法,其中该方法包括:
通过对将分析滤波器组应用于音频信息获得的信息量化来生成一组子带信号,每个子带信号包含代表音频信号频谱内容的一个或多个频谱分量;
在该组子带信号中识别一个特定子带信号,其中的一个或多个频谱分量具有非零值并用具有对应于一个阈值的最小量化水平的量化器将其量化,其中的多个频谱分量的值是零;
从音频信号的频谱内容中导出比例控制信息,其中比例控制信息控制合成频谱分量的比例以用于合成和代替接收机中的零频谱分量,该接收机响应于输出信号产生音频信息;以及
将比例控制信息和代表该组子带信号的信息装配在一起以产生输出信号。
13.权利要求12的方法,包括:
获得由该组子带信号代表的音频信号音调的度量;以及
由音调的度量导出比例控制信息。
14.权利要求12或13的方法,包括:
获得由该组子带信号代表的音频信号的心理声学掩蔽估计阈值;以及
由该心理声学掩蔽估计阈值导出比例控制信息。
15.权利要求12至14中任何一个的方法,包括:
获得由非零值和零值频谱分量代表的部分音频信号的频谱水平的两个度量;以及
由频谱水平的这两个度量导出比例控制信息。
16.一种生成音频信息的装置,其中该装置包括;
解格式器,该解格式器接收输入信号并从中获得一组子带信号,每个子带信号包含代表音频信号的频谱内容的一个或多个频谱分量;
与该解格式器连接的解码器,该解码器在该组子带信号中识别一个特定子带信号,其中的一个或多个频谱分量具有非零值并用具有对应于一个阈值的最小量化水平的量化器将其量化,其中的多个频谱分量的值是零,该解码器生成分别对应于该特定子波带中零值频谱分量的合成频谱分量,并按照小于或等于阈值的比例包络进行比例调整,该解码器通过在该特定子带信号中用合成频谱分量代替相应的零值频谱分量来生成一组修改的子带信号;以及
与该解码器连接的合成滤波器组,响应于该修改的子带信号生成音频信息。
17.权利要求16的装置,其中比例包络是均匀的。
18.权利要求16或17的装置,其中合成滤波器组由在相邻频谱分量之间存在频谱泄漏的块变换实现,比例包络按照一个基本上等于块变换频谱泄漏的衰减率的比率变化。
19.权利要求16至18中任何一个的装置,其中合成滤波器组由块变换实现,该解码器:
对该组子带信号中的一个或多个频谱分量使用频域滤波器;以及
由频域滤波器的输出导出比例包络。
20.权利要求19的装置,其中解码器随着频率改变频域滤波器的响应。
21.权利要求16至20中任何一个的装置,其中解码器
获得由该组子带信号代表的音频信号音调的度量;以及
根据音调的度量适配比例包络。
22.权利要求21的装置,从输入信号中获得音调的度量。
23.权利要求21的装置,其中解码器由零频谱分量在该特定子带信号中的排列方式导出音调的度量。
24.权利要求16至23中任何一个的装置,其中合成滤波器组由块变换实现以及
解格式器从输入信号中获得一个子带信号组序列;
解码器在子带信号组序列中识别出通用子带信号,其中对于序列中的每一组有一个或多个频谱分量是非零值而多个频谱分量的值是零,在通用子带信号中识别出通用频谱分量,其值在序列的多个相邻组中为零,所述多个相邻组或者其前面或后面是具有非零值的通用频谱分量,按照比例包络比例调整对应于零频谱分量的合成频谱分量,比例包络按照人类听觉系统的时间掩蔽特征随序列中的组变化,通过在各组子带信号中用合成频谱分量代替相应的零频谱分量生成修改的子带信号序列;以及
合成滤波器组根据该修改的子带信号序列生成音频信息。
25.权利要求16至24中任何一个的装置,其中合成滤波器组由块变换实现并且该解码器通过子带信号中其它频谱分量的谱平移生成合成频谱分量。
26.权利要求16至25中任何一个的装置,其中比例包络按照人类听觉系统的时间掩蔽特征变化。
27.一种生成输出信号的装置,其中该装置包括:
分析滤波器组,该滤波器组根据音频信息生成一组子带信号,每个子带信号包含代表音频信号频谱内容的一个或多个频谱分量;
与分析滤波器组连接的量化器,该量化器量化频谱分量;
与量化器连接的编码器,该编码器从该组子带信号中识别一个特定子带信号,其中的一个或多个频谱分量具有非零值并用具有对应于一个阈值的最小量化水平的量化器将其量化,其中的多个频谱分量的值是零,该编码器从音频信号的频谱内容中导出比例控制信息,其中比例控制信息控制合成频谱分量的比例以用于合成和代替接收机中的零频谱分量,该接收机产生响应于输出信号的音频信息;以及
与该编码器连接的格式器,该格式器通过组合比例控制信息和代表该组子带信号的信息来产生输出信号。
28.权利要求27的装置,
获得由该组子带信号代表的音频信号音调的度量;以及
由音调的度量导出比例控制信息。
29.权利要求27或28的装置,包括一个建模组件用于:
获得由该组子带信号代表的音频信号的心理声学掩蔽估计阈值;以及
由该心理声学掩蔽估计阈值导出比例控制信息。
30.权利要求27至29中任何一个的装置,
获得由非零值和零值频谱分量代表的部分音频信号的频谱水平的两个度量;以及
由频谱水平的这两个度量导出比例控制信息。
31.一种媒体,该媒体传送指令程序且对于运行该指令程序并实施生成音频信息方法的装置是可读的,其中该方法包括:
接收输入信号并从中获得一组子带信号,每个子带信号包含代表音频信号频谱内容的一个或多个频谱分量;
从该组子带信号中识别该特定子带信号,其中的一个或多个频谱分量具有非零值并用最小量化水平对应于一个阈值的量化器将其量化,其中的多个频谱分量的值是零;
生成分别对应于该特定子波带中零值频谱分量的合成频谱分量,并按照小于或等于阈值的比例包络进行量化;
在该特定子带信号中用合成频谱分量代替相应的零频谱分量生成一组修改的子带信号;以及
用合成滤波器组针对修改的子带信号生成音频信息。
32.权利要求31的媒体,其中比例包络是均匀的。
33.权利要求31或32的媒体,其中合成滤波器组由在相邻频谱分量之间存在频谱泄漏的块变换实现,比例包络按照一个基本上等于块变换频谱泄漏的衰减比例的比率变化。
34.权利要求31至33中任何一个的媒体,其中合成滤波器组由块变换实现,该方法包括:
在子带信号中对一个或多个频谱分量使用频域滤波器;以及
由频域滤波器的输出导出比例包络。
35.权利要求34的媒体,包括频域滤波器响应的变化是频率的函数。
36.权利要求31至35中任何一个的媒体,其中的方法包括:
获得由一组子带信号代表的音频信号音调的度量;以及
针对音调的度量调整比例包络。
37.权利要求36的媒体,其中的方法从输入信号中获得音调的度量。
38.权利要求36的媒体,其中的方法包括由零频谱分量在该特定子带信号中的排列方式导出音调的度量。
39.权利要求31至38中任何一个的媒体,其中合成滤波器组由块变换实现,该方法包括:
从输入信号获得一组子带信号;
由子带信号序列识别出通用子带信号,其中对于序列中的每一组有一个或多个频谱分量是非零值而多个频谱分量的值是零。
由通用子带信号中识别出通用频谱分量,其值在序列的多个相邻组中为零,或者其前面或后面是具有非零值的通用频谱分量;
按照比例包络针对零频谱分量调整合成频谱分量,比例包络按照人类听觉系统的时间掩蔽特征随序列中的组变化。
在各组子带信号中用合成频谱分量代替相应的零频谱分量生成修改的子带信号序列;以及
用合成滤波器组针对修改的子带信号序列生成音频信息。
40.权利要求31至39中任何一个的媒体,其中合成滤波器组由块变换实现并且该方法通过子带信号中其它频谱分量的谱平移生成合成频谱分量。
41.权利要求31至40中任何一个的媒体,其中比例包络按照人类听觉系统的时间掩蔽特征变化。
42.一种媒体,该媒体传送指令程序且对于运行该指令程序并实施生成输出信号方法的装置是可读的,其中该方法包括:
将分析滤波器组应用于音频信息获得量化信息并用该量化信息生成一组子带信号,每个子带信号包含代表音频信号频谱内容的一个或多个频谱分量;
从该组子带信号中识别该特定子带信号,其中的一个或多个频谱分量具有非零值并用最小量化水平对应于一个阈值的量化器将其量化,其中的多个频谱分量的值是零;
从音频信号的频谱内容中导出比例控制信息,其中比例控制信息控制合成频谱分量的量化以用于合成和代替接收机中的零频谱分量,该接收机产生对应于输出信号的音频信息;以及
将比例控制信息和代表该组子带信号的信息合成在一起以产生输出信号。
43.权利要求42的媒体,其中的方法包括:
获得由一组子带信号代表的音频信号音调的度量;以及
由音调的度量导出比例控制信息。
44.权利要求42或43的媒体,其中的方法包括:
获得由子带信号代表的音频信号的心理声学掩蔽估计值;以及
由该心理声学掩蔽估计值导出比例控制信息。
45.权利要求42至44中任何一个的媒体,其中的方法包括:
获得由非零值和零值频谱分量代表的部分音频信号频谱水平的两个度量;以及
由频谱水平的这两个度量导出比例控制信息。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/174,493 US7447631B2 (en) | 2002-06-17 | 2002-06-17 | Audio coding system using spectral hole filling |
US10/174,493 | 2002-06-17 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1662958A true CN1662958A (zh) | 2005-08-31 |
CN100369109C CN100369109C (zh) | 2008-02-13 |
Family
ID=29733607
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB038139677A Expired - Lifetime CN100369109C (zh) | 2002-06-17 | 2003-05-30 | 使用频谱孔填充的音频编码系统 |
Country Status (20)
Country | Link |
---|---|
US (4) | US7447631B2 (zh) |
EP (6) | EP2209115B1 (zh) |
JP (6) | JP4486496B2 (zh) |
KR (5) | KR100991448B1 (zh) |
CN (1) | CN100369109C (zh) |
AT (7) | ATE349754T1 (zh) |
CA (6) | CA2489441C (zh) |
DE (3) | DE60310716T8 (zh) |
DK (3) | DK1514261T3 (zh) |
ES (1) | ES2275098T3 (zh) |
HK (6) | HK1070729A1 (zh) |
IL (2) | IL165650A (zh) |
MX (1) | MXPA04012539A (zh) |
MY (2) | MY159022A (zh) |
PL (1) | PL208344B1 (zh) |
PT (1) | PT2216777E (zh) |
SG (3) | SG2014005300A (zh) |
SI (2) | SI2209115T1 (zh) |
TW (1) | TWI352969B (zh) |
WO (1) | WO2003107328A1 (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102341846A (zh) * | 2009-03-04 | 2012-02-01 | 韩国科亚电子股份有限公司 | 用于音频编码的量化 |
CN101802910B (zh) * | 2007-09-12 | 2012-11-07 | 杜比实验室特许公司 | 利用话音清晰性的语音增强 |
CN102089806B (zh) * | 2008-07-11 | 2012-12-05 | 弗劳恩霍夫应用研究促进协会 | 噪声填充器、噪声填充参数计算器、用于提供噪声填充参数的方法/用于提供音频信号的填充了噪声的频谱表示的方法 |
CN102822890A (zh) * | 2010-03-30 | 2012-12-12 | 松下电器产业株式会社 | 音响装置 |
CN101802909B (zh) * | 2007-09-12 | 2013-07-10 | 杜比实验室特许公司 | 通过噪声水平估计调整进行的语音增强 |
CN102007531B (zh) * | 2008-07-11 | 2013-08-21 | 弗劳恩霍弗实用研究促进协会 | 音讯信号解码器、音讯信号编码器及提供多声道音讯信号表现形态的方法 |
CN105103226A (zh) * | 2013-01-29 | 2015-11-25 | 弗劳恩霍夫应用研究促进协会 | 低复杂度音调自适应音频信号量化 |
CN110189760A (zh) * | 2013-01-29 | 2019-08-30 | 弗劳恩霍夫应用研究促进协会 | 对音频信号的频谱执行噪声填充的装置 |
Families Citing this family (136)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7742927B2 (en) * | 2000-04-18 | 2010-06-22 | France Telecom | Spectral enhancing method and device |
DE10134471C2 (de) * | 2001-02-28 | 2003-05-22 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Charakterisieren eines Signals und Verfahren und Vorrichtung zum Erzeugen eines indexierten Signals |
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
AU2003242903A1 (en) * | 2002-07-08 | 2004-01-23 | Koninklijke Philips Electronics N.V. | Audio processing |
US7889783B2 (en) * | 2002-12-06 | 2011-02-15 | Broadcom Corporation | Multiple data rate communication system |
KR101164937B1 (ko) | 2003-05-28 | 2012-07-12 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 오디오 신호의 인식된 라우드니스를 계산 및 조정하는방법, 장치 및 컴퓨터 프로그램 |
US7461003B1 (en) * | 2003-10-22 | 2008-12-02 | Tellabs Operations, Inc. | Methods and apparatus for improving the quality of speech signals |
US7460990B2 (en) | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
CA2555182C (en) * | 2004-03-12 | 2011-01-04 | Nokia Corporation | Synthesizing a mono audio signal based on an encoded multichannel audio signal |
KR101143724B1 (ko) * | 2004-05-14 | 2012-05-11 | 파나소닉 주식회사 | 부호화 장치 및 부호화 방법, 및 부호화 장치를 구비한 통신 단말 장치 및 기지국 장치 |
EP1742202B1 (en) * | 2004-05-19 | 2008-05-07 | Matsushita Electric Industrial Co., Ltd. | Encoding device, decoding device, and method thereof |
CN101006496B (zh) * | 2004-08-17 | 2012-03-21 | 皇家飞利浦电子股份有限公司 | 可分级音频编码 |
JP2008513845A (ja) * | 2004-09-23 | 2008-05-01 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声データを処理するシステム及び方法、プログラム要素並びにコンピュータ読み取り可能媒体 |
US8199933B2 (en) | 2004-10-26 | 2012-06-12 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
CN101048935B (zh) | 2004-10-26 | 2011-03-23 | 杜比实验室特许公司 | 控制音频信号的单位响度或部分单位响度的方法和设备 |
KR100657916B1 (ko) * | 2004-12-01 | 2006-12-14 | 삼성전자주식회사 | 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법 |
KR100707173B1 (ko) * | 2004-12-21 | 2007-04-13 | 삼성전자주식회사 | 저비트율 부호화/복호화방법 및 장치 |
US7562021B2 (en) * | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
KR100851970B1 (ko) * | 2005-07-15 | 2008-08-12 | 삼성전자주식회사 | 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치 |
US7630882B2 (en) * | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
US7546240B2 (en) | 2005-07-15 | 2009-06-09 | Microsoft Corporation | Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition |
US20070053603A1 (en) * | 2005-09-08 | 2007-03-08 | Monro Donald M | Low complexity bases matching pursuits data coding and decoding |
US8121848B2 (en) * | 2005-09-08 | 2012-02-21 | Pan Pacific Plasma Llc | Bases dictionary for low complexity matching pursuits data coding and decoding |
US7848584B2 (en) * | 2005-09-08 | 2010-12-07 | Monro Donald M | Reduced dimension wavelet matching pursuits coding and decoding |
US7813573B2 (en) * | 2005-09-08 | 2010-10-12 | Monro Donald M | Data coding and decoding with replicated matching pursuits |
US8126706B2 (en) * | 2005-12-09 | 2012-02-28 | Acoustic Technologies, Inc. | Music detector for echo cancellation and noise reduction |
JP5185254B2 (ja) | 2006-04-04 | 2013-04-17 | ドルビー ラボラトリーズ ライセンシング コーポレイション | Mdct領域におけるオーディオ信号音量測定と改良 |
TWI517562B (zh) | 2006-04-04 | 2016-01-11 | 杜比實驗室特許公司 | 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式 |
WO2007121778A1 (en) * | 2006-04-24 | 2007-11-01 | Nero Ag | Advanced audio coding apparatus |
AU2007243586B2 (en) | 2006-04-27 | 2010-12-23 | Dolby Laboratories Licensing Corporation | Audio gain control using specific-loudness-based auditory event detection |
US20070270987A1 (en) * | 2006-05-18 | 2007-11-22 | Sharp Kabushiki Kaisha | Signal processing method, signal processing apparatus and recording medium |
WO2008051347A2 (en) | 2006-10-20 | 2008-05-02 | Dolby Laboratories Licensing Corporation | Audio dynamics processing using a reset |
US8521314B2 (en) | 2006-11-01 | 2013-08-27 | Dolby Laboratories Licensing Corporation | Hierarchical control path with constraints for audio dynamics processing |
US8639500B2 (en) * | 2006-11-17 | 2014-01-28 | Samsung Electronics Co., Ltd. | Method, medium, and apparatus with bandwidth extension encoding and/or decoding |
KR101379263B1 (ko) * | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
AU2012261547B2 (en) * | 2007-03-09 | 2014-04-17 | Skype | Speech coding system and method |
GB0704622D0 (en) * | 2007-03-09 | 2007-04-18 | Skype Ltd | Speech coding system and method |
KR101411900B1 (ko) * | 2007-05-08 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 장치 |
US7761290B2 (en) * | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US7774205B2 (en) * | 2007-06-15 | 2010-08-10 | Microsoft Corporation | Coding of sparse digital media spectral data |
US8046214B2 (en) * | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US7885819B2 (en) * | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
CN101790758B (zh) | 2007-07-13 | 2013-01-09 | 杜比实验室特许公司 | 用于控制音频信号的信号处理的设备和方法 |
CN101939782B (zh) * | 2007-08-27 | 2012-12-05 | 爱立信电话股份有限公司 | 噪声填充与带宽扩展之间的自适应过渡频率 |
ES2774956T3 (es) | 2007-08-27 | 2020-07-23 | Ericsson Telefon Ab L M | Método y dispositivo para la descodificación espectral perceptual de una señal de audio, que incluyen el llenado de huecos espectrales |
US8249883B2 (en) | 2007-10-26 | 2012-08-21 | Microsoft Corporation | Channel extension coding for multi-channel source |
WO2009084918A1 (en) * | 2007-12-31 | 2009-07-09 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
PL2311033T3 (pl) | 2008-07-11 | 2012-05-31 | Fraunhofer Ges Forschung | Dostarczanie sygnału aktywującego dopasowanie czasowe i kodowanie sygnału audio z jego użyciem |
WO2010016271A1 (ja) * | 2008-08-08 | 2010-02-11 | パナソニック株式会社 | スペクトル平滑化装置、符号化装置、復号装置、通信端末装置、基地局装置及びスペクトル平滑化方法 |
WO2010028297A1 (en) | 2008-09-06 | 2010-03-11 | GH Innovation, Inc. | Selective bandwidth extension |
WO2010028299A1 (en) * | 2008-09-06 | 2010-03-11 | Huawei Technologies Co., Ltd. | Noise-feedback for spectral envelope quantization |
US8532983B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction for encoding or decoding an audio signal |
US8515747B2 (en) * | 2008-09-06 | 2013-08-20 | Huawei Technologies Co., Ltd. | Spectrum harmonic/noise sharpness control |
US8577673B2 (en) * | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
WO2010031003A1 (en) | 2008-09-15 | 2010-03-18 | Huawei Technologies Co., Ltd. | Adding second enhancement layer to celp based core layer |
EP2182513B1 (en) * | 2008-11-04 | 2013-03-20 | Lg Electronics Inc. | An apparatus for processing an audio signal and method thereof |
US9947340B2 (en) * | 2008-12-10 | 2018-04-17 | Skype | Regeneration of wideband speech |
GB0822537D0 (en) | 2008-12-10 | 2009-01-14 | Skype Ltd | Regeneration of wideband speech |
GB2466201B (en) * | 2008-12-10 | 2012-07-11 | Skype Ltd | Regeneration of wideband speech |
TWI716833B (zh) * | 2009-02-18 | 2021-01-21 | 瑞典商杜比國際公司 | 用於高頻重建或參數立體聲之複指數調變濾波器組 |
TWI618350B (zh) | 2009-02-18 | 2018-03-11 | 杜比國際公司 | 用於高頻重建或參數立體聲之複指數調變濾波器組 |
KR101320963B1 (ko) * | 2009-03-31 | 2013-10-23 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 신호 잡음 제거 방법, 신호 잡음 제거 장치, 및 오디오 디코딩 시스템 |
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
RU2605677C2 (ru) | 2009-10-20 | 2016-12-27 | Франхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен | Аудио кодер, аудио декодер, способ кодирования аудио информации, способ декодирования аудио информации и компьютерная программа, использующая итеративное уменьшение размера интервала |
US9117458B2 (en) * | 2009-11-12 | 2015-08-25 | Lg Electronics Inc. | Apparatus for processing an audio signal and method thereof |
US9838784B2 (en) | 2009-12-02 | 2017-12-05 | Knowles Electronics, Llc | Directional audio capture |
PL2524372T3 (pl) | 2010-01-12 | 2015-08-31 | Fraunhofer Ges Forschung | Koder audio. dekoder audio, sposób kodowania i dekodowania informacji audio i program komputerowy uzyskujący wartość podobszaru kontekstu w oparciu o normę uprzednio zdekodowanych wartości widmowych |
CA3225485A1 (en) | 2010-01-19 | 2011-07-28 | Dolby International Ab | Improved subband block based harmonic transposition |
TWI557723B (zh) | 2010-02-18 | 2016-11-11 | 杜比實驗室特許公司 | 解碼方法及系統 |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
US8798290B1 (en) | 2010-04-21 | 2014-08-05 | Audience, Inc. | Systems and methods for adaptive signal equalization |
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
WO2011156905A2 (en) * | 2010-06-17 | 2011-12-22 | Voiceage Corporation | Multi-rate algebraic vector quantization with supplemental coding of missing spectrum sub-bands |
US9236063B2 (en) | 2010-07-30 | 2016-01-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dynamic bit allocation |
JP6075743B2 (ja) * | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
US9208792B2 (en) * | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
WO2012037515A1 (en) | 2010-09-17 | 2012-03-22 | Xiph. Org. | Methods and systems for adaptive time-frequency resolution in digital data coding |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
JP5695074B2 (ja) * | 2010-10-18 | 2015-04-01 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 音声符号化装置および音声復号化装置 |
CN105225669B (zh) | 2011-03-04 | 2018-12-21 | 瑞典爱立信有限公司 | 音频编码中的后量化增益校正 |
US9009036B2 (en) | 2011-03-07 | 2015-04-14 | Xiph.org Foundation | Methods and systems for bit allocation and partitioning in gain-shape vector quantization for audio coding |
US8838442B2 (en) | 2011-03-07 | 2014-09-16 | Xiph.org Foundation | Method and system for two-step spreading for tonal artifact avoidance in audio coding |
US9015042B2 (en) * | 2011-03-07 | 2015-04-21 | Xiph.org Foundation | Methods and systems for avoiding partial collapse in multi-block audio coding |
ES2559040T3 (es) | 2011-03-10 | 2016-02-10 | Telefonaktiebolaget Lm Ericsson (Publ) | Relleno de subvectores no codificados en señales de audio codificadas por transformada |
EP3067888B1 (en) * | 2011-04-15 | 2017-05-31 | Telefonaktiebolaget LM Ericsson (publ) | Decoder for attenuation of signal regions reconstructed with low accuracy |
JP6189831B2 (ja) | 2011-05-13 | 2017-08-30 | サムスン エレクトロニクス カンパニー リミテッド | ビット割り当て方法及び記録媒体 |
US9264094B2 (en) * | 2011-06-09 | 2016-02-16 | Panasonic Intellectual Property Corporation Of America | Voice coding device, voice decoding device, voice coding method and voice decoding method |
JP2013007944A (ja) | 2011-06-27 | 2013-01-10 | Sony Corp | 信号処理装置、信号処理方法、及び、プログラム |
US20130006644A1 (en) * | 2011-06-30 | 2013-01-03 | Zte Corporation | Method and device for spectral band replication, and method and system for audio decoding |
JP5997592B2 (ja) * | 2012-04-27 | 2016-09-28 | 株式会社Nttドコモ | 音声復号装置 |
WO2013188562A2 (en) * | 2012-06-12 | 2013-12-19 | Audience, Inc. | Bandwidth extension via constrained synthesis |
EP2717263B1 (en) * | 2012-10-05 | 2016-11-02 | Nokia Technologies Oy | Method, apparatus, and computer program product for categorical spatial analysis-synthesis on the spectrum of a multichannel audio signal |
CN103854653B (zh) * | 2012-12-06 | 2016-12-28 | 华为技术有限公司 | 信号解码的方法和设备 |
EP3217398B1 (en) | 2013-04-05 | 2019-08-14 | Dolby International AB | Advanced quantizer |
JP6157926B2 (ja) * | 2013-05-24 | 2017-07-05 | 株式会社東芝 | 音声処理装置、方法およびプログラム |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
EP2830055A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Context-based entropy coding of sample values of a spectral envelope |
EP2830060A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise filling in multichannel audio coding |
JP6531649B2 (ja) | 2013-09-19 | 2019-06-19 | ソニー株式会社 | 符号化装置および方法、復号化装置および方法、並びにプログラム |
BR112016014476B1 (pt) | 2013-12-27 | 2021-11-23 | Sony Corporation | Aparelho e método de decodificação, e, meio de armazenamento legível por computador |
EP2919232A1 (en) * | 2014-03-14 | 2015-09-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder and method for encoding and decoding |
JP6035270B2 (ja) | 2014-03-24 | 2016-11-30 | 株式会社Nttドコモ | 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム |
RU2572664C2 (ru) * | 2014-06-04 | 2016-01-20 | Российская Федерация, От Имени Которой Выступает Министерство Промышленности И Торговли Российской Федерации | Устройство активного гашения вибрации |
EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
EP2980794A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
JP7118642B2 (ja) | 2014-08-08 | 2022-08-16 | アリ リサーチ ソシエタ ア レスポンサビリタ リミタータ センプリフィカタ | 炎症性およびアレルギー性病変の治療に用いるための脂肪酸とパルミトイルエタノールアミドの混合物 |
DE112015004185T5 (de) | 2014-09-12 | 2017-06-01 | Knowles Electronics, Llc | Systeme und Verfahren zur Wiederherstellung von Sprachkomponenten |
US10460736B2 (en) * | 2014-11-07 | 2019-10-29 | Samsung Electronics Co., Ltd. | Method and apparatus for restoring audio signal |
US9875756B2 (en) | 2014-12-16 | 2018-01-23 | Psyx Research, Inc. | System and method for artifact masking |
US9668048B2 (en) | 2015-01-30 | 2017-05-30 | Knowles Electronics, Llc | Contextual switching of microphones |
TWI758146B (zh) | 2015-03-13 | 2022-03-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
US10553228B2 (en) * | 2015-04-07 | 2020-02-04 | Dolby International Ab | Audio coding with range extension |
US20170024495A1 (en) * | 2015-07-21 | 2017-01-26 | Positive Grid LLC | Method of modeling characteristics of a musical instrument |
MX2018010753A (es) * | 2016-03-07 | 2019-01-14 | Fraunhofer Ges Forschung | Método de ocultamiento híbrido: combinación de ocultamiento de pérdida paquete de dominio de frecuencia y tiempo en códecs de audio. |
DE102016104665A1 (de) * | 2016-03-14 | 2017-09-14 | Ask Industries Gmbh | Verfahren und Vorrichtung zur Aufbereitung eines verlustbehaftet komprimierten Audiosignals |
JP2018092012A (ja) * | 2016-12-05 | 2018-06-14 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
WO2018106088A1 (ko) * | 2016-12-09 | 2018-06-14 | 주식회사 엘지화학 | 밀봉재 조성물 |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
US10950251B2 (en) * | 2018-03-05 | 2021-03-16 | Dts, Inc. | Coding of harmonic signals in transform-based audio codecs |
EP3544005B1 (en) | 2018-03-22 | 2021-12-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding with dithered quantization |
EP3662469A4 (en) | 2018-04-25 | 2020-08-19 | Dolby International AB | INTEGRATION OF HIGH FREQUENCY RECONSTRUCTION TECHNIQUES WITH REDUCED POST-PROCESSING DELAY |
KR20210005164A (ko) | 2018-04-25 | 2021-01-13 | 돌비 인터네셔널 에이비 | 고주파 오디오 재구성 기술의 통합 |
WO2023118600A1 (en) * | 2021-12-23 | 2023-06-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for spectrotemporally improved spectral gap filling in audio coding using different noise filling methods |
WO2023117145A1 (en) * | 2021-12-23 | 2023-06-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for spectrotemporally improved spectral gap filling in audio coding using different noise filling methods |
WO2023117146A1 (en) * | 2021-12-23 | 2023-06-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for spectrotemporally improved spectral gap filling in audio coding using a filtering |
WO2023118605A1 (en) * | 2021-12-23 | 2023-06-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for spectrotemporally improved spectral gap filling in audio coding using a filtering |
Family Cites Families (68)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US36478A (en) * | 1862-09-16 | Improved can or tank for coal-oil | ||
US3995115A (en) | 1967-08-25 | 1976-11-30 | Bell Telephone Laboratories, Incorporated | Speech privacy system |
US3684838A (en) | 1968-06-26 | 1972-08-15 | Kahn Res Lab | Single channel audio signal transmission system |
JPS6011360B2 (ja) | 1981-12-15 | 1985-03-25 | ケイディディ株式会社 | 音声符号化方式 |
US4667340A (en) | 1983-04-13 | 1987-05-19 | Texas Instruments Incorporated | Voice messaging system with pitch-congruent baseband coding |
US4790016A (en) | 1985-11-14 | 1988-12-06 | Gte Laboratories Incorporated | Adaptive method and apparatus for coding speech |
WO1986003873A1 (en) | 1984-12-20 | 1986-07-03 | Gte Laboratories Incorporated | Method and apparatus for encoding speech |
US4885790A (en) | 1985-03-18 | 1989-12-05 | Massachusetts Institute Of Technology | Processing of acoustic waveforms |
US4935963A (en) | 1986-01-24 | 1990-06-19 | Racal Data Communications Inc. | Method and apparatus for processing speech signals |
JPS62234435A (ja) | 1986-04-04 | 1987-10-14 | Kokusai Denshin Denwa Co Ltd <Kdd> | 符号化音声の復号化方式 |
EP0243562B1 (en) | 1986-04-30 | 1992-01-29 | International Business Machines Corporation | Improved voice coding process and device for implementing said process |
US4776014A (en) | 1986-09-02 | 1988-10-04 | General Electric Company | Method for pitch-aligned high-frequency regeneration in RELP vocoders |
US5054072A (en) | 1987-04-02 | 1991-10-01 | Massachusetts Institute Of Technology | Coding of acoustic waveforms |
US5127054A (en) | 1988-04-29 | 1992-06-30 | Motorola, Inc. | Speech quality improvement for voice coders and synthesizers |
JPH02183630A (ja) * | 1989-01-10 | 1990-07-18 | Fujitsu Ltd | 音声符号化方式 |
US5109417A (en) | 1989-01-27 | 1992-04-28 | Dolby Laboratories Licensing Corporation | Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio |
US5054075A (en) | 1989-09-05 | 1991-10-01 | Motorola, Inc. | Subband decoding method and apparatus |
CN1062963C (zh) | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
ES2087522T3 (es) | 1991-01-08 | 1996-07-16 | Dolby Lab Licensing Corp | Descodificacion/codificacion para campos sonoros multidimensionales. |
JP3134337B2 (ja) * | 1991-03-30 | 2001-02-13 | ソニー株式会社 | ディジタル信号符号化方法 |
EP0551705A3 (en) * | 1992-01-15 | 1993-08-18 | Ericsson Ge Mobile Communications Inc. | Method for subbandcoding using synthetic filler signals for non transmitted subbands |
JP2563719B2 (ja) | 1992-03-11 | 1996-12-18 | 技術研究組合医療福祉機器研究所 | 音声加工装置と補聴器 |
JP2693893B2 (ja) | 1992-03-30 | 1997-12-24 | 松下電器産業株式会社 | ステレオ音声符号化方法 |
JP3508146B2 (ja) * | 1992-09-11 | 2004-03-22 | ソニー株式会社 | ディジタル信号符号化復号化装置、ディジタル信号符号化装置及びディジタル信号復号化装置 |
JP3127600B2 (ja) * | 1992-09-11 | 2001-01-29 | ソニー株式会社 | ディジタル信号復号化装置及び方法 |
US5402124A (en) * | 1992-11-25 | 1995-03-28 | Dolby Laboratories Licensing Corporation | Encoder and decoder with improved quantizer using reserved quantizer level for small amplitude signals |
US5394466A (en) * | 1993-02-16 | 1995-02-28 | Keptel, Inc. | Combination telephone network interface and cable television apparatus and cable television module |
US5623577A (en) * | 1993-07-16 | 1997-04-22 | Dolby Laboratories Licensing Corporation | Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions |
JPH07225598A (ja) | 1993-09-22 | 1995-08-22 | Massachusetts Inst Of Technol <Mit> | 動的に決定された臨界帯域を用いる音響コード化の方法および装置 |
JP3186489B2 (ja) * | 1994-02-09 | 2001-07-11 | ソニー株式会社 | ディジタル信号処理方法及び装置 |
JP3277682B2 (ja) * | 1994-04-22 | 2002-04-22 | ソニー株式会社 | 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体及び情報伝送方法 |
KR960704300A (ko) * | 1994-05-25 | 1996-08-31 | 이데이 노부유키 | 부호화 방법, 복호화 방법, 부호화/복호화 방법, 부호화 장치, 복호화 장치 및 부호화/복호화 장치(Encoding method, decoding method, encoding/decoding method, encoding apparatus, decoding apparatus, and encoding/decoding apparatus) |
US5748786A (en) * | 1994-09-21 | 1998-05-05 | Ricoh Company, Ltd. | Apparatus for compression using reversible embedded wavelets |
JP3254953B2 (ja) | 1995-02-17 | 2002-02-12 | 日本ビクター株式会社 | 音声高能率符号化装置 |
DE19509149A1 (de) | 1995-03-14 | 1996-09-19 | Donald Dipl Ing Schulz | Codierverfahren |
JPH08328599A (ja) | 1995-06-01 | 1996-12-13 | Mitsubishi Electric Corp | Mpegオーディオ復号器 |
DE69620967T2 (de) * | 1995-09-19 | 2002-11-07 | At & T Corp., New York | Synthese von Sprachsignalen in Abwesenheit kodierter Parameter |
US5692102A (en) * | 1995-10-26 | 1997-11-25 | Motorola, Inc. | Method device and system for an efficient noise injection process for low bitrate audio compression |
US6138051A (en) * | 1996-01-23 | 2000-10-24 | Sarnoff Corporation | Method and apparatus for evaluating an audio decoder |
JP3189660B2 (ja) * | 1996-01-30 | 2001-07-16 | ソニー株式会社 | 信号符号化方法 |
JP3519859B2 (ja) * | 1996-03-26 | 2004-04-19 | 三菱電機株式会社 | 符号器及び復号器 |
DE19628293C1 (de) * | 1996-07-12 | 1997-12-11 | Fraunhofer Ges Forschung | Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion |
US6092041A (en) * | 1996-08-22 | 2000-07-18 | Motorola, Inc. | System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder |
JPH1091199A (ja) * | 1996-09-18 | 1998-04-10 | Mitsubishi Electric Corp | 記録再生装置 |
US5924064A (en) | 1996-10-07 | 1999-07-13 | Picturetel Corporation | Variable length coding using a plurality of region bit allocation patterns |
EP0878790A1 (en) * | 1997-05-15 | 1998-11-18 | Hewlett-Packard Company | Voice coding system and method |
JP3213582B2 (ja) * | 1997-05-29 | 2001-10-02 | シャープ株式会社 | 画像符号化装置及び画像復号装置 |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
KR20000068538A (ko) * | 1997-07-11 | 2000-11-25 | 이데이 노부유끼 | 정보 복호 방법 및 장치, 정보 부호화 방법 및 장치, 및 제공매체 |
DE19730130C2 (de) | 1997-07-14 | 2002-02-28 | Fraunhofer Ges Forschung | Verfahren zum Codieren eines Audiosignals |
US6351730B2 (en) * | 1998-03-30 | 2002-02-26 | Lucent Technologies Inc. | Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment |
US6115689A (en) * | 1998-05-27 | 2000-09-05 | Microsoft Corporation | Scalable audio coder and decoder |
JP2000148191A (ja) * | 1998-11-06 | 2000-05-26 | Matsushita Electric Ind Co Ltd | ディジタルオーディオ信号の符号化装置 |
US6300888B1 (en) * | 1998-12-14 | 2001-10-09 | Microsoft Corporation | Entrophy code mode switching for frequency-domain audio coding |
SE9903553D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
US6363338B1 (en) * | 1999-04-12 | 2002-03-26 | Dolby Laboratories Licensing Corporation | Quantization in perceptual audio coders with compensation for synthesis filter noise spreading |
JP4843142B2 (ja) * | 1999-04-16 | 2011-12-21 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | 音声符号化のための利得−適応性量子化及び不均一符号長の使用 |
FR2807897B1 (fr) * | 2000-04-18 | 2003-07-18 | France Telecom | Methode et dispositif d'enrichissement spectral |
JP2001324996A (ja) * | 2000-05-15 | 2001-11-22 | Japan Music Agency Co Ltd | Mp3音楽データ再生方法及び装置 |
JP3616307B2 (ja) * | 2000-05-22 | 2005-02-02 | 日本電信電話株式会社 | 音声・楽音信号符号化方法及びこの方法を実行するプログラムを記録した記録媒体 |
SE0001926D0 (sv) * | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
JP2001343998A (ja) * | 2000-05-31 | 2001-12-14 | Yamaha Corp | ディジタルオーディオデコーダ |
JP3538122B2 (ja) | 2000-06-14 | 2004-06-14 | 株式会社ケンウッド | 周波数補間装置、周波数補間方法及び記録媒体 |
SE0004187D0 (sv) | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
GB0103245D0 (en) * | 2001-02-09 | 2001-03-28 | Radioscape Ltd | Method of inserting additional data into a compressed signal |
US6963842B2 (en) * | 2001-09-05 | 2005-11-08 | Creative Technology Ltd. | Efficient system and method for converting between different transform-domain signal representations |
US20030187663A1 (en) | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
US7447631B2 (en) * | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
-
2002
- 2002-06-17 US US10/174,493 patent/US7447631B2/en active Active
- 2002-09-06 US US10/238,047 patent/US7337118B2/en not_active Expired - Lifetime
-
2003
- 2003-04-29 TW TW092109991A patent/TWI352969B/zh not_active IP Right Cessation
- 2003-05-30 CA CA2489441A patent/CA2489441C/en not_active Expired - Lifetime
- 2003-05-30 SI SI200332091T patent/SI2209115T1/sl unknown
- 2003-05-30 MX MXPA04012539A patent/MXPA04012539A/es active IP Right Grant
- 2003-05-30 EP EP10162216A patent/EP2209115B1/en not_active Expired - Lifetime
- 2003-05-30 KR KR1020047020570A patent/KR100991448B1/ko active IP Right Grant
- 2003-05-30 PL PL372104A patent/PL208344B1/pl unknown
- 2003-05-30 AT AT03736761T patent/ATE349754T1/de active
- 2003-05-30 DE DE60310716T patent/DE60310716T8/de active Active
- 2003-05-30 JP JP2004514060A patent/JP4486496B2/ja not_active Expired - Lifetime
- 2003-05-30 WO PCT/US2003/017078 patent/WO2003107328A1/en active IP Right Grant
- 2003-05-30 EP EP06020757A patent/EP1736966B1/en not_active Expired - Lifetime
- 2003-05-30 SG SG2014005300A patent/SG2014005300A/en unknown
- 2003-05-30 SG SG10201702049SA patent/SG10201702049SA/en unknown
- 2003-05-30 CN CNB038139677A patent/CN100369109C/zh not_active Expired - Lifetime
- 2003-05-30 CA CA2735830A patent/CA2735830C/en not_active Expired - Lifetime
- 2003-05-30 CA CA2736055A patent/CA2736055C/en not_active Expired - Lifetime
- 2003-05-30 EP EP03736761A patent/EP1514261B1/en not_active Expired - Lifetime
- 2003-05-30 KR KR1020107009429A patent/KR100991450B1/ko active IP Right Grant
- 2003-05-30 DK DK03736761T patent/DK1514261T3/da active
- 2003-05-30 EP EP10162217A patent/EP2216777B1/en not_active Expired - Lifetime
- 2003-05-30 DE DE60333316T patent/DE60333316D1/de not_active Expired - Lifetime
- 2003-05-30 SG SG2009049545A patent/SG177013A1/en unknown
- 2003-05-30 ES ES03736761T patent/ES2275098T3/es not_active Expired - Lifetime
- 2003-05-30 AT AT10162217T patent/ATE536615T1/de active
- 2003-05-30 AT AT10162216T patent/ATE526661T1/de not_active IP Right Cessation
- 2003-05-30 AT AT06020757T patent/ATE473503T1/de not_active IP Right Cessation
- 2003-05-30 DK DK06020757.8T patent/DK1736966T3/da active
- 2003-05-30 PT PT10162217T patent/PT2216777E/pt unknown
- 2003-05-30 CA CA2736046A patent/CA2736046A1/en not_active Abandoned
- 2003-06-09 EP EP10159809A patent/EP2207169B1/en not_active Expired - Lifetime
- 2003-06-09 SI SI200332086T patent/SI2207169T1/sl unknown
- 2003-06-09 AT AT03760242T patent/ATE470220T1/de not_active IP Right Cessation
- 2003-06-09 CA CA2736060A patent/CA2736060C/en not_active Expired - Lifetime
- 2003-06-09 AT AT10159809T patent/ATE529858T1/de not_active IP Right Cessation
- 2003-06-09 DK DK10159809.2T patent/DK2207169T3/da active
- 2003-06-09 AT AT10159810T patent/ATE529859T1/de not_active IP Right Cessation
- 2003-06-09 CA CA2736065A patent/CA2736065C/en not_active Expired - Lifetime
- 2003-06-09 KR KR1020107013897A patent/KR100986152B1/ko active IP Right Grant
- 2003-06-09 KR KR1020107013899A patent/KR100986153B1/ko active IP Right Grant
- 2003-06-09 EP EP10159810A patent/EP2207170B1/en not_active Expired - Lifetime
- 2003-06-09 KR KR1020047020587A patent/KR100986150B1/ko active IP Right Grant
- 2003-06-09 DE DE60332833T patent/DE60332833D1/de not_active Expired - Lifetime
- 2003-06-16 MY MYPI20032238A patent/MY159022A/en unknown
- 2003-06-16 MY MYPI20032237A patent/MY136521A/en unknown
-
2004
- 2004-12-08 IL IL165650A patent/IL165650A/en active IP Right Grant
-
2005
- 2005-04-19 HK HK05103320A patent/HK1070729A1/xx not_active IP Right Cessation
- 2005-04-19 HK HK05103319.3A patent/HK1070728A1/xx not_active IP Right Cessation
-
2009
- 2009-02-04 US US12/365,783 patent/US8050933B2/en not_active Expired - Lifetime
- 2009-02-04 US US12/365,789 patent/US8032387B2/en not_active Expired - Lifetime
-
2010
- 2010-02-15 JP JP2010030139A patent/JP5063717B2/ja not_active Expired - Lifetime
- 2010-08-19 HK HK10107912.8A patent/HK1141623A1/xx not_active IP Right Cessation
- 2010-08-19 HK HK10107913.7A patent/HK1141624A1/xx not_active IP Right Cessation
-
2011
- 2011-01-13 HK HK11100292.2A patent/HK1146145A1/xx not_active IP Right Cessation
- 2011-01-13 HK HK11100293.1A patent/HK1146146A1/xx not_active IP Right Cessation
- 2011-10-31 IL IL216069A patent/IL216069A/en active IP Right Grant
- 2011-12-28 JP JP2011287052A patent/JP5253565B2/ja not_active Expired - Lifetime
- 2011-12-28 JP JP2011287051A patent/JP5253564B2/ja not_active Expired - Lifetime
-
2012
- 2012-07-03 JP JP2012149087A patent/JP5345722B2/ja not_active Expired - Lifetime
-
2013
- 2013-07-12 JP JP2013146451A patent/JP5705273B2/ja not_active Expired - Lifetime
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101802910B (zh) * | 2007-09-12 | 2012-11-07 | 杜比实验室特许公司 | 利用话音清晰性的语音增强 |
CN101802909B (zh) * | 2007-09-12 | 2013-07-10 | 杜比实验室特许公司 | 通过噪声水平估计调整进行的语音增强 |
CN102089806B (zh) * | 2008-07-11 | 2012-12-05 | 弗劳恩霍夫应用研究促进协会 | 噪声填充器、噪声填充参数计算器、用于提供噪声填充参数的方法/用于提供音频信号的填充了噪声的频谱表示的方法 |
CN102007531B (zh) * | 2008-07-11 | 2013-08-21 | 弗劳恩霍弗实用研究促进协会 | 音讯信号解码器、音讯信号编码器及提供多声道音讯信号表现形态的方法 |
CN102341846B (zh) * | 2009-03-04 | 2013-09-25 | 韩国科亚电子股份有限公司 | 用于音频编码器的量化方法和装置 |
CN102341846A (zh) * | 2009-03-04 | 2012-02-01 | 韩国科亚电子股份有限公司 | 用于音频编码的量化 |
CN102822890A (zh) * | 2010-03-30 | 2012-12-12 | 松下电器产业株式会社 | 音响装置 |
CN105103226A (zh) * | 2013-01-29 | 2015-11-25 | 弗劳恩霍夫应用研究促进协会 | 低复杂度音调自适应音频信号量化 |
CN105103226B (zh) * | 2013-01-29 | 2019-04-16 | 弗劳恩霍夫应用研究促进协会 | 低复杂度音调自适应音频信号量化 |
CN110189760A (zh) * | 2013-01-29 | 2019-08-30 | 弗劳恩霍夫应用研究促进协会 | 对音频信号的频谱执行噪声填充的装置 |
US10468043B2 (en) | 2013-01-29 | 2019-11-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Low-complexity tonality-adaptive audio signal quantization |
US11094332B2 (en) | 2013-01-29 | 2021-08-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Low-complexity tonality-adaptive audio signal quantization |
US11694701B2 (en) | 2013-01-29 | 2023-07-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Low-complexity tonality-adaptive audio signal quantization |
CN110189760B (zh) * | 2013-01-29 | 2023-09-12 | 弗劳恩霍夫应用研究促进协会 | 对音频信号的频谱执行噪声填充的装置 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100369109C (zh) | 使用频谱孔填充的音频编码系统 | |
Painter et al. | Perceptual coding of digital audio | |
EP1701452B1 (en) | System and method for masking quantization noise of audio signals | |
US6240380B1 (en) | System and method for partially whitening and quantizing weighting functions of audio signals | |
CN1065381C (zh) | 数字音频信号编码和/或译码方法 | |
CN100367348C (zh) | 低比特速率音频编码 | |
CN1310210C (zh) | 使用解码信号的特征适配合成频谱分量的音频编码系统 | |
US7428489B2 (en) | Encoding method and apparatus, and decoding method and apparatus | |
CN1571993A (zh) | 用于改善高频重建的方法 | |
CN1897467A (zh) | 信号编码、信号解码装置和方法、程序以及记录介质 | |
JP2005338637A (ja) | オーディオ信号符号化装置及び方法 | |
US20060036435A1 (en) | Method for encoding and decoding audio at a variable rate | |
JP4843142B2 (ja) | 音声符号化のための利得−適応性量子化及び不均一符号長の使用 | |
Singh et al. | Audio watermarking based on quantization index modulation using combined perceptual masking | |
CN1375817A (zh) | 一种基于小波变换的音频信号压缩编/解码方法 | |
JP2005284301A (ja) | 復号方法及び装置、並びにプログラム | |
Gunjal et al. | Traditional Psychoacoustic Model and Daubechies Wavelets for Enhanced Speech Coder Performance | |
HE et al. | Wideband Speech and Audio Coding Based on Wavelet Transform And Psychoacoustic Model | |
Ali et al. | Efficient audio coding with optimized subband configurations | |
Ali et al. | Efficient signal adaptive perceptual audio coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CX01 | Expiry of patent term |
Granted publication date: 20080213 |
|
CX01 | Expiry of patent term |