CN105825858A - 比特分配、音频编码和解码 - Google Patents
比特分配、音频编码和解码 Download PDFInfo
- Publication number
- CN105825858A CN105825858A CN201610341124.5A CN201610341124A CN105825858A CN 105825858 A CN105825858 A CN 105825858A CN 201610341124 A CN201610341124 A CN 201610341124A CN 105825858 A CN105825858 A CN 105825858A
- Authority
- CN
- China
- Prior art keywords
- bit
- band
- sub
- unit
- distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001228 spectrum Methods 0.000 claims abstract description 133
- 238000000034 method Methods 0.000 claims abstract description 46
- 238000012545 processing Methods 0.000 claims description 13
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000009432 framing Methods 0.000 description 46
- 238000010586 diagram Methods 0.000 description 32
- 230000005236 sound signal Effects 0.000 description 31
- 230000000873 masking effect Effects 0.000 description 26
- 230000003595 spectral effect Effects 0.000 description 25
- 238000004891 communication Methods 0.000 description 15
- 230000001052 transient effect Effects 0.000 description 14
- 238000013139 quantization Methods 0.000 description 12
- 238000011084 recovery Methods 0.000 description 11
- 230000009466 transformation Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 230000008859 change Effects 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 238000010606 normalization Methods 0.000 description 5
- 230000011664 signaling Effects 0.000 description 4
- 230000008447 perception Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
一种比特分配、音频编码和解码。提供一种比特分配方法,所述方法包括:基于每个频带按照小数点为单位确定分配的比特的数量以使得在给定帧的可容许的比特的数量的范围内使存在于预定频带中的频谱的信噪比(SNR)最大化;以及基于每个频带调整分配的比特的数量。
Description
本申请是向中国知识产权局提交的申请日为2012年5月14日、申请号为201280034734.0、发明名称为“比特分配、音频编码和解码”的申请的分案申请。
技术领域
与本公开一致的设备、装置和制品涉及音频编码和解码,更具体地讲,涉及一种用于基于子频带有效地将比特分配给对感知重要的频率区域的方法和设备、音频编码方法和设备、音频解码方法和设备、记录介质和采用上述方法和设备以及记录介质的多媒体装置。
背景技术
当音频信号被编码或解码时,需要有效地使用有限数量的比特以在有限数量的比特的范围中恢复具有最好的声音质量的音频信号。特别地,在低比特率,对音频信号进行编码和解码的技术需要均匀地将比特分配给在感觉上重要的频谱分量而非将比特集中于特定频率区域。
特别地,在低比特率,当在将比特分配给每个频带(诸如,子频带)的情况下执行编码时,可由于因为比特的数量不足没被编码的频率分量而产生频谱孔(spectralhole),由此导致声音质量的降低。
发明内容
技术问题
一方面在于提供一种用于基于子频带有效地将比特分配给在感觉上重要的频率区域的方法和设备、音频编码方法和设备、音频解码方法和设备、记录介质和采用上述方法和设备以及记录介质的多媒体装置。
一方面在于提供一种用于基于子频带以低复杂性有效地将比特分配给在感觉上重要的频率区域的方法和设备、音频编码方法和设备、音频解码方法和设备、记录介质和采用上述方法和设备以及记录介质的多媒体装置。
问题的解决方案
根据一个或多个示例性实施例的一方面,提供一种比特分配方法,所述比特分配方法包括:基于每个频带按照小数点为单位确定分配的比特的数量以使得在给定帧的可容许的比特的数量的范围内使存在于预定频带中的频谱的信噪比(SNR)最大化;以及基于每个频带调整分配的比特的数量。
根据一个或多个示例性实施例的另一方面,提供一种比特分配设备,所述比特分配设备包括:变换单元,将时域中的音频信号变换为频域中的音频频谱;和比特分配单元,通过使用基于音频频谱中的给定帧中所包括的频带的掩蔽阈值按照小数点为单位估计可容许的比特的数量,通过使用频谱能量按照小数点为单位估计分配的比特的数量,并且调整分配的比特的数量以免超过可容许的比特的数量。
根据一个或多个示例性实施例的另一方面,提供一种音频编码设备,所述音频编码设备包括:变换单元,将时域中的音频信号变换为频域中的音频频谱;比特分配单元,基于每个频带按照小数点为单位确定分配的比特的数量以使得在音频频谱的给定帧的可容许的比特的数量的范围内使存在于预定频带中的频谱的信噪比(SNR)最大化,并且调整基于每个频带确定的分配的比特的数量;和编码单元,通过使用基于每个频带和频谱能量调整的比特的数量来对音频频谱进行编码。
根据一个或多个示例性实施例的另一方面,提供一种音频解码设备,所述音频编码设备包括:变换单元,将时域中的音频信号变换为频域中的音频频谱;比特分配单元,基于每个频带按照小数点为单位确定分配的比特的数量以使得在音频频谱的给定帧的可容许的比特的数量的范围内使存在于预定频带中的频谱的信噪比(SNR)最大化,并且调整基于每个频带确定的分配的比特的数量;和编码单元,通过使用基于每个频带和频谱能量调整的比特的数量来对音频频谱进行编码。
根据一个或多个示例性实施例的另一方面,提供一种音频解码设备,所述音频解码设备包括:比特分配单元,通过使用基于给定帧中所包括的频带的掩蔽阈值按照小数点为单位估计可容许的比特的数量,通过使用频谱能量按照小数点为单位估计分配的比特的数量,并且调整分配的比特的数量以免超过可容许的比特的数量;解码单元,通过使用基于每个频带和频谱能量调整的比特的数量来对比特流中所包括的音频频谱进行解码;和逆变换单元,将解码的音频频谱变换为时域中的音频信号。
附图说明
通过参照附图详细描述以上和其它方面的示例性实施例,以上和其它方面将会变得更加清楚,其中:
图1是根据示例性实施例的音频编码设备的框图;
图2是根据示例性实施例的图1的音频编码设备中的比特分配单元的框图;
图3是根据另一示例性实施例的图1的音频编码设备中的比特分配单元的框图;
图4是根据另一示例性实施例的图1的音频编码设备中的比特分配单元的框图;
图5是根据示例性实施例的图1的音频编码设备中的编码单元的框图;
图6是根据另一示例性实施例的音频编码设备的框图;
图7是根据示例性实施例的音频解码设备的框图;
图8是根据示例性实施例的图7的音频解码设备中的比特分配单元的框图;
图9是根据示例性实施例的图7的音频解码设备中的解码单元的框图;
图10是根据另一示例性实施例的图7的音频解码设备中的解码单元的框图;
图11是根据另一示例性实施例的图7的音频解码设备中的解码单元的框图;
图12是根据另一示例性实施例的音频解码设备的框图;
图13是根据另一示例性实施例的音频解码设备的框图;
图14是示出根据另一示例性实施例的比特分配方法的流程图;
图15是示出根据另一示例性实施例的比特分配方法的流程图;
图16是示出根据另一示例性实施例的比特分配方法的流程图;
图17是示出根据另一示例性实施例的比特分配方法的流程图;
图18是根据示例性实施例的包括编码模块的多媒体装置的框图;
图19是根据示例性实施例的包括解码模块的多媒体装置的框图;和
图20是根据示例性实施例的包括编码模块和解码模块的多媒体装置的框图。
具体实施方式
本发明构思可允许形式上的各种变化或修改和各种改变,并且将会在附图中示出并且在说明书中详细描述特定示例性实施例。然而,应该理解,特定示例性实施例并不使本发明构思局限制于特定公开形式,而是包括落在本发明构思的精神和技术范围内的每一种修改的、等同的或替换的形式。在下面的描述中,不详细描述公知功能或构造,因为它们将会用不必要的细节来模糊本发明。
虽然诸如“第一”和“第二”的术语可被用于描述各种元件,但元件不可由这些术语限制。这些术语可被用于区分某一元件与另一元件。
在本申请中使用的术语仅被用于描述特定示例性实施例,而不具有限制本发明构思的任何意图。虽然在考虑到本发明构思中的功能的同时尽可能当前广泛使用的一般术语被选择为在本发明构思中使用的术语,但它们可根据本领域普通技术人员的意图、先例或新技术的出现而变化。另外,在特定情况下,可使用由申请人故意选择的术语,并且在这种情况下,将在本发明的对应描述中公开这些术语的含义。因此,在本发明构思中使用的术语不应简单地由术语的名称定义,而是应由术语的含义和在本发明构思上的内容定义。
除非单数形式的表述和复数形式的表述在上下文中清楚地彼此不同,否则单数形式的表述包括复数形式的表述。在本申请中,应该理解,诸如“包括”和“具有”的术语被用于指示存在实现的特征、数量、步骤、操作、元件、部件或其组合,但并不预先排除存在或添加一个或多个其它特征、数量、步骤、操作、元件、部件或其组合的可能性。
以下,将参照示出示例性实施例的附图更充分地描述本发明构思。附图中的相同标号表示相同元件,因此,将省略其重复描述。
如这里所使用,当诸如“…中的至少一个”的表述位于元件的列表之后时,是修饰元件的整个列表而非修饰列表的单个元件。
图1是根据示例性实施例的音频编码设备100的框图。
图1的音频编码设备100可包括变换单元130、比特分配单元150、编码单元170和复用单元190。音频编码设备100的部件可被集成在至少一个模块中并且由至少一个处理器(例如,中央处理器(CPU))实现。这里,音频可包括音频信号、语音信号或通过合成它们而获得的信号,但在以下,为了方便描述,音频通常指示音频信号。
参照图1,变换单元130可通过将时域中的音频信号变换为频域中的音频信号来产生音频频谱。可通过使用各种公知方法(诸如,离散余弦变换(DCT))来执行时域至频域变换。
比特分配单元150可确定通过针对音频频谱使用频谱能量或心理-声学模型而获得的掩蔽阈值和通过使用频谱能量基于每个子频带分配的比特的数量。这里,子频带是对音频频谱的采样点进行分组的单位并且可通过反映阈值频带而具有统一或非统一长度。当子频带具有非统一长度时,可确定子频带以使得在每帧,每个子频带中所包括的从开始的采样点到最后的采样点的采样点的数量逐渐增加。这里,子频带的数量或每个子帧中所包括的采样点的数量可被预先确定。可选择地,在一帧被分成具有统一长度的预定数量的子频带之后,可根据频谱系数的分布调整该统一长度。可使用频谱平坦度测量、最大值和最小值之差或者最大值的微分值确定频谱系数的分布。
根据示例性实施例,比特分配单元150可通过使用基于每个子频带获得的范数值(即,平均频谱能量)来估计可容许的比特的数量,基于平均频谱能量分配比特,并且限制分配的比特的数量以免超过可容许的比特的数量。
根据示例性实施例,比特分配单元150可通过基于每个子频带使用心理-声学模型来估计可容许的比特的数量,基于平均频谱能量分配比特,并且限制分配的比特的数量以免超过容许的比特的数量。
编码单元170可通过根据基于每个子频带最后确定的分配的比特的数量对音频频谱进行量化和无损编码,来产生关于编码的频谱的信息。
复用单元190通过复用从比特分配单元150提供的编码的范数值和从编码单元170提供的关于编码的频谱的信息来产生比特流。
音频编码设备100可产生可选的子频带的噪声水平并且将噪声水平提供给音频解码设备(图7的700、图12的1200或者图13的1300)。
图2是根据示例性实施例的与图1的音频编码设备100中的比特分配单元150对应的比特分配单元200的框图。
图2的比特分配单元200可包括范数估计器210、范数编码器230以及比特估计器和分配器250。比特分配单元200的部件可被集成在至少一个模块中并且由至少一个处理器实现。
参照图2,范数估计器210可基于每个子频带获得与平均频谱能量对应的范数值。例如,可通过在ITU-TG.719中应用的等式1来计算范数值,但不限于此。
数学图1
[数学1]
在等式1中,当P个子频带或子区段存在于一帧中时,N(p)表示第p子频带或子区段的范数值,Lp表示第p子频带或子区段的长度,即采样点或频谱系数的数量,sp和ep分别表示第p子频带的开始的采样点和最后的采样点,并且y(k)表示采样点大小或频谱系数(即,能量)。
基于每个子频带获得的范数值可被提供给编码单元(图1的170)。
范数编码器230可对基于每个子频带获得的范数值进行量化和无损编码。基于每个子频带量化的范数值或者通过对量化的范数值进行去量化而获得的范数值可被提供给比特估计器和分配器250。基于每个子频带量化并且无损编码的范数值可被提供给复用单元(图1的190)。
比特估计器和分配器250可通过使用范数值来估计并且分配需要的数量的比特。优选地,可使用去量化的范数值,以使得编码部分和解码部分能够使用相同的比特估计和分配过程。在这种情况下,可使用通过考虑掩蔽效应而调整的范数值。例如,可如等式2中一样使用在ITU-TG.719中应用的心理-声学加权来调整范数值,但不限于此。
数学图2
[数学2]
在等式2中,表示第p子频带的量化的范数值的索引,表示第p子频带的调整的范数值的索引,并且WSpe(p)表示用于范数值调整的偏移频谱。
比特估计器和分配器250可通过使用基于每个子频带的范数值来计算掩蔽阈值,并且通过使用掩蔽阈值来估计感知所需要的比特的数量。为了实现这一点,基于每个子频带获得的范数值可被同样地表示为以dB为单位的频谱能量,如等式3中所示。
数学图3
[数学3]
作为通过使用频谱能量来获得掩蔽阈值的方法,可使用各种公知方法。也就是说,掩蔽阈值是与恰可察觉失真(JND)对应的值,并且当量化噪声小于掩蔽阈值时,不可察觉到感知噪声。因此,可使用掩蔽阈值计算不察觉感知噪声所需的最小的比特的数量。例如,可通过基于每个子频带使用范数值与掩蔽阈值之比来计算信号掩蔽比(SMR),并且可通过针对计算的SMR使用比特的关系来估计满足掩蔽阈值的比特的数量。虽然估计的比特的数量是不察觉感知噪声所需的最小的比特的数量,但由于在压缩方面不需要使用超过估计的数量的比特,所以估计的比特的数量可被视为基于每个子频带可容许的最大的比特的数量(以下,可容许的比特的数量)。可按照小数点为单位表示每个子频带的可容许的比特的数量。
比特估计器和分配器250可通过使用基于每个子频带的范数值按照小数点为单位执行比特分配。在这种情况下,从具有比其它子频带的范数值更大的范数值的子频带顺序地分配比特,并且可进行调整,即通过针对基于每个子频带的范数值根据每个子频带的感知重要性进行加权来将更多的比特分配给对感知重要的子频带。可通过例如ITU-TG.719中的心理-声学加权来确定感知重要性。
比特估计器和分配器250可从具有比其它子频带的范数值更大的范数值的子频带顺序地将比特分配给采样点。换句话说,首先,针对具有最大范数值的子频带分配每个采样点的比特,并且通过将具有最大范数值的子频带的范数值减小预定单位来改变具有最大范数值的子频带的优先级,以使得比特被分配给另一子频带。重复执行这个过程,直至清楚地分配了在给定帧中可容许的比特的总数B。
比特估计器和分配器250可通过针对每个子频带限制分配的比特的数量以免超过估计的比特的数量(即,可容许的比特的数量),来最后确定分配的比特的数量。对于所有子频带,将分配的比特的数量与估计的比特的数量进行比较,如果分配的比特的数量大于估计的比特的数量,则分配的比特的数量被限制为估计的比特的数量。如果作为比特数限制的结果获得的给定帧中的所有子频带的分配的比特的数量小于给定帧中可容许的比特的总数B,则与该差值对应的比特的数量可被均匀地分配给所有子频带或者根据感知重要性被非均匀地分配。
由于分配给每个子频带的比特的数量能够按照小数点为单位被确定并且被限制为可容许的比特的数量,所以可有效地分配给定帧的比特的总数。
根据示例性实施例,估计并且分配每个子频带所需的比特数量的详细方法如下。根据这种方法,由于可立刻确定分配给每个子频带的比特的数量而无需几次重复,所以可降低复杂性。
例如,通过应用由等式4表示的拉格朗日函数可获得可优化量化失真和分配给每个子频带的比特的数量的解决方案。
数学图4
[数学4]
L=D+λ(ΣNbLb-B)
在等式4中,L表示拉格朗日函数,D表示量化失真,B表示给定帧中可容许的比特的总数,Nb表示第b子频带的采样点的数量,并且Lb表示分配给第b子频带的比特的数量。也就是说,NbLb表示分配给第b子频带的比特的数量。λ表示作为优化系数的拉格朗日乘数。
通过使用等式4,可在考虑到量化失真的同时确定用于使分配给给定帧中所包括的子频带的比特的总数和给定帧的可容许的比特的数量之差最小化的Lb。
量化失真D可由等式5定义。
数学图5
[数学5]
在等式5中,xi表示输入频谱,并且表示解码的频谱。也就是说,量化失真D可被定义为任意帧中的输入频谱xi和解码的频谱的均方误差(MSE)。
等式5中的分母是由给定输入频谱确定的常数值,因此,由于等式5中的分母不影响优化,所以等式7可由等式6简化。
数学图6
[数学6]
作为输入频谱xi的第b子频带的平均频谱能量的范数值gb可由等式7定义,通过对数标度量化的范数值nb可由等式8定义,并且去量化的范数值可由等式9定义。
数学图7
[数学7]
数学图8
[数学8]
数学图9
[数学9]
在等式7中,sb和eb分别表示第b子频带的开始的采样点和最后的采样点。
如等式10,通过将输入频谱xi除以去量化的范数值来产生归一化的频谱yi,并且如等式11,通过将恢复的归一化的频谱乘以去量化的范数值来产生解码的频谱
数学图10
[数学10]
数学图11
[数学11]
可通过使用等式9至等式11根据等式12整理量化失真项。
数学图12
[数学12]
通常,从量化失真和分配的比特的数量之间的关系,定义每次每个采样增加1比特时,信噪比(SNR)增加6.02dB,并且通过使用这一点,归一化的频谱的量化失真可由等式13定义。
数学图13
[数学13]
在实际音频编码的情况下,可通过应用可根据信号特性变化的dB标度值C而非固定1比特/采样点6.025dB的关系来定义等式14。
数学图14
[数学14]
在等式14中,当C是2时,1比特/采样点对应于6.02dB,并且当C是3时,1比特/采样点对应于9.03dB。
因此,可通过等式12和等式14根据等式15表示等式6。
数学图15
[数学15]
为了从等式15获得最佳的Lb和λ,如等式16,对Lb和λ执行偏微分。
数学图16
[数学16]
当整理等式16时,Lb可由等式17表示。
数学图17
[数学17]
通过使用等式17,可在给定帧中可容许的比特的总数B的范围中估计可使输入频谱的SNR最大化的每个子频带的每个采样点的分配的比特的数量Lb。
由比特估计器和分配器250确定的基于每个子频带的分配的比特的数量可被提供给编码单元(图1的170)。
图3是根据另一示例性实施例的与图1的音频编码设备100中的比特分配单元150对应的比特分配单元300的框图。
图3的比特分配单元300可包括心理-声学模型310、比特估计器和分配器330、比例因子估计器350和比例因子编码器370。比特分配单元300的部件可被集成在至少一个模块中并且由至少一个处理器实现。
参照图3,心理-声学模型310可通过从变换单元(图1的130)接收音频频谱来获得每个子频带的掩蔽阈值。
比特估计器和分配器330可通过使用基于每个子频带的掩蔽阈值来估计感知所需要的比特的数量。也就是说,可基于每个子频带计算SMR,并且可通过针对计算的SMR使用比特的关系来估计满足掩蔽阈值的比特的数量。虽然估计的比特的数量是不察觉感知噪声所需的最小的比特的数量,但由于在压缩方面不需要使用超过估计的数量的比特,所以估计的比特的数量可被视为基于每个子频带的可容许的最大的比特的数量(以下,可容许的比特的数量)。可按照小数点为单比特表示每个子频带的可容许的比特的数量。
比特估计器和分配器330可通过使用基于每个子频带的频谱能量按照小数点为单位执行比特分配。在这种情况下,例如,利用等式7至等式20的比特分配方法可被使用。
比特估计器和分配器330针对所有子频带将分配的比特的数量与估计的比特的数量进行比较,如果分配的比特的数量大于估计的比特的数量,则分配的比特的数量被限制为估计的比特的数量。如果作为比特数限制的结果获得的给定帧中的所有子频带的分配的比特的数量小于给定帧中可容许的比特的总数B,则与该差值对应的比特的数量可被均匀地分配给所有子频带或者根据感知重要性被非均匀地分配。
比例因子估计器350可通过使用基于每个子频带最后确定的分配的比特的数量来估计比例因子。基于每个子频带估计的比例因子可被提供给编码单元(图1的170)。
比例因子编码器370可对基于每个子频带估计的比例因子进行量化和无损编码。基于每个子频带编码的比例因子可被提供给复用单元(图1的190)。
图4是根据另一示例性实施例的与图1的音频编码设备100中的比特分配单元150对应的比特分配单元400的框图。
图4的比特分配单元400可包括范数估计器410、比特估计器和分配器430、比例因子估计器450和比例因子编码器470。比特分配单元400的部件可被集成在至少一个模块中并且由至少一个处理器实现。
参照图4,范数估计器410可基于每个子频带获得与平均频谱能量对应的范数值。
比特估计器和分配器430可通过使用基于每个子频带的频谱能量来获得掩蔽阈值,并且通过使用掩蔽阈值来估计在感知上需要的比特的数量(即,可容许的比特的数量)。
比特估计器和分配器430可通过使用基于每个子频带的频谱能量按照小数点为单位执行比特分配。在这种情况下,例如,利用等式7至等式20的比特分配方法可被使用。
比特估计器和分配器430针对所有子频带将分配的比特的数量与估计的比特的数量进行比较,如果分配的比特的数量大于估计的比特的数量,则分配的比特的数量被限制为估计的比特的数量。如果作为比特数限制的结果获得的给定帧中的所有子频带的分配的比特的数量小于给定帧中可容许的比特的总数B,则与该差值对应的比特的数量可被均匀地分配给所有子频带或者根据感知重要性被非均匀地分配。
比例因子估计器450可通过使用基于每个子频带最后确定的分配的比特的数量来估计比例因子。基于每个子频带估计的比例因子可被提供给编码单元(图1的170)。
比例因子编码器470可对基于每个子频带估计的比例因子进行量化和无损编码。基于每个子频带编码的比例因子可被提供给复用单元(图1的190)。
图5是根据示例性实施例的与图1的音频编码设备100中的编码单元170对应的编码单元500的框图。
图5的编码单元500可包括频谱归一化单元510和频谱编码器530。编码单元500的部件可被集成在至少一个模块中并且由至少一个处理器实现。
参照图5,频谱归一化单元510可通过使用从比特分配单元(图1的150)提供的范数值来对频谱进行归一化。
频谱编码器530可通过使用每个子频带的分配的比特的数量来量化归一化的频谱,并且对量化结果进行无损编码。例如,阶乘脉冲编码可被用于频谱编码,但不限于此。根据阶乘脉冲编码,可在分配的比特的数量的范围内以阶乘形式表示诸如脉冲位置、脉冲大小和脉冲符号的信息。
关于由频谱编码器530编码的频谱的信息可被提供给复用单元(图1的190)。
图6是根据另一示例性实施例的音频编码设备600的框图。
图6的音频编码设备600可包括瞬态检测单元610、变换单元630、比特分配单元650、编码单元670和复用单元690。音频编码设备600的部件可被集成在至少一个模块中并且由至少一个处理器实现。由于当将图6的音频编码设备600与图1的音频编码设备100进行比较时存在差异,即图6的音频编码设备600还包括瞬态检测单元610,所以在这里省略共同部件的详细描述。
参照图6,瞬态检测单元610可通过分析音频信号来检测指示瞬态特性的间隔。各种公知方法可被用于瞬态间隔的检测。从瞬态检测单元610提供的瞬态信令信息可通过复用单元690而被包括在比特流中。
变换单元630可根据瞬态间隔检测结果确定用于变换的窗口大小,并且基于确定的窗口大小执行时域至频域的变换。例如,短窗口可被应用于检测到瞬态间隔的子频带,并且长窗口可被应用于未检测到瞬态间隔的子频带。
比特分配单元650可分别由图2的比特分配单元200、图3的比特分配单元300和图4的比特分配单元400之一实现。
编码单元670可根据瞬态间隔检测结果确定用于编码的窗口大小。
音频编码设备600可针对可选的子频带产生噪声级别并且将噪声级别提供给音频解码设备(图7的700、图12的1200或者图13的1300)。
图7是根据示例性实施例的音频解码设备700的框图。
图7的音频解码设备700可包括解复用单元710、比特分配单元730、解码单元750和逆变换单元770。音频解码设备的部件可被集成在至少一个模块中并且由至少一个处理器实现。
参照图7,解复用单元710可解复用比特流以提取量化且无损编码的范数值和关于编码的频谱的信息。
比特分配单元730可基于每个子频带从量化且无损编码的范数值获得去量化的范数值,并且通过使用去量化的范数值来确定分配的比特的数量。比特分配单元730可基本上与音频编码设备100的比特分配单元150或音频编码设备600的比特分配单元650相同地操作。当在音频编码设备100或音频编码设备600中通过心理-声学加权调整了范数值时,可由音频解码设备700以相同方式调整去量化的范数值。
解码单元750可通过使用从解复用单元710提供的关于编码的频谱的信息来对编码的频谱进行无损解码和去量化。例如,脉冲解码可被用于频谱解码。
逆变换单元770可通过将解码的频谱变换至时域来产生恢复的音频信号。
图8是根据示例性实施例的图7的音频解码设备700中的比特分配单元800的框图。
图8的比特分配单元800可包括范数解码器810以及比特估计器和分配器830。比特分配单元800的部件可被集成在至少一个模块中并且由至少一个处理器实现。
参照图8,范数解码器810可从由解复用单元(图7的710)提供的量化且无损编码的范数值获得去量化的范数值。
比特估计器和分配器830可通过使用去量化的范数值来确定分配的比特的数量。详细地讲,比特估计器和分配器830可通过使用基于每个子频带的频谱能量(即,范数值)来获得掩蔽阈值,并且通过使用掩蔽阈值来估计感知所需要的比特的数量(即,可容许的比特的数量)。
比特估计器和分配器830可通过使用基于每个子频带的频谱能量(即,范数值)按照小数点为单位执行比特分配。在这种情况下,例如,利用等式7至等式20的比特分配方法可被使用。
比特估计器和分配器830针对所有子频带将分配的比特的数量与估计的比特的数量进行比较,如果分配的比特的数量大于估计的比特的数量,则分配的比特的数量被限制为估计的比特的数量。如果作为比特数限制的结果获得的给定帧中的所有子频带的分配的比特的数量小于给定帧中可容许的比特的总数B,则与该差值对应的比特的数量可被均匀地分配给所有子频带或者根据感知重要性被非均匀地分配。
图9是根据示例性实施例的与图7的音频解码设备700中的解码单元750对应的解码单元900的框图。
图9的解码单元900可包括频谱解码器910和包络成形单元930。解码单元900的部件可被集成在至少一个模块中并且由至少一个处理器实现。
参照图9,频谱解码器910可通过使用从解复用单元(图7的710)提供的关于编码的频谱的信息和从比特分配单元(图7的730)提供的分配的比特的数量,来对编码的频谱进行无损解码和去量化。来自频谱解码器910的解码的频谱是归一化的频谱。
包络成形单元930可通过使用从比特分配单元(图7的730)提供的去量化的范数值对从频谱解码器910提供的归一化的频谱执行包络成形,来恢复在归一化之前的频谱。
图10是根据示例性实施例的与图7的音频解码设备700中的解码单元750对应的解码单元1000的框图。
图9的解码单元1000可包括频谱解码器1010、包络成形单元1030和频谱填充单元1050。解码单元1000的部件可被集成在至少一个模块中并且由至少一个处理器实现。
参照图10,频谱解码器1010可通过使用从解复用单元(图7的710)提供的关于编码的频谱的信息和从比特分配单元(图7的730)提供的分配的比特的数量,来对编码的频谱进行无损解码和去量化。来自频谱解码器1010的解码的频谱是归一化的频谱。
包络成形单元1030可通过使用从比特分配单元(图7的730)提供的去量化的范数值对从频谱解码器1010提供的归一化的频谱执行包络成形,来恢复在归一化之前的频谱。
当在从包络成形单元1030提供的频谱中存在包括去量化为0的部分的子频带时,频谱填充单元1050可在子频带中的去量化为0的部分中填充噪声分量。根据示例性实施例,可随机产生噪声分量,或者可通过复制与包括去量化为0的部分的子频带相邻的去量化为非0值的子频带的频谱或去量化为非0值的子频带的频谱来产生噪声分量。根据另一示例性实施例,可通过产生用于包括去量化为0的部分的子频带的噪声分量并且使用噪声分量的能量与从比特分配单元(图7的730)提供的去量化的范数值(即,频谱能量)之比来调整噪声分量的能量。根据另一示例性实施例,可产生用于包括去量化为0的部分的子频带的噪声分量,并且噪声分量的平均能量可被调整为1。
图11是根据另一示例性实施例的与图7的音频解码设备700中的解码单元750对应的解码单元1100的框图。
图11的解码单元1100可包括频谱解码器1110、频谱填充单元1130和包络成形单元1150。解码单元1100的部件可被集成在至少一个模块中并且由至少一个处理器实现。由于当将图11的解码单元1100与图10的解码单元1000进行比较时存在差异,即频谱填充单元1130和包络成形单元1150的布置不同,所以在这里省略共同部件的详细描述。
参照图11,当在从频谱解码器1110提供的归一化的频谱中存在包括去量化为0的部分的子频带时,频谱填充单元1130可在子频带中去量化为0的部分中填充噪声分量。在这种情况下,可使用应用于图10的频谱填充单元1050的各种噪声填充方法。优选地,对于包括去量化为0的部分的子频带,可产生噪声分量,并且噪声分量的平均能量可被调整为1。
包络成形单元1150可通过使用从比特分配单元(图7的730)提供的去量化的范数值来恢复包括填充有噪声分量的子频带的频谱的在归一化之前的频谱。
图12是根据另一示例性实施例的音频解码设备1200的框图。
图12的音频解码设备1200可包括解复用单元1210、比例因子解码器1230、频谱解码器1250和逆变换单元1270。音频解码设备1200的部件可被集成在至少一个模块中并且由至少一个处理器实现。
参照图12,解复用单元1210可解复用比特流以提取量化且无损编码的比例因子和关于编码的频谱的信息。
比例因子解码器1230可基于每个子频带对量化且无损编码的比例因子进行无损解码和去量化。
频谱解码器1250可通过使用从解复用单元1210提供的关于编码的频谱的信息和去量化的比例因子来对编码的频谱进行无损解码和去量化。频谱解码单元1250可包括与图10的解码单元1000相同的部件。
逆变换单元1270可通过将由频谱解码器1250解码的频谱变换至时域来产生恢复的音频信号。
图13是根据另一示例性实施例的音频解码设备1300的框图。
图13的音频解码设备1300可包括解复用单元1310、比特分配单元1330、解码单元1350和逆变换单元1370。音频解码设备1300的部件可被集成在至少一个模块中并且由至少一个处理器实现。
由于当将图13的音频解码设备1300与图7的音频解码设备700进行比较时存在差异,即瞬态信令信息被提供给解码单元1350和逆变换单元1370,所以在这里省略共同部件的详细描述。
参照图13,解码单元1350可通过使用从解复用单元1310提供的关于编码的频谱的信息来对频谱进行解码。在这种情况下,窗口大小可根据瞬态信令信息而不同。
逆变换单元1370可通过将解码的频谱变换至时域来产生恢复的音频信号。在这种情况下,窗口大小可根据瞬态信令信息而不同。
图14是示出根据另一示例性实施例的比特分配方法的流程图。
参照图14,在操作1410中,获取每个子频带的频谱能量,频谱能量可以是范数值。
在操作1420中,通过使用基于每个子频带的频谱能量来获取掩蔽阈值。
在操作1430中,通过使用基于每个子频带的掩蔽阈值按照小数点为单位估计可容许的比特的数量。
在操作1440中,根据基于每个子频带的频谱能量按照小数点为单位分配比特。
在操作1450中,基于每个子频带将容许的比特的数量与分配的比特的数量进行比较。
在操作1460中,如果作为操作1450中的比较的结果,对于给定子频带,分配的比特的数量大于可容许的比特的数量,则分配的比特的数量被限制为可容许的比特的数量。
在操作1470中,如果作为操作1450中的比较的结果,对于给定子频带,分配的比特的数量小于或等于可容许的比特的数量,则分配的比特的数量被按原样使用,或者通过使用在操作1460中限制的可容许的比特的数量来针对每个子频带确定最终的分配的比特的数量。
虽然未示出,但如果针对给定帧中的所有子频带在操作1470中确定的分配的比特的数量之和小于或大于给定帧中可容许的比特的总数,则与该差值对应的比特的数量可被均匀地分配给所有子频带或者根据感知重要性被非均匀地分配。
图15是示出根据另一示例性实施例的比特分配方法的流程图。
参照图15,在操作1500中,获取每个子频带的去量化的范数值。
在操作1510中,通过使用基于每个子频带的去量化的范数值来获取掩蔽阈值。
在操作1520中,通过使用基于每个子频带的掩蔽阈值来获取SMR。
在操作1530中,通过使用基于每个子频带的SMR按照小数点为单位估计可容许的比特的数量。
在操作1540中,根据基于每个子频带的频谱能量(或去量化的范数值)按照小数点为单位分配比特。
在操作1550中,基于每个子频带将可容许的比特的数量与分配的比特的数量进行比较。
在操作1560中,如果作为操作1550中的比较的结果,对于给定子频带,分配的比特的数量大于可容许的比特的数量,则分配的比特的数量被限制为可容许的比特的数量。
在操作1570中,如果作为操作1550中的比较的结果,对于给定子频带,分配的比特的数量小于或等于可容许的比特的数量,则分配的比特的数量被按原样使用,或者通过使用在操作1560中限制的可容许的比特的数量来针对每个子频带确定最终的分配的比特的数量。
虽然未示出,但如果针对给定帧中的所有子频带在操作1570中确定的分配的比特的数量之和小于或大于给定帧中容许的比特的总数,则与该差值对应的比特的数量可被均匀地分配给所有子频带或者根据感知重要性被非均匀地分配。
图16是示出根据另一示例性实施例的比特分配方法的流程图。
参照图16,在操作1610中,执行初始化。作为初始化的示例,当通过使用等式20来估计每个子频带的分配的比特的数量时,可通过针对所有子频带计算常数值
来降低整体复杂性。
在操作1620中,通过使用等式17按照小数点为单位估计每个子频带的分配的比特的数量。可通过将每个采样点的分配的比特的数量Lb乘以每个子频带的采样点的数量来获得每个子频带的分配的比特的数量。当通过使用等式17计算每个子频带的每个采样点的分配的比特的数量Lb时,Lb可具有小于0的值。在这种情况下,如等式18中一样,将0分配给具有小于0的值的Lb。
数学图18
[数学18]
结果,针对给定帧中所包括的所有子频带估计的分配的比特的数量之和可能大于给定帧中可容许的比特的数量B。
在操作1630中,将针对给定帧中所包括的所有子频带估计的分配的比特的数量之和与给定帧中可容许的比特的数量B进行比较。
在操作1640中,通过使用等式19针对每个子频带重新分配比特,直至针对给定帧中所包括的所有子频带估计的分配的比特的数量之和与给定帧中可容许的比特的数量B相同。
数学图19
[数学19]
在等式19中,
表示通过第(k-1)次重复确定的比特的数量,并且表示通过第k次重复确定的比特的数量。通过每次重复确定的比特的数量不可小于0,因此,针对具有大于0的比特的数量的子频带执行操作1640。
在操作1650中,如果作为操作1630中的比较结果,针对给定帧中所包括的所有子频带估计的分配的比特的数量之和与给定帧中可容许的比特的数量B相同,则每个子频带的分配的比特的数量被按原样使用,或者通过使用作为操作1640中的重新分配的结果而获得的每个子频带的分配的比特的数量针对每个子频带确定最终的分配的比特的数量。
图17是示出根据另一示例性实施例的比特分配方法的流程图。
参照图17,像图16的操作1610一样,在操作1710中执行初始化。像图16的操作1620一样,在操作1720中,按照小数点为单位估计每个子频带的分配的比特的数量,并且当每个子频带的每个采样点的分配的比特的数量Lb小于0时,如等式18,将0分配给具有小于0的值的Lb。
在操作1730中,根据SNR定义每个子频带所需的最小的比特的数量,并且通过将分配的比特的数量限制为最小的比特的数量来调整大于0并且小于最小的比特的数量的操作1720中的分配的比特的数量。如此,通过将每个子频带的分配的比特的数量限制为最小的比特的数量,可减小降低声音质量的可能性。例如,每个子频带所需的最小的比特的数量被定义为阶乘脉冲编码中的脉冲编码所需的最小的比特的数量。阶乘脉冲编码通过使用非0的脉冲位置、脉冲大小和脉冲符号的所有组合来表示信号。在这种情况下,可表示脉冲的所有组合的偶然数N可由等式20表示。
数学图20
[数学20]
在等式20中,2i表示针对在i个非零位置的信号可利用+/-表示的符号的偶然数。
在等式20中,F(n,i)可由等式21定义,它指示用于针对给定n个采样点(即,位置)选择i个非零位置的偶然数。
数学图21
[数学21]
在等式20中,D(m,i)可由等式22表示,它指示用于通过大小来表示在i个非零位置选择的信号的偶然数。
数学图22
[数学22]
表示N个组合所需的比特的数量M可由等式23表示。
数学图23
[数学23]
结果,对给定第b子频带中的Nb个采样点的最少1个脉冲进行编码所需的最小的比特的数量可由等式24表示。
数学图24
[数学24]
在这种情况下,用于传输量化所需的增益值的比特的数量可与阶乘脉冲编码所需的最小的比特的数量相加并且可根据比特率而不同。如等式25,可通过阶乘脉冲编码所需的最小的比特的数量和给定子频带的采样点的数量Nb之中的较大值确定基于每个子频带所需的最小的比特的数量。例如,基于每个子频带所需的最小的比特的数量可被设置为每个采样点1比特。
数学图25
[数学25]
当由于目标比特率小而导致在操作1730中将要使用的比特不够时,对于分配的比特的数量大于0并且小于最小的比特的数量的子频带,分配的比特的数量被撤销并且被调整为0。另外,对于分配的比特的数量小于等式24的分配的比特的数量的子频带,分配的比特的数量可被撤销,并且对于分配的比特的数量大于等式24的分配的比特的数量并且小于等式25的最小的比特的数量的子频带,可分配最小数量的比特。
在操作1740中,将针对给定帧中的所有子频带估计的分配的比特的数量之和与给定帧中可容许的比特的数量进行比较。
在操作1750中,针对分配了超过最小数量的比特的子频带重新分配比特,直至针对给定帧中的所有子频带估计的分配的比特的数量之和与给定帧中可容许的比特的数量相同。
在操作1760中,确定每个子频带的分配的比特的数量是否在比特重新分配的前一重复和当前重复之间改变。如果每个子频带的分配的比特的数量在比特重新分配的前一重复和当前重复之间未改变或者在针对给定帧中的所有子频带估计的分配的比特的数量之和与给定帧中可容许的比特的数量相同之前未改变,则执行操作1740至1760。
在操作1770中,如果作为操作1760中的确定的结果,每个子频带的分配的比特的数量在比特重新分配的前一重复和当前重复之间未改变,则从高子频带到低子频带顺序地撤销比特,并且执行操作1740至1760,直至满足给定帧中可容许的比特的数量。
也就是说,对于分配的比特的数量大于等式25的最小的比特的数量的子频带,在减少分配的比特的数量的同时执行调整操作,直至满足给定帧中可容许的比特的数量。另外,如果针对所有子频带,分配的比特的数量等于或小于等式25的最小的比特的数量并且分配的比特的数量之和大于给定帧中可容许的比特的数量,则可从高子频带到低子频带撤销分配的比特的数量。
根据图16和图17的比特分配方法,为了将比特分配给每个子频带,在以频谱能量或加权频谱能量的次序将初始比特分配给每个子频带之后,可立刻估计每个子频带所需的比特的数量,而无需重复几次搜索频谱能量或加权频谱能量的操作。另外,通过将比特重新分配给每个子频带直至针对给定帧中的所有子频带估计的分配的比特的数量之和与给定帧中可容许的比特的数量相同,可实现有效的比特分配。另外,通过对于任意子频带保证最小的比特的数量,可防止由于因较小数量的比特的分配而不能对足够数量的频谱采样点或脉冲进行编码所导致的频谱孔的产生。
图14至图17的方法可被编程并且可由至少一个处理装置(例如,中央处理器(CPU))执行。
图18是根据示例性实施例的包括编码模块的多媒体装置的框图。
参照图18,多媒体装置1800可包括通信单元1810和编码模块1830。另外,多媒体装置1800可还包括存储单元1850,存储单元1850用于存储作为根据音频比特流的使用进行编码的结果而获得的音频比特流。此外,多媒体装置1800可还包括麦克风1870。也就是说,存储单元1850和麦克风1870可被可选地包括。多媒体装置1800可还包括任意解码模块(未示出),例如用于执行普通解码功能的解码模块或根据示例性实施例的解码模块。编码模块1830可由至少一个处理器(例如,中央处理器(未示出))通过与多媒体装置1800中所包括的其它部件(未示出)结合为一体来实现。
通信单元1810可接收从外部提供的音频信号或编码的比特流中的至少一个,或者发送恢复的音频信号或作为由编码模块1830编码的结果而获得的编码的比特流中的至少一个。
通信单元1810被构造为通过无线网络(诸如,无线互联网、无线以太网、无线电话网络、无线局域网(LAN)、Wi-Fi、Wi-Fi直连(WFD)、第三代(3G)、第四代(4G)、蓝牙、红外数据关联(IrDA)、射频识别(RFID)、超宽带(UWB)、Zigbee或近场通信(NFC))或有线网络(诸如,有线电话网络或有线互联网)将数据发送给外部多媒体装置以及从外部多媒体装置接收数据。
根据示例性实施例,编码模块1830可通过下述操作来产生比特流:将通过通信单元1810或麦克风1870提供的时域中的音频信号变换为频域中的音频频谱,基于频带按照小数点为单位确定分配的比特的数量以使得在音频频谱的给定帧中可容许的比特的数量的范围内使存在于预定频带中的频谱的SNR最大化,调整基于频带确定的分配的比特的数量,并且通过使用基于频带和频谱能量调整的比特的数量来对音频频谱进行编码。
根据另一示例性实施例,编码模块1830可通过下述操作来产生比特流:将通过通信单元1810或麦克风1870提供的时域中的音频信号变换为频域中的音频频谱,通过使用基于音频频谱的给定帧中所包括的频带的掩蔽阈值按照小数点为单位估计可容许的比特的数量,通过使用频谱能量按照小数点为单位估计分配的比特的数量,调整分配的比特的数量以免超过可容许的比特的数量,并且通过使用基于频带和频谱能量调整的比特的数量来对音频频谱进行编码。
存储单元1850可存储由编码模块1830产生的编码的比特流。另外,存储单元1850可存储操作多媒体装置1800所需的各种程序。
麦克风1870可将来自用户或外部的音频信号提供给编码模块1830。
图19是根据示例性实施例的包括解码模块的多媒体装置的框图。
图19的多媒体装置1900可包括通信单元1910和解码模块1930。另外,根据作为解码结果而获得的恢复的音频信号的使用,图19的多媒体装置1900可还包括存储单元1950,存储单元1950用于存储恢复的音频信号。另外,图19的多媒体装置1900可还包括扬声器1970。也就是说,存储单元1950和扬声器1970是可选的。图19的多媒体装置1900可还包括编码模块(未示出),例如用于执行普通编码功能的编码模块或根据示例性实施例的编码模块。解码模块1930可与多媒体装置1900中所包括的其它部件(未示出)结合在一起并且由至少一个处理器(例如,中央处理器(CPU))实现。
参照图19,通信单元1910可接收从外部提供的音频信号或编码的比特流中的至少一个,或者可发送作为解码模块1930的解码结果而获得的恢复的音频信号或作为编码结果而获得的音频比特流中的至少一个。可基本上类似于图18的通信单元1810而实现通信单元1910。
根据示例性实施例,解码模块1930可通过下述操作来产生恢复的音频信号:接收通过通信单元1910提供的比特流,基于频带按照小数点为单位确定分配的比特的数量以使得在给定帧中可容许的比特的数量的范围内使存在于每个频带中的频谱的SNR最大化,调整基于频带确定的分配的比特的数量,通过使用基于频带和频谱能量调整的比特的数量来对比特流中所包括的音频频谱进行解码,并且将解码的音频频谱变换为时域中的音频信号。
根据另一示例性实施例,解码模块1930可通过下述操作来产生比特流:接收通过通信单元1910提供的比特流,通过使用基于给定帧中所包括的频带的掩蔽阈值按照小数点为单位估计分配的比特的数量,通过使用频谱能量按照小数点为单位估计分配的比特的数量,调整分配的比特的数量以免超过可容许的比特的数量,通过使用基于频带和频谱能量调整的比特的数量来对比特流中所包括的音频频谱进行解码,并且将解码的音频频谱变换为时域中的音频信号。
存储单元1950可存储由解码模块1930产生的恢复的音频信号。另外,存储单元1950可存储操作多媒体装置1900所需的各种程序。
扬声器1970可将由解码模块1930产生的恢复的音频信号输出到外部。
图20是根据示例性实施例的包括编码模块和解码模块的多媒体装置的框图。
图20中示出的多媒体装置2000可包括通信单元2010、编码模块2020和解码模块2030。另外,多媒体装置2000可还包括存储单元2040,存储单元2040用于根据作为编码结果的音频比特流的使用存储所述音频比特流或根据作为解码结果的恢复的音频信号的使用存储所述恢复的音频信号。另外,多媒体装置2000可还包括麦克风2050和/或扬声器2060。编码模块2020和解码模块2030可由至少一个处理器(例如,中央处理器(CPU)(未示出))通过与多媒体装置2000中所包括的其它部件(未示出)结合为一体来实现。
由于图20中示出的多媒体装置2000的部件对应于图18中示出的多媒体装置1800的部件或图19中示出的多媒体装置1900的部件,所以省略其详细描述。
图18中示出的多媒体装置1800、图19中示出的多媒体装置1900和图20中示出的多媒体装置2000的中的每一个可包括仅语音通信终端(诸如,电话或移动电话)、仅广播或音乐装置(诸如,TV或MP3播放器)或者仅语音通信终端和仅广播或音乐装置的混合终端装置,但不限于此。另外,多媒体装置1800、1900和2000的中的每一个可被用作客户机、服务器或在客户机和服务器之间转换的变换器。
当多媒体装置1800、1900或2000是例如移动电话时,虽然未示出,但多媒体装置1800、1900或2000可还包括:用户输入单元,诸如键区;显示单元,用于显示由用户界面或移动电话处理的信息;和处理器,用于控制移动电话的功能。另外,移动电话可还包括:相机单元,具有图像拾取功能;和用于执行移动电话所需的功能的至少一个部件。
当多媒体装置1800、1900或2000是例如TV时,虽然未示出,但多媒体装置1800、1900或2000可还包括:用户输入单元,诸如键区;显示单元,用于显示接收的广播信息;和处理器,用于控制TV的所有功能。另外,TV可还包括用于执行TV的功能的至少一个部件。
根据示例性实施例的方法可被编写为计算机程序并且可被实现在使用计算机可读记录介质执行程序的通用数字计算机中。另外,可在示例性实施例中使用的数据结构、程序命令或数据文件可被以各种方式记录在计算机可读记录介质中。计算机可读记录介质是任何可存储随后可由计算机系统读取的数据的数据存储装置。计算机可读记录介质的示例包括磁介质(诸如,硬盘、软盘和磁带)、光学介质(诸如,CD-ROM和DVD)、磁光介质(诸如,光软盘)和专门被构造为存储并且执行程序命令的硬件装置(诸如,ROM、RAM和闪存)。另外,计算机可读记录介质可以是用于传输指示程序命令和数据结构的信号的传输介质。程序命令可包括由编译器编辑的机器语言代码和可由计算机使用解释器执行的高级语言代码。
尽管已参照本发明构思的示例性实施例具体示出并描述了本发明构思,但本领域普通技术人员将会理解,在不脱离由权利要求限定的本发明构思的精神和范围的情况下,可对其做出各种形式和细节上的修改。
Claims (14)
1.一种比特分配方法,包括:
基于从时域到频域的变换,产生包括音频和语音中的至少一个的信号的频谱;
考虑对于帧的可容许的比特,以分数的形式估计将被分配给所述频谱的帧中的子频带的比特;
当估计出的子频带的比特是非零个比特时,基于最少比特限制将估计出的比特重新分配给具有非零个比特的子频带,以将比特分配给子频带。
2.如权利要求1所述的方法,其中,重新分配的步骤包括:当所分配的比特少于对子频带设置的预定最少比特时,将所分配的比特设置为零。
3.如权利要求1所述的方法,其中,重新分配的步骤包括:基于对子频带设置的预定最少比特,限制所分配的比特。
4.如权利要求1所述的方法,其中,重新分配的步骤包括:当所分配的比特少于对子频带设置的预定最少比特时,将所分配的比特设置为所述预定最少比特。
5.如权利要求1所述的方法,其中,重新分配的步骤是基于较高频带的所分配的比特来执行的。
6.如权利要求1所述的方法,还包括:使用所分配的比特对子频带的频谱数据进行编码。
7.如权利要求1所述的方法,还包括:使用所分配的比特对子频带的频谱数据进行解码。
8.一种比特分配设备,包括:
至少一个处理装置,被配置为:
基于从时域到频域的变换,产生包括音频和语音中的至少一个的信号的频谱;
考虑对于帧的可容许的比特,以分数的形式估计将被分配给所述频谱的帧中的子频带的比特;
当估计出的子频带的比特是非零个比特时,基于最少比特限制将估计出的比特重新分配给具有非零个比特的子频带,以将比特分配给子频带。
9.如权利要求8所述的设备,其中,所述处理装置被配置为当所分配的比特少于对子频带设置的预定最少比特时,通过将所分配的比特设置为零来对估计出的比特进行重新分配。
10.如权利要求8所述的设备,其中,所述处理装置被配置为通过基于对子频带设置的预定最少比特限制所分配的比特来对估计出的比特进行重新分配。
11.如权利要求8所述的设备,其中,所述处理装置被配置为当所分配的比特少于对子频带设置的预定最少比特时,通过将所分配的比特设置为所述预定最少比特来对估计出的比特进行重新分配。
12.如权利要求8所述的设备,其中,所述处理装置被配置为基于较高频带的所分配的比特来对估计出的比特进行重新分配。
13.如权利要求8所述的设备,其中,所述处理装置还被配置为使用所分配的比特对子频带的频谱数据进行编码。
14.如权利要求8所述的设备,其中,所述处理装置还被配置为使用所分配的比特对子频带的频谱数据进行解码。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161485741P | 2011-05-13 | 2011-05-13 | |
US61/485,741 | 2011-05-13 | ||
US201161495014P | 2011-06-09 | 2011-06-09 | |
US61/495,014 | 2011-06-09 | ||
CN201280034734.0A CN103650038B (zh) | 2011-05-13 | 2012-05-14 | 比特分配、音频编码和解码 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280034734.0A Division CN103650038B (zh) | 2011-05-13 | 2012-05-14 | 比特分配、音频编码和解码 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105825858A true CN105825858A (zh) | 2016-08-03 |
CN105825858B CN105825858B (zh) | 2020-02-14 |
Family
ID=47141906
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610341675.1A Active CN105825859B (zh) | 2011-05-13 | 2012-05-14 | 比特分配、音频编码和解码 |
CN201610341124.5A Active CN105825858B (zh) | 2011-05-13 | 2012-05-14 | 比特分配、音频编码和解码 |
CN201280034734.0A Active CN103650038B (zh) | 2011-05-13 | 2012-05-14 | 比特分配、音频编码和解码 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610341675.1A Active CN105825859B (zh) | 2011-05-13 | 2012-05-14 | 比特分配、音频编码和解码 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280034734.0A Active CN103650038B (zh) | 2011-05-13 | 2012-05-14 | 比特分配、音频编码和解码 |
Country Status (15)
Country | Link |
---|---|
US (7) | US9236057B2 (zh) |
EP (5) | EP2707874A4 (zh) |
JP (3) | JP6189831B2 (zh) |
KR (7) | KR102053900B1 (zh) |
CN (3) | CN105825859B (zh) |
AU (3) | AU2012256550B2 (zh) |
BR (1) | BR112013029347B1 (zh) |
CA (1) | CA2836122C (zh) |
MX (3) | MX337772B (zh) |
MY (2) | MY186720A (zh) |
RU (2) | RU2648595C2 (zh) |
SG (1) | SG194945A1 (zh) |
TW (5) | TWI562133B (zh) |
WO (2) | WO2012157931A2 (zh) |
ZA (1) | ZA201309406B (zh) |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100266989A1 (en) | 2006-11-09 | 2010-10-21 | Klox Technologies Inc. | Teeth whitening compositions and methods |
KR102053900B1 (ko) | 2011-05-13 | 2019-12-09 | 삼성전자주식회사 | 노이즈 필링방법, 오디오 복호화방법 및 장치, 그 기록매체 및 이를 채용하는 멀티미디어 기기 |
EP2728577A4 (en) | 2011-06-30 | 2016-07-27 | Samsung Electronics Co Ltd | APPARATUS AND METHOD FOR GENERATING A BANDWIDTH EXTENSION SIGNAL |
US8586847B2 (en) * | 2011-12-02 | 2013-11-19 | The Echo Nest Corporation | Musical fingerprinting based on onset intervals |
US11116841B2 (en) | 2012-04-20 | 2021-09-14 | Klox Technologies Inc. | Biophotonic compositions, kits and methods |
CN105976824B (zh) * | 2012-12-06 | 2021-06-08 | 华为技术有限公司 | 信号解码的方法和设备 |
KR102200643B1 (ko) | 2012-12-13 | 2021-01-08 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | 음성 음향 부호화 장치, 음성 음향 복호 장치, 음성 음향 부호화 방법 및 음성 음향 복호 방법 |
CN103107863B (zh) * | 2013-01-22 | 2016-01-20 | 深圳广晟信源技术有限公司 | 一种分段平均码率的数字音频信源编码方法及装置 |
KR101757347B1 (ko) * | 2013-01-29 | 2017-07-26 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. | 지각적 변환 오디오 코딩에서의 노이즈 채움 |
US20140276354A1 (en) | 2013-03-14 | 2014-09-18 | Klox Technologies Inc. | Biophotonic materials and uses thereof |
CN108198564B (zh) | 2013-07-01 | 2021-02-26 | 华为技术有限公司 | 信号编码和解码方法以及设备 |
EP3614381A1 (en) * | 2013-09-16 | 2020-02-26 | Samsung Electronics Co., Ltd. | Signal encoding method and device and signal decoding method and device |
CA2927990C (en) * | 2013-10-31 | 2018-08-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain |
CN111370008B (zh) | 2014-02-28 | 2024-04-09 | 弗朗霍弗应用研究促进协会 | 解码装置、编码装置、解码方法、编码方法、终端装置、以及基站装置 |
CN106409300B (zh) | 2014-03-19 | 2019-12-24 | 华为技术有限公司 | 用于信号处理的方法和装置 |
CN111710342B (zh) * | 2014-03-31 | 2024-04-16 | 弗朗霍弗应用研究促进协会 | 编码装置、解码装置、编码方法、解码方法及程序 |
CN105336339B (zh) | 2014-06-03 | 2019-05-03 | 华为技术有限公司 | 一种语音频信号的处理方法和装置 |
US9361899B2 (en) * | 2014-07-02 | 2016-06-07 | Nuance Communications, Inc. | System and method for compressed domain estimation of the signal to noise ratio of a coded speech signal |
EP2980792A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an enhanced signal using independent noise-filling |
CN111968656B (zh) | 2014-07-28 | 2023-11-10 | 三星电子株式会社 | 信号编码方法和装置以及信号解码方法和装置 |
EP3208800A1 (en) * | 2016-02-17 | 2017-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for stereo filing in multichannel coding |
CN105957533B (zh) * | 2016-04-22 | 2020-11-10 | 杭州微纳科技股份有限公司 | 语音压缩方法、语音解压方法及音频编码器、音频解码器 |
CN106782608B (zh) * | 2016-12-10 | 2019-11-05 | 广州酷狗计算机科技有限公司 | 噪声检测方法及装置 |
CN108174031B (zh) * | 2017-12-26 | 2020-12-01 | 上海展扬通信技术有限公司 | 一种音量调节方法、终端设备及计算机可读存储介质 |
US10950251B2 (en) * | 2018-03-05 | 2021-03-16 | Dts, Inc. | Coding of harmonic signals in transform-based audio codecs |
US10586546B2 (en) | 2018-04-26 | 2020-03-10 | Qualcomm Incorporated | Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding |
US10580424B2 (en) * | 2018-06-01 | 2020-03-03 | Qualcomm Incorporated | Perceptual audio coding as sequential decision-making problems |
US10734006B2 (en) | 2018-06-01 | 2020-08-04 | Qualcomm Incorporated | Audio coding based on audio pattern recognition |
CN108833324B (zh) * | 2018-06-08 | 2020-11-27 | 天津大学 | 一种基于时域限幅噪声消除的haco-ofdm系统接收方法 |
CN108922556B (zh) * | 2018-07-16 | 2019-08-27 | 百度在线网络技术(北京)有限公司 | 声音处理方法、装置及设备 |
WO2020207593A1 (en) * | 2019-04-11 | 2020-10-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, apparatus for determining a set of values defining characteristics of a filter, methods for providing a decoded audio representation, methods for determining a set of values defining characteristics of a filter and computer program |
CN110265043B (zh) * | 2019-06-03 | 2021-06-01 | 同响科技股份有限公司 | 自适应有损或无损的音频压缩和解压缩演算方法 |
CN114514575A (zh) | 2019-11-01 | 2022-05-17 | 三星电子株式会社 | 集线器装置、包括集线器装置和多个装置的多装置系统以及集线器装置和多装置系统的操作方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0591061A (ja) * | 1991-09-30 | 1993-04-09 | Sony Corp | オーデイオ信号処理方法 |
JPH05114863A (ja) * | 1991-08-27 | 1993-05-07 | Sony Corp | 高能率符号化装置及び復号化装置 |
JPH09214355A (ja) * | 1996-01-30 | 1997-08-15 | Sony Corp | 信号符号化方法 |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
CN1457482A (zh) * | 2001-02-09 | 2003-11-19 | 索尼株式会社 | 信号再生设备和方法,信号记录设备和方法,信号接收设备以及信息处理方法 |
CN1462429A (zh) * | 2001-05-08 | 2003-12-17 | 皇家菲利浦电子有限公司 | 声频编码 |
JP2005265865A (ja) * | 2004-02-16 | 2005-09-29 | Matsushita Electric Ind Co Ltd | オーディオ符号化のためのビット割り当て方法及び装置 |
CN1780278A (zh) * | 2004-11-19 | 2006-05-31 | 松下电器产业株式会社 | 子载波通信系统中自适应调制与编码方法和设备 |
CN1957398A (zh) * | 2004-02-18 | 2007-05-02 | 沃伊斯亚吉公司 | 在基于代数码激励线性预测/变换编码激励的音频压缩期间低频加重的方法和设备 |
US20070244699A1 (en) * | 2006-03-28 | 2007-10-18 | Sony Corporation | Audio signal encoding method, program of audio signal encoding method, recording medium having program of audio signal encoding method recorded thereon, and audio signal encoding device |
Family Cites Families (63)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4899384A (en) * | 1986-08-25 | 1990-02-06 | Ibm Corporation | Table controlled dynamic bit allocation in a variable rate sub-band speech coder |
JPH03181232A (ja) | 1989-12-11 | 1991-08-07 | Toshiba Corp | 可変レート符号化方式 |
JP2560873B2 (ja) * | 1990-02-28 | 1996-12-04 | 日本ビクター株式会社 | 直交変換符号化復号化方法 |
JPH0414355A (ja) | 1990-05-08 | 1992-01-20 | Matsushita Electric Ind Co Ltd | 構内交換機のリンガ信号送出方法 |
JPH04168500A (ja) * | 1990-10-31 | 1992-06-16 | Sanyo Electric Co Ltd | 信号符号化方法 |
EP0559348A3 (en) * | 1992-03-02 | 1993-11-03 | AT&T Corp. | Rate control loop processor for perceptual encoder/decoder |
JP3153933B2 (ja) * | 1992-06-16 | 2001-04-09 | ソニー株式会社 | データ符号化装置及び方法並びにデータ復号化装置及び方法 |
JPH06348294A (ja) * | 1993-06-04 | 1994-12-22 | Sanyo Electric Co Ltd | 帯域分割符号化装置 |
US5893065A (en) * | 1994-08-05 | 1999-04-06 | Nippon Steel Corporation | Apparatus for compressing audio data |
TW271524B (zh) | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
KR0144011B1 (ko) * | 1994-12-31 | 1998-07-15 | 김주용 | 엠펙 오디오 데이타 고속 비트 할당 및 최적 비트 할당 방법 |
DE19638997B4 (de) * | 1995-09-22 | 2009-12-10 | Samsung Electronics Co., Ltd., Suwon | Digitales Toncodierungsverfahren und digitale Toncodierungsvorrichtung |
JP3181232B2 (ja) | 1996-12-19 | 2001-07-03 | 立川ブラインド工業株式会社 | ロールブラインドのスクリーン取付装置 |
JP3328532B2 (ja) * | 1997-01-22 | 2002-09-24 | シャープ株式会社 | デジタルデータの符号化方法 |
KR100261254B1 (ko) * | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치 |
JP3802219B2 (ja) * | 1998-02-18 | 2006-07-26 | 富士通株式会社 | 音声符号化装置 |
JP3515903B2 (ja) * | 1998-06-16 | 2004-04-05 | 松下電器産業株式会社 | オーディオ符号化のための動的ビット割り当て方法及び装置 |
JP4168500B2 (ja) | 1998-11-04 | 2008-10-22 | 株式会社デンソー | 半導体装置およびその実装方法 |
JP2000148191A (ja) * | 1998-11-06 | 2000-05-26 | Matsushita Electric Ind Co Ltd | ディジタルオーディオ信号の符号化装置 |
TW477119B (en) * | 1999-01-28 | 2002-02-21 | Winbond Electronics Corp | Byte allocation method and device for speech synthesis |
JP2000293199A (ja) * | 1999-04-05 | 2000-10-20 | Nippon Columbia Co Ltd | 音声符号化方法および記録再生装置 |
US6687663B1 (en) * | 1999-06-25 | 2004-02-03 | Lake Technology Limited | Audio processing method and apparatus |
US6691082B1 (en) | 1999-08-03 | 2004-02-10 | Lucent Technologies Inc | Method and system for sub-band hybrid coding |
JP2002006895A (ja) * | 2000-06-20 | 2002-01-11 | Fujitsu Ltd | ビット割当装置および方法 |
JP4055336B2 (ja) * | 2000-07-05 | 2008-03-05 | 日本電気株式会社 | 音声符号化装置及びそれに用いる音声符号化方法 |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
KR100462611B1 (ko) * | 2002-06-27 | 2004-12-20 | 삼성전자주식회사 | 하모닉 성분을 이용한 오디오 코딩방법 및 장치 |
US7272566B2 (en) * | 2003-01-02 | 2007-09-18 | Dolby Laboratories Licensing Corporation | Reducing scale factor transmission cost for MPEG-2 advanced audio coding (AAC) using a lattice based post processing technique |
FR2849727B1 (fr) * | 2003-01-08 | 2005-03-18 | France Telecom | Procede de codage et de decodage audio a debit variable |
JP2005202248A (ja) * | 2004-01-16 | 2005-07-28 | Fujitsu Ltd | オーディオ符号化装置およびオーディオ符号化装置のフレーム領域割り当て回路 |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
KR100695125B1 (ko) * | 2004-05-28 | 2007-03-14 | 삼성전자주식회사 | 디지털 신호 부호화/복호화 방법 및 장치 |
US7725313B2 (en) * | 2004-09-13 | 2010-05-25 | Ittiam Systems (P) Ltd. | Method, system and apparatus for allocating bits in perceptual audio coders |
US7979721B2 (en) * | 2004-11-15 | 2011-07-12 | Microsoft Corporation | Enhanced packaging for PC security |
KR100657948B1 (ko) * | 2005-02-03 | 2006-12-14 | 삼성전자주식회사 | 음성향상장치 및 방법 |
DE202005010080U1 (de) | 2005-06-27 | 2006-11-09 | Pfeifer Holding Gmbh & Co. Kg | Verbindungsvorrichtung |
US7562021B2 (en) * | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
US7734053B2 (en) * | 2005-12-06 | 2010-06-08 | Fujitsu Limited | Encoding apparatus, encoding method, and computer product |
US8332216B2 (en) * | 2006-01-12 | 2012-12-11 | Stmicroelectronics Asia Pacific Pte., Ltd. | System and method for low power stereo perceptual audio coding using adaptive masking threshold |
JP5114863B2 (ja) * | 2006-04-11 | 2013-01-09 | 横浜ゴム株式会社 | 空気入りタイヤおよび空気入りタイヤの組立方法 |
SG136836A1 (en) * | 2006-04-28 | 2007-11-29 | St Microelectronics Asia | Adaptive rate control algorithm for low complexity aac encoding |
JP4823001B2 (ja) * | 2006-09-27 | 2011-11-24 | 富士通セミコンダクター株式会社 | オーディオ符号化装置 |
US7953595B2 (en) * | 2006-10-18 | 2011-05-31 | Polycom, Inc. | Dual-transform coding of audio signals |
KR101291672B1 (ko) * | 2007-03-07 | 2013-08-01 | 삼성전자주식회사 | 노이즈 신호 부호화 및 복호화 장치 및 방법 |
PT2186089T (pt) * | 2007-08-27 | 2019-01-10 | Ericsson Telefon Ab L M | Método e dispositivo para descodificação espetral percetual de um sinal áudio que inclui preenchimento de buracos espetrais |
ATE535904T1 (de) * | 2007-08-27 | 2011-12-15 | Ericsson Telefon Ab L M | Verbesserte transformationskodierung von sprach- und audiosignalen |
CN101239368A (zh) | 2007-09-27 | 2008-08-13 | 骆立波 | 异型盖整平模具及其整平方法 |
WO2009049895A1 (en) * | 2007-10-17 | 2009-04-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding using downmix |
US8527265B2 (en) * | 2007-10-22 | 2013-09-03 | Qualcomm Incorporated | Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs |
EP2077551B1 (en) * | 2008-01-04 | 2011-03-02 | Dolby Sweden AB | Audio encoder and decoder |
US8831936B2 (en) * | 2008-05-29 | 2014-09-09 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement |
US8364471B2 (en) * | 2008-11-04 | 2013-01-29 | Lg Electronics Inc. | Apparatus and method for processing a time domain audio signal with a noise filling flag |
US8463599B2 (en) * | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
CN102222505B (zh) * | 2010-04-13 | 2012-12-19 | 中兴通讯股份有限公司 | 可分层音频编解码方法系统及瞬态信号可分层编解码方法 |
EP2561508A1 (en) * | 2010-04-22 | 2013-02-27 | Qualcomm Incorporated | Voice activity detection |
CN101957398B (zh) | 2010-09-16 | 2012-11-28 | 河北省电力研究院 | 一种基于机电与电磁暂态混合仿真技术检测计算电网一次时间常数的方法 |
JP5609591B2 (ja) * | 2010-11-30 | 2014-10-22 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
FR2969805A1 (fr) * | 2010-12-23 | 2012-06-29 | France Telecom | Codage bas retard alternant codage predictif et codage par transformee |
EP2975611B1 (en) * | 2011-03-10 | 2018-01-10 | Telefonaktiebolaget LM Ericsson (publ) | Filling of non-coded sub-vectors in transform coded audio signals |
JP5648123B2 (ja) * | 2011-04-20 | 2015-01-07 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 音声音響符号化装置、音声音響復号装置、およびこれらの方法 |
KR102053900B1 (ko) * | 2011-05-13 | 2019-12-09 | 삼성전자주식회사 | 노이즈 필링방법, 오디오 복호화방법 및 장치, 그 기록매체 및 이를 채용하는 멀티미디어 기기 |
US8731949B2 (en) * | 2011-06-30 | 2014-05-20 | Zte Corporation | Method and system for audio encoding and decoding and method for estimating noise level |
RU2505921C2 (ru) * | 2012-02-02 | 2014-01-27 | Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." | Способ и устройство кодирования и декодирования аудиосигналов (варианты) |
-
2012
- 2012-05-14 KR KR1020120051071A patent/KR102053900B1/ko active IP Right Grant
- 2012-05-14 MX MX2015005615A patent/MX337772B/es unknown
- 2012-05-14 JP JP2014511291A patent/JP6189831B2/ja active Active
- 2012-05-14 SG SG2013084173A patent/SG194945A1/en unknown
- 2012-05-14 TW TW101117139A patent/TWI562133B/zh active
- 2012-05-14 CN CN201610341675.1A patent/CN105825859B/zh active Active
- 2012-05-14 US US13/471,020 patent/US9236057B2/en active Active
- 2012-05-14 RU RU2013155482A patent/RU2648595C2/ru active
- 2012-05-14 EP EP12785222.6A patent/EP2707874A4/en not_active Ceased
- 2012-05-14 AU AU2012256550A patent/AU2012256550B2/en active Active
- 2012-05-14 KR KR1020120051070A patent/KR102053899B1/ko active IP Right Grant
- 2012-05-14 RU RU2018108586A patent/RU2705052C2/ru active
- 2012-05-14 BR BR112013029347-0A patent/BR112013029347B1/pt active IP Right Grant
- 2012-05-14 MX MX2016003429A patent/MX345963B/es unknown
- 2012-05-14 WO PCT/KR2012/003776 patent/WO2012157931A2/en active Application Filing
- 2012-05-14 WO PCT/KR2012/003777 patent/WO2012157932A2/en active Application Filing
- 2012-05-14 TW TW105133790A patent/TWI606441B/zh active
- 2012-05-14 EP EP12786182.1A patent/EP2707875A4/en not_active Ceased
- 2012-05-14 MY MYPI2017001633A patent/MY186720A/en unknown
- 2012-05-14 US US13/471,046 patent/US9159331B2/en active Active
- 2012-05-14 EP EP18158653.8A patent/EP3346465A1/en not_active Ceased
- 2012-05-14 CN CN201610341124.5A patent/CN105825858B/zh active Active
- 2012-05-14 MY MYPI2013004216A patent/MY164164A/en unknown
- 2012-05-14 MX MX2013013261A patent/MX2013013261A/es active IP Right Grant
- 2012-05-14 TW TW106103488A patent/TWI604437B/zh active
- 2012-05-14 EP EP18170208.5A patent/EP3385949A1/en active Pending
- 2012-05-14 TW TW105133789A patent/TWI576829B/zh active
- 2012-05-14 EP EP21193627.3A patent/EP3937168A1/en active Pending
- 2012-05-14 CN CN201280034734.0A patent/CN103650038B/zh active Active
- 2012-05-14 CA CA2836122A patent/CA2836122C/en active Active
- 2012-05-14 TW TW101117138A patent/TWI562132B/zh active
-
2013
- 2013-12-12 ZA ZA2013/09406A patent/ZA201309406B/en unknown
-
2015
- 2015-10-09 US US14/879,739 patent/US9489960B2/en active Active
- 2015-12-11 US US14/966,043 patent/US9711155B2/en active Active
-
2016
- 2016-11-07 US US15/330,779 patent/US9773502B2/en active Active
- 2016-11-23 AU AU2016262702A patent/AU2016262702B2/en active Active
-
2017
- 2017-05-10 JP JP2017094252A patent/JP2017194690A/ja not_active Ceased
- 2017-07-17 US US15/651,764 patent/US10276171B2/en active Active
- 2017-09-25 US US15/714,428 patent/US10109283B2/en active Active
-
2018
- 2018-01-16 AU AU2018200360A patent/AU2018200360B2/en active Active
-
2019
- 2019-04-18 JP JP2019079583A patent/JP6726785B2/ja active Active
- 2019-12-03 KR KR1020190159358A patent/KR102209073B1/ko active IP Right Grant
- 2019-12-03 KR KR1020190159364A patent/KR102193621B1/ko active IP Right Grant
-
2020
- 2020-12-15 KR KR1020200175854A patent/KR102284106B1/ko active IP Right Grant
-
2021
- 2021-01-22 KR KR1020210009642A patent/KR102409305B1/ko active IP Right Grant
-
2022
- 2022-01-03 KR KR1020220000533A patent/KR102491547B1/ko active IP Right Grant
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05114863A (ja) * | 1991-08-27 | 1993-05-07 | Sony Corp | 高能率符号化装置及び復号化装置 |
JPH0591061A (ja) * | 1991-09-30 | 1993-04-09 | Sony Corp | オーデイオ信号処理方法 |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
JPH09214355A (ja) * | 1996-01-30 | 1997-08-15 | Sony Corp | 信号符号化方法 |
CN1457482A (zh) * | 2001-02-09 | 2003-11-19 | 索尼株式会社 | 信号再生设备和方法,信号记录设备和方法,信号接收设备以及信息处理方法 |
CN1462429A (zh) * | 2001-05-08 | 2003-12-17 | 皇家菲利浦电子有限公司 | 声频编码 |
JP2005265865A (ja) * | 2004-02-16 | 2005-09-29 | Matsushita Electric Ind Co Ltd | オーディオ符号化のためのビット割り当て方法及び装置 |
CN1957398A (zh) * | 2004-02-18 | 2007-05-02 | 沃伊斯亚吉公司 | 在基于代数码激励线性预测/变换编码激励的音频压缩期间低频加重的方法和设备 |
CN1780278A (zh) * | 2004-11-19 | 2006-05-31 | 松下电器产业株式会社 | 子载波通信系统中自适应调制与编码方法和设备 |
US20070244699A1 (en) * | 2006-03-28 | 2007-10-18 | Sony Corporation | Audio signal encoding method, program of audio signal encoding method, recording medium having program of audio signal encoding method recorded thereon, and audio signal encoding device |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105825858A (zh) | 比特分配、音频编码和解码 | |
KR102154741B1 (ko) | 오디오 부호화방법 및 장치, 오디오 복호화방법 및 장치, 그 기록매체 및 이를 채용하는 멀티미디어 기기 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |