CN103650038B - 比特分配、音频编码和解码 - Google Patents

比特分配、音频编码和解码 Download PDF

Info

Publication number
CN103650038B
CN103650038B CN201280034734.0A CN201280034734A CN103650038B CN 103650038 B CN103650038 B CN 103650038B CN 201280034734 A CN201280034734 A CN 201280034734A CN 103650038 B CN103650038 B CN 103650038B
Authority
CN
China
Prior art keywords
bit
band
sub
distribution
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201280034734.0A
Other languages
English (en)
Other versions
CN103650038A (zh
Inventor
金美英
安顿·普波沃
吴殷美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Priority to CN201610341675.1A priority Critical patent/CN105825859B/zh
Priority to CN201610341124.5A priority patent/CN105825858B/zh
Publication of CN103650038A publication Critical patent/CN103650038A/zh
Application granted granted Critical
Publication of CN103650038B publication Critical patent/CN103650038B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

提供一种比特分配方法,所述方法包括:基于每个频带按照小数点为单位确定分配的比特的数量以使得在给定帧的可容许的比特的数量的范围内使存在于预定频带中的频谱的信噪比(SNR)最大化;以及基于每个频带调整分配的比特的数量。

Description

比特分配、音频编码和解码
技术领域
与本公开一致的设备、装置和制品涉及音频编码和解码,更具体地讲,涉及一种用于基于子频带有效地将比特分配给对感知重要的频率区域的方法和设备、音频编码方法和设备、音频解码方法和设备、记录介质和采用上述方法和设备以及记录介质的多媒体装置。
背景技术
当音频信号被编码或解码时,需要有效地使用有限数量的比特以在有限数量的比特的范围中恢复具有最好的声音质量的音频信号。特别地,在低比特率,对音频信号进行编码和解码的技术需要均匀地将比特分配给在感觉上重要的频谱分量而非将比特集中于特定频率区域。
特别地,在低比特率,当在将比特分配给每个频带(诸如,子频带)的情况下执行编码时,可由于因为比特的数量不足没被编码的频率分量而产生频谱孔(spectralhole),由此导致声音质量的降低。
发明内容
技术问题
一方面在于提供一种用于基于子频带有效地将比特分配给在感觉上重要的频率区域的方法和设备、音频编码方法和设备、音频解码方法和设备、记录介质和采用上述方法和设备以及记录介质的多媒体装置。
一方面在于提供一种用于基于子频带以低复杂性有效地将比特分配给在感觉上重要的频率区域的方法和设备、音频编码方法和设备、音频解码方法和设备、记录介质和采用上述方法和设备以及记录介质的多媒体装置。
问题的解决方案
根据一个或多个示例性实施例的一方面,提供一种比特分配方法,所述比特分配方法包括:基于每个频带按照小数点为单位确定分配的比特的数量以使得在给定帧的可容许的比特的数量的范围内使存在于预定频带中的频谱的信噪比(SNR)最大化;以及基于每个频带调整分配的比特的数量。
根据一个或多个示例性实施例的另一方面,提供一种比特分配设备,所述比特分配设备包括:变换单元,将时域中的音频信号变换为频域中的音频频谱;和比特分配单元,通过使用基于音频频谱中的给定帧中所包括的频带的掩蔽阈值按照小数点为单位估计可容许的比特的数量,通过使用频谱能量按照小数点为单位估计分配的比特的数量,并且调整分配的比特的数量以免超过可容许的比特的数量。
根据一个或多个示例性实施例的另一方面,提供一种音频编码设备,所述音频编码设备包括:变换单元,将时域中的音频信号变换为频域中的音频频谱;比特分配单元,基于每个频带按照小数点为单位确定分配的比特的数量以使得在音频频谱的给定帧的可容许的比特的数量的范围内使存在于预定频带中的频谱的信噪比(SNR)最大化,并且调整基于每个频带确定的分配的比特的数量;和编码单元,通过使用基于每个频带和频谱能量调整的比特的数量来对音频频谱进行编码。
根据一个或多个示例性实施例的另一方面,提供一种音频解码设备,所述音频编码设备包括:变换单元,将时域中的音频信号变换为频域中的音频频谱;比特分配单元,基于每个频带按照小数点为单位确定分配的比特的数量以使得在音频频谱的给定帧的可容许的比特的数量的范围内使存在于预定频带中的频谱的信噪比(SNR)最大化,并且调整基于每个频带确定的分配的比特的数量;和编码单元,通过使用基于每个频带和频谱能量调整的比特的数量来对音频频谱进行编码。
根据一个或多个示例性实施例的另一方面,提供一种音频解码设备,所述音频解码设备包括:比特分配单元,通过使用基于给定帧中所包括的频带的掩蔽阈值按照小数点为单位估计可容许的比特的数量,通过使用频谱能量按照小数点为单位估计分配的比特的数量,并且调整分配的比特的数量以免超过可容许的比特的数量;解码单元,通过使用基于每个频带和频谱能量调整的比特的数量来对比特流中所包括的音频频谱进行解码;和逆变换单元,将解码的音频频谱变换为时域中的音频信号。
附图说明
通过参照附图详细描述以上和其它方面的示例性实施例,以上和其它方面将会变得更加清楚,其中:
图1是根据示例性实施例的音频编码设备的框图;
图2是根据示例性实施例的图1的音频编码设备中的比特分配单元的框图;
图3是根据另一示例性实施例的图1的音频编码设备中的比特分配单元的框图;
图4是根据另一示例性实施例的图1的音频编码设备中的比特分配单元的框图;
图5是根据示例性实施例的图1的音频编码设备中的编码单元的框图;
图6是根据另一示例性实施例的音频编码设备的框图;
图7是根据示例性实施例的音频解码设备的框图;
图8是根据示例性实施例的图7的音频解码设备中的比特分配单元的框图;
图9是根据示例性实施例的图7的音频解码设备中的解码单元的框图;
图10是根据另一示例性实施例的图7的音频解码设备中的解码单元的框图;
图11是根据另一示例性实施例的图7的音频解码设备中的解码单元的框图;
图12是根据另一示例性实施例的音频解码设备的框图;
图13是根据另一示例性实施例的音频解码设备的框图;
图14是示出根据另一示例性实施例的比特分配方法的流程图;
图15是示出根据另一示例性实施例的比特分配方法的流程图;
图16是示出根据另一示例性实施例的比特分配方法的流程图;
图17是示出根据另一示例性实施例的比特分配方法的流程图;
图18是根据示例性实施例的包括编码模块的多媒体装置的框图;
图19是根据示例性实施例的包括解码模块的多媒体装置的框图;和
图20是根据示例性实施例的包括编码模块和解码模块的多媒体装置的框图。
具体实施方式
本发明构思可允许形式上的各种变化或修改和各种改变,并且将会在附图中示出并且在说明书中详细描述特定示例性实施例。然而,应该理解,特定示例性实施例并不使本发明构思局限制于特定公开形式,而是包括落在本发明构思的精神和技术范围内的每一种修改的、等同的或替换的形式。在下面的描述中,不详细描述公知功能或构造,因为它们将会用不必要的细节来模糊本发明。
虽然诸如“第一”和“第二”的术语可被用于描述各种元件,但元件不可由这些术语限制。这些术语可被用于区分某一元件与另一元件。
在本申请中使用的术语仅被用于描述特定示例性实施例,而不具有限制本发明构思的任何意图。虽然在考虑到本发明构思中的功能的同时尽可能当前广泛使用的一般术语被选择为在本发明构思中使用的术语,但它们可根据本领域普通技术人员的意图、先例或新技术的出现而变化。另外,在特定情况下,可使用由申请人故意选择的术语,并且在这种情况下,将在本发明的对应描述中公开这些术语的含义。因此,在本发明构思中使用的术语不应简单地由术语的名称定义,而是应由术语的含义和在本发明构思上的内容定义。
除非单数形式的表述和复数形式的表述在上下文中清楚地彼此不同,否则单数形式的表述包括复数形式的表述。在本申请中,应该理解,诸如“包括”和“具有”的术语被用于指示存在实现的特征、数量、步骤、操作、元件、部件或其组合,但并不预先排除存在或添加一个或多个其它特征、数量、步骤、操作、元件、部件或其组合的可能性。
以下,将参照示出示例性实施例的附图更充分地描述本发明构思。附图中的相同标号表示相同元件,因此,将省略其重复描述。
如这里所使用,当诸如“…中的至少一个”的表述位于元件的列表之后时,是修饰元件的整个列表而非修饰列表的单个元件。
图1是根据示例性实施例的音频编码设备100的框图。
图1的音频编码设备100可包括变换单元130、比特分配单元150、编码单元170和复用单元190。音频编码设备100的部件可被集成在至少一个模块中并且由至少一个处理器(例如,中央处理器(CPU))实现。这里,音频可包括音频信号、语音信号或通过合成它们而获得的信号,但在以下,为了方便描述,音频通常指示音频信号。
参照图1,变换单元130可通过将时域中的音频信号变换为频域中的音频信号来产生音频频谱。可通过使用各种公知方法(诸如,离散余弦变换(DCT))来执行时域至频域变换。
比特分配单元150可确定通过针对音频频谱使用频谱能量或心理-声学模型而获得的掩蔽阈值和通过使用频谱能量基于每个子频带分配的比特的数量。这里,子频带是对音频频谱的采样点进行分组的单位并且可通过反映阈值频带而具有统一或非统一长度。当子频带具有非统一长度时,可确定子频带以使得在每帧,每个子频带中所包括的从开始的采样点到最后的采样点的采样点的数量逐渐增加。这里,子频带的数量或每个子帧中所包括的采样点的数量可被预先确定。可选择地,在一帧被分成具有统一长度的预定数量的子频带之后,可根据频谱系数的分布调整该统一长度。可使用频谱平坦度测量、最大值和最小值之差或者最大值的微分值确定频谱系数的分布。
根据示例性实施例,比特分配单元150可通过使用基于每个子频带获得的范数值(即,平均频谱能量)来估计可容许的比特的数量,基于平均频谱能量分配比特,并且限制分配的比特的数量以免超过可容许的比特的数量。
根据示例性实施例,比特分配单元150可通过基于每个子频带使用心理-声学模型来估计可容许的比特的数量,基于平均频谱能量分配比特,并且限制分配的比特的数量以免超过容许的比特的数量。
编码单元170可通过根据基于每个子频带最后确定的分配的比特的数量对音频频谱进行量化和无损编码,来产生关于编码的频谱的信息。
复用单元190通过复用从比特分配单元150提供的编码的范数值和从编码单元170提供的关于编码的频谱的信息来产生比特流。
音频编码设备100可产生可选的子频带的噪声水平并且将噪声水平提供给音频解码设备(图7的700、图12的1200或者图13的1300)。
图2是根据示例性实施例的与图1的音频编码设备100中的比特分配单元150对应的比特分配单元200的框图。
图2的比特分配单元200可包括范数估计器210、范数编码器230以及比特估计器和分配器250。比特分配单元200的部件可被集成在至少一个模块中并且由至少一个处理器实现。
参照图2,范数估计器210可基于每个子频带获得与平均频谱能量对应的范数值。例如,可通过在ITU-TG.719中应用的等式1来计算范数值,但不限于此。
数学图1
[数学1]
N ( p ) = 1 L p Σ k = s p e p y ( k ) 2 , p = 0 , . . . , P - 1
在等式1中,当P个子频带或子区段存在于一帧中时,N(p)表示第p子频带或子区段的范数值,Lp表示第p子频带或子区段的长度,即采样点或频谱系数的数量,sp和ep分别表示第p子频带的开始的采样点和最后的采样点,并且y(k)表示采样点大小或频谱系数(即,能量)。
基于每个子频带获得的范数值可被提供给编码单元(图1的170)。
范数编码器230可对基于每个子频带获得的范数值进行量化和无损编码。基于每个子频带量化的范数值或者通过对量化的范数值进行去量化而获得的范数值可被提供给比特估计器和分配器250。基于每个子频带量化并且无损编码的范数值可被提供给复用单元(图1的190)。
比特估计器和分配器250可通过使用范数值来估计并且分配需要的数量的比特。优选地,可使用去量化的范数值,以使得编码部分和解码部分能够使用相同的比特估计和分配过程。在这种情况下,可使用通过考虑掩蔽效应而调整的范数值。例如,可如等式2中一样使用在ITU-TG.719中应用的心理-声学加权来调整范数值,但不限于此。
数学图2
[数学2]
I ~ N q ( p ) = I N q ( p ) + WSpe ( p )
在等式2中,表示第p子频带的量化的范数值的索引,表示第p子频带的调整的范数值的索引,并且WSpe(p)表示用于范数值调整的偏移频谱。
比特估计器和分配器250可通过使用基于每个子频带的范数值来计算掩蔽阈值,并且通过使用掩蔽阈值来估计感知所需要的比特的数量。为了实现这一点,基于每个子频带获得的范数值可被同样地表示为以dB为单位的频谱能量,如等式3中所示。
数学图3
[数学3]
2 log 2 [ 1 L p Σ k = s p e p y ( k ) 2 ] = 10 log 10 [ Σ k = s p e p y ( k ) 2 ] 0.1 log 2 10 - log 2 ( L p )
作为通过使用频谱能量来获得掩蔽阈值的方法,可使用各种公知方法。也就是说,掩蔽阈值是与恰可察觉失真(JND)对应的值,并且当量化噪声小于掩蔽阈值时,不可察觉到感知噪声。因此,可使用掩蔽阈值计算不察觉感知噪声所需的最小的比特的数量。例如,可通过基于每个子频带使用范数值与掩蔽阈值之比来计算信号掩蔽比(SMR),并且可通过针对计算的SMR使用比特的关系来估计满足掩蔽阈值的比特的数量。虽然估计的比特的数量是不察觉感知噪声所需的最小的比特的数量,但由于在压缩方面不需要使用超过估计的数量的比特,所以估计的比特的数量可被视为基于每个子频带可容许的最大的比特的数量(以下,可容许的比特的数量)。可按照小数点为单位表示每个子频带的可容许的比特的数量。
比特估计器和分配器250可通过使用基于每个子频带的范数值按照小数点为单位执行比特分配。在这种情况下,从具有比其它子频带的范数值更大的范数值的子频带顺序地分配比特,并且可进行调整,即通过针对基于每个子频带的范数值根据每个子频带的感知重要性进行加权来将更多的比特分配给对感知重要的子频带。可通过例如ITU-TG.719中的心理-声学加权来确定感知重要性。
比特估计器和分配器250可从具有比其它子频带的范数值更大的范数值的子频带顺序地将比特分配给采样点。换句话说,首先,针对具有最大范数值的子频带分配每个采样点的比特,并且通过将具有最大范数值的子频带的范数值减小预定单位来改变具有最大范数值的子频带的优先级,以使得比特被分配给另一子频带。重复执行这个过程,直至清楚地分配了在给定帧中可容许的比特的总数B。
比特估计器和分配器250可通过针对每个子频带限制分配的比特的数量以免超过估计的比特的数量(即,可容许的比特的数量),来最后确定分配的比特的数量。对于所有子频带,将分配的比特的数量与估计的比特的数量进行比较,如果分配的比特的数量大于估计的比特的数量,则分配的比特的数量被限制为估计的比特的数量。如果作为比特数限制的结果获得的给定帧中的所有子频带的分配的比特的数量小于给定帧中可容许的比特的总数B,则与该差值对应的比特的数量可被均匀地分配给所有子频带或者根据感知重要性被非均匀地分配。
由于分配给每个子频带的比特的数量能够按照小数点为单位被确定并且被限制为可容许的比特的数量,所以可有效地分配给定帧的比特的总数。
根据示例性实施例,估计并且分配每个子频带所需的比特数量的详细方法如下。根据这种方法,由于可立刻确定分配给每个子频带的比特的数量而无需几次重复,所以可降低复杂性。
例如,通过应用由等式4表示的拉格朗日函数可获得可优化量化失真和分配给每个子频带的比特的数量的解决方案。
数学图4
[数学4]
L=D+λ(ΣNbLb-B)
在等式4中,L表示拉格朗日函数,D表示量化失真,B表示给定帧中可容许的比特的总数,Nb表示第b子频带的采样点的数量,并且Lb表示分配给第b子频带的比特的数量。也就是说,NbLb表示分配给第b子频带的比特的数量。λ表示作为优化系数的拉格朗日乘数。
通过使用等式4,可在考虑到量化失真的同时确定用于使分配给给定帧中所包括的子频带的比特的总数和给定帧的可容许的比特的数量之差最小化的Lb
量化失真D可由等式5定义。
数学图5
[数学5]
D = Σ i ( x i - x i ~ ) 2 Σ i x i 2
在等式5中,xi表示输入频谱,并且表示解码的频谱。也就是说,量化失真D可被定义为任意帧中的输入频谱xi和解码的频谱的均方误差(MSE)。
等式5中的分母是由给定输入频谱确定的常数值,因此,由于等式5中的分母不影响优化,所以等式7可由等式6简化。
数学图6
[数学6]
L = Σ i ( x i - x i ~ ) 2 + λ ( Σ N b L b - B )
作为输入频谱xi的第b子频带的平均频谱能量的范数值gb可由等式7定义,通过对数标度量化的范数值nb可由等式8定义,并且去量化的范数值可由等式9定义。
数学图7
[数学7]
g b = Σ i = s b e b x i 2 N b
数学图8
[数学8]
数学图9
[数学9]
g ~ b = 2 0.5 n b
在等式7中,sb和eb分别表示第b子频带的开始的采样点和最后的采样点。
如等式10,通过将输入频谱xi除以去量化的范数值来产生归一化的频谱yi,并且如等式11,通过将恢复的归一化的频谱乘以去量化的范数值来产生解码的频谱
数学图10
[数学10]
y i = x i g ~ b , i ∈ [ s b , . . . e b ]
数学图11
[数学11]
x ~ i = y ~ i g ~ b , i ∈ [ s b , . . . e b ]
可通过使用等式9至等式11根据等式12整理量化失真项。
数学图12
[数学12]
Σ i ( x i - x ~ i ) 2 = Σ b g ~ b 2 Σ i ∈ b ( y i - y ~ i ) 2 = Σ b 2 n b ( y i - y ~ i ) 2
通常,从量化失真和分配的比特的数量之间的关系,定义每次每个采样增加1比特时,信噪比(SNR)增加6.02dB,并且通过使用这一点,归一化的频谱的量化失真可由等式13定义。
数学图13
[数学13]
Σ i ∈ b ( y i - y ~ i ) 2 Σ i y i 2 = Σ i ∈ b ( y i - y ~ i ) 2 N b = 2 - 2 L b
在实际音频编码的情况下,可通过应用可根据信号特性变化的dB标度值C而非固定1比特/采样点的关系来定义等式14。
数学图14
[数学14]
Σ i ∈ b ( y i - y ~ i ) 2 = 2 - CL b N b
在等式14中,当C是2时,1比特/采样点对应于6.02dB,并且当C是3时,1比特/采样点对应于9.03dB。
因此,可通过等式12和等式14根据等式15表示等式6。
数学图15
[数学15]
L = Σ b 2 n b 2 - C L b N b + λ ( Σ b N b L b - B )
为了从等式15获得最佳的Lb和λ,如等式16,对Lb和λ执行偏微分。
数学图16
[数学16]
∂ L ∂ L b = - C 2 n b - CL b N b ln 2 + λN b = 0 ∂ L ∂ λ = Σ N b L b - B = 0
当整理等式16时,Lb可由等式17表示。
数学图17
[数学17]
L b = 1 C ( n b - Σ b N b n b - CB Σ b N b )
通过使用等式17,可在给定帧中可容许的比特的总数B的范围中估计可使输入频谱的SNR最大化的每个子频带的每个采样点的分配的比特的数量Lb
由比特估计器和分配器250确定的基于每个子频带的分配的比特的数量可被提供给编码单元(图1的170)。
图3是根据另一示例性实施例的与图1的音频编码设备100中的比特分配单元150对应的比特分配单元300的框图。
图3的比特分配单元300可包括心理-声学模型310、比特估计器和分配器330、比例因子估计器350和比例因子编码器370。比特分配单元300的部件可被集成在至少一个模块中并且由至少一个处理器实现。
参照图3,心理-声学模型310可通过从变换单元(图1的130)接收音频频谱来获得每个子频带的掩蔽阈值。
比特估计器和分配器330可通过使用基于每个子频带的掩蔽阈值来估计感知所需要的比特的数量。也就是说,可基于每个子频带计算SMR,并且可通过针对计算的SMR使用比特的关系来估计满足掩蔽阈值的比特的数量。虽然估计的比特的数量是不察觉感知噪声所需的最小的比特的数量,但由于在压缩方面不需要使用超过估计的数量的比特,所以估计的比特的数量可被视为基于每个子频带的可容许的最大的比特的数量(以下,可容许的比特的数量)。可按照小数点为单比特表示每个子频带的可容许的比特的数量。
比特估计器和分配器330可通过使用基于每个子频带的频谱能量按照小数点为单位执行比特分配。在这种情况下,例如,利用等式7至等式20的比特分配方法可被使用。
比特估计器和分配器330针对所有子频带将分配的比特的数量与估计的比特的数量进行比较,如果分配的比特的数量大于估计的比特的数量,则分配的比特的数量被限制为估计的比特的数量。如果作为比特数限制的结果获得的给定帧中的所有子频带的分配的比特的数量小于给定帧中可容许的比特的总数B,则与该差值对应的比特的数量可被均匀地分配给所有子频带或者根据感知重要性被非均匀地分配。
比例因子估计器350可通过使用基于每个子频带最后确定的分配的比特的数量来估计比例因子。基于每个子频带估计的比例因子可被提供给编码单元(图1的170)。
比例因子编码器370可对基于每个子频带估计的比例因子进行量化和无损编码。基于每个子频带编码的比例因子可被提供给复用单元(图1的190)。
图4是根据另一示例性实施例的与图1的音频编码设备100中的比特分配单元150对应的比特分配单元400的框图。
图4的比特分配单元400可包括范数估计器410、比特估计器和分配器430、比例因子估计器450和比例因子编码器470。比特分配单元400的部件可被集成在至少一个模块中并且由至少一个处理器实现。
参照图4,范数估计器410可基于每个子频带获得与平均频谱能量对应的范数值。
比特估计器和分配器430可通过使用基于每个子频带的频谱能量来获得掩蔽阈值,并且通过使用掩蔽阈值来估计在感知上需要的比特的数量(即,可容许的比特的数量)。
比特估计器和分配器430可通过使用基于每个子频带的频谱能量按照小数点为单位执行比特分配。在这种情况下,例如,利用等式7至等式20的比特分配方法可被使用。
比特估计器和分配器430针对所有子频带将分配的比特的数量与估计的比特的数量进行比较,如果分配的比特的数量大于估计的比特的数量,则分配的比特的数量被限制为估计的比特的数量。如果作为比特数限制的结果获得的给定帧中的所有子频带的分配的比特的数量小于给定帧中可容许的比特的总数B,则与该差值对应的比特的数量可被均匀地分配给所有子频带或者根据感知重要性被非均匀地分配。
比例因子估计器450可通过使用基于每个子频带最后确定的分配的比特的数量来估计比例因子。基于每个子频带估计的比例因子可被提供给编码单元(图1的170)。
比例因子编码器470可对基于每个子频带估计的比例因子进行量化和无损编码。基于每个子频带编码的比例因子可被提供给复用单元(图1的190)。
图5是根据示例性实施例的与图1的音频编码设备100中的编码单元170对应的编码单元500的框图。
图5的编码单元500可包括频谱归一化单元510和频谱编码器530。编码单元500的部件可被集成在至少一个模块中并且由至少一个处理器实现。
参照图5,频谱归一化单元510可通过使用从比特分配单元(图1的150)提供的范数值来对频谱进行归一化。
频谱编码器530可通过使用每个子频带的分配的比特的数量来量化归一化的频谱,并且对量化结果进行无损编码。例如,阶乘脉冲编码可被用于频谱编码,但不限于此。根据阶乘脉冲编码,可在分配的比特的数量的范围内以阶乘形式表示诸如脉冲位置、脉冲大小和脉冲符号的信息。
关于由频谱编码器530编码的频谱的信息可被提供给复用单元(图1的190)。
图6是根据另一示例性实施例的音频编码设备600的框图。
图6的音频编码设备600可包括瞬态检测单元610、变换单元630、比特分配单元650、编码单元670和复用单元690。音频编码设备600的部件可被集成在至少一个模块中并且由至少一个处理器实现。由于当将图6的音频编码设备600与图1的音频编码设备100进行比较时存在差异,即图6的音频编码设备600还包括瞬态检测单元610,所以在这里省略共同部件的详细描述。
参照图6,瞬态检测单元610可通过分析音频信号来检测指示瞬态特性的间隔。各种公知方法可被用于瞬态间隔的检测。从瞬态检测单元610提供的瞬态信令信息可通过复用单元690而被包括在比特流中。
变换单元630可根据瞬态间隔检测结果确定用于变换的窗口大小,并且基于确定的窗口大小执行时域至频域的变换。例如,短窗口可被应用于检测到瞬态间隔的子频带,并且长窗口可被应用于未检测到瞬态间隔的子频带。
比特分配单元650可分别由图2的比特分配单元200、图3的比特分配单元300和图4的比特分配单元400之一实现。
编码单元670可根据瞬态间隔检测结果确定用于编码的窗口大小。
音频编码设备600可针对可选的子频带产生噪声级别并且将噪声级别提供给音频解码设备(图7的700、图12的1200或者图13的1300)。
图7是根据示例性实施例的音频解码设备700的框图。
图7的音频解码设备700可包括解复用单元710、比特分配单元730、解码单元750和逆变换单元770。音频解码设备的部件可被集成在至少一个模块中并且由至少一个处理器实现。
参照图7,解复用单元710可解复用比特流以提取量化且无损编码的范数值和关于编码的频谱的信息。
比特分配单元730可基于每个子频带从量化且无损编码的范数值获得去量化的范数值,并且通过使用去量化的范数值来确定分配的比特的数量。比特分配单元730可基本上与音频编码设备100的比特分配单元150或音频编码设备600的比特分配单元650相同地操作。当在音频编码设备100或音频编码设备600中通过心理-声学加权调整了范数值时,可由音频解码设备700以相同方式调整去量化的范数值。
解码单元750可通过使用从解复用单元710提供的关于编码的频谱的信息来对编码的频谱进行无损解码和去量化。例如,脉冲解码可被用于频谱解码。
逆变换单元770可通过将解码的频谱变换至时域来产生恢复的音频信号。
图8是根据示例性实施例的图7的音频解码设备700中的比特分配单元800的框图。
图8的比特分配单元800可包括范数解码器810以及比特估计器和分配器830。比特分配单元800的部件可被集成在至少一个模块中并且由至少一个处理器实现。
参照图8,范数解码器810可从由解复用单元(图7的710)提供的量化且无损编码的范数值获得去量化的范数值。
比特估计器和分配器830可通过使用去量化的范数值来确定分配的比特的数量。详细地讲,比特估计器和分配器830可通过使用基于每个子频带的频谱能量(即,范数值)来获得掩蔽阈值,并且通过使用掩蔽阈值来估计感知所需要的比特的数量(即,可容许的比特的数量)。
比特估计器和分配器830可通过使用基于每个子频带的频谱能量(即,范数值)按照小数点为单位执行比特分配。在这种情况下,例如,利用等式7至等式20的比特分配方法可被使用。
比特估计器和分配器830针对所有子频带将分配的比特的数量与估计的比特的数量进行比较,如果分配的比特的数量大于估计的比特的数量,则分配的比特的数量被限制为估计的比特的数量。如果作为比特数限制的结果获得的给定帧中的所有子频带的分配的比特的数量小于给定帧中可容许的比特的总数B,则与该差值对应的比特的数量可被均匀地分配给所有子频带或者根据感知重要性被非均匀地分配。
图9是根据示例性实施例的与图7的音频解码设备700中的解码单元750对应的解码单元900的框图。
图9的解码单元900可包括频谱解码器910和包络成形单元930。解码单元900的部件可被集成在至少一个模块中并且由至少一个处理器实现。
参照图9,频谱解码器910可通过使用从解复用单元(图7的710)提供的关于编码的频谱的信息和从比特分配单元(图7的730)提供的分配的比特的数量,来对编码的频谱进行无损解码和去量化。来自频谱解码器910的解码的频谱是归一化的频谱。
包络成形单元930可通过使用从比特分配单元(图7的730)提供的去量化的范数值对从频谱解码器910提供的归一化的频谱执行包络成形,来恢复在归一化之前的频谱。
图10是根据示例性实施例的与图7的音频解码设备700中的解码单元750对应的解码单元1000的框图。
图9的解码单元1000可包括频谱解码器1010、包络成形单元1030和频谱填充单元1050。解码单元1000的部件可被集成在至少一个模块中并且由至少一个处理器实现。
参照图10,频谱解码器1010可通过使用从解复用单元(图7的710)提供的关于编码的频谱的信息和从比特分配单元(图7的730)提供的分配的比特的数量,来对编码的频谱进行无损解码和去量化。来自频谱解码器1010的解码的频谱是归一化的频谱。
包络成形单元1030可通过使用从比特分配单元(图7的730)提供的去量化的范数值对从频谱解码器1010提供的归一化的频谱执行包络成形,来恢复在归一化之前的频谱。
当在从包络成形单元1030提供的频谱中存在包括去量化为0的部分的子频带时,频谱填充单元1050可在子频带中的去量化为0的部分中填充噪声分量。根据示例性实施例,可随机产生噪声分量,或者可通过复制与包括去量化为0的部分的子频带相邻的去量化为非0值的子频带的频谱或去量化为非0值的子频带的频谱来产生噪声分量。根据另一示例性实施例,可通过产生用于包括去量化为0的部分的子频带的噪声分量并且使用噪声分量的能量与从比特分配单元(图7的730)提供的去量化的范数值(即,频谱能量)之比来调整噪声分量的能量。根据另一示例性实施例,可产生用于包括去量化为0的部分的子频带的噪声分量,并且噪声分量的平均能量可被调整为1。
图11是根据另一示例性实施例的与图7的音频解码设备700中的解码单元750对应的解码单元1100的框图。
图11的解码单元1100可包括频谱解码器1110、频谱填充单元1130和包络成形单元1150。解码单元1100的部件可被集成在至少一个模块中并且由至少一个处理器实现。由于当将图11的解码单元1100与图10的解码单元1000进行比较时存在差异,即频谱填充单元1130和包络成形单元1150的布置不同,所以在这里省略共同部件的详细描述。
参照图11,当在从频谱解码器1110提供的归一化的频谱中存在包括去量化为0的部分的子频带时,频谱填充单元1130可在子频带中去量化为0的部分中填充噪声分量。在这种情况下,可使用应用于图10的频谱填充单元1050的各种噪声填充方法。优选地,对于包括去量化为0的部分的子频带,可产生噪声分量,并且噪声分量的平均能量可被调整为1。
包络成形单元1150可通过使用从比特分配单元(图7的730)提供的去量化的范数值来恢复包括填充有噪声分量的子频带的频谱的在归一化之前的频谱。
图12是根据另一示例性实施例的音频解码设备1200的框图。
图12的音频解码设备1200可包括解复用单元1210、比例因子解码器1230、频谱解码器1250和逆变换单元1270。音频解码设备1200的部件可被集成在至少一个模块中并且由至少一个处理器实现。
参照图12,解复用单元1210可解复用比特流以提取量化且无损编码的比例因子和关于编码的频谱的信息。
比例因子解码器1230可基于每个子频带对量化且无损编码的比例因子进行无损解码和去量化。
频谱解码器1250可通过使用从解复用单元1210提供的关于编码的频谱的信息和去量化的比例因子来对编码的频谱进行无损解码和去量化。频谱解码单元1250可包括与图10的解码单元1000相同的部件。
逆变换单元1270可通过将由频谱解码器1250解码的频谱变换至时域来产生恢复的音频信号。
图13是根据另一示例性实施例的音频解码设备1300的框图。
图13的音频解码设备1300可包括解复用单元1310、比特分配单元1330、解码单元1350和逆变换单元1370。音频解码设备1300的部件可被集成在至少一个模块中并且由至少一个处理器实现。
由于当将图13的音频解码设备1300与图7的音频解码设备700进行比较时存在差异,即瞬态信令信息被提供给解码单元1350和逆变换单元1370,所以在这里省略共同部件的详细描述。
参照图13,解码单元1350可通过使用从解复用单元1310提供的关于编码的频谱的信息来对频谱进行解码。在这种情况下,窗口大小可根据瞬态信令信息而不同。
逆变换单元1370可通过将解码的频谱变换至时域来产生恢复的音频信号。在这种情况下,窗口大小可根据瞬态信令信息而不同。
图14是示出根据另一示例性实施例的比特分配方法的流程图。
参照图14,在操作1410中,获取每个子频带的频谱能量,频谱能量可以是范数值。
在操作1420中,通过使用基于每个子频带的频谱能量来获取掩蔽阈值。
在操作1430中,通过使用基于每个子频带的掩蔽阈值按照小数点为单位估计可容许的比特的数量。
在操作1440中,根据基于每个子频带的频谱能量按照小数点为单位分配比特。
在操作1450中,基于每个子频带将容许的比特的数量与分配的比特的数量进行比较。
在操作1460中,如果作为操作1450中的比较的结果,对于给定子频带,分配的比特的数量大于可容许的比特的数量,则分配的比特的数量被限制为可容许的比特的数量。
在操作1470中,如果作为操作1450中的比较的结果,对于给定子频带,分配的比特的数量小于或等于可容许的比特的数量,则分配的比特的数量被按原样使用,或者通过使用在操作1460中限制的可容许的比特的数量来针对每个子频带确定最终的分配的比特的数量。
虽然未示出,但如果针对给定帧中的所有子频带在操作1470中确定的分配的比特的数量之和小于或大于给定帧中可容许的比特的总数,则与该差值对应的比特的数量可被均匀地分配给所有子频带或者根据感知重要性被非均匀地分配。
图15是示出根据另一示例性实施例的比特分配方法的流程图。
参照图15,在操作1500中,获取每个子频带的去量化的范数值。
在操作1510中,通过使用基于每个子频带的去量化的范数值来获取掩蔽阈值。
在操作1520中,通过使用基于每个子频带的掩蔽阈值来获取SMR。
在操作1530中,通过使用基于每个子频带的SMR按照小数点为单位估计可容许的比特的数量。
在操作1540中,根据基于每个子频带的频谱能量(或去量化的范数值)按照小数点为单位分配比特。
在操作1550中,基于每个子频带将可容许的比特的数量与分配的比特的数量进行比较。
在操作1560中,如果作为操作1550中的比较的结果,对于给定子频带,分配的比特的数量大于可容许的比特的数量,则分配的比特的数量被限制为可容许的比特的数量。
在操作1570中,如果作为操作1550中的比较的结果,对于给定子频带,分配的比特的数量小于或等于可容许的比特的数量,则分配的比特的数量被按原样使用,或者通过使用在操作1560中限制的可容许的比特的数量来针对每个子频带确定最终的分配的比特的数量。
虽然未示出,但如果针对给定帧中的所有子频带在操作1570中确定的分配的比特的数量之和小于或大于给定帧中容许的比特的总数,则与该差值对应的比特的数量可被均匀地分配给所有子频带或者根据感知重要性被非均匀地分配。
图16是示出根据另一示例性实施例的比特分配方法的流程图。
参照图16,在操作1610中,执行初始化。作为初始化的示例,当通过使用等式20来估计每个子频带的分配的比特的数量时,可通过针对所有子频带计算常数值
Σ N i n i - CB Σ N i
来降低整体复杂性。
在操作1620中,通过使用等式17按照小数点为单位估计每个子频带的分配的比特的数量。可通过将每个采样点的分配的比特的数量Lb乘以每个子频带的采样点的数量来获得每个子频带的分配的比特的数量。当通过使用等式17计算每个子频带的每个采样点的分配的比特的数量Lb时,Lb可具有小于0的值。在这种情况下,如等式18中一样,将0分配给具有小于0的值的Lb
数学图18
[数学18]
L b = max ( 0 , 1 C ( n b - Σ b N b n b - CB Σ b N b ) )
结果,针对给定帧中所包括的所有子频带估计的分配的比特的数量之和可能大于给定帧中可容许的比特的数量B。
在操作1630中,将针对给定帧中所包括的所有子频带估计的分配的比特的数量之和与给定帧中可容许的比特的数量B进行比较。
在操作1640中,通过使用等式19针对每个子频带重新分配比特,直至针对给定帧中所包括的所有子频带估计的分配的比特的数量之和与给定帧中可容许的比特的数量B相同。
数学图19
[数学19]
L b k = max ( 0 , L b k - 1 - Σ b N b L b k - 1 - B Σ b N b ) , b ∈ [ L b k - 1 ≥ 0 ]
在等式19中,
表示通过第(k-1)次重复确定的比特的数量,并且表示通过第k次重复确定的比特的数量。通过每次重复确定的比特的数量不可小于0,因此,针对具有大于0的比特的数量的子频带执行操作1640。
在操作1650中,如果作为操作1630中的比较结果,针对给定帧中所包括的所有子频带估计的分配的比特的数量之和与给定帧中可容许的比特的数量B相同,则每个子频带的分配的比特的数量被按原样使用,或者通过使用作为操作1640中的重新分配的结果而获得的每个子频带的分配的比特的数量针对每个子频带确定最终的分配的比特的数量。
图17是示出根据另一示例性实施例的比特分配方法的流程图。
参照图17,像图16的操作1610一样,在操作1710中执行初始化。像图16的操作1620一样,在操作1720中,按照小数点为单位估计每个子频带的分配的比特的数量,并且当每个子频带的每个采样点的分配的比特的数量Lb小于0时,如等式18,将0分配给具有小于0的值的Lb
在操作1730中,根据SNR定义每个子频带所需的最小的比特的数量,并且通过将分配的比特的数量限制为最小的比特的数量来调整大于0并且小于最小的比特的数量的操作1720中的分配的比特的数量。如此,通过将每个子频带的分配的比特的数量限制为最小的比特的数量,可减小降低声音质量的可能性。例如,每个子频带所需的最小的比特的数量被定义为阶乘脉冲编码中的脉冲编码所需的最小的比特的数量。阶乘脉冲编码通过使用非0的脉冲位置、脉冲大小和脉冲符号的所有组合来表示信号。在这种情况下,可表示脉冲的所有组合的偶然数N可由等式20表示。
数学图20
[数学20]
N = Σ i = 1 m 2 i F ( n , i ) D ( m , i )
在等式20中,2i表示针对在i个非零位置的信号可利用+/-表示的符号的偶然数。
在等式20中,F(n,i)可由等式21定义,它指示用于针对给定n个采样点(即,位置)选择i个非零位置的偶然数。
数学图21
[数学21]
F ( n , i ) = C i n = n ! i ! ( n - i ) !
在等式20中,D(m,i)可由等式22表示,它指示用于通过大小来表示在i个非零位置选择的信号的偶然数。
数学图22
[数学22]
D ( m , i ) = C i - 1 m - 1 = ( m - 1 ! ) ( i - 1 ) ! ( m - i ) !
表示N个组合所需的比特的数量M可由等式23表示。
数学图23
[数学23]
结果,对给定第b子频带中的Nb个采样点的最少1个脉冲进行编码所需的最小的比特的数量可由等式24表示。
数学图24
[数学24]
L b min = 1 + log 2 N b
在这种情况下,用于传输量化所需的增益值的比特的数量可与阶乘脉冲编码所需的最小的比特的数量相加并且可根据比特率而不同。如等式25,可通过阶乘脉冲编码所需的最小的比特的数量和给定子频带的采样点的数量Nb之中的较大值确定基于每个子频带所需的最小的比特的数量。例如,基于每个子频带所需的最小的比特的数量可被设置为每个采样点1比特。
数学图25
[数学25]
L b min = max ( N b , 1 + log 2 N b + L gain )
当由于目标比特率小而导致在操作1730中将要使用的比特不够时,对于分配的比特的数量大于0并且小于最小的比特的数量的子频带,分配的比特的数量被撤销并且被调整为0。另外,对于分配的比特的数量小于等式24的分配的比特的数量的子频带,分配的比特的数量可被撤销,并且对于分配的比特的数量大于等式24的分配的比特的数量并且小于等式25的最小的比特的数量的子频带,可分配最小数量的比特。
在操作1740中,将针对给定帧中的所有子频带估计的分配的比特的数量之和与给定帧中可容许的比特的数量进行比较。
在操作1750中,针对分配了超过最小数量的比特的子频带重新分配比特,直至针对给定帧中的所有子频带估计的分配的比特的数量之和与给定帧中可容许的比特的数量相同。
在操作1760中,确定每个子频带的分配的比特的数量是否在比特重新分配的前一重复和当前重复之间改变。如果每个子频带的分配的比特的数量在比特重新分配的前一重复和当前重复之间未改变或者在针对给定帧中的所有子频带估计的分配的比特的数量之和与给定帧中可容许的比特的数量相同之前未改变,则执行操作1740至1760。
在操作1770中,如果作为操作1760中的确定的结果,每个子频带的分配的比特的数量在比特重新分配的前一重复和当前重复之间未改变,则从高子频带到低子频带顺序地撤销比特,并且执行操作1740至1760,直至满足给定帧中可容许的比特的数量。
也就是说,对于分配的比特的数量大于等式25的最小的比特的数量的子频带,在减少分配的比特的数量的同时执行调整操作,直至满足给定帧中可容许的比特的数量。另外,如果针对所有子频带,分配的比特的数量等于或小于等式25的最小的比特的数量并且分配的比特的数量之和大于给定帧中可容许的比特的数量,则可从高子频带到低子频带撤销分配的比特的数量。
根据图16和图17的比特分配方法,为了将比特分配给每个子频带,在以频谱能量或加权频谱能量的次序将初始比特分配给每个子频带之后,可立刻估计每个子频带所需的比特的数量,而无需重复几次搜索频谱能量或加权频谱能量的操作。另外,通过将比特重新分配给每个子频带直至针对给定帧中的所有子频带估计的分配的比特的数量之和与给定帧中可容许的比特的数量相同,可实现有效的比特分配。另外,通过对于任意子频带保证最小的比特的数量,可防止由于因较小数量的比特的分配而不能对足够数量的频谱采样点或脉冲进行编码所导致的频谱孔的产生。
图14至图17的方法可被编程并且可由至少一个处理装置(例如,中央处理器(CPU))执行。
图18是根据示例性实施例的包括编码模块的多媒体装置的框图。
参照图18,多媒体装置1800可包括通信单元1810和编码模块1830。另外,多媒体装置1800可还包括存储单元1850,存储单元1850用于存储作为根据音频比特流的使用进行编码的结果而获得的音频比特流。此外,多媒体装置1800可还包括麦克风1870。也就是说,存储单元1850和麦克风1870可被可选地包括。多媒体装置1800可还包括任意解码模块(未示出),例如用于执行普通解码功能的解码模块或根据示例性实施例的解码模块。编码模块1830可由至少一个处理器(例如,中央处理器(未示出))通过与多媒体装置1800中所包括的其它部件(未示出)结合为一体来实现。
通信单元1810可接收从外部提供的音频信号或编码的比特流中的至少一个,或者发送恢复的音频信号或作为由编码模块1830编码的结果而获得的编码的比特流中的至少一个。
通信单元1810被构造为通过无线网络(诸如,无线互联网、无线以太网、无线电话网络、无线局域网(LAN)、Wi-Fi、Wi-Fi直连(WFD)、第三代(3G)、第四代(4G)、蓝牙、红外数据关联(IrDA)、射频识别(RFID)、超宽带(UWB)、Zigbee或近场通信(NFC))或有线网络(诸如,有线电话网络或有线互联网)将数据发送给外部多媒体装置以及从外部多媒体装置接收数据。
根据示例性实施例,编码模块1830可通过下述操作来产生比特流:将通过通信单元1810或麦克风1870提供的时域中的音频信号变换为频域中的音频频谱,基于频带按照小数点为单位确定分配的比特的数量以使得在音频频谱的给定帧中可容许的比特的数量的范围内使存在于预定频带中的频谱的SNR最大化,调整基于频带确定的分配的比特的数量,并且通过使用基于频带和频谱能量调整的比特的数量来对音频频谱进行编码。
根据另一示例性实施例,编码模块1830可通过下述操作来产生比特流:将通过通信单元1810或麦克风1870提供的时域中的音频信号变换为频域中的音频频谱,通过使用基于音频频谱的给定帧中所包括的频带的掩蔽阈值按照小数点为单位估计可容许的比特的数量,通过使用频谱能量按照小数点为单位估计分配的比特的数量,调整分配的比特的数量以免超过可容许的比特的数量,并且通过使用基于频带和频谱能量调整的比特的数量来对音频频谱进行编码。
存储单元1850可存储由编码模块1830产生的编码的比特流。另外,存储单元1850可存储操作多媒体装置1800所需的各种程序。
麦克风1870可将来自用户或外部的音频信号提供给编码模块1830。
图19是根据示例性实施例的包括解码模块的多媒体装置的框图。
图19的多媒体装置1900可包括通信单元1910和解码模块1930。另外,根据作为解码结果而获得的恢复的音频信号的使用,图19的多媒体装置1900可还包括存储单元1950,存储单元1950用于存储恢复的音频信号。另外,图19的多媒体装置1900可还包括扬声器1970。也就是说,存储单元1950和扬声器1970是可选的。图19的多媒体装置1900可还包括编码模块(未示出),例如用于执行普通编码功能的编码模块或根据示例性实施例的编码模块。解码模块1930可与多媒体装置1900中所包括的其它部件(未示出)结合在一起并且由至少一个处理器(例如,中央处理器(CPU))实现。
参照图19,通信单元1910可接收从外部提供的音频信号或编码的比特流中的至少一个,或者可发送作为解码模块1930的解码结果而获得的恢复的音频信号或作为编码结果而获得的音频比特流中的至少一个。可基本上类似于图18的通信单元1810而实现通信单元1910。
根据示例性实施例,解码模块1930可通过下述操作来产生恢复的音频信号:接收通过通信单元1910提供的比特流,基于频带按照小数点为单位确定分配的比特的数量以使得在给定帧中可容许的比特的数量的范围内使存在于每个频带中的频谱的SNR最大化,调整基于频带确定的分配的比特的数量,通过使用基于频带和频谱能量调整的比特的数量来对比特流中所包括的音频频谱进行解码,并且将解码的音频频谱变换为时域中的音频信号。
根据另一示例性实施例,解码模块1930可通过下述操作来产生比特流:接收通过通信单元1910提供的比特流,通过使用基于给定帧中所包括的频带的掩蔽阈值按照小数点为单位估计分配的比特的数量,通过使用频谱能量按照小数点为单位估计分配的比特的数量,调整分配的比特的数量以免超过可容许的比特的数量,通过使用基于频带和频谱能量调整的比特的数量来对比特流中所包括的音频频谱进行解码,并且将解码的音频频谱变换为时域中的音频信号。
存储单元1950可存储由解码模块1930产生的恢复的音频信号。另外,存储单元1950可存储操作多媒体装置1900所需的各种程序。
扬声器1970可将由解码模块1930产生的恢复的音频信号输出到外部。
图20是根据示例性实施例的包括编码模块和解码模块的多媒体装置的框图。
图20中示出的多媒体装置2000可包括通信单元2010、编码模块2020和解码模块2030。另外,多媒体装置2000可还包括存储单元2040,存储单元2040用于根据作为编码结果的音频比特流的使用存储所述音频比特流或根据作为解码结果的恢复的音频信号的使用存储所述恢复的音频信号。另外,多媒体装置2000可还包括麦克风2050和/或扬声器2060。编码模块2020和解码模块2030可由至少一个处理器(例如,中央处理器(CPU)(未示出))通过与多媒体装置2000中所包括的其它部件(未示出)结合为一体来实现。
由于图20中示出的多媒体装置2000的部件对应于图18中示出的多媒体装置1800的部件或图19中示出的多媒体装置1900的部件,所以省略其详细描述。
图18中示出的多媒体装置1800、图19中示出的多媒体装置1900和图20中示出的多媒体装置2000的中的每一个可包括仅语音通信终端(诸如,电话或移动电话)、仅广播或音乐装置(诸如,TV或MP3播放器)或者仅语音通信终端和仅广播或音乐装置的混合终端装置,但不限于此。另外,多媒体装置1800、1900和2000的中的每一个可被用作客户机、服务器或在客户机和服务器之间转换的变换器。
当多媒体装置1800、1900或2000是例如移动电话时,虽然未示出,但多媒体装置1800、1900或2000可还包括:用户输入单元,诸如键区;显示单元,用于显示由用户界面或移动电话处理的信息;和处理器,用于控制移动电话的功能。另外,移动电话可还包括:相机单元,具有图像拾取功能;和用于执行移动电话所需的功能的至少一个部件。
当多媒体装置1800、1900或2000是例如TV时,虽然未示出,但多媒体装置1800、1900或2000可还包括:用户输入单元,诸如键区;显示单元,用于显示接收的广播信息;和处理器,用于控制TV的所有功能。另外,TV可还包括用于执行TV的功能的至少一个部件。
根据示例性实施例的方法可被编写为计算机程序并且可被实现在使用计算机可读记录介质执行程序的通用数字计算机中。另外,可在示例性实施例中使用的数据结构、程序命令或数据文件可被以各种方式记录在计算机可读记录介质中。计算机可读记录介质是任何可存储随后可由计算机系统读取的数据的数据存储装置。计算机可读记录介质的示例包括磁介质(诸如,硬盘、软盘和磁带)、光学介质(诸如,CD-ROM和DVD)、磁光介质(诸如,光软盘)和专门被构造为存储并且执行程序命令的硬件装置(诸如,ROM、RAM和闪存)。另外,计算机可读记录介质可以是用于传输指示程序命令和数据结构的信号的传输介质。程序命令可包括由编译器编辑的机器语言代码和可由计算机使用解释器执行的高级语言代码。
尽管已参照本发明构思的示例性实施例具体示出并描述了本发明构思,但本领域普通技术人员将会理解,在不脱离由权利要求限定的本发明构思的精神和范围的情况下,可对其做出各种形式和细节上的修改。

Claims (12)

1.一种比特分配方法,包括:
在对于帧的可容许的比特内,以分数的形式估计将被分配给所述帧中的子频带的比特,其中,当所估计的子频带的比特小于零时所估计的比特被设置为零;
对所估计的比特进行重新分配,直至针对所述帧的所有频带所分配的比特的总和等于所述可容许的比特,从而获得子频带的分配的比特。
2.如权利要求1所述的方法,其中,基于子频带的频谱能量来执行所述估计。
3.如权利要求1所述的方法,其中,重新分配的步骤包括:基于对子频带设置的预定最小比特来限制所分配的比特。
4.如权利要求1所述的方法,其中,重新分配的步骤包括:当所分配的比特小于对子频带设置的预定最小比特时,将所分配的比特设置为零。
5.如权利要求1所述的方法,其中,重新分配的步骤包括:当所分配的比特小于对子频带设置的预定最小比特时,将所分配的比特设置为所述预定最小比特。
6.如权利要求1所述的方法,其中,基于较高频带的所分配的比特来执行所述重新分配。
7.一种比特分配设备,包括:
处理器,被配置为:
在对于帧的可容许的比特内,以分数的形式估计将被分配给所述帧中的子频带的比特,其中,当所估计的子频带的比特小于零时所估计的比特被设置为零;
对所估计的比特进行重新分配,直至针对所述帧的所有频带所分配的比特的总和等于所述可容许的比特,从而获得子频带的分配的比特。
8.如权利要求7所述的设备,其中,处理器被配置为基于子频带的频谱能量来执行所述估计。
9.如权利要求7所述的设备,其中,处理器被配置为基于对子频带设置的预定最小比特来限制所分配的比特。
10.如权利要求7所述的设备,其中,处理器被配置为当所分配的比特小于对子频带设置的预定最小比特时,将所分配的比特设置为零。
11.如权利要求7所述的设备,其中,处理器被配置为当所分配的比特小于对子频带设置的预定最小比特时,将所分配的比特设置为所述预定最小比特。
12.如权利要求7所述的设备,其中,处理器被配置为基于较高频带的所分配的比特来执行所述重新分配。
CN201280034734.0A 2011-05-13 2012-05-14 比特分配、音频编码和解码 Active CN103650038B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201610341675.1A CN105825859B (zh) 2011-05-13 2012-05-14 比特分配、音频编码和解码
CN201610341124.5A CN105825858B (zh) 2011-05-13 2012-05-14 比特分配、音频编码和解码

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201161485741P 2011-05-13 2011-05-13
US61/485,741 2011-05-13
US201161495014P 2011-06-09 2011-06-09
US61/495,014 2011-06-09
PCT/KR2012/003777 WO2012157932A2 (en) 2011-05-13 2012-05-14 Bit allocating, audio encoding and decoding

Related Child Applications (2)

Application Number Title Priority Date Filing Date
CN201610341124.5A Division CN105825858B (zh) 2011-05-13 2012-05-14 比特分配、音频编码和解码
CN201610341675.1A Division CN105825859B (zh) 2011-05-13 2012-05-14 比特分配、音频编码和解码

Publications (2)

Publication Number Publication Date
CN103650038A CN103650038A (zh) 2014-03-19
CN103650038B true CN103650038B (zh) 2016-06-15

Family

ID=47141906

Family Applications (3)

Application Number Title Priority Date Filing Date
CN201280034734.0A Active CN103650038B (zh) 2011-05-13 2012-05-14 比特分配、音频编码和解码
CN201610341675.1A Active CN105825859B (zh) 2011-05-13 2012-05-14 比特分配、音频编码和解码
CN201610341124.5A Active CN105825858B (zh) 2011-05-13 2012-05-14 比特分配、音频编码和解码

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN201610341675.1A Active CN105825859B (zh) 2011-05-13 2012-05-14 比特分配、音频编码和解码
CN201610341124.5A Active CN105825858B (zh) 2011-05-13 2012-05-14 比特分配、音频编码和解码

Country Status (15)

Country Link
US (7) US9236057B2 (zh)
EP (5) EP3937168A1 (zh)
JP (3) JP6189831B2 (zh)
KR (7) KR102053899B1 (zh)
CN (3) CN103650038B (zh)
AU (3) AU2012256550B2 (zh)
BR (1) BR112013029347B1 (zh)
CA (1) CA2836122C (zh)
MX (3) MX337772B (zh)
MY (2) MY164164A (zh)
RU (2) RU2648595C2 (zh)
SG (1) SG194945A1 (zh)
TW (5) TWI562132B (zh)
WO (2) WO2012157932A2 (zh)
ZA (1) ZA201309406B (zh)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100266989A1 (en) 2006-11-09 2010-10-21 Klox Technologies Inc. Teeth whitening compositions and methods
MY164164A (en) * 2011-05-13 2017-11-30 Samsung Electronics Co Ltd Bit allocating, audio encoding and decoding
BR112013033900B1 (pt) 2011-06-30 2022-03-15 Samsung Electronics Co., Ltd Método para gerar um sinal estendido de largura de banda para decodificação de áudio
US8586847B2 (en) * 2011-12-02 2013-11-19 The Echo Nest Corporation Musical fingerprinting based on onset intervals
US11116841B2 (en) 2012-04-20 2021-09-14 Klox Technologies Inc. Biophotonic compositions, kits and methods
CN105976824B (zh) * 2012-12-06 2021-06-08 华为技术有限公司 信号解码的方法和设备
ES2970676T3 (es) 2012-12-13 2024-05-30 Fraunhofer Ges Forschung Dispositivo de codificación de audio vocal, dispositivo de decodificación de audio vocal, procedimiento decodificación de audio vocal, y procedimiento de decodificación de audio vocal
CN103107863B (zh) * 2013-01-22 2016-01-20 深圳广晟信源技术有限公司 一种分段平均码率的数字音频信源编码方法及装置
RU2660605C2 (ru) * 2013-01-29 2018-07-06 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Концепция заполнения шумом
US20140276354A1 (en) 2013-03-14 2014-09-18 Klox Technologies Inc. Biophotonic materials and uses thereof
CN108198564B (zh) 2013-07-01 2021-02-26 华为技术有限公司 信号编码和解码方法以及设备
JP6243540B2 (ja) 2013-09-16 2017-12-06 サムスン エレクトロニクス カンパニー リミテッド スペクトル符号化方法及びスペクトル復号化方法
JP6396459B2 (ja) * 2013-10-31 2018-09-26 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 周波数領域における時間的予備整形雑音の挿入によるオーディオ帯域幅拡張
EP4325488A3 (en) * 2014-02-28 2024-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoding device, encoding device, decoding method, encoding method, terminal device, and base station device
CN104934034B (zh) 2014-03-19 2016-11-16 华为技术有限公司 用于信号处理的方法和装置
CN111710342B (zh) * 2014-03-31 2024-04-16 弗朗霍弗应用研究促进协会 编码装置、解码装置、编码方法、解码方法及程序
CN110097892B (zh) 2014-06-03 2022-05-10 华为技术有限公司 一种语音频信号的处理方法和装置
US9361899B2 (en) * 2014-07-02 2016-06-07 Nuance Communications, Inc. System and method for compressed domain estimation of the signal to noise ratio of a coded speech signal
CN111968655B (zh) 2014-07-28 2023-11-10 三星电子株式会社 信号编码方法和装置以及信号解码方法和装置
EP2980792A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
EP3208800A1 (en) 2016-02-17 2017-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for stereo filing in multichannel coding
CN105957533B (zh) * 2016-04-22 2020-11-10 杭州微纳科技股份有限公司 语音压缩方法、语音解压方法及音频编码器、音频解码器
CN106782608B (zh) * 2016-12-10 2019-11-05 广州酷狗计算机科技有限公司 噪声检测方法及装置
CN108174031B (zh) * 2017-12-26 2020-12-01 上海展扬通信技术有限公司 一种音量调节方法、终端设备及计算机可读存储介质
US10950251B2 (en) * 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs
US10586546B2 (en) 2018-04-26 2020-03-10 Qualcomm Incorporated Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding
US10734006B2 (en) 2018-06-01 2020-08-04 Qualcomm Incorporated Audio coding based on audio pattern recognition
US10580424B2 (en) * 2018-06-01 2020-03-03 Qualcomm Incorporated Perceptual audio coding as sequential decision-making problems
CN108833324B (zh) * 2018-06-08 2020-11-27 天津大学 一种基于时域限幅噪声消除的haco-ofdm系统接收方法
CN108922556B (zh) * 2018-07-16 2019-08-27 百度在线网络技术(北京)有限公司 声音处理方法、装置及设备
WO2020207593A1 (en) * 2019-04-11 2020-10-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, apparatus for determining a set of values defining characteristics of a filter, methods for providing a decoded audio representation, methods for determining a set of values defining characteristics of a filter and computer program
CN110265043B (zh) * 2019-06-03 2021-06-01 同响科技股份有限公司 自适应有损或无损的音频压缩和解压缩演算方法
US11930230B2 (en) 2019-11-01 2024-03-12 Samsung Electronics Co., Ltd. Hub device, multi-device system including the hub device and plurality of devices, and operating method of the hub device and multi-device system

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1208489A (zh) * 1995-12-01 1999-02-17 数字剧场系统股份有限公司 采用心理声学自适应位分配方式的多通道预测子带编码器
CN1957398A (zh) * 2004-02-18 2007-05-02 沃伊斯亚吉公司 在基于代数码激励线性预测/变换编码激励的音频压缩期间低频加重的方法和设备

Family Cites Families (71)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4899384A (en) * 1986-08-25 1990-02-06 Ibm Corporation Table controlled dynamic bit allocation in a variable rate sub-band speech coder
JPH03181232A (ja) 1989-12-11 1991-08-07 Toshiba Corp 可変レート符号化方式
JP2560873B2 (ja) * 1990-02-28 1996-12-04 日本ビクター株式会社 直交変換符号化復号化方法
JPH0414355A (ja) 1990-05-08 1992-01-20 Matsushita Electric Ind Co Ltd 構内交換機のリンガ信号送出方法
JPH04168500A (ja) * 1990-10-31 1992-06-16 Sanyo Electric Co Ltd 信号符号化方法
JPH05114863A (ja) * 1991-08-27 1993-05-07 Sony Corp 高能率符号化装置及び復号化装置
JP3141450B2 (ja) 1991-09-30 2001-03-05 ソニー株式会社 オーディオ信号処理方法
EP0559348A3 (en) * 1992-03-02 1993-11-03 AT&T Corp. Rate control loop processor for perceptual encoder/decoder
JP3153933B2 (ja) * 1992-06-16 2001-04-09 ソニー株式会社 データ符号化装置及び方法並びにデータ復号化装置及び方法
JPH06348294A (ja) * 1993-06-04 1994-12-22 Sanyo Electric Co Ltd 帯域分割符号化装置
US5893065A (en) * 1994-08-05 1999-04-06 Nippon Steel Corporation Apparatus for compressing audio data
TW271524B (zh) * 1994-08-05 1996-03-01 Qualcomm Inc
KR0144011B1 (ko) * 1994-12-31 1998-07-15 김주용 엠펙 오디오 데이타 고속 비트 할당 및 최적 비트 할당 방법
DE19638997B4 (de) * 1995-09-22 2009-12-10 Samsung Electronics Co., Ltd., Suwon Digitales Toncodierungsverfahren und digitale Toncodierungsvorrichtung
JP3189660B2 (ja) 1996-01-30 2001-07-16 ソニー株式会社 信号符号化方法
JP3181232B2 (ja) 1996-12-19 2001-07-03 立川ブラインド工業株式会社 ロールブラインドのスクリーン取付装置
JP3328532B2 (ja) * 1997-01-22 2002-09-24 シャープ株式会社 デジタルデータの符号化方法
KR100261254B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
JP3802219B2 (ja) * 1998-02-18 2006-07-26 富士通株式会社 音声符号化装置
JP3515903B2 (ja) * 1998-06-16 2004-04-05 松下電器産業株式会社 オーディオ符号化のための動的ビット割り当て方法及び装置
JP4168500B2 (ja) 1998-11-04 2008-10-22 株式会社デンソー 半導体装置およびその実装方法
JP2000148191A (ja) * 1998-11-06 2000-05-26 Matsushita Electric Ind Co Ltd ディジタルオーディオ信号の符号化装置
TW477119B (en) * 1999-01-28 2002-02-21 Winbond Electronics Corp Byte allocation method and device for speech synthesis
JP2000293199A (ja) * 1999-04-05 2000-10-20 Nippon Columbia Co Ltd 音声符号化方法および記録再生装置
US6687663B1 (en) * 1999-06-25 2004-02-03 Lake Technology Limited Audio processing method and apparatus
US6691082B1 (en) 1999-08-03 2004-02-10 Lucent Technologies Inc Method and system for sub-band hybrid coding
JP2002006895A (ja) * 2000-06-20 2002-01-11 Fujitsu Ltd ビット割当装置および方法
JP4055336B2 (ja) * 2000-07-05 2008-03-05 日本電気株式会社 音声符号化装置及びそれに用いる音声符号化方法
JP4190742B2 (ja) 2001-02-09 2008-12-03 ソニー株式会社 信号処理装置及び方法
CN1244904C (zh) * 2001-05-08 2006-03-08 皇家菲利浦电子有限公司 声频信号编码方法和设备
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
KR100462611B1 (ko) * 2002-06-27 2004-12-20 삼성전자주식회사 하모닉 성분을 이용한 오디오 코딩방법 및 장치
US7272566B2 (en) * 2003-01-02 2007-09-18 Dolby Laboratories Licensing Corporation Reducing scale factor transmission cost for MPEG-2 advanced audio coding (AAC) using a lattice based post processing technique
FR2849727B1 (fr) * 2003-01-08 2005-03-18 France Telecom Procede de codage et de decodage audio a debit variable
JP2005202248A (ja) * 2004-01-16 2005-07-28 Fujitsu Ltd オーディオ符号化装置およびオーディオ符号化装置のフレーム領域割り当て回路
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
JP2005265865A (ja) * 2004-02-16 2005-09-29 Matsushita Electric Ind Co Ltd オーディオ符号化のためのビット割り当て方法及び装置
KR100695125B1 (ko) * 2004-05-28 2007-03-14 삼성전자주식회사 디지털 신호 부호화/복호화 방법 및 장치
US7725313B2 (en) * 2004-09-13 2010-05-25 Ittiam Systems (P) Ltd. Method, system and apparatus for allocating bits in perceptual audio coders
US7979721B2 (en) * 2004-11-15 2011-07-12 Microsoft Corporation Enhanced packaging for PC security
CN1780278A (zh) * 2004-11-19 2006-05-31 松下电器产业株式会社 子载波通信系统中自适应调制与编码方法和设备
KR100657948B1 (ko) * 2005-02-03 2006-12-14 삼성전자주식회사 음성향상장치 및 방법
DE202005010080U1 (de) 2005-06-27 2006-11-09 Pfeifer Holding Gmbh & Co. Kg Verbindungsvorrichtung
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7734053B2 (en) * 2005-12-06 2010-06-08 Fujitsu Limited Encoding apparatus, encoding method, and computer product
US8332216B2 (en) * 2006-01-12 2012-12-11 Stmicroelectronics Asia Pacific Pte., Ltd. System and method for low power stereo perceptual audio coding using adaptive masking threshold
JP2007264154A (ja) * 2006-03-28 2007-10-11 Sony Corp オーディオ信号符号化方法、オーディオ信号符号化方法のプログラム、オーディオ信号符号化方法のプログラムを記録した記録媒体及びオーディオ信号符号化装置
JP5114863B2 (ja) * 2006-04-11 2013-01-09 横浜ゴム株式会社 空気入りタイヤおよび空気入りタイヤの組立方法
SG136836A1 (en) * 2006-04-28 2007-11-29 St Microelectronics Asia Adaptive rate control algorithm for low complexity aac encoding
JP4823001B2 (ja) * 2006-09-27 2011-11-24 富士通セミコンダクター株式会社 オーディオ符号化装置
US7953595B2 (en) * 2006-10-18 2011-05-31 Polycom, Inc. Dual-transform coding of audio signals
KR101291672B1 (ko) * 2007-03-07 2013-08-01 삼성전자주식회사 노이즈 신호 부호화 및 복호화 장치 및 방법
WO2009029035A1 (en) * 2007-08-27 2009-03-05 Telefonaktiebolaget Lm Ericsson (Publ) Improved transform coding of speech and audio signals
HUE041323T2 (hu) 2007-08-27 2019-05-28 Ericsson Telefon Ab L M Eljárás és eszköz hangjel észlelési spektrális dekódolására, beleértve a spektrális lyukak kitöltését
CN101239368A (zh) 2007-09-27 2008-08-13 骆立波 异型盖整平模具及其整平方法
EP2082396A1 (en) * 2007-10-17 2009-07-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding using downmix
US8527265B2 (en) * 2007-10-22 2013-09-03 Qualcomm Incorporated Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs
EP2077551B1 (en) * 2008-01-04 2011-03-02 Dolby Sweden AB Audio encoder and decoder
US8831936B2 (en) * 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
US8364471B2 (en) 2008-11-04 2013-01-29 Lg Electronics Inc. Apparatus and method for processing a time domain audio signal with a noise filling flag
US8463599B2 (en) 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
CN102222505B (zh) * 2010-04-13 2012-12-19 中兴通讯股份有限公司 可分层音频编解码方法系统及瞬态信号可分层编解码方法
JP5575977B2 (ja) * 2010-04-22 2014-08-20 クゥアルコム・インコーポレイテッド ボイスアクティビティ検出
CN101957398B (zh) 2010-09-16 2012-11-28 河北省电力研究院 一种基于机电与电磁暂态混合仿真技术检测计算电网一次时间常数的方法
JP5609591B2 (ja) * 2010-11-30 2014-10-22 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
FR2969805A1 (fr) * 2010-12-23 2012-06-29 France Telecom Codage bas retard alternant codage predictif et codage par transformee
WO2012121638A1 (en) * 2011-03-10 2012-09-13 Telefonaktiebolaget L M Ericsson (Publ) Filing of non-coded sub-vectors in transform coded audio signals
JP5648123B2 (ja) * 2011-04-20 2015-01-07 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 音声音響符号化装置、音声音響復号装置、およびこれらの方法
MY164164A (en) * 2011-05-13 2017-11-30 Samsung Electronics Co Ltd Bit allocating, audio encoding and decoding
DE102011106033A1 (de) * 2011-06-30 2013-01-03 Zte Corporation Verfahren und System zur Audiocodierung und -decodierung und Verfahren zur Schätzung des Rauschpegels
RU2505921C2 (ru) * 2012-02-02 2014-01-27 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ и устройство кодирования и декодирования аудиосигналов (варианты)

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1208489A (zh) * 1995-12-01 1999-02-17 数字剧场系统股份有限公司 采用心理声学自适应位分配方式的多通道预测子带编码器
CN1957398A (zh) * 2004-02-18 2007-05-02 沃伊斯亚吉公司 在基于代数码激励线性预测/变换编码激励的音频压缩期间低频加重的方法和设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ITU-T G.719, Low-complexity, full-band audio coding for high-quality, conversational applications;Anonym;《TRANSMISSION SYSTEMS AND MEDIA, DIGITAL SYSTEMS AND NETWORKS Digital terminal equipments - Coding of analogue signals》;20080630;1-58 *
Jing Wang;Ning Ning;Ji, Xuan;Jingming Kuang.Perceptual Norm Adjustment with Segmental Weighted SMR for ITU-T G.719 Audio Codec.《Multimedia and Signal Processing (CMSP), 2011》.2011, *
Perception-based bit-allocation algorithms for audio coding;VORAN S;《APPLICATIONS OF SIGNAL PROCESSING TO AUDIO AND ACOUSTICS》;19971019;4 *

Also Published As

Publication number Publication date
US9711155B2 (en) 2017-07-18
TWI562133B (en) 2016-12-11
CN105825858B (zh) 2020-02-14
US20160035354A1 (en) 2016-02-04
KR20190138767A (ko) 2019-12-16
TW201301264A (zh) 2013-01-01
KR102193621B1 (ko) 2020-12-21
KR102053900B1 (ko) 2019-12-09
TWI562132B (en) 2016-12-11
EP2707875A4 (en) 2015-03-25
AU2018200360A1 (en) 2018-02-08
ZA201309406B (en) 2021-05-26
MX337772B (es) 2016-03-18
WO2012157931A2 (en) 2012-11-22
CN105825858A (zh) 2016-08-03
AU2018200360B2 (en) 2019-03-07
BR112013029347A2 (pt) 2017-02-07
RU2013155482A (ru) 2015-06-20
CN105825859A (zh) 2016-08-03
AU2016262702A1 (en) 2016-12-15
TWI576829B (zh) 2017-04-01
CN103650038A (zh) 2014-03-19
KR20210011482A (ko) 2021-02-01
RU2648595C2 (ru) 2018-03-26
KR20190139172A (ko) 2019-12-17
SG194945A1 (en) 2013-12-30
US9773502B2 (en) 2017-09-26
US9159331B2 (en) 2015-10-13
KR102053899B1 (ko) 2019-12-09
TW201715512A (zh) 2017-05-01
KR20120127334A (ko) 2012-11-21
US20170316785A1 (en) 2017-11-02
EP3346465A1 (en) 2018-07-11
US20160099004A1 (en) 2016-04-07
KR20200143332A (ko) 2020-12-23
KR20220004778A (ko) 2022-01-11
KR102209073B1 (ko) 2021-01-28
CA2836122A1 (en) 2012-11-22
US9489960B2 (en) 2016-11-08
TWI606441B (zh) 2017-11-21
MY164164A (en) 2017-11-30
US9236057B2 (en) 2016-01-12
MX2013013261A (es) 2014-02-20
US10276171B2 (en) 2019-04-30
RU2018108586A3 (zh) 2019-04-24
KR102491547B1 (ko) 2023-01-26
AU2012256550A1 (en) 2014-01-16
CA2836122C (en) 2020-06-23
EP2707874A4 (en) 2014-12-03
JP6726785B2 (ja) 2020-07-22
KR102409305B1 (ko) 2022-06-15
WO2012157932A2 (en) 2012-11-22
WO2012157931A3 (en) 2013-01-24
TWI604437B (zh) 2017-11-01
AU2016262702B2 (en) 2017-10-19
TW201250672A (en) 2012-12-16
KR20120127335A (ko) 2012-11-21
EP2707875A2 (en) 2014-03-19
JP2019168699A (ja) 2019-10-03
WO2012157932A3 (en) 2013-01-24
US10109283B2 (en) 2018-10-23
US20120288117A1 (en) 2012-11-15
US20120290307A1 (en) 2012-11-15
JP2017194690A (ja) 2017-10-26
JP6189831B2 (ja) 2017-08-30
KR102284106B1 (ko) 2021-07-30
BR112013029347B1 (pt) 2021-05-11
RU2018108586A (ru) 2019-02-26
US20180012605A1 (en) 2018-01-11
US20170061971A1 (en) 2017-03-02
EP2707874A2 (en) 2014-03-19
EP3385949A1 (en) 2018-10-10
TW201705124A (zh) 2017-02-01
MY186720A (en) 2021-08-12
TW201705123A (zh) 2017-02-01
MX345963B (es) 2017-02-28
CN105825859B (zh) 2020-02-14
AU2012256550B2 (en) 2016-08-25
RU2705052C2 (ru) 2019-11-01
EP3937168A1 (en) 2022-01-12
JP2014514617A (ja) 2014-06-19

Similar Documents

Publication Publication Date Title
CN103650038B (zh) 比特分配、音频编码和解码
US9589569B2 (en) Audio-encoding method and apparatus, audio-decoding method and apparatus, recoding medium thereof, and multimedia device employing same

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant