WO2009127133A1 - 音频处理方法及装置 - Google Patents

音频处理方法及装置 Download PDF

Info

Publication number
WO2009127133A1
WO2009127133A1 PCT/CN2009/070712 CN2009070712W WO2009127133A1 WO 2009127133 A1 WO2009127133 A1 WO 2009127133A1 CN 2009070712 W CN2009070712 W CN 2009070712W WO 2009127133 A1 WO2009127133 A1 WO 2009127133A1
Authority
WO
WIPO (PCT)
Prior art keywords
subband
bits
value
sub
audio processing
Prior art date
Application number
PCT/CN2009/070712
Other languages
English (en)
French (fr)
Inventor
张德明
张琦
Original Assignee
华为技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 华为技术有限公司 filed Critical 华为技术有限公司
Publication of WO2009127133A1 publication Critical patent/WO2009127133A1/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition

Definitions

  • the present invention relates to the field of audio processing technologies, and in particular, to an audio processing method and apparatus. Background technique
  • a perceptual coding method is mainly used.
  • This coding method utilizes the masking effect of the human ear, omits unnecessary information, and compresses the amount of information.
  • the audio mentioned here is a generalized concept, including signals such as voice and music.
  • the so-called masking effect of the human ear means that if the two sounds are close in time or frequency, the weaker sound will be covered by the stronger sound, and the human ear will only hear the stronger one.
  • the error signal can be artificially constructed in the quantization process of the audio coding. In this case, as long as the equivalent noise or distortion caused by the quantization error is not exceeded, the masking threshold is not exceeded.
  • the bit allocation mechanism in the existing audio processing is based on the psychoacoustic model, and the bit resources are configured according to the size of the masking threshold. A portion with a high masking value can allocate fewer bits, and a portion with a lower masking value needs to allocate more bits. Through the bit allocation mechanism, the bit resources can be effectively utilized, and the coding rate can be reduced as much as possible without affecting the auditory effect of the human ear, thereby realizing efficient coding.
  • the prior art proposes a bit allocation method in TDAC (Time Domain Alias
  • the MDCT Modified Discrete Cosine Transform
  • the frequency domain envelope value ie, the greater the energy
  • the bit allocation according to the perceptual importance ranking and the bit allocation using the binary search method of the reverse water filling principle.
  • Nbit(j) argmin b _ coef (_/ ⁇ ) x (ip(j) - ⁇ n b s ⁇ max
  • nbit(j) allocates the number of bits for the jth subband
  • nb_coef(j) is the number of MDCT coefficients included in the jth subband
  • nb_bits-max is the maximum number of bits that can be used for MDCT coefficient encoding
  • R is a quantization bit allocation table.
  • the specific search process is:
  • step 2) If there are still bit resources remaining after all the sub-bands are allocated according to step 2), the sub-bands are selected according to the perceived importance of the sub-bands from high to low, and bit allocation is performed for the selected sub-bands, and the sub-band is determined. The final number of bits in the band.
  • the prior art has the following problems:
  • the prior art scheme performs bit allocation by the binary search method of the reverse water filling principle, it is necessary to achieve multiple times through multiple cycles of searching.
  • the optimal allocation of bits is highly complex.
  • the technical problem to be solved by the embodiments of the present invention is to provide an audio processing method and apparatus, which can reduce the complexity of bit allocation.
  • the embodiment of the present invention provides an audio processing method, including: according to a frequency domain envelope value of a subband, and a modified discrete included in a subband
  • the number of cosine transform MDCT coefficients determines the allocation! ⁇ the initial value of the number of bits of the subband; the initial value of the number of bits allocated to each subband is matched with the value in the quantization bit allocation table, from which the quantization bit is obtained according to the matching result
  • the number of bits allocated to each subband is determined in the allocation table.
  • An embodiment of the present invention provides an audio processing apparatus, including: an initial value determining unit, configured to determine, according to a frequency domain packet of a subband, a number of modified discrete cosine transform MDCT coefficients included in a subband An initial value of the number of bits of the subband; an allocation unit, configured to match the initial value of the number of bits allocated to each subband with a value in the quantization bit allocation table, and determine an allocation from the quantization bit allocation table according to the matching result The number of bits given to each subband.
  • the scheme of the embodiment of the present invention allocates the sub-band to each sub-band by using a known quantization bit allocation table.
  • the initial value of the bit number is matched with the value in the known quantization bit allocation table, so that the complexity of the bit allocation can be greatly reduced, and the delay is small, and the system resources are small.
  • FIG. 1 is a flow chart of bit allocation in an audio processing method according to an embodiment of the present invention.
  • FIG. 2 is a flow chart of bit allocation at the encoding end in the audio processing method according to the second embodiment of the present invention
  • FIG. 3 is a flow chart of bit allocation at the decoding end in the third audio processing method according to the embodiment of the present invention
  • FIG. 4 is an audio processing device according to an embodiment of the present invention
  • Embodiments of the present invention provide an audio processing method for reducing the complexity of bit allocation in an encoding or decoding process.
  • a flowchart of a bit allocation in an audio processing method includes: 101. Sorting audio subbands according to frequency domain envelope values of subbands;
  • the perceptual importance ranking may not be performed.
  • the above bit allocation method can be adopted, and the following describes the encoding end and the decoding end separately.
  • a pre-set quantization coded bit table has been included.
  • the frequency domain envelope value of each sub-band obtained by the encoding is preprocessed, and the frequency domain envelope value is decremented by a slight amount according to the increment of the frequency band, that is, a decrement processing is performed, and the decrement is absolutely The value is incremented by the number of subbands.
  • the purpose of the pre-processing is to ensure that the low-frequency part is of higher importance than the high-frequency part when the low-frequency sub-band and the high-frequency sub-band have the same original energy. It should be noted that the pretreatment may not be performed.
  • the pre-processed frequency domain envelope values are sorted from large to small. The larger the frequency domain envelope value, the more important the perceptual importance.
  • each subband is quantized according to the result of bit allocation; the quantized frequency domain envelope value information is input into the code stream, and the quantized subband MDCT coefficient information is quantized.
  • the code stream is input from high to low according to importance, and is transmitted.
  • the process of performing bit allocation on the decoding end in the method of the embodiment of the present invention is basically the same as the process of the encoding end, and mainly includes:
  • the MDCT coefficient information of each sub-band is correspondingly read out from the code stream.
  • FIG. 2 it is a flow chart of bit allocation at the encoding end in the audio processing method according to the second embodiment of the present invention.
  • FIG. 2 includes:
  • ⁇ og_rms(i) ⁇ og_rms(i)- £ ⁇ where is an incremental amount associated with i, set in this example
  • the value of f here is only an example but not limited to this.
  • the purpose of the pre-processing is to ensure that the low-frequency part is of higher importance than the high-frequency part when the low-frequency sub-band and the high-frequency sub-band have the same original energy.
  • the pre-processing is to make a slight decrement of the frequency domain envelope value, and other methods can be used to ensure that when the low-frequency sub-band and the high-frequency sub-band have the same original energy, the low-frequency part is higher than the high-frequency part. Part is of higher importance.
  • pretreatment may not be performed.
  • the sub-bands are sorted in descending order, and the corresponding sorting result of each sub-band is ⁇ ].
  • the sub-bands are sorted in descending order according to the frequency domain envelope values.
  • bit _ rms i) over _ rmsg x log — rms i) xnb_ coef (i)
  • Wr_r ⁇ g is the perceptual weighting factor.
  • the number of allocated bits is relatively small; the smaller the value, the more the bit allocation scheme tends to be averaged.
  • the value is equal to the extreme case 0, the number of bits allocated for the important and important sub-bands is the same, that is, the whole
  • the bit allocation scheme does not take into account the perceived importance and performs an even distribution.
  • OV er_mmg ( 75 is taken as an example, but is not limited thereto. It should be noted that the perceptual weighting factor may not be considered at this time.
  • the set is searched for the closest value to the initially determined number of bits, and this value is used as the bit allocation number of the determined subband.
  • bit allocation number of the subband is determined.
  • step 205 If the bit allocation is performed after the bit allocation table is matched, the remaining bit resources are redistributed according to the perceived importance of the subband.
  • the process of step 205 is as follows:
  • the following steps are repeated: 2051.
  • the MDCT coefficients are quantized and encoded, and the quantized frequency domain envelope value information is added to the coded code stream, and the quantized coded information of the MDCT coefficients is added to the coded code stream in descending order of importance.
  • Figure 2 mainly describes the method of the encoding end.
  • the decoded bit allocation is also the same principle, and the process is similar to the processing of the encoding end.
  • FIG. 3 it is a flow chart of bit allocation at the decoding end in the audio processing method according to the third embodiment of the present invention, which includes:
  • ⁇ og_ rms ⁇ i) ⁇ og_ rms ⁇ i) - e ⁇
  • f is the value here. It is only an example but not limited to this.
  • the purpose of the pre-processing is to ensure that the low-frequency portion is of higher importance than the high-frequency portion when the low-frequency sub-band and the high-frequency sub-band have the same original energy.
  • the pre-processing is to make a slight decrement of the frequency domain envelope value, and other methods can be used to ensure that when the low-frequency sub-band and the high-frequency sub-band have the same original energy, the low-frequency part is higher than the high-frequency part. Part is of higher importance.
  • pretreatment may not be performed.
  • the sub-bands are sorted in descending order.
  • the corresponding sorting result of each sub-band is that the larger the frequency domain envelope value is, the smaller the corresponding is, the more important the perceptual importance is. .
  • the sub-bands are sorted in descending order according to the frequency domain envelope values.
  • bit _ rms(i) over _ rmsg x log_ rms(i) nb _ coef ( ), where ov — is the perceptual weighting factor.
  • ov is the perceptual weighting factor.
  • bit allocation number of the subband is determined.
  • step 305 After the bit allocation table matching is performed, and the bit resources remain, the remaining bit resources are reallocated according to the perceived importance of the sub-bands.
  • the process of step 305 is as follows:
  • an embodiment of the present invention provides an audio processing device.
  • FIG. 4 it is a schematic structural diagram of an audio processing device according to an embodiment of the present invention.
  • the audio processing device includes: an initial value determining unit 402, and an allocating unit 403.
  • the initial value determining unit 402 is configured to determine an initial value of the number of bits allocated to each subband according to the frequency domain envelope value of the subband and the number of MDCT coefficients included in the subband.
  • the allocating unit 403 is configured to match the initial value of the number of bits allocated to each subband with a value in a known quantization bit allocation table, and determine, according to the matching result, the allocation to each subband from the quantization bit allocation table. The number of bits.
  • the audio processing device further includes a sorting unit 401 for sub-band sorting the perceptual importance according to the frequency domain envelope values of the sub-bands.
  • the audio processing device further includes: a pre-processing unit 404.
  • the pre-processing unit 404 is configured to perform a decrement processing on the frequency domain envelope value of the sub-band, and the absolute value of the decrement is incremented according to the increment of the sub-band sequence number; the sorting unit 401 from the pre-processing unit 404 Get the frequency domain envelope value of the subband.
  • the initial value determining unit 402 of the audio processing device may include: a first calculating unit 4021 and a first processing unit 4022.
  • the first calculating unit 4021 determines the theoretical value of the number of bits according to the frequency domain of the subband and the number of modified discrete cosine transform MDCT coefficients included in the subband.
  • the first processing unit 4022 is configured to use the theoretical number of bits as the initial value of the number of bits allocated to each subband.
  • the initial value determining unit 402 of the audio processing device may include: a second calculating unit 4023, Second processing unit 4024.
  • the second calculating unit 4023 is configured to determine a bit number theoretical value according to the frequency domain of the subband, the number of MDCT coefficients included in the subband, and determine the bit according to the theoretical value of the bit number and the number of bits available for allocation. The actual value.
  • the second processing unit 4024 is configured to use the bit number actual value as an initial value of the number of bits allocated to each subband.
  • the initial value determining unit 402 further includes: a weighting factor adjusting unit 4025.
  • the weighting factor adjustment unit 4025 is configured to adjust the initial value of the number of bits of the sub-band by the weighting factor.
  • the weighting factor adjustment unit 4025 may specifically adjust the initial value of the number of bits allocated to each sub-band by a weighting factor in the calculation process of the first calculating unit 4021 or the second calculating unit 4023 described above.
  • the allocation unit 403 includes: a search unit 4031, an allocation value determining unit 4032.
  • the search unit 4031 is configured to search from the quantization bit allocation table for a value closest to the initial value of the number of bits allocated to each sub-band.
  • the assigned value determining unit 4032 is configured to determine the value obtained by the search as the number of bits allocated to the sub-band.
  • the audio processing device further includes: an adjustment unit 405.
  • the adjusting unit 405 is configured to: when there is a remaining bit resource, select a sub-band from the sorting unit 401 according to the perceptual importance, perform bit re-allocation for the selected sub-band, and determine a final bit number of each sub-band, Specifically, in the known quantization bit allocation table, re-searching for the selected subband to the number of bits allocated to the subband, the re-searching for the number of bits allocated to the subband and the allocation unit 403 The difference in the number of bits allocated to the subband is less than or equal to the difference between the number of bits available for allocation and the number of allocated bits.
  • the adjustment unit 405 specifically selects the sub-bands from the sorting unit 401 from high to low in terms of perceived importance.
  • the audio processing device may be arranged at the encoder for bit allocation or may be arranged in the decoder for bit allocation.
  • the scheme allocates the bit allocated to each subband by using a known quantization bit allocation table.
  • the initial value is matched with the value in the known quantization bit allocation table, so that the complexity of the bit allocation can be greatly reduced, and the delay is small, and the system resources are small.
  • the weighting factor used for adjustment not only makes full use of the assignable bit resources, but also takes into account the different perceptual importance of each subband, and uses the weighting factor to adjust the relative bit allocation of subbands whose perceptual importance is important and unimportant. Therefore, the problem of improper bit allocation existing in the prior art is better solved.
  • the frequency domain envelope value of the subband is preprocessed to ensure that when the low frequency subband and the high frequency subband have the same original energy, the low frequency part is more important than the high frequency part. Sex.
  • the software for implementing the embodiment of the present invention may be stored in a computer readable storage medium, and when executed, the software includes the following steps:: modifying the discrete cosine transform included in the subband according to the frequency domain of the subband
  • the number of MDCT coefficients determines an initial value of the number of bits allocated to each subband; the initial value of the number of bits allocated to each subband is matched with the value in the quantization bit allocation table, and the allocation is determined from the quantization bit allocation table The number of bits given to each subband.
  • the storage medium may be a Rom/Ram, a magnetic disk, an optical disk, or the like.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

音频处理方法及装置
本申请要求于 2008 年 4 月 18 日提交中国专利局、 申请号为 200810087594.9、 发明名称为 "音频处理方法及装置" 的中国专利申请的优先 权, 其全部内容通过引用结合在本申请中。
技术领域
本发明涉及音频处理技术领域, 具体涉及一种音频处理方法及装置。 背景技术
目前的音频处理技术中主要采用感知编码方法,这种编码方法利用人耳的 掩蔽效应, 省略不必要的信息, 压缩信息量。 这里所说的音频, 是一个广义概 念, 包含语音、 音乐等信号。 所谓人耳的掩蔽效应, 是指如果两个声音在时间 或者频率上比较接近, 那么较弱的声音会被较强的声音所遮盖,这时人耳将只 能听到较强的那个声音。根据掩蔽效应的性质,在音频编码的量化过程中可以 人为构造误差信号,此时只要保证量化误差带来的等效噪声或者失真不超过掩 蔽阔值。
现有的音频处理中的比特分配机制是在心理声学模型的基础上,根据掩蔽 阔值的大小进行比特资源的配置。掩蔽阔值高的部分可以分配较少的比特,掩 蔽阔值低的部分需要分配较多的比特。通过比特分配机制,可以有效地利用比 特资源,在不影响人耳听觉效果的基础上尽可能的减小编码码率, 实现高效率 的编码。
现有技术提出一种比特分配方法 , 在 TDAC ( Time Domain Alias
Cancelling,时域混叠消除)进行编码时,将 0〜7000Hz频带内的 MDCT( Modified Discrete Cosine Transform, 修正离散余弦变换) 系数分成了 18个子带, 按照 每个子带的频域包络值的大小进行感知重要性排序,频域包络值越大(即能量 越大), 感知重要性越重要, 然后根据感知重要性排序进行比特分配, 利用反 向填水原则的二分搜索法实现比特分配。 具体过程如下:
1 ) 按感知重要性对子带排序, 每个子带的感知重要性定义为
Figure imgf000003_0001
, 其中 rms— indx(j)是子带 j的频域包络值的量化能量对应 的编码索引值, 也表示子带能量的大小。 2 )利用反向填水原则的二分搜索法实现比特分配: a、 通过二分搜索法发现 "水
nbit(j) = argmin b _ coef (_/·) x (ip(j) - ~ n b smax
r&R I
Figure imgf000004_0001
。 其中, nbit(j)为第 j个子带分配比特数, nb— coef(j)为第 j个子带内包含的 MDCT系数的个数, nb— bits— max为最大可用于 MDCT系数编码的比特数, R是 一个量化比特分配表。
具体搜索过程为: 的搜索范围为
Figure imgf000004_0002
搜索 =Α±
次数为 10次。 首先令 ― 2 , 将其作为 代入公式 1 , 然后, 如果
∑"b O < "b—bits—丽 , 则 = , 再循环进行本步骤; 如果 ∑"b > "b—bits—丽 , 则 4 = , 再循环进行本步骤。 b、 找到 "水位" 后, 根据公式 1计算每个子带分配的比特数。
3 )如果对所有子带按照步骤 2 )分配比特完成后仍有比特资源剩余, 再根 据子带的感知重要性从高到低选择子带, 为选择的子带再进行比特分配,确定 该子带的最终比特数。
在对现有技术的研究和实践过程中, 发明人发现现有技术存在以下问题: 现有技术方案通过反向填水原则的二分搜索法进行比特分配时,需要通过 多次循环多次搜索达到比特的最优分配, 复杂度高。
发明内容
本发明实施例要解决的技术问题是提供一种音频处理方法及装置,能够降 低比特分配的复杂度。
为解决上述技术问题, 本发明所提供的实施例是通过以下技术方案实现: 本发明实施例提供一种音频处理方法, 包括: 根据子带的频域包络值、 子 带内包含的修正离散余弦变换 MDCT系数个数确定分配! ^个子带的比特数 初始值;将所述分配给每个子带的比特数初始值与量化比特分配表中的数值进 行匹配, 根据匹配结果从所述量化比特分配表中确定分配给每个子带的比特 数。 本发明实施例提供一种音频处理装置, 包括: 初始值确定单元, 用于才艮据 子带的频域包^^直、 子带内包含的修正离散余弦变换 MDCT系数个数确定分 配给每个子带的比特数初始值; 分配单元, 用于将所述分配给每个子带的比特 数初始值与量化比特分配表中的数值进行匹配,根据匹配结果从所述量化比特 分配表中确定分配给每个子带的比特数。
上述技术方案可以看出,本发明实施例方案根据子带本身的包络特征确定 分配给每个子带的比特数初始值后, 利用已知的量化比特分配表,将所述分配 给每个子带的比特数初始值与已知的量化比特分配表中的数值进行匹配,从而 可以大大减小比特分配的复杂度, 并且延时小, 占用系统资源少。
附图说明
图 1是本发明实施例一音频处理方法中的比特分配流程图;
图 2是本发明实施例二音频处理方法中在编码端的比特分配流程图; 图 3是本发明实施例三音频处理方法中在解码端的比特分配流程图; 图 4是本发明实施例音频处理装置结构示意图。
具体实施方式
本发明实施例提供了一种音频处理方法,用于在编码或解码过程中降低比 特分配的复杂度。
请参阅图 1,是本发明实施例一音频处理方法中的比特分配流程图, 包括: 101、 将音频的子带按照子带的频域包络值进行感知重要性排序;
102、根据子带的频域包络值、 子带内包含的 MDCT系数个数确定分配给 每个子带的比特数初始值;
103、 将所述分配给每个子带的比特数初始值与已知的量化比特分配表中 的数值进行匹配 , 从所述量化比特分配表中确定分配给每个子带的比特数。
需要说明的是, 实施例一中也可以不进行感知重要性排序。
在编码或解码的过程中,都可以采用上述的比特分配方法, 以下内容对编 码端和解码端分开说明。在编码端和解码端, 已经含有预先设置好的量化编码 比特表。
本发明实施例比特分配方法中在编码端的过程主要包括:
( 1 )、 对每个子带频域包络值进行预处理; 子带的频域包络值和子带的能量值是相对应的。 该步骤中, 对编码得到 的每个子带频域包络值进行预处理,按照频带的递增,对频域包络值做一个微 小量的递减, 即作一个减量处理, 该减量的绝对值按子带序号的增加而递增。 预处理的目的是为了确保当低频子带和高频子带有相同的原始能量时,低频部 分比高频部分有更高的重要性。 需要说明的是, 也可以不进行预处理。
( 2 )、 根据预处理后的频域包络值对子带进行感知重要性排序;
对预处理后的频域包络值按从大到小进行排序,频域包络值越大,感知重 要性越重要。
( 3 )、 初步确定分配给每个子带的比特数;
根据每个子带频域包络值、子带内包含的 MDCT系数的个数和已知的可用 于 MDCT系数编码的比特数, 初步确定分配给每个子带的比特数, 并且根据感 知加权因子调整感知重要的子带和感知不重要的子带之间的相对比特分配。
需要说明的是, 可以不考虑已知的可用于 MDCT系数编码的比特数, 也可 以不考虑加权因子。
( 4 )、将初步确定的每个子带的比特数与已知的量化编码比特表格中的数 值相匹配, 找到最接近初步确定的比特数的数值;
( 5 )、若进行量化比特匹配之后还有剩余的比特资源,再根据子带的感知 重要性, 进行再分配, 确定每个子带的最终比特数。
按上述过程得到最终的比特分配结果后,对每个子带按照比特分配的结果, 进行量化编码; 将经过量化编码的频域包络值信息输入码流,将量化编码后的 子带 MDCT系数信息按重要性从高到低输入码流, 进行传输。
本发明实施例方法中在解码端进行比特分配的过程与编码端的处理过程 基本相同, 主要包括:
( 1 )、 从码流中解码获得子带的频域包络值;
( 2 )、 采用与前面编码端的流程中的 (1 ) 〜(5 ) 步骤相同的方法进行比 特分配;
( 3 )、根据比特分配的结果, 从码流中相应的读取出每个子带的 MDCT系 数信息。
以下进一步介绍本发明实施例方案。 请参阅图 2, 是本发明实施例二音频处理方法中在编码端的比特分配流程 图。
在编码端 , 通过编码流程得到的一组 M点 MDCT系数被划分为 N个子带 band , 每个子 带 内 包含的 MDCT 系 数的 个数为 nb—coe , ∑«b_coe ( = ^ = 0,...,N-l , 每个子带的频域包络值为 log— 频域包络 值和本子带的能量值相对应, 编码端可用于 MDCT系数量化的比特数为 nb_bits_max 图 2中包括:
201、 对编码后得到的每个子带频域包络值进行预处理; 对编码后得到 的每个子带的频域包络值进行预处理:
\og_rms(i) = \og_rms(i)-£ ^ 其中 是一个和 i相关的递增微小量, 本实施例中设为
£· = 2χ 0.002, 需说明的是, 此处 f取值只是举例说明但不局限于此。 预处理的目的是为了确保当低频子带和高频子带有相同的原始能量时,低 频部分比高频部分有更高的重要性。本发明实施例中预处理是以对频域包络值 做一个微量的递减举例说明 ,也可以通过其他方式确保当低频子带和高频子带 有相同的原始能量时, 低频部分比高频部分有更高的重要性。
需要说明的是, 也可以不进行预处理。
202、 根据预处理后的频域包络值对子带进行感知重要性排序;
根据预处理后的频域包络值,按从大到小的顺序对子带进行排序,每个子 带相应的排序结果为 ^ ], 频域包络值越大, 相应的 越小, 感知重要性 越重要。
如果没有进行预处理, 则直接根据频域包络值, 按从大到小的顺序对子带 进行排序。
203、 初步确定分配给每个子带的比特数;
首先,子带内每个 MDCT系数理论上应分配的比特数直接由该子带的频域 包络值所 决 定 , 每个子 带 理论上应 分 配 的 比 特数为 : bit _ rms i) = over _ rmsg x log— rms i) xnb_ coef (i)
其中。wr— r^g是感知加权因子, 该值越大则比特分配方案越趋于极端, 即感知重要性越重要的子带所分配的比特数相对越多 ,感知重要性越不重要的 子带分配的比特数相对越少; 该值越小则比特分配方案越趋于平均, 当该值等 于极端情况 0时, 感知重要性为重要和不重要的子带所分配的比特数相同, 即 整个比特分配方案不考虑感知重要性, 进行了平均分配。 本实施例中以 OVer_mmg = ( 75为例说明但不局限于此。 需要说明的是,此时也可以不考虑感 知加权因子。
其次, 考虑实际应用情况, 计算每个子带实际可分配的比特数, 作为初步 确定分配给每个子带的比特数:
nb bits max ^bit _rms i) bat _ opt(i) = [——― ― h over _ remsg x log— rms(i) -― ― ] xnb_ coef ( )
― M ~ ~ M _ 。 该式中考虑了实际可用于 MDCT系数量化的比特数和理论上应分配的比 特数, 因此更为实用。 观察该式, 可以发现∑ ^— (0 = "6- — max , 既充分 利用了可分配的比特资源, 又考虑到了每个子带不同的感知重要性, 而且可以 利用感知加权因子。 ver-^ ^对感知重要性为重要和不重要的子带的相对比特 分配进行调整,确保在感知重要性重要的子带已经分配了足够的比特资源之后 不再占用更多的比特资源 ,而感知重要性略不重要的子带也能分配到一定的比 特资源 ,从而较好解决现有技术中存在的比特分配不当的问题。需要说明的是, 计算实际可分配的比特数时也可以不考虑感知加权因子。 另外,也可以直接采 此时, 计算得到的每个子带的比特数是一个实数。
204、 将初步确定的每个子带的比特数与量化编码比特分配表匹配, 确定 每个子带的比特分配数;
在编码端, 已经预先设置有固定的量化编码比特表, 即已知一个可能的比 特分配集合 ? = ¼— , — ,···},其中 2— <q— bi <"'。 那么, 通过前面步骤 初步确定每个子带的比特数后 ,在该集合中搜索与初步确定的比特数最接近的 数值, 将该数值作为确定的子带的比特分配数。 进行比特分配表匹配之后,每个子带分配的比特数为: bat—b = q—bitk, ^ q—bit k = argmm q bit k - bat _opt{i)\
中 ― q_b' R ― ― , 则 已 消 耗 的 比 特 资 源 allocatedUts = ^ bat _bit{i), ^ allocatedbits≤ nb bits max
205、 如果还有比特资源剩余, 将剩余的比特资源按子带的感知重要性进 行再分配, 确定子带的最终比特分配数。
如进行了比特分配表匹配之后,还有比特资源剩余, 则将剩余的比特资源 按子带的感知重要性进行再分配 , 步骤 205的过程如下:
allocatedbits < nb— bits— max且 o≤ < N , 则重复进行以下步骤: 2051、 按照感知重要性从重要到不重要的顺序选择子带 ; 2052、 已知该子带已分配的比特数为 (。W[Z']) = ?- 则如果增加其 分配的比特数, 考虑到已知的可能比特分配集合 R, 该子带分配的比特数应为 q _ bitk+1 且满足以下条件 · 如果 allocatedbits + q _bitsk+1 - q _bitsk < nb_ bits _ max 贝!] bat _bit(ord[i]) = q_bitk+l allocatedbits - allocatedbits + q—bits k^— q—bits k 否贝 bat _bit(ord[i]) = q—bitk 按上述过程得到最终的比特分配结果^ ^- ' )后, 对每个子带的一组
MDCT系数进行量化编码, 将量化编码后的频域包络值信息加入编码码流, 将 MDCT系数的量化编码信息按照重要性从高到低的顺序加入编码码流。
图 2主要描述的是编码端的方法, 对于解码端而言, 其解码后的比特分配 也是相同的原理, 过程与编码端的处理过程类似。
请参阅图 3, 是本发明实施例三音频处理方法中在解码端的比特分配流程 图, 包括:
301、 对解码后得到的每个子带频域包络值进行预处理;
从接收到的码流中读取频域包络值信息, 解码得到一组频域包络值 \og_rms{i) , 已知可用于 MDCT系数量化的比特数为 "b—bits 对解码后得到 的每个子带的频域包络值进行预处理:
\og_ rms{i) = \og_ rms{i) - e ^ 其中 是一个和 i相关的递增微小量, 本实施例中设 为 £ = 2 x0.002 , 需说明的是, 此处 f取值只是举例说明但不局限于此。
预处理的目的是为了确保当低频子带和高频子带有相同的原始能量时,低 频部分比高频部分有更高的重要性。本发明实施例中预处理是以对频域包络值 做一个微量的递减举例说明,也可以通过其他方式确保当低频子带和高频子带 有相同的原始能量时, 低频部分比高频部分有更高的重要性。
需要说明的是, 也可以不进行预处理。
302、 根据预处理后的频域包络值对子带进行感知重要性排序;
根据预处理后的频域包络值,按从大到小的顺序对子带进行排序,每个子 带相应的排序结果为 频域包络值越大, 相应的 越小, 感知重要性 越重要。
如果没有进行预处理, 则直接根据频域包络值,按从大到小的顺序对子带 进行排序。
303、 初步确定分配给每个子带的比特数;
首先,子带内每个 MDCT系数理论上应分配的比特数直接由该子带的频域 包 络值 所 决 定 , 每个 子 带 理论上应 分配 的 比 特数为 : bit _ rms(i) = over _ rmsg x log_ rms(i) nb _ coef ( ), 其中 ov — 是感知力口权因子, 该值越大则比特分配方案越趋于极端,即感知重要性越重要的子带所分配的比 特数相对越多,感知重要性越不重要的子带分配的比特数相对越少; 该值越小 则比特分配方案越趋于平均, 当该值等于极端情况 0时, 感知重要性为重要和 不重要的子带所分配的比特数相同, 即整个比特分配方案不考虑感知重要性, 进行了平均分配。本实施例中以。 ν^- ^ = 75为例说明但不局限于此。 需要 说明的是, 此时也可以不考虑感知加权因子。
其次, 考虑实际应用情况, 计算每个子带实际可分配的比特数, 作为初步 确定分配给每个子带的比特数:
, ,.、 rnb bits max , ,.、 Y bit _rms(i)
bat _ opt i) = [—— = = l· over _ remsg x log— rms{i) -―—— J xnb _ coef (i)
― M — — M — 该式中考虑了实际可用于 MDCT系数量化的比特数和理论上应分配的比 特数, 因此更为实用。 观察该式, 可以发现∑ ^— (0 = "6- — max , 既充分 利用了可分配的比特资源, 又考虑到了每个子带不同的感知重要性, 而且可以 利用感知加权因子。 ver-^ ^对感知重要性为重要和不重要的子带的相对比特 分配进行调整,确保在感知重要性重要的子带已经分配了足够的比特资源之后 不再占用更多的比特资源,而感知重要性略不重要的子带也能分配到一定的比 特资源 ,从而较好解决现有技术中存在的比特分配不当的问题。需要说明的是, 计算实际可分配的比特数时也可以不考虑感知加权因子。 另外,也可以直接采 此时, 计算得到的每个子带的比特数是一个实数。
304、 将初步确定的每个子带的比特数与量化编码比特分配表匹配, 确定 每个子带的比特分配数;
在解码端, 与在编码端一样, 已经预先设置有固定的量化编码比特表, 即 已知一个可能的比特分配集合 W = — 。,?— bz ..},其中?— 。 < <…。那么, 通过前面步骤初步确定每个子带的比特数后,在该集合中搜索与初步确定的比 特数最接近的数值 , 将该数值作为确定的子带的比特分配数。
进行比特分配表匹配之后,每个子带分配的比特数为: bat—b = q—bitk, ^ 中
Figure imgf000011_0001
, 则 已 消 耗 的 比 特 资 源 allocatedbits = _ bat _bit(i) , ^ allocatedb its < nb— bits _ max
305、 如果还有比特资源剩余, 将剩余的比特资源按子带的感知重要性进 行再分配, 确定子带的最终比特分配数。
如进行了比特分配表匹配之后,还有比特资源剩余, 则将剩余的比特资源 按子带的感知重要性进行再分配, 步骤 305的过程如下:
如 allocatedbits < "b— b fc— max且 o≤ i〈N , 则重复进行以下步骤:
3051、 按照感知重要性从重要到不重要的顺序选择子带 ; 3052、 已知该子带已分配的比特数为^ - δζΥ( ζ']) = -δ ,则如果增加其 分配的比特数, 考虑到已知的可能比特分配集合 R, 该子带分配的比特数应为 q_bitk+1 且满足以下条件. ^t alloca dbits + q—bits k+ - q— bits k≤ nb—bits—max 贝 ij bat
Figure imgf000012_0001
= q _bitk+1 allocatedbits― allocatedbits + q _bitsk+l—q—bitsk 否 贝 ij bat _bit(ord[i]) = q—bitk 当得到最终的每个子带分配的比特数后,根据得到的最终的每个子带分配 的比特数^ -^(0和子带的感知重要性排序。 WW , 依次从接收到的码流中读 取每个子带的 MDCT系数量化编码的结果, 对其进行解码得到 MDCT系数。
上述内容伴细介绍了本发明实施例音频处理方法,相应的,本发明实施例 提供一种音频处理装置。
请参阅图 4, 是本发明实施例音频处理装置结构示意图。
如图 4所示, 音频处理装置包括: 初始值确定单元 402、 分配单元 403。 初始值确定单元 402, 用于根据子带的频域包络值、 子带内包含的 MDCT 系数个数确定分配给每个子带的比特数初始值。
分配单元 403 , 用于将所述分配给每个子带的比特数初始值与已知的量化 比特分配表中的数值进行匹配 ,根据匹配结果从所述量化比特分配表中确定分 配给每个子带的比特数。
音频处理装置进一步包括排序单元 401 , 用于将子带按照子带的频域包络 值进行感知重要性排序。
音频处理装置进一步包括: 预处理单元 404。
预处理单元 404, 用于将子带的频域包络值作一个减量处理, 所述减量的 绝对值按子带序号的增加而递增;所述排序单元 401从所述预处理单元 404获取 子带的频域包络值。
音频处理装置的初始值确定单元 402可以是包括: 第一计算单元 4021、 第 一处理单元 4022。
第一计算单元 4021 ,根据子带的频域包^ ^直、子带内包含的修正离散余弦 变换 MDCT系数个数确定比特数理论值。
第一处理单元 4022,用于将所述比特数理论值作为分配给每个子带的比特 数初始值。
音频处理装置的初始值确定单元 402可以是包括: 第二计算单元 4023、 第 二处理单元 4024。
第二计算单元 4023 , 用于根据子带的频域包^^直、 子带内包含的 MDCT系 数个数确定比特数理论值,根据所述比特数理论值及可用于分配的比特数确定 比特数实际值。
第二处理单元 4024,用于将所述比特数实际值作为分配给每个子带的比特 数初始值。 初始值确定单元 402进一步包括: 加权因子调整单元 4025。
加权因子调整单元 4025,用于通过加权因子调整分配! ^个子带的比特数 初始值。加权因子调整单元 4025具体可以在上述的第一计算单元 4021或第二计 算单元 4023的计算过程中 , 通过加权因子调整分配给每个子带的比特数初始 值。
所述分配单元 403包括: 搜索单元 4031、 分配值确定单元 4032。
搜索单元 4031 ,用于从所述量化比特分配表中搜索与所述分配给每个子带 的比特数初始值最接近的数值。
分配值确定单元 4032 , 用于将搜索得到的数值确定为分配给子带的比特 数。
音频处理装置进一步包括: 调整单元 405。
调整单元 405, 用于发现还有比特资源剩余时, 按感知重要性从所述排序 单元 401中选择子带, 为所述选择的子带进行比特再分配, 确定每个子带的最 终比特数, 具体为: 在所述已知的量化比特分配表中, 为所述选择的子带重新 搜索分配给该子带的比特数,所述重新搜索分配给该子带的比特数与所述分配 单元 403已分配给该子带的比特数的差值小于或等于可用于分配的比特数与已 分配比特数的差值。 调整单元 405具体是按感知重要性从高到低从所述排序单 元 401中选择子带。
所述音频处理装置可以设置在编码器进行比特分配,也可以是设置在解码 器中进行比特分配。
综上所述,本发明实施例方案根据子带本身的包络特征确定分配给每个子 带的比特数初始值后, 利用已知的量化比特分配表,将所述分配给每个子带的 比特数初始值与已知的量化比特分配表中的数值进行匹配,从而可以大大减小 比特分配的复杂度, 并且延时小, 占用系统资源少。 进一步的 ,本发明实施例方案中确定分配给每个子带的比特数初始值时综 合考虑了子带的频域包络值、 子带内包含的 MDCT系数个数、 可用于分配的比 特数及用于调整的加权因子, 既充分利用了可分配的比特资源, 又考虑到了每 个子带不同的感知重要性,利用加权因子对感知重要性为重要和不重要的子带 的相对比特分配进行调整,从而较好解决现有技术中存在的比特分配不当的问 题。
进一步的,本发明实施例方案中对子带的频域包络值进行预处理,确保当 低频子带和高频子带有相同的原始能量时,低频部分比高频部分有更高的重要 性。
另外, 实现本发明实施例的软件可以存储于一计算机可读存储介质中,该 软件在执行时, 包括以下步骤: 根据子带的频域包^ ^直、 子带内包含的修正离 散余弦变换 MDCT系数个数确定分配给每个子带的比特数初始值;将所述分配 给每个子带的比特数初始值与量化比特分配表中的数值进行匹配,从所述量化 比特分配表中确定分配给每个子带的比特数。 所述的存储介质可以为 Rom/Ram, 磁盘, 光盘等。
以上对本发明实施例所提供的一种音频处理方法及装置进行了详细介绍 , 对于本领域的一般技术人员,依据本发明实施例的思想,在具体实施方式及应 用范围上均会有改变之处, 综上所述,本说明书内容不应理解为对本发明的限 制。

Claims

权 利 要 求
1、 一种音频处理方法, 其特征在于, 包括:
根据子带的频域包络值、 子带内包含的修正离散余弦变换 MDCT系数个 数确定分配给每个子带的比特数初始值;
将所述分配给每个子带的比特数初始值与量化比特分配表中的数值进行 匹配 , 根据匹配结果从所述量化比特分配表中确定分配给每个子带的比特数。
2、 根据权利要求 1所述的音频处理方法, 其特征在于, 所述确定分配给 每个子带的比特数初始值之前进一步包括:
将子带按照子带的频域包络值进行感知重要性排序。
3、 根据权利要求 2所述的音频处理方法, 其特征在于, 所述将子带按照 子带的频域包络值进行感知重要性排序之前进一步包括:将子带的频域包络值 作一个减量处理, 所述减量的绝对值按子带序号的增加而递增。
4、 根据权利要求 2所述的音频处理方法, 其特征在于, 所述根据子带的 频域包 直、子带内包含的修正离散余弦变换 MDCT系数个数确定分配! ^个 子带的比特数初始值包括:
根据子带的频域包络值、 子带内包含的修正离散余弦变换 MDCT系数个 数确定比特数理论值,将所述比特数理论值作为分配给每个子带的比特数初始 值。
5、 根据权利要求 2所述的音频处理方法, 其特征在于, 所述根据子带的 频域包 直、子带内包含的修正离散余弦变换 MDCT系数个数确定分配! ^个 子带的比特数初始值包括:
根据子带的频域包络值、 子带内包含的 MDCT系数个数确定比特数理论 比特数实际值作为分配给每个子带的比特数初始值。
6、 根据权利要求 4或 5所述的音频处理方法, 其特征在于:
进一步包括通过加权因子调整分配给每个子带的比特数初始值。
7、 根据权利要求 1所述的音频处理方法, 其特征在于, 所述将分配给每 个子带的比特数初始值与量化比特分配表中的数值进行匹配 ,根据匹配结果从 所述量化比特分配表中确定分配给每个子带的比特数包括: 从所述量化比特分配表中搜索与所述分配给每个子带的比特数初始值接 近的数值, 将搜索得到的数值确定为分配给子带的比特数。
8、 根据权利要求 2所述的音频处理方法, 其特征在于, 确定分配给每个 子带的比特数后进一步包括:
若发现还有比特资源剩余, 按感知重要性选择子带;
为所述选择的子带进行比特再分配 , 确定每个子带的最终比特数。
9、 根据权利要求 8所述的音频处理方法, 其特征在于, 所述按感知重要 性选择子带包括: 按感知重要性从高到低选择子带。
10、根据权利要求 8所述的音频处理方法, 其特征在于, 所述为选择的子 带进行比特再分配, 确定每个子带的最终比特数具体为:
在所述量化比特分配表中 , 为所述选择的子带重新搜索分配给该子带的 比特数,所述重新搜索分配给该子带的比特数与已分配给该子带的比特数的差 值小于或等于可用于分配的比特数与已分配比特数的差值。
11、 根据权利要求 1所述的音频处理方法, 其特征在于:
所述子带的频域包络值通过编码过程得到; 或者,
所述子带的频域包络值通过解码过程得到。
12、 一种音频处理装置, 其特征在于, 包括:
初始值确定单元, 用于根据子带的频域包^^直、 子带内包含的修正离散 余弦变换 MDCT系数个数确定分配给每个子带的比特数初始值;
分配单元, 用于将所述分配给每个子带的比特数初始值与量化比特分配 表中的数值进行匹配 ,根据匹配结果从所述量化比特分配表中确定分配 ^^个 子带的比特数。
13、 根据权利要求 12所述的音频处理装置, 其特征在于, 进一步包括: 排序单元, 用于将子带按照子带的频域包络值进行感知重要性排序。
14、 根据权利要求 13所述的音频处理装置, 其特征在于, 进一步包括: 预处理单元, 用于将子带的频域包络值作一个减量处理, 所述减量的绝 对值按子带序号的增加而递增;
所述排序单元从所述预处理单元获取子带的频域包络值。
15、 根据权利要求 12所述的音频处理装置, 其特征在于, 所述初始化值 确定单元包括:
第一计算单元, 根据子带的频域包络值、 子带内包含的修正离散余弦变 换 MDCT系数个数确定比特数理论值;
第一处理单元, 用于将所述比特数理论值作为分配给每个子带的比特数 初始值。
16、 根据权利要求 12所述的音频处理装置, 其特征在于, 所述初始值确 定单元包括:
第二计算单元, 用于根据子带的频域包络值、 子带内包含的 MDCT系数 个数确定比特数理论值,根据所述比特数理论值及可用于分配的比特数确定比 特数实际值;
第二处理单元, 用于将所述比特数实际值作为分配给每个子带的比特数 初始值。
17、 根据权利要求 15或 16所述的音频处理装置, 其特征在于, 所述初始 值确定单元进一步包括:
加权因子调整单元, 用于通过加权因子调整分配给每个子带的比特数初 始值。
18、 根据权利要求 12所述的音频处理装置, 其特征在于, 所述分配单元 包括:
搜索单元, 用于从所述量化比特分配表中搜索与所述分配给每个子带的 比特数初始值接近的数值;
分配值确定单元, 用于将搜索得到的数值确定为分配给子带的比特数。
19、 根据权利要求 13所述的音频处理装置, 其特征在于, 进一步包括: 调整单元, 用于发现还有比特资源剩余时,按感知重要性从所述排序单元 中选择子带,为所述选择的子带进行比特再分配,确定每个子带的最终比特数。
20、 根据权利要求 19所述的音频处理装置, 其特征在于:
所述调整单元具体是按感知重要性从高到低从所述排序单元中选择子带。
21、 根据权利要求 12所述的音频处理装置, 其特征在于:
所述音频处理装置设置在编码器或解码器中。
PCT/CN2009/070712 2008-04-18 2009-03-10 音频处理方法及装置 WO2009127133A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN200810087594.9 2008-04-18
CNA2008100875949A CN101562015A (zh) 2008-04-18 2008-04-18 音频处理方法及装置

Publications (1)

Publication Number Publication Date
WO2009127133A1 true WO2009127133A1 (zh) 2009-10-22

Family

ID=41198777

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2009/070712 WO2009127133A1 (zh) 2008-04-18 2009-03-10 音频处理方法及装置

Country Status (2)

Country Link
CN (1) CN101562015A (zh)
WO (1) WO2009127133A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101930426B (zh) 2009-06-24 2015-08-05 华为技术有限公司 信号处理方法、数据处理方法及装置
CN102081927B (zh) * 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
CN102081926B (zh) * 2009-11-27 2013-06-05 中兴通讯股份有限公司 格型矢量量化音频编解码方法和系统
CN105637582B (zh) * 2013-10-17 2019-12-31 株式会社索思未来 音频编码装置及音频解码装置
KR102023138B1 (ko) * 2013-12-02 2019-09-19 후아웨이 테크놀러지 컴퍼니 리미티드 인코딩 방법 및 장치
CN114822564A (zh) * 2021-01-21 2022-07-29 华为技术有限公司 音频对象的比特分配方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1078832A (zh) * 1992-01-29 1993-11-24 索尼公司 采用加权信号量化位分配进行数据压缩的装置和方法
CN1732530A (zh) * 2002-11-07 2006-02-08 三星电子株式会社 运动图像专家组音频编码方法及装置
JP2006080927A (ja) * 2004-09-09 2006-03-23 Toa Corp 符号化方法、符号化装置、復号化方法及び復号化装置
CN1783727A (zh) * 2002-08-21 2006-06-07 中山正音数字技术有限公司 用于对多声道数字音频信号进行压缩编码的编码方法
CN101064106A (zh) * 2006-04-28 2007-10-31 意法半导体亚太私人有限公司 用于低复杂度高级音频编码的自适应速率控制算法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1078832A (zh) * 1992-01-29 1993-11-24 索尼公司 采用加权信号量化位分配进行数据压缩的装置和方法
CN1783727A (zh) * 2002-08-21 2006-06-07 中山正音数字技术有限公司 用于对多声道数字音频信号进行压缩编码的编码方法
CN1732530A (zh) * 2002-11-07 2006-02-08 三星电子株式会社 运动图像专家组音频编码方法及装置
JP2006080927A (ja) * 2004-09-09 2006-03-23 Toa Corp 符号化方法、符号化装置、復号化方法及び復号化装置
CN101064106A (zh) * 2006-04-28 2007-10-31 意法半导体亚太私人有限公司 用于低复杂度高级音频编码的自适应速率控制算法

Also Published As

Publication number Publication date
CN101562015A (zh) 2009-10-21

Similar Documents

Publication Publication Date Title
JP6673957B2 (ja) 帯域幅拡張のための高周波数符号化/復号化方法及びその装置
EP3174049B1 (en) Audio signal coding method and device
US8862463B2 (en) Adaptive time/frequency-based audio encoding and decoding apparatuses and methods
US9111535B2 (en) Method and apparatus for decoding audio signal
EP1914724B1 (en) Dual-transform coding of audio signals
WO2014091694A1 (ja) 音声音響符号化装置、音声音響復号装置、音声音響符号化方法及び音声音響復号方法
CN101128866A (zh) 多声道音频编码中的优化保真度和减少的信令
CN106941004B (zh) 音频信号的比特分配的方法和装置
KR102493482B1 (ko) 시간-도메인 스테레오 코딩 및 디코딩 방법, 및 관련 제품
US20080140428A1 (en) Method and apparatus to encode and/or decode by applying adaptive window size
WO2009127133A1 (zh) 音频处理方法及装置
WO2013143221A1 (zh) 信号编码和解码的方法和设备
JP6388624B2 (ja) 方法、符号化器、復号化器、及び移動体機器
JP2002023799A (ja) 音声符号化装置及びそれに用いる心理聴覚分析方法
JP2004309921A (ja) 符号化装置、符号化方法及びプログラム
US20130346088A1 (en) Audio coding method and apparatus
KR102492791B1 (ko) 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품
JP2000151413A (ja) オーディオ符号化における適応ダイナミック可変ビット割り当て方法
KR102492600B1 (ko) 시간-도메인 스테레오 파라미터에 대한 코딩 방법, 및 관련 제품
JPH08123488A (ja) 高能率符号化方法、高能率符号記録方法、高能率符号伝送方法、高能率符号化装置及び高能率符号復号化方法
CN103503065A (zh) 用于衰减低精确度重构的信号区域的方法和解码器
JP5635213B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
JPH05114863A (ja) 高能率符号化装置及び復号化装置
JPH06291679A (ja) オーディオ信号のためのしきい値制御量子化決定法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 09733292

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 09733292

Country of ref document: EP

Kind code of ref document: A1