CN101605017A - 编码比特的分配方法和装置 - Google Patents

编码比特的分配方法和装置 Download PDF

Info

Publication number
CN101605017A
CN101605017A CNA2008101108376A CN200810110837A CN101605017A CN 101605017 A CN101605017 A CN 101605017A CN A2008101108376 A CNA2008101108376 A CN A2008101108376A CN 200810110837 A CN200810110837 A CN 200810110837A CN 101605017 A CN101605017 A CN 101605017A
Authority
CN
China
Prior art keywords
bit allocation
fluctuation
allocation unit
bit
fluctuation parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CNA2008101108376A
Other languages
English (en)
Inventor
张德明
张立斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CNA2008101108376A priority Critical patent/CN101605017A/zh
Priority to PCT/CN2009/071980 priority patent/WO2009149639A1/zh
Publication of CN101605017A publication Critical patent/CN101605017A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了一种编码比特的分配方法和装置,涉及编码技术,能够获得高质量的编码结果。本发明实施例提供的技术方案包括:一种编码比特的分配方法,该方法包括:获取信号中各比特分配单元的波动参数,所述信号包括至少两个所述比特分配单元;利用所述波动参数为所述各比特分配单元分配编码比特。

Description

编码比特的分配方法和装置
技术领域
本发明涉及编码技术,尤其涉及一种编码比特的分配方法和装置。
背景技术
变换域编码是目前音频编码采用的主要编码方法,变换域编码的基本特点是将音频信号分成若干子带,对每一子带分别进行编码。
由于在一定编码模式下,编码器的编码速率是固定的,因此,当编码器对音频信号进行编码时,为音频信号分配的总编码比特数目也是固定的。根据该总的编码比特数目,为每一子带分配编码比特。对于每一个子带,为该子带分配的编码比特越多,则该子带的编码量化误差越小,编码质量越好,反之,编码量化误差越大,编码质量越差。
子带编码比特分配的目的是使该子带分配的编码比特数目与人耳对该子带感知的敏感程度相吻合,从而在有限的编码比特数目下,实现最佳的编码质量。人耳对子带感知的敏感程度与该子带的能量相对应。国际电信联盟一电信标准部(The ITU Telecommunication Standardization Sector,ITU-T)于1999年发布的G.722.1音频编码标准,是一种根据子带的能量为子带分配编码比特的编码方法。
G.722.1标准适用于编码速率为24kbit/s或32kbit/s的7kHz带宽的音频信号,其帧长为20ms,算法延迟为40ms。G.722.1编码标准采用的是变换域编码方式,即基于调制叠接变换(Modulated Lapped Transform,MLT)变换的哈夫曼编码方式。G.722.1在对各子带进行编码比特分配时,考虑到了各子带的能量级别以及所处的频带范围,使得编码比特分配的结果比较符合人耳对各子带的敏感程度,能够获得具有一定质量的编码结果。
在实现本发明的过程中,发明人发现现有技术中至少存在如下问题:现有技术提供的技术方案没有深入考虑子带本身的音频特点,不能获得高质量的编码结果。例如,若两个子带的能量相同,所处的频带范围一致,但一个子带内的频域系数变化范围非常大,即波动性较大;而另一个子带内的频域系数变化范围非常小,即波动性较小,在这种情况下,现有技术会给两个子带分配几乎相同的编码比特数目,造成波动性较大的子带的量化误差要远大于波动性较小的子带的量化误差,从而导致了波动性较大的子带的编码质量大大低于波动性较小的子带编码质量,造成音频信号整体编码质量的下降,无法获得高质量的编码结果。
发明内容
本发明的实施例提供一种编码比特的分配方法和装置,能够获得高质量的编码结果。
为达到上述目的,本发明的实施例采用如下技术方案:
一种编码比特的分配方法,该方法包括:
获取信号中各比特分配单元的波动参数,所述信号包括至少两个所述比特分配单元;
利用所述波动参数为所述各比特分配单元分配编码比特。
一种编码比特的分配装置,该装置包括:
波动参数获取模块,用于获取信号中各比特分配单元的波动参数,所述信号包括至少两个所述比特分配单元;
比特分配模块,用于利用所述波动参数获取模块获取的波动参数为所述各比特分配单元分配编码比特。
本发明实施例提供的编码比特的分配方法和装置,在编码进行比特分配时,深入分析信号的特点,通过获取的波动参数,反映出信号的波动性,利用信号的波动性,为信号中各比特分配单元分配编码所需的比特数,解决了现有技术中进行比特分配时,只考虑信号的能量特性,造成的编码量化误差较大,编码质量不高的问题,从而,能够获得高质量的编码结果。
附图说明
图1为本发明实施例一提供的编码比特的分配方法流程图;
图2为本发明实施例二提供的编码比特的分配方法流程图;
图3为本发明实施例三提供的编码比特的分配方法流程图;
图4为本发明实施例一提供的编码比特的分配装置示意图;
图5为本发明实施例二提供的编码比特的分配装置示意图。
具体实施方式
为了更清楚地说明本发明实施例的技术方案,下面将结合附图对本发明的实施例进行详细的介绍,下面的描述仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些实施例获得本发明的其他的实施方式。
为了解决现有技术中编码进行比特分配时,只考虑信号的能量特性,造成的编码量化误差较大,编码质量不高的问题,本发明实施例提供了一种编码比特的分配方法和装置,能够获得高质量的编码结果。
本发明实施例一提供了一种编码比特的分配方法,如图1所示,该方法包括如下步骤:
步骤11、获取信号中各比特分配单元的波动参数,所述信号包括至少两个所述比特分配单元;
步骤12、利用所述波动参数为所述各比特分配单元分配编码比特。
本发明实施例在编码进行比特分配时,深入分析信号的特点,通过获取的波动参数,反映出信号的波动性,利用信号的波动性,为信号中各比特分配单元分配编码所需的比特数,解决了现有技术中进行比特分配时,只考虑信号的能量特性,造成的编码量化误差较大,编码质量不高的问题,从而,能够获得高质量的编码结果。
本发明实施例二提供了一种编码比特的分配方法,如图2所示,该方法包括如下步骤:
步骤21、获取信号中各比特分配单元的波动参数,所述信号包括至少两个所述比特分配单元。
步骤22、利用所述波动参数为所述各比特分配单元分配编码比特,该步骤具体包括:
步骤221、获取所述各比特分配单元的比特分配依据量;
步骤222、利用所述各比特分配单元的波动参数增加或减少所述各比特分配单元的比特分配依据量,获取修正的比特分配依据量;
本发明实施例采用的获取修正的比特分配依据量的步骤具体包括:
步骤A1、设置至少一个波动参数阈值,所述波动参数阈值包括第一波动参数阈值;
本发明实施例通过设置波动参数阈值,体现出各波动参数之间大小关系,大于该波动参数阈值的波动参数较大,即该波动参数对应的比特分配单元的波动性较大;小于该波动参数阈值的波动参数较小,即该波动参数对应的比特分配单元的波动性较小。
步骤A2、当任一比特分配单元的波动参数大于所述第一波动参数阈值时,增加该比特分配单元的比特分配依据量,获取该比特分配单元修正的比特分配依据量;
当任一比特分配单元的波动参数小于所述第一波动参数阈值时,减少该比特分配单元的比特分配依据量,获取该比特分配单元修正的比特分配依据量。
步骤A2中,即为波动性较大的比特分配单元,获取的修正的比特分配依据量较大;为波动性较小的比特分配单元,获取的修正的比特分配依据量较小。
步骤223、根据所述修正的比特分配依据量为所述各比特分配单元分配编码比特,具体包括:
步骤B1、设置至少一个比特分配依据量阈值;
本发明实施例通过设置比特分配依据量阈值,体现出各比特分配依据量之间大小关系。
步骤B2、当所述比特分配单元对应的修正的比特分配依据量大于所述比特分配依据量阈值时,增加为该比特分配单元分配的比特数;
当所述比特分配单元对应的修正的比特分配依据量小于所述比特分配依据量阈值时,减少为该比特分配单元分配的比特数。
步骤B2采用的方法即为波动性较大的比特分配单元分配较多的编码比特,为波动性较小的比特分配单元分配较少的编码比特。
下面对本发明实施例三进行详细介绍。
如图3所示,本发明实施例三包括:
步骤31、获取所述信号的频域系数。
本发明实施例提供的频域系数为对信号进行调制叠接变换MLT后的MLT系数,但不限于此,任何能够反映信号频域特性的频域系数均属于本发明的保护范围之内。本发明实施例以所述频域系数为MLT系数的情况为例进行说明。
所述的信号可以表示为x(n),n表示时域采样点的标号。将所述信号加上正弦窗和变换因子,进行MLT变换,获得MLT系数mlt(m),采用的变换公式为:
mlt ( m ) = Σ n = 0 2 N - 1 2 N sin ( π 2 N ( n + 0.5 ) ) cos ( π N ( n - N - 1 2 ) ( m + 0.5 ) ) x ( n ) - - - ( 1 )
其中,为所加正弦窗, cos ( π N ( n - N - 1 2 ) ( m + 0.5 ) ) 为所加变换因子,m表示频域采样点的标号,N表示一帧信号的长度,即一帧信号中的总采样点数。因为在对当前帧信号进行MLT变换时,会使用到前一帧信息,在公式(1)中采用2N个采样点,该采样点包含了当前处理帧信号的前一帧信号中的采样点。
本发明实施例在一帧信号中取320个采样点,即N=320,能够获得320个MLT系数。
步骤32、将所述频域系数归属为至少两个子带,所述比特分配单元包括至少一个子带。根据各子带划分比特分配单元,所述比特分配单元包括至少一个子带,所述比特分配单元可以包括一个子带,也可以包括多个子带。
本发明实施例将每20个MLT系数划分为一组,作为一个子带,本发明实施例包括16个子带。每个子带表征500赫兹的频带宽度,本发明实施例提供的编码后的频带范围为0至7000赫兹,因此忽略掉最后的两个子带,对前14个子带进行编码。
步骤33、获取信号中各比特分配单元的波动参数,所述信号包括至少两个所述比特分配单元。
本发明实施例提供的所述波动参数为音调,但本发明实施例提供的技术方案不限于此,任何能够反映信号波动性的特征参数都属于本发明实施例的技术方案之内。
所述比特分配单元包括至少一个子带。对本发明实施例进行说明时,将所述比特分配单元分为两种情况进行说明,一种为所述比特分配单元包括一个子带,另一种为所述比特分配单元包括至少两个子带。
当所述比特分配单元包括至少两个子带时,由于通常相邻子带的波动性相差不大,本发明实施例采用将相邻的若干子带结合起来作为一个比特分配单元,在获得高质量编码结果的同时,能够降低计算量,减少编码时设置的波动控制比特数目。
当所述比特分配单元包括一个子带时,获取信号中各比特分配单元的波动参数的步骤包括:
步骤S1、获取所述每一个子带中的频域系数绝对值的最大值;
本发明实施例,根据每一个子带中包括的MLT系数(20个)mlt(m)的绝对值|mlt(m)|,找出最大的|mlt(m)|作为该子带中频域系数绝对值的最大值Peak(r)其中,r表示子带标号。
步骤S2、获取所述每一个子带中的频域系数绝对值的平均值;
本发明实施例,对每一个子带中包括的MLT系数(20个)mlt(m)的绝对值|mlt(m)|求取算术平均值,得到该子带中的频域系数绝对值的平均值Avg(r)。
步骤S3、根据所述频域系数绝对值的最大值和平均值获取各比特分配单元的波动参数为: Tone ( r ) = Peak ( r ) Avg ( r ) - 1 N - - - ( 2 )
其中,r表示子带标号,Tone(r)表示第r个子带的音调,Peak(r)表示第r个子带中频域系数绝对值的最大值,Avg(r)表示第r个子带中频域系数绝对值的平均值,N表示第r个子带中频域系数的个数。
本发明实施例采用的计算音调的公式包括但不限于上述公式(2),任何相似算法或基于公式(2)的变形都属于本发明的保护范围。
当所述比特分配单元包括相邻的至少两个子带时,本发明实施例将所述14个子带划分为4个比特分配单元进行编码,将第0、1、2共三个子带作为第一个比特分配单元,第3、4、5共三个子带作为第二个比特分配单元,第6、7、8、9共四个子带作为第三个比特分配单元,第10、11、12、13共四个子带作为第四个比特分配单元。
所述获取信号中各比特分配单元的波动参数的步骤包括:
步骤T1、获取所述每一个比特分配单元中所有子带中的频域系数绝对值的最大值;
在本发明实施例中,根据每一个比特分配单元中包括的所有子带MLT系数mlt(m)的绝对值|mlt(m)|,找出最大的|mlt(m)|作为该比特分配单元中频域系数绝对值的最大值Peak(r)其中,r表示子带标号,其中,第一至四个比特分配单元中包括的MLT系数分别为60、60、80、80。
步骤T2、获取所述每一个比特分配单元中所有子带中的频域系数绝对值的平均值;
在本发明实施例中,对每一个比特分配单元中包括的所有子带MLT系数mlt(m)的绝对值|mlt(m)|求取算术平均值,作为该比特分配单元的频域系数绝对值的平均值。
步骤T3、根据所述频域系数绝对值的最大值和平均值获取各比特分配单元的波动参数Tone: Tone ( i ) = Peak ( i ) Avg ( i ) - 1 N , - - - ( 3 )
其中,i表示比特分配单元标号,Tone(i)表示第i个比特分配单元的音调,Peak(i)表示第i个比特分配单元中频域系数绝对值的最大值,Avg(i)表示第i个比特分配单元中频域系数绝对值的平均值,N表示第i个比特分配单元中频域系数的个数。
本发明实施例采用的计算音调的公式包括但不限于上述公式(3),任何相似算法或基于公式(3)的变形都属于本发明的保护范围。
步骤34、利用所述波动参数为所述各比特分配单元分配编码比特,具体包括:
步骤341、获取所述各比特分配单元的比特分配依据量。
在本发明实施例中,所述的比特分配依据量为所述比特分配单元的幅度包络量化值。
首先通过计算每一个子带的幅度包络值,获取所述各比特分配单元的幅度包络值:
每一个子带的幅度包络值rms(r):
rms ( r ) = 1 20 Σ n = 0 19 mlt ( 20 r + n ) mlt ( 20 r + n ) - - - ( 4 )
其中,r表示子带序号,其范围为0≤r<14,mlt(m)为MLT系数,0≤m<320。
对获取的幅度包络值进行量化编码,得到量化后的幅度包络量化rms_q(r)。
步骤342、利用所述各比特分配单元的波动参数增加或减少所述各比特分配单元的比特分配依据量,获取修正的比特分配依据量,具体包括:
步骤U1、根据所述波动参数获取所述各比特分配单元的波动标识,具体包括:
步骤U11、设置至少一个波动参数阈值,所述的波动参数阈值将所述波动参数分隔成至少两个波动参数区间。
根据所述设置的波动参数阈值分析所述各比特分配单元的波动性。
当采用一个波动参数阈值时,将波动参数音调Tone(r)与所述各比特分配单元的波动参数阈值thr比较,将Tone(r)超过thr的比特分配单元归属为一个波动参数区间,该波动参数区间中的比特分配单元频域系数的波动性较大;将Tone(r)小于thr的比特分配单元归属为一个波动参数区间,该波动参数区间中的比特分配单元频域系数的波动性较小。
当采用两个或两个以上波动参数阈值时,通过该波动参数阈值将所述各比特分配单元的波动性进行分级,本发明实施例采用三个波动参数阈值,将波动性划分为四级,获取四个波动参数区间。
步骤U12、为所述的每个波动参数区间设置相应的波动标识;
当本发明实施例采用一个波动参数阈值时,可采用下式设置波动标识Stat(r):
Stat ( r ) = 1 Tone ( r ) > thr 0 else - - - ( 5 )
其中,thr的取值在0到1之间,本实施例中thr=0.3。每个子带的波动性标志Stat(r)用1比特编码然后传输到解码端(解码端也要用到这些信息进行比特分配),这共需要14比特,上式(5)表明对Tone(r)超过thr的波动参数区间设置的标识为1,对Tone(r)小于thr的波动参数区间设置的标识为0。
当本发明实施例采用三个波动参数阈值时,可采用下式设置波动标识Stat(i):
Stat ( i ) = 3 Tone ( i ) > thr 1 2 Tone ( i ) > thr 2 1 Tone ( i ) > thr 3 0 else - - - ( 6 )
其中thr1>thr2>thr3,三者的取值均在在0到1之间,本实施例中thr1=0.6,thr2=0.4,thr3=0.2。波动性级别Stat(i)用2比特编码然后传输到解码端(解码端也要用到这些信息进行比特分配),这共需要8比特,上式(6)表明按照波动参数区间中波动参数从大到小的顺序,为四个波动参数区间设置的波动标识分别为3、2、1、0。
步骤U13、根据所述各比特分配单元的波动参数所属的波动参数区间,获取所述各比特分配单元的波动标识。
所述各比特分配单元的波动标识与其波动参数所属的波动参数区间的波动标识一致。
步骤U2、为各波动标识设置相应的权重系数。
在本发明实施例中,当采用一个波动参数阈值时,波动标识Stat(r)=1时,权重系数取1.1;波动标识Stat(r)=0时,权重系数取0.9。
当采用三个波动参数阈值时,波动标识Stat(r)=3时,权重系数取1.2;波动标识Stat(r)=2时,权重系数取1.1;波动标识Stat(r)=1时,权重系数取1.0;波动标识Stat(r)=0时,权重系数取0.9,即波动参数大的波动参数区间,其分配的权重系数也大;波动参数小的波动参数区间,其分配的权重系数也小,从而,保证了在下述利用所述权重系数,能够合理调整所述比特分配依据量,反映出波动性对比特分配的影响。
步骤U3、利用所述各比特分配单元的波动标识对应的权重系数,增加或减少所述各比特分配单元的幅度包络量化值,获取所述各比特分配单元的伪幅度包络量化值作为修正的比特分配依据量。
将所述各比特分配单元的幅度包络量化值和该比特分配单元的波动标识对应的权重系数相乘,获得所述各比特分配单元的伪幅度包络量化值。
当权重系数大于1时,获得的伪幅度包络量化值大于所述幅度包络量化值;
当权重系数小于1时,获得的伪幅度包络量化值小于所述幅度包络量化值。
步骤343、根据所述修正的比特分配依据量为所述各比特分配单元分配编码比特。
当所述伪幅度包络量化值(修正的比特分配依据量)较大时,为其相应的比特分配单元分配编码比特数较多;当所述伪幅度包络量化值(修正的比特分配依据量)较小时,为其相应的比特分配单元分配编码比特数较少。
所属领域技术人员可根据已公开的现有技术根据所述伪幅度包络量化值为所述各比特分配单元分配比特,此处不再赘述。但本发明实施例提供的技术方案并不局限于只能利用伪幅度包络量化值作为比特分配依据量,包括采用其它参数作为比特分配依据量的相似技术方案。
通过上述的编码比特的分配方法,本发明实施例提供的技术方案在进行编码比特分配时考虑到了信号的波动性,为波动性较大的比特分配单元分配较多的编码比特,为波动性较小的比特分配单元分配较少的编码比特,在更大程度上使得各比特分配单元分配的编码比特数目,与人耳对该比特分配单元感知的重要程度相吻合,从而能够获得高质量的编码结果。
本发明实施例还提供了一种编码比特的分配装置,如图4所示,该装置包括:
波动参数获取模块41,用于获取信号中各比特分配单元的波动参数,所述信号包括至少两个所述比特分配单元;
比特分配模块42,用于利用所述波动参数获取模块获取的波动参数为所述各比特分配单元分配编码比特。
本发明实施例提供的编码比特的分配装置,在编码进行比特分配时,深入分析信号的特点,通过获取的波动参数,反映出信号的波动性,利用信号的波动性,为信号中各比特分配单元分配编码所需的比特数,解决了现有技术中进行比特分配时,只考虑信号的能量特性,造成的编码量化误差较大,编码质量不高的问题,从而,能够获得高质量的编码结果。
在本发明实施例中,如图5所示,所述装置还包括:
频域系数获取模块43,用于获取所述信号的频域系数;
比特分配单元获取模块44,用于将所述频域系数划分为至少一个子带,所述比特分配单元包括至少一个子带。。
所述比特分配模块42包括:
比特分配依据量获取模块421,用于获取所述各比特分配单元的比特分配依据量;
修正比特分配依据量获取模块422,用于利用所述各比特分配单元的波动参数增加或减少所述各比特分配单元的比特分配依据量,获取修正的比特分配依据量;
分配模块423,用于根据所述修正的比特分配依据量为所述各比特分配单元分配编码比特。
本发明实施例采用的波动参数为音调,当所述比特分配单元包括一个子带时,所述波动参数获取模块包括:
第一最大值获取模块,用于获取所述每一个子带中的频域系数绝对值的最大值;
第一平均值获取模块,用于获取所述每一个子带中的频域系数绝对值的平均值;
第一波动参数获取模块,用于根据所述频域系数绝对值的最大值和平均值获取各比特分配单元的波动参数为音调Tone: Tone ( r ) = Peak ( r ) Avg ( r ) - 1 N , 其中,r表示子带标号,Peak(r)表示第r个子带中频域系数绝对值的最大值,Avg(r)表示第r个子带中频域系数绝对值的平均值,N表示第r个子带中频域系数的个数。
当所述比特分配单元包括相邻的至少两个子带时,所述波动参数获取模块包括:
第二最大值获取模块,用于获取所述每一个比特分配单元中所有子带中的频域系数绝对值的最大值;
第二平均值获取模块,用于获取所述每一个比特分配单元中所有子带中的频域系数绝对值的平均值;
第二波动参数获取模块,用于根据所述频域系数绝对值的最大值和平均值获取各比特分配单元的波动参数为音调Tone: Tone ( i ) = Peak ( i ) Avg ( i ) - 1 N , 其中,i表示比特分配单元标号,Peak(i)表示第i个比特分配单元中频域系数绝对值的最大值,Avg(i)表示第i个比特分配单元中频域系数绝对值的平均值,N表示第i个比特分配单元中频域系数的个数。
本发明实施例采用的比特分配依据量为幅度包络量化值,所述修正比特分配依据量获取模块422包括:
波动标识获取模块,用于设置至少一个波动参数阈值,所述的波动参数阈值将所述波动参数分隔成至少两个波动参数区间;为所述的每个波动参数区间设置相应的波动标识;根据所述各比特分配单元的波动参数所属的波动参数区间,获取所述各比特分配单元的波动标识;
权重系数设置模块,用于为各波动标识设置相应的权重系数,当所述第一波动参数区间中的波动参数大于所述第二波动参数区间中的波动参数时,为所述第一波动参数区间对应的波动标识设置的权重系数大于为所述第二波动参数区间对应的波动标识设置的权重系数;
伪幅度包络量化值获取模块,用于利用所述各比特分配单元的波动标识对应的权重系数,增加或减少所述各比特分配单元的幅度包络量化值,获取所述各比特分配单元的伪幅度包络量化值作为修正的比特分配依据量。
通过上述的编码比特的分配装置,本发明实施例提供的技术方案在进行编码比特分配时考虑到了信号的波动性,为波动性较大的比特分配单元分配较多的编码比特,为波动性较小的比特分配单元分配较少的编码比特,在更大程度上使得各比特分配单元分配的编码比特数目,与人耳对该比特分配单元感知的重要程度相吻合,从而能够获得高质量的编码结果。
本领域普通技术人员可以理解实现上述实施例中的全部或部分步骤,可以通过程序指令相关硬件完成。所述实施例对应的软件可以存储在一个计算机可存储读取的介质中。
当然,本发明的实施例还可有很多种,在不背离本发明的实施例精神及其实质的情况下,本领域技术人员当可根据本发明的实施例做出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明的实施例所附的权利要求的保护范围。

Claims (18)

1、一种编码比特的分配方法,其特征在于,该方法包括:
获取信号中各比特分配单元的波动参数,所述信号包括至少两个所述比特分配单元;
利用所述波动参数为所述各比特分配单元分配编码比特。
2、根据权利要求1所述的编码比特的分配方法,其特征在于,所述利用所述波动参数为所述各比特分配单元分配编码比特的步骤包括:
获取所述各比特分配单元的比特分配依据量;
利用所述各比特分配单元的波动参数增加或减少所述各比特分配单元的比特分配依据量,获取修正的比特分配依据量;
根据所述修正的比特分配依据量为所述各比特分配单元分配编码比特。
3、根据权利要求2所述的编码比特的分配方法,其特征在于,所述利用所述各比特分配单元的波动参数增加或减少所述各比特分配单元的比特分配依据量,获取修正的比特分配依据量的步骤包括:
设置至少一个波动参数阈值,所述波动参数阈值包括第一波动参数阈值;
当任一比特分配单元的波动参数大于所述第一波动参数阈值时,增加该比特分配单元的比特分配依据量,获取该比特分配单元修正的比特分配依据量;
当任一比特分配单元的波动参数小于所述第一波动参数阈值时,减少该比特分配单元的比特分配依据量,获取该比特分配单元修正的比特分配依据量。
4、根据权利要求3所述的编码比特的分配方法,其特征在于,所述根据所述修正的比特分配依据量为所述各比特分配单元分配编码比特的步骤包括:
设置至少一个比特分配依据量阈值;
当所述比特分配单元对应的修正的比特分配依据量大于所述比特分配依据量阈值时,增加为该比特分配单元分配的比特数;
当所述比特分配单元对应的修正的比特分配依据量小于所述比特分配依据量阈值时,减少为该比特分配单元分配的比特数。
5、根据权利要求2所述的编码比特的分配方法,其特征在于,在所述获取信号中各比特分配单元的波动参数的步骤之前还包括:
获取所述信号的频域系数;
将所述频域系数归属为至少两个子带,所述比特分配单元包括至少一个子带。
6、根据权利要求5所述的编码比特的分配方法,其特征在于,所述波动参数为音调,当所述比特分配单元包括一个子带时,所述获取信号中各比特分配单元的波动参数的步骤包括:
获取所述每一个子带中的频域系数绝对值的最大值;
获取所述每一个子带中的频域系数绝对值的平均值;
根据所述频域系数绝对值的最大值和平均值获取各比特分配单元的波动参数为: Tone ( r ) = Peak ( r ) Avg ( r ) - 1 N , 其中,r表示子带标号,Tone(r)表示第r个子带的音调,Peak(r)表示第r个子带中频域系数绝对值的最大值,Avg(r)表示第r个子带中频域系数绝对值的平均值,N表示第r个子带中频域系数的个数。
7、根据权利要求5所述的编码比特的分配方法,其特征在于,所述波动参数为音调,当所述比特分配单元包括至少两个子带时,所述获取信号中各比特分配单元的波动参数的步骤包括:
获取所述每一个比特分配单元中所有子带中的频域系数绝对值的最大值;
获取所述每一个比特分配单元中所有子带中的频域系数绝对值的平均值;
根据所述频域系数绝对值的最大值和平均值获取各比特分配单元的波动参数为: Tone ( i ) = Peak ( i ) Avg ( i ) - 1 N , 其中,i表示比特分配单元标号,Tone(i)表示第i个比特分配单元的音调,Peak(i)表示第i个比特分配单元中频域系数绝对值的最大值,Avg(i)表示第i个比特分配单元中频域系数绝对值的平均值,N表示第i个比特分配单元中频域系数的个数。
8、根据权利要求5所述的编码比特的分配方法,其特征在于,所述利用所述各比特分配单元的波动参数增加或减少所述各比特分配单元的比特分配依据量,获取修正的比特分配依据量的步骤包括:
根据所述波动参数获取所述各比特分配单元的波动标识;
为各波动标识设置相应的权重系数;
利用所述各比特分配单元的波动标识对应的权重系数,增加或减少所述各比特分配单元的比特分配依据量,获取所述各比特分配单元的修正的比特分配依据量。
9、根据权利要求8所述的编码比特的分配方法,其特征在于,所述比特分配依据量为所述比特分配单元的幅度包络量化值,所述利用所述各比特分配单元的波动标识对应的权重系数,增加或减少所述各比特分配单元的比特分配依据量,获取所述各比特分配单元的修正的比特分配依据量的步骤为:
利用所述各比特分配单元的波动标识对应的权重系数,增加或减少所述各比特分配单元的幅度包络量化值,获取所述各比特分配单元的伪幅度包络量化值作为所述修正的比特分配依据量。
10、根据权利要求9所述的编码比特的分配方法,其特征在于,所述根据所述波动参数获取所述各比特分配单元的波动标识的步骤包括:
设置至少一个波动参数阈值,所述的波动参数阈值将所述波动参数分隔成至少两个波动参数区间;
为所述的每个波动参数区间设置相应的波动标识;
根据所述各比特分配单元的波动参数所属的波动参数区间,获取所述各比特分配单元的波动标识。
11、根据权利要求10所述的编码比特的分配方法,其特征在于,所述波动参数区间包括第一波动参数区间和第二波动参数区间,所述为各波动标识设置相应的权重系数的步骤包括:
当所述第一波动参数区间中的波动参数大于所述第二波动参数区间中的波动参数时,为所述第一波动参数区间对应的波动标识设置的权重系数大于为所述第二波动参数区间对应的波动标识设置的权重系数。
12、根据权利要求9所述的编码比特的分配方法,其特征在于,所述利用所述各比特分配单元的幅度包络量化值和波动标识对应的权重系数,增加或减少所述各比特分配单元的幅度包络量化值,获取所述各比特分配单元的伪幅度包络量化值的步骤包括:
将所述各比特分配单元的幅度包络量化值和该比特分配单元的波动标识对应的权重系数相乘,获得所述各比特分配单元的伪幅度包络量化值。
13、一种编码比特的分配装置,其特征在于,该装置包括:
波动参数获取模块,用于获取信号中各比特分配单元的波动参数,所述信号包括至少两个所述比特分配单元;
比特分配模块,用于利用所述波动参数获取模块获取的波动参数为所述各比特分配单元分配编码比特。
14、根据权利要求13所述的编码比特的分配装置,其特征在于,所述比特分配模块包括:
比特分配依据量获取模块,用于获取所述各比特分配单元的比特分配依据量;
修正比特分配依据量获取模块,用于利用所述各比特分配单元的波动参数增加或减少所述各比特分配单元的比特分配依据量,获取修正的比特分配依据量;
分配模块,用于根据所述修正的比特分配依据量为所述各比特分配单元分配编码比特。
15、根据权利要求14所述的编码比特的分配装置,其特征在于,所述装置还包括:
频域系数获取模块,用于获取所述信号的频域系数;
比特分配单元获取模块,用于将所述频域系数划分为至少一个子带,所述比特分配单元包括至少一个子带。
16、根据权利要求15所述的编码比特的分配装置,其特征在于,所述波动参数为音调,当所述比特分配单元包括一个子带时,所述波动参数获取模块包括:
第一最大值获取模块,用于获取所述每一个子带中的频域系数绝对值的最大值;
第一平均值获取模块,用于获取所述每一个子带中的频域系数绝对值的平均值;
第一波动参数获取模块,用于根据所述频域系数绝对值的最大值和平均值获取各比特分配单元的波动参数为音调Tone: Tone ( r ) = Peak ( r ) Avg ( r ) - 1 N , 其中,r表示子带标号,Peak(r)表示第r个子带中频域系数绝对值的最大值,Avg(r)表示第r个子带中频域系数绝对值的平均值,N表示第r个子带中频域系数的个数。
17、根据权利要求15所述的编码比特的分配装置,其特征在于,所述波动参数为音调,当所述比特分配单元包括相邻的至少两个子带时,所述波动参数获取模块包括:
第二最大值获取模块,用于获取所述每一个比特分配单元中所有子带中的频域系数绝对值的最大值;
第二平均值获取模块,用于获取所述每一个比特分配单元中所有子带中的频域系数绝对值的平均值;
第二波动参数获取模块,用于根据所述频域系数绝对值的最大值和平均值获取各比特分配单元的波动参数为音调Tone: Tone ( i ) = Peak ( i ) Avg ( i ) - 1 N , 其中,i表示比特分配单元标号,Peak(i)表示第i个比特分配单元中频域系数绝对值的最大值,Avg(i)表示第i个比特分配单元中频域系数绝对值的平均值,N表示第i个比特分配单元中频域系数的个数。
18、根据权利要求15所述的编码比特的分配装置,其特征在于,所述修正比特分配依据量获取模块包括:
波动标识获取模块,用于设置至少一个波动参数阈值,所述的波动参数阈值将所述波动参数分隔成至少两个波动参数区间;为所述的每个波动参数区间设置相应的波动标识;根据所述各比特分配单元的波动参数所属的波动参数区间,获取所述各比特分配单元的波动标识;
权重系数设置模块,用于为各波动标识设置相应的权重系数,当所述第一波动参数区间中的波动参数大于所述第二波动参数区间中的波动参数时,为所述第一波动参数区间对应的波动标识设置的权重系数大于为所述第二波动参数区间对应的波动标识设置的权重系数;
伪幅度包络量化值获取模块,用于利用所述各比特分配单元的波动标识对应的权重系数,增加或减少所述各比特分配单元的幅度包络量化值,获取所述各比特分配单元的伪幅度包络量化值作为修正的比特分配依据量。
CNA2008101108376A 2008-06-12 2008-06-12 编码比特的分配方法和装置 Withdrawn CN101605017A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CNA2008101108376A CN101605017A (zh) 2008-06-12 2008-06-12 编码比特的分配方法和装置
PCT/CN2009/071980 WO2009149639A1 (zh) 2008-06-12 2009-05-26 编码比特的分配方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2008101108376A CN101605017A (zh) 2008-06-12 2008-06-12 编码比特的分配方法和装置

Publications (1)

Publication Number Publication Date
CN101605017A true CN101605017A (zh) 2009-12-16

Family

ID=41416364

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2008101108376A Withdrawn CN101605017A (zh) 2008-06-12 2008-06-12 编码比特的分配方法和装置

Country Status (2)

Country Link
CN (1) CN101605017A (zh)
WO (1) WO2009149639A1 (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US6745162B1 (en) * 2000-06-22 2004-06-01 Sony Corporation System and method for bit allocation in an audio encoder
US7653139B2 (en) * 2005-12-23 2010-01-26 Ikanos Communications, Inc. Bit-loading method and system for a DMT transceiver
JP2007264154A (ja) * 2006-03-28 2007-10-11 Sony Corp オーディオ信号符号化方法、オーディオ信号符号化方法のプログラム、オーディオ信号符号化方法のプログラムを記録した記録媒体及びオーディオ信号符号化装置

Also Published As

Publication number Publication date
WO2009149639A1 (zh) 2009-12-17

Similar Documents

Publication Publication Date Title
US10546592B2 (en) Audio signal coding and decoding method and device
US10600430B2 (en) Signal decoding method, audio signal decoder and non-transitory computer-readable medium
EP3232437B1 (en) Voice audio encoding device, voice audio decoding device, voice audio encoding method, and voice audio decoding method
CN1735928B (zh) 用于可变速率音频编解码的方法
KR101913241B1 (ko) 인코딩 방법 및 장치
JP6637559B2 (ja) 信号を復号するための方法および装置
KR102123770B1 (ko) 하모닉 오디오 신호의 변환 인코딩/디코딩
US9100053B2 (en) Method and decoder for reconstructing a source signal
WO2012141635A1 (en) Adaptive gain-shape rate sharing
US20160189722A1 (en) Acoustic signal coding apparatus, acoustic signal decoding apparatus, terminal apparatus, base station apparatus, acoustic signal coding method, and acoustic signal decoding method
AU2014286765B2 (en) Signal encoding and decoding methods and devices
CN105096957B (zh) 处理信号的方法及设备
BRPI0010672B1 (pt) uso de quantificação de ganho adaptativo e comprimentos de símbolo não-uniformes para uma codificação de áudio
CN101605017A (zh) 编码比特的分配方法和装置
CN101572586B (zh) 编解码方法、装置及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C04 Withdrawal of patent application after publication (patent law 2001)
WW01 Invention patent application withdrawn after publication