CN101572087B - 嵌入式语音或音频信号编解码方法和装置 - Google Patents

嵌入式语音或音频信号编解码方法和装置 Download PDF

Info

Publication number
CN101572087B
CN101572087B CN2008100944347A CN200810094434A CN101572087B CN 101572087 B CN101572087 B CN 101572087B CN 2008100944347 A CN2008100944347 A CN 2008100944347A CN 200810094434 A CN200810094434 A CN 200810094434A CN 101572087 B CN101572087 B CN 101572087B
Authority
CN
China
Prior art keywords
signal
frequency
embedded
decoding
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008100944347A
Other languages
English (en)
Other versions
CN101572087A (zh
Inventor
鲍长春
贾懋珅
李锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Beijing University of Technology
Original Assignee
Huawei Technologies Co Ltd
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd, Beijing University of Technology filed Critical Huawei Technologies Co Ltd
Priority to CN2008100944347A priority Critical patent/CN101572087B/zh
Publication of CN101572087A publication Critical patent/CN101572087A/zh
Application granted granted Critical
Publication of CN101572087B publication Critical patent/CN101572087B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了一种嵌入式语音或音频信号编解码方法和装置,涉及编码技术,为解决现有的嵌入式语音编码能够处理的信号频带较窄的问题而发明。本发明的技术方案为:嵌入式语音或音频信号编码方法,包括:根据单声道超宽带语音或音频信号所占用的频带,将所述信号划分成低频子频带和高频子频带;在宽带嵌入式编码层,对单声道超宽带语音或音频信号的低频子频带信号进行嵌入式编码;在预设的高频信号编码层,对单声道超宽带单声道语音或音频信号的高频子频带信号进行嵌入式编码。本发明实施例提供的嵌入式语音或音频信号编解码方法和装置可以应用在音/视频会议、电视电话会议、网络通信、移动通信、网络拥塞控制以及第三代和第四代移动通信领域中。

Description

嵌入式语音或音频信号编解码方法和装置
技术领域
本发明涉及编码技术,特别涉及一种嵌入式语音或音频信号编解码方法和装置。
背景技术
嵌入式编码是一种变速率编码,与传统基于选择的变速率编码不同,嵌入式编码以分层的方式产生具有嵌入式包含关系的码流结构。嵌入式编码生成的码流按照包含信息的重要性不同,可以分为多个层次——一个核心层和一个以上的增强层。其中,核心层位于码流的低层,用于提供信号最基本的信息;增强层位于码流的高层,用于弥补所述信号的细节信息。对信号进行嵌入式编码时,码流包含的层数越多,根据该码流解码出的信号越接近原始信号。
嵌入式编码对有丢包情况出现的因特网和基于网络应用的通信系统有着重要的作用。嵌入式解码器在对具有嵌入式分层结构的码流解码时,可以根据网络的传输状况或者对信号质量需求的不同,选择合适层次的编码信号进行解码。例如:当网络带宽足够大时,接收端接收到的码流包含所有层次(核心层和所有增强层),嵌入式解码器可以对码流中包含的所有层次进行解码,得到高质量的信号;当网络带宽受限制,或者出现分组丢失的情况时,接收端接收到的码流包含部分层次(核心层和部分增强层),嵌入式解码器可以在缺少部分增强层信息的情况下,对所述接收到的部分层次(核心层和部分增强层)进行解码。由于所述码流中缺少部分增强层信息(即信号的某些细节信息),所以此时嵌入式解码器解码出的信号质量较低。但是,由于核心层提供了信号的最基本信息,所以保证了信号的连续性。
目前,对语音信号进行嵌入式编码的方式有很多种,其中,主要采用国际电信联盟-电信标准部(ITU-T)在2006年7月通过的嵌入式语音编码标准G.729.1进行编码。该嵌入式语音编码标准G.729.1定义了12种编码速率:8kbps、12kbps,14kbps...32kbps(2kbps递增),其中,低层码率的码流包含在高层码率的码流中,每个码流分别对应一个码率层。所述嵌入式语音编码标准G.729.1规定:8kbps和12kbps码率层能够处理采样频率为8kHz的窄带信号(即:有效带宽为4kHz的窄带信号),14kbps至32kbps码率层能够处理采样频率为16kHz,有效带宽为7kHz的宽带信号。
在实现本发明的过程中,发明人发现,现有技术至少存在如下问题:在现有的嵌入式语音编码方式下,能处理的信号有效带宽较窄,例如:嵌入式语音编码标准G.729.1能处理的信号有效带宽在最高的32kbps码率下,也仅仅是7kHz。对音频信号而言,有效带宽太窄时,编码后的信号不能表征音频信号的所有特征,不能满足宽带多媒体通信的要求。
发明内容
本发明的实施例提供一种嵌入式语音或音频信号编解码方法和装置,能够对超宽带单声道语音或者音频信号进行嵌入式编码。
本发明解决上述技术问题的一个实施例是:嵌入式语音或音频信号编码方法,包括:根据单声道超宽带语音或音频信号所占用的频带,将所述信号划分成低频子频带和高频子频带;在宽带嵌入式编码层,对所述单声道超宽带语音或音频信号的低频子频带信号进行嵌入式编码;在预设的高频信号编码层,对所述单声道超宽带单声道语音或音频信号的高频子频带信号进行嵌入式编码。
本发明解决上述技术问题的另一个实施例是:嵌入式语音或音频信号编码装置,包括:
频带划分单元,用于根据单声道超宽带语音或音频信号所占用的频带,将所述信号划分成低频子频带和高频子频带;
低频子频带嵌入式编码单元,用于在宽带嵌入式编码层,对所述单声道超宽带语音或音频信号的低频子频带信号进行嵌入式编码;
高频子频带嵌入式编码单元,用于在预设的高频信号编码层,对所述单声道超宽带语音或音频信号的高频子频带信号进行嵌入式编码。
本发明解决上述技术问题的再一个实施例是:嵌入式语音或音频信号解码方法,包括:在宽带嵌入式解码层,对单声道超宽带语音或音频信号的低频子频带信号进行逐层解码;在预设的高频信号解码层,对单声道超宽带语音或音频信号的高频子频带信号进行逐层解码;将所述单声道超宽带语音或音频信号解码后的低频子频带和高频子频带信号进行频谱合并。
本发明解决上述技术问题的再一个实施例是:嵌入式语音或音频信号解码装置,包括:
低频子频带嵌入式解码单元,用于在宽带嵌入式解码层,对单声道超宽带语音或音频信号的低频子频带信号进行逐层解码;
高频子频带嵌入式解码单元,用于在预设的高频信号解码层,对单声道超宽带语音或音频信号的高频子频带信号进行逐层解码;
频谱合并单元,用于将所述单声道超宽带语音或音频信号解码后的低频子频带和高频子频带信号进行频谱合并。
本发明实施例提供的嵌入式语音或音频信号编解码方法和装置,在现有的宽带嵌入式编/解码层之上设置有高频信号编/解码层,在对单声道超宽带语音、音频信号进行编/解码时,可以将其分成高频部分和低频部分,分别进行编/解码。与现有技术相比,本发明实施例提供的嵌入式单声道语音、音频编解码方法和装置,能够处理的信号带宽较宽,能够满足语音和音频的编码要求,获得高质量的语音和音频信号。
附图说明
图1为本发明实施例提供的嵌入式语音或音频信号编码方法的流程图;
图2为图1所示的本发明实施例提供的嵌入式语音或音频信号编码方法步骤102编码端原理示意图;
图3为图2所示的本发明实施例提供的嵌入式语音或音频信号编码方法高频信息编码层原理示意图;
图4为图3所示的本发明实施例提供的嵌入式语音或音频信号编码方法高频信息编码层对应的码流结构示意图;
图5为图2所示的本发明实施例提供的嵌入式语音或音频信号编码方法低频补充信息编码模块原理示意图;
图6为图5所示的本发明实施例提供的嵌入式语音或音频信号编码方法采用低频补充信息编码模块对MDCT残差系数进行编码的流程示意图;
图7为图6所示的本发明实施例提供的嵌入式语音或音频信号编码方法低频补充信息编码层对应的码流结构示意图;
图8为本发明实施例提供的嵌入式语音或音频信号编码装置结构示意图;
图9为本发明实施例提供的嵌入式语音或音频信号解码方法的流程图;
图10为图9所示的本发明实施例提供的嵌入式语音或音频信号解码方法步骤902解码端原理示意图;
图11为图10所示的本发明实施例提供的嵌入式语音或音频信号解码方法高频信息解码层原理示意图;
图12为图10所示的本发明实施例提供的嵌入式语音或音频信号解码方法低频补充信息解码层原理示意图;
图13为本发明实施例提供的嵌入式语音或音频信号解码装置结构示意图。
具体实施方式
为了解决现有的嵌入式语音编码标准能够处理的信号频带较窄,不适合对音频信号编码的问题,本发明实施例提供一种嵌入式语音或音频信号编解码方法和装置。
如图1所示,本发明实施例提供的嵌入式语音或音频信号编码方法,包括:
步骤101,根据单声道超宽带语音或音频信号所占用的频带,将所述信号划分成低频子频带和高频子频带;
步骤102,在宽带嵌入式编码层,对所述单声道超宽带语音或音频信号的低频子频带信号进行嵌入式编码;
步骤103,在预设的高频信号编码层,对所述单声道超宽带语音或音频信号的高频子频带信号进行嵌入式编码。
通过上述步骤101至103所述,本发明实施例提供嵌入式语音或音频信号编码方法,能够对采样频率为32kbps的单声道超宽带语音或音频信号进行编码。
在现有技术中,对低频语音信号进行编码时,其编码质量并不理想,为了解决该问题,如图1所示,本发明实施例提供的嵌入式语音或音频信号编码方法,还包括:
步骤104,在预设的低频补充信息编码层,对低频子频带的修正的离散余弦变换(MDCT)残差系数进行嵌入式编码。
在本实施例中,所述宽带嵌入式编码层为嵌入式语音编码标准G.729.1提供的嵌入式编码层;所述高频信号编码层是在所述嵌入式语音编码标准G.729.1提供的嵌入式编码层基础上增加的编码层,该高频信号编码层包括3个编码子层,分别为:第一高频信号编码子层、第二高频信号编码子层和第三高频信号编码子层,其中,所述第一高频信号编码子层为36kbps编码层,所述第二高频信号编码子层为40kbps编码层,所述第三高频信号编码子层为48kbps编码层;所述低频补充信息编码层是在所述高频信号编码层的基础上增加的编码层,该低频补充信息编码层包括2个编码子层,分别为:第一低频补充信息编码子层和第二低频补充信息编码子层,其中,所述第一低频补充信息编码子层为56kbps编码层,所述第二低频补充信息编码子层为64kbps编码层。在实际的使用过程中,所述宽带嵌入式编码层还可以为其他嵌入式编码标准提供的编码层,此处不对其进行详细说明。以下所述的本发明实施例提供的嵌入式语音或音频信号编码方法,均是在嵌入式语音编码标准G.729.1的基础之上进行编码的。
本发明实施例提供嵌入式语音或音频信号编码方法,通过上述新增的五个编码层,可以在嵌入式语音编码标准G.729.1提供的32kbps编码速率基础上,增加以下五种编码速率:36kbps、40kbps、48kbps、56kbps和64kbps。其中,低层码率的码流包含在高层码率的码流中,随着码流层次的增加,解码信号质量也随之递增。
为了使本领域技术人员能够更清楚地理解本发明实施例提供的技术方案,下面以具体的实施例和附图对本发明实施例提供的嵌入式语音或音频信号编码方法进行详细说明。
在本实施例中,所述超宽带语音或音频信号为32kHz采样,有效带宽是14kHz的单声道超宽带语音或音频信号,编码端的编码速率为64kbps。
由于嵌入式语音编码标准G.729.1规定的处理帧长为20ms,为了与其保持一致,在本发明实施例中,单声道超宽带语音、音频信号的处理帧长也为20ms。本实施例所述的单声道超宽带语音或音频信号的采样频率为32kHz,由此可知,每帧超宽带信号的样点数为640个。
当编码端的编码速率为64kbps时,本发明实施例提供的嵌入式语音或音频信号编码方法可以通过三个编码模块进行嵌入式编码。如图2所示,所述三个编码模块分别为:1、编码速率小于32kbps的G.729.1编码模块;2、编码速率为36kbps或者40kbps或者48kbps的高频信号编码模块;3、编码速率为56kbps或者64kbps的低频补充信号编码模块。
下面分别对本发明实施例提供的嵌入式语音或音频信号编码方法采用以上三个编码模块进行嵌入式编码的情况进行说明:
1、采用编码速率小于32kbps的G.729.1编码模块,对所述超宽带单通道语音或音频信号的低频子频带信号进行嵌入式编码。
其步骤包括:
首先,提取所述32kHz采样的单声道超宽带语音或音频信号的低频子频带的信号,如图2所示,包括:
对原始输入的32kHz采样的单声道超宽带语音或音频信号进行下采样,获得16kHz采样的信号;
采用低通滤波器对该16kHz采样的信号进行低通滤波,滤除8kHz以上频率部分的信号,获得低频子频带部分的信号;在本实施例中,所述低通滤波器应该在保证滤除8kHz以上频率成分的前提下,尽量避免影响7kHz以下的频率成分。
其次,采用宽带信号编码器对所述低频子频带信号进行嵌入式编码,在本实施例中,所述宽带信号编码器为图2所示的G.729.1编码模块,包括:
采用代数码激励线性预测(ACELP)编码技术对所述低频子频带信号进行编码,产生8kbps和12kbps编码层的码流(即:形成编码速率为12kbps的码流);
采用时域频带扩展技术(TDBWE)对所述低频子频带信号进行编码,产生14kbps编码层的码流(即:形成编码速率为14kbps的码流);
采用时域混叠抵消(TDAC)的预测变换编码技术对所述低频子频带信号进行编码,产生16kbps至32kbps编码层的码流(即:形成编码速率为32kbps的码流)。
2、采用编码速率为36kbps或者40kbps或者48kbps的高频信号编码模块,对所述单声道超宽带语音或音频信号的高频子频带信号进行嵌入式编码。
通过上述编码速率小于32kbps的G.729.1编码模块对所述单声道超宽带语音或音频信号进行编码以后,获得的码流速率为32kbps,所述G.729.1编码模块仅对所述单声道超宽带语音或音频信号的低频子频带信号进行了嵌入式编码,在本发明实施例提供的嵌入式语音或音频信号编码方法中,通过编码速率为36kbps或者40kbps或者48kbps的高频信号编码模块,对所述单声道超宽带语音或音频信号的高频子频带信号进行了嵌入式编码。
其步骤包括:
首先,提取所述32kHz采样的单声道超宽带语音或音频信号的高频子频带信号,在本实施例中,所述高频子频带的频率范围为7至14kHz;
在本实施例中,可以通过提取所述单声道超宽带语音或音频信号的调制叠接变换(MLT)系数,获得所述7至14kHz范围内的信号,其具体步骤包括:
将每帧输入的单声道超宽带语音、音频信号按下述公式(1)进行MLT变换:
mlt ( m ) = Σ n = 0 1279 2 640 sin ( π 1280 ( n + 0.5 ) ) cos ( π 640 ( n - 319.5 ) ( m + 0.5 ) ) x ( n ) - - - ( 1 ) 得到
640个MLT系数,所述640个MLT系数表示的是0至16kHz范围内的频谱值,提取7至14kHz频带范围的MLT系数,即:提取第281到第560个MLT系数,共计280个MLT系数,该280个MLT系数即为单声道超宽带语音或音频信号的高频子频带信号。
其次,采用MLT对所述高频子频带信号进行嵌入式编码,如图3所示,其具体步骤包括:
将上述提取出的7至14kHz频带范围的280个MLT系数划分成一个以上的区域,在本实施例中,将所述MLT系数平均划分成14个区域,每个区域拥有20个采样点(280/14=20),每个区域的带宽为500Hz(7kHz/14=500Hz);
按照公式(2),依次求出每个区域内MLT系数的均方值,即:该区域的幅度包络值:
rms ( r ) = 1 20 Σ n = 0 19 mlt ( 20 r + n ) mlt ( 20 r + n ) - - - ( 2 )
其中,r表示区域的编号;
对得到的14个区域的幅度包络值进行标量量化,获得各个区域的幅度包络量化值,对所述各个区域的幅度包络量化值进行哈夫曼编码,并写入36kbps编码层所对应的码流;
根据各区域幅度包络量化值的大小,对所述14个区域进行排序,规定各个频带的重要性,幅度包络值大的频带重要于包络值小的频带;
根据MLT系数编码可利用的比特数和各频带的幅度包络量化值,得到16种分类方法,不同分类方法下各频带所分配的比特数不同;从中选出一种最优分类方法,用4比特的分类控制信息来描述,并将这4个比特写入36kbps编码层对应的码流;
本实施例中,编码端的编码速率为64kbps,在所述36kbps、40kbps和48kbps编码层中,高频子频带信号的最高编码速率为16kbps(48kbps-32kbps=16kbps),因此,分配到每帧MLT系数编码可利用的比特数为:
16kbps*20ms=320bits    (3)
将每个区域内的MLT系数都除以该区域幅度包络量化值,得到归一化的MLT系数,将每个区域归一化的MLT系数进行标量量化,并根据所述选出的最优分类方法对每个区域量化后的归一化MLT系数进行哈夫曼编码,并按照所述各个区域的排列顺序写入码流,其具体为:按照所述各个区域的排列顺序,将所述进行哈夫曼编码后的归一化MLT系数分成三个部分,第一部分、第二部分和第三部分,将所述第一部分写入36kbps编码层对应的码流,将所述第二部分写入40kbps编码层对应的码流,将所述第三部分写入48bps编码层对应的码流。
根据公式(3)可知,MLT系数编码所需的总比特数为320bits,36kbps编码层编码MLT系数的比特数为:
(36-32)kbps*20ms=80bits    (4)
40kbps层编码MLT系数的比特数为:
(40-36)kbps*20ms=80bits    (5)
48kbps层编码MLT系数的比特数为:
(48-40)kbps*20ms=160bits    (6)
如图4所示,最终编码MLT系数形成的码流信息,共由三部分构成:各区域的幅度包络量化值(变长),分类控制比特(4比特),归一化MLT系数量化值(变长)。
在实际的使用过程中,网络需要的传输速率可能与编码端的编码速率不相同,当网络需要的传输速率(即实际需要的编码速率)为36kbps或者40kbps时,需要对36kbps、40kbps和48kbps编码层的码流进行截断,例如:当实际需要的编码速率为40kbps时,需要将所述48kbps编码层截断,保留36kbps编码层和40kbps编码层,即:保留如图4所示的前160bits信息;当实际需要的编码速率为36kbps时,需要将所述40kbps编码层和48kbps编码层截断,保留36kbps编码层,即:保留如图4所示的前80bits信息。
因为对各个区域的归一化MLT系数量化值进行哈夫曼编码时,是按照区域的重要性来依次写入码流的,同时,幅度包络量化值和分类控制信息都写在了前80bits信息(即:36kbps编码层)中,因此保证了36、40、48kbps各层码流的重要性依次递减,在36、40、48kbps编码层占用的320bits信息中,前160bits信息要远远重要于后160bits信息,所以对码流进行截断后,也能够保证所编码的单声道超宽带语音或音频信号完整连续。
通过所述高频信号编码层对单声道超宽带语音或音频信号进行编码后,获得的码流速率为48kbps。
3、采用编码速率为56kbps或者64kbps的低频补充信号编码模块,对低频子频带编码时的补充信号进行嵌入式编码。
如图2所示,在G.729.1编码模块中,16kbps至32kbps(2kbps递增)编码层,采用的是TDAC预测变换编码技术。该技术把输入的原始语音或音频信号与码率为12kbps时本地解码信号的差值,通过感知加权滤波器,进行修正的离散余弦变换(MDCT),得到输入谱DLB w(k),同样,对高频带信号SHB(n)进行MDCT变换,得到输入谱SHB(k)。DLB w(k)表示的是0至4kHz频段的频域系数,SHB(k)表示的是4至8kHz频段的频域系数,把两个分裂的MDCT谱DLB w(k)和SHB(n)合并,进行形状-增益矢量量化。合并后的谱被分成子带,每一子带的增益定义了谱包络,每一子带的形状用嵌入式的球形矢量量化进行编码,从而形成16kbps至32kbps编码层对应的码流。
在所述G.729.1编码中,由于受编码比特数的限制,对DLB w(k)和SHB(n)的编码质量并不理想,尤其是对于音频信号,在4至7kHz频段的编码误差很大,编码后音频信号的谐波结构发生了丢失现象。
为了解决上述问题,本发明实施例提供的嵌入式语音或音频信号编码方法,在采用编码速率为36kbps或者40kbps或者48kbps的高频信号编码模块,对所述单声道超宽带语音或音频信号进行嵌入式编码,获得48kbps编码速率的码流以后,又采用编码速率为56kbps或者64kbps的低频补充信号编码模块,对DLB w(k)和SHB(n)的编码残差进行了重新编码。
其具体步骤包括:
首先,获取低频子频带的MDCT残差系数;
如图5所示,本发明实施例提供的技术方案中,将G.729.1解码端的TDAC解码操作引入编码端,使得编码端在TDAC编码模块中,可进行MDCT系数的本地解码操作,并保证在编码端得到与解码端相同的MDCT重建系数
Figure S2008100944347D00122
将本地解码后的MDCT系数与编码前的MDCT系数DLB w(k)和SHB(n)求差值,得到MDCT域的MDCT残差系数信号,此时得到的MDCT残差系数共有320个,其表示的实际频率范围为0至8kHz;由于本模块仅需处理0~7kHz范围内的MDCT系数,只提取前280个MDCT系数进行编码;本实施例所述的编码端的编码速率为64kbps,只在56、64kbps码率层进行MDCT残差系数编码,对MDCT残差系数编码的最高码率为16kbps(64kbps-48kbps=16kbps),对应于每帧的MDCT系数编码可利用的比特数就是320bits(16kbps*20ms=320bits)。
其次,对所述低频子频带的MDCT残差系数进行嵌入式编码,如图6所示,其具体步骤包括:
将上述获得的280个MDCT残差系数划分成一个以上的区域,在本实施例中,将所述MDCT残差系数平均划分成14个区域,每个区域拥有20个采样点(280/14=20),每个区域的带宽为500Hz(7kHz/14=500Hz);
按照公式(2),依次求出每个区域内MDCT残差系数的均方值,即:该区域的幅度包络值,对得到的14个区域的幅度包络值进行标量量化,获得各个区域的幅度包络量化值,对所述幅度包络量化值进行哈夫曼编码,并且写入56kbps编码层所对应的码流;
根据各区域幅度包络量化值的大小,对所述14个区域进行排序,规定各个频带的重要性,幅度包络值大的频带重要于包络值小的频带;
根据上述MDCT残差系数编码可利用的比特数和各频带的幅度包络量化值,得到16种分类方法,不同分类方法下各频带所分配的比特数不同;从中选出一种最优分类方法,用4比特的分类控制信息来描述,并将这4个比特写入56kbps编码层对应的码流;
将每个区域内的MDCT残差系数都除以该区域幅度包络量化值,得到归一化的MDCT残差系数,将每个区域归一化的MDCT残差系数进行标量量化,并根据所述选出的最优分类方法对每个区域归一化的MDCT残差系数量化值进行哈夫曼编码,按照所述各个区域的排列顺序写入码流,其具体为:按照所述各个区域的排列顺序,将所述进行哈夫曼编码后的归一化MDCT残差系数量化值分成两个部分,第一部分和第二部分,将所述第一部分写入56kbps编码层对应的码流,将所述第二部分写入64kbps编码层对应的码流;
这两个码率层中MDCT残差系数编码所需的总比特数为320bits,其中,56kbps编码层的比特数为:
(56-48)kbps*20ms=160bits    (4)
64kbps层编码MDCT系数的比特数为:
(64-56)kbps*20ms=160bits    (5)
如图7所示,最终编码MDCT残差系数形成的码流信息,共由三部分构成:各区域的幅度包络量化值(变长),分类控制比特(4比特),归一化MDCT残差系数量化值(变长)。
在实际的使用过程中,网络需要的传输速率可能与编码端的编码速率不相同,当网络需要的传输速率(即实际需要的编码速率)为56kbps时,需要将64kbps编码层截断,保留56kbps编码层,即:保留如图7所示的前160bits信息。
因为在对各区域的归一化MDCT残差系数量化值进行哈夫曼编码时,是按照区域的重要性来依次写入码流的,同时幅度包络量化值和分类控制信息都写在了前160bits信息(即:56kbps编码层)中,保证了56和64kbps编码层码流的重要性依次递减,在320bits信息中,前160bits信息要远远重要于后160bits,所以,在对码流进行截断后也能够保证所编码的语音或音频信号完整连续。
本发明实施例提供的嵌入式语音或音频信号编码方法,通过上述三个编码模块进行嵌入式编码以后,最终获得编码速率为64kbps的码流。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读存储介质中,该程序在执行时,包括如下步骤:根据单声道超宽带语音或音频信号所占用的频带,将所述信号划分成低频子频带和高频子频带;在宽带嵌入式编码层,对所述单声道超宽带语音或音频信号的低频子频带信号进行嵌入式编码;在预设的高频信号编码层,对所述单声道超宽带单声道语音或音频信号的高频子频带信号进行嵌入式编码。所述的存储介质,如:ROM/RAM、磁碟或光盘等。
本发明实施例提供的嵌入式语音或音频信号编码方法,在现有的嵌入式语音编码标准G.729.1提供的嵌入式编码层的基础上,新增加了超宽带嵌入式编码层,可以对32kHz采样频率的超宽带语音和音频信号进行编码操作,解决了现有嵌入式语音编码标准G.729.1只能对16kHz采样的宽带信号进行编码操作,造成解码出的信号带宽太窄,无法满足音频信号要求的问题。本发明实施例提供的嵌入式单声道语音、音频编解码方法和装置,能够满足语音和音频的编码要求,获得高质量的语音和音频信号。
与上述嵌入式语音或音频信号编码方法相对应地,本发明实施例还提供一种嵌入式单声道语音、音频编码装置。如图8所示,该装置包括:
频带划分单元801,用于根据单声道超宽带语音或音频信号所占用的频带,将所述信号划分成低频子频带和高频子频带;
低频子频带嵌入式编码单元802,用于在宽带嵌入式编码层,对所述单声道超宽带语音或音频信号的低频子频带信号进行嵌入式编码;
高频子频带嵌入式编码单元803,用于在预设的高频信号编码层,对所述单声道超宽带语音或音频信号的高频子频带信号进行嵌入式编码。
进一步地,所述嵌入式语音或音频信号编码装置,还可以包括:
残差系数编码单元804,用于在预设的低频补充信息编码层,对低频子频带的修正的离散余弦变换MDCT残差系数进行嵌入式编码。
进一步地,所述嵌入式语音或音频信号编码装置,还可以包括:
码流截取单元805,用于对所述高频信号编码层编码后的码流,或所述低频补充信息编码层编码后的码流进行截断。
本发明实施例提供的嵌入式语音或音频信号编码装置,预设有高频信号编码层,可以对16kHz以上采样频率的超宽带语音和音频信号进行编码操作,解决了现有嵌入式编码方法只能对16kHz采样的宽带信号进行编码操作,造成解码出的信号带宽太窄,无法满足音频信号要求的问题。本发明实施例提供的嵌入式单声道语音、音频编码装置,能够满足语音和音频的编码要求,获得高质量的语音和音频信号。并且,本发明实施例提供的嵌入式语音或音频信号编码装置,还预设有低频补充信息编码层,通过使用该编码层对单声道语音或音频的低频信号进行补充编码,提高了对低频信号的编码质量。
与上述嵌入式语音或音频信号编码方法相对应地,本发明实施例还提供一种嵌入式语音或音频信号解码方法。
如图9所示,本发明实施例提供的嵌入式语音或音频信号解码方法,包括:
步骤901,在宽带嵌入式解码层,对单声道超宽带语音或音频信号的低频子频带信号进行逐层解码;
步骤902,在预设的高频信号解码层,对单声道超宽带语音或音频信号的高频子频带信号进行逐层解码;
步骤903,将所述单声道超宽带语音或音频信号解码后的低频子频带和高频子频带信号进行频谱合并。
通过上述步骤901至903所述,本发明实施例提供嵌入式语音或音频信号解码方法,能够对采样频率为32kbps的单声道超宽带语音或音频信号进行解码,并获得有效带宽为14kHz的语音或音频信号。
如图9所示,本发明实施例提供的嵌入式语音或音频信号解码方法,在步骤902和903之间,还包括:步骤904,在预设的低频补充信息解码层,对低频子频带的修正的离散余弦变换MDCT残差系数进行逐层解码。
本发明实施例提供的嵌入式语音或音频信号解码方法,通过步骤904能够解码出高质量的低频信号。
在本实施例中,所述宽带嵌入式解码层为嵌入式语音编码标准G.729.1提供的嵌入式解码层;所述高频信号解码层是在所述嵌入式语音编码标准G.729.1提供的嵌入式解码层基础上增加的解码层,该高频信号解码层包括3个解码子层,分别为:第一高频信号解码子层、第二高频信号解码子层和第三高频信号解码子层,其中,所述第一高频信号解码子层为36kbps解码层,所述第二高频信号解码子层为40kbps解码层,所述第三高频信号解码子层为48kbps解码层;所述低频补充信息解码层是在所述高频信号解码层基础上增加的解码层,该低频补充信息解码层包括2个解码子层,分别为:第一低频补充信息解码子层和第二低频补充信息解码子层,其中,所述第一低频补充信息解码子层为56kbps解码层,所述第二低频补充信息解码子层为64kbps解码层。在实际的使用过程中,所述宽带嵌入式解码层还可以为其他嵌入式编码标准提供的解码层,此处不对其进行详细说明。以下所述的本发明实施例提供的嵌入式语音或音频信号解码方法,均是在嵌入式语音编码标准G.729.1的基础之上进行解码的。
本发明实施例提供嵌入式语音或音频信号解码方法,通过上述新增的五个解码层,解码端可以在嵌入式语音编码标准G.729.1提供的32kbps码流速率基础上,解码出以下五种新增的码流速率的信号:36kbps、40kbps、48kbps、56kbps和64kbps。其中,低层码率的码流包含在高层码率的码流中,解码信号质量由低层到高层逐层递增。
为了使本领域技术人员能够更清楚地理解本发明实施例提供的技术方案,下面以具体的实施例和附图对本发明实施例提供的嵌入式语音或音频解码方法进行详细说明。
在本实施例中,解码端要解码出32kHz采样,有效带宽是14kHz的单声道超宽带语音或音频信号,所述解码端的解码速率为64kbps。
与编码端提供的三个编码模块相对应,本发明实施例提供的嵌入式语音或音频信号解码方法可以通过三个解码模块对接收到的单声道超宽带语音或音频信号进行解码。如图10所示,所述三个解码模块包括:1、解码速率小于32kbps的G.729.1解码模块;2、解码速率为36kbps或者40kbps或者48kbps的高频信号解码模块;3、解码速率为56kbps或者64kbps的低频补充信号解码模块。
在本实施例中,解码端是通过每帧接收到的比特数来判断接收到的码流速率,例如:解码端在一帧中接收到640bits信息,则判断接收到的码流速率为32kbps(640bits/20ms=32kbps),以此类推,解码端在一帧中接收到1280bits信息,则判断接收到的码流速率为64kbps(1280bits/20ms=64kbps)。
当接收到的码流速率不同时,解码端通过上述三个解码模块,对所述码流执行不同的解码操作,下面分别对解码端采用上述三个模块进行解码操作的过程进行详细说明。
1、采用解码速率小于32kbps的G.729.1解码模块,对解码端接收到的码流中,嵌入式语音编码标准G.729.1提供的8至32kbps码率层中的信号逐层解码。
其具体步骤包括:
首先,提取接收到的码流中8至32kbps码率层的码流。
其次,采用宽带信号解码器对所述8至32kbps码率层的码流逐层解码,生成相应码率下的16kHz采样的宽带信号;在本实施例中,所述宽带信号解码器为图10所示的G.729.1解码模块,由于该G.729.1解码模块的具体解码过程与现有技术相同,此处不再赘述。
第三,对所述16kHz采样的宽带信号进行上采样处理,得到有效带宽范围在0至7kHz的32kHz采样信号。
2、采用解码速率为36kbps或者40kbps或者48kbps的高频信号解码模块,对解码端接收到的码流中,本发明实施例提供的高频信号解码层中的信号解码。
当解码端在一帧中接收到960bits信息(即:码流速率为48kbps)时,本发明实施例提供的嵌入式语音或音频信号解码方法,在采用上述G.729.1解码模块对码流中的8至32kbps码率层信息进行解码之后,还要采用解码速率为36kbps或者40kbps或者48kbps的高频信号解码模块对码流中的高频信号解码层信息进行解码。
如图11所示,本发明实施例采用所述高频信号解码模块,利用MLT逆变换(IMLT),对码流信号中高频信号解码层包含的36、40和48kbps解码层整体信息进行解码。其具体步骤包括:
首先,恢复出MLT域的各个区域的幅度包络量化值和4bits的分类控制信息。
其次,根据与编码端相同的分类方法,对36、40和48kbps码率层中的归一化MLT系数量化值进行反量化,获得各个频带的归一化MLT系数;
在本实施例中,所述与编码端相同的分类方法,可以通过36、40和48kbps码率层可利用的总比特数320和接收到的4bits分类控制信息确定。
第三,将所述各个频带的归一化MLT系数分别乘以各个区域的幅度包络量化值,得到信号的MLT系数;
为了能够获得高频子频带部分信号的MLT系数,在本实施例中,解码端解码出的MLT系数应该在7至14kHz频带范围内;所以,需要把上述解码出的0至7kHz频带范围内的MLT系数进行频谱搬移,将其搬移到7至14kHz频带范围内,进行频谱搬移以后,将7至14kHz频带范围以外的MLT置0。
第四,对所述高频子频带部分信号的MLT系数进行逆变换,获得时域高频子频带解码信号。
本发明实施例提供的嵌入式单声道解码方法通过上述G.729.1解码模块和高频信号解码模块,对所述接收到的码流信号的低频子频带部分和高频子频带信号进行分别解码以后,为了得到完整的单声道超宽带语音或音频信号,还需要对所述解码获得的低频子频带信号和高频子频带信号进行频谱合并,其具体步骤包括:对所述G.729.1解码模块解码出的宽带信号进行上采样,获得32kHz采样的信号;将该采样后的信号与所述高频信号解码模块解码出的信号相叠加,获得48kbps码流下的单声道超宽带语音或音频信号。
当解码端在一帧中接收到800bits信息(即:码流速率为40kbps)或720bits信息(即:码流速率为36kbps)时,所述码流中包含的高频信号解码层缺少了48kbps码率层和40kbps码率层(码流速率为36kbps时)的信息,即:高频信号解码层不完整。
根据本发明实施例提供的嵌入式语音或音频信号编码方法可知,在36kbps编码层(和40kbps编码层)中包含了高频子频带划分的各个区域的幅度包络量化值、分类控制信息和归一化MLT系数量化值的第一部分(和归一化MLT系数量化值的第二部分),由于所述归一化MLT系数量化值是按照各个区域的重要性顺序写入码流的,所以所述36kbps编码层(和40kbps编码层)包含了解码高频信号解码层所需的必要信息,此时,仍然可以按照上述码流速率为48kbps时的情况,利用高频信号解码模块,对码流中高频信号解码层对应的信息进行解码。
在利用上述高频信号解码模块进行解码时,如图10所示,在恢复出MLT域的各个区域的幅度包络量化值之后,还需要按照所述幅度包络量化值的大小,对各个区域的幅度包络量化值进行排序,确定出36kbps码率层(和40kbps码率层)包含了哪些重要区域的MLT系数信息,从而解码出所述重要区域的MLT系数。对于缺少的48kbps码率层(和40kbps码率层)中的次重要区域的MLT系数信息,为了恢复这些区域的MLT系数,保证整体解码信号频带的完整性、连续性,本发明实施例采用噪声填充技术进行解码,即利用随机数与已知的幅度包络量化值相结合粗略地得到这些区域的MLT系数。通过所述噪声填充技术,能够解码出完整的高频信号解码层MLT系数,从而实现对单声道超带宽语音、音频信号的解码。
3、采用解码速率为56kbps或者64kbps的低频补充信号解码模块,对解码端接收到的码流中,本发明实施例提供的低频补充信息解码层中的信号解码。
当解码端在一帧中接收到1280bits信息(即:码流速率为64kbps)时,本发明实施例提供的嵌入式语音或音频信号解码方法,在采用上述G.729.1解码模块对码流中的8至32kbps码率层信息进行解码,采用解码速率为36kbps或者40kbps或者48kbps的高频信号解码模块对码流中的高频信号解码层信息进行解码之后,还要采用解码速率为56kbps或者64kbps的低频补充信号解码模块对码流中的低频补充信息解码层中的信号解码。
在本实施例中,所述低频补充信号为低频子频带在编码时产生的MDCT残差系数。如图12所示,其具体步骤包括:
首先,通过56、64kbps码率层解码出0至7kHz频段的MDCT残差系数。
其次,将所述0至7kHz频段的MDCT残差系数进行频谱分离,分成4至7kHz和0至4kHz两部分。
第三,将所述4至7kHz和0至4kHz两部分的MDCT残差系数,分别与解码端的TDAC模块解码出的高频带(4至7kHz)重建信号
Figure S2008100944347D00201
和低频带(0至4kHz)MDCT重建系数
Figure S2008100944347D00202
相加,得到修正后的高频带(4至7kHz)MDCT重建系数SHB(k)和低频带(0至4kHz)MDCT重建系数DLB w(k)。
第四,将所述修正后的高频带(4至7kHz)MDCT重建系数SHB(k)划分成一个以上区域,在本实施例中,将所述SHB(k)等分成6个区域,每个区域有20个MDCT系数( 280 × ( 7 - 4 ) 7 = 120 , 表示4至7kHz频段的MDCT系数的个数; 120 6 = 20 , 表示每个区域MDCT系数的个数),表示的带宽为500Hz ( ( 7 - 4 ) kHz 6 = 500 Hz ) ; 求出每个区域内的MDCT重建系数的和,若某一个区域的MDCT系数之和为0,则该频带的MDCT系数由解码端TDBWE模块生成的系数替代。
第五,根据第四以及第三中得到的最终MDCT系数,进行逆MDCT变换,得到时域信号
Figure S2008100944347D00214
Figure S2008100944347D00215
第六,将所述时域信号
Figure S2008100944347D00216
Figure S2008100944347D00217
按照G.729.1中的解码操作进行解码,恢复出16kHz采样的宽带信号,对该宽带信号进行上采样,并与所述36、40、48kbps解码层解码出的32kHz采样的单声道超宽带语音、音频信号相加得到64kbps码率下的解码信号。
当解码端在一帧中接收到1120bits信息(即:码流速率为56kbps)时,所述码流中包含的低频补充信号解码层缺少了64kbps解码层,即:低频补充信号解码层不完整。
根据本发明实施例提供的嵌入式语音或音频信号编码方法可知,56kbps解码层码流信息包含的是0至7kHz频段中重要区域的MDCT残差系数,解码处理时可以恢复出这些频带的MDCT残差系数;对于频段中次重要频带,码流中只有它们的幅度包络量化值,而没有其细节信息(MDCT残差系数)。此时,对于这些区域,本发明实施例统一将这些区域的MDCT残差系数置为零值。由此,解得到0至7kHz频段完整的MDCT残差系数。将其与TDAC解码出的高频带(4至7kHz)重建信号
Figure S2008100944347D00218
和低频带(0至4kHz)MDCT重建系数
Figure S2008100944347D00219
相加,得到修正后的高频带(4至7kHz)MDCT重建系数SHB(k)和低频带(0至4kHz)MDCT重建系数DLB w(k),同样将高频带(4至7kHz)MDCT重建系数SHB(k)等分成6个频带,求出每个频带内MDCT重建系数之和,若某一个频带的MDCT系数之和为零,则该频带的MDCT系数由TDBWE生成的系数来替代。这样根据最终的MDCT系数,进行逆MDCT变换,得到时域信号
Figure S2008100944347D00222
将这两个信号按照G.729.1中的解码操作进行解码,恢复出16kHz采样的宽带信号,进行上采样后与36、40、48kbps解码层解码出的32kHz采样的超宽带信息相加得到56kbps码率下的解码信号。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读存储介质中,该程序在执行时,包括如下步骤:在宽带嵌入式解码层,对单声道超宽带语音或音频信号的低频子频带信号进行逐层解码;在预设的高频信号解码层,对单声道超宽带语音或音频信号的高频子频带信号进行逐层解码;将所述单声道超宽带语音或音频信号解码后的低频子频带和高频子频带信号进行频谱合并。所述的存储介质,如:ROM/RAM、磁碟或光盘等。
本发明实施例提供的嵌入式语音或音频信号解码方法,基于现有的嵌入式语音编码标准G.729.1,可以解码出8、16、32kHz采样的语音和音频信号,处理信号的带宽范围大大地超过了G.729.1编码器,这样在保证编码压缩率的前提下,极大限度的满足人耳对音频信号的要求。
与上述嵌入式语音或音频信号解码方法相对应地,本发明还提供一种嵌入式语音或音频解码装置。如图13所示,所述装置包括:
低频子频带嵌入式解码单元1301,用于在宽带嵌入式解码层,对单声道超宽带语音或音频信号的低频子频带信号进行逐层解码;
高频子频带嵌入式解码单元1302,用于在预设的高频信号解码层,对单声道超宽带语音或音频信号的高频子频带信号进行逐层解码;
频谱合并单元1303,用于将所述单声道超宽带语音或音频信号解码后的低频子频带和高频子频带信号进行频谱合并。
进一步地,所述嵌入式语音或音频信号解码装置,还可以包括:
噪声填充单元1304,当码流中包含高频信号解码层的第一高频信号解码子层时,用于采用随机数对码流中缺少的第二高频信号解码子层和第三高频信号解码子层的信号进行填充;当码流中包含高频信号解码层的第一高频信号解码子层和第二高频信号解码子层时,用于采用随机数对码流中缺少的第三高频信号解码子层的信号进行填充。
进一步地,所述嵌入式语音或音频信号解码装置,还可以包括:
残差系数解码单元1305,用于在预设的低频补充信息解码层,对低频子频带的修正的离散余弦变换MDCT残差系数进行逐层解码。
进一步地,所述残差系数解码单元1305还可以包括:
置零单元13051,当码流中包含低频补充信息解码层的第一低频补充信息解码子层时,用于将码流中缺少的第二低频补充信息解码层的修正的离散余弦变换MDCT重建系数置0。
本发明实施例提供的嵌入式语音或音频信号解码装置,预设有高频信号解码层,可以对16kHz以上采样频率的超宽带语音和音频信号进行解码操作,解决了现有嵌入式解码方法只能对16kHz采样的宽带信号进行解码操作,造成解码出的信号带宽太窄,无法满足音频信号要求的问题。本发明实施例提供的嵌入式单声道语音、音频解码装置,能够满足语音和音频的解码要求,获得高质量的语音和音频信号。并且,本发明实施例提供的嵌入式语音或音频信号解码装置,还预设有低频补充信息解码层,通过使用该解码层对单声道语音或音频的低频信号进行补充解码,提高了对低频信号的解码质量。
本发明实施例提供的嵌入式语音或音频信号编解码方法和装置适用于对语音和音频信号的嵌入式编码,以满足高质量的音/视频会议、电视电话会议、网络通信、移动通信、网络拥塞控制以及第三代和第四代移动通信对嵌入式语音与音频编码的广泛需求。
以上所述,仅为本发明实施例的具体实施方式,但本发明实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变换或替换,都应涵盖在本发明的保护范围之内。因此,本发明实施例的保护范围应该以权利要求的保护范围为准。

Claims (25)

1.一种嵌入式语音或音频信号编码方法,其特征在于,包括:
根据单声道超宽带语音或音频信号所占用的频带,将所述信号划分成低频子频带和高频子频带;
在宽带嵌入式编码层,对所述单声道超宽带语音或音频信号的低频子频带信号进行嵌入式编码;
在预设的高频信号编码层,对所述单声道超宽带单声道语音或音频信号的高频子频带信号进行嵌入式编码;
其中,所述在预设的高频信号编码层,对所述单声道超宽带语音或音频信号的高频子频带信号进行嵌入式编码包括:在预设的高频信号编码层,采用调制叠接变换MLT对所述单声道超宽带语音或音频信号的高频子频带信号进行嵌入式编码;
所述在预设的高频信号编码层,采用调制叠接变换MLT对所述单声道超宽带语音或音频信号的高频子频带信号进行嵌入式编码包括:获取所述单声道超宽带语音或音频信号在高频子频带信号的调制叠接变换MLT系数;将所述调制叠接变换MLT系数划分成一个以上的区域;获取所述各个区域的幅度包络量化值和归一化调制叠接变换MLT系数量化值;在所述高频信号编码层,将各个区域的幅度包络量化值、分类控制信息和各个区域的归一化调制叠接变换MLT系数量化值,依次进行编码,所述分类控制信息表征各个区域分配的编码比特数。
2.根据权利要求1所述的嵌入式语音或音频信号编码方法,其特征在于,所述宽带嵌入式编码层为嵌入式语音编码标准G.729.1提供的嵌入式编码层。
3.根据权利要求1所述的嵌入式语音或音频信号编码方法,其特征在于,所述将所述调制叠接变换MLT系数划分成一个以上的区域之后,还包括:对各 个区域进行排序;
所述在高频信号编码层,将各个区域的归一化调制叠接变换MLT系数量化值进行编码包括:在高频信号编码层,按照各个区域的排列顺序,依次将各个区域的归一化调制叠接变换MLT系数量化值进行编码。
4.根据权利要求1或3所述的嵌入式语音或音频信号编码方法,其特征在于,所述高频信号编码层包括第一高频信号编码子层、第二高频信号编码子层和第三高频信号编码子层;
所述各个区域的归一化调制叠接变换MLT系数量化值分为第一部分、第二部分和第三部分;
所述在所述高频信号编码层,将各个区域的幅度包络量化值、分类控制信息和各个区域的归一化调制叠接变换MLT系数量化值,依次进行编码包括:
在所述第一高频信号编码层,将各个区域的幅度包络量化值、分类控制信息和归一化调制叠接变换MLT系数量化值的第一部分进行编码;
在所述第二高频信号编码层,将所述归一化调制叠接变换MLT系数量化值的第二部分进行编码;
在所述第三高频信号编码层,将所述归一化调制叠接变换MLT系数量化值的第三部分进行编码。
5.根据权利要求1所述的嵌入式语音或音频编码方法,其特征在于,所述在预设的高频信号编码层,对所述单声道超宽带语音或音频信号的高频子频带信号进行嵌入式编码之后,还包括:对所述高频信号编码层进行截断的步骤。
6.根据权利要求1所述的嵌入式语音或音频信号编码方法,其特征在于,所述在预设的高频信号编码层,对所述单声道超宽带语音或音频信号的高频子频带信号进行嵌入式编码之后,还包括: 
获取低频子频带的修正的离散余弦变换MDCT残差系数;
在预设的低频补充信息编码层,对低频子频带的修正的离散余弦变换MDCT残差系数进行嵌入式编码。
7.根据权利要求6所述的嵌入式语音或音频信号编码方法,其特征在于,所述获取低频子频带的修正的离散余弦变换MDCT残差系数包括:
对所述低频子频带编码后的修正的离散余弦变换MDCT系数进行本地解码;
将所述本地解码后的修正的离散余弦变换MDCT系数与编码前的修正的离散余弦变换MDCT系数求差,获得低频子频带的修正的离散余弦变换MDCT残差系数。
8.根据权利要求6所述的嵌入式语音或音频信号编码方法,其特征在于,所述在预设的低频补充信息编码层,对低频子频带的修正的离散余弦变换MDCT残差系数进行嵌入式编码包括:
将所述修正的离散余弦变换MDCT残差系数划分成一个以上的区域;
获取所述各个区域的幅度包络量化值和归一化修正的离散余弦变换MDCT残差系数量化值;
在预设的低频补充信息编码层,将各个区域的幅度包络量化值、分类控制信息和各个区域的归一化修正的离散余弦变换MDCT残差系数量化值,依次进行编码,所述分类控制信息表征各个区域分配的编码比特数。
9.根据权利要求8所述的嵌入式语音或音频信号编码方法,其特征在于,所述将所述修正的离散余弦变换MDCT残差系数划分成一个以上的区域之后,还包括:对各个区域进行排序;
所述在预设的低频补充信息编码层,将各个区域的归一化修正的离散余弦 变换MDCT残差系数量化值进行编码包括:在预设的低频补充信息编码层,按照各个区域的排列顺序,依次将各个区域的归一化修正的离散余弦变换MDCT残差系数量化值进行编码。
10.根据权利要求8或9所述的嵌入式语音或音频信号编码方法,其特征在于,所述低频补充信息编码层包括第一低频补充信息编码子层和第二低频补充信息编码子层;
所述各个区域的归一化修正的离散余弦变换MDCT残差系数量化值分为第一部分和第二部分;
所述在预设的低频补充信息编码层,将各个区域的幅度包络量化值、分类控制信息和各个区域的归一化修正的离散余弦变换MDCT残差系数量化值,依次进行编码包括:
在所述第一低频补充信息编码子层,将各个区域的幅度包络量化值、分类控制信息和归一化修正的离散余弦变换MDCT残差系数量化值的第一部分进行编码;
在所述第二低频补充信息编码子层,将所述归一化修正的离散余弦变换MDCT残差系数量化值的第二部分进行编码。
11.根据权利要求6所述的嵌入式语音或音频信号编码方法,其特征在于,所述在预设的低频补充信息编码层,对低频子频带的修正的离散余弦变换MDCT残差系数进行嵌入式编码之后,还包括:对所述低频补充信息编码层进行截断的步骤。
12.一种嵌入式语音或音频信号编码装置,其特征在于,包括:
频带划分单元,用于根据单声道超宽带语音或音频信号所占用的频带,将所述信号划分成低频子频带和高频子频带; 
低频子频带嵌入式编码单元,用于在宽带嵌入式编码层,对所述单声道超宽带语音或音频信号的低频子频带信号进行嵌入式编码;
高频子频带嵌入式编码单元,用于在预设的高频信号编码层,对所述单声道超宽带语音或音频信号的高频子频带信号进行嵌入式编码;
所述高频子频带嵌入式编码单元具体用于在预设的高频信号编码层,采用调制叠接变换MLT对所述单声道超宽带语音或音频信号的高频子频带信号进行嵌入式编码;
所述高频子频带嵌入式编码单元更具体用于:获取所述单声道超宽带语音或音频信号在高频子频带信号的调制叠接变换MLT系数;将所述调制叠接变换MLT系数划分成一个以上的区域;获取所述各个区域的幅度包络量化值和归一化调制叠接变换MLT系数量化值;在所述高频信号编码层,将各个区域的幅度包络量化值、分类控制信息和各个区域的归一化调制叠接变换MLT系数量化值,依次进行编码,所述分类控制信息表征各个区域分配的编码比特数。
13.根据权利要求12所述的嵌入式语音或音频信号编码装置,其特征在于,还包括:
残差系数编码单元,用于在预设的低频补充信息编码层,对低频子频带的修正的离散余弦变换MDCT残差系数进行嵌入式编码。
14.根据权利要求13所述的嵌入式语音或音频信号编码装置,其特征在于,还包括:
码流截取单元,用于对所述高频信号编码层编码后的码流,或所述低频补充信息编码层编码后的码流进行截断。
15.一种嵌入式语音或音频信号解码方法,其特征在于,包括:
在宽带嵌入式解码层,对单声道超宽带语音或音频信号的低频子频带信号 进行逐层解码;
在预设的高频信号解码层,对单声道超宽带语音或音频信号的高频子频带信号进行逐层解码;
将所述单声道超宽带语音或音频信号解码后的低频子频带和高频子频带信号进行频谱合并;
其中,所述在预设的高频信号解码层,对单声道超宽带语音或音频信号的高频子频带信号进行逐层解码包括:在预设的高频信号解码层,采用调制叠接逆变换IMLT对所述单声道超宽带语音或音频信号的高频信号进行逐层解码,获得所述单声道超宽带语音或音频信号的高频子频带信号;
所述在预设的高频信号解码层,采用调制叠接逆变换IMLT对所述单声道超宽带语音或音频信号的高频信号进行逐层解码,获得所述单声道超宽带语音或音频信号的高频子频带部分信号包括:获取所述高频子频带各个区域的幅度包络量化值和分类控制信息;根据所述分类控制信息,获取各个区域的归一化调制叠接变换MLT系数;根据所述各个区域的幅度包络量化值和归一化调制叠接变换MLT系数,获取所述高频子频带部分信号的调制叠接变换MLT系数;对所述调制叠接变换MLT系数进行逆变换,获得解码后的单声道超宽带语音或音频信号的高频子频带部分的信号。
16.根据权利要求15所述的嵌入式语音或音频信号解码方法,其特征在于,所述宽带嵌入式解码层为嵌入式语音编码标准G.729.1提供的嵌入式解码层。
17.根据权利要求15所述的嵌入式语音或音频信号解码方法,其特征在于,当码流中包含高频信号解码层的第一高频信号解码子层,或第一高频信号解码 子层和第二高频信号解码子层时,所述根据所述分类控制信息,获取各个区域的归一化调制叠接变换MLT系数之后,所述根据所述各个区域的幅度包络量化值和归一化调制叠接变换MLT系数,获取所述高频子频带部分信号的调制叠接变换MLT系数之前,还包括:采用随机数对码流中缺少的第二高频信号解码子层和第三高频信号解码子层,或第二高频信号解码子层的归一化调制叠接变换MLT系数进行填充。
18.根据权利要求15所述的嵌入式语音或音频信号解码方法,其特征在于,所述在预设的高频信号解码层,对单声道超宽带语音或音频信号的高频子频带分信号进行逐层解码之后,所述将所述单声道超宽带语音或音频信号解码后的低频子频带和高频子频带信号进行频谱合并之前,还包括:
在预设的低频补充信息解码层,对低频子频带的修正的离散余弦变换MDCT残差系数进行逐层解码。
19.根据权利要求18所述的嵌入式语音或音频信号解码方法,其特征在于,所述在预设的低频补充信息解码层,对低频子频带的修正的离散余弦变换MDCT残差系数进行逐层解码包括:
获取所述低频子频带的修正的离散余弦变换MDCT残差系数;
根据所述修正的离散余弦变换MDCT残差系数获得修正的离散余弦变换MDCT重建系数;
对所述修正的离散余弦变换MDCT重建系数进行逐层解码。
20.根据权利要求19所述的嵌入式语音或音频信号解码方法,其特征在于,当码流中包含低频补充信息解码层的第一低频补充信息解码子层时,所述根据所述修正的离散余弦变换MDCT残差系数获得修正的离散余弦变换MDCT重建系数之前,还包括:将码流中缺少的第二低频补充信息解码子层的修正的离散 余弦变换MDCT重建系数置0。
21.根据权利要求19所述的嵌入式语音或音频信号解码方法,其特征在于,所述根据所述修正的离散余弦变换MDCT残差系数获得修正的离散余弦变换MDCT重建系数之后,还包括:
将所述修正的离散余弦变换MDCT重建系数划分成至少一个区域;
对各个区域的修正的离散余弦变换MDCT重建系数分别求和;
当所述修正的离散余弦变换MDCT重建系数和为0时,时域频带扩展技术TDBWE生成该区域的所述修正的离散余弦变换MDCT重建系数。
22.一种嵌入式语音或音频信号解码装置,其特征在于,包括:
低频子频带嵌入式解码单元,用于在宽带嵌入式解码层,对单声道超宽带语音或音频信号的低频子频带信号进行逐层解码;
高频子频带嵌入式解码单元,用于在预设的高频信号解码层,对单声道超宽带语音或音频信号的高频子频带信号进行逐层解码;
频谱合并单元,用于将所述单声道超宽带语音或音频信号解码后的低频子频带和高频子频带信号进行频谱合并;
所述高频子频带嵌入式解码单元具体用于在预设的高频信号解码层,采用调制叠接逆变换IMLT对所述单声道超宽带语音或音频信号的高频信号进行逐层解码,获得所述单声道超宽带语音或音频信号的高频子频带信号;
所述高频子频带嵌入式解码单元更具体用于:获取所述高频子频带各个区域的幅度包络量化值和分类控制信息;根据所述分类控制信息,获取各个区域的归一化调制叠接变换MLT系数;根据所述各个区域的幅度包络量化值和归一化调制叠接变换MLT系数,获取所述高频子频带部分信号的调制叠接变换MLT系数;对所述调制叠接变换MLT系数进行逆变换,获得解码后的单声道超宽带 语音或音频信号的高频子频带部分的信号。
23.根据权利要求22所述的嵌入式语音或音频信号解码装置,其特征在于,还包括:
噪声填充单元,当码流中包含高频信号解码层的第一高频信号解码子层时,用于采用随机数对码流中缺少的第二高频信号解码子层和第三高频信号解码子层的信号进行填充;当码流中包含高频信号解码层的第一高频信号解码子层和第二高频信号解码子层时,用于采用随机数对码流中缺少的第三高频信号解码子层的信号进行填充。
24.根据权利要求22所述的嵌入式单声道语音、音频解码装置,其特征在于,还包括:
残差系数解码单元,用于在预设的低频补充信息解码层,对低频子频带的修正的离散余弦变换MDCT残差系数进行逐层解码。
25.根据权利要求24所述的嵌入式单声道语音、音频解码装置,其特征在于,所述残差系数解码单元还包括:
置零单元,当码流中包含低频补充信息解码层的第一低频补充信息解码子层时,用于将码流中缺少的第二低频补充信息解码子层的修正的离散余弦变换MDCT重建系数置0。 
CN2008100944347A 2008-04-30 2008-04-30 嵌入式语音或音频信号编解码方法和装置 Expired - Fee Related CN101572087B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008100944347A CN101572087B (zh) 2008-04-30 2008-04-30 嵌入式语音或音频信号编解码方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008100944347A CN101572087B (zh) 2008-04-30 2008-04-30 嵌入式语音或音频信号编解码方法和装置

Publications (2)

Publication Number Publication Date
CN101572087A CN101572087A (zh) 2009-11-04
CN101572087B true CN101572087B (zh) 2012-02-29

Family

ID=41231420

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008100944347A Expired - Fee Related CN101572087B (zh) 2008-04-30 2008-04-30 嵌入式语音或音频信号编解码方法和装置

Country Status (1)

Country Link
CN (1) CN101572087B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103035248B (zh) 2011-10-08 2015-01-21 华为技术有限公司 音频信号编码方法和装置
CN105976830B (zh) 2013-01-11 2019-09-20 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
EP4318466A3 (en) * 2014-09-04 2024-03-13 Sony Group Corporation Transmission device, transmission method, reception device and reception method
CN113921019A (zh) * 2014-09-30 2022-01-11 索尼公司 发送装置、发送方法、接收装置和接收方法
CN106033982B (zh) * 2015-03-13 2018-10-12 中国移动通信集团公司 一种实现超宽带语音互通的方法、装置和终端
CN105957533B (zh) * 2016-04-22 2020-11-10 杭州微纳科技股份有限公司 语音压缩方法、语音解压方法及音频编码器、音频解码器
CN115116454A (zh) * 2022-06-15 2022-09-27 腾讯科技(深圳)有限公司 音频编码方法、装置、设备、存储介质及程序产品

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101000768A (zh) * 2006-06-21 2007-07-18 北京工业大学 嵌入式语音编解码的方法及编解码器

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101000768A (zh) * 2006-06-21 2007-07-18 北京工业大学 嵌入式语音编解码的方法及编解码器

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Per Ekstrand.BANDWIDTH EXTENSION OF AUDIO SIGNALS BY SPECTRAL BAND REPLICATION.《Proc.1st IEEE Benelux Workshop on Model based Processing and Coding of Audio (MPCA-2002)》.2002,53-58. *
徐昊鲍长春贾懋坤.采样率对TCX宽带嵌入式变速率语音编码器质量的影响.《信号处理》.2007,111-114. *
李海婷 等.最新的ITU-T嵌入式变速率语音编码关键技术.《数字信号处理》.2006,50-56. *

Also Published As

Publication number Publication date
CN101572087A (zh) 2009-11-04

Similar Documents

Publication Publication Date Title
CN101572087B (zh) 嵌入式语音或音频信号编解码方法和装置
CN101263554B (zh) 在比特率分级和带宽分级的音频解码中的比特率切换方法
CN101622661B (zh) 一种数字语音信号的改进编解码方法
KR101061404B1 (ko) 가변 레이트로 오디오를 인코딩 및 디코딩하는 방법
JP6980871B2 (ja) 信号符号化方法及びその装置、並びに信号復号方法及びその装置
CN102511062B (zh) 用于改进数字音频信号的分级编码/解码的增强编码/解码中的比特分配
US20100322429A1 (en) Joint Enhancement of Multi-Channel Audio
KR101698371B1 (ko) 디지털 오디오 신호들의 개선된 코딩/디코딩
EP2037451A1 (en) Method for improving the coding efficiency of an audio signal
KR102514418B1 (ko) 오디오 신호에 대한 고주파 재구성 기술의 하위 호환 통합
CN103366755A (zh) 对音频信号进行编码和解码的方法和设备
CN101281749A (zh) 可分级的语音和乐音联合编码装置和解码装置
US9424857B2 (en) Encoding method and apparatus, and decoding method and apparatus
CN101281748B (zh) 用编码索引实现的空缺子带填充方法及编码索引生成方法
CN101572088A (zh) 立体声编解码方法、编解码器及编解码系统
US20120095754A1 (en) Method and apparatus for encoding and decoding audio signal using layered sinusoidal pulse coding
JP2020074052A (ja) オーディオ信号の高周波再構成のための高調波転換器の後方互換な統合
CN101572586B (zh) 编解码方法、装置及系统
KR100765747B1 (ko) 트리 구조 벡터 양자화를 이용한 스케일러블 음성 부호화장치
Mazor et al. Adaptive subbands excited transform (ASET) coding
Kokes et al. A wideband speech codec based on nonlinear approximation
KR101455648B1 (ko) 상호 운용성을 지원하는 오디오/스피치 신호의부호화/복호화 방법 및 시스템
You et al. Magnitude-sign split quantization for bandwidth scalable wideband speech codec
Jia et al. A novel embedded speech and audio codec based on ITU-T Recommendation G. 722.1
CN101609679A (zh) 嵌入式编解码方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120229

Termination date: 20190430