CN101000768A - 嵌入式语音编解码的方法及编解码器 - Google Patents

嵌入式语音编解码的方法及编解码器 Download PDF

Info

Publication number
CN101000768A
CN101000768A CNA2006100829585A CN200610082958A CN101000768A CN 101000768 A CN101000768 A CN 101000768A CN A2006100829585 A CNA2006100829585 A CN A2006100829585A CN 200610082958 A CN200610082958 A CN 200610082958A CN 101000768 A CN101000768 A CN 101000768A
Authority
CN
China
Prior art keywords
algebraic
codebook
layer
gain
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006100829585A
Other languages
English (en)
Other versions
CN101000768B (zh
Inventor
鲍长春
李海婷
刘泽新
朱恒
范睿
李立雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Beijing University of Technology
Original Assignee
Huawei Technologies Co Ltd
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd, Beijing University of Technology filed Critical Huawei Technologies Co Ltd
Priority to CN2006100829585A priority Critical patent/CN101000768B/zh
Publication of CN101000768A publication Critical patent/CN101000768A/zh
Application granted granted Critical
Publication of CN101000768B publication Critical patent/CN101000768B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明涉及一种嵌入式语音编解码的方法及编解码器。本发明主要是采用逐级细化激励信号的实现方式实现嵌入式语音编解码处理。在本发明中,每一级的脉冲都是在保留前一级的基础上额外搜索若干能够丰富细节的脉冲获得。而且,本发明还采用了对各个速率的合成滤波器状态进行独立更新的实现方式。因此,本发明提供的嵌入式变速率语音编码方法能适应网络的分组传输方式。在发送端,能够以最高码率进行传输,根据网络传输状况和终端的特点,接收端可以小于最高码率进行接收。这样,即便在传输过程中发生了分组丢失现象,只要接收端的接收码率大于某一门限值则可以进行正常解码,得到最低层次质量保证的合成语音,从而可以获得连续的语音信号。

Description

嵌入式语音编解码的方法及编解码器
技术领域
本发明涉及语音编解码技术领域,尤其涉及一种嵌入式语音编解码的方法及编解码器。
背景技术
在语音通信过程中,需要在语音发送端采用语音压缩编码技术对语音进行编码,编码后再将语音传输到接收端。在语音接收端则需要采用与语音压缩编码技术对应的语音解码技术对收到的码流进行解码,从而获得发送端发送的原始语音信息,实现语音通信。
针对简单的老式电话业务(POTS)是采用ITU-T的G.711标准对每秒钟8kHz采样、每样点8bit表示的语音信号进行压缩编码。因此,在公共交换电话网(PSTN)中,被设计为由成千上万条传输速率为64kb/s的传输线路组成。由于电话语音的采样率为8kHz,使得语音信号的带宽被限制在4kHz以下。这种限制使得电话里的语音比实际交谈中的全带宽语音的自然度和可懂度都有一定程度的下降。
随着网络通信技术的快速发展,语音的网络传输引起了业界的关注,尤其是以分组交换为基础的IP电话技术得到了越来越多的应用。通常,IP电话的传输能力要远远大于传统的PSTN,例如,在IP光纤主干网和传输速率高达百兆的局域网中语音传输能力将远远超过PSTN的语音传输能力。
由于语音传输能力的增强,使得业界开始考虑提供更高质量的合成语音的技术。为此,需要提高原始语音的采样速率,即对语音信号进行宽带编码,传输宽带语音。所述的宽带语音,是指频率范围在50-7000Hz的语音信号。由于宽带语音具有丰富的高频成分,因此在自然度和可懂度方面都要优于窄带语音。
在以分组交换为基础的IP网络上进行语音分组传输可能会出现以下两种情况:
(1)分组丢失情况,即有些分组可能在传输过程中丢失;
(2)分组延时情况,即有些分组在到达接收端时,已经超过了允许的最大传输延时而被接收端拒绝接收,拒收的原因是接收该分组已经没有任何意义,在该情况下,相当于出现分组丢失。
由于这两种情况的存在,使得在语音接收端会因为缺少丢失的分组导致合成语音的质量大大下降,甚至根本得不到合成语音。
因此,在实现语音分组传输技术时,需要提供减小分组丢失对接收端合成语音质量的影响的实现策略。
为减小分组丢失对语音合成质量的影响,从语音压缩编码的角度考虑可以采用对原始语音进行嵌入式编码的方案实现语音压缩编码,从而在发送端获得具有嵌入式结构的码流,这样便可以根据嵌入的编码信息对码流进行解码操作,使得可以获得相对较好的语音质量。
在经过嵌入式编码操作后获得的嵌入式的码流中,低码率的码字包含(即嵌入)在高码率的码字中,作为高速率工作的核心码元。也就是说,一个嵌入式的码流可以分解成几个低级的码流,这些码流的码率逐次递减,但依然能代表原来的语音信号,只是在不同程度上损失了一些语音信号的细节,即语音质量会有所降低。这样,在语音通信过程中,若线路容量够时,则可以以高速率传输以保证较高的语音质量,若遇到线路拥塞时,则可以将码字中非核心码元丢弃,即以低速率较差的语音质量实现语音通信,从而保证语音信号的连续性。
因此,嵌入式的码流结构不仅可以有效地解决由于分组丢失所引起的合成语音质量下降的问题,而且可以提供多种编码速率,以适应不同种类的通信终端。目前,由于网络中的传输速率是4-64kb/s之间范围内变动,基于这一特性若实现4-64kb/s的变速率编码则需要采用5-6种编码算法。各种具有不同码率和不同解码语音质量的算法虽然能够保证各类通信终端的正常运行,但由于各种算法之间的非兼容性,同时也给不同系统的互相连接、互相通信带来了很大的困难。
也就是说,由于目前还没有一种同时具有多种速率输出的编译码实现方式,使得在不同的场合工作在不同的速率的通信需求无法实现。
发明内容
本发明的目的是提供一种嵌入式语音编解码的方法及编解码器,从而可以提供一种同时具有多种速率输出的编解码实现,以满足不同场景下工作于不同速率的通信需求。
本发明的目的是通过以下技术方案实现的:
本发明提供了一种嵌入式语音编码方法,该方法是将输入语音在时域上分帧,之后进行编码,所述的编码处理步骤包括:
A、计算确定语音帧的线性预测系数,以及感知加权合成滤波器的脉冲响应和一级目标矢量;
B、根据所述一级目标矢量及所述的感知加权合成滤波器的脉冲响应计算确定基音延迟索引值,并生成各层自适应码书矢量;
C、根据之后的根据一级目标矢量及自适应码书矢量及前一层代数码书矢量更新获得的各级目标矢量及所述的感知加权合成滤波器的脉冲响应逐层计算各层的代数码书矢量,并逐层量化各层的代数码书增益,还计算确定自适应码书增益;
D、将所述的线性预测系数、基音延迟索引值、自适应码书增益、各层的代数码书矢量及各层的代数码书增益进行编码,获得编码后的码流。
在执行所述的步骤C之后,所述的方法还包括:
E、根据各层的代数码书矢量及增益和各层自适应码书矢量及增益计算获得表示同一子帧语音的各层激励矢量;
F、利用所述的各层激励矢量通过合成滤波器合成语音,更新各层合成滤波器存储状态及记录的自适应码书。
所述的步骤E包括:
将同一子帧的当前层的自适应码书矢量与当前层以及之前各层代数码书矢量的和作为各层激励矢量。
所述的步骤C包括:
C1、根据各层合成滤波器的状态、线性预测系数及感知加权合成滤波器的脉冲响应,由预处理后的语音计算各层的一级目标矢量;
C2、根据所述的一级目标矢量以及由一级目标矢量更新获得的各层目标矢量,采用逐层增加代数码书的脉冲的方式逐层搜索确定各层代数码书,并确定各层代数码书增益。
所述的步骤C2包括:
针对下一层代数码书的搜索和增益矢量的计算是基于上一层代数码书的搜索结果及上一层的增益矢量计算结果实现。
在所述的步骤C2中,对于各层中的核心层,采用全搜索的方式搜索确定核心层代数码书,对于增强层,采用基于深度优先树搜索算法的4选3脉冲搜索方式搜索确定相应的增强层代数码书。
所述的基于深度优先树搜索算法的4选3脉冲搜索方式包括:
根据相应的目标矢量,由深度优先树搜索算法确定4个非零脉冲组成一个代数码矢量,并从所述的4个非零脉冲中任意选择3个组成相应的代数码激励矢量,共获得4组由3个非零脉冲组成的代数码激励矢量;
采用与深度优先树搜索算法相同的准则,在4组代数码激励矢量中选择一组作为搜索选定的代数码书矢量。
在所述的步骤C2中,包括:
在核心层,根据核心层的目标矢量搜索核心层代数码书矢量;
在增强层,依据增强层的顺序,根据各增强层对应的目标矢量逐层搜索确定各增强层的代数码书矢量。
在所述的步骤C2中,所述的各层代数码书增益的量化处理包括:
对于核心层增益的量化,是采用核心层的代数码书的增益和自适应码书增益联合矢量量化确定核心层的增益,作为核心层的增益矢量;
对于增强层增益的量化,是采用各增强层各自量化其代数码书的增益比。
所述的各增强层代数码书增益的量化处理包括:
采用对当前层代数码书增益与前一层量化后的代数码书增益之比,进行当前层的代数码书增益的量化。
所述的方法还包括:将语音信号编码后获得的码流通过基于IP的网络中传送给对端。
本发明还提供了一种嵌入式语音编码器,包括:
线性预测分析单元,用于确定语音帧的线性预测系数;
自适应码书搜索单元,用于根据一级目标矢量及计算获得的感知加权合成滤波器的脉冲响应计算确定基音延迟索引值及各层自适应码书矢量;
代数码书搜索单元,用于根据基于所述的一级目标矢量及自适应码书矢量及前一层代数码书矢量计算获得的之后的各级目标矢量,以及计算获得的感知加权合成滤波器的脉冲响应逐层计算各层的代数码书矢量;
增益计算单元,用于根据各层的代数码书搜索结果和上一层量化的代数码书增益逐层量化各层的代数码书增益,根据自适应码书搜索结果计算自适应码书增益;
编码单元,用于将所述的线性预测系数、基音延迟索引值、自适应码书增益、各层的代数码书矢量及各层的代数码书增益进行编码,获得编码后的码流。
所述的编码器中还包括:
计算各层激励矢量单元,用于根据各层的代数码书矢量及增益和各层自适应码书矢量及增益计算获得表示同一子帧语音的各层激励矢量;
各层合成滤波器状态更新单元,用于利用所述的各层激励矢量通过合成滤波器合成语音,更新各层合成滤波器存储状态及记录的自适应码书。
所述的自适应码书搜索单元的输入连接有一级目标矢量计算单元,该单元用于根据各层合成滤波器的状态、线性预测系数及计算获得的感知加权合成滤波器的脉冲响应,由预处理后的语音计算确定一级目标矢量,所述的自适应码书搜索单元根据所述的一级目标矢量确定所述的基音延迟索引值及各层自适应码书矢量。
所述的代数码书搜索单元包括:
核心层更新目标矢量单元,用于对一级目标矢量单元输出的各层的一级目标矢量根据自适应码书搜索单元输出的各层自适应码书矢量进行更新,获得更新后的各层目标矢量;
核心层代数码书搜索单元,用于根据核心层更新目标矢量单元中更新后的核心层目标矢量采用全搜索的方式搜索确定核心层代数码书;
增强层更新目标矢量单元,用于根据上层代数码书更新上层的各层目标矢量,获得更新后的各层目标矢量;
增强层代数码书搜索单元,该单元至少包括一个,用于根据更新后的当前层相应的目标矢量采用基于深度优先树搜索算法的4选3脉冲搜索方式搜索确定当前的增强层代数码书。
所述的增益计算单元包括:
核心层增益矢量量化单元,用于对核心层代数码书及自适应码书进行增益矢量量化确定核心层增益;
增强层增益比量化单元,该单元至少包括一个,用于对量化后的上层代数码书增益和当前层代数码书进行增益比量化处理量化当前层代数码书增益。
本发明不提供了一种嵌入式语音解码方法,包括:
从接收到的码流中解码线性预测系数得到合成滤波器系数,解码基音延迟得到相应速率对应的自适应码书,解码核心层代数码书索引值得到核心层代数码书;
解码自适应码书增益和核心层代数码书增益,并根据接收到的码流大小解码增强层的代数码书及其增益;
根据解码获得的各参数产生激励信号,并利用所述的激励信号经过合成滤波器合成语音输出。
所述的根据接收到的码流大小解码增强层的代数码激励及其增益包括:
根据接收到的码流的大小,判断需要解码的增强层个数,并依次分层解码出各增强层的代数码书及其增益。
所述的方法还包括:
解码端接收编码端发来的码流后,根据解码需要获得的语音质量,解码出该语音质量对应的各参数信息,并根据所述的各参数信息输出合成的相应速率的语音。
本发明还提供了一种嵌入式语音解码器,包括:
解码线性预测系数单元,用于解码码流中的线性预测系数得到合成滤波器系数;
解码自适应码书单元,用于根据基音延迟索引值解码基音延迟得到对应的自适应码书;
解码自适应码书和核心层代数码书增益单元,用于解码码流获得自适应码书增益和核心层代数码书增益;
解码核心层代数码书单元,用于解码码流中的核心层代数码书索引值得到核心层代数码书;
语音合成单元,用于根据解码获得的各参数产生激励信号,并利用所述的激励信号经过合成滤波器合成语音输出。
所述的解码器还包括:
解码增强层代数码书和增益比单元,该单元包括到少一个,用于根据接收到的码流大小选择相应的单元,通过该单元解码相应的增强层的代数码书及其增益,并提供给语音合成单元。
由上述本发明提供的技术方案可以看出,本发明提供的嵌入式变速率语音编码方法能适应网络的分组传输方式。在发送端,能够以最高码率进行传输,根据网络传输状况和终端的特点,接收端可以小于最高码率进行接收。这样,即便在传输过程中发生了分组丢失现象,只要接收端的接收码率大于某一门限值则可以进行正常解码,得到最低层次质量保证的合成语音,从而可以获得连续的语音信号。
实验表明,由本编码器解码出的8kb/s、12kb/s、16kb/s、24kb/s、32kb/s合成语音,质量逐层改善,符合ITU-T的要求。而且,本编码器的核心层8kb/s合成语音要优于G.729的8kb/s合成语音质量,同时,本编码器增强层的合成语音质量,与G.722.2相近速率的合成语音的质量基本相当。
附图说明
图1为嵌入式语音编码器具体工作流程示意图;
图2为嵌入式语音解码器具体工作流程示意图;
图3a和图3b为嵌入式语音编解码器的码率结构框图;
图4为嵌入式语音编码器的帧比特结构图;
图5为嵌入式语音编码器的原理框图;
图6为嵌入式语音解码器的原理框图;
图7为嵌入式语音编码器增强层代数码书搜索的具体实现流程示意图;
图8为嵌入式语音编码器增强层代数码书增益比量化的具体实现原理框图;
图9为嵌入式语音编码器各层合成滤波器状态更新的具体实现原理框图。
具体实施方式
本发明具体是运用ACELP(代数码激励线性预测)技术提供一种多码率的宽带嵌入式语音编解码实现方案。本发明提供的语音编码技术的核心是采用逐级细化激励信号的实现方式,对于较低码率的编码信号对应于包含脉冲数较少的激励信号,随着码率的提升,通过逐层增加脉冲的方式不断细化激励信号,以获得较高的语音质量。
而且,在本发明中,针对各层的脉冲的搜索不是相互独立的,而是彼此存在着嵌入包含关系,具体为:对于每一级的脉冲的获得,都是在保留前一级的基础上,针对更新了的残差信号(即目标矢量),又额外搜索若干能够丰富细节的脉冲实现。
另外,本发明中,还采用了对各个速率的合成滤波器状态进行独立更新的实现方式,从而可以保证编码端与解码端的状态同步。
具体一点讲,本发明在实现过程中,相应的编码过程包括:
首先,在编码端用开环和闭环方法确定基音预测器系数(即基音延迟索引值),具体可以采用现有技术中的相应方法获得该系数,当然也可以采用其他方法计算获得该系数,在确定了该系数后,则可以根据该系数及线性预测系数将基音合成滤波器和短时合成滤波器组合在一起形成一个级联的滤波器。
其次,计算确定各层的激励矢量,具体的方法为:用激励码书中的某一矢量去激励这个级联滤波器,得到合成语音(n),再计算合成语音(n)和原始语音s(n)之间的误差e(n),经过感知特性加权后,选取均方误差最小的激励矢量作为最佳激励矢量,所述的最佳激励矢量是根据各层代数码书矢量确定。
最后,编码端通过对最佳激励矢量和已知的合成滤波器的系数(即ISP参数量化表索引值)进行编码,从而达到了对语音信号进行压缩的目的。
本发明中,相应的解码过程包括:
在解码端,首先,解码接收到的码流,从而将最佳激励信号(即最佳激励矢量)及滤波器的系数从接收到的码流中被恢复出来;
之后,根据滤波器的初始记忆内容(即解码器的合成滤波器初始化状态),将所述的最佳激励信号通过级联滤波器产生合成语音,获得相应的语音信号。
本发明提供的嵌入式编码方案适用于网络的分组传输方式,发送端以最高码率进行传输,根据网络传输状况和终端的特点,接收端可以小于最高码率进行接收。这样,即便在传输过程中发生了分组丢失现象,只要接收端的接收码率大于某一门限值(即编码的最低码率)就可进行正常解码,得到最低层次质量保证的合成语音。
为便于对本发明的进一步理解,下面将结合附图对本发明提供的嵌入式语音编解码方法的实现过程进行说明。
在下面的描述中,具体以采用码激励线性预测技术实现的8-32kb/s的宽带嵌入式变速率语音信号编解码方案为例对本发明的具体实现进行说明。在相应的编码器中,假设输入为16kHz采样、16比特线性PCM(脉冲编码调制)语音信号,而且整个编码器分为五层,具体包括:核心层、增强一层、增强二层、增强三层和增强四层,整个编码器包含的编码速率(即码率)依次分别为8kb/s、12kb/s、16kb/s、24kb/s、32kb/s。
当然,如果需要其他编码速率,则也可以采用其他分层方式实现所述编码器。
本发明提供的编码实现方案中采用了嵌入式编码结构,使得相应的编码器的输出码流为嵌入式的结构,因此,可以适用于现代网络中的语音数据传输。
以所述五层编码器为例,如图1所示,所述的宽带嵌入式语音编码器工作流程包括:
步骤101:对输入的每一帧语音信号进行预处理,在该处理流程中相应的编码操作是以20ms语音为一帧进行处理的;
相应的预处理主要包括:下采样、高通滤波和预加重处理,其中:
所述的下采样是将输入信号的采样率从16kHz降低到12.8kHz,也就是每帧语音由320个样点变为256个,其目的是为了在保证宽带语音质量的前提下降低算法的复杂度;
所述的高通滤波,用于去除不必要的低频成分,高通滤波器的截至频率为50Hz;
所述的预加重处理的目的是提升高频部分,使语音信号的频谱变得平坦,便于进行频谱分析和声道参数分析。
步骤102:对于处理后的语音进行线性预测分析,得到表示语音信号短时谱包络的线性预测系数,并将线性预测系数转换为ISP参数后进行矢量量化,进而获得编码过程中需要的ISP参数量化表索引值。
步骤103、步骤104:对每帧语音进行开环基音分析,为子帧分析中的闭环基音分析提供一个可能的范围,并计算感知加权合成滤波器的单位脉冲响应。
上述步骤101至步骤104的帧分析处理过程中均是按帧来进行处理的。
在上述帧分析过程结束后将进入子帧循环,具体以每5ms为一个子帧,编码器按子帧来进行处理,相应的处理过程具体包括:
步骤105:将子帧通过相应的五层自适应码书搜索和增益控制得到整数和分数基音延时,即确定相应的基音延迟索引值;
步骤106:进行核心层代数码书搜索得到核心层代数码书索引值;
步骤107:将自适应码书增益与核心层代数码书增益联合起来进行矢量量化,确定核心层增益矢量。
步骤108、109、110、111:依次进行增强一层代数码书搜索及其增益比的量化、增强二层代数码书搜索及其增益比的量化、增强三层代数码书搜索及其增益比的量化、增强四层代数码书搜索及其增益比的量化,从而确定各增强层的代数码书矢量和增益矢量。
步骤112:在进行上述处理之后,还需要更新五层中的每层感知加权合成滤波器的状态,以用于计算下一子帧的目标矢量。
在子帧分析过程结束后,输入语音将通过本编码器编码得到嵌入式的码流,并通过网络进行该码流的传输,具体是将上述得到的线性预测系数、基音延迟索引值、核心层增益、各层的代数码书、各增强层增益均编入所述码流中,以便于在解码端可以恢复出相应的参数,进而得到需要的语音。
如图2所示,图2中给出了宽带嵌入式语音解码器工作流程图,当解码端收到包含所有编码参数信息的32kb/s码流后,根据所要求的解码速率进行解码,具体包括:
步骤201:根据ISP参数量化表索引值解码出ISP参数并转换成线性预测系数;
步骤202:根据基音延迟索引值,通过自适应码书译码得到自适应码激励;
步骤203:解码核心层代数码书索引值,得到核心层代数码激励。
步骤204:根据自适应码书增益及核心层代数码书增益索引值,分别解码出自适应码书增益和核心层代数码书增益。
步骤205:判断接收到的比特数是否大于或等于240bits,如果是,则执行步骤206,否则,确定比特数小于240bits,直接得到8kb/s的合成激励信号,并执行步骤213;
步骤206:根据增强一层代数码书及增益比的索引值解码出增强一层代数码激励及其增益,并与8kb/s的合成激励信号相加得到12kb/s的合成激励信号,并执行步骤207。
步骤207:判断接收到的比特数是否大于或等于320bits,如果是,则执行步骤213,否则,确定比特数小于320bits,则直接输出12kb/s的合成激励信号,并执行步骤208;
步骤208:根据增强二层代数码书及增益比的索引值解码出增强二层代数码激励及其增益,并与12kb/s的合成激励信号相加得到16kb/s的合成激励信号,并执行步骤209。
步骤209:判断接收到的比特数是否大于或等于480bits,如果是,则执行步骤210,否则,确定比特数小于480bits,直接输出16kb/s的合成激励信号,并执行步骤213;
步骤210:根据增强三层代数码书及增益比的索引值解码出增强三层代数码激励及其增益,并与16kb/s的合成激励信号相加得到24kb/s的合成激励信号,并执行步骤211。
步骤211:判断接收到的比特数是否大于或等于640bits,如果是,则执行步骤212,否则,确定比特数小于640bits,直接输出24kb/s的合成激励信号,并执行步骤213;
步骤212:根据增强四层代数码书及增益比的索引值解码出增强四层代数码激励及其增益,并与24kb/s的合成激励信号相加得到32kb/s的合成激励信号,并执行步骤213。
步骤213:为了提高合成语音质量,需要对合成激励信号进行后处理,所述的后处理包括基音增强、增益平滑、抗稀疏处理。
步骤214:将经过后处理的合成激励信号通过合成滤波器输出合成语音。
步骤215:输出合成后的语音信号。
如图3a和图3b所示,图中示出了本发明提供的宽带嵌入式语音编解码器的帧比特结构。如图4所示,图中示出了本发明提供宽带嵌入式语音编解码器的码率结构框图。
在图3a和图3b,以及图4中,可以看出,由于在高码率的码流中包含了低码率的全部码流,因此,在解码端根据网络传输情况或者客户端选择的服务质量,将会产生不同质量的合成宽带语音。如果接收到全部的32kb/s的码流,解码器不仅可以解出32kb/s层对应的合成语音,还可以从32kb/s的码流中提取出24kb/s层、16kb/s层、12kb/s层和8kb/s的码流进行语音合成;同理,如果接收到16kb/s的码流,解码器不仅可以解出16kb/s层对应的合成语音,还可以从16kb/s的码流中提取出8kb/s的码流进行语音合成。
本发明提供的宽带嵌入式语音编码器的具体实现结构如图5所示,在图5中,相应编码器的工作原理包括:输入语音以帧为单位,经过预处理单元301、线性预测分析单元302、开环基音分析单元303,输出参数1为ISP参数量化表索引值;接着进入到子帧循环,子帧循环中的编码过程可以分为几个部分:核心层304、增强一层324、增强二层332、增强3.1层339、增强3.2层345、增强4.1层350、增强4.2层354。
下面将图5所示的编码器的结构进行说明,具体包括:
(1)线性预测分析单元,用于确定语音帧的合成滤波器系数。
(2)自适应码书搜索单元,用于根据一级目标矢量及计算获得的感知加权合成滤波器的脉冲响应计算确定基音延迟索引值并生成各层自适应码书矢量;所述的自适应码书搜索单元的输入还连接有一级目标矢量计算单元,该单元用于根据各层合成滤波器的状态、线性预测系数及计算获得的感知加权合成滤波器的脉冲响应,由预处理后的语音计算确定一级目标矢量,所述的自适应码书搜索单元根据所述的一级目标矢量确定所述的基音延迟索引值及各层自适应码书矢量。
(3)代数码书搜索单元,用于根据基于所述的一级目标矢量更新后的各级目标矢量及计算获得的感知加权合成滤波器的脉冲响应逐层计算各层的代数码书矢量,该单元具体包括:
核心层更新目标矢量单元,用于对一级目标矢量单元输出的各层的一级目标矢量根据自适应码书搜索单元输出的各层自适应码书矢量进行更新,获得更新后的各层目标矢量;
核心层代数码书搜索单元,用于根据核心层更新目标矢量单元中更新后的核心层目标矢量采用全搜索的方式搜索确定核心层代数码书;
增强层更新目标矢量单元,用于根据上层代数码书更新上层的各层目标矢量,获得更新后的各层目标矢量;
增强层代数码书搜索单元,该单元至少包括一个,用于根据更新后的当前层相应的目标矢量采用基于深度优先树搜索算法的4选3脉冲搜索方式搜索确定当前的增强层代数码书。
(4)增益计算单元,用于根据各层的码书搜索结果逐层量化各层的码书增益,该单元具体包括:
核心层增益矢量量化单元,用于对核心层代数码书及自适应码书进行增益矢量量化确定核心层增益;
增强层增益比量化单元,该单元至少包括一个,用于对量化后的上层代数码书增益和当前层代数码书进行增益比量化处理量化当前层代数码书增益。
(5)编码单元,用于将上述各处理单元处理获得的所述的线性预测系数、基音延迟索引值、核心层代数码书增益及自适应码书增益、各增强层的代数码书矢量及各层的代数码书增益进行编码,获得编码后的码流。
(6)计算各层激励矢量单元和各层合成滤波器状态更新单元,用于根据各层的代数码书矢量及增益和各层自适应码书矢量及增益计算获得表示同一子帧语音的各层激励矢量;以及用于利用所述的各层激励矢量通过合成滤波器合成语音,更新各层合成滤波器存储状态及记录的自适应码书。
基于上述结构的编码器,具体的编码处理过程如下:
(一)核心层部分的编码包括:核心层的更新目标矢量单元308-313、自适应码书搜索单元306、核心层代数码书搜索单元314、用于实现自适应码书增益和代数码书增益量化的核心层增益矢量量化单元315;
首先,根据开环基音分析后的语音和各层感知加权合成滤波器的状态mem_syn0、mem_syn1、mem_syn2、mem_syn31、mem_syn32、mem_syn41、mem_syn42得到各层第一级目标矢量305:xn、xn_12k、xn_16k、xn_24k1、xn_24k2、xn_32k1、xn_32k2,所述的第一级目标矢量将用于自适应码书搜索;也就是说,每层对应有各自的目标矢量,以便于在最大程度上保证每层参数之间的匹配。
本编码器的自适应码书搜索306是根据核心层的第一级目标矢量xn搜索出最佳整数和分数基音延迟,输出参数2为基音延迟索引值。然后,在最佳基音延迟处通过内插过去的激励得到各层的自适应码激励,分别记作vn、vn_12k、vn_16k、vn_24k1、vn_24k2、vn_32k1、vn_32k2,作为核心层自适应码书对各层的贡献。同时计算出自适应码书增益,在此仅取核心层8kb/s的自适应码书增益作为当前子帧的自适应码书增益,记作gp
在核心层代数码书搜索之前,首先要将核心层第一级目标矢量xn减去核心层自适应码书对各层的贡献得到用于核心层代数码书搜索的第二级目标矢量307xn2:
xn2(n)=xn(n)-gp·y1(n),其中y1(n)=vn(n)*h(n)为核心层自适应码激励vn与感知加权合成滤波器单位脉冲响应矢量h的卷积。
同时,还利用自适应码书对各层的贡献更新其他各层的目标矢量308、309、310、311、312、313,其中:
(1)增强1层更新后的目标矢量记作xn2_12k,xn2_12k(n)=xn_12k(n)-gp·y1_12k(n),其中y1_12k(n)=vn_12k(n)*h(n)为增强1层自适应码激励vn_12k与感知加权合成滤波器单位脉冲响应矢量h的卷积;
(2)增强2层更新后的目标矢量记作xn2_16k,xn2_16k(n)=xn_16k(n)-gp·y1_16k(n),其中y1_16k(n)=vn_16k(n)*h(n)为增强2层自适应码激励vn_16k与感知加权合成滤波器单位脉冲响应矢量h的卷积;
(3)增强3.1层更新后的目标矢量记作xn2_24k1,xn2_24k1(n)=xn_24k1(n)-gp·y1_24k1(n),其中y1_24k1(n)=vn_24k1(n)*h(n)为增强3.1层自适应码激励vn_24k1与感知加权合成滤波器单位脉冲响应矢量h的卷积;
(4)增强3.2层更新后的目标矢量记作xn2_24k2,xn2_24k2(n)=xn_24k2(n)-gp·y1_24k2(n),其中y1_24k2(n)=vn_24k2(n)*h(n)为增强3.2层自适应码激励vn_24k2与感知加权合成滤波器单位脉冲响应矢量h的卷积;
(5)增强4.1层更新后的目标矢量记作xn2_32k1,xn2_32k1(n)=xn_32k1(n)-gp·y1_32k1(n),其中y1_32k1(n)=vn_32k1(n)*h(n)为增强4.1层自适应码激励vn_32k1与感知加权合成滤波器单位脉冲响应矢量h的卷积;
(6)  增强4.2层更新后的目标矢量记作xn2_32k2,xn2_32k2(n)=xn_32k2(n)-gp·y1_32k2(n),其中y1_32k2(n)=vn_32k2(n)*h(n)为增强4.2层自适应码激励vn_32k2与感知加权合成滤波器单位脉冲响应矢量h的卷积。
根据第二级目标矢量xn2进行核心层代数码书搜索314。核心层采用全搜索的方法搜索出3个脉冲,经过核心层代数码书搜索,可以得到核心层代数码书索引值作为参数3输出。
在核心层代数码书搜索同时,还得到的还有核心层代数码书增益gc,将核心层自适应码书增益gp与核心层代数码书增益gc联合起来进行矢量量化315,得到核心层增益矢量量化索引值,作为参数4输出。
(二)完成核心层的编码,整个编码器进入增强1层324的编码部分;
增强层的编码主要是通过逐层增加代数码书的脉冲个数,对核心层代数码书进行增强来实现的,主要包括:第三级目标矢量的计算单元、增强1层的各层更新目标矢量单元、增强1层代数码书搜索单元和增益比量化单元。
在增强1层代数码书搜索之前,首先要将增强1层第二级目标矢量xn2_12k减去核心层代数码书的贡献得到用于增强1层代数码书搜索的第三级目标矢量316记为xn3,xn3(n)=xn2_12k(n)-gc·y2(n),其中y2(n)=core_code(n)*h(n)为核心层代数码激励core_code与感知加权合成滤波器单位脉冲响应矢量h的卷积。
同时,还需要更新后面其他各层的目标矢量317、318、319、320、321,具体为:
增强2层更新后的目标矢量记作xn3_16k,xn3_16k(n)=xn2_16k(n)-gc·y2(n);
增强3.1层更新后的目标矢量记作xn3_24k1,xn3 24k1(n)=xn2_24k1(n)-gc·y2(n);
增强3.2层更新后的目标矢量记作xn3_24k2,xn3_24k2(n)=xn2_24k2(n)-gc·y2(n);
增强4.1层更新后的目标矢量记作xn3_32k1,xn3_32k1(n)=xn2_32k1(n)-gc·y2(n);
增强4.2层更新后的目标矢量记作xn3_32k2,xn3_32k2(n)=xn2_32k2(n)-gc·y2(n)。
根据第三级目标矢量xn3,增强1层代数码书搜索单元322采用4选3脉冲搜索方案进行增强1层代数码书搜索,具体的搜索算法包括:
首先,根据深度优先树搜索算法找到4个脉冲。然后从中任意选取3个脉冲组合在一起形成新的代数码激励,根据码字选取准则选取最优的那种组合作为最后选定的代数码激励。经过增强1层代数码书搜索,得到增强1层代数码书索引值作为参数5输出。
同时得到的还有增强1层代数码书增益gc1。不直接量化gc1,而是对增强1层的代数码书增益与核心层的代数码书增益之比γ1进行标量量化323,得到增强1层增益比量化的索引值作为参数6输出,参数 6 r 1 = g c 1 / g ^ c , 其中
Figure A20061008295800162
为量化后的核心层代数码书增益。
本发明中,每个增强层都是在前一层的基础上再搜索三个脉冲,由于不同速率脉冲的搜索不是彼此独立的,即相互之间存在着包含嵌套的关系,因此本编码器搜索出的脉冲可逐层抛弃,以适应网络分组传输中出现的丢包现象。
(三)接下来整个编码器进入增强2层332的编码部分,主要包括:第四级目标矢量的计算、增强2层的各层目标矢量更新、增强2层代数码书搜索和增益比量化。
首先要将增强2层第三级目标矢量xn3_16k减去增强1层代数码书的贡献得到用于增强2层代数码书搜索的第四级目标矢量325记为xn4,xn4(n)=xn3_16k(n)-gc1·y3(n),其中y3(n)=layer1_code(n)*h(n)为增强1层代数码激励layer1_code与感知加权合成滤波器单位脉冲响应矢量h的卷积。
同时要更新后面其他各层的目标矢量326、327、328、329,具体包括:
增强3.1层更新后的目标矢量记作xn4_24k1,xn4_24k1(n)=xn3_24k1(n)-gc1·y3(n);
增强3.2层更新后的目标矢量记作xn4_24k2,xn4_24k2(n)=xn3_24k2(n)-gc1·y3(n);
增强4.1层更新后的目标矢量记作xn4_32k1,xn4_32k1(n)=xn3_32k1(n)-gc1·y3(n);
增强4.2层更新后的目标矢量记作xn4_32k2,xn4_32k2(n)=xn3_32k2(n)-gc1·y3(n)。
根据第四级目标矢量xn4,采用4选3脉冲搜索方案进行增强2层代数码书搜索330,得到增强2层代数码书索引值作为参数7输出。
同时,得到的还有增强2层代数码书增益gc2。将增强2层的代数码书增益与增强1层的代数码书增益之比γ2进行标量量化331,得到增强2层增益比量化的索引值作为参数8输出,参数 8 r 2 = g c 2 / g c 1 ^ , 其中
Figure A20061008295800172
为量化后的增强1层代数码书增益。
(四)增强三层的编码分为两部分:增强3.1层339、增强3.2层345。
(1)增强3.1层的编码部分主要包括:第五级目标矢量的计算、增强3.1层的各层目标矢量更新、增强3.1层代数码书搜索和增益比量化。
首先要将增强3.1层第四级目标矢量xn4_24k1减去增强2层代数码书的贡献得到用于增强3.1层代数码书搜索的第五级目标矢量333记为xn5,xn5(n)=xn4_24k1(n)-gc2·y4(n),其中y4(n)=layer2_code(n)*h(n)为增强2层代数码激励layer2_code与感知加权合成滤波器单位脉冲响应矢量h的卷积。
同时,还需要更新后面其他各层的目标矢量334、335、336,具体包括:
增强3.2层更新后的目标矢量记作xn5_24k2,xn5_24k2(n)=xn4_24k2(n)-gc2·y4(n);
增强4.1层更新后的目标矢量记作xn5_32k1,xn5_32k1(n)=xn4_32k1(n)-gc2·y4(n);
增强4.2层更新后的目标矢量记作xn5_32k2,xn5_32k2(n)=xn4_32k2(n)-gc2·y4(n)。
根据第五级目标矢量xn5,采用4选3脉冲搜索方案进行增强3.1层代数码书搜索337,得到增强3.1层代数码书索引值作为参数9输出。同时得到的还有增强3.1层代数码书增益gc31。将增强3.1层的代数码书增益与增强2层的代数码书增益之比γ31进行标量量化338,得到增强3.1层增益比量化的索引值作为参数10输出。 r 31 = g c 31 / g c 2 ^ , 其中
Figure A20061008295800174
为量化后的增强2层代数码书增益。
(2)增强3.2层的编码部分主要包括:第六级目标矢量的计算、增强3.2层的各层目标矢量更新、增强3.2层代数码书搜索和增益比量化。
首先要将增强3.2层第五级目标矢量xn5_24k2减去增强3.1层代数码书的贡献得到用于增强3.2层代数码书搜索的第六级目标矢量340记为xn6,xn6(n)=xn5_24k2(n)-gc31·y5(n),其中y5(n)=layer31_code(n)*h(n)为增强3.1层代数码激励layer31_code与感知加权合成滤波器单位脉冲响应矢量h的卷积。
同时,还需要更新后面其他各层的目标矢量341、342,具体包括:
增强4.1层更新后的目标矢量记作xn6_32k1,xn6_32k1(n)=xn5_32k1(n)-gc31·y5(n);
增强4.2层更新后的目标矢量记作xn6_32k2,xn6_32k2(n)=xn5_32k2(n)-gc31·y5(n)。
根据第六级目标矢量xn6,采用4选3脉冲搜索方案进行增强3.2层代数码书搜索343,得到增强3.2层代数码书索引值作为参数11输出。同时得到的还有增强3.2层代数码书增益gc32。将增强3.2层的代数码书增益与增强3.1层的代数码书增益之比γ32进行标量量化344,得到增强3.2层增益比量化的索引值作为参数12输出。 r 32 = g c 32 / g c 31 ^ , 其中
Figure A20061008295800176
为量化后的增强3.1层代数码书增益。
(五)编码器进入增强四层的编码部分。增强四层的编码分为两部分:增强4.1层350、增强4.2层354。
(1)增强4.1层的编码部分主要包括:第七级目标矢量的计算、增强4.1层的各层目标矢量更新、增强4.1层代数码书搜索和增益比量化。
首先要将增强4.1层第六级目标矢量xn6_32k1减去增强3.2层代数码书的贡献得到用于增强4.1层代数码书搜索的第七级目标矢量346记为xn7,xn7(n)=xn6_32k1(n)-gc32·y6(n),其中y6(n)=layer32_code(n)*h(n)为增强3.2层代数码激励layer32_code与感知加权合成滤波器单位脉冲响应矢量h的卷积。
同时,还需要更新后面增强4.2层的目标矢量347,增强4.2层更新后的目标矢量记作xn7_32k2,xn7_32k2(n)=xn6_32k2(n)-gc32·y6(n)。
根据第七级目标矢量xn5,采用4选3脉冲搜索方案进行增强4.1层代数码书搜索348,得到增强4.1层代数码书索引值作为参数13输出。同时得到的还有增强4.1层代数码书增益gc41。将增强4.1层的代数码书增益与增强3.2层的代数码书增益之比γ41进行标量量化349,得到增强4.1层增益比量化的索引值作为参数14输出。 r 41 = g c 41 / g c 32 ^ , 其中
Figure A20061008295800182
为量化后的增强3.2层代数码书增益。
(2)增强4.2层的编码部分主要包括:第八级目标矢量的计算、增强4.2层的各层目标矢量更新、增强4.2层代数码书搜索和增益比量化。
首先要将增强4.2层第七级目标矢量xn7_32k2减去增强4.1层代数码书的贡献得到用于增强4.2层代数码书搜索的第八级目标矢量351记为xn8,xn8(n)=xn7_32k2(n)-gc41·y7(n),其中y7(n)=layer41_code(n)*h(n)为增强4.1层代数码激励layer41_code与感知加权合成滤波器单位脉冲响应矢量h的卷积。
根据第八级目标矢量xn8,采用4选3脉冲搜索方案进行增强4.2层代数码书搜索352,得到增强4.2层代数码书索引值作为参数15输出。同时得到的还有增强4.2层代数码书增益gc42。将增强4.2层的代数码书增益与增强4.1层的代数码书增益之比γ42进行标量量化353,得到增强4.2层增益比量化的索引值作为参数16输出。 r 42 = g c 42 / g c 41 ^ , 其中
Figure A20061008295800184
为量化后的增强4.1层代数码书增益。
对各层搜索完毕后,为了计算下一子帧的目标矢量,在子帧循环的最后,还需要对合成滤波器的状态进行更新。由于所述的编码器采用的是嵌入式的编码结构,不同层对应着不同的激励信号,因此不同层的合成滤波器的状态也是不一样的。为了适应嵌入式编码结构带来的这种变化,具体采取了各层状态同步更新的方法,具体为:
将上面得到的各层新的激励矢量通过感知加权合成滤波器356,并将滤波器状态分别存储于mem_syn0、mem_syn1、mem_syn2、mem_syn31、mem_syn32、mem_syn41、mem_syn42,用于下一子帧各层第一级目标矢量的计算。
至此,整个编码过程结束。
在图6中,描述了本宽带嵌入式语音解码器的工作原理。图中虚线框和虚线表示取其中某一种情况下的处理。参照图6所示,解码器的具体结构包括:
解码线性预测系数单元,用于确定解码获得合成滤波器系数;
解码自适应码书单元,具体包括解码自适应码1-5单元,共5个单元,具体可以根据需要的获得的解码速率,确定选择使用的具体的一个单元,并通过该单元根据参数2解码获得相应的自适应码书;
解码自适应码书和核心层代数码书增益单元,用于根据参数4解码获得相应的自适应码书增益和核心层代数码书增益;
解码核心层代数码书单元,用于根据参数3解码获得相应的核心层代数码书;
解码增强层代数码书和增益比单元,具体包括解码增强1-4层的代数码书和增益比单元,共4个单元,用于根据接收到的码流的大小和/或需要解码获得的语音速率确定采用其中至少一个单元,用于根据对应的参数解码获得相应增强层的代数码书和增益比,当不需要对增强层进行解码时,则无需设置该单元。
在图6所述的解码器中,具体的解码过程如下:
首先,根据表示ISP参数量化表索引值的参数1,通过解码线性预测系数单元解码出ISP参数并转换成线性预测系数,将所述的线性预测系数内插得到4个子帧的量化后的合成滤波器系数。
其次,再解码码流中的各参数,根据解码不同码率的语音,具体的处理方式包括:
如果要求解码出8kb/s的合成语音,则根据表示基音延迟索引值的参数2的解码自适应码书单元中的解码自适应码书1得到自适应码激励vn并对其进行滤波,以增强宽带信号的基音预测性能,根据表示核心层代数码书索引值的参数3解码出核心层代数码激励core_code,并由表示增益矢量索引值的参数4分别解码出自适应码书增益
Figure A20061008295800191
和核心层代数码书增益
Figure A20061008295800192
,组成8kb/s的合成激励信号exc_8k。
如果要求解码出12kb/s的合成语音,则根据参数2的解码自适应码书单元中的解码自适应码书2得到自适应码激励vn_12k并对其进行滤波,根据参数3解码出核心层代数码书core_code,由参数4分别解码出自适应码书增益
Figure A20061008295800193
和核心层代数码书增益
Figure A20061008295800194
。再根据表示增强1层代数码书索引值的参数5和表示增强1层代数码书增益比索引值的参数6解码出增强1层代数码激励layer1_code及其增益 。它们一起组成12kb/s的合成激励信号exc_12k。
如果要求解码出16kb/s的合成语音,则根据参数2的解码自适应码书单元中的解码自适应码书3得到自适应码激励vn_16k并对其进行滤波,根据参数3解码出核心层代数码激励core_code,由参数4分别解码出自适应码书增益 和核心层代数码书增益
Figure A20061008295800197
,根据参数5和参数6解码出增强1层代数码激励layer1_code及其增益 。再根据表示增强2层代数码书索引值的参数7和表示增强2层代数码书增益比索引值的参数8解码出增强2层代数码激励layer2_code及其增益
Figure A20061008295800199
。之后,一起组成16kb/s的合成激励信号exc_16k。
如果要求解码出24kb/s的合成语音,则根据参数2的解码自适应码书单元中的解码自适应码书4得到自适应码激励vn_24k,根据参数3解码出核心层代数码激励core_code,由参数4分别解码出自适应码书增益 和核心层代数码书增益
Figure A200610082958001911
,根据参数5和参数6解码出增强1层代数码激励layer1_code及其增益 ,根据参数7和参数8解码出增强2层代数码激励layer2_code及其增益
Figure A20061008295800202
,根据表示增强3.1层代数码书索引值的参数9和表示增强3.1层代数码书增益比索引值的参数10解码出增强3.1层代数码激励layer31_code及其增益
Figure A20061008295800203
,根据表示增强3.2层代数码书索引值的参数11和表示增强3.2层代数码书增益比索引值的参数12解码出增强3.2层代数码激励layer32_code及其增益
Figure A20061008295800204
。之后,一起组成24kb/s的合成激励信号exc_24k。
如果要求解码出32kb/s的合成语音,则根据参数2的解码自适应码书单元中的解码自适应码书5得到自适应码激励vn_32k,根据参数3解码出核心层代数码激励core_code,由参数4分别解码出自适应码书增益
Figure A20061008295800205
和核心层代数码书增益
Figure A20061008295800206
,根据参数5和参数6解码出增强1层代数码激励layer1_code及其增益 ,根据参数7和参数8解码出增强2层代数码激励layer2_code及其增益
Figure A20061008295800208
,根据参数9和参数10解码出增强3.1层代数码激励layer31_code及其增益
Figure A20061008295800209
,根据参数11和参数12解码出增强3.2层代数码激励layer32_code及其增益
Figure A200610082958002010
,根据表示增强4.1层代数码书索引值的参数13和表示增强4.1层代数码书增益比索引值的参数14解码出增强4.1层代数码激励layer41_code及其增益
Figure A200610082958002011
,根据表示增强4.2层代数码书索引值的参数15和表示增强4.2层代数码书增益比索引值的参数16解码出增强4.2层代数码激励layer42_code及其增益
Figure A200610082958002012
。之后,一起组成32kb/s的合成激励信号exc_32k。
对合成激励信号进行后处理,通过合成滤波器得到采样率为12.8kHz的合成语音。此合成语音在去加重后进行上采样,得到采样率为16kHz、频带范围为50Hz-6400Hz的合成语音。
由于宽带语音的频带范围为50Hz-7000Hz,所以还要对此合成语音进行高频补偿:首先产生一个高斯白噪声,对其进行修正,得到高频带激励信号;高频带激励信号通过修正的合成滤波器(对解码出的线性预测系数修正得到)得到合成信号;把此合成信号通过一个带通滤波器得到高频带合成信号。将高频带的合成信号与频带范围为50Hz-6400Hz、采样率为16kHz的合成语音相加得到输出的合成语音。
在上述宽带嵌入式语音编码器中包括增强层代数码书搜索的过程,如图7所示,具体采用的增强层的代数码书搜索方案为4选3脉冲搜索方案,相应的搜索流程包括:
步骤71:首先计算目标矢量,根据已有的深度优先树搜索算法找到4个脉冲组成一个代数码矢量。
步骤72:从这4个脉冲中任意选取3个组成新的代数激励码矢量,共得到4个含有3个非零脉冲的代数码激励矢量。
步骤73:采用与深度优先树搜索相同的准则,计算这4个含有3个非零脉冲的代数码激励矢量的Qk,k=0、1、2、3,其中 Q k = ( d t c k ) 2 c k t Φ c k , 根据深度优先树搜索用到的搜索准则,即使Q值最大的码字为所选码字,d=Htx是目标矢量x(n)和感知加权合成滤波器单位脉冲响应h(n)的相关,Φ=HtH是h(n)的自相关矩阵,ck,k=0、1、2、3分别代表4个含有3个非零脉冲的代数码激励矢量。
步骤74:初始化最大值max=Q0,k=0;
步骤75:令k=k+1,并计算Qk,之后,执行步骤76;
步骤76:判断max>Qk是否成立,若max>Qk成立,则执行步骤75;否则,执行步骤77;
步骤77:将Qk赋给max,即令max=Qk
步骤78:判断k是否等于3,即判断是否完成对四组代数码激励矢量的计算,若不等于,则确定未完成相应计算,需要继续执行步骤75,否则,确定完成相应的计算,需要执行步骤79:
步骤79;结束搜索,确定max对应的三个脉冲的位置,并执行步骤710;
步骤710:根据三个脉冲所在的轨迹信息编码出选择的情况标号。
即从4个脉冲中选取3个作为最后的代数码激励矢量,选出的3个脉冲所在的轨迹可能会有4种情况:轨迹0、1、2;轨迹1、2、3;轨迹2、3、0;轨迹3、0、1,分别对应情况标号0、1、2、3。因此在编码脉冲位置索引值的同时必须编码情况标号,使得在解码端能确定具体选择哪种情况。编码过程如下:首先对这3个脉冲的索引值进行编码,然后对编码端3个脉冲的轨迹的4种情况进行按顺序循环排序,即:轨迹0、1、2;轨迹1、2、3;轨迹2、3、0;轨迹3、0、1。选出符合要求的一种情况,取此种情况的头一个数字作为相应的情况标号,对该标号用2bit进行编码。
解码时,首先要建立一个包含轨迹信息的数组Track[12],
Track[]=[0 1 2
          1 2 3
          2 3 0
          3 0 1];
然后解码出表征轨迹信息的情况标号存入track0,用其乘以3存入变量i中,那么数组Track[]中下标值为i,i+1,i+2处的数值即为这3个脉冲的轨迹号。再根据轨迹号和脉冲位置索引值求解这3个脉冲的最终位置,组成代数码激励矢量。
本发明中,还包括对增强层代数码书增益比的量化处理过程,相应的宽带嵌入式语音编码器增强层代数码书增益比的量化原理如图8所示。从实验中可以观察到各层代数码书的增益是逐渐递减的,所以将相邻两层增益的比值进行量化可以减少动态范围。
r 1 = g c 1 / g c ^ 是增强1层代数码书增益gc1与核心层量化后代数码书增益
Figure A20061008295800212
的比值。r1用3bits来量化,量化后的值记作
Figure A20061008295800213
,那么量化后的增强1层代数码书增益为 g ^ c 1 = r ^ 1 · g ^ c .
r 2 = g c 2 / g ^ c 1 是增强2层代数码书增益gc2与增强1层量化后代数码书增益
Figure A20061008295800222
的比值。r2也用3bits来量化,量化后的值记作
Figure A20061008295800223
,那么量化后的增强2层代数码书增益为
Figure A20061008295800224
g ^ c 2 = r ^ 2 · g ^ c 1 .
r 31 = g c 31 / g c 2 ^ 是增强3.1层代数码书增益gc31与增强2层量化后代数码书增益
Figure A20061008295800227
的比值。r31用3bits来量化,量化后的值记作
Figure A20061008295800228
,那么量化后的增强3.1层代数码书增益为 g ^ c 31 = r ^ 31 · g ^ c 2 .
r 32 = g c 32 / g c 31 ^ 是增强3.2层代数码书增益gc32与增强3.1层量化后代数码书增益
Figure A200610082958002212
的比值。r32用3bits来量化,量化后的值记作
Figure A200610082958002213
,那么量化后的增强3.2层代数码书增益为
Figure A200610082958002214
g ^ c 32 = r ^ 32 · g ^ c 31 .
r 41 = g c 41 / g c 32 ^ 是增强4.1层代数码书增益gc41与增强3.2层量化后代数码书增益 的比值。r41用3bits来量化,量化后的值记作
Figure A200610082958002218
,那么量化后的增强4.1层代数码书增益为
Figure A200610082958002219
g ^ c 41 = r ^ 41 · g ^ c 32 .
r 42 = g c 42 / g c 41 ^ 是增强4.2层代数码书增益gc42与增强4.1层量化后代数码书增益
Figure A200610082958002222
的比值。r42用3bits来量化,量化后的值记作
Figure A200610082958002223
,那么量化后的增强4.2层代数码书增益为
Figure A200610082958002224
g ^ c 42 = r ^ 42 · g ^ c 41 .
在本发明实现的编码过程中,还包括针对各层合成滤波器的状态更新处理过程,具体的宽带嵌入式语音编码器各层合成滤波器状态更新的原理如图9所示。在各层搜索完毕后,得到了自适应码书增益gp及各层的自适应码激励:vn、vn_12k、vn_16k、vn_24k1、vn_24k2、vn_32k1、vn_32k2,各层的代数码激励:core_code、layer1_code、layer21_code、layer31_code、layer32_code、layer41_code、layer42_code及对应的代数码书增益gc、gc1、gc2、gc31、gc32、gc41、gc42。由此可以得到各层新的激励矢量:exc_8k、exc_12k、exc_16k、exc_24k1、exc_24k2、exc_32k1、exc_32k2。其中:
exc_8k(n)=gp·vn(n)+gc·core_code(n);
exc_12k(n)=gp·vn_12k(n)+gc·core_code(n)+gc1·layer1_code(n);
exc_16k(n)=gp·vn_16k(n)+gc·core_code(n)+gc1·layer1_code(n)+gc2·layer2_code(n);
exc_24k1(n)=gp·vn_24k1(n)+gc·core_code(n)+gc1·layer1_code(n)+gc2·layer2_code(n)+gc31·layer31_code(n);
exc_24k2(n)=gp·vn_24k2(n)+gc·core_code(n)+gc1·layer1_code(n)+gc2·layer2_code(n)+gc31·layer31_code(n)+gc32·layer32_code(n);
exc_32k1(n)=gp·vn_32k1(n)+gc·core_code(n)+gc1·layer1_code(n)+gc2·layer2_code(n)+gc31·layer31_code(n)+gc32·layer32_code(n)+gc41·layer41_code(n);
exc_32k2(n)=gp·vn_32k2(n)+gc·core_code(n)+gc1·layer1_code(n)+gc2·layer2_code(n)+gc31·layer31_code(n)+gc32·layer32_code(n)+gc41·layer41_code(n)+gc42·layer42_code(n)。
将上面得到的各层新的激励矢量通过感知加权合成滤波器356,并将滤波器状态分别存储于mem_syn0、mem_syn1、mem_syn2、mem_syn31、mem_syn32、mem_syn41、mem_syn42,用于下一子帧各层第一级目标矢量的计算。
本发明中,宽带嵌入式编码器比特分配与参数的对照如表1所示,根据表1将编码端确定的各参数写入码流中相应的位置,以便于解码端可以准确地解码获得相应的参数信息。
当然,本发明在具体实现过程中并不限于仅采用表1所示的方式生成编码码流,例如,可以根据增加层的个数n的多少调整码流,但必须要按照核心层->增强1层->增强2层->…->增强n层的顺序生成相应的编码码流。
表1
  Bits(MSB-LSB)     描述
  s1-s8     第1个ISP子矢量的索引值
  s9-s16     第2个ISP子矢量的索引值
  s17-s22     第3个ISP子矢量的索引值
  s23-s29     第4个ISP子矢量的索引值
  s30-s36     第5个ISP子矢量的索引值
  s37-s41     第6个ISP子矢量的索引值
  s42-s46     第7个ISP子矢量的索引值
  核心层码书索引码流
  第一子帧
  s47-s54     自适应码书索引值
  s55-s59     代数码书轨迹1中脉冲位置的索引值
  s60-s64     代数码书轨迹2中脉冲位置的索引值
  s65-s69     代数码书轨迹3中脉冲位置的索引值
  s70     代数码书的第三个脉冲轨道标记
  s71-s76     码书增益索引值
  第二子帧
  s77-s81     自适应码书索引值
  s82-s103     与s55-s76结构类似
  第三子帧
  s104-s133     与s47-s76结构类似
    第四子帧
    s134-s160     与s77-s103结构类似
    增强1层码书索引码流
    第一子帧
    s161-s165     代数码书第1个脉冲位置的索引值
    s166-s170     代数码书第2个脉冲位置的索引值
    s171-s175     代数码书第3个脉冲位置的索引值
    s176-s177     代数码书丢弃脉冲情况标值
    s178-s180     代数码书增益比索引值
    第二子帧
    s181-s200     与s161-s180结构类似
    第三子帧
    s201-s220     与s181-s200结构类似
    第四子帧
    s221-s240     与s201-s220结构类似
    增强2层码书索引码流
    s241-s320    与s161-s240增强1层码书索引码流结构类似
    增强3.1层码书索引码流
    S321-s400    与s161-s240增强1层码书索引码流结构类似
    增强3.2层码书索引码流
    s401-s480    与s161-s240增强1层码书索引码流结构类似
    增强4.1层码书索引码流
    s481-s560    与s161-s240增强1层码书索引码流结构类似
    增强4.2层码书索引码流
    S561-s640    与s161-s240增强1层码书索引码流结构类似
可以看出,在表1中:
用8bits编码第1个ISP子矢量索引值并存放在s1-s8;用8bits编码第2个ISP子矢量索引值存放在s9-s16;用6bits编码第3个ISP子矢量存放在s7-s22;用7bits编码第4个ISP子矢量索引值存放在s23-s29;用7bits编码第5个ISP子矢量索引值存放在s30-s36;用5bits编码第6个ISP子矢量索引值存放在s37-s41;用5bits编码第7个ISP子矢量索引值存放在s42-s46;
s47-s76内存放的是核心层第1子帧的参数:用8bits编码第1子帧的自适应码书索引值存放在s47-s54;用5bits编码第1子帧核心层代数码书第1个脉冲位置的索引值存放在s55-s59;用5bits编码第1子帧核心层代数码书第2个脉冲位置的索引值存放在s60-s64;用5bits编码第1子帧核心层代数码书第3个脉冲位置的索引值存放在s65-s69;用1bits编码第1子帧核心层代数码书的第三个脉冲轨道标记存放在s70;用6bits编码第1子帧核心层码书增益矢量索引值存放在s71-s76。
s77-s103内存放的是核心层第2子帧的参数:用5bits编码第2子帧的自适应码书索引值存放在s77-s81;s82-s103与s55-s76内存放的第1子帧参数顺序及参数的比特分配数相似。
s104-s133内存放的是核心层第3子帧的参数:与s47-s76内存放的第1子帧参数顺序及参数的比特分配数相似。
s134-s160内存放的是核心层第4子帧的参数:与s77-s103内存放的第2子帧参数顺序及参数的比特分配数相似。
s161-s180内存放的是增强1层第1子帧的参数:用5bits编码增强1层代数码书第1个脉冲位置的索引值存放在s161_s165;用5bits编码增强1层代数码书第2个脉冲位置的索引值存放在s166-s170;用5bits编码增强1层代数码书第3个脉冲位置的索引值存放在s171-s175;用2bits编码增强1层代数码书丢弃脉冲情况标记存放在s176-s177;用3bits编码增强1层代数码书增益比索引值存放在s178-s180;
s181-s200内存放的是增强1层第2子帧的参数:与s161-s180内存放的第1子帧参数顺序及参数的比特分配数相似。
s201-s220内存放的是增强1层第3子帧的参数:与s161-s180内存放的第1子帧参数顺序及参数的比特分配数相似。
s221-s240内存放的是增强1层第4子帧的参数:与s161-s180内存放的第1子帧参数顺序及参数的比特分配数相似。
s241-s320内存放的是增强2层的参数:与s161-s240内存放的增强1层参数顺序及参数的比特分配数相似。
s321-s400内存放的是增强3.1层的参数:与s161-s240内存放的增强1层参数顺序及参数的比特分配数相似。
s401-s480内存放的是增强3.2层的参数:与s161-s240内存放的增强1层参数顺序及参数的比特分配数相似。
s480-s560内存放的是增强4.1层的参数:与s161-s240内存放的增强1层参数顺序及参数的比特分配数相似。
s561-s640内存放的是增强4.2层的参数:与s161-s240内存放的增强1层参数顺序及参数的比特分配数相似。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (20)

1、一种嵌入式语音编码方法,该方法是将输入语音在时域上分帧,之后进行编码,其特征在于,所述的编码处理步骤包括:
A、计算确定语音帧的线性预测系数,以及感知加权合成滤波器的脉冲响应和一级目标矢量;
B、根据所述一级目标矢量及所述的感知加权合成滤波器的脉冲响应计算确定基音延迟索引值,并生成各层自适应码书矢量;
C、根据之后的根据一级目标矢量及自适应码书矢量及前一层代数码书矢量更新获得的各级目标矢量及所述的感知加权合成滤波器的脉冲响应逐层计算各层的代数码书矢量,并逐层量化各层的代数码书增益,还计算确定自适应码书增益;
D、将所述的线性预测系数、基音延迟索引值、自适应码书增益、各层的代数码书矢量及各层的代数码书增益进行编码,获得编码后的码流。
2、根据权利要求1所述的方法,其特征在于,在执行所述的步骤C之后,所述的方法还包括:
E、根据各层的代数码书矢量及增益和各层自适应码书矢量及增益计算获得表示同一子帧语音的各层激励矢量;
F、利用所述的各层激励矢量通过合成滤波器合成语音,更新各层合成滤波器存储状态及记录的自适应码书。
3、根据权利要求2所述的方法,其特征在于,所述的步骤E包括:
将同一子帧的当前层的自适应码书矢量与当前层以及之前各层代数码书矢量的和作为各层激励矢量。
4、根据权利要求1、2或3所述的方法,其特征在于,所述的步骤C包括:
C1、根据各层合成滤波器的状态、线性预测系数及感知加权合成滤波器的脉冲响应,由预处理后的语音计算各层的一级目标矢量;
C2、根据所述的一级目标矢量以及由一级目标矢量更新获得的各层目标矢量,采用逐层增加代数码书的脉冲的方式逐层搜索确定各层代数码书,并确定各层代数码书增益。
5、根据权利要求4所述的方法,其特征在于,所述的步骤C2包括:
针对下一层代数码书的搜索和增益矢量的计算是基于上一层代数码书的搜索结果及上一层的增益矢量计算结果实现。
6、根据权利要求4所述的方法,其特征在于,在所述的步骤C2中,对于各层中的核心层,采用全搜索的方式搜索确定核心层代数码书,对于增强层,采用基于深度优先树搜索算法的4选3脉冲搜索方式搜索确定相应的增强层代数码书。
7、根据权利要求6所述的方法,其特征在于,所述的基于深度优先树搜索算法的4选3脉冲搜索方式包括:
根据相应的目标矢量,由深度优先树搜索算法确定4个非零脉冲组成一个代数码矢量,并从所述的4个非零脉冲中任意选择3个组成相应的代数码激励矢量,共获得4组由3个非零脉冲组成的代数码激励矢量;
采用与深度优先树搜索算法相同的准则,在4组代数码激励矢量中选择一组作为搜索选定的代数码书矢量。
8、根据权利要求4所述的方法,其特征在于,所述的步骤C2中,包括:
在核心层,根据核心层的目标矢量搜索核心层代数码书矢量;
在增强层,依据增强层的顺序,根据各增强层对应的目标矢量逐层搜索确定各增强层的代数码书矢量。
9、根据权利要求4所述的方法,其特征在于,在所述的步骤C2中,所述的各层代数码书增益的量化处理包括:
对于核心层增益的量化,是采用核心层的代数码书的增益和自适应码书增益联合矢量量化确定核心层的增益,作为核心层的增益矢量;
对于增强层增益的量化,是采用各增强层各自量化其代数码书的增益比。
10、根据权利要求9所述的方法,其特征在于,所述的各增强层代数码书增益的量化处理包括:
采用对当前层代数码书增益与前一层量化后的代数码书增益之比,进行当前层的代数码书增益的量化。
11、一种嵌入式语音编码器,其特征在于,包括:
线性预测分析单元,用于确定语音帧的线性预测系数;
自适应码书搜索单元,用于根据一级目标矢量及计算获得的感知加权合成滤波器的脉冲响应计算确定基音延迟索引值及各层自适应码书矢量;
代数码书搜索单元,用于根据基于所述的一级目标矢量及自适应码书矢量及前一层代数码书矢量计算获得的之后的各级目标矢量,以及计算获得的感知加权合成滤波器的脉冲响应逐层计算各层的代数码书矢量;
增益计算单元,用于根据各层的代数码书搜索结果和上一层量化的代数码书增益逐层量化各层的代数码书增益,根据自适应码书搜索结果计算自适应码书增益;
编码单元,用于将所述的线性预测系数、基音延迟索引值、自适应码书增益、各层的代数码书矢量及各层的代数码书增益进行编码,获得编码后的码流。
12、根据权利要求11所述的编码器,其特征在于,所述的编码器中还包括:
计算各层激励矢量单元,用于根据各层的代数码书矢量及增益和各层自适应码书矢量及增益计算获得表示同一子帧语音的各层激励矢量;
各层合成滤波器状态更新单元,用于利用所述的各层激励矢量通过合成滤波器合成语音,更新各层合成滤波器存储状态及记录的自适应码书。
13、根据权利要求11或12所述的编码器,其特征在于,所述的自适应码书搜索单元的输入连接有一级目标矢量计算单元,该单元用于根据各层合成滤波器的状态、线性预测系数及计算获得的感知加权合成滤波器的脉冲响应,由预处理后的语音计算确定一级目标矢量,所述的自适应码书搜索单元根据所述的一级目标矢量确定所述的基音延迟索引值及各层自适应码书矢量。
14、根据权利要求13所述的编码器,其特征在于,所述的代数码书搜索单元包括:
核心层更新目标矢量单元,用于对一级目标矢量单元输出的各层的一级目标矢量根据自适应码书搜索单元输出的各层自适应码书矢量进行更新,获得更新后的各层目标矢量;
核心层代数码书搜索单元,用于根据核心层更新目标矢量单元中更新后的核心层目标矢量采用全搜索的方式搜索确定核心层代数码书;
增强层更新目标矢量单元,用于根据上层代数码书更新上层的各层目标矢量,获得更新后的各层目标矢量;
增强层代数码书搜索单元,该单元至少包括一个,用于根据更新后的当前层相应的目标矢量采用基于深度优先树搜索算法的4选3脉冲搜索方式搜索确定当前的增强层代数码书。
15、根据权利要求14所述的编码器,其特征在于,所述的增益计算单元包括:
核心层增益矢量量化单元,用于对核心层代数码书及自适应码书进行增益矢量量化确定核心层增益;
增强层增益比量化单元,该单元至少包括一个,用于对量化后的上层代数码书增益和当前层代数码书进行增益比量化处理量化当前层代数码书增益。
16、一种嵌入式语音解码方法,其特征在于,包括:
从接收到的码流中解码线性预测系数得到合成滤波器系数,解码基音延迟得到相应速率对应的自适应码书,解码核心层代数码书索引值得到核心层代数码书;
解码自适应码书增益和核心层代数码书增益,并根据接收到的码流大小解码增强层的代数码书及其增益;
根据解码获得的各参数产生激励信号,并利用所述的激励信号经过合成滤波器合成语音输出。
17、根据权利要求16所述的方法,其特征在于,所述的根据接收到的码流大小解码增强层的代数码激励及其增益包括:
根据接收到的码流的大小,判断需要解码的增强层个数,并依次分层解码出各增强层的代数码书及其增益。
18、根据权利要求16或17所述的方法,其特征在于,所述的方法还包括:
解码端接收编码端发来的码流后,根据解码需要获得的语音质量,解码出该语音质量对应的各参数信息,并根据所述的各参数信息输出合成的相应速率的语音。
19、一种嵌入式语音解码器,其特征在于,包括:
解码线性预测系数单元,用于解码码流中的线性预测系数得到合成滤波器系数;
解码自适应码书单元,用于根据基音延迟索引值解码基音延迟得到对应的自适应码书;
解码自适应码书和核心层代数码书增益单元,用于解码码流获得自适应码书增益和核心层代数码书增益;
解码核心层代数码书单元,用于解码码流中的核心层代数码书索引值得到核心层代数码书;
语音合成单元,用于根据解码获得的各参数产生激励信号,并利用所述的激励信号经过合成滤波器合成语音输出。
20、根据权利要求19所述的嵌入式语音解码器,其特征在于,还包括:
解码增强层代数码书和增益比单元,该单元包括到少一个,用于根据接收到的码流大小选择相应的单元,通过该单元解码相应的增强层的代数码书及其增益,并提供给语音合成单元。
CN2006100829585A 2006-06-21 2006-06-21 嵌入式语音编解码的方法及编解码器 Expired - Fee Related CN101000768B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2006100829585A CN101000768B (zh) 2006-06-21 2006-06-21 嵌入式语音编解码的方法及编解码器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2006100829585A CN101000768B (zh) 2006-06-21 2006-06-21 嵌入式语音编解码的方法及编解码器

Publications (2)

Publication Number Publication Date
CN101000768A true CN101000768A (zh) 2007-07-18
CN101000768B CN101000768B (zh) 2010-12-08

Family

ID=38692707

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006100829585A Expired - Fee Related CN101000768B (zh) 2006-06-21 2006-06-21 嵌入式语音编解码的方法及编解码器

Country Status (1)

Country Link
CN (1) CN101000768B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009059564A1 (en) * 2007-11-05 2009-05-14 Huawei Technologies Co., Ltd. A multi-rate speech audio encoding method
WO2009089700A1 (fr) * 2008-01-18 2009-07-23 Huawei Technologies Co., Ltd. Procédé et appareil de mise à jour de l'état d'un filtre de synthèse
CN101933306A (zh) * 2007-12-31 2010-12-29 阿尔卡特朗讯美国公司 用于在分组网络中检测和抑制回声的方法和设备
CN102290051A (zh) * 2010-06-18 2011-12-21 微软公司 预测重新采样器调度器算法
CN101572087B (zh) * 2008-04-30 2012-02-29 北京工业大学 嵌入式语音或音频信号编解码方法和装置
CN102449690A (zh) * 2009-06-04 2012-05-09 高通股份有限公司 用于重建被擦除语音帧的系统与方法
CN101765880B (zh) * 2007-07-27 2012-09-26 松下电器产业株式会社 语音编码装置和语音编码方法
CN102682777B (zh) * 2007-11-05 2013-11-06 华为技术有限公司 一种衰减因子的获取方法和获取装置
CN104021796A (zh) * 2013-02-28 2014-09-03 华为技术有限公司 语音增强处理方法和装置
CN106030704A (zh) * 2013-12-16 2016-10-12 三星电子株式会社 用于对音频信号进行编码/解码的方法和设备
CN107256709A (zh) * 2012-11-15 2017-10-17 株式会社Ntt都科摩 音频编码装置
CN107452391A (zh) * 2014-04-29 2017-12-08 华为技术有限公司 音频编码方法及相关装置
CN106463132B (zh) * 2014-07-02 2021-02-02 杜比国际公司 对压缩的hoa表示编码和解码的方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1241358B (it) * 1990-12-20 1994-01-10 Sip Sistema di codifica del segnale vocale con sottocodice annidato

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8046216B2 (en) 2005-01-18 2011-10-25 Huawei Technologies Co., Ltd. Method and device for updating status of synthesis filters
US8078459B2 (en) 2005-01-18 2011-12-13 Huawei Technologies Co., Ltd. Method and device for updating status of synthesis filters
CN101765880B (zh) * 2007-07-27 2012-09-26 松下电器产业株式会社 语音编码装置和语音编码方法
CN102682777B (zh) * 2007-11-05 2013-11-06 华为技术有限公司 一种衰减因子的获取方法和获取装置
WO2009059564A1 (en) * 2007-11-05 2009-05-14 Huawei Technologies Co., Ltd. A multi-rate speech audio encoding method
CN101430879B (zh) * 2007-11-05 2011-08-10 华为技术有限公司 一种多速率语音频编码的方法
CN101933306A (zh) * 2007-12-31 2010-12-29 阿尔卡特朗讯美国公司 用于在分组网络中检测和抑制回声的方法和设备
CN101933306B (zh) * 2007-12-31 2015-05-20 阿尔卡特朗讯美国公司 用于在分组网络中检测和抑制回声的方法和设备
US7921009B2 (en) 2008-01-18 2011-04-05 Huawei Technologies Co., Ltd. Method and device for updating status of synthesis filters
WO2009089700A1 (fr) * 2008-01-18 2009-07-23 Huawei Technologies Co., Ltd. Procédé et appareil de mise à jour de l'état d'un filtre de synthèse
CN101572087B (zh) * 2008-04-30 2012-02-29 北京工业大学 嵌入式语音或音频信号编解码方法和装置
CN102449690A (zh) * 2009-06-04 2012-05-09 高通股份有限公司 用于重建被擦除语音帧的系统与方法
US8428938B2 (en) 2009-06-04 2013-04-23 Qualcomm Incorporated Systems and methods for reconstructing an erased speech frame
CN102449690B (zh) * 2009-06-04 2014-05-07 高通股份有限公司 用于重建被擦除语音帧的系统与方法
CN102290051B (zh) * 2010-06-18 2015-11-25 微软技术许可有限责任公司 预测重新采样器调度器算法
CN102290051A (zh) * 2010-06-18 2011-12-21 微软公司 预测重新采样器调度器算法
CN107256709A (zh) * 2012-11-15 2017-10-17 株式会社Ntt都科摩 音频编码装置
CN107256709B (zh) * 2012-11-15 2021-02-26 株式会社Ntt都科摩 音频编码装置
CN104021796B (zh) * 2013-02-28 2017-06-20 华为技术有限公司 语音增强处理方法和装置
CN104021796A (zh) * 2013-02-28 2014-09-03 华为技术有限公司 语音增强处理方法和装置
CN106030704A (zh) * 2013-12-16 2016-10-12 三星电子株式会社 用于对音频信号进行编码/解码的方法和设备
CN106030704B (zh) * 2013-12-16 2020-07-31 三星电子株式会社 用于对音频信号进行编码/解码的方法和设备
CN107452391A (zh) * 2014-04-29 2017-12-08 华为技术有限公司 音频编码方法及相关装置
CN107452391B (zh) * 2014-04-29 2020-08-25 华为技术有限公司 音频编码方法及相关装置
US10984811B2 (en) 2014-04-29 2021-04-20 Huawei Technologies Co., Ltd. Audio coding method and related apparatus
CN106463132B (zh) * 2014-07-02 2021-02-02 杜比国际公司 对压缩的hoa表示编码和解码的方法和装置

Also Published As

Publication number Publication date
CN101000768B (zh) 2010-12-08

Similar Documents

Publication Publication Date Title
CN101000768B (zh) 嵌入式语音编解码的方法及编解码器
CN101395661B (zh) 音频编码和解码的方法和设备
CN1735927B (zh) 用于高质量语音编码转换的方法和装置
CN101023471B (zh) 可伸缩性编码装置、可伸缩性解码装置、可伸缩性编码方法、可伸缩性解码方法、通信终端装置以及基站装置
CN100583241C (zh) 音频编码设备、音频解码设备、音频编码方法和音频解码方法
FI117994B (fi) Algebrallinen koodikirja signaalin avulla valituin pulssiamplitudein puheen nopeata koodausta varten
RU2509379C2 (ru) Устройство и способ квантования и обратного квантования lpc-фильтров в суперкадре
KR101147878B1 (ko) 코딩 및 디코딩 방법 및 장치
CN102122511B (zh) 一种信号处理方法、处理装置以及语音解码器
US7792679B2 (en) Optimized multiple coding method
CN102985969B (zh) 编码装置、解码装置和编码方法、解码方法
CN101176148B (zh) 编码装置、解码装置和其方法
KR20020077389A (ko) 광대역 신호의 코딩을 위한 대수적 코드북에서의 펄스위치 및 부호의 인덱싱
JP2002526798A (ja) 複数チャネル信号の符号化及び復号化
CN101494055A (zh) 用于码分多址无线系统的方法和装置
JPH08263099A (ja) 符号化装置
US20010053972A1 (en) Method and apparatus for an encoding and decoding a speech signal by adaptively changing pulse position candidates
CN104025189A (zh) 编码语音信号的方法、解码语音信号的方法,及使用其的装置
CN108109629A (zh) 一种基于线性预测残差分类量化的多描述语音编解码方法和系统
CN101281749A (zh) 可分级的语音和乐音联合编码装置和解码装置
CA2283187A1 (en) A method and apparatus for speech encoding, speech decoding, and speech coding/decoding
US20050108009A1 (en) Apparatus for coding of variable bitrate wideband speech and audio signals, and a method thereof
US6804639B1 (en) Celp voice encoder
CN1104010A (zh) 产生用于话音编码器的频谱噪音加权滤波器的方法
CN101198041B (zh) 矢量量化方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20101208

Termination date: 20160621