CN101303857A - 编码方法和编码器 - Google Patents
编码方法和编码器 Download PDFInfo
- Publication number
- CN101303857A CN101303857A CNA2007101657843A CN200710165784A CN101303857A CN 101303857 A CN101303857 A CN 101303857A CN A2007101657843 A CNA2007101657843 A CN A2007101657843A CN 200710165784 A CN200710165784 A CN 200710165784A CN 101303857 A CN101303857 A CN 101303857A
- Authority
- CN
- China
- Prior art keywords
- code book
- search
- pulse
- type
- searching algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 100
- 238000010845 search algorithm Methods 0.000 claims abstract description 14
- 230000000737 periodic effect Effects 0.000 claims description 17
- 230000007704 transition Effects 0.000 claims description 15
- 238000011156 evaluation Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 12
- 230000003100 immobilizing effect Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 abstract description 6
- 239000012141 concentrate Substances 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 230000004087 circulation Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000007993 MOPS buffer Substances 0.000 description 1
- 241000282341 Mustela putorius furo Species 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0013—Codebook search algorithms
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Control Of Stepping Motors (AREA)
- Error Detection And Correction (AREA)
Abstract
本发明实施例公开了一种编码方法,根据不同的输入信号类型选择不同的码书搜索算法。本发明实施例还提供相应的编码器。由于采用本发明实施例方案可根据输入信号的各种可能的结构特点选择使用适当的搜索算法,使得某些采用简单计算即可得到满意结果的信号类型能够与适应该类型且计算复杂度较低的搜索算法搭配,以较少的系统资源获得较佳的性能;而同时,其他需要较复杂计算的信号类型也能够被质量较好的搜索算法处理,保证了编码的质量。
Description
技术领域
本发明涉及矢量编码技术,特别是基于码激励线性预测(CELP:CodeExcited Linear Prediction)模型的编码方法和编码器。
背景技术
在基于CELP模型的编码技术中,对自适应滤波后的残差信号进行量化编码是一个非常重要的环节。目前,通常使用固定码书搜索的方式对残差信号进行量化编码。一种常用的固定码书是代数码书。代数码书关注目标信号的脉冲位置,对脉冲的幅度则默认为1,因此只需要量化脉冲的符号和位置;当然,可以通过在相同的位置叠加多个脉冲来表示不同的幅度。在利用代数码书进行量化编码时,重点之一在于搜索目标信号所对应的最佳代数码书的各个脉冲的位置。一般而言,在寻找脉冲的最佳位置时,进行全搜索(即遍历所有可能的位置组合情况)的运算复杂度很大,因此需要寻找次优搜索算法。在保证搜索结果质量的前提下,尽量减少搜索次数,降低计算复杂度,是编码技术研究与发展的主要目标之一。
下面介绍两种现有代数码书脉冲位置搜索所采用的次优搜索方法。
一、深度优先树搜索(Depth-First Tree Search Procedure)
假设语音子帧长度为64,根据编码码率不同,需要搜索的脉冲数目也不同,假设为N。如果不加其他限制,在64个位置中搜索N个脉冲则运算复杂度过高。为此,对代数码书的脉冲位置进行约束,将64个位置划分为M个轨道(Track)。一种典型的轨道划分方式如表1所示。
表1
Track | Positions |
T0 | 0,4,8,12,16,20,24,28,3236,40,44,48,52,56,60 |
T1 | 1,5,9,13,17,21,25,29,33,37,41,45,49,53,57,61 |
T2 | 2,6,10,14,18,22,26,30,34,38,42,46,50,54,58,62 |
T3 | 3,7,11,15,19,23,27,31,35,39,43,47,51,55,59,63 |
表1中,“T0”~“T3”为4个轨道,“Positions”为各个轨道上包含的位置编号。由表1可以看出,64个位置被划分为4个轨道,每个轨道有16个位置,4个轨道的脉冲位置相互交错,最大限度的保证对各种脉冲位置的组合。
需要搜索的N个脉冲按照一定的数量分布被约束在M=4个轨道上。下面以N=4,每个轨道上搜索1个脉冲的情况来进行说明,其他情况可类推。
假设在T0~T3上搜索的脉冲分别为P0~P3,在搜索过程中,每次搜索相邻两个轨道上的两个脉冲,例如T0-T1,T1-T2,T2-T3,T3-T0。通过四级(Level)搜索得到最终的最佳码书。具体过程如图1所示,包括步骤:
①第一级搜索在T0-T1,T2-T3上进行。首先在T0-T1上搜索P0和P1的位置,其中P0在轨道T0的16个位置中的4个位置进行搜索,这4个位置由已知的参考信号在该轨道上的极值来确定,P1在轨道T1的16个位置中进行搜索;按照设定的评价标准(例如代价函数Qk)从搜索到的4×16种位置组合中确定最佳的P0和P1的位置。然后在T2-T3上搜索P2和P3的位置,其中P2在轨道T2的16个位置中的8个位置进行搜索,这8个位置由已知的参考信号在该轨道上的极值来确定,P3在轨道T3的16个位置中进行搜索,最后确定出最佳的P2和P3的位置,完成这一级的搜索。
②第二级搜索在T1-T2,T3-T0上进行,过程与第一级搜索类似。
③同样在T2-T3,T0-T1上进行第三级搜索,在T3-T0,T1-T2上进行第四级搜索。
④最后,从四级搜索的四个结果中选择一个最优的结果作为最佳代数码书。总共搜索的次数为4×(4×16+8×16)=768次。
二、全局脉冲替换
简单起见,假设所使用的码书结构与前述算法一中相同,并且同样需要在4个轨道上各搜索一个脉冲,在T0~T3上搜索的脉冲分别为P0~P3。具体过程包括步骤:
①确定一个初始码书,假设为{P0,P1,P2,P3}={20,33,42,7}。保持P1,P2,P3不变,用轨道T0中的其他位置依次替换P0的初始值20,得到新码书{0,33,42,7}、{4,33,42,7}、...、{60,33,42,7}。按照设定的评价标准从其中选择一个最佳的新码书,例如选择代价函数Qk值最大的新码书。记录该最大的Qk值和对应的新码书,假定为{4,33,42,7}。
②保持初始码书中的P0,P2,P3不变(注意,此时的初始码书还是原来的初始码书,即{20,33,42,7}),用轨道T1中的其他位置依次替换P1的初始值33,类似①中的过程,最终得到替换过程中最大的Qk值和对应的新码书,假定为{20,21,42,7}。
③对P2和P3执行类似①和②的处理,分别得到最大的Qk值和对应的新码书。
④将上述过程中分别得到的4个最大的Qk值中最大的一个作为全局最优值,相应的码书作为本轮搜索的最佳码书,假定为{20,21,42,7}。
⑤以最佳码书{20,21,42,7}作为新一轮的初始码书,重复上述①~④的过程,一般可循环执行4次,获得最终的最佳码书。总共搜索的次数为4×(4×16)=256次。
现有各种编码技术中所使用的码书搜索算法很难在计算复杂度和性能方面同时达到满意的效果。例如,深度优先树搜索算法虽然能在各种码率情况下获得良好的语音质量,但是其搜索次数较多,运算复杂度较大;而全局脉冲替代法虽然运算复杂度很低,但容易陷入局部最大值,性能不稳定,在某些信号情况下具有较好的质量,而在另一些信号情况下则质量不佳。
发明内容
本发明实施例的目的在于提供一种能够兼顾降低计算复杂度和提高系统性能的编码方法和编码器。
一种编码方法,包括:获取输入信号的特征参数;根据所述特征参数确定输入信号的类型;根据所述特征参数生成待量化的矢量;根据所确定的输入信号的类型,选择相应的码书搜索算法对所述待量化的矢量进行码书搜索。
一种编码器,包括:特征参数获取单元,用于获取输入信号的特征参数;信号类型确定单元,用于根据所述特征参数确定输入信号的类型;矢量生成单元,用于根据所述特征参数生成待量化的矢量;至少两个码书搜索单元,用于提供不同的码书搜索算法;判决单元,用于根据所述信号类型确定单元确定的输入信号的类型,选择相应的码书搜索单元对所述待量化的矢量进行码书搜索。
上述编码方法或装置采用根据不同的输入信号类型选择不同的码书搜索算法的方法。由于可根据输入信号的特点选择使用适当的搜索算法,使得某些采用简单计算即可得到满意结果的信号类型能够与适应该类型且计算复杂度较低的搜索算法搭配,以较少的系统资源获得较佳的性能;而同时,其他需要较复杂计算的信号类型也能够被质量较好的搜索算法处理,保证了编码的质量。
附图说明
图1是现有深度优先树搜索方法示意图;
图2是本发明编码方法的实施例的流程示意图;
图3是本发明编码器的实施例的逻辑结构示意图;
图4是本发明码书搜索算法实施例一流程示意图;
图5是本发明码书搜索算法实施例二流程示意图;
图6是本发明码书搜索算法实施例三流程示意图;
图7是本发明码书搜索算法实施例四流程示意图;
图8是本发明码书搜索算法实施例五流程示意图。
具体实施方式
本发明实施例提供一种编码方法,根据不同的输入信号类型选择不同的码书搜索算法。本发明实施例还提供相应的编码器。以下分别对本发明实施例的方法和装置进行详细说明。
参考图2,本发明编码方法的实施例包括步骤:
Step1、获取输入信号的特征参数。
本实施例中编码的输入信号可以是基于CELP模型的自适应滤波后的残差信号,以及类似的其他适于矢量量化编码的语音或者乐音信号等。所称特征参数是用来描述输入信号某方面特性的数据。特征参数通常以帧为单位进行分析和提取,帧大小可根据应用需要以及信号特性等来选择。
特征参数的可选范围包括但不限于:线性预测参数(LPC:Liner PredictionCoefficient)、线性预测倒谱系数(LPCC:Liner prediction Cepstrum Coefficient)、基音周期参数、帧能量、平均过零率等。
Step2、根据输入信号的特征参数确定输入信号的类型。
在确定输入信号的类型时,由于特征参数种类较多,分别体现输入信号某个方面的特性,因此可以基于不同的判断方式对输入信号进行分类,例如以不同的特征参数或特征参数的组合作为判断依据,或者在判断时设置不同的特征参数阈值等,本实施例对此不做限定,具体可根据实际应用的情况进行设置。
由于信号种类的划分与后续搜索算法的选择密切相关,一种可行的分类方式是根据候选搜索算法的特点来确定分类所依据的具体特征参数以及划分类别的判决标准。
例如:对于计算复杂度较低的算法,适宜于处理具有周期性特征的输入信号,因为这种信号相对较容易确定其最佳脉冲的位置,这样既有效降低了复杂度,又不会对系统性能造成明显影响;对于计算复杂度较高的高质量算法,适宜于处理具有白噪声特征的输入信号,因为这种信号的最佳脉冲的位置比较难以确定,采用高质量算法来处理可保证编码质量。因此可将体现输入信号周期特点的特征参数作为分类依据,将输入信号的类型分为具有周期性特征的类型和具有白噪声特征的类型,对具有周期性特征的信号使用较低复杂度的搜索算法,对具有白噪声特征的信号使用较高复杂度的搜索算法。
当然,还可以采用体现输入信号其他特性的特征参数作为类别划分的辅助判决依据,或对分类进行进一步的细化。下面给出一种示例性的类别划分和判决方法:
将输入信号分为四种不同的帧类型,分别是清音帧、浊音帧、通用帧和过渡帧,其中浊音帧和过渡帧也可合并为一种类型。清音帧和通用帧属于具有白噪声特征的类型,浊音帧和过渡帧属于具有周期性特征的类型。
可使用基音周期参数,例如平均幅度差函数(AMDF:Average MagnitudeDifference Function)来评价输入信号的周期特征,初步区分具有周期性特征的类型和具有白噪声特征的类型,当然,也可以单独或辅助使用平均过零率来进行判断,通常周期性信号的平均过零率小于白噪声信号的平均过零率;
在具有白噪声特征的类型中,可使用帧能量来判决清音帧和通用帧,通常清音帧的帧能量低于通用帧的帧能量,可设置阈值进行判断;
在具有周期性特征的类型中,可对AMDF作进一步的分析来区别浊音帧与过渡帧,或使用细分的平均过零率取值范围来区分,当然,若浊音帧与过渡帧合并为一种类型,则可不必细分。
上述类别划分和判决方法仅为示例,实际应用时可根据应用需要以及信号特点等选择适当的特征参数和判决顺序,例如,可先根据帧能量进行分类,再使用体现结构性的特征参数进行划分。
Step3、根据输入信号的特征参数生成待量化的矢量。
此步骤可参照现有方式进行。并且,此步骤与Step2没有顺序上的逻辑关联,可与Step2先后或并列执行。
Step4、根据所确定的输入信号的类型,选择相应的码书搜索算法对待量化的矢量进行码书搜索。
可根据输入信号分类的特点,为各种类型的信号配置与其特点相适应的码书搜索算法。
例如,基于步骤Step2中示例的信号分类方法,可以:
对清音帧信号采用复杂度较高性能较好的码书搜索算法,例如随机码书搜索算法或背景技术中描述的深度优先树搜索算法等;
对通用帧采用复杂度较高性能较好的码书搜索算法,例如背景技术中描述的深度优先树搜索算法;
对浊音帧和/或过渡帧信号采用复杂度较低的码书搜索算法,例如基于脉冲位置替换的码书搜索算法,具体可以是背景技术中描述的全局脉冲替换算法;当然,若浊音帧与过渡帧细分为两个不同的信号类型,也可以分别配置不同的码书搜索算法。
在确定所使用的码书搜索算法之后,即可采用所确定的码书搜索算法对待量化的矢量进行码书搜索。
下面对用于执行上述编码方法的实施例的本发明编码器的实施例进行详细说明,参考图3,包括:
特征参数获取单元101,用于获取输入信号的特征参数。
信号类型确定单元102,用于根据特征参数获取单元101提供的特征参数确定输入信号的类型。
矢量生成单元103,用于根据特征参数获取单元101提供的特征参数生成待量化的矢量。
若干个码书搜索单元1~n,图3中统一标号为104,分别用于提供不同的码书搜索算法。
判决单元105,用于按照信号类型确定单元102确定的输入信号的类型,选择相应的码书搜索单元104对矢量生成单元103生成的待量化的矢量进行码书搜索。
基于前述方法实施例提供的信号分类举例,信号类型确定单元102确定的输入信号的类型可包括具有周期性特征的类型和具有白噪声特征的类型;
此时,码书搜索单元104可包括第一类码书搜索单元和第二类码书搜索单元,其中第一类码书搜索单元提供的码书搜索算法的计算复杂度低于第二类码书搜索单元提供的码书搜索算法的计算复杂度;判决单元105的功能具体为根据具有周期性特征的类型选择第一类码书搜索单元,根据具有白噪声特征的类型选择第二类码书搜索单元。
进一步基于方法实施例提供的信号分类的具体示例,信号类型确定单元102确定的具有白噪声特征的类型可细分为清音帧和通用帧;确定的具有周期性特征的类型可包括浊音帧和/或过渡帧;
此时,码书搜索单元104中的第二类码书搜索单元可包括随机码书搜索单元和深度优先搜索单元;其中,随机码书搜索单元用于提供随机码书搜索算法,深度优先搜索单元用于提供深度优先树搜索算法;码书搜索单元104中的第一类码书搜索单元可包括脉冲替换搜索单元,用于提供基于脉冲位置替换的码书搜索算法;
判决单元105的功能具体为,根据通用帧和/或清音帧选择深度优先搜索单元;根据浊音帧和/或过渡帧选择脉冲替换搜索单元。
上述编码方法或装置实施例采用根据不同的输入信号类型选择不同的码书搜索算法的方法。由于可根据输入信号的各种可能的结构特点选择使用适当的搜索算法,使得某些采用简单计算即可得到满意结果的信号类型能够与适应该类型且计算复杂度较低的搜索算法搭配,以较少的系统资源获得较佳的性能;而同时,其他需要较复杂计算的信号类型也能够被质量较好的搜索算法处理,保证了编码的质量。
为提供更优的编码性能,下面给出一种基于脉冲位置替换的码书搜索算法,该算法可作为具有较低复杂度和较高性能的码书搜索算法用于本发明编码技术中。
码书搜索算法实施例一、参考图4,包括步骤:
A1、获取基础码书,所述基础码书包括N个脉冲在M个轨道上的位置信息,N、M为正整数。
本文中所称基础码书是在进行一轮搜索时所使用的作为搜索基础的初始码书。通常,在进行代数码书脉冲位置搜索前,已根据码率等信息确定了需要搜索的脉冲在各个轨道上的数量分布。例如,以语音量化编码中的脉冲搜索为例,假设64个位置按照表1所示的方式划分为M=4个轨道,分别为T0、T1、T2、T3,则根据码率的不同,脉冲数量的分布可能为:N=4,在每个轨道上分别搜索1个脉冲;N=8,在每个轨道上分别搜索2个脉冲;或N=5,在T0、T1、T2上分别搜索1个脉冲,在T3上搜索2个脉冲等。
确定N个脉冲在M个轨道上的数量分布后,获取基础码书就是获取各个轨道上的各个脉冲的初始位置。可通过各种方式来确定脉冲的初始位置,本码书搜索算法实施例不作限定。例如可以:
①随机选择脉冲所在轨道上的任意位置作为脉冲的初始位置;
②按照某个已知的参考信号在各个轨道上的若干个极值确定相应轨道上的各个脉冲的位置;
③通过某种计算方式来获得。
其中,一种可选的参考信号为“脉冲位置最大似然函数”(也叫脉冲幅度选择信号),该函数可表示为:
其中,d(i)是由待量化的目标信号确定的矢量信号d的各维分量,通常可表现为目标信号与经过预滤波的加权合成滤波器的脉冲响应的卷积;rLTP(i)为长时预测的残差信号r的各维分量;Ed是信号d的能量;Er是信号r的能量;a为比例因子,它控制了参考信号d(i)的依赖程度,对于不同的码率其取值可有所不同。可计算出b(i)在64个位置上的不同取值,分别选择T0~T3中b(i)取值最大的位置作为脉冲的初始位置。
A2、从Ns个脉冲中选择n个搜索脉冲,所述Ns个脉冲为所述N个脉冲的全部或部分,Ns为小于等于N的正整数,n为小于Ns的正整数;固定基础码书中除所述n个搜索脉冲外其他脉冲的位置,将所述n个搜索脉冲的位置分别用所在轨道上的其他位置进行替换得到搜索码书。
能够被选为搜索脉冲的脉冲可以是所有N个脉冲,也可以只是其中的部分,以下将由“能够被选为搜索脉冲的脉冲”组成的集合称为“Ns集合”。从含义上看,N个脉冲中如果有不属于Ns集合的脉冲,表明其位置已是优选的位置,可以不再进行搜索。
从Ns个脉冲中选择n个搜索脉冲,可采用各种选择方法,本码书搜索算法实施例中不作限定。例如可以:
①随机选择n的数值以及搜索脉冲的组合;
假设Ns集合中共有P0、P1、P2共3个脉冲,则可能的选择包括:n=1,搜索脉冲为P1;n=2,搜索脉冲为P0、P2;n=2,搜索脉冲为P1、P2等。
②确定n的数值,n大于等于2,随机选择搜索脉冲的组合;
假设Ns集合中共有P0、P1、P2、P3共4个脉冲,且确定n=3,则可能的选择包括:搜索脉冲为P0、P1、P2;搜索脉冲为P0、P2、P3;搜索脉冲为P0、P1、P3;搜索脉冲为P1、P2、P3。
选好搜索脉冲组合后,即用其所在轨道上的其他位置替换基础码书中的对应位置,得到搜索码书。
假设基础码书共有N=4个脉冲P0、P1、P2、P3,分别位于M=4个轨道T0、T1、T2、T3上,每个轨道上1个脉冲。若在一次搜索过程中选择出的搜索脉冲为P2、P3,则固定基础码书中P0、P1的位置,将P2的位置分别用T2上的其他位置来替换(假设有t2个),将P3的位置分别用T3上的其他位置来替换(假设有t3个),则共可对应(t2+1)×(t3+1)-1=t2×t3+t2+t3个搜索码书。需要说明的是,被搜索的轨道上用于替换的位置可以是该轨道上的全部位置,也可以仅仅包括设定的可选范围中的位置,例如可以根据某个已知的参考信号的取值从被搜索的轨道中选择一部分位置用于替换。
A3、将步骤A2的搜索过程执行K次作为一轮,K为大于等于2的正整数,其中至少一次搜索过程中选择两个或两个以上的搜索脉冲。
步骤A2循环执行的次数K可以是具体设定的一个上限值,当执行K次搜索过程后即认为完成一轮搜索。K值也可以是不确定的,而由某种搜索终结条件来判断一轮搜索的完成与否,例如当所选择的搜索脉冲已遍历Ns集合时,可判断完成一轮搜索。当然,还可以综合上述两种方式,即以搜索终结条件的达成与否来判断一轮搜索是否完成,但同时搜索过程的次数不得大于设定的K值上限,若已达到K值上限则即便搜索终结条件未达成也认为完成一轮搜索。具体规则可根据实际应用的情况设置,本码书搜索算法实施例不作限定。
为了使搜索结果体现脉冲之间的关联关系,本码书搜索算法实施例要求K次搜索过程中的至少一次对两个或两个以上的脉冲进行,此时所选择的搜索脉冲可以分布在相同或不同的轨道上。
A4、按照设定的评价标准从所述基础码书与搜索码书中选择本轮的最佳码书。
对搜索码书与基础码书进行比较评价的过程可与步骤A2搜索的过程同步执行。例如,可设置一个“优选码书”,并将其值初始化为基础码书;然后在获得一个搜索码书后,即与当前的优选码书进行比较评价,若确定该搜索码书优于优选码书,就用该搜索码书替换当前的优选码书;直到全部K次搜索过程结束,所得到的优选码书即为本轮的最佳码书。需要注意的是,各次搜索过程的基础仍然是基础码书,只是比较评价的对象为优选码书。
也可以集中对K次搜索过程的结果进行比较评价。例如,可保存每次搜索过程得到的优选码书,然后集中比较K个优选码书,从中选择本轮的最佳码书。
对搜索码书与基础码书进行比较评价的标准具体可根据应用情况进行确定,本码书搜索算法实施例不作限定。例如,可采用通常用来衡量代数码书质量的代价函数(Qk)来进行比较,一般认为Qk值越大,码书质量越好,因此可选择Qk值大的作为优选码书。
码书搜索算法实施例二、是在码书搜索算法实施例一的基础上提供一种具体的搜索脉冲选择方法,参考图5,包括步骤:
B1、获取基础码书,所述基础码书包括N个脉冲在M个轨道上的位置信息,N、M为正整数。
此步骤可参照码书搜索算法实施例一中的步骤A1执行。
B2、从Ns个脉冲中选择n=n0个搜索脉冲;Ns的含义与码书搜索算法实施例一中的相同,n0为大于等于2的值,且在当前一轮搜索中保持不变;所选择的n0个搜索脉冲是全部CNs n种可能组合中的一种,且不重复选择。
假设Ns集合中共有P0、P1、P2、P3共4个脉冲,分别位于M=4个轨道T0、T1、T2、T3上,每个轨道上1个脉冲。确定n=n0=2,则从Ns集合中选择2个搜索脉冲共有 种组合,包括:P0、P1;P0、P2;P0、P3;P1、P2;P1、P3;P2、P3。可以随机或顺序的从这6种组合中进行选择;为使得每次的选择不重复,可按组合的变化规律依次进行选择,也可保存全部组合或对全部组合进行编号,将选择过的组合(或编号)删除。
B3、将步骤B2的搜索过程执行K次作为一轮, 其中至少一次搜索过程中选择两个或两个以上的搜索脉冲。
由于n值固定,且每次选取的搜索脉冲组合均不重复,因此最多搜索CNs n次就可以遍历Ns集合中的全部可能组合。当然,也可以限制K值上限小于CNs n,此时将不完全遍历全部可能组合,但所选择的搜索脉冲仍可能遍历Ns集合。
B4、按照设定的评价标准从所述基础码书与搜索码书中选择本轮的最佳码书。
此步骤可参照码书搜索算法实施例一中的步骤A4执行。
码书搜索算法实施例三、是在码书搜索算法实施例一和二的基础上提供一种循环多轮执行的方法,参考图6所示,包括步骤:
C1、获取基础码书,所述基础码书包括N个脉冲在M个轨道上的位置信息,N、M为正整数。
此步骤可参照码书搜索算法实施例一中的步骤A1执行。
C2、Ns=N,执行一轮K次搜索,获得本轮的最佳码书。
此步骤可参照码书搜索算法实施例一中的步骤A2~A4执行,或参照码书搜索算法实施例二中的步骤B2~B4执行。由于Ns=N,搜索脉冲可在基础码书的全部脉冲中选取。对于码书搜索算法实施例二中的方法而言,在不同的轮中,确定的n值可以相同也可以不同。
C3、判断搜索的轮数G是否达到设定的G值上限,若是则执行步骤C5,若否则执行步骤C4。
C4、以所述最佳码书替换原有基础码书作为新的基础码书,返回步骤C2继续搜索新一轮的最佳码书。
C5、获取本轮的最佳码书作为最终最佳码书。
码书搜索算法实施例四、是在码书搜索算法实施例一和二的基础上提供另一种循环多轮执行的方法,参考图7,包括步骤:
D1、获取基础码书,所述基础码书包括N个脉冲在M个轨道上的位置信息,N、M为正整数。
此步骤可参照码书搜索算法实施例一中的步骤A1执行。
D2、执行一轮K次搜索,获得本轮的最佳码书。
此步骤可参照码书搜索算法实施例一中的步骤A2~A4执行,或参照码书搜索算法实施例二中的步骤B2~B4执行。在第一轮搜索中可设置Ns=N。
D3、判断搜索的轮数G是否达到设定的G值上限,或者判断下一轮的Ns集合是否为空,若是则执行步骤D5,若否则执行步骤D4。
在本码书搜索算法实施例中,每一轮的Ns集合可根据上一轮的搜索结果来确定,具体确定方式见步骤D4。若Ns集合为空,则可认为搜索完成;或者也可以根据设定的G值上限在Ns集合非空时判断搜索完成。
D4、以所述最佳码书替换原有基础码书作为新的基础码书,以获得所述最佳码书的那次搜索过程中位置被固定且属于原有Ns个脉冲的脉冲作为新的Ns个脉冲,返回步骤D2继续搜索新一轮的最佳码书。
假设第一轮搜索中Ns=N=4,Ns集合中共有P0、P1、P2、P3共4个脉冲,分别位于M=4个轨道T0、T1、T2、T3上,每个轨道上1个脉冲。确定第一轮n=n0=2,采用码书搜索算法实施例二中的遍历全部搜索脉冲组合的方式进行K=6次搜索。各次组合分别:P0、P1;P0、P2;P0、P3;P1、P2;P1、P3;P2、P3。假设第一轮获得的最佳码书为采用P0、P3组合时搜索得到的,则可知被固定的,且属于第一轮的Ns集合的脉冲为P1、P2,因此第二轮的Ns集合即为P1、P2。若确定第二轮n=n0=2,则需进行K=1次搜索,显然第二轮获得的最佳码书为采用P1、P2组合时搜索得到的,该次搜索被固定的脉冲为P0、P3,但显然该两个脉冲均不属于第二轮的Ns集合,因此可判断第三轮的Ns集合为空,从而确定搜索完成。
D5、获取本轮的最佳码书作为最终最佳码书。
码书搜索算法实施例五、是在前述各个码书搜索算法实施例的基础上提供一种初始的基础码书的具体获取方法,参考图8,包括步骤:
E1、获取N个脉冲在M个轨道上的数量分布。
即根据码率等相关信息,确定需要搜索的脉冲的总数量N以及各个轨道上分布的脉冲数量。
E2、按照已知的参考信号在各个轨道上的若干个极值,确定各个轨道的集中搜索范围,所述集中搜索范围至少包括该轨道上的一个位置。
参考信号可选脉冲位置最大似然函数b(i),可计算出b(i)在全部脉冲位置上的不同取值,分别选择各个轨道上b(i)取值最大的若干个位置作为各个轨道的集中搜索范围。每个轨道的集中搜索范围所包含的位置数目可以相同也可以不同。
假设共有M=4个轨道T0、T1、T2、T3上,每个轨道上的位置划分如表1所示,将每个轨道上的脉冲位置重新按照b(i)的绝对值从大到小的顺序进行排序。假设经过排序后的轨道位置为:
{T0,T1,T2,T3}=
{
{0,36,32,4,40,28,16,8,20,52,44,48,12,56,24,60},
{1,33,37,5,29,41,17,9,49,21,53,25,13,45,57,61},
{34,2,38,30,6,18,42,50,26,14,10,22,54,46,58,62},
{35,3,31,39,7,19,27,51,15,43,55,47,23,11,59,63}
}
则,若选取每个轨道上b(i)的绝对值最大的4个位置为该轨道的集中搜索范围,可得基础码书的集中搜索范围为:
{
{0,36,32,4},
{1,33,37,5},
{34,2,38,30},
{35,3,31,39}
}
E3、在所述M个集中搜索范围中按照N个脉冲的数量分布进行全搜索,按照设定的评价标准从所有可能的位置组合中选择基础码书。
由于集中搜索范围通常较小,因此可在其中进行全搜索以获得较佳的基础码书。例如,假设基础码书共有N=4个脉冲P0、P1、P2、P3,分别位于M=4个轨道T0、T1、T2、T3上,每个轨道上1个脉冲;则对于步骤E2中给出的示例几种搜索范围,共需要搜索4×4×4×4=256次即可获得基础码书。
E4、基于所述基础码书进行第一轮K次搜索,获得本轮的最佳码书。
此步骤可参照码书搜索算法实施例一中的步骤A2~A4执行,或参照码书搜索算法实施例二中的步骤B2~B4执行。
为更好的理解上述码书搜索算法实施例,下面给出一个计算实例。
假设共有N=4个脉冲P0、P1、P2、P3,分别位于M=4个轨道T0、T1、T2、T3上,每个轨道上1个脉冲,每个轨道上的位置划分如表1所示;搜索步骤包括:
①按照码书搜索算法实施例五提供的初始基础码书的计算方法,从每个轨道包括4个位置的集中搜索范围中全搜索出初始的基础码书,假设为{32,33,2,35}。需要的搜索次数为4×4×4×4=256次。
②开始第一轮搜索,确定第一轮n=n0=2,采用码书搜索算法实施例二中的遍历全部搜索脉冲组合的方式进行K=6次搜索。每次搜索分别在一个轨道的4个位置和另一个轨道的12个位置中进行(所统计位置数已包括基础码书中的脉冲位置,选择轨道上用于搜索的位置可采用和确定基础码书的集中搜索范围类似的方法)。假定第一轮搜索得到的最佳码书为{32,33,6,35},是在固定脉冲为P0、P1时得到该最佳码书的。需要的搜索次数为6×(4×12)=288次。
③开始第二轮搜索,确定第二轮n=n0=2,固定P2、P3的位置{6,35},对P0、P1组合进行K=1次搜索。该次搜索分别在T0、T1的4个位置中进行。假定第二轮搜索得到的最佳码书为{32,33,6,35}。需要的搜索次数为4×4=16次。
④判断搜索脉冲集合Ns为空,即所有基础码书脉冲的位置都搜索完成,因此最终最佳码书即为{32,33,6,35}。总共需要的搜索次数为256+288+16=560次。
将上述计算例中的方法应用于对由24个男生序列和24个女生序列组成的测试序列进行语音编码,将编码结果与现有深度优先树搜索方法的编码结果进行客观语音质量比较,两种方法获得的语音质量相当。而上述方法的搜索次数为560次,远小于深度优先树搜索方法的搜索次数768次。
通过上述码书搜索算法实施例可以看出,本发明提供的码书搜索算法实施例通过对不同的脉冲组合进行替换搜索的方法选择最佳码书,且其中至少一次搜索对多个脉冲进行,由于最佳码书从多个不同组合的替换中选择获得,能够在尽可能保证搜索的全局性的前提下减少搜索次数;而且由于至少一次搜索对多个脉冲进行,使得脉冲之间的相关性对搜索结果的影响能够被考虑到,进一步保证了搜索结果的质量。若进一步采用在一轮搜索中固定n值且逐次选取不同搜索脉冲组合的方法,优化了搜索脉冲的选取方式,使得搜索过程更加有效,若进一步能遍历搜索脉冲的全部可能组合,能够进一步增强搜索结果的全局意义,提高搜索结果的质量。若进一步采用多轮搜索的方法获取最终最佳码书,能进一步提高搜索结果的质量。当然,也可以仅在一轮搜索中使用码书搜索算法实施例一或二提供的搜索方法,而在之前或之后的其他轮中采用其他搜索方法。若进一步在采用多轮搜索的方法获取最终最佳码书时,根据上一轮的搜索结果缩小下一轮搜索中Ns集合的范围,能有效降低计算量。若进一步采用集中搜索的方法获取初始的基础码书,能够得到较高质量的基础码书,进一步提高搜索结果的质量。
下面对本发明编码方法和编码器实施例的应用效果在某基于分类的编码器中进行实验评价,该编码器对信号进行了分类,分为清音、通用、浊音和过渡类,但是所有类型的输入信号采用单一的固定码书搜索算法进行搜索。实验中,本发明的方法对清音帧采用随机码书搜索算法,通用帧采用深度优先搜索方法,浊音帧/过渡帧采用本发明码书搜索算法的计算例中使用的方法。实验表明,根据对不同声音样本在不同采样率下的处理结果进行综合比较:
①本发明实施例编码方法的加权分段信噪比参数平均比原编码器中的方法提高了0.0245左右;
②本发明实施例编码方法的算法复杂度,以每秒百万次操作(MOPS:Million Operations Per Second)计,平均比原编码器中的方法降低了0.3185MOPS左右;
③本发明实施例编码方法的语音质量感知评价(PESQ:PerceptualEvaluation of Speech Quality)指标平均比原编码器中的方法下降了0.00127个平均意见分(MOS:Mean Opinion Score),约为万分之三左右,几乎没有区别。
综上可以看出,本发明实施例编码方法与原编码器中的方法相比在降低复杂度和提高系统性能方面都有一定的优势。
本领域普通技术人员可以理解上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
以上对本发明所提供的编码方法及编码器进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (12)
1、一种编码方法,其特征在于,包括:
获取输入信号的特征参数;
根据所述特征参数确定输入信号的类型;
根据所述特征参数生成待量化的矢量;
根据所确定的输入信号的类型,选择相应的码书搜索算法对所述待量化的矢量进行码书搜索。
2、根据权利要求1所述的编码方法,其特征在于:所述输入信号的类型包括具有周期性特征的类型和具有白噪声特征的类型;
输入信号为具有周期性特征的类型时使用的码书搜索算法为第一类码书搜索算法,输入信号为具有白噪声特征的类型时使用的码书搜索算法为第二类码书搜索算法;
所述第一类码书搜索算法的计算复杂度低于所述第二类码书搜索算法的计算复杂度。
3、根据权利要求2所述的编码方法,其特征在于:所述具有白噪声特征的类型包括通用帧和/或清音帧;
所述通用帧和/或清音帧所使用的码书搜索算法为深度优先树搜索算法。
4、根据权利要求2或3所述的编码方法,其特征在于:所述具有周期性特征的类型包括浊音帧和/或过渡帧;
所述浊音帧和/或过渡帧所使用的码书搜索算法为基于脉冲位置替换的码书搜索算法。
5、根据权利要求4所述的编码方法,其特征在于,所述基于脉冲位置替换的码书搜索算法包括步骤:
获取基础码书,所述基础码书包括N个脉冲在M个轨道上的位置信息,N、M为正整数;
从Ns个脉冲中选择n个搜索脉冲,所述Ns个脉冲为所述N个脉冲的全部或部分,Ns为小于等于N的正整数,n为小于Ns的正整数;固定基础码书中除所述n个搜索脉冲外其他脉冲的位置,将所述n个搜索脉冲的位置分别用所在轨道上的其他位置进行替换得到搜索码书;
将上述搜索过程执行K次作为一轮,K为大于等于2的正整数,其中至少一次搜索过程中选择两个或两个以上的搜索脉冲;
按照设定的评价标准从所述基础码书与搜索码书中选择本轮的最佳码书。
6、根据权利要求5所述的编码方法,其特征在于:
所述从Ns个脉冲中选择n个搜索脉冲为,确定n的数值,n大于等于2,在每次搜索过程中不重复地,顺序或随机地选择全部CNs n种可能组合中的一种;
所述搜索过程的执行次数为,
7、根据权利要求5所述的编码方法,其特征在于,还包括:
以所述最佳码书替换原有基础码书作为新的基础码书,以获得所述最佳码书的那次搜索过程中位置被固定且属于原有Ns个脉冲的脉冲作为新的Ns个脉冲,继续搜索新一轮的最佳码书;
重复执行上述以最佳码书替换原有基础码书的过程,直到Ns=0或搜索的轮数G达到设定的G值上限。
8、根据权利要求5所述的编码方法,其特征在于,所述获取基础码书的步骤包括:
获取N个脉冲在M个轨道上的数量分布;
按照已知的参考信号在各个轨道上的若干个极值,确定各个轨道的集中搜索范围,所述集中搜索范围至少包括该轨道上的一个位置;
在所述M个集中搜索范围中按照N个脉冲的数量分布进行全搜索,按照设定的评价标准从所有可能的位置组合中选择基础码书。
9、一种编码器,其特征在于,包括:
特征参数获取单元,用于获取输入信号的特征参数;
信号类型确定单元,用于根据所述特征参数确定输入信号的类型;
矢量生成单元,用于根据所述特征参数生成待量化的矢量;
至少两个码书搜索单元,用于提供不同的码书搜索算法;
判决单元,用于根据所述信号类型确定单元确定的输入信号的类型,选择相应的码书搜索单元对所述待量化的矢量进行码书搜索。
10、根据权利要求9所述的编码器,其特征在于:
所述信号类型确定单元确定的输入信号的类型包括具有周期性特征的类型和具有白噪声特征的类型;
所述码书搜索单元包括第一类码书搜索单元和第二类码书搜索单元,所述第一类码书搜索单元提供的码书搜索算法的计算复杂度低于所述第二类码书搜索单元提供的码书搜索算法的计算复杂度;
所述判决单元用于根据输入信号的类型选择相应的码书搜索单元,是用于根据具有周期性特征的类型选择第一类码书搜索单元,根据具有白噪声特征的类型选择第二类码书搜索单元。
11、根据权利要求10所述的编码器,其特征在于:
所述信号类型确定单元确定的具有白噪声特征的类型包括通用帧和/或清音帧;
所述第二类码书搜索单元包括深度优先搜索单元,用于提供深度优先树搜索算法;
所述判决单元用于根据具有白噪声特征的类型选择第二类码书搜索单元,是用于根据通用帧和/或清音帧选择所述深度优先搜索单元。
12、根据权利要求10所述的编码器,其特征在于:
所述信号类型确定单元确定的具有周期性特征的类型包括浊音帧和/或过渡帧;
所述第一类码书搜索单元包括脉冲替换搜索单元,用于提供基于脉冲位置替换的码书搜索算法;
所述判决单元用于根据具有周期性特征的类型选择第一类码书搜索单元,是用于根据浊音帧和/或过渡帧选择所述脉冲替换搜索单元。
Priority Applications (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200710165784A CN100578619C (zh) | 2007-11-05 | 2007-11-05 | 编码方法和编码器 |
PCT/CN2008/072371 WO2009059513A1 (fr) | 2007-11-05 | 2008-09-16 | Procédé de codage, codeur et support lisible par ordinateur |
AT08800868T ATE533147T1 (de) | 2007-11-05 | 2008-09-16 | Kodierungsverfahren, kodierer und computerlesbares medium |
EP08800868A EP2110808B1 (en) | 2007-11-05 | 2008-09-16 | A coding method, an encoder and a computer readable medium |
KR1020097012209A KR101211922B1 (ko) | 2007-11-05 | 2008-09-16 | 부호화 방법, 인코더, 및 컴퓨터로 판독 가능한 매체 |
JP2009539594A JP5532304B2 (ja) | 2007-11-05 | 2008-09-16 | 符号化方法、符号化器、および、コンピュータ読み取り可能な媒体 |
US12/481,060 US8600739B2 (en) | 2007-11-05 | 2009-06-09 | Coding method, encoder, and computer readable medium that uses one of multiple codebooks based on a type of input signal |
JP2013019667A JP2013122612A (ja) | 2007-11-05 | 2013-02-04 | 符号化方法、符号化器、および、コンピュータ読み取り可能な媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200710165784A CN100578619C (zh) | 2007-11-05 | 2007-11-05 | 编码方法和编码器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101303857A true CN101303857A (zh) | 2008-11-12 |
CN100578619C CN100578619C (zh) | 2010-01-06 |
Family
ID=40113736
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200710165784A Active CN100578619C (zh) | 2007-11-05 | 2007-11-05 | 编码方法和编码器 |
Country Status (7)
Country | Link |
---|---|
US (1) | US8600739B2 (zh) |
EP (1) | EP2110808B1 (zh) |
JP (2) | JP5532304B2 (zh) |
KR (1) | KR101211922B1 (zh) |
CN (1) | CN100578619C (zh) |
AT (1) | ATE533147T1 (zh) |
WO (1) | WO2009059513A1 (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010135975A1 (zh) * | 2009-05-27 | 2010-12-02 | 华为技术有限公司 | 一种生成格型矢量量化码书的方法及装置 |
CN102243876A (zh) * | 2010-05-12 | 2011-11-16 | 华为技术有限公司 | 预测残差信号的量化编码方法及装置 |
CN103377653A (zh) * | 2012-04-20 | 2013-10-30 | 展讯通信(上海)有限公司 | 语音编码中代数码表的搜索方法及装置,语音编码方法 |
CN104254886A (zh) * | 2011-12-21 | 2014-12-31 | 华为技术有限公司 | 自适应编码浊音语音的基音周期 |
CN105355194A (zh) * | 2015-10-22 | 2016-02-24 | 百度在线网络技术(北京)有限公司 | 语音合成方法和装置 |
CN106605263A (zh) * | 2014-07-29 | 2017-04-26 | 奥兰吉公司 | 确定用于编码lpd/fd过渡帧的预算 |
CN108417206A (zh) * | 2018-02-27 | 2018-08-17 | 四川云淞源科技有限公司 | 基于大数据的信息高速处理方法 |
WO2023272516A1 (en) * | 2021-06-29 | 2023-01-05 | Siemens Aktiengesellschaft | A method, device, system and storage medium for scheme recommendation |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070136054A1 (en) * | 2005-12-08 | 2007-06-14 | Hyun Woo Kim | Apparatus and method of searching for fixed codebook in speech codecs based on CELP |
EP2827327B1 (en) | 2007-04-29 | 2020-07-29 | Huawei Technologies Co., Ltd. | Method for Excitation Pulse Coding |
CN100578619C (zh) | 2007-11-05 | 2010-01-06 | 华为技术有限公司 | 编码方法和编码器 |
CN102299760B (zh) | 2010-06-24 | 2014-03-12 | 华为技术有限公司 | 脉冲编解码方法及脉冲编解码器 |
JP6385433B2 (ja) * | 2013-10-18 | 2018-09-05 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | オーディオ信号のスペクトルのスペクトル係数のコード化 |
FR3013496A1 (fr) * | 2013-11-15 | 2015-05-22 | Orange | Transition d'un codage/decodage par transformee vers un codage/decodage predictif |
US10878831B2 (en) | 2017-01-12 | 2020-12-29 | Qualcomm Incorporated | Characteristic-based speech codebook selection |
CN117789740B (zh) * | 2024-02-23 | 2024-04-19 | 腾讯科技(深圳)有限公司 | 音频数据处理方法、装置、介质、设备及程序产品 |
Family Cites Families (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5202953A (en) * | 1987-04-08 | 1993-04-13 | Nec Corporation | Multi-pulse type coding system with correlation calculation by backward-filtering operation for multi-pulse searching |
US5701392A (en) | 1990-02-23 | 1997-12-23 | Universite De Sherbrooke | Depth-first algebraic-codebook search for fast coding of speech |
US5754976A (en) * | 1990-02-23 | 1998-05-19 | Universite De Sherbrooke | Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech |
CA2010830C (en) * | 1990-02-23 | 1996-06-25 | Jean-Pierre Adoul | Dynamic codebook for efficient speech coding based on algebraic codes |
EP0753841B1 (en) * | 1990-11-02 | 2002-04-10 | Nec Corporation | Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits |
US5187745A (en) * | 1991-06-27 | 1993-02-16 | Motorola, Inc. | Efficient codebook search for CELP vocoders |
CA2141181A1 (en) | 1994-09-21 | 1996-03-22 | Kimberly-Clark Worldwide, Inc. | Wet-resilient webs |
JPH08179796A (ja) | 1994-12-21 | 1996-07-12 | Sony Corp | 音声符号化方法 |
US5822724A (en) * | 1995-06-14 | 1998-10-13 | Nahumi; Dror | Optimized pulse location in codebook searching techniques for speech processing |
US6393391B1 (en) * | 1998-04-15 | 2002-05-21 | Nec Corporation | Speech coder for high quality at low bit rates |
JP3144284B2 (ja) * | 1995-11-27 | 2001-03-12 | 日本電気株式会社 | 音声符号化装置 |
JP3299099B2 (ja) * | 1995-12-26 | 2002-07-08 | 日本電気株式会社 | 音声符号化装置 |
JP3531342B2 (ja) * | 1996-03-29 | 2004-05-31 | ソニー株式会社 | 音声処理装置および音声処理方法 |
US6480822B2 (en) * | 1998-08-24 | 2002-11-12 | Conexant Systems, Inc. | Low complexity random codebook structure |
JP3180786B2 (ja) * | 1998-11-27 | 2001-06-25 | 日本電気株式会社 | 音声符号化方法及び音声符号化装置 |
JP4173940B2 (ja) * | 1999-03-05 | 2008-10-29 | 松下電器産業株式会社 | 音声符号化装置及び音声符号化方法 |
EP1221694B1 (en) | 1999-09-14 | 2006-07-19 | Fujitsu Limited | Voice encoder/decoder |
US6510407B1 (en) * | 1999-10-19 | 2003-01-21 | Atmel Corporation | Method and apparatus for variable rate coding of speech |
CA2327041A1 (en) | 2000-11-22 | 2002-05-22 | Voiceage Corporation | A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals |
US7065338B2 (en) * | 2000-11-27 | 2006-06-20 | Nippon Telegraph And Telephone Corporation | Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound |
KR100464369B1 (ko) * | 2001-05-23 | 2005-01-03 | 삼성전자주식회사 | 음성 부호화 시스템의 여기 코드북 탐색 방법 |
JP2002349429A (ja) * | 2001-05-28 | 2002-12-04 | Toyota Industries Corp | 可変容量型圧縮機及びその製造方法 |
DE10140507A1 (de) * | 2001-08-17 | 2003-02-27 | Philips Corp Intellectual Pty | Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers |
KR100446630B1 (ko) * | 2002-05-08 | 2004-09-04 | 삼성전자주식회사 | 음성신호에 대한 벡터 양자화 및 역 벡터 양자화 장치와그 방법 |
US7363218B2 (en) * | 2002-10-25 | 2008-04-22 | Dilithium Networks Pty. Ltd. | Method and apparatus for fast CELP parameter mapping |
KR100463559B1 (ko) * | 2002-11-11 | 2004-12-29 | 한국전자통신연구원 | 대수 코드북을 이용하는 켈프 보코더의 코드북 검색방법 |
KR100463418B1 (ko) * | 2002-11-11 | 2004-12-23 | 한국전자통신연구원 | Celp 음성 부호화기에서 사용되는 가변적인 고정코드북 검색방법 및 장치 |
KR100463419B1 (ko) * | 2002-11-11 | 2004-12-23 | 한국전자통신연구원 | 적은 복잡도를 가진 고정 코드북 검색방법 및 장치 |
US7249014B2 (en) * | 2003-03-13 | 2007-07-24 | Intel Corporation | Apparatus, methods and articles incorporating a fast algebraic codebook search technique |
KR100556831B1 (ko) * | 2003-03-25 | 2006-03-10 | 한국전자통신연구원 | 전역 펄스 교체를 통한 고정 코드북 검색 방법 |
CN1240050C (zh) | 2003-12-03 | 2006-02-01 | 北京首信股份有限公司 | 一种用于语音编码的固定码本快速搜索方法 |
CN1760905A (zh) | 2004-10-16 | 2006-04-19 | 鸿富锦精密工业(深圳)有限公司 | 电子竞标系统及方法 |
CN100498934C (zh) * | 2005-10-31 | 2009-06-10 | 连展科技(天津)有限公司 | 一种新型的快速固定码本搜索方法 |
CN100416652C (zh) * | 2005-10-31 | 2008-09-03 | 连展科技(天津)有限公司 | 增强的amr编码器快速固定码本搜索方法 |
US20070136054A1 (en) * | 2005-12-08 | 2007-06-14 | Hyun Woo Kim | Apparatus and method of searching for fixed codebook in speech codecs based on CELP |
KR100795727B1 (ko) | 2005-12-08 | 2008-01-21 | 한국전자통신연구원 | Celp기반의 음성 코더에서 고정 코드북 검색 장치 및방법 |
CN100578619C (zh) | 2007-11-05 | 2010-01-06 | 华为技术有限公司 | 编码方法和编码器 |
JP5242231B2 (ja) * | 2008-04-24 | 2013-07-24 | 三菱電機株式会社 | 電位生成回路および液晶表示装置 |
-
2007
- 2007-11-05 CN CN200710165784A patent/CN100578619C/zh active Active
-
2008
- 2008-09-16 AT AT08800868T patent/ATE533147T1/de active
- 2008-09-16 JP JP2009539594A patent/JP5532304B2/ja active Active
- 2008-09-16 EP EP08800868A patent/EP2110808B1/en active Active
- 2008-09-16 WO PCT/CN2008/072371 patent/WO2009059513A1/zh active Application Filing
- 2008-09-16 KR KR1020097012209A patent/KR101211922B1/ko active IP Right Grant
-
2009
- 2009-06-09 US US12/481,060 patent/US8600739B2/en active Active
-
2013
- 2013-02-04 JP JP2013019667A patent/JP2013122612A/ja active Pending
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010135975A1 (zh) * | 2009-05-27 | 2010-12-02 | 华为技术有限公司 | 一种生成格型矢量量化码书的方法及装置 |
US8489395B2 (en) | 2009-05-27 | 2013-07-16 | Huawei Technologies Co., Ltd. | Method and apparatus for generating lattice vector quantizer codebook |
CN102243876A (zh) * | 2010-05-12 | 2011-11-16 | 华为技术有限公司 | 预测残差信号的量化编码方法及装置 |
CN102243876B (zh) * | 2010-05-12 | 2013-08-07 | 华为技术有限公司 | 预测残差信号的量化编码方法及装置 |
CN104254886A (zh) * | 2011-12-21 | 2014-12-31 | 华为技术有限公司 | 自适应编码浊音语音的基音周期 |
CN104254886B (zh) * | 2011-12-21 | 2018-08-14 | 华为技术有限公司 | 自适应编码浊音语音的基音周期 |
CN103377653A (zh) * | 2012-04-20 | 2013-10-30 | 展讯通信(上海)有限公司 | 语音编码中代数码表的搜索方法及装置,语音编码方法 |
CN103377653B (zh) * | 2012-04-20 | 2016-03-16 | 展讯通信(上海)有限公司 | 语音编码中代数码表的搜索方法及装置,语音编码方法 |
CN106605263A (zh) * | 2014-07-29 | 2017-04-26 | 奥兰吉公司 | 确定用于编码lpd/fd过渡帧的预算 |
CN105355194A (zh) * | 2015-10-22 | 2016-02-24 | 百度在线网络技术(北京)有限公司 | 语音合成方法和装置 |
CN108417206A (zh) * | 2018-02-27 | 2018-08-17 | 四川云淞源科技有限公司 | 基于大数据的信息高速处理方法 |
WO2023272516A1 (en) * | 2021-06-29 | 2023-01-05 | Siemens Aktiengesellschaft | A method, device, system and storage medium for scheme recommendation |
Also Published As
Publication number | Publication date |
---|---|
JP5532304B2 (ja) | 2014-06-25 |
WO2009059513A1 (fr) | 2009-05-14 |
JP2010511901A (ja) | 2010-04-15 |
EP2110808A4 (en) | 2010-01-13 |
US8600739B2 (en) | 2013-12-03 |
EP2110808A1 (en) | 2009-10-21 |
CN100578619C (zh) | 2010-01-06 |
JP2013122612A (ja) | 2013-06-20 |
US20090248406A1 (en) | 2009-10-01 |
ATE533147T1 (de) | 2011-11-15 |
EP2110808B1 (en) | 2011-11-09 |
KR20090086102A (ko) | 2009-08-10 |
KR101211922B1 (ko) | 2012-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100578619C (zh) | 编码方法和编码器 | |
CN101578508B (zh) | 用于对语音信号中的过渡帧进行编码的方法和设备 | |
CN101145345B (zh) | 音频分类方法 | |
CN105261357B (zh) | 基于统计模型的语音端点检测方法及装置 | |
CN101842833A (zh) | 语音和音频编码中快速代数码本搜索的方法和设备 | |
KR100556831B1 (ko) | 전역 펄스 교체를 통한 고정 코드북 검색 방법 | |
CN102446506A (zh) | 音频信号的分类识别方法及装置 | |
CN103392203A (zh) | 用于在码激励线性预测编解码器中量化激励的自适应和固定贡献的增益的设备和方法 | |
CN110349597A (zh) | 一种语音检测方法及装置 | |
CN103370880A (zh) | 编码方法、解码方法、编码装置、解码装置、程序以及记录介质 | |
US7596493B2 (en) | System and method for supporting multiple speech codecs | |
CN107077857A (zh) | 对线性预测系数量化的方法和装置及解量化的方法和装置 | |
CN100530357C (zh) | 固定码书搜索方法及搜索器 | |
CN1145144C (zh) | 对背景噪音信号进行高质量解码的语音解码器 | |
Kumar | Real‐time implementation and performance evaluation of speech classifiers in speech analysis‐synthesis | |
KR101862982B1 (ko) | LPC-10e 보코더에서 DNN을 이용한 유무성음 판별 방법 | |
CN1271925A (zh) | 用于码激励线性预测语音编码的整形的固定码簿搜索 | |
CN100412948C (zh) | 语音编码器中搜寻语音讯号的编码向量的搜寻系统及方法 | |
CN100578620C (zh) | 固定码书搜索方法及搜索器 | |
CN101609681A (zh) | 编码方法、编码器、解码方法及解码器 | |
Zhou et al. | Learning and Modeling Unit Embeddings for Improving HMM-based Unit Selection Speech Synthesis. | |
Amada et al. | CELP speech coding based on an adaptive pulse position codebook | |
CN107210042A (zh) | 编码装置、解码装置、它们的方法、程序以及记录介质 | |
Kumari et al. | An efficient algebraic codebook structure for CS-ACELP based speech codecs | |
CN117975130A (zh) | 一种基于自熵过滤与伪标签生成的无数据网络量化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |