CN1495704A - 声音编码装置以及声音解码装置 - Google Patents
声音编码装置以及声音解码装置 Download PDFInfo
- Publication number
- CN1495704A CN1495704A CNA031410227A CN03141022A CN1495704A CN 1495704 A CN1495704 A CN 1495704A CN A031410227 A CNA031410227 A CN A031410227A CN 03141022 A CN03141022 A CN 03141022A CN 1495704 A CN1495704 A CN 1495704A
- Authority
- CN
- China
- Prior art keywords
- sound source
- sound
- repetition period
- mentioned
- driving
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000006978 adaptation Effects 0.000 claims description 124
- 230000008676 import Effects 0.000 claims description 44
- 238000007792 addition Methods 0.000 claims description 16
- 238000011156 evaluation Methods 0.000 abstract description 30
- 230000003044 adaptive effect Effects 0.000 abstract 1
- 230000035807 sensation Effects 0.000 description 107
- 238000004364 calculation method Methods 0.000 description 43
- 230000000694 effects Effects 0.000 description 37
- 230000004044 response Effects 0.000 description 32
- 230000000052 comparative effect Effects 0.000 description 21
- 239000013598 vector Substances 0.000 description 21
- 238000001228 spectrum Methods 0.000 description 17
- 230000009471 action Effects 0.000 description 15
- 230000001052 transient effect Effects 0.000 description 14
- 238000000034 method Methods 0.000 description 11
- 238000000926 separation method Methods 0.000 description 11
- 230000008901 benefit Effects 0.000 description 10
- 238000012545 processing Methods 0.000 description 10
- 239000002131 composite material Substances 0.000 description 9
- 230000008569 process Effects 0.000 description 8
- 238000011282 treatment Methods 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 5
- 238000001914 filtration Methods 0.000 description 5
- 238000012937 correction Methods 0.000 description 4
- 238000011002 quantification Methods 0.000 description 4
- 239000002699 waste material Substances 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000001976 improved effect Effects 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 101100433727 Caenorhabditis elegans got-1.2 gene Proteins 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 230000002787 reinforcement Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 210000001260 vocal cord Anatomy 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 241001070941 Castanea Species 0.000 description 1
- 235000014036 Castanea Nutrition 0.000 description 1
- 240000008415 Lactuca sativa Species 0.000 description 1
- 101100489867 Mus musculus Got2 gene Proteins 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Analogue/Digital Conversion (AREA)
- Radar Systems Or Details Thereof (AREA)
- Position Fixing By Use Of Radio Waves (AREA)
Abstract
周期预选装置(23)用多个常数乘以适应声源的重复周期,求出多个驱动声源的候选重复周期,选择预定个数的驱动声源的候选重复周期。驱动声源编码器(29)对预定个数的驱动声源的候选重复周期的每一个,输出编码畸变最小的声源位置和极性以及这时的编码畸变的评价值。周期编码器(28)对每隔各重复周期的编码畸变的评价值进行比较,根据比较结果选择驱动声源的候选重复周期,输出选择信息、声源位置和极性。
Description
本申请为以下申请的分案申请:
申请日为2000年11月7日、申请号为00132922.7、发明名称为“声音编码装置以及声音解码装置”。
技术领域
本发明涉及把数字声音信号压缩成具有较少信息量的声音编码装置以及涉及对由声音编码装置产生的声音编码进行解码,使数字声音信号再生的声音解码装置。
背景技术
在传统的众多声音编码装置及声音解码装置,把输入声音分为频谱包络信息和声源,按预定长区间的帧单位对其编码,产生声音编码,对该声音编码进行解码,通过用合成滤波器组合频谱包络信息和声源得到解码声音。作为最典型的声音编码装置及声音解码装置应用编码驱动线性预测编码方式(CELP:Code-Excited Linear Prediction)。
图14是示出传统的CELP系声音编码装置结构的方框图,图15是示出传统的CELP系声音解码装置结构的方框图。
在图14,1是输入声音,2是线性预测分析装置,3是线性预测系数编码器,4是适应声源编码器,5是驱动声源编码器,6是增益编码器,7是多路转换器,8是声音编码。此外,在图15,9是分离器,10是线性预测系数解码器,11是适应声源解码器,12是驱动声源解码器,13是增益解码器,14是合成滤波器,15是输出声音。
其次说明其动作。
在该传统的声音编码装置及声音解码装置,以5~50ms量级作为一帧,按帧单位进行处理。首先,在图14所示的声音编码装置,输入声音1输入到线性预测分析装置2和适应声源编码器4和增益编码器6。线性预测分析装置2对输入声音1进行分析,以便提取作为声音频谱包络信息的线性预测系数。线性预测系数编码器3对该线预测系数进行编码,把该编码输出到多路转换器7,同时为了声源的编码输出量化的线性预测系数。
适应声源编码器4把过去的预定长的声源(信号)作为适应声源编码册储存,对于用内部产生数比特的2进位数值表示的多个适应声源编码的每一个产生周期重复过去声源的时序向量。其次对产生的多个时序向量乘以适当的增益,并允许它在用从线性预测系数编码器3输出的量化的线性预测系数的合成滤波器内通过,以产生暂时的合成音。适应声源编码器4计算并检查在暂时合成声音和输入声音1之间的距离,从上述多个适应声源编码中选择一个使该距离最小的适应声源编码,输出到多路转换器7,同时,把与选择的适应声源编码对应的时序向量作为适应声源输出到驱动声源编码器5和增益编码器6。此外,把输入声音1或从输入声音1减去通过适应声源的合成音得到的信号作为应编码的信号输出到驱动声源编码器5。
驱动声源编码器5首先与用内部产生的数比特的2进位数值表示的各驱动声源编码对应,从内部储存的驱动声源编码册顺序读出时序向量。其次对读出的各时序向量和从适应声源编码器4读出的适应声源乘以适当的增益并相加,在用从线性预测系数编码器3输出的量化线性预测系数的合成滤波器内通过,以获得暂时的合成音。计算和检查在暂时的合成音和应编码的信号之间的距离,该应编码的信号是从适应声源编码器4输出的输入声音1或作为从输入声音1减去由适应声源产生的合成音的信号,选择该距离最小的驱动声源编码输出到多路转换器7,同时以与选择的驱动声源编码对应的时序向量作为驱动声源,输出到增益编码器6。
增益编码器6首先与用内部产生的数比特的2进位数值表示的各增益编码对应,从作为内部储存的增益编码册顺序读出增益向量。而且用各增益向量的各要素乘以从适应声源编码器4输出的适应声源和从驱动声源编码器5输出的驱动声源并相加,产生声源,使产生的该声源通过应用从线性预测系数编码器3输出的量化线性预测系数的合成滤波器,以获得暂时的合成音。计算并检查在该暂时的合成音和输入声音1之间的距离,选择使该距离最小的增益编码,输出到多路转换器7。此时,把与该增益编码对应的上述产生的声源输出到适应声源编码器4。
最后,适应声源编码器4应用与通过增益编码器6选择的增益编码对应的上述声源,对内部的适应声源编码册进行更新。
多路转换器7对从线性预测系数编码器3输出的线预测系数的编码,从适应声源编码器4输出的适应声源编码、从驱动声源编码器5输出的驱动声源编码以及从增益编码器6输出的增益编码进行多路转换成声音编码8,并输出得到的声音编码8。
其次,在图15所示的声音解码装置内,分离器9对从声音编码装置输出的声音编码8进行分离,并把线性预测系数的编码输出到线性预测系数解码器10,把适应声源编码输出到适应声源解码器11,把驱动声源编码输出到驱动声源解码器12,把增益编码输出到增益解码器13。线性预测系数解码器10对从分离器9分离的线性预测系数的编码来的线性预测系数进行解码,作为合成滤波器14的滤波系数设置、输出。
其次,适应声源解码器把内部过去的声源作为适应声源编码册储存,与分离器9分离的适应声源编码对应,把周期地重复过去的声源的时序向量作为适应声源输出。此外,驱动声源解码器12把与分离器9分离的驱动声源编码对应的时序向量作为驱动声源输出。增益解码器13输出与分离器9分离的增益编码对应的增益向量。而且通过对上述两时序向量乘以上述增益向量各要素并相加产生声源,使该声源通过合成滤波器14,产生输出声音15。最后,适应声源解码器11用上述产生的声源对内部适应声源编码册进行更新。
其次对谋求这种CELP系声音编码装置及声音解码装置改良的传统技术进行说明。
在片岗章俊、林伸二、守谷健弘、栗原祥子、间野一则「CS-ACELP声音编码器的基本算法」NTT R&D,Vol.45,P325-330,1996年4月(文献1)内,以降低演算量和存储量作为主要目的,公开了在驱动声源编码内导入脉冲声源的CELP系声音编码装置及声音解码装置。在该传统的结构只用数个脉冲的各位置信息和极性信息来表现驱动声源。这种声源为代数的声源,构造较简单、编码特性好,在最近的众多标准方式中被采用。
图16是示出文献1用的脉冲声源候选位置的表,在上述图14的声音编码装置,装载在驱动声源编码装置5,在上述图15的声音解码装置,装载在驱动声源解码装置12上。在文献1,声源编码帧长为40个取样,驱动声源由4只脉冲声源构成。从声源号1到声源号3的脉冲声源的候选位置如图16所示受各8个位置制约,脉冲位置可以用各3比特编码。声源号4的脉冲声源受16个位置制约,脉冲位置可用4比特编码。通过给予脉冲声源候选位置的制约,一方面抑制编码特性变坏,一方面通过编码比特数的削减,这导致多个脉冲声源候选位置组合数的削减,实现演算量的削减。
在文献1,为了削减脉冲位置搜索的演算量,预先计算各脉冲响应(由单一脉冲声源产生的合成音)和应编码的信号之间的相关值,可以作为预表储存,通过这些值的简单相加,实现距离(编码畸变)计算。而且,搜索使该距离最小的多个脉冲声源位置及极性。这个处理通过上述图14的声音编码装置的驱动声源编码装置5实施。
以下具体说明文献1所用的搜索方法。
首先距离最小等效于下式(1)所示的评价值D最大,通过对脉冲位置的完全组合实施对该评价值的计算,可以进行搜索。
D=C2/E (1)
其中C和E分别为:C=∑g(K)d(mk) (2)
E=∑∑g(K)g(i)φ(mk,mi) (3)
这里mk是第k个脉冲的脉冲位置,g(K)是第K个脉冲的脉冲振幅,d(X)是当脉冲处于脉冲位置X时脉冲响应和应编码对象信号之间的相关值,φ(X,Y)是当脉冲处于脉冲位置X时产生的脉冲响应和脉冲处于脉冲位置Y时产生的脉冲响应之间的相互关系。
此外通过假设g(K)具有与d(mk)相同符号,并具有绝对值1,则上式(2)和(3)可如下式(4)、(5)那样简化计算。
C=∑d′(mk) (4)
E=∑∑φ′(mk,mi) (5)
其中d′(mk)=d(mk) (6)
φ′(mk,mi)=sign[d(mk)]sign[d(mi)]φ(mk,mi)(7)
在开始计算对脉冲位置的所有组合的评价值D之前,如果进行d′和φ′的计算,则可以通过式(4)和(5)的单纯相加的小演算量算出评价值D。
在特开平10-232696号公报、特开平10-312198号公报公开了改善该代数的声源品质的结构,同时日本音响学会1999年春季研究发表会讲演论文集I P213-214(文献2)公开了土屋、天田、三关著「适应脉冲位置ACELP声音编码的改善」。
在特开平10-232696号公报,准备了多个固定波形,通过代数编码声源位置上配置该固定波形,以产生驱动声源。通过这种结构可获高品质的输出声音。
在文献2,研究了在驱动声源(在文献2中ACELP声源)的产生单元内包含音调滤波器的结构。关于这些固定波形的导入和音调滤波器处理,可以通过文献1的脉冲响应的计算部分同时进行,获得品质改善而不大幅增加搜索处理量的效果。
在特开平10-312198号公报公开了一种结构,其中在音调增益大于等于预定值时,使驱动声源与适应声源正交,同时搜索脉冲位置。
图17是示出引入了上述特开平10-232696号公报及文献2的改良结构的传统的CELP系声音编码装置的驱动声源编码器5的详细结构的方框图。在图上,16是听觉加权滤波系数的计算装置,17、19是听觉加权滤波器,18是主响应产生装置,20是预表计算装置,21是搜索装置,22是声源位置表。
其次说明驱动声源编码器5的动作。
首先从图14示出的声音编码装置内的线性预测系数编码器3中的量化线性预测系数输入到听觉加权滤波系数计算装置16和主响应产生装置18,从适应声源编码器4输入待编码的信号到听觉加权滤波器17,该待编码的信号是输入声音1或通过从输入信号1减去由适应声源产生的合成音获得的信号。从适应声源编码器4把对适应声源编码进行变换获得的适应声源重复周期输入到主响应产生装置18。
听觉加权滤波系数计算装置16应用上述量化线性预测系数,计算听觉加权滤波系数,把计算的听觉加权滤波系数设定为听觉加权滤波器17和19的滤波系数。听觉加权滤波器17通过由听觉加权滤波系数计算装置16设定的滤波系数对输入的上述应编码的信号进行滤波处理。
主响应产生装置18用输入的上述适应声源重复周期对单位脉冲或固定波形进行音调周期化处理,把得到的信号作为声源,通过用上述量化的线性预测系数构成的合成滤波器产生合成音,以此作为主响应输出。听觉加权滤波器19通过由听觉加重滤波系数计算装置16设定的滤波系数对上述主响应进行滤波处理。
预表计算装置20计算在上述听觉加权的应编码的信号和听觉加权的主响应之间的相关值并取作d(X)、计算听觉加权的主响应的相互关系值取作φ(X,Y)。而且由上述(6)式和(7)式求d′(X)和φ′(X,Y),把这些作为预表储存。
在声源位置表22内储存与图16同样的声源候选位置。搜索装置21从声源位置表顺序读出声源的候选位置,并根据上述(1)式,(4)式,(5)式使用由预表计算装置20计算的预表,计算对各声源位置组合的评价值D。而且搜索装置21搜索使评价值D最大的声源位置的组合,把表示获得的多个声源位置的声源位置编码(在声源位置表内的指数)和极性编码作为驱动声源编码输出到图14所示的多路转换器7,同时把与该驱动声源编码对应的时序向量作为驱动声源输出到增益编码器6。
在特开平10-312198号公报内公开的正交导入通过输入到预表计算装置20的听觉加权的应编码的信号对适应声源正交,以及通过在搜索装置21内从上述(5)式表示的E值减去与适应声源和各驱动声源脉冲之间相关值有关的贡献部分实现。
虽然传统的声音编码装置以及声音解码装置如上所述构成,所以产生音调周期化驱动声源的音调周期化处理可以改善编码特性而不会大幅增加搜索演算处理量,但由于适应声源的重复周期用作音调滤波处理的重复周期,所以当原来的音调周期与该重复周期不同时,容易引起品质变坏。
图18及图19是说明在传统的声音编码装置及声音解码装置内的应编码的信号和音调周期化的驱动声源的声源位置关系的图。图18是适应声源的重复周期的为原来的音调周期的2倍的情况,图19是适应声源的重复周期约为原来的音调周期的1/2倍的情况。
因为适应声源的重复周期是这样决定的,使根据适应声源产生的同步声音和应编码的信号之间的编码畸变最小,因此通常与作为声带的振动周期的音调周期是不同的。在相异的情况,大体上取原来的音调周期的整数倍或整数分之一的值,尤其取1/2倍或2倍。
在图18,因为声带的振动每隔一音调周期周期地变化,所以适应声源的重复周期约为原来的音调周期的2倍。因此,如果用该重复周期进行驱动声源的编码,则大多数声源位置聚集在每一音调周期的第1半周期内,在帧内重复它,在该重复周期内其重复结果如图所示。如果用与原来的音调周期相异的周期重复的声源,则该帧的音色改变,产生合成音不稳定的印象。当比特速率降低并因此驱动声源的信息量下降时这种缺点就越不可忽略,并在适应声源的振幅比驱动声源的振幅小的区间内变得更加显著。
在图19,因为在输入声音内低频成分是支配的,并且原来的音调周期的前半部和后半部波形是类似的,所以适应声源的重复周期约为原来的音调周期的1/2。即使在这种情况,也与图18同样,由于应用与原来的音调周期相异的周期重复的声源,所以该区域的音色改变,产生合成音不稳定的印象。
此外在比特速率下降和驱动声源的信息量少的情况下,其倾向是采用由波形畸变(编码畸变)最小决定的驱动声源,在低振幅波段的误差变大,合成音的频谱畸变变大,这种频谱畸变可以作为音质变坏检出。为了抑制由这频谱畸变产生的音质变坏,引入听觉加权处理,不过一旦加强听觉加权,则波形畸变增大,并因此引起沙拉沙拉声的音质变坏,所以加强听觉加权处理应当这样调整,使得通常由波形畸变和频谱畸变产生的音质变坏的影响具有相同水平。然而尤其当输入声音是女声时,频谱畸变增加,并且听觉加权处理不能调整到使得对男声和女声两者都处于最佳状态。
此外,在传统的结构中,对配置在多个声源位置的声源(包含脉冲)在每一帧内提供恒定的振幅。在此较各声源候选位置数时不论其数差异多少,所谓保持多个声源振幅一定是无用的。例如在图16所示的声源位置表的情况下,对于从声源号1到声源号3的声源位置各使用3比特,对声源号4的声源位置使用4比特。如果对每个声源号检查在各候选位置的声源和应编码的信号之间的相互关系,可以容易预测,具有候选数最多的声源号4得到最大值的几率大。假设一种极端情况,即对某声源不提供比特数。0比特,即在固定位置上配置声源的情况下,即使另外提供极性,则在声源和应编码的信号之间的相互关系值也小。这意味着对一声源号比其它声源号提供更大振幅是不合适的。因而传统结构的问题是对多个声源的振幅并非最佳设计。
虽然另外公开了一种传统结构,即:对该声源号的每个振幅而言,通过对增益量化处理期间的独立值进行向量量化,但是这会导至增益量化信息量增加,处理复杂等后果。
使驱动声源与适应声源正交的技术会引起搜索处理量增加。因此代数声源组合数增加导至编码或解码处理的巨大负担。尤其对导入固定波形或音调周期化的结构进行正交时其演算量的增加最大。
发明内容
本发明是为解决上述问题而提出的,其目的是获得高品质声音编码装置及声音解码装置。此外把演算量的增加抑制在最低限,同时获得高品质的声音编码装置及声音解码装置。
本发明的声音编码装置应用由过去声源产生的适应声源和由输入声音和上述适应声源产生的驱动声源,输出对上述输入声音按帧单位编码的声音编码,配备如下装置,即:对上述适应声源的重复周期乘以多个常数求出驱动声源的多个候选重复周期,从这些驱动声源的多个候选重复周期中预选预定个数,输出这些预选的驱动声源的候选重复周期的周期预选装置;对上述周期预选装置输出的上述预定个数的预选的驱动声源每个候选重复周期,输出编码畸变最小的声源位置信息、声源极性信息及与这时的编码畸变有关的评价值的驱动声源编码器;对上述驱动声源编码器输出的上述预定个数的预选的驱动声源的每个候选重复周期获得的编码畸变进行比较,根据其比较结果选择一个驱动声源的候选重复周期,输出对该选择结果编码的选择信息以及表示与选择的驱动声源的候选重复周期对应的声源位置信息的声源位置编码以及表示与选择的驱动声源的候选重复周期对应的声源极性信息的极性编码的周期编码器。
本发明的声音编码装置的周期预选装置预选的驱动声源的候选重复周期的预定个数为2个,周期编码器是用1比特对选择结果进行编码产生选择信息的。
本发明的声音编码装置的周期预选装置对适应声源的重复周期与预定阈值进行比较,根据其比较结果选择预定个数的驱动声源的候选重复周期。
本发明的声音编码装置的周期预选装置包含产生多个其它适应声源,其重复周期分别与多个驱动声源的候选重复周期相等,根据产生的这些多个适应声源间的距离,选择预定个数的驱动声源的候选重复周期。
本发明的声音编码装置对由周期预选装置产生的适应声源重复周期相乘的多个常数包含1/2及1。
本发明的声音解码装置应用输入声音编码,由过去的声源产生的适应声源,由上述声音编码和上述适应声源产生的驱动声源,从上述声音编码按帧单位对声音解码,包含如下装置,即:对上述适应声源的重复周期乘以多个常数,求出驱动声源的多个候选重复周期,从这些驱动声源的多个候选重复周期中预选预定个数,并输出预定个数的预选驱声源的候选重复周期的周期预选装置;根据在上述声音编码中包含的驱动声源重复周期的选择信息,在上述周期预选装置输出的上述预定个数的预选的驱动声源的候选重复周期的选择信息,上述周期预选装置输出的上述预定个数的预选的驱动声源的候选重复周期内选择一个,以其作为驱动声源的重复周期输出的周期解码器;根据在上述声音编码内包含的声源位置编码以及极性编码产生时序信号,用上述周期解码器输出的上述驱动声源的重复周期,输出使上述时序信号按音调周期化的时序向量的驱动声源解码器。
本发明的声音解码装置的周期预选装置预选的驱动声源的候选重复周期的预定个数是2个,并且周期解码器是用表示包含在声音编码内、编码时选择的驱动声源的候选重复周期的1比特对编码的选择信息解码的。
本发明的声音解码装置的周期预选装置是对适应声源的重复周期与预定阈值进行比较,根据其比较结果选择预定个数驱动声源的候选重复周期的。
本发明的声音解码装置的周期预选装置是产生多个其它适应声源,该适应声源的重复周期分别与多个驱动声源的候选重复周期相等,根据产生的这些多个其它适应声源间的距离,选择预定个数驱动声源的候选重复周期的。
本发明的声音解码装置是通过周期预选装置对适应声源的重复周期所乘的多个常数包含1/2及1的。
本发明的声音解码装置应用由过去的声源产生的适应声源和由输入声源和上述适应声源产生的驱动声源,对上述输入声音按帧单位编码并输出的声音编码,包含以下装置,即:根据上述适应声源的重复周期,决定听觉加权的强度系数的听觉加权的强度控制装置;根据上述适应声源的重复周期和上述听觉加权控制装置决定的上述听觉加权的强度系数和上述输入声音等应编码的信号,输出表示声源位置信息的声源位置编码和声源极性信息的极性编码的驱动声源编码器。
本发明的声音编码装置的听觉加权控制装置是根据适应声源的重复周期和过去的适应声源的重复周期的平均值决定听觉加权的强度系数的。
本发明的声音编码装置,应用由过去声源产生的适应声源和由输入声音和上述适应声源产生的通过多个声源位置及极性表现的驱动声源,输出对上述输入声音按帧单位编码的声音编码,配备声源位置表,它对上述多个声源中的每一个,包含可能选择的多个候选位置和根据候选数决定的固定振幅,并配备驱动声源编码器,它参照该声源位置表,对上述多个声源乘以与其对应的固定振幅并把上述多个声源配置在与其对应的候选位置上,这样,对乘以固定振幅的上述多个声源相加,产生驱动声源,选择能提供使上述输入声音之间编码畸变最小的驱动声源的上述多个声源的候选位置及极性,产生声源位置编码及极性编码。
本发明的声音解码装置,应用输入声音编码,由过去的声源产生的适应声源和由上述声音编码和上述适应声源产生的,用多个声源位置及极性表现的驱动声源,从上声音编码中按帧单位的声音解码,配备声源位置表,它对上述多个声源中的每一个,包含可能选择的多个候选位置和根据这些候选位置决定的固定振幅。并配备驱动声源解码器,它根据在上述声音编码中包含的声源位置编码,参照上述声源位置表,选择上述多个声源各自的位置,乘以与上述声源分别对应的固定振幅,同时配置在各自选择上述多个声源的候选位置上,这样对乘以固定振幅配置的上述多个声源相加,产生驱动声源。
本发明的声音编码器,应用由过去的声源产生的适应声源和通过由输入声音和上述适应声源产生的,多个声源位置及极性表现的驱动声源,对上述输入声音按帧单位编码输出声音编码中,配备预表计算装置,它计算上述输入声音等的编码对象信号和根据把预定的声源配置在所有声源候选位置的每个位置的多个暂时驱动声源,各自产生的多个合成音之间的相关值,同时计算上述多个合成音中任2个之间的相互关系值。它还配备预表修正装置,它计算在上述应编码的信号和根据上述适应声源产生的合成音之间的相关值,同时计算在根据上述各暂时驱动声源产生的上述各合成音和根据上述适应声源产生的上述合成音之间的相关值,用计算的这些相关值修正上述预表。还配备搜索装置,它用上述修正预表决定上述多个声源的位置及极性,输出表示上述声源位置的声源位置编码和表示上述极性的极性编码。
附图的简单说明
图1是示出在本发明实施例1的声音编码装置内的驱动声源编码器结构的方框图。
图2是示出在本发明实施例1的声音解码装置内的驱动声源解码器结构的方框图。
图3是说明本发明实施例1的应编码信号和音调周期化驱动声源的声源位置关系图。
图4是说明本发明实施例1的应编码信号和音调周期化驱动声源的声源位置关系图。
图5是示出在本发明实施例2的声音编码装置内的驱动声源编码器结构的方框图。
图6是示出在本发明实施例2的声音解码装置内的驱动声源解码器结构的方框图。
图7是说明用本发明实施例2的适应声源装置产生的适应声源的图。
图8是说明用本发明实施例2的适应声源装置产生的适应声源的图。
图9是说明用本发明实施例2的适应声源装置产生的适应声源的图。
图10是示出在本发明实施例3的声音编码装置内的驱动声源编码器和听觉加权控制装置结构的方框图。
图11是示出在本发明实施例4的声音编码装置内的驱动声源编码器和听觉加权控制装置结构的方框图。
图12示出本发明实施例5的声源位置表的图。
图13是示出在本发明实施例6的声源编码装置内的驱动声源编码器结构的方框图。
图14是示出传统的CELP系声音编码装置结构的方框图。
图15是示出传统的CELP系声音解码装置结构的方框图。
图16是示出传统的脉冲声源候选位置的图。
图17是示出在传统的CELP系声音编码装置内驱动声音编码器结构的方框图。
图18是说明传统的应编码对信号和音调周期化的驱动声源的声源位置关系的图。
图19是说明传统的应编码信号和音调周期化的驱动声源的声源位置关系的图。
发明的具体实施方式
以下说明本发明的实施例。
实施例1
图1是示出在本发明实施例1的声音编码装置内的驱动声源编码器5结构的方框图。声音编码装置的全体结构与图14同样。在图中,23周期预选装置,27是驱动声源编码部,28是周期编码器,周期预选装置23包含常数表24,比较器25,预选装置26。
即:本实施例的声音编码装置的驱动声源编码器5包含与上述传统的驱动声源编码器同样动作的驱动声源编码部27,设置在驱动声源编码部27前后的周期预选装置23及周期编码器28。
图2是示出在本发明实施例1的声音解码装置内的驱动声源解码器12结构的方框图。声音解码装置的全体结构与图15同样。在图2,29是周期解码器,30是驱动声源解码部。
即:本实施例的声音解码装置的驱动声源解码器12包含与传统的驱动声源解码器同样动作的驱动声源解码部30和插入驱动声源解码部30前的周期选装置23及周期解码器29。
其次说明动作。
首先,用图1说明声音编码装置的动作。从图14所示的适应声源编码器4,变换适应声源编码得到的适应声源的重复周期输入到周期预选装置23。此外,从适应声源编码器4来的应编码信号和从线性预测系数编码器3来的量化线性预测系数输入到驱动声源编码部29。
在周期预选装置23内的常数表24上储存了1/2,1,2等3个常数,各常数乘输入的适应声源重复周期所得的3个重复周期作为驱动声源的候选周期输入到预选装置26。比较器25对预先提供输入的适应声源的重复周期的预定阈值作比较,把比较结果输出到预选装置26。作为该预定阈值,采用与平均音调周期相当的40左右。
当比较器25的比较结果大于预定的阈值时,预选装置26预选对输入的适应声源的重复周期乘1/2,1的2个驱动声源的候选重复周期,当比较结果小于预定阈值时,预选对输入的适应声源的重复周期乘1,2的2个驱动声源的候选重复周期,把得到的2个驱动声源候选重复周期顺序输出到驱动声源编码器27。
与图17所示的传统驱动声源编码器5同样,驱动声源编码部27可以应用输入的2个驱动声源的候选重复周期(与图17不同处在于这重复周期为适应声源的常数倍)、量化线性预测系数、应编码的信号,进行代数的声源的编码处理,对于2个驱动声源的候选重复周期的每一个输出使编码畸变最小,各自由固定波形或脉冲构成的多个声源位置,极性以及与这时编码畸变有关的上式(1)中的评价值D。
周期编码器28对驱动声源编码部27输出的各驱动声源的候选重复周期的评价值D进行比较,当1个评价值和另1个评价值之间的差大于预定阈值(即:只有1个编码畸变小)时,则选择提供该评价估的驱动声源的候选重复周期,当评价值间的差小于预定阈值时,则选择与由其它分析得到的输入声音的音调周期推算结果最接近的驱动声源的候选重复周期,把该选择结果用1比特编码的选择信息,以及表示这时的声源位置的声源位置编码和表示声源极性的极性编码作为声源编码输出到图14所示的多路转换器7,同时把与这驱动声源编码对应的时序向量作为驱动声源输出到图14所示的增益编码器16。
其次用图2说明声音解码装置的动作。在图15所示的声音解码装置,与传统的同样,分离器9分离从声音编码装置输出的声音编码8,并把线性预测系数的编码输出到线性预测系数的解码器11,把适应声源符号输出到适应声源解码器11,把驱动声源编码输出到驱动声源解码器12,把增益编码输出到增益解码器13,在本实施例,从图15所示的适应声源解码器11变换适应声源编码得到的适应声源的重复周期输入到驱动声源解码器12。即:在图2,把从适应声源解码器11来的适应声源的重复周期输入到周期预选装置23。此外分离器9分离的驱动声源编码内的选择信息输入到周期解码器29,把驱动声源编码内的声源位置编码和极性编码输入到驱动声源解码器30。
周期预选装置23具有与声音编码装置内的图1所示周期预选装置23同样的结构,预选装置26从输入的适应声源重复周期常数倍的多个驱动声源的候选重复周期中,根据比较器25的比较结果,选择2个预选的驱动声源候选重复周期输出到周期解码器29。
周期解码器29根据输入的选择信息选择从预选装置26输出的2个预选的驱动声源的候选重复周期之一,以此作为驱动声源的重复周期输出到驱动声源解码部30。驱动声源解码部30与传统的驱动声源解码器12同样,把多个固定波形或脉冲分别配置在由声源位置编码确定的多个位置,根据周期编码器29来的上述驱动声源重复周期进行音调周期化,产生各种包含多个固定波形或脉冲的一系列音调周期,把与驱动声源编码对应的这时序向量作为驱动声源输出。
图3及图4是说明在实施例1的声音编码装置及声音解码装置内的应编码的对象和音调周期化的驱动声源位置即配置在驱动声源的各音调周期内的脉冲(或固定波形)位置关系的图。应编码的信号与图18及图19相同,图3是适应声源的重复周期为原来音调周期约2倍的情况,图4是约1/2倍的情况。
图3的情况,如果原来的音调周期在20以上,则适应声源的重复周期在40以上,因此,预选装置26在所有情况下预选等于适应声源的重复周期的1/2倍或1倍的值。如果用这两个重复周期进行编码时的评价值D的差异小,则选择与从其它途径求出的原来音调周期的推算值(比适应声源的重复周期的正确解答率高)相近的1/2倍,获得如图所示理想的音调周期化的声源位置。
图4的情况,如果原来的音调周期在80以下,则适应声源的重复周期在40以下,因此,预选装置26以高概率预选等于适应声源的1倍和2倍的值。如果用这两个重复周期时的编码进行评价值D的差异小,则选择与从其它途径求出的原来音调周期相近的2倍,获得如图所示理想的音调周期化的声源位置。
虽然在上述实施例,在驱动声源编码和解码中使用只由多个固定波形或脉冲位置及极性表示的代数的声源,但是本发明并不限于代数的声源结构,也可以适应于用其它的学习声源编码册或随机声源编码册等的CELP系声音编码装置及声音解码装置。
虽然在上述实施例,另外求音调周期的推算值,但是周期编码器28也可以选择使编码畸变最小,即评价值D最大的重复周期。此外,作为另一方案,通过对过去数帧的适应声源重复周期取平均的值作为参照值,用以取代音调周期也行。
虽然在上述实施例,作为频谱参量用线性预测系数说明,但是用一般广泛使用LSP(Line Spectrum Pair:线谱对)等其它频谱参量也行。
虽然在上述实施例,用常数表24内所有的常数乘适应声源的重复周期,但是用预选装置26从常数24内选择2个常数,之后乘以适应声源重复周期也行。
此外从常数表24内去除1,代之把适应声源的重复周期输入到直接预选装置26也可获同样结果。
虽然特性改善效果减少,但是把常数表中的值只取1/2和1,可以省掉比较器25和预选装置26。
如上所述,如果采用本实施例1,则用多个常数乘以适应声源的重复周期求出多个驱动声源的候选重复周期,从预选的驱动声源的各候选重复周期中预选预定个,对每个预选的驱动声源的各候选重复周期搜索编码畸变最小的驱动声源编码,根据对驱动声源的各重复周期的每个编码畸变的比较结果,选择驱动声源的候选重复周期,因此即使在原来的音调周期和适应声源的重复周期相异的情况下,也能以高慨率用与原来的音调周期相近的重复周期产生音调周期化的音调周期化的驱动声源,可以抑制合成音的不稳定的印象的发生,得到可以提供高品质声音编码装置的效果。
此外,在周期预选中预选个数取2,驱动声源的重复周期的选择信息用1比特编码,因此得到可提供只具有最低限附加信息量的高品质的声音编码装置的效果。
在本发明的的周期预选中,比较适应声源的重复周期与预定阀值,根据该比较结果来选择预定个驱动声源的候选重复周期,所以,能排除接近原有音调周期概率低的驱动声源的候选重复周期,不需要对无需评价的驱动声源的候选重复周期的驱动声源编码处理和选择信息的分配,只需增加最小的运算量和信息量就可提供高品质的声音编码装置。
因为作为周期预选中的适应声源的重复周期所乘的常数包含1/2、1,所以虽然是少数选择枝但是高概率,可以选择与原来的音调周期相近的驱动声源的候选重复周期,得到可提供只具有最低限的附加演算量和信息量的高品质的声音编码装置的效果。
如果采用本实施例1,则对适应声源的重复周期乘以多个常数求出多个驱动声源的候选重复周期,从多个驱动声源的候选重复周期中预选预定个,根据声音编码中的驱动声源的重复周期的选择信息,从预选的驱动声源的候选重复周期中的一个作为驱动声源的重复周期选择,因为用这驱动声源的重复周期对驱动声源解码,因此即使在原来的音调周期和适应声源的重复周期相异的情况下,也能以高慨率用与原来的音调周期相近的重复周期产生实现音调周期化的音调周期化的驱动声源,可以抑制合成音不稳定的印象的发生,得到可提供高品质的声音解码装置的效果。
因为周期预选中的预选个数取2,对用1比特编码的驱动声源的重复周期的选择信息解码,所以得到可提供具有最低限附加信息量的高品质解码装置的效果。
在周期预选中对适应声源的重复周期和预定阈值进行比较,根据比较结果,选择预定个数的驱动声源的候选重周期,因此可以排除与原来的音调周期相近的、慨率低的驱动声源的候选重复周期,不要对不必要的驱动声源的候选重复周期的选择信息的分配,得到可提供具有最低限附加信息量的声音解码装置的效果。
因为作为对周期预选中适应声源的重复周期所乘的常数至少包含1/2,1,所以虽然是少数选择枝但是高慨率,可以选择与原来的音调周期近的驱动声源的候选重复周期,得到可提供具有最低限的附加信息量的高品质的声音解码装置的效果。
实施例2
图5是示出在本发明实施例2的声音编码装置内的驱动声源编码器5结构的方框图。声音编码装置的全体结构与实施例1,即图14同样。在图5,31是周期预选装置,33是储存在适应声源编码器4内的适应声源编码册,周期预选装置31包含常数表32,适应声源产生装置34,距离计算装置35,预选装置36。
虽然驱动声源编码器27是与传统的驱动声源编码器5同样动作的装置,但是使在驱动声源编码器27的前后从新插入周期预选装置31和周期编码器28的,作为图14的驱动声源编码器5的部分是本实施例2的声音编码装置。
图6是示出本发明实施例2的声音解码装置内的驱动声源解码器12结构的方框图。声音解码装置的全体结构与实施例1,即图15同样。在图6,33是储存在适应声源解码器11内的适应声源编码册。
虽然驱动声源编码器30是与传统的驱动声源解码器12同样动作的装置,但是附加的重复周期预选装置31和重复周期解码器29从新插在驱动声源解码器30之前的,作为图15的驱动声源解码器12的部分是本实施例2的声音解码装置。
其次说明其动作。
首先用图5说明声音编码装置的动作。与实施例1同样,适应声源编码器4输出的适应声源的重复周期输入到周期预选装置31,从适应声源编码器4来的应编码的信号,以及从线性预测系数编码器3来的量化线性预测系数输入到驱动声音编码器27。
1/3,1/2,1,2四个常数储存在周期预选装置31内的常数表31中,各常数乘以输入的适应声源的重复周期得到的四个驱动声源的候选重复周期输出到适应声源产生装置34和预选装置36内。
适应声源产生装置34用储存在适应声源编码册33内的过去的声源,产生把上述四个驱动声源的候选重复周期的每一个作为重复周期的四个其它适应声源,并把产生的四个其它声源输出到距离计算装置35。对输入到周期预选装置31的适应声源的重复周期的1倍,因为适应声源编码器4已经产生同一的重复同期适应声源,因此可以省略在适应声源产生装置上的产生。
此外,当驱动声源的四个候选重复周期中的一部分太大或太小,并因此不合适作为音调周期时,则有可能适应声源编码册不能承担产生四个适应声源,为了避免这种可能性,适应声源产生装置34通过提供零信号等作为对驱动声源候选重复周期的适应声源,防止对音调周期不合适的驱动声源的候选周期在预选过程被选择。
距离计算装置35计算在以输入适应声源重复周期1倍的值作为重复周期时的第3其它适应声源(即适应声源编码器4输出的适应声源)和以其它的1/3倍,1/2倍,2倍值作为重复周期时的第1,第2,第4其它适应声源之间的距离,把得到的各距离输出到预选装置36。
预选装置36首先比较1/3倍时和1/2倍时的距离,选择距离小的一方。而且对该选择的距离与用预定常数乘以产生的其它适应声源的平均振幅得到的值进行比较,在前者小时,把提供该距离的重复周期(适应声源的重复周期的1/3倍或1/2倍)和适应声源的重复周期1倍的值作为预选的驱动声源的候选重复周期输出。此外,当前者大于后者时,以下对该距离和适应声源的重复周期2倍时的距离进行比较,对于提供小的一方距离的重复周期和适应声源重复周期1倍的值作为预选的驱动声源的候选重复周期输出。作为预定常数,最好用小于1的正值,例如0.1左右的小值。
驱动声源编码器27与图27所示传统的驱动声源编码器5同样,用输入的各预选的驱动声源的候选重复周期(与图17相异的是:该预选驱动声源的候选重复周期为输入的适应声源的常数倍),量化的线性预测系数,应编码的信号等,进行代数的声源编码处理,搜索对各候选重复周期编码畸变最小的驱动声源编码,输出得到的多个声源位置和极性以及与这时编码畸变有关的上述(1)式的评价值D。
周期编码器28对驱动声源编码器27输出的驱动声源的各候选重复周期的评价值进行比较,在1个评价值和其余的评价值之间的差大于阈值(即只有其中之一编码畸变小)时,选择提供该评价值的驱动声源的候选重复周期,当评价值间的差小于阈值时,则选择通过另外分析得到的与音调周期(原来的音调周期的推定值)最相近的驱动声源的候选重复周期,把该选择结果用1比特编码的选择信息和表示这时的声源位置的声源位置编码和表示声源极性的极性编码作为驱动声源编码输出。
其次,用图6说明声音解码装置的动作。与实施例1同样,适应声源编码器11输出的适应声源的重复周期输入到周期预选装置31,分离器9把分离的驱动声源编码内的选择信息输入到周期解码器29,驱动声源编码内的声源位置编码以及极性编码输入到驱动声源解码器30。
周期预选装置31具有与声音编码装置内图5所示的周期预选装置31相同的结构,从输入的适应声源的重复周期常数倍的驱动声源的候选重复周期中选择2个预选的驱动声源的候选重复周期,输出到周期解码器29。周期解码器29根据输入的驱动声源的选择信息,选择上述2个驱动声源的候选重复周期之一,把它作为驱动声源的重复周期,输出到驱动声源解码器30。驱动声源解码器30与传统的驱动声源解码器12同样,把固定波形或脉冲配置在与声源位置对应的各位置上,根据驱动声源的重复周期进行音调周期化,把对驱动声源编码的时序向量作为驱动声源输出。
图7,图8,图9是说明由实施例2的声音编码装置及声音解码装置内的适应声源产生装置34产生的其它适应声源的图,图7表示输入周期预选装置的适应声源的重复周期与原来的音调期一致的情形,图8表示输入适应声源的重复周期为原来的音调周期2倍的情形,图9表示输入适应声源的重复周期为原来的音调周期3倍的情形。
从图7可以看出;当输入适应声源的重复周期与原来的音调周期一致时,以输入适应声源的重复周期的1/3倍及1/4倍作为重复周期产生的第1及第2其它的适应声源和第3其它适应声源,即输入周期预选装置的原适应声源(图中最上面的)之间的距离大,则容易预选输入适应声源的重复周期2倍和1倍的重复周期的第3及第4其它适应声源。
从图8可以看出;当输入适应声源的重复周期为原来的音调周期的2倍时,以输入适应声源的重复周期的1/2倍作为重复周期产生的第2其它适应声源和输入周期预选装置的原适应声源(图中最上面的)之间的距离小,则容易预选作为输入声源的重复周期1/2倍和1倍的重复周期产生的第2及第3其它适应声源。
从图9可以看出;当输入适应声源的重复周期为原来的音调周期的3倍时,以输入适应声源的重复周期的1/3倍作为重复周期产生的第1其它适应声源和输入周期预选装置的原适应声源(图中最上面的)之间的距离小,则容易预选作为输入适应声源重复周期的1/3倍和1倍的重复周期产生的第1及第3的其它适应声源。
在上述实施例,虽然在驱动声源的编码和解码中使用代数的声源,但是本发明不限于代数的声源结构,也可适用于用其它学习声源编码册或随机源编码册等的CELP系声音编码装置及声音解码装置。
此外,在上述实施例,虽然由别的途径求音调周期,用于通过周期编码器28的选择,但是不用它来选择使编码畸变最小,即评价值最大的驱动声源的候选重复周期的结构也是可能的。不用音调周期,对过去数帧的适应声源的重复周期取平均的值作为参照值用也行。
在上述实施例,虽然作为频谱参量用线性预测系数说明,但是用一般广泛使用的LSP等的其它频谱参量的结构也成。
常数表内去掉1,代之把适应声源的重复周期输入直接预选装置36也可获得相同结果。
虽然降低了特性改善效果,但是把常数表中的值只取1/2,1,2也可以。
如上所示,如果采用本实施例2,对声源的重复周期乘以多个常数,求出驱动声源的多个候选重复周期,并产生把这驱动声源的多个候选重复周期作为各自的重复周期的多个其它适应声源,根据产生的适应声源间的距离,可以选择驱动声源的预定个数的候选重复周期,因此即使在原来的音调周期和适应声源的候选重复周期相异的情况,也能以高概率用与原来的音调周期相近的重复周期进行周期化的音调周期化的音调周期化的驱动声源,抑制合成音不稳定印象的发生,得到可提供高品质声音编码装置的效果。
接着,周期预选的预选个数取2,则用1比特对驱动声源的重复周期的选择信息进行编码,因此得到可提供具有最低限附加信息量的高品质声音编码装置的效果。
分别产生把多个驱动声源的候选重复周期原封不动作为适应声源的重复周期时的适应声源,根据产生的适应声源间的距离值可以选择预定个数的驱动声源的候选重复周期,因此可以排除作为原来的音调周期的概率低的驱动声源的候选重复周期,不要对不必评价的驱动声源的候选重复周期进行驱动声源编码处理和选择信息的分配,得到可提供具有最低限演算量和信息量的高品质声音编码装置的效果。
因为作为对周期预选中适应声源的重复周期所乘的常数至少包含1/2,1,所以能以少数选择枝以及高概率产生包含原来的音调周期的驱动声源的候选重复周期,得到可提供具有最低限演算量和信息量的高品质声音编码装置的效果。
如果采用本实施例2,对适应声源的重复周期乘以多个常数,求出多个驱动声源的候选重复周期,从这多个驱动声源的候选重复周期中选择预定个数预选的驱动声源的候选重复周期,根据声音编码中的驱动声源的重复周期的选择信息,从予选的驱动声源的候选重复周期中选择1个作为驱动声源的重复周期,用这重复周期对驱动声源进行编码,因此即使在原来的音调周期和适应声源的重复周期相异时也能以高概率产生用与原来的音调周期相近的重复周期进行音调周期化的音调周期化的驱动声源,可以抑制合成音不稳定印象的发生,得到可提供高品质的声音解码装置。
对周期预选中的预选个数取2,因为对用1比特编码的驱动声源的重复周期的选择信号进行解码,因此得到可提供具有最低限附加信息量的高品质声音解码装置的效果。
在周期预选中分别产生把多个驱动声源的候选重复周期原封不动作为适应声源的重复周期时的适应声源,根据产生的适应声源间的距离值可以选择预定个数的驱动声源的候选重复周期,因此可以排除作为原来的音调周期的、概率低的驱动声源的候选重复周期,不要对不必要的重复驱动声源的候选重复周期的选择信息的分配,得到可提供具有最低限附加信息量的高品质声音解码装置的效果。
因为作为对周期预选中的适应声源的重复周期所乘的常数至少包含1/2,1,所以以少数选择枝以及高概率选择包含原来的音调周期的驱动声源的候选重复周期,得到可提供具有最低限附加信息量的高品质的声音解码装置的效果。
实施例3.
图10是示出在本发明实施例3的声音解码装置内的驱动声源编码器5和新附加的听觉加权控制手37结构的方框图。声音编码装置的全体结构包含连接到驱动声源编码器5的附加的听觉加权控制装置37。听觉加权控制装置37由比较器38,强度控制装置39构成。在驱动声源编码器5内的结构是与图17说明的传统结构相同,唯一变更点在于:听觉加权滤波系数计算装置16由听觉加权控制装置37控制。
其次说明动作。
首先,从声音编码装置内的图14所示的线性预测系数编码器3把量化的线性预测系数输入到驱动声源编码器5内的听觉加权滤波系数计算装置16和主响应产生装置18。从适应声源编码器4把变换适应声源编码得到的适应声源重复周期输入到驱动声源编码器5内的主响应产生装置18和听觉加权控制装置37内的比较器38。接着,从适应声源编码器4把输入声音1或从输入声音1扣除由适应声源产生的合成音的信号作为应编码的信号输入到驱动声源编码器5内的听觉加权滤波器17。
听觉加权控制装置37内的比较器38把输入的重复周期与预定阈值进行比较,把比较结果输入到强度控制装置39。作为预定阈值,取使男声和女声的音调周期的分布大体分离的约40的值。
强度控制装置39根据上述比较结果决定控制2个听觉加权滤波器17、19内的加强强度的强度系数,把决定的强度系数输入到驱动声源编码器5内的听觉加权滤波系数计算装置16。在比较器38的比较结果中,当适应声源的重复周期大于预定阈值时,因为男声的可能性高,所以决定强度系数,以便使听觉加权强度减弱。在相反的比较结果,当适应声源的重复周期小于预定阈值时,因为女声的可能性高,所以决定强度系数,以便使听觉加权强度变强。作为强度系数,例如可以采取对用于计算听觉加权滤波系数的线性预测系数相乘值等。
听觉加权滤波系数计算装置16用上述量化线性预测系数和上述强度系数,计算听觉加权滤波系数,把算出的听觉加权滤波系数设定为听觉加权滤波器17和听觉加权滤波器19的滤波系数。
因为以下听觉加权滤波器17,主响应产生装置18,听觉加权滤波器19,预表计算装置20,搜索装置21,声源位置表22的结构和动作与传统的相同,省略其说明。
虽然本实施例的听觉加权控制装置37根据适应源的重复周期大于或小于预定阈值决定强度系数,但是也可以使用2个以上预定阈值更精细地加以控制,或者根据适应声源的重复周期和阈值之差连续地加以控制。
虽然本实施例在驱动声源的编码中使用代数的声源,但本发明不限于代数的声源结构,也可适用于使用其它学习声源编码册或随机声源编码册等的CELP系声音编码装置。
虽然在上述实施例,作为频谱参量用线性预测系数说明,但是用一般广泛使用的LSP等、其它频谱参量的结构也行。
如上所述,如果采用本实施例3,根据适应声源的重复周期值控制听觉加权的强度系数,用这强度系数计算听觉加权用的滤波系数,应用这滤波系数对为了进行驱动声源编码使用的应编码信号进行响觉加权,因此可以对男声、女声双方实现最佳地调整的听觉加权,得到可提供高品质音编码装置的效果。
实施例4.
图11是示出在本发明实施例4的声音编码装置内的驱动声源编码器5和新附加的听觉加权控制装置40结构的方框图。声音编码装置的全体结构包含在图14上附加与驱动声源编码器5连接的听觉加权控制装置40。听觉加权控制装置40由比较器38,强度控制装置39,平均值更新装置41构成。驱动声源编码器5内的结构与图17说明的传统的相同,唯一变更点在于:听觉加权滤波系数计算装置16由听觉加权控制装置40控制。
其次说明其动作。
因为本实施例4是在上述实施例3的听觉加权控制装置37内附加平均值更新装置41构成,现在主要说明这新加部分的动作。从适应声源编码器4把变换适应声源得到的适应声源的重复周期输入到驱动声音编码器5内的主响应产生装置18和听觉加权控制装置40内的平均值更新装置41。
听觉加权控制装置40内的平均值更新装置41用输入的适应声源的重复周期,更新储存在内部的适应声源的重复周期的平均值,把更新的平均值对比较器38输出。作为更新平均值的最简单的方法包括对该帧的重复周期乘以比1小的常数和对以前的平均值乘以(1-α)相加的方法。求平均值的目的是准确决定输入声音是男声或女声,最好对适应声源增益大的帧限制其更新。
而且比较器38把上述更新的平均值与预定阈值进行比较,把比较结果输出到强度控制装置39。强度控制装置39根据上述比较结果决定控制听觉加权滤波器17,19内的加强强度系数,把决定的强度系数输出到驱动声源编码器5内的听觉加权滤波系数计算装置16。在比较器18的比较结果中,当平均值大于预定阈值时,因为男声的可能性高,决定强度系数,以便使听觉加权的强度变弱。在相反的比较结果,平均值小于预定阈值时,因为女声的可能性高,决定强度系数,以便使听觉加权的强度变强。
以下因为听觉加权滤波系数计算装置16,听觉加权滤波器17,主响应产生装置18,听觉加权滤波器19,预表计算装置20,搜索装置21,声源位置表22的结构和动作与传统的相同,省略其说明。
虽然本实施例的听觉加权控制装置40根据适应声源重复周期的平均值是否大于或小于预定阈值决定强度系数,但是使用2个以上预定阈值精细地加以控制或根据适应声源重复周期的平均值和阈值的差连续地控制也是可能的。
虽然在上述实施例,在驱动声源的编码中使用代数的声源,但是本发明不限于代数的声源结构,也可适用于应用其它学习声源编码册或随机声源编码册的CELP系声音编码装置。
虽然在上述实施例,作为频谱参量用线性预测系数说明,但是用一般广泛使用的LSP等、其它频谱参量的结构也行。
如上所述,如果采用本实施例4,根据适应声源的重复周期的平均值,控制听觉加权的强度系数,用这强度系数计算加权用的滤波系数,用这滤波系数对驱动声源的编码中使用的应编码的信号进行听觉加权,因此可能对男声和女声双方实现最佳的调整的听觉加权,得到可提供高品质的声音编码装置的效果。
尤其是通过使用适应声源重复周期的平均值,频繁地变更听觉加权的强度,得到可以控制不稳定印象发生的效果。
实施例5.
图12是示出在本发明实施例5的声音编码装置内的驱动声源编码器5及声音解码装置内的驱动声源解码器12中使用的声源位置表22的图。对图16所示的传统的声源位置表,在每个声源号上附加固定振幅。
如果是在同一表内,则这固定振幅的振幅值根据各声源号的每个候选声源位置提供。在图12的例子中,从1号到3号包括8个候选声音位置,并且提供同一固定振幅1.0。因为声源号4的候选声源位置数较多为16,提供比其它更大的振幅值1.2。因此候选声源位置数越多,则提供越大的振幅数。
用附加这振幅的声源位置表的声源位置搜索可以根据上述式(1)进行,其中
C=∑d″(mk) (8)
E=∑∑φ″(mk,mi) (9)
d″(mk)=akd′(mk) (10)
φ″(mk,mi)=ak aiφ″(mk,mi) (11)
这里ak是K号的脉冲振幅(图12的振幅)。在开始计算脉冲位置全体组合的评价值D前,通过d″和φ″的计算作为预表储存,则随后只需(8)式和(9)式进行简单相加的较少演算量,就可以计算评价值D。
驱动声源的解码,根据声源位置编码,对图12的声源位置表中各声源号中选择各一个声源位置,并在该声源位置上配置乘以对多个声源号提供的各固定振幅的声源。在声源不是脉冲时或对声源进行音调周期化时,因为配置的多个声源的成分重复,所以也可以对重复的部分全部相加。即在传统的代数的声源解码处理中进行附加处理,即乘以对多个声源号提供的各固定振幅。
在传统技术中对每个声源号准备了固定波形,这时必须对每一声源号计算主响应。在本实施例,只需如上所述附加预表的修正。即使在传统技术中位置信息量(即候选数)因声源号而不同,每个声源的振幅值仍维持不变。
如上所述,如果采用本实施例5,对多个声源的每一个根据各声源可能选择的位置提供固定振幅,驱动声源编码器5对配置在各候选位置上的多个声源乘以与多个声源各自对应的固定振幅,并对配置的全部声源相加,产生驱动声源,搜索表示与输入声音之间编码畸变最小的驱动声音对应的声源位置编码以及表示声源极性的极性编码并输出,因此,以简单的结构,几乎不增加处理量,声源装置可以避免把多个声源设置在某固定值带来的浪费,得到可提供高品质声音编码装置的效果。
此外,对多个声源的每一个提供与其各声源可能选择的候选位置有关的固定振幅,对分别配置在根据声音编码中的声音位置编码决定的多个声源位置乘以与其对应的固定振幅,并对配置的全部声源相加,产生驱动声源,因此,以简单的结构,声源装置可以减少把多个声源设置在某固定值带来的浪费,得到可提供高品质的声音解码装置的效果。
实施例6。
图13是示出在本发明实施例6的声音编码装置的驱动声源编码器5结构的方框图。
声音编码装置的全体结构与图14同样。在图13,42是预表修正装置。在本实施例,通过只附加这预表修正装置42使听觉加权的应编码的信号对适应声源正交。
其次说明其动作。
首先从声音编码装置内的线性预测系数编码器3把量化的线性预测系数输入到驱动声源编码器5内的听觉加权滤波系数计算装置16和主响应产生装置18。从适应声源编码器4把变换适应声源编码得到的适应声源的重复周期输入到驱动声源编码器5内的主响应产生装置18内。从适应声源编码器4把输入声音1或从输入声音1减掉由适应声源产生的合成音作为应编码的信号输入到驱动声源编码器5内的听觉加权滤波器17。而且从适应声源编码器4把适应声源输入到驱动声源编码器5内的预表修正装置42。
听觉加权滤波系数计算装置16用上述量化的线性预测系数计算听觉加权滤波系数,把计算的听觉加权滤波系数作为听觉加权滤波器17和听觉加权滤波器19的滤波系数设定。听觉加权滤波器17通过由听觉加权滤波系数计算装置16设定的滤波系数对输入的应编码的信号进行滤波处理。
主响应产生装置18对单位脉冲或固定波形用输入的适应声源的重复周期进行音调周期化处理,把得到的信号作为声源,通过用上述量化的线性预测系数构成的合成滤波器产生合成音,以它作为主响应输出。听觉加权滤波器19通过由听觉加权滤波系数计算装置16设定的滤波系数对输入的主响应进行滤波处理。
预表计算装置20计算在上述听觉加权的应编码的信号和听觉加权的主响应之间的相关值,即计算在听觉加权应编码的信号和根据把预定声源配置在所有的候选声源位置的得到的、信号的多个暂时驱动声源,分别产生的听觉加权的多个合成音之间的相关值作为d(x),并计算听觉加权主响应的相互关系,即计算根据上述多个暂时驱动声源产生的上述多个合成音中的任二个之间的相互关系,作为φ(X,Y)。而且把这些d(x)和φ(X,Y)作为预表储存。
预表修正装置42输入适应声源和预表计算装置20储存的预表,以下根据(12)式及(13)进行修正处理,对得到的结果通过(14)式和(15)式求出声源位置的每一d′(x)和φ′(X,Y),以此作为新的预表储存。
d(x)=d(x)-Cx Ctgt/Pacb (12)
φ(X,Y)=φ(X,Y)-Cx Cy/Pa cb (13)
d′(mk)=|d(mk)| (14)
φ′(mk,mi)=sign[d(mk)] sign[d(mi)]φ′ (mk,mi)
(15)
其中,Ctgt是在听觉加权的应编码信号和听觉加权的适应声源响应(或合成音)之间的相关值,即在听觉加权应编码信号和根据听觉加权的适应声源产生的合成音之间的相关值。
Cx是在把听觉加权的主响应配置在声源位置x上的信号和听觉加权的适应声源响应(合成音)之间的相关值,即在根据与各声源候选位置对应的各暂时驱动声源产生的合成音和根据适应声源产生的合成音之间的相关值。
Pacb是听觉加权的适应声源响应(合成音)的功率。
最后,搜索装置21从声源位置22顺序读出候选声源位置,计算对各声源位置组合的评价值D,根据(1)式,(4)式,(5)式,使用预表修正装置42储存的预表,即使用声源位置的每个d′(x)和φ′(X,Y)进行计算。而且搜索使评价值D最大的声源位置的组合,表示得到的多个声源位置的声源位置编码(在声源位置表内的指数)和表示声源极性的极性编码作为驱动声源编码输出,同时把与该驱动声源编码对应的时序向量作为驱动声源输出。
如上所述,如果采用本实施例,求出根据在应编码信号和适应声源产生的合成音之间的相关值Ctgt,根据与各候选声源对应的各暂时驱动声源产生的合成音和根据适应声源产生的合成声之间的相关值Cx,应用这些值可修正预表,因此不使搜索装置21内的处理量增加,听觉加权的、应编码的信号可对适应声源正交,因此可以改善编码特性,得到可提供高品质的声音编码装置的效果。
如上所述,如果采用本发明,通过包含如下装置:即用多个常数乘以适应声源重复周期求出驱动声源的多个候选重复周期,从这些驱动声源多个候选重复周期中预选预定个,输出预定个数的预选驱动声源的候选重复周期的周期预选装置;对上述周期预选装置输出的上述预定个预选驱动声源的每个候选重复周期,输出编码畸变最小的声源位置信息、声源极性信息以及与这时的编码畸变有关的评价值的驱动声源编码器;在上述驱动声源编码输出的上述预定个数的预选驱动声源的每个候选重复周期得到的编码畸变进行比较,根据其比较结果,选择一个驱动声源的候选重复周期,并输出对其选择结果编码的选择信息和与表示选择的驱动声源的候选重复周期对应的声源极性信息的极性编码的周期编码的装置;即使原来的音调周期和适应声源的重复周期相异时也能通过以高慨率用与原来的音调周期相近的重复周期进行音调周期化产生音调周期化的驱动声源,可以抑制合成音的不稳定印象的发生,可提供高品质的声音编码装置的效果。
如果采用本发明,则周期预选装置预选的驱动声源的候选重复周期的预定个数为2个,通过把周期的编码器选择结果用1比特编码,产生选择信息,得到可提供具有最低附加信息量的高品质声音编码装置的效果。
如果采用本发明,周期预选装置通过把适应声源重复周期与预定阈值进行比较,根据其比较结果选择驱动声源的预定个候选重复周期,去除原来的音调周期概率低的候选重复周期,不要对不必评价的候选重复周期的驱动声源编码处理和选择信息的分配,得到可提供具有最低限附加演算量和信息量的高品质声音编码装置的效果。
如果采用本发明,周期预选装置产生具有与驱动声源的多个候选重复周期分别相等的重复周期的多个其它适应声源,根据产生的这些多个其它适应声源间的距离,通过选择驱动声源预定个候选重复周期,去除原来音调周期的慨率低的驱动声源的候选重复周期,不要对不必评价的候选重复周期的驱动声源编码处理和选择信息分配,得到提供具有最低限附加演算量和信息量的高品质声音编码装置的效果。
如果采用本发明,通过周期预选装置对适应声源的重复周期所乘常数包含1/2,1,以少数选择枝和高慨率能选择包含原来的音调周期的驱动声源的候选重复周期,得到可提供最低限附加演算量和信息量的高品质编码装置的效果。
如果采用本发明,通过包含如下装置,即:用多个常数适应声源的重复周期求驱动声源的多个候选重复周期,从这些驱动声源的多个候选重复周期中预选预定个,输出预定个数的预选驱动声源的候选重复周期的周期预选装置;根据在上述声音编码中包含的驱动声源的重复周期的选择信息,在上述周期预选装置输出的上述预定个数的预选驱动声源候选重复周期内选择1个,并以此作为驱动声源的重复周期输出的周期解码器;根据在上述声音编码内包含的声源位置编码及极性编码产生时序信号,用上述周期解码器输出的上述驱动声源的重复周期输出对上述时序信号音调周期化的时序向量的驱动声源解码器;即使在原来的音调周期与适应声源的重复周期相异时,也能以高概率产生用与原来的音调周期相近的重复周期进行音调周期化的音调周期化的驱动声源,可以抑制合成音不稳定印象的发生,得到可提供高品质的声音解码装置的效果。
如果采用本发明,周期预选装置预选的驱动声源候选重复周期的预定个数为2,通过周期解码器对表示声音编码内包含的、编码期间选择的驱动声源的候选重复周期的1比特编码的选择信息进行解码,得到可提供具有最低附加信息量的高品质的声音解码装置的效果。
如果采用本发明,周期预选装置把适应声源的重复周期与预定阈值进行比较,通过根据其比较结果,选择预定个数的驱动声源的候选重复周期,可去除原来的音调周期慨率低的驱动声源的候选重复周期,不要对不必的驱动声源的候选重复周期的选择信息分配,得到可提供具有最低限附加信息量的高品质的声音解码装置的效果。
如果采用本发明,周期预选装置产生具有与驱动声源的多个候选重复周期分别相等的多个其它适应声源,根据产生的这些多个其它适应声源间的距离,通过选择预定个数的驱动声源的候选重复周期可以去除原来的音调周期低概率的驱动声源的候选重复周期,不要对不必要的驱动声源的候选重复周期的选择信息的分配,得到可提供具有最低限附加信息量的高品质解码装置的效果。
如果采用本发明,通过由周期预选装置对适应声源的重复周期所乘的多个常数包含1/2及1,能以少数选择枝和高概率选择包含原来的音调周期的驱动声源的候选重复周期,得到可提供具有最低限附加信息量的高品质声音解码装置的效果。
如果采用本发明,通过配备以下装置,即:根据适应声源的重复周期,决定听觉加权的强度系数的听觉加权的控制装置;根据上述适应声源的重复周期和上述听觉加权控制装置决定的上述听觉加权强度系数和上述输入声音等应编码的信号,输出表示声源位置信息的声源位置编码和表示声源极性信息的极性编码的驱动声源编码器;对男声和女双方进行最佳调整的听觉加权是可能的,得到可提供高品质的声音编码装置的效果。
如果采用本发明,听觉加权控制装置通过根据适应声源的重复周期和过去的适应声源的重复周期的平均值决定听觉加权的强度系数,对男声和女声两方进行最佳调整的听觉加权是可能的,听觉加权的强度频繁变更,具有可抑制不稳定印象的发生的效果。
如果采用本发明,则通过配置以下表和装置,即对多个声源的每一个,包含可能选择的多个候选位置以及根据这些候选数决定的固定振幅的声源位置表;参照该声源位置,对上述多个声源以与其分别对应的固定振幅,把上述多个声源配置在与其分别对应的候选位置上,这样对乘以固定振幅配置的上述多个声源进行相加产生驱动声源,选择提供上述输入声音之间编码畸变最小的驱动声源的上述多个声源的候选位置及极性,产生声源编码及极性的驱动声源编码器;可以简单结构、几乎不增加处理量,可以减少与声源的每个振幅有关的浪费,得到可提供高品质声音编码装置的效果。
根据本发明,因具有声源位置表,用于对上述多个声源的每一个,包含可能选择的多个候选位置以及由这些候选数决定的固定振幅;驱动声源解码器,用于根据在上述声音编码中包含的声源位置编码,参照上述声源位置表,选择上述多个声源各自的候选位置,对上述多个声源分别乘以相应的固定振幅,把上述多个声源配置在分别选择的候选位置上,并对乘以相应的固定振幅、配置的上述多个声源相加,产生驱动声源,故可以简单的结构,可以减少与声源的每个振幅有关的浪费,得到可提供高品质声音编码装置的效果。
如果采用本发明,则通过配置如下装置,即:计算在输入声音等的应编码信号和根据把预定的声源配置在所有声源各候选位置上的作为信号的多个暂时声源分别产生的各合成音之间的相关值,同时计算在上述多个合成音中任两个之间的相互关系,作为预表储存的预表计算装置;计算在上述应编码的信号和根据上述适应声源产生的合成音之间的相关值,同时计算根据上述各暂时驱动声源产生的上述合成音和根据上述适应声源产生的上述合成音之间的相关值,用计算的这些相关值,修正上述预表的预表修正装置;用上述修正的预表决定上述多个声源位置及极性,输出表示上述声源位置的位置编码和表示上述极性的极性编码的搜索装置;不增加搜索装置内的处理量可以使听觉加权应编码的信号对适应声源正交,因此可以改善编码的特性,得到可提供高品质声音编码装置的效果。
Claims (2)
1.一种声音编码装置,应用由过去的音源产生的适应声源和由输入声音和上述适应声源产生的,用多个声源位置以及极性表现的驱动声源对上述输入声音按帧单位编码,输出声音编码,其特征为包含:
声源位置表:用于对上述多个声源的每一个,包含可能选择的多个候选位置及其由候选数决定的固定振幅;
驱动声源编码器,用于参照该声源位置表,对上述多个声源分别乘以相应的固定振幅并把多个声源配置在与其对应的候选位置上,对乘以相应的固定振幅、配置的上述多个音源相加产生驱动声源,选择具有上述输入声音之间编码畸变最小的驱动声源的上述多个声源的候选位置以及极性,产生声源位置编码以及极性编码。
2.一种声音解码装置,用于输入声音编码,应用由过去的声源产生的适应声源和从上述声音编码和上述适应声源产生、用多个声源位置以及极性表现的驱动声源,从上述声音编码按帧单位使声音解码,其特征为包含:
声源位置表,用于对上述多个声源的每一个,包含可能选择的多个候选位置以及由这些候选数决定的固定振幅;
驱动声源解码器,用于根据在上述声音编码中包含的声源位置编码,参照上述声源位置表,选择上述多个声源各自的候选位置,对上述多个声源分别乘以相应的固定振幅,把上述多个声源配置在分别选择的候选位置上,并对乘以相应的固定振幅、配置的上述多个声源相加,产生驱动声源。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP317205/1999 | 1999-11-08 | ||
JP31720599A JP3594854B2 (ja) | 1999-11-08 | 1999-11-08 | 音声符号化装置及び音声復号化装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB001329227A Division CN1135528C (zh) | 1999-11-08 | 2000-11-07 | 声音编码装置以及声音解码装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1495704A true CN1495704A (zh) | 2004-05-12 |
Family
ID=18085645
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB001329227A Expired - Fee Related CN1135528C (zh) | 1999-11-08 | 2000-11-07 | 声音编码装置以及声音解码装置 |
CNA031410227A Pending CN1495704A (zh) | 1999-11-08 | 2000-11-07 | 声音编码装置以及声音解码装置 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB001329227A Expired - Fee Related CN1135528C (zh) | 1999-11-08 | 2000-11-07 | 声音编码装置以及声音解码装置 |
Country Status (5)
Country | Link |
---|---|
US (2) | US7047184B1 (zh) |
EP (4) | EP2028650A3 (zh) |
JP (1) | JP3594854B2 (zh) |
CN (2) | CN1135528C (zh) |
DE (1) | DE60041235D1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102682778A (zh) * | 2007-03-02 | 2012-09-19 | 松下电器产业株式会社 | 编码装置以及编码方法 |
CN110518915A (zh) * | 2019-08-06 | 2019-11-29 | 福建升腾资讯有限公司 | 一种比特位计数编码以及解码方法 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10154932B4 (de) * | 2001-11-08 | 2008-01-03 | Grundig Multimedia B.V. | Verfahren zur Audiocodierung |
US7251597B2 (en) * | 2002-12-27 | 2007-07-31 | International Business Machines Corporation | Method for tracking a pitch signal |
FI118704B (fi) | 2003-10-07 | 2008-02-15 | Nokia Corp | Menetelmä ja laite lähdekoodauksen tekemiseksi |
US8688437B2 (en) | 2006-12-26 | 2014-04-01 | Huawei Technologies Co., Ltd. | Packet loss concealment for speech coding |
US8271273B2 (en) * | 2007-10-04 | 2012-09-18 | Huawei Technologies Co., Ltd. | Adaptive approach to improve G.711 perceptual quality |
KR101235830B1 (ko) * | 2007-12-06 | 2013-02-21 | 한국전자통신연구원 | 음성코덱의 품질향상장치 및 그 방법 |
CA2810995A1 (en) * | 2010-09-17 | 2012-03-22 | Panasonic Corporation | Quantization device and quantization method |
CN105551497B (zh) * | 2013-01-15 | 2019-03-19 | 华为技术有限公司 | 编码方法、解码方法、编码装置和解码装置 |
TWI557727B (zh) | 2013-04-05 | 2016-11-11 | 杜比國際公司 | 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61134000A (ja) | 1984-12-05 | 1986-06-21 | 株式会社日立製作所 | 音声分析合成方式 |
JPS6396699A (ja) | 1986-10-13 | 1988-04-27 | 松下電器産業株式会社 | 音声符号化装置 |
JPH01200296A (ja) | 1988-02-04 | 1989-08-11 | Nec Corp | 音声符号化装置 |
JPH028900A (ja) | 1988-06-28 | 1990-01-12 | Nec Corp | 音声符号化復号化方法並びに音声符号化装置及び音声復合化装置 |
JP2538450B2 (ja) | 1991-07-08 | 1996-09-25 | 日本電信電話株式会社 | 音声の励振信号符号化・復号化方法 |
JP3099836B2 (ja) | 1991-07-08 | 2000-10-16 | 日本電信電話株式会社 | 音声の励振周期符号化方法 |
US5233660A (en) * | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
JPH0830299A (ja) * | 1994-07-19 | 1996-02-02 | Nec Corp | 音声符号化装置 |
US5781880A (en) * | 1994-11-21 | 1998-07-14 | Rockwell International Corporation | Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual |
DE69609089T2 (de) * | 1995-01-17 | 2000-11-16 | Nec Corp., Tokio/Tokyo | Sprachkodierer mit aus aktuellen und vorhergehenden Rahmen extrahierten Merkmalen |
FR2734389B1 (fr) * | 1995-05-17 | 1997-07-18 | Proust Stephane | Procede d'adaptation du niveau de masquage du bruit dans un codeur de parole a analyse par synthese utilisant un filtre de ponderation perceptuelle a court terme |
US5732389A (en) * | 1995-06-07 | 1998-03-24 | Lucent Technologies Inc. | Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures |
WO1998006091A1 (fr) * | 1996-08-02 | 1998-02-12 | Matsushita Electric Industrial Co., Ltd. | Codec vocal, support sur lequel est enregistre un programme codec vocal, et appareil mobile de telecommunications |
JP3360545B2 (ja) | 1996-08-26 | 2002-12-24 | 日本電気株式会社 | 音声符号化装置 |
JP3174742B2 (ja) | 1997-02-19 | 2001-06-11 | 松下電器産業株式会社 | Celp型音声復号化装置及びcelp型音声復号化方法 |
US6453288B1 (en) * | 1996-11-07 | 2002-09-17 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for producing component of excitation vector |
US6202046B1 (en) * | 1997-01-23 | 2001-03-13 | Kabushiki Kaisha Toshiba | Background noise/speech classification method |
US6408268B1 (en) | 1997-03-12 | 2002-06-18 | Mitsubishi Denki Kabushiki Kaisha | Voice encoder, voice decoder, voice encoder/decoder, voice encoding method, voice decoding method and voice encoding/decoding method |
JP3582693B2 (ja) | 1997-03-13 | 2004-10-27 | 日本電信電話株式会社 | 音声符号化方法 |
JP3520955B2 (ja) | 1997-04-22 | 2004-04-19 | 日本電信電話株式会社 | 音響信号符号化法 |
US6507814B1 (en) * | 1998-08-24 | 2003-01-14 | Conexant Systems, Inc. | Pitch determination using speech classification and prior pitch estimation |
JP2001075600A (ja) * | 1999-09-07 | 2001-03-23 | Mitsubishi Electric Corp | 音声符号化装置および音声復号化装置 |
-
1999
- 1999-11-08 JP JP31720599A patent/JP3594854B2/ja not_active Expired - Fee Related
-
2000
- 2000-10-24 EP EP20080019950 patent/EP2028650A3/en not_active Withdrawn
- 2000-10-25 EP EP20080019949 patent/EP2028649A3/en not_active Withdrawn
- 2000-10-25 EP EP09014426A patent/EP2154682A3/en not_active Withdrawn
- 2000-10-25 DE DE60041235T patent/DE60041235D1/de not_active Expired - Lifetime
- 2000-10-25 EP EP00123107A patent/EP1098298B1/en not_active Expired - Lifetime
- 2000-11-07 US US09/706,813 patent/US7047184B1/en not_active Ceased
- 2000-11-07 CN CNB001329227A patent/CN1135528C/zh not_active Expired - Fee Related
- 2000-11-07 CN CNA031410227A patent/CN1495704A/zh active Pending
-
2010
- 2010-01-28 US US12/695,942 patent/USRE43190E1/en not_active Expired - Fee Related
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102682778A (zh) * | 2007-03-02 | 2012-09-19 | 松下电器产业株式会社 | 编码装置以及编码方法 |
CN102682778B (zh) * | 2007-03-02 | 2014-10-22 | 松下电器(美国)知识产权公司 | 编码装置以及编码方法 |
CN110518915A (zh) * | 2019-08-06 | 2019-11-29 | 福建升腾资讯有限公司 | 一种比特位计数编码以及解码方法 |
CN110518915B (zh) * | 2019-08-06 | 2022-10-14 | 福建升腾资讯有限公司 | 一种比特位计数编码以及解码方法 |
Also Published As
Publication number | Publication date |
---|---|
JP3594854B2 (ja) | 2004-12-02 |
EP2154682A3 (en) | 2011-12-21 |
EP1098298A2 (en) | 2001-05-09 |
JP2001134297A (ja) | 2001-05-18 |
USRE43190E1 (en) | 2012-02-14 |
EP1098298B1 (en) | 2008-12-31 |
US7047184B1 (en) | 2006-05-16 |
EP2154682A2 (en) | 2010-02-17 |
EP2028650A3 (en) | 2011-08-10 |
EP2028649A2 (en) | 2009-02-25 |
DE60041235D1 (de) | 2009-02-12 |
CN1295317A (zh) | 2001-05-16 |
EP2028650A2 (en) | 2009-02-25 |
EP1098298A3 (en) | 2002-12-11 |
CN1135528C (zh) | 2004-01-21 |
EP2028649A3 (en) | 2011-07-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1172294C (zh) | 音频编码装置、音频编码方法、音频解码装置及音频解码方法 | |
CN1252681C (zh) | 一种码激励线性预测语音编码器的增益量化 | |
CN1187735C (zh) | 多模式话音编码装置和解码装置 | |
CN1200403C (zh) | 线性预测编码参数的矢量量化装置 | |
CN1172292C (zh) | 在编码宽带信号中用于适应性带宽音调搜寻的方法与设备 | |
CN1212606C (zh) | 处理丢失帧的语音通信系统及方法 | |
CN1185625C (zh) | 语音编码方法及语音编码装置 | |
CN1192358C (zh) | 声音信号加工方法和声音信号加工装置 | |
CN1220178C (zh) | 在码本中进行搜索以对声音信号编码的方法和设备 | |
CN1097396C (zh) | 声音编码装置和方法 | |
CN1252679C (zh) | 声音编码装置、声音编码译码装置、以及声音编码方法 | |
CN1248195C (zh) | 语音编码转换方法和装置 | |
CN1957399A (zh) | 语音/音频解码装置以及语音/音频解码方法 | |
CN1689069A (zh) | 声音编码设备和声音编码方法 | |
CN1457425A (zh) | 用于语音编码的码本结构与搜索 | |
CN1977311A (zh) | 语音编码装置、语音解码装置及其方法 | |
CN1135528C (zh) | 声音编码装置以及声音解码装置 | |
CN1291375C (zh) | 声信号编码方法和设备、解码方法和设备 | |
CN1222926C (zh) | 语音编码方法及其装置 | |
CN1890714A (zh) | 一种优化的复合编码方法 | |
CN1122256C (zh) | 用前向和反向线性预测编码分析编码音频信号的方法和装置 | |
CN1947173A (zh) | 分层编码装置及分层编码方法 | |
CN1890713A (zh) | 用于数字信号压缩编码的多脉冲字典的索引间的编码转换 | |
CN1293535C (zh) | 声音编码设备和方法以及声音解码设备和方法 | |
CN1135530C (zh) | 声音编码装置和声音译码装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |