CN1132156C - 具有减少复杂性的合成滤波器的celp语音编码器 - Google Patents
具有减少复杂性的合成滤波器的celp语音编码器 Download PDFInfo
- Publication number
- CN1132156C CN1132156C CN97190315A CN97190315A CN1132156C CN 1132156 C CN1132156 C CN 1132156C CN 97190315 A CN97190315 A CN 97190315A CN 97190315 A CN97190315 A CN 97190315A CN 1132156 C CN1132156 C CN 1132156C
- Authority
- CN
- China
- Prior art keywords
- activation sequence
- signal
- composite
- obtains
- input end
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000015572 biosynthetic process Effects 0.000 title abstract 3
- 238000003786 synthesis reaction Methods 0.000 title abstract 3
- 238000001914 filtration Methods 0.000 claims abstract description 25
- 230000004913 activation Effects 0.000 claims description 129
- 239000002131 composite material Substances 0.000 claims description 93
- 238000004458 analytical method Methods 0.000 claims description 30
- 230000005540 biological transmission Effects 0.000 claims description 21
- 238000000034 method Methods 0.000 claims description 12
- 230000002194 synthesizing effect Effects 0.000 claims description 2
- 230000005284 excitation Effects 0.000 abstract description 29
- 230000003044 adaptive effect Effects 0.000 description 51
- 230000004044 response Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 238000005086 pumping Methods 0.000 description 10
- 238000012546 transfer Methods 0.000 description 8
- 238000006073 displacement reaction Methods 0.000 description 6
- 238000010276 construction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000009941 weaving Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0013—Codebook search algorithms
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
在CELP编码器中进行了在目标信号和多个合成信号之间的比较。合成信号通过具有从目标信号得出的参量的合成滤波器对多个激励序列进行滤波而被得出。导致在目标信号和合成信号之间的最小误差的激励信号被选出。搜寻最佳激励信号需要很大的计算复杂性。为了减少复杂性,通过使用减少复杂性的合成滤波器预选少量的激励序列。用该少量激励序列进行完全复杂性的搜寻。由于在最后选择时的减少数目的激励序列,因此减少了所需要的计算复杂性。
Description
本发明涉及包括用于通过传输信道把输入信号发送给接收机的发射机在内的传输系统,该发射机包括编码器,它具有用于产生多个激励序列的激励序列产生器,和选择装置,用于选择激励序列,以导致在从所述激励序列得到的合成信号与从输入信号得到的目标信号之间的最小误差,该发射机被设计来发射代表选择的激励序列的信号给接收机,该接收机包括译码器,它具有用于从代表选择的激励序列的信号得到选择的激励序列的激励序列产生器,和合成滤波器,用于从激励序列得到合成的信号。
本发明也涉及发射机,编码器,传输方法和编码方法。
按照前序的传输系统可从W.Grieder等写的论文“对于4.8kbpsCELP语音编码器的码本搜寻”(“Codebook searching for 4.8kbpsCELP speech coder”)中得知,其发表于1993年5月17~18日在加拿大Sakatoon的现代环境会议中的通信、计算机和功率中,并被登录在1993年的IEEE Wescanex第397~406页。
这种传输系统可被用于通过诸如无线信道,同轴电缆或光纤等的传输媒体的语音信号传输。这种传输系统也可被用于在诸如磁带或盘等的记录媒体上记录语音信号。可能的应用是自动回答机或口述录音机。
在现代语音传输系统中,要被发送的语音信号常常藉使用分析-合成技术来被编码。在这种技术中,合成信号藉助于由多个激励序列激励的合成滤波器而被产生。对于多个激励序列确定了合成的语音信号,且确定了代表在合成信号和从输入信号得到的目标信号之间的误差的误差信号。选择导致最小误差的激励序列,并以编码形式发送给接收机。
在接收机中,恢复激励序列,并通过把激励序列加到合成的滤波器来产生合成信号。该合成信号是发射机的输入信号的复制品。
为了得到良好质量的信号传输,大量的(例如1024个)激励序列被牵涉到用于选择。在语音编码的情况下,激励序列通常是2~5毫秒持续时间的一段。在16KHz的采样频率的情况下,这意味着32~80个样本。合成滤波器的参量通常从代表输入信号的特征性质的分析参量得出。在语音编码时,大多数使用的分析参量是所谓的预测参量。预测参量的数目可从10变动到50,因此,合成滤波器的阶数也可从10变动到50。
必须对所有激励序列计算合成的语音信号,这导致了很大的计算负担。
本发明的目的是提供其中计算负担大为减小的按照前序中的传输系统。
因此,按照本发明的传输系统的特征在于,编码器包括用于从多个激励序列得到多个合成信号的减少复杂性的合成滤波器,以及选择装置被设计来选择激励序列,以导致在相应的合成信号和目标信号之间的最小误差。
本发明是基于惊异地认识到合成滤波器的复杂性可大为减少而不影响选择处理的质量。实验结果已惊奇地显示,减少复杂性的合成滤波器的阶数可比合成滤波器的阶数低10倍,而对编码质量没有显著的不利影响。
本发明的实施例的特征在于,选择装置被设计来选择至少一个另外的激励序列,编码器包括一个附加的合成滤波器,被设计来从至少两个激励序列得出附加的合成信号,以及选择装置被设计来从至少两个激励序列中选择激励序列以导致在相应的附加合成输入信号和从作为选择的激励序列的输入信号得到的参考信号之间的最小误差。
在本实施例中,基于对减少复杂性的合成滤波器的使用,预选至少两个激励序列。然后通过使用更复杂的合成滤波器,进行最后选择。该合成滤波器可以和接收机中的合成滤波器相同,但也可能是,它与接收机中的合成滤波器相比较,具有减少的复杂性。可以看到,参考信号可以和目标信号相同,但也可能是,这些信号是不同的。
本发明的另一个实施例的特征在于,编码器包括分析装置,用于得出代表输入信号特征性质的多个分析参量和把所述分析参量加到合成滤波器,以及分析装置被设计来得出一个减少的分析参量集和把所述减少的分析参量集加到减少复杂性的合成滤波器。
在本实施例中,合成滤波器和减少复杂性的合成滤波器的性质都取决于输入信号的性质。这确保了减少复杂性的合成滤波器总是近似于完全复杂性的合成滤波器。
本发明的再一个实施例的特征在于,分析装置被设计来以递归方式确定多个分析参量,以及减少的分析参量集是从在确定多个分析参量的递归方式中得到的中间结果导出的。
藉助于从在确定多个分析参量的递归方式中得到的中间结果确定减少的分析参量集,可以得出,为得到减少的分析参量集不需要进行附加的计算。
现在将参照附图来解释本发明。
这里显示了:
图1.可应用本发明的传输系统;
图2.按照本发明的编码器;
图3.用于从主序列预选多个激励序列的自适应码本选择装置的一部分;
图4.用于选择至少一个另外的激励序列的选择装置的一部分;
图5.按照本发明的激励序列选择装置;
图6.按照本发明的固定码本选择装置;
图7.在按照图1的传输系统中所使用的译码器。
在按照图1的传输系统中,输入信号被加到发射机2。在发射机2中,输入信号通过使用按照本发明的编码器而被编码。编码器4的输出信号被加到发射装置6的输入端,用于通过传输媒体8把编码器4的输出信号发送到接收机10。发射装置的工作可包括把来自编码器的(二进制)信号,可能以二进制方式调制到适用于传输媒体8的载波信号上。在接收机10中,接收的信号由前端12被变换成适用于译码器14的信号。前端12的工作可包括滤波,解调和对二进制符号的检测。译码器14从来自前端12的输出信号得出重建的输入信号。
在按照图2的编码器中,载送数字化输入信号的样本i[n]的编码器4的输入端连接到帧构建装置20的输入端。载有输出信号x[n]的帧构建装置的输出端连接到高通滤波器22。载有输出信号s[n]的高通滤波器22的输出端连接到感知加权滤波器32和LPC分析器24的输入端。载有输出信号r[k]的LPC分析器24的第一输出端连接到量化器26。LPC分析器的第二输出端载有用于减少复杂性的合成滤波器的滤波器系数af。
载有输出信号c[k]的量化器26的输出端连接到内插器28的输入端和多路复接器59的第一输入端。载有信号aq[k][s]的内插器28的输出端连接到感知加权滤波器32的第二输入端、零输入响应滤波器34的输入端和冲激响应计算器36的输入端。载有信号w[n]的感知加权滤波器32的输出端连接到减法器38的第一输入端。载有输出信号z[n]的零输入响应滤波器34的输出端连接到减法器38的第二输入端。
载有目标信号t[n]的减法器38的输出端连接到自适应码本选择装置40与自适应码本预选装置42的输入端和减法器41的输入端。载有输出信号h[n]的冲激响应计算器36的输出端连接到自适应码本选择装置40的输入端、自适应码本预选装置42的输入端、固定码本选择装置44的输入端和又被称为固定码本预选装置46的激励信号选择装置的输入端。载有输出信号ia[k]的自适应码本预选装置42的输出端连接到自适应码本选择装置40的输入端。自适应码本预选装置42、自适应码本选择装置40、固定码本预选装置46和固定码本选择装置44的组合构成选择装置45。
载有输出信号Ga的自适应码本选择装置的第一输出端连接到多路复接器59的第二输入端和乘法器52的第一输入端。载有输出信号Ia的自适应码本选择装置的第二输出端连接到多路复接器59的第三输入端和自适应码本48的输入端。载有输出信号p[n]的自适应码本选择装置40的第三输出端连接到减法器41的第二输入端。
载有输出信号e[n]的减法器42的输出端连接到固定码本选择装置44的第二输入端和固定码本预选装置46的第二输入端。载有输出信号if[k]的固定码本预选装置46的输出端连接到固定码本选择装置44的第三输入端。载有输出信号Gf的固定码本选择装置的第一输出端连接到乘法器54的第一输入端和多路复接器59的第四输入端。载有输出信号P的固定码本选择装置44的第二输出端连接到激励产生器50的第一输入端和多路复接器59的第五输入端。载有输出信号L[k]的固定码本选择装置44的第三输出端连接到激励产生器50的第二输入端和多路复接器59的第六输入端。载有输出信号yf[n]的激励产生器50的输出端连接到乘法器54的第二输入端。载有输出信号ya[n]的自适应码本48的输出端连接到乘法器52的第二输入端。乘法器52的输出端连接到加法器56的第一输入端。乘法器54的输出端连接到加法器56的第二输入端。载有输出信号yaf[n]的加法器56的输出端连接到存储器更新单元58,后者被连到自适应码本48。
多路复接器59的输出构成编码器59的输出。
按照图2的编码器的实施例是在假设输入信号是具有从0~7KHz频率范围的宽带语音信号的情况下被解释的。假设16KHz的采样速率。然而,可以看到,本发明并不限于这种类型的信号。
在帧构建装置20中,语音信号i[n]被划分成N个信号样本序列x[n],也被称为帧。这样的帧的持续时间典型地为10~30毫秒。藉助于高通滤波器22,编成帧的信号的直流分量被除去,这样无直流的信号可在高通滤波器22的输出端上提供。藉助于线性预测分析器24,确定了K个线性预测系数a[k]。对于窄带语音,K典型地为8和12之间,对于宽带语音,K在16到20之间,然而除这些典型值以外的数值也是可能的。线性预测系数被使用在将在后面解释的合成滤波器中。
为了计算预测系数a[k],信号s[n]首先用汉明(Hamming)窗被加权,以得到加权的信号sw[n]。藉助于先计算自相关系数然后执行用于递归地确定数值a[k]的Levinson-Durbin算法,从信号sw[n]得出预测系数a[n]。第一递归步骤的结果作为af被存储,供在减少复杂性的合成滤波器中使用。替换地,有可能存储第二递归步骤的结果af1和af2作为减少复杂性的合成滤波器的参量。可以看到,如果使用二阶减少复杂性的合成滤波器,则可能仅执行预选。然后,使用完全复杂性的合成滤波器的选择可被省去。为消除在由预测参量a[k]表示的频谱包络中的极尖的峰值,藉助于把每个系数a[k]乘以数值γk来执行带宽扩展运算。修改的预测系数ab[k]被转换成对数域比值r[k]。
量化器26以非均匀方式量化对数域比值,以便减少为发射对数域比值到接收机要被使用的比特数目。量化器26产生表明对数域比值的量化电平的信号c[k]。
为了选择用于合成滤波器的最佳激励序列,帧s[n]被再分成S个子帧。为了达到平滑滤波过渡,内插器28执行对于每个子帧的当前指数c[k]和先前的指数Cp[k]之间的线性内插,并把相应的对数域比值变换回预测参量aq[k][s]。s等于当前子帧的指数。
在由合成编码器进行的分析中,语音信号帧(或子帧)与多个合成的语音帧进行比较,每个合成的语音帧相应于由合成滤波器滤波的不同的激励序列。合成滤波器的转移函数等于1/A(z),而A(z)等于: 在(1)式中,P是预测阶数,k是运行指数,和z-1是单位延时算子。为了研究人的听觉系统的感知性质,在语音帧和合成的语音帧之间的差值由具有转移函数A(z)/A(z/γ)的感知加权滤波器进行滤波。γ是常数,通常其数值约为0.8。所选择的最佳激励信号是导致感知加权滤波器的输出信号的最小功率的激励信号。
在大多数语音编码器中,感知加权滤波操作是在比较操作之前进行。这意味着,语音信号必须由具有转移函数A(z)/A(z/γ)的滤波器进行滤波以及合成滤波器必须由具有转移函数1/A(z/γ)的修正的合成滤波器替代。可以看到,其它类型的感知加权滤波器也在使用,例如具有转移函数A(z/γ1)/A(z/γ2)的滤波器。感知加权滤波器32按照如上讨论的转移函数A(z)/A(z/γ)执行对语音信号的滤波。感知加权滤波器32的参量在每个子帧用内插的预测参量aq[k][s]被更新。可以看到,本发明的范围包括感知加权滤波器的转移函数的所有变形和感知加权滤波器的所有位置。
修正的合成滤波器的输出信号也取决于来自先前子帧的所选择的激励序列。取决于当前激励序列的合成语音信号的各部分和先前的激励序列可被分开。因为零输入滤波器的输出信号与当前激励序列无关,所以当用图2的滤波器34进行时它可被移到语音信号路径上。
因为修正的合成滤波器的输出信号被从感知加权的语音信号中减去,所以零输入响应滤波器34的信号也必须被从感知加权的语音信号中减去。此减法由减法器38执行。在减法器38的输出端可得到目标信号t[n]。
编码器4包括本地译码器30。本地译码器30包括自适应码本48,它随后存储多个先前选择的激励序列。自适应码本48用自适应码本的指数Ia来寻址。自适应码本48的输出信号ya[n]由乘法器52用增益系数Ga按比例调节。本地译码器30也包括激励产生器50,它被设计来产生多个预定的激励序列。激励序列yf[n]是所谓的规则脉冲激励序列。它包括多个由多个具有零值的样本分隔开的激励样本。激励样本的位置由参量PH(相位)表示。激励样本可以具有数值-1,0和+1中的一个值。激励样本的数值由变量L[k]给出。激励产生器50的输出信号yf[n]由乘法器54用增益系数Gf按比例调节。乘法器52和54的输出信号被加法器56加到激励信号yaf[n]上。该信号yaf[n]被存储在自适应码本48中供下一个子帧使用。
在自适应码本预选装置42中,确定减少的激励序列集。这些序列的指数ia[k]被传送到自适应码本选择装置40。在自适应码本预选装置42中,按照本发明,使用了一阶减少复杂性的合成滤波器。另外,不是考虑所有可能的激励序列,而是考虑具有相互位移至少两个位置的减少数目的激励序列。一个好的选择是在2到5的范围内的位移。所使用的合成滤波器的复杂性的减少和所考虑的激励序列数目的减少给出了编码器复杂性的很大的减小。
自适应码本选择装置40被设计来从预选的激励序列得出最佳激励序列。在这种选择中,使用完全复杂性的合成滤波器,并尝试了在预选的激励序列的邻近范围内的少量的激励序列。在尝试的激励序列之间的位移小于在预选时所使用的位移。按照本发明,在编码器中使用了为1的位移。由于所涉及到的少量的激励序列,最后选择的附加复杂性较低。自适应码本选择装置也产生信号p[n],它是通过由加权的合成滤波器对存储的激励序列进行滤波和把合成信号乘以数值Ga而得出的合成信号。
减法器41从目标信号t[n]中减去信号p[n],以得出差值信号e[n]。在固定码本预选装置46中,从信号e[n]得出后向滤波的目标信号tf[n]。从可能的激励序列中,预选最类似于滤波的目标信号的激励序列,并把它们的指数if[k]传送到固定码本选择装置46。固定码本选择装置44从由固定码本预选装置46预选的激励信号中搜寻最佳激励信号。在这种搜寻中,使用完全复杂性的合成滤波器。信号C[k],Ga,Ia,Gf,PH和L[k]由多路复接器59被复接成一个单个输出信息流。
冲激响应值h[n]由冲激响应计算器36从预测参量aq[k][s]按照递归来计算:
h[n]=0 ;n<0
h[n]=1 ;n=0 在(2)式中,Nm是所需要的冲激响应长度。在本系统中,该长度等于子帧中的样本数目。
在按照图3的自适应码本预选装置42中,目标信号t[n]被加到时间反演器(reverser)50的输入端。时间反演器50的输出端连接到零状态滤波器52的输入端。零状态滤波器52的输出端连接到时间反演器54的输入端。时间反演器54的输出端连接到互相关器56的第一输入端。互相关器56的输出端连接到除法器64的第一输入端。
自适应码本48的输出端连接到互相关器56的第二输入端和通过选择开关49连接到减少复杂性的零状态合成滤波器60的输入端。选择开关的另一端也连接到存储器更新单元58的输出端。减少复杂性的合成滤波器60的输出端连接到能量估值器62的输入端。能量估值器62的输出端连接到能量表63的输入端。能量表63的输出端连接到除法器64的第二输入端。除法器64的输出端连接到峰值检波器65的输入端,以及峰值检波器65的输出端连接到选择器66的输入端。选择器66的第一输出端连接到自适应码本48的输入端,用于选择不同的激励序列。载有表示来自自适应码本的预选择的激励序列的信号的选择器66的第二输出端连接到自适应码本48的选择输入端和能量表63的选择输入端。
自适应码本预选装置42被设计来从自适应码本选择激励序列和相应的增益系数ga。该运算可被写作为使等于下式的误差信号
最小化:在(3)式中,Nm是子帧中的样本数,y[l][n]是零-状态合成滤波器对激励序列ca[l][n]的响应.通过把(3)式对ga进行微分并令导数等于零,可找到ga的最佳值: 把(4)式代入(3)式,可给出
使
最小化相当于使(5)式中的第二项f[l]对l的最大化。f[l]也可被写为: 在(6)式中,h[n]是图3的滤波器52的冲激响应,如按照(2)式所计算的那样。(6)式也可被写为: (7)式被用于自适应码本的预选。使用(7)式的优点在于,为确定(7)式的分子,对于所有的码本的项只需要一次滤波运算。使用(6)式会需要对于涉及预选的每个码本项进行一次滤波运算。为确定(7)式的分母,其计算仍需要对码本的所有项进行滤波,使用了减少复杂性的合成滤波器。
f[l]的分母Ea是所涉及的用减少复杂性的合成滤波器60进行滤波的激励序列的能量。实验表明,单个滤波器系数改变得相当慢,所以该系数只需要每帧更新一次。也有可能每帧只计算一次激励序列能量,但这需要稍加修改的选择程序。为从自适应码本预选激励序列,可按照下式计算从(7)式得出的测量值rap[i·Lm+l]: 在(8)式中,i和l是运行参量,」Lmin是所考虑的语音信号的最小可能的音节周期,Nm是每个子帧的样本数,Sa是在随后的激励序列之间的位移,及Lm是决定每个子帧存储的能量值数目的常数,它等于对于0≤l<Lm和0≤i<S进行按照(8)式的搜寻。这种搜寻被设计成总是包括相应于先前写入自适应码本48的激励序列的起始部分的第一码本项。这就允许再使用被存储在能量表63中的先前计算的能量值。
在更新自适应码本48的时刻,先前子帧的所选择的激励信号yaf[n]存在于存储器更新单元58中。选择开关49是在位置0,及新的可供使用的激励序列由减少复杂性的合成滤波器60滤波。新滤波的激励序列的能量值被存储在Lm存储位置。在存储器63中已存在的能量值被向下移位。最老的Lm能量值从存储63移出,因为相应的激励序列不再存在于自适应码本中。目标信号ta[n]由时间反演器50,滤波器52和时间反演器54的组合进行计算。相关器56计算(8)式的分子,和除法器64进行(8)式的分子除以(8)式的分母的运算。峰值检波器65确定给出(8)式的Pa最大值的码本指数的指数。选择器66加上由峰值选择器56找到的Pa序列的相邻激励序列的指数,并把所有这些指数传送到自适应码本选择器40。
在帧的中段(在S/2子帧通过以后),af值被更新。然后,选择开关被置于位置1,及相应于被牵涉到用于自适应码本预选的激励序列的所有能量值被重新计算和存储在存储器63中。
在按照图4的自适应码本选择器40中,自适应码本48的输出端连接到(完全复杂性的)零-状态合成滤波器70的输出端。合成滤波器70接收来自计算器36的其冲激响应参量。合成滤波器70的输出端连接到相关器72的输入端和能量估算器74的输入端。目标信号t[n]被加到相关器72的第二输入端。相关器72的输出端连接到除法器76的第一输入端。能量估算器74的输出端连接到除法器76的第二输入端。除法器76的输出端连接到选择器78的第一输入端。预选的激励序列的指数ia[k]被加到选择器78的第二输入端。选择器的第一输出端连接到自适应码本48的选择输入端。选择器78的另外两个输出端提供输出信号Ga和Ia。
选择最佳激励序列相当于使ra[r]项最大化。所述ra[r]项等于: (9)式相当于(5)式中的f[l]项。信号y[r][n]由滤波器70从激励序列得出。滤波器70的初始状态在激励序列被滤波之前每次被设置为零。假定变量ia[r]包含预选的激励序列的指数以及其以增加的指数次序的相邻者。这意味着,ia[r]包含Pa个随后的指数组,每个组包括自适应码本的Sa个连贯的指数。对于具有一组的第一个指数的码本项,y[r·Sa][n]按照下式进行计算: 因为除了一个以外的同样的激励样本涉及计算y[r·Sa+1][n],所以数值y[r·Sa+1][n]可从y[r·Sa][n]递归地被确定。这种递归可适用于在一组中具有一个指数的所有激励序列。对于递归通常可写出:
y[r·Sa+i+1][n]=y[r·Sa+i][n-1]+h[n]·ca[ia[r·Sa+i+1]] (11)相关器72从滤波器70的输出信号和目标信号t[n]确定(9)式的分子。能量估算器74确定(9)式的分母。在除法器的输出端,可提供(9)式的值。选择器78使(9)式对于所有的预选的指数被加以计算,并存储自适应码本48的最佳指数Ia。随后,选择器按照下式计算增益值g: 在(12)式中,
是滤波器70对于具有指数Ia的选择的激励序列的响应。增益系数g藉非均匀量化运算被量化成量化的增益系数Ga,它在选择器78的输出端被提供。选择器78按照下式也输出自适应码本对于合成信号的贡献p[n]:
在按照图5的固定码本预选装置中,信号e[n]被加到后向滤波器80的输入端。后向滤波器80的输出端连接到相关器86的第一输入端和相位选择器82的输入端。相位选择器的输出端连接到幅度选择器84的输入端。幅度选择器84的输出端连接到相关器86的第二输入端和减少复杂性的合成滤波器88的输入端。减少复杂性的合成滤波器88的输出端连接到能量估算器90的输入端。
相关器86的输出端连接到除法器92的第一输入端。能量估算器90的输出端连接到除法器92的第二输入端。除法器92的输出端连接到选择器94的输入端。在选择器的输出端可提供固定码本的预选激励序列的指数if[k]。
后向滤波器80从信号e[n]计算后向滤波的信号tf[n]。后向滤波器的工作和对于在按照图3的自适应码本预选装置42中的后向滤波运算所描述的作用相同。固定码本被设计为所谓的三元RPE码本(规则脉冲激励),即包括用预定个数的零值分隔开的多个等距离脉冲的码本。三元RPE码本具有Nm个脉冲,其中Np个脉冲具有+1,0或-1的幅度。这些Np个脉冲被安置在由相位PH和脉冲间距D限定的规则栅格上,其中0≤PH<D。栅格位置pos由PH+D·l给出,其中0≤l<Np。剩下的Nm-Np个脉冲是零。三元RPE码本,如上面规定的,具有D·(3Np-1)项。为减少复杂性,对于每个子帧产生包含Nf项的子集的本地RPE码本。该本地RPE码本的所有激励序列具有同样的相位PH,它是由相位选择器82藉在间隔0≤PH<D中搜寻使以下表示式取最大值的PH值而被确定的: 在幅度选择器84中,填充两个阵列。第一阵列,amp包含等于sign(tf[PH+D·l])的变量amp[l],其中sign是符号函数。第二阵列,pos[l]包含表示|tf[PH+D·l]|的Nz个最大值的标记。对于这些值,不允许激励脉冲具有零值。然后,二维阵列cf[k][n]被填充以具有相位PH和具有满足分别由阵列amp和pos的内容所加上的需要的样本值的Nf个激励序列。这些激励序列是与在此处由后向滤波的信号tf[n]表示的剩余序列有最大相似性的激励序列。
对候选的激励序列的选择是基于和在自适应码本预选装置42中所使用的同样的原理。相关器86计算在后向滤波的信号tf[n]和预选的激励序列之间的相关值。(减少复杂性的)合成滤波器88被设计来对激励序列进行滤波,及能量估算器90计算滤波的激励序列的能量。除法器把相关值除以相应于激励序列的能量。选择器94选择相应于除法器92的输出信号的Pf个最大值的激励序列,并把各候选激励序列的相应指数存储在阵列if[k]中。
在按照图6的固定码本选择装置44中,减少的码本94的输出端连接到合成滤波器96的输入端。合成滤波器96的输出端连接到相关器98的第一输入端和能量估算器100的输入端。信号e[n]被加到相关器98的第二输入端。相关器98的输出端连接到乘法器108的第一输入端和除法器102的第一输入端。能量估算器100的输出端连接到除法器102的第二输入端和乘法器112的输入端。除法器102的输出端连接到量化器104的输入端。量化器104的输出端连接到乘法器105和平方器110的输入端。
乘法器105的输出端连接到乘法器108的第二输入端。平方器110的输出端连接到乘法器112的第二输入端。乘法器108的输出端连接到减法器114的第一输入端。乘法器112的输出端连接到减法器114的第二输入端。减法器114的输出端连接到选择器116的输入端。选择器116的第一输出端连接到减少的码本94的选择输入端。具有输出信号P,L[k]和Gf的选择器116的三个输出端提供了固定码本搜寻的最后结果。
在固定码本选择装置42中,执行对最佳激励序列的闭环搜寻。搜寻包括确定使表示式rf[r]为最大的指数r。rf[r]等于: 在(15)式中,y[r][n]是滤波的激励序列,Gf是最佳增益系数g的量化后的值,该最佳增益系数g等于: (15)式可藉助于展开
的表示式,删除与r无关的项和用量化后的增益Gf代替最佳增益g而被得到。信号y[r][n]可按照下式计算: 因为cf[if[r]][j]对于j=P+D·l(0≤l<Np)只能有非零值,所以(17)式可被简化为: (18)式的判定由滤波器96执行。(15)式的分子由相关器98确定及(15)式的分母由能量估算器100计算。在除法器102的输出端可提供g值。g值由量化器104量化为Gf。在乘法器108的输出端可提供(15)式的第一项,及在乘法器112的输出端可提供(15)式的第二项。在减法器114的输出端可提供表示式rf[r]。选择器116选择使(15)式最大化的r值,并在其输出端提供增益Gf、非零激励脉冲的幅度L[k]、和激励序列的最佳相位PH。
按照图7的译码器14的输入信号被加到多路分接器118的输入端。载有信号C[k]的多路分接器118的第一输出端连接到内插器130的输入端。载有信号Ia的多路分接器118的第二输出端连接到自适应码本120的输入端。自适应码本120的输出端连接到乘法器124的第一输入端。载有信号Ga的多路分接器118的第三输出端连接到乘法器124的第二输入端。载有信号Gf的多路分接器118的第四输出端连接到乘法器126的第一输入端。载有信号PH的多路分接器118的第五输出端连接到激励产生器122的第一输入端。载有信号L[k]的多路分接器118的第六输出端连接到激励产生器122的第二输入端。激励产生器的输出端连接到乘法器126的第二输入端。乘法器124的输出端连接到加法器128的第一输入端,及乘法器126的输出端连接到加法器128的第二输入端。
加法器128的输出端连接到合成滤波器132的第一输入端。合成滤波器的输出端连接到后滤波器134的第一输入端。内插器130的输出端连接到合成滤波器132的第二输入端和连接到后滤波器134的第二输入端。在后滤波器134的输出端可提供译码的输出信号。
自适应码本120对于每个子帧按照指数Ia产生激励序列。所述激励信号由乘法器124用增益系数Ga按比例调节。激励产生器122对于每个子帧按照相位PH和幅度值L[k]产生激励序列。来自激励产生器122的激励信号由乘法器126用增益系数Gf按比例调节。乘法器124和126的输出信号被加法器128相加以得到完整的激励信号。该激励信号被送回到自适应码本120用于适应其内容。合成滤波器132在每个子帧中被更新的内插的预测参量aq[k][s]的控制下从在加法器128的输出端上的激励信号得出合成的语音信号。内插的预测参量aq[k][s]藉助于对参量C[k]内插和把内插的C[k]参量变换到预测的参量而得出。后滤波器134被用来改进语音信号的感知质量。该滤波器的转移函数等于: 在(19)式中,G[s]是用于补偿后滤波器134的滤波函数的变化的衰减的增益系数。
Claims (8)
1.传输系统,包括用于通过传输信道把输入信号发送给接收机的发射机,发射机包括编码器,具有用于产生多个激励序列的激励序列产生器,和选择装置,用于选择激励序列以导致在从所述激励序列得到的合成信号与从输入信号得到的目标信号之间的最小误差,发射机被设计来发射代表选择的激励序列的信号给接收机,接收机包括译码器,具有用于从代表选择的激励序列的信号得到选择的激励序列的激励序列产生器,和合成滤波器,用于从激励序列得到合成的信号,其特征在于,编码器包括用于从多个激励序列得到多个合成信号的减少复杂性的合成滤波器,以及在于选择装置被设计来选择激励序列,以导致在相应的合成信号和目标信号之间的最小误差。
2.按照权利要求1的传输系统,其特征在于,选择装置被设计来选择至少一个另外的激励序列,在于编码器包括一个附加的合成滤波器,被设计来从至少两个激励序列得出附加的合成信号,以及在于选择装置被设计来从至少两个激励序列中选择激励序列以导致在相应的附加合成输入信号和从作为选择的激励序列的输入信号得到的参考信号之间的最小误差。
3.按照权利要求1或2的传输系统,其特征在于,编码器包括分析装置,用于得出代表输入信号特征性质的多个分析参量和把所述分析参量加到合成滤波器,以及分析装置被设计来得出一个减少的分析参量集和把所述减少的分析参量集加到减少复杂性的合成滤波器。
4.按照权利要求3的传输系统,其特征在于,分析装置被设计来以递归方式确定多个分析参量,以及在于减少的分析参量集是从在确定多个分析参量的递归方式中得到的中间结果导出的。
5.用于发送输入信号的发射机,包括编码器,其具有分析装置,用于得出代表输入信号特征性质的多个分析参量,编码器还包括用于产生多个激励序列的激励序列产生器,选择装置,用于选择激励序列以导致在从所述激励序列得到的合成信号与从输入信号得到的目标信号之间的最小误差,发射机被设计来发送代表选择的激励序列的信号,其特征在于,编码器包括减少复杂性的合成滤波器,其接收来自分析装置的减少的分析参量集,用于从多个激励序列得出多个合成信号,以及在于选择装置被设计来选择激励序列,以导致在相应的合成信号和目标信号之间的最小误差。
6.编码器,包括用于得出代表输入信号特征性质的多个分析参量的分析装置,用于产生多个激励序列的激励序列产生器,用于选择激励序列以导致在从所述激励序列得到的合成信号与从输入信号得到的目标信号之间的最小误差的选择装置,编码器被设计来产生代表选择的激励序列的信号,其特征在于,编码器包括减少复杂性的合成滤波器,其接收来自分析装置的减少的分析参量集,用于从多个激励序列得出多个合成信号,以及在于选择装置被设计来选择激励序列,以导致在相应的合成信号和目标信号之间的最小误差。
7.用于通过传输信道发送输入信号的方法,该方法包括产生多个激励序列,选择激励序列以导致在从所述激励序列得到的合成信号和从输入信号得到的目标信号之间的最小误差,发送代表选择的激励序列的信号,该方法还包括从代表激励序列的信号得到选择的激励序列,和从激励序列得到合成信号,其特征在于,该方法包括按照减小复杂性的滤波方法从多个激励序列得到多个合成信号,以及在于该方法包括选择激励序列以导致在相应的合成信号与目标信号之间的最小误差。
8.编码方法,包括得出代表输入信号特征性质的多个分析参量,产生多个激励序列和选择激励序列以导致在从所述激励序列得到的合成信号和从输入信号得到的目标信号之间的最小误差,产生代表选择的激励序列的信号,其特征在于,该方法包括按照由减少的分析参量集控制的减少复杂性的滤波方法从多个激励序列得到多个合成信号,以及在于该方法包括选择激励序列以导致在相应的合成信号和目标信号之间的最小误差。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP96200369.5 | 1996-02-15 | ||
EP96200369 | 1996-02-15 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1188557A CN1188557A (zh) | 1998-07-22 |
CN1132156C true CN1132156C (zh) | 2003-12-24 |
Family
ID=8223671
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN97190315A Expired - Fee Related CN1132156C (zh) | 1996-02-15 | 1997-01-31 | 具有减少复杂性的合成滤波器的celp语音编码器 |
Country Status (8)
Country | Link |
---|---|
US (1) | US6014619A (zh) |
EP (1) | EP0843875A1 (zh) |
JP (1) | JPH11504731A (zh) |
KR (1) | KR19990007817A (zh) |
CN (1) | CN1132156C (zh) |
BR (1) | BR9702073A (zh) |
TW (1) | TW307960B (zh) |
WO (1) | WO1997030438A1 (zh) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU3708597A (en) * | 1996-08-02 | 1998-02-25 | Matsushita Electric Industrial Co., Ltd. | Voice encoder, voice decoder, recording medium on which program for realizing voice encoding/decoding is recorded and mobile communication apparatus |
TW439368B (en) * | 1998-05-14 | 2001-06-07 | Koninkl Philips Electronics Nv | Transmission system using an improved signal encoder and decoder |
US6732070B1 (en) * | 2000-02-16 | 2004-05-04 | Nokia Mobile Phones, Ltd. | Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching |
US6789059B2 (en) * | 2001-06-06 | 2004-09-07 | Qualcomm Incorporated | Reducing memory requirements of a codebook vector search |
US8605911B2 (en) | 2001-07-10 | 2013-12-10 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
ES2237706T3 (es) | 2001-11-29 | 2005-08-01 | Coding Technologies Ab | Reconstruccion de componentes de alta frecuencia. |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
JP5129115B2 (ja) | 2005-04-01 | 2013-01-23 | クゥアルコム・インコーポレイテッド | 高帯域バーストの抑制のためのシステム、方法、および装置 |
TWI324336B (en) | 2005-04-22 | 2010-05-01 | Qualcomm Inc | Method of signal processing and apparatus for gain factor smoothing |
US8417185B2 (en) * | 2005-12-16 | 2013-04-09 | Vocollect, Inc. | Wireless headset and method for robust voice data communication |
US7773767B2 (en) | 2006-02-06 | 2010-08-10 | Vocollect, Inc. | Headset terminal with rear stability strap |
US7885419B2 (en) * | 2006-02-06 | 2011-02-08 | Vocollect, Inc. | Headset terminal with speech functionality |
USD605629S1 (en) | 2008-09-29 | 2009-12-08 | Vocollect, Inc. | Headset |
US8160287B2 (en) | 2009-05-22 | 2012-04-17 | Vocollect, Inc. | Headset with adjustable headband |
US8438659B2 (en) | 2009-11-05 | 2013-05-07 | Vocollect, Inc. | Portable computing device and headset interface |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5384891A (en) * | 1988-09-28 | 1995-01-24 | Hitachi, Ltd. | Vector quantizing apparatus and speech analysis-synthesis system using the apparatus |
US5671327A (en) * | 1991-10-21 | 1997-09-23 | Kabushiki Kaisha Toshiba | Speech encoding apparatus utilizing stored code data |
US5327520A (en) * | 1992-06-04 | 1994-07-05 | At&T Bell Laboratories | Method of use of voice message coder/decoder |
GB2282943B (en) * | 1993-03-26 | 1998-06-03 | Motorola Inc | Vector quantizer method and apparatus |
US5717823A (en) * | 1994-04-14 | 1998-02-10 | Lucent Technologies Inc. | Speech-rate modification for linear-prediction based analysis-by-synthesis speech coders |
US5602961A (en) * | 1994-05-31 | 1997-02-11 | Alaris, Inc. | Method and apparatus for speech compression using multi-mode code excited linear predictive coding |
JP3183074B2 (ja) * | 1994-06-14 | 2001-07-03 | 松下電器産業株式会社 | 音声符号化装置 |
US5732389A (en) * | 1995-06-07 | 1998-03-24 | Lucent Technologies Inc. | Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures |
-
1996
- 1996-02-23 TW TW085102123A patent/TW307960B/zh active
-
1997
- 1997-01-31 JP JP9529139A patent/JPH11504731A/ja active Pending
- 1997-01-31 CN CN97190315A patent/CN1132156C/zh not_active Expired - Fee Related
- 1997-01-31 KR KR1019970707340A patent/KR19990007817A/ko active Search and Examination
- 1997-01-31 WO PCT/IB1997/000067 patent/WO1997030438A1/en not_active Application Discontinuation
- 1997-01-31 EP EP97900708A patent/EP0843875A1/en not_active Withdrawn
- 1997-01-31 BR BR9702073A patent/BR9702073A/pt not_active Application Discontinuation
- 1997-02-11 US US08/798,889 patent/US6014619A/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US6014619A (en) | 2000-01-11 |
WO1997030438A1 (en) | 1997-08-21 |
JPH11504731A (ja) | 1999-04-27 |
BR9702073A (pt) | 1998-05-26 |
EP0843875A1 (en) | 1998-05-27 |
CN1188557A (zh) | 1998-07-22 |
TW307960B (en) | 1997-06-11 |
KR19990007817A (ko) | 1999-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1114279C (zh) | 复杂度减小的信号传输系统 | |
CN1132156C (zh) | 具有减少复杂性的合成滤波器的celp语音编码器 | |
US6408268B1 (en) | Voice encoder, voice decoder, voice encoder/decoder, voice encoding method, voice decoding method and voice encoding/decoding method | |
JPH08263099A (ja) | 符号化装置 | |
CN1146129C (zh) | 降低了复杂度的信号传输系统和方法 | |
KR100257775B1 (ko) | 다중 펄스분석 음성처리 시스템과 방법 | |
CN1074846C (zh) | 产生用于话音编码器的频谱噪音加权滤波器的方法 | |
US6094630A (en) | Sequential searching speech coding device | |
EP0578436B1 (en) | Selective application of speech coding techniques | |
US5797119A (en) | Comb filter speech coding with preselected excitation code vectors | |
US6295520B1 (en) | Multi-pulse synthesis simplification in analysis-by-synthesis coders | |
CN1139988A (zh) | 猝发脉冲激励的线性预测 | |
CN1222996A (zh) | 用于传输语音信号的传输系统 | |
CN105122358A (zh) | 用于处理编码信号的装置和方法与用于产生编码信号的编码器和方法 | |
CN1235335A (zh) | 改善话音信号编码器性能的方法 | |
Rose et al. | The design and performance of a real-time self excited vocoder | |
CA2218223C (en) | Reduced complexity signal transmission system | |
CA2218244C (en) | Reduced complexity signal transmission system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C53 | Correction of patent of invention or patent application | ||
CB02 | Change of applicant information |
Applicant after: Koninklike Philips Electronics N. V. Applicant before: Philips Electronics N. V. |
|
COR | Change of bibliographic data |
Free format text: CORRECT: APPLICANT; FROM: N.V. PHILIPS OPTICAL LAMP LTD., CO. TO: ROYAL PHILIPS ELECTRONICS CO., LTD. |
|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |