JP2009104169A - Conversion device and conversion method of speech code string - Google Patents

Conversion device and conversion method of speech code string Download PDF

Info

Publication number
JP2009104169A
JP2009104169A JP2009011591A JP2009011591A JP2009104169A JP 2009104169 A JP2009104169 A JP 2009104169A JP 2009011591 A JP2009011591 A JP 2009011591A JP 2009011591 A JP2009011591 A JP 2009011591A JP 2009104169 A JP2009104169 A JP 2009104169A
Authority
JP
Japan
Prior art keywords
circuit
pitch
code string
coefficient
pitch period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009011591A
Other languages
Japanese (ja)
Inventor
Masahiro Serizawa
芹沢  昌宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009011591A priority Critical patent/JP2009104169A/en
Publication of JP2009104169A publication Critical patent/JP2009104169A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a conversion device of a speech code string, capable of converting a code string by a small arithmetic amount. <P>SOLUTION: In addition to a circuit for combining a decoding signal from the code string of a Code-Excited Linear Prediction (CELP) system at an input side, a circuit in which an LP coefficient and a pitch period respectively decoded by an LP coefficient decoding circuit 12 and a pitch component decoding circuit 13 are directly forwarded to each of the LP coefficient coding circuit 31 and a pitch component calculation circuit 40 at an output side, and supplied for code string conversion at the output side, is added. Thereby, LP analysis and selection of a pitch period candidate, which are conventionally performed for the decoding signal at the output side become unnecessary. When a band expansion processing is necessary at each of input and output sides, a circuit of band expansion conversion and pitch period candidate generation is added, and a coding circuit is provided instead of pitch component calculation. When a frame length of the input side is longer than that of the output side in the LP coefficient and the pitch period, interpolation is performed, and when it is shorter, average processing is performed. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は、二種類の音声符号化方式間で音声通信を行なう場合に、一方の方式の符号化により得た音声符号列を他方の方式で復号可能な音声符号列に変換する符号列変換装置および符号列変換方法に関し、特に、低歪みかつ低演算量で音声符号列に変換できる音声符号列変換装置および符号列変換方法に関する。   The present invention relates to a code string conversion device for converting a voice code string obtained by encoding one system into a voice code string decodable by the other system when performing voice communication between two types of voice encoding systems. In particular, the present invention relates to a speech code string conversion apparatus and a code string conversion method capable of converting into a speech code string with low distortion and a small amount of computation.

現在、携帯電話等で最も多く使用されている音声符号化方式として、CELP(Code Excited Linear Prediction)方式がある。CELP方式に関して記載する文献としては「Code-Excited Linear Prediction: High Quality Speech at Very Low Bit Rates」(IEEE Proc.ICASSP−85、pp.937−940、1985)(以後、非特許文献1と呼ぶ)がある。   Currently, there is a CELP (Code Excited Linear Prediction) method as a speech encoding method most frequently used in mobile phones and the like. References relating to the CELP system include “Code-Excited Linear Prediction: High Quality Speech at Very Low Bit Rates” (IEEE Proc. ICASSP-85, pp. 937-940, 1985) (hereinafter referred to as Non-Patent Document 1). There is.

CELP方式による符号化装置では、入力音声信号を線形予測(LP)分析して計算したスペクトル包絡特性を表す線形予測(LP)係数とこのLP係数で構成されるLP合成フィルタを駆動する励振信号とに分けて符号化を行なう。LP分析とLP係数の符号化とは、予め定めた長さのフレーム毎に行なう。符号化励振信号の符号化は、このフレームをサブフレームに更に分割したサブフレーム毎に行なう。   In a coding apparatus using the CELP method, a linear prediction (LP) coefficient representing a spectral envelope characteristic calculated by linear prediction (LP) analysis of an input speech signal, and an excitation signal for driving an LP synthesis filter composed of the LP coefficient, Encoding is performed separately. LP analysis and LP coefficient encoding are performed for each frame of a predetermined length. The encoding excitation signal is encoded for each subframe obtained by further dividing this frame into subframes.

ここで、励振信号は、入力信号のピッチ周期を表す周期成分とその残りの残差成分とそれらのゲインとにより構成される。入力信号のピッチ周期を表す周期成分は、適応コードブックと呼ばれる過去の励振信号を保持するコードブックに格納された適応コードベクトルで表される。上記残差成分は、音源コードベクトルと呼ばれる複数のパルスからなるマルチパルス信号または予め設計した信号で表す。音源コードベクトルの情報は、音源コードブックに蓄積している。   Here, the excitation signal is composed of a periodic component representing the pitch period of the input signal, the remaining residual component, and their gains. The periodic component representing the pitch period of the input signal is represented by an adaptive code vector stored in a code book that holds past excitation signals called an adaptive code book. The residual component is represented by a multi-pulse signal composed of a plurality of pulses called a sound source code vector or a signal designed in advance. The information of the sound source code vector is accumulated in the sound source code book.

CELP方式による復号装置では、復号した上記ピッチ周期成分と上記残差信号から計算した励振信号とを、復号した上記LP係数で構成する合成フィルタに入力して合成音声信号を得る。   In a CELP decoding device, the decoded pitch period component and the excitation signal calculated from the residual signal are input to a synthesis filter composed of the decoded LP coefficients to obtain a synthesized speech signal.

異なる二つのCELP方式間で通信する際に、一方の方式の符号化により得た音声符号列を他方の方式で復号可能な音声符号列に変換する従来の変換装置として、一方のCELP方式の復号装置により入力した音声符号列から復号した音声信号を他方のCELP方式で符号化して出力音声符号列を得る変換装置がある。   When communicating between two different CELP systems, as a conventional conversion device that converts a speech code string obtained by encoding of one system into a speech code string that can be decoded by the other system, decoding of one CELP system There is a conversion apparatus that obtains an output speech code string by encoding a speech signal decoded from a speech code string input by the apparatus using the other CELP method.

次に、図11を参照して、従来におけるこの種の音声符号列の変換装置について説明する。図11は一方のCELP方式Aの音声符号列を他方であるCELP方式Bの音声符号列に変換する変換装置の一構成例を示すブロック図である。   Next, a conventional speech code string converting apparatus of this type will be described with reference to FIG. FIG. 11 is a block diagram illustrating a configuration example of a conversion apparatus that converts one CELP system A speech code string into another CELP system B speech code string.

図示される変換装置は、入力端子10、デマルチプレクサ回路11、LP係数復号回路12、ピッチ成分復号回路113、残差成分復号回路14、および音声合成回路15を、CELP方式Aの復号処理のために備える。また、フレーム回路21、サブフレーム回路22、LP分析回路130、LP係数符号化回路31、ピッチ周期候補選択回路132、ピッチ成分符号化回路41、残差成分符号化回路51、励振信号合成回路52、マルチプレクサ回路53、および出力端子50は、CELP方式Bの符号化処理を行なうために設けられる。   The illustrated conversion device includes an input terminal 10, a demultiplexer circuit 11, an LP coefficient decoding circuit 12, a pitch component decoding circuit 113, a residual component decoding circuit 14, and a speech synthesis circuit 15 for CELP A decoding processing. Prepare for. In addition, the frame circuit 21, the subframe circuit 22, the LP analysis circuit 130, the LP coefficient encoding circuit 31, the pitch period candidate selection circuit 132, the pitch component encoding circuit 41, the residual component encoding circuit 51, and the excitation signal synthesis circuit 52 The multiplexer circuit 53 and the output terminal 50 are provided for performing CELP system B encoding processing.

入力端子10は、CELP方式Aの符号列をCELP方式Aのフレーム毎に入力し、デマルチプレクサ回路11に渡す。デマルチプレクサ回路11は、入力端子10から渡された符号列から各符号を分離する。デマルチプレクサ回路11は、分離した量子化LP係数の符号を分離してLP係数復号回路12に、またピッチ周期の符号をピッチ成分復号回路113に、更に残差成分信号の符号を残差成分復号回路14に、それぞれ渡す。   The input terminal 10 inputs a CELP system A code string for each frame of the CELP system A and passes it to the demultiplexer circuit 11. The demultiplexer circuit 11 separates each code from the code string passed from the input terminal 10. The demultiplexer circuit 11 separates the code of the separated quantized LP coefficient to the LP coefficient decoding circuit 12, the code of the pitch period to the pitch component decoding circuit 113, and further the code of the residual component signal to residual component decoding Each is passed to the circuit 14.

LP係数復号回路12は、デマルチプレクサ回路11から渡された符号を用いてスペクトル特性を表すLP係数を復号し復号した係数を音声合成回路15に渡す。   The LP coefficient decoding circuit 12 decodes the LP coefficient representing the spectral characteristics using the code passed from the demultiplexer circuit 11 and passes the decoded coefficient to the speech synthesis circuit 15.

LP係数の符号化および復号方法としては、LP係数を線スペクトル対(LSP)に変化した後にベクトル量子化する方法がある。ベクトル量子化では、符号化器と復号器とで同一の量子化ベクトルテーブルを有し、各ベクトルに付与された符号を伝送する。復号器では、渡された符号に対応するベクトルを出力する。LSPのベクトル量子化法の詳細については「Efficient Vector Quantization of LPC Parameters at 24 Bits/Frame」 (IEEE Proc.ICASSP−91,pp.661−664,1991)(以後、非特許文献2と称する)を参照することができる。   As an LP coefficient encoding and decoding method, there is a method of performing vector quantization after changing the LP coefficient into a line spectrum pair (LSP). In vector quantization, an encoder and a decoder have the same quantization vector table, and a code assigned to each vector is transmitted. The decoder outputs a vector corresponding to the passed code. For details of LSP vector quantization, see “Efficient Vector Quantization of LPC Parameters at 24 Bits / Frame” (IEEE Proc. ICASSP-91, pp. 661-664, 1991) (hereinafter referred to as Non-Patent Document 2). You can refer to it.

ピッチ成分復号回路113は、デマルチプレクサ回路11から渡された符号からピッチ周期Lとピッチゲインgaを復号する。ピッチ周期Lとピッチゲインgaとは各々スカラー量子化されており、各々渡された符号に対応する値を、予め設計した量子化テーブルの中から検索して、復号値とする。また、ピッチ成分復号回路113は、音声合成回路15から渡される励振信号を過去のピッチ周期Lに対するサンプルまで蓄積し、蓄積した励振信号を過去のピッチ周期Lだけ遡って切り出すことにより適応コードベクトルCaを作成する。最後に、ピッチ成分信号Ea(=ga・Ca)を計算し、音声合成回路15に渡す。   The pitch component decoding circuit 113 decodes the pitch period L and the pitch gain ga from the code passed from the demultiplexer circuit 11. The pitch period L and the pitch gain ga are each scalar quantized, and a value corresponding to each passed code is searched from a previously designed quantization table to be a decoded value. The pitch component decoding circuit 113 accumulates the excitation signal passed from the speech synthesis circuit 15 up to samples for the past pitch period L, and extracts the accumulated excitation signal retroactively by the past pitch period L, thereby adapting the adaptive code vector Ca. Create Finally, the pitch component signal Ea (= ga · Ca) is calculated and passed to the speech synthesis circuit 15.

残差成分復号回路14は、デマルチプレクサ回路11から渡された符号を用いて音源コードベクトルCrと音源ゲインgrを復号し、残差成分信号Er(=gr・Cr)を計算し、音声合成回路15に渡す。音源ゲインgrは、スカラー量子化されており、渡された符号に対応する値を、予め設計した量子化テーブルの中から検索して、復号値とする。音源コードベクトルCrは、渡された符号に対応するベクトルを、予め作成した音源コードブックの中から検索して、復号ベクトルとする。   The residual component decoding circuit 14 decodes the excitation code vector Cr and the excitation gain gr using the code passed from the demultiplexer circuit 11, calculates the residual component signal Er (= gr · Cr), and generates a speech synthesis circuit. Pass to 15. The sound source gain gr is scalar quantized, and a value corresponding to the passed code is searched from a previously designed quantization table to obtain a decoded value. As the sound source code vector Cr, a vector corresponding to the passed code is searched from a previously created sound source code book to be a decoded vector.

音声合成回路15は、ピッチ成分復号回路113から渡されたピッチ成分信号Eaと残差成分復号回路14から渡された残差成分信号Erとを用いて次の数式1の励振信号ベクトルExを計算し、ピッチ成分復号回路113に渡す。   The speech synthesis circuit 15 calculates the excitation signal vector Ex of the following Equation 1 using the pitch component signal Ea passed from the pitch component decoding circuit 113 and the residual component signal Er passed from the residual component decoding circuit 14. To the pitch component decoding circuit 113.

Figure 2009104169
Figure 2009104169

更に、音声合成回路15は、LP係数復号回路12から渡されるLP係数a(i)により構成され、下記の数式2に示される合成フィルタH(z)で、先に計算した励振信号ベクトルExをフィルタリングしてCELP方式Aの復号信号を求め、この復号信号をフレーム回路21に渡す。   Further, the speech synthesis circuit 15 is configured by the LP coefficient a (i) passed from the LP coefficient decoding circuit 12, and the excitation signal vector Ex previously calculated by the synthesis filter H (z) expressed by the following formula 2 is used. Filtering is performed to obtain a CELP system A decoded signal, and this decoded signal is passed to the frame circuit 21.

Figure 2009104169
数式2で「p」はLP係数の次数である。
Figure 2009104169
In Equation 2, “p” is the order of the LP coefficient.

CELP方式では聴感的な音質を向上するために、この復号信号にポストフィルタと呼ばれるスペクトルピークを強調するフィルタを施す。しかし、再度符号化を行なう場合には符号化歪みを増加させるため、このポストフィルタを適用しない。   In the CELP system, in order to improve the audible sound quality, a filter that emphasizes a spectrum peak called a post filter is applied to the decoded signal. However, when encoding is performed again, this post filter is not applied to increase encoding distortion.

フレーム回路21は、音声合成回路15から渡された復号信号をCELP方式Bのフレーム長で切り出し、LP分析回路130とピッチ周期候補選択回路132とサブフレーム回路22とに渡す。サブフレーム回路22は、フレーム回路21から渡された復号信号をCELP方式Bのサブフレーム長に分割し、ピッチ成分符号化回路41に渡す。   The frame circuit 21 cuts out the decoded signal passed from the speech synthesis circuit 15 with the CELP system B frame length, and passes it to the LP analysis circuit 130, the pitch period candidate selection circuit 132, and the subframe circuit 22. The subframe circuit 22 divides the decoded signal passed from the frame circuit 21 into subframe lengths of CELP system B, and passes them to the pitch component encoding circuit 41.

LP分析回路130は、フレーム回路21から渡された復号信号をLP分析してLP係数を得る。次に、LP分析回路130は、この得たLP係数をLP係数符号化回路30とピッチ周期候補選択回路132とに渡す。   The LP analysis circuit 130 performs LP analysis on the decoded signal passed from the frame circuit 21 to obtain an LP coefficient. Next, the LP analysis circuit 130 passes the obtained LP coefficient to the LP coefficient encoding circuit 30 and the pitch period candidate selection circuit 132.

LP係数符号化回路31は、LP分析回路130から渡されたLP係数をベクトル量子化し、その符号をマルチプレクサ回路53に渡す。この量子化法として上記参照文献2を参照することができる。更に、LP係数符号化回路31は、量子化したLP係数をピッチ成分符号化回路41と残差成分符号化回路51とに渡す。   The LP coefficient encoding circuit 31 vector-quantizes the LP coefficient passed from the LP analysis circuit 130 and passes the code to the multiplexer circuit 53. Reference can be made to the above Reference 2 for this quantization method. Further, the LP coefficient encoding circuit 31 passes the quantized LP coefficient to the pitch component encoding circuit 41 and the residual component encoding circuit 51.

ピッチ周期候補選択回路132はフレーム回路21から渡された復号信号を用いてピッチ周期の候補を選択しピッチ成分符号化回路41に渡す。候補選択は、まずLP分析回路130から渡されたLP係数a(i)で構成される次の数式3で示される荷重フィルタW(z)により、フレーム回路21から渡された復号信号をフィルタリングする。数式3において「β」および「γ」は聴覚的な音質改善を行なうための荷重具合を調整する係数であり「0<γ<β≦1」を満たす値をとる。   The pitch cycle candidate selection circuit 132 selects a pitch cycle candidate using the decoded signal passed from the frame circuit 21 and passes it to the pitch component encoding circuit 41. In the candidate selection, first, the decoded signal passed from the frame circuit 21 is filtered by the weighting filter W (z) expressed by the following Equation 3 composed of the LP coefficient a (i) passed from the LP analysis circuit 130. . In Equation 3, “β” and “γ” are coefficients for adjusting the load for performing auditory sound quality improvement, and take values that satisfy “0 <γ <β ≦ 1”.

Figure 2009104169
Figure 2009104169

次に、ピッチ周期候補選択回路132は、この荷重された復号信号の自己相関関数を相関ラグ「20〜147」の範囲で計算し、自己相関が最大となる相関ラグとその近隣の値をピッチ周期の候補とする。   Next, the pitch period candidate selection circuit 132 calculates the autocorrelation function of the weighted decoded signal in the range of the correlation lag “20 to 147”, and calculates the correlation lag that maximizes the autocorrelation and its neighboring values to the pitch. Candidate for period.

ピッチ成分符号化回路41は、サブフレーム毎に、サブフレーム回路22から渡されたサブフレーム長の復号信号ベクトルSdのピッチ周期成分を符号化し、その符号をマルチプレクサ回路53に渡す。ピッチ成分符号化回路41は、まず残差成分符号化回路51から渡された過去に復号された励振信号を時間Lだけ遡ってサブフレーム長で切り出すことにより適応コードベクトルを作成する。次にピッチ成分符号化回路41は、この適応コードベクトルを上記数式2によりフィルタリングし、ピッチ成分だけの復号信号Sa(L)を計算する。更に、ピッチ成分符号化回路41は、上記数式3を用いて復号信号ベクトルSdおよびピッチ周期成分ベクトルSa(L)それぞれを荷重し、荷重復号信号ベクトルSdwと荷重ピッチ周期成分ベクトルSaw(L)とを得る。   The pitch component encoding circuit 41 encodes the pitch period component of the decoded signal vector Sd having a subframe length passed from the subframe circuit 22 for each subframe, and passes the code to the multiplexer circuit 53. The pitch component encoding circuit 41 first creates an adaptive code vector by cutting back the previously decoded excitation signal passed from the residual component encoding circuit 51 by a time L by a subframe length. Next, the pitch component encoding circuit 41 filters the adaptive code vector by the above-described equation 2 to calculate a decoded signal Sa (L) having only the pitch component. Further, the pitch component encoding circuit 41 loads the decoded signal vector Sd and the pitch period component vector Sa (L) using Equation 3 above, and loads the load decoded signal vector Sdw and the load pitch period component vector Saw (L). Get.

ピッチ成分符号化回路41は、上述したピッチ周期成分に関する動作を、ピッチ周期候補選択回路132から渡されるピッチ周期の候補それぞれに対して行ない、荷重復号信号ベクトルSdwと荷重ピッチ周期成分ベクトルSaw(L)との二乗距離Daが最小となる最適ピッチ周期Loを決定する。   The pitch component encoding circuit 41 performs the above-described operation on the pitch cycle component for each of the pitch cycle candidates passed from the pitch cycle candidate selection circuit 132, and performs the load decoding signal vector Sdw and the load pitch cycle component vector Saw (L ) To determine the optimum pitch period Lo that minimizes the square distance Da.

二乗距離Daは、ピッチ周期L毎に計算される最適ピッチゲインga(L)を用いて下記数式4により得られる。また、最適ピッチゲインga(L)は下記数式5により求められる。ここで、以後の説明において、記号‖x‖はベクトルxのノルム、また記号<x,y>はベクトルxとベクトルyとの内積、それぞれを意味するものとする。   The square distance Da is obtained by the following formula 4 using the optimum pitch gain ga (L) calculated for each pitch period L. Further, the optimum pitch gain ga (L) is obtained by the following formula 5. In the following description, the symbol ‖x‖ means the norm of the vector x, and the symbol <x, y> means the inner product of the vector x and the vector y.

Figure 2009104169
Figure 2009104169
Figure 2009104169
Figure 2009104169

ピッチ成分符号化回路41は、最後に、最適ピッチ周期Loとこれに対応するピッチゲインga(Lo)とをスカラー量子化して得た符号をマルチプレクサ回路53に渡す。   The pitch component encoding circuit 41 finally passes a code obtained by scalar quantization of the optimum pitch period Lo and the corresponding pitch gain ga (Lo) to the multiplexer circuit 53.

また、ピッチ成分符号化回路41は、荷重ピッチ周期成分ベクトルSaw(Lo)に量子化した最適ピッチゲインgaq(Lo)を積算して得られたベクトルを、荷重復号信号ベクトルSdwから引き算して得た残差信号ベクトルSdw’を残差成分符号化回路51に渡す。更に、ピッチ成分符号化回路41は、最適ピッチ周期Loに対応した適応コードベクトルCa(Lo)に、量子化した最適ピッチゲインgaq(Lo)を積算したピッチ成分励振信号E’aを励振信号合成回路52に渡す。   Further, the pitch component encoding circuit 41 obtains a vector obtained by integrating the optimum pitch gain gaq (Lo) quantized to the load pitch period component vector Saw (Lo) from the load decoded signal vector Sdw. The residual signal vector Sdw ′ is passed to the residual component encoding circuit 51. Further, the pitch component encoding circuit 41 synthesizes a pitch component excitation signal E′a obtained by integrating the quantized optimum pitch gain gaq (Lo) to the adaptive code vector Ca (Lo) corresponding to the optimum pitch period Lo. Pass to circuit 52.

残差成分符号化回路51は、サブフレーム毎に、ピッチ成分符号化回路41から渡された復号信号ベクトルSdの残差成分である残差信号ベクトルSdw’を符号化し、その符号をマルチプレクサ53に渡す。   The residual component encoding circuit 51 encodes the residual signal vector Sdw ′, which is the residual component of the decoded signal vector Sd passed from the pitch component encoding circuit 41, for each subframe, and the code is sent to the multiplexer 53. hand over.

すなわち、残差成分符号化回路51は、まず、予め設計し蓄積した音源コードブックからk番目の音源コードベクトルCr(k)を取り出す。次に、残差成分符号化回路51は、この音源コードベクトルを上記数式2によりフィルタリングし、残差成分だけの復号信号Sr(k)を計算する。更に、残差成分符号化回路51は、上記数式3を用いて復号信号ベクトルSdおよび残差成分ベクトルSr(k)それぞれを荷重し、荷重復号信号ベクトルSdwと荷重残差成分ベクトルSrw(k)とを得る。残差成分符号化回路51は、上述した残差成分に関する動作を、音源コードブックに蓄積されている全ての音源コードベクトルに対して行ない、ピッチ成分符号化回路41から渡された残差信号ベクトルSdw’と荷重残差成分ベクトルSrw(k)との二乗距離Drが最小となる音源コードベクトルの符号koを決定する。   That is, the residual component encoding circuit 51 first extracts the k-th excitation code vector Cr (k) from the excitation codebook designed and stored in advance. Next, the residual component encoding circuit 51 filters the excitation code vector by the above-described Equation 2 and calculates a decoded signal Sr (k) having only the residual component. Further, the residual component encoding circuit 51 loads each of the decoded signal vector Sd and the residual component vector Sr (k) using Equation 3 above, and the weighted decoded signal vector Sdw and the weighted residual component vector Srw (k). And get. The residual component encoding circuit 51 performs the above-described operation relating to the residual component on all the excitation code vectors stored in the excitation codebook, and the residual signal vector passed from the pitch component encoding circuit 41. The code ko of the excitation code vector that minimizes the square distance Dr between Sdw ′ and the load residual component vector Srw (k) is determined.

二乗距離Drは、各遅延毎に計算する最適音源ゲインgr(k)を用いた下記数式6により得られる。また、最適音源ゲインgr(k)は下記数式7により求められる。   The square distance Dr is obtained by the following formula 6 using the optimum sound source gain gr (k) calculated for each delay. The optimum sound source gain gr (k) is obtained by the following formula 7.

Figure 2009104169
Figure 2009104169
Figure 2009104169
Figure 2009104169

最後に、残差成分符号化回路51は、最適音源ゲインgr(ko)をスカラー量子化し、その符号と音源コードベクトルの符号koをマルチプレクサ回路53に渡す。また、残差成分符号化回路51は、選択された音源コードベクトルCr(ko)に量子化した最適音源ゲインgrq(ko)を積算した残差成分励振信号E’rを励振信号合成回路52に渡す。   Finally, the residual component encoding circuit 51 scalar quantizes the optimum excitation gain gr (ko), and passes the code and the code ko of the excitation code vector to the multiplexer circuit 53. Also, the residual component encoding circuit 51 supplies the residual component excitation signal E′r obtained by integrating the optimal excitation gain grq (ko) quantized to the selected excitation code vector Cr (ko) to the excitation signal combining circuit 52. hand over.

励振信号合成回路52は、ピッチ成分符号化回路41から渡されたピッチ成分励振信号E’aと残差成分符号化回路51から渡された残差成分励振信号E’rとを加算することにより励振信号Ex’を下記数式8により計算してピッチ成分符号化回路41に渡す。   The excitation signal synthesis circuit 52 adds the pitch component excitation signal E′a passed from the pitch component encoding circuit 41 and the residual component excitation signal E′r passed from the residual component encoding circuit 51. The excitation signal Ex ′ is calculated by the following formula 8 and passed to the pitch component encoding circuit 41.

Figure 2009104169
Figure 2009104169

マルチプレクサ回路53は、LP係数符号化回路31とピッチ成分符号化回路41と残差成分符号化回路51とから渡された、各符号化で得た符号を所定の順序で接続して符号列を生成し、出力端子50に渡す。出力端子50は、マルチプレクサ回路53から渡された符号列を出力する。   The multiplexer circuit 53 connects the codes obtained by the respective encodings passed from the LP coefficient encoding circuit 31, the pitch component encoding circuit 41, and the residual component encoding circuit 51 in a predetermined order, and connects the code string. Generate and pass to output terminal 50. The output terminal 50 outputs the code string passed from the multiplexer circuit 53.

「Code-Excited Linear Prediction: High Quality Speech at Very Low Bit Rates」IEEE Proc.、1985年、ICASSP−85、pp.937−940“Code-Excited Linear Prediction: High Quality Speech at Very Low Bit Rates” IEEE Proc. 1985, ICASSP-85, pp. 937-940 「Efficient Vector Quantization of LPC Parameters at 24 Bits/Frame」IEEE Proc.、1991年、ICASSP−91、pp.661−664)“Efficient Vector Quantization of LPC Parameters at 24 Bits / Frame” IEEE Proc. 1991, ICASSP-91, pp. 661-664)

しかしながら、上述した従来の音声符号列の変換装置では、符号変換処理量が多く大形化が避けられないという問題点がある。   However, the above-described conventional speech code string conversion apparatus has a problem that the code conversion processing amount is large and an increase in size cannot be avoided.

その理由は、入力側のCELP方式Aで、符号化された符号列がデマルチプレクサ回路から復号回路を経て合成された復号信号がフレーム回路を経て出力側のCELP方式Bで符号化される際に、合成された復号信号を介して全てのパラメータに関する符号列の変換を行うためである。   The reason for this is that when a decoded signal obtained by synthesizing the encoded code string from the demultiplexer circuit through the decoding circuit is encoded by the CELP method B on the output side through the frame circuit in the CELP method A on the input side. This is because the code string conversion is performed on all parameters via the synthesized decoded signal.

本発明の課題は、このような問題点を解決し、歪みを増大させることなく、低演算量で音声符号列に変換できる音声符号列の変換装置およびその方法を提供することである。   An object of the present invention is to solve such problems and to provide a speech code string conversion apparatus and method that can convert a speech code string with a small amount of computation without increasing distortion.

上記の課題を解決するために、本発明による音声符号列変換装置は、ピッチ周期を含む第1の符号列を入力側として入力端子から入力し、ピッチ周期を含む第2の符号列に変換して出力側の出力端子から出力するものであって、第1の手段は、第2の符号列のピッチ周期を符号化する時間単位であるサブフレーム毎に、第1の符号列に含まれるピッチ周期を第2の符号列に含まれるピッチ周期とする、第1の符号列側のピッチ成分復号回路と第2の符号列側のピッチ成分計算回路とを備えることを特徴としている。   In order to solve the above problems, a speech code string converter according to the present invention inputs a first code string including a pitch period from an input terminal as an input side, and converts the first code string including a pitch period into a second code string including a pitch period. Output from the output terminal on the output side, and the first means includes a pitch included in the first code string for each subframe which is a time unit for encoding the pitch period of the second code string. A pitch component decoding circuit on the first code string side and a pitch component calculation circuit on the second code string side, each having a period as a pitch period included in the second code string, are provided.

第2の手段は、第2の符号列のピッチ周期を符号化する時間単位であるサブフレーム毎に、第1の符号列の当該サブフレームにおけるピッチ周期とその過去のサブフレームにおけるピッチ周期とから計算するピッチ周期の補間または平均化の回路と、この計算したピッチ周期を、第2の符号列に含まれるピッチ周期とするピッチ成分計算回路とを備えることを特徴としている。   The second means calculates, for each subframe, which is a time unit for encoding the pitch period of the second code string, from the pitch period in the subframe of the first code string and the pitch period in the past subframe. A circuit for interpolating or averaging the pitch period to be calculated, and a pitch component calculating circuit for setting the calculated pitch period to a pitch period included in the second code string are provided.

第3の手段は、第2の符号列のピッチ周期を符号化する時間単位であるサブフレーム毎に、第1の符号列に含まれるピッチ周期、および少なくともその近傍にある複数のピッチ周期候補を生成するピッチ周期候補生成回路と、生成された候補のうちのいずれか一つを、第2の符号列に含まれるピッチ周期とするピッチ成分符号化回路とを備えることを特徴としている。   The third means obtains a pitch period included in the first code string and at least a plurality of pitch period candidates in the vicinity thereof for each subframe which is a time unit for encoding the pitch period of the second code string. A pitch cycle candidate generation circuit to be generated, and a pitch component encoding circuit that uses any one of the generated candidates as a pitch cycle included in the second code string are provided.

第4の手段は、第2の符号列のピッチ周期を符号化する時間単位であるサブフレーム毎に、第1の符号列の当該サブフレームのピッチ周期とその過去のサブフレームのピッチ周期とからピッチ周期を計算するピッチ周期の補間または平均化の回路と、この計算したピッチ周期、および少なくともその近傍にある複数のピッチ周期をピッチ周期候補として生成するピッチ周期候補生成回路と、生成された候補のうちのいずれか一つを第2の符号列に含まれるピッチ周期とするピッチ成分符号化回路とを備えることを特徴としている。   For each subframe that is a time unit for encoding the pitch period of the second code string, the fourth means calculates the pitch period of the subframe of the first code string and the pitch period of the past subframe. A pitch period interpolation or averaging circuit for calculating a pitch period, a pitch period candidate generation circuit for generating the calculated pitch period and at least a plurality of pitch periods in the vicinity thereof as a pitch period candidate, and a generated candidate And a pitch component encoding circuit having a pitch period included in the second code string as one of them.

第5の手段は、上記第3または第4の手段におけるピッチ成分符号化回路は、サブフレーム毎に、第1の符号列から復号される音声信号と第2の符号列から復号される音声信号との距離を最小とするように第2の符号列に含まれるピッチ周期を選択することを特徴としている。   According to a fifth means, the pitch component encoding circuit in the third or fourth means is an audio signal decoded from the first code string and an audio signal decoded from the second code string for each subframe. The pitch period included in the second code string is selected so as to minimize the distance between

第6の手段は、上記第3または第4の手段におおけるピッチ成分符号化回路は、サブフレーム毎に、第1の符号列から復号される励振信号と第2の符号列から復号される励振信号との距離を最小とするように前記第2の符号列に含まれるピッチ周期を選択することを特徴としている。   In the sixth means, the pitch component encoding circuit in the third or fourth means is decoded from the excitation signal decoded from the first code string and the second code string for each subframe. The pitch period included in the second code string is selected so as to minimize the distance from the excitation signal.

第7の手段は、第2の符号列のスペクトル特性を符号化する時間単位であるフレーム毎に、第1の符号列に含まれるスペクトル特性を第2の符号列に含まれるスペクトル特性とするため、第1の符号列側にLP係数復号回路、第2の符号列側にLP係数符号化回路それぞれを備えることを特徴としている。   In a seventh aspect, the spectral characteristic included in the first code string is changed to the spectral characteristic included in the second code string for each frame which is a time unit for encoding the spectral characteristic of the second code string. The LP coefficient decoding circuit is provided on the first code string side, and the LP coefficient coding circuit is provided on the second code string side.

第8の手段は、第2の符号列のスペクトル特性を符号化する時間単位であるフレーム毎に、第1の符号列の当該フレームのスペクトル特性とその過去のフレームのスペクトル特性とからスペクトル特性を計算するLP係数の補間または平均化の回路と、この計算したスペクトル特性を第2の符号列に含まれるスペクトル特性とするLP係数符号化回路とを備えることを特徴としている。   The eighth means obtains a spectral characteristic from the spectral characteristic of the frame of the first code string and the spectral characteristic of the past frame for each frame which is a time unit for encoding the spectral characteristic of the second code string. It is characterized by comprising a circuit for interpolation or averaging of LP coefficients to be calculated, and an LP coefficient encoding circuit that uses the calculated spectral characteristics as spectral characteristics included in the second code string.

第9の手段は、第2の符号列のフレーム毎に、第1の符号列に含まれるスペクトル特性の帯域拡張強度を変換する帯域拡張変換回路と、変換して得たスペクトル特性を第2の符号列に含まれるスペクトル特性とするLP係数符号化回路とを備えることを特徴としている。   The ninth means includes, for each frame of the second code string, a band extension conversion circuit that converts the band extension intensity of the spectrum characteristic included in the first code string, and converts the spectrum characteristic obtained by the conversion into the second And an LP coefficient encoding circuit having spectral characteristics included in the code string.

また、第10の手段は、第2の符号列のスペクトル特性を符号化する時間単位であるフレーム毎に、第1の符号列の当該フレームのスペクトル特性とその過去のフレームのスペクトル特性とからスペクトル特性を計算するLP係数の補間または平均化の回路と、この計算したスペクトル特性の帯域拡張強度を変換する帯域拡張変換回路と、変換して得たスペクトル特性を、第2の符号列に含まれるスペクトル特性とするLP係数符号化回路を備えることを特徴としている。   In addition, the tenth means, for each frame that is a time unit for encoding the spectrum characteristic of the second code string, calculates the spectrum from the spectrum characteristic of the frame of the first code string and the spectrum characteristic of the past frame. The second code string includes an LP coefficient interpolation or averaging circuit for calculating the characteristics, a band extension conversion circuit for converting the band extension intensity of the calculated spectrum characteristics, and the spectrum characteristics obtained by the conversion. An LP coefficient encoding circuit having spectral characteristics is provided.

上述したように、本発明は、第1の符号列を第2の符号列に変換する際に、第1の符号列で復号したLP係数を、第2の符号列においてLP分析結果として用いている。この結果、第2の符号列処理において、LP分析処理を省略することができる。また、第1の符号列で復号したピッチ周期またはその近傍などのピッチ周期を、第2の符号列においてピッチ周期候補として用いている。この結果、第2の符号列処理において、ピッチ周期候補の選択処理を省略することができる。   As described above, when the first code string is converted into the second code string, the present invention uses the LP coefficient decoded by the first code string as the LP analysis result in the second code string. Yes. As a result, the LP analysis process can be omitted in the second code string process. Also, the pitch period decoded by the first code string or a pitch period such as the vicinity thereof is used as a pitch period candidate in the second code string. As a result, the pitch cycle candidate selection process can be omitted in the second code string process.

すなわち、本発明によれば、入力側のCELP方式の符号列から復号したLP係数とピッチ周期とを直接用いて出力側に用いており、入力した符号列を復号して得た復号信号を介さずに符号変換しているため、従来、入力側の復号信号に対して行っていたLP分析およびピッチ周期候補の選択を不要にできるので、従来方式に比べて少ない演算量による符号列変換が可能になるという効果が得られる。   That is, according to the present invention, the LP coefficient and pitch period decoded from the input CELP code sequence are directly used on the output side, and the decoded signal obtained by decoding the input code sequence is used. Therefore, it is possible to eliminate the need for LP analysis and selection of pitch period candidates that were previously performed on the decoded signal on the input side. The effect of becoming.

本発明による実施の第1の形態を示す機能ブロック図である。It is a functional block diagram which shows the 1st Embodiment by this invention. 本発明による実施の第2の形態を示す機能ブロック図である。It is a functional block diagram which shows the 2nd Embodiment by this invention. 本発明による実施の第3の形態を示す機能ブロック図である。It is a functional block diagram which shows the 3rd Embodiment by this invention. 本発明におけるLP係数の補間処理を説明する図である。It is a figure explaining the interpolation process of the LP coefficient in this invention. 本発明におけるピッチ周期の補間処理を説明する図である。It is a figure explaining the interpolation process of the pitch period in this invention. 本発明による実施の第4の形態を示す機能ブロック図である。It is a functional block diagram which shows the 4th Embodiment by this invention. 本発明による実施の第5の形態を示す機能ブロック図である。It is a functional block diagram which shows the 5th Embodiment by this invention. 本発明におけるLP係数の平均化処理を説明する図である。It is a figure explaining the averaging process of LP coefficient in the present invention. 本発明におけるピッチ周期の平均化処理を説明する図である。It is a figure explaining the averaging process of the pitch period in this invention. 本発明による実施の第6の形態を示す機能ブロック図である。It is a functional block diagram which shows the 6th Embodiment by this invention. 従来の一例を示す機能ブロック図である。It is a functional block diagram which shows an example of the past.

次に、本発明の実施の形態について図面を参照して説明する。   Next, embodiments of the present invention will be described with reference to the drawings.

図1は本発明における実施の第1の形態を示す機能ブロック図である。この形態はCELP方式AおよびCELP方式Bそれぞれのフレーム長とサブフレーム長とが一致する場合である。   FIG. 1 is a functional block diagram showing a first embodiment of the present invention. This form is a case where the frame length and the subframe length of CELP system A and CELP system B match.

図示された音声符号列の変換装置は、入力端子10、デマルチプレクサ回路11、LP係数復号回路12、ピッチ成分復号回路13、残差成分復号回路14、および音声合成回路15を、CELP方式Aの復号処理のために備える。また、フレーム回路21、サブフレーム回路22、LP係数符号化回路31、ピッチ成分計算回路40、残差成分符号化回路51、励振信号合成回路52、マルチプレクサ回路53、および出力端子50は、CELP方式Bの符号化処理を行なうために設けられる。   The illustrated speech code string conversion apparatus includes an input terminal 10, a demultiplexer circuit 11, an LP coefficient decoding circuit 12, a pitch component decoding circuit 13, a residual component decoding circuit 14, and a speech synthesis circuit 15 in a CELP system A. Prepare for decryption. The frame circuit 21, the subframe circuit 22, the LP coefficient encoding circuit 31, the pitch component calculation circuit 40, the residual component encoding circuit 51, the excitation signal synthesis circuit 52, the multiplexer circuit 53, and the output terminal 50 are CELP-type. It is provided to perform the B encoding process.

従来の変換装置として参照した図11との相違は、LP分析回路130およびピッチ周期候補選択回路132が削除され、ピッチ成分復号回路113がピッチ成分復号回路13に、またピッチ成分符号化回路41がピッチ成分計算回路40にそれぞれ変更された点にある。   The difference from FIG. 11 referred to as the conventional converter is that the LP analysis circuit 130 and the pitch period candidate selection circuit 132 are deleted, the pitch component decoding circuit 113 is replaced with the pitch component decoding circuit 13, and the pitch component encoding circuit 41 is replaced with The pitch component calculation circuit 40 is changed.

この符号列変換装置において、入力端子10は、CELP方式Aの符号列を入力し、デマルチプレクサ回路11に渡す。デマルチプレクサ回路11は、入力端子10から渡された符号列を分離して、量子化LP係数の符号をLP係数復号回路12に渡し、ピッチ成分の符号をピッチ成分復号回路13に渡し、更に、残差成分信号の符号を残差成分復号回路14に渡す。   In this code string converter, the input terminal 10 inputs a CELP system A code string and passes it to the demultiplexer circuit 11. The demultiplexer circuit 11 separates the code string passed from the input terminal 10, passes the code of the quantized LP coefficient to the LP coefficient decoding circuit 12, passes the code of the pitch component to the pitch component decoding circuit 13, and The sign of the residual component signal is passed to the residual component decoding circuit 14.

LP係数復号回路12は、デマルチプレクサ回路11から渡された符号を用いてスペクトル特性を表すLP係数を復号し、復号した係数を音声合成回路15とLP係数符号化回路31とに渡す。ピッチ成分復号回路13はデマルチプレクサ回路11から渡された符号からピッチ周期Lとピッチゲインgaとを復号する。ピッチ成分復号回路13は、図11のピッチ成分復号回路113と比べて、ピッチ周期Lをピッチ成分計算回路40に渡す点のみが異なる。また、音声合成回路15から渡される励振信号を過去のピッチ周期Lのサンプルまで蓄積し、蓄積した励振信号を過去にピッチ周期Lだけ遡って切り出すことにより適応コードベクトルCaを作成する。最後に、ピッチ成分信号Ea(=ga・Ca)を計算し、音声合成回路15に渡す。   The LP coefficient decoding circuit 12 decodes the LP coefficient representing the spectral characteristics using the code passed from the demultiplexer circuit 11, and passes the decoded coefficient to the speech synthesis circuit 15 and the LP coefficient encoding circuit 31. The pitch component decoding circuit 13 decodes the pitch period L and the pitch gain ga from the code passed from the demultiplexer circuit 11. The pitch component decoding circuit 13 is different from the pitch component decoding circuit 113 of FIG. 11 only in passing the pitch period L to the pitch component calculation circuit 40. In addition, the excitation signal passed from the speech synthesis circuit 15 is accumulated up to the samples of the past pitch period L, and the accumulated excitation signal is cut back by the pitch period L in the past to create the adaptive code vector Ca. Finally, the pitch component signal Ea (= ga · Ca) is calculated and passed to the speech synthesis circuit 15.

残差成分復号回路14は、デマルチプレクサ11から渡された符号を用いて音源コードベクトルCrと音源ゲインgrを復号して残差成分信号Er(=gr・Cr)を計算し、音声合成回路15に渡す。音声合成回路15は、ピッチ成分復号回路13から渡されたピッチ成分信号Eaと、残差成分復号回路14から渡された残差成分信号Erとを用いて上記数式1の励振信号ベクトルExを計算し、ピッチ成分復号回路13に渡す。更に、音声合成回路15は、この励振信号ベクトルExを、LP係数復号回路15から渡されるLP係数a(i)で構成される上記数式2による合成フィルタH(z)でフィルタリングして復号信号ベクトルSdを得て、フレーム回路21に渡す。   The residual component decoding circuit 14 decodes the excitation code vector Cr and the excitation gain gr using the code passed from the demultiplexer 11 to calculate the residual component signal Er (= gr · Cr), and the speech synthesis circuit 15 To pass. The speech synthesizing circuit 15 calculates the excitation signal vector Ex of Equation 1 using the pitch component signal Ea passed from the pitch component decoding circuit 13 and the residual component signal Er passed from the residual component decoding circuit 14. To the pitch component decoding circuit 13. Further, the speech synthesis circuit 15 filters the excitation signal vector Ex with the synthesis filter H (z) according to the above equation 2 composed of the LP coefficient a (i) passed from the LP coefficient decoding circuit 15 to obtain a decoded signal vector. Sd is obtained and passed to the frame circuit 21.

フレーム回路21は、音声合成回路15から渡された復号信号をCELP方式Bのフレーム長だけ切り出し、サブフレーム回路22に渡す。サブフレーム回路22は、フレーム回路21から渡された復号信号をCELP方式Bのサブフレーム長に分割し、ピッチ成分計算回路40に渡す。   The frame circuit 21 cuts out the decoded signal passed from the speech synthesis circuit 15 by the frame length of CELP system B and passes it to the subframe circuit 22. The subframe circuit 22 divides the decoded signal passed from the frame circuit 21 into subframe lengths of CELP system B, and passes them to the pitch component calculation circuit 40.

LP係数符号化回路31は、LP係数復号回路12から渡されたLP係数を量子化し、その符号をマルチプレクサ回路53に渡す。更に、LP係数符号化回路31は、量子化したLP係数をピッチ成分計算回路40と残差成分符号化回路51とに渡す。   The LP coefficient encoding circuit 31 quantizes the LP coefficient passed from the LP coefficient decoding circuit 12 and passes the code to the multiplexer circuit 53. Further, the LP coefficient encoding circuit 31 passes the quantized LP coefficient to the pitch component calculation circuit 40 and the residual component encoding circuit 51.

ピッチ成分計算回路40は、励振信号合成回路52から渡された過去に復号された励振信号を時間Lだけ遡ってサブフレーム長で切り出すことにより適応コードベクトルを生成する。次にピッチ成分計算回路40は、この適応コードベクトルを上記数式2によりフィルタリングし、ピッチ成分だけの復号信号Sa(L)を計算する。更にピッチ成分計算回路40は、上記数式3を用いて復号信号ベクトルSdおよびピッチ周期成分ベクトルSa(L)それぞれを荷重し、荷重復号信号ベクトルSdwと荷重ピッチ周期成分ベクトルSaw(L)とを得る。ピッチ成分計算回路40はこれらの値を用いてピッチゲインga(L)を上記数式5で計算する。最後に、ピッチ成分計算回路40は、ピッチ周期Lとピッチゲインga(L)とをスカラー量子化して得た符号をマルチプレクサ回路53に渡す。また、量子化したピッチゲインgaq(L)と適応コードベクトルCaq(L)との積により計算したピッチ成分信号E’aを励振信号合成回路52に渡す。   The pitch component calculation circuit 40 generates an adaptive code vector by cutting back the previously decoded excitation signal passed from the excitation signal synthesis circuit 52 by the time L by a subframe length. Next, the pitch component calculation circuit 40 filters the adaptive code vector with the above-described Equation 2 to calculate the decoded signal Sa (L) having only the pitch component. Further, the pitch component calculation circuit 40 loads the decoded signal vector Sd and the pitch cycle component vector Sa (L) using the above Equation 3, and obtains the load decoded signal vector Sdw and the load pitch cycle component vector Saw (L). . The pitch component calculation circuit 40 calculates the pitch gain ga (L) by using the above formula 5 using these values. Finally, the pitch component calculation circuit 40 passes the code obtained by scalar quantization of the pitch period L and the pitch gain ga (L) to the multiplexer circuit 53. Further, the pitch component signal E′a calculated by the product of the quantized pitch gain gaq (L) and the adaptive code vector Caq (L) is passed to the excitation signal synthesis circuit 52.

残差成分符号化回路51は、サブフレーム毎に、ピッチ成分計算回路40から渡された復号信号ベクトルSdの残差成分を符号化し、その符号をマルチプレクサ53に渡す。   The residual component encoding circuit 51 encodes the residual component of the decoded signal vector Sd passed from the pitch component calculation circuit 40 for each subframe, and passes the code to the multiplexer 53.

まず、残差成分符号化回路51は、予め設計し蓄積した音源コードブックからk番目の音源コードベクトルCr(k)を取り出す。次に残差成分符号化回路51は、この音源コードベクトルを上記数式2によりフィルタリングし、残差成分だけの復号信号Sr(k)を計算する。更に、残差成分符号化回路51は、上記数式3を用いて復号信号ベクトルSdおよび残差成分ベクトルSr(k)それぞれを荷重して、荷重復号信号ベクトルSdwと荷重残差成分ベクトルSrw(k)とを得る。   First, the residual component encoding circuit 51 extracts the k-th excitation code vector Cr (k) from the excitation code book designed and stored in advance. Next, the residual component encoding circuit 51 filters the excitation code vector with the above-described Equation 2 to calculate a decoded signal Sr (k) having only the residual component. Further, the residual component encoding circuit 51 loads the decoded signal vector Sd and the residual component vector Sr (k) using Equation 3 to load the decoded decoded signal vector Sdw and the weighted residual component vector Srw (k). ) And get.

残差成分符号化回路51は、上述した残差成分に関する動作を、音源コードブックに蓄積されている全ての音源コードベクトルに対して行ない、ピッチ成分計算回路40から渡された残差信号ベクトルSdw’と荷重残差成分ベクトルSrw(k)との二乗距離Drを、上記数式6を用いて計算し、最小とする音源コードベクトルの符号koを決定する。   The residual component encoding circuit 51 performs the above-described operation related to the residual component on all the excitation code vectors stored in the excitation codebook, and the residual signal vector Sdw passed from the pitch component calculation circuit 40. The square distance Dr between 'and the load residual component vector Srw (k) is calculated using Equation 6 above, and the code ko of the minimum excitation code vector is determined.

最後に、残差成分符号化回路51は、最適音源ゲインgr(ko)をスカラー量子化し、その符号と音源コードベクトルの符号koをマルチプレクサ回路53に渡す。また、残差成分符号化回路51は、選択された音源コードベクトルCr(ko)に量子化した最適音源ゲインgrq(ko)を積算した残差成分励振信号E’rを励振信号合成回路52に渡す。   Finally, the residual component encoding circuit 51 scalar quantizes the optimum excitation gain gr (ko), and passes the code and the code ko of the excitation code vector to the multiplexer circuit 53. Also, the residual component encoding circuit 51 supplies the residual component excitation signal E′r obtained by integrating the optimal excitation gain grq (ko) quantized to the selected excitation code vector Cr (ko) to the excitation signal combining circuit 52. hand over.

励振信号合成回路52は、ピッチ成分計算回路40から渡されたピッチ成分励振信号E’aと、残差成分符号化回路51から渡された残差成分励振信号E’rとを加算する上記数式8により励振信号Ex’を計算し、ピッチ成分計算回路40に渡す。   The excitation signal synthesis circuit 52 adds the pitch component excitation signal E′a passed from the pitch component calculation circuit 40 and the residual component excitation signal E′r passed from the residual component encoding circuit 51. 8 calculates the excitation signal Ex ′ and passes it to the pitch component calculation circuit 40.

マルチプレクサ回路53は、LP係数符号化回路31とピッチ成分計算回路40と残差成分符号化回路51とから渡されたLP係数とピッチ周期とピッチゲインと音源コードブックと音源ゲインの符号とを所定順序に接続して符号列を生成し、出力端子50に渡す。出力端子50は、マルチプレクサ回路53から渡された符号列を出力する。   The multiplexer circuit 53 predetermines the LP coefficient, pitch period, pitch gain, excitation codebook, and excitation gain code passed from the LP coefficient encoding circuit 31, the pitch component calculation circuit 40, and the residual component encoding circuit 51. A code string is generated by connecting to the order and passed to the output terminal 50. The output terminal 50 outputs the code string passed from the multiplexer circuit 53.

次に、図2を参照して本発明における実施の第2の形態について説明する。   Next, a second embodiment of the present invention will be described with reference to FIG.

この形態はCELP方式AおよびCELP方式Bの間でスペクトルの帯域拡張処理が異なることを補正するための帯域拡張変換処理、およびピッチ周期の候補を生成するピッチ周期候補生成処理を追加するものである。   This form adds a band extension conversion process for correcting that the spectrum band extension process differs between CELP system A and CELP system B, and a pitch period candidate generation process for generating pitch period candidates. .

図2が図1と異なる点は、帯域拡張変換回路30およびピッチ周期候補生成回路32が追加され、ピッチ成分計算回路40の代わりに、図11で説明したピッチ成分符号化回路41が用いられていることである。帯域拡張変換回路30はLP係数復号回路12とLP係数符号化回路31との間に位置する。ピッチ周期候補生成回路32は、ピッチ成分復号回路13とピッチ成分符号化回路41との間に位置する。   2 differs from FIG. 1 in that a band extension conversion circuit 30 and a pitch period candidate generation circuit 32 are added, and the pitch component encoding circuit 41 described in FIG. 11 is used instead of the pitch component calculation circuit 40. It is that you are. The band extension conversion circuit 30 is located between the LP coefficient decoding circuit 12 and the LP coefficient encoding circuit 31. The pitch period candidate generation circuit 32 is located between the pitch component decoding circuit 13 and the pitch component encoding circuit 41.

図2で図1と同一の構成要素は、同一の番号符号を付与してその説明を省略する。従って、これらの処理に関連する帯域拡張変換回路30およびピッチ周期候補生成回路32について次に説明する。   In FIG. 2, the same constituent elements as those in FIG. Therefore, the band extension conversion circuit 30 and the pitch period candidate generation circuit 32 related to these processes will be described next.

帯域拡張処理は、スペクトル特性で急峻なピークが生じないようにLP係数a(i)を入力信号の自己相関関数r(i)から計算する際に、指数窓などの窓関数w(i)を自己相関関数r(i)に積算して「w(i)・r(i)」を求める処理である。符号化方式によりこの窓関数w(i)が異なるため、符号列変換ではこれを補正することにより、変換による劣化を低減することができる。また、ピッチ周期候補生成処理は、CELP方式Aで復号されたピッチ周期をそのままCELP方式Bで用いるのではなく、そのピッチ周期とその近隣のピッチ周期の中から選択する処理である。ピッチ周期をそのまま使用する場合に比べてピッチ周期を決定するための演算量が必要であるが、変換による劣化を低減できる。   In the band expansion process, when calculating the LP coefficient a (i) from the autocorrelation function r (i) of the input signal so that a sharp peak does not occur in the spectral characteristics, the window function w (i) such as an exponential window is calculated. In this process, “w (i) · r (i)” is obtained by integrating the autocorrelation function r (i). Since this window function w (i) differs depending on the encoding method, the deterioration due to the conversion can be reduced by correcting this in the code string conversion. The pitch period candidate generation process is a process of selecting a pitch period decoded by CELP system A as it is from CELP system B without using it as it is in CELP system B. Compared with the case where the pitch period is used as it is, a calculation amount for determining the pitch period is required, but deterioration due to conversion can be reduced.

帯域拡張変換回路30は、LP係数復号回路12から渡されたLP係数で構成されるLPフィルタのインパルス応答を計算し、このインパルス応答の自己相関関数にCELP方式Aの帯域拡張係数wa(i)の逆数を積算し、更にCELP方式Bの帯域拡張係数wb(i)を積算する。次に、帯域拡張変換回路30は、レビンソン・ダーバン(Levinson-Durbin)法等により自己相関関数からLP係数を計算し、LP係数符号化回路31に渡す。   The band extension conversion circuit 30 calculates the impulse response of the LP filter composed of the LP coefficients passed from the LP coefficient decoding circuit 12, and uses the CELP system A band extension coefficient wa (i) as the autocorrelation function of the impulse response. And the band expansion coefficient wb (i) of CELP system B is integrated. Next, the band extension conversion circuit 30 calculates the LP coefficient from the autocorrelation function by the Levinson-Durbin method or the like, and passes it to the LP coefficient encoding circuit 31.

ピッチ周期候補生成回路32は、ピッチ成分復号回路13から渡されたピッチ周期Lとその近隣のピッチ周期を、ピッチ周期候補として、ピッチ成分符号化回路41に渡す。渡されるピッチ周期には、符号列変換による音質劣化を抑えるために、ピッチ周期Lの整数倍もしくは整数分の1の値、またはその近傍の値をピッチ周期候補として含めることもできる。   The pitch cycle candidate generation circuit 32 passes the pitch cycle L and the neighboring pitch cycle passed from the pitch component decoding circuit 13 to the pitch component encoding circuit 41 as pitch cycle candidates. In order to suppress deterioration in sound quality due to code string conversion, the passed pitch period may include an integer multiple of the pitch period L, a value of a fraction of an integer, or a value in the vicinity thereof as a pitch period candidate.

ピッチ成分符号化回路41は、ピッチ周期候補生成回路32からピッチ周期候補を渡され、従来方式で説明したものと同一の動作を行なう。この際、演算量を削減するために、上記数式2によるフィルタリングと、上記数式3による荷重とを省略するために、各遅延毎に計算する最適ピッチゲインG’a(L)を用いて音声合成回路15で計算された励振信号Exと適応コードベクトルCa(L)との二乗距離D’aが最小となる最適ピッチ周期Loを決定することもできる。   The pitch component encoding circuit 41 receives the pitch period candidate from the pitch period candidate generation circuit 32 and performs the same operation as described in the conventional method. At this time, in order to reduce the amount of calculation, speech synthesis is performed using the optimum pitch gain G′a (L) calculated for each delay in order to omit the filtering according to Equation 2 and the load according to Equation 3. It is also possible to determine the optimal pitch period Lo that minimizes the square distance D′ a between the excitation signal Ex calculated by the circuit 15 and the adaptive code vector Ca (L).

二乗距離D’aは下記数式9を、また最適ピッチゲインG’a(L)は下記数式10を、それぞれ用いて求められる。   The square distance D'a is obtained using the following equation 9, and the optimum pitch gain G'a (L) is obtained using the following equation 10.

Figure 2009104169
Figure 2009104169
Figure 2009104169
Figure 2009104169

次に、図3を参照して本発明における実施の第3の形態について説明する。   Next, a third embodiment of the present invention will be described with reference to FIG.

この実施の形態は、CELP方式Aのフレーム長Naおよびサブフレーム長NsaそれぞれがCELP方式Bのフレーム長Nbおよびサブフレーム長Nsbのそれぞれより長い場合である。この形態は、上記第2の形態と比べてフレーム長およびサブフレーム長それぞれの差を調整する処理を有することが異なる。   In this embodiment, the frame length Na and the subframe length Nsa of CELP system A are longer than the frame length Nb and the subframe length Nsb of CELP system B, respectively. This embodiment is different from the second embodiment in that it has a process of adjusting the difference between the frame length and the subframe length.

図3が図2と異なる点は、これらの処理に関連するLP係数補間回路60とピッチ周期補間回路70とが追加されていることである。LP係数補間回路60はLP係数復号回路12と帯域拡張変換回路30との間に位置する。ピッチ周期補間回路70は、ピッチ成分復号回路13とピッチ周期候補生成回路32との間に位置する。   3 differs from FIG. 2 in that an LP coefficient interpolation circuit 60 and a pitch period interpolation circuit 70 related to these processes are added. The LP coefficient interpolation circuit 60 is located between the LP coefficient decoding circuit 12 and the band extension conversion circuit 30. The pitch period interpolation circuit 70 is located between the pitch component decoding circuit 13 and the pitch period candidate generation circuit 32.

図3で図2と同一の構成要素は同一の番号符号を付与してその説明を省略する。追加されたLP係数補間回路60とピッチ周期補間回路70とについて、次に説明する。   In FIG. 3, the same components as those in FIG. The added LP coefficient interpolation circuit 60 and pitch period interpolation circuit 70 will be described next.

ここで説明を具体的にするために、CELP方式Aのフレーム長Naは20msであり、サブフレーム長Nsaは10ms、また、CELP方式Bのフレーム長Nbは10msであり、サブフレーム長Nsbは5msであるものとする。また、LP係数は各フレームの最終サブフレームを中心としてLP分析窓で計算するものとする。   To make the description concrete, the frame length Na of CELP system A is 20 ms, the subframe length Nsa is 10 ms, the frame length Nb of CELP system B is 10 ms, and the subframe length Nsb is 5 ms. Suppose that The LP coefficient is calculated by the LP analysis window with the final subframe of each frame as the center.

LP係数補間回路60は、LP係数復号回路12からフレーム長Naの20ms毎に渡されるLP係数と過去のフレームで渡されたLP係数とから、CELP方式Bで使用するフレーム長Nbの10ms毎のLP係数を計算し、帯域拡張変換回路30に渡す。   The LP coefficient interpolation circuit 60 uses the LP coefficient passed every 20 ms of the frame length Na from the LP coefficient decoding circuit 12 and the LP coefficient passed in the past frame, every 10 ms of the frame length Nb used in the CELP system B. The LP coefficient is calculated and passed to the band extension conversion circuit 30.

ここで図4にCELP方式AおよびCELP方式BそれぞれのLP係数の関係を示す。図示されるX印は前述したLP分析窓の中心であり、LP係数を補間する場合の中心とする。フレーム番号をCELP方式Aでは「k」またCELP方式Bでは「t」それぞれにより示している。矢印は、CELP方式AのLP係数がCELP方式BのどのLP係数を計算するために使用されるかを示す。   FIG. 4 shows the relationship between the LP coefficients of CELP system A and CELP system B. The X mark shown in the figure is the center of the LP analysis window described above, and is the center when the LP coefficient is interpolated. The frame number is indicated by “k” in CELP system A and “t” in CELP system B, respectively. The arrows indicate which LP coefficients of CELP scheme A are used to calculate the LP coefficients of CELP scheme A.

LP係数復号回路12から、CELP方式Aのフレームのスペクトル特性を表すLP係数が20ms毎に渡されるが、CELP方式Bでは10ms毎にLP係数を必要とする。このため、図4に示される矢印のように「i」を「1,2,…,またはp」とするとき、フレーム番号「t−1」および「t」におけるCELP方式BのLP係数ab(t−1,i)およびLP係数ab(t,i)を、CELP方式Aで対応するフレームのLP係数aa(k,i)、および過去にjフレーム分だけ遡ったフレームにおけるLP係数aa(k−j,i)を用いて下記数式11および数式12それぞれに従って計算する。計算に当たっては、補間方法を規定する荷重関数w(j)が用いられる。また、図4に示される例でX印の位置関係を考慮すると、数式11におけるLP係数ab(t−1,i)の場合では「w(0)=5/8,w(1)=3/8」および「M=2」が適用される。また、数式12におけるLP係数ab(t,i)の場合では「w(0)=1」および「M=1」が適用される。   The LP coefficient representing the spectral characteristics of the CELP system A frame is passed from the LP coefficient decoding circuit 12 every 20 ms, whereas the CELP system B requires an LP coefficient every 10 ms. For this reason, when “i” is “1, 2,..., Or p” as indicated by an arrow shown in FIG. 4, the LP coefficient ab (CELP method B at frame numbers “t−1” and “t” ( t-1, i) and LP coefficient ab (t, i) are converted to LP coefficient aa (k, i) of the corresponding frame in CELP system A, and LP coefficient aa (k -J, i) is used according to the following equations 11 and 12. In the calculation, a load function w (j) that defines an interpolation method is used. In consideration of the positional relationship of the X mark in the example shown in FIG. 4, in the case of the LP coefficient ab (t−1, i) in Expression 11, “w (0) = 5/8, w (1) = 3 / 8 "and" M = 2 "apply. In the case of the LP coefficient ab (t, i) in Expression 12, “w (0) = 1” and “M = 1” are applied.

Figure 2009104169
Figure 2009104169
Figure 2009104169
Figure 2009104169

ピッチ周期補間回路70は、ピッチ成分復号回路13からサブフレーム長Nasの10ms毎に渡されるピッチ周期と過去のサブフレームで渡されたピッチ周期とから、CELP方式Bで使用するサブフレーム長Nsbの5ms毎のピッチ周期を計算し、ピッチ周期候補生成回路32に渡す。   The pitch period interpolation circuit 70 determines the subframe length Nsb used in the CELP system B from the pitch period passed every 10 ms of the subframe length Nas from the pitch component decoding circuit 13 and the pitch period passed in the past subframe. A pitch period every 5 ms is calculated and passed to the pitch period candidate generation circuit 32.

ここで、図5にCELP方式AおよびCELP方式Bそれぞれのピッチ周期の関係を示す。フレーム番号をCELP方式Aでは「k」またCELP方式Bでは「t」それぞれにより示している。矢印は、CELP方式Aのピッチ周期がCELP方式Bのどのピッチ周期を計算するために使用されるかを示す。   FIG. 5 shows the relationship between the pitch periods of CELP system A and CELP system B. The frame number is indicated by “k” in CELP system A and “t” in CELP system B, respectively. The arrows indicate which pitch period of CELP system B is used to calculate the pitch period of CELP system A.

ピッチ成分復号回路13からは、CELP方式Aのサブフレームのピッチ周期が10ms毎に渡されるが、CELP方式Bでは5ms毎にピッチ周期を必要とするため、図5の矢印が示すように、フレーム番号「t」の第1および第2サブフレームにおけるCELP方式Bのピッチ周期L1b(t)およびピッチ周期L2b(t)を、CELP方式Aで対応するフレームのピッチ周期L1a(k)およびピッチ周期L2a(k)および過去にjフレーム分だけ遡ったフレームにおけるピッチ周期L1a(k−j)およびピッチ周期L2a(k−j)それぞれを用いて下記数式13のピッチ周期Lsb(t)により計算する。計算に当たっては、補間方法を規定する荷重関数u(j)が用いられる。   From the pitch component decoding circuit 13, the pitch period of the subframe of CELP system A is passed every 10 ms. However, since the CELP system B requires a pitch period every 5 ms, as shown by the arrow in FIG. The pitch period L1b (t) and pitch period L2b (t) of CELP system B in the first and second subframes with the number “t” are the pitch period L1a (k) and pitch period L2a of the corresponding frame in CELP system A. (K) and the pitch period L1a (k−j) and the pitch period L2a (k−j) in the frame that is traced back by j frames in the past, respectively, are calculated by the pitch period Lsb (t) of Equation 13 below. In the calculation, a load function u (j) that defines an interpolation method is used.

Figure 2009104169
Figure 2009104169

また、図5に示される例で両CELP方式のサブフレームの位置関係を考慮すると、数式13におけるピッチ周期Lsb(t)がピッチ周期L1b(t)の場合では「u(0)=3/4,u(1)=1/4」および「M=2」が適用される。また、ピッチ周期Lsb(t)がピッチ周期L2b(t)の場合では「u(0)=1」および「M=1」が適用される。   Further, in consideration of the positional relationship between the CELP subframes in the example shown in FIG. 5, when the pitch period Lsb (t) in Expression 13 is the pitch period L1b (t), “u (0) = 3/4”. , U (1) = 1/4 ”and“ M = 2 ”apply. Further, when the pitch period Lsb (t) is the pitch period L2b (t), “u (0) = 1” and “M = 1” are applied.

次に、図6を参照して本発明における実施の第4の形態について説明する。   Next, a fourth embodiment of the present invention will be described with reference to FIG.

この形態は上記第3の形態と同様に、CELP方式Aのフレーム長Naおよびサブフレーム長NsaそれぞれがCELP方式Bのフレーム長Nbおよびサブフレーム長Nsbのそれぞれより長い場合である。   This form is a case where the CELP system A frame length Na and the subframe length Nsa are longer than the CELP system B frame length Nb and the subframe length Nsb, respectively, as in the third embodiment.

CELP方式AおよびCELP方式Bの間でスペクトルの帯域拡張処理が異なることを補正するための帯域拡張変換処理、およびピッチ周期の候補を生成するピッチ周期候補生成処理を追加するものである。 A band extension conversion process for correcting that the spectrum band extension process differs between CELP system A and CELP system B and a pitch period candidate generation process for generating pitch period candidates are added.

図6が図1と異なる点は、LP係数補間回路60とピッチ周期補間回路70とが追加されていることであり、図3から帯域拡張変換回路30およびピッチ周期候補生成回路32が削除され、ピッチ成分符号化回路41の代わりに、図1を参照して説明したピッチ成分計算回路40が用いられていることである。従って、LP係数補間回路60はLP係数復号回路12とLP係数符号化回路31との間に位置する。ピッチ周期補間回路70は、ピッチ成分復号回路13とピッチ成分計算回路40との間に位置する。   6 differs from FIG. 1 in that an LP coefficient interpolation circuit 60 and a pitch period interpolation circuit 70 are added, and the band extension conversion circuit 30 and the pitch period candidate generation circuit 32 are deleted from FIG. Instead of the pitch component encoding circuit 41, the pitch component calculation circuit 40 described with reference to FIG. 1 is used. Therefore, the LP coefficient interpolation circuit 60 is located between the LP coefficient decoding circuit 12 and the LP coefficient encoding circuit 31. The pitch period interpolation circuit 70 is located between the pitch component decoding circuit 13 and the pitch component calculation circuit 40.

図6で図1と同一の構成要素は、同一の番号符号を付与してその説明を省略する。また、LP係数補間回路60とピッチ周期補間回路70とは図1に追加されているが、上記図3から図5までを参照して説明しているものと機能的に同一である。   In FIG. 6, the same components as those in FIG. The LP coefficient interpolation circuit 60 and the pitch period interpolation circuit 70 are added to FIG. 1, but are functionally the same as those described with reference to FIGS.

すなわち、LP係数補間回路60は、LP係数復号回路12から渡されたLP係数を補間して、LP係数符号化回路31に渡す。ピッチ周期補間回路70はピッチ成分復号回路13から渡されるピッチ周期を補間して、ピッチ成分計算回路40渡す。   That is, the LP coefficient interpolation circuit 60 interpolates the LP coefficient passed from the LP coefficient decoding circuit 12 and passes it to the LP coefficient encoding circuit 31. The pitch period interpolation circuit 70 interpolates the pitch period passed from the pitch component decoding circuit 13 and passes it to the pitch component calculation circuit 40.

次に、図7を参照して本発明における実施の第5の形態について説明する。   Next, a fifth embodiment of the present invention will be described with reference to FIG.

この実施の形態は、CELP方式Aのフレーム長Naおよびサブフレーム長NsaそれぞれがCELP方式Bのフレーム長Nbおよびサブフレーム長Nsbのそれぞれより短い場合である。この形態は、上記第2の形態と比べてフレーム長およびサブフレーム長それぞれの差を調整する処理を有することが異なり、また上記第3の形態と比較してその差の調整処理方法が異なっている。   In this embodiment, the frame length Na and the subframe length Nsa of CELP system A are shorter than the frame length Nb and the subframe length Nsb of CELP system B, respectively. This embodiment differs from the second embodiment in that it has a process for adjusting the difference between the frame length and the subframe length, and the difference adjustment processing method is different from that in the third embodiment. Yes.

すなわち、図7が図3と異なる点は、これらの処理に関連する図3におけるLP係数補間回路60とピッチ周期補間回路70とがLP係数平均化回路61とピッチ周期平均化回路71とにそれぞれ代替えされていることである。従って、LP係数平均化回路61はLP係数復号回路12と帯域拡張変換回路30との間に位置する。ピッチ周期平均化回路71は、ピッチ成分復号回路13とピッチ周期候補生成回路32との間に位置する。   That is, FIG. 7 differs from FIG. 3 in that the LP coefficient interpolation circuit 60 and the pitch period interpolation circuit 70 in FIG. 3 related to these processes are respectively replaced by the LP coefficient averaging circuit 61 and the pitch period averaging circuit 71. It has been replaced. Therefore, the LP coefficient averaging circuit 61 is located between the LP coefficient decoding circuit 12 and the band extension conversion circuit 30. The pitch period averaging circuit 71 is located between the pitch component decoding circuit 13 and the pitch period candidate generating circuit 32.

図7で図3と同一の構成要素は、同一の番号符号を付与してその説明を省略する。従って、代替えされたLP係数平均化回路61とピッチ周期平均化回路71とについて次に説明する。   In FIG. 7, the same components as those in FIG. 3 are given the same reference numerals and description thereof is omitted. Therefore, the replaced LP coefficient averaging circuit 61 and pitch period averaging circuit 71 will be described next.

ここで説明を具体的にするために、CELP方式Aのフレーム長Naは10msであり、サブフレーム長Nsaは5ms、また、CELP方式Bのフレーム長Nbは20msであり、サブフレーム長Nsbは10msであるものとする。また、LP係数は各フレームの最終サブフレームを中心としてLP分析窓で計算するものとする。   In order to make the description concrete here, the frame length Na of CELP system A is 10 ms, the subframe length Nsa is 5 ms, the frame length Nb of CELP system B is 20 ms, and the subframe length Nsb is 10 ms. Suppose that The LP coefficient is calculated by the LP analysis window with the final subframe of each frame as the center.

LP係数平均化回路61は、LP係数復号回路12からフレーム長Naの10ms毎に渡されるLP係数と過去のフレームで渡されたLP係数とから、CELP方式Bで使用するフレーム長Nbの20ms毎のLP係数を計算し、帯域拡張変換回路30に渡す。   The LP coefficient averaging circuit 61 uses the LP coefficient passed from the LP coefficient decoding circuit 12 every 10 ms of the frame length Na and the LP coefficient passed in the past frame, and every 20 ms of the frame length Nb used in the CELP system B. The LP coefficient is calculated and passed to the band extension conversion circuit 30.

ここで、図8にCELP方式AおよびCELP方式BそれぞれのLP係数の関係を示す。図示されるX印は前述したLP分析窓の中心であり、LP係数を平均化する場合の中心とする。フレーム番号をCELP方式Aでは「k」またCELP方式Bでは「t」それぞれにより示している。矢印は、CELP方式AのLP係数がCELP方式BのどのLP係数を計算するために使用されるかを示す。   FIG. 8 shows the relationship between the LP coefficients of CELP system A and CELP system B. The X mark shown in the figure is the center of the LP analysis window described above, and is the center when the LP coefficients are averaged. The frame number is indicated by “k” in CELP system A and “t” in CELP system B, respectively. The arrows indicate which LP coefficients of CELP scheme A are used to calculate the LP coefficients of CELP scheme A.

LP係数復号回路12からは、CELP方式Aのフレームのスペクトル特性を表すLP係数が10ms毎に渡されるが、CELP方式Bでは20ms毎にLP係数を必要とする。このため、図8に示される矢印のように「i」を「1,2,…,またはp」とするとき、フレーム番号「t」におけるCELP方式BのLP係数ab(t,i)を、CELP方式Aで対応するフレームのLP係数aa(k,i)および過去にjフレーム分だけ遡ったフレームにおけるLP係数aa(k−j,i)を用いて上記数式12に従って計算する。計算に当たっては、平均化方法を規定する荷重関数w(j)が用いられる。また、図8に示される例でX印の位置関係を考慮すると、数式12におけるLP係数ab(t,i)の場合で「w(0)=3/4、w(1)=1/4」および「M=2」が適用される。   The LP coefficient decoding circuit 12 passes the LP coefficient representing the spectrum characteristics of the CELP system A frame every 10 ms, but the CELP system B requires an LP coefficient every 20 ms. For this reason, when “i” is “1, 2,..., Or p” as indicated by an arrow shown in FIG. 8, the LP coefficient ab (t, i) of the CELP system B at the frame number “t” is The calculation is performed according to Equation 12 using the LP coefficient aa (k, i) of the frame corresponding to CELP system A and the LP coefficient aa (k−i, i) of the frame that is traced back by j frames in the past. In the calculation, a load function w (j) that defines an averaging method is used. In consideration of the positional relationship of the X mark in the example shown in FIG. 8, in the case of the LP coefficient ab (t, i) in Expression 12, “w (0) = 3/4, w (1) = 1/4. And “M = 2” apply.

ピッチ周期平均化回路71は、ピッチ成分復号回路13からサブフレーム長Nasの10ms毎に渡されるピッチ周期と過去のサブフレームで渡されたピッチ周期とから、CELP方式Bで使用するサブフレーム長Nsbの5ms毎のピッチ周期を計算し、ピッチ周期候補生成回路32に渡す。   The pitch period averaging circuit 71 uses the pitch period passed every 10 ms of the subframe length Nas from the pitch component decoding circuit 13 and the pitch period passed in the past subframe, and the subframe length Nsb used in the CELP system B. The pitch period is calculated every 5 ms and passed to the pitch period candidate generation circuit 32.

ここで、図9にCELP方式AおよびCELP方式Bそれぞれのピッチ周期の関係を示す。フレーム番号をCELP方式Aでは「k」またCELP方式Bでは「t」それぞれにより示している。矢印は、CELP方式Aのピッチ周期がCELP方式Bのどのピッチ周期を計算するために使用されるかを示す。   FIG. 9 shows the relationship between the pitch periods of CELP system A and CELP system B. The frame number is indicated by “k” in CELP system A and “t” in CELP system B, respectively. The arrows indicate which pitch period of CELP system B is used to calculate the pitch period of CELP system A.

ピッチ成分復号回路13からは、CELP方式Aのサブフレームのピッチ周期が5ms毎に渡されるが、CELP方式Bでは10ms毎にピッチ周期を必要とする。このため、図9の矢印が示すように、フレーム番号「t」の第1および第2サブフレームにおけるCELP方式Bのピッチ周期L1b(t)およびピッチ周期L2b(t)を、CELP方式Aで対応するフレームのピッチ周期L1a(k)およびピッチ周期L2a(k)および過去にjフレーム分だけ遡ったフレームにおけるピッチ周期L1a(k−j)およびピッチ周期L2a(k−j)それぞれを用いて上記数式13のピッチ周期Lsb(t)により計算する。計算に当たっては、平均化方法を規定する荷重関数u(j)が用いられる。また、図9に示される例で両CELP方式のサブフレームの位置関係を考慮すると、数式13におけるピッチ周期Lsb(t)がピッチ周期L1b(t)の場合では「u(0)=1/2,u(1)=1/2」および「M=2」が適用される。また同様に、ピッチ周期L2b(t)の場合では「u(0)=0,u(1)=0,u(2)=1/2、u(3)=1/2」および「M=4」が適用される。   From the pitch component decoding circuit 13, the pitch period of the subframe of CELP system A is passed every 5 ms, but CELP system B requires a pitch period every 10 ms. Therefore, as indicated by the arrows in FIG. 9, CELP method A corresponds to pitch period L1b (t) and pitch period L2b (t) of CELP method B in the first and second subframes of frame number “t”. Using the pitch period L1a (k) and the pitch period L2a (k) of the frame to be played, and the pitch period L1a (kj) and the pitch period L2a (kj) in the frame that is traced back by j frames in the past It is calculated by 13 pitch periods Lsb (t). In the calculation, a load function u (j) that defines an averaging method is used. Further, in consideration of the positional relationship between the CELP subframes in the example shown in FIG. 9, when the pitch period Lsb (t) in Expression 13 is the pitch period L1b (t), “u (0) = 1/2 , U (1) = 1/2 ”and“ M = 2 ”apply. Similarly, in the case of the pitch period L2b (t), “u (0) = 0, u (1) = 0, u (2) = 1/2, u (3) = 1/2” and “M = 4 "applies.

次に、図10を参照して本発明における実施の第6の形態について説明する。   Next, a sixth embodiment of the present invention will be described with reference to FIG.

この形態は上記第5の形態と同様に、CELP方式Aのフレーム長Naおよびサブフレーム長NsaそれぞれがCELP方式Bのフレーム長Nbおよびサブフレーム長Nsbのそれぞれより短い場合である。この形態は、上記第2の形態と比べてフレーム長およびサブフレーム長それぞれの差を調整する処理を有することが異なり、また上記第5の形態と比較してその差の調整処理方法が異なっている。   This form is a case where the CELP system A frame length Na and the subframe length Nsa are shorter than the CELP system B frame length Nb and the subframe length Nsb, respectively, as in the fifth embodiment. This embodiment is different from the second embodiment in that it has a process for adjusting the difference between the frame length and the subframe length, and the difference adjustment processing method is different from that in the fifth embodiment. Yes.

図10が図1と異なる点は、LP係数平均化回路61とピッチ周期平均化回路71とが追加されていることであり、図7と異なる点は、帯域拡張変換回路30およびピッチ周期候補生成回路32が削除され、ピッチ成分符号化回路41の代わりに図1を参照して説明したピッチ成分計算回路40が用いられていることである。従って、LP係数平均化回路61はLP係数復号回路12とLP係数符号化回路31との間に位置する。ピッチ周期平均化回路71はピッチ成分復号回路13とピッチ成分計算回路40との間に位置する。   10 is different from FIG. 1 in that an LP coefficient averaging circuit 61 and a pitch period averaging circuit 71 are added. The difference from FIG. 7 is that the band extension conversion circuit 30 and pitch period candidate generation are performed. The circuit 32 is deleted, and the pitch component calculation circuit 40 described with reference to FIG. 1 is used instead of the pitch component encoding circuit 41. Therefore, the LP coefficient averaging circuit 61 is located between the LP coefficient decoding circuit 12 and the LP coefficient encoding circuit 31. The pitch period averaging circuit 71 is located between the pitch component decoding circuit 13 and the pitch component calculation circuit 40.

図10で図1と同一の構成要素は、同一の番号符号を付与してその説明を省略する。また、LP係数平均化回路61とピッチ周期平均化回路71とは図1に追加されているが、上記図7から図9までを参照して説明しているものと機能的に同一である。   In FIG. 10, the same constituent elements as those in FIG. Further, the LP coefficient averaging circuit 61 and the pitch period averaging circuit 71 are added to FIG. 1, but are functionally the same as those described with reference to FIGS.

すなわち、LP係数平均化回路61は、第5の実施例で説明したのと同様に、LP係数復号回路12から渡されたLP係数を平均化して、LP係数符号化回路31に渡す。ピッチ周期平均化回路71は、ピッチ成分復号回路13から渡されるピッチ周期を平均化して、ピッチ成分計算回路40に渡す。   That is, the LP coefficient averaging circuit 61 averages the LP coefficients passed from the LP coefficient decoding circuit 12 and passes them to the LP coefficient encoding circuit 31 in the same manner as described in the fifth embodiment. The pitch period averaging circuit 71 averages the pitch periods passed from the pitch component decoding circuit 13 and passes them to the pitch component calculation circuit 40.

以上説明したように本発明によれば、入力側のCELP方式の符号列から復号したLP係数とピッチ周期とを直接用いて出力側に用いており、入力した符号列を復号して得た復号信号を介さずに符号変換しているため、従来、入力側の復号信号に対して行っていたLP分析およびピッチ周期候補の選択を不要にできるので、従来方式に比べて少ない演算量による符号列変換が可能になるという効果が得られる。   As described above, according to the present invention, the LP coefficient and pitch period decoded from the input CELP code sequence are directly used on the output side, and the decoding obtained by decoding the input code sequence Since code conversion is performed without using a signal, it is possible to eliminate the need for LP analysis and selection of pitch period candidates that were conventionally performed on a decoded signal on the input side. The effect that conversion becomes possible is acquired.

本発明は、復号したピッチ周期成分と残差信号から計算した励振信号とを復号したLP係数で構成する合成フィルタに入力して合成音声信号を得るCELP方式による復号装置に広く利用することができる。   INDUSTRIAL APPLICABILITY The present invention can be widely used in a CELP decoding apparatus that obtains a synthesized speech signal by inputting a decoded pitch period component and an excitation signal calculated from a residual signal into a synthesis filter composed of decoded LP coefficients. .

10 入力端子
11 デマルチプレクサ回路
12 LP係数復号回路
13 ピッチ成分復号回路
14 残差成分復号回路
15 音声合成回路
21 フレーム回路
22 サブフレーム回路
30 帯域拡張変換回路
31 LP係数符号化回路
32 ピッチ周期候補生成回路
40 ピッチ成分計算回路
41 ピッチ成分符号化回路
50 出力端子
51 残差成分符号化回路
52 励振信号合成回路
53 マルチプレクサ回路
60 LP係数補間回路
61 LP係数平均化回路
70 ピッチ周期補間回路
71 ピッチ周期平均化回路
DESCRIPTION OF SYMBOLS 10 Input terminal 11 Demultiplexer circuit 12 LP coefficient decoding circuit 13 Pitch component decoding circuit 14 Residual component decoding circuit 15 Speech synthesis circuit 21 Frame circuit 22 Subframe circuit 30 Band extension conversion circuit 31 LP coefficient encoding circuit 32 Pitch period candidate generation Circuit 40 Pitch component calculation circuit 41 Pitch component encoding circuit 50 Output terminal 51 Residual component encoding circuit 52 Excitation signal synthesis circuit 53 Multiplexer circuit 60 LP coefficient interpolation circuit 61 LP coefficient averaging circuit 70 Pitch period interpolation circuit 71 Pitch period average Circuit

Claims (4)

スペクトル特性を含む第1の符号列を、スペクトル特性を含む第2の符号列に変換する符号列変換装置において、前記第2の符号列のフレーム毎に、前記第1の符号列に含まれるスペクトル特性の帯域拡張強度を変換して得たスペクトル特性を前記第2の符号列に含まれるスペクトル特性とする回路を備えることを特徴とする符号列変換装置。   In a code string converter for converting a first code string including a spectrum characteristic into a second code string including a spectrum characteristic, a spectrum included in the first code string for each frame of the second code string A code string conversion device comprising: a circuit that converts a spectral characteristic obtained by converting a band extension strength of a characteristic into a spectral characteristic included in the second code string. スペクトル特性を含む第1の符号列を、スペクトル特性を含む第2の符号列に変換する符号列変換装置において、前記第2の符号列のスペクトル特性を符号化する時間単位であるフレーム毎に、前記第1の符号列の当該フレームのスペクトル特性とその過去のフレームのスペクトル特性とから計算したスペクトル特性の帯域拡張強度を変換して得たスペクトル特性を、前記第2の符号列に含まれるスペクトル特性とする回路を備えることを特徴とする符号列変換装置。   In the code string conversion device for converting the first code string including the spectral characteristics into the second code string including the spectral characteristics, for each frame which is a time unit for encoding the spectral characteristics of the second code string, A spectrum characteristic obtained by converting the band extension intensity of the spectrum characteristic calculated from the spectrum characteristic of the frame of the first code string and the spectrum characteristic of the past frame is included in the spectrum included in the second code string. A code string conversion device comprising a circuit having characteristics. スペクトル特性を含む第1の符号列を、スペクトル特性を含む第2の符号列に変換する符号列変換方法において、前記第2の符号列のフレーム毎に、前記第1の符号列に含まれるスペクトル特性の帯域拡張強度を変換するステップと、変換した後に符号化したスペクトル特性を前記第2の符号列に含まれるスペクトル特性とするステップとを有することを特徴とする符号列変換方法。   In a code string conversion method for converting a first code string including a spectrum characteristic into a second code string including a spectrum characteristic, a spectrum included in the first code string for each frame of the second code string A code string conversion method comprising: converting a band extension strength of a characteristic; and converting a spectral characteristic encoded after the conversion into a spectral characteristic included in the second code string. スペクトル特性を含む第1の符号列を、スペクトル特性を含む第2の符号列に変換する符号列変換方法において、前記第2の符号列のスペクトル特性を符号化する時間単位であるフレーム毎に、前記第1の符号列の当該フレームにおけるスペクトル特性とその過去のフレームにおけるスペクトル特性とからスペクトル特性を計算するステップと、計算したスペクトル特性の帯域拡張強度を変換するステップと、変換したスペクトル特性を前記第2の符号列に含まれるスペクトル特性とするステップとを有することを特徴とする符号列変換方法。   In a code string conversion method for converting a first code string including a spectral characteristic into a second code string including a spectral characteristic, for each frame which is a time unit for encoding the spectral characteristic of the second code string, Calculating a spectral characteristic from a spectral characteristic in the frame of the first code string and a spectral characteristic in the past frame; converting a band extension intensity of the calculated spectral characteristic; And a step of converting the spectral characteristics included in the second code string.
JP2009011591A 2009-01-22 2009-01-22 Conversion device and conversion method of speech code string Pending JP2009104169A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009011591A JP2009104169A (en) 2009-01-22 2009-01-22 Conversion device and conversion method of speech code string

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009011591A JP2009104169A (en) 2009-01-22 2009-01-22 Conversion device and conversion method of speech code string

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2001026906A Division JP2002229599A (en) 2001-02-02 2001-02-02 Device and method for converting voice code string

Publications (1)

Publication Number Publication Date
JP2009104169A true JP2009104169A (en) 2009-05-14

Family

ID=40705838

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009011591A Pending JP2009104169A (en) 2009-01-22 2009-01-22 Conversion device and conversion method of speech code string

Country Status (1)

Country Link
JP (1) JP2009104169A (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08123495A (en) * 1994-10-28 1996-05-17 Mitsubishi Electric Corp Wide-band speech restoring device
JPH08146997A (en) * 1994-11-21 1996-06-07 Hitachi Ltd Device and system for code conversion

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08123495A (en) * 1994-10-28 1996-05-17 Mitsubishi Electric Corp Wide-band speech restoring device
JPH08146997A (en) * 1994-11-21 1996-06-07 Hitachi Ltd Device and system for code conversion

Similar Documents

Publication Publication Date Title
JP3134817B2 (en) Audio encoding / decoding device
JPH0353300A (en) Sound encoding and decoding system
KR101780667B1 (en) Audio coding device, audio coding method, audio coding program, audio decoding device, audio decoding method, and audio decoding program
JP3364825B2 (en) Audio encoding device and audio encoding / decoding device
JP4108317B2 (en) Code conversion method and apparatus, program, and storage medium
JP3063668B2 (en) Voice encoding device and decoding device
EP1363274B1 (en) Voice code sequence converting device
JP6644848B2 (en) Vector quantization device, speech encoding device, vector quantization method, and speech encoding method
JP2009104169A (en) Conversion device and conversion method of speech code string
JP4438280B2 (en) Transcoder and code conversion method
JP2956068B2 (en) Audio encoding / decoding system
JP2004348120A (en) Voice encoding device and voice decoding device, and method thereof
JP4238535B2 (en) Code conversion method and apparatus between speech coding and decoding systems and storage medium thereof
JP3166697B2 (en) Audio encoding / decoding device and system
EP1560201B1 (en) Code conversion method and device for code conversion
JP3770901B2 (en) Broadband speech restoration method and broadband speech restoration apparatus
JP4447546B2 (en) Wideband voice restoration method and wideband voice restoration apparatus
JPH04301900A (en) Audio encoding device
WO2000003385A1 (en) Voice encoding/decoding device
JP3748082B2 (en) Broadband speech restoration method and broadband speech restoration apparatus
JP3748083B2 (en) Broadband speech restoration method and broadband speech restoration apparatus
JP3636327B2 (en) Wideband voice restoration method and wideband voice restoration apparatus
JP2005284314A (en) Method and device for wide-band speech restoration
JP2005284315A (en) Method and device for wide-band speech restoration
JP2005284317A (en) Method and device for wide-band speech restoration

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110921

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120201