JP2968109B2 - Code-excited linear prediction encoder and decoder - Google Patents

Code-excited linear prediction encoder and decoder

Info

Publication number
JP2968109B2
JP2968109B2 JP3327443A JP32744391A JP2968109B2 JP 2968109 B2 JP2968109 B2 JP 2968109B2 JP 3327443 A JP3327443 A JP 3327443A JP 32744391 A JP32744391 A JP 32744391A JP 2968109 B2 JP2968109 B2 JP 2968109B2
Authority
JP
Japan
Prior art keywords
code
impulse response
adaptive
signal
gain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP3327443A
Other languages
Japanese (ja)
Other versions
JPH05165497A (en
Inventor
賢一郎 細田
浩 桂川
弘美 青柳
義博 有山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP3327443A priority Critical patent/JP2968109B2/en
Publication of JPH05165497A publication Critical patent/JPH05165497A/en
Application granted granted Critical
Publication of JP2968109B2 publication Critical patent/JP2968109B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、コード励振線形予測符
号化方法(CELP)に従う符号化器及び復号化器に関
する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an encoder and a decoder according to a code-excited linear prediction encoding method (CELP).

【0002】[0002]

【従来の技術】従来、デジタル移動通信分野における音
声信号(音響信号を含む)の高能率符号化方式として、
コード励振線形予測符号化方式やこのコード励振線形予
測符号化方式の変形であるベクトル加算励振線形予測符
号化方式(VSELP)が採用されてきた。
2. Description of the Related Art Conventionally, as a high-efficiency coding method for voice signals (including audio signals) in the field of digital mobile communication,
A code-excited linear predictive coding scheme (VSELP), which is a modification of the code-excited linear predictive coding scheme, has been adopted.

【0003】音声信号に対する符号化方式の基本的構成
は、音声の声道特性を表現する声道パラメータ、音源情
報を表現する音源パラメータを求めることにある。最近
のコード励振線形予測符号化方式では、音源情報として
の励振信号を統計的に周期性の強い有声音に寄与する適
応コードと統計的に周期性の弱いランダム的な無声音に
寄与する統計コードとでコード化して、それぞれコード
ブックに格納しておき、入力音声信号と合成音声信号と
の重付け誤差電力和が最小となるように各コードブック
内の最適な適応コード及び統計コードを見付け出すこと
で符号化処理を行なっている。そして、入力音声信号か
ら声道パラメータを得るフォワード型の符号化方式であ
れ、合成音声信号から声道パラメータを得るバックワー
ド型の符号化方式であれ、少なくとも音源パラメータ、
従って最適な適応コード及び統計コードの情報を伝送す
る。
The basic configuration of a coding method for a speech signal is to obtain a vocal tract parameter representing vocal tract characteristics of speech and a sound source parameter representing sound source information. In recent code-excited linear predictive coding, the excitation signal as the sound source information is divided into an adaptive code that contributes to a voiced sound with a statistically strong periodicity and a statistical code that contributes to a random unvoiced sound with a statistically weak periodicity. And store them in a codebook, and find the optimal adaptive code and statistical code in each codebook so that the sum of weighting error power between the input audio signal and the synthesized audio signal is minimized. Performs the encoding process. And at least a sound source parameter, whether it is a forward type encoding method for obtaining vocal tract parameters from an input audio signal or a backward type encoding method for obtaining vocal tract parameters from a synthesized audio signal.
Therefore, the information of the optimal adaptive code and statistical code is transmitted.

【0004】このようなコード励振線形予測符号化方式
では、6kbit/s〜8kbit/sの符号化速度において高品質
な再生音声が得られることが知られている。
It is known that such a code excitation linear predictive coding system can provide high-quality reproduced speech at a coding speed of 6 kbit / s to 8 kbit / s.

【0005】[0005]

【発明が解決しようとする課題】しかしながら、通信シ
ステムの中には、より低い符号化速度を求めるものがあ
る。例えば、4kbit/s以下の符号化速度を求めるものが
ある。このような低速度の場合、声道パラメータ及び音
源パラメータを共に伝送するフォワード型であろうと、
音源パラメータを伝送するバックワード型であろうと、
音源パラメータに割当てられる符号化ビット数は当然に
少なくなり、適応コードブック及び統計コードブックに
格納されている適応コード及び統計コードの数も少なく
なる。その結果、このような低符号化速度においては再
生音声の品質が低下する。
However, some communication systems require a lower coding rate. For example, there is one that calculates an encoding speed of 4 kbit / s or less. In the case of such a low speed, whether the forward type transmits both the vocal tract parameters and the sound source parameters,
Regardless of the backward type that transmits sound source parameters,
Naturally, the number of coding bits allocated to the excitation parameters is reduced, and the number of adaptive codes and statistical codes stored in the adaptive codebook and statistical codebook is also reduced. As a result, at such a low encoding speed, the quality of the reproduced sound is reduced.

【0006】また、適応コードブックは、最適な適応コ
ード及び統計コードの合成コードによって適応的に更新
されるものであるので、適応コードは統計コードに基づ
いて形成されるものであるということができる。そのた
め、周期性の強い有声音の立ち上がりが遅く、また、有
声音の定常部においても明確なパルス性の強いコードを
形成できず、再生音声が明瞭性に欠けるという欠点を有
する。この欠点に対しては、孤立インパルスでなるパル
ス性コードを用いることも考えられる。
Further, since the adaptive codebook is updated adaptively with a combination code of an optimal adaptive code and a statistical code, it can be said that the adaptive code is formed based on the statistical code. . Therefore, there is a disadvantage that a voiced sound having strong periodicity rises slowly, and a code having a strong pulse characteristic cannot be formed even in a stationary portion of the voiced sound, and the reproduced voice lacks clarity. To overcome this disadvantage, a pulse consisting of an isolated impulse
It is also conceivable to use security codes.

【0007】しかしながら、統計コードやパルス性コー
ドは固定コードであり、再生音声の品質を向上させよう
とすると、統計コードやパルス性コード等の固定コード
の種類を非常に多くしなければならない。しかし、この
ようにした場合には、低符号化速度に対応できない。
However, a statistical code or a pulse code
Code is a fixed code, let's improve the quality of playback audio
Is a fixed code such as a statistical code or pulse code
The types must be very many. But this
In such a case, it is impossible to cope with a low encoding speed.

【0008】一方、固定コードを少なくすると、入力音
声信号を正確に反映した再生音声を得難くなる。例え
ば、個人によって、声帯(音源情報発生源)の特質は異
なっているが、このような声帯の差異を励振信号に正し
く反映させることができず、再生音声の品質を低下させ
る。
On the other hand, if the fixed code is reduced, the input sound
It becomes difficult to obtain a reproduced sound that accurately reflects the voice signal. example
For example, the characteristics of vocal cords (sources of sound source information) differ depending on the individual.
However, such differences in vocal cords are corrected in the excitation signal.
And the quality of the playback audio is reduced.
You.

【0009】本発明は、以上の点を考慮してなされたも
のであり、低符号化速度の場合であっても、主に音源パ
ラメータ面から再生音声の品質を高めることができるコ
ード励振線形予測符号化器及び復号化器を提供しようと
するものである。
The present invention has been made in view of the above points, and has a code-excited linear prediction method capable of improving the quality of reproduced speech mainly from a sound source parameter plane even at a low coding rate. It is intended to provide an encoder and a decoder.

【0010】[0010]

【課題を解決するための手段】かかる課題を解決するた
め、第1の本発明は、(1)入力音声信号を線形予測し
て声道パラメータを求める声道パラメータ作成手段と、
(2)当該声道パラメータを量子化して、量子化された
声道パラメータを少なくとも出力する声道パラメータ量
子化手段と、(3)過去の入力音声信号の最適なコード
を表わす適応コ ードを記憶している適応コードブック
と、(4)予め定められている統計コード及び又はパル
ス性コードでなる固定コードを記憶している固定コード
ブックと、(5)上記適応コードと上記固定コードに基
づいて励振信号を作成する励振信号作成手段とを備え、
(6)量子化された上記声道パラメータと上記励振信号
とに基づいて合成音声信号を作成し、上記入力音声信号
と当該合成音声信号との誤差を評価することによって、
現時刻の当該入力音声信号に最適なコードに対応した上
記両コードブックのインデックスを決定し、上記声道パ
ラメータと上記両インデックスとを符号化音声信号とし
て出力するコード励振線形予測符号化器において、
(7)上記励振信号作成手段は、上記声道パラメータに
基づいて特定のインパルス応答を作成し、当該インパル
ス応答を用いて、上記固定コードに畳み込み処理を施し
た後、上記適応コードと合成して上記励振信号を作成す
るものであり、(8)上記インパルス応答は、上記固定
コードが出力された時点で定められた上記入力音声信号
の周波数特性に変換する伝達関数のインパルス応答に対
応するものであることを特徴とする。
Means for Solving the Problems In order to solve the problems, the first invention is as follows: (1) Linear prediction of an input speech signal
Vocal tract parameter creation means for determining vocal tract parameters by
(2) The vocal tract parameters are quantized and quantized
Amount of vocal tract parameters that output at least vocal tract parameters
(3) optimal code of past input audio signal
Adaptive codebook for storing an adaptive code representing the
And (4) a predetermined statistical code and / or pal
Fixed code that stores a fixed code consisting of security codes
Book, and (5) based on the adaptive code and the fixed code.
Excitation signal creating means for creating an excitation signal based on the
(6) The quantized vocal tract parameters and the excitation signal
And a synthesized speech signal is created based on the input speech signal.
And evaluating the error between the synthesized speech signal and
Supports the best code for the input audio signal at the current time
Determine the index of the two codebooks, and
Parameters and the above indices are coded audio signals.
In a code-excited linear prediction encoder that outputs
(7) The excitation signal creating means includes the vocal tract parameter
Create a specific impulse response based on
Convolution processing of the above fixed code using the
After that, the excitation signal is created by combining with the adaptive code.
(8) the impulse response is fixed
The input audio signal determined at the time the code was output
Of the transfer function that converts to the frequency response of
It is characterized by being responsive.

【0011】また、第2の本発明は、(1)コード励振
線形予測符号化器側から与えられた符号化音声信号を、
声道パラメータ、適応コードのインデックス及び固定コ
ードのインデックスに分離する多重分離手段と、(2)
上記適応コードのインデックスに対応した、過去の入力
音声信号のコードを適応コードとして出力する適応コー
ドブックと、(3)上記固定コードのインデックスに対
応した、予め定められている固定コードを出力する固定
コードブックと、(4)上記適応コードと上記固定コー
ドとに基づいて励振信号を作成する励振信号作成手段
と、(5)上記声道パラメータと上記励振信号に基づい
て合成音声信号を作成する合成音声信号作成手段とを有
するコード励振線形予測復号化器において、(6)上記
励振信号作成手段は、上記声道パラメータに基づいて特
定のインパルス応答を作成し、当該インパルス応答を用
いて、上記固定コードに畳み込み処理を施した後、上記
適応コードと加算して上記励振信号を作成するものであ
り、(7)上記インパルス応答は、上記固定コードが出
力された時点で定められた上記入力音声信号の周波数特
性に変換する伝達関数のインパルス応答に対応するもの
であることを特徴とす る。
Further , the second invention provides (1) code excitation
The encoded audio signal given from the linear prediction encoder is
Vocal tract parameters, adaptive code index and fixed code
Demultiplexing means for demultiplexing into code indexes, (2)
Past input corresponding to the index of the above adaptive code
An adaptive code that outputs a speech signal code as an adaptive code.
And (3) the index of the above fixed code.
Fixed to output a predetermined fixed code corresponding to
A code book, (4) the adaptive code and the fixed code
Excitation signal generating means for generating an excitation signal based on the
And (5) based on the vocal tract parameters and the excitation signal
Means for creating a synthesized speech signal by
(6) The code-excited linear prediction decoder
The excitation signal generating means is configured to generate a characteristic based on the vocal tract parameters.
Create a constant impulse response and use the impulse response
After performing the convolution process on the fixed code,
The excitation signal is created by adding to the adaptive code.
(7) The fixed code is output from the impulse response.
The frequency characteristics of the input audio signal determined at the time
Corresponding to the impulse response of the transfer function to be converted
It characterized in that it is.

【0012】[0012]

【作用】第1の本発明のコード励振線形予測符号化器及
び第2の本発明のコード励振線形予測復号化器において
は、声道パラメータに基づいて特定のインパルス応答を
作成し、かつ、当該インパルス応答を用いて、固定コー
ドに畳み込み処理を施した後、適応コードと合成して励
振信号を作成すると共に、上記インパルス応答が、上記
固定コードが出力された時点で定められた上記入力音声
信号の周波数特性に変換する伝達関数のインパルス応答
に対応するものであるので、励振信号の要素となってい
る固定コードについて、上記入力音声信号の周波数特性
が反映され、固定コードとして数多くのもののが用意さ
れていなくても再生音声として高品質のものを得ること
ができる。
According to a first aspect of the present invention, there is provided a code-excited linear predictive encoder and a code-exciting linear predictive encoder.
And a second embodiment of the code-excited linear prediction decoder according to the present invention.
Generates a specific impulse response based on vocal tract parameters
Create a fixed code using the impulse response.
After convolving the code with the adaptive code,
And the impulse response is
The above input sound determined at the time when the fixed code is output
Impulse response of transfer function converted to frequency characteristics of signal
Therefore, it is an element of the excitation signal.
Frequency characteristics of the input audio signal
And a number of fixed codes are available.
Obtain high quality playback audio even if it is not
Can be.

【0013】すなわち、固定コードブックから出力され
た固定コードの周波数特性を、入力音声信号の周波数特
性に近付ける操作を行なっている。このようにしたの
は、従来、励振信号の周波数特性は理論的に白色として
モデル化されてきたが、実際には白色的でなく、入力音
声信号の周波数特性に近い特性を有していることが実験
的に確認されており、統計コードやパルス性コードなど
の固定コードの周波数特性を、入力音声信号の周波数特
性に近付れば、それだけ高品質な合成音声信号を得るこ
とができるためであり、また、励振信号の有効な周波数
成分は量子化誤差信号よりかなり大きくなって量子化誤
差信号のマスキング効果が得られるためである。
That is, the output from the fixed codebook is
An operation is performed to bring the frequency characteristics of the fixed code closer to the frequency characteristics of the input audio signal. The reason for this is that the frequency characteristic of the excitation signal has been theoretically modeled as white in the past, but it is not white in nature but has a characteristic close to the frequency characteristic of the input audio signal. Has been experimentally confirmed, such as statistical codes and pulse codes
This is because, if the frequency characteristics of the fixed code are closer to the frequency characteristics of the input voice signal, a higher quality synthesized voice signal can be obtained, and the effective frequency component of the excitation signal is the quantization error signal. This is because the masking effect becomes much larger and a masking effect of the quantization error signal is obtained.

【0014】[0014]

【実施例】【Example】

(A)コード励振線形予測符号化器の一実施例 以下、本発明によるコード励振線形予測符号化器の一実
施例を図面を参照しながら詳述する。ここで、図1がこ
の実施例の構成を示すブロック図である。
(A) One Embodiment of Code Excited Linear Prediction Encoder An embodiment of a code excited linear prediction encoder according to the present invention will be described in detail below with reference to the drawings. FIG. 1 is a block diagram showing the configuration of this embodiment.

【0015】図1において、この実施例のコード励振線
形予測符号化器は、大きくは、入力音声処理部1と最適
合成音声探索部2と多重化部3とから構成されている。
Referring to FIG. 1, the code-excited linear predictive encoder of this embodiment comprises an input speech processing section 1, an optimum synthesized speech search section 2, and a multiplexing section 3.

【0016】入力音声処理部1は、LSP(線スペクト
ル対パラメータ)分析部11、LSPパラメータ符号化
部12、LSPパラメータ復号化部13、LPC(線形
予測係数)係数変換部14、重付けフィルタ15、合成
フィルタ零入力応答生成部16、重付けフィルタ零入力
応答生成部17及び2個の減算器18、19から構成さ
れており、入力音声信号が与えられたときに、復号化器
に伝送する声道パラメータを得ると共に、局部再生で形
成される合成音声信号の目標音声信号を形成するもので
ある。
The input speech processing unit 1 includes an LSP (line spectrum vs. parameter) analyzer 11, an LSP parameter encoder 12, an LSP parameter decoder 13, an LPC (linear prediction coefficient) coefficient converter 14, and a weighting filter 15. , A synthesis filter zero-input response generator 16, a weighting filter zero-input response generator 17, and two subtractors 18 and 19, and when an input audio signal is given, is transmitted to a decoder. The vocal tract parameters are obtained, and a target audio signal of a synthesized audio signal formed by local reproduction is formed.

【0017】この実施例の場合、デジタル化された離散
的な入力音声信号系列は、声道パラメータを求めるため
の分析フレーム長に対応する時間だけ蓄積され、さら
に、この分析フレーム長は数個のサブフレームに分割さ
れて入力音声処理部1で処理される。
In this embodiment, a digitized discrete input speech signal sequence is accumulated for a time corresponding to an analysis frame length for obtaining vocal tract parameters, and the analysis frame length is several times. It is divided into sub-frames and processed by the input audio processing unit 1.

【0018】入力音声信号はLSP分析部11に与えら
れ、このLSP分析部11によってLSP分析されて声
道パラメータとしてのLSPパラメータに変換される。
このLSPパラメータはLSPパラメータ符号化部12
によって符号化(例えばベクトル量子化)されて多重化
部3に与えられてコード励振線形予測復号化器側に伝送
される。また、符号化されたLSPパラメータは、LS
Pパラメータ復号化部13によって復号化(ベクトル逆
量子化)された後、LPC係数変換部14によってLP
C係数に変換される。このように変換されたLPC係数
が、重付けフィルタ15、合成フィルタ零入力応答生成
部16、重付けフィルタ零入力応答生成部17及び後述
する重付き合成フィルタ29のタップ係数として使用さ
れる。また、後述する周波数特性操作部28に与えられ
る。なお、LSP分析部11から出力されたLSPパラ
メータを直接LPC係数に変換するのではなく、符号、
復号処理を施したLSPパラメータをLPC係数に変換
するのは、復号化器が利用するLPC係数と同様なLP
C係数を局部再生で利用して音源パラメータを適切に決
定できるようにするためである。
The input voice signal is supplied to an LSP analysis unit 11, which performs an LSP analysis and converts it into LSP parameters as vocal tract parameters.
This LSP parameter is the LSP parameter encoding unit 12
(For example, vector quantization), and the resulting signal is supplied to the multiplexing unit 3 and transmitted to the code excitation linear prediction decoder. Also, the encoded LSP parameter is LS
After being decoded (vector inverse quantization) by the P parameter decoding unit 13, the LPC coefficient conversion unit 14
It is converted to a C coefficient. The LPC coefficients thus converted are used as tap coefficients of the weighting filter 15, the synthesis filter zero-input response generator 16, the weighting filter zero-input response generator 17, and a weighting synthesis filter 29 described later. It is also provided to a frequency characteristic operation unit 28 described later. Note that, instead of directly converting the LSP parameters output from the LSP analysis unit 11 into LPC coefficients, codes,
The conversion of the decoded LSP parameters into LPC coefficients is performed in the same manner as the LPC coefficients used by the decoder.
This is because the sound source parameters can be appropriately determined by using the C coefficient in local reproduction.

【0019】ここで、伝送に供する声道パラメータとし
てLSPパラメータを用いるようにしたのは、声道の周
波数特性に対する補間特性が良くなること、LSPパラ
メータは少ない符号化ビット数で符号化してもLPCパ
ラメータ等より声道スペクトルに与える歪みが小さいこ
と、ベクトル量子化法との組み合わせによって効率の良
い符号化ができることによる。
Here, the LSP parameter is used as the vocal tract parameter to be used for transmission because the interpolation characteristic with respect to the frequency characteristic of the vocal tract is improved, and even if the LSP parameter is encoded with a small number of encoding bits, the LPC parameter is used. This is because distortion given to the vocal tract spectrum is smaller than parameters and the like, and efficient coding can be performed by combination with the vector quantization method.

【0020】次に、入力音声信号から、局部再生される
合成音声信号に対する目標音声信号を形成する動作を説
明する。
Next, the operation of forming a target audio signal for a synthesized audio signal locally reproduced from an input audio signal will be described.

【0021】上述した入力音声信号は重付けフィルタ1
5に与えられ、人間の聴覚特性が考慮された重付けが施
された後、減算器18に被減算入力として与えられる。
この減算器18には、また、合成フィルタ零入力応答生
成部16がLPC係数をタップ係数として用いて生成し
た、重み付き合成フィルタ29に関する零入力応答信号
が減算入力として与えられる。かくして、直前の分析フ
レームにおける重み付き合成フィルタ29の状態の影響
が除去された音声信号が得られ、これが減算器19に被
減算入力として与えられる。この減算器19には、ま
た、重付けフィルタ零入力応答生成部17がLPC係数
をタップ係数として用いて生成した、重付けフィルタ1
5に関する零入力応答信号が減算入力として与えられ
る。かくして、直前の分析フレームにおける重付けフィ
ルタ15の状態の影響が除去された音声信号が得られ、
これが目標音声信号として後述する減算器30に与えら
れる。
The input audio signal described above is applied to the weighting filter 1
5, weighted in consideration of human auditory characteristics, and then supplied to the subtractor 18 as a subtracted input.
The subtracter 18 is supplied with a zero input response signal relating to the weighted synthesis filter 29 generated by the synthesis filter zero input response generation unit 16 using the LPC coefficient as a tap coefficient, as a subtraction input. Thus, an audio signal from which the influence of the state of the weighted synthesis filter 29 in the immediately preceding analysis frame has been removed is obtained, and this is supplied to the subtractor 19 as an input to be subtracted. The subtractor 19 also includes a weighting filter 1 generated by the weighting filter zero-input response generator 17 using LPC coefficients as tap coefficients.
The quiescent response signal for 5 is provided as the subtraction input. Thus, an audio signal from which the influence of the state of the weighting filter 15 in the immediately preceding analysis frame has been removed is obtained.
This is supplied to a subtractor 30 described later as a target audio signal.

【0022】最適合成音声探索部2は、局部再生による
合成音声信号が最も目標音声信号に類似する音源パラメ
ータを探索するものであり、適応コードブック20、統
計コードブック21、パルス性コードブック22、利得
コードブック23、利得制御器24、27、加算器2
5、固定コード選択スイッチ26、周波数特性操作部2
8、重み付き合成フィルタ29、減算器30、誤差電力
和計算部31及び最小誤差電力和コード選択部32から
構成されている。
The optimum synthesized speech search unit 2 searches for a sound source parameter whose synthesized speech signal obtained by local reproduction is most similar to the target speech signal, and includes an adaptive codebook 20, a statistical codebook 21, a pulse codebook 22, Gain codebook 23, gain controllers 24 and 27, adder 2
5, fixed code selection switch 26, frequency characteristic operation unit 2
8, a weighted synthesis filter 29, a subtractor 30, an error power sum calculator 31 and a minimum error power sum code selector 32.

【0023】適応コードブック20、統計コードブック
21及びパルス性コードブック22はそれぞれ、励振信
号に係る波形コードである適応コード、統計コード、パ
ルス性コードを格納しているものであり、利得コードブ
ック23は適応コード及び固定コード(統計コード及び
パルス性コードをまとめてこのように呼ぶ)に関する利
得コードを格納しているものである。
The adaptive codebook 20, the statistical codebook 21, and the pulse codebook 22 store an adaptive code, a statistical code, and a pulse code, which are waveform codes related to an excitation signal, respectively. Reference numeral 23 stores a gain code relating to the adaptive code and the fixed code (the statistical code and the pulse code are collectively referred to as such).

【0024】適応コード及び統計コードはそれぞれ、従
来と同様に、統計的に周期性の強い有声音に寄与する波
形コード、統計的に周期性の弱いランダム的な無声音に
寄与する波形コードである。なお、適応コードブック2
0の適応コードは後述するように適応的に更新される。
パルス性コードは、孤立インパルスよりなる波形コード
である。パルス性コードは、周期性の強い有声音の立ち
上がりや、パルス性が明確な有声音の定常部分に寄与す
ることを考慮したものである。利得コードは、例えばベ
クトル量子化されており、ベクトルの一成分が適応コー
ドの利得に関し、他成分が固定コードの利得に関するも
のとなる。
The adaptive code and the statistical code are respectively a waveform code contributing to a voiced sound having a statistically strong periodicity and a waveform code contributing to a random unvoiced sound having a statistically weak periodicity. In addition, adaptive code book 2
The adaptive code of 0 is adaptively updated as described later.
The pulse code is a waveform code composed of an isolated impulse. The pulse-like code takes into account the fact that it contributes to the rise of a voiced sound with a strong periodicity and to the stationary part of a voiced sound with a clear pulse. The gain code is, for example, vector-quantized, and one component of the vector relates to the gain of the adaptive code, and the other component relates to the gain of the fixed code.

【0025】なお、パルス性の音源信号は、周期性を有
する単純な信号であるのでパルス信号発生部が発生する
ことも考えられるが、この実施例のようにコード化して
コードブック22から読出すことで発生することが以下
の理由によって好ましい。すなわち、適応コードブック
20からの出力と同期させ易く、また、統計コードブッ
ク21と同一のブック構成とすることで後述するように
統計コード又はパルス性コードを選択して復号化器に伝
送する際の多重化処理等が容易になるためである。
Since the pulse-like sound source signal is a simple signal having a periodicity, a pulse signal generator may be generated. However, the pulse-like sound source signal is coded and read out from the code book 22 as in this embodiment. This is preferable for the following reasons. That is, it is easy to synchronize with the output from the adaptive codebook 20, and by using the same book configuration as the statistical codebook 21, the statistical code or the pulse code is selected and transmitted to the decoder as described later. This is because multiplexing processing and the like can be easily performed.

【0026】このような各種コードを用いて局部再生し
た合成音声信号が目標音声信号に最も類似する、各種コ
ードの最適コードを求めてそのインデックスを多重化部
3に与えて、コード励振線形予測復号化器側に伝送す
る。この実施例は、低符号化速度を意識したものである
ので、固定コードについては統計コード又はパルス性コ
ードを選択してそのインデックスを伝送することとして
いる。従って、固定コードとしていずれを選択している
かの選択情報も、コード励振線形予測復号化器側に伝送
する。
The optimum code of each code, in which the synthesized voice signal locally reproduced using such various codes is most similar to the target voice signal, is obtained, and its index is given to the multiplexing unit 3 to perform code excitation linear predictive decoding. To the transmitter. In this embodiment, since a low coding rate is considered, a statistic code or a pulse code is selected for a fixed code and the index thereof is transmitted. Therefore, the selection information of which one is selected as the fixed code is also transmitted to the code excitation linear prediction decoder side.

【0027】このような最適コードの探索(統計コード
又はパルス性コードの選択処理を含む)は、この実施例
の場合、適応コード、統計コード、パルス性コード、利
得コードの順に実行される。
In this embodiment, the search for the optimum code (including the selection of the statistical code or the pulse code) is performed in the order of the adaptive code, the statistical code, the pulse code, and the gain code.

【0028】最適な適応コードの探索時においては、統
計コードブック21及びパルス性コードブック22から
の出力を0とし、また、利得制御器24が適切な値の利
得係数(例えば1)を乗算するようになされている。こ
のような状態において、適応コードブック20に格納さ
れている全ての適応コードを時間順次に又は並列的に出
力させ、利得制御器24及び加算器25を介して重み付
き合成フィルタ29に励振信号として与える。重み付き
合成フィルタ29は、LPC係数変換部14から与えら
れたLPC係数をタップ係数としてこの励振信号に対し
て畳み込み処理を行ない、音源パラメータとして適応コ
ードの内容だけが反映された合成音声信号を、全ての適
応コードについて求める。
At the time of searching for an optimal adaptive code, the outputs from the statistical codebook 21 and the pulse codebook 22 are set to 0, and the gain controller 24 multiplies an appropriate value of a gain coefficient (for example, 1). It has been made like that. In such a state, all the adaptive codes stored in the adaptive code book 20 are output in time sequence or in parallel, and are output to the weighted synthesis filter 29 via the gain controller 24 and the adder 25 as excitation signals. give. The weighted synthesis filter 29 performs convolution processing on the excitation signal using the LPC coefficient given from the LPC coefficient conversion unit 14 as a tap coefficient, and generates a synthesized speech signal in which only the content of the adaptive code is reflected as a sound source parameter, Obtain for all adaptive codes.

【0029】減算器30は、適応コードの内容だけが反
映された合成音声信号と目標音声信号との誤差信号を全
ての適応コードについて求めて誤差電力和計算部31に
与える。誤差電力和計算部31は誤差信号についてその
成分の2乗和(誤差電力和)を、全ての適応コードにつ
いて求めて最小誤差電力和コード選択部32に与える。
最小誤差電力コード選択部32は、誤差電力和が最小の
適応コードを最適なものと決定する。
The subtracter 30 obtains an error signal between the synthesized speech signal in which only the content of the adaptive code is reflected and the target speech signal for all the adaptive codes, and supplies it to the error power sum calculator 31. The error power sum calculator 31 calculates the sum of squares (error power sum) of the components of the error signal for all the adaptive codes and supplies the sum to the minimum error power sum code selector 32.
The minimum error power code selection unit 32 determines the adaptive code having the minimum error power sum as the optimal one.

【0030】次に、最適な統計コードの探索が実行され
るが、この探索時においては、固定コード選択スイッチ
26が統計コードブック21側に切換えられ、適応コー
ドブック20が出力を0とする(なお、最適適応コード
を出力することも考えられる)。このような状態におい
て、統計コードブック21に格納されている全ての統計
コードを時間順次に又は並列的に出力させ、固定コード
選択スイッチ26及び利得制御器24を介して周波数特
性操作部28に入力させる。
Next, a search for an optimum statistical code is performed. In this search, the fixed code selection switch 26 is switched to the statistical codebook 21 side, and the output of the adaptive codebook 20 is set to 0 ( It is also conceivable to output an optimal adaptive code). In such a state, all the statistical codes stored in the statistical code book 21 are output in time sequence or in parallel, and input to the frequency characteristic operation unit 28 via the fixed code selection switch 26 and the gain controller 24. Let it.

【0031】この周波数特性操作部28は、後述する図
3に示す詳細構成を有し、入力された統計コードの周波
数特性を統計コードの時間的な長さに対応して入力音声
信号の周波数特性に近付けるように変換操作する。この
ように周波数特性が変換操作された全ての統計コードが
加算器25(この場合ないのに等しい)を介して励振信
号として重み付き合成フィルタ29に与えられる。これ
以降は、最適な適応コードの探索と同様に処理され、最
小誤差電力和コード選択部32が最適な統計コードを決
定する。
The frequency characteristic operation unit 28 has a detailed configuration shown in FIG. 3 described later, and converts the frequency characteristics of the input statistic code into the frequency characteristics of the input audio signal corresponding to the time length of the statistic code. Perform the conversion operation to approach. All the statistical codes whose frequency characteristics have been converted in this way are supplied to the weighted synthesis filter 29 as an excitation signal via the adder 25 (equivalently in this case). Subsequent processing is performed in the same manner as the search for the optimal adaptive code, and the minimum error power sum code selection unit 32 determines the optimal statistical code.

【0032】ここで、周波数特性操作部28を設けるよ
うにしたのは以下の理由による。従来、励振信号の周波
数特性は理論的に白色としてモデル化されてきたが、実
際には白色的でなく、入力音声信号の周波数特性に近い
特性を有していることが実験的に確認されている。従っ
て、統計コードやパルス性コードの周波数特性を、入力
音声信号の周波数特性に近付れば、それだけ高品質な合
成音声信号を得ることができ、また、励振信号の有効な
周波数成分は量子化誤差信号よりかなり大きくなって量
子化誤差信号のマスキング効果が得られる。そこで、周
波数特性操作部28を設けている。ここで、入力音声信
号の周波数特性を表す情報としては、LPC係数があ
り、また、ピッチ予測情報を意味する最適な適応コード
の情報(それに対する利得を含む)がある。従って、周
波数特性操作部28はこれらの情報に基づいて、統計コ
ードやパルス性コードの周波数特性を操作する。
The reason why the frequency characteristic operation section 28 is provided is as follows. Conventionally, the frequency characteristics of the excitation signal have been theoretically modeled as white, but it has been experimentally confirmed that the frequency characteristics of the excitation signal are not white and have characteristics close to the frequency characteristics of the input audio signal. I have. Therefore, the closer the frequency characteristics of the statistical code or pulse code are to those of the input audio signal, the higher the quality of the synthesized audio signal can be obtained, and the effective frequency components of the excitation signal are quantized. It becomes much larger than the error signal, and a masking effect of the quantization error signal is obtained. Therefore, a frequency characteristic operation unit 28 is provided. Here, the information representing the frequency characteristics of the input speech signal includes an LPC coefficient, and information on an optimal adaptive code (including a gain for the code), which means pitch prediction information. Therefore, the frequency characteristic operation unit 28 operates the frequency characteristics of the statistical code or the pulse code based on the information.

【0033】このようにして最適な統計コードの探索が
終了すると、次には、最適なパルス性コードの探索を行
なう。この探索時においては、固定コード選択スイッチ
26がパルス性コードブック22側に切換えられ、適応
コードブック20が出力を0とする(なお、最適適応コ
ードを出力することも考えられる)。このような状態に
おいて、パルス性コードブック22に格納されている全
てのパルス性コードを時間順次に又は並列的に出力させ
る。以降の処理は、最適な統計コードの探索時と同様で
あるのでその説明は省略する。
When the search for the optimum statistical code is completed in this way, the search for the optimum pulse code is next performed. At the time of this search, the fixed code selection switch 26 is switched to the pulse codebook 22 side, and the output of the adaptive codebook 20 is set to 0 (note that the optimum adaptive code may be output). In such a state, all the pulse codes stored in the pulse code book 22 are output in time sequence or in parallel. Subsequent processing is the same as that at the time of searching for the optimum statistical code, and therefore, description thereof is omitted.

【0034】このようにして最適なパルス性コードが決
定されたときには、最小誤差電力和コード選択部32
は、最適な統計コードの誤差電力和と最適なパルス性コ
ードの誤差電力和とを比較し、誤差電力和が小さい方を
コード励振線形予測復号化器側に伝送する固定コードに
決定する。
When the optimum pulse code is determined in this way, the minimum error power sum code selector 32
Compares the error power sum of the optimal statistic code and the error power sum of the optimal pulsed code, and determines the smaller one as the fixed code to be transmitted to the code excitation linear prediction decoder.

【0035】この後、最適な利得コードの探索を行な
う。この利得コードの探索時においては、適応コードブ
ック20からは最適な適応コードが出力され、固定コー
ド選択スイッチ26は選択された統計コードブック21
又はパルス性コードブック22に切換えられ、選択され
た固定コードブック21又は22からは最適な固定コー
ドが出力される。1個の利得コードブック23は適応コ
ード用の利得と固定コード用の利得からなり、適応コー
ド用の利得は利得制御器24に与えられ、固定コード用
の利得は利得制御器27に与えられる。かくして、利得
制御された最適適応コードと、周波数特性操作と利得制
御とが施された最適固定コードとが加算器25によって
加算され、励振信号として重み付き合成フィルタ29に
与えられる。このような処理は、利得コードブック23
内の全ての利得コードに対して時間順次に又は並列的に
実行される。重み付き合成フィルタ29以降の探索時の
処理は、他のコードの探索時の処理と同様である。
Thereafter, a search for an optimum gain code is performed. During the search for the gain code, the adaptive codebook 20 outputs the optimal adaptive code, and the fixed code selection switch 26 sets the selected statistical codebook 21.
Alternatively, the codebook is switched to the pulse codebook 22, and the selected fixed codebook 21 or 22 outputs the optimum fixed code. One gain codebook 23 includes an adaptive code gain and a fixed code gain. The adaptive code gain is provided to a gain controller 24, and the fixed code gain is provided to a gain controller 27. Thus, the optimal adaptive code subjected to the gain control and the optimal fixed code subjected to the frequency characteristic operation and the gain control are added by the adder 25, and given to the weighted synthesis filter 29 as an excitation signal. Such processing is performed by the gain codebook 23.
Is performed in time sequence or in parallel for all the gain codes in. The processing at the time of searching after the weighted synthesis filter 29 is the same as the processing at the time of searching for other codes.

【0036】最小誤差電力和コード選択部32は、最適
適応コード、最適固定コード、最適利得コードが得られ
ると、これらのインデックスを多重化部3に与えると共
に、統計コード及びパルス性コードのどちらを選択した
かを表す固定コード選択スイッチ情報も多重化部3に与
える。多重化部3は、LSPパラメータ符号化部12か
ら与えられたLSPパラメータと、これら情報とを多重
化してコード励振線形予測復号化器側に出力する。な
お、利得コードとしてベクトル量子化を適用している場
合には、伝送されるインデックスはベクトル番号であ
る。
When the optimum adaptive code, the optimum fixed code, and the optimum gain code are obtained, the minimum error power sum code selecting unit 32 gives these indices to the multiplexing unit 3 and selects either the statistical code or the pulse code. The fixed code selection switch information indicating the selection is also given to the multiplexing unit 3. The multiplexing unit 3 multiplexes the LSP parameters supplied from the LSP parameter encoding unit 12 and the information, and outputs the multiplexed information to the code excitation linear prediction decoder side. When vector quantization is applied as a gain code, the transmitted index is a vector number.

【0037】また、最小誤差電力和コード選択部32
は、多重化部3に与えるインデックス及び固定コード選
択スイッチ情報を、対応するコードブック(20及び2
3と、21又は22)や固定コード選択スイッチ26に
与える。このとき、スイッチ26が切換えられ、各コー
ドブックから最適コードが出力される。これにより、今
回のサブフレーム処理時において最も目標音声信号に近
い合成音声信号を形成できる励振信号が加算器25から
出力され、これが適応コードブック20に与えられる。
そして、適応コードブック20は適応コードの更新処理
を行なう。
The minimum error power sum code selector 32
Stores the index and fixed code selection switch information given to the multiplexing unit 3 in the corresponding codebook (20 and 2).
3 and 21 or 22) and the fixed code selection switch 26. At this time, the switch 26 is switched, and the optimal code is output from each codebook. As a result, an excitation signal capable of forming a synthesized voice signal closest to the target voice signal in the current subframe processing is output from the adder 25, and supplied to the adaptive codebook 20.
Then, adaptive code book 20 performs an adaptive code update process.

【0038】以上のような符号化処理がサブフレーム毎
に繰返され、符号化音声信号が順次コード励振線形予測
復号化器に送信される。
The above-described encoding process is repeated for each subframe, and the encoded speech signal is sequentially transmitted to the code excitation linear prediction decoder.

【0039】図3は、上述した周波数特性操作部28の
詳細構成を示すものである。図3において、この周波数
特性操作部28は、縦続接続された2個のフィルタ28
1及び282と、ピッチラグ決定部283とから構成さ
れている。
FIG. 3 shows a detailed configuration of the frequency characteristic operation unit 28 described above. In FIG. 3, the frequency characteristic operation unit 28 includes two filters 28 connected in cascade.
1 and 282, and a pitch lag determining unit 283.

【0040】固定コード選択スイッチ26から出力され
た固定コードは、第1のフィルタ281に与えられる。
この第1のフィルタ281のインパルス応答H(z)
は、次式に示すように選定されており、これによって入
力された固定コードに対する周波数変換操作を行なう。
The fixed code output from the fixed code selection switch 26 is provided to the first filter 281.
The impulse response H 1 (z) of the first filter 281
Is selected as shown in the following equation, and performs a frequency conversion operation on the input fixed code.

【0041】 H1(z)=(1−Σγi aiz-i)/(1−Σνi aiz-i) …(1) 但し、ai(iは1〜M)は、LPC係数変換部14か
ら供給される合成フィルタ29に対するタップ係数であ
る。また、γ及びνはそれぞれ、予め定められた0より
大きく1より小さい定数である。
H 1 (z) = (1−Σγ i aiz −i ) / (1−Σν i aiz −i ) (1) where ai (i is 1 to M) is supplied from the LPC coefficient conversion unit 14. The tap coefficient for the synthesis filter 29 to be used. Further, γ and ν are each from a predetermined 0.
It is a constant that is largely smaller than 1.

【0042】この第1のフィルタ281によって周波数
特性が操作された固定コードが、第2のフィルタ282
に入力される。ピッチラグ決定部283は適応コードブ
ック20に対する最適適応コードのインデックスからピ
ッチラグLを得て第2のフィルタ282に与える。この
第2のフィルタ282のインパルス応答H2(z)は、
次式に示すように選定されており、これによって入力さ
れた固定コードに対する周波数変換操作を行なう。
The fixed code whose frequency characteristics have been manipulated by the first filter 281 is
Is input to The pitch lag determining unit 283 obtains the pitch lag L from the index of the optimal adaptive code for the adaptive codebook 20, and supplies the pitch lag L to the second filter 282. The impulse response H2 (z) of the second filter 282 is
The frequency is selected as shown in the following equation, and a frequency conversion operation is performed on the input fixed code.

【0043】 H2(z)=1/(1−εz-L) …(2) 但し、εは予め定められた0より大きく1以下の定数で
ある。この第2のフィルタ282の出力が、利得制御器
27に与えられる。
H2 (z) = 1 / (1−εz− L ) (2) where ε is a constant greater than 0 and less than or equal to 1 which is predetermined. The output of the second filter 282 is provided to the gain controller 27.

【0044】このような詳細構成を有する周波数特性操
作部28によって、上述したように、入力された固定コ
ードの周波数特性を固定コードの時間的な長さに対応し
て入力音声信号の周波数特性に近付けるようにできてい
る。
As described above, the frequency characteristic of the input fixed code is converted into the frequency characteristic of the input audio signal in accordance with the time length of the fixed code by the frequency characteristic operation unit 28 having such a detailed configuration. It is designed to get closer.

【0045】従って、上記実施例のコード励振線形予測
符号化器によれば、低符号化速度においても高品質の再
生音声を得ることができる。以下、かかる効果が得られ
ることを具体的に説明する。
Therefore, according to the code-excited linear predictive encoder of the above-described embodiment, high-quality reproduced speech can be obtained even at a low encoding speed. Hereinafter, it will be specifically described that such effects can be obtained.

【0046】(1) 低符号化速度を期した場合、音源パラ
メータに割当てられる符号化ビット数が少ないので、用
意される固定コードも少なくなり、入力音声信号に含ま
れているパルス性雑音を明確に再生でき難いが、この実
施例の場合、パルス性コードを利用しているので、この
ような場合の音声の再生品質を高めることができる。
(1) When a low coding rate is expected, the number of coded bits allocated to the excitation parameters is small, so that the number of fixed codes to be prepared is also small, and the pulse noise included in the input speech signal can be clearly identified. However, in this embodiment, since the pulse code is used, the sound reproduction quality in such a case can be improved.

【0047】また、パルス性コードと統計コードとを切
換えて用いているので、低符号化速度に対応できると共
に、音声の過渡部のようなランダム信号とパルス的信号
が混在する信号に対する再生品質を高めることができ
る。
Further, since the pulse code and the statistical code are switched and used, it is possible to cope with a low encoding speed and to improve the reproduction quality of a signal in which a random signal and a pulse signal are mixed, such as a transient part of voice. Can be enhanced.

【0048】(2) 低符号化速度を期した場合、音源パラ
メータに対する符号化ビット数も少なくなるが、声道パ
ラメータに対する符号化ビット数も少なくなる。この実
施例の場合、少ない符号化ビット数で符号化してもLP
C等より声道スペクトルに与える歪みが小さいLSPパ
ラメータを伝送するようにしているので、この点から再
生品質を高めることができる。
(2) When a low encoding speed is expected, the number of encoded bits for the excitation parameters is reduced, but the number of encoded bits for the vocal tract parameters is also reduced. In the case of this embodiment, even if encoding is performed with a small number of encoding bits, LP
Since the LSP parameter that causes less distortion to the vocal tract spectrum than C or the like is transmitted, the reproduction quality can be improved from this point.

【0049】(3) 上述のように、実際の励振信号が入力
音声信号の周波数特性に近い周波数特性を有することを
考慮して周波数特性操作部を設けているので、実際に即
している分だけ再生品質を高めることができると共に、
この変換に伴い量子化誤差信号に対するマスキング効果
が生じて再生品質を高めることができる。
(3) As described above, the frequency characteristic operation unit is provided in consideration of the fact that the actual excitation signal has a frequency characteristic close to the frequency characteristic of the input audio signal. Only while improving the playback quality,
With this conversion, a masking effect on the quantization error signal is generated, and the reproduction quality can be improved.

【0050】 (B)コード励振線形予測復号化器の一実施例 次に、本発明によるコード励振線形予測復号化器の一実
施例を図面を参照しながら詳述する。この実施例は、図
1に示すコード励振線形予測符号化器の実施例に対応す
るものである。図2がこの実施例の構成を示すブロック
図である。
(B) One Embodiment of Code Excited Linear Predictive Decoder Next, an embodiment of a code excited linear predictive decoder according to the present invention will be described in detail with reference to the drawings. This embodiment corresponds to the embodiment of the code excitation linear prediction encoder shown in FIG. FIG. 2 is a block diagram showing the configuration of this embodiment.

【0051】図2において、この実施例のコード励振線
形予測復号化器は、多重分離部40、LSPパラメータ
復号化部41、LPC係数変換部42、適応コードブッ
ク43、統計コードブック44、パルス性コードブック
45、利得コードブック46、利得制御器47、49、
固定コード選択スイッチ48、周波数特性操作部50、
加算器51及び重み付き合成フィルタ52から構成され
ている。
Referring to FIG. 2, a code excitation linear prediction decoder according to this embodiment includes a demultiplexer 40, an LSP parameter decoder 41, an LPC coefficient converter 42, an adaptive codebook 43, a statistical codebook 44, Codebook 45, gain codebook 46, gain controllers 47, 49,
Fixed code selection switch 48, frequency characteristic operation unit 50,
It comprises an adder 51 and a weighted synthesis filter 52.

【0052】コード励振線形予測符号化器側から与えら
れた符号化音声信号は、多重分離部40に入力される。
多重分離部40は、この符号化音声信号を、LSPパラ
メータ、最適適応コードのインデックス、最適固定コー
ドのインデックス、最適利得コードのインデックス及び
固定コード選択スイッチ情報に分離する。そして、LS
PパラメータはLSPパラメータ復号化部41に与え、
最適適応コードのインデックスを適応コードブック43
に与え、最適利得コードのインデックスを利得コードブ
ック46に与え、固定コード選択スイッチ情報を固定コ
ード選択スイッチ48に与える。また、最適固定コード
のインデックスを、固定コード選択スイッチ情報に基づ
いて定まる統計コードブック44又はパルス性コードブ
ック45に与える。
The coded speech signal given from the code excitation linear prediction coder side is input to the demultiplexing section 40.
The demultiplexing unit 40 separates the encoded audio signal into LSP parameters, an index of an optimal adaptive code, an index of an optimal fixed code, an index of an optimal gain code, and fixed code selection switch information. And LS
The P parameter is given to the LSP parameter decoding unit 41,
The index of the optimal adaptive code is stored in the adaptive code book 43.
, The index of the optimal gain code is provided to the gain codebook 46, and the fixed code selection switch information is provided to the fixed code selection switch 48. Further, the index of the optimal fixed code is given to the statistical codebook 44 or the pulse codebook 45 determined based on the fixed code selection switch information.

【0053】LSPパラメータ復号化部41は、与えら
れた符号化されているLSPパラメータを復号化(例え
ばベクトル逆量子化)し、LPC係数変換部42はこの
LSPパラメータをLPC係数に変換する。このように
変換されたLPC係数が、周波数特性操作部50及び重
付き合成フィルタ52に声道パラメータ情報として与え
られる。
The LSP parameter decoding section 41 decodes (for example, vector dequantizes) the given coded LSP parameters, and the LPC coefficient conversion section 42 converts the LSP parameters into LPC coefficients. The LPC coefficients thus converted are provided to the frequency characteristic operation unit 50 and the weighted synthesis filter 52 as vocal tract parameter information.

【0054】利得コードブック46は、与えられたイン
デックスで定まる利得コードを、適応コード用と固定コ
ード用とに分離し、それぞれ適応コード用の利得制御器
47、固定コード用の利得制御器49に与える。
The gain codebook 46 separates a gain code determined by a given index into an adaptive code and a fixed code, and sends them to an adaptive code gain controller 47 and a fixed code gain controller 49, respectively. give.

【0055】適応コードブック43は、与えられたイン
デックスで定まる適応コードを出力し、この適応コード
が利得制御器47を介して利得制御されて加算器51に
与えられる。また、適応コードブック43は適応コード
を周波数特性操作部50に与える。
The adaptive codebook 43 outputs an adaptive code determined by a given index, and the adaptive code is gain-controlled via a gain controller 47 and is applied to an adder 51. The adaptive code book 43 gives the adaptive code to the frequency characteristic operation unit 50.

【0056】統計コードブック44又はパルス性コード
ブック45は、与えられたインデックスに対応する統計
コード又はパルス性コードを固定コード選択スイッチ4
8を介して周波数特性操作部50に与えられ、周波数特
性操作部50は、LPC係数、適応コードのインデック
スに基づいてその周波数特性を操作する(入力音声信号
の周波数特性に近くなるように操作する)。周波数特性
操作部50の詳細構成は、上述した図3に示す構成を有
している。このように周波数特性が操作された固定コー
ドが、利得制御器49で利得制御されて加算器51に与
えられる。
The statistical code book 44 or the pulse code book 45 stores the statistical code or the pulse code corresponding to the given index in the fixed code selection switch 4.
8 to the frequency characteristic operation unit 50, and the frequency characteristic operation unit 50 operates the frequency characteristic based on the LPC coefficient and the index of the adaptive code (operates so as to be close to the frequency characteristic of the input audio signal). ). The detailed configuration of the frequency characteristic operation unit 50 has the configuration shown in FIG. 3 described above. The fixed code whose frequency characteristics have been manipulated as described above is gain-controlled by the gain controller 49 and is provided to the adder 51.

【0057】加算器51は、与えられた適応コードと固
定コードを加算してその加算信号を励振信号として重み
付き合成フィルタ52に与える。重み付き合成フィルタ
52は、この励振信号をLPC係数で畳み込んで合成音
声信号を得て出力する。
The adder 51 adds the given adaptive code and fixed code, and supplies the added signal to the weighted synthesis filter 52 as an excitation signal. The weighted synthesis filter 52 convolves the excitation signal with LPC coefficients to obtain and output a synthesized speech signal.

【0058】加算器51から出力された励振信号は、ま
た適応コードブック43に与えられる。このとき、適応
コードブック43は、この励振信号を用いて適応コード
の更新を行なう。
The excitation signal output from the adder 51 is supplied to the adaptive codebook 43 again. At this time, the adaptive code book 43 updates the adaptive code using the excitation signal.

【0059】コード励振線形予測復号化器は、以上のよ
うな処理を符号化音声信号が与えられる毎に、従ってサ
ブフレーム毎に行なう。
The code-excited linear predictive decoder performs the above-described processing every time a coded speech signal is supplied, and thus for each subframe.

【0060】従って、この実施例のコード励振線形予測
復号化器によれば、与えられたLSPパラメータを処理
する構成を有し、音源としてパルス性コードブック45
を有し、入力音声信号の周波数特性に固定音源の周波数
特性を近付ける周波数特性操作部50を有するので、こ
れにより、上述したコード励振線形予測符号化器につい
ての効果が実際のものとなる。
Accordingly, the code-excited linear predictive decoder according to this embodiment has a configuration for processing a given LSP parameter, and has a pulse codebook 45 as a sound source.
And the frequency characteristic operation unit 50 that brings the frequency characteristics of the fixed sound source closer to the frequency characteristics of the input audio signal, thereby realizing the effect of the above-described code excitation linear prediction encoder.

【0061】(C)他の実施例 上記実施例は、フォワード型のコード励振線形予測符号
化器及び復号化器に関するものであるが、本発明を、バ
ックワード型のコード励振線形予測符号化器及び復号化
器に適用することもできる。
(C) Other Embodiments The above embodiment relates to a forward-type code-excited linear prediction encoder and a decoder. The present invention relates to a backward-type code-excited linear prediction encoder. And a decoder.

【0062】さらに、上記実施例は、4bit/s 以下の符
号化速度を意識して構成されたものであるが、これより
高い符号化速度の符号化器及び復号化器に適用できるこ
とは勿論である。符号化速度が許すならば、統計コード
ブック及びパルス性コードブックを選択的ではなく、常
に両者を有効に動作させるものであっても良い。
Further, the above-mentioned embodiment is configured with consideration for the encoding speed of 4 bit / s or less, but it is needless to say that the present invention can be applied to an encoder and a decoder having a higher encoding speed. is there. If the coding speed allows, the statistical codebook and the pulsed codebook may not always be selected but both may always be operated effectively.

【0063】上記実施例の周波数特性操作部28及び5
0は、LPC係数を利用した周波数特性操作とピッチラ
グを利用した周波数特性操作の両方を行なうものであっ
たが、少なくとも一方だけの操作を行なうものであって
も良い。
The frequency characteristic operating units 28 and 5 of the above embodiment
In the case of 0, both the frequency characteristic operation using the LPC coefficient and the frequency characteristic operation using the pitch lag are performed, but at least one of the operations may be performed.

【0064】[0064]

【発明の効果】本発明のコード励振線形予測符号化器及
び復号化器によれば、固定コードブックから出力された
固定コードの周波数特性を、入力音声信号の周波数特性
に近付ける操作を行なうので、音源パラメータが実際の
音源と良く対応がとれ、符号化速度の高低を問わず、
の点から再生音声の品質を高めることができる。
According to the code excited linear predictive encoder and decoder of the present invention, the frequency characteristic of the fixed code output from the fixed codebook, because the operation close to the frequency characteristics of the input speech signal, The sound source parameters correspond well to the actual sound source, and the quality of the reproduced sound can be improved from this point regardless of the coding speed .

【図面の簡単な説明】[Brief description of the drawings]

【図1】コード励振線形予測符号化器の一実施例を示す
ブロック図である。
FIG. 1 is a block diagram showing an embodiment of a code excitation linear prediction encoder.

【図2】コード励振線形予測復号化器の一実施例を示す
ブロック図である。
FIG. 2 is a block diagram showing an embodiment of a code excitation linear prediction decoder.

【図3】実施例の周波数特性操作部28(50)の詳細
構成を示すブロック図である。
FIG. 3 is a block diagram illustrating a detailed configuration of a frequency characteristic operation unit (50) according to the embodiment.

【符号の説明】[Explanation of symbols]

3…多重化部、11…LSPパラメータ分析部、12…
LSPパラメータ符号化部、13、41…LSPパラメ
ータ復号化部、14、42…LPC係数変換部、20、
43…適応コードブック、21、44…統計コードブッ
ク、22、45…パルス性コードブック、25、51…
加算器、26、48…固定コード選択スイッチ、28、
50…周波数特性操作部、29、52…重み付き合成フ
ィルタ、30…減算器、31…誤差電力和計算部、32
…最小誤差電力コード選択部、40…多重分離部。
3: multiplexing unit, 11: LSP parameter analysis unit, 12 ...
LSP parameter encoding unit, 13, 41 ... LSP parameter decoding unit, 14, 42 ... LPC coefficient conversion unit, 20,
43: Adaptive codebook, 21, 44: Statistical codebook, 22, 45: Pulse codebook, 25, 51 ...
Adder, 26, 48 ... fixed code selection switch, 28,
50: frequency characteristic operation unit, 29, 52: weighted synthesis filter, 30: subtractor, 31: error power sum calculation unit, 32
... Minimum error power code selector, 40 ... Demultiplexer.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 有山 義博 東京都港区虎ノ門1丁目7番12号 沖電 気工業株式会社内 (56)参考文献 特開 平2−282800(JP,A) 特開 平2−148926(JP,A) 特開 平1−54497(JP,A) 特開 平3−101800(JP,A) (58)調査した分野(Int.Cl.6,DB名) G10L 3/00 - 9/20 H03M 7/30 H04B 14/04 JICSTファイル(JOIS)────────────────────────────────────────────────── ─── Continuation of front page (72) Inventor Yoshihiro Ariyama 1-7-12 Toranomon, Minato-ku, Tokyo Oki Electric Industry Co., Ltd. (56) References JP-A-2-282800 (JP, A) JP-A-2-148926 (JP, A) JP-A-1-54497 (JP, A) JP-A-3-101800 (JP, A) (58) Fields investigated (Int. Cl. 6 , DB name) G10L 3 / 00-9/20 H03M 7/30 H04B 14/04 JICST file (JOIS)

Claims (8)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 入力音声信号を線形予測して声道パラメ
ータを求める声道パラメータ作成手段と、 前記声道パラメータを量子化して、量子化された声道パ
ラメータを少なくとも出力する声道パラメータ量子化手
段と、 過去の入力音声信号の最適なコードを表わす適応コード
を記憶している適応コードブックと、 予め定められている統計コード及び又はパルス性コード
でなる固定コードを記憶している固定コードブックと、 前記声道パラメータに基づき、前記固定コードが出力さ
れた時点で定められた前記入力音声信号の周波数特性に
変換する伝達関数のインパルス応答を用いて、前記固定
コードに畳み込み処理を施す周波数特性操作部と、 前記畳み込み処理が施された適応コードと前記固定コー
ドとにそれぞれ利得を乗算する利得制御器と、 前記利得制御器によって利得が乗算された前記畳み込み
処理が施された適応コードと前記固定コードとを加算し
て励振信号を作成する励振信号生成手段と、 量子化された前記声道パラメータと前記励振信号に基づ
いて合成音声信号を作成する合成フィルタと、 前記入力音声信号と前記合成音声信号との誤差を評価す
ることによって、現時刻の前記入力音声信号に最適な前
記適応コードと固定コードを選択し対応するインデック
スを決定するコード選択部と、 前記声道パラメータと前記適応コードと固定コードのイ
ンデックスとを多重化して符号化音声信号として出力す
る多重化部とを有することを特徴とするコード励振線形
予測符号化器。
1. A vocal tract parameter which is linearly predicted for an input speech signal.
Vocal tract parameter generating means for obtaining data, and quantizing the vocal tract parameters to obtain a quantized vocal tract parameter.
A vocal tract parameter quantizer that outputs at least parameters
Stage and an adaptive code representing the optimal code of the past input speech signal
And an adaptive code book that stores a predetermined statistical code and / or pulse code
The fixed code is stored based on the vocal tract parameters.
Frequency characteristics of the input audio signal determined at the time
Using the impulse response of the transfer function to be converted,
A frequency characteristic operation unit for performing convolution processing on the code, the adaptive code on which the convolution processing has been performed, and the fixed code;
And a gain controller for multiplying the gain by the gain and the gain, respectively, and the convolution multiplied by the gain by the gain controller.
Add the processed adaptive code and the fixed code
Excitation signal generating means for generating an excitation signal by using the quantized vocal tract parameters and the excitation signal.
A synthesis filter for creating a synthesized voice signal, and evaluating an error between the input voice signal and the synthesized voice signal.
The optimum time before the input audio signal at the current time
Select the adaptive code and fixed code, and corresponding index
A code selecting unit for determining a vocal tract parameter, the adaptive code and the fixed code.
Multiplexed with the index and output as an encoded audio signal.
Code excitation linear circuit having a multiplexing section
Predictive encoder.
【請求項2】 請求項1記載のコード励振線形予測符号
化器において、 上記インパルス応答は、次の式で示す伝達関数H(z)の
インパルス応答であることを特徴としたコード励振線形
予測符号化器。 H(z)=1/(1−εz-L) 但し、εは0<ε≦1なる定数、Lは適応コードの前記
インデックスから計算したピッチラグである。
2. The code-excited linear prediction code according to claim 1, wherein said impulse response is an impulse response of a transfer function H (z) represented by the following equation. Chemist. H (z) = 1 / (1−εz− L ) where ε is a constant satisfying 0 <ε ≦ 1, and L is a pitch lag calculated from the index of the adaptive code.
【請求項3】 請求項1記載のコード励振線形予測符号
化器において、 上記インパルス応答は、次の式で示す伝達関数H(z)の
インパルス応答であることを特徴としたコード励振線形
予測符号化器。 H(z)=(1−Σ γi aiz-i)/(1−Σ νi aiz-i ) 但し、ai(iは1〜M)は、タップ係数、γ及びνは0
<γ<1及び0<ν<1なる定数である。
3. The code-excited linear prediction encoder according to claim 1, wherein the impulse response is an impulse response of a transfer function H (z) represented by the following equation. Chemist. H (z) = (1−Σγ i aiz− i ) / (1−Σv i aiz− i ) where ai (i is 1 to M) is a tap coefficient, and γ and ν are 0
<Γ <1 and 0 <ν <1.
【請求項4】 請求項1記載のコード励振線形予測符号
化器において、 上記インパルス応答は、次の式で示す伝達関数H1(z)
のインパルス応答と伝達関数H2(z)のインパルス応答
とを縦属接続したインパルス応答を用いることを特徴と
したコード励振線形予測符号化器。 H1(z)=(1−Σ γi aiz-i)/(1−Σ νi aiz-i ) H2(z)=1/(1−εz-L) 但し、ai(iは1〜M)は、タップ係数、γ及びνは0
<γ<1及び0<ν<1なる定数、εは0<ε≦1なる
定数、Lは適応コードの前記インデックスから計算した
ピッチラグである。
4. The code excitation linear predictive encoder according to claim 1, wherein the impulse response is a transfer function H1 (z) represented by the following equation:
A code excitation linear predictive encoder characterized by using an impulse response in which the impulse response of the transfer function H2 (z) and the impulse response of the transfer function H2 (z) are cascaded. H1 (z) = (1−Σγ i aiz− i ) / (1−Σv i aiz− i ) H2 (z) = 1 / (1−εz− L ) where ai (i is 1 to M) Is the tap coefficient, and γ and ν are 0
<Γ <1 and 0 <ν <1 constants, ε is a constant satisfying 0 <ε ≦ 1, and L is a pitch lag calculated from the index of the adaptive code.
【請求項5】 コード励振線形予測符号化器側から与え
られた符号化音声信号を、声道パラメータ,適応コード
のインデックス及び固定コードのインデックスに分離す
る多重分離手段と、 前記適応コードのインデックスに対応した、過去の入力
音声信号のコードを適応コードとして出力する適応コー
ドブックと、 前記固定コードのインデックスに対応した、予め定めら
れている固定コードを出力する固定コードブックと、 前記声道パラメータに基づいて、前記固定コードが前記
コード励振線形予測符号化器側で選択された時点で定め
られた入力音声信号の周波数特性に変換する伝達関数の
インパルス応答を用いて、前記固定コードに畳み込み処
理を施す周波数特性操作部と、 前記畳み込み処理が施された適応コードと前記固定コー
ドとにそれぞれ利得を乗算する利得制御器と、 前記利得制御器によって利得が乗算された前記畳み込み
処理が施された適応コードと前記固定コードとを加算し
て励振信号を作成する励振信号生成手段と、 前記声道パラメータと前記励振信号に基づいて合成音声
信号を作成する合成フィルタとを有することを特徴とし
たコード励振線形予測復号化器。
5. The method according to claim 1, wherein the code excitation linear prediction encoder supplies
Vocal tract parameters and adaptive code
Index and fixed code index.
Demultiplexing means, and a past input corresponding to the index of the adaptive code.
An adaptive code that outputs a speech signal code as an adaptive code.
And a predetermined book corresponding to the index of the fixed code.
A fixed code book that outputs a fixed code, and the fixed code is based on the vocal tract parameters.
Determined at the time selected by the code excitation linear prediction encoder
Of the transfer function to be converted into the frequency characteristic of the input audio signal
Using the impulse response, convolve the fixed code
A frequency characteristic operation unit for performing processing, the adaptive code subjected to the convolution processing, and the fixed code.
And a gain controller for multiplying the gain by the gain and the gain, respectively, and the convolution multiplied by the gain by the gain controller.
Add the processed adaptive code and the fixed code
Excitation signal generation means for generating an excitation signal by using the vocal tract parameter and the excitation signal.
And a synthesis filter for generating a signal.
Code-excited linear predictive decoder.
【請求項6】 請求項5記載のコード励振線形予測復号
化器において、 上記インパルス応答は、次の式で示す伝達関数H(z)の
インパルス応答であることを特徴としたコード励振線形
予測復号化器。 H(z)=1/(1−εz-L) 但し、εは0<ε≦1なる定数、Lは適応コードの前記
インデックスから計算したピッチラグである。
6. The code-excited linear prediction decoder according to claim 5, wherein the impulse response is an impulse response of a transfer function H (z) represented by the following equation. Chemist. H (z) = 1 / (1−εz− L ) where ε is a constant satisfying 0 <ε ≦ 1, and L is a pitch lag calculated from the index of the adaptive code.
【請求項7】 請求項5記載のコード励振線形予測復号
化器において、 上記インパルス応答は、次の式で示す伝達関数H(z)の
インパルス応答であることを特徴としたコード励振線形
予測復号化器。 H(z)=(1−Σ γi aiz-i)/(1−Σ νi aiZ-i ) 但し、ai(iは1〜M)は、タップ係数、γ及びνは0
<γ<1及び0<ν<1なる定数である。
7. The code-excited linear prediction decoder according to claim 5, wherein the impulse response is an impulse response of a transfer function H (z) represented by the following equation. Chemist. H (z) = (1−Σγ i aiz− i ) / (1−Σv i aiZ− i ) where ai (i is 1 to M) is a tap coefficient, and γ and ν are 0
<Γ <1 and 0 <ν <1.
【請求項8】 請求項5記載のコード励振線形予測復号
化器において、 上記インパルス応答は、次の式で示す伝達関数H1(z)
のインパルス応答と伝達関数H2(z)のインパルス応答
とを縦属接続したインパルス応答を用いることを特徴と
したコード励振線形予測復号化器。 H1(z)=(1−Σ γi aiz-i)/(1−Σ νi aiz-i ) H2(z)=1/(1−εz-L) 但し、ai(iは1〜M)は、タップ係数、γ及びνは0
<γ<1及び0<ν<1なる定数、εは0<ε≦1なる
定数、Lは適応コードの前記インデックスから計算した
ピッチラグである。
8. The code-excited linear prediction decoder according to claim 5, wherein the impulse response is a transfer function H1 (z) represented by the following equation:
A code-excited linear predictive decoder characterized by using an impulse response obtained by cascading an impulse response of the transfer function H2 (z) and an impulse response of the transfer function H2 (z). H1 (z) = (1−Σγ i aiz− i ) / (1−Σv i aiz− i ) H2 (z) = 1 / (1−εz− L ) where ai (i is 1 to M) Is the tap coefficient, and γ and ν are 0
<Γ <1 and 0 <ν <1 constants, ε is a constant satisfying 0 <ε ≦ 1, and L is a pitch lag calculated from the index of the adaptive code.
JP3327443A 1991-12-11 1991-12-11 Code-excited linear prediction encoder and decoder Expired - Lifetime JP2968109B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3327443A JP2968109B2 (en) 1991-12-11 1991-12-11 Code-excited linear prediction encoder and decoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3327443A JP2968109B2 (en) 1991-12-11 1991-12-11 Code-excited linear prediction encoder and decoder

Publications (2)

Publication Number Publication Date
JPH05165497A JPH05165497A (en) 1993-07-02
JP2968109B2 true JP2968109B2 (en) 1999-10-25

Family

ID=18199229

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3327443A Expired - Lifetime JP2968109B2 (en) 1991-12-11 1991-12-11 Code-excited linear prediction encoder and decoder

Country Status (1)

Country Link
JP (1) JP2968109B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0654909A4 (en) * 1993-06-10 1997-09-10 Oki Electric Ind Co Ltd Code excitation linear prediction encoder and decoder.
US5864797A (en) * 1995-05-30 1999-01-26 Sanyo Electric Co., Ltd. Pitch-synchronous speech coding by applying multiple analysis to select and align a plurality of types of code vectors
JP3522012B2 (en) * 1995-08-23 2004-04-26 沖電気工業株式会社 Code Excited Linear Prediction Encoder
KR100351484B1 (en) 1998-06-09 2002-09-05 마츠시타 덴끼 산교 가부시키가이샤 Speech coding apparatus and speech decoding apparatus

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4899385A (en) * 1987-06-26 1990-02-06 American Telephone And Telegraph Company Code excited linear predictive vocoder
JPH03101800A (en) * 1989-06-28 1991-04-26 Fujitsu Ltd Voice encoding system

Also Published As

Publication number Publication date
JPH05165497A (en) 1993-07-02

Similar Documents

Publication Publication Date Title
EP0409239B1 (en) Speech coding/decoding method
JP3346765B2 (en) Audio decoding method and audio decoding device
US5729655A (en) Method and apparatus for speech compression using multi-mode code excited linear predictive coding
KR100304682B1 (en) Fast Excitation Coding for Speech Coders
US20020095285A1 (en) Apparatus for encoding and apparatus for decoding speech and musical signals
US5727122A (en) Code excitation linear predictive (CELP) encoder and decoder and code excitation linear predictive coding method
US5659659A (en) Speech compressor using trellis encoding and linear prediction
JPH11327597A (en) Voice coding device and voice decoding device
JP3063668B2 (en) Voice encoding device and decoding device
CA2440820A1 (en) Sound encoding apparatus and method, and sound decoding apparatus and method
JPH0944195A (en) Voice encoding device
JP2968109B2 (en) Code-excited linear prediction encoder and decoder
JP3268750B2 (en) Speech synthesis method and system
JP3303580B2 (en) Audio coding device
JP2613503B2 (en) Speech excitation signal encoding / decoding method
JP3232701B2 (en) Audio coding method
JP3299099B2 (en) Audio coding device
JP3319396B2 (en) Speech encoder and speech encoder / decoder
JPH0519795A (en) Excitation signal encoding and decoding method for voice
JP3089967B2 (en) Audio coding device
JP2853170B2 (en) Audio encoding / decoding system
JPH11259098A (en) Method of speech encoding/decoding
JP3192051B2 (en) Audio coding device
JP2700974B2 (en) Audio coding method
JP3520955B2 (en) Acoustic signal coding

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19990309

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990803

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070820

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080820

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090820

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090820

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100820

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100820

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110820

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120820

Year of fee payment: 13

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120820

Year of fee payment: 13