JPH11282497A - Sound source vector generation device, speech encoder and decoder, speech signal communication system, and speech signal recording system - Google Patents

Sound source vector generation device, speech encoder and decoder, speech signal communication system, and speech signal recording system

Info

Publication number
JPH11282497A
JPH11282497A JP10085717A JP8571798A JPH11282497A JP H11282497 A JPH11282497 A JP H11282497A JP 10085717 A JP10085717 A JP 10085717A JP 8571798 A JP8571798 A JP 8571798A JP H11282497 A JPH11282497 A JP H11282497A
Authority
JP
Japan
Prior art keywords
vector
diffusion
spreading
combination
pulse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10085717A
Other languages
Japanese (ja)
Other versions
JP3174756B2 (en
Inventor
Kazutoshi Yasunaga
和敏 安永
Toshiyuki Morii
利幸 森井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP08571798A priority Critical patent/JP3174756B2/en
Priority to CN2007101529987A priority patent/CN101174413B/en
Priority to KR1020057016117A priority patent/KR20050090026A/en
Priority to KR1020077016453A priority patent/KR100938017B1/en
Priority to CA2598870A priority patent/CA2598870C/en
Priority to CN2007103073184A priority patent/CN101202047B/en
Priority to EP06019105A priority patent/EP1746582B1/en
Priority to EP06021073A priority patent/EP1746583B1/en
Priority to EP06009156A priority patent/EP1684268B8/en
Priority to CA002494946A priority patent/CA2494946C/en
Priority to CN2006100048275A priority patent/CN1808569B/en
Priority to DE69840855T priority patent/DE69840855D1/en
Priority to CN200710307317XA priority patent/CN101202046B/en
Priority to EP06019107A priority patent/EP1752968B1/en
Priority to PCT/JP1998/004777 priority patent/WO1999021174A1/en
Priority to US09/319,933 priority patent/US6415254B1/en
Priority to KR1020087016338A priority patent/KR100900113B1/en
Priority to EP06025737.5A priority patent/EP1763019B1/en
Priority to CNB2005100062028A priority patent/CN100349208C/en
Priority to DE69836624T priority patent/DE69836624T2/en
Priority to EP20060025738 priority patent/EP1760694A3/en
Priority to EP10163650A priority patent/EP2224597B1/en
Priority to KR1020077016452A priority patent/KR100938018B1/en
Priority to KR1020087019303A priority patent/KR101029398B1/en
Priority to EP06019106.1A priority patent/EP1734512B1/en
Priority to DE69840038T priority patent/DE69840038D1/en
Priority to KR1020087018788A priority patent/KR100925084B1/en
Priority to DE69839407T priority patent/DE69839407T2/en
Priority to EP98950336A priority patent/EP0967594B1/en
Priority to DE69838305T priority patent/DE69838305T2/en
Priority to KR1020077016451A priority patent/KR100886062B1/en
Priority to CN2007101529972A priority patent/CN101174412B/en
Priority to CA002275266A priority patent/CA2275266C/en
Priority to EP06021078A priority patent/EP1755227B1/en
Priority to KR1020087018800A priority patent/KR100872246B1/en
Priority to KR10-2003-7013816A priority patent/KR100527217B1/en
Priority to KR1019997005510A priority patent/KR100651438B1/en
Priority to DE29825254U priority patent/DE29825254U1/en
Priority to DE69840008T priority patent/DE69840008D1/en
Priority to CN2007103073381A priority patent/CN101221764B/en
Priority to CN2007103073165A priority patent/CN101202045B/en
Priority to DE29825253U priority patent/DE29825253U1/en
Priority to CN2007103073150A priority patent/CN101202044B/en
Priority to CA2528645A priority patent/CA2528645C/en
Priority to DE69840009T priority patent/DE69840009D1/en
Priority to EP06025740.9A priority patent/EP1760695B1/en
Priority to CA2598683A priority patent/CA2598683C/en
Priority to CA2598780A priority patent/CA2598780C/en
Priority to CA2684452A priority patent/CA2684452C/en
Priority to EP05028415A priority patent/EP1640970B9/en
Priority to CA2684379A priority patent/CA2684379C/en
Publication of JPH11282497A publication Critical patent/JPH11282497A/en
Priority to HK00104635A priority patent/HK1025417A1/en
Application granted granted Critical
Publication of JP3174756B2 publication Critical patent/JP3174756B2/en
Priority to US10/133,735 priority patent/US7024356B2/en
Priority to US10/614,834 priority patent/US7373295B2/en
Priority to US11/125,184 priority patent/US7590527B2/en
Priority to US11/281,386 priority patent/US7499854B2/en
Priority to US11/508,849 priority patent/US7546239B2/en
Priority to HK06110370A priority patent/HK1090161A1/en
Priority to HK06110927A priority patent/HK1090465A1/en
Priority to HK07103128.2A priority patent/HK1097637A1/en
Priority to HK07105320.3A priority patent/HK1099117A1/en
Priority to HK07105319.6A priority patent/HK1099138A1/en
Priority to HK07106627.1A priority patent/HK1101839A1/en
Priority to US11/776,823 priority patent/US7533016B2/en
Priority to HK07108050.3A priority patent/HK1103843A1/en
Priority to HK07109794.2A priority patent/HK1104655A1/en
Priority to HK08113638.3A priority patent/HK1122639A1/en
Priority to US12/357,093 priority patent/US8332214B2/en
Priority to US12/362,232 priority patent/US7925501B2/en
Priority to US12/783,974 priority patent/US8352253B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a sound source vector generation device which generates a sound source vector with high similarity to a sound source vector by an actual speech signal to efficiently encode/decode speech information, and to provide a speech encoder/decoder, a speech signal communication system, and a speech signal recording system, for obtaining a high quality synthetic speech using the above sound source vector generation device. SOLUTION: By providing a pulse vector generation part 101, a diffusion pattern storage and selection part 102, a pulse vector diffusion part 103, and a diffusion vector adder part 104, a sound source vector generation device which can generate a sound source vector 105 more similar to an actual sound source than a conventional algebraic sound source generation device is obtained, and by using it as a noise coding notebook, a speech encoder/decoder, a speech signal communication system, and a speech signal recording system which are able to output higher quality synthetic sound than a conventional speech encoder/decoder.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、音声情報を効率的
に符号化/復号化するための、音源ベクトル生成装置、
及び音声符号化装置/復号化装置、音声信号通信システ
ム、並びに音声信号記録システムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a sound source vector generating apparatus for efficiently encoding / decoding audio information.
And an audio encoding / decoding device, an audio signal communication system, and an audio signal recording system.

【0002】[0002]

【従来の技術】従来の音声符号化技術としては、Code E
xcited Linear Prediction:"High Quality Speech at
Low Bit Rate",M. R. Schroeder, Proc. ICASSP'85, p
p.937-940 (文献1)に記載のCELP音声符号化装置
がある。この音声符号化装置は、入力音声を一定時間で
区切ったフレーム毎に線形予測を行い、フレーム毎の線
形予測による予測残差(励振信号)を、過去の駆動音源
を格納した適応符号帳と複数の雑音符号ベクトルを格納
した雑音符号帳を用いて符号化する装置である。
2. Description of the Related Art Conventional speech coding techniques include Code E
xcited Linear Prediction: "High Quality Speech at
Low Bit Rate ", MR Schroeder, Proc. ICASSP'85, p
There is a CELP speech coding apparatus described in p.937-940 (Reference 1). This speech coding apparatus performs linear prediction for each frame obtained by dividing an input speech at a fixed time, and stores a prediction residual (excitation signal) by the linear prediction for each frame with an adaptive codebook storing past driving sound sources. Is a device that performs encoding using a random codebook that stores the random code vector of.

【0003】ここではまず、この従来のCELP音声符
号化装置を、図6を用いて詳しく説明する。
First, the conventional CELP speech coding apparatus will be described in detail with reference to FIG.

【0004】線形予測分析部12は、CELP音声符号
化装置に入力された音声信号11を分析し、線形予測係
数を算出する。ここで、線形予測係数とは、音声信号の
周波数スペクトルの包絡特性を表すパラメータである。
線形予測分析部12で得られた線形予測係数は、線形予
測係数符号化部13において量子化された後、線形予測
係数復号化部14へ送られる。なお、この時に得られる
量子化番号は、線形予測符号として符号出力部24へ出
力される。線形予測係数復号化部24は、線形予測係数
符号化部13で量子化された線形予測係数を復号化して
合成フィルタの係数を得、合成フィルタ15へ出力す
る。
[0004] A linear prediction analysis unit 12 analyzes the speech signal 11 input to the CELP speech coding apparatus and calculates a linear prediction coefficient. Here, the linear prediction coefficient is a parameter representing the envelope characteristic of the frequency spectrum of the audio signal.
The linear prediction coefficients obtained by the linear prediction analysis unit 12 are quantized by the linear prediction coefficient encoding unit 13 and then sent to the linear prediction coefficient decoding unit 14. Note that the quantization number obtained at this time is output to the code output unit 24 as a linear prediction code. The linear prediction coefficient decoding unit 24 decodes the linear prediction coefficients quantized by the linear prediction coefficient encoding unit 13 to obtain coefficients of a synthesis filter, and outputs the coefficients to the synthesis filter 15.

【0005】適応符号帳17は、適応符号ベクトルの候
補を複数種類出力する符号帳であり、駆動音源を過去数
フレーム分格納したバッファによって構成される。な
お、適応符号ベクトルとは、入力音声内の周期成分を表
現する時系列ベクトルである。
[0005] The adaptive codebook 17 is a codebook that outputs a plurality of types of adaptive code vector candidates, and is composed of a buffer that stores driving excitations for the past several frames. Note that the adaptive code vector is a time-series vector expressing a periodic component in the input speech.

【0006】雑音符号帳18は、雑音符号ベクトルの候
補を複数種類(割り当てられたビット数に対応する種
類)格納した符号帳である。なお、雑音符号ベクトルと
は、入力音声内の非周期成分を表現する時系列ベクトル
である。
The random codebook 18 is a codebook storing a plurality of random code vector candidates (types corresponding to the number of assigned bits). Note that the noise code vector is a time-series vector representing an aperiodic component in the input speech.

【0007】適応符号ゲイン重み付け部19および雑音
符号ゲイン重み付け部20は、適応符号帳17および雑
音符号帳18から出力される候補ベクトルそれぞれに対
して、重み符号帳21から読みだした適応符号ゲインと
雑音符号ゲインをそれぞれ乗じ、加算部22へ出力す
る。なお、重み符号帳とは、適応符号ベクトル候補に乗
じる重みと、雑音符号ベクトル候補に乗じる重みをそれ
ぞれ複数種類(割り当てられたビット数に対応する種
類)ずつ格納したメモリである。
The adaptive code gain weighting section 19 and the noise code gain weighting section 20 provide an adaptive code gain read from the weight codebook 21 for each of the candidate vectors output from the adaptive codebook 17 and the noise codebook 18, respectively. The noise signals are multiplied by the noise code gains, respectively, and output to the addition unit 22. Note that the weighting codebook is a memory that stores a plurality of types of weights (types corresponding to the number of allocated bits) for weights for multiplying adaptive code vector candidates and weights for multiplying noise code vector candidates.

【0008】加算部22は、適応符号ゲイン重み付け部
19、雑音符号ゲイン重み付け部20においてそれぞれ
重み付けられた適応符号ベクトル候補と雑音符号ベクト
ル候補を加算して駆動音源ベクトル候補を生成し、合成
フィルタ15へ出力する。合成フィルタ15は、線形予
測係数復号化部14で得られた合成フィルタの係数によ
って構成される全極型フィルタであり、加算部22から
の駆動音源ベクトル候補を入力すると、合成音声ベクト
ル候補を出力する機能を有している。
The adder 22 adds the adaptive code vector candidates and the noise code vector candidates weighted by the adaptive code gain weighting unit 19 and the noise code gain weighting unit 20, respectively, to generate a driving excitation vector candidate, and Output to The synthesis filter 15 is an all-pole filter composed of the coefficients of the synthesis filter obtained by the linear prediction coefficient decoding unit 14, and outputs a synthesized speech vector candidate when a driving excitation vector candidate is input from the addition unit 22. It has the function to do.

【0009】歪み計算部16は、合成フィルタ15の出
力である合成音声ベクトル候補と入力音声11との歪み
を計算し、得られた歪みの値を符号番号特定部23に出
力する。符号番号特定部23は、歪み計算部16で算出
する歪みを最小化するような3種類の符号番号(適応符
号番号、雑音符号番号、重み符号番号)を、3種類の符
号帳(適応符号帳、雑音符号帳、重み符号帳)それぞれ
について特定する。そして、符号番号特定部23で特定
された3種類の符号番号は、符号出力部24へ出力され
る。符号出力部24は、線形予測係数符号化部13で得
られた線形予測符号番号と、符号番号特定部23で特定
された適応符号番号、雑音符号番号、重み符号番号をま
とめて、伝送路へ出力する。
The distortion calculator 16 calculates the distortion between the synthesized speech vector candidate output from the synthesis filter 15 and the input speech 11, and outputs the obtained distortion value to the code number identification unit 23. The code number identification unit 23 converts three types of code numbers (adaptive code number, noise code number, and weight code number) that minimize the distortion calculated by the distortion calculation unit 16 into three types of code books (adaptive code book). , Noise codebook, weight codebook). The three types of code numbers specified by the code number specifying unit 23 are output to the code output unit 24. The code output unit 24 collects the linear prediction code number obtained by the linear prediction coefficient coding unit 13 and the adaptive code number, the noise code number, and the weight code number specified by the code number specification unit 23, and sends the result to the transmission path. Output.

【0010】次に、図7を用いて従来のCELP音声復
号化装置の動作を説明する。音声復号化装置(図7)で
は、まず、符号入力部31が、音声符号化装置(図6)
から送信された符号を受信し、受信した符号に対応する
線形予測符号番号と、適応符号番号、雑音符号番号、重
み符号番号に分解し、分解して得られた符号をそれぞ
れ、線形予測係数復号化部32、適応符号帳33、雑音
符号帳34、重み符号帳35へ出力する。
Next, the operation of the conventional CELP speech decoding apparatus will be described with reference to FIG. In the audio decoding device (FIG. 7), first, the code input unit 31
Receive the code transmitted from, and decompose the code into a linear prediction code number corresponding to the received code, an adaptive code number, a noise code number, and a weight code number, and decode the codes obtained by the decomposition into linear prediction coefficient decoding, respectively. To the coding unit 32, the adaptive codebook 33, the noise codebook 34, and the weight codebook 35.

【0011】次に、線形予測係数復号化部32が符号入
力部31で得られた線形予測符号番号を復号化して合成
フィルタの係数を得、合成フィルタ39へ出力する。そ
して、適応符号帳内の適応符号番号と対応する位置から
適応符号ベクトルが読みだされ、雑音符号帳から雑音符
号番号と対応する雑音符号ベクトルが読みだされ、さら
に、重み符号帳から重み符号番号と対応した適応符号ゲ
インと雑音符号ゲインが読みだされる。そして、適応符
号ベクトル重付け部36において、適応符号ベクトルに
適応符号ゲインが乗じられ加算部38へと送られる。ま
た同様に、雑音符号ベクトル重付け部37において、雑
音符号ベクトルに雑音符号ゲインが乗じられ加算部38
へ送られる。
Next, a linear prediction coefficient decoding unit 32 decodes the linear prediction code number obtained by the code input unit 31 to obtain a coefficient of a synthesis filter, and outputs it to the synthesis filter 39. Then, an adaptive code vector is read from a position corresponding to the adaptive code number in the adaptive code book, a noise code vector corresponding to the noise code number is read from the noise code book, and a weight code number is read from the weight code book. The adaptive code gain and the noise code gain corresponding to are read out. Then, the adaptive code vector weighting unit 36 multiplies the adaptive code vector by the adaptive code gain and sends the result to the adding unit 38. Similarly, the noise code vector weighting unit 37 multiplies the noise code vector by the noise code gain, and
Sent to

【0012】加算部38は、上記2つの符号ベクトルが
加算して駆動音源ベクトルを生成し、生成された駆動音
源はバッファ更新のために適応符号帳33へ、また、フ
ィルタを駆動のために合成フィルタ39へと送られる。
合成フィルタ39は、加算部38で得られた駆動音源ベ
クトルで駆動され、線形予測係数復号化部32の出力を
用いて合成音声を再生する。
The adder 38 adds the two code vectors to generate a driving excitation vector, and the generated driving excitation is combined with the adaptive codebook 33 for updating the buffer and for driving the filter. It is sent to the filter 39.
The synthesis filter 39 is driven by the driving sound source vector obtained by the addition unit 38, and reproduces a synthesized voice using the output of the linear prediction coefficient decoding unit 32.

【0013】なお、CELP音声符号化装置の歪み計算
部16では、一般に、次の(数1)により求められる歪
みEが計算される。
The distortion calculator 16 of the CELP speech coding apparatus generally calculates a distortion E obtained by the following (Equation 1).

【0014】[0014]

【数1】 (Equation 1)

【0015】ここで、(数1)の歪みEを最小化するた
めには、適応符号番号、雑音符号番号、重み符号番号の
全組合せについて閉ループで歪みを算出し、各符号番号
を特定することが理想である。しかし、(数1)を閉ル
ープ探索すると演算処理量が大きくなりすぎるため、一
般的には、まず、適応符号帳を用いてベクトル量子化に
より適応符号番号を特定し、次に雑音符号帳を用いたベ
クトル量子化により雑音符号番号を特定し、最後に、重
み符号帳を用いたベクトル量子化により重み符号番号を
特定する。ここでは、この場合について、雑音符号帳を
用いたベクトル量子化処理をさらに詳しく説明する。
Here, in order to minimize the distortion E in (Equation 1), the distortion is calculated in a closed loop for all combinations of the adaptive code number, the noise code number, and the weight code number, and each code number is specified. Is ideal. However, since the amount of calculation processing becomes too large when a closed loop search of (Equation 1) is performed, generally, first, an adaptive code number is specified by vector quantization using an adaptive codebook, and then a noise codebook is used. The noise code number is specified by the vector quantization, and finally the weight code number is specified by the vector quantization using the weight codebook. Here, in this case, the vector quantization processing using the random codebook will be described in more detail.

【0016】適応符号番号および適応符号ゲインが、先
にもしくは暫定的に決まっている場合には、(数1)の
歪み評価式は次の(数2)に変形される。
When the adaptive code number and the adaptive code gain are determined first or tentatively, the equation for evaluating distortion in (Equation 1) is transformed into the following (Equation 2).

【0017】[0017]

【数2】 (Equation 2)

【0018】ただし、(数2)内のベクトルxは、先に
もしくは暫定的に特定した適応符号番号と適応符号ゲイ
ンを用いた、次の(数3)によって求められる雑音音源
情報(雑音符号番号特定用のターゲットベクトル)であ
る。
However, the vector x in (Equation 2) is the noise source information (noise code number) obtained by the following (Equation 3) using the adaptive code number and the adaptive code gain specified earlier or provisionally. (Specific target vector).

【0019】[0019]

【数3】 (Equation 3)

【0020】雑音符号番号を特定した後に雑音符号ゲイ
ンgcを特定する場合には、(数2)内のgcが任意の値を
とり得ると仮定できるので、(数2)を最小化する雑音
符号ベクトルの番号を特定する処理(雑音音源情報のベ
クトル量子化処理)は、次の(数4)の分数式を最大化
する雑音符号ベクトルの番号特定に置き換えられること
が一般に知られている。
When the noise code gain gc is specified after the noise code number is specified, it can be assumed that gc in (Equation 2) can take an arbitrary value. It is generally known that the process of specifying the vector number (the vector quantization process of the noise excitation information) can be replaced by the specification of the number of the noise code vector that maximizes the following fractional expression (Equation 4).

【0021】[0021]

【数4】 (Equation 4)

【0022】すなわち、適応符号番号および適応符号ゲ
インが前もってもしくは暫定的に特定されている場合、
雑音音源情報のベクトル量子化処理とは、歪み計算部1
6で算出する(数4)の分数式を最大化する雑音符号ベ
クトル候補の番号を特定する処理となる。
That is, when the adaptive code number and the adaptive code gain are specified in advance or provisionally,
The vector quantization process of the noise source information means the distortion calculation unit 1
This is a process of specifying the number of the noise code vector candidate that maximizes the fractional expression of (Equation 4) calculated in (6).

【0023】初期のCELP符号化装置/復号化装置で
は、割り当てられたビット数に対応する種類のランダム
数列をメモリに格納したものが雑音符号帳として用いら
れていた。しかし、非常に多くのメモリ容量が必要にな
るとともに、雑音符号ベクトル候補それぞれについて
(数4)の歪みを計算するための演算処理量が膨大にな
るという課題があった。
In the early CELP encoder / decoder, a random number sequence of a type corresponding to the number of allocated bits was stored in a memory and used as a random codebook. However, there is a problem that a very large memory capacity is required and the amount of calculation processing for calculating the distortion of (Equation 4) for each of the noise code vector candidates becomes enormous.

【0024】従来、この課題を解決する一方法として
は、"8KBIT/S ACELP CODING OF SPEECH WITH 10 MS SPE
ECH-FRAME:A CANDIDATE FOR CCITT STANDARDIZATIO
N":R. Salami, C. Laflamme, J-P. Adoul, ICASSP'94,
pp.II-97〜II-100,1994(文献2)などに記載される
ように、代数的に音源ベクトルを生成する代数的音源ベ
クトル生成部を用いたCELP音声符号化装置/復号化
装置が挙げられる。
Conventionally, one method of solving this problem is to use “8KBIT / S ACELP CODING OF SPEECH WITH 10 MS SPE”.
ECH-FRAME: A CANDIDATE FOR CCITT STANDARDIZATIO
N ": R. Salami, C. Laflamme, JP. Adoul, ICASSP'94,
As described in pp. II-97 to II-100, 1994 (Document 2), etc., a CELP speech encoding apparatus / decoding apparatus using an algebraic excitation vector generation unit that generates excitation vectors algebraically. No.

【0025】[0025]

【発明が解決しようとする課題】しかしながら、上記代
数的音源生成部を雑音符号帳に用いたCELP音声符号
化装置/復号化装置では、(数3)によって求めた雑音
音源情報(雑音符号番号特定用のターゲット)を、少数
本のパルスで常に近似表現しているため、音声品質の向
上を図る上で限界がある。このことは、(数3)の雑音
音源情報xの要素を実際に調べると、それが少数本のパ
ルスだけによって構成される場合がほとんどないことか
ら明らかである。
However, in a CELP speech coding apparatus / decoding apparatus using the algebraic excitation generating section as a noise codebook, the noise excitation information (noise code number identification) obtained by (Equation 3) is used. ) Is always approximated by a small number of pulses, so there is a limit in improving speech quality. This is apparent from the fact that when the element of the noise source information x in (Equation 3) is actually examined, it hardly consists of only a small number of pulses.

【0026】本発明は、音声信号を実際に分析した時に
得られる音源ベクトルの形状と、統計的に類似性の高い
形状の音源ベクトルを生成することができる新たな音源
ベクトル生成装置を提供すること、さらに、上記音源ベ
クトル生成装置を雑音符号帳として用いることで、代数
的音源生成部を雑音符号帳として用いる場合より品質の
高い合成音声を得ることが可能なCELP音声符号化装
置/復号化装置、音声信号通信システム、音声信号記録
システムを提供することを目的とする。
The present invention provides a new sound source vector generating apparatus capable of generating a sound source vector having a shape that is statistically highly similar to the shape of a sound source vector obtained when an audio signal is actually analyzed. Furthermore, a CELP speech coding apparatus / decoding apparatus capable of obtaining synthesized speech with higher quality by using the above excitation vector generation apparatus as a noise codebook than when using an algebraic excitation generation unit as a noise codebook It is an object to provide an audio signal communication system and an audio signal recording system.

【0027】[0027]

【課題を解決するための手段】この課題を解決するため
に本発明は、ベクトル軸上のある1要素に極性付き単位
パルスが立ったパルスベクトルを生成するチャネルをN
個(N≧1)備えたパルスベクトル生成部と、前記N個
のチャネルごとにM種類(M≧1)の拡散パタンを格納
する機能と、格納したM種類の拡散パタンからある1種
類の拡散パタンを選択する機能とを併せ持つ拡散パタン
格納・選択部と、前記パルスベクトル生成部から出力さ
れるパルスベクトルと前記拡散パタン格納・選択部から
選択される拡散パタンとの重畳演算をチャネルごとに行
い、N個の拡散ベクトルを生成する機能を有するパルス
ベクトル拡散部と、前記パルスベクトル拡散部により生
成されるN個の拡散ベクトルを加算して音源ベクトルを
生成する機能を有する拡散ベクトル加算部とを備えるこ
とを特徴とする音源ベクトル生成装置であり、上記パル
スベクトル生成部に、N個(N≧1)のパルスベクトル
を代数的に生成する機能をもたせること、さらに、上記
拡散パタン格納・選択部が、実際の音源ベクトルの形状
(特性)を予め学習することによって得られた拡散パタ
ンを格納しておくことによって、従来の代数的音源生成
部よりも、実際の音源ベクトルの形状によく類似した形
状の音源ベクトルを生成することが可能になる。
According to the present invention, a channel for generating a pulse vector in which a unit pulse with polarity rises in one element on a vector axis is set to N.
(N ≧ 1) pulse vector generation units, a function of storing M (M ≧ 1) diffusion patterns for each of the N channels, and one type of diffusion from the stored M types of diffusion patterns A diffusion pattern storage / selection unit having a function of selecting a pattern, and a superposition calculation of a pulse vector output from the pulse vector generation unit and a diffusion pattern selected from the diffusion pattern storage / selection unit for each channel. , A pulse vector spreading unit having a function of generating N diffusion vectors, and a diffusion vector adding unit having a function of generating a sound source vector by adding the N diffusion vectors generated by the pulse vector spreading unit. A sound source vector generation apparatus characterized in that the pulse vector generation unit generates N (N ≧ 1) pulse vectors algebraically. By providing the function, and by storing the diffusion pattern obtained by learning the shape (characteristic) of the actual sound source vector in advance, the diffusion pattern storage / selection unit can perform the conventional algebraic sound source generation. It is possible to generate a sound source vector having a shape more similar to the shape of an actual sound source vector than a part.

【0028】また本発明は、上記の新しい音源ベクトル
生成装置を雑音符号帳に用いることを特徴とするCEL
P音声符号化装置/復号化装置であり、従来の代数的音
源生成部を雑音符号帳に用いた音声符号化装置/復号化
装置よりも、より実際の形状に近い音源ベクトルを生成
することができ、よって、より品質の高い合成音声を出
力することが可能な音声符号化装置/復号化装置、音声
信号通信システム、音声信号記録システムが得られる。
According to the present invention, there is provided a CEL using the above-mentioned new excitation vector generation apparatus for a noise codebook.
P speech encoder / decoder, which can generate an excitation vector closer to the actual shape than a speech encoder / decoder using a conventional algebraic excitation generator for a noise codebook. Thus, it is possible to obtain a speech encoding device / decoding device, a speech signal communication system, and a speech signal recording system capable of outputting higher quality synthesized speech.

【0029】[0029]

【発明の実施の形態】本発明の請求項1に記載の発明
は、ベクトル軸上のある1要素に極性付き単位パルスが
立ったパルスベクトルを生成するチャネルをN個(N≧
1)備えたパルスベクトル生成部と、前記N個のチャネ
ルごとにM種類(M≧1)の拡散パタンを格納する機能
と、格納したM種類の拡散パタンからある1種類の拡散
パタンを選択する機能とを併せ持つ拡散パタン格納・選
択部と、前記パルスベクトル生成部から出力されるパル
スベクトルと前記拡散パタン格納・選択部から選択され
る拡散パタンとの重畳演算をチャネルごとに行い、N個
の拡散ベクトルを生成する機能を有するパルスベクトル
拡散部と、前記パルスベクトル拡散部により生成される
N個の拡散ベクトルを加算して音源ベクトルを生成する
機能を有する拡散ベクトル加算部とを備えることを特徴
とする音源ベクトル生成装置であり、格納した拡散パタ
ンの形状(特性)を反映した音源ベクトルを生成するこ
とができるという作用を有する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS The invention according to claim 1 of the present invention provides N channels (N ≧ N) for generating a pulse vector in which a unit pulse with polarity rises at one element on a vector axis.
1) The provided pulse vector generation unit, the function of storing M types (M ≧ 1) of diffusion patterns for each of the N channels, and selecting one type of diffusion pattern from the stored M types of diffusion patterns A diffusion pattern storage / selection unit having functions and a pulse vector output from the pulse vector generation unit and a diffusion pattern selected from the diffusion pattern storage / selection unit are superimposed for each channel, and N A pulse vector spreading unit having a function of generating a diffusion vector; and a diffusion vector adding unit having a function of generating a sound source vector by adding N diffusion vectors generated by the pulse vector spreading unit. A sound source vector that reflects the shape (characteristics) of the stored diffusion pattern. Having an iodine.

【0030】請求項2に記載の発明は、パルスベクトル
生成部が、N個(N≧1)のパルスベクトルを代数的に
生成する機能を有することを特徴とする請求項1記載の
音源ベクトル生成装置であり、N個(N≧1)のパルス
ベクトルを代数的に生成できるため、パルスベクトル生
成部がパルスベクトル生成情報を特にROMに記憶して
おく必要がなくなるという作用を有する。
According to a second aspect of the present invention, the pulse vector generating section has a function of generating N (N ≧ 1) pulse vectors algebraically. Since the apparatus is an apparatus and can generate N (N ≧ 1) pulse vectors algebraically, the pulse vector generation unit does not need to particularly store pulse vector generation information in ROM.

【0031】請求項3に記載の発明は、生成される音源
ベクトルに対して1対1に番号を割り当てることを特徴
とする請求項1もしくは請求項2に記載の音源ベクトル
生成装置であり、音源ベクトルと対応する番号の送受に
より音源情報の伝達が可能になるという作用を有する。
According to a third aspect of the present invention, in the sound source vector generating apparatus according to the first or second aspect, a number is assigned to the generated sound source vector on a one-to-one basis. The transmission and reception of a number corresponding to a vector has an effect that sound source information can be transmitted.

【0032】請求項4に記載の発明は、請求項3記載の
音源ベクトル生成装置を雑音符号帳として用い、前記雑
音符号帳で雑音音源情報をベクトル量子化することによ
り得られ、かつ、パルス位置、パルス極性、拡散パタン
を特定するインデクスを雑音符号番号とすることを特徴
とするCELP音声符号化装置/復号化装置であり、C
ELP音声符号化装置/復号化装置における雑音音源情
報を上記雑音符号番号の伝送によって行うことができる
という作用を有する。
According to a fourth aspect of the present invention, the excitation vector generation apparatus according to the third aspect is used as a noise codebook, and the noise excitation information is vector-quantized by the noise codebook, and the pulse position is obtained. , A pulse polarity, and an index for specifying a spreading pattern are used as noise code numbers.
This has the effect that the noise source information in the ELP speech encoder / decoder can be transmitted by transmitting the noise code number.

【0033】請求項5に記載の発明は、拡散パタンが、
雑音音源情報をベクトル量子化した際に生じる量子化歪
みをより小さくするように予め学習して得られたもので
あることを特徴とする請求項4記載のCELP音声符号
化装置/復号化装置であり、雑音音源情報をベクトル量
子化した際に生じる量子化歪みを代数的音源を雑音符号
帳に用いた場合よりも小さくできるという作用を有す
る。
According to a fifth aspect of the present invention, the diffusion pattern is:
5. The CELP speech coding apparatus / decoding apparatus according to claim 4, wherein the speech information is obtained by learning in advance so as to reduce quantization distortion generated when the noise source information is vector-quantized. There is an effect that the quantization distortion that occurs when the noise excitation information is vector-quantized can be made smaller than when the algebraic excitation is used for the noise codebook.

【0034】請求項6に記載の発明は、拡散パターンが
2種類以上(M≧2)格納されていることを特徴とする
請求項1または2記載の音源ベクトル生成装置であり、
格納した拡散パタンの形状(特性)を反映した音源ベク
トルを生成することができるという作用を有し、あるい
はN個(N≧1)のパルスベクトルを代数的に生成でき
るため、パルスベクトル生成部がパルスベクトル生成情
報を特にROMに記憶しておく必要がなくなるという作
用を有する。
According to a sixth aspect of the present invention, there is provided the sound source vector generating apparatus according to the first or second aspect, wherein two or more types of diffusion patterns are stored (M ≧ 2).
It has the effect of generating a sound source vector that reflects the shape (characteristics) of the stored diffusion pattern, or can generate N (N ≧ 1) pulse vectors algebraically. This has an effect that the pulse vector generation information does not need to be particularly stored in the ROM.

【0035】請求項7に記載の発明は、拡散パターンが
2種類以上(M≧2)格納されていることを特徴とする
請求項3記載の音源ベクトル生成装置であり、音源ベク
トルと対応した番号を伝送することで音源情報の伝送を
行うことが可能になるという作用を有する。
According to a seventh aspect of the present invention, there is provided the sound source vector generating apparatus according to the third aspect, wherein two or more kinds of diffusion patterns are stored (M ≧ 2). Has the effect that sound source information can be transmitted.

【0036】請求項8に記載の発明は、請求項7記載の
音源ベクトル生成装置を雑音符号帳として用い、前記雑
音符号帳で雑音音源情報をベクトル量子化することによ
り得られ、かつ、パルス位置、パルス極性、拡散パタン
を特定するインデクスを雑音符号番号とすることを特徴
とするCELP音声符号化装置/復号化装置であり、C
ELP音声符号化装置/復号化装置における雑音音源情
報を上記雑音符号番号の伝送によって行うことができる
という作用を有する。
According to an eighth aspect of the present invention, the excitation vector generating apparatus according to the seventh aspect is used as a noise codebook, and the noise excitation information is obtained by vector-quantizing the noise excitation information, and a pulse position is obtained. , A pulse polarity, and an index for specifying a spreading pattern are used as noise code numbers.
This has the effect that the noise source information in the ELP speech encoder / decoder can be transmitted by transmitting the noise code number.

【0037】請求項9に記載の発明は、拡散パタン格納
・選択部において、各チャネルで選択された拡散パタン
の組合せを示す組合せ番号を、雑音音源情報をベクトル
量子化した際に生じる量子化歪みが最小化されるよう
に、拡散パタンのとりうるM^N通りの全組合せ中から
閉ループで特定することを特徴とする請求項8記載のC
ELP音声符号化装置/復号化装置であり、拡散パタン
の全組合せ(M^N通り)の中から符号化歪みを最小化
する組合せ番号を選択できるため、品質の高い合成音声
が得られるという作用を有する。
According to a ninth aspect of the present invention, in the spreading pattern storage / selection unit, the combination number indicating the combination of the spreading patterns selected in each channel is determined by a quantization distortion generated when the noise source information is vector-quantized. 9. A method according to claim 8, wherein the combination is specified in a closed loop from all M ^ N possible combinations of the diffusion pattern so that is minimized.
An ELP speech encoding / decoding apparatus that can select a combination number that minimizes encoding distortion from all combinations of diffusion patterns (M 拡 散 N ways), so that high-quality synthesized speech can be obtained. Having.

【0038】請求項10に記載の発明は、拡散パタン格
納・選択部において、各チャネルで選択された拡散パタ
ンの組合せを示す組合せ番号を、雑音音源情報のベクト
ル量子化した際に生じる量子化歪みが最小化されるよう
に、あらかじめ求まっている音声パラメータを用いて拡
散パタンの組合せの予備選択を行い、前記予備選択され
た拡散パタンの組合せの中から特定することを特徴とす
る請求項8記載のCELP音声符号化装置/復号化装置
であり、予備選択の導入により、雑音音源情報のベクト
ル量子化を少い演算量で効率よく行えるという作用を有
する。
According to a tenth aspect of the present invention, in the spreading pattern storage / selection section, quantization distortion generated when the combination number indicating the combination of the spreading patterns selected in each channel is subjected to vector quantization of the noise source information. 9. Preliminarily selecting a combination of diffusion patterns using speech parameters determined in advance so that is minimized, and specifying from among the combinations of preselected diffusion patterns. CELP speech coding / decoding device, which has the effect of efficiently performing vector quantization of noise source information with a small amount of computation by introducing preliminary selection.

【0039】請求項11に記載の発明は、拡散パタン格
納・選択部が、音声区間の分析結果によって、予備選択
する拡散パタンの組合せを切り替えることを特徴とする
請求項10記載のCELP音声符号化装置であり、拡散
パタンの全組合せ番号についての歪み計算をする必要が
なくなるため、雑音音源情報のベクトル量子化処理を少
い演算量で効率的に行うことができるという作用を有す
る。
According to the eleventh aspect of the present invention, the CELP speech coding apparatus according to the tenth aspect, wherein the diffusion pattern storage / selection unit switches the combination of the diffusion patterns to be preliminarily selected according to the analysis result of the speech section. Since the apparatus does not need to calculate distortion for all combination numbers of the diffusion pattern, it has an effect that vector quantization processing of noise source information can be efficiently performed with a small amount of calculation.

【0040】請求項12に記載の発明は、音声区間の分
析結果が、雑音音源情報をベクトル量子化する時点で既
に抽出もしくは決定されている音声パラメータであるこ
とを特徴とする請求項11記載のCELP音声符号化装
置であり、拡散パタンの全組合せ番号についての歪み計
算をする必要がなくなるため、雑音符号番号の特定を少
い演算量で効率的に行うことができるという作用を有す
る。
According to a twelfth aspect of the present invention, the analysis result of the voice section is a voice parameter which has already been extracted or determined at the time of vector quantization of the noise source information. Since this is a CELP speech coding apparatus, there is no need to perform distortion calculation for all combination numbers of a spreading pattern, so that the noise code number can be specified efficiently with a small amount of calculation.

【0041】請求項13に記載の発明は、拡散パタン格
納・選択部内の各チャネルにおいて、全ての拡散パタン
が、雑音音源情報をベクトル量子化した際に生じる量子
化歪みをより小さくするように予め学習して得られた拡
散パタンであることを特徴とする請求項8記載のCEL
P音声符号化装置/復号化装置であり、雑音音源情報を
符号化した際に生じる符号化歪みを代数的音源を雑音符
号帳に用いた場合よりも小さくできるという作用を有す
る。
According to a thirteenth aspect of the present invention, in each channel in the spreading pattern storage / selection unit, all the spreading patterns are set in advance so as to reduce quantization distortion generated when the noise source information is vector-quantized. 9. The CEL according to claim 8, wherein the CEL is a diffusion pattern obtained by learning.
This is a P-speech encoding device / decoding device, and has an effect that encoding distortion generated when encoding noise excitation information can be made smaller than when an algebraic excitation is used for a noise codebook.

【0042】請求項14に記載の発明は、拡散パタン格
納・選択部内の各チャネルにおいて、拡散パタンのうち
少なくとも1種類が、雑音音源情報をベクトル量子化し
た際に生じる量子化歪みをより小さくするように予め学
習して得られた拡散パタンであることを特徴とする請求
項8記載のCELP音声符号化装置/復号化装置であ
り、量子化歪みを小さくできるような拡散パタンの形状
(特性)を反映させた音源ベクトルあるいは形状を反映
させない音源ベクトルを、音声信号の短時間的特徴に応
じて利用できるようになり、品質の高い合成音声を得ら
れるという作用を有する。
According to a fourteenth aspect of the present invention, in each channel in the spreading pattern storage / selection unit, at least one of the spreading patterns reduces quantization distortion caused when the noise source information is vector-quantized. 9. The CELP speech encoding device / decoding device according to claim 8, wherein the diffusion pattern is obtained by learning in advance as described above, and the shape (characteristic) of the diffusion pattern that can reduce quantization distortion. The sound source vector that reflects the sound or the sound source vector that does not reflect the shape can be used according to the short-time characteristics of the audio signal, and has an effect that a high-quality synthesized speech can be obtained.

【0043】請求項15に記載の発明は、拡散パタン格
納・選択部内の各チャネルにおいて、拡散パタンのうち
少なくとも1種類が、乱数ベクトル系列により形成され
るランダムパタンであることを特徴とする請求項8記載
のCELP音声符号化装置/復号化装置であり、ランダ
ムな形状(特性)を反映させた音源ベクトル、もしく
は、それ以外の形状(特性)を反映させた音源ベクトル
を、音声信号の短時間的特徴に応じて利用できるように
なり、品質の高い合成音声を得られるという作用を有す
る。
According to a fifteenth aspect of the present invention, in each channel in the spreading pattern storage / selection unit, at least one of the spreading patterns is a random pattern formed by a random number vector sequence. 8. The CELP speech encoding apparatus / decoding apparatus according to claim 8, wherein the excitation vector reflecting a random shape (characteristic) or the excitation vector reflecting another shape (characteristic) is converted into a short time of the audio signal. It can be used according to the characteristic feature, and has an effect that a high-quality synthesized speech can be obtained.

【0044】請求項16に記載の発明は、拡散パタン格
納・選択部内の各チャネルにおいて、拡散パタンのうち
少なくとも1種類が、雑音音源情報をベクトル量子化す
る際に生じる量子化歪みをより小さくするように予め学
習して得られた拡散パタンであり、かつ、少くとも1種
類がランダムパタンであることを特徴とする請求項8記
載のCELP音声符号化装置/復号化装置であり、量子
化歪みを小さくするような形状(特性)を反映させた音
源ベクトルもしくは、ランダムな形状(特性)を反映さ
せた音源ベクトルを、音声信号の短時間的特徴に応じて
利用できるようになり、品質の高い合成音声を得ること
ができるという作用を有する。
According to a sixteenth aspect of the present invention, in each channel in the spreading pattern storage / selection unit, at least one of the spreading patterns further reduces quantization distortion generated when vectorizing noise source information. 9. The CELP speech encoding apparatus / decoding apparatus according to claim 8, wherein the diffusion pattern is a learning pattern obtained by learning in advance, and at least one type is a random pattern. A sound source vector reflecting a shape (characteristic) or a random shape (characteristic) that reduces the size of the sound signal can be used according to the short-time characteristics of the audio signal, and high quality is achieved. This has the effect that synthesized speech can be obtained.

【0045】請求項17に記載の発明は、拡散パタン格
納・選択部において、各チャネルで選択された拡散パタ
ンの組合せを示す組合せ番号を、雑音音源情報をベクト
ル量子化した際に生じる量子化歪みが最小化されるよう
に、拡散パタンのとりうるM^N通りの全組合せ中から
閉ループで特定することを特徴とする請求項13、1
4、16のいずれかに記載のCELP音声符号化装置/
復号化装置であり、拡散パタンの全組合せ(M^N通
り)の中から符号化歪みを最小化する組合せ番号を選択
できるため、品質の高い合成音声が得られるという作用
を有する。
According to a seventeenth aspect of the present invention, in the spreading pattern storage / selection unit, the combination number indicating the combination of the spreading patterns selected in each channel is set to a quantization distortion generated when the noise source information is vector-quantized. 13. The method according to claim 13, further comprising specifying a closed loop from all M ^ N possible combinations of the diffusion pattern so that is minimized.
The CELP speech encoding device according to any one of Claims 4 and 16,
Since the decoding device is capable of selecting a combination number that minimizes coding distortion from all combinations of diffusion patterns (M 拡 散 N), it has an effect that a high-quality synthesized speech can be obtained.

【0046】請求項18に記載の発明は、拡散パタン格
納・選択部において、各チャネルで選択された拡散パタ
ンの組合せを示す組合せ番号を、雑音音源情報のベクト
ル量子化した際に生じる量子化歪みが最小化されるよう
に、あらかじめ求まっている音声パラメータを用いて拡
散パタンの組合せの予備選択を行い、前記予備選択され
た拡散パタンの組合せの中から特定することを特徴とす
る請求項13、14、16のいずれかに記載のCELP
音声符号化装置/復号化装置であり、予備選択の導入に
より、雑音音源情報のベクトル量子化を少い演算量で効
率よく行えるという作用を有する。
According to an eighteenth aspect of the present invention, in the spreading pattern storage / selection unit, the combination number indicating the combination of the spreading patterns selected in each channel is subjected to quantization distortion generated when the noise source information is vector-quantized. The method according to claim 13, wherein a preliminary selection of a combination of diffusion patterns is performed by using a previously determined voice parameter so as to minimize the combination of the diffusion patterns. CELP according to any one of 14 and 16,
This is a speech encoding / decoding device, and has an effect that by introducing preliminary selection, vector quantization of noise source information can be efficiently performed with a small amount of computation.

【0047】請求項19に記載の発明は、拡散パタン格
納・選択部が、音声区間の分析結果によって、予備選択
する拡散パタンの組合せを切り替えることを特徴とする
請求項18記載のCELP音声符号化装置であり、拡散
パタンの全組合せ番号についての歪み計算をする必要が
なくなるため、雑音音源情報のベクトル量子化処理を少
い演算量で効率的に行うことができるという作用を有す
る。
The invention according to claim 19, wherein the diffusion pattern storage / selection unit switches the combination of the diffusion patterns to be preselected according to the analysis result of the speech section. Since the apparatus does not need to calculate distortion for all combination numbers of the diffusion pattern, it has an effect that vector quantization processing of noise source information can be efficiently performed with a small amount of calculation.

【0048】請求項20に記載の発明は、音声区間の分
析結果が、雑音音源情報をベクトル量子化する時点で既
に抽出もしくは決定されている音声パラメータであるこ
とを特徴とする請求項19記載のCELP音声符号化装
置であり、拡散パタンの全組合せ番号についての歪み計
算をする必要がなくなるため、雑音符号番号の特定を少
い演算量で効率的に行うことができるという作用を有す
る。
According to a twentieth aspect of the present invention, the analysis result of the voice section is a voice parameter that has been already extracted or determined at the time of vector quantization of the noise source information. Since this is a CELP speech coding apparatus, there is no need to perform distortion calculation for all combination numbers of a spreading pattern, so that the noise code number can be specified efficiently with a small amount of calculation.

【0049】請求項21に記載の発明は、拡散パタン格
納・選択部において、各チャネルで選択された拡散パタ
ンの組合せを示す組合せ番号を、雑音音源情報をベクト
ル量子化した際に生じる量子化歪みが最小化されるよう
に、拡散パタンのとりうるM^N通りの全組合せ中から
閉ループで特定することを特徴とする請求項15記載の
CELP音声符号化装置/復号化装置であり、拡散パタ
ンの全組合せ(M^N通り)の中から符号化歪みを最小
化する組合せ番号を選択できるため、品質の高い合成音
声が得られるという作用を有する。
According to a twenty-first aspect of the present invention, in the spreading pattern storage / selection unit, the combination number indicating the combination of the spreading patterns selected in each channel is determined by the quantization distortion generated when the noise source information is vector-quantized. 16. The CELP speech encoding apparatus / decoding apparatus according to claim 15, wherein the combination is specified in a closed loop from all M ^ N possible combinations of spreading patterns so that is minimized. Can be selected from among all combinations (M ^ N combinations) of, so that a high-quality synthesized speech can be obtained.

【0050】請求項22に記載の発明は、拡散パタン格
納・選択部において、各チャネルで選択された拡散パタ
ンの組合せを示す組合せ番号を、雑音音源情報のベクト
ル量子化した際に生じる量子化歪みが最小化されるよう
に、あらかじめ求まっている音声パラメータを用いて拡
散パタンの組合せの予備選択を行い、前記予備選択され
た拡散パタンの組合せの中から特定することを特徴とす
る請求項15記載のCELP音声符号化装置/復号化装
置であり、予備選択の導入により、雑音音源情報のベク
トル量子化を少い演算量で効率よく行えるという作用を
有する。
According to a twenty-second aspect of the present invention, in the spreading pattern storage / selection unit, a quantization distortion generated when the combination number indicating the combination of the spreading patterns selected in each channel is vector-quantized of the noise source information. 16. The method according to claim 15, further comprising: performing a preliminary selection of a combination of the diffusion patterns using a voice parameter obtained in advance so as to minimize the combination of the diffusion patterns. CELP speech coding / decoding device, which has the effect of efficiently performing vector quantization of noise source information with a small amount of computation by introducing preliminary selection.

【0051】請求項23に記載の発明は、拡散パタン格
納・選択部が、音声区間の分析結果によって、予備選択
する拡散パタンの組合せを切り替えることを特徴とする
請求項22記載のCELP音声符号化装置であり、拡散
パタンの全組合せ番号についての歪み計算をする必要が
なくなるため、雑音音源情報のベクトル量子化処理を少
い演算量で効率的に行うことができるという作用を有す
る。
According to a twenty-third aspect of the present invention, the spread pattern storage / selection unit switches a combination of preliminarily selected spread patterns according to a result of analysis of a speech section. Since the apparatus does not need to calculate distortion for all combination numbers of the diffusion pattern, it has an effect that vector quantization processing of noise source information can be efficiently performed with a small amount of calculation.

【0052】請求項24に記載の発明は、音声区間の分
析結果が、雑音音源情報をベクトル量子化する時点で既
に抽出もしくは決定されている音声パラメータであるこ
とを特徴とする請求項23記載のCELP音声符号化装
置であり、拡散パタンの全組合せ番号についての歪み計
算をする必要がなくなるため、雑音符号番号の特定を少
い演算量で効率的に行うことができるという作用を有す
る。
According to a twenty-fourth aspect of the present invention, the analysis result of the voice section is a voice parameter that has already been extracted or determined at the time when the noise source information is vector-quantized. Since this is a CELP speech coding apparatus, there is no need to perform distortion calculation for all combination numbers of a spreading pattern, so that the noise code number can be specified efficiently with a small amount of calculation.

【0053】請求項25に記載の発明は、適応音源情報
をベクトル量子化した時に算出された理想適応符号ゲイ
ンの値と予め設定しておいたしきい値との大小関係を比
較する適応ゲイン判定部を有し、前記理想適応符号ゲイ
ンの値が予め設定しておいたしきい値より大きい時に
は、学習によって得られた拡散パタンを選択することを
特徴とする請求項13,14,16,17,18,1
9,20のいずれかに記載のCELP音声符号化装置で
あり、合成音声の品質を高められるという作用を有す
る。
According to a twenty-fifth aspect of the present invention, there is provided an adaptive gain determining section for comparing a magnitude relation between a value of an ideal adaptive code gain calculated when adaptive excitation information is vector-quantized and a preset threshold value. 19. The spread pattern obtained by learning is selected when the value of the ideal adaptive code gain is larger than a preset threshold value. , 1
A CELP speech encoding device according to any one of claims 9 and 20, which has an effect of improving the quality of synthesized speech.

【0054】請求項26に記載の発明は、適応符号番号
を特定した際に生じた符号化歪みのパワと予め設定して
おいたしきい値との大小関係を比較する歪みパワ判定部
を有し、前記符号化歪みのパワが予め設定しておいたし
きい値より大きい時には、ランダムパタンの拡散ベクト
ルを選択することを特徴とする請求項15,21,2
2,23,24のいずれかに記載のCELP音声符号化
装置であり、音声信号内の周期性の弱い区間に対しては
ランダム的な音源ベクトルを利用できるようになるの
で、合成音声(特に、ノイズ区間など)の品質を向上さ
せることができるという作用を有する。
According to a twenty-sixth aspect of the present invention, there is provided a distortion power judging section for comparing the magnitude relation between the power of coding distortion generated when an adaptive code number is specified and a preset threshold value. 15. The spread vector of a random pattern is selected when the power of the coding distortion is larger than a preset threshold value.
2, 23, and 24, wherein a random excitation vector can be used for a section having a weak periodicity in an audio signal. (E.g., a noise section).

【0055】請求項27に記載の発明は、請求項1,
2,3,6,7のいずれかに記載の音源ベクトル生成装
置を有することを特徴とする音声信号通信システムであ
り、前記音源ベクトル生成装置の有する作用を備えた音
声信号通信システムを構成することができる。
According to the twenty-seventh aspect of the present invention,
A sound signal communication system comprising the sound source vector generation device according to any one of 2, 3, 6, and 7, wherein the sound signal communication system has an operation of the sound source vector generation device. Can be.

【0056】請求項28に記載の発明は、請求項4,
5,8から26のいずれかに記載のCELP音声符号化
装置を有することを特徴とする音声信号通信システムで
あり、前記CELP音声符号化装置の有する作用を備え
た音声信号通信システムを構成することができる。
According to the twenty-eighth aspect of the present invention,
A speech signal communication system comprising the CELP speech encoding device according to any one of claims 5, 8 to 26, which constitutes a speech signal communication system having an operation of the CELP speech encoding device. Can be.

【0057】請求項29に記載の発明は、請求項4,
5,8から10,13から18,21,22のいずれか
に記載のCELP音声復号化装置を有することを特徴と
する音声信号通信システムであり、前記CELP音声復
号化装置の有する作用を備えた音声信号通信システムを
構成することができる。
According to the twenty-ninth aspect of the present invention,
A speech signal communication system comprising the CELP speech decoding device according to any one of 5, 8 to 10, 13 to 18, 21 and 22. The speech signal communication system has an operation of the CELP speech decoding device. An audio signal communication system can be configured.

【0058】請求項30に記載の発明は、請求項1,
2,3,6,7のいずれかに記載の音源ベクトル生成装
置を有することを特徴とする音声信号記録システムであ
り、前記音源ベクトル生成装置の有する作用を備えた音
声信号記録システムを構成することができる。
The invention according to claim 30 is based on claim 1,
An audio signal recording system comprising the sound source vector generation device according to any one of 2, 3, 6, and 7, wherein the audio signal recording system has an operation of the sound source vector generation device. Can be.

【0059】請求項31に記載の発明は、請求項4,
5,8から26のいずれかに記載のCELP音声符号化
装置を有することを特徴とする音声信号記録システムで
あり、前記CELP音声符号化装置の有する作用を備え
た音声信号記録システムを構成することができる。
The invention according to claim 31 is based on claim 4,
An audio signal recording system comprising the CELP audio encoding device according to any one of 5, 8 to 26, wherein the audio signal recording system has an operation of the CELP audio encoding device. Can be.

【0060】請求項32に記載の発明は、請求項4,
5,8から10,13から18,21,22のいずれか
に記載のCELP音声復号化装置を有することを特徴と
する音声信号記録システムであり、前記CELP音声復
号化装置の有する作用を備えた音声信号記録システムを
構成することができる。
[0060] The invention described in claim 32 is the fourth invention.
An audio signal recording system comprising the CELP audio decoding device according to any one of 5, 8 to 10, 13 to 18, 21, and 22, which has the function of the CELP audio decoding device. An audio signal recording system can be configured.

【0061】以下、本発明の実施の実施の形態につい
て、図1から図5を用いて説明する。 (実施の形態1)図1は本実施の形態における音源ベク
トル生成装置の構成ブロック図を示す。図1において、
101はベクトル軸上のある1要素に極性付き単位パル
スが立ったベクトル(以下:パルスベクトルと呼ぶ)を
生成するチャネルをN個(本実施の形態では、N=3の
場合について説明する)備えたパルスベクトル生成部、
102は前記N個のチャネルごとにM種類(本実施の形
態では、M=2の場合について説明する)の拡散パタン
を格納する機能と、格納したM種類の拡散パタンからあ
る1種類の拡散パタンを選択する機能とを併せ持つ拡散
パタン格納・選択部、103は前記パルスベクトル生成
部101から出力されるパルスベクトルと前記拡散パタ
ン格納・選択部102から選択される拡散パタンとの重
畳演算をチャネルごとに行い、N個の拡散ベクトルを生
成する機能を有するパルスベクトル拡散部、104は前
記パルスベクトル拡散部103により生成されるN個の
拡散ベクトルを加算して音源ベクトルを生成する機能を
有する拡散ベクトル加算部、105は生成された音源ベ
クトルである。なお、本実施の形態では、パルスベクト
ル生成部1が、下記の(表1)記載の規則に従ってN個
(N=3)のパルスベクトルを代数的に生成する場合に
ついて説明する。
Hereinafter, embodiments of the present invention will be described with reference to FIGS. 1 to 5. (Embodiment 1) FIG. 1 is a block diagram showing a configuration of a sound source vector generation apparatus according to the present embodiment. In FIG.
Reference numeral 101 denotes N channels for generating a vector (hereinafter, referred to as a pulse vector) in which a unit pulse with a polarity rises in a certain element on the vector axis (this embodiment describes a case where N = 3). Pulse vector generator,
Reference numeral 102 denotes a function of storing M types of diffusion patterns (in this embodiment, a case where M = 2) for each of the N channels, and one type of diffusion pattern from the stored M types of diffusion patterns. A diffusion pattern storage / selection unit 103 having a function of selecting a pulse pattern output from the pulse vector generation unit 101 and a diffusion pattern selected from the diffusion pattern storage / selection unit 102 for each channel And a pulse vector spreading unit 104 having a function of generating N spreading vectors, and a spreading vector 104 having a function of generating a sound source vector by adding the N spreading vectors generated by the pulse vector spreading unit 103. The adder 105 is a generated sound source vector. In the present embodiment, a case will be described where the pulse vector generation unit 1 algebraically generates N (N = 3) pulse vectors according to the rules described in (Table 1) below.

【0062】[0062]

【表1】 [Table 1]

【0063】以上のように構成された音源ベクトル生成
装置の動作を、図1を用いて説明する。拡散パタン格納
・選択部102は、チャネル毎に2種類ずつ格納した拡
散パタンから1種類ずつ選択し、パルスベクトル拡散部
103へ出力する。ただしここで、選択された拡散パタ
ンの組合せ(組合せ総数:M^N=8通り)に対応し
て、番号が割り当てられることとする。次に、パルスベ
クトル生成部101が、(表1)記載の規則に従い代数
的にパルスベクトルをチャネル数分(本実施の形態では
3個)生成する。
The operation of the sound source vector generation device configured as described above will be described with reference to FIG. The spreading pattern storage / selection unit 102 selects one type from the two types of spreading patterns stored for each channel, and outputs the selected one to the pulse vector spreading unit 103. Here, it is assumed that numbers are assigned corresponding to the selected combinations of the diffusion patterns (total number of combinations: M : N = 8). Next, the pulse vector generation unit 101 algebraically generates pulse vectors for the number of channels (three in this embodiment) according to the rules described in (Table 1).

【0064】パルスベクトル拡散部103は、拡散パタ
ン格納・選択部102で選択された拡散パタンと、パル
スベクトル生成部101で生成されたパルスとを、下記
(数5)による重畳演算に用いて、チャネル毎に拡散ベ
クトルを生成する。
The pulse vector spreading section 103 uses the spreading pattern selected by the spreading pattern storing / selecting section 102 and the pulse generated by the pulse vector generating section 101 in a superposition operation by the following (Equation 5). A spreading vector is generated for each channel.

【0065】[0065]

【数5】 (Equation 5)

【0066】拡散ベクトル加算部104は、パルスベク
トル拡散部103で生成された3個の拡散ベクトルを、
下記(数6)により加算して、音源ベクトル105を生
成する。
The spreading vector adding section 104 adds the three spreading vectors generated by the pulse vector spreading section 103 to
The sound source vector 105 is generated by the addition according to the following (Equation 6).

【0067】[0067]

【数6】 (Equation 6)

【0068】このように構成された音源ベクトル生成装
置では、拡散パタン格納・選択部が選択する拡散パタン
の組合せ方や、パルスベクトル生成部が生成するパルス
ベクトル内のパルスの位置および極性に変化を持たせる
ことで、多様な音源ベクトルを生成することが可能にな
る。そして、このように構成された音源ベクトル生成装
置では、拡散パタン格納・選択部102が選択する拡散
パタンの組合せ方と、パルスベクトル生成部101が生
成するパルスベクトルの形状(パルス位置およびパルス
極性)の組合せ方の2種類の情報に対して、それぞれ1
対1に対応する番号を割り当てておくことが可能であ
る。また、拡散パタン格納・選択部102には、実際の
音源情報をもとに予め学習を行い、その学習の結果得ら
れる拡散パタンを格納しておくことが可能である。
In the sound source vector generation device configured as described above, the change in the combination of the diffusion patterns selected by the diffusion pattern storage / selection unit and the position and polarity of the pulse in the pulse vector generated by the pulse vector generation unit are determined. By having them, it becomes possible to generate various sound source vectors. In the thus configured sound source vector generation apparatus, the combination of the diffusion patterns selected by the diffusion pattern storage / selection unit 102 and the shape of the pulse vector (pulse position and pulse polarity) generated by the pulse vector generation unit 101 1 for each of the two types of information
It is possible to assign a number corresponding to one to one. Further, the diffusion pattern storage / selection unit 102 can perform learning in advance based on actual sound source information and store a diffusion pattern obtained as a result of the learning.

【0069】また、上記音源ベクトル生成装置を音声符
号化装置/復号化装置の音源情報生成部に用いれば、拡
散パタン格納・選択部が選択した拡散パタンの組合せ番
号と、パルスベクトル生成部が生成したパルスベクトル
の組合わせ番号(パルス位置およびパルス極性を特定で
きる)との2種類の番号を伝送することで、雑音音源情
報の伝送を実現できるようになる。
If the above excitation vector generation device is used for the excitation information generation unit of the speech encoding device / decoding device, the combination number of the diffusion pattern selected by the diffusion pattern storage / selection unit and the pulse vector generation unit By transmitting two types of numbers, that is, the combination number of the pulse vector (which can specify the pulse position and the pulse polarity), transmission of noise source information can be realized.

【0070】また、上記のように構成した音源ベクトル
生成部を用いると、代数的に生成したパルス音源を用い
る場合よりも、実際の音源情報に似た形状(特性)の音
源ベクトルを生成することが可能になる。
Further, the use of the sound source vector generation unit configured as described above makes it possible to generate a sound source vector having a shape (characteristic) similar to actual sound source information, compared with the case of using a pulse sound source generated algebraically. Becomes possible.

【0071】なお、本実施の形態では、拡散パタン格納
・選択部102が1チャネルあたり2種類の拡散パタン
を格納している場合について説明したが、各チャネルに
対して2種類以外の拡散パタンを割り当てた場合にも、
同様の作用・効果が得られる。
In this embodiment, a case has been described where the diffusion pattern storage / selection section 102 stores two types of diffusion patterns per channel. However, other than two types of diffusion patterns are stored for each channel. If you do,
Similar functions and effects can be obtained.

【0072】なおまた、本実施の形態では、パルスベク
トル生成部101が3チャネル構成かつ(表1)記載の
パルス生成規則に基づいている場合について説明した
が、チャネル数が異なる場合や、パルス生成規則として
(表1)記載以外のパルス生成規則を用いた場合にも、
同様の作用・効果が得られる。
In this embodiment, the case where pulse vector generation section 101 has a three-channel configuration and is based on the pulse generation rules described in (Table 1) has been described. Even when pulse generation rules other than those described in (Table 1) are used as rules,
Similar functions and effects can be obtained.

【0073】また、上記音源ベクトル生成装置あるいは
音声符号化装置/復号化装置を有する、音声信号通信シ
ステムまたは音声信号記録システムを構成することによ
り、上記音源ベクトル生成装置の有する作用・効果を得
ることができる。
Further, by constituting an audio signal communication system or an audio signal recording system having the above-mentioned excitation vector generation device or the audio encoding / decoding device, the operation and effect of the above-mentioned excitation vector generation device can be obtained. Can be.

【0074】(実施の形態2)図2は本実施の形態にお
けるCELP音声符号化装置の構成ブロック図を示し、
図3はCELP型音声復号化装置の構成ブロック図を示
す。
(Embodiment 2) FIG. 2 is a block diagram showing the configuration of a CELP speech coding apparatus according to this embodiment.
FIG. 3 is a block diagram showing the configuration of the CELP-type speech decoding apparatus.

【0075】図2は、従来のCELP音声符号化装置の
雑音符号帳(図6内の18)に、実施の形態1記載の音
源ベクトル生成装置(図1)を適用したものであり、図
3は、従来のCELP音声符号化装置の雑音符号帳(図
7内の34)に、上記実施の形態1記載の音源ベクトル
生成装置を適用したものである。よって雑音音源情報の
ベクトル量子化処理以外の処理は、従来技術の項に記載
した内容と同様であり、本実施の形態では、図2および
図3における雑音音源情報のベクトル量子化処理を中心
に、音声符号化装置、音声復号化装置の説明を行う。ま
た、実施の形態1と同様に、チャネル数N=3,1チャ
ネルの拡散パタン数M=2,パルスベクトルの生成は
(表1)によるものとする。
FIG. 2 shows a case where the excitation vector generating apparatus (FIG. 1) described in the first embodiment is applied to the noise codebook (18 in FIG. 6) of the conventional CELP speech coding apparatus. Is obtained by applying the excitation vector generation apparatus described in the first embodiment to the noise codebook (34 in FIG. 7) of the conventional CELP speech coding apparatus. Therefore, processes other than the vector quantization process of the noise source information are the same as those described in the section of the related art. In the present embodiment, the vector quantization process of the noise source information in FIGS. , A speech encoding device and a speech decoding device will be described. Further, as in the first embodiment, the number of channels N = 3, the number of diffusion patterns of one channel M = 2, and the generation of the pulse vector is based on (Table 1).

【0076】図2の音声符号化装置における雑音音源情
報のベクトル量子化処理は、(数4)の基準値を最大化
するような2種類の番号(拡散パタンの組合せ番号、パ
ルス位置とパルス極性の組合せ番号)を特定する処理で
ある。図1の音源ベクトル生成装置を雑音符号帳として
用いた場合に、拡散パタンの組合せ番号(8種類)とパ
ルスベクトルの組合せ番号(極性を考慮した場合:16
384種類)を閉ループで特定するためには、拡散パタ
ン格納・選択部215が、まず始めに、自ら格納してい
る2種類の拡散パタンのうち、どちらか一方の拡散パタ
ンを選択し、パルスベクトル拡散部217へ出力する。
その後、パルスベクトル生成部216が、(表1)記載
の規則に従い代数的にパルスベクトルをチャネル数分
(本実施の形態では3個)生成し、パルスベクトル拡散
部217へ出力する。パルスベクトル拡散部217は、
拡散パタン格納・選択部215で選択された拡散パタン
と、パルスベクトル生成部216で生成されたパルスベ
クトルとを、(数5)による重畳演算に用いて、チャネ
ル毎に拡散ベクトルを生成する。拡散ベクトル加算部2
18は、パルスベクトル拡散部217で得られた拡散ベ
クトルを加算して、音源ベクトル(雑音符号ベクトルの
候補となる)を生成する。そして、歪み計算部206
が、拡散ベクトル加算部218で得られた雑音符号ベク
トル候補を用いた(数4)の値を算出する。この(数
4)の値の算出を、(表1)記載の規則によって生成さ
れるパルスベクトルの組合せ全てについて行い、その中
から(数4)の値が最大になる時の拡散パタンの組合せ
番号、パルスベクトルの組合せ番号(パルス位置とその
極性の組合せ)、およびその時の最大値を符号番号特定
部213へ出力する。
In the vector quantization process of the noise source information in the speech encoding apparatus of FIG. 2, two types of numbers (a combination number of a diffusion pattern, a pulse position and a pulse polarity) are set so as to maximize the reference value of (Equation 4). (Combination number). When the excitation vector generation apparatus of FIG. 1 is used as a noise codebook, the combination number (8 types) of the diffusion pattern and the combination number of the pulse vector (when the polarity is considered: 16)
384 types) in a closed loop, the diffusion pattern storage / selection unit 215 first selects one of the two types of diffusion patterns stored by itself, and generates a pulse vector. Output to the diffusion unit 217.
After that, the pulse vector generation unit 216 algebraically generates pulse vectors for the number of channels (three in this embodiment) according to the rules described in (Table 1), and outputs the generated pulse vectors to the pulse vector spreading unit 217. The pulse vector spreading section 217
A diffusion vector is generated for each channel by using the diffusion pattern selected by the diffusion pattern storage / selection unit 215 and the pulse vector generated by the pulse vector generation unit 216 in a superposition operation by (Equation 5). Diffusion vector adder 2
Reference numeral 18 adds a diffusion vector obtained by the pulse vector spreading section 217 to generate a sound source vector (a candidate for a noise code vector). Then, the distortion calculation unit 206
Calculates the value of (Equation 4) using the noise code vector candidate obtained by the spreading vector addition unit 218. The calculation of the value of (Equation 4) is performed for all combinations of pulse vectors generated according to the rules described in (Table 1), and the combination number of the diffusion pattern when the value of (Equation 4) is maximized from among them , The combination number of the pulse vector (combination of the pulse position and its polarity) and the maximum value at that time are output to the code number specifying unit 213.

【0077】次に、拡散パタン格納・選択部215は、
格納している拡散パタンから、先ほどと異なる組合せの
拡散パタンを選択する。そして新たに選択しなおした拡
散パタンの組合せについて、上記と同様に(表1)の規
則に従ってパルスベクトル生成部216で生成されるパ
ルスベクトルの全組合せについて、(数4)の値を算出
する。そして、その中から、(数4)を最大にする時
の、拡散パタンの組合せ番号、パルスベクトルの組合せ
番号、および最大値を符号番号特定部213へ再度出力
する。
Next, the diffusion pattern storage / selection unit 215
From the stored diffusion patterns, a different combination of diffusion patterns is selected. Then, for the newly selected combination of diffusion patterns, the value of (Equation 4) is calculated for all combinations of pulse vectors generated by the pulse vector generation unit 216 according to the rules of (Table 1) in the same manner as described above. Then, from among them, the combination number of the diffusion pattern, the combination number of the pulse vector, and the maximum value when maximizing (Equation 4) are output to the code number specifying unit 213 again.

【0078】この処理を、拡散パタン格納・選択部21
5が格納している拡散パタンから選択できる全組合せ
(本実施の形態の説明では、組合せ総数は8)について
繰り返す。
This processing is performed by the diffusion pattern storage / selection unit 21
5 is repeated for all combinations that can be selected from the diffusion patterns stored (the total number of combinations is 8 in the description of the present embodiment).

【0079】符号番号特定部213は、歪み計算部20
6によって算出されたトータル8個の最大値を比較し、
その中から一番大きいものを選択し、その最大値を生成
した時の2種類の組合せ番号(拡散パタンの組合せ番
号、パルスベクトルの組合せ番号)を特定し、雑音符号
番号として符号出力部214へ出力する。
The code number specifying section 213 is provided for the distortion calculating section 20.
Compare the maximum value of a total of 8 calculated by 6
The largest one is selected from them, and two kinds of combination numbers (combination number of the diffusion pattern and combination number of the pulse vector) at the time when the maximum value is generated are specified, and are sent to the code output unit 214 as the noise code number. Output.

【0080】一方、図3の音声復号化装置では、符号入
力部301が、音声符号化装置(図2)から送信される
符号を受信し、受信した符号を対応する線形予測符号番
号と、適応符号番号、雑音符号番号(拡散パタンの組合
せ番号、パルスベクトルの組合せ番号の2種類から構成
されている)、および重み符号番号に分解し、分解して
得られた符号をそれぞれ、線形予測係数復号化部30
2、適応符号帳303、雑音符号帳304、重み符号帳
305へ出力する。なおここで、雑音符号番号のうち、
拡散パタンの組合せ番号は拡散パタン格納・選択部31
1へ出力され、パルスベクトルの組合せ番号はパルスベ
クトル生成部312へ出力されるものとする。
On the other hand, in the speech decoding apparatus shown in FIG. 3, code input section 301 receives a code transmitted from speech encoding apparatus (FIG. 2), and converts the received code into a corresponding linear prediction code number and an adaptive linear prediction code number. A code number, a noise code number (consisting of two types, a combination number of a spreading pattern and a combination number of a pulse vector), and a weighting code number, and codes obtained by the decomposition are respectively decoded by linear prediction coefficients. Conversion part 30
2. Output to adaptive codebook 303, noise codebook 304, and weight codebook 305. Here, among the noise code numbers,
The combination number of the diffusion pattern is stored in the diffusion pattern storage / selection unit 31.
1, and the combination number of the pulse vector is output to the pulse vector generation unit 312.

【0081】そして、線形予測係数復号化部302が線
形予測符号番号を復号化して合成フィルタの係数を得、
合成フィルタ309へ出力する。適応符号帳303で
は、適応符号番号と対応する位置から適応符号ベクトル
が読みだされる。
Then, the linear prediction coefficient decoding unit 302 decodes the linear prediction code number to obtain the coefficients of the synthesis filter,
Output to the synthesis filter 309. In the adaptive codebook 303, an adaptive code vector is read from a position corresponding to the adaptive code number.

【0082】雑音符号帳304では、拡散パタン格納・
選択部311が拡散パルスの組合せ番号に対応する拡散
パタンをチャネル毎に読みだしてパルスベクトル拡散部
313へ出力し、パルスベクトル生成部312がパルス
ベクトルの組合せ番号に対応したパルスベクトルをチャ
ネル数分生成してパルスベクトル拡散部313へ出力
し、パルスベクトル拡散部313が拡散パタン格納・選
択部311から受けた拡散パタンとパルスベクトル生成
部312から受けたパルスベクトルとを(数5)記載の
重畳演算に用いて拡散ベクトルを生成し、拡散ベクトル
加算部314へ出力する。拡散ベクトル加算部314が
パルスベクトル拡散部313で生成した各チャネルの拡
散ベクトルを加算して雑音符号ベクトルを生成する。
In the noise codebook 304, the storage of the diffusion pattern
The selecting unit 311 reads out a spreading pattern corresponding to the combination number of the spreading pulse for each channel, and outputs it to the pulse vector spreading unit 313. The pulse vector generating unit 312 converts the pulse vector corresponding to the combination number of the pulse vector into the number of channels. The pulse pattern is generated and output to the pulse vector spreading unit 313. The pulse vector spreading unit 313 superimposes the diffusion pattern received from the diffusion pattern storage / selection unit 311 and the pulse vector received from the pulse vector generation unit 312 according to (Equation 5). A diffusion vector is generated using the calculation and output to the diffusion vector addition unit 314. The spreading vector adding section 314 adds the spreading vector of each channel generated by the pulse vector spreading section 313 to generate a noise code vector.

【0083】そして、重み符号帳305から重み符号番
号と対応した適応符号ゲインと雑音符号ゲインが読みだ
され、適応符号ベクトル重付け部306において適応符
号ベクトルに適応符号ゲインが乗じられ、同様に雑音符
号ベクトル重付け部307において雑音符号ベクトルに
雑音符号ゲインが乗じられ、加算部308へ送られる。
加算部308は、ゲインが乗じられた上記2つの符号ベ
クトルを加算して駆動音源ベクトルを生成し、生成した
駆動音源ベクトルを、バッファ更新のために適応符号帳
303へ、また、合成フィルタを駆動するために合成フ
ィルタ309へと出力する。
Then, the adaptive code gain and the noise code gain corresponding to the weight code number are read out from the weight codebook 305, and the adaptive code vector weighting unit 306 multiplies the adaptive code vector by the adaptive code gain. The code vector weighting unit 307 multiplies the noise code vector by the noise code gain and sends the result to the addition unit 308.
The adder 308 adds the two code vectors multiplied by the gain to generate a driving excitation vector, and transmits the generated driving excitation vector to the adaptive codebook 303 for updating the buffer, and also drives the synthesis filter. Output to the synthesis filter 309 in order to perform the processing.

【0084】合成フィルタ309は、加算部308で得
られた駆動音源ベクトルで駆動され、合成音声310を
再生する。また適応符号帳303は、加算部308より
受けた駆動音源ベクトルでバッファを更新する。
The synthesis filter 309 is driven by the driving sound source vector obtained by the adding section 308, and reproduces the synthesized speech 310. Adaptive codebook 303 updates the buffer with the driving excitation vector received from adding section 308.

【0085】ただし、図2および図3内の拡散パタン格
納・選択部には、(数6)記載の音源ベクトルを(数
2)内のcに代入した下記(数7)の歪み評価基準式を
コスト関数とし、当該コスト関数の値がより小さくなる
ように予め学習して得られた拡散パタンが各チャネル毎
に格納されているものとする。このようにすることで、
実際の雑音音源情報((数4)内のベクトルx)の形状
と類似した形状の音源ベクトルを生成することができる
ようになるため、代数的音源ベクトル生成部を雑音符号
帳に用いたCELP音声符号化装置/復号化装置より
も、品質の高い合成音声を得ることが可能になる。
However, in the diffusion pattern storage / selection unit in FIGS. 2 and 3, the sound source vector described in (Equation 6) is substituted for c in (Equation 2), and the following distortion evaluation criterion equation (Equation 7) is used. Is a cost function, and it is assumed that a diffusion pattern obtained by learning in advance so that the value of the cost function becomes smaller is stored for each channel. By doing this,
Since it becomes possible to generate a source vector having a shape similar to the shape of actual noise source information (vector x in (Equation 4)), CELP speech using an algebraic source vector generator for a noise codebook It is possible to obtain higher quality synthesized speech than the encoder / decoder.

【0086】[0086]

【数7】 (Equation 7)

【0087】なお、本実施の形態では、拡散パタン格納
・選択部が、(数7)記載のコスト関数の値をより小さ
くするように予め学習して得られた拡散パタンをチャネ
ル毎にM個ずつ格納しておいた場合について説明した
が、実際にはM個の拡散パタン全てが学習によって得ら
れたものである必要はなく、学習によって得られた拡散
パタンを各チャネル毎に少くとも1種類格納しておくよ
うにすれば、そのような場合にも合成音声の品質を向上
させる作用・効果を得ることができる。
In the present embodiment, the diffusion pattern storage / selection unit selects M diffusion patterns obtained by learning in advance so as to make the value of the cost function described in (Equation 7) smaller, for each channel. Although the case where each of them is stored has been described, in practice, it is not necessary that all M diffusion patterns are obtained by learning, and at least one type of diffusion pattern obtained by learning is provided for each channel. If stored, the operation and effect of improving the quality of synthesized speech can be obtained even in such a case.

【0088】なおまた、本実施の形態では、拡散パタン
格納・選択部が格納する拡散パタンの全組合せ、およ
び、パルスベクトル生成部6が生成するパルスベクトル
の位置候補の全組合せから、(数4)の基準値を最大化
する組合せ番号を閉ループで特定する場合について説明
したが、雑音符号帳の番号特定以前に求めたパラメータ
(適応符号ベクトルの理想ゲインなど)を基に予備選択
を行ったり、開ループで探索するなどしても同様の作用
・効果を得ることができる。
Further, in this embodiment, (Equation 4) is obtained from all combinations of diffusion patterns stored by the diffusion pattern storage / selection unit and all combinations of pulse vector position candidates generated by the pulse vector generation unit 6. ) Is described in the case of specifying the combination number that maximizes the reference value in a closed loop, but the preliminary selection is performed based on the parameters (such as the ideal gain of the adaptive code vector) obtained before the identification of the random codebook number, Similar functions and effects can be obtained by searching in an open loop.

【0089】また、上記音声符号化装置/復号化装置を
有する、音声信号通信システムまたは音声信号記録シス
テムを構成することにより、実施の形態1で記載した音
源ベクトル生成装置の有する作用・効果を得ることがで
きる。
Further, by constituting an audio signal communication system or an audio signal recording system having the audio encoding / decoding device, the operation and effect of the sound source vector generating device described in the first embodiment can be obtained. be able to.

【0090】(実施の形態3)図4は本実施の形態にお
けるCELP音声符号化装置の構成ブロック図である。
(Embodiment 3) FIG. 4 is a block diagram showing the configuration of a CELP speech coding apparatus according to the present embodiment.

【0091】図4は、実施の形態1の音源ベクトル生成
装置(図1)を雑音符号帳に用いたCELP音声符号化
装置において、雑音符号帳を探索する以前に求まってい
る理想適応符号ゲインの値を用いて、拡散パタン格納・
選択部に格納された拡散パタンの予備選択を行う方法を
説明するための図であり、雑音符号帳周辺部以外は図2
記載のCELP音声符号化装置と同一である。よって本
実施の形態の説明は、図4記載のCELP音声符号化装
置における雑音音源情報のベクトル量子化処理について
の説明にとどめる。
FIG. 4 shows a CELP speech coding apparatus using the excitation vector generating apparatus (FIG. 1) according to the first embodiment as a random codebook, and the ideal adaptive code gain obtained before searching for the random codebook. Using the value to store the diffusion pattern
FIG. 4 is a diagram for explaining a method of performing preliminary selection of a diffusion pattern stored in a selection unit, and FIG.
This is the same as the described CELP speech coding apparatus. Therefore, the description of the present embodiment is limited to the description of the vector quantization process of the noise source information in the CELP speech coding apparatus shown in FIG.

【0092】図4において、407は適応符号帳、40
9は適応符号ゲイン重み付け部、408は実施の形態1
で説明した音源ベクトル生成装置によって構成された雑
音符号帳、410は雑音符号ゲイン重み付け部、405
は合成フィルタ、406は歪み計算部、413は符号番
号特定部、415は拡散パタン格納・選択部、416は
パルスベクトル生成部、417はパルスベクトル拡散
部、418は拡散ベクトル加算部、419は適応ゲイン
判定部である。ただし、本実施の形態において、上記拡
散パタン格納・選択部415が格納する格納するM種類
(M≧2)の拡散パタンのうちすくなくとも1種類は、
雑音音源情報をベクトル量子化する際に生じる量子化歪
みをより小さくするように予め学習し、当該学習の結果
得られた拡散パタンであることとする。
In FIG. 4, reference numeral 407 denotes an adaptive codebook;
9 is an adaptive code gain weighting unit, and 408 is the first embodiment.
The noise codebook 410 constituted by the excitation vector generation apparatus described in (1), 410 is a noise code gain weighting unit, 405
Is a synthesis filter, 406 is a distortion calculation unit, 413 is a code number specifying unit, 415 is a spreading pattern storage / selection unit, 416 is a pulse vector generation unit, 417 is a pulse vector spreading unit, 418 is a spreading vector addition unit, and 419 is adaptive. It is a gain determination unit. However, in the present embodiment, at least one of the M types (M ≧ 2) of the diffusion patterns stored by the diffusion pattern storage / selection unit 415 is:
Learning is performed in advance so as to reduce the quantization distortion generated when the noise source information is vector-quantized, and the diffusion pattern is obtained as a result of the learning.

【0093】本実施の形態では、説明簡単化のため、パ
ルスベクトル生成部のチャネル数Nは3、拡散パタン格
納・選択部が格納しているチャネルあたりの拡散パルス
の種類数Mは2とし、さらに、M種類(M=2)の拡散
パタンは、1つが上記学習によって得られた拡散パタン
であり、もう一方は、乱数ベクトル生成装置によって生
成される乱数ベクトル列(以下:ランダムパタンと呼
ぶ)である場合として説明を行う。ちなみに、上記学習
によって得られる拡散パタンは、図1内のw11の様に、
長さは比較的短く、パルス的な形状の拡散パタンになる
ことがわかっている。
In this embodiment, for simplicity of explanation, the number of channels N of the pulse vector generation unit is 3, and the number M of types of spreading pulses per channel stored in the spreading pattern storage / selection unit is 2, Further, one of the M types (M = 2) of diffusion patterns is a diffusion pattern obtained by the learning, and the other is a random number vector sequence (hereinafter, referred to as a random pattern) generated by a random number vector generation device. The description will be made assuming that. By the way, the diffusion pattern obtained by the above learning is shown as w11 in FIG.
It has been found that the length is relatively short, resulting in a pulse-shaped diffusion pattern.

【0094】図4のCELP音声符号化装置において
は、雑音音源情報のベクトル量子化の前に適応符号帳の
番号特定処理が行われる。よって、雑音音源情報のベク
トル量子化処理を行う時点では、適応符号帳のベクトル
番号(適応符号番号)および、理想適応符号ゲイン(暫
定的に決っている)を参照することが可能である。本実
施の形態では、このうちの理想適応符号ゲインの値を使
って、拡散パルスの予備選択を行う。
In the CELP speech coding apparatus shown in FIG. 4, the number identification processing of the adaptive codebook is performed before the vector quantization of the noise excitation information. Therefore, at the time of performing the vector quantization process of the noise excitation information, it is possible to refer to the vector number (adaptive code number) of the adaptive codebook and the ideal adaptive code gain (tentatively determined). In the present embodiment, the preliminary selection of the spreading pulse is performed using the ideal adaptive code gain value.

【0095】具体的にはまず、適応符号帳探索の終了直
後に符号番号特定部413に保持されている適応符号ゲ
インの理想値が、歪み計算部406へ出力される。歪み
計算部406は、符号番号特定部413から受けた適応
符号ゲインを適応ゲイン判定部419へ出力する。適応
ゲイン判定部419は、まず始めに、歪み計算部406
より受けた理想適応符号ゲインの値と予め設定されたし
きい値との大小比較を行う。次に適応ゲイン判定部41
9は、上記大小比較の結果に基づき、拡散パタン格納・
選択部415に予備選択用の制御信号を送る。制御信号
の内容は、上記大小比較において適応符号ゲインが大き
い場合には、雑音音源情報をベクトル量子化する際に生
じる量子化歪みをより小さくするように予め学習して得
られた拡散パタンを選択するように指示するものであ
り、上記大小比較において適応符号ゲインが大きくない
場合には、学習の結果得られた拡散パタンとは別の拡散
パタンを予備選択するように指示するものである。
Specifically, first, immediately after the end of the adaptive codebook search, the ideal value of the adaptive code gain held in code number specifying section 413 is output to distortion calculating section 406. The distortion calculation section 406 outputs the adaptive code gain received from the code number identification section 413 to the adaptive gain determination section 419. The adaptive gain determination unit 419 firstly outputs the distortion calculation unit 406
The magnitude of the received ideal adaptive code gain is compared with a preset threshold. Next, the adaptive gain determination unit 41
9 is based on the result of the above-mentioned magnitude comparison and stores the diffusion pattern
A control signal for preliminary selection is sent to selection section 415. When the adaptive code gain is large in the magnitude comparison, the content of the control signal is selected from a diffusion pattern obtained by learning in advance so as to reduce the quantization distortion generated when the noise excitation information is vector-quantized. In the case where the adaptive code gain is not large in the magnitude comparison, it is instructed to preliminarily select a spreading pattern different from the spreading pattern obtained as a result of learning.

【0096】すると、拡散パタン格納・選択部415に
おいて、各チャネルが格納しているM種類(M=2)の
拡散パタンから学習によって得られた側の拡散パタンだ
けが予備選択されることになり、拡散パタンの組合せ数
を大幅に削減できるようになる。その結果、拡散パタン
の全組合せ番号についての歪み計算をする必要がなくな
り、雑音音源情報のベクトル量子化処理を少い演算量で
効率的に行うことが可能になる。
Then, the diffusion pattern storage / selection section 415 preliminarily selects only the diffusion pattern on the side obtained by learning from the M (M = 2) diffusion patterns stored in each channel. Thus, the number of combinations of diffusion patterns can be greatly reduced. As a result, it is not necessary to calculate the distortion for all the combination numbers of the diffusion pattern, and the vector quantization of the noise source information can be efficiently performed with a small amount of calculation.

【0097】そして、さらに、雑音符号ベクトルの形状
は、適応ゲインの値が大きい時(有声性が強い時)には
パルス的な形状になり、適応ゲインの値が小さい時(有
声性が弱い時)にはランダム的な形状になる。よって、
音声信号の有声区間および無声区間に対して、それぞれ
適した形状の雑音符号ベクトルを利用できるようになる
ため、合成音声の品質を向上させることが可能になる。
Further, the noise code vector has a pulse-like shape when the value of the adaptive gain is large (when the voicedness is strong), and when the adaptive gain value is small (when the voicedness is weak). ) Has a random shape. Therefore,
Since a noise code vector having an appropriate shape can be used for each of a voiced section and an unvoiced section of a voice signal, it is possible to improve the quality of a synthesized voice.

【0098】なお、本実施の形態では説明簡単化のた
め、パルスベクトル生成部のチャネル数Nは3、拡散パ
タン格納・選択部が格納しているチャネルあたりの拡散
パルスの種類数Mは2の場合に限定して説明を行った
が、パルスベクトル生成部のチャネル数、拡散パタン格
納・選択部内のチャネルあたりの拡散パタン数が上記説
明と異なる場合についても、同様の効果・作用が得られ
る。
In this embodiment, for simplicity of explanation, the number of channels N of the pulse vector generation unit is 3, and the number M of types of spreading pulses per channel stored in the spreading pattern storage / selection unit is 2. Although the description has been limited to the case, even when the number of channels in the pulse vector generation unit and the number of diffusion patterns per channel in the diffusion pattern storage / selection unit are different from the above description, the same effects and effects can be obtained.

【0099】また、本実施の形態では説明簡単化のた
め、各チャネルあたり格納するM種類(M=2)の拡散
パタンのうち、一種類は上記学習によって得られた拡散
パタン、もう一種類はランダムパタンである場合につい
て説明を行ったが、学習によって得られた拡散パタンを
各チャネル毎に少くとも1種類格納しておくようにすれ
ば、上記のような場合でなくても、同様の効果・作用を
期待することができる。
In this embodiment, for simplicity of description, of the M types (M = 2) of diffusion patterns stored for each channel, one type is the diffusion pattern obtained by the above learning, and the other is the type. Although the case of a random pattern has been described, if at least one type of diffusion pattern obtained by learning is stored for each channel, the same effect can be obtained even in cases other than the above.・ An effect can be expected.

【0100】なおまた、本実施の形態では、拡散パタン
を予備選択するための手段として、適応符号ゲインの大
小情報をもちいる場合について説明したが、適応ゲイン
の大小情報以外の音声信号の短時間的特徴を表すパラメ
ータを併用すると、なお一層の効果・作用を期待するこ
とができる。
In this embodiment, the case where the magnitude information of the adaptive code gain is used as means for preliminary selection of the spreading pattern has been described. Further effects and effects can be expected when parameters representing the objective characteristics are used together.

【0101】また、上記音声符号化装置を有する、音声
信号通信システムまたは音声信号記録システムを構成す
ることにより、実施の形態1で記載した音源ベクトル生
成装置の有する作用・効果を得ることができる。
Further, by configuring a speech signal communication system or a speech signal recording system having the speech encoding device, the operation and effect of the sound source vector generation device described in the first embodiment can be obtained.

【0102】(実施の形態4)図5は本実施の形態にお
けるCELP音声符号化装置の構成ブロック図である。
(Embodiment 4) FIG. 5 is a block diagram showing the configuration of a CELP speech coding apparatus according to the present embodiment.

【0103】図5は、実施の形態1の音源ベクトル生成
装置(図1)を雑音符号帳に用いたCELP音声符号化
装置において、雑音音源情報をベクトル量子化する時点
で利用可能な情報を使って拡散パタン格納・選択部に格
納された複数の拡散パタンの予備選択を行うことを目的
としており、予備選択の基準として適応符号帳の番号特
定を行った時に生じる符号化歪み(S/N比で表現)の
大小を使うことを特徴としている。なお、図5の雑音符
号帳周辺部以外は図2記載のCELP音声符号化装置と
同一である。よって本実施の形態の説明は、図5記載の
CELP音声符号化装置における雑音音源情報のベクト
ル量子化処理についてだけの説明にとどめる。
FIG. 5 shows a CELP speech coding apparatus using the excitation vector generation apparatus (FIG. 1) of Embodiment 1 as a noise codebook, using information available at the time of vector quantization of noise excitation information. The purpose of the present invention is to perform preliminary selection of a plurality of diffusion patterns stored in the diffusion pattern storage / selection unit by using a coding distortion (S / N ratio) generated when the number of an adaptive codebook is specified as a reference for preliminary selection. It is characterized by using the size of the expression. Note that the parts other than the noise codebook peripheral part in FIG. 5 are the same as the CELP speech coding apparatus shown in FIG. Therefore, the description of the present embodiment will be limited to the description of only the vector quantization process of the noise source information in the CELP speech coding apparatus shown in FIG.

【0104】図5において、507は適応符号帳、50
9は適応符号ゲイン重み付け部、508は実施の形態1
で説明した音源ベクトル生成装置によって構成された雑
音符号帳、510は雑音符号ゲイン重み付け部、505
は合成フィルタ、506は歪み計算部、513は符号番
号特定部、515は拡散パタン格納・選択部、516は
パルスベクトル生成部、517はパルスベクトル拡散
部、518は拡散ベクトル加算部、519は歪みパワ判
定部である。ただし、本実施の形態において、上記拡散
パタン格納・選択部515が格納する格納するM種類
(M≧2)の拡散パタンのうちすくなくとも1種類は、
ランダムパタンであることとする。
In FIG. 5, reference numeral 507 denotes an adaptive codebook;
9 is an adaptive code gain weighting unit, and 508 is the first embodiment.
510 is a noise code gain weighting unit configured by the excitation vector generation apparatus described in
Is a synthesis filter, 506 is a distortion calculation unit, 513 is a code number identification unit, 515 is a diffusion pattern storage / selection unit, 516 is a pulse vector generation unit, 517 is a pulse vector diffusion unit, 518 is a diffusion vector addition unit, and 519 is distortion. It is a power determination unit. However, in the present embodiment, at least one of the M types (M ≧ 2) of the diffusion patterns stored by the diffusion pattern storage / selection unit 515 is:
It shall be a random pattern.

【0105】本実施の形態では、説明簡単化のため、パ
ルスベクトル生成部のチャネル数Nは3、拡散パタン格
納・選択部が格納しているチャネルあたりの拡散パルス
の種類数Mは2とし、さらに、M種類(M=2)の拡散
パタンのうち1種類はランダムパタン、もう1種類は雑
音音源情報をベクトル量子化することにより生じる量子
化歪みをより小さくするように予め学習し、当該学習の
結果得られた拡散パタンであるとする。
In this embodiment, for simplicity of explanation, the number of channels N of the pulse vector generation unit is 3, and the number M of types of spreading pulses per channel stored in the spreading pattern storage / selection unit is 2, Further, one of the M types (M = 2) of diffusion patterns is learned in advance so that one type is a random pattern, and the other type is previously learned to reduce quantization distortion caused by vector quantization of noise source information. Is assumed to be the diffusion pattern obtained as a result.

【0106】図5のCELP音声符号化装置において
は、雑音音源情報のベクトル量子化処理の前に適応符号
帳の番号特定処理が行われる。よって、雑音音源番号の
ベクトル量子化処理を行う時点では、適応符号帳のベク
トル番号(適応符号番号)、理想適応符号ゲイン(暫定
的に決っている)および、適応符号帳探索用のターゲッ
トベクトルを参照することができる。本実施の形態で
は、上記3つの情報から算出できる適応符号帳の符号化
歪み(S/N比で表現)を使って、拡散パルスの予備選
択を行う。
In the CELP speech coding apparatus shown in FIG. 5, an adaptive codebook number specifying process is performed before the vector quantization process of the noise excitation information. Therefore, at the time of performing the vector quantization process of the noise excitation number, the adaptive codebook vector number (adaptive code number), the ideal adaptive code gain (tentatively determined), and the target vector for adaptive codebook search are Can be referenced. In the present embodiment, preliminary selection of a spreading pulse is performed using coding distortion (expressed by an S / N ratio) of an adaptive codebook that can be calculated from the above three information.

【0107】具体的にはまず、適応符号帳探索の終了直
後に符号番号特定部513に保持されている適応符号番
号および適応符号ゲイン(理想ゲイン)の値が歪み計算
部506へ出力される。歪み計算部506は、符号番号
特定部513から受けた適応符号番号および適応符号ゲ
インと適応符号帳探索用のターゲットベクトルを用い
て、適応符号帳の番号特定によって生じた符号化歪み
(S/N比)を算出する。算出したS/N比を歪みパワ
判定部519へ出力する。
Specifically, first, immediately after the end of the adaptive codebook search, the values of the adaptive code number and the adaptive code gain (ideal gain) held in code number specifying section 513 are output to distortion calculating section 506. The distortion calculation unit 506 uses the adaptive code number and the adaptive code gain received from the code number identification unit 513 and the target vector for adaptive codebook search to encode distortion (S / N) caused by identification of the adaptive codebook number. Ratio). The calculated S / N ratio is output to distortion power determination section 519.

【0108】歪みパワ判定部519は、まず始めに、歪
み計算部506より受けたS/N比と予め設定されたし
きい値との大小比較を行う。次に歪みパワ判定部519
は、上記大小比較の結果に基づき、拡散パタン格納・選
択部515に予備選択用の制御信号を送る。制御信号の
内容は、上記大小比較においてS/N比が大きい場合に
は、雑音符号帳探索用ターゲットベクトルを符号化する
ことにより生じる符号化歪みをより小さくするように予
め学習した結果得られる拡散パタンを選択するように指
示するものであり、上記大小比較においてS/N比が小
さい場合には、ランダムパタンの拡散パタンを選択する
ように指示するものである。
First, the distortion power determination unit 519 compares the S / N ratio received from the distortion calculation unit 506 with a preset threshold value. Next, the distortion power determination unit 519
Sends a control signal for preliminary selection to the diffusion pattern storage / selection unit 515 based on the result of the magnitude comparison. When the S / N ratio is large in the magnitude comparison, the content of the control signal is a spread obtained as a result of learning in advance so as to reduce coding distortion caused by coding the target vector for noise codebook search. The instruction is to select a pattern, and when the S / N ratio is small in the magnitude comparison, the instruction is to select a diffusion pattern of a random pattern.

【0109】すると、拡散パタン格納・選択部515に
おいて、各チャネルが格納しているM種類(M=2)の
拡散パタンから1種類だけが予備選択されることにな
り、拡散パタンの組合せを大幅に削減できるようにな
る。その結果、拡散パタンの全組合せ番号についての歪
み計算をする必要がなくなり、雑音符号番号の特定を少
い演算量で効率的に行うことができることになる。そし
て、さらに、雑音符号ベクトルの形状は、S/N比が大
きい時にはパルス的な形状になり、S/N比が小さい時
にはランダム的な形状になる。よって、音声信号の短時
間的な特徴に応じて、雑音符号ベクトルの形状を変化さ
せることが可能になるため、合成音声(特に、ノイズ区
間)の品質を向上させることが可能になる。
Then, in diffusion pattern storage / selection section 515, only one of M types (M = 2) of diffusion patterns stored in each channel is preliminarily selected, and the combination of the diffusion patterns is greatly increased. Can be reduced. As a result, it is not necessary to calculate distortion for all the combination numbers of the diffusion pattern, and the noise code number can be efficiently specified with a small amount of calculation. Further, the noise code vector has a pulse shape when the S / N ratio is large, and has a random shape when the S / N ratio is small. Therefore, the shape of the noise code vector can be changed in accordance with the short-time characteristics of the speech signal, so that the quality of the synthesized speech (particularly, a noise section) can be improved.

【0110】なお、本実施の形態では説明簡単化のた
め、パルスベクトル生成部のチャネル数Nは3、拡散パ
タン格納・選択部が格納しているチャネルあたりの拡散
パルスの種類数Mは2の場合に限定して説明を行った
が、パルスベクトル生成部のチャネル数、チャネルあた
りの拡散パタンの種類数が上記説明と異なる場合につい
ても、同様の効果・作用が得られる。
In the present embodiment, for simplicity of explanation, the number of channels N of the pulse vector generation unit is 3, and the number M of types of spreading pulses per channel stored in the spreading pattern storage / selection unit is 2. Although the description has been limited to the case, the same effects and effects can be obtained even when the number of channels of the pulse vector generation unit and the number of types of diffusion patterns per channel are different from those described above.

【0111】また、本実施の形態では説明簡単化のた
め、さらに、各チャネルあたり格納するM種類(M=
2)の拡散パタンのうち、一種類は上記学習によって得
られた拡散パタン、もう一種類はランダムパタンである
場合について説明を行ったが、ランダムパタンの拡散パ
タンを各チャネル毎に少くとも1種類格納しておくよう
にすれば、上記のような場合でなくても、同様の効果・
作用を期待することができる。
Further, in this embodiment, for simplification of description, M types (M =
Of the diffusion patterns of 2), one type is a diffusion pattern obtained by the above learning, and another type is a random pattern. However, at least one type of random pattern is provided for each channel. If it is stored, the same effect and
Action can be expected.

【0112】なおまた、本実施の形態では、拡散パタン
を予備選択するための手段として、適応符号番号の特定
によって生じる符号化歪み(S/N比で表現)の大小情
報だけを用いたが、音声信号の短時間的特徴をさらに正
確に表せる情報を併用すると、なお一層の効果・作用を
期待することができる。
Further, in the present embodiment, only the magnitude information of the coding distortion (expressed by the S / N ratio) caused by the specification of the adaptive code number is used as means for preliminary selecting the spreading pattern. When the information that can express the short-time characteristics of the audio signal more accurately is used together, further effects and effects can be expected.

【0113】また、上記音声符号化装置を有する、音声
信号通信システムまたは音声信号記録システムを構成す
ることにより、実施の形態1で記載した音源ベクトル生
成装置の有する作用・効果を得ることができる。
Further, by configuring a speech signal communication system or a speech signal recording system having the speech encoding device, the operation and effect of the sound source vector generation device described in the first embodiment can be obtained.

【0114】[0114]

【発明の効果】以上のように本発明の音源ベクトル生成
装置によれば、実際の音源情報を分析もしくはそれをも
とに学習して得られた拡散パタンの形状(特性)をパル
スベクトルに反映することができるため、実際の音源ベ
クトルと類似性の高い形状(特性)の音源ベクトルを生
成することができる。
As described above, according to the sound source vector generating apparatus of the present invention, the shape (characteristic) of the diffusion pattern obtained by analyzing the actual sound source information or learning based on it is reflected in the pulse vector. Therefore, a sound source vector having a shape (characteristic) highly similar to an actual sound source vector can be generated.

【0115】また、前記音源ベクトル生成装置を雑音符
号帳として用いたCELP音声符号化装置/復号化装置
を構成することにより、音声信号を実際に分解(分析)
して得られる雑音符号ベクトル探索用ターゲットベクト
ルと統計的に近い形状(特性)の雑音符号ベクトルを生
成できるため、代数的音源生成部を雑音符号帳に用いる
場合より品質の高い合成音声を得ることができる。
Further, the speech signal is actually decomposed (analyzed) by configuring a CELP speech encoding / decoding device using the excitation vector generation device as a noise codebook.
To generate a noise code vector having a shape (characteristic) statistically similar to a target vector for noise code vector search obtained as a result, thereby obtaining higher quality synthesized speech than when the algebraic excitation generator is used for the noise codebook. Can be.

【0116】また、前記音声符号化装置を有する、音声
信号通信システムまたは音声信号記録システムを構成す
ることにより、前記音源ベクトル生成装置の有する効果
を持つシステムを得ることができる。
Further, by configuring an audio signal communication system or an audio signal recording system having the audio encoding device, it is possible to obtain a system having the effects of the sound source vector generation device.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施の形態による音源ベクトル生成
装置の構成ブロック図
FIG. 1 is a configuration block diagram of a sound source vector generation device according to an embodiment of the present invention;

【図2】本発明の一実施の形態による音声符号化装置の
構成ブロック図
FIG. 2 is a configuration block diagram of a speech encoding device according to an embodiment of the present invention;

【図3】本発明の一実施の形態による音声復号化装置の
構成ブロック図
FIG. 3 is a configuration block diagram of a speech decoding device according to an embodiment of the present invention;

【図4】本発明の一実施の形態による音声符号化装置の
構成ブロック図
FIG. 4 is a configuration block diagram of a speech encoding device according to an embodiment of the present invention;

【図5】本発明の一実施の形態による音声符号化装置の
構成ブロック図
FIG. 5 is a configuration block diagram of a speech encoding device according to an embodiment of the present invention;

【図6】従来のCELP型音声符号化装置の構成ブロッ
ク図
FIG. 6 is a configuration block diagram of a conventional CELP-type speech coding apparatus.

【図7】従来のCELP型音声復号化装置の構成ブロッ
ク図
FIG. 7 is a block diagram showing the configuration of a conventional CELP-type speech decoding device.

【符号の説明】[Explanation of symbols]

101、216、416、516 パルスベクトル生成
部 102、215、415、515 拡散パタン格納・選
択部 103、217、417、517 パルスベクトル拡散
部 104、218、418、518 拡散ベクトル加算部 105 音源ベクトル 201、401、501 入力音声 202、402、502 線形予測分析部 203、403、503 線形予測係数符号化部 204、302、404、504 線形予測係数復号化
部 205、309、405、505 合成フィルタ 206、406、506 歪み計算部 207、303、407、507 適応符号帳 208、304、408、508 雑音符号帳 209、306、409、509 適応符号ゲイン重み
付け部 210、307、410、510 雑音符号ゲイン重み
付け部 211、305、411、511 重み符号帳 212、308、412、512 加算部 213、413、513 符号番号特定部 214、414、514 符号出力部 301 符号入力部 310 合成音声 419 適応ゲイン判定部 519 歪みパワ判定部
101, 216, 416, 516 Pulse vector generator 102, 215, 415, 515 Spread pattern storage / selector 103, 217, 417, 517 Pulse vector spreader 104, 218, 418, 518 Spread vector adder 105 Sound source vector 201 , 401, 501 Input speech 202, 402, 502 Linear prediction analysis unit 203, 403, 503 Linear prediction coefficient coding unit 204, 302, 404, 504 Linear prediction coefficient decoding unit 205, 309, 405, 505 Synthesis filter 206, 406, 506 distortion calculators 207, 303, 407, 507 adaptive codebooks 208, 304, 408, 508 noise codebooks 209, 306, 409, 509 adaptive code gain weighters 210, 307, 410, 510 noise code gain weighters 211, 05, 411, 511 Weighted codebook 212, 308, 412, 512 Adder 213, 413, 513 Code number specifying unit 214, 414, 514 Code output unit 301 Code input unit 310 Synthesized voice 419 Adaptive gain determination unit 519 Distortion power determination Department

Claims (32)

【特許請求の範囲】[Claims] 【請求項1】 ベクトル軸上のある1要素に極性付き単
位パルスが立ったパルスベクトルを生成するチャネルを
N個(N≧1)備えたパルスベクトル生成部と、前記N
個のチャネルごとにM種類(M≧1)の拡散パタンを格
納する機能と、格納したM種類の拡散パタンからある1
種類の拡散パタンを選択する機能とを併せ持つ拡散パタ
ン格納・選択部と、前記パルスベクトル生成部から出力
されるパルスベクトルと前記拡散パタン格納・選択部か
ら選択される拡散パタンとの重畳演算をチャネルごとに
行い、N個の拡散ベクトルを生成する機能を有するパル
スベクトル拡散部と、前記パルスベクトル拡散部により
生成されるN個の拡散ベクトルを加算して音源ベクトル
を生成する機能を有する拡散ベクトル加算部とを備える
ことを特徴とする音源ベクトル生成装置。
A pulse vector generating unit including N (N ≧ 1) channels for generating a pulse vector in which a unit pulse with polarity rises in a certain element on a vector axis;
A function of storing M types (M ≧ 1) of diffusion patterns for each of the channels, and a function of storing one of the stored M types of diffusion patterns
A diffusion pattern storage / selection unit having a function of selecting a type of diffusion pattern; and a channel for superimposing a pulse vector output from the pulse vector generation unit and a diffusion pattern selected from the diffusion pattern storage / selection unit. A pulse vector spreading unit having a function of generating N diffusion vectors, and a diffusion vector addition having a function of generating a sound source vector by adding the N diffusion vectors generated by the pulse vector spreading unit And a sound source vector generation device.
【請求項2】 パルスベクトル生成部が、N個(N≧
1)のパルスベクトルを代数的に生成する機能を有する
ことを特徴とする請求項1記載の音源ベクトル生成装
置。
2. The method according to claim 1, wherein the number of pulse vector generation units is N (N ≧
2. The sound source vector generation apparatus according to claim 1, further comprising a function of generating the pulse vector algebraically according to 1).
【請求項3】 生成される音源ベクトルに対して1対1
に番号を割り当てることを特徴とする請求項1もしくは
請求項2に記載の音源ベクトル生成装置。
3. One-to-one correspondence with a generated sound source vector
The sound source vector generation device according to claim 1 or 2, wherein a number is assigned to the sound source vector.
【請求項4】 請求項3記載の音源ベクトル生成装置を
雑音符号帳として用い、前記雑音符号帳で雑音音源情報
をベクトル量子化することにより得られ、かつ、パルス
位置、パルス極性、拡散パタンを特定するインデクスを
雑音符号番号とすることを特徴とするCELP音声符号
化装置/復号化装置。
4. An excitation vector generation apparatus according to claim 3, which is obtained as a noise codebook, is obtained by vector-quantizing noise excitation information with said noise codebook, and further includes a pulse position, a pulse polarity, and a diffusion pattern. A CELP speech coding apparatus / decoding apparatus characterized in that an index to be specified is a random code number.
【請求項5】 拡散パタンが、雑音音源情報をベクトル
量子化した際に生じる量子化歪みをより小さくするよう
に予め学習して得られたものであることを特徴とする請
求項4記載のCELP音声符号化装置/復号化装置。
5. The CELP according to claim 4, wherein the diffusion pattern is obtained by learning in advance so as to reduce quantization distortion generated when the noise source information is vector-quantized. Audio encoding / decoding device.
【請求項6】 拡散パターンが2種類以上(M≧2)格
納されていることを特徴とする請求項1または2記載の
音源ベクトル生成装置。
6. The sound source vector generation apparatus according to claim 1, wherein two or more types of diffusion patterns (M ≧ 2) are stored.
【請求項7】 拡散パターンが2種類以上(M≧2)格
納されていることを特徴とする請求項3記載の音源ベク
トル生成装置。
7. The sound source vector generation apparatus according to claim 3, wherein two or more types of diffusion patterns (M ≧ 2) are stored.
【請求項8】 請求項7記載の音源ベクトル生成装置を
雑音符号帳として用い、前記雑音符号帳で雑音音源情報
をベクトル量子化することにより得られ、かつ、パルス
位置、パルス極性、拡散パタンを特定するインデクスを
雑音符号番号とすることを特徴とするCELP音声符号
化装置/復号化装置。
8. An excitation vector generating apparatus according to claim 7, which is obtained as a noise codebook, is obtained by vector-quantizing noise excitation information with said noise codebook, and further includes a pulse position, a pulse polarity, and a spreading pattern. A CELP speech coding apparatus / decoding apparatus characterized in that an index to be specified is a random code number.
【請求項9】 拡散パタン格納・選択部において、各チ
ャネルで選択された拡散パタンの組合せを示す組合せ番
号を、雑音音源情報をベクトル量子化した際に生じる量
子化歪みが最小化されるように、拡散パタンのとりうる
M^N通り(”^”はべき乗を示す)の全組合せ中から
閉ループで特定することを特徴とする請求項8記載のC
ELP音声符号化装置/復号化装置。
9. A spreading pattern storage / selection unit sets a combination number indicating a combination of spreading patterns selected in each channel so that quantization distortion generated when vectorizing noise source information is minimized. 9. The method according to claim 8, wherein the combination is specified in a closed loop from all M ^ N combinations (“^” indicates a power) of the diffusion pattern.
ELP speech encoder / decoder.
【請求項10】 拡散パタン格納・選択部において、各
チャネルで選択された拡散パタンの組合せを示す組合せ
番号を、雑音音源情報のベクトル量子化した際に生じる
量子化歪みが最小化されるように、あらかじめ求まって
いる音声パラメータを用いて拡散パタンの組合せの予備
選択を行い、前記予備選択された拡散パタンの組合せの
中から特定することを特徴とする請求項8記載のCEL
P音声符号化装置/復号化装置。
10. A spreading pattern storage / selection unit that sets a combination number indicating a combination of spreading patterns selected in each channel so that quantization distortion generated when vectorizing noise source information is minimized. 9. The CEL according to claim 8, wherein a preliminary selection of a combination of the diffusion patterns is performed by using a voice parameter determined in advance, and the combination is selected from the combinations of the diffusion patterns selected in advance.
P speech encoder / decoder.
【請求項11】 拡散パタン格納・選択部が、音声区間
の分析結果によって、予備選択する拡散パタンの組合せ
を切り替えることを特徴とする請求項10記載のCEL
P音声符号化装置。
11. The CEL according to claim 10, wherein the diffusion pattern storage / selection unit switches the combination of the diffusion patterns to be preselected according to the analysis result of the voice section.
P audio coding device.
【請求項12】 音声区間の分析結果が、雑音音源情報
をベクトル量子化する時点で既に抽出もしくは決定され
ている音声パラメータであることを特徴とする請求項1
1記載のCELP音声符号化装置。
12. The method according to claim 1, wherein the analysis result of the voice section is a voice parameter that has already been extracted or determined when the noise source information is vector-quantized.
2. The CELP speech encoding device according to claim 1.
【請求項13】 拡散パタン格納・選択部内の各チャネ
ルにおいて、全ての拡散パタンが、雑音音源情報をベク
トル量子化した際に生じる量子化歪みをより小さくする
ように予め学習して得られた拡散パタンであることを特
徴とする請求項8記載のCELP音声符号化装置/復号
化装置。
13. In each channel in a spreading pattern storage / selection unit, all the spreading patterns are obtained by learning in advance so that quantization distortion generated when vectorizing noise source information is reduced to be smaller. 9. The CELP speech encoding / decoding device according to claim 8, wherein the pattern is a pattern.
【請求項14】 拡散パタン格納・選択部内の各チャネ
ルにおいて、拡散パタンのうち少なくとも1種類が、雑
音音源情報をベクトル量子化した際に生じる量子化歪み
をより小さくするように予め学習して得られた拡散パタ
ンであることを特徴とする請求項8記載のCELP音声
符号化装置/復号化装置。
14. In each channel in the spreading pattern storage / selection unit, at least one of the spreading patterns is obtained by learning in advance so that quantization distortion generated when vectorizing noise source information is reduced. 9. The CELP speech encoding / decoding apparatus according to claim 8, wherein the spread pattern is a spread pattern.
【請求項15】 拡散パタン格納・選択部内の各チャネ
ルにおいて、拡散パタンのうち少なくとも1種類が、乱
数ベクトル系列により形成されるランダムパタンである
ことを特徴とする請求項8記載のCELP音声符号化装
置/復号化装置。
15. The CELP speech coding according to claim 8, wherein in each channel in the spreading pattern storage / selection unit, at least one of the spreading patterns is a random pattern formed by a random number vector sequence. Device / decryption device.
【請求項16】 拡散パタン格納・選択部内の各チャネ
ルにおいて、拡散パタンのうち少なくとも1種類が、雑
音音源情報をベクトル量子化する際に生じる量子化歪み
をより小さくするように予め学習して得られた拡散パタ
ンであり、かつ、少くとも1種類がランダムパタンであ
ることを特徴とする請求項8記載のCELP音声符号化
装置/復号化装置。
16. In each channel in the spreading pattern storage / selection unit, at least one of the spreading patterns is obtained by learning in advance so as to reduce quantization distortion generated when vectorizing noise source information. 9. The CELP speech coding apparatus / decoding apparatus according to claim 8, wherein the spread pattern is a random pattern and at least one type is a random pattern.
【請求項17】 拡散パタン格納・選択部において、各
チャネルで選択された拡散パタンの組合せを示す組合せ
番号を、雑音音源情報をベクトル量子化した際に生じる
量子化歪みが最小化されるように、拡散パタンのとりう
るM^N通りの全組合せ中から閉ループで特定すること
を特徴とする請求項13、14、16のいずれかに記載
のCELP音声符号化装置/復号化装置。
17. The spreading pattern storage / selection unit sets a combination number indicating a combination of spreading patterns selected in each channel so that quantization distortion generated when noise source information is vector-quantized is minimized. 17. The CELP speech encoding apparatus / decoding apparatus according to claim 13, wherein the identification is performed in a closed loop from all M ^ N combinations of possible diffusion patterns.
【請求項18】 拡散パタン格納・選択部において、各
チャネルで選択された拡散パタンの組合せを示す組合せ
番号を、雑音音源情報のベクトル量子化した際に生じる
量子化歪みが最小化されるように、あらかじめ求まって
いる音声パラメータを用いて拡散パタンの組合せの予備
選択を行い、前記予備選択された拡散パタンの組合せの
中から特定することを特徴とする請求項13、14、1
6のいずれかに記載のCELP音声符号化装置/復号化
装置。
18. A spreading pattern storage / selection unit that sets a combination number indicating a combination of spreading patterns selected in each channel so as to minimize quantization distortion generated when vector quantization of noise source information is performed. 15. A preliminary selection of a combination of diffusion patterns is performed by using previously determined voice parameters, and the combination is selected from among the combinations of the diffusion patterns selected in advance.
7. The CELP speech encoding / decoding device according to any one of 6.
【請求項19】 拡散パタン格納・選択部が、音声区間
の分析結果によって、予備選択する拡散パタンの組合せ
を切り替えることを特徴とする請求項18記載のCEL
P音声符号化装置。
19. The CEL according to claim 18, wherein the diffusion pattern storage / selection unit switches a combination of diffusion patterns to be preselected according to the analysis result of the voice section.
P audio coding device.
【請求項20】 音声区間の分析結果が、雑音音源情報
をベクトル量子化する時点で既に抽出もしくは決定され
ている音声パラメータであることを特徴とする請求項1
9記載のCELP音声符号化装置。
20. The method according to claim 1, wherein the analysis result of the voice section is a voice parameter that has already been extracted or determined when the noise source information is vector-quantized.
10. The CELP speech encoding device according to item 9.
【請求項21】 拡散パタン格納・選択部において、各
チャネルで選択された拡散パタンの組合せを示す組合せ
番号を、雑音音源情報をベクトル量子化した際に生じる
量子化歪みが最小化されるように、拡散パタンのとりう
るM^N通りの全組合せ中から閉ループで特定すること
を特徴とする請求項15記載のCELP音声符号化装置
/復号化装置。
21. The spreading pattern storage / selection unit sets a combination number indicating a combination of spreading patterns selected in each channel so that quantization distortion generated when noise source information is vector-quantized is minimized. 16. The CELP speech encoding apparatus / decoding apparatus according to claim 15, wherein the identification is performed in a closed loop from among all M ^ N combinations of possible diffusion patterns.
【請求項22】 拡散パタン格納・選択部において、各
チャネルで選択された拡散パタンの組合せを示す組合せ
番号を、雑音音源情報のベクトル量子化した際に生じる
量子化歪みが最小化されるように、あらかじめ求まって
いる音声パラメータを用いて拡散パタンの組合せの予備
選択を行い、前記予備選択された拡散パタンの組合せの
中から特定することを特徴とする請求項15記載のCE
LP音声符号化装置/復号化装置。
22. A spreading pattern storage / selection unit sets a combination number indicating a combination of spreading patterns selected in each channel so that quantization distortion generated when vectorizing noise source information is minimized. 16. The CE according to claim 15, wherein a preliminary selection of a combination of diffusion patterns is performed by using a voice parameter determined in advance, and the combination is selected from the combinations of the diffusion patterns selected in advance.
LP speech encoder / decoder.
【請求項23】 拡散パタン格納・選択部が、音声区間
の分析結果によって、予備選択する拡散パタンの組合せ
を切り替えることを特徴とする請求項22記載のCEL
P音声符号化装置。
23. The CEL according to claim 22, wherein the diffusion pattern storage / selection unit switches the combination of the diffusion patterns to be preselected according to the analysis result of the voice section.
P audio coding device.
【請求項24】 音声区間の分析結果が、雑音音源情報
をベクトル量子化する時点で既に抽出もしくは決定され
ている音声パラメータであることを特徴とする請求項2
3記載のCELP音声符号化装置。
24. The method according to claim 2, wherein the analysis result of the voice section is a voice parameter that has already been extracted or determined when the noise source information is vector-quantized.
3. The CELP speech encoding device according to item 3.
【請求項25】 適応音源情報をベクトル量子化した時
に算出された理想適応符号ゲインの値と予め設定してお
いたしきい値との大小関係を比較する適応ゲイン判定部
を有し、前記理想適応符号ゲインの値が予め設定してお
いたしきい値より大きい時には、学習によって得られた
拡散パタンを選択することを特徴とする請求項13,1
4,16,17,18,19,20のいずれかに記載の
CELP音声符号化装置。
25. An adaptive gain determining unit for comparing a magnitude relation between a value of an ideal adaptive code gain calculated when the adaptive excitation information is vector-quantized and a preset threshold value, 13. A spread pattern obtained by learning when a value of a code gain is larger than a preset threshold value.
The CELP speech encoding device according to any one of 4, 16, 17, 18, 19, and 20.
【請求項26】 適応符号番号を特定した際に生じた符
号化歪みのパワと予め設定しておいたしきい値との大小
関係を比較する歪みパワ判定部を有し、前記符号化歪み
のパワが予め設定しておいたしきい値より大きい時に
は、ランダムパタンの拡散ベクトルを選択することを特
徴とする請求項15,21,22,23,24のいずれ
かに記載のCELP音声符号化装置。
26. A distortion power judging section for comparing a magnitude relation between a power of coding distortion generated when an adaptive code number is specified and a preset threshold value, and comprising a power of said coding distortion. 25. The CELP speech coding apparatus according to claim 15, wherein a spread vector of a random pattern is selected when is larger than a preset threshold value.
【請求項27】 請求項1,2,3,6,7のいずれか
に記載の音源ベクトル生成装置を有することを特徴とす
る音声信号通信システム。
27. An audio signal communication system comprising the sound source vector generation device according to claim 1.
【請求項28】 請求項4,5,8から26のいずれか
に記載のCELP音声符号化装置を有することを特徴と
する音声信号通信システム。
28. A speech signal communication system comprising the CELP speech encoding apparatus according to claim 4, 5, 8, or 26.
【請求項29】 請求項4,5,8から10,13から
18,21,22のいずれかに記載のCELP音声復号
化装置を有することを特徴とする音声信号通信システ
ム。
29. A speech signal communication system comprising the CELP speech decoding device according to any one of claims 4, 5, 8 to 10, 13 to 18, 21, and 22.
【請求項30】 請求項1,2,3,6,7のいずれか
に記載の音源ベクトル生成装置を有することを特徴とす
る音声信号記録システム。
30. An audio signal recording system comprising the sound source vector generation device according to claim 1.
【請求項31】 請求項4,5,8から26のいずれか
に記載のCELP音声符号化装置を有することを特徴と
する音声信号記録システム。
31. A speech signal recording system comprising the CELP speech encoding device according to claim 4, 5, 8 or 26.
【請求項32】 請求項4,5,8から10,13から
18,21,22のいずれかに記載のCELP音声復号
化装置を有することを特徴とする音声信号記録システ
ム。
32. An audio signal recording system comprising the CELP audio decoding device according to any one of claims 4, 5, 8 to 10, 13 to 18, 21, and 22.
JP08571798A 1997-10-22 1998-03-31 Sound source vector generating apparatus and sound source vector generating method Expired - Lifetime JP3174756B2 (en)

Priority Applications (70)

Application Number Priority Date Filing Date Title
JP08571798A JP3174756B2 (en) 1998-03-31 1998-03-31 Sound source vector generating apparatus and sound source vector generating method
CN2007101529987A CN101174413B (en) 1997-10-22 1998-10-22 Sound signal encoder and sound signal decoder
KR1020057016117A KR20050090026A (en) 1997-10-22 1998-10-22 Sound encoder and sound decoder
KR1020077016453A KR100938017B1 (en) 1997-10-22 1998-10-22 Vector quantization apparatus and vector quantization method
CA2598870A CA2598870C (en) 1997-10-22 1998-10-22 Multi-stage vector quantization apparatus and method for speech encoding
CN2007103073184A CN101202047B (en) 1997-10-22 1998-10-22 Sound encoder and sound decoder
EP06019105A EP1746582B1 (en) 1997-10-22 1998-10-22 Excitation vector generator for speech coding and speech decoding
EP06021073A EP1746583B1 (en) 1997-10-22 1998-10-22 Sound encoder and sound decoder
EP06009156A EP1684268B8 (en) 1997-10-22 1998-10-22 Method and apparatus for the generation of vectors for speech decoding
CA002494946A CA2494946C (en) 1997-10-22 1998-10-22 Speech coder and speech decoder
CN2006100048275A CN1808569B (en) 1997-10-22 1998-10-22 Voice encoding device,orthogonalization search method, and celp based speech coding method
DE69840855T DE69840855D1 (en) 1997-10-22 1998-10-22 Excitation vector generation for speech coding and decoding
CN200710307317XA CN101202046B (en) 1997-10-22 1998-10-22 Sound encoder and sound decoder
EP06019107A EP1752968B1 (en) 1997-10-22 1998-10-22 Method and apparatus for generating dispersed vectors
PCT/JP1998/004777 WO1999021174A1 (en) 1997-10-22 1998-10-22 Sound encoder and sound decoder
US09/319,933 US6415254B1 (en) 1997-10-22 1998-10-22 Sound encoder and sound decoder
KR1020087016338A KR100900113B1 (en) 1997-10-22 1998-10-22 Dispersed pulse vector generator and method for generating a dispersed pulse vector
EP06025737.5A EP1763019B1 (en) 1997-10-22 1998-10-22 Orthogonalization search for the CELP based speech coding
CNB2005100062028A CN100349208C (en) 1997-10-22 1998-10-22 Speech coder and speech decoder
DE69836624T DE69836624T2 (en) 1997-10-22 1998-10-22 AUDIO CODERS AND DECODERS
EP20060025738 EP1760694A3 (en) 1997-10-22 1998-10-22 Multistage vector quantization for speech encoding
EP10163650A EP2224597B1 (en) 1997-10-22 1998-10-22 Multistage vector quantization for speech encoding
KR1020077016452A KR100938018B1 (en) 1997-10-22 1998-10-22 Dispersed vector generator and method for generating a dispersed vector
KR1020087019303A KR101029398B1 (en) 1997-10-22 1998-10-22 Vector quantization apparatus and vector quantization method
EP06019106.1A EP1734512B1 (en) 1997-10-22 1998-10-22 CELP encoder and a method of CELP encoding
DE69840038T DE69840038D1 (en) 1997-10-22 1998-10-22 Sound encoder and sound decoder
KR1020087018788A KR100925084B1 (en) 1997-10-22 1998-10-22 Speech encoder and method of a speech encoding
DE69839407T DE69839407T2 (en) 1997-10-22 1998-10-22 Method and apparatus for generating vectors for speech decoding
EP98950336A EP0967594B1 (en) 1997-10-22 1998-10-22 Sound encoder and sound decoder
DE69838305T DE69838305T2 (en) 1997-10-22 1998-10-22 Orthogonalization search for CELP based speech coding
KR1020077016451A KR100886062B1 (en) 1997-10-22 1998-10-22 Dispersed pulse vector generator and method for generating a dispersed pulse vector
CN2007101529972A CN101174412B (en) 1997-10-22 1998-10-22 Sound encoder and sound decoder
CA002275266A CA2275266C (en) 1997-10-22 1998-10-22 Speech coder and speech decoder
EP06021078A EP1755227B1 (en) 1997-10-22 1998-10-22 Multistage vector quantization for speech encoding
KR1020087018800A KR100872246B1 (en) 1997-10-22 1998-10-22 Orthogonal search method and speech coder
KR10-2003-7013816A KR100527217B1 (en) 1997-10-22 1998-10-22 Sound encoder and sound decoder
KR1019997005510A KR100651438B1 (en) 1997-10-22 1998-10-22 Sound encoder and sound decoder
DE29825254U DE29825254U1 (en) 1997-10-22 1998-10-22 Speech coder and speech decoder
DE69840008T DE69840008D1 (en) 1997-10-22 1998-10-22 Method and apparatus for the generation of scattered vectors
CN2007103073381A CN101221764B (en) 1997-10-22 1998-10-22 Sound encoder and sound decoder
CN2007103073165A CN101202045B (en) 1997-10-22 1998-10-22 Sound encoder and sound decoder
DE29825253U DE29825253U1 (en) 1997-10-22 1998-10-22 Sound encoder and sound decoder
CN2007103073150A CN101202044B (en) 1997-10-22 1998-10-22 Sound encoder and sound decoder
CA2528645A CA2528645C (en) 1997-10-22 1998-10-22 Speech coder and speech decoder, orthogonal search method and speech coding method
DE69840009T DE69840009D1 (en) 1997-10-22 1998-10-22 Multilevel Vector Quantization for speech coding
EP06025740.9A EP1760695B1 (en) 1997-10-22 1998-10-22 Orthogonalization search for the CELP based speech coding
CA2598683A CA2598683C (en) 1997-10-22 1998-10-22 A speech encoder and method of speech encoding
CA2598780A CA2598780C (en) 1997-10-22 1998-10-22 A method and apparatus for generating dispersed vectors
CA2684452A CA2684452C (en) 1997-10-22 1998-10-22 Multi-stage vector quantization for speech encoding
EP05028415A EP1640970B9 (en) 1997-10-22 1998-10-22 Orthogonalization search for the CELP based speech coding
CA2684379A CA2684379C (en) 1997-10-22 1998-10-22 A speech coder using an orthogonal search and an orthogonal search method
HK00104635A HK1025417A1 (en) 1997-10-22 2000-07-26 Sound encoder and sound decoder
US10/133,735 US7024356B2 (en) 1997-10-22 2002-04-29 Speech coder and speech decoder
US10/614,834 US7373295B2 (en) 1997-10-22 2003-07-09 Speech coder and speech decoder
US11/125,184 US7590527B2 (en) 1997-10-22 2005-05-10 Speech coder using an orthogonal search and an orthogonal search method
US11/281,386 US7499854B2 (en) 1997-10-22 2005-11-18 Speech coder and speech decoder
US11/508,849 US7546239B2 (en) 1997-10-22 2006-08-24 Speech coder and speech decoder
HK06110370A HK1090161A1 (en) 1997-10-22 2006-09-19 Orthogonalizarion search for the celp based speechcoding
HK06110927A HK1090465A1 (en) 1997-10-22 2006-10-03 Method and apparatus for the generation of vectorsfor speech decoding& x9;& x9;& x9;& x9;& x9;
HK07103128.2A HK1097637A1 (en) 1997-10-22 2007-03-23 Excitation vector generator for speech coding and speech decoding
HK07105320.3A HK1099117A1 (en) 1997-10-22 2007-05-21 Method and apparatus for generating dispersed vectors
HK07105319.6A HK1099138A1 (en) 1997-10-22 2007-05-21 Multistage vector quantization for speech encoding
HK07106627.1A HK1101839A1 (en) 1997-10-22 2007-06-20 Celp encoder and a method of celp encoding celp celp
US11/776,823 US7533016B2 (en) 1997-10-22 2007-07-12 Speech coder and speech decoder
HK07108050.3A HK1103843A1 (en) 1997-10-22 2007-07-24 Sound encoder and sound decoder
HK07109794.2A HK1104655A1 (en) 1997-10-22 2007-09-07 Orthogonalization search for the celp based speech coding
HK08113638.3A HK1122639A1 (en) 1997-10-22 2008-12-16 Voice signal encoder and voice signal decoder
US12/357,093 US8332214B2 (en) 1997-10-22 2009-01-21 Speech coder and speech decoder
US12/362,232 US7925501B2 (en) 1997-10-22 2009-01-29 Speech coder using an orthogonal search and an orthogonal search method
US12/783,974 US8352253B2 (en) 1997-10-22 2010-05-20 Speech coder and speech decoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP08571798A JP3174756B2 (en) 1998-03-31 1998-03-31 Sound source vector generating apparatus and sound source vector generating method

Related Child Applications (7)

Application Number Title Priority Date Filing Date
JP11343086A Division JP2000132199A (en) 1999-12-02 1999-12-02 Voice encoding device/decoding device
JP2000156368A Division JP3276355B2 (en) 1998-03-31 2000-05-26 CELP-type speech decoding apparatus and CELP-type speech decoding method
JP2000156371A Division JP3276358B2 (en) 1998-03-31 2000-05-26 CELP-type speech coding apparatus and CELP-type speech coding method
JP2000156370A Division JP3276357B2 (en) 1998-03-31 2000-05-26 CELP-type speech coding apparatus and CELP-type speech coding method
JP2000156369A Division JP3276356B2 (en) 1998-03-31 2000-05-26 CELP-type speech coding apparatus and CELP-type speech coding method
JP2000156367A Division JP3276354B2 (en) 1998-03-31 2000-05-26 Diffusion vector generation device, sound source vector generation device, and sound source vector generation method
JP2000156366A Division JP3276353B2 (en) 1998-03-31 2000-05-26 Diffusion vector generation device, sound source vector generation device, and sound source vector generation method

Publications (2)

Publication Number Publication Date
JPH11282497A true JPH11282497A (en) 1999-10-15
JP3174756B2 JP3174756B2 (en) 2001-06-11

Family

ID=13866599

Family Applications (1)

Application Number Title Priority Date Filing Date
JP08571798A Expired - Lifetime JP3174756B2 (en) 1997-10-22 1998-03-31 Sound source vector generating apparatus and sound source vector generating method

Country Status (1)

Country Link
JP (1) JP3174756B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001222298A (en) * 2000-02-10 2001-08-17 Mitsubishi Electric Corp Voice encode method and voice decode method and its device
WO2003071522A1 (en) * 2002-02-20 2003-08-28 Matsushita Electric Industrial Co., Ltd. Fixed sound source vector generation method and fixed sound source codebook
WO2008072732A1 (en) * 2006-12-14 2008-06-19 Panasonic Corporation Audio encoding device and audio encoding method
JP2009527784A (en) * 2006-02-22 2009-07-30 フランス テレコム Improved encoding / decoding of digital audio signals in CELP technology

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001222298A (en) * 2000-02-10 2001-08-17 Mitsubishi Electric Corp Voice encode method and voice decode method and its device
WO2003071522A1 (en) * 2002-02-20 2003-08-28 Matsushita Electric Industrial Co., Ltd. Fixed sound source vector generation method and fixed sound source codebook
US7580834B2 (en) 2002-02-20 2009-08-25 Panasonic Corporation Fixed sound source vector generation method and fixed sound source codebook
JP2009527784A (en) * 2006-02-22 2009-07-30 フランス テレコム Improved encoding / decoding of digital audio signals in CELP technology
WO2008072732A1 (en) * 2006-12-14 2008-06-19 Panasonic Corporation Audio encoding device and audio encoding method

Also Published As

Publication number Publication date
JP3174756B2 (en) 2001-06-11

Similar Documents

Publication Publication Date Title
CA2684379C (en) A speech coder using an orthogonal search and an orthogonal search method
JP3174756B2 (en) Sound source vector generating apparatus and sound source vector generating method
JP3276356B2 (en) CELP-type speech coding apparatus and CELP-type speech coding method
JP3276358B2 (en) CELP-type speech coding apparatus and CELP-type speech coding method
JP3276354B2 (en) Diffusion vector generation device, sound source vector generation device, and sound source vector generation method
JP3276355B2 (en) CELP-type speech decoding apparatus and CELP-type speech decoding method
JP3276353B2 (en) Diffusion vector generation device, sound source vector generation device, and sound source vector generation method
JP3276357B2 (en) CELP-type speech coding apparatus and CELP-type speech coding method
JP2000132199A (en) Voice encoding device/decoding device
CA2528645C (en) Speech coder and speech decoder, orthogonal search method and speech coding method

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080330

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090330

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100330

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110330

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110330

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120330

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130330

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130330

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140330

Year of fee payment: 13

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S131 Request for trust registration of transfer of right

Free format text: JAPANESE INTERMEDIATE CODE: R313135

SZ02 Written request for trust registration

Free format text: JAPANESE INTERMEDIATE CODE: R313Z02

SZ02 Written request for trust registration

Free format text: JAPANESE INTERMEDIATE CODE: R313Z02

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term