JPH0475100A - 符号化装置 - Google Patents

符号化装置

Info

Publication number
JPH0475100A
JPH0475100A JP2188438A JP18843890A JPH0475100A JP H0475100 A JPH0475100 A JP H0475100A JP 2188438 A JP2188438 A JP 2188438A JP 18843890 A JP18843890 A JP 18843890A JP H0475100 A JPH0475100 A JP H0475100A
Authority
JP
Japan
Prior art keywords
signal
linear
prediction
filter
residual signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2188438A
Other languages
English (en)
Other versions
JP2736157B2 (ja
Inventor
Jiyungo Kitou
鬼頭 淳悟
Tomokazu Morio
智一 森尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2188438A priority Critical patent/JP2736157B2/ja
Publication of JPH0475100A publication Critical patent/JPH0475100A/ja
Application granted granted Critical
Publication of JP2736157B2 publication Critical patent/JP2736157B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野] 音声信号の情報を圧縮して伝送及び蓄積する符号化装置
に関する。
[従来の技術] 一般に音声信号は近接サンプル間の相関がかなり高いの
で、近接サンプルの信号系列から線形予測(短期予測)
により音声信号を効率良く情報圧縮する方法が広く用い
られている。
また、音声信号の有音声にはピッチ周期のように比較的
時間間隔の広い冗長性があり、この冗長性に対しても線
形予測によりピッチ予測(長期予測)を行って音声信号
を更に効率良く情報圧縮する方法が用いられている。
上述の二つの線形予測を用いた低ビツトレートの音声符
号化方法として、CELP (コード・エキサイテツド
φリニア・プレディクション・コーディング(Code
−Excited Linea+ !’redicti
on coding ) )が盛んに研究されている。
CELPを用いて音声を符号化する従来の符号化装置は
、予測残差信号を短時間(例えば5m5ec)のベクト
ルとして取り扱うことによりベクトル量子化の技術を用
いて予測残差信号を低ビットレートで符号化している。
第3図にCELPを用いたの従来の符号化装置、第4図
に第3図に示す符号化装置に対応する復号化装置をそれ
ぞれ示す。
以下、第3図に示す符号化装置を説明する。
AD変換器35は、入力端子から入力されたアナログ音
声信号をデジタルデータに変換して一定のサンプル長(
例えば5m5ec)の入力ベクトル■として線形予測分
析器36及び減算器37に出力する。
線形予測分析器36は、AD変換器35により変換され
たデジタルデータを線形予測分析する。ここで線形予測
分析として、スペクトル予測(近接予測)及びピッチ予
測(長期予測)の両者を含むものとする。なお、線形予
測分析器36で分析結果として得られた予測係数ベクト
ルβは、線形予測器38にaカされると共にマルチプレ
クサ39にも出力される。コードブック40は、一定の
サンプル長を有しておりゲイン正規化された残差信号波
形(以後、コードワードと称する)を複数(例えば10
24種類)記憶する。
最適コードワード選択器41はコードブック40に記憶
されたコードワードをその指示により選択し、コードブ
ック40は最適コードワード選択器41により選択され
たコードワードをゲイン掛は算器42に出力する。ゲイ
ン掛は算器42は、最適コードワード選択器4Iにより
選択されたコードワードを増幅して線形予測器38及び
加算器43などで構成される合成フィルタに出力する。
合成フィルタは、ゲイン掛は算器42で増幅されたコー
ドワードを入力して合成信号ベクトルV′を算出する。
減算器37は、合成信号ベクトルv′ と入力ベクトル
■との誤差、即ちエラーを算出する。
聴覚的重み付はフィルタ44は、減算器37で算出され
たエラーにスペクトルマスキング効果を考慮する。パワ
ー算出器45は、エラーの二乗誤差を計算する。最適コ
ードワード選択器41は、二乗誤差が最小となるコード
ワード及びゲインを選択して、選択されたコードワード
を特定する指標値Iをマルチプレクサ39に出力する。
マルチプレクサ39は、予測係数ベクトルβ、残差利得
り及び残差信号を特定する指標Iをマルチプレックスし
て伝送路に送出する。
上述のコードワードのコードブック40の作成方法とし
ては、実際の長時間の音声信号を分析して残差信号を算
出してベクトル量子化により作成する方法、ホワイト−
ガウシアン(White−Gaussian)のランダ
ム信号で擬似的に作成する方法がある。
次に第4図に示す復号化装置を説明する。
デマルチプレクサ47は、伝送路46から受信した信号
を予測係数ベクトルβ、残差利得り及び残差信号を特定
する指標値Iにそれぞれ分解する。
コードブック48は、上述の符号化器のコードブック4
0と同じ内容を有しており、残差信号を特定する指標値
Iに基づきコードワードを掛は算器49に出力する。掛
は算器49は、コードブック48から出力されたコード
ワードを入力して受信した残差利得りにより増幅する。
受信した予測係数ベクトルβを係数とする線形予測器5
0及び加算器51により構成された合成フィルタは、掛
は算器49で増幅されたコードワードを入力して再生信
号ベクトルをDA変換器52に出力する。DA変換器5
2は合成フィルタから出力された再生信号をアナログ信
号に変換する。
上記のCELPを用いた従来の符号化装置は、破裂子音
の破裂時点、無音及び無声子音から母音定常部への過渡
区間などでは異なるコードブックを用いて符号化した方
が効率的に音声を圧縮できることが示唆されている(「
コード・エキサイテツド・リニア・プレディクション(
CEPL):ハイ・クォリティ・スピーチ・アト・ヴ工
り−・ロウ嘗ビット・レイン(Code−Exceed
 Linea+P+ediction(CH,P):)
ligh Qaal目y 5peech at Ver
7Low Bit Rates) J 、エム・アール
・シュレーダー及びビー・ニス・アタル(M、 R,5
chroedu andB、 S、八+al)共著、 
ICASR,1985、参照)。
〔発明が解決しようとする問題点] しかしながら、CELPを用いた上述の従来の符号化装
置には、コードブックの内容が音声の長時間統計分析の
結果により最適化されて設定されており、短時間的に発
声された音声に対して最適ではないという問題点がある
。また、従来の符号化装置には、線形予測で全極モデル
により音声信号をモデル化しているため、子音、特に鼻
子音区間の残差信号に、全極モデルによっては表現する
ことができないスペクトルの零点の情報が含まれており
、子音及び鼻子音に対する符号化が難しいという問題点
がある。
本発明の目的は、上述の従来の符号化装置における問題
点に鑑み、複数の残差信号コードブックの中から使用す
るコードブックを選択して効率良く音声を符号化するこ
とができる符号化装置を提供することにある。
[問題点を解決するための手段] 本発明の上述した目的は、音声信号を線形予測分析して
予測信号を出力する分析手段と、予測信号に基づいて音
声信号の残差信号を算出する予測手段と、残差信号のス
ペクトル形状に対応する指標信号を出力する分類手段と
、正規化された残差信号波形を記憶する複数のコードブ
ックと、指標信号に基づいて複数のコードブックから使
用する残差信号波形を選択する選択手段と、選択された
残差信号波形及び予測信号により合成信号を出力するフ
ィルタとを備えており、選択手段は、フィルタからの出
力に基づいて残差信号波形を特定する指標値を出力する
符号化装置によって達成される。
[作用] 分析手段は音声信号を線形予測分析して予測信号を出力
し、予測手段は予測信号に基づいて音声信号の残差信号
を算出し、分類手段は残差信号のスペクトル形状に対応
する指標信号を出力し、複数のコードブックは正規化さ
れた残差信号波形を記憶しており、フィルタは選択され
た残差信号波形及び予測信号により合成信号を出力し、
選択手段は指標信号に基づいて複数のコードブックから
使用する残差信号波形を選択してフィルタからの出力に
基づいて残差信号波形を特定する指標値を出力する。
[実施例] 以下、本発明の符号化装置の一実施例を図面を参照して
説明する。
第1図は本実施例における符号化装置の構成を示す。
第1図に示す符号化装置は、AD変換器11、分析手段
としての線形予測分析器12.+3、予測手段としての
線形予測器14.15、残差信号コードブック16、掛
は算器17、加算器18、減算器19、聴覚的重み付は
フィルタ20、パワー算出器21、選択手段としての最
適コードワード選択器22、マルチプレクサ23、高速
フーリエ変換器(以後、FFTと称する)24、逆高速
フーリエ変換器(以後、逆FFTと称する)25、スペ
クトル反転器26及び分類手段としての分類器27によ
り構成されている。
次に上述の符号化装置の動作を説明する。
AD変換器11は入力端子から入力されたアナログ音声
信号をデジタルデータに変換して、一定のサンプル長(
例えば5m5ec)の入力ベクトルSとして線形予測分
析器12及び減算器19に出力する。
線形予測分析器12は、AD変換器11により変換され
たデジタルデータを線形予測分析する。
ここでは線形予測分析としてスペクトル予測の近接予測
及びピッチ予測の長期予測を含むものとする。分析は複
数の入力ベクトル(例えば4つのベクトル、即ち2Qm
scc毎)に対して実施され、分析の結果得られた予測
信号としての線形予測ベクトルαは、線形予測器14.
15及びマルチプレクサ23に出力される。
線形予測器15は分析側に配置されており、線形予測分
析器12から出力された線形予測ベクトルαにより駆動
されて入力音声の残差信号を算出する。
なお、線形予測分析器12で充分に線形予測が行われて
いれば、線形予測器15により算出される残差信号は、
音声信号に含まれている零点、即ち反共振点によるスペ
クトルの谷を含む。
上述の零点のスペクトル概形は、以下の各ステップによ
り推定する。
FFT24(例えばポイント数が256点)により算出
した残差信号を周波数分析してパワースペクトルに変換
する(ステップ31)。パワースペクトル成分毎にスペ
クトル反転器26によりスペクトル反転を実施する。こ
こで反転されたスペクトル成分をSi1パワ一スペクト
ル成分をStとすると、5ixSi=1で表される。但
しi=0〜(N−1) 、N=FFT24のポイント数
とする(ステップS2)。逆FFT器25によりスペク
トル反転したものに逆FFTを施して時間波形に戻す(
ステップS3)。
上述のステップ81〜ステツプS3の操作によりパワー
スペクトルの零型表現を橋形表現に変換できる。そして
、線形予測分析器13により線形予測分析を行って線形
予測ベクトルα′を抽出し、抽出された線形予測ベクト
ルα′をベクトル量子化方法を用いた分類器27により
数種類に分類し、分類されたスペクトル形状の指標信号
としての指標jを出力する(ステップS4)。
上記の各ステップS1〜S4を経たあと、分類器27か
ら出力されたスペクトル形状の指標jに基づいて、予め
備えられている複数のコードブック16から最適コード
ワード選択器22により使用するコードブックを選択す
る(複数のコードブック16の作成方法は後述する)。
なお、分類器27より出力されたスペクトル形状の指標
jはマルチプレクサ23にもaカされる。
複数のコードブック16を構成するコードブックのそれ
ぞれには、一定のサンプル長を有しており、ゲイン正規
化された残差信号波形(コードワード)が複数(例えば
256種類)記憶されている。
最適コードワード選択器22の指示により選択された全
てのコードワードは、ゲイン掛は算器17で増幅される
ゲイン掛は算器17で増幅されたコードワードは、線形
予測器14及び加算器18などで構成された合成フィル
タに出力される。合成フィルタは増幅されたコードワー
ドを入力して合成信号ベクトルS′を出力する。
減算器19は、合成フィルタから出力された合成信号ベ
クトルS′ とAD変換器11から出力された入力ベク
トルSとの誤差、即ちエラーを算出する。
減算器19により算出されたエラーは、聴覚重み付はフ
ィルタ20によりスペクトルマスキング効果が考慮され
る。
パワー算出器21は、聴覚重み付はフィルタ20から出
力されたスペクトルマスキング効果が考慮されたエラー
の二乗誤差を計算して最適コードワード選択器22に出
力する。
最適コードワード選択器22は、パワー算出器21によ
り算出されたエラーの二乗誤差が最小となるコードワー
ド及びゲインを選択して、選択されたコードワードを特
定する指標値1ndexをマルチプレクサ23に出力す
る。
マルチプレクサ23は、線形予測ベクトルα、残差利得
g1コードブック選択のための指標j及びコードワード
を特定する指標値1ndexのそれぞれをマルチプレッ
クスして伝送路28に送る。
次に上述の複数のコードブック16の作成方法について
説明する。
複数のコードブック16は、長時間の実際の音声信号を
分析して残差信号を得て、得られた残差信号を更にベク
トル量子化することにより作成する。
その作成方法の手順は、まず従来のサイズ(例えば10
24〜2048種類のコードワード)の残差信号のコー
ドブックを作成する。そして作成されたコードブックを
使用して、コードブック作成に用いた長時間の実際の音
声信号を符号化し、残差信号のスペクトル形状の指標・
とじての形状指標jごとに使用頻度の高いコードワード
を一定個数(例えば256種)選択する。上記のように
して複数のコードブックを作成する。
第2図は第1図の符号化装置に対応する復号化装置の構
成を示す。
第2図に示す復号化装置は、デマルチプレクサ29、複
数のコードブック30、掛は算器31、加算器32、線
形予測器33及びDA変換器34により構成される。
次に上述の復号化装置の動作について説明する。
デマルチプレクサ29は、伝送路28から受信した信号
を線形予測ベクトルα、残差利得g1残差スペクトル形
状の形状指標j及び残差信号を特定する指標値1nde
xに分解して、分解された残差スペクトル形状の形状指
標j及び残差信号を特定する指標値1ndexを複数の
コードブック30に、残差利得gを加算器32に、線形
予測ベクトルαを線形予測器33にそれぞれ出力する。
デマルチプレクサ29から出力された形状指標jに基づ
いて、あらかじめ蓄えられている複数のコードブック3
0から使用するコードブックを選択する。ここで複数の
コードブック30は符号化装置におけるコードブック1
6の内容と同じ内容を有している。選択されたフードブ
ック30の指標値1ndexに基づくコードワードは掛
は算器31に出力される。
掛は算器31は受信した残差利得gにより入力されたコ
ードワードを増幅して合成フィルタに出力する。受信し
た線形予測ベクトルαを係数とする線形予測器33で構
成された合成フィルタは、増幅されたコードワードを入
力して再生信号ベクトルを出力する。そしてDA変換器
34は、合成フィルタから出力された再生信号ベクトル
を入力してアナログの音声信号に変換する。
[発明の効果コ 音声信号を線形予測分析して予測信号を出力する分析手
段と、予測信号に基づいて音声信号の残差信号を算出す
る予測手段と、残差信号のスペクトル形状に対応する指
標信号を出力する分類手段と、正規化された残差信号波
形を記憶する複数のコードブックと、指標信号に基づい
て複数のコードブックから使用する残差信号波形を選択
する選択手段と、選択された残差信号波形及び予測信号
により合成信号を出力するフィルタとを備えており、選
択手段は、フィルタからの出力に基づいて残差信号波形
を特定する指標値を出力するので、適切な残差信号のコ
ードブックを選択することかでき、その結果、子音及び
鼻子音に対して高能率で符号化が可能な符号化装置を得
ることができる。
【図面の簡単な説明】
第1図は本発明の符号化装置における一実施例の構成を
示すブロック図、第2図は第1図に示す符号化装置に対
応する復号化装置の一構成例を示すブロック図、第3図
は従来の符号化装置の一構成例を示すのブロック図、第
4図は第3図に示す符号化装置に対応する復号化装置の
一構成例を示すブロック図である。 11・・・AD変換器、12.13・・・線形予測分析
器、14、15.33・・・線形予測器、16.30・
・・コードブック、17.31・・・掛は算器、18.
32・・・加算器、19・・・減算器、20・・・聴覚
的重み付はフィルタ、21・・・パワー算出器、22・
・・最適コードワード選択器、23・・・マルチプレク
サ、24・・・FFT、25・・・逆FFT、26・・
・スペクトル反転器、27・・・分類器、28・・・デ
マルチプレクサ、34・・・DA変換器。

Claims (1)

    【特許請求の範囲】
  1. 音声信号を線形予測分析して予測信号を出力する分析手
    段と、前記予測信号に基づいて前記音声信号の残差信号
    を算出する予測手段と、前記残差信号のスペクトル形状
    に対応する指標信号を出力する分類手段と、正規化され
    た残差信号波形を記憶する複数のコードブックと、前記
    指標信号に基づいて前記複数のコードブックから使用す
    る残差信号波形を選択する選択手段と、前記選択された
    残差信号波形及び前記予測信号により合成信号を出力す
    るフィルタとを備えており、前記選択手段は、前記フィ
    ルタからの出力に基づいて前記残差信号波形を特定する
    指標値を出力することを特徴とする符号化装置。
JP2188438A 1990-07-17 1990-07-17 符号化装置 Expired - Fee Related JP2736157B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2188438A JP2736157B2 (ja) 1990-07-17 1990-07-17 符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2188438A JP2736157B2 (ja) 1990-07-17 1990-07-17 符号化装置

Publications (2)

Publication Number Publication Date
JPH0475100A true JPH0475100A (ja) 1992-03-10
JP2736157B2 JP2736157B2 (ja) 1998-04-02

Family

ID=16223683

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2188438A Expired - Fee Related JP2736157B2 (ja) 1990-07-17 1990-07-17 符号化装置

Country Status (1)

Country Link
JP (1) JP2736157B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998006091A1 (fr) * 1996-08-02 1998-02-12 Matsushita Electric Industrial Co., Ltd. Codec vocal, support sur lequel est enregistre un programme codec vocal, et appareil mobile de telecommunications
JP2002123299A (ja) * 2000-08-09 2002-04-26 Sony Corp 音声処理装置および音声処理方法、学習装置および学習方法、並びにプログラムおよび記録媒体
US7912711B2 (en) 2000-08-09 2011-03-22 Sony Corporation Method and apparatus for speech data
JP2013011920A (ja) * 2011-06-28 2013-01-17 Kddi Corp 少ないコードブックの情報量によって高次元の特徴ベクトルを検索する検索装置及びプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01258000A (ja) * 1988-04-08 1989-10-16 Nec Corp 音声信号符号化復号化方法並びに音声信号符号化装置及び音声信号復号化装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01258000A (ja) * 1988-04-08 1989-10-16 Nec Corp 音声信号符号化復号化方法並びに音声信号符号化装置及び音声信号復号化装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998006091A1 (fr) * 1996-08-02 1998-02-12 Matsushita Electric Industrial Co., Ltd. Codec vocal, support sur lequel est enregistre un programme codec vocal, et appareil mobile de telecommunications
US6226604B1 (en) 1996-08-02 2001-05-01 Matsushita Electric Industrial Co., Ltd. Voice encoder, voice decoder, recording medium on which program for realizing voice encoding/decoding is recorded and mobile communication apparatus
US6421638B2 (en) 1996-08-02 2002-07-16 Matsushita Electric Industrial Co., Ltd. Voice encoding device, voice decoding device, recording medium for recording program for realizing voice encoding/decoding and mobile communication device
US6549885B2 (en) 1996-08-02 2003-04-15 Matsushita Electric Industrial Co., Ltd. Celp type voice encoding device and celp type voice encoding method
US6687666B2 (en) 1996-08-02 2004-02-03 Matsushita Electric Industrial Co., Ltd. Voice encoding device, voice decoding device, recording medium for recording program for realizing voice encoding/decoding and mobile communication device
JP2002123299A (ja) * 2000-08-09 2002-04-26 Sony Corp 音声処理装置および音声処理方法、学習装置および学習方法、並びにプログラムおよび記録媒体
US7912711B2 (en) 2000-08-09 2011-03-22 Sony Corporation Method and apparatus for speech data
JP4736266B2 (ja) * 2000-08-09 2011-07-27 ソニー株式会社 音声処理装置および音声処理方法、学習装置および学習方法、並びにプログラムおよび記録媒体
JP2013011920A (ja) * 2011-06-28 2013-01-17 Kddi Corp 少ないコードブックの情報量によって高次元の特徴ベクトルを検索する検索装置及びプログラム

Also Published As

Publication number Publication date
JP2736157B2 (ja) 1998-04-02

Similar Documents

Publication Publication Date Title
US5787391A (en) Speech coding by code-edited linear prediction
EP1353323B1 (en) Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound
US6249758B1 (en) Apparatus and method for coding speech signals by making use of voice/unvoiced characteristics of the speech signals
JPH1091194A (ja) 音声復号化方法及び装置
JPH0990995A (ja) 音声符号化装置
US6768978B2 (en) Speech coding/decoding method and apparatus
JP3531780B2 (ja) 音声符号化方法および復号化方法
JPH0475100A (ja) 符号化装置
JP2658816B2 (ja) 音声のピッチ符号化装置
JPH09261065A (ja) 量子化装置及び逆量子化装置及び量子化逆量子化システム
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
JP2796408B2 (ja) 音声情報圧縮装置
JP3088204B2 (ja) コード励振線形予測符号化装置及び復号化装置
Dong-jian Two stage concatenation speech synthesis for embedded devices
Li et al. Basic audio compression techniques
JPH07168596A (ja) 音声符号化装置
JP3010655B2 (ja) 圧縮符号化装置及び方法、並びに復号装置及び方法
JP3024467B2 (ja) 音声符号化装置
JP3468862B2 (ja) 音声符号化装置
JP2001154683A (ja) 音声合成装置とその方法及び音声合成プログラムを記録した記録媒体
JP3271966B2 (ja) 符号化装置及び符号化方法
JP3230380B2 (ja) 音声符号化装置
JPH05281999A (ja) 巡回符号帳を用いる音声符号化装置
JPH0667696A (ja) 音声符号化方法
JPH0497199A (ja) 音声符号化方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees