JP2560486B2 - マルチパルス符号化装置 - Google Patents

マルチパルス符号化装置

Info

Publication number
JP2560486B2
JP2560486B2 JP1223458A JP22345889A JP2560486B2 JP 2560486 B2 JP2560486 B2 JP 2560486B2 JP 1223458 A JP1223458 A JP 1223458A JP 22345889 A JP22345889 A JP 22345889A JP 2560486 B2 JP2560486 B2 JP 2560486B2
Authority
JP
Japan
Prior art keywords
coefficient
pulse
pitch
impulse
transversal filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1223458A
Other languages
English (en)
Other versions
JPH02167600A (ja
Inventor
哲 田口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP1223458A priority Critical patent/JP2560486B2/ja
Publication of JPH02167600A publication Critical patent/JPH02167600A/ja
Application granted granted Critical
Publication of JP2560486B2 publication Critical patent/JP2560486B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はマルチパルス符号化装置に関する。
〔従来の技術〕
音声信号のスペクトル包絡情報をLPC係数等で表現し
スペクトル微細構造情報をマルチパルスで表現するマル
チパルス符号化装置の符号化速度を4.8kb/s程度まで削
減し、且つ、良好な音質を確保するために、ピッチ情報
の利用が試みられている。
ピッチ情報を利用するマルチパルス符号化装置とし
て、ピッチ予測型のもの、及びピッチ補間型のものが知
られている。
〔発明が解決しようとする課題〕
しかし、ピッチ予測型のマルチパルス符号化装置は符
号化速度を4.8kb/sまで削減すると音質が著しく劣化す
る欠点があり、又、ピッチ補間型のマルチパルス符号化
装置はピッチ分析の誤差の影響を受け易く不安である欠
点がある。
本発明の目的は、符号化速度が4.8kb/sの領域で音質
が良好であり、且つ、安定なマルチパルス符号化装置を
提供することにある。
〔課題を解決するための手段〕
本発明のマルチパルス符号化装置は、入力音声信号か
らピッチを抽出する第1の手段と、前記入力音声信号の
音源情報を表現するインパルス系列を決定する第2の手
段と、タップ位置に自由度を有し前記第2の手段が決定
した第1のインパルス系列に類似したインパルス系列を
前記第1の手段が抽出したピッチに等しい繰返し周波数
の一定振幅のインパルスの列から生成するトランスバー
サルフィルタの各タップ位置及び各タップの係数を決定
する第3の手段と、この第3の手段が決定した前記トラ
ンスバーサルフィルタに入力することにより前記入力音
声信号の音源情報を表現するインパルス系列を生成する
第2のインパルス系列を決定する第4の手段とを備え、
入力音声信号のスペクトル包絡情報、トランスバーサル
フィルタの各タップ位置及び各タップの係数情報、及び
第2のインパルス系列情報を合成側へ出力する。
〔実施例〕
次に、本発明について図面を参照して説明する。
第1図は本発明の一実施例の分析側を示すブロック
図、第2図は同じく合成側を示すブロック図である。
第1図に示す分析側は、A/D変換器1,ピッチ抽出器2,
ハミング窓3,LPC分析器4,K量子化器5,K複号化器6,K/α
変換器7,減衰係数印加器8,聴感重み付フィルタ9,矩形窓
10,インパルス応答算出器11,自己相関算出器12,相互右
相関算出器13,マルチパルス検索器14,トランスバーサル
フィルタ係数決定器15,係数量子化器16,係数複号化器1
7,インパルス応答算出器18,相互相関算出器19,自己相関
算出器20,パルス検索器21,パルス量子化器22及び多重化
回路23を備えて構成されている。
A/D変換器1は、3.4kHz以下に帯域制限されている音
声信号Siをサンプリング周波数8kHzでサンプリングし、
所要のビット数に量子化し、量子化サンプルをピッチ抽
出器2,ハミング窓3及び聴感重み付フィルタ9へ供給す
る。
ピッチ抽出器2は、入力した信号から音声信号Siのピ
ッチ情報を抽出する。
ハミング窓3,LPC分析器4,K量子化器5,K復号化器6,K/
α変換器7,減衰係数印加器8,聴感重み付フィルタ9,矩形
窓10,インパルス応答算出器11,自己相関算出器12,相互
相関算出器13及びマルチパルス検索器14は、以下に述べ
る如く公知の手法により、分析フレーム同期である2.0m
s(分析フレーム周波数は50Hz)ごとに、音声信号Siの
音源情報を表現するインパルス系列であるマルチパルス
を決定する。
即ち、ハミング窓3,LPC分析器4及びK量子化器は、A
/D変換器1から入力した信号を分析フレーム周期ごとに
ハミング窓処理し、線形予測(linear predictive codi
ng;LPC)分析して部分自己相関係数であるKパラメータ
を抽出し、量子化したKパラメータを多重化回路23へ出
力する。K量子化器5で量子化されたKパラメータは、
K復号化器6で複号化されて量子化雑音を含んだKパラ
メータになり、K/α変換器7でαパラメータに変換され
る。減衰係数印加回路8は、K/α変換器7が出力したα
パラメータに減衰係数を印加する。これらαパラメータ
及び減衰係数の印加されたαパラメータを係数とする標
準型フィルタである聴感重み付フィルタ9は、A/D変換
器1から入力した信号を聴感重み付し、聴感重み付され
た信号は矩形窓10により分析フレームごとに矩形窓処理
される。インパルス応答算出器11,自己相関算出器12,相
互相関算出器13及びマルチパルス検索器14は、減衰係数
印加器8で減衰係数を印加したαパラメータを係数とす
る全極型フィルタのインパルス応答を算出し、算出した
インパルス応答の自己相関係数列を算出し、又、このイ
ンパルス応答と矩形窓10の出力、即ち、聴感重み付した
音声信号Siとの相互相関係数列を算出し、これら自己相
関係数列及び相互相関係数列からマルチパルスの振幅及
び位置を決定する。
以下、音声信号Siが有声である場合についてまず説明
する。
一般に、音声信号が有声である場合、マルチパルスを
ピッチの周期で区切ると各区間のパルスパターンはほぼ
等しい。従って、タップ位置に自由度を有するトランス
バーサルフィルタの各タップ位置及び各タップの係数を
適当に設定し、このトランスバーサルフィルタにピッチ
と等しい繰返し周波数の一定振幅のインパルス列を入力
することにより、マルチパルスに類似したインパルス系
列を発生させることができる。また、このトランスバー
サルフィルタに設定すべき係数及びタップ位置の情報で
マルチパルスの振幅及び位置の情報を置換えれば、マル
チパルスの表現に要するビット数を大幅に削減できる。
音声信号Siが有声である場合、トランスバーサルフィル
タ係数決定器15は、ピッチ抽出器2から入力したピッチ
情報を用い、マルチパルス検索器14が出力したマルチパ
ルスの情報を置換える(トランスバーサルフィルタの)
係数及びタップ位置の情報を決定する。決定された係数
及びタップ位置は、係数量子化器16で量子化され、多重
化回路23へ出力される。
さて、マルチパルス検索器14が出力したマルチパルス
は、合成側においてLPC合成フィルタ等の近接予測フィ
ルタを駆動すべきインパルス系列の1つの解である。係
数量子化器16の出力信号を係数復号化器17で復号化した
信号をフィルタ係数に用いて構成したトランスバーサル
フィルタに音声信号Siのピッチと等しい繰返し周波数の
一定振幅のインパルス列を入力することにより、マルチ
パルス検索器14が出力したマルチパルスに類似したイン
パルス系列を発生させることができる。しかし、このよ
うにして発生したインパルス系列は、合成側において接
近予測フィルタを駆動すべき理想的なマルチパルスに対
する種々の誤差を含んでいる。これら誤差の補正を計る
ため、係数量子化器16の出力信号を復号して用いて構成
したトランスバーサルフィルタに入力することにより音
声信号Siの音源情報であるマルチパルスを生成するイン
パルス系列を決定する。このインパルス系列は、合成側
において係数量子化器16の出力信号を用いて構成したト
ランスバーサルフィルタ及び近接予測フィルタを縦続接
続した回路を駆動すべきインパルス系列であり、係数復
号化器17,インパルス応答算出器18,相互相関算出器19,
自己相関算出器20及びパルス検察器21により以下述べる
ようにして決定される。
係数復号化器17は、係数量子化器16の出力信号を符号
し、量子化雑音を含んだ係数及びタップ位置を出力す
る。インパルス応答算出器18は、係数復号化器17及び減
衰定数印加器8から入力した信号を用い、係数復号化器
17が出力した係数及びタップ位置を係数及びタップ位置
とするトランスバーサルフィルタ及び減衰係数印加8で
減衰係数を印加したαパラメータを係数とする全極フィ
ルタを縦続接続した回路のインパルス応答を算出する
と、自己相関算出器12,相互相関算出器13及びマルチパ
ルス検索器14がインパルス応答算出器11及び矩形窓10の
出力信号を用いてマルチパルスを決定したのと同様にし
て、相互相関算出器19,自己相関算出器20及びパルス検
索器21はインパルス応答算出器18及び矩形窓10の出力信
号を用いてインパルス系列を決定する。音声信号Siのピ
ッチと等しい繰返し周期の一定振幅のインパルス列とパ
ルス検索器21が出力するインパルス系列との相違は、音
声信号Siの音源情報であるマルチパルスの情報を係数復
号化器17の出力信号であるトランスバーサルフィルタの
情報で置換えたときの誤差に対応するものであり、比較
的小さいので、パルス検索器21はピッチ抽出器2が抽出
したピッチ情報を利用して演算量を削減している。パル
ス量子化器22は、パルス検索器21が出力したインパルス
系列を量子化し、多重化回路22へ出力する。この量子化
は、ピッチ抽出器2が抽出したピッチ、及び、このピッ
チと等しい繰返し周波数の一定振幅のインパルス列に対
する量子化すべきインパルス系列のずれの形で行われ、
インパルス系列を直接に量子化するのと比較して所要ビ
ット数を削減している。
次にインパルス応答算出器18の構成を図を用いて詳細
に説明する。第3図はインパルス応答算出器18の構成を
示すブロック図である。第3図に示すインパルス応答算
出器18はインパルス発生器181,トランスバーサルフィル
タ271,LPC合成フィルタ301により構成される。尚トラン
スバーサルフィルタ271及びLPC合成フィルタ301は合成
側を構成するトランスバーサルフィルタ27及びLPC合成
フィルタ30と同一のブロックである。
インパルス発生器181は50Hzの繰返し、即ちフレーム
周期毎にインパルスを発生しトランスバーサルフィルタ
271へ出力する。トランスバーサルフィルタ271のフィル
タ係数は係数復号化器17より供給される。トランスバー
サルフィルタ271は前記インパルスを入力し、インパル
ス列をLPC合成フィルタ301へ出力する。無論このインパ
ルス列はマルチパルス検索器14の出力を“1"ピッチ周期
分切出したパルス列とほぼ等価なものである。LPC合成
フィルタ301のフィルタ係数は減衰係数印加器8により
供給される。LPC合成フィルタ301は前記インパルス列よ
り連続性のある(サンプリング系列)波形を合成し出力
する。この出力がインパルス応答算出器18の出力とな
る。尚、この出力は聴感重み付けフィルタ9の出力波形
の“1"ピッチ周期分のリプリカを意味するものである。
多重化回路23は、K量子化器5が量子化したKパラメ
ータ、係数量子化器16が量子化したトランスバーサルフ
ィルタの情報、パルス量子化器22が量子化したインパル
ス系列の情報を時分割多重化して分析フレーム周期に等
しいフレーム周期のフレームを構成し、合成側へ出力す
る。
次に、音声信号Siが無声である場合について説明す
る。
この場合、トランスバーサルフィルタ係数決定器15,
パルス検索器21及びパルス量子化器22は、ピッチ抽出器
2から入力したピッチ情報により音声信号Siが無声であ
ると判断し、それぞれ下記の如くに動作する。この場
合、トランスバーサルフィルタ係数決定器15はインパル
ス応答器18を制御してインパルス応答算出器11と同じ動
作をさせ、パルス検索器21はマルチパルス検索器14と同
じ動作をする。その結果、パルス検索器21はマルチパル
ス検索器14が出力したのと同じマルチパルスを出力し、
パルス量子化器22はこのマルチパルス及びピッチ抽出器
2から入力したピッチ情報をそれぞれ直接に量子化す
る。多重化回路23は、この場合、K量子化器5及びパル
ス量子化器22からの入力信号のみを時分割多重化してフ
レームを構成し、合成側へ出力する。
以上、第1図に示す分析側の構成及び動作について説
明した。
第2図に示す合成側は、分離回路24,パルス復号化器2
5,係数復号化器26,トランスバーサルフィルタ27,K復号
化器28,K/α変換器29,LPC合成フィルタ30及びD/A変換器
31を備えて構成されている。
分離回路24は、分析側から伝送されてきた信号を多重
化回路23による多重化の前の状態に分離する。分離され
たインパルス系列の情報はパルス復号化器25でインパル
ス系列及びピッチ情報に復号される。音声信号Siが有声
の場合にはトランスバーサルフィルタの情報が係数復号
化器26に入力し、タップ位置及び係数に復号化され、タ
ップ位置に自由度を有するトランスバーサルフィルタ27
の各タップ位置及び各係数を設定する。又、トランスバ
ーサルフィルタ27は、パルス復号化器25から入力したピ
ッチ情報により音声信号Siが無声であると判断すると、
タップ0、いいかえれば遅延“0"のタップのみ係数を
“1"にし、他の係数をすべて“0"にする。このようにし
て各タップ位置及び各係数の設定されたトランスバーサ
ルフィルタ27にパルス復号化器25からインパルス系列が
入力し、マルチパルスが出力される。一方、分離された
Kパラメータは、K復号化器28で復号化され、K/α変換
器29でαパラメータに変換される。これらαパラメータ
を係数とする全極型フィルタであるLPC合成フィルタ30
にトランスバーサルフィルタ27からマルチパルスが入力
され、LPC合成フィルタ30の出力信号がD/A変換器31でア
ナログ化され、音声信号Siの合成音声信号として出力さ
れる。
以上、第2図に示す合成側の構成及び動作について説
明した。
第1図及び第2図に示す実施例はピッチ抽出器2が抽
出したピッチ情報を利用して音源情報を表現するビット
数を削減しているが、パルス検索器21がピッチ抽出誤差
をも補正すべく出力したインパルス系列を用いて音声信
号を合成しており、合成にピッチ情報を直接には用いな
いので、ピッチ抽出器2のピッチ抽出誤差により動作が
不安定になることはない。
第1図及び第2図に示す実施例は分析フレーム周波数
を50Hzにしているので、符号化速度を4.8kb/sとする
と、多重回路23が出力するフレームのフレーム長は96ビ
ットとなる。このフレームのビットアロケーションにつ
いて説明する。
音声信号Siが有声である場合、実用上考慮すべきピッ
チの範囲は、1分析フレーム中におけるピッチの区間数
にして10区間〜2区間である。ピッチの区間数が10区間
〜4区間の場合、伝送するインパルス系列のパルス数を
(ピッチ区間数+1)、即ち、11〜5とし、3区間又は
2区間の場合はパルス数を3又は2にする。伝送するパ
ルス数が11のとき、ピッチ周期に7ビット、第1パルス
の位置に5ビット、第2〜第11のパルスの位置に10ビッ
トを配分し、これら総計22ビットをパルス量子化器22に
配分する。トランスバーサルフィルタ係数決定器15が決
定するトランスバーサルフィルタのタップ数は5個に固
定するものとし、伝送するパルス数が上記の11のとき、
係数量子化器16に31ビットを配分する。タップ0の係数
が最大係数値になるように伝送するインパルス系列を決
定しておくものとし、31ビット中の7ビットを最大係数
値、2ビット×4を残り4係数の相対値、4ビット×4
をタップ0以外の4タップのタップ位置に配分する。イ
ンパルス系列の表現に22ビット、トランスバーサルフィ
ルタの表現に31ビットを配分した残りの43ビットを、K
パラメータに42ビット(このビット数で10〜12次のKパ
ラメータを表現出来る)、フレーム同期ビットにしビッ
ト配分する。
伝送するインパルス系列のパルス数が1個減少すると
パルス位置を表現するビットが1ビット不要になるの
で、不要になったビットをKパラメータに配分する。こ
のようにして、パルス数が7のときにはKパラメータ46
ビットを配分できる。Kパラメータの量子化ビット数を
これ以上増加しても品質向上の効果は少ないので、パル
ス数が6又はそれ以下の場合は、Kパラメータへの配分
ビット数が42〜46ビットの範囲内でパルス位置やトラン
スバーサルフィルタのタップ位置の量子化ビット数を増
加する。
音声信号Siが無声の場合は、インパルス系列の表現に
70ビットを配分し、Kパラメータに25ビットを配分し、
残りの1ビットをフレーム同期ビットとする。無声音の
場合はKパラメータに配分するビット数をこの程度に減
少しても有声音の場合と比較して、品質劣化は許容でき
る。インパルス系列に配分した70ビットは、ピッチ情報
に7ビット、最大振幅に7ビット、各パルスのパルス位
置及び相対振幅に40ビット及び16ビットを配分する。
〔発明の効果〕
以上説明したように本発明は、ピッチ情報を用いてマ
ルチパルスの情報をトランスバーサルフィルタの情報に
置換えることによりマルチパルスの表現に要するビット
数を大幅に削減し、更に、マルチパルスを発生するため
にトランスバーサルフィルタに入力すべきインパルス系
列を決定することにより、4.8kb/sという低い符号化速
度の領域においても音質を良好にでき、しかも、ピッチ
分析の誤差の影響を受けて動作が不安定になることなく
安定に動作できる効果がある。
【図面の簡単な説明】
第1図は本発明の一実施例の分析側を示すブロック図、
第2図は同じく合成側を示すブロック図、第3図はイン
パルス応答算出器18を説明するためのブロック図であ
る。 1……A/D変換器、2……ピッチ抽出器、3……ハミン
グ窓、4……LPC分析器、5……K量子化器、6……K
複合化器、7……K/α変換器、8……減衰係数印加器、
9……聴感重み付フィルタ、10……矩形窓、11……イン
パルス応答算出器、12……自己相関算出器、13……相互
相関算出器、14……マルチパルス検索器、15……トラン
スバーサルフィルタ係数決定器、16……係数量子化器、
17……係数復号化器、18……インパルス応答算出器、19
……相互相関算出器、20……自己相関算出器、21……パ
ルス検索器、22……パルス量子化器、23……多重化回
路、24……分離回路、25……パルス復号化器、26……係
数復号化器、27……トランスバーサルフィルタ、28……
K復号化器、29……K/α変換器、30……LPC合成フィル
タ、31……D/A変換。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】入力音声信号からピッチを抽出する第1の
    手段と、前記入力音声信号の音源情報を表現するインパ
    ルス系列を決定する第2の手段と、タップ位置に自由度
    を有し前記第2の手段が決定した第1のインパルス系列
    に類似したインパルス系列を前記第1の手段が抽出した
    ピッチに等しい繰返し周波数の一定振幅のインパルスの
    列から生成するトランスバーサルフィルタの各タップ位
    置及び各タップの係数を決定する第3の手段と、この第
    3の手段が決定した前記トランスバーサルフィルタに入
    力することにより前記入力音声信号の音源情報を表現す
    るインパルス系列を生成する第2のインパルス系列を決
    定する第4の手段とを備え、入力音声信号のスペクトル
    包絡情報、トランスバーサルフィルタの各タップ位置及
    び各タップの係数情報、及び第2のインパルス系列情報
    を出力することを特徴とするマルチパルス符号化装置。
JP1223458A 1988-09-05 1989-08-29 マルチパルス符号化装置 Expired - Lifetime JP2560486B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1223458A JP2560486B2 (ja) 1988-09-05 1989-08-29 マルチパルス符号化装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP22283588 1988-09-05
JP63-222835 1988-09-05
JP1223458A JP2560486B2 (ja) 1988-09-05 1989-08-29 マルチパルス符号化装置

Publications (2)

Publication Number Publication Date
JPH02167600A JPH02167600A (ja) 1990-06-27
JP2560486B2 true JP2560486B2 (ja) 1996-12-04

Family

ID=26525112

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1223458A Expired - Lifetime JP2560486B2 (ja) 1988-09-05 1989-08-29 マルチパルス符号化装置

Country Status (1)

Country Link
JP (1) JP2560486B2 (ja)

Also Published As

Publication number Publication date
JPH02167600A (ja) 1990-06-27

Similar Documents

Publication Publication Date Title
US5018200A (en) Communication system capable of improving a speech quality by classifying speech signals
JPS6046440B2 (ja) 音声処理方法とその装置
US6678655B2 (en) Method and system for low bit rate speech coding with speech recognition features and pitch providing reconstruction of the spectral envelope
USRE43099E1 (en) Speech coder methods and systems
US4791670A (en) Method of and device for speech signal coding and decoding by vector quantization techniques
US4991215A (en) Multi-pulse coding apparatus with a reduced bit rate
JP2586043B2 (ja) マルチパルス符号化装置
KR0155315B1 (ko) Lsp를 이용한 celp보코더의 피치 검색방법
JP2560486B2 (ja) マルチパルス符号化装置
JPH0738118B2 (ja) マルチパルス符号化装置
Esteban et al. 9.6/7.2 kbps voice excited predictive coder (VEPC)
JPH087597B2 (ja) 音声符号化器
JP2853126B2 (ja) マルチパルス符号化装置
JP2560860B2 (ja) マルチパルス型音声符号化及び復号化装置
JP2853170B2 (ja) 音声符号化復号化方式
JP2898641B2 (ja) 音声符号化装置
JP3071800B2 (ja) 適応ポストフィルタ
JPH0411040B2 (ja)
JP2847730B2 (ja) 音声符号化方式
JP2581050B2 (ja) 音声分析合成装置
JP3103108B2 (ja) 音声符号化装置
JPH10105200A (ja) 音声符号化/復号化方法
JPH01179999A (ja) ピッチ抽出装置
JPS6189737A (ja) 音声分析合成装置
JPH0437999B2 (ja)