JPH05289698A - 音声符号化法 - Google Patents
音声符号化法Info
- Publication number
- JPH05289698A JPH05289698A JP4088911A JP8891192A JPH05289698A JP H05289698 A JPH05289698 A JP H05289698A JP 4088911 A JP4088911 A JP 4088911A JP 8891192 A JP8891192 A JP 8891192A JP H05289698 A JPH05289698 A JP H05289698A
- Authority
- JP
- Japan
- Prior art keywords
- vector
- adaptive
- distortion
- noise
- adaptive codebook
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
する。 【構成】 適応符号帳として、過去の励振信号をピッチ
周期で切り出した従来と同様の適応ベクトルの他に、雑
音ベクトルよりなる固定ベクトルをいくつか用いる。従
来と同様にこの適応符号帳から最も歪みの少ないベクト
ルを選択するが、音声の定常的区間では適応ベクトルか
ら選択され、非定常的区間では固定ベクトルから選択さ
れる。固定ベクトルは過去の励振信号の符号誤りの影響
を受けない。
Description
トルをもつ適応符号帳と、雑音成分ベクトルをもつ雑音
符号帳とがフィルタの励振源として用いられ、そのフィ
ルタにより合成された音声の波形と入力音声の波形との
歪みが最小となるように励振ベクトルを決定し、音声の
信号系列を少ない情報量でディジタル符号化する高能率
音声符号化法に関するものである。
ビスでは電波や記憶媒体の効率的利用を図るために、種
々の高能率音声符号化法が用いられている。8KHzサ
ンプルの音声を8kbit/s程度で符号化する方法と
してはCELP、VSELP、マルチパルス符号化、重
み付きベクトル量子化により変換符号化等が知られてい
るが、いずれも波形歪みを小さく抑える有効な手段とし
て、前方予測型のピッチ予測が用いられている。
レームとして、現在量子化しようとするフレームの音声
信号がもつ周期を分析して、その周期を6から8ビット
で伝送している。ピッチ周期を決定す際には、波形歪み
を小さくするために、合成後の波形歪みを尺度としてピ
ッチ周期を決定する方法や、非整数値の周期を用いる方
法が有効である。
としては、ピッチ周期毎に過去の励振信号を、現在の分
析開始時点からピッチ周期サンプル点だけさかのぼった
時点まで波形セグメントとして切り出し、必要に応じて
その波形セグメントを繰り返したベクトルを作成し、そ
れを符号帳のベクトルとみなす手法(適応符号帳) が有
力である。この適応符号帳のベクトルで合成フィルタへ
励振し、得られた合成波形の入力音声に対する歪みが最
小になる適応符号帳のベクトルを選択してピッチ周期を
決定する。
の符号化方法を、図4に示す。入力端子11に入力され
た原音声について音声分析部12において、その周波数
スペクトルの包絡形状を表すパラメータが計算される。
この分析には通常、線形予測法が用いられる。その線形
予測パラメータは線形予測パラメータ符号化部13で符
号化され、その符号化出力は分岐され、線形予測パラメ
ータ復号化部14で復号化され、その復号化された線形
予測パラメータが線形予測合成フィルタ15のフィルタ
係数として設定される。
音源ベクトルをある周期(ピッチ周期) に相当する長さ
で切り出し、その切り出したベクトルをフレームの長さ
になるまで繰り返し、音声の周期成分と対応する時系列
符号ベクトルの候補が出力される。また雑音符号帳1
7,18から音声の非周期成分と対応する時系列符号ベ
クトルの候補が出力される。雑音符号帳17,18は通
常白色ガウス性雑音を基調とし、1フレーム分の長さの
各種の符号ベクトルが入力音声とは独立にあらかじめ記
憶されている。
らの各時系列ベクトルの候補は重みつき加算部19にお
いて、それぞれ乗算部211 ,212 ,213 で重みg
1 ,g2 ,g3 が乗算され、これら乗算出力は加算部2
2で加算される。この加算出力は駆動音源ベクトルとし
て線形予測合成フィルタ15へ供給され、合成フィルタ
15から合成(再生) 音声が出力される。この合成音声
の入力端子11からの原音声に対する歪みが距離計算部
23で計算され、その計算結果に応じて符号帳検索部2
4により、適応符号帳16における切り出し長さをかえ
た候補が選択され、かつ雑音符号帳17,18から他の
符号ベクトルが選択され、さらに重みつき加算部19の
重みg1 ,g2 ,g3 が変更され、距離計算部23で計
算された歪みが最小になるようにされる。歪み最小とな
ったときの適応符号帳16の切り出し長を示す周期符号
と、雑音符号帳17,18の各符号ベクトルを示す雑音
符号と、重みg1 ,g2 ,g3 を示す重み符号と、線形
予測パラメータ符号とが符号化出力として出力され、伝
送または蓄積される。
ベクトルが現在の入力音声と大きく異なる場合、すなわ
ち音声波形の過渡的な部分あるいはピッチの周期性が小
さい部分では、適応符号帳のベクトルのどのベクトルで
も十分歪みを小さくできないという問題がある。このた
め音声の周期性を判定して、無声部分では適応符号帳を
用いない手法が考えられるが、補助情報が必要であった
り、波形歪みを小さくする観点からは必ずしも有効でな
かった。
声符号化による波形歪みを小さくするため、ピッチの周
期性の有無に柔軟に対応できる適応符号帳を構成する音
声符号化法を提供することにある。
帳に、過去の励振信号を切り出した従来と同様のベクト
ルの他に雑音ベクトルよりなる固定ベクトルを用意し、
この適応符号帳の全ベクトル中の歪みが最小となる符号
を選択する。このような構成であるため、音声の定常的
な部分あるいは非定常的な部分によらず波形歪みを小さ
くできる。
帳の構成例を示す。図1において図4と対応する部分に
同一符号を付けてある。この発明では適応符号帳31中
のベクトルの一部に固定ベクトルを用意する。例えばこ
の適応符号帳31に8ビットを割り当てることとする
と、256種のベクトルを用意することになる。このう
ち、64個を雑音ベクトルを固定ベクトル32とし、の
こりの192個をピッチ周期に対応させて過去の励振信
号を切り出して作成した適応ベクトル33とする。25
6個のベクトルを励振源として波形を合成し、入力に対
する歪みが最も小さくなるベクトルを選択する。
ッチ周期に対応するベクトル33が選ばれる。その反対
に周期性の低い部分では周期性のない固定ベクトル32
が選ばれることになる。復号器では送られてきた符号か
ら自動的にピッチ周期に対応する適応ベクトル33か固
定ベクトル32かのいずれかが用いられる。なお固定ベ
クトル32は予め学習音声を用いて作成しておくとさら
に歪みを小さくできる。また適応符号帳31のなかでの
適応ベクトル33と固定ベクトル32との比率も別のパ
ラメータで制御することが可能である。
32の歪み評価関数を伝送路符号誤り率で制御する例を
示す。適応ベクトル33は伝送路に符号誤りが生じ、あ
る音声区間に大きな歪みが生ずると、そのあとで符号誤
りが無くなっても、影響を次の区間に及ぼすという問題
がある。これは適応ベクトル33が過去に復号化した励
振信号を切り出すことで作られているためである。この
点、固定ベクトル32は過去の復号化音声に依存しない
ので、符号誤りの影響を伝播させることはない。従って
適応ベクトル33を用いた場合の合成音声波形に対する
歪みを評価する歪み評価部34と、固定ベクトル32を
用いた場合の合成音声波形に対する歪みを評価する歪み
評価部35とに歪み評価部を分け、これら両歪み評価部
34,35でなされた各ベクトルに対する歪み評価を総
合比較部36で、伝送路の符号誤り率に応じて、何れの
ベクトルを選択するかの判定を行う。
固定ベクトル32を優先的に選択するようにバイアスを
与える等の手段で、適応ベクトル33と固定ベクトル3
2とで歪み評価関数に差をつければ符号誤りの影響を軽
減することが可能である。もちろん歪み評価関数に差を
つけることで符号誤りの無いときの符号化歪みは僅かに
増加することになる。図2Aでは伝送路の状態が観測さ
れるならばその状態によって評価関数を制御することで
伝送路の状態に適応させた符号化を可能とした場合であ
る。
長ビット数やパラメータのビット数を制御する方法は多
く知られているが、いずれも符号器でビット配分等を変
更したことを遅れなくかつ正しく復号器に伝える必要が
あった。これには別の情報が必要でかつ、この制御情報
に誤りがあると復号器での歪みはきわめて大きくなって
しまう。図2Aに示す実施例ではビット配分等の符号の
構成は固定のまま、より符号誤りの影響の少ないベクト
ルが選ばれる確率が高くなるように制御するだけである
から、復号器には制御を必要としない。
示す。固定の励振信号(ランダム雑音) 37から取り出
し部分を位相シフトして各別の固定ベクトル32とす
る。適応ベクトル33は過去の励振信号38をピッチ周
期の長さだけ切り出して作成するものであるが、この例
では同じ様に切り出し処理で固定ベクトル32を作成す
ることができる。
トルを、過去の励振信号38と固定の波形39とを一つ
の系列に統合した場合である。想定した最大のピッチ周
期を越えると、自動的に固定の波形39の部分から波形
を切り出してくることになる。このため、半固定ベクト
ル41に示すようにベクトルの一部の要素だけは過去の
励振信号38で、残りの要素は固定波形39から切り出
される場合も有り得る。この図の場合、図2Bの例と同
様に固定ベクトルのためのメモリ容量が大幅に節約でき
るとともに適応符号帳31を作成する処理が簡明になる
という利点がある。
応符号帳31のなかにいくらかの固定のベクトルを用意
することで非定常な音声区間でも符号化歪みを小さくで
きる。また固定ベクトルは過去の励振信号の符号誤りの
影響を受けないという利点もある。さらに固定ベクトル
と適応ベクトルの歪み尺度の制御で、伝送路の符号誤り
率に符号化特性を適応させることが可能となる。
成例を示す図。
図。
Claims (2)
- 【請求項1】 音声信号を一定サンプル数ごとに線形予
測分析し、合成フィルタ係数を求め、そのフィルタの励
振源としてピッチ周期の成分ベクトルをもつ適応符号帳
と雑音成分ベクトルをもつ雑音符号帳等を備え、合成後
の波形が入力音声の波形に対し歪みが最小となるように
励振ベクトルを決定する符号化法において、 上記適応符号帳のなかの一部の符号に固定の雑音ベクト
ルを割り当て、残りの符号に過去の励振信号をピッチ周
期で切り出した適応ベクトルを割り当て、最も歪みの少
ないベクトルを選択して符号を伝送することを特徴とす
る音声符号化法。 - 【請求項2】 上記適応符号帳のうち、雑音ベクトルを
選ぶ評価関数と適応ベクトルを選ぶ評価関数とを独立に
もち、伝送路の符号誤りの状態に適応させて評価関数を
制御し、伝送路誤りが多い場合には雑音ベクトルが優先
的に選ばれるように設定することを特徴とする請求項1
に記載の音声符号化法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4088911A JP2700974B2 (ja) | 1992-04-09 | 1992-04-09 | 音声符号化法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4088911A JP2700974B2 (ja) | 1992-04-09 | 1992-04-09 | 音声符号化法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH05289698A true JPH05289698A (ja) | 1993-11-05 |
JP2700974B2 JP2700974B2 (ja) | 1998-01-21 |
Family
ID=13956130
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4088911A Expired - Lifetime JP2700974B2 (ja) | 1992-04-09 | 1992-04-09 | 音声符号化法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2700974B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000008633A1 (fr) * | 1998-08-06 | 2000-02-17 | Matsushita Electric Industrial Co., Ltd. | Generateur de signaux d'excitation, codeur vocal et decodeur vocal |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4414705B2 (ja) | 2003-09-17 | 2010-02-10 | パナソニック株式会社 | 音源信号符号化装置、及び音源信号符号化方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61194921A (ja) * | 1985-02-22 | 1986-08-29 | Nec Corp | 適応ベクトル量子化装置 |
JPS6454497A (en) * | 1987-06-26 | 1989-03-01 | American Telephone & Telegraph | Core excitation linear prediction vocoder and method therefor |
-
1992
- 1992-04-09 JP JP4088911A patent/JP2700974B2/ja not_active Expired - Lifetime
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61194921A (ja) * | 1985-02-22 | 1986-08-29 | Nec Corp | 適応ベクトル量子化装置 |
JPS6454497A (en) * | 1987-06-26 | 1989-03-01 | American Telephone & Telegraph | Core excitation linear prediction vocoder and method therefor |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000008633A1 (fr) * | 1998-08-06 | 2000-02-17 | Matsushita Electric Industrial Co., Ltd. | Generateur de signaux d'excitation, codeur vocal et decodeur vocal |
Also Published As
Publication number | Publication date |
---|---|
JP2700974B2 (ja) | 1998-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5778334A (en) | Speech coders with speech-mode dependent pitch lag code allocation patterns minimizing pitch predictive distortion | |
US6202046B1 (en) | Background noise/speech classification method | |
KR100304682B1 (ko) | 음성 코더용 고속 여기 코딩 | |
US5305421A (en) | Low bit rate speech coding system and compression | |
US5729655A (en) | Method and apparatus for speech compression using multi-mode code excited linear predictive coding | |
US6249758B1 (en) | Apparatus and method for coding speech signals by making use of voice/unvoiced characteristics of the speech signals | |
EP0833305A2 (en) | Low bit-rate pitch lag coder | |
US6910009B1 (en) | Speech signal decoding method and apparatus, speech signal encoding/decoding method and apparatus, and program product therefor | |
JPH08179795A (ja) | 音声のピッチラグ符号化方法および装置 | |
EP0557940A2 (en) | Speech coding system | |
JPH0944195A (ja) | 音声符号化装置 | |
JPH1097294A (ja) | 音声符号化装置 | |
KR100465316B1 (ko) | 음성 부호화기 및 이를 이용한 음성 부호화 방법 | |
US5884252A (en) | Method of and apparatus for coding speech signal | |
JP2700974B2 (ja) | 音声符号化法 | |
JP3153075B2 (ja) | 音声符号化装置 | |
JP3299099B2 (ja) | 音声符号化装置 | |
JPH06131000A (ja) | 基本周期符号化装置 | |
JP2968109B2 (ja) | コード励振線形予測符号化器及び復号化器 | |
JPH08185199A (ja) | 音声符号化装置 | |
JP3099836B2 (ja) | 音声の励振周期符号化方法 | |
JPH0519796A (ja) | 音声の励振信号符号化・復号化方法 | |
JP3229784B2 (ja) | 音声符号化復号化装置及び音声復号化装置 | |
JP3226180B2 (ja) | 音声のピッチ周期符号化法 | |
JPH08320700A (ja) | 音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081003 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091003 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101003 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111003 Year of fee payment: 14 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121003 Year of fee payment: 15 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121003 Year of fee payment: 15 |