JPH05289698A - 音声符号化法 - Google Patents

音声符号化法

Info

Publication number
JPH05289698A
JPH05289698A JP4088911A JP8891192A JPH05289698A JP H05289698 A JPH05289698 A JP H05289698A JP 4088911 A JP4088911 A JP 4088911A JP 8891192 A JP8891192 A JP 8891192A JP H05289698 A JPH05289698 A JP H05289698A
Authority
JP
Japan
Prior art keywords
vector
adaptive
distortion
noise
adaptive codebook
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4088911A
Other languages
English (en)
Other versions
JP2700974B2 (ja
Inventor
Takehiro Moriya
健弘 守谷
Satoshi Miki
聡 三樹
Kazunori Mano
一則 間野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP4088911A priority Critical patent/JP2700974B2/ja
Publication of JPH05289698A publication Critical patent/JPH05289698A/ja
Application granted granted Critical
Publication of JP2700974B2 publication Critical patent/JP2700974B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【目的】 音声の非定常な区間でも符号化歪みを小さく
する。 【構成】 適応符号帳として、過去の励振信号をピッチ
周期で切り出した従来と同様の適応ベクトルの他に、雑
音ベクトルよりなる固定ベクトルをいくつか用いる。従
来と同様にこの適応符号帳から最も歪みの少ないベクト
ルを選択するが、音声の定常的区間では適応ベクトルか
ら選択され、非定常的区間では固定ベクトルから選択さ
れる。固定ベクトルは過去の励振信号の符号誤りの影響
を受けない。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明はピッチ周期の成分ベク
トルをもつ適応符号帳と、雑音成分ベクトルをもつ雑音
符号帳とがフィルタの励振源として用いられ、そのフィ
ルタにより合成された音声の波形と入力音声の波形との
歪みが最小となるように励振ベクトルを決定し、音声の
信号系列を少ない情報量でディジタル符号化する高能率
音声符号化法に関するものである。
【0002】
【従来の技術】ディジタル移動無線通信や音声蓄積サー
ビスでは電波や記憶媒体の効率的利用を図るために、種
々の高能率音声符号化法が用いられている。8KHzサ
ンプルの音声を8kbit/s程度で符号化する方法と
してはCELP、VSELP、マルチパルス符号化、重
み付きベクトル量子化により変換符号化等が知られてい
るが、いずれも波形歪みを小さく抑える有効な手段とし
て、前方予測型のピッチ予測が用いられている。
【0003】すなわち、5msから30ms程度を1フ
レームとして、現在量子化しようとするフレームの音声
信号がもつ周期を分析して、その周期を6から8ビット
で伝送している。ピッチ周期を決定す際には、波形歪み
を小さくするために、合成後の波形歪みを尺度としてピ
ッチ周期を決定する方法や、非整数値の周期を用いる方
法が有効である。
【0004】またピッチ周期を利用した具体的処理手順
としては、ピッチ周期毎に過去の励振信号を、現在の分
析開始時点からピッチ周期サンプル点だけさかのぼった
時点まで波形セグメントとして切り出し、必要に応じて
その波形セグメントを繰り返したベクトルを作成し、そ
れを符号帳のベクトルとみなす手法(適応符号帳) が有
力である。この適応符号帳のベクトルで合成フィルタへ
励振し、得られた合成波形の入力音声に対する歪みが最
小になる適応符号帳のベクトルを選択してピッチ周期を
決定する。
【0005】このようなピッチ周期決定法を用いた従来
の符号化方法を、図4に示す。入力端子11に入力され
た原音声について音声分析部12において、その周波数
スペクトルの包絡形状を表すパラメータが計算される。
この分析には通常、線形予測法が用いられる。その線形
予測パラメータは線形予測パラメータ符号化部13で符
号化され、その符号化出力は分岐され、線形予測パラメ
ータ復号化部14で復号化され、その復号化された線形
予測パラメータが線形予測合成フィルタ15のフィルタ
係数として設定される。
【0006】適応符号帳16において直前の過去の駆動
音源ベクトルをある周期(ピッチ周期) に相当する長さ
で切り出し、その切り出したベクトルをフレームの長さ
になるまで繰り返し、音声の周期成分と対応する時系列
符号ベクトルの候補が出力される。また雑音符号帳1
7,18から音声の非周期成分と対応する時系列符号ベ
クトルの候補が出力される。雑音符号帳17,18は通
常白色ガウス性雑音を基調とし、1フレーム分の長さの
各種の符号ベクトルが入力音声とは独立にあらかじめ記
憶されている。
【0007】適応符号帳16,雑音符号帳17,18か
らの各時系列ベクトルの候補は重みつき加算部19にお
いて、それぞれ乗算部211 ,212 ,213 で重みg
1 ,g2 ,g3 が乗算され、これら乗算出力は加算部2
2で加算される。この加算出力は駆動音源ベクトルとし
て線形予測合成フィルタ15へ供給され、合成フィルタ
15から合成(再生) 音声が出力される。この合成音声
の入力端子11からの原音声に対する歪みが距離計算部
23で計算され、その計算結果に応じて符号帳検索部2
4により、適応符号帳16における切り出し長さをかえ
た候補が選択され、かつ雑音符号帳17,18から他の
符号ベクトルが選択され、さらに重みつき加算部19の
重みg1 ,g2 ,g3 が変更され、距離計算部23で計
算された歪みが最小になるようにされる。歪み最小とな
ったときの適応符号帳16の切り出し長を示す周期符号
と、雑音符号帳17,18の各符号ベクトルを示す雑音
符号と、重みg1 ,g2 ,g3 を示す重み符号と、線形
予測パラメータ符号とが符号化出力として出力され、伝
送または蓄積される。
【0008】
【発明が解決しようとする課題】ところが、過去の励振
ベクトルが現在の入力音声と大きく異なる場合、すなわ
ち音声波形の過渡的な部分あるいはピッチの周期性が小
さい部分では、適応符号帳のベクトルのどのベクトルで
も十分歪みを小さくできないという問題がある。このた
め音声の周期性を判定して、無声部分では適応符号帳を
用いない手法が考えられるが、補助情報が必要であった
り、波形歪みを小さくする観点からは必ずしも有効でな
かった。
【0009】この発明の目的は少ない情報量のもとで音
声符号化による波形歪みを小さくするため、ピッチの周
期性の有無に柔軟に対応できる適応符号帳を構成する音
声符号化法を提供することにある。
【0010】
【課題を解決するための手段】この発明では、適応符号
帳に、過去の励振信号を切り出した従来と同様のベクト
ルの他に雑音ベクトルよりなる固定ベクトルを用意し、
この適応符号帳の全ベクトル中の歪みが最小となる符号
を選択する。このような構成であるため、音声の定常的
な部分あるいは非定常的な部分によらず波形歪みを小さ
くできる。
【0011】
【実施例】図1にこの発明の符号化法で用いる適応符号
帳の構成例を示す。図1において図4と対応する部分に
同一符号を付けてある。この発明では適応符号帳31中
のベクトルの一部に固定ベクトルを用意する。例えばこ
の適応符号帳31に8ビットを割り当てることとする
と、256種のベクトルを用意することになる。このう
ち、64個を雑音ベクトルを固定ベクトル32とし、の
こりの192個をピッチ周期に対応させて過去の励振信
号を切り出して作成した適応ベクトル33とする。25
6個のベクトルを励振源として波形を合成し、入力に対
する歪みが最も小さくなるベクトルを選択する。
【0012】定常的で周期性の高い部分では自動的にピ
ッチ周期に対応するベクトル33が選ばれる。その反対
に周期性の低い部分では周期性のない固定ベクトル32
が選ばれることになる。復号器では送られてきた符号か
ら自動的にピッチ周期に対応する適応ベクトル33か固
定ベクトル32かのいずれかが用いられる。なお固定ベ
クトル32は予め学習音声を用いて作成しておくとさら
に歪みを小さくできる。また適応符号帳31のなかでの
適応ベクトル33と固定ベクトル32との比率も別のパ
ラメータで制御することが可能である。
【0013】図2Aは適応ベクトル33と固定ベクトル
32の歪み評価関数を伝送路符号誤り率で制御する例を
示す。適応ベクトル33は伝送路に符号誤りが生じ、あ
る音声区間に大きな歪みが生ずると、そのあとで符号誤
りが無くなっても、影響を次の区間に及ぼすという問題
がある。これは適応ベクトル33が過去に復号化した励
振信号を切り出すことで作られているためである。この
点、固定ベクトル32は過去の復号化音声に依存しない
ので、符号誤りの影響を伝播させることはない。従って
適応ベクトル33を用いた場合の合成音声波形に対する
歪みを評価する歪み評価部34と、固定ベクトル32を
用いた場合の合成音声波形に対する歪みを評価する歪み
評価部35とに歪み評価部を分け、これら両歪み評価部
34,35でなされた各ベクトルに対する歪み評価を総
合比較部36で、伝送路の符号誤り率に応じて、何れの
ベクトルを選択するかの判定を行う。
【0014】例えば伝送路に符号誤りが生じる場合には
固定ベクトル32を優先的に選択するようにバイアスを
与える等の手段で、適応ベクトル33と固定ベクトル3
2とで歪み評価関数に差をつければ符号誤りの影響を軽
減することが可能である。もちろん歪み評価関数に差を
つけることで符号誤りの無いときの符号化歪みは僅かに
増加することになる。図2Aでは伝送路の状態が観測さ
れるならばその状態によって評価関数を制御することで
伝送路の状態に適応させた符号化を可能とした場合であ
る。
【0015】これまでも伝送路の状態に適応させて、冗
長ビット数やパラメータのビット数を制御する方法は多
く知られているが、いずれも符号器でビット配分等を変
更したことを遅れなくかつ正しく復号器に伝える必要が
あった。これには別の情報が必要でかつ、この制御情報
に誤りがあると復号器での歪みはきわめて大きくなって
しまう。図2Aに示す実施例ではビット配分等の符号の
構成は固定のまま、より符号誤りの影響の少ないベクト
ルが選ばれる確率が高くなるように制御するだけである
から、復号器には制御を必要としない。
【0016】図2Bには適応符号帳31の別の構成例を
示す。固定の励振信号(ランダム雑音) 37から取り出
し部分を位相シフトして各別の固定ベクトル32とす
る。適応ベクトル33は過去の励振信号38をピッチ周
期の長さだけ切り出して作成するものであるが、この例
では同じ様に切り出し処理で固定ベクトル32を作成す
ることができる。
【0017】図3では適応符号帳31のもとになるベク
トルを、過去の励振信号38と固定の波形39とを一つ
の系列に統合した場合である。想定した最大のピッチ周
期を越えると、自動的に固定の波形39の部分から波形
を切り出してくることになる。このため、半固定ベクト
ル41に示すようにベクトルの一部の要素だけは過去の
励振信号38で、残りの要素は固定波形39から切り出
される場合も有り得る。この図の場合、図2Bの例と同
様に固定ベクトルのためのメモリ容量が大幅に節約でき
るとともに適応符号帳31を作成する処理が簡明になる
という利点がある。
【0018】
【発明の効果】以上述べたようにこの発明によれば、適
応符号帳31のなかにいくらかの固定のベクトルを用意
することで非定常な音声区間でも符号化歪みを小さくで
きる。また固定ベクトルは過去の励振信号の符号誤りの
影響を受けないという利点もある。さらに固定ベクトル
と適応ベクトルの歪み尺度の制御で、伝送路の符号誤り
率に符号化特性を適応させることが可能となる。
【図面の簡単な説明】
【図1】この発明の実施例の要部である適応符号帳の構
成例を示す図。
【図2】その適応符号帳の他の例を示す図。
【図3】その適応符号帳の更に他の例を示す図。
【図4】従来の音声符号化装置の一例を示すブロック
図。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 音声信号を一定サンプル数ごとに線形予
    測分析し、合成フィルタ係数を求め、そのフィルタの励
    振源としてピッチ周期の成分ベクトルをもつ適応符号帳
    と雑音成分ベクトルをもつ雑音符号帳等を備え、合成後
    の波形が入力音声の波形に対し歪みが最小となるように
    励振ベクトルを決定する符号化法において、 上記適応符号帳のなかの一部の符号に固定の雑音ベクト
    ルを割り当て、残りの符号に過去の励振信号をピッチ周
    期で切り出した適応ベクトルを割り当て、最も歪みの少
    ないベクトルを選択して符号を伝送することを特徴とす
    る音声符号化法。
  2. 【請求項2】 上記適応符号帳のうち、雑音ベクトルを
    選ぶ評価関数と適応ベクトルを選ぶ評価関数とを独立に
    もち、伝送路の符号誤りの状態に適応させて評価関数を
    制御し、伝送路誤りが多い場合には雑音ベクトルが優先
    的に選ばれるように設定することを特徴とする請求項1
    に記載の音声符号化法。
JP4088911A 1992-04-09 1992-04-09 音声符号化法 Expired - Lifetime JP2700974B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4088911A JP2700974B2 (ja) 1992-04-09 1992-04-09 音声符号化法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4088911A JP2700974B2 (ja) 1992-04-09 1992-04-09 音声符号化法

Publications (2)

Publication Number Publication Date
JPH05289698A true JPH05289698A (ja) 1993-11-05
JP2700974B2 JP2700974B2 (ja) 1998-01-21

Family

ID=13956130

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4088911A Expired - Lifetime JP2700974B2 (ja) 1992-04-09 1992-04-09 音声符号化法

Country Status (1)

Country Link
JP (1) JP2700974B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000008633A1 (fr) * 1998-08-06 2000-02-17 Matsushita Electric Industrial Co., Ltd. Generateur de signaux d'excitation, codeur vocal et decodeur vocal

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4414705B2 (ja) 2003-09-17 2010-02-10 パナソニック株式会社 音源信号符号化装置、及び音源信号符号化方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61194921A (ja) * 1985-02-22 1986-08-29 Nec Corp 適応ベクトル量子化装置
JPS6454497A (en) * 1987-06-26 1989-03-01 American Telephone & Telegraph Core excitation linear prediction vocoder and method therefor

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61194921A (ja) * 1985-02-22 1986-08-29 Nec Corp 適応ベクトル量子化装置
JPS6454497A (en) * 1987-06-26 1989-03-01 American Telephone & Telegraph Core excitation linear prediction vocoder and method therefor

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000008633A1 (fr) * 1998-08-06 2000-02-17 Matsushita Electric Industrial Co., Ltd. Generateur de signaux d'excitation, codeur vocal et decodeur vocal

Also Published As

Publication number Publication date
JP2700974B2 (ja) 1998-01-21

Similar Documents

Publication Publication Date Title
US5778334A (en) Speech coders with speech-mode dependent pitch lag code allocation patterns minimizing pitch predictive distortion
US6202046B1 (en) Background noise/speech classification method
KR100304682B1 (ko) 음성 코더용 고속 여기 코딩
US5305421A (en) Low bit rate speech coding system and compression
US5729655A (en) Method and apparatus for speech compression using multi-mode code excited linear predictive coding
US6249758B1 (en) Apparatus and method for coding speech signals by making use of voice/unvoiced characteristics of the speech signals
EP0833305A2 (en) Low bit-rate pitch lag coder
US6910009B1 (en) Speech signal decoding method and apparatus, speech signal encoding/decoding method and apparatus, and program product therefor
JPH08179795A (ja) 音声のピッチラグ符号化方法および装置
EP0557940A2 (en) Speech coding system
JPH0944195A (ja) 音声符号化装置
JPH1097294A (ja) 音声符号化装置
KR100465316B1 (ko) 음성 부호화기 및 이를 이용한 음성 부호화 방법
US5884252A (en) Method of and apparatus for coding speech signal
JP2700974B2 (ja) 音声符号化法
JP3153075B2 (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JPH06131000A (ja) 基本周期符号化装置
JP2968109B2 (ja) コード励振線形予測符号化器及び復号化器
JPH08185199A (ja) 音声符号化装置
JP3099836B2 (ja) 音声の励振周期符号化方法
JPH0519796A (ja) 音声の励振信号符号化・復号化方法
JP3229784B2 (ja) 音声符号化復号化装置及び音声復号化装置
JP3226180B2 (ja) 音声のピッチ周期符号化法
JPH08320700A (ja) 音声符号化装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081003

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091003

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101003

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111003

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121003

Year of fee payment: 15

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121003

Year of fee payment: 15