JPS58102297A

JPS58102297A - 音声符号化方式

Info

Publication number: JPS58102297A
Application number: JP56200852A
Authority: JP
Inventors: 来山　征士; 谷戸　文広; 明榑松
Original assignee: Kokusai Denshin Denwa KK
Current assignee: KDDI Corp
Priority date: 1981-12-15
Filing date: 1981-12-15
Publication date: 1983-06-17
Also published as: US4610022A; GB2113055B; JPS6011360B2; GB2113055A

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】本発明は音声の高能率符号化方式の改良に関する。

仁の種の方式では、音声の符号化に際してはアナログあ
るいはデジタル信号で表わされた入力音声を予測パラメ
ータと予測誤差信号に努析し、予測パラメータはそのま
ま符号化するが、予測誤差信号５社基数スペクトルは平
坦であるがその帯域が非常に広いのでベースバンド成分
だけを抽出して符号化し１両符号化信号を伝送や蓄積に
用いる。一方、同符号化信号から音声を復元するには、
本来は予測誤差信号そのものを予測パラメータて制御し
て音声を合成すべきであるが、伝送また祉蓄積された符
号化信号からはベースバンド成分しか得られないので、
このベースバンド成分とその高調波成分との和を励振信
号として予測誤差信号の代シに用いている・し九がって
励振信号の周波数スペクトルが予ＩＩＩＷ１４差信号と
同じ（平坦でないと、良好な合成音声が得られない。

従来１’ｌ　ｓｐ励振信号の周波数スペクトルが長時間
の平均で平坦となるように、高調波成分に対するエン７
アシス回路の周波数特性及び増幅器の利得が設定されて
いたため、Ｊｌ好な合成音声が得られなかった０以上の
ことを、第１図ないし第２図（４〜（０によ）詳説する
。なお、説明の簡単のため入力音声信号１をアナログ信
号として説明するが、デジタル信号であっても同様であ
る。

第１図は従来方式を示し、入力音声信号１は予＃ｉＩｍ
２に入力され、その線形予測器２ａによ）線形予測パラ
メータ３に分析され、符号器２ｂによ〉符号化され九符
号化予測パラメータ４でトランスバーサル・フィルタの
よ）ナフィｋ１２Ｃの周波数特性を制御することにより
、予測誤差信号５を得る。即ち、音声はある種の衝撃的
な音及び白色雑音が基になシこれが喉や口腔などのなす
フィルタを通ったものと考えられるので、衝撃音及び白
色雑音とフィルタの周波数特性とで音声を表現できる。

線形予測器２ａはこのフィルタの周波数特性を予測する
ものであり、予測パラメータ３はその特性を表現してい
る。フィルタ２Ｃは喉などがなすフィルタの逆特性を持
つように予測パラメータで周波数特性を制御されるもの
であシ、そのため予測が正しいほどフィルタ２＠の出力
即ち予測誤差信号５社基本の衝撃音波形若しくは白色雑
音波形に等しくなシ、その周波数スペクトルは第２図（
ａ）の如く平坦になる。なお、フィルタ２Ｃの制御に符
号化予測パラメータ４を用いているのは、符号化の際の
量子化誤差を予測誤差信号５に吸収させるためである。

予測誤差信号５をそのまま符号化すると膨大なビット数
を必要とするため、例えばｆｅ−８００Ｈ！　（Ｄ　Ｅ
’−パスフィルタ６によシ第２図（６）の如くベースバ
ンド成分７だけを抽出しこれを符号器８によ如符号化し
、この符号化ベースバンド成分９及び上述した符号化予
測パラメータ４を伝送あるいは蓄積に供する。１０は伝
送路あるいは蓄積用メモリである。なお、ローパスフィ
ルタ６で除かれた予測誤差信号５の高域成分はベースバ
ンド成分７の高調波であるから、後述の如く音声の合成
に際しベースバンド成分から作　　　　　１シ出して補
充する〇伝送あるいは蓄積された後、符号化ベースバンド成分９
及び符号化予測パラメータ４はそれぞれ復号１１１１，
１２で復号化され、復号器１１０出力紘ｐ−パスフィル
タ１３により復号化雑音を除去され元のベースバンド成
分７と同じ復号化ベースバンド成分１４となる。この復
号化ベースバンド成分１４は非線形回路１５に入力され
て第２図（ｅ）の如くその高調波成分を含む信号１６が
作られ、この信号１６がエンファシス回路１７によｐ第
２図（句の如く高域強調波成分１８とされる。しかるの
ちバイパスフィルタ１９に通され、先に０−パスフィル
タ６や１３で除かれてしまった高域成分に対応する信号
２０が第２図（ｅ）の如く得られる。この高域成分２０
は増幅器２１によシ増幅されてベースバンド成分１４に
対する高調波成分２２となシ５加算回路２３によｐ加え
合わされて励振信号２４になる。

合成フィルタ２Ｓは例えばトランスパーナル・フィルタ
であって復号化予測パラメータ２６によシ周波数特性を
制御され、喉などがなすフィルタと略同−の周波数特性
で励振信号２４を通すことによ〕合成音声出力２７が得
られる。なお１合成フィルタ２５の制御は符号化予測パ
ラメータ４で直接性われることもある。

しかし−、エン７アシス回路１７の周波数特性及び増幅
器２１の利得は前述の如く励振信号２４のスペクトルを
長時間平均で平坦化するように設定されているため、短
時間でのスペクトルは第２図（ｆ）の如く平坦になって
おらず、したがって合成音声の品質が良くなかった。

本発明状励振信号の短時間スペクトルが平坦となる音声
符号化方式を提供する仁とを目的とする。そのため本発
明では、非線形回路によシ生成した高調波成分を予測器
に入力して短時間スペクトルが平坦な高調波成分を作成
し、これをレベル検出手段からの信号によシ利得が制御
される可変増幅器によシベースバンド成分とレベル合わ
せしてから加算して全体のスペクトルを平坦化する。以
下５図面に基づいて本発明を説明する。なお、図中で従
来技術と同一部分には同一符号を付して説明の重複を省
く。

第３図は本発明の一実施例を示し、第１図の従来方式に
対し、エン７アシス回路１７の次段に予測器２８を設け
、増幅器２１０代シに可変増幅器２９を用い、仁の可変
増幅器２９の利得をレベル検出手段をなす２つのレベル
測定器３０゜３１の出力ａ、ｂで制御する構成である。

したがって従来方式と異なるところだけ説明すると、次
Ｃ）：Ｉｋシである。

予測器２８は入力音声信号１に対する予測器２と同機能
のものであるが、予測パラメータ３２の符号化は不要で
あるから、線形予測ｓ２８＆トドランスパーナル・フィ
ルタのような特性制御の可能なフィルタ２８ｂとからな
る。したがって、エンファシス回路１７からの高域強調
波成分１８は予測器２８の動作原理によ）第４図（荀の
如く高域の周波数スペクトルが平坦な信号３３に変換さ
れる。この信号３３は従来と同じくバイパスフィルタ１
９に通され、第４図（ｂ）の如く平坦なスペクトルの高
調波成分３４が得られゐ。この高調波成分３４は平坦で
はあるがベースバンド成分１４とはレベルが一致してい
ない。そこで、２つのレベル測定器３０．３１によシ両
成分１４．３４のレベルａ、ｂをそれぞれ測定し、レベ
ル差（ａ−ｂ）Ｋ比例した利得で可変増幅器２９を動作
させる。これによシ。

この可変増幅器２９からの高調波成分３ｓは第４　Ｅ（
ｅ）（）如＜　ヘースパンＦ　成分１４　Ｊ−同ｖ　ヘ
ルになシ、励振信号２４は同図（句の如く平坦な周波数
スペクトルになゐ。よって合成音声の品質が極めて良好
になる。なお、予測器２８とじては第３図の線形予測形
予測器の他、第５図に示す学資形予＄１１８３４などを
用いても良い。第５図で３６ａａタツモフィルタである。また、レベル測定器３０．３１として
は第６図に示す如く％２乗回路３７、加算回路３８及び
メモリ３９からなるパワー演算回路などを用いることが
できる。但し、４０はクリア信号である。更に、可変増
幅器２９として拡第７図に示す如く、レベルの割算回路
４１、利得αの決定回路４２及び利得の制御可能な増幅
器４３からなるもの等を用いることができる。

第８ｗＪは他の実施例を示し、可変増幅器２９の利得制
御に符号化側における予測誤差信号５０レベルＣをも利
用すゐ点が第３図の実施例と異なる。つ會シ、励振信号
２４を平坦化すゐには予測誤差信号５０レベルｔからベ
ースバンド成分１４のレベルａを引いたレベル差（ｅ−
ａ）に増幅後の高調波成分３５０レベルを合わせれば良
いので、増幅前の高調波成分３４のレベルｂに対しユｉ
土の利得で可変増Ｉ１１！２９を動作させれは曳い。な
お、この実施例の場合、レベル測定器４４が符号化側に
置かれるので、レベルＣの符号器４５、符号化レベル４
６の伝送や蓄積並びに符号化レベル４６の復号器４７が
必要となるが、符号化レベル４６には僅かなビット数し
か要しないので情報量の増加線始んどないと言える。逆
に、合成音声の品質が従来方式１度で良いとすれば、励
振信号２４のスペクトル平坦化によル品質が向上する分
だけ、符号化予測パラメータ４中符号化べ４哀バンド成
分９のビット数低減が可能となるから、全体として、情
報量を大幅に減らせる。

第９図は更に他の実施例を示す。この実施例は第８図の
ものと同様な考えであるが、予測器４差信号５のレベル
Ｃと符号化前のベースバンド成分７０レベルａ′とのレ
ベル差（ｅ　−ａ’　）を予め符号化側で算出し、符号
化して伝送または蓄積する点が第８図と異なる。即ち、
０−パスフィルタ６前後のレベルＣとａ′の差（ｅ−ａ
’）をレベル゛比較器４８で算出して符号器４５で符号
化する。可変増幅器２９では復号器４７で復号化された
レベル差（ｅ−ａ’）と高調波成分３４のレベルｂとか
ら、レベル差（ｅ−ａ’）を補うｅ　−ａ’ べく　、　なる利得に制御される。この実施例の場合も
レベル差（ｅ−ａ’）の伝送が必要となるが、第８図の
場合と同様情報量の増加は殆んどなく、合成音声の品質
向上が大幅に向上する。

以上、実施例をあげて説明したように、本発明によれば
励振信号の短時間周波数ス々クトルが予測誤差信号と同
じ平坦なものとなシ、合成音声の品質が大幅に向上する
。したがって、低ビツト符号化を目した高能率な音声符
号化方式として多大の効果を奏する。

【図面の簡単な説明】

第１図は従来技術を示す構成図、第２図（（転）〜（ｆ
）は第１図における各部の信号の周波数スペクトルを示
す図、第′３図は本発明の一実施例を示す構成図、第４
図（＆）〜（ｄ）は第３図における各部の信号の周波数
スペクトルを示す図％給５図は予測器の他の例を示す構
成図、第６図はレベル測定器の一例を示す構成図、第７
図は可変増幅器の一例を示す構成図、第８図及び第９図
はそれぞれ本発明の他の実施例を示す構成図である。図面中、１は入力音声信号。２は予測器。３は予測バラメータ、４は符号化予測パラメータ、５は予測誤差信号、６と１３はローパスフィルタ、７はベースバンド成分。８と４５と２ｂは符号器、９は符号化ベースバンド成分、１１と１２と４７は復号器。１４は復号化ベースバンド成分、１５は非線形回路。１７はエン７アシス回路、１９はバイパスフィルタ、２３は加算回路。２４は励振信号、２５は音声合成用フィルタ、２６は復号化予測パラメータ、２７は合成音声出力。２８Ｆｉスペクトル平坦化用の予測器、２９は可変増幅
器。３０と３１と４４はレベル測定器、４８はレベル比較器である。特許出願人　　国際電信電話株式会社

Claims

【特許請求の範囲】

（１）　　入力音声信号の°符号化はこの入力音声信号
を予測器に通して予測／豐うメータと予測誤差信号に分
析して予測誤差信号のベースバンド成分と予測ノ譬うメ
ータを符号化し、これらの符号化信号に基づく音声の合
成は復号化されｆ　ヘー　スパントｆｆ分にこのベース
バンド成分から生成した高調波成分を加算してなる励振
信号を符号化の１１あるいは復号化された予測ノ４ラメ
ータで制御して合成する構成の音声符号化方式において
、前記高調波成分のスペクトルを平坦化する予測器と、
この予−測器によりスペクトルを平坦化された高調波成
分を増幅する可変増幅器と、この可変増幅器の出力レベ
ルをベースバンド成分のレベルに一＆させるように可変
増幅器に利得制御信号を与えるレベル検出手段とを備え
、可変増幅器の出力をベースバンド成分に加算して励振
信号とする仁とを特徴とする音声符号化方式。
（２）　　上記レベル検出手段は復号化されたベースバ
ンド成分のレベルを測定するレベル測定器と可変増幅器
の入力レベルを測定するレベル測定器からなシ、可変轡
幅器は両レベルの差に比例し大利得で動作することを特
徴とする特許請求の範囲第１項記載の音声符号化方式。
（３）上記レベル検出手段は予測器からの予ｌｌｌ１誤
差信号のレベルを＃１足するレベル測定器と、復号化さ
れたベースバンド成分のレベルを測定するレベル測定器
と、可変増幅器の入力レベルを測定するレベル測定器と
を有し、可変増幅器は予ｆｌａｉｌＡ差信号と復号化さ
れたベースバンド成分とのレベル差を補償する利得で動
作することを特徴とする特許請求の範囲第１号記載の音
声符号化方式。
（４）上記レベル検出手段は予測器からの予測誤差信号
のレベルと符号化前のベースバンド成分とのレベル差を
算出するレベル比較器と、可変増幅器Ｏ入力レベルを測
定するレベル測定器とを有し、可変増幅器はレベル比較
器によるレベル差を補償する利得で動作する仁とを特徴
とする特許請求ＯＩｉ囲第１項記載の音声符号化方式。