JPS58204632A

JPS58204632A - 音声符号化方法とその装置

Info

Publication number: JPS58204632A
Application number: JP57087483A
Authority: JP
Inventors: Taku Arazeki; 卓荒関
Original assignee: NEC Corp; Nippon Electric Co Ltd
Current assignee: NEC Corp
Priority date: 1982-05-24
Filing date: 1982-05-24
Publication date: 1983-11-29

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】本発明は、低ビツトレートの音声符号化法の改良に関す
る。

音声信号をディジタル化し処理を施しビット数を削減し
て通信あるいは記憶する必要性が増々高まっている。デ
ィジタル化した音Ｐ信号のビット数を減らす方法として
、音声信号の相関性を利用することが良く行われる。具
体的には線形予測法を用いることが多い。この植の音声
圧縮法として、音声４６号をパラメータに変換して符号
化するいわゆるボコーダと、音声信号の予測残差を量子
化して符号化する波形符号化方式とがある。前者を用い
ると１〜２Ｋ　ｂ　ｐ　ｓで了解性のある音声符号化法
が得られ、後者を用いると１０〜３０Ｋｂｐｓでかなり
原音に近い音声符号化法が得られる。これら二つの符号
化法の間に位１１ｔする方法として、残差励振型ボコー
ダが提案されている。この方法は、ボコーダに比ベビッ
ト数は増加するが、ボコーダでの問題点、例えば自然性
が失われる点、あるいは話者依存性、つまり発話者によ
って再生音の品質が大いに変化するという点、その他の
種々の問題点が改善される。従来のボコーダにおける問
題点およ氏らの’　Ｔｈｅ　Ｒｚｓｉｄｕａｌ　−Ｅｘ
ｃｉｔｅｄ　Ｌｉｎｅａｒ　Ｐｒｅ　−ｄｉｃｔｉｏｎ
　Ｖｏｃｏｄｅｒ　　ｗｉｔｈ　　Ｔｒａｎｓｍｉｓｓ
ｉｏｎ　　Ｒａｔｅα）１’ｌＪ　−２３、ＮＯ，１２
，ＤｈＣＥＭＢＥ）Ｌ　１９７５．ＰＰ、　１４６６−
１４７３）・　を瓢照して知ることができるので、ここ
では、上記発明および論文等で代表される従来の残差励
振型ボコーダの原理を藺導に述べるにとどめる。

残差励振型ボコーダは、符号器において、先ず音声信号
をあらかじめ定められたサンプル毎にスペクトル分析し
、音声信号の予測残差を求めるためのフィルタ係数を求
める。前記発明においてはこのフィルタの係数として部
分自己相関係数（ＰＡ［）Ｒ係数）を用いている。次に
、求まったフィルタ係数を用いて音声信号をフィルタリ
ングして得られた予測残差信号の高域を除くため低域フ
ィルタに通す。符号器では、フィルタ係数とともに、こ
のようにして得られた予測残差の低域成分のみを低い周
波数で再サンプルして量子化して出力する。再サンプル
の周波数を低くすることにより、もとの予測残差をその
ま＼のサンプリング周波数で量子化するよりもビット数
を減らすことができる。これが残差励振型ボコーダでビ
ット削減がロエ能となる理由である。さて、復号器にお
いては、原理的には残差信号を正しいサンプリング周波
数に変換した後符号器のフィルタと逆特性のフィルタに
通１ことにより原音声が再生できるはずである。しかし
ながら、前述のように残差信号の高域は除かれているた
めこのままでは音声信号の再生はできない。従って、入
力した残差信号から高域成分を再生する必要がある。こ
のよ引と、残差励振型ボコーダでは復号器側にはサンプ
リング変換のための補間回路と高域再生のための回路が
加わる。

このような残差励振型ボコーダは通當４〜９　Ｋｂｐｓ
程度のビットレートで用いられる。ボコーダに比べ、ピ
ッチ抽出等の判定過程を含まないため品質□ はかなり改善できるが、高域再生ｉこまだ問題かある。

高調波を発生するには基本的には非線形回路を通すこと
により得られるが、未だ十分な品質の得られる高周波成
分再生法は確立していない。

本発明の目的は、低ビツトレートで自然性、了解性とも
十分な音声符号化法の提供にある。

本発明によれば、音声信号を分析し予測情報を算出し予
測残差を求め前記予測残差の包絡情報を計算し前記包絡
情報に基きビット割り当てを行い紬記予側残差の量子化
を行い前記予測情報と前記包絡情報と前記量子化結果と
を出力する符号化部と、前記符号化部から出力された信
号をもとに予測残差を復元し音声信号を再生する復号部
とから成る音声符号化方法が得られる。

本発明によればさらに、入力された音声信号を分析し予
測情報を出力する分析部と、前記予測情報に基き予測残
差を出力するフィルタ部と、前記予測残差の包絡情報を
求め前記包絡情報に基きビット割り当てを行う包絡分析
部と、前記包絡分析部出力に基き前記予測残差を量子化
する手段とを有することを特徴とする音声符号化装置が
得られる。

本発明によればさらにまた、符号化された信号から予測
情報を復号する手段と、前記符号化された信号から包絡
情報を復号しビット割り当てを行う包絡情報復号部と、
前記包絡情報復号部の出力に基き前記符号化された信号
から予測残差を復号する残走復号部と、前記予測情報に
基き前記予測ＩＡ差から音声信号を再生する合成フィル
タ部とを有することを特徴とする脩ＰＮ号装置が得られ
る。

図を用いて本発明のさらに詳細な説明を続ける。

第１図は本発明による第１の実施例である。第２Ｍは各
部の波形を示す図である。

送信側においては、原音声４６号ＸはＡ／Ｄ変換器１０
によりディジクルイメ号ＸＪに変換される。ここで、ｊ
はサンプリング時刻を出す。ディジタル化された音声信
号Ｘｊは予御１分析回路１００’に入力される。予測分
析回路１００においては音声信号ｘｊをあらかじめ定ま
ったサンプル数Ｎ（例えば２５６）をにまとめて１つの
ブロックにして分析する。その方法は、まず、ＸＩの自
己相関ｌも（ｉ）　（ｉ＝ｌ、２゜・・・ｐ）を求める
。次に、自己相関係ｔＹ川ｉ）からＰＡ［’ＯＲ係数ｋ
ｔ　（を二１，２．・・・ｐ）を求め量子化して出力す
る。これら一連の処理は板倉氏の［新しい音声分析合成
方式″″ＦＡＩ（ＣＯル“［と題する論文°（日米４エ
レクトロニクス、　１９７３＝１２．１２．　ｐｐ。５
８−、ニア５）に詳しく解説されているので、ここでは詳細な説
明を省略する。このようにして求まるＰｆｆｌυＲ係数
は量子化されてマルチプレクサ１５０に入力される。ま
た量子化さ？”したＰＡＲＣＯＲ係数を予測係数ａ　Ｉ
（１−１、２，・・・ｐ）に変換して予測フィルタ１２
０に入力する。予測フィルタ１２０の伝達特性は１　・
−Ｐｓ　：＝　ｌ−ａ、ｚ−１−ａ２７ｒ−２−、−−
−３ＮＺ″″Ｎで表わされる。遅延回路１１（１は、予
測分析回路１００で発生する遅延を補正するために挿入
するものである。予測フィルタ１２０では音声信号ＸＩ
　の予ＩＩを行い、それらの差を出力することになる。

Ｘ。

が有声音の場合には、出力Ｙｊは第２図ｙＪ　で示すよ
うなパルス性の信号となる。包絡分析回路１３０は残差
１８号ｙｊの包絡線を求め、それを少ないビット数で表
現してマルチプレクサ１５０に出力する。包絡線の求め
方については後述する。包絡分析回路１３０で得られた
包絡線を第２図のｅで示す。包絡分析ＩＬ！ｌ路１３０
はさらに包絡線Ｃから残差信号Ｙｊの各サンプルを何ビ
ットで量子化するか決定する。このビット割り当ての行
い方は、先ず、５ｄＨ毎の閾値を決め包晶″″線を６ｄ
ｒ−（毎に分割し大きなレベルから順に、例えば、３，
２，１．Ｏｏ、）順にビットを割り撮り、総ビット数が
所望の値とならない場合には閾値を設定しなおしてビッ
トを゛削り振りしなおす。この結果は第２図Ｂのように
なる。

縦軸は割り当てられたビット数である。量子化器１４０
においては、残差信号Ｙｊ　を包絡線Ｃで振幅の正規化
を行った後、上のビット割り当に従って量子化して符号
としてマルチプレクサ１５０に加える。マルチプレクサ
１５０は予測に関する情報と包絡に関する情報と残差の
量子化結果とを組み合わせて端子２から送り出す。

次に受信側では、送信路から端子３を介して入力された
信号はデマルチプレクサ２００により分割される。包絡
に関する情報は包絡復元回路２１０に入力され、予測に
関する情報は予測係数復元回路２３０に入力され、残差
信号の量子化結果は復号回路２２０に入力される。包絡
復元回路２１０は残差信号の包絡線を復元し、さらに残
差の各サンプルの量子化ビット数を計算する。包絡復元
回路２１０での復元方法を包絡分析回路１３０での分析
方法と同じ規則で行うようにしておけば、送信側と受信
側とで同じビット割り当てが行われることになる。

復号回路２２０においては、上で求まったビット割り当
て番こ基き逆量子化（を子化と逆のｉ）を行った後、上
で求まった包絡線ｅを乗じて残差信号を復号する。予測
係数復元回路２３０は予測係数”ｉ””’ｅ２ｅ　”’
　ｅ　Ｎ）を求めて合成フィルタ２６０に入力する。合
成フィルタ２６０は予測フィルタ１２０と逆の特性、つ
まり　−Ｐｓなる伝達特性を持っており、ＩＡ差信号の復号１６号９
　から音声信号４゛ｊ　を再生することができる。

ここで、本実施例での諸元を示す。サンプリング周波数
はｇ　ｋＨｚでＴフレーム２５６サンプルである。予測
に関する情報としてはＰＡＲＣＯＲ係数を用いており、
Ｎ＝ｔｏとして４０ビツト、包絡に関する情報は後述の
とうり（資）ビット、残差の量子化は約７０ビツトで、
全部で１５３ビツトとなり４８００ピッＶ秒の転送レー
トとなる。このように残差の量子化に１１Ｊしては１サ
ンプル当りで１ビツト以下の割り当てとなる。

上のようなビット配分をすると、有声音や破裂音の場合
には時間的に信号が局部に集中するため上述の方法が有
効となる。しかし、Ｓｖｂ等の子音は振幅レベルが２５
６サンプルでは殆んど変化しないため、上述のようなビ
ット割り当てを行うと品質が低下する。本実施例では、
白色雑音発生器２４０において白色雑音を発生し、包絡
復元回路２１０から得られる包絡線で信号振幅を制御し
て出力する。スイッチ２５０は復号回路２２０の出力め
るいは白色雑音発生器２．１０の出力のいずれかを選び
合成フィルタ２６０に入力する。二つの信号の選択は、
包絡復元回路２１０において包絡縁の形状から判断され
た結果に基いて行われる。

次に包絡分析回路１３０の動作について説明する。

第３図は包絡分析回路１３０の実施例である。信号ｙｊ
　は端子３１から入力され整流回路１３１で全波整流さ
れる。その後でＤＣＴ　＆換回ｗ！！！１３２で離散コ
サイン変換（１）ＣＴ）を行い周波数軸上のＤＣＴ係数
に変換する。このようにして得られたＤＣＴ係数の低周
波成分とピッチ周波数の＾調波成分を選択的に出力して
符号化することにより整流した信号の平均値を少ないビ
ット数で伝送することができる。この平均値適当な値を
乗すると包絡線が得られる。ＤＣＴ係数符号器１３３の
動作は次のようになる。つまり、先ず、直流成分を表わ
すＤＣ’Ｔ係数を量子化する。この値は対数変換しｄＢ
にした後１ｄＢ毎に′Ｉｋ−ｆ、化すればよい。この際
６ビツトあれば十分なダイナミックレンジの振幅の量子
化ができる。次に、直流成分の０．１倍より小さな振幅
のＤｅＴ係数をすべて０にする。その後低い周波数から
順に０．１倍より大きな振幅の係数のみ０．１〜０．４
　、−０．１〜−０．４の範囲で４ビツト盪子化を行う
。符号化を行うとき、上のように０以外の振幅の量子化
のときは４ピツ）Ｍ子化しその上に１ビツト′１＃を追
加し５ビツトとする。０の理数がいくつか続いた場合に
は０の続いた数を４ビツトで表わしその上に１ビツト′
０″を追加し５ビツトとＣる。このようなランレンクス
符号化と呼ばれる符号化法を用いると低周波成分とピッ
チのＡ１１ｍ波成分合成率良く符号化できる。

以上述べたような方法で符号化された信号は端子３１か
ら包絡線に関する情報として出力されるっ次に、この符
号化された信号をＤＣＴ係数復号器１３４でＤＣ’Ｔ係
数に復元する。この方法はＩ）０′係数符号器１３３で
行った操作の逆を行うことになる。逆１）　ＣＴ変換回
路１３５はＤＣＴ係数から時間軸上の信号１こ変換する
回路であり、包絡線（第２図Ｃ）を出力する。包絡線ｅ
は端子３３から出力される。ここで述べたＤＣＴ変換に
ついてけＡｈｍｅｄ氏等のし文（’　Ｄｉｓｃｒｅｔｅ
　Ｃｏ５１ｎｅ　ｉ’ｒａｎｓｆｏｒｍ“。

ＩＦｉＥｇ　ＴＲ−イ（ＮＳＡＣＴＩＯＮＳ　　ＯＮ　
　ＣＯＤ、ＩＰＵＴＴｉ：Ｒ８，ＶＯＩ　、Ｃ−２５、
Ｉ）り、９０−−９３　、　、Ｔａｎｎａｒｙ　１９７
４）にｉ；Ｔ述されているのでここでは説明を省略すＡ
０ビ・ント配分回路１３６は包絡線Ｃをもとに信号ｙｊ
　に対するビ・ソト割り当てを行う。ビット割り当ての
考え方は既に述べたとうりである。そのＨ体的な方法は
管肺昭５５　５７９Ｑｎ　ヲｓ”２１！Ｉ（ｊ７　テ実
現すＺ＋コとカテきろ。

このようにして求°１ったビット割り当て信号Ｂは端子
３１から出力さ１１る。

第４１：４は本発明による第２の実姉例を示す図である
。＠５図は第２の実施例の各部の波形を示す図である。

本実施例は第１の実施例と共通な回路が多い。送信側に
おいてはＡ／ｌ）変換器１０、予測分析回路１００、遅
延回路１１０、予測フィルタ１２ｏ１包絡分析回路１３
０、量子化器１４０およびマルチプレクサ１５０は第１
の実施例で用いた回路とまったく同じである。また、受
信側においては、デマルチプレクサ２００、包絡復元回
路２１０．復号回路２２ｏ１予＃ｊ係数復元回ｍ　２３
０　ｓ白色雑音発生器２４ｏ１スイッチ２５０、合成フ
ィルタ２６０、およびＤ／Ａ変換器加は第１の実施例の
それらと同じである。送ｇＭ＠においては、第１の実施
例と同様に、音声信。

号Ｘはディジタル化され予測残差ｙｊ　が得られる。

さらに、包絡分析回路１３０で包絡線ｅが求まり、包絡
に関する情報はマルチプレクサ１５０に出力される。包
絡＠ｅはピッチ切り出し回路１３１に入力される。ピッ
チ切り出し回路１３９は包絡Ｉｗｅがらピッチを抽出し
、その１区間のみを散り出して新たな包結線ｅ′を作り
ビット割り当てを行い童子化＠　１４０に入力する。新
たな包絡Ｍｅ’およびそれによるビット割り当ての結果
は第５図ｅ′とＢに示すとうりである。受信側において
は、包絡復元回路２１０で包絡線ｅを復元し、ピッチ切
り出し回路２１１で新たな包絡線Ｃ′を作り、復号回路
２２０に入力する。復号回路２２０は第５図９１のよう
な１ピッチ分の残差信号を再生する。補間回路２２１は
包絡線直す。このようにして作られたｙ、あるいは白色
雑音発生器２４０の出力のいずれかが選ばれて合成フィ
ルタにより音声信号仝、が再生される。

第２の実施例を用いると第１の実施例に比べ残差の符号
化に割り当てるビット数が少なくても良い。従って４８
００　ｂ　ｐ　ｓ以下で十分な品質の符号化音声品質と
なる。

なお、本発明の実施例において、予測分析回路ではＰＡ
［’ＯＲ分析を行っている→、ＬＡＰ等の他の分析法を
用いても良い。また包絡縁は直交変換により表現したが
他の方法を用いても良い。

以上述べたごとく、本発明によれば低ピットレー１で品
質の良い符号化方法が実現できる。

【図面の簡単な説明】

８ｇ１図は本発明による゛第１の実施例を示すブロック
図、第２図は第１の実施例の各部の波形を示す図、第３
図は包絡分析回路の実施例を示すブロック図、第４図は
本発明による第２の実施例を示すブロック図、第５図は
第２の実施例の各部の波形を示す図である。第１図、第３図および第４図において、１，２゜３．４
は端子、１０はＡ／Ｄ変換器、加はＤ／Ａ変換器、１０
０は予測分析回路、１１Ｏは遅延回路、１２０は予測フ
ィルタ、１３０は包絡分析回路、１３１は整流回路、１
３２はＤ　Ｃ’１’変換回路、１３３は１）ＣＴ係数符
号器、１３４はＤＣＴ係数復号器、１３５は逆ＤＣＴｇ
換回路、１３９はピッチ切り出し回路、１４０は量子化
器、１５０はマルチプレクサ、２００はデマルチプレク
サ、２１Ｏは包絡復元回路、２１１はピッ、［：。ナ切り出し回路、２２０は・復号回路、２２１は補間回
路、２３０は予測像ｅ偵元回路、２４０は白色雑音発箋
　ｌ目を−〇２３０勇５図（５２−

Claims

【特許請求の範囲】１、音声信号を分析し予測情報を算出し予測残差を求め
前記予測残差の包絡情報を計算し前記包絡情報に基きビ
ット割り当てを行い前記予測残差の量子化を行い前記予
測情報と前記包絡情報と前ｍｌ量子化結果とを出力する
符号化部と、前記符号化部から出゛力された信号をもと
に予６ＩＩＩ残差を復元し音声信号を再生する復号部と
から成る音声符号化方法。２、入力された音声信号を分析し予測情報を出力する分
析部と、前記予測情報に基き予測残差を出力するフィル
タ部と、前記予測残差の包絡情報を求め前記包絡情報に
暴きビット割り当てを行う包絡分析部と、繭記包籟分析
部出力に基き前記予測残差を量子化する手段とを有する
ことをｔＶｆ黴とする背戸符号化装置。３、符号化された信号から予測情報を復号する手段と、
藺紀符号化された信号から包絡情報を復号しビット割り
当てを行う包絡情報復号部と、前記包絡情報復号部の出
力に基き前記符号化された信号から予測残差を復号する
残差復号部と、前記予測情報に基き前記予測残差から音
声信号を再生する合成フィルタ部とを有することを特徴
とする音声符号化法。