JPH05250000A

JPH05250000A - 音声符号化制御方式

Info

Publication number: JPH05250000A
Application number: JP3303116A
Authority: JP
Inventors: Yoshiaki Tanaka; 良紀田中; Tomohiko Taniguchi; 智彦谷口; Yoshihiro Sakai; 良広坂井; Hitoshi Matsuzawa; 均松澤
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1991-11-19
Filing date: 1991-11-19
Publication date: 1993-09-28

Abstract

(57)【要約】【目的】音声信号を符号化して高能率伝送を行う音声
符号化制御方式に関し、再生音声品質の向上を図るもの
である。【構成】入力音声信号を加える声道情報分析部１と音
源情報分析部２と、量子化部３，４と、伝送比率決定部
５と、多重化部６とを備え、声道情報分析部１と音源情
報分析部２とによる入力音声信号の同一のフレームに於
ける声道情報と音源情報とを、遅延回路７により遅延さ
せることにより、異なるフレームに於ける声道情報と音
源情報とを組として伝送比率を決定し、量子化部３，４
の量子化ビットを伝送比率に従って割当てて、異なるフ
レームの声道情報と音源情報とを同一のフレームに多重
化して伝送する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、音声信号を符号化し
て、高能率伝送を可能とする音声符号化制御方式に関す
る。音声信号のディジタル伝送に於いては、８ｋＨｚで
サンプリングし、１サンプルを８ビットのμ−ｌａｗ或
いはＡ−ｌａｗの圧伸則で符号化し、６４ｋｂ／ｓのビ
ットレートで伝送する方式が一般的である。このビット
レートを数ｋｂ／ｓ程度に小さくし、且つ音声品質を低
下させることなく、高能率伝送を可能とすることが要望
されている。

【０００２】

【従来の技術】音声信号の高能率符号化は既に各種の方
式が提案されており、例えば、線形予測符号化（ＬＰ
Ｃ：Ｌinear Ｐredictive Ｃoding ）方式は、フレーム
毎に線形予測分析により抽出された線形予測係数と、予
測残差信号とを多重化して伝送し、受信側では、予測残
差信号を線形予測合成フィルタを通すことにより、音声
を再生するものである。この線形予測符号化方式に於い
ては、線形予測合成フィルタが人間の声道部分をモデル
化したものに相当し、予測残差信号が声帯振動や乱気流
等の声道部に入力される音源信号に相当する。

【０００３】この予測残差信号を効率的に伝送する為に
予測残差ベクトルをベクトル量子化し、そのインデック
スを伝送するコード駆動線形予測符号化（ＣＥＬＰ：Ｃ
odeＥxcited Ｌinear Ｐrediction Ｃoding ）方式，
予測残差ベクトルを有限個のパルス列でモデル化し、最
適パルス位置及びパルス振幅として伝送するマルチパル
ス駆動形符号化（ＭＰＥＣ：Ｍulti-pulse Ｅxcited
Ｌinear ＰredictionＣoding ）方式等の各種の方式が
知られている。

【０００４】このような予測符号化方式に於いて伝送さ
れるパラメータは、線形予測係数からなる声道情報と、
予測残差信号からなる音源情報とに大別される。これら
のパラメータは、例えば、２０ｍｓの一つのフレームの
音声信号に対して分析を行った後、それぞれ同時に、即
ち、同一フレームに於いて伝送される。この場合、分析
を行った同じフレームに於いて伝送する場合や、或るフ
レームに於いて分析された音源パラメータと声道パラメ
ータとを、次のフレームに於いて同時に伝送する場合も
ある。

【０００５】又伝送ビットレートは固定とし、入力音声
信号の性質に応じて、音源パラメータと声道パラメータ
とに対する量子化ビットの割当比率を可変にすることに
より、再生音声品質の向上を図る符号化方式も知られて
いる。例えば、伝送比率の異なる符号器を複数動作させ
て、最も特性の良い比率の符号器を選択する方式や、音
源パラメータと声道パラメータとの何れか変化の大きい
方のパラメータに対して多くの量子化ビットを割当てる
方式等がある。

【０００６】図３は前述の従来例の可変伝送比率の符号
化方式の説明図であり、３１は声道情報分析部、３２は
音源情報分析部、３５は伝送比率決定部、３３，３４は
量子化部、３６は多重化部であり、声道情報分析部３１
と音源情報分析部３２と伝送比率決定部３５等は、ディ
ジタル・シグナル・プロセッサ（ＤＳＰ）の演算制御機
能によって実現することができる。入力音声信号は、声
道情報分析部３１と音源情報分析部３２とに入力され、
例えば、２０ｍｓのフレーム毎に声道パラメータと音源
パラメータとが求められ、伝送比率決定部３５と量子化
部３３，３４とに入力される。伝送比率決定部３５は、
両パラメータの何れか変化の大きい方のパラメータに対
して多くの量子化ビットを割当てるように、量子化器３
３，３４を制御し、多重化部３６により多重化して送出
する。この場合の伝送比率情報はサイド情報として伝送
される。

【０００７】図４は従来例の所要伝送速度の説明図であ
り、（ａ）は声道情報、（ｂ）は音源情報のそれぞれの
所要伝送速度の時間的変化の一例を示し、（ｃ）はそれ
らを合成したトータルの所要伝送速度を示す。一般的に
声道情報と音源情報との所要伝送速度は、同じフレーム
に於いて大きくなるものである。又伝送レートを固定し
た場合、声道情報と音源情報との所要伝送速度に対応し
て伝送比率限定部３５に於いて量子化ビットの割当比率
が制御されることになり、量子化器３３，３４はそれぞ
れ制御された量子化ステップに従って声道情報と音源情
報とを量子化して、多重化部３６に加えることになる。

【０００８】

【発明が解決しようとする問題点】伝送比率決定部３５
により声道情報と音源情報との伝送比率を可変とする符
号化方式は、固定比率の符号化方式に比較して再生音声
品質の向上を図ることができる利点があるが、図４から
も判るように、声道情報の所要伝送速度と、音源情報の
所要伝送速度との相関が比較的大きいものであり、音声
の過渡部分のように、一方の伝送比率を大きくする必要
があるフレームに於いては、他方の伝送比率も大きくす
る必要が生じることになり、伝送レートが固定の場合に
は、固定比率の符号化方式と大差がないものとなる。従
って、再生音声品質の改善効果を充分に発揮できない欠
点があった。本発明は、音声の過渡部分に於いても再生
音声品質の向上を図ることを目的とする。

【０００９】

【課題を解決するための手段】本発明の音声符号化制御
方式は、図１を参照して説明すると、入力音声信号を加
える声道情報分析部１と音源情報分析部２と、これらの
声道情報分析部１と音源情報分析部２とに於いてそれぞ
れ求めた声道情報と音源情報とを量子化する量子化部
３，４と、フレーム毎に声道情報と音情報との伝送比率
を制御する伝送比率決定部５と、量子化部３，４により
量子化された声道情報と音源情報とを多重化する多重化
部６とを備え、それぞれ異なるフレームに於いて求めた
声道情報と音源情報とを同一フレームに多重化して送出
するものである。

【００１０】又伝送比率決定部５は、相互に１フレーム
ずれて求められた声道情報と音源情報との組に対して伝
送比率を決定し、声道情報と音源情報とを多重化部６に
より同一フレームに多重化して送出するものである。

【００１１】又伝送比率決定部５は、声道情報と音源情
報との時間的変化の大きい方の伝送比率を大きくするよ
うに、伝送比率を決定するものである。

【００１２】

【作用】声道情報分析部１と音源情報分析部２とに於い
てそれぞれ異なるフレームに於いて求めた声道情報と音
源情報とを同一のフレームに多重化して送出するもので
あり、換言すれば、声道情報分析部１と音源情報分析部
２とに於いてそれぞれ同一フレームに於いて求めた声道
情報と音源情報とを異なるフレームに多重化して送出す
るものである。従って、音声の過渡部分等に於ける声道
情報と音源情報との所要伝送量が共に多くなるフレーム
に於いて、一方の情報と他方の情報とが異なるフレーム
に於いて送出されるから、それぞれ所望の伝送比率とし
て送出することができることになり、再生音声品質の改
善が可能となる。

【００１３】声道情報分析部１と音源情報原籍部２との
何れか一方に１フレーム分の遅延時間の遅延回路を接続
することにより、伝送比率決定部５は、相互に１フレー
ムずれた声道情報と音源情報との組に対して伝送比率を
決定する。そして、決定された伝送比率でこの組の声道
情報と音源情報とを多重化部６により同一フレームに多
重化して送出する。

【００１４】又伝送比率決定部５は、声道情報と音源情
報とのそれぞれ前フレームと現フレームとの差を求め
て、差の大きい方の伝送比率を大きくするように伝送比
率を決定して、多重化して送出するものである。

【００１５】

【実施例】図１は本発明の実施例の説明図であり、前述
のように、入力音声信号は、声道情報分析部１と音源情
報分析部２とに加えられる。又遅延回路７は声道情報分
析部１に接続しているが、点線で示すように、音源情報
分析部２に接続することも可能である。又伝送比率決定
部５は、声道情報の変化分の検出部８と、音源情報の変
化分の検出部９と、比較部１０とを備え、量子化部３，
４の量子化ビットの割当比率を制御し、伝送比率情報を
サイド情報として多重化部６に於いて多重化して受信側
へ伝送するものである。声道情報分析部１，音源情報分
析部２，伝送比率決定部５等の機能は、従来例と同様に
例えばディジタル・シグナル・プロセッサ（ＤＳＰ）の
演算制御機能によって実現することができる。

【００１６】遅延回路７の遅延時間を１フレーム分と
し、実線で示すように、声道情報分析部１に接続した場
合、声道情報分析部１からの声道情報は、音源情報分析
部２からの音源情報に比較して１フレーム分遅延して、
量子化部３，４及び伝送比率決定部５に加えられる。従
って、伝送比率決定部５は、１フレーム分ずれた声道情
報と音源情報とを基に伝送比率を決定し、量子化部３，
４の量子化ビットの割当てを制御することになる。その
場合、声道情報と音源情報とが１フレーム分ずれること
により、それらの相関が小さくなるから、それぞれの所
要伝送速度に対応した量子化ビットの割当てを行うこと
ができる。即ち、遅延回路７の遅延時間は１フレームに
限定されるものではなく、許容できる音声信号の伝送遅
延時間に対応して選定することができるものであり、又
接続個所は、声道情報分析部１又は音源情報分析部２の
入力側に接続することも可能である。

【００１７】受信側は、前述の処理と逆の処理を行う構
成を設ければ良いことになり、例えば、サイド情報によ
る伝送比率情報を基に量子化ビットを多重分離し、それ
ぞれ逆量子化して声道情報と音源情報とを再生し、声道
情報により合成フィルタを制御し、音源情報に従った音
源信号を合成フィルタを通すことにより音声信号を再生
することができる。

【００１８】前述のＣＥＬＰ方式の場合、符号化器は、
例えば、アダプティブとストキャスティックとの二つの
コードブックを有し、アダプティブ・コードブックのピ
ッチベクトルＰ及びストキャスティック・コードブック
のコードベクトルＣに対して、それぞれゲイン（ピッチ
ゲインｂ，コードゲインｇ）を乗じて加えることによ
り、駆動音源信号（ｂ・Ｐ＋ｇ・Ｃ）を形成する。この
アダプティブ・コードブックのピッチベクトルＰは、音
声信号のピッチ周期性に依存する部分を発生するもので
あり、又ストキャスティック・コードブックのコードベ
クトルＣは、それ以外の非周期性な成分を発生させる為
のものである。

【００１９】符号化の過程は、駆動音源信号として最適
なものを一定区間毎に二つのコードブックの中から選択
する処理であり、コードブックの探索は、駆動音源信号
に重み付け合成フィルタを施して得られる再生信号（ｂ
・Ａ・Ｐ＋ｇ・Ａ・Ｃ）と重み付け入力信号（Ａ）との
間の誤差信号の電力を評価関数として行われるものであ
り、この誤差信号の電力を最小とする駆動音源信号が最
適駆動音源信号として決定される。ストキャスティック
・コードブックは、その内容が時間的に変動せずに固定
のものであるのに対して、アダプティブ・コードブック
は、その内容が適応的に変化するものである。このアダ
プティブ・コードブックの各ピッチベクトルＰは、その
前のフレームまでに得られている最適駆動音源信号を用
いて生成され、次のフレームに於いて用いられる。即
ち、探索の周期毎にその内容が更新される。

【００２０】又声道パラメータである線形予測係数につ
いては、現フレームの予測係数を用いて求めた予測誤差
信号の電力と、前フレームの予測係数を用いて求めた予
測誤差信号の電力とを比較し、その差が予め設定された
値より大きい場合には現フレームの予測係数を伝送し、
そうでない場合は予測係数を伝送しないものであり、予
測係数を伝送しない場合は、前フレームの予測係数を用
いて音声再生を行うことになる。従って、予測係数を伝
送しない場合は、声道情報の所要伝送速度は零となる。

【００２１】又音源パラメータについては、入力音声信
号に対して、有声／無声判定を行い、無声音の場合は、
例えば、５ｍｓ毎に前述のコードブックの探索を行い、
有声音の場合は、無声音の場合の半分の２．５ｍｓ毎に
コードブックの探索を行う。それによって、分析周期が
短い有声音フレームの方が音源情報の所要伝送速度が大
きくなる。

【００２２】前述のように、声道パラメータと音源パラ
メータとの所要伝送速度は、それぞれフレーム毎に変化
することになる。固定伝送レートで符号化を行う場合
は、トータルの伝送速度が一定となるように、前述のよ
うに、それぞれの伝送比率を制御することになる。本発
明に於いては、入力音声信号の同一フレームに於ける声
道パラメータと音源パラメータとについて伝送比率を決
定するものではなく、遅延回路７による１フレーム分の
遅延を行い、例えば、入力音声信号の現フレームの音源
パラメータと、前フレームの声道パラメータとを用いて
伝送比率を決定することになる。

【００２３】固定伝送レートに於ける声道パラメータと
音源パラメータとの伝送比率の決定に於いて、一方の所
要伝送速度が大きく、他方の所要伝送速度が小さい場合
はそれに対応して伝送比率を決定することができる。又
両方共に所要伝送速度が小さい場合は、何れか一方の伝
送比率を大きくすれば良いことになる。しかし、両方共
に所要伝送速度が大きい場合は、音声品質への影響がよ
り大きい声道パラメータの方の伝送比率を大きくし、音
源パラメータの伝送比率を小さくすることが好適であ
る。

【００２４】図２は本発明の実施例の所要伝送速度の説
明図であり、（ａ）は声道情報の所要伝送速度、（ｂ）
は音源情報の所要伝送速度、（ｃ）はそれらを合成した
トータルの所要伝送速度を示す。（ａ）の声道情報を図
４の（ａ）の声道情報と同一とすると、（ｂ）の音源情
報は、図４の（ｂ）の音源情報に比較して、遅延回路に
よりτ（例えば、１フレーム分）の遅延を与えた場合を
示す。従って、図２の（ｃ）に示すように、トータルの
所要伝送速度のピークは図４の（ｃ）と比較すれば明ら
かなように小さくする。即ち、声道情報と音源情報との
相関を小さくすることにより、それぞれの所要伝送速度
に対応した伝送比率の決定を行うことができる。

【００２５】又伝送比率限定部５に於ける検出部８，９
により、声道情報と音源情報との変化分を検出し、変化
分の大きい方の伝送比率を大きくすることができる。即
ち、時間的な変化分の大きい方の情報を多く伝送するこ
とにより、再生音声品質の向上を図ることができる。そ
の場合も、前述のように、入力音声信号の異なるフレー
ムに於ける声道情報と音源情報との組についての変化分
を比較することになり、時間的なずれが生じているか
ら、所要伝送速度の大きい方の伝送比率を大きくするこ
とができる。

【００２６】

【発明の効果】以上説明したように、本発明は、声道情
報分析部１と音源情報分析部２とに於いて入力音声信号
の同一フレームの声道情報と音源情報とを求めた場合
に、遅延回路７等により遅延させることにより、異なる
フレームに於いて多重化部６により多重化するものであ
り、換言すれば、入力音声信号の異なるフレームに於け
る声道情報と音源情報とを、同一フレームに多重化する
ものである。従って、音声信号の過渡部分等に於ける声
道情報と音源情報との所要伝送速度が共に大きくなるよ
うな場合でも、異なるフレームに於いて多重化するもの
であるから、それぞれの所要伝送速度に対応した伝送比
率で多重化することが可能となる。従って、再生音声品
質の向上を図ることができる利点がある。

【００２７】又伝送比率決定部５は、遅延回路７等によ
り相互に１フレームずれか声道情報と音源情報との組に
対して伝送比率を決定するもので、受信側は１フレーム
分のずれを補正するとしても、音声信号の高能率符号化
伝送に於ける遅延は僅かなものとなり、それぞれの所要
伝送速度に対応した伝送比率とすることが容易となる利
点がある。

【００２８】又伝送比率決定部５の検出部８，９と比較
部１０等により、声道情報と音源情報との時間的変化の
大きい方の伝送比率を大きくするように伝送比率を決定
するものであり、時間的変化の大きい方の情報量を多く
することにより、再生音声品質の向上を図ることができ
る。

【図面の簡単な説明】

【図１】本発明の実施例の説明図である。

【図２】本発明の実施例の所要伝送速度の説明図であ
る。

【図３】従来例の説明図である。

【図４】従来例の所要伝送速度の説明図である。

【符号の説明】

１声道情報分析部２音源情報分析部３，４量子化部５伝送比率決定部６多重化部７遅延回路８，９検出部１０比較部

───────────────────────────────────────────────────── フロントページの続き (72)発明者松澤均神奈川県川崎市中原区上小田中1015番地富士通株式会社内

Claims

【特許請求の範囲】

【請求項１】入力音声信号を加える声道情報分析部
（１）と音源情報分析部（２）と、該音声情報分析部
（１）と音源情報分析部（２）とに於いてそれぞれ求め
た声道情報と音源情報とを量子化する量子化部（３），
（４）と、フレーム毎に前記声道情報と音源情報との伝
送比率を制御する伝送比率決定部（５）と、前記量子化
部（３），（４）により量子化された声道情報と音源情
報とを多重化する多重化部（６）とを備え、それぞれ異なるフレームに於いて求めた前記声道情報と
音源情報とを、同一のフレームに多重化して送出するこ
とを特徴とする音声符号化制御方式。
【請求項２】前記伝送比率決定部（５）は、相互に１
フレームずれて求められた声道情報と音源情報との組に
対して伝送比率を決定し、該声道情報と音源情報とを前
記多重化部（６）により同一フレームに多重化して送出
することを特徴とする請求項１記載の音声符号化制御方
式。
【請求項３】前記伝送比率決定部（５）は、前記声道
情報と音源情報との時間的変化の大きい方の伝送比率を
大きくするように、伝送比率を決定することを特徴とす
る請求項１記載の音声符号化制御方式。