JPH11109997A

JPH11109997A - 音声符号化方法、音声符号化装置および音声復号化装置

Info

Publication number: JPH11109997A
Application number: JP9274395A
Authority: JP
Inventors: Mitsuru Oi; 充大井
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 1997-10-07
Filing date: 1997-10-07
Publication date: 1999-04-23

Abstract

(57)【要約】【課題】量子化ビット数を削減し、かつ、再生音の品
質を劣化させない音声符号化を実現する。【解決手段】波形符号化された音声サンプル値が正符
号の場合に量子化する手段と負符号の場合に量子化する
手段の２種類の量子化手段を設け、各サンプル値の正負
符号を判別し、該符号に応じてそれぞれの量子化手段を
選択して、サンプル値を量子化し、音声コードを出力す
る。また、該音声コードの量子化手段が、正符号用であ
るか負符号用であるかを復号化装置側に指示するため
に、サンプル値の符号が正から負、負から正に切り替わ
るごとに、音声コードの時系列中に識別コードを挿入す
る。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、例えば携帯電話等
の無線系およびＬＡＮ等の有線系のシステムに用いら
れ、音声を波形符号化し、情報圧縮された音声コードを
出力する音声符号化方法、音声符号化装置およびその復
号化装置に関するものである。

【０００２】

【従来の技術】ディジタル音声の通信や蓄積では、音声
波形を量子化コードの時系列として表現する波形符号化
方式が用いられている。この方式は他の方式に比べ、演
算量が少なく、遅延が小さい特徴を有している。反面、
全サンプルのデータを使用するため、情報量が大きくな
る欠点がある。

【０００３】従来から情報量削減のために、１サンプル
あたりの表現ビット数の削減法として種々の方式が考案
されている。例えば、波形符号化方式として広く利用さ
れているＡＤＰＣＭ方式では、音声に対しては１サンプ
ルあたり４ビットで表現し、８ＫＨzでサンプリングし
たデータを扱うので、３２Ｋbpsの情報量となる。これ
以上に削減すると量子化誤差が増加し、音質の劣化が著
しくなることが知られている。

【０００４】ここで、量子化ビット数と量子化誤差の関
係について、図を用いて説明する。図５は３ビット量子
化の場合の入力値と量子化後の値の関係を表現してい
る。横軸が入力されるサンプル値、縦軸が量子化後の量
子化値である。例えば、入力値が０からＡ１の値に対し
ては、Ａ１に量子化される。この数値が例えば３ビット
のコード“０００”で表現されることになる。この場合
の量子化誤差として、入力値が０からＡ２の値について
算出してみる。図６の斜線部分の面積が誤差の総和に相
当するので、この場合の誤差は（Ａ１×Ａ１／２）×２＝Ａ１×Ａ１となる。

【０００５】一方、図７は２ビット量子化の場合の入力
値と量子化後の値の関係を表している。量子化の範囲を
図５と同一にとると、この範囲を４レベルに量子化する
ので、量子化値は、Ａ２，Ａ４，Ａ６，Ａ８となる。前
述の３ビットの場合と同様に入力値が０からＡ２の値に
対して量子化誤差の総和を算出してみる。図８の斜線部
分の面積が誤差の総和に相当するので、この場合の誤差
は（２×Ａ１）×（２×Ａ１）／２＝２×（Ａ１×Ａ１）となる。

【０００６】以上から、量子化ビット数を１ビット削減
すると、量子化誤差が２倍に増加することがわかる。こ
のように、量子化誤差に関しては、量子化ステップ幅す
なわち図５におけるＡ１に相当する値が小さいほど、量
子化誤差が小さくなることが言える。

【０００７】以上のことは、量子化を行う範囲すなわち
図５では０からＡ８に相当する値の範囲が一定で量子化
ビット数を増減させる場合である。量子化ビット数が大
きくなれば逆に量子化ステップ幅が小さくなるので、量
子化誤差が小さくなる。一方、量子化ビット数が同じ場
合、量子化を行う値の範囲が狭いほど、量子化ステップ
幅が小さくなるので量子化誤差も小さくなる。

【０００８】音声波形は正領域と負領域の値をとるた
め、量子化範囲は正負の両方の領域をカバーする必要が
あるが、従来の手法では、量子化範囲として、正領域と
負領域を合わせた１つの範囲を規定し、固定的にこの範
囲で量子化を行っていた。

【０００９】

【発明が解決しようとする課題】図９は音声「あ」を発
声した際のＰＣＭ波形の一部であり、図１０はこの波形
をＡＤＰＣＭ方式で符号化したときのサンプル値の時間
的変化を示したものである。音声の場合、発声の機構か
ら波形が急激に変化することはなく、図９と図１０で表
現されるように、サンプル値は正の値や負の値が一定時
間継続する特質を持っている。

【００１０】従来の手法では、正のサンプル値を量子化
する場合、負の領域は必要ないにもかかわらず、負の領
域にも量子化値が割り当てられていた。同様に、負のサ
ンプル値を量子化する場合も、必要のない正の量子化値
が割り当てられていた。例えば、４ビット量子化の場
合、１６レベルの量子化値のうち正負各領域に８レベル
の量子化値、３ビットの場合には８レベル量子化値のう
ち正負各領域に４レベルの量子化値しか割当られない。
すなわち、量子化ビット数で表現できる量子化値の数の
半分しか使っておらず、半分が無駄になっていることか
ら、情報効率が悪いという問題を有していた。

【００１１】本発明は、従来の手法における上記のよう
な無駄を排除することで情報量を削減し、その上で同等
の再生音品質が得られる音声符号化・復号化を達成する
ことを目的とする。

【００１２】

【課題を解決するための手段】上記目的を達成するため
に、請求項１の発明は、入力された音声信号を波形符号
化し、サンプリング周期毎に音声コードを出力する音声
符号化方法において、音声データの正領域と負領域とで
別々に量子化の範囲を設定し、音声サンプル値の正符号
である場合と負符号である場合とで別々に量子化して音
声コードを得ることを特徴とする。

【００１３】また、請求項２の発明は、入力された音声
信号を波形符号化し、サンプリング周期毎に音声コード
を出力する音声符号化装置において、音声データの正領
域と負領域とで別々に量子化するための２種類の量子化
手段と、波形符号化後の音声データの各サンプル値の正
負符号を判定する手段と、前記正負符号の判定結果に応
じて、前記２種類の量子化手段から一つを選択する手段
と、前記音声データの各サンプル値に対して前記選択さ
れた量子化手段により符号化された音声コードを出力す
るとともに、サンプル値の正負符号が切り替わるときに
識別コードを挿入して出力する手段とを具備することを
特徴とする。

【００１４】さらに、請求項３の発明は、入力された音
声コードを復号化して波形符号化データを得た後、音声
を再生する音声復号化装置において、サンプリング周期
毎の音声コードに対し、正領域の音声コードと負領域の
音声データとで別々に復号するための２種類の復号化手
段と、入力されたコード列における符号切替りの識別コ
ードと音声コードを分離する手段と、前記識別コードの
検出に応じて、前記２種類の復号化手段から一つを選択
する手段と、前記選択された復号化手段により前記音声
コードを復号した波形符号化データを出力する手段とを
具備することを特徴とする。

【００１５】本発明の符号化装置によれば、波形符号化
された音声サンプル値が正符号の場合に量子化する手段
と負符号の場合に量子化する手段との２種類の量子化手
段が設けられている。入力された音声信号に対し波形符
号化処理を行った後、各サンプル値毎の正負符号が判別
され、符号に応じてそれぞれの量子化手段が選択され、
量子化が実行される。コード化された音声データの量子
化手段が、正符号用であるか負符号用であるかを、復号
化装置に対し指示する必要があるため、正負の符号が切
り替わるタイミング、すなわち負のデータ値から正のデ
ータ値に変わる場合と、逆に正のデータ値から負のデー
タ値に変わる場合で、コード化データの中に所定の識別
コードが挿入される。一方、復号化装置では、この符号
化装置の正負２種類の量子化手段に対応する２種類の復
号化手段が設けられ、入力される符号化データにおいて
識別コードが検出される毎に正負２種類の復号化手段が
選択されて、復号化が実行される。

【００１６】従来の技術では、符号化処理において量子
化の範囲として音声データの正の領域と負の領域を合わ
せたものを使用していたの対し、本発明では量子化の範
囲を音声データの正領域と負領域とを別々に設定し、音
声サンプル値の正負符号に応じて量子化範囲を切り替え
る点が異なる。したがって、従来方式に比べ量子化範囲
は半分となり、従来方式と同等の品質を得るための量子
化ビット数を音声コード当り１ビット削減することがで
きる。

【００１７】

【発明の実施の形態】図１に本発明の音声符号化装置の
実施の形態を示す。マイク等からのアナログ音声信号が
入力端子１１よりへ入力され、音声入力部１２でＡＤ変
換（アナログ・デジタル変換）され、さらに情報圧縮の
ために波形符号化が実行される。波形符号化方式として
はＡＤＰＣＭ方式が一般的であるが、本発明ではサンプ
リング周波数毎に信号値がコード化されている方式であ
れば種類は規定しない。入力部１２からは情報圧縮され
たサンプル値（波形符号化データ）の時系列が出力され
る。サンプルと量子化値の対応を格納したＲＯＭ等の量
子化テーブル部１５は、サンプル値が正符号である場合
と負符号である場合、すなわち、音声データの正領域用
と負領域用の２種類のテーブル１５ａ，１５ｂからな
る。符号判定部１３ではサンプル値毎に正負符号を判定
する。量子化テーブル選択部１４は符号判定結果から、
量子化テーブル１５のうち、正の量子化テーブル１５ａ
と負の量子化テーブル１５ｂのいずれかを選択する。符
号化部１６は、選択された符号化テーブルを用いてサン
プル値を符号化すると同時に、サンプル値の正負符号が
切り替わるとき、あらかじめ定めた符号切替識別コード
をサンプル値のコードデータすなわち音声コードの時系
列に挿入する。結果のコードデータはコード出力部１７
より記憶媒体やネットワークなどに出力される。

【００１８】サンプル値の時系列が符号化部１６により
コードデータに変換される処理内容を図２により説明す
る。図中の（Ａ）は、サンプル値の時間変化を示した例
である。横軸のＳ１からＳ１０が音声サンプルの時系列
で、縦軸がサンプル値である。縦軸の値ｄは量子化幅、
“０００”から“１１０”は量子化後のコードを表して
いる。サンプルＳ１は信号値が０であるので“０００”
にコード化される。サンプルＳ２からＳ５は信号値が負
か０であり、正負符号は同じなので負領域のコード化が
行なわれ、それぞれ“０１０”，“１００”，“０１
０”，“００１”となる。サンプルＳ６は信号値が正
で、直前のサンプルＳ５の信号値の負符号から切り替わ
るので、符号切替識別コードとして、ここでは“１１
１”を挿入した後、正領域のコード化が行なわれ“００
１”となる。サンプルＳ７、Ｓ８は信号値が正か０であ
るので、正領域のコード化がおこなわれ、“０１１”，
“０００”となる。つぎにサンプルＳ９は正負符号が負
に切り替わるので、信号値のコードデータの前に符号切
替識別コード“１１１”が挿入され、つぎに信号値が負
領域のコード化が行われて“０１１”が続く。サンプル
Ｓ１０は負符号でＳ９と同じなので、そのまま負領域の
コード化データ“０１０”が続くことになる。以上か
ら、コード化データの時系列は図２の（Ｂ）に示すよう
になる。

【００１９】次に、図３に本発明の音声復号化装置の実
施の形態を示す。入力端子３１から入力されたコードデ
ータは、分離部３２において符号切替識別コードと信号
値コード（音声コード）に分離される。値号値コードと
復号化値の対応を格納したＲＯＭ等の復号化テーブル部
３４は、図１の符号化テーブル部１５と同様に、正領域
と負領域用の２種類のテーブル３４ａ、３４ｂからな
る。符号切替識別コードが検出されるごとに、選択部３
３において復号化テーブル３４から正の復号化テーブル
３４ａと負の復号化テーブル３４ｂとを切り替えて選択
し、該選択された復号化テーブルを使用して、復号化部
３５において信号値コードが復号化されて波形符号化デ
ータが算出される。さらに出力部３６において、波形符
号化データはＰＣＭデータ化され、ＤＡ変換後、スピー
カー等から出力される。なお、入力されたコードデータ
に対し、最初に復号化テーブル３４ａと３４ｂのいずれ
を選択するかは、あらかじめ取り決めておくか、コード
データの時系列の先頭（ヘッダ部）にそのための識別コ
ードを挿入しておければよい。

【００２０】図４はコードデータとこれを復号する際に
選択される復号化テーブルについて示したものである。
初めのＳ１〜Ｓ３の３サンプルが復号化テーブル３４ａ
で復号化されているとき、符号切替識別コード“１１
１”が検出された後のサンプルに対しては、再び符号切
替識別コードが検出されるまで、すなわちＳ４〜Ｓ５に
対しては、復号化テーブル３４ｂが使用される。そし
て、符号切替識別コードが検出されたサンプルＳ６以降
は、再びテーブルが切り替わり、復号化テーブル３４ａ
により復号化処理が行われることになる。

【００２１】本発明では、正の量子化テーブルと負の量
子化テーブルをサンプル値の正負符号により切り替えて
使用するため、従来と同等の量子化精度を得る場合、コ
ードの量子化ビットを１ビット削減することが可能とな
る。これを図１１により説明する。

【００２２】図１１は３ビット量子化の場合の本発明に
よる方法と従来の方法における量子化範囲の違いを示し
たものである。従来の方法では３ビットで表現できる量
子化値は８個である。これに対し、本発明で従来の方法
と同等の量子化精度を得るには、量子化範囲を正と負の
領域で分けることから、半分の４個の量子化値が得られ
ればよいので、必要な量予化ビット数としては２ビット
となる。このように、本発明では、従来の方法による再
生音と同等の品質を、量子化ビットを１ビット削減して
実現できる。

【００２３】本発明を利用する波形符号化方式では、サ
ンプリング周波数分のサンプル数が存在するため、１ビ
ット削減することで全体の情報量の削減効果は大きい。
例えば、ＡＤＰＣＭ方式では８ＫＨzサンプリング、４
ビット量子化の条件が一般的であり、この場合の情報量
は３２Ｋbpsとなる。この条件のもとで本発明を適用す
ると、量子化ビット数が３ビットで同等の品質が得られ
る。このときの識別コード分を除いた情報量は２４Ｋbp
sとなり、２５％の削減を図ることができる。また、実
際の音声データに関して本発明の方法で符号化すると、
符号切替識別コードが付加されるため、従来方法に比べ
て情報量の削減効果は２０％であった。実際の会話音声
では、無音の区間と有音区間があり、無音区間に関して
は信号の変動がなく０レベルであることから、符号切替
識別コードは挿入されない。したがって、無音区間に関
しては情報量の削減効果は、上記の２５％であるといえ
る。また、有音区間に関しては、音声データの実測値か
ら削減効果は２０％程度と考えられる。以上から、通常
の音声に関して本発明を適用することにより、従来方法
に比べて２０から２５％の情報量削減を図ることが可能
となる。

【００２４】

【発明の効果】以上述べたように、本発明の音声符号化
方法、符号化装置および復号化装置によれば、従来方法
に比べ音声品質を維持したまま情報量を２０から２５％
削減できることから、装置規模の縮小化や伝送の効率化
が可能となる。

【図面の簡単な説明】

【図１】本発明の音声符号化装置の実施の形態を示すブ
ロック図である。

【図２】サンプル値の時間変化の一例及び該サンプル値
を本発明により符号化した結果の一例を示す図である。

【図３】本発明の音声復号化装置の実施の形態を示すブ
ロック図である。

【図４】コードデータの一例及びこれを復号する際に選
択される複号化テーブルについて説明する図である。

【図５】３ビット量子化における入力値と量子化値の関
係を示す図である。

【図６】３ビット量子化における量子化誤差の総和を示
す図である。

【図７】２ビット量子化における入力値と量子化値の関
係を示す図である。

【図８】２ビット量子化における量子化誤差の総和を示
す図である。

【図９】音声に対するＰＣＭサンプル値の時間変化の例
を示す図である。

【図１０】ＡＤＰＣＭ方式で符号化した際のサンプル値
の時間変化の例を示す図である。

【図１１】本発明と従来方法の量子化範囲の違いを説明
する図である。

【符号の説明】

１１入力端子１２入力部１３符号判定部１４選択部１５量子化テーブル部１６符号化部１７コード出力部３１入力端子３２分離部３３選択部３４復号化テーブル部３５復号化部３６出力部

Claims

【特許請求の範囲】

【請求項１】入力された音声信号を波形符号化し、サ
ンプリング周期毎に音声コードを出力する音声符号化方
法において、音声データの正領域と負領域とで別々に量子化の範囲を
設定し、音声サンプル値の正符号である場合と負符号で
ある場合とで別々に量子化して音声コードを得ることを
特徴とする音声符号化方法。
【請求項２】入力された音声信号を波形符号化し、サ
ンプリング周期毎に音声コードを出力する音声符号化装
置において、音声データの正領域と負領域とで別々に量子化するため
の２種類の量子化手段と、波形符号化後の音声データの各サンプル値の正負符号を
判定する手段と、前記正負符号の判定結果に応じて、前記２種類の量子化
手段から一つを選択する手段と、前記音声データの各サンプル値に対して前記選択された
量子化手段により符号化された音声コードを出力すると
ともに、サンプル値の正負符号が切り替わるときに識別
コードを挿入して出力する手段とを具備することを特徴
とする音声符号化装置。
【請求項３】入力された音声コードを復号化して波形
符号化データを得た後、音声を再生する音声復号化装置
において、サンプリング周期毎の音声コードに対し、正領域の音声
コードと負領域の音声データとで別々に復号するための
２種類の復号化手段と、入力されたコード列における符号切替りの識別コードと
音声コードを分離する手段と、前記識別コードの検出に応じて、前記２種類の復号化手
段から一つを選択する手段と、前記選択された復号化手段により前記音声コードを復号
した波形符号化データを出力する手段とを具備すること
を特徴とする音声復号化装置。