JP4260928B2

JP4260928B2 - 音声圧縮装置および記録媒体

Info

Publication number: JP4260928B2
Application number: JP18565998A
Authority: JP
Inventors: 弥章佐藤
Original assignee: United Module Corp
Current assignee: United Module Corp
Priority date: 1998-06-16
Filing date: 1998-06-16
Publication date: 2009-04-30
Anticipated expiration: 2018-06-16
Also published as: JP2000003194A

Description

【０００１】
【発明の属する技術分野】
本発明は音声圧縮装置および記録媒体に関し、特に、音声圧縮方式としてＤＰＣＭ（Differential Pulse Code Modulation）あるいはＡＤＰＣＭ（Adaptive-Differential-PCM ）を採用した装置に用いて好適なものである。
【０００２】
【従来の技術】
従来、音声信号を伝送したり蓄積したりする場合に、伝送データ量の削減や、蓄積メディア（メモリ、テープ、ディスク等）への保存可能時間の長時間化を目的として、図８に示すように音声の圧縮、伸長が行われている。図８において、音声圧縮装置８１にて入力音声から生成された音声圧縮信号が、図示しない伝送路を介して伝送されたり、図示しない蓄積メディアに蓄積されたりする。その後、必要に応じて音声伸長装置８２にて伸長され、再生音声として出力される。
【０００３】
音声信号の圧縮方式としては、例えばＡＤＰＣＭ（Adaptive-Differential-PCM ）が一般的に知られている。このＡＤＰＣＭによる圧縮方式は、波形をサンプリングするとき隣り合うサンプル値の差分を量子化する手法であるＤＰＣＭ（Differential Pulse Code Modulation）において、量子化のステップサイズ（スケーリング係数）を波形の振幅によって適応的に変える方式である。例えば、振幅の大きいところではステップサイズを大きくし、波形の変化に追従できるようにする。
【０００４】
例えば、ＰＣＭ音声信号の場合には１サンプル当たり１６ビット必要であったのが、ＤＰＣＭを適用すると７ビット程度に圧縮できるが、非常に大きなピークを有する音声では、この７ビットでは表現しきれない場合が生じる。そこで、ＤＰＣＭによる音声圧縮信号に対して、以前に生成したＤＰＣＭのデータから線形的に予測したスケールファクタをかけることにより、７ビットのみであっても大きな変化を有する音声を十分に表現できるようにしている。
【０００５】
このＡＤＰＣＭは、例えばＰＨＳの音声圧縮方式として採用されている。すなわち、最近のディジタル電話回線は、サンプリング周波数が８ＫＨｚで１サンプル当たりのビット数が８ビットであり、伝送レートは６４Ｋｂｐｓであるのに対して、ＡＤＰＣＭにより音声圧縮をした場合には量子化ビット数が４ビットであり、伝送レートは３２Ｋｂｐｓである。
【０００６】
このようなＰＨＳを考えた場合、図８の音声圧縮装置８１は送信側のＰＨＳ端末内にあり、音声伸長装置８２は受信側のＰＨＳ端末内にある。そして、送信側の音声圧縮装置８１で入力音声から生成された音声圧縮信号は、電話回線を通して伝送され、受信側の音声伸長装置８２で伸長され、再生音声として出力される。この例では音声圧縮装置８１と音声伸長装置８２とが別の端末に備えられているが、同一筐体内に備えられる場合もある。
【０００７】
例えば、ＤＲＡＭ等のメモリや磁気テープ、あるいはディスク等の記録媒体に音声信号を圧縮して記憶し、それを必要に応じて伸長して再生する機能を備えた音声再生装置あるいは音声記録再生装置等では、音声圧縮装置８１と音声伸長装置８２とが同じ筐体内に備えられる。この場合にも音声圧縮方式として、上述のＤＰＣＭやＡＤＰＣＭによる圧縮方式を採用することが可能である。
【０００８】
図９は、ＤＰＣＭを採用した従来の音声圧縮装置の構成を示す図であり、図１０は、同じくＤＰＣＭを採用した従来の音声伸長装置の構成を示す図である。まず図９を用いてＤＰＣＭによる音声圧縮の動作について説明する。
各サンプルポイントのＰＣＭ音声信号PCM[j]は差分回路９１に順次入力され、下記の式（１）に従って隣り合うサンプル値の差分が計算される。
DPCM[j] = PCM[j] - PCM'[j-1]……（１）
【０００９】
この式（１）において、ｊはサンプルポイントの番号を表す値、DPCM[]は隣り合うサンプル値の差分値、PCM[] はＰＣＭ音声信号のサンプル値、PCM'[]はＰＣＭ音声信号を一度圧縮してから伸長して元に戻した値である。音声圧縮装置で音声信号を圧縮した後に、音声伸長装置で元の波形と近い波形を再生するためには、PCM[j-1]ではなくこのPCM'[j-1] のような値を使って差分式（１）を使用しなければならない。
【００１０】
上記差分回路９１で計算された差分値DPCM[j] は、正規化・量子化装置９２で圧縮され、音声圧縮信号code[j] として出力される。この音声圧縮信号code[j] は、逆正規化・逆量子化装置９３にも与えられ、上記正規化・量子化装置９２による処理とは逆の処理を行うことによって差分値DPCM'[j]が生成される。この差分値DPCM'[j]は、逆差分回路９４に与えられ、下記の式（２）に従って上記差分回路９１とは逆の処理が行われる。
PCM'[j] = PCM'[j-1] + DPCM'[j]……（２）
【００１１】
ここで求められたＰＣＭ音声信号のサンプル値PCM'[j] は、正規化・量子化装置９２で発生した量子化誤差を含む値であり、遅延バッファ９５により一定時間だけ遅延された後、差分回路９１および逆差分回路９４に供給される。上述したように、このような量子化誤差を含んだサンプル値PCM'[j] を差分式（１）に用いることにより、実際に入力された音声の波形と極めて近い波形の音声を、図１０に示す音声伸長装置で再生することが可能となる。
【００１２】
次に、図１０を用いてＤＰＣＭによる音声伸長の動作について説明する。入力された音声圧縮信号code[j] は、逆正規化・逆量子化装置１０１に与えられ、上記音声圧縮装置の正規化・量子化装置９２による処理とは逆の処理を行うことによって差分値DPCM'[j]が生成される。この差分値DPCM'[j]は、逆差分回路１０２に与えられ、上述の逆差分式（２）に従って上記差分回路９１とは逆の処理が行われる。ここで求められたＰＣＭ音声信号のサンプル値PCM'[j] は、再生音声として出力されるとともに、遅延バッファ１０３により一定時間だけ遅延された後、逆差分回路１０２に供給される。
【００１３】
【発明が解決しようとする課題】
上述のように、ＤＰＣＭ方式（ＡＤＰＣＭ方式も同様）では、音声圧縮装置と音声伸長装置で差分式と逆差分式とを使用している。これは、音声信号の一般的特性として、周波数が低くなるほど信号圧が高くなるという性質があるため、差分式を使用して圧縮することにより、その結果は、元のＰＣＭ音声信号よりも絶対値が小さな値となることが期待でき（双方共に２の補数表現とした場合）、しかもデータ圧縮時の損失が少なく、再生音声の品質が向上するためである。
【００１４】
しかしながら、従来のＤＰＣＭ方式では、これらの差分式および逆差分式は、音声の周波数帯域によらず固定のものが使用されていた。この場合、低周波数の音声信号が入力された場合のＳ／Ｎ比は良好だが、ある程度以上周波数の高い音声信号が入力された場合には、再生音声のＳ／Ｎ比が劣化してしまう。さらに細かく見れば、固定で使用されている差分式および逆差分式は、ある周波数帯域の音声信号に対してのみ非常に良い結果をもたらすが、他の周波数帯域の音声信号に対してはそれよりもＳ／Ｎ比が劣化してしまうという問題があった。
【００１５】
本発明は、このような問題を解決するために成されたものであり、ＤＰＣＭ方式あるいはＡＤＰＣＭ方式による差分式および逆差分式を入力音声信号の周波数帯域に応じて変更することによって、どんな周波数帯域の音声信号が入力された場合でも良好なＳ／Ｎ比の再生信号を得ることができるようにすることを目的とする。
【００１６】
【課題を解決するための手段】
本発明の音声圧縮伸長装置は、入力音声信号の周波数帯域を検出する入力信号解析手段と、上記入力音声信号に対してＤＰＣＭあるいはＡＤＰＣＭによる差分演算を行うと共に、上記差分演算を行うための複数の差分式を有するフィルタ手段と、上記フィルタ手段が有する複数の差分式のうち、上記入力信号解析手段において検出された周波数帯域に応じて、その周波数付近においてアンダーピークを有するゲイン特性の差分式を選択的に使用するように制御する制御手段と、上記制御手段において選択された差分式を用いて上記フィルタ手段において差分演算された差分値に対して、正規化および量子化することによって圧縮する圧縮手段と、上記圧縮手段において正規化および量子化された差分値を逆正規化および逆量子化する手段と、上記逆正規化および逆量子化された差分値に対して、上記制御手段において選択された差分式の選択信号に基づいて、複数の逆差分式から上記選択信号に対応する逆差分式を選択して逆差分演算を行い、音声信号を求める逆差分手段と、上記逆差分手段において求められた音声信号を上記フィルタ手段に供給する手段とを備えたことを特徴とする。
【００１８】
上記入力信号解析手段は、上記入力音声信号の周波数帯域をＦＦＴにより検出する手段であっても良い。
また、上記入力音声信号の一定時間区間内において符号反転する回数をカウントすることにより検出するようにしても良い。
【００１９】
また、上記制御手段において選択的に切り替えられた差分式の選択信号を圧縮信号と共に伝送する手段を備えるようにしても良い。
また、圧縮後のデータ形式として圧縮信号とスケールファクタとを持つ方式の音声圧縮装置であって、上記制御手段において選択的に切り替えられた差分式の選択信号および上記スケールファクタを上記圧縮信号と共に伝送する手段を備えようにしても良い。
【００２０】
本発明のコンピュータ読み取り可能な記録媒体は、入力音声信号の周波数帯域を検出する入力信号解析手段、上記入力音声信号に対してＤＰＣＭあるいはＡＤＰＣＭによる差分演算を行うと共に、上記差分演算を行うための複数の差分式を有するフィルタ手段、上記フィルタ手段が有する複数の差分式のうち、上記入力信号解析手段において検出された周波数帯域に応じて、その周波数付近においてアンダーピークを有するゲイン特性の差分式を選択的に使用するように制御する制御手段、上記制御手段において選択された差分式を用いて上記フィルタ手段において差分演算された差分値に対して、正規化および量子化することによって圧縮する圧縮手段、上記圧縮手段において正規化および量子化された差分値を逆正規化および逆量子化する手段、上記逆正規化および逆量子化された差分値に対して、上記制御手段において選択された差分式の選択信号に基づいて、複数の逆差分式から上記選択信号に対応する逆差分式を選択して逆差分演算を行い、音声信号を求める逆差分手段、および上記逆差分手段において求められた音声信号を上記フィルタ手段に供給する手段としてコンピュータを機能させるためのプログラムを記録したことを特徴とする。
【００２１】
【発明の実施の形態】
以下、本発明の一実施形態を図面に基づいて説明する。
図１は、本発明による音声圧縮装置の構成例を示す図であり、図２は、この音声圧縮装置と対にして用いられる音声伸長装置の構成例を示す図である。
【００２２】
図１において、１は差分回路であり、入力されるＰＣＭ音声信号PCM[j]の波形をサンプリングするときに連続するサンプル値の差分を計算する。本実施形態の差分回路１で使用する差分式は、例えば次の式(11)〜(18)の８つである。
DPCM[j] = PCM[j] - 2*PCM'[j-1] + PCM'[j-2] ……(11)
DPCM[j] = PCM[j] - PCM'[j-1] + PCM'[j-2]/2……(12)
DPCM[j] = PCM[j] - PCM'[j-1] ……(13)
DPCM[j] = PCM[j] - PCM'[j-1]/2 + PCM'[j-2] ……(14)
DPCM[j] = PCM[j] + PCM'[j-2] ……(15)
DPCM[j] = PCM[j] + PCM'[j-1]/2 + PCM'[j-2] ……(16)
DPCM[j] = PCM[j] + PCM'[j-1] + PCM'[j-2]/2……(17)
DPCM[j] = PCM[j] + 2*PCM'[j-1] + PCM'[j-2] ……(18)
【００２３】
２は入力信号解析器であり、入力されたＰＣＭ音声信号を周波数解析し、入力音声の周波数帯域を検出する。３は差分式制御装置であり、上記入力信号解析器２での解析結果に応じて差分式選択信号control を出力し、差分回路１における８つの差分式(11)〜(18)のうち何れの式を用いて音声圧縮を行うかを制御する。すなわち、差分値DPCM[j] を（PCM[j], PCM'[j-1], PCM'[j-2]）の関数として、差分式選択信号control で差分式(11)〜(18)のうちの何れか１つを入力音声信号の周波数帯域に応じて選択する。
【００２４】
４は正規化・量子化装置であり、上記差分回路１で何れかの差分式に従って計算された差分値DPCM[j] に対して正規化および量子化の処理を施すことによって圧縮を行い、圧縮コード信号code[j] を生成する。このようにして、例えば１６ビットの入力ＰＣＭ音声信号PCM[j]から、例えば７ビットの圧縮コード信号code[j] を生成することが可能である。この圧縮コード信号code[j] は、逆正規化・逆量子化装置５および信号ミキサ８に与えられる。逆正規化・逆量子化装置５は、上記正規化・量子化装置４による処理とは逆の処理を行うことによって差分値DPCM'[j]を生成するものである。
【００２５】
６は逆差分回路であり、上記差分回路１とは逆の処理を行うことによって元のＰＣＭ音声信号PCM[j]に近いサンプル値PCM'[j] を生成する。この逆差分回路６で使用する逆差分式は、上述した差分式(11)〜(18)にそれぞれ対応した次の式(21)〜(28)である。
PCM'[j] = 2*PCM'[j-1] - PCM'[j-2] + DPCM'[j] ……(21)
PCM'[j] = PCM'[j-1] - PCM'[j-2]/2 + DPCM'[j] ……(22)
PCM'[j] = PCM'[j-1] + DPCM'[j] ……(23)
PCM'[j] = PCM'[j-1]/2 - PCM'[j-2] + DPCM'[j] ……(24)
PCM'[j] = - PCM'[j-2] + DPCM'[j] ……(25)
PCM'[j] = -PCM'[j-1]/2 - PCM'[j-2] + DPCM'[j] ……(26)
PCM'[j] = -PCM'[j-1] - PCM'[j-2]/2 + DPCM'[j] ……(27)
PCM'[j] = 2*PCM'[j-1] - PCM'[j-2] + DPCM'[j] ……(28)
これら８つのサンプル値PCM'[j] は（PCM'[j-1], PCM'[j-2], DPCM'[j]）の関数として、差分式選択信号control によって何れか１つが選択される。
【００２６】
この逆差分回路６によって何れかの逆差分式に従って求められたＰＣＭ音声信号PCM'[j] は、遅延バッファ７により一定時間だけ遅延された後、差分回路１および逆差分回路６に供給される。このような量子化誤差を含んだサンプル値PCM'[j] を差分式および逆差分式に用いることにより、実際に入力された音声の波形と極めて近い波形の音声を、図２に示す音声伸長装置で再生することが可能となる。
【００２７】
上述したように、差分式制御装置３は、差分回路１における差分式と逆差分回路６における逆差分式として、それぞれ８つの式の中から実際に使用する式を選択する。この差分式制御装置３がどの式を選択するかについては、基本的には、入力されたＰＣＭ音声信号を入力信号解析器２によって周波数解析し、検出した周波数に最も適した式を設定するが、外部からユーザが任意に設定することも可能である。
【００２８】
差分式制御装置３を用いて何れかの差分式および逆差分式を選択した場合、どの式を選択したかを何らかの手段で音声伸長装置に伝える必要がある。そのために本実施形態では、例えば、音声圧縮装置の出力段に信号ミキサ８を設け、解析の結果得られた式番号等からなる差分式選択信号control を音声圧縮信号にミキシングして伝送するようにしている。後述するが、音声伸長装置側には信号分配装置を設け、ヘッダ等に付加されて伝送された式番号を分離する。
【００２９】
次に、図２において、１１は信号分配装置であり、入力された音声圧縮信号から圧縮コード信号code[j] と差分式選択信号control とを分離し、分離した圧縮コード信号code[j] を逆正規化・逆量子化装置１２に供給するとともに、差分式選択信号control を逆差分回路１３に供給する。逆正規化・逆量子化装置１２は、図１の音声圧縮装置の正規化・量子化装置４による処理とは逆の処理（逆正規化・逆量子化装置５と同様の処理）を行うことによって差分値DPCM'[j]を生成する。
【００３０】
また、逆差分回路１３は、逆正規化・逆量子化装置１２より生成された差分値DPCM'[j]に対して、上記式(21)〜(28)の中から差分式選択信号control によって選択された何れか１つの逆差分式に従って図１の差分回路１とは逆の処理（逆差分回路６と同様の処理）を行う。ここで求められたＰＣＭ音声信号PCM'[j] は、再生音声として出力されるとともに、遅延バッファ１４により一定時間だけ遅延された後、逆差分回路１３に供給される。
【００３１】
次に、上記差分回路１における８つの差分式(11)〜(18)の意味合いについて、図３を用いて説明する。図３は、周波数に対する差分式のゲイン特性（差分回路１のフィルタ特性）を示す図であり、図の横軸は入力ＰＣＭ音声信号の周波数を示し、縦軸は各差分式により得られる絶対値の平均を示している。図３に示す３つのゲイン特性▲１▼〜▲３▼は、それぞれ上記の差分式(11)、(15)、(18)に対応するものである。ここでは代表として３つのゲイン特性を示しているが、８つの差分式(11)〜(18)に対応する８つのゲイン特性は、アンダーピークの位置する周波数が少しずつずれたものとなっている。
【００３２】
再生音声において良好なＳ／Ｎ比を得るためには、ゲインができるだけ小さいことが望ましい。したがって、８つの差分式(11)〜(18)は、それぞれのゲイン特性でアンダーピークが位置する周波数のＰＣＭ音声信号に対して用いるのが望ましい。すなわち、差分式(11)は低い周波数のＰＣＭ音声信号に、差分式(15)は中間周波数のＰＣＭ音声信号に、差分式(18)は高い周波数のＰＣＭ音声信号に用いるのが望ましい。
【００３３】
従来は、音声のいわゆる１／ｆゆらぎ特性（音の信号圧は１／周波数に比例して下がるという特性）に対応して、▲１▼に類似した特性を有する差分式を固定して用いていた。これに対して本実施形態では、入力されたＰＣＭ音声信号の周波数帯域がどこにあるかに応じて、その周波数付近においてアンダーピークを有するゲイン特性の差分式を選択的に使用して圧縮するようにしている。これにより、どんな周波数帯域の音声信号でも、ＤＰＣＭ後に得られる期待値のレベルを小さく抑えることができ、再生音声のＳ／Ｎ比を良好に保つことができる。
【００３４】
次に、差分式の切り替え判定手法（入力ＰＣＭ音声信号の周波数帯域の判定手法）について説明する。
ここでは、入力されたＰＣＭ音声信号に含まれる周波数成分を解析し、最も適したＤＰＣＭの差分式を選択することにより、良好なＳ／Ｎ比の再生音声を得ることができるようにする。
【００３５】
一般的に周波数成分をデジタル的に解析する手段として、ＦＦＴ（高速フーリエ変換）やＤＦＴ（離散的フーリエ変換）が知られており、これを本実施形態に適用することが可能である。例えば、入力されたＰＣＭ音声信号に対してＦＦＴによる解析を行った結果、当該ＰＣＭ音声信号を最も高いピークの得られた周波数成分を持つ信号であると判断する。そして、その周波数付近にアンダーピークを有する特性の差分式を選択的に用いるようにする。
【００３６】
このＦＦＴによる周波数解析手段によれば、周波数解析を行う区間内における各周波数成分の信号圧、位相が比較的正確に算出できるが、メモリ量、演算回数が極めて多く、ハードウェア量が膨大であり、消費電力も多いという欠点を有する。そこで本実施形態では、以下に示す他の周波数解析手段を提供するものである。
【００３７】
本実施形態による周波数解析手段の第１の例は、一定の時間区間内においてＰＣＭ音声信号が符号反転する回数（信号値が“０”をクロスする回数）をカウントして周波数を解析するものである。すなわち、図４に示すように、ある一定の時間区間内で入力ＰＣＭ音声信号を見た場合、周波数が低くなるほどゼロクロスの回数は少なくなり、周波数が高くなるほどゼロクロスの回数は多くなる。よって、一定の時間内でこのゼロクロスの回数をカウントすることにより、ＰＣＭ音声信号の周波数成分を解析することが可能である。
【００３８】
本実施形態による周波数解析手段の第２の例は、一定の時間区間内において、入力されたＰＣＭ音声信号の信号圧の絶対値の和と、ＤＰＣＭ処理後の差分値の絶対値の和とを比較して解析するものである。すなわち、図５に示すように、図４に示したような同じ信号圧の音声でも周波数が異なる場合には、ＤＰＣＭ処理を施すと、周波数が低い方では得られた差分値の振幅は小さくなり、周波数が高い方では得られた差分値の振幅が大きくなる。
【００３９】
つまり、ある一定時間区間内における入力ＰＣＭ音声信号の絶対値の和と、ＤＰＣＭによるフィルタ処理後の差分値の絶対値の和との比率は、周波数によって異なる。そこで、例えば異なる複数の周波数で入力ＰＣＭ音声信号にフィルタをかける簡単な手段を入力信号解析器２に用意しておき、フィルタ処理後の値の一定時間内における平均的な大きさ（絶対値平均もしくは二乗平均）を算出する。そして、この算出結果と入力音声の平均的な大きさとの比率を見ることによって、現在入力されているＰＣＭ音声信号の周波数を類推する。
【００４０】
このように、第２の例では、周波数成分の解析用に幾つかのフィルタが必要になるが、これは差分回路１における８つの差分式に対応するフィルタほど詳細で複雑なものでなくても良く、それほど回路規模が大きくなることはない。また、差分回路１における８つの差分式に対応するフィルタを周波数成分の解析用に兼用するようにしても良い。
【００４１】
以上に述べた周波数解析手段の第１の例および第２の例によれば、必要とするハードウェア量がＦＦＴの場合と比較してはるかに少なくて済み、メモリ量、演算回数、消費電力も少ないという利点を有する。なお、入力されるＰＣＭ音声信号は、常に図４に示したようなきれいなサイン波であるとは限らない。よって、上記した第１の例もしくは第２の例による手法を単独で用いただけでは、必ずしも正しい周波数成分の解析が行えるとは限らない。
【００４２】
そこで、周波数解析手段の第３の例として、上記した第１の例もしくは第２の例の手法を、ある一定時間区間内で１回のみ行うのではなく、異なる時間区間内で複数回行うことにより、解析結果の精度を高めることができる。さらに、第４の例として、上記した第１の例もしくは第２の例の手法を単独で用いるのではなく、両者を併せて用いることにより、あるいは両者の手法を異なる時間区間内でそれぞれ複数回行うことにより、解析結果の精度を更に高めることができる。
【００４３】
次に、本発明による音声圧縮装置の第２の実施形態について説明する。上記した実施形態では、音声信号の圧縮方式としてＤＰＣＭを採用した場合について述べた。これに対して第２の実施形態では、スケールファクタを圧縮コード信号code[j] とミキシングして伝送する方式の音声圧縮装置について説明する。
【００４４】
図６は、第２の実施形態による音声圧縮装置の構成例を示す図であり、図１に示したブロックと同じブロックには同一の符号を付している。また、図７は、第２の実施形態による音声伸長装置の構成例を示す図であり、図２に示したブロックと同じブロックには同一の符号を付している。
【００４５】
なお、以下の説明において、
SubInfo[k]は圧縮補助信号、
SubInfo[k].SF はスケールファクタ信号（例えば５ビット）、
SubInfo[k].LN は差分式選択信号（例えば３ビット）、
N は圧縮補助信号を適用するＰＣＭの長さ、
SFtbl[n]はスケールファクタテーブル（例えば、SFtbl[n]=2^(n/4))
であるものとする。
【００４６】
つまり、各々の圧縮補助信号SubInfo[k]のインデックスに対応する入力ＰＣＭ信号PCM[j]、圧縮コード信号Code[j] は、次のようになる。
SubInfo[0] : PCM[0] 〜 PCM[N-1] 、Code[0] 〜 Code[N-1]
SubInfo[1] : PCM[N] 〜 PCM[2*N-1] 、Code[N] 〜 Code[2*N-1]
SubInfo[2] : PCM[2*N] 〜 PCM[3*N-1] 、Code[2*N] 〜 Code[3*N-1]
SubInfo[3] : PCM[3*N] 〜 PCM[4*N-1] 、Code[3*N] 〜 Code[4*N-1]
SubInfo[4] : PCM[4*N] 〜 PCM[5*N-1] 、Code[4*N] 〜 Code[5*N-1]
……
【００４７】
以下に、本実施形態の動作を説明する。まず、図６に示す音声圧縮装置の動作について説明する。入力信号解析器６２では、入力されたＰＣＭ音声信号PCM[j]を解析し、その解析結果を制御装置６３に与えてスケールファクタ、差分式の選択を実施する。ここでは差分式(11)を用いるものとする。また、正規化・量子化装置４では、この差分式(11)に従って差分回路１で計算された差分値DPCM[j] に対して、以下の式(31)、(32)に従って圧縮を行う。
Code[j] = DPCM[j] / SFtbl[tmp#11[j].SF] ……(31)
Code[j] = DPCM[j] / SFtbl[SubInfo[k].SF]……(32)
【００４８】
ここで、式(31)と式(32)の関係について説明する。図６の正規化・量子化装置４では、最終的に式(32)を使用する予定であるが、いま述べている内容は、その前処理に当たる入力信号解析器６２についての処理であり、まだスケールファクタ信号SubInfo[k].SF は確定していない。この入力信号解析器６２では、スケールファクタ信号SubInfo[k].SF と差分式選択信号SubInfo[k].LN とを確定させることを目的として処理をしており、その処理のために正規化・量子化装置４で一時的に用いるのが式(31)である。
【００４９】
本実施形態では、このような入力信号解析器６２の処理で要する時間分だけ入力ＰＣＭ音声信号を遅延させるための遅延バッファ６１を、差分回路１の前段に設けている。そして、入力信号解析器６２および制御回路６３では、差分回路１において式(11)に従って計算した結果に対して正規化・量子化装置４で式(31)を適用した場合に、圧縮コード信号Code[j] が例に示す７ビットの表現範囲に収まるスケールファクタ係数tmp#11[j].SFの最小値を求める。
【００５０】
この最小値は、差分値DPCM[j] に対するマッピングとなり、下記に示すような値となる。
DPCM[j] tmp#11[j].SF
-64 ≦DPCM[j] ＜64 ：tmp#11[j].SF = 0
-76 ≦DPCM[j] ＜76 ：tmp#11[j].SF = 1
-90 ≦DPCM[j] ＜90 ：tmp#11[j].SF = 2
-107≦DPCM[j] ＜107 ：tmp#11[j].SF = 3
-128≦DPCM[j] ＜128 ：tmp#11[j].SF = 4
……
【００５１】
最小値を求めるのは以下の理由による。すなわち、上記式(31)から、SFtbl[] の値が大きくなると量子化刻み幅が大きくなり、再生音声のＳ／Ｎ比が劣化する。したがって、再生音声の品質を上げることが目標であるため、できる限り小さなスケールファクタ係数tmp#11[j].SFの値が望ましいということになり、最小値を選択するという答えになる。
【００５２】
このようにスケールファクタ係数を対応させる処理を j=0〜N-1 まで行い、その中で最大のtmp#11[j].SFを求める。これは、式(31)を使用した場合に、オーバフローやアンダーフローの発生しない値を選択する必要があるからである。この解をSubInfo#11[k].SFとする。つまり、
SubInfo#11[k].SF = max(tmp#11[k*N], tmp#11[k*N+1], … tmp#11[(k+1)*N-1])
である。
【００５３】
なお、ここでは、差分式(11)についてのみ示したが、差分式の選択を行うことを前提とした場合、最も適切な式番号とスケールファクタとを求めるために、各々の差分式に対応するスケールファクタを夫々求め、スケールファクタの値が最も小さな式番号とスケールファクタとの組を最終的な入力信号解析器６２の解とする。つまり、
SubInfo[k].SF = min (SubInfo#11[k].SF, SubInfo#12[k].SF, SubInfo#13[k].SF,… SubInfo#18[k].SF)
SubInfo[k].LN = 上記の最小の値の番号
である。
【００５４】
制御装置６３は、上記入力信号解析器６２での解析結果に応じて差分式選択信号SubInfo[k].LN とスケールファクタ信号SubInfo[k].SF とを出力する。差分式選択信号SubInfo[k].LN は、差分回路１、逆差分回路６および信号ミキサ８に入力され、スケールファクタ信号SubInfo[k].SF は、正規化・量子化装置４および逆正規化・逆量子化装置５に入力される。上記正規化・量子化装置４で使用されたスケールファクタ信号SubInfo[k].SF は、信号ミキサ８にも与えられる。
【００５５】
次に、図７に示す音声伸長装置について説明する。図７に示すように、本実施形態では信号分配装置１１の出力段に制御装置７１が設けられている。制御装置７１は、差分式選択信号SubInfo[k].LN を逆差分回路１３に供給するとともに、スケールファクタ信号SubInfo[k].SF を逆正規化・逆量子化装置１２に供給するように制御する。
【００５６】
なお、以上の実施形態では、選択対象の差分式として式(11)〜(18)の８つを用いているが、本発明はこの数には限定されるものではなく、それより多い差分式あるいは少ない差分式を選択的に使用するようにしても良い。より少ない差分式を用いる場合、式(13)および式(15)に示す２項式のみを用いても良いし、それ以外の３項式のみを用いるようにしても良い。あるいは、２項式と３項式とを１つずつ用意し、その何れかを選択的に使用するようにしても良い。
【００５７】
また、本実施形態は、例えばＰＨＳのように、音声圧縮装置と音声伸長装置とが別の筐体内に備えられ、音声圧縮信号が伝送路を介して伝送されるようなシステムや、音声再生装置あるいは音声記録再生装置等のように、音声圧縮装置と音声伸長装置とが同じ筐体内に備えられるようなシステムに適用することが可能である。
【００５８】
（本発明の他の実施形態）
上記図１および図２、あるいは図６および図７に示した各ブロックは、本実施形態においてはハード的に構成しているが、ＣＰＵ、ＲＯＭおよびＲＡＭ等からなるマイクロコンピュータシステムによって構成し、その動作をＲＯＭやＲＡＭに格納された作業プログラムに従って実現するようにしても良い。
【００５９】
この場合、上記作業プログラム自体が上述した実施形態の機能を実現することになり、そのプログラム自体、およびそのプログラムをコンピュータに供給するための手段、例えばかかるプログラムを格納した記録媒体は本発明を構成する。かかるプログラムを記憶する記録媒体としては、上記ＲＯＭやＲＡＭの他に、例えばフロッピーディスク、ハードディスク、光ディスク、光磁気ディスク、ＣＤ−ＲＯＭ、ＣＤ−Ｉ、ＣＤ−Ｒ、ＣＤ−ＲＷ、ＤＶＤ、ｚｉｐ、磁気テープ、あるいは不揮発性のメモリカード等を用いることができる。
【００６０】
また、コンピュータが供給されたプログラムコードを実行することにより、上述の実施形態の機能が実現されるだけでなく、そのプログラムコードがコンピュータにおいて稼働しているＯＳ（オペレーティングシステム）あるいは他のアプリケーションソフト等の共同して上述の実施形態の機能が実現される場合にもかかるプログラムコードは本発明の実施形態に含まれることは言うまでもない。
【００６１】
さらに、供給されたプログラムコードがコンピュータの機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに格納された後、そのプログラムコードの指示に基づいてその機能拡張ボードや機能拡張ユニットに備わるＣＰＵ等が実際の処理の一部または全部を行い、その処理によって上述した実施形態の機能が実現される場合にも本発明に含まれることは言うまでもない。
【００６２】
【発明の効果】
本発明は上述したように、入力された音声の特性を解析し、その解析結果に基づいて、フィルタ手段で使用するフィルタ特性（差分式）を選択的に切り替えるようにしたので、入力音声の特性（例えば周波数特性）に応じて最も適した差分式を選択して音声圧縮を行うことができ、どんな周波数帯域の音声信号が入力されても良好なＳ／Ｎ比の再生音声を得ることができる。
【図面の簡単な説明】
【図１】本発明の第１の実施形態に係る音声圧縮装置の構成を示す図である。
【図２】本発明の第１の実施形態に係る音声伸長装置の構成を示す図である。
【図３】周波数に対する差分式のゲイン特性を示す図である。
【図４】本発明による周波数解析手段の第１の例を説明するための図である。
【図５】本発明による周波数解析手段の第２の例を説明するための図である。
【図６】本発明の第２の実施形態に係る音声圧縮装置の構成を示す図である。
【図７】本発明の第２の実施形態に係る音声伸長装置の構成を示す図である。
【図８】従来の音声圧縮伸長装置の構成を示す図である。
【図９】従来の音声圧縮装置の構成を示す図である。
【図１０】従来の音声伸長装置の構成を示す図である。
【符号の説明】
１差分回路
２入力信号解析器
３差分式制御装置
４正規化・量子化装置
５逆正規化・逆量子化装置
６逆差分回路
７遅延バッファ
８信号ミキサ
１１信号分配装置
１２逆正規化・逆量子化装置
１３逆差分回路
１４遅延バッファ
６１遅延バッファ
６２入力信号解析器
６３制御装置
７１制御装置

Claims

入力音声信号の周波数帯域を検出する入力信号解析手段と、
上記入力音声信号に対してＤＰＣＭあるいはＡＤＰＣＭによる差分演算を行うと共に、上記差分演算を行うための複数の差分式を有するフィルタ手段と、
上記フィルタ手段が有する複数の差分式のうち、上記入力信号解析手段において検出された周波数帯域に応じて、その周波数付近においてアンダーピークを有するゲイン特性の差分式を選択的に使用するように制御する制御手段と、
上記制御手段において選択された差分式を用いて上記フィルタ手段において差分演算された差分値に対して、正規化および量子化することによって圧縮する圧縮手段と、
上記圧縮手段において正規化および量子化された差分値を逆正規化および逆量子化する手段と、
上記逆正規化および逆量子化された差分値に対して、上記制御手段において選択された差分式の選択信号に基づいて、複数の逆差分式から上記選択信号に対応する逆差分式を選択して逆差分演算を行い、音声信号を求める逆差分手段と、
上記逆差分手段において求められた音声信号を上記フィルタ手段に供給する手段と
を備えたことを特徴とする音声圧縮装置。
上記入力信号解析手段は、上記入力音声信号の周波数帯域をＦＦＴにより検出することを特徴とする請求項１に記載の音声圧縮装置。
上記入力信号解析手段は、上記入力音声信号の一定時間区間内において符号反転する回数をカウントすることによって周波数帯域を検出することを特徴とする請求項１に記載の音声圧縮装置。
上記制御手段において選択的に切り替えられた差分式の選択信号を圧縮信号と共に伝送する手段を備えたことを特徴とする請求項１〜３の何れか１項に記載の音声圧縮装置。
圧縮後のデータ形式として圧縮信号とスケールファクタとを持つ方式の音声圧縮装置であって、
上記制御手段において選択的に切り替えられた差分式の選択信号および上記スケールファクタを上記圧縮信号と共に伝送する手段を備えたことを特徴とする請求項１〜４の何れか１項に記載の音声圧縮装置。
入力音声信号の周波数帯域を検出する入力信号解析手段、
上記入力音声信号に対してＤＰＣＭあるいはＡＤＰＣＭによる差分演算を行うと共に、上記差分演算を行うための複数の差分式を有するフィルタ手段、
上記フィルタ手段が有する複数の差分式のうち、上記入力信号解析手段において検出された周波数帯域に応じて、その周波数付近においてアンダーピークを有するゲイン特性の差分式を選択的に使用するように制御する制御手段、
上記制御手段において選択された差分式を用いて上記フィルタ手段において差分演算された差分値に対して、正規化および量子化することによって圧縮する圧縮手段、
上記圧縮手段において正規化および量子化された差分値を逆正規化および逆量子化する手段、
上記逆正規化および逆量子化された差分値に対して、上記制御手段において選択された差分式の選択信号に基づいて、複数の逆差分式から上記選択信号に対応する逆差分式を選択して逆差分演算を行い、音声信号を求める逆差分手段、および
上記逆差分手段において求められた音声信号を上記フィルタ手段に供給する手段としてコンピュータを機能させるためのプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。