JP4260928B2 - 音声圧縮装置および記録媒体 - Google Patents
音声圧縮装置および記録媒体 Download PDFInfo
- Publication number
- JP4260928B2 JP4260928B2 JP18565998A JP18565998A JP4260928B2 JP 4260928 B2 JP4260928 B2 JP 4260928B2 JP 18565998 A JP18565998 A JP 18565998A JP 18565998 A JP18565998 A JP 18565998A JP 4260928 B2 JP4260928 B2 JP 4260928B2
- Authority
- JP
- Japan
- Prior art keywords
- difference
- signal
- pcm
- input
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
【発明の属する技術分野】
本発明は音声圧縮装置および記録媒体に関し、特に、音声圧縮方式としてDPCM(Differential Pulse Code Modulation)あるいはADPCM(Adaptive-Differential-PCM )を採用した装置に用いて好適なものである。
【0002】
【従来の技術】
従来、音声信号を伝送したり蓄積したりする場合に、伝送データ量の削減や、蓄積メディア(メモリ、テープ、ディスク等)への保存可能時間の長時間化を目的として、図8に示すように音声の圧縮、伸長が行われている。図8において、音声圧縮装置81にて入力音声から生成された音声圧縮信号が、図示しない伝送路を介して伝送されたり、図示しない蓄積メディアに蓄積されたりする。その後、必要に応じて音声伸長装置82にて伸長され、再生音声として出力される。
【0003】
音声信号の圧縮方式としては、例えばADPCM(Adaptive-Differential-PCM )が一般的に知られている。このADPCMによる圧縮方式は、波形をサンプリングするとき隣り合うサンプル値の差分を量子化する手法であるDPCM(Differential Pulse Code Modulation)において、量子化のステップサイズ(スケーリング係数)を波形の振幅によって適応的に変える方式である。例えば、振幅の大きいところではステップサイズを大きくし、波形の変化に追従できるようにする。
【0004】
例えば、PCM音声信号の場合には1サンプル当たり16ビット必要であったのが、DPCMを適用すると7ビット程度に圧縮できるが、非常に大きなピークを有する音声では、この7ビットでは表現しきれない場合が生じる。そこで、DPCMによる音声圧縮信号に対して、以前に生成したDPCMのデータから線形的に予測したスケールファクタをかけることにより、7ビットのみであっても大きな変化を有する音声を十分に表現できるようにしている。
【0005】
このADPCMは、例えばPHSの音声圧縮方式として採用されている。すなわち、最近のディジタル電話回線は、サンプリング周波数が8KHzで1サンプル当たりのビット数が8ビットであり、伝送レートは64Kbpsであるのに対して、ADPCMにより音声圧縮をした場合には量子化ビット数が4ビットであり、伝送レートは32Kbpsである。
【0006】
このようなPHSを考えた場合、図8の音声圧縮装置81は送信側のPHS端末内にあり、音声伸長装置82は受信側のPHS端末内にある。そして、送信側の音声圧縮装置81で入力音声から生成された音声圧縮信号は、電話回線を通して伝送され、受信側の音声伸長装置82で伸長され、再生音声として出力される。この例では音声圧縮装置81と音声伸長装置82とが別の端末に備えられているが、同一筐体内に備えられる場合もある。
【0007】
例えば、DRAM等のメモリや磁気テープ、あるいはディスク等の記録媒体に音声信号を圧縮して記憶し、それを必要に応じて伸長して再生する機能を備えた音声再生装置あるいは音声記録再生装置等では、音声圧縮装置81と音声伸長装置82とが同じ筐体内に備えられる。この場合にも音声圧縮方式として、上述のDPCMやADPCMによる圧縮方式を採用することが可能である。
【0008】
図9は、DPCMを採用した従来の音声圧縮装置の構成を示す図であり、図10は、同じくDPCMを採用した従来の音声伸長装置の構成を示す図である。まず図9を用いてDPCMによる音声圧縮の動作について説明する。
各サンプルポイントのPCM音声信号PCM[j]は差分回路91に順次入力され、下記の式(1)に従って隣り合うサンプル値の差分が計算される。
DPCM[j] = PCM[j] - PCM'[j-1]……(1)
【0009】
この式(1)において、jはサンプルポイントの番号を表す値、DPCM[]は隣り合うサンプル値の差分値、PCM[] はPCM音声信号のサンプル値、PCM'[]はPCM音声信号を一度圧縮してから伸長して元に戻した値である。音声圧縮装置で音声信号を圧縮した後に、音声伸長装置で元の波形と近い波形を再生するためには、PCM[j-1]ではなくこのPCM'[j-1] のような値を使って差分式(1)を使用しなければならない。
【0010】
上記差分回路91で計算された差分値DPCM[j] は、正規化・量子化装置92で圧縮され、音声圧縮信号code[j] として出力される。この音声圧縮信号code[j] は、逆正規化・逆量子化装置93にも与えられ、上記正規化・量子化装置92による処理とは逆の処理を行うことによって差分値DPCM'[j]が生成される。この差分値DPCM'[j]は、逆差分回路94に与えられ、下記の式(2)に従って上記差分回路91とは逆の処理が行われる。
PCM'[j] = PCM'[j-1] + DPCM'[j]……(2)
【0011】
ここで求められたPCM音声信号のサンプル値PCM'[j] は、正規化・量子化装置92で発生した量子化誤差を含む値であり、遅延バッファ95により一定時間だけ遅延された後、差分回路91および逆差分回路94に供給される。上述したように、このような量子化誤差を含んだサンプル値PCM'[j] を差分式(1)に用いることにより、実際に入力された音声の波形と極めて近い波形の音声を、図10に示す音声伸長装置で再生することが可能となる。
【0012】
次に、図10を用いてDPCMによる音声伸長の動作について説明する。入力された音声圧縮信号code[j] は、逆正規化・逆量子化装置101に与えられ、上記音声圧縮装置の正規化・量子化装置92による処理とは逆の処理を行うことによって差分値DPCM'[j]が生成される。この差分値DPCM'[j]は、逆差分回路102に与えられ、上述の逆差分式(2)に従って上記差分回路91とは逆の処理が行われる。ここで求められたPCM音声信号のサンプル値PCM'[j] は、再生音声として出力されるとともに、遅延バッファ103により一定時間だけ遅延された後、逆差分回路102に供給される。
【0013】
【発明が解決しようとする課題】
上述のように、DPCM方式(ADPCM方式も同様)では、音声圧縮装置と音声伸長装置で差分式と逆差分式とを使用している。これは、音声信号の一般的特性として、周波数が低くなるほど信号圧が高くなるという性質があるため、差分式を使用して圧縮することにより、その結果は、元のPCM音声信号よりも絶対値が小さな値となることが期待でき(双方共に2の補数表現とした場合)、しかもデータ圧縮時の損失が少なく、再生音声の品質が向上するためである。
【0014】
しかしながら、従来のDPCM方式では、これらの差分式および逆差分式は、音声の周波数帯域によらず固定のものが使用されていた。この場合、低周波数の音声信号が入力された場合のS/N比は良好だが、ある程度以上周波数の高い音声信号が入力された場合には、再生音声のS/N比が劣化してしまう。さらに細かく見れば、固定で使用されている差分式および逆差分式は、ある周波数帯域の音声信号に対してのみ非常に良い結果をもたらすが、他の周波数帯域の音声信号に対してはそれよりもS/N比が劣化してしまうという問題があった。
【0015】
本発明は、このような問題を解決するために成されたものであり、DPCM方式あるいはADPCM方式による差分式および逆差分式を入力音声信号の周波数帯域に応じて変更することによって、どんな周波数帯域の音声信号が入力された場合でも良好なS/N比の再生信号を得ることができるようにすることを目的とする。
【0016】
【課題を解決するための手段】
本発明の音声圧縮伸長装置は、入力音声信号の周波数帯域を検出する入力信号解析手段と、上記入力音声信号に対してDPCMあるいはADPCMによる差分演算を行うと共に、上記差分演算を行うための複数の差分式を有するフィルタ手段と、上記フィルタ手段が有する複数の差分式のうち、上記入力信号解析手段において検出された周波数帯域に応じて、その周波数付近においてアンダーピークを有するゲイン特性の差分式を選択的に使用するように制御する制御手段と、上記制御手段において選択された差分式を用いて上記フィルタ手段において差分演算された差分値に対して、正規化および量子化することによって圧縮する圧縮手段と、上記圧縮手段において正規化および量子化された差分値を逆正規化および逆量子化する手段と、上記逆正規化および逆量子化された差分値に対して、上記制御手段において選択された差分式の選択信号に基づいて、複数の逆差分式から上記選択信号に対応する逆差分式を選択して逆差分演算を行い、音声信号を求める逆差分手段と、上記逆差分手段において求められた音声信号を上記フィルタ手段に供給する手段とを備えたことを特徴とする。
【0018】
上記入力信号解析手段は、上記入力音声信号の周波数帯域をFFTにより検出する手段であっても良い。
また、上記入力音声信号の一定時間区間内において符号反転する回数をカウントすることにより検出するようにしても良い。
【0019】
また、上記制御手段において選択的に切り替えられた差分式の選択信号を圧縮信号と共に伝送する手段を備えるようにしても良い。
また、圧縮後のデータ形式として圧縮信号とスケールファクタとを持つ方式の音声圧縮装置であって、上記制御手段において選択的に切り替えられた差分式の選択信号および上記スケールファクタを上記圧縮信号と共に伝送する手段を備えようにしても良い。
【0020】
本発明のコンピュータ読み取り可能な記録媒体は、入力音声信号の周波数帯域を検出する入力信号解析手段、上記入力音声信号に対してDPCMあるいはADPCMによる差分演算を行うと共に、上記差分演算を行うための複数の差分式を有するフィルタ手段、上記フィルタ手段が有する複数の差分式のうち、上記入力信号解析手段において検出された周波数帯域に応じて、その周波数付近においてアンダーピークを有するゲイン特性の差分式を選択的に使用するように制御する制御手段、上記制御手段において選択された差分式を用いて上記フィルタ手段において差分演算された差分値に対して、正規化および量子化することによって圧縮する圧縮手段、上記圧縮手段において正規化および量子化された差分値を逆正規化および逆量子化する手段、上記逆正規化および逆量子化された差分値に対して、上記制御手段において選択された差分式の選択信号に基づいて、複数の逆差分式から上記選択信号に対応する逆差分式を選択して逆差分演算を行い、音声信号を求める逆差分手段、および上記逆差分手段において求められた音声信号を上記フィルタ手段に供給する手段としてコンピュータを機能させるためのプログラムを記録したことを特徴とする。
【0021】
【発明の実施の形態】
以下、本発明の一実施形態を図面に基づいて説明する。
図1は、本発明による音声圧縮装置の構成例を示す図であり、図2は、この音声圧縮装置と対にして用いられる音声伸長装置の構成例を示す図である。
【0022】
図1において、1は差分回路であり、入力されるPCM音声信号PCM[j]の波形をサンプリングするときに連続するサンプル値の差分を計算する。本実施形態の差分回路1で使用する差分式は、例えば次の式(11)〜(18)の8つである。
DPCM[j] = PCM[j] - 2*PCM'[j-1] + PCM'[j-2] ……(11)
DPCM[j] = PCM[j] - PCM'[j-1] + PCM'[j-2]/2……(12)
DPCM[j] = PCM[j] - PCM'[j-1] ……(13)
DPCM[j] = PCM[j] - PCM'[j-1]/2 + PCM'[j-2] ……(14)
DPCM[j] = PCM[j] + PCM'[j-2] ……(15)
DPCM[j] = PCM[j] + PCM'[j-1]/2 + PCM'[j-2] ……(16)
DPCM[j] = PCM[j] + PCM'[j-1] + PCM'[j-2]/2……(17)
DPCM[j] = PCM[j] + 2*PCM'[j-1] + PCM'[j-2] ……(18)
【0023】
2は入力信号解析器であり、入力されたPCM音声信号を周波数解析し、入力音声の周波数帯域を検出する。3は差分式制御装置であり、上記入力信号解析器2での解析結果に応じて差分式選択信号control を出力し、差分回路1における8つの差分式(11)〜(18)のうち何れの式を用いて音声圧縮を行うかを制御する。すなわち、差分値DPCM[j] を(PCM[j], PCM'[j-1], PCM'[j-2])の関数として、差分式選択信号control で差分式(11)〜(18)のうちの何れか1つを入力音声信号の周波数帯域に応じて選択する。
【0024】
4は正規化・量子化装置であり、上記差分回路1で何れかの差分式に従って計算された差分値DPCM[j] に対して正規化および量子化の処理を施すことによって圧縮を行い、圧縮コード信号code[j] を生成する。このようにして、例えば16ビットの入力PCM音声信号PCM[j]から、例えば7ビットの圧縮コード信号code[j] を生成することが可能である。この圧縮コード信号code[j] は、逆正規化・逆量子化装置5および信号ミキサ8に与えられる。逆正規化・逆量子化装置5は、上記正規化・量子化装置4による処理とは逆の処理を行うことによって差分値DPCM'[j]を生成するものである。
【0025】
6は逆差分回路であり、上記差分回路1とは逆の処理を行うことによって元のPCM音声信号PCM[j]に近いサンプル値PCM'[j] を生成する。この逆差分回路6で使用する逆差分式は、上述した差分式(11)〜(18)にそれぞれ対応した次の式(21)〜(28)である。
PCM'[j] = 2*PCM'[j-1] - PCM'[j-2] + DPCM'[j] ……(21)
PCM'[j] = PCM'[j-1] - PCM'[j-2]/2 + DPCM'[j] ……(22)
PCM'[j] = PCM'[j-1] + DPCM'[j] ……(23)
PCM'[j] = PCM'[j-1]/2 - PCM'[j-2] + DPCM'[j] ……(24)
PCM'[j] = - PCM'[j-2] + DPCM'[j] ……(25)
PCM'[j] = -PCM'[j-1]/2 - PCM'[j-2] + DPCM'[j] ……(26)
PCM'[j] = -PCM'[j-1] - PCM'[j-2]/2 + DPCM'[j] ……(27)
PCM'[j] = 2*PCM'[j-1] - PCM'[j-2] + DPCM'[j] ……(28)
これら8つのサンプル値PCM'[j] は(PCM'[j-1], PCM'[j-2], DPCM'[j])の関数として、差分式選択信号control によって何れか1つが選択される。
【0026】
この逆差分回路6によって何れかの逆差分式に従って求められたPCM音声信号PCM'[j] は、遅延バッファ7により一定時間だけ遅延された後、差分回路1および逆差分回路6に供給される。このような量子化誤差を含んだサンプル値PCM'[j] を差分式および逆差分式に用いることにより、実際に入力された音声の波形と極めて近い波形の音声を、図2に示す音声伸長装置で再生することが可能となる。
【0027】
上述したように、差分式制御装置3は、差分回路1における差分式と逆差分回路6における逆差分式として、それぞれ8つの式の中から実際に使用する式を選択する。この差分式制御装置3がどの式を選択するかについては、基本的には、入力されたPCM音声信号を入力信号解析器2によって周波数解析し、検出した周波数に最も適した式を設定するが、外部からユーザが任意に設定することも可能である。
【0028】
差分式制御装置3を用いて何れかの差分式および逆差分式を選択した場合、どの式を選択したかを何らかの手段で音声伸長装置に伝える必要がある。そのために本実施形態では、例えば、音声圧縮装置の出力段に信号ミキサ8を設け、解析の結果得られた式番号等からなる差分式選択信号control を音声圧縮信号にミキシングして伝送するようにしている。後述するが、音声伸長装置側には信号分配装置を設け、ヘッダ等に付加されて伝送された式番号を分離する。
【0029】
次に、図2において、11は信号分配装置であり、入力された音声圧縮信号から圧縮コード信号code[j] と差分式選択信号control とを分離し、分離した圧縮コード信号code[j] を逆正規化・逆量子化装置12に供給するとともに、差分式選択信号control を逆差分回路13に供給する。逆正規化・逆量子化装置12は、図1の音声圧縮装置の正規化・量子化装置4による処理とは逆の処理(逆正規化・逆量子化装置5と同様の処理)を行うことによって差分値DPCM'[j]を生成する。
【0030】
また、逆差分回路13は、逆正規化・逆量子化装置12より生成された差分値DPCM'[j]に対して、上記式(21)〜(28)の中から差分式選択信号control によって選択された何れか1つの逆差分式に従って図1の差分回路1とは逆の処理(逆差分回路6と同様の処理)を行う。ここで求められたPCM音声信号PCM'[j] は、再生音声として出力されるとともに、遅延バッファ14により一定時間だけ遅延された後、逆差分回路13に供給される。
【0031】
次に、上記差分回路1における8つの差分式(11)〜(18)の意味合いについて、図3を用いて説明する。図3は、周波数に対する差分式のゲイン特性(差分回路1のフィルタ特性)を示す図であり、図の横軸は入力PCM音声信号の周波数を示し、縦軸は各差分式により得られる絶対値の平均を示している。図3に示す3つのゲイン特性▲1▼〜▲3▼は、それぞれ上記の差分式(11)、(15)、(18)に対応するものである。ここでは代表として3つのゲイン特性を示しているが、8つの差分式(11)〜(18)に対応する8つのゲイン特性は、アンダーピークの位置する周波数が少しずつずれたものとなっている。
【0032】
再生音声において良好なS/N比を得るためには、ゲインができるだけ小さいことが望ましい。したがって、8つの差分式(11)〜(18)は、それぞれのゲイン特性でアンダーピークが位置する周波数のPCM音声信号に対して用いるのが望ましい。すなわち、差分式(11)は低い周波数のPCM音声信号に、差分式(15)は中間周波数のPCM音声信号に、差分式(18)は高い周波数のPCM音声信号に用いるのが望ましい。
【0033】
従来は、音声のいわゆる1/fゆらぎ特性(音の信号圧は1/周波数に比例して下がるという特性)に対応して、▲1▼に類似した特性を有する差分式を固定して用いていた。これに対して本実施形態では、入力されたPCM音声信号の周波数帯域がどこにあるかに応じて、その周波数付近においてアンダーピークを有するゲイン特性の差分式を選択的に使用して圧縮するようにしている。これにより、どんな周波数帯域の音声信号でも、DPCM後に得られる期待値のレベルを小さく抑えることができ、再生音声のS/N比を良好に保つことができる。
【0034】
次に、差分式の切り替え判定手法(入力PCM音声信号の周波数帯域の判定手法)について説明する。
ここでは、入力されたPCM音声信号に含まれる周波数成分を解析し、最も適したDPCMの差分式を選択することにより、良好なS/N比の再生音声を得ることができるようにする。
【0035】
一般的に周波数成分をデジタル的に解析する手段として、FFT(高速フーリエ変換)やDFT(離散的フーリエ変換)が知られており、これを本実施形態に適用することが可能である。例えば、入力されたPCM音声信号に対してFFTによる解析を行った結果、当該PCM音声信号を最も高いピークの得られた周波数成分を持つ信号であると判断する。そして、その周波数付近にアンダーピークを有する特性の差分式を選択的に用いるようにする。
【0036】
このFFTによる周波数解析手段によれば、周波数解析を行う区間内における各周波数成分の信号圧、位相が比較的正確に算出できるが、メモリ量、演算回数が極めて多く、ハードウェア量が膨大であり、消費電力も多いという欠点を有する。そこで本実施形態では、以下に示す他の周波数解析手段を提供するものである。
【0037】
本実施形態による周波数解析手段の第1の例は、一定の時間区間内においてPCM音声信号が符号反転する回数(信号値が“0”をクロスする回数)をカウントして周波数を解析するものである。すなわち、図4に示すように、ある一定の時間区間内で入力PCM音声信号を見た場合、周波数が低くなるほどゼロクロスの回数は少なくなり、周波数が高くなるほどゼロクロスの回数は多くなる。よって、一定の時間内でこのゼロクロスの回数をカウントすることにより、PCM音声信号の周波数成分を解析することが可能である。
【0038】
本実施形態による周波数解析手段の第2の例は、一定の時間区間内において、入力されたPCM音声信号の信号圧の絶対値の和と、DPCM処理後の差分値の絶対値の和とを比較して解析するものである。すなわち、図5に示すように、図4に示したような同じ信号圧の音声でも周波数が異なる場合には、DPCM処理を施すと、周波数が低い方では得られた差分値の振幅は小さくなり、周波数が高い方では得られた差分値の振幅が大きくなる。
【0039】
つまり、ある一定時間区間内における入力PCM音声信号の絶対値の和と、DPCMによるフィルタ処理後の差分値の絶対値の和との比率は、周波数によって異なる。そこで、例えば異なる複数の周波数で入力PCM音声信号にフィルタをかける簡単な手段を入力信号解析器2に用意しておき、フィルタ処理後の値の一定時間内における平均的な大きさ(絶対値平均もしくは二乗平均)を算出する。そして、この算出結果と入力音声の平均的な大きさとの比率を見ることによって、現在入力されているPCM音声信号の周波数を類推する。
【0040】
このように、第2の例では、周波数成分の解析用に幾つかのフィルタが必要になるが、これは差分回路1における8つの差分式に対応するフィルタほど詳細で複雑なものでなくても良く、それほど回路規模が大きくなることはない。また、差分回路1における8つの差分式に対応するフィルタを周波数成分の解析用に兼用するようにしても良い。
【0041】
以上に述べた周波数解析手段の第1の例および第2の例によれば、必要とするハードウェア量がFFTの場合と比較してはるかに少なくて済み、メモリ量、演算回数、消費電力も少ないという利点を有する。なお、入力されるPCM音声信号は、常に図4に示したようなきれいなサイン波であるとは限らない。よって、上記した第1の例もしくは第2の例による手法を単独で用いただけでは、必ずしも正しい周波数成分の解析が行えるとは限らない。
【0042】
そこで、周波数解析手段の第3の例として、上記した第1の例もしくは第2の例の手法を、ある一定時間区間内で1回のみ行うのではなく、異なる時間区間内で複数回行うことにより、解析結果の精度を高めることができる。さらに、第4の例として、上記した第1の例もしくは第2の例の手法を単独で用いるのではなく、両者を併せて用いることにより、あるいは両者の手法を異なる時間区間内でそれぞれ複数回行うことにより、解析結果の精度を更に高めることができる。
【0043】
次に、本発明による音声圧縮装置の第2の実施形態について説明する。上記した実施形態では、音声信号の圧縮方式としてDPCMを採用した場合について述べた。これに対して第2の実施形態では、スケールファクタを圧縮コード信号code[j] とミキシングして伝送する方式の音声圧縮装置について説明する。
【0044】
図6は、第2の実施形態による音声圧縮装置の構成例を示す図であり、図1に示したブロックと同じブロックには同一の符号を付している。また、図7は、第2の実施形態による音声伸長装置の構成例を示す図であり、図2に示したブロックと同じブロックには同一の符号を付している。
【0045】
なお、以下の説明において、
SubInfo[k]は圧縮補助信号、
SubInfo[k].SF はスケールファクタ信号(例えば5ビット)、
SubInfo[k].LN は差分式選択信号(例えば3ビット)、
N は圧縮補助信号を適用するPCMの長さ、
SFtbl[n]はスケールファクタテーブル(例えば、SFtbl[n]=2(n/4) )
であるものとする。
【0046】
つまり、各々の圧縮補助信号SubInfo[k]のインデックスに対応する入力PCM信号PCM[j]、圧縮コード信号Code[j] は、次のようになる。
SubInfo[0] : PCM[0] 〜 PCM[N-1] 、Code[0] 〜 Code[N-1]
SubInfo[1] : PCM[N] 〜 PCM[2*N-1] 、Code[N] 〜 Code[2*N-1]
SubInfo[2] : PCM[2*N] 〜 PCM[3*N-1] 、Code[2*N] 〜 Code[3*N-1]
SubInfo[3] : PCM[3*N] 〜 PCM[4*N-1] 、Code[3*N] 〜 Code[4*N-1]
SubInfo[4] : PCM[4*N] 〜 PCM[5*N-1] 、Code[4*N] 〜 Code[5*N-1]
……
【0047】
以下に、本実施形態の動作を説明する。まず、図6に示す音声圧縮装置の動作について説明する。入力信号解析器62では、入力されたPCM音声信号PCM[j]を解析し、その解析結果を制御装置63に与えてスケールファクタ、差分式の選択を実施する。ここでは差分式(11)を用いるものとする。また、正規化・量子化装置4では、この差分式(11)に従って差分回路1で計算された差分値DPCM[j] に対して、以下の式(31)、(32)に従って圧縮を行う。
Code[j] = DPCM[j] / SFtbl[tmp#11[j].SF] ……(31)
Code[j] = DPCM[j] / SFtbl[SubInfo[k].SF]……(32)
【0048】
ここで、式(31)と式(32)の関係について説明する。図6の正規化・量子化装置4では、最終的に式(32)を使用する予定であるが、いま述べている内容は、その前処理に当たる入力信号解析器62についての処理であり、まだスケールファクタ信号SubInfo[k].SF は確定していない。この入力信号解析器62では、スケールファクタ信号SubInfo[k].SF と差分式選択信号SubInfo[k].LN とを確定させることを目的として処理をしており、その処理のために正規化・量子化装置4で一時的に用いるのが式(31)である。
【0049】
本実施形態では、このような入力信号解析器62の処理で要する時間分だけ入力PCM音声信号を遅延させるための遅延バッファ61を、差分回路1の前段に設けている。そして、入力信号解析器62および制御回路63では、差分回路1において式(11)に従って計算した結果に対して正規化・量子化装置4で式(31)を適用した場合に、圧縮コード信号Code[j] が例に示す7ビットの表現範囲に収まるスケールファクタ係数tmp#11[j].SFの最小値を求める。
【0050】
この最小値は、差分値DPCM[j] に対するマッピングとなり、下記に示すような値となる。
DPCM[j] tmp#11[j].SF
-64 ≦DPCM[j] <64 :tmp#11[j].SF = 0
-76 ≦DPCM[j] <76 :tmp#11[j].SF = 1
-90 ≦DPCM[j] <90 :tmp#11[j].SF = 2
-107≦DPCM[j] <107 :tmp#11[j].SF = 3
-128≦DPCM[j] <128 :tmp#11[j].SF = 4
……
【0051】
最小値を求めるのは以下の理由による。すなわち、上記式(31)から、SFtbl[] の値が大きくなると量子化刻み幅が大きくなり、再生音声のS/N比が劣化する。したがって、再生音声の品質を上げることが目標であるため、できる限り小さなスケールファクタ係数tmp#11[j].SFの値が望ましいということになり、最小値を選択するという答えになる。
【0052】
このようにスケールファクタ係数を対応させる処理を j=0〜N-1 まで行い、その中で最大のtmp#11[j].SFを求める。これは、式(31)を使用した場合に、オーバフローやアンダーフローの発生しない値を選択する必要があるからである。この解をSubInfo#11[k].SFとする。つまり、
SubInfo#11[k].SF = max(tmp#11[k*N], tmp#11[k*N+1], … tmp#11[(k+1)*N-1])
である。
【0053】
なお、ここでは、差分式(11)についてのみ示したが、差分式の選択を行うことを前提とした場合、最も適切な式番号とスケールファクタとを求めるために、各々の差分式に対応するスケールファクタを夫々求め、スケールファクタの値が最も小さな式番号とスケールファクタとの組を最終的な入力信号解析器62の解とする。つまり、
SubInfo[k].SF = min (SubInfo#11[k].SF, SubInfo#12[k].SF, SubInfo#13[k].SF,… SubInfo#18[k].SF)
SubInfo[k].LN = 上記の最小の値の番号
である。
【0054】
制御装置63は、上記入力信号解析器62での解析結果に応じて差分式選択信号SubInfo[k].LN とスケールファクタ信号SubInfo[k].SF とを出力する。差分式選択信号SubInfo[k].LN は、差分回路1、逆差分回路6および信号ミキサ8に入力され、スケールファクタ信号SubInfo[k].SF は、正規化・量子化装置4および逆正規化・逆量子化装置5に入力される。上記正規化・量子化装置4で使用されたスケールファクタ信号SubInfo[k].SF は、信号ミキサ8にも与えられる。
【0055】
次に、図7に示す音声伸長装置について説明する。図7に示すように、本実施形態では信号分配装置11の出力段に制御装置71が設けられている。制御装置71は、差分式選択信号SubInfo[k].LN を逆差分回路13に供給するとともに、スケールファクタ信号SubInfo[k].SF を逆正規化・逆量子化装置12に供給するように制御する。
【0056】
なお、以上の実施形態では、選択対象の差分式として式(11)〜(18)の8つを用いているが、本発明はこの数には限定されるものではなく、それより多い差分式あるいは少ない差分式を選択的に使用するようにしても良い。より少ない差分式を用いる場合、式(13)および式(15)に示す2項式のみを用いても良いし、それ以外の3項式のみを用いるようにしても良い。あるいは、2項式と3項式とを1つずつ用意し、その何れかを選択的に使用するようにしても良い。
【0057】
また、本実施形態は、例えばPHSのように、音声圧縮装置と音声伸長装置とが別の筐体内に備えられ、音声圧縮信号が伝送路を介して伝送されるようなシステムや、音声再生装置あるいは音声記録再生装置等のように、音声圧縮装置と音声伸長装置とが同じ筐体内に備えられるようなシステムに適用することが可能である。
【0058】
(本発明の他の実施形態)
上記図1および図2、あるいは図6および図7に示した各ブロックは、本実施形態においてはハード的に構成しているが、CPU、ROMおよびRAM等からなるマイクロコンピュータシステムによって構成し、その動作をROMやRAMに格納された作業プログラムに従って実現するようにしても良い。
【0059】
この場合、上記作業プログラム自体が上述した実施形態の機能を実現することになり、そのプログラム自体、およびそのプログラムをコンピュータに供給するための手段、例えばかかるプログラムを格納した記録媒体は本発明を構成する。かかるプログラムを記憶する記録媒体としては、上記ROMやRAMの他に、例えばフロッピーディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−I、CD−R、CD−RW、DVD、zip、磁気テープ、あるいは不揮発性のメモリカード等を用いることができる。
【0060】
また、コンピュータが供給されたプログラムコードを実行することにより、上述の実施形態の機能が実現されるだけでなく、そのプログラムコードがコンピュータにおいて稼働しているOS(オペレーティングシステム)あるいは他のアプリケーションソフト等の共同して上述の実施形態の機能が実現される場合にもかかるプログラムコードは本発明の実施形態に含まれることは言うまでもない。
【0061】
さらに、供給されたプログラムコードがコンピュータの機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに格納された後、そのプログラムコードの指示に基づいてその機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって上述した実施形態の機能が実現される場合にも本発明に含まれることは言うまでもない。
【0062】
【発明の効果】
本発明は上述したように、入力された音声の特性を解析し、その解析結果に基づいて、フィルタ手段で使用するフィルタ特性(差分式)を選択的に切り替えるようにしたので、入力音声の特性(例えば周波数特性)に応じて最も適した差分式を選択して音声圧縮を行うことができ、どんな周波数帯域の音声信号が入力されても良好なS/N比の再生音声を得ることができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係る音声圧縮装置の構成を示す図である。
【図2】本発明の第1の実施形態に係る音声伸長装置の構成を示す図である。
【図3】周波数に対する差分式のゲイン特性を示す図である。
【図4】本発明による周波数解析手段の第1の例を説明するための図である。
【図5】本発明による周波数解析手段の第2の例を説明するための図である。
【図6】本発明の第2の実施形態に係る音声圧縮装置の構成を示す図である。
【図7】本発明の第2の実施形態に係る音声伸長装置の構成を示す図である。
【図8】従来の音声圧縮伸長装置の構成を示す図である。
【図9】従来の音声圧縮装置の構成を示す図である。
【図10】従来の音声伸長装置の構成を示す図である。
【符号の説明】
1 差分回路
2 入力信号解析器
3 差分式制御装置
4 正規化・量子化装置
5 逆正規化・逆量子化装置
6 逆差分回路
7 遅延バッファ
8 信号ミキサ
11 信号分配装置
12 逆正規化・逆量子化装置
13 逆差分回路
14 遅延バッファ
61 遅延バッファ
62 入力信号解析器
63 制御装置
71 制御装置
Claims (6)
- 入力音声信号の周波数帯域を検出する入力信号解析手段と、
上記入力音声信号に対してDPCMあるいはADPCMによる差分演算を行うと共に、上記差分演算を行うための複数の差分式を有するフィルタ手段と、
上記フィルタ手段が有する複数の差分式のうち、上記入力信号解析手段において検出された周波数帯域に応じて、その周波数付近においてアンダーピークを有するゲイン特性の差分式を選択的に使用するように制御する制御手段と、
上記制御手段において選択された差分式を用いて上記フィルタ手段において差分演算された差分値に対して、正規化および量子化することによって圧縮する圧縮手段と、
上記圧縮手段において正規化および量子化された差分値を逆正規化および逆量子化する手段と、
上記逆正規化および逆量子化された差分値に対して、上記制御手段において選択された差分式の選択信号に基づいて、複数の逆差分式から上記選択信号に対応する逆差分式を選択して逆差分演算を行い、音声信号を求める逆差分手段と、
上記逆差分手段において求められた音声信号を上記フィルタ手段に供給する手段と
を備えたことを特徴とする音声圧縮装置。 - 上記入力信号解析手段は、上記入力音声信号の周波数帯域をFFTにより検出することを特徴とする請求項1に記載の音声圧縮装置。
- 上記入力信号解析手段は、上記入力音声信号の一定時間区間内において符号反転する回数をカウントすることによって周波数帯域を検出することを特徴とする請求項1に記載の音声圧縮装置。
- 上記制御手段において選択的に切り替えられた差分式の選択信号を圧縮信号と共に伝送する手段を備えたことを特徴とする請求項1〜3の何れか1項に記載の音声圧縮装置。
- 圧縮後のデータ形式として圧縮信号とスケールファクタとを持つ方式の音声圧縮装置であって、
上記制御手段において選択的に切り替えられた差分式の選択信号および上記スケールファクタを上記圧縮信号と共に伝送する手段を備えたことを特徴とする請求項1〜4の何れか1項に記載の音声圧縮装置。 - 入力音声信号の周波数帯域を検出する入力信号解析手段、
上記入力音声信号に対してDPCMあるいはADPCMによる差分演算を行うと共に、上記差分演算を行うための複数の差分式を有するフィルタ手段、
上記フィルタ手段が有する複数の差分式のうち、上記入力信号解析手段において検出された周波数帯域に応じて、その周波数付近においてアンダーピークを有するゲイン特性の差分式を選択的に使用するように制御する制御手段、
上記制御手段において選択された差分式を用いて上記フィルタ手段において差分演算された差分値に対して、正規化および量子化することによって圧縮する圧縮手段、
上記圧縮手段において正規化および量子化された差分値を逆正規化および逆量子化する手段、
上記逆正規化および逆量子化された差分値に対して、上記制御手段において選択された差分式の選択信号に基づいて、複数の逆差分式から上記選択信号に対応する逆差分式を選択して逆差分演算を行い、音声信号を求める逆差分手段、および
上記逆差分手段において求められた音声信号を上記フィルタ手段に供給する手段としてコンピュータを機能させるためのプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP18565998A JP4260928B2 (ja) | 1998-06-16 | 1998-06-16 | 音声圧縮装置および記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP18565998A JP4260928B2 (ja) | 1998-06-16 | 1998-06-16 | 音声圧縮装置および記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000003194A JP2000003194A (ja) | 2000-01-07 |
JP4260928B2 true JP4260928B2 (ja) | 2009-04-30 |
Family
ID=16174636
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP18565998A Expired - Fee Related JP4260928B2 (ja) | 1998-06-16 | 1998-06-16 | 音声圧縮装置および記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4260928B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100612829B1 (ko) | 2001-07-07 | 2006-08-18 | 삼성전자주식회사 | 그래픽 애니메이션 데이터의 키 부호화 장치와 그 방법 |
JP5249000B2 (ja) * | 2008-12-01 | 2013-07-31 | アズビル株式会社 | 導圧管の詰まり診断装置および詰まり診断方法 |
JP5302178B2 (ja) * | 2009-12-21 | 2013-10-02 | アズビル株式会社 | 導圧管の詰まり診断装置および詰まり診断方法 |
BR112013010406A2 (pt) * | 2010-11-02 | 2016-08-09 | I Ces Innovative Compression Engineering Solutions | método para compressão de valores digitais de arquivos de imagem, áudio e/ou vídeo |
-
1998
- 1998-06-16 JP JP18565998A patent/JP4260928B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2000003194A (ja) | 2000-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6592148B2 (ja) | 高周波数の再構成方法を使用するコーディング・システムの性能拡大方法 | |
KR100427753B1 (ko) | 음성신호재생방법및장치,음성복호화방법및장치,음성합성방법및장치와휴대용무선단말장치 | |
KR100348368B1 (ko) | 디지털 음향 신호 부호화 장치, 디지털 음향 신호 부호화방법 및 디지털 음향 신호 부호화 프로그램을 기록한 매체 | |
US20050270195A1 (en) | Method and apparatus for encoding/decoding digital signal | |
US9928852B2 (en) | Method of detecting a predetermined frequency band in an audio data signal, detection device and computer program corresponding thereto | |
US5754127A (en) | Information encoding method and apparatus, and information decoding method and apparatus | |
US8149927B2 (en) | Method of and apparatus for encoding/decoding digital signal using linear quantization by sections | |
JP2007504503A (ja) | 低ビットレートオーディオ符号化 | |
US9135925B2 (en) | Apparatus and method of enhancing quality of speech codec | |
JP2001102930A (ja) | 量子化誤差補正方法及び装置並びにオーディオ情報復号方法及び装置 | |
US20060004565A1 (en) | Audio signal encoding device and storage medium for storing encoding program | |
US20020173969A1 (en) | Method for decompressing a compressed audio signal | |
JP4260928B2 (ja) | 音声圧縮装置および記録媒体 | |
JPH08166799A (ja) | 高能率符号化方法及び装置 | |
US20070118362A1 (en) | Audio compression/decompression device | |
US7305346B2 (en) | Audio processing method and audio processing apparatus | |
US10650834B2 (en) | Audio processing method and non-transitory computer readable medium | |
US6678653B1 (en) | Apparatus and method for coding audio data at high speed using precision information | |
US20110116551A1 (en) | Apparatus and methods for processing compression encoded signals | |
EP0899892A2 (en) | Signal processing apparatus and method, and information recording apparatus | |
US5799271A (en) | Method for reducing pitch search time for vocoder | |
JP2002049399A (ja) | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 | |
JP2993324B2 (ja) | 音声高能率符号化装置 | |
JP2000293199A (ja) | 音声符号化方法および記録再生装置 | |
JP2002049398A (ja) | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050509 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070726 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070828 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080513 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080807 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090106 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090205 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120220 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120220 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130220 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130220 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140220 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |