JP3998281B2 - デジタル音声信号の帯域分割符号化方法と復号化方法 - Google Patents
デジタル音声信号の帯域分割符号化方法と復号化方法 Download PDFInfo
- Publication number
- JP3998281B2 JP3998281B2 JP21593296A JP21593296A JP3998281B2 JP 3998281 B2 JP3998281 B2 JP 3998281B2 JP 21593296 A JP21593296 A JP 21593296A JP 21593296 A JP21593296 A JP 21593296A JP 3998281 B2 JP3998281 B2 JP 3998281B2
- Authority
- JP
- Japan
- Prior art keywords
- power
- band
- bits
- signal component
- aloc
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の属する技術分野】
この発明は、データ伝送におけるデジタル音声信号の帯域分割符号化と復号化方法に関し、特にISDN、イーサネットなどのLANを用いてリアルタイムでデジタル音声信号のデータを圧縮する符号化方法とこの符号化信号を復号化する方法に関する。
【0002】
【従来の技術】
デジタル音声信号を帯域フィルタで複数の帯域(F)に分割し、分割された各帯域(F)のデジタル信号の大きさによってその帯域(F)に割り当てられる量子化ビット数を決定し、この量子化ビット数によって帯域(F)内の各デジタル信号を量子化するデジタル音声信号の符号化方法は、例えば、デジタルコンパクトカセットによる録音に関して、藤本健文著「フィリップスDCCシステムのキイ・ポイント:サイコ・アクースチックPASCコードの特徴と詳細」株式会社アイエー出版、ラジオ技術誌、1991年,12月,第156−161頁において知られている。ここでは、高効率音声信号符号化(PASC:Precision Adaptive Subb and Cording)が使用されている。
【0003】
この符号化方法では、デジタル音声信号を先ずバンドパス・フィルタに導入し、この信号を例えば32の等間隔の帯域に分割する。DCCシステムでは、通常、標本化周波数が48kHzであるので750Hzの帯域幅が採用される。そして、各32の帯域毎に12個の入力信号成分が得られる毎に1つのユニットとして処理し、32*12の384個の入力データを、人間の可聴音声信号レベルと音声感度に関する周波数依存性を加味して、音声信号の量子化を行っている。
【0004】
周知のように、音声信号の検知に関して著しい周波数依存性がある。つまり、周波数が0Hz付近および約15kHz以上の音響信号(音圧)は人間の耳に検知できない。そして、特に2〜5kHzで音響信号の検知感度が高く、この点に着目してPASCで音声の受信品質を殆ど低下させることなく、音声信号の符号化を効率化し高品質の音声信号の記録を可能にしている。すなわち、このDCCシステムでは、各帯域(F)の周波数によって、1信号成分あたりで2ビットから15ビットの異なる量子化ビット数が割り当てられ、人間の耳に検知感度の高い(音圧の高い)周波数帯の帯域(F)に、より多くの量子化ビット数を割り当てるようにして、符号化と復号化による音質の低下を防いでいる。
【0005】
そして、このようにして割り当てられた量子化ビット数で量子化された信号成分は、各帯域(F)の最大値を6ビットで表したスケールファクタとともに、該帯域(F)のサブバンドデータとされる。つまり、このスケールファクタが、信号成分の指数部を、量子化された信号成分が、信号成分の仮数部をそれぞれ表すこととなり、これらのデータをもとに符号化信号の受信側で信号成分が復号化される。なお、この受信側での逆量子化の際には、各帯域(F)の量子化ビット数を知る必要があるので、前記サブバンドデータには、各帯域(F)の量子化ビット数を示すコーディング情報が加えられて出力される。
【0006】
また、このDCCシステムにおいては、量子化ビット数の最小値が2ビットであるが、多重周波数帯域に分離したいずれかの帯域(i)が人間の聴覚特性から無視できる周波数帯域であるときには、該帯域(i)に割り当てる量子化ビット数を「0」ビットとする発明も、特開平5−37395号で知られている。
【0007】
すなわち、音声信号を分離した各帯域(i)の信号の絶対値の最大値を指標値Xiとして検出し、この指標値Xiと人間の聴覚特性から求めた基準値TH(i)を比較し、Xi≦TH(i)である場合に、該帯域(i)に割り当てられる量子化ビット数を「0」ビットとするものである。そして、この帯域(i)に割り当てられるはずであったビット数を他の帯域に割り当てることにより、伝送系の伝送速度などから送出できるデータ量が限られた条件で、高効率でしかも可聴特性が劣化しない符号化を行うものである。
【0008】
【発明が解決しようとする課題】
上述のPASCによるデータ伝送では、周波数帯域毎に割り当てられた量子化ビット数を示すコーディング情報と各信号成分の指数部を示すスケールファクタを、圧縮符号化された入力データとともに伝送しているが、データ伝送量に制限のある伝送系を用いるときには、このコーディング情報を含めることによって伝送可能な総ビット数が減少し、各データに割り当てられるビット数の減少により再生した音質が劣化する。
【0009】
また、スケールファクタは、各帯域(F)の信号成分の絶対値の最大値を6ビットで表したまま、圧縮しないで出力するので、6ビット*帯域数(上記DCCシステムでは、6ビット*32=192ビット)を符号化信号に含めて送出する必要があり、データ伝送量に制限がある場合には、前述と同様に各データに割り当てられるビット数が減少する。
【0010】
更に、上記従来例では、各帯域(F)の信号成分の絶対値の最大値を、該帯域内の全ての信号成分の代表値とするものであることから、いずれかの信号成分が突出した値となると、復号化した他の信号成分が正確に再生できない。
【0011】
また、特開平5−37395号のように、一部の帯域の信号成分を符号化情報が存在するのもかかわらず「0」ビットとすると、復号化された音声信号に情報の欠落が生じ、原デジタル音声信号を再生すると音質が劣化する。
【0012】
更に、「0」ビットを割り当てた一部の帯域に信号が存在しないと、分離された各周波数帯域(F)の逆量子化信号を再構成サブバンドフィルタにより合成する際に、フィルタによる折り返し歪みが相殺されずに表れ、再生信号にノイズが表れるという問題があった。
【0013】
この発明は、上述の問題に鑑み、ISDN、LANのようなデータ伝送量にかなり制約がある伝送系を用いても、各信号成分に割り当てられる量子化ビット数が減少することがなく、高品質の音声信号を保つことができ、また、帯域内の1つの信号成分が突出して高いものとなっても、これにつられて他の信号成分の復号化に影響することがないデジタル音声信号の符号化方法とその復号化方法を提供する。
【0014】
また、特定帯域に「0」ビットの量子化ビット数を割り当てて、符号化しても、原デジタル音声信号に近似したデジタル音声信号に復号化することができる。
【0015】
【課題を解決するための手段】
請求項1のデジタル音声信号の帯域分割符号化方法は、デジタル音声信号を、M個の多重周波数帯域(F)に分離しながら、一定時間間隔の順次時間(N)でT個の各周波数帯域(F)の信号成分(S(F,N))を求め、各帯域(F)のT個の信号成分(S(F,N))から該帯域(F)のビット配分指数(ALOC(F))を求め、ビット配分指数(ALOC(F))で指示される量子化ビット数で該帯域(F)の各信号成分(S(F,N))を量子化し、量子化信号成分(QS(F,N))を連続させて伝送路へ送出するデジタル音声信号の符号化方法において、
各帯域(F)内の信号成分(S(F,N))を二乗してT個の総和をパワー(POW(F))とし、パワー(POW(F))を圧縮符号化して符号化パワー(OPMAX(F),QOP(F))とした後、符号化パワー(OPMAX(F),QOP(F))から再び復号化して復号化パワー(TPOW(F))を求め、各周波数帯域(F)のビット配分指数(ALOC(F))を復号化パワー(TPOW(F))の大きさによって決定するとともに、パワー(POW(F))を圧縮符号化した前記符号化パワー(OPMAX(F),QOP(F))を、復号化パワー(TPOW(F))の大きさをもとに決定したビット配分指数(ALOC(F))で指示される量子化ビット数で該帯域(F)の各信号成分(S(F,N))を量子化した量子化信号成分(QS(F,N))に連続させて伝送路へ送出することを特徴とする。
【0016】
各周波数帯域のパワーPOW(F)は、その帯域内の各信号成分S(F,N)をそれぞれ二乗したT個の総和で求めたものであるから、帯域内の全ての信号成分によって該帯域の信号の大きさを表したものとなる。従って、信号成分に異常値が生じても、帯域内の信号の大きさを表したパワーPOW(F)に大きな誤差は生じない。
【0017】
このパワーPOW(F)を圧縮符号化した後、再び復号化した復号化パワーTPOW(F)の大きさで、帯域毎の量子化ビット数を指示するビット配分指数を定めるので、帯域内の信号のレベルが大きい帯域により多くの量子化ビット数を割り当てることができる。パワーPOW(F)は、圧縮符号化した符号化パワー(OPMAX(F),QOP(F))として伝送路へ送出されるので、少ないビット数で全ての帯域(F)の信号の大きさを送出できる。
【0018】
受信側(復号化側)において、この符号化パワー(OPMAX(F),QOP(F))を上記と同様に復号化して復号化パワーTPOW(F)が得られ、各帯域(F)のビット配分指数から量子化ビット数が求められるので、帯域毎の量子化ビット数を出力側(符号化側)で送出する必要がない。
【0019】
従って、送出する符号化信号には、符号化パワー(OPMAX(F),QOP(F))と、周波数帯域(F)毎に量子化された量子化信号((QS(F,N))を連続させた帯域データDT(F)が含まれるだけで、量子化ビット数を表すビット配分指数ALOC(F)は伝送されないので、総配分ビット数が増加し、各信号成分S(F,N)の量子化に、より多くのビットを配分することができる。
【0020】
請求項2のデジタル音声信号の帯域分割符号化方法は、デジタル音声信号を、M個の多重周波数帯域(F)に分離しながら、一定時間間隔の順次時間(N)でT個の各周波数帯域(F)の信号成分(S(F,N))を求め、各周波数帯域(F)内で信号成分(S(F,N))の絶対値の最大値である時間軸最大値(NMAX(F))を求め、該周波数帯域(F)の各信号成分(S(F,N))を時間軸最大値(NMAX(F))により正規化して正規信号成分(NS(F,N))とするとともに、各帯域(F)のT個の信号成分(S(F,N))から該帯域(F)のビット配分指数(ALOC(F))を求め、ビット配分指数(ALOC(F))で指示される量子化ビット数で該帯域(F)の各正規信号成分(NS(F,N))を量子化し、量子化信号成分(QS(F,N))を連続させて伝送路へ送出するデジタル音声信号の符号化方法において、
各帯域(F)内の信号成分(S(F,N))を二乗してT個の総和をパワー(POW(F))とし、パワー(POW(F))を圧縮符号化して符号化パワー(OPMAX(F),QOP(F))とした後、符号化パワー(OPMAX(F),QOP(F))から再び復号化して復号化パワー(TPOW(F))を求め、各周波数帯域(F)のビット配分指数(ALOC(F))を復号化パワー(TPOW(F))の大きさによって決定するとともに、パワー(POW(F))を圧縮符号化した前記符号化パワー(OP M AX(F),QOP(F))を、復号化パワー(TPOW(F))の大きさをもとに決定したビット配分指数(ALOC(F))で指示される量子化ビット数で該帯域(F)の各正規信号成分(NS(F,N))を量子化した量子化信号成分(QS(F,N))に連続させて伝送路へ送出することを特徴とする。
【0021】
信号成分S(F,N)は、その帯域内の時間軸最大値(NMAX(F))で正規化され正規信号成分NS(F,N)となる。
【0022】
各周波数帯域のパワーPOW(F)は、その帯域内の各信号成分S(F,N)をそれぞれ二乗したT個の総和で求めたものであるから、帯域内の全ての信号成分によって該帯域の信号の大きさを表したものとなる。従って、信号成分に異常値が生じても、帯域内の信号の大きさを表したパワーPOW(F)に大きな誤差は生じない。
【0023】
このパワーPOW(F)を圧縮符号化した後、再び復号化した復号化パワーTPOW(F)の大きさで、帯域毎の量子化ビット数を指示するビット配分指数を定めるので、帯域内の信号のレベルが大きい帯域により多くの量子化ビット数を割り当てることができる。パワーPOW(F)は、圧縮符号化した符号化パワー(OPMAX(F),QOP(F))として伝送路へ送出されるので、少ないビット数で全ての帯域(F)の信号の大きさを送出できる。
【0024】
受信側(復号化側)において、この符号化パワー(OPMAX(F),QOP(F))を上記と同様に復号化して復号化パワーTPOW(F)が得られ、各帯域(F)のビット配分指数から量子化ビット数が求められるので、帯域毎の量子化ビット数を出力側(符号化側)で送出する必要がない。
【0025】
また、受信側(復号化側)において、この復号化パワーTPOW(F)を用いて、帯域内の各逆量子化信号成分を逆正規化できるので、時間軸最大値(NMAX(F))も出力側(符号化側)で送出する必要がない。
【0026】
従って、送出する符号化信号には、符号化パワー(OPMAX(F),QOP(F))と、周波数帯域(F)毎に量子化された量子化信号((QS(F,N))を連続させた帯域データDT(F)が含まれるだけで、量子化ビット数を表すビット配分指数ALOC(F)と時間軸最大値(NMAX(F))はいずれも伝送されないので、総配分ビット数が増加し、各信号成分S(F,N)の量子化に、より多くのビットを配分することができる。
【0027】
請求項3のデジタル音声信号の帯域分割符号化方法は、ビット配分指数(ALOC(F))の決定を、量子化ビット数が互いに異なる少なくとも2以上のビット配分グループを設定し、単位処理時間内にM*T個の信号成分(S(F,N))を量子化して伝送可能な総ビット数を総配分ビット数(SBIT)として求め、総配分ビット数(SBIT)を、量子化ビット数の大きいビット配分グループから順に分配して、該ビット配分グループに属する周波数帯域(F)の数を決定し、総配分ビット数(SBIT)が不足するときには、残りの周波数帯域(F)を量子化ビット数が0のビット配分グループに属するものとして、その数を決定し、復号化パワー(TPOW(F))が大きい周波数帯域(F)から順に量子化ビット数の大きいビット配分グループを特定し、特定したビット配分グループをビット配分指数(ALOC(F))で表して各周波数帯域(F)のビット配分指数(ALOC(F))を決定することを特徴とする。
【0028】
請求項3の発明は、単位時間内に伝送路へ伝送可能な総配分ビット数(SBIT)を求め、総配分ビット数(SBIT)を、量子化ビット数の大きいビット配分グループから順に分配して、そのビット配分グループに属する周波数帯域(F)の数を決定する。従って、伝送レートの変化に追随させて、各ビット配分グループ間の数を変化させることができるので、最適な量子化ビット数で各帯域(F)内の信号成分を量子化できる。総配分ビット数(SBIT)が不足する場合には、残りの周波数帯域(F)は、「0」ビットの量子化ビットが割り当てられるビット配分グループに属するものとして、全ての周波数帯域(F)が復号化パワーTPOW(F)の大きさによって、いずれかのビット配分グループに分けられる。
【0029】
復号化パワーTPOW(F)の大きい順に、その周波数帯域(F)が属するビット配分グループを決定するので、復号化パワーTPOW(F)が比較的大きい周波数帯域(F)の信号成分S(F,N)には、多くのビットを割り当てることができる。周波数帯域(F)とビット配分グループの関係は、ビット配分指数ALOC(F)で表される。
【0030】
請求項4のデジタル音声信号の帯域分割符号化方法は、M個の多重周波数帯域(F)を複数の副周波数帯域(FB)に分割し、副周波数帯域(FB)毎に、量子化ビット数が互いに異なる少なくとも2以上のビット配分グループを設定し、単位処理時間内に副周波数帯域(FB)の全ての信号成分(S(F,N))を量子化して伝送可能な総ビット数を総配分ビット数(SFBBIT)として求め、総配分ビット数(SFBBIT)を、量子化ビット数の大きいビット配分グループから順に分配して、該ビット配分グループに属する周波数帯域(F)の数を決定し、総配分ビット数(SFBBIT)が不足するときには、副周波数帯域(FB)の残りの周波数帯域(F)を量子化ビット数が0のビット配分グループに属するものとして、その数を決定し、復号化パワー(TPOW(F))が大きい周波数帯域(F)から順に量子化ビット数の大きいビット配分グループを特定し、特定したビット配分グループをビット配分指数(ALOC(F))で表して各周波数帯域(F)のビット配分指数(ALOC(F))を決定し、副周波数帯域(FB)毎に、圧縮パワー指数(QOP(F))と量子化信号成分(QS(F,N))を連続させて伝送路へ送出することを特徴とする。
【0031】
請求項4の発明は、単位時間内に副周波数帯域(FB)の全ての信号成分を量子化して伝送可能な総配分ビット数(SFBBIT)を求め、総配分ビット数(SFBBIT)を、量子化ビット数の大きいビット配分グループから順に分配して、そのビット配分グループに属する周波数帯域(F)の数を決定する。従って、伝送レートの変化に追随させて、副周波数帯域(FB)毎に各ビット配分グループ間の数を変化させることができるので、最適な量子化ビット数で各帯域(F)内の信号成分を量子化できる。総配分ビット数(SFBBIT)が不足する場合には、残りの周波数帯域(F)は、「0」ビットの量子化ビットが割り当てられるビット配分グループに属するものとして、副周波数帯域(FB)の全ての周波数帯域(F)が復号化パワー(TPOW(F))の大きさによって、いずれかのビット配分グループに分けられる。
【0032】
副周波数帯域(FB)毎に、復号化パワー(TPOW(F))の大きい順に、その周波数帯域(F)が属するビット配分グループを決定するので、復号化パワー(TPOW(F))が比較的大きい周波数帯域(F)の信号成分(S(F,N))には、多くのビットを割り当てることができる。周波数帯域(F)とビット配分グループの関係は、ビット配分指数(ALOC(F))で表される。
【0033】
デジタル音声信号は、周波数によって大きく異なる可聴特性を有するので、復号化パワー(TPOW(F))を、周波数帯域(F)を更に数分割した副周波数(FB)単位で比較することによって、伝送する音質の品質を更に忠実に再現できる。
【0034】
請求項5のデジタル音声信号の帯域分割符号化方法は、パワー(POW(F))の圧縮符号化を、パワー(POW(F))をTで割った正規パワー(SPOW(F))を、2の指数で量子化して量子化パワー指数(OP(F))とし、量子化パワー指数(OP(F))の最大値(OPMAX(F))と、最大値(OPMAX(F))と各周波数帯域(F)の量子化パワー指数(OP(F))との差分値から求めた圧縮パワー指数(QOP(F))で符号化パワー(OPMAX(F),QOP(F))とし、復号化パワー(TPOW(F))への復号化は、符号化パワー(OPMAX(F),QOP(F))の最大値(OPMAX(F))から各周波数帯域(F)の圧縮パワー指数(QOP(F))を減じて量子化パワー指数(OP(F))を求め、量子化パワー指数(OP(F))を2の指数として逆量子化した値を逆量子化パワー(TSPOW(F))とし、
逆量子化パワー(TSPOW(F))にTを乗じて復号化パワー(TPOW(F))としたことを特徴とする。
【0035】
請求項5の発明は、量子化パワー指数(OP(F))は、正規パワー(SPOW(F))を2の指数で量子化したものであるから、パワー(POW(F))を少ないビット数に圧縮して表すことができる。
【0036】
また、各周波数帯域(F)の量子化パワー指数(OP(F))は、更に最大値(OPMAX(F))と、この最大値との差分値である圧縮パワー指数(QOP(F))とで表すので、パワー(POW(F))を更に少ないビット数に圧縮して表すことができる。
【0037】
この符号化パワー(OPMAX(F),QOP(F))からの復号化は、圧縮符号化の逆の手順で復号化し、復号化パワー(TPOW(F))を求める。
【0038】
請求項6のデジタル音声信号の帯域分割復号化方法は、請求項2の帯域分割符号化信号をビットストリーム(R)として受信し、ビットストリーム(R)からパワー(POW(F))を圧縮符号化した符号化パワー(OPMAX(F),QOP(F))を抽出し、符号化パワー(OPMAX(F),QOP(F))を復号化して復号化パワー(TPOW(F))を求め、復号化パワー(TPOW(F))の大きさから各周波数帯域(F)のビット配分指数(ALOC(F))を求め、ビット配分指数(ALOC(F))で指示される量子化ビット数で周波数帯域(F)毎にビットストリーム(R)を区切り、該周波数帯域(F)の量子化信号成分QS(F,N)を抽出し、逆量子化して逆量子化信号成分(TNS(F,N))とするとともに、各帯域(F)内の逆量子化信号成分(TNS(F,N))を二乗してT個の総和を逆量子化パワー(POWK(F))とし、逆量子化信号成分(TNS(F,N))に、逆量子化パワー(POWK(F))に対する復号化パワー(TPOW(F))の比(TPOW(F)/POWK(F))の1/2乗を乗じて逆正規化信号成分(TS(F,N))とし、再構成サブバンドフィルタにより、逆正規化信号成分(TS(F,N))からデジタル出力音声信号を復号化することを特徴とする。
【0039】
符号化パワー(OPMAX(F),QOP(F))と単位処理時間内に転送可能な総ビット数から、出力側(符号化側)と同一の復号化処理によって、各周波数帯域(F)のビット配分指数(ALOC(F))を求めることができる。従って、ビット配分指数(ALOC(F))を伝送しなくても、求めたビット配分指数(ALOC(F))に指示される量子化ビット数で、ビットストリームRを区切り、量子化信号成分(QS(F,N))を抽出して復号化することができる。取り出した量子化信号成分(QS(F,N))は、量子化ビット数が判明しているので、所定のビット数からなる逆量子化信号成分(TNS(F,N))に逆量子化される。
【0040】
逆量子化信号成分(TNS(F,N))は、出力側(符号化側)において信号成分(S(F,N))を時間軸最大値(NMAX(F))で正規化した正規信号成分(NS(F,N))に相当するものである。従って、量子化と逆量子化による量子化歪みによる誤差を無視すれば、逆量子化信号成分(TNS(F,N))を二乗してT個の総和で算出した逆量子化パワー(POWK(F))は、
【0041】
【数1】
【0042】
で表される。
【0043】
一方、復号化パワー(TPOW(F))は、パワー(POW(F))を量子化した後、逆量子化したものであるから、同様に量子化歪みによる誤差を無視すれば、
【0044】
【数2】
【0045】
で表される。
【0046】
従って、逆量子化パワー(POWK(F))に対する復号化パワー(TPOW(F))の比(TPOW(F)/POWK(F))は、上式からNMAX(F)2となり、その1/2乗はNMAX(F)となる。
【0047】
従って、逆量子化信号成分(TNS(F,N))に、逆量子化パワー(POWK(F))に対する復号化パワー(TPOW(F))の比(TPOW(F)/POWK(F))の1/2乗を乗じて逆正規化された逆正規化信号成分(TS(F,N))は、近似的に出力側(符号化側)の信号成分(S(F,N))となる。すなわち、復号化パワー(TPOW(F))を用いて、帯域内の各逆量子化信号成分を逆正規化できるので、各周波数帯域(F)の時間軸最大値(NMAX(F))を出力側(符号化側)で送出する必要がない。
【0048】
逆正規化信号成分(TS(F,N))は、再構成サブバンドフィルタによって合成され、デジタル音声信号に再生される。
【0053】
請求項7のデジタル音声信号の帯域分割復号化方法は、請求項3の帯域分割符号化信号をビットストリーム(R)として受信し、ビットストリーム(R)からパワー(POW(F))を圧縮符号化した符号化パワー(OPMAX(F),QOP(F))を抽出し、符号化パワー(OPMAX(F),QOP(F))を復号化して復号化パワー(TPOW(F))を求め、復号化パワー(TPOW(F))の大きさから各周波数帯域(F)のビット配分指数(ALOC(F))を求め、「0」ビット以外の量子化ビット数が割り当てられた周波数帯域(F)については、ビット配分指数(ALOC(F))で指示される量子化ビット数で周波数帯域(F)毎にビットストリーム(R)を区切り、該周波数帯域(F)の量子化信号成分(QS(F,N))を抽出し、逆量子化して逆量子化信号成分(TNS(F,N))とし、「0」ビットの量子化ビット数が割り当てられた周波数帯域(F)については、任意の乱数(xck)を書き込んでT個の逆量子化信号成分(TNS(F,N))を生成し、各帯域(F)内の逆量子化信号成分(TNS(F,N))を二乗してT個の総和を逆量子化パワー(POWK(F))とし、逆量子化信号成分(TNS(F,N))に、復号化パワー(TPOW(F))と逆量子化パワー(POWK(F))の比(TPOW(F)/POWK(F))の1/2乗を乗じて逆正規化信号成分(TS(F,N))とし、再構成サブバンドフィルタにより、逆正規化信号成分(TS(F,N))からデジタル出力音声信号を復号化することを特徴とする。
【0054】
「0」ビットの量子化ビット数が割り当てられた周波数帯域(F)は、ビットストリームRに含まれる符号化パワー(OPMAX(F),QOP(F))から復号化パワー(POW(F))を求め、復号化パワー(POW(F))の大きさから求めることができる。この「0」ビットの量子化ビット数が割り当てられた周波数帯域(F)内の逆量子化信号成分(QS(F,N))は、任意の乱数(xck)をデータとして書き込むことにより生成される。従って、データが欠落した周波数帯域(F)が存在しなくなり、再生したデジタル音声信号の音質が劣化することがない。
【0055】
任意の乱数(xck)がデータとして書き込まれた逆量子化信号成分(QS(F,N))は、逆量子化信号成分(TNS(F,N))に、逆量子化パワー(POWK(F))に対する復号化パワー(TPOW(F))の比(TPOW(F)/POWK(F))を乗じて逆正規化された逆正規化信号成分(TS(F,N))となる。
【0056】
逆量子化パワー(POWK(F))に対する復号化パワー(TPOW(F))の比(TPOW(F)/POWK(F))は、量子化歪みによる影響を無視すれば、ほぼ「0」ビットの量子化ビット数が割り当てられた周波数帯域(F)の時間軸最大値(NMAX(F))の2乗と等しくなる。
【0057】
従って、前記逆正規化信号成分(TS(F,N))は、任意の乱数(xck)がデータとして書き込まれた逆量子化信号成分(QS(F,N))に、その周波数帯域(F)の時間軸最大値(NMAX(F))を乗じたものとなり、全ての周波数帯域(F)においてデータが欠落することなく、しかも、「0」ビットが割り当てられた周波数帯域(F)において復号化された信号は、他の周波数帯域(F)の大きさとバランスのとれた大きさとすることができ、原デジタル音声信号と音質が異ならないデジタル音声信号を再生することができる。
【0058】
【発明の実施の形態】
以下では、図面に示す実施の形態に基づき、この発明を詳述する。
【0059】
図1に示すように、符号1で示す所定の標本化周波数のデジタル音声入力信号(PCM信号)をこの発明で使用するサブバンドフィルタ2に導入する。このサブバンドフィルタ2により可聴周波数帯域をM´等分に分離した狭帯域の信号成分を取り出せる。この周波数分離処理をT回にわたり実行して、結局、M´*T個の信号成分S(F,N)を得る。
【0060】
この実施の形態では、サブバンドフィルタ2により分離された分離帯域数M´は32であるが、高い周波数帯域の信号成分S(F,N)を伝送しなくても、ほぼ復号化して再生する音声信号の音質に影響を与えないので、高域の4つの周波数帯域の信号成分S(F,N)については以後の符号化処理を実行せず、分離周波数帯域数Mを28として、
【0061】
【数3】
【0062】
からなる信号ブロックをバッファ3に収納する。当然ながら、サブバンドフィルタ2により分離された全ての周波数帯域について、以後の符号化処理を実行し、この帯域数M´を分離周波数帯域数Mとしてもよい。また、処理時間Tは、後述するように伝送レートによって変化する変数で、本実施の形態では、3、4、6、12のいずれかの値となる。
【0063】
バッファ3に収納された信号成分S(F,N)は、図示のように周波数帯域の指数Fと時間軸の指数Nで指定される行列状の配置で表すことができる。尚、この各信号成分S(F,N)は、16ビットデータとしてバッファに記憶されている。
【0064】
次に、これらの周波数分割された信号成分S(F,N)を正規化処理部4で正規化するため、先ず信号成分S(F,N)の絶対値の時間軸に関する最大値NMAX(F)を各周波数帯域Fについて求める。つまり、
【0065】
【数4】
【0066】
次いで、周波数帯域Fと時間軸Nで指定される信号成分S(F,N)に対して、時間軸N内の信号成分の最大値NMAX(F)で信号成分S(F,N)を割り算したものを、正規化された正規信号成分NS(F,N)とする。つまり、
【0067】
【数5】
【0068】
周波数帯域Fと時間軸Nの全ての範囲に対し、このように正規化した正規信号成分TS(F,N)を求め、これ等をバッファ5に納める。
【0069】
一方、この信号成分S(F,N)を用いて、パワー計算部6において各周波数帯域(F)の信号の大きさを表すパワーPOW(F)を求める。図2のステップS1に示すように、各周波数帯域(F)のパワーPOW(F)は、該帯域(F)内の信号成分S(F,N)を二乗してそのT個の総和で求める。すなわち、
【0070】
【数6】
【0071】
次に、パワー圧縮部7において、このパワーPOW(F)を圧縮符号化して符号化パワー(OPMAX(F),QOP(F))とする。パワーPOW(F)の圧縮符号化については、図2で説明する。
【0072】
信号成分S(F,N)は、16ビットの固定小数点数で示され、その値は、
−1.0≦S(F,N)<1.0の範囲にある。従ってステップS1で求めたパワーPOW(F)は、0≦POW(F)≦Tと時間長Tによりその値が異なるため、ステップS2で時間長Tで正規化して正規パワーSPOW(F)とする。
【0073】
すなわち、POW(F)/Tで求めた正規パワーSPOW(F)は、0≦SPOW(F)≦1の範囲に含まれ、32ビットの固定小数点で示される。
【0074】
続いて、ステップS3からステップS8でこの正規パワーPOW(F)を2の指数で量子化し、量子化パワー指数OP(F)とする。
【0075】
2の指数での量子化は、ステップS7のように、正規パワーSPOW(F)を2を基数とする浮動小数点数で表し、その指数aから量子化パワー指数OP(F)を求めるが、正規パワーSPOW(F)が「0」のとき(ステップS3)には、指数aがマイナスの無限大となるので、ステップS4で量子化パワー指数OP(F)を「0」とする。また、正規パワーSPOW(F)が「1」のとき(ステップS5)には、指数aが「1」となるが、例外的に量子化パワー指数OP(F)を「31」とする。
【0076】
ステップS7で正規パワーSPOW(F)を2を基数とする浮動小数点数で表すと、正規パワーSPOW(F)は、32ビットの固定小数点で示されるので、指数aは、−31≦a≦0の範囲となり、これを「0」と正の整数で表すため、ステップS8で指数aに「31」を加えて量子化パワー指数OP(F)とする。
【0077】
以上のステップS1からステップS8までの処理を全ての周波数帯域(F)において繰り返し、各周波数帯域(F)の量子化パワー指数OP(F)を求める。
【0078】
続いて、この量子化パワー指数OP(F)を更に圧縮して伝送路へ送出するため、ステップS9に示すように、各帯域(F)の量子化パワー指数OP(F)を、その最大値OPMAX(F)と最大値OPMAX(F)に対する差分値QOP(F)で表す。
【0079】
【表1】
【0080】
【表2】
【0081】
尚、この最大値OPMAX(F)と最大値OPMAX(F)に対する差分値QOP(F)は、更に表2に示すように、1ビットシフト(パワーシフト)させて総ビット数を減少させてもよい。表1と表2は、このパワーシフトを比較して示すもので、表1は、F=12の周波数帯域に量子化パワー指数OP(F)の最大値14が存在し、OPMAX(F)=14に対する各帯域(F)の量子化パワー指数OP(F)の差分値QOP(F)が「0」から「10」の範囲に含まれていることを示している。従って、同表のように圧縮パワー指数QOP(F)は、最大4ビットで符号化することができ、伝送路へは、「14」を5ビットで表した最大値OPMAX(F)と4ビットで表した各帯域(F)の圧縮パワー指数QOP(F)と圧縮パワー指数QOP(F)を何ビットで送出したかを示す2ビットのコード(QPBIT)が送出される。この符号化パワー(OPMAX(F),QOP(F))の総ビット数powbitは、合計5+4*28+2の119ビットである。
【0082】
表2は、表1を1ビットシフト(パワーシフト)させたもので、シフトさせた量子化パワー指数OP´(F)の最大値OP´MAX(F)は7と、圧縮パワー指数QOP´(F)は、「0」から「5」の範囲に含まれ、最大3ビットで符号化することができる。このようにシフトした符号化パワー(OP´MAX(F),QOP(F))の総ビット数powbitは、最大値OP´MAX(F)に4ビット、各帯域(F)の圧縮パワー指数QOP(F)に3*28ビット、QPBITに2ビットの90ビットと圧縮することができる。
【0083】
以上のように圧縮符号化された符号化パワー(OPMAX(F),QOP(F))は、後述するビットストリーム生成部12に出力されて伝送路に送出されるが、同時に後述する帯域(F)毎のビット配分指数ALOC(F)を決定するため、パワー復号部8へも出力される。
【0084】
パワー復号部8では、前述のパワー圧縮部7での符号化処理と全く逆の復号化処理を行って、パワーPOW(F)に相当する復号化パワーTPOW(F)を求めるものである。
【0085】
すなわち、図3に示すようにステップS10で最大値OPMAX(F)から差分値である圧縮パワー指数QOP(F)を減じて量子化パワー指数OP(F)を求め、量子化パワー指数OP(F)が「0」であるときには、量子化したときの値に一致するように、ステップS11とステップS12で逆量子化パワーTSPOW(F)を「0」とする。
【0086】
量子化パワー指数OP(F)が正の整数である場合には、ステップS13で「31」を引いた値をaとし、ステップS14で、仮数を0.5、基数を2、指数をaとして浮動小数点で表した逆量子化パワーTSPOW(F)に逆量子化する。
【0087】
この逆量子化パワーTSPOW(F)をパワーPOW(F)に相当する値に復号化するため、ステップS15で、時間長Tを乗じ復号化パワーTPOW(F)とする。そして、以上のステップS10乃至ステップS15までの処理を繰り返し、全ての周波数帯域(F)の復号化パワーTPOW(F)を求める。
【0088】
このようにして求めた復号化パワーTPOW(F)は、ビット割当決定部9に送られ、各周波数帯域(F)の復号化パワーTPOW(F)をもとにビット配分指数ALOC(F)が決定される。
【0089】
パワーPOW(F)から直接ビット配分指数ALOC(F)を決定しないのは、ビット配分指数ALOC(F)を決定するための情報として出力側(符号化側)からは、前述した符号化パワー(OPMAX(F),QOP(F))しか送出しないので、予め受信側(復号化側)と全く同一の処理によって、符号化パワー(OPMAX(F),QOP(F))からのビット配分指数ALOC(F)を決定し、受信側(復号化側)での量子化歪みによる復号化エラーを防止するものである。
【0090】
正規信号成分NS(F,N)を量子化する量子化ビット数の割り当ては、総配分ビット数SBITを各周波数帯域(F)の復号化パワーTPOW(F)の大きさによって、周波数帯域(F)単位で割り当てられる。
【0091】
本実施の形態では、「4ビット」「2.4ビット」「1.6ビット」「0ビット」とそれぞれ量子化ビット数が異なる4つのビット配分グループを設定し、復号化パワーTPOW(F)の大きい、すなわちその帯域(F)の信号成分S(F,N)のレベルが大きい帯域(F)から量子化ビット数が多いビット配分グループに属させて、全ての帯域(F)を4つのビット配分グループに分配するものである。すなわち、信号成分S(F,N)のレベルが大きい帯域(F)に多くの量子化ビット数を割り当て、分解能をより高めた圧縮を行うものである。各周波数帯域(F)がいずれのビット配分グループに属するかをビット配分指数ALOC(F)で表す。
【0092】
ビット配分指数と、割り当てられる量子化ビット数の関係は、表3に示すようになる。
【0093】
【表3】
【0094】
尚、カッコ内に示すステップは、量子化のステップ数rを示すものである。
【0095】
M´*T個の信号成分S(F,N)の量子化に配分できる総配分ビット数SBITは、単位処理時間内にM´*T個の信号成分S(F,N)を量子化して伝送可能な総ビット数によって求められる。例えば、符号化するデジタル音声入力信号1のサンプリング周波数を8KHzとすれば、M´*T個の信号成分S(F,N)を量子化する単位処理時間は、M´*T/8KHzすなわち125μsec*M´*Tである。この単位処理時間に伝送レートが8kbpsの伝送系を用いて送出できるビット数、すなわち総配分ビット数SBITは、125μsec*M´*T*8kbpsであり、M´を32、Tを12とすれば、384bitとなる。
【0096】
このように総配分ビット数SBITは、信号ブロックの時間長Tに比例するものであるが、本実施の形態では、符号化したデジタル音声信号を所定長のパケットとして送出するものであるので、伝送レートの変化に対して時間長Tを調整することによって、総配分ビット数SBITをほぼ一定にしているものである。
【0097】
【表4】
【0098】
表4には、このようにして算出した総配分ビット数SBITと4種類の伝送レートの関係を示している。同表から明らかなように、伝送レートが上がると時間長が短くなるので符号化側での遅延時間が短くなり、伝送レートが下がればこれに応じて多くの信号成分S(F,N)をバッファに記憶して一括符号化処理するものである。
【0099】
本実施の形態では、出力側(符号化側)と受信側(復号化側)でそれぞれこの表4をテーブルとして備え、受信側は、LANのトラヒックを検出してこれに応じた伝送レートを出力側へ指示し、出力側は、受信側から指示された伝送レートに対応する時間長Tを表4で選択し、同表に従って、上述の各ビット配分グループに属する周波数帯域数を決定するものである。
【0100】
以下、伝送レートが24kbpsである場合の各ビット配分グループに属する周波数帯域数の決定方法について説明する。
【0101】
4ビットを割り当てるビット配分グループ(ALOC(F)=3)の周波数帯域(F)の数k40と、2.4ビットを割り当てるビット配分グループ(ALOC(F)=2)の周波数帯域(F)の数k24は、表4を参照してk40=7、k24=11である。1.6ビットが割り当てるビット配分グループ(ALOC(F)=1)の周波数帯域(F)の数k16は、残りのビット数BIT3STEPをALOC(3ST)で割ったときの整数商INT〔BIT3STEP/ALOC3ST(T)〕で求める。
【0102】
ここで、残りのビット数BIT3STEPとは、総配分ビット数SBITから符号化パワー(OPMAX(F),QOP(F))の送出に要するビット数powbitと、前記ビット配分グループ(ALOC(F)=3、=2)に割り当てられたビット数を差し引いた残りのビット数であり、
【0103】
【数7】
【0104】
で算出される。
【0105】
これらの式において、ALOC15ST(T)は、4ビットで正規信号成分NS(F,N)を量子化して帯域(F)内のT個をまとめて伝送路に送出するのに要するビット数4*Tビットである。また、ALOC5ST(T)は、同様に2.4ビットで量子化して帯域(F)内のT個をまとめて伝送路に送出するのに要するビット数、ALOC3ST(T)は、1.6ビットで量子化して帯域(F)内のT個をまとめて伝送路に送出するのに要するビット数であり、そのビット数は、表5に示すように時間長Tにより異なる。
【0106】
【表5】
【0107】
伝送レートが24kbpsである場合には、総配分ビット数SBITは384bit、時間長Tは4であり、powbitは、各帯域(F)の量子化パワー指数OP(F)が表1に示す例でありパワーシフトしていないとすれば、前述したとおり119ビットである。従って、BIT3STEPは、
【0108】
【数8】
【0109】
である。また、表5からALOC3ST(4)は、7であるから、1.6ビットが割り当てるビット配分グループ(ALOC(F)=1)の周波数帯域(F)の数k16は、6となる。
【0110】
そして上記いずれのビット配分グループにも属しない帯域(F)は、0ビットが割り当てられるビット配分グループに属するものとなる。この0ビットが割り当てられるビット配分グループの帯域数k0は、量子化される正規信号成分NS(F,N)の周波数帯域数Mが上述の通り28であるから、k0=M−k40−k24−k16、すなわち4となる。
次に各周波数帯域(F)とビット配分グループとの関係は、図4のフローに示すように各帯域(F)の復号化パワーTPOW(F)の大きさによって特定される。
【0111】
ステップS16では、とりあえず全ての周波数帯域(F)をALOC(F)=0とする。
【0112】
ステップS17では、各周波数帯域(F)の復号化パワーTPOW(F)を比較して、大きい順にk40+k24+k16個の周波数帯域(F)を選び、選択した周波数帯域(F)をALOC(F)=1とする。すなわち、このときにALOC(F)=1に置き換えられなかった周波数帯域(F)は、ALOC(F)=0で表されるビット配分グループに属する。
【0113】
更に、ステップS18で、復号化パワーTPOW(F)の大きい順にk40+k24個の周波数帯域(F)を選び、ALOC(F)=2とする。このとき、ステップS17でALOC(F)=1とされ、ALOC(F)=2に置き換えられなかった周波数帯域(F)は、ALOC(F)=1で表されるビット配分グループに属する。
【0114】
同様に、ステップS19で、復号化パワーTPOW(F)の大きい順にk40個の周波数帯域(F)を選び、ALOC(F)=3とする。このとき、ステップS18でALOC(F)=2とされ、ALOC(F)=3に置き換えられなかった周波数帯域(F)は、ALOC(F)=2で表されるビット配分グループに属する。従って、各周波数帯域(F)は、復号化パワーTPOW(F)の大きい順に4種類のビット配分グループに分けられる。
【0115】
図1の量子化部10では、ビット配分決定部9で決定されるビット配分指数ALOC(F)で指示される量子化ビット数で、バッファ5に記憶された正規信号成分NS(F,N)を量子化する。これは、図5に示す手順で行われる。ビット配分決定9から転送路13を介して導入された各周波数帯域(F)のビット配分を指示する指数ALOC(F)をステップS30で判定し、その指数ALOC(F)の値に応じて係数PPXの値を指定する。すなわち、ALOC(F)=1で量子化ステップ数rが3である場合にはPPX=2、ALOC(F)=2で量子化ステップ数rが5である場合にはPPX=4、ALOC(F)=3で量子化ステップ数rが15である場合にはPPX=14である。尚、量子化ビット数が「0」のALOC(F)=0の帯域(F)は、量子化処理を行わず伝送しないので、PPXを指定せずに次の周波数帯域(F)について上記処理を行う。
【0116】
ステップS31は、正規信号成分NS(F,N)を絶対値が1以下の実数として、ビット配分グループ毎に特定された奇数のステップ数r(3、5、15)で「0」を中心とした量子化信号(QS(F,N)に量子化するものである。
【0117】
この量子化を図6(a)乃至(c)で詳述する。図6(a)に示すようにALOC(F)=1である場合には、正規化により絶対値が1以下とされた正規化信号成分NS(F,N)は、PPX=2を乗じて1を加えることによって、−1から+3までの範囲のいずれかの実数となる。INT(X)は、Xを超えない最大整数値を意味するので、結局INT[〔NS(F,N)*PPX+1〕÷2]で表される量子化信号QS(F,N)は、同図に示すように−1から+1までの「0」を中心とした3ステップで表される。
【0118】
また、ALOC(F)=2である場合には、正規化信号成分NS(F,N)は、PPX=4を乗じて1を加えることによって、−3から+5までの範囲のいずれかの実数となる。従って、INT[〔NS(F,N)*PPX+1〕÷2]で表される量子化信号QS(F,N)は、図6(b)のように−2から+2までの「0」を中心とした5ステップで表される。同様に、ALOC(F)=3である場合には、PPXが14であるから、NS(F,N)*PPX+1は、−13から+15の範囲の実数であり、量子化信号(QS(F,N)は、図6(c)のように−7から+7までの「0」を中心とした5ステップで表される。
【0119】
このように量子化された量子化信号QS(F,N)は、図1のバッファ11に収納された後、ビットストリーム生成部12で伝送路14を介して入力される符号化パワー(OPMAX(F),QOP(F))とともにビットストリームRに符号化され、パケットとしてLAN等の伝送路に送出される。
【0120】
以下、このビットストリーム生成部12において図9に示すフォーマットでビットストリームRを生成する手順を、図7及び図8で説明する。尚、パケットとしてLANに送出する場合には、この音声データを表すビットストリームR(以下、符号化信号という)の前後に、パケットの送信先、発信元、いずれの伝送レートで符号化したかなどを示す情報符号、誤り制御符号を付加してパケットを構成するが、その詳細についての説明は、省略する。
【0121】
図7に示すように、先ずステップS40により符号化信号の先頭に2ビットのQPBITを付ける。このQPBITは、前述したように、圧縮パワー指数QOP(F)を何ビットで送出したかを示すコードであり、表6に示すように、パワーシフトのシフト量によっても異なるビット数を表すこととなることから、圧縮パワー指数QOP(F)を表す最大ビット数とパワーシフト量から表6を用いてビット数を特定する。
【0122】
【表6】
【0123】
QPBITが「1、1」である場合は、表6に示すように量子化パワー指数OP(F)の最大値OPMAX(F)が差分値である圧縮パワー指数QOP(F)と同じビット数で表される場合であり、差分値をを用いて各帯域(F)の量子化パワー指数OP(F)を表す意味がないので、ステップS41とステップS42により、各帯域(F)の量子化パワー指数OP(F)をそのままQPBITに続けて帯域(F)順に連続させて送出する。
【0124】
QPBITが「1、1」以外の場合には、ステップS43で、QPBITの後にパワーシフト量により3ビットから5ビットで表示される最大値OPMAX(F)を連続させ、更にその後各帯域(F)の圧縮パワー指数QOP(F)を、QPBITで指示されるビット数で帯域(F)順に連続させて送出する(ステップS44)。以上のステップS40乃至ステップS44の処理によって、符号化パワー(OPMAX(F),QOP(F))の符号化信号を生成する。
【0125】
次に、量子化部10で量子化された量子化信号成分QS(F,N)は、図8に示す圧縮符号化処理により、前記符号化パワー(OPMAX(F),QOP(F))に続くフリーフォーマット区間に後置される。この場合、ビットストリーム生成部12には、量子化信号QS(F,N)の他に、転送路15を介してビット配分指数ALOC(F)も導入されている。これは、ビット配分指数ALOC(F)で指示されるビット数で量子化信号QS(F,N)を表すためである。この圧縮符号化処理は周波数帯域(F)単位で行うので、先ず周波数帯域(F)毎にその指数ALOC(F)をステップS50で判定する。
【0126】
量子化ビット数が0ビットの場合(ALOC(F)=0のとき)には、その帯域(F)の量子化信号QS(F,N)が存在しないので、何も処理せず次の帯域(F)の処理を行う
1.6ビットの場合(ALOC(F)=1の時)には、ステップS51で3ステップで表したT個の量子化信号QS(F,N)を連続させてT桁の3進で表し、ステップS52でこれを2進に変換してALOC3ST(T)ビットの量子化信号からなる帯域データDT(F)とするものである。すなわち、表5に示すALOC3ST(T)は、T桁の3進値を2進値で表す場合の必要ビット数を示すものである。従って、帯域(F)内のT個の量子化信号QS(F,N)は、まとめてALOC3ST(T)ビットに圧縮符号化され、その結果、単位量子化信号成分QS(F,N)あたりに割り当てられるビット数は、ALOC3ST(T)/Tより、ALOC(F)=1で指示されるほぼ1.6ビットとなる。
【0127】
尚、ステップS51において、各量子化信号QS(F,N)に1を加えるのは、3ステップで−1から+1の整数値で表示される量子化信号QS(F,N)を0または正の整数値に置き換えて、3進表示化するためである。
【0128】
又、2.4ビットの場合(ALOC(F)=2のとき)には、ステップS53で、それぞれ5ステップで表したT個の量子化信号QS(F,N)を連続させてT桁の5進で表し、これをステップS54で2進に変換して、ALOC5ST(T)ビットの量子化信号からなる帯域データDT(F)とするものである。ステップS53で2を加えるのは、各量子化信号QS(F,N)が−2から+2までの整数値であるため、これを0または正の整数値に置き換えて5進表示化するためである。このようにして、ALOC(F)=2のビット配分グループに属する帯域(F)内のT個の量子化信号QS(F,N)は、まとめてALOC5ST(T)ビットに圧縮符号化され、その結果、単位量子化信号成分QS(F,N)あたりに割り当てられるビット数は、ALOC5ST(T)/Tより、ほぼ2.4ビットとなる。ここで、ALOC5ST(T)は、表5に示すようにT桁の5進値を2進値で表すための必要ビット数を示すものである。
【0129】
量子化ビット数が4ビットである場合(ALOC(F)=3のとき)には、ステップS55で、その周波数帯域(F)内の各量子化信号成分QS(F,N)に7を加算して0または正の整数として4ビットで表し、ステップS56でこれを時間軸N順にT個連続させて4*Tビットの帯域データDT(F)とする。従って、ALOC(F)=3のビット配分グループに属する周波数帯域(F)の各正規信号成分NS(F,N)は、15ステップで量子化された後、4ビットデータに符号化され帯域データDT(F)の一部となる。
【0130】
尚、本実施の形態では、帯域(F)内のT個全ての量子化信号成分S(F,N)についてこれを連続させて一連の帯域(F)データとしているが、時間長Tが長い場合には、これを複数に分割し、分割した量子化信号成分S(F,N)について同様にステップS50乃至ステップS56の処理を行い、一連の分割帯域データDT´(F)としてもよい。
【0131】
以上の処理過程によりビットストリーム生成部12から送出される符号化信号のフォーマットを図9に示す。図9(a)は、QPBITが「1、1」以外である場合の符号化パワー(OPMAX(F),QOP(F))と帯域データDT(F)を連続させた符号化信号を示すもので、全ての周波数帯域(F)について上述の処理を行った符号化信号のビット数は、総配分ビット数SBIT以下となる。尚、ALOC(F)=0のビット配分グループに属する周波数帯域(例えばF=1、2)については、圧縮パワー指数QOP(F)のみが符号化され、帯域データDT(F)はその帯域(F)内の正規化信号成分NS(F,N)が量子化されないので送出されない。
【0132】
また、各帯域データDT(F)は、周波数帯域(F)単位の該帯域(F)内のT個全ての量子化信号成分QS(F,N)を一組にして形成されている。この帯域データDT(F)とビット配分グループとの関係を図9(b)に示す。
【0133】
次に、LAN等の伝送回路を経由して導入された、あるいは何らかのデジタル信号読取装置によって検出された、上記符号化信号を復号化して、元のデジタル音声信号1´に変換する処理方法について説明する。
【0134】
図10は、この符号化信号を復合化する受信装置(復号化装置)の構成を示すブロック図であり、上記本発明に係る帯域分割符号化方法によって符号化された符号化信号が、パワー抽出部20に導入される。本実施の形態では、この受信装置は、イーサネットなどのLANによるパケット通信回線網の電話端末であるが、符号化したデジタル音声信号を復号化して再生するものであれば、例えば、ISDNの端末装置、音響機器の再生装置などであってもよい。この受信装置で、符号化信号を復号化して逆正規化信号成分TS(F,N)とし、更に再構成サブバンドフィルタ29によって逆フィルタを行い、最終的に原デジタル音声信号1に近似したデジタル音声信号1´を出力するものである。以下、この過程を詳述する。
【0135】
パワー抽出部20では、ビットストリームRから、各周波数帯域(F)のパワーを求めるために、符号化された復号化パワー(OPMAX(F),QOP(F))を抽出する。
【0136】
この為、先ずステップS60により符号化信号の先頭に2ビットのQPBITを受信して、QPBITと表6を比較して圧縮パワー指数QOP(F)のビット数を求める。表6中のパワーシフト量は、前記表4に示すように伝送レートにより決まった値となるので、受信側(復号化側)でこの表4及び表6をテーブルとして記憶していれば、伝送レートから圧縮パワー指数QOP(F)のビット数を求めることができる。尚、この伝送レートについては、前述のように受信側(復号化側)から出力側(符号化側)に送出された伝送レートのデータをもとに、出力側(符号化側)から同じレートで送出されたものであるから、受信側(復号化側)で明らかであるが、パケットの情報符号に伝送レートを示すデータを含め、受信側(復号化側)でこの情報符号から伝送レートを確認するものであってもよい。
【0137】
QPBITが「1、1」である場合には、量子化パワー指数OP(F)を、差分値を用いた圧縮パワー指数QOP(F)で表現していないので、図11のステップS61からステップS62に進み、表6で指示されるビット数で、周波数帯域数M回分QPBIT以後のビットストリームRを区切り、直接各帯域(F)の量子化パワー指数OP(F)を求める。
【0138】
また、QPBITが「1、1」以外である場合には、ステップS61からステップS63に進み、QPBITに続く最大値OPMAX(F)を抽出するとともに、最大値OPMAX(F)に続く各帯域(F)の圧縮パワー指数QOP(F)を、QPBITと表6で指示されるビット数で区切って検出し、最大値OPMAX(F)と圧縮パワー指数QOP(F)から各帯域(F)の量子化パワー指数OP(F)を算出する。
【0139】
このようにして求めた各帯域(F)の量子化パワー指数OP(F)は、パワー復号部21に送られ、パワー復号部21により逆量子化されて復号化パワーTPOW(F)となる。この逆量子化の過程は図11においてステップS64で示すが、図3のステップS11以下に示す過程と全く同一であるので、その説明を省略する。
【0140】
図10に示すように、復号化パワーTPOW(F)は、各帯域(F)のビット配分指数ALOC(F)を求めるためにビット割当決定部22と、逆正規化のために逆正規化部27へ出力される。
【0141】
ビット割当決定部22は、出力側(符号化側)のビット割当決定部9と全く同一の構成で、各周波数帯域(F)の復号化パワーTPOW(F)をもとにビット配分指数ALOC(F)を決定する。
【0142】
ビット配分指数ALOC(F)の決定方法は、前述のビット割当決定部9でのビット配分指数ALOC(F)の決定方法と全く同じであるので、その説明を省略する。
【0143】
尚、この決定過程において、総配分ビット数SBITと各ビット配分グループに属する周波数帯域数kは、伝送レートと表4を示すテーブルから求めることができ、powbitは、前記受信した符号化パワー(OPMAX(F),QOP(F))の総ビット数より求めることができる。
【0144】
次いで、逆量子化部23で、図12、図13のように、ビット割当決定部22から送られたビット配分指数ALOC(F)に基づき、符号化パワー(OPMAX(F),QOP(F))に続くビットストリームRから各帯域(F)の帯域データDT(F)を抽出し、帯域データDT(F)を構成する量子化信号QS(F,T)成分を逆量子化して逆量子化信号成分TNS(F,N)とする。この処理は、図8の処理の逆変換に相当する。図12に示すフローにおいて、
【0145】
【数9】
【0146】
【数10】
【0147】
である。
【0148】
上記のように逆量子化部23は、ビットストリームRから各帯域(F)の帯域データDT(F)を抽出し、逆量子化信号成分TNS(F,N)を求めるものであるが、ある周波数帯域(F)がALOC(F)=0のビット配分グループに属するものであったとすると、その帯域では量子化されないので、ビットストリームRにその帯域の帯域データDT(F)は含まれていない。
【0149】
従って、ステップS70である帯域(F)のビット配分指数ALOC(F)が0と判定されると、ステップS71において、その代わりに逆量子化信号成分TNS(F,N)が直接生成される。この逆量子化信号成分TNS(F,N)のデータには、乱数発生回路24から出力された乱数xckが書き込まれる。生成された逆量子化信号成分TNS(F,N)は、符号化側の正規信号成分NS(F,N)に相当するものであるため、正規信号成分NS(F,N)と同じビット数で、データの絶対値は、1以下となっている。
【0150】
ある帯域(F)のビット配分指数ALOC(F)が1と判定されると、ステップS73からステップS74でV=0とされ、ステップS75に進む。ALOC(F)=1で指定される周波数帯域(F)の帯域データDT(F)は、ALOC3ST(T)ビットであるから、ビットストリームRからALOC3ST(T)ビットで区切り、該帯域(F)の帯域データDT(F)を抽出する。抽出した帯域データDT(F)は、後述する復号化処理のため10進のRで表す。尚、時間長Tは、伝送レートと表4で定まり、例えば、伝送レートが24kbpsであるとすると、T=4である。
【0151】
次に、ステップS76においてこの帯域データDT(F)から量子化信号成分QS(F,T)を抽出する。ckは帯域(F)内の量子化信号成分NS(F,N)の順序を表すもので、初期値は1である。(R)10/HDATA(0,ck)は、ALOC3ST(T)ビットの帯域データDT(F)を10進で表し、3T-ckで割ることを意味し、その整数商がQ、余りがRとされる。この整数商Qは、図8に示すステップS51の(QS(F,N)+1)を示すものであり、このときのNは、T+1−ckである。整数商Qは、0から2までのいずれかであるから、ステップS77で、この整数商Qから(−V−1)すなわち1を引くことによって、0を中心とした3ステップのQS(F,T+1−ck)を求める。QS(F,T+1−ck)は、−1、0、+1のいずれかであるが、正規化信号成分NS(F,N)と同じ表示形式とする為に、ステップS78においてV=0とした後、16ビットの固定小数点数の逆量子化信号成分TNS(F,T+1−ck)とする。
【0152】
同様にして、ckをインクリメントし、前回のステップS76で算出した余りRについて、再びこの余りRについて、(R)10/HDATA(0,ck)の計算を行い、その整数商Qと余りRを求める。この整数商Qから上記と同様にして次の逆量子化信号成分TNS(F,T+1−ck)を求める。
【0153】
この処理をckがTに達するまで繰り返し、帯域データDT(F)からT個の逆量子化信号成分TNS(F,N)を求める。
【0154】
ある周波数帯域(F)について、ビット配分指数ALOC(F)=2であったとすると、ステップS79からステップS80に進みV=1となり、ステップS81へ進む。ALOC(F)=2で指定される周波数帯域(F)の帯域データDT(F)は、ALOC5ST(T)ビットであるから、ビットストリームRからALOC5ST(T)ビットで区切り、該帯域(F)の帯域データDT(F)を抽出する。抽出した帯域データDT(F)は、前述と同様に復号化処理のため10進のRで表す。
【0155】
ステップS76において、Vは1となるので、(R)10/HDANA(1,ck)は、ALOC5ST(T)ビットのデータRを5T-ckで割ることを意味し、2進の帯域データDT(F)が5進に置き換えられる。量子化信号QS(F,T+1−ck)は、この整数商Qから求められるが、ステップS77において前述と同様に、(−V−1)すなわち2を引くことによって、0を中心とした5ステップのQS(F,T+1−ck)が求められる。
【0156】
復合化したQS(F,T+1−ck)は、−2から+2の整数値であるが、正規化信号成分NS(F,N)と同じ表示形式とする為に、ステップS78においてV+1すなわち2で割った後、16ビットの固定小数点数の逆量子化信号成分TNS(F,T+1−ck)とする。
【0157】
この処理をckが1からTに達するまで繰り返し、帯域データDT(F)からT個の逆量子化信号成分TNS(F,N)を求める。
【0158】
周波数帯域(F)のビット配分指数ALOC(F)が3の場合には、ステップS79からステップS82に進み、4ビット毎にビットストリームRを区切り、帯域データDT(F)内の量子化信号成分QS(F,N)を抜き出す。この量子化信号成分QS(F,N)は、0から14までの15ステップで表された量子化信号成分QS(F,N)であるため、ステップS83でこの区切られた量子化信号成分QS(F,N)から7を引いて、0を中心とした−7から+7までの値とする。
【0159】
この復合化したQS(F,N)は、正規化信号成分NS(F,N)と同じ表示形式とする為に、ステップS84において、7で割った後、16ビットの固定小数点数の逆量子化信号成分TNS(F,N)とする。そして、このステップS82からステップS84の処理をT回繰り返して、帯域データDT(F)のT個の逆量子化信号成分TNS(F,N)を求める。
【0160】
このように、逆量子化部23では、復号化した量子化信号成分QS(F,N)を実数としたときに絶対値が1以下となるように割り算を行って、逆量子化信号成分TNS(F,N)とし、これらをバッファ25に納める。
【0161】
この逆量子化信号成分TNS(F,N)は、図10に示すように逆正規化部27に送られ逆正規化処理が行われるが、この逆正規化処理のために逆量子化パワー算出部26にも送られ、帯域(F)毎の逆量子化パワーPOWK(F)が算出される。
【0162】
逆量子化パワー算出部26では、各周波数帯域(F)毎に、図14のステップS90に示すように、該帯域(F)の逆量子化信号成分TNS(F,N)を二乗し、そのT個の総和を逆量子化パワーPOWK(F)として算出する。すなわち、
【0163】
【数11】
【0164】
各帯域(F)毎に算出した逆量子化パワーPOWK(F)は、逆正規化部27へ出力される。
【0165】
逆正規化部27へは、この逆量子化パワーPOWK(F)の他に、パワー復号部21から転送路90を介して送られた復号化パワーTPOW(F)も入力されていて、逆正規化部27は、図14のステップS91に示すように、これらの逆量子化パワーPOWK(F)と復号化パワーTPOW(F)を用いて、周波数帯域毎に逆量子化信号成分TNS(F,N)を符号化側の信号成分S(F,N)に相当する大きさの逆正規化信号成分TS(F,N)とする。
【0166】
逆量子化信号成分TNS(F,N)は、上述のように出力側(符号化側)において信号成分S(F,N)を時間軸最大値(NMAX(F))で正規化した正規信号成分NS(F,N)に相当するものである。従って、正規信号成分NS(F,N)の量子化と逆量子化による量子化歪みの誤差を無視すれば、逆量子化信号成分TNS(F,N)を二乗してT個の総和で算出した逆量子化パワーPOWK(F)は、
【0167】
【数12】
【0168】
となる。
【0169】
一方、復号化パワーTPOW(F)は、パワーPOW(F)を量子化した後 、逆量子化したものであるから、同様に量子化歪みによる誤差を無視すれば、
【0170】
【数13】
【0171】
で表される。
【0172】
従って、逆量子化パワー(POWK(F))に対する復号化パワー(TPOW(F))の比(TPOW(F)/POWK(F))は、上式からNMAX(F)2となり、その1/2乗はNMAX(F)となる。
【0173】
従って、逆量子化信号成分TNS(F,N)に、逆量子化パワー(POWK(F))に対する復号化パワー(TPOW(F))の比(TPOW(F)/POWK(F))の1/2乗を乗じた逆正規化信号成分TS(F,N)は、出力側(符号化側)の信号成分S(F,N)と近似した値となる。
【0174】
尚、この逆正規化処理の際に、ビット配分指数ALOC(F)が0の帯域(F)の各逆量子化信号成分TNS(F,N)には、乱数xckが書き込まれ、ノイズを表すものとなっているが、このノイズも逆正規化部27で逆正規化され、その帯域(F)の復号化パワー(TPOW(F))に応じたレベルに拡大される。ビット配分指数ALOC(F)が0の帯域(F)の復号化パワー(TPOW(F))は、他の帯域(F)に比べて相対的に小さい値であるので、他の帯域(F)とバランスのとれた大きさに拡大される。
【0175】
逆正規化部27で、各帯域(F)毎に逆正規化された逆正規化信号成分TS(F,N)は、全ての帯域(F)についての処理が終了するまで、バッファ28に一時記憶される。
【0176】
最後に、バッファ28に記憶された行列状の逆正規化信号成分TS(F,N)の信号ブロックは、狭帯域の再構成サブバンドフィルタ29を通過させることによって、記号1´で示すデジタル音声信号(PCM)に復号化される。このデジタル音声信号は、所定の音声変換装置(再生装置)により再生されるか、若しくは、所定の記憶装置に記憶される。
【0177】
上記実施の形態でのデジタル音声信号の符号化と復号化処理は、M=28の多数の帯域に分けて、この帯域内の全ての復号化パワーTPOW(F)を比較して、ビット配分指数ALOC(F)を決定したが、音声は周波数によって大きく異なる可聴特性を有するので、例えば、高域と低域など複数の副周波数帯域に分割し、副周波数帯域内で同様の処理を行えば、更に伝送する音声の品質をより忠実に表現できる。この実施の形態でM=28とする場合に、例えば高域と低域の副周波数帯域に分割し、低域をF=1乃至14、高域をF=15乃至28とし、帯域数M1と、M2を各14として、それぞれの副周波数帯域FBで上述の符号化処理を行い、デジタル音声信号1を符号化した符号化信号を図15に示す。同図に示すように、副周波数帯域FB毎に、符号化パワー(OPMAX(F),QOP(F))とその副周波数帯域FB内の各帯域データDT(FB,F)が連続して送出される。図において、S1BITは、低域の副周波数帯域(FB=1)の総配分ビット数(SFBBIT)、S2BITは、高域の副周波数帯域(FB=2)の総配分ビット数(SFBBIT)である。
【0178】
このように、副周波数帯域に分けて符号化を行うと、総配分ビット数SBITを周波数特性を考慮して各副周波数帯域FBに分配して、各副周波数帯域FB毎に総配分ビット数(SFBBIT)を設定することができ、また、その中で、表4に記載されるビット配分グループに属する帯域数kやパワーシフト量も調整することができる。また、量子化パワー指数OP(F)の最大値OPMAX(F)は、副周波数帯域(FB)単位で求めることとなるので、デジタル音声信号の高域と低域のレベルが平均的に異なる場合には、量子化パワー指数OP(F)を、より効率的に圧縮パワー指数QOP(F)に圧縮できる。
【0179】
また、上記実施の形態では、各ビット配分グループに属する周波数帯域数kは、表6に基づいて定めたが、予め各ビット配分グループに属する周波数帯域数kの比率を定め、総配分ビット数SBITをこの比率が維持されるように各ビット配分グループに分配し、各ビット配分グループに属する周波数帯域数kを求めてもよい。
【0180】
また、上記実施の形態は、主としてLANにパケットとして送出する例で説明したがこれに限るものではなく、ISDNの端末の電話機、デジタルコンパクトカセットや磁気テープ等でのデジタル音声信号の符号化と復号化にも利用できる。これ等の場合には、単位時間当たりに送出できるビット数が増えるので、量子化ビット数を更に増やし、細かいステップによる高音質を保持できる信号の符号化およびそれに対する復号化も可能である。
【0181】
【発明の効果】
以上説明したように、請求項1乃至請求項5の発明によれば、各周波数帯域の信号レベルの大きさを、その帯域内の各信号成分S(F,N)をそれぞれ二乗したT個の総和のパワーPOW(F)で求めたので、一つの信号成分S(F,N)に異常値が生じても、パワーPOW(F)に大きな誤差は生じない。
【0182】
このパワーPOW(F)は、圧縮符号化した符号化パワー(OPMAX(F),QOP(F))として伝送路へ送出されるので、少ないビット数で全ての帯域(F)の信号の大きさを送出できる。
【0183】
圧縮符号化した符号化パワー(OPMAX(F),QOP(F))を再び復号化して復号化パワーTPOW(F)を求め、この復号化パワーTPOW(F)の大きさで、帯域毎の量子化ビット数を指示するビット配分指数を定めるので、帯域内の信号のレベルが大きい帯域により多くの量子化ビット数を割り当てることができるとともに、受信側(復号化側)で同じ復号化処理によりビット配分指数を求めることができるので、帯域毎の量子化ビット数を出力側(符号化側)で送出する必要がない。
【0184】
従って、送出する符号化信号には、符号化パワー(OPMAX(F),QOP(F))と、周波数帯域(F)毎に量子化された量子化信号((QS(F,N))を連続させたデータ信号(DT(F)が含まれるだけで、量子化ビット数を表すビット配分指数ALOC(F)は伝送されないので、総配分ビット数が増加し、各信号成分S(F,N)の量子化に、より多くのビットを配分することができる。
【0185】
請求項3の発明によれば、これに加えて更に、単位時間内に伝送路へ伝送可能な総配分ビット数(SBIT)を求め、総配分ビット数(SBIT)を、量子化ビット数の大きいビット配分グループから順に分配して、そのビット配分グループに属する周波数帯域(F)の数を決定するので、伝送レートの変化に追随させて、各ビット配分グループ間の数を変化させることができ、最適な量子化ビット数で各帯域(F)内の信号成分を量子化できる。
【0186】
請求項4の発明は、更に請求項1又は2の発明に加えて、伝送レートの変化に追随させて、副周波数帯域(FB)毎に各ビット配分グループに属する周波数帯域数kを変化させることができるので、最適な量子化ビット数で各帯域(F)内の信号成分を量子化できる。
【0187】
また、量子化パワー指数OP(F)の最大値OPMAX(F)は、副周波数帯域(FB)単位で求めることとなるので、デジタル音声信号の信号レベルが副周波数帯域(FB)単位で平均的に異なる場合には、量子化パワー指数OP(F)を、より効率的に圧縮パワー指数QOP(F)に圧縮できる。
【0188】
請求項5の発明は、更に請求項1又は2の発明に加えて、パワーPOW(F)を正規化した後、2の指数で量子化して量子化パワー指数OP(F)とするので、パワーPOW(F)を、より少ないビット数に圧縮して表すことができる。
【0189】
また、各周波数帯域(F)の量子化パワー指数OP(F)は、更に最大値OPMAX(F)と、この最大値との差分値である圧縮パワー指数QOP(F)とで表すので、パワーPOW(F)を更に少ないビット数に圧縮して表すことができる。
【0190】
請求項6の発明は、符号化パワー(OPMAX(F),QOP(F))と単位処理時間内に転送可能な総ビット数から、出力側(符号化側)と同一の復号化処理によって、各周波数帯域(F)のビット配分指数ALOC(F)を求めることができる。従って、各信号成分に関する量子化ビット数を表す情報が含まれていないビットストリームRを受信しても、ビットストリームRを区切り、量子化信号成分(QS(F,N)を抽出して復号化することができる。
【0191】
ビットストリームRに含まれる符号化パワー(OPMAX(F),QOP(F))と量子化信号QS(F,T)から、信号成分S(F,N)の正規化に用いた時間軸最大値(NMAX(F))に近似した値を算出できるので、時間軸最大値(NMAX(F))が含まれていないビットストリームRであっても、逆正規化することができる。従って、限られたビット数のビットストリームRからより多くの量子化ビット数を配分することができる。
【0194】
請求項7の発明は、「0」ビットの量子化ビット数が割り当てられた周波数帯域(F)の逆量子化信号成分QS(F,N)を、任意の乱数xckをデータとして書き込むことにより生成するので、データが欠落した周波数帯域(F)が存在しなくなり、また、その逆量子化信号成分QS(F,N)に、正規化の際に用いた時間軸最大値(TMAX(F))と近似した値を乗じて逆正規化信号成分TS(F,N)とするので、データが欠落することなく、しかも他の周波数帯域(F)の大きさとバランスのとれた大きさとすることができ、原デジタル音声信号と音質が異ならないデジタル音声信号を再生することができる。
【0195】
【図面の簡単な説明】
【図1】この発明による帯域分割符号化方法でデジタル音声信号を符号化する出力側(符号化側)の構成を示すブロック図である。
【図2】パワーPOW(F)の算出と圧縮符号化過程を示すフローチャートである。
【図3】符号化パワー(OPMAX(F),QOP(F))の復号化過程を示すフローチャートである。
【図4】復号化パワーTPOW(F)の大きさによって、各周波数帯域(F)のビット配分グループを特定する過程を示すフローチャートである。
【図5】ALOC(F)配分指数ALOC(F)で指示される量子化ビット数で正規信号成分NS(F,N)を量子化する過程を示すフローチャートである。
【図6】(a)は、ビット配分指数ALOC(F)=1の、
(b)は、ビット配分指数ALOC(F)=2の、
(c)は、ビット配分指数ALOC(F)=3の、
量子化過程を示す説明図である。
【図7】符号化パワー(OPMAX(F),QOP(F))を符号化したビットストリームRに含める過程を示すフローチャートである。
【図8】量子化信号QS(F,T)成分を符号化したビットストリームRに含める過程を示すフローチャートである。
【図9】出力側(符号化側)から送出される符号化信号のフォーマットを示し、
(a)は、QPBITが「1、1」以外である場合の符号化パワー(OPMAX(F),QOP(F))と帯域データDT(F)を連続させた符号化信号を、
(b)は、帯域データDT(F)とビット配分グループとの関係を、
それぞれ示す説明図である。
【図10】この発明による帯域分割復号化方法で符号化信号を復号化する受信側(復号化側)の構成を示すブロック図である。
【図11】符号化パワー(OPMAX(F),QOP(F))をビットストリームRから抽出し、復号化する過程を示すフローチャートである。
【図12】ビット配分指数ALOC(F)に基いてビットストリームRから各帯域(F)の帯域データDT(F)を抽出し、帯域データDT(F)を構成する量子化信号QS(F,T)成分を逆量子化する過程を示すフローチャートである。
【図13】図12に連続する過程を示すフローチャートである。
【図14】逆量子化信号TNS(F,T)成分を逆正規化する過程を示すフローチャートである。
【図15】副周波数帯域FBで符号化処理を行って符号化した符号化信号のフォーマットを示す説明図である。
【符号の説明】
1 デジタル音声信号
ALOC(F) ビット配分指数
F 周波数帯域
FB 副周波数帯域
M 多重周波数帯域数
N 時間
NMAX(F) 時間軸最大値
NS(F,N) 正規信号成分
OP(F) 量子化パワー指数
OPMAX(F) 最大値
OPMAX(F),QOP(F) 符号化パワー
POW(F) パワー
POWK(F) 逆量子化パワー
QOP(F) 圧縮パワー指数
QS(F,N) 量子化信号成分
R ビットストリーム(符号化信号)
S(F,N) 信号成分
SBIT 総配分ビット数
SFBBIT 総配分ビット数
SPOW(F) 正規パワー
T 時間長
TPOW(F) 復号化パワー
TSPOW(F) 逆量子化パワー
Claims (7)
- デジタル音声信号を、M個の多重周波数帯域(F)に分離しながら、一定時間間隔の順次時間(N)でT個の各周波数帯域(F)の信号成分(S(F,N))を求め、
各帯域(F)のT個の信号成分(S(F,N))から該帯域(F)のビット配分指数(ALOC(F))を求め、
ビット配分指数(ALOC(F))で指示される量子化ビット数で該帯域(F)の各信号成分(S(F,N))を量子化し、
量子化信号成分(QS(F,N))を連続させて伝送路へ送出するデジタル音声信号の符号化方法において、
各帯域(F)内の信号成分(S(F,N))を二乗してT個の総和をパワー(POW(F))とし、
パワー(POW(F))を圧縮符号化して符号化パワー(OPMAX(F),QOP(F))とした後、符号化パワー(OPMAX(F),QOP(F))から再び復号化して復号化パワー(TPOW(F))を求め、
各周波数帯域(F)のビット配分指数(ALOC(F))を復号化パワー(TPOW(F))の大きさによって決定するとともに、
パワー(POW(F))を圧縮符号化した前記符号化パワー(OPMAX(F),QOP(F))を、復号化パワー(TPOW(F))の大きさをもとに決定したビット配分指数(ALOC(F))で指示される量子化ビット数で該帯域(F)の各信号成分(S(F,N))を量子化した量子化信号成分(QS(F,N))に連続させて伝送路へ送出することを特徴とするデジタル音声信号の帯域分割符号化方法。 - デジタル音声信号を、M個の多重周波数帯域(F)に分離しながら、一定時間間隔の順次時間(N)でT個の各周波数帯域(F)の信号成分(S(F,N))を求め、
各周波数帯域(F)内で信号成分(S(F,N))の絶対値の最大値である時間軸最大値(NMAX(F))を求め、
該周波数帯域(F)の各信号成分(S(F,N))を時間軸最大値(NMAX(F))により正規化して正規信号成分(NS(F,N))とするとともに、
各帯域(F)のT個の信号成分(S(F,N))から該帯域(F)のビット配分指数(ALOC(F))を求め、
ビット配分指数(ALOC(F))で指示される量子化ビット数で該帯域(F)の各正規信号成分(NS(F,N))を量子化し、
量子化信号成分(QS(F,N))を連続させて伝送路へ送出するデジタル音声信号の符号化方法において、
各帯域(F)内の信号成分(S(F,N))を二乗してT個の総和をパワー(POW(F))とし、
パワー(POW(F))を圧縮符号化して符号化パワー(OPMAX(F),QOP(F))とした後、符号化パワー(OPMAX(F),QOP(F))から再び復号化して復号化パワー(TPOW(F))を求め、
各周波数帯域(F)のビット配分指数(ALOC(F))を復号化パワー(TPOW(F))の大きさによって決定するとともに、
パワー(POW(F))を圧縮符号化した前記符号化パワー(OPMAX(F),QOP(F))を、復号化パワー(TPOW(F))の大きさをもとに決定したビット配分指数(ALOC(F))で指示される量子化ビット数で該帯域(F)の各正規信号成分(NS(F,N))を量子化した量子化信号成分(QS(F,N))に連続させて伝送路へ送出することを特徴とするデジタル音声信号の帯域分割符号化方法。 - ビット配分指数(ALOC(F))の決定は、
量子化ビット数が互いに異なる少なくとも2以上のビット配分グループを設定し、
単位処理時間内にM*T個の信号成分(S(F,N))を量子化して伝送可能な総ビット数を総配分ビット数(SBIT)として求め、
総配分ビット数(SBIT)を、量子化ビット数の大きいビット配分グループから順に分配して、該ビット配分グループに属する周波数帯域(F)の数を決定し、
総配分ビット数(SBIT)が不足するときには、残りの周波数帯域(F)を量子化ビット数が0のビット配分グループに属するものとして、その数を決定し、
復号化パワー(TPOW(F))が大きい周波数帯域(F)から順に量子化ビット数の大きいビット配分グループを特定し、特定したビット配分グループをビット配分指数(ALOC(F))で表して各周波数帯域(F)のビット配分指数(ALOC(F))を決定することを特徴とする請求項1又は2記載のデジタル音声信号の帯域分割符号化方法。 - M個の多重周波数帯域(F)を複数の副周波数帯域(FB)に分割し、
副周波数帯域(FB)毎に、量子化ビット数が互いに異なる少なくとも2以上のビット配分グループを設定し、
単位処理時間内に副周波数帯域(FB)の全ての信号成分(S(F,N))を量子化して伝送可能な総ビット数を総配分ビット数(SFBBIT)として求め、
総配分ビット数(SFBBIT)を、量子化ビット数の大きいビット配分グループから順に分配して、該ビット配分グループに属する周波数帯域(F)の数を決定し、
総配分ビット数(SFBBIT)が不足するときには、副周波数帯域(FB)の残りの周波数帯域(F)を量子化ビット数が0のビット配分グループに属するものとして、その数を決定し、
復号化パワー(TPOW(F))が大きい周波数帯域(F)から順に量子化ビット数の大きいビット配分グループを特定し、特定したビット配分グループをビット配分指数(ALOC(F))で表して各周波数帯域(F)のビット配分指数(ALOC(F))を決定し、
副周波数帯域(FB)毎に、圧縮パワー指数(QOP(F))と量子化信号成分(QS(F,N))を連続させて伝送路へ送出することを特徴とする請求項1又は2記載のデジタル音声信号の帯域分割符号化方法。 - パワー(POW(F))の圧縮符号化は、
パワー(POW(F))をTで割った正規パワー(SPOW(F))を、2の指数で量子化して量子化パワー指数(OP(F))とし、
量子化パワー指数(OP(F))の最大値(OPMAX(F))と、最大値(OPMAX(F))と各周波数帯域(F)の量子化パワー指数(OP(F))との差分値から求めた圧縮パワー指数(QOP(F))で符号化パワー(OPMAX(F),QOP(F))とし、
復号化パワー(TPOW(F))への復号化は、
符号化パワー(OPMAX(F),QOP(F))の最大値OPMAX(F)から各周波数帯域(F)の圧縮パワー指数(QOP(F))を減じて量子化パワー指数(OP(F))を求め、
量子化パワー指数(OP(F))を2の指数として逆量子化した値を逆量子化パワー(TSPOW(F))とし、
逆量子化パワー(TSPOW(F))にTを乗じて復号化パワー(TPOW(F))としたことを特徴とする請求項1又は2記載のデジタル音声信号の帯域分割符号化方法。 - 請求項2の帯域分割符号化信号をビットストリーム(R)として受信し、
ビットストリーム(R)からパワー(POW(F))を圧縮符号化した符号化パワー(OPMAX(F),QOP(F))を抽出し、
符号化パワー(OPMAX(F),QOP(F))を復号化して復号化パワー(TPOW(F))を求め、
復号化パワー(TPOW(F))の大きさから各周波数帯域(F)のビット配分指数(ALOC(F))を求め、
ビット配分指数(ALOC(F))で指示される量子化ビット数で周波数帯域(F)毎にビットストリーム(R)を区切り、該周波数帯域(F)の量子化信号成分(QS(F,N))を抽出し、逆量子化して逆量子化信号成分(TNS(F,N))とするとともに、
各帯域(F)内の逆量子化信号成分(TNS(F,N))を二乗してT個の総和を逆量子化パワー(POWK(F))とし、
逆量子化信号成分(TNS(F,N))に、逆量子化パワー(POWK(F))に対する復号化パワー(TPOW(F))の比(TPOW(F)/POWK(F))の1/2乗を乗じて逆正規化信号成分(TS(F,N))とし、
再構成サブバンドフィルタにより、逆正規化信号成分(TS(F,N))からデジタル出力音声信号を復号化することを特徴とするデジタル音声信号の帯域分割復号化方法。 - 請求項3の帯域分割符号化信号をビットストリーム(R)として受信し、
ビットストリーム(R)からパワー(POW(F))を圧縮符号化した符号化パワー(OPMAX(F),QOP(F))を抽出し、
符号化パワー(OPMAX(F),QOP(F))を復号化して復号化パワー(TPOW(F))を求め、
復号化パワー(TPOW(F))の大きさから各周波数帯域(F)のビット配分指数(ALOC(F))を求め、
「0」ビット以外の量子化ビット数が割り当てられた周波数帯域(F)については、ビット配分指数(ALOC(F))で指示される量子化ビット数で周波数帯域(F)毎にビットストリーム(R)を区切り、該周波数帯域(F)の量子化信号成分(QS(F,N))を抽出し、逆量子化して逆量子化信号成分(TNS(F,N))とし、
「0」ビットの量子化ビット数が割り当てられた周波数帯域(F)については、任意の乱数(xck)を書き込んでT個の逆量子化信号成分(TNS(F,N))を生成し、
各帯域(F)内の逆量子化信号成分(TNS(F,N))を二乗してT個の総和を逆量子化パワー(POWK(F))とし、
逆量子化信号成分(TNS(F,N))に、復号化パワー(TPOW(F))と逆量子化パワー(POWK(F))の比(TPOW(F)/POWK(F))の1/2乗を乗じて逆正規化信号成分(TS(F,N))とし、
再構成サブバンドフィルタにより、逆正規化信号成分(TS(F,N))からデジタル出力音声信号を復号化することを特徴とするデジタル音声信号の帯域分割復号化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP21593296A JP3998281B2 (ja) | 1996-07-30 | 1996-07-30 | デジタル音声信号の帯域分割符号化方法と復号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP21593296A JP3998281B2 (ja) | 1996-07-30 | 1996-07-30 | デジタル音声信号の帯域分割符号化方法と復号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1049196A JPH1049196A (ja) | 1998-02-20 |
JP3998281B2 true JP3998281B2 (ja) | 2007-10-24 |
Family
ID=16680653
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP21593296A Expired - Fee Related JP3998281B2 (ja) | 1996-07-30 | 1996-07-30 | デジタル音声信号の帯域分割符号化方法と復号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3998281B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE60135487D1 (de) | 2000-12-22 | 2008-10-02 | Sony Corp | Codierer |
JP4548348B2 (ja) * | 2006-01-18 | 2010-09-22 | カシオ計算機株式会社 | 音声符号化装置及び音声符号化方法 |
-
1996
- 1996-07-30 JP JP21593296A patent/JP3998281B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH1049196A (ja) | 1998-02-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9390720B2 (en) | Entropy encoding and decoding using direct level and run-length/level context-adaptive arithmetic coding/decoding modes | |
US7933417B2 (en) | Encoding device and decoding device | |
US7953595B2 (en) | Dual-transform coding of audio signals | |
US7966175B2 (en) | Fast lattice vector quantization | |
US7433824B2 (en) | Entropy coding by adapting coding between level and run-length/level modes | |
JP3203657B2 (ja) | 情報符号化方法及び装置,情報復化方法及び装置,情報伝送方法,並びに情報記録媒体 | |
JP3318931B2 (ja) | 信号符号化装置、信号復号化装置及び信号符号化方法 | |
EP1249837A2 (en) | A method for decompressing a compressed audio signal | |
JPH03121633A (ja) | 可聴音信号符号化方法 | |
JP3998281B2 (ja) | デジタル音声信号の帯域分割符号化方法と復号化方法 | |
JPS63110830A (ja) | 帯域分割符号化復号化装置 | |
JPH0537395A (ja) | 帯域分割符号化方法 | |
JP2820096B2 (ja) | 符号化方式および復号方式 | |
US20090076828A1 (en) | System and method of data encoding | |
JP2971715B2 (ja) | デジタル音声信号の伝送方法とデジタル音声信号の符号化方法 | |
JP2001109497A (ja) | オーディオ信号符号化装置およびオーディオ信号符号化方法 | |
JP3389849B2 (ja) | 量子化装置 | |
JPH04324718A (ja) | デイジタル・ステレオ音声圧縮方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20051017 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051206 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070123 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070202 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20070315 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070619 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070620 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070731 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070807 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100817 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |