JPH07261799A - 直交変換符号化装置及び方法 - Google Patents
直交変換符号化装置及び方法Info
- Publication number
- JPH07261799A JPH07261799A JP6049517A JP4951794A JPH07261799A JP H07261799 A JPH07261799 A JP H07261799A JP 6049517 A JP6049517 A JP 6049517A JP 4951794 A JP4951794 A JP 4951794A JP H07261799 A JPH07261799 A JP H07261799A
- Authority
- JP
- Japan
- Prior art keywords
- data
- orthogonal transform
- outputting
- band
- quantized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Signal Processing For Digital Recording And Reproducing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】
【目的】 ハードウェア及びアルゴリズムを簡略化して
高圧縮率符号化する。 【構成】 帯域分割手段はディジタル音声データを複数
の周波数帯域に分割し帯域分割データとし、分析手段は
各帯域分割データを所定の変換ブロック長で直交変換し
直交変換係数を算出、グループ化して直交変換係数群と
する。フーリエ変換手段はディジタル音声データをFF
Tによりパワースペクトルデータとし、ビット割当情報
生成手段はこのパワースペクトルデータによるマスキン
グ量に基づき、直交変換係数群毎に複数の変換ブロック
にわたり同一のビット数で量子化すべく量子化ビット数
制御データ及びビット割当情報データを出力する。量子
化手段は量子化ビット数制御データに基づき直交変換係
数を量子化データに変換し、フォーマッティング手段は
量子化データ及びビット割当情報データを多重化し、符
号化データとして出力する。
高圧縮率符号化する。 【構成】 帯域分割手段はディジタル音声データを複数
の周波数帯域に分割し帯域分割データとし、分析手段は
各帯域分割データを所定の変換ブロック長で直交変換し
直交変換係数を算出、グループ化して直交変換係数群と
する。フーリエ変換手段はディジタル音声データをFF
Tによりパワースペクトルデータとし、ビット割当情報
生成手段はこのパワースペクトルデータによるマスキン
グ量に基づき、直交変換係数群毎に複数の変換ブロック
にわたり同一のビット数で量子化すべく量子化ビット数
制御データ及びビット割当情報データを出力する。量子
化手段は量子化ビット数制御データに基づき直交変換係
数を量子化データに変換し、フォーマッティング手段は
量子化データ及びビット割当情報データを多重化し、符
号化データとして出力する。
Description
【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、直交変換符号化装置及
びその方法に係わり、特にディジタル音声データを高圧
縮率で符号化する直交変換符号化装置及びその方法に関
する。
びその方法に係わり、特にディジタル音声データを高圧
縮率で符号化する直交変換符号化装置及びその方法に関
する。
【0002】
【従来の技術】限られた記録容量や伝送帯域内でCD
(Compact Disk)、DAT(Digital Audio Tape)相当
の高音質のディジタルオーディオを記録、伝送するため
には、音質を損なわずにデータ量を圧縮する高能率符号
化が不可欠であり、様々な符号化方法の開発や標準化が
検討されている。
(Compact Disk)、DAT(Digital Audio Tape)相当
の高音質のディジタルオーディオを記録、伝送するため
には、音質を損なわずにデータ量を圧縮する高能率符号
化が不可欠であり、様々な符号化方法の開発や標準化が
検討されている。
【0003】一方、機器の小型化の流れの中で、将来的
には民生用の半導体録音機の出現が予想される。この場
合において、仮に256Mbitsのメモリに1チャネル1
時間の記録を行うものとすると、64kbps /chにデー
タを圧縮する必要がある。より具体的には、原音をDA
T相当の量子化ビット数16ビット、サンプリング周波
数48kHz(=768kbps /ch)とした場合、1/
12にデータを圧縮する必要がある。
には民生用の半導体録音機の出現が予想される。この場
合において、仮に256Mbitsのメモリに1チャネル1
時間の記録を行うものとすると、64kbps /chにデー
タを圧縮する必要がある。より具体的には、原音をDA
T相当の量子化ビット数16ビット、サンプリング周波
数48kHz(=768kbps /ch)とした場合、1/
12にデータを圧縮する必要がある。
【0004】ところで、現在実用化されているMD(Mi
ni Disk )の符号化方法であるATRAC(Adaptive T
ransform Acoustic Coding)においてはCDのデータ
(705.6kbps /ch)を1/4.83の146kbp
s /chに圧縮している。また、DCC(Digital Compac
t Cassette)の符号化方法であるPASC(PrecisionA
daptive Subband Coding )においては、DATのデー
タ(768kbps /ch)を1/4の192bps /chに圧
縮している。
ni Disk )の符号化方法であるATRAC(Adaptive T
ransform Acoustic Coding)においてはCDのデータ
(705.6kbps /ch)を1/4.83の146kbp
s /chに圧縮している。また、DCC(Digital Compac
t Cassette)の符号化方法であるPASC(PrecisionA
daptive Subband Coding )においては、DATのデー
タ(768kbps /ch)を1/4の192bps /chに圧
縮している。
【0005】このように上記従来のMDの符号化方法A
TRAC、DCCの符号化方法PASC等の符号化方法
では半導体録音機を実現するためにはまだ圧縮率が不足
しており、より高圧縮率の符号化装置及び符号化方法が
望まれている。
TRAC、DCCの符号化方法PASC等の符号化方法
では半導体録音機を実現するためにはまだ圧縮率が不足
しており、より高圧縮率の符号化装置及び符号化方法が
望まれている。
【0006】高圧縮率符号化とは、信号に含まれる冗長
な相関成分を取り除き、無相関化することによりデータ
圧縮を行うことである。しかしながら、単に冗長な成分
を取り除くだけでは、圧縮率に限界があり、高音質なオ
ーディオ信号を100kbps /ch程度まで低ビットレー
ト化することは困難である。
な相関成分を取り除き、無相関化することによりデータ
圧縮を行うことである。しかしながら、単に冗長な成分
を取り除くだけでは、圧縮率に限界があり、高音質なオ
ーディオ信号を100kbps /ch程度まで低ビットレー
ト化することは困難である。
【0007】これを解決すべく、上述した最近の符号化
方法においては、冗長な成分を取り除くとともに、人間
の聴覚特性を利用して人間が知覚できない再生時に不要
な成分を取り除くことにより圧縮率の向上を図ってい
る。
方法においては、冗長な成分を取り除くとともに、人間
の聴覚特性を利用して人間が知覚できない再生時に不要
な成分を取り除くことにより圧縮率の向上を図ってい
る。
【0008】ここで人間の聴覚特性とは、マスキング特
性、臨界帯域幅、最小可聴しきい値、時間分解能−周波
数分解能特性等が挙げられる。図5に人間の聴覚特性を
考慮した従来の直交変換符号化装置の概要構成ブロック
図を示す。
性、臨界帯域幅、最小可聴しきい値、時間分解能−周波
数分解能特性等が挙げられる。図5に人間の聴覚特性を
考慮した従来の直交変換符号化装置の概要構成ブロック
図を示す。
【0009】直交変換符号化装置50は、入力されたデ
ィジタル音声データDPCM を分析し、第1サブバンドデ
ータD1 〜第kサブバンドデータDk に分割するQMF
(Quadrature Mirror Filter)と、入力されたサブバン
ドデータの直交変換をそれぞれ行い対応する直交変換係
数DX1’〜DXk’を出力する第1〜第k直交変換部52
-1〜52-kと、第1〜第kサブバンドデータD1 〜Dk
に基づいて、各直交変換部52-1〜52-kに対応するブ
ロック長制御信号DCBS1〜DCBSkを出力するとともに、
ブロック長情報データDBSを出力するブロック長決定部
53と、直交変換係数DX1’〜DXk’及びブロック長情
報データDBSに基づいてマスキング計算を行い、それに
基づいて直交変換係数の量子化ビット数を決定し、ビッ
ト割当情報データDB ’を出力するマスキング計算ビッ
ト割当部54と、ビット割当情報データDB ’に基づい
て、直交変換係数DX1’〜DXk’を量子化して量子化デ
ータDQXとして出力する量子化器55と、ビット割当情
報データDB ’、量子化データDQX’及びブロック長情
報データDBSを多重化して、符号化データDCODE’とし
て出力するフォーマッティング部56と、を備えて構成
されている。
ィジタル音声データDPCM を分析し、第1サブバンドデ
ータD1 〜第kサブバンドデータDk に分割するQMF
(Quadrature Mirror Filter)と、入力されたサブバン
ドデータの直交変換をそれぞれ行い対応する直交変換係
数DX1’〜DXk’を出力する第1〜第k直交変換部52
-1〜52-kと、第1〜第kサブバンドデータD1 〜Dk
に基づいて、各直交変換部52-1〜52-kに対応するブ
ロック長制御信号DCBS1〜DCBSkを出力するとともに、
ブロック長情報データDBSを出力するブロック長決定部
53と、直交変換係数DX1’〜DXk’及びブロック長情
報データDBSに基づいてマスキング計算を行い、それに
基づいて直交変換係数の量子化ビット数を決定し、ビッ
ト割当情報データDB ’を出力するマスキング計算ビッ
ト割当部54と、ビット割当情報データDB ’に基づい
て、直交変換係数DX1’〜DXk’を量子化して量子化デ
ータDQXとして出力する量子化器55と、ビット割当情
報データDB ’、量子化データDQX’及びブロック長情
報データDBSを多重化して、符号化データDCODE’とし
て出力するフォーマッティング部56と、を備えて構成
されている。
【0010】次に概要動作を説明する。人間の聴覚系
は、帯域フィルタが並んだフィルタバンクと考えられ、
その帯域幅は臨界帯域幅と呼ばれる。この臨界帯域幅は
低域では狭く、高域ほど広くなる。換言すれば、低域ほ
ど周波数分解能が高く、高域ほど周波数分解能が低い。
は、帯域フィルタが並んだフィルタバンクと考えられ、
その帯域幅は臨界帯域幅と呼ばれる。この臨界帯域幅は
低域では狭く、高域ほど広くなる。換言すれば、低域ほ
ど周波数分解能が高く、高域ほど周波数分解能が低い。
【0011】一方、時間分解能は逆に低域ほど低く、高
域ほど高い。直交変換の周波数分解能・時間分解能は変
換ブロック長により決まり、ブロック長が大きいほど周
波数分解能が高く、時間分解能が低い。したがって聴覚
特性に合わせた信号分析を行うためには、入力ディジタ
ル音声データDPCM を複数の周波数帯域に分割し、聴覚
の周波数−時間分解能特性に合わせて低い周波数帯域で
は大きいブロック長で、高い周波数帯域では小さいブロ
ック長で直交変換を行う必要がある。
域ほど高い。直交変換の周波数分解能・時間分解能は変
換ブロック長により決まり、ブロック長が大きいほど周
波数分解能が高く、時間分解能が低い。したがって聴覚
特性に合わせた信号分析を行うためには、入力ディジタ
ル音声データDPCM を複数の周波数帯域に分割し、聴覚
の周波数−時間分解能特性に合わせて低い周波数帯域で
は大きいブロック長で、高い周波数帯域では小さいブロ
ック長で直交変換を行う必要がある。
【0012】ところで直交変換は、変換ブロック長Nk
を大きく取ると符号化データDCODE’に占めるビット割
当情報の割合を小さくできるというメリットがあるが、
急激な立ち上がり部をもつ波形の直前でプリエコーが知
覚されやすくなるというデメリットがある。したがっ
て、ディジタル音声データが定常的な部分ではブロック
長を大きくとり、急激な立上り部を含む部分ではブロッ
ク長を小さくする必要がある。
を大きく取ると符号化データDCODE’に占めるビット割
当情報の割合を小さくできるというメリットがあるが、
急激な立ち上がり部をもつ波形の直前でプリエコーが知
覚されやすくなるというデメリットがある。したがっ
て、ディジタル音声データが定常的な部分ではブロック
長を大きくとり、急激な立上り部を含む部分ではブロッ
ク長を小さくする必要がある。
【0013】そこでQMF51は、入力されたディジタ
ル音声データDPCM を第1サブバンドデータD1 、…、
第kサブバンドデータDk に分割して、それぞれ対応す
る直交変換部52-1〜52-k及びブロック長決定部53
に出力する。
ル音声データDPCM を第1サブバンドデータD1 、…、
第kサブバンドデータDk に分割して、それぞれ対応す
る直交変換部52-1〜52-k及びブロック長決定部53
に出力する。
【0014】ブロック長決定部53は、入力された第1
〜第kサブバンドデータD1 〜Dkを常時チェックし、
急激な立ち上がり部をもつサブバンドデータに対しては
適応的に変換ブロック長を短くすべく、ブロック長制御
データDCBS1〜DCBSkを対応する直交変換部に出力す
る。
〜第kサブバンドデータD1 〜Dkを常時チェックし、
急激な立ち上がり部をもつサブバンドデータに対しては
適応的に変換ブロック長を短くすべく、ブロック長制御
データDCBS1〜DCBSkを対応する直交変換部に出力す
る。
【0015】これにより第1〜第k直交変換部52-1〜
52-kは、入力されたサブバンドデータをブロック長制
御データDCBS1〜DCBSkに基づいて直交変換し、直交変
換係数DX1’〜DXk’として出力する。
52-kは、入力されたサブバンドデータをブロック長制
御データDCBS1〜DCBSkに基づいて直交変換し、直交変
換係数DX1’〜DXk’として出力する。
【0016】つづいてマスキング計算ビット割当部54
は、ブロック長情報及び直交変換係数DX1’〜DXk’に
基づいてマスキング計算を行い、それに基づいて直交変
換係数の量子化ビット数を決定し、ビット割当情報デー
タDB ’を量子化器55及びフォーマッティング部56
に出力する。この場合において、マスキング計算は、各
サブバンド毎の直交変換の結果として得られる直交変換
係数(周波数スペクトル)DX1’〜DXk’を直接用いて
行っていた。
は、ブロック長情報及び直交変換係数DX1’〜DXk’に
基づいてマスキング計算を行い、それに基づいて直交変
換係数の量子化ビット数を決定し、ビット割当情報デー
タDB ’を量子化器55及びフォーマッティング部56
に出力する。この場合において、マスキング計算は、各
サブバンド毎の直交変換の結果として得られる直交変換
係数(周波数スペクトル)DX1’〜DXk’を直接用いて
行っていた。
【0017】これらの結果、量子化器55は、ビット割
当情報データDB ’に基づいて直交変換データDX1’〜
DXk’を量子化して量子化データDQX’として出力し、
フォーマッティング部56はビット割当情報データ
DB ’、量子化データDQX’及びブロックサイズ情報デ
ータDBSを多重化して、符号化データDCODE’として出
力していた。
当情報データDB ’に基づいて直交変換データDX1’〜
DXk’を量子化して量子化データDQX’として出力し、
フォーマッティング部56はビット割当情報データ
DB ’、量子化データDQX’及びブロックサイズ情報デ
ータDBSを多重化して、符号化データDCODE’として出
力していた。
【0018】以上の説明のように、上記従来の直交変換
符号化装置においては、直交変換する際の変換ブロック
長を、ディジタル音声データの性質に応じて適応的に切
換える必要があった。また直交変換係数の量子化ビット
割当を決めるために必要なマスキング計算は、直交変換
係数を直接用いて行っていた。
符号化装置においては、直交変換する際の変換ブロック
長を、ディジタル音声データの性質に応じて適応的に切
換える必要があった。また直交変換係数の量子化ビット
割当を決めるために必要なマスキング計算は、直交変換
係数を直接用いて行っていた。
【0019】
【発明が解決しようとする課題】しかしながら、上記従
来の直交変換符号化装置においては、変換ブロック長を
短く設定すればプリエコーの問題は回避できるが、以下
の様な問題点が生じていた。
来の直交変換符号化装置においては、変換ブロック長を
短く設定すればプリエコーの問題は回避できるが、以下
の様な問題点が生じていた。
【0020】a) サイド情報としてのビット割当情報
は、各変換ブロック毎に付加されるので、変換ブロック
長が短い場合には、符号化データ全体に対するビット割
当情報の割合が増加し、特に低ビットレートでこの方法
を用いた場合には非常に不利になるという問題点があっ
た。
は、各変換ブロック毎に付加されるので、変換ブロック
長が短い場合には、符号化データ全体に対するビット割
当情報の割合が増加し、特に低ビットレートでこの方法
を用いた場合には非常に不利になるという問題点があっ
た。
【0021】b) 変換ブロック長を短くするというこ
とは、直交変換係数(周波数スペクトル)の周波数分解
能が低下し、この直交変換係数を直接用いてマスキング
計算を行っていることにより、その計算精度が低下して
しまうという問題点があった。
とは、直交変換係数(周波数スペクトル)の周波数分解
能が低下し、この直交変換係数を直接用いてマスキング
計算を行っていることにより、その計算精度が低下して
しまうという問題点があった。
【0022】また、各サブバンド毎に適応ブロック長切
換を行うことにより、以下の様な問題点が生じる。 c) 各サブバンド毎のブロック長を決定するためのハ
ードウェア構成が非常に複雑になるという問題点があっ
た。
換を行うことにより、以下の様な問題点が生じる。 c) 各サブバンド毎のブロック長を決定するためのハ
ードウェア構成が非常に複雑になるという問題点があっ
た。
【0023】d) マスキング量計算のための周波数ス
ペクトルの構造が多数あり、アルゴリズム、ハードウェ
アが極めて複雑になるという問題点があった。より具体
的には、MDの場合、3つのサブバンドに分割してお
り、各サブバンド毎にブロック長が長ブロック長及び短
ブロック長の2種類があり、それらを切り換えて用いて
いる。
ペクトルの構造が多数あり、アルゴリズム、ハードウェ
アが極めて複雑になるという問題点があった。より具体
的には、MDの場合、3つのサブバンドに分割してお
り、各サブバンド毎にブロック長が長ブロック長及び短
ブロック長の2種類があり、それらを切り換えて用いて
いる。
【0024】この結果、変換ブロック長の組合わせが8
通り(=2×2×2)できることとなり、その各々の場
合で異なる構造の周波数スペクトルとなるので、マスキ
ング計算のアルゴリズムも8通り必要となり、これにと
もなってハードウェアも複雑化することとなる。
通り(=2×2×2)できることとなり、その各々の場
合で異なる構造の周波数スペクトルとなるので、マスキ
ング計算のアルゴリズムも8通り必要となり、これにと
もなってハードウェアも複雑化することとなる。
【0025】そこで、本発明の目的は、ハードウェア及
びアルゴリズムを簡略化でき、かつビット割当情報を減
らし、マスキングの計算精度を向上させることにより、
より高圧縮率符号化が可能な直交変換符号化装置及び方
法を提供することにある。
びアルゴリズムを簡略化でき、かつビット割当情報を減
らし、マスキングの計算精度を向上させることにより、
より高圧縮率符号化が可能な直交変換符号化装置及び方
法を提供することにある。
【0026】
【課題を解決するための手段】上記課題を解決するた
め、請求項1記載の発明は、ディジタル音声データを符
号化する直交変換符号化装置において、前記ディジタル
音声データを複数の周波数帯域に分割し帯域分割データ
として出力する帯域分割手段と、前記周波数帯域毎に予
め設定した所定の変換ブロック長で各前記帯域分割デー
タを直交変換して各変換ブロック毎の直交変換係数を算
出し、得られた直交変換係数をグループ化して直交変換
係数群として出力する分析手段と、前記ディジタル音声
データを高速フーリエ変換し、パワースペクトルデータ
を出力するフーリエ変換手段と、前記パワースペクトル
データに基づいてマスキング量を計算し、前記マスキン
グ量に基づいて同一の前記直交変換係数群を構成する前
記直交変換係数を複数の変換ブロックにわたって同一の
ビット数で量子化するためのビット数制御データを出力
するとともに、各前記直交変換係数群毎のビット割当情
報データを出力するビット割当情報生成手段と、前記ビ
ット数制御データに基づいて前記直交変換係数を量子化
して量子化データとして出力する量子化手段と、前記量
子化データ及び前記ビット割当情報データを多重化し、
符号化データとして出力するフォーマッティング手段
と、を備える。
め、請求項1記載の発明は、ディジタル音声データを符
号化する直交変換符号化装置において、前記ディジタル
音声データを複数の周波数帯域に分割し帯域分割データ
として出力する帯域分割手段と、前記周波数帯域毎に予
め設定した所定の変換ブロック長で各前記帯域分割デー
タを直交変換して各変換ブロック毎の直交変換係数を算
出し、得られた直交変換係数をグループ化して直交変換
係数群として出力する分析手段と、前記ディジタル音声
データを高速フーリエ変換し、パワースペクトルデータ
を出力するフーリエ変換手段と、前記パワースペクトル
データに基づいてマスキング量を計算し、前記マスキン
グ量に基づいて同一の前記直交変換係数群を構成する前
記直交変換係数を複数の変換ブロックにわたって同一の
ビット数で量子化するためのビット数制御データを出力
するとともに、各前記直交変換係数群毎のビット割当情
報データを出力するビット割当情報生成手段と、前記ビ
ット数制御データに基づいて前記直交変換係数を量子化
して量子化データとして出力する量子化手段と、前記量
子化データ及び前記ビット割当情報データを多重化し、
符号化データとして出力するフォーマッティング手段
と、を備える。
【0027】また、請求項2記載の発明は、ディジタル
音声データを符号化する直交変換符号化方法において、
前記ディジタル音声データを複数の周波数帯域に分割し
帯域分割データとして出力する帯域分割工程と、前記周
波数帯域毎に予め設定した所定の変換ブロック長で各前
記帯域分割データを直交変換して各変換ブロック毎の直
交変換係数を算出し、得られた直交変換係数をグループ
化して直交変換係数群として出力する分析工程と、前記
ディジタル音声データを高速フーリエ変換し、パワース
ペクトルデータを出力するフーリエ変換工程と、前記パ
ワースペクトルデータに基づいてマスキング量を計算
し、前記マスキング量に基づいて同一の前記直交変換係
数群を構成する前記直交変換係数を複数の変換ブロック
にわたって同一のビット数で量子化するためのビット数
制御データを出力するとともに、各前記直交変換係数群
毎のビット割当情報データを出力するビット割当情報生
成工程と、前記ビット数制御データに基づいて前記直交
変換係数を量子化して量子化データとして出力する量子
化工程と、前記量子化データ及び前記ビット割当情報デ
ータを多重化し、符号化データとして出力するフォーマ
ッティング工程と、を備える。
音声データを符号化する直交変換符号化方法において、
前記ディジタル音声データを複数の周波数帯域に分割し
帯域分割データとして出力する帯域分割工程と、前記周
波数帯域毎に予め設定した所定の変換ブロック長で各前
記帯域分割データを直交変換して各変換ブロック毎の直
交変換係数を算出し、得られた直交変換係数をグループ
化して直交変換係数群として出力する分析工程と、前記
ディジタル音声データを高速フーリエ変換し、パワース
ペクトルデータを出力するフーリエ変換工程と、前記パ
ワースペクトルデータに基づいてマスキング量を計算
し、前記マスキング量に基づいて同一の前記直交変換係
数群を構成する前記直交変換係数を複数の変換ブロック
にわたって同一のビット数で量子化するためのビット数
制御データを出力するとともに、各前記直交変換係数群
毎のビット割当情報データを出力するビット割当情報生
成工程と、前記ビット数制御データに基づいて前記直交
変換係数を量子化して量子化データとして出力する量子
化工程と、前記量子化データ及び前記ビット割当情報デ
ータを多重化し、符号化データとして出力するフォーマ
ッティング工程と、を備える。
【0028】
【作用】請求項1記載の発明によれば、帯域分割手段
は、ディジタル音声データを複数の周波数帯域に分割し
帯域分割データとして分析手段に出力する。
は、ディジタル音声データを複数の周波数帯域に分割し
帯域分割データとして分析手段に出力する。
【0029】分析手段は、前記周波数帯域毎に予め設定
した所定の変換ブロック長で各帯域分割データを直交変
換して各変換ブロック毎の直交変換係数を算出し、得ら
れた直交変換係数をグループ化して直交変換係数群とし
て量子化手段に出力する。
した所定の変換ブロック長で各帯域分割データを直交変
換して各変換ブロック毎の直交変換係数を算出し、得ら
れた直交変換係数をグループ化して直交変換係数群とし
て量子化手段に出力する。
【0030】これと並行して、フーリエ変換手段は、デ
ィジタル音声データを高速フーリエ変換し、パワースペ
クトルデータをビット割当情報生成手段に出力する。ビ
ット割当情報生成手段は、パワースペクトルデータに基
づいてマスキング量を計算し、このマスキング量に基づ
いて同一の直交変換係数群を構成する直交変換係数を複
数の変換ブロックにわたって同一のビット数で量子化す
るためのビット数制御データを量子化手段に出力すると
ともに、各直交変換係数群毎のビット割当情報データを
フォーマッティング手段に出力する。
ィジタル音声データを高速フーリエ変換し、パワースペ
クトルデータをビット割当情報生成手段に出力する。ビ
ット割当情報生成手段は、パワースペクトルデータに基
づいてマスキング量を計算し、このマスキング量に基づ
いて同一の直交変換係数群を構成する直交変換係数を複
数の変換ブロックにわたって同一のビット数で量子化す
るためのビット数制御データを量子化手段に出力すると
ともに、各直交変換係数群毎のビット割当情報データを
フォーマッティング手段に出力する。
【0031】量子化手段は、ビット数制御データに基づ
いて直交変換係数を量子化して量子化データとしてフォ
ーマッティング手段に出力する。フォーマッティング手
段は、量子化データ及びビット割当情報データを多重化
し、符号化データとして出力する。
いて直交変換係数を量子化して量子化データとしてフォ
ーマッティング手段に出力する。フォーマッティング手
段は、量子化データ及びビット割当情報データを多重化
し、符号化データとして出力する。
【0032】また、請求項2記載の発明によれば、帯域
分割工程は、ディジタル音声データを複数の周波数帯域
に分割し帯域分割データとして分析工程に出力する。分
析工程は、周波数帯域毎に予め設定した所定の変換ブロ
ック長で各帯域分割データを直交変換して各変換ブロッ
ク毎の直交変換係数を算出し、得られた直交変換係数を
グループ化して直交変換係数群として量子化工程に出力
する。
分割工程は、ディジタル音声データを複数の周波数帯域
に分割し帯域分割データとして分析工程に出力する。分
析工程は、周波数帯域毎に予め設定した所定の変換ブロ
ック長で各帯域分割データを直交変換して各変換ブロッ
ク毎の直交変換係数を算出し、得られた直交変換係数を
グループ化して直交変換係数群として量子化工程に出力
する。
【0033】これと並行して、フーリエ変換手段は、デ
ィジタル音声データを高速フーリエ変換し、パワースペ
クトルデータをビット割当情報生成工程に出力する。ビ
ット割当情報生成工程は、パワースペクトルデータに基
づいてマスキング量を計算し、このマスキング量に基づ
いて同一の直交変換係数群を構成する直交変換係数を複
数の変換ブロックにわたって同一のビット数で量子化す
るためのビット数制御データを量子化工程に出力すると
ともに、各直交変換係数群毎のビット割当情報データを
フォーマッティング工程に出力する。
ィジタル音声データを高速フーリエ変換し、パワースペ
クトルデータをビット割当情報生成工程に出力する。ビ
ット割当情報生成工程は、パワースペクトルデータに基
づいてマスキング量を計算し、このマスキング量に基づ
いて同一の直交変換係数群を構成する直交変換係数を複
数の変換ブロックにわたって同一のビット数で量子化す
るためのビット数制御データを量子化工程に出力すると
ともに、各直交変換係数群毎のビット割当情報データを
フォーマッティング工程に出力する。
【0034】量子化工程は、ビット数制御データに基づ
いて直交変換係数を量子化して量子化データとしてフォ
ーマッティング工程に出力する。フォーマッティング工
程は、量子化データ及びビット割当情報データを多重化
し、符号化データとして出力する。
いて直交変換係数を量子化して量子化データとしてフォ
ーマッティング工程に出力する。フォーマッティング工
程は、量子化データ及びビット割当情報データを多重化
し、符号化データとして出力する。
【0035】したがって、いずれの発明においても、直
交変換係数を量子化する際には、同一の直交変換係数群
を構成する直交変換係数は複数の変換ブロックにわたっ
て同一の量子化ビット数となり、ビット割当情報データ
の量を少なくすることができ、符号化データのディジタ
ル音声データに対する圧縮率を向上させることができ
る。
交変換係数を量子化する際には、同一の直交変換係数群
を構成する直交変換係数は複数の変換ブロックにわたっ
て同一の量子化ビット数となり、ビット割当情報データ
の量を少なくすることができ、符号化データのディジタ
ル音声データに対する圧縮率を向上させることができ
る。
【0036】さらに同一の直交変換係数群を構成する直
交変換係数は複数の変換ブロックにわたって同一のビッ
ト数で量子化するので、短い固定ブロック長の直交変換
を用いても、ビット割当情報データ量は増加することが
ない。
交変換係数は複数の変換ブロックにわたって同一のビッ
ト数で量子化するので、短い固定ブロック長の直交変換
を用いても、ビット割当情報データ量は増加することが
ない。
【0037】したがって、短い固定ブロック長を採用す
ることができ、複雑な制御を必要とする適応ブロック長
切換等の手法を用いることなく、プリエコーを抑制する
ことができる。
ることができ、複雑な制御を必要とする適応ブロック長
切換等の手法を用いることなく、プリエコーを抑制する
ことができる。
【0038】
【実施例】次に図面を参照して本発明の好適な実施例を
説明する。図1に実施例の直交変換符号化装置の基本構
成ブロック図を示す。
説明する。図1に実施例の直交変換符号化装置の基本構
成ブロック図を示す。
【0039】直交変換符号化装置1は、後述するサブバ
ンド分割や直交変換により入力されたディジタル音声デ
ータDPCM の相関成分を減少させ、直交変換係数DX を
出力する分析部2と、聴覚心理モデルを用い、ディジタ
ル音声データのパワースペクトルからマスキングオーデ
ィオグラム(マスキング量の周波数特性)を計算し量子
化ビット数を決定して量子化ビット数制御データDQCを
出力するとともに、ビット割当情報データDB を出力す
るマスキング計算ビット割当部3と、量子化ビット数制
御データDQCに基づいて直交変換係数DX を量子化して
量子化データD QXを出力する量子化部4と、量子化デー
タDQX及びビット割当情報データDB を多重化し、符号
化データDCODEとして出力するフォーマッティング部5
と、を備えて構成されている。
ンド分割や直交変換により入力されたディジタル音声デ
ータDPCM の相関成分を減少させ、直交変換係数DX を
出力する分析部2と、聴覚心理モデルを用い、ディジタ
ル音声データのパワースペクトルからマスキングオーデ
ィオグラム(マスキング量の周波数特性)を計算し量子
化ビット数を決定して量子化ビット数制御データDQCを
出力するとともに、ビット割当情報データDB を出力す
るマスキング計算ビット割当部3と、量子化ビット数制
御データDQCに基づいて直交変換係数DX を量子化して
量子化データD QXを出力する量子化部4と、量子化デー
タDQX及びビット割当情報データDB を多重化し、符号
化データDCODEとして出力するフォーマッティング部5
と、を備えて構成されている。
【0040】次に概要動作を説明する。分析部2は、入
力されたディジタル音声データDPCM を複数のサブバン
ド(周波数帯域)に分割し、各サブバンド毎に同一のブ
ロック長を設定して直交変換を行い、直交変換係数DX
として出力する。この際、直交変換係数DX は複数のグ
ループに分けられる。この場合において直交変換は、変
換ブロックが50[%]オーバーラップするMDCT
(Modified Discrete Cosine Transform)を用いて行っ
ている。
力されたディジタル音声データDPCM を複数のサブバン
ド(周波数帯域)に分割し、各サブバンド毎に同一のブ
ロック長を設定して直交変換を行い、直交変換係数DX
として出力する。この際、直交変換係数DX は複数のグ
ループに分けられる。この場合において直交変換は、変
換ブロックが50[%]オーバーラップするMDCT
(Modified Discrete Cosine Transform)を用いて行っ
ている。
【0041】これと並行してマスキング計算・ビット割
当部3は、ディジタル音声データD PCM のパワースペク
トルからマスキングオーディオグラムを計算し、量子化
ビット数を決定して量子化ビット数制御データDQCを量
子化部4に出力するとともに、ビット割当情報データD
B をフォーマッティング部5に出力する。
当部3は、ディジタル音声データD PCM のパワースペク
トルからマスキングオーディオグラムを計算し、量子化
ビット数を決定して量子化ビット数制御データDQCを量
子化部4に出力するとともに、ビット割当情報データD
B をフォーマッティング部5に出力する。
【0042】量子化部4は、量子化ビット数制御データ
DQCに基づいて直交変換係数DX を量子化して量子化デ
ータDQXをフォーマッティング部5に出力する。これら
により、フォーマッティング部5は、量子化データDQX
及びビット割当情報データDB を多重化し、符号化デー
タDCODEとして出力する。
DQCに基づいて直交変換係数DX を量子化して量子化デ
ータDQXをフォーマッティング部5に出力する。これら
により、フォーマッティング部5は、量子化データDQX
及びビット割当情報データDB を多重化し、符号化デー
タDCODEとして出力する。
【0043】上記処理においては、各サブバンド毎に同
一のブロック長を設定して直交変換を行い、各グループ
毎に複数の変換ブロックにわたって同一のビット数で量
子化を行っているので、ビット割当情報データ量が少な
くてすむ。換言すれば、符号化データDCODEに含まれる
ビット割当情報データDB の量子化データDQXに対する
割合は小さなものとなり、高圧縮率の符号化を達成でき
る。
一のブロック長を設定して直交変換を行い、各グループ
毎に複数の変換ブロックにわたって同一のビット数で量
子化を行っているので、ビット割当情報データ量が少な
くてすむ。換言すれば、符号化データDCODEに含まれる
ビット割当情報データDB の量子化データDQXに対する
割合は小さなものとなり、高圧縮率の符号化を達成でき
る。
【0044】次に図2により具体的な直交変換符号化装
置の概要構成ブロック図を示す。直交変換符号化装置1
0は、入力されたディジタル音声データDPCM (PCM
ディジタル音声データ)を分析し、第1サブバンドデー
タDSB1 〜第kサブバンドデータDSBk に分割するQM
F(Quadrature Mirror Filter)11と、入力されたサ
ブバンドデータの直交変換をそれぞれ行い対応する直交
変換係数DX1〜D Xkを出力する第1〜第k直交変換部1
2-1〜12-kと、ディジタル音声データD PCM を高速フ
ーリエ変換し、パワースペクトル推定を行い、パワース
ペクトル推定データDPSを出力する高速フーリエ変換部
(FFT)13と、パワースペクトル推定データDPSに
基づいて、マスキングオーディオグラム(マスキング量
の周波数特性)を計算して量子化ビット数を決定して量
子化ビット数制御データDQCを出力するとともに、ビッ
ト割当情報データDB を出力するマスキング計算ビット
割当部14と、量子化ビット数制御データDQCに基づい
て直交変換係数DX1〜DXkを量子化して量子化データD
QXとして出力する量子化器15と、量子化データDQX及
びビット割当情報データDB を多重化し、符号化データ
DCODEとして出力するフォーマッティング部16と、を
備えて構成されている。
置の概要構成ブロック図を示す。直交変換符号化装置1
0は、入力されたディジタル音声データDPCM (PCM
ディジタル音声データ)を分析し、第1サブバンドデー
タDSB1 〜第kサブバンドデータDSBk に分割するQM
F(Quadrature Mirror Filter)11と、入力されたサ
ブバンドデータの直交変換をそれぞれ行い対応する直交
変換係数DX1〜D Xkを出力する第1〜第k直交変換部1
2-1〜12-kと、ディジタル音声データD PCM を高速フ
ーリエ変換し、パワースペクトル推定を行い、パワース
ペクトル推定データDPSを出力する高速フーリエ変換部
(FFT)13と、パワースペクトル推定データDPSに
基づいて、マスキングオーディオグラム(マスキング量
の周波数特性)を計算して量子化ビット数を決定して量
子化ビット数制御データDQCを出力するとともに、ビッ
ト割当情報データDB を出力するマスキング計算ビット
割当部14と、量子化ビット数制御データDQCに基づい
て直交変換係数DX1〜DXkを量子化して量子化データD
QXとして出力する量子化器15と、量子化データDQX及
びビット割当情報データDB を多重化し、符号化データ
DCODEとして出力するフォーマッティング部16と、を
備えて構成されている。
【0045】ここで直交変換符号化装置10の詳細な動
作説明を行う。 1)QMFの動作 人間の聴覚は、上述したように、低域で周波数分解能が
高く、高域で時間分解能が高いという特性を持ってい
る。
作説明を行う。 1)QMFの動作 人間の聴覚は、上述したように、低域で周波数分解能が
高く、高域で時間分解能が高いという特性を持ってい
る。
【0046】そこで、入力データの周波数成分分析を行
う際、予め幾つかの周波数帯域(サブバンド)に分割す
ることにより、各々のサブバンドにおいて最適な周波
数、時間分解能を持った直交変換を行うことができる。
う際、予め幾つかの周波数帯域(サブバンド)に分割す
ることにより、各々のサブバンドにおいて最適な周波
数、時間分解能を持った直交変換を行うことができる。
【0047】直交変換符号化装置10においては、デシ
メーションによって生じた折り返し成分を除去するため
に、QMF11を用いてこのサブバンド分析を行ってい
る。 2)第1〜第k直交変換部の動作 次に複数のサブバンドに分割された各帯域通過信号に対
し、各帯域通過信号毎に異なるブロック長でMDCT
(Modified Discrete Cosine Transform)を用いて直交
変換(周波数分析)を行う。
メーションによって生じた折り返し成分を除去するため
に、QMF11を用いてこのサブバンド分析を行ってい
る。 2)第1〜第k直交変換部の動作 次に複数のサブバンドに分割された各帯域通過信号に対
し、各帯域通過信号毎に異なるブロック長でMDCT
(Modified Discrete Cosine Transform)を用いて直交
変換(周波数分析)を行う。
【0048】MDCTは、ブロック歪を軽減するため入
力信号をオーバーラップさせながら直交変換を行ってい
るにもかかわらず、時間領域の折り返しを発生させずに
直交変換係数の数をオーバーラップさせない場合と同一
にすることができる。
力信号をオーバーラップさせながら直交変換を行ってい
るにもかかわらず、時間領域の折り返しを発生させずに
直交変換係数の数をオーバーラップさせない場合と同一
にすることができる。
【0049】ところで、MDCTのブロック長を長くと
りすぎると、図4(a)に示すように、急峻な立上がり
を持つ波形直前の静寂部において、図4(c)に示すよ
うに量子化ノイズがプリエコーとして知覚されやすくな
る。
りすぎると、図4(a)に示すように、急峻な立上がり
を持つ波形直前の静寂部において、図4(c)に示すよ
うに量子化ノイズがプリエコーとして知覚されやすくな
る。
【0050】これを防止するため、そのような入力デー
タに適応して図4(b)のようにブロック長を短くして
量子化ノイズの時間的拡がりを制限して、後方性マスキ
ングの効果でプリエコーを知覚されないようにし、それ
以外の場合ではブロック長を長くすることが考えられる
が、本直交変換符号化装置10においては、後述するよ
うにMDCTによる直交変換係数ではなく、入力ディジ
タル音声データを別途高速フーリエ変換して得られるパ
ワースペクトルを用いてマスキング計算を行うようにし
たこと並びに符号化の単位である符号化ブロック内の同
一のグループには、複数のMDCTブロックに対して同
じビット割当を用いるようにしたことにより、短い固定
ブロック長でMDCTを行うように構成してハードウエ
ア構成を簡単にしている。
タに適応して図4(b)のようにブロック長を短くして
量子化ノイズの時間的拡がりを制限して、後方性マスキ
ングの効果でプリエコーを知覚されないようにし、それ
以外の場合ではブロック長を長くすることが考えられる
が、本直交変換符号化装置10においては、後述するよ
うにMDCTによる直交変換係数ではなく、入力ディジ
タル音声データを別途高速フーリエ変換して得られるパ
ワースペクトルを用いてマスキング計算を行うようにし
たこと並びに符号化の単位である符号化ブロック内の同
一のグループには、複数のMDCTブロックに対して同
じビット割当を用いるようにしたことにより、短い固定
ブロック長でMDCTを行うように構成してハードウエ
ア構成を簡単にしている。
【0051】ここで、MDCTの具体例を説明する。本
実施例における符号化の単位である符号化ブロックは、
2048サンプル(48kHzサンプリングで42.7
ms)からなっている(図3参照)。
実施例における符号化の単位である符号化ブロックは、
2048サンプル(48kHzサンプリングで42.7
ms)からなっている(図3参照)。
【0052】これをQMFで二つのサブバンドに分割す
ると各帯域通過信号は、 第1サブバンド:帯域0〜12kHz、1024サンプ
ル 第2サブバンド:帯域0〜24kHz、1024サンプ
ル となる。
ると各帯域通過信号は、 第1サブバンド:帯域0〜12kHz、1024サンプ
ル 第2サブバンド:帯域0〜24kHz、1024サンプ
ル となる。
【0053】次に第1サブバンドについては512点
で、第2サブバンドについては256点で50[%]ず
つオーバーラップさせながら固定ブロック長でMDCT
を行う。
で、第2サブバンドについては256点で50[%]ず
つオーバーラップさせながら固定ブロック長でMDCT
を行う。
【0054】この結果、符号化ブロック単位でみると、
第1サブバンドに対しては4回、第2サブバンドに対し
ては8回のMDCTを行っていることとなる。各サブバ
ンドの1回のMDCTで得られる変換係数の数は、第1
サブバンドで256点、第2サブバンドで128点とな
る。
第1サブバンドに対しては4回、第2サブバンドに対し
ては8回のMDCTを行っていることとなる。各サブバ
ンドの1回のMDCTで得られる変換係数の数は、第1
サブバンドで256点、第2サブバンドで128点とな
る。
【0055】したがって、各サブバンドのMDCTの周
波数分解能Δfは、 第1サブバンド:Δf1 =46.875Hz 第2サブバンド:Δf2 =93.75Hz となり、第1サブバンドの方が第2サブバンドの2倍の
高分解能となる。
波数分解能Δfは、 第1サブバンド:Δf1 =46.875Hz 第2サブバンド:Δf2 =93.75Hz となり、第1サブバンドの方が第2サブバンドの2倍の
高分解能となる。
【0056】また、各サブバンドのMDCTの時間分解
能Δtは、 第1サブバンド:Δt1 =10.7ms 第2サブバンド:Δt2 =5.3ms となり、逆に第2サブバンドのほうが第1サブバンドの
2倍の高分解能となっている。
能Δtは、 第1サブバンド:Δt1 =10.7ms 第2サブバンド:Δt2 =5.3ms となり、逆に第2サブバンドのほうが第1サブバンドの
2倍の高分解能となっている。
【0057】この様に直交変換符号化装置10の構成に
よれば、QMF及びMDCTによって得られる直交変換
係数の時間−周波数構造は低域で周波数分解能が高く、
高域で時間分解能が高いという、人間の聴覚特性にあわ
せたものとなる。
よれば、QMF及びMDCTによって得られる直交変換
係数の時間−周波数構造は低域で周波数分解能が高く、
高域で時間分解能が高いという、人間の聴覚特性にあわ
せたものとなる。
【0058】上述した例の場合、第1サブバンドでは2
56点のMDCTによる直交変換係数が得られ、第2サ
ブバンドでは128点のMDCTによる直交変換係数が
得られる。したがって、全帯域(0〜24kHz)で
は、384点の直交変換係数が得られる。
56点のMDCTによる直交変換係数が得られ、第2サ
ブバンドでは128点のMDCTによる直交変換係数が
得られる。したがって、全帯域(0〜24kHz)で
は、384点の直交変換係数が得られる。
【0059】得られた直交変換係数は、複数個づつグル
ープ化され、当該グループを単位としてビット数が割り
当てられ、量子化されることとなる。以下の説明におい
ては、このグループをバンドと呼ぶこととする。
ープ化され、当該グループを単位としてビット数が割り
当てられ、量子化されることとなる。以下の説明におい
ては、このグループをバンドと呼ぶこととする。
【0060】本実施例におけるMDCT直交変換係数の
バンド分割は、聴覚特性を考慮して高域になるほどバン
ド幅が広くなるように分割している。具体的には、 0〜6kHz :バンド幅500Hz→バンド1〜1
2 6〜12kHz :バンド幅750Hz→バンド13〜
20 12〜24kHz:バンド幅1kHz →バンド21〜
28 程度となるようにバンド分割を行っている。 3)高速フーリエ変換部及びマスキング計算ビット割当
部の動作 マスキング効果とは、例えば、ジェット機の轟音で周囲
の他の音がかき消されてしまうようにあるマスク音(マ
スカー)によってマスクされる他の音(マスキー)が聞
こえなくなったり、聞こえにくくなる効果(現象)であ
る。これによりマスクされる周波数成分(直交変換係
数)は、記録、伝送しなくても良い。あるいは、直交変
換係数を少ないビット数で粗く量子化して、量子化ノイ
ズが大きい場合であっても感知されにくくなる。
バンド分割は、聴覚特性を考慮して高域になるほどバン
ド幅が広くなるように分割している。具体的には、 0〜6kHz :バンド幅500Hz→バンド1〜1
2 6〜12kHz :バンド幅750Hz→バンド13〜
20 12〜24kHz:バンド幅1kHz →バンド21〜
28 程度となるようにバンド分割を行っている。 3)高速フーリエ変換部及びマスキング計算ビット割当
部の動作 マスキング効果とは、例えば、ジェット機の轟音で周囲
の他の音がかき消されてしまうようにあるマスク音(マ
スカー)によってマスクされる他の音(マスキー)が聞
こえなくなったり、聞こえにくくなる効果(現象)であ
る。これによりマスクされる周波数成分(直交変換係
数)は、記録、伝送しなくても良い。あるいは、直交変
換係数を少ないビット数で粗く量子化して、量子化ノイ
ズが大きい場合であっても感知されにくくなる。
【0061】ディジタル音声データのパワースペクトル
と、パワースペクトルから計算されるマスキング量の周
波数特性(マスキングオーディオグラム)から各バンド
の直交変換係数を量子化するのに必要なビット数を算出
するが、そのためにはまずパワースペクトルを求めなけ
ればならない。
と、パワースペクトルから計算されるマスキング量の周
波数特性(マスキングオーディオグラム)から各バンド
の直交変換係数を量子化するのに必要なビット数を算出
するが、そのためにはまずパワースペクトルを求めなけ
ればならない。
【0062】QMF、MDCTを通した符号化対象の直
交変換係数をパワースペクトルの計算に使用すれば、周
波数領域に変換する処理ルーチンが一つですむこととな
る。しかしながら、符号化対象の直交変換係数を用いた
場合には、ビット割当情報の更新は、変換ブロック長単
位となるために、ビット割当情報を減らすために長いブ
ロック長にしなければならずプリエコーの問題が生じ
る。
交変換係数をパワースペクトルの計算に使用すれば、周
波数領域に変換する処理ルーチンが一つですむこととな
る。しかしながら、符号化対象の直交変換係数を用いた
場合には、ビット割当情報の更新は、変換ブロック長単
位となるために、ビット割当情報を減らすために長いブ
ロック長にしなければならずプリエコーの問題が生じ
る。
【0063】このプリエコーを回避するために信号の急
激な立上がり部分では、短いブロック長に切り換える適
応ブロック長切換を行う必要が生じ、装置構成が複雑と
なるというデメリットが生じる。
激な立上がり部分では、短いブロック長に切り換える適
応ブロック長切換を行う必要が生じ、装置構成が複雑と
なるというデメリットが生じる。
【0064】このため、直交変換符号化装置10では、
マスキング量の計算にQMFを通さずにバイパスさせた
入力PCMディジタル音声データを高速フーリエ変換し
たものを用いている。
マスキング量の計算にQMFを通さずにバイパスさせた
入力PCMディジタル音声データを高速フーリエ変換し
たものを用いている。
【0065】これにより、直交変換ブロック長とフーリ
エ変換ブロック長を独立に設定できるので、直交変換ブ
ロック長として短い固定ブロック長を用いた直交変換を
採用することができるとともに、フーリエ変換ブロック
長を長く設定することができ、複数の直交変換ブロック
にわたって同一のビット割当を行うことができることと
なり、ビット割当情報量を減らすことができる。 4)量子化器の動作 直交変換係数の量子化は、符号化ブロック単位でバンド
毎に直交変換データをその標準偏差で正規化した振幅に
対して割り当てられたビット数で行う。これは、QM
F、MDCTによって算出したスペクトラムはダイナミ
ックレンジが大きく、そのまま量子化したのでは非常に
効率が悪いからである。 5)フォーマッティング部の動作 この後、フォーマッティング部16は、量子化データD
QX及びビット割当情報データDB を多重化し、符号化デ
ータDCODEとして出力する。
エ変換ブロック長を独立に設定できるので、直交変換ブ
ロック長として短い固定ブロック長を用いた直交変換を
採用することができるとともに、フーリエ変換ブロック
長を長く設定することができ、複数の直交変換ブロック
にわたって同一のビット割当を行うことができることと
なり、ビット割当情報量を減らすことができる。 4)量子化器の動作 直交変換係数の量子化は、符号化ブロック単位でバンド
毎に直交変換データをその標準偏差で正規化した振幅に
対して割り当てられたビット数で行う。これは、QM
F、MDCTによって算出したスペクトラムはダイナミ
ックレンジが大きく、そのまま量子化したのでは非常に
効率が悪いからである。 5)フォーマッティング部の動作 この後、フォーマッティング部16は、量子化データD
QX及びビット割当情報データDB を多重化し、符号化デ
ータDCODEとして出力する。
【0066】本実施例によれば、サイド情報データとし
てのビット割当情報は、複数の直交変換ブロックからな
る符号化ブロック単位で更新されるので、符号化データ
全体に対するサイド情報データの割合が小さくなり、特
に低ビットレートでこの方法を用いた場合に有利とな
る。
てのビット割当情報は、複数の直交変換ブロックからな
る符号化ブロック単位で更新されるので、符号化データ
全体に対するサイド情報データの割合が小さくなり、特
に低ビットレートでこの方法を用いた場合に有利とな
る。
【0067】さらに、各サブバンド毎に定めた固定ブロ
ック長の直交変換を採用しているのでハードウェア構成
が非常に簡単になる。
ック長の直交変換を採用しているのでハードウェア構成
が非常に簡単になる。
【0068】
【発明の効果】請求項1又は請求項2記載の発明によれ
ば、入力ディジタル音声データを直接フーリエ変換して
パワースペクトルを求め、求めたパワースペクトルに基
づいて直交変換係数を量子化するビット数を決定するこ
とにより、直交変換の変換ブロック長と、フーリエ変換
の変換ブロック長と、を独立に設定できる。
ば、入力ディジタル音声データを直接フーリエ変換して
パワースペクトルを求め、求めたパワースペクトルに基
づいて直交変換係数を量子化するビット数を決定するこ
とにより、直交変換の変換ブロック長と、フーリエ変換
の変換ブロック長と、を独立に設定できる。
【0069】したがって、直交変換の変換ブロック長と
して短い固定変換ブロック長を採用して直交変換を行う
ことができ、複雑な適応ブロック長切換を行わなくとも
プリエコーの問題を回避でき、ハードウェア構成を非常
に簡略化することができる。
して短い固定変換ブロック長を採用して直交変換を行う
ことができ、複雑な適応ブロック長切換を行わなくとも
プリエコーの問題を回避でき、ハードウェア構成を非常
に簡略化することができる。
【0070】さらにフーリエ変換の変換ブロック長を長
くすることにより、グループ化した直交変換係数群を構
成する直交変換係数を複数の変換ブロックにわたって同
一のビット数で量子化することができるので、ビット割
当情報量を低減して、圧縮率を向上させることができ
る。したがって、特に低ビットレートの符号化で有利と
なる。
くすることにより、グループ化した直交変換係数群を構
成する直交変換係数を複数の変換ブロックにわたって同
一のビット数で量子化することができるので、ビット割
当情報量を低減して、圧縮率を向上させることができ
る。したがって、特に低ビットレートの符号化で有利と
なる。
【図1】実施例の直交変換符号化装置の基本構成を示す
ブロック図である。
ブロック図である。
【図2】実施例の直交変換符号化装置の詳細構成を示す
ブロック図である。
ブロック図である。
【図3】サブバンド分割・直交変換のブロック長の具体
例の説明図である。
例の説明図である。
【図4】プリエコーの影響についての説明図である。
【図5】従来例の直交変換符号化装置の詳細構成を示す
ブロック図である。
ブロック図である。
1…直交変換符号化装置 2…分析部 3…聴覚心理モデル部 4…量子化部 5…フォーマッティング部 10…直交変換符号化装置 11…QMF(Quadrature Mirror Filter) 12-1〜12-k…第1〜第k直交変換部 13…高速フーリエ変換部(FFT) 14…マスキング計算ビット割当部 15…量子化器 16…フォーマッティング部 DPCM …ディジタル音声データ DX …直交変換係数 DQC…量子化ビット数制御データ DB …ビット割当情報データ DQX…量子化データ DCODE…符号化データ DSB1 ,DSBk …第1〜第kサブバンドデータ DX1〜DXk…直交変換係数 DPS…パワースペクトル推定データ DBS…ブロック長情報データ
Claims (2)
- 【請求項1】 ディジタル音声データを符号化する直交
変換符号化装置において、 前記ディジタル音声データを複数の周波数帯域に分割し
帯域分割データとして出力する帯域分割手段と、 前記周波数帯域毎に予め設定した所定の変換ブロック長
で各前記帯域分割データを直交変換して各変換ブロック
毎の直交変換係数を算出し、得られた直交変換係数をグ
ループ化して直交変換係数群として出力する分析手段
と、 前記ディジタル音声データを高速フーリエ変換し、パワ
ースペクトルデータを出力するフーリエ変換手段と、 前記パワースペクトルデータに基づいてマスキング量を
計算し、前記マスキング量に基づいて同一の前記直交変
換係数群を構成する前記直交変換係数を複数の変換ブロ
ックにわたって同一のビット数で量子化するためのビッ
ト数制御データを出力するとともに、各前記直交変換係
数群毎のビット割当情報データを出力するビット割当情
報生成手段と、 前記ビット数制御データに基づいて前記直交変換係数を
量子化して量子化データとして出力する量子化手段と、 前記量子化データ及び前記ビット割当情報データを多重
化し、符号化データとして出力するフォーマッティング
手段と、 を備えたことを特徴とする直交変換符号化装置。 - 【請求項2】 ディジタル音声データを符号化する直交
変換符号化方法において、 前記ディジタル音声データを複数の周波数帯域に分割し
帯域分割データとして出力する帯域分割工程と、 前記周波数帯域毎に予め設定した所定の変換ブロック長
で各前記帯域分割データを直交変換して各変換ブロック
毎の直交変換係数を算出し、得られた直交変換係数をグ
ループ化して直交変換係数群として出力する分析工程
と、 前記ディジタル音声データを高速フーリエ変換し、パワ
ースペクトルデータを出力するフーリエ変換工程と、 前記パワースペクトルデータに基づいてマスキング量を
計算し、前記マスキング量に基づいて同一の前記直交変
換係数群を構成する前記直交変換係数を複数の変換ブロ
ックにわたって同一のビット数で量子化するためのビッ
ト数制御データを出力するとともに、各前記直交変換係
数群毎のビット割当情報データを出力するビット割当情
報生成工程と、 前記ビット数制御データに基づいて前記直交変換係数を
量子化して量子化データとして出力する量子化工程と、 前記量子化データ及び前記ビット割当情報データを多重
化し、符号化データとして出力するフォーマッティング
工程と、 を備えたことを特徴とする直交変換符号化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6049517A JPH07261799A (ja) | 1994-03-18 | 1994-03-18 | 直交変換符号化装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6049517A JPH07261799A (ja) | 1994-03-18 | 1994-03-18 | 直交変換符号化装置及び方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH07261799A true JPH07261799A (ja) | 1995-10-13 |
Family
ID=12833339
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6049517A Pending JPH07261799A (ja) | 1994-03-18 | 1994-03-18 | 直交変換符号化装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH07261799A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006157789A (ja) * | 2004-12-01 | 2006-06-15 | Kddi Corp | 音声障害検出装置 |
JP2009513992A (ja) * | 2003-06-25 | 2009-04-02 | ドルビー スウェーデン アクチボラゲット | オーディオ信号を符号化する装置と方法および符号化されたオーディオ信号を復号化する装置と方法 |
-
1994
- 1994-03-18 JP JP6049517A patent/JPH07261799A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009513992A (ja) * | 2003-06-25 | 2009-04-02 | ドルビー スウェーデン アクチボラゲット | オーディオ信号を符号化する装置と方法および符号化されたオーディオ信号を復号化する装置と方法 |
JP2006157789A (ja) * | 2004-12-01 | 2006-06-15 | Kddi Corp | 音声障害検出装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1440300B1 (en) | Encoding device, decoding device and audio data distribution system | |
JP3804968B2 (ja) | 適応配分式符号化・復号装置及び方法 | |
US7752041B2 (en) | Method and apparatus for encoding/decoding digital signal | |
US5537510A (en) | Adaptive digital audio encoding apparatus and a bit allocation method thereof | |
KR100310214B1 (ko) | 신호인코딩또는디코딩장치와레코딩매체 | |
US5737718A (en) | Method, apparatus and recording medium for a coder with a spectral-shape-adaptive subband configuration | |
JP3186292B2 (ja) | 高能率符号化方法及び装置 | |
JP2007017908A (ja) | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 | |
JP3277682B2 (ja) | 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体及び情報伝送方法 | |
JPH1084284A (ja) | 信号再生方法および装置 | |
JPH0846518A (ja) | 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体 | |
US20050254586A1 (en) | Method of and apparatus for encoding/decoding digital signal using linear quantization by sections | |
KR20030068716A (ko) | 웨이브렛 패킷 변환을 이용한 오디오 압축 방법 및 그시스템 | |
KR100750115B1 (ko) | 오디오 신호 부호화 및 복호화 방법 및 그 장치 | |
JP3557674B2 (ja) | 高能率符号化方法及び装置 | |
JP3395001B2 (ja) | ディジタルオーディオ信号の適応的符号化方法 | |
JP3088580B2 (ja) | 変換符号化装置のブロックサイズ決定法 | |
US6034315A (en) | Signal processing apparatus and method and information recording apparatus | |
US7305346B2 (en) | Audio processing method and audio processing apparatus | |
JPH07261799A (ja) | 直交変換符号化装置及び方法 | |
JP3297238B2 (ja) | 適応的符号化システム及びビット割当方法 | |
JP3134383B2 (ja) | ディジタルデータの高能率符号化方法及び装置 | |
KR100340368B1 (ko) | 고능률부호화장치,복호화장치및디지털데이터도출방법 | |
JP3134384B2 (ja) | 符号化装置及び方法 | |
JP2003280697A (ja) | 音声圧縮方法および音声圧縮装置 |