JPH07135470A - 高能率符号化装置、高能率符号復号化装置、及びメディア - Google Patents
高能率符号化装置、高能率符号復号化装置、及びメディアInfo
- Publication number
- JPH07135470A JPH07135470A JP5279383A JP27938393A JPH07135470A JP H07135470 A JPH07135470 A JP H07135470A JP 5279383 A JP5279383 A JP 5279383A JP 27938393 A JP27938393 A JP 27938393A JP H07135470 A JPH07135470 A JP H07135470A
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- sample
- time
- samples
- efficiency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Signal Processing For Digital Recording And Reproducing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
くは周波数領域サンプルへのビット配分を行う高能率符
号化装置であり、適応ビット配分符号化を行う際に、例
えば周波数領域サンプルとしてのMDCTサンプルを正
規化回路905でブロックフローティング処理し、第1
の量子化器901によって量子化すると共に、1サンプ
ルづつ単独で前段の量子化器901の量子化における量
子化誤差を差分器902で求め、この前段の量子化誤差
を更に第2の量子化器903で量子化することにより、
MDCTサンプルを少なくとも2箇の語に分解する。 【効果】 音質劣化を最小に止めることが可能で、バッ
クワードの互換性をも有する。
Description
テム、ビデオテープレコーダ、ビデオディスクプレーヤ
等のステレオないしはいわゆるマルチサラウンド音響シ
ステムにおいて用いられるビットレートの削減を行う高
能率符号化装置と、この装置により符号化された信号が
伝送若しくは記録されるメディアと、その符号化された
信号を復号化する高能率符号復号化装置に関するもので
ある。
符号化の手法及び装置には種々あるが、例えば、時間領
域のオーディオ信号等を単位時間毎にブロック化してこ
のブロック毎の時間軸の信号を周波数軸上の信号に変換
(直交変換)して複数の周波数帯域に分割し、各帯域毎
に符号化するブロック化周波数帯域分割方式であるいわ
ゆる変換符号化方式や、時間領域のオーディオ信号等を
単位時間毎にブロック化しないで、複数の周波数帯域に
分割して符号化する非ブロック化周波数帯域分割方式で
ある帯域分割符号化(サブ・バンド・コーディング:S
BC)方式等を挙げることができる。また、上述の帯域
分割符号化と変換符号化とを組み合わせた高能率符号化
の手法及び装置も考えられており、この場合には、例え
ば、上記帯域分割符号化方式で帯域分割を行った後、該
各帯域毎の信号を上記変換符号化方式で周波数領域の信
号に直交変換し、この直交変換された各帯域毎に符号化
を施すことになる。
用される帯域分割用フィルタとしては、例えばQMF(Q
uadrature Mirror filter)等のフィルタがあり、これは
1976R.E.Crochiere Digital coding of speech in sub
bands Bell Syst.Tech. J.Vol.55, No.8 1976 に、述べ
られている。また、ICASSP 83, BOSTON PolyphaseQuad
rature filters-A new subband coding technique Jose
ph H. Rothweilerにはポリフェーズ クワドラチャ フ
ィルタ(Polyphase Quadrature filter) などの等バンド
幅のフィルタ分割手法及び装置が述べられている。
ば、入力オーディオ信号を所定単位時間(フレーム)で
ブロック化し、該ブロック毎に高速フーリエ変換(FF
T)やコサイン変換(DCT)、モディファイドDCT
変換(MDCT)などを行うことで時間軸を周波数軸に
変換するような直交変換がある。上記MDCTについて
は、ICASSP 1987 Subband/Transform Coding Using Fil
ter Bank Designs Basedon Time Domain Aliasing Canc
ellation J.P.Princen A.B.Bradley Univ. ofSurrey R
oyal Melbourne Inst.of Tech. に述べられている。
を量子化する場合の周波数分割幅としては、例えば人間
の聴覚特性を考慮した帯域分割がある。すなわち、一般
に臨界帯域(クリティカルバンド)と呼ばれている高域
程帯域幅が広くなるような帯域幅で、オーディオ信号を
複数(例えば25バント)の帯域に分割することがあ
る。また、この時の各帯域毎のデータを符号化する際に
は、各帯域毎に所定のビット配分或いは、各帯域毎に適
応的なビット配分による符号化が行われる。例えば、上
記MDCT処理されて得られたMDCT係数データを上
記ビット配分によって符号化する際には、上記各ブロッ
ク毎のMDCT処理により得られる各帯域毎のMDCT
係数データに対して、適応的な配分ビット数で符号化が
行われることになる。
しては、次の2手法及び装置が知られている。IEEE Tra
nsactions of Accoustics,Speech,and Signal Processi
ng,vol.ASSP-25,No.4,August 1977 では、各帯域毎の信
号の大きさをもとに、ビット配分を行っている。またIC
ASSP 1980 The critical band coder--digital encodin
g ofthe perceptual requirements of the auditory sy
stem M.A. Kransner MITでは、聴覚マスキングを利用す
ることで、各帯域毎に必要な信号対雑音比を得て固定的
なビット配分を行う手法及び装置が述べられている。
ト配分技術は、再生側(デコード側)においてある一定
ビットレートで再生(デコード)が行われることを期待
したものであり、したがって、当該一定ビットレートを
下回るビットレートで再生を行った場合には著しい音質
劣化をもたらす。すなわち、エンコード時に使用された
ビットレートよりも低いビットレートを用いてデコード
することとして、例えばエンコード側でエンコード処理
後のビットの一部を別のデータ転送用に流用するような
場合は、再生側においてエンコード時のビットレートを
下回るビットレートで再生が行われることになるため、
上記再生側においてエンコード時のビットレートで再生
することを期待する上述の既知のビット配分技術では、
再生(デコード)時に著しい音質劣化をもたらすように
なる。
する再生機が使われているような場合において、より高
いビットレートを用いた音質の良いシステムを導入しよ
うとしても、上記既に用いられている低いビットレート
で再生を行う再生機では良好な再生を行なうことが出来
ない。
は、バックワードの互換性が無い。
最小に止めることが可能で、バックワードの互換性をも
有する高能率符号化装置とこれに対応する高能率符号復
号化装置及びメディアからなるシステムを提供すること
を目的とするものである。
した情報を例えばいわゆるICカードのような記憶デバ
イスを用いた記憶媒体に記録させるような場合において
は、当該記憶デバイスが高価であることから、より長時
間の記録がなされることが望まれ、また、音質劣化も最
小化することが望まれる。したがって、本発明の別の目
的は、高価な記憶デバイスを用いた記憶媒体に記録を行
うような場合において、長時間記録のために例えば記録
時間を初期の設定から延長したいときには記録済み若し
くは記録中のエンコード情報のビットレートを適宜減ら
して記録時間を延ばし且つこの時の音質劣化を最小化で
きる高能率符号化装置とこれに対応する高能率符号復号
化装置及びメディアを提供することにある。
て高能率符号化がなされた信号の再生装置(高能率符号
復号化装置)を構成する場合には、コストを抑えること
が望まれるので、本発明は、例えば、安価な通常良く使
われる固定値以下のビットレートを用いてビット配分を
行うデコーダを複数個使用して作成することができ、こ
のことにより新たなデコーダ用LSI(大規模集積回
路)の作成も不要で、安価な高能率符号復号化装置を提
供することをも目的としている。
成するために提案されたものであり、本発明の高能率符
号化装置は、オーディオ,音声又は画像時間信号を、フ
ィルタで周波数分解した時間領域サンプル若しくは周波
数分解した時間領域サンプルを直交変換するか直接入力
時間信号を直交変換した周波数領域サンプルを、量子化
した後、1サンプルづつ単独で、前段の量子化誤差を更
に量子化するような少なくとも1箇の量子化機能によ
り、時間領域サンプル若しくは周波数領域サンプルを少
なくとも2箇の語に分解する。この時、各語の語長を事
前に決めておく事は、語長情報をエンコーダ(符号化装
置)からデコーダ(復号化装置)に送付する必要がなく
ビットレート低減に有効である。もちろん語長情報を送
って適応的な語長とすることもできる。これらの量子化
において四捨五入動作を行い、量子化誤差を小さくす
る。
なくとも一つの量子化機能の出力ビットレートをある一
定時間単位で一定ビットレートとしたり、全ての前記量
子化機能の出力ビットレートをある一定時間単位で一定
ビットレートとする。これらの場合、時間領域サンプル
若しくは周波数領域サンプルを、複数サンプル毎にブロ
ックフローティングし、前記前段の量子化誤差を更に量
子化したサンプルデータの為のスケールファクタを、少
なくとも当該前段の量子化出力の為のスケールファクタ
から求める。
間領域サンプル若しくは周波数領域サンプルを、複数サ
ンプル毎にブロックフローティングし、前記前段の量子
化誤差を更に量子化したサンプルデータの為のスケール
ファクタを、少なくとも前記前段の量子化出力の為のス
ケールファクタ及びワードレングスから求める。
された小ブロック中のサンプルデータに対しては、前記
小ブロック内で同一のブロックフローティング及び語長
をもつ量子化を行なう。また、前記時間と周波数につい
て細分化された小ブロック中のサンプルを得るために
は、フィルタなどの非ブロック化周波数分析を行った
後、前記フィルタなどの非ブロック化周波数分析の出力
を直交変換等のブロック化周波数分析する。この時、前
記非ブロック化周波数分析の周波数帯域幅が少なくとも
最低域の2帯域で同じであることは、コストを低減する
うえで役に立つ。また、前記非ブロック化周波数分析の
周波数帯域幅が少なくとも最高域で高域程広いことは、
臨界帯域に基づく聴覚の効果を利用するうえで重要であ
る。さらに、前記ブロック化周波数分析では、入力信号
の時間特性により適応的にそのブロックサイズを変更す
ることにより、入力信号の時間特性に対応した最適な処
理が可能となる。ここで、前記ブロックサイズの変更
は、少なくとも2つの前記非ブロック化周波数分析の出
力帯域ごとに独立に行うことは、周波数成分の間の相互
干渉を防いで各帯域成分独立に最適な処理を行う上で効
果的である。
量を各チャネルのスケールファクタ又はサンプル最大値
により決めるのは、簡単な演算によるため、演算を低減
させるうえで効果的である。これに加えて、各チャネル
のスケールファクタで代表される振幅情報の時間的変化
によって各チャネルに与えられるビット配分量を変化さ
せることも、ビットレートを下げるうえでは有益であ
る。
間領域サンプル若しくは周波数領域サンプルを量子化し
た後、1サンプルづつ単独で、前段の量子化誤差を更に
量子化するような少なくとも1箇の量子化機能により、
少なくとも2箇の語に分解し、1つのシンクブロックの
中に各量子化出力毎に分離して、本発明のメディアに記
録し、これを本発明の高能率符号復号化装置によって復
号再生する。また、本発明の他の高能率符号化装置は、
時間領域サンプル若しくは周波数領域サンプルを量子化
した後、1サンプルづつ単独で、前段の量子化誤差を更
に量子化するような少なくとも1箇の量子化機能によ
り、少なくとも2箇の語に分解し、本発明のメディアに
対して、1つのシンクブロックの中に各量子化出力を周
波数又は時間順に交互に記録し、その後本発明の高能率
符号復号化装置では、これらの時間領域サンプル若しく
は周波数領域サンプルから復号再生する。
波数領域サンプルを量子化した後、1サンプルづつ単独
で、前段の量子化誤差を更に量子化するような少なくと
も1箇の量子化機能により、時間領域サンプル若しくは
周波数領域サンプルを少なくとも2箇の語に分解する。
この時、量子化された各語の語長を事前に決めておく事
は語長情報をエンコーダからデコーダに送付する必要が
なくビットレート低減に有効である。もちろん語長情報
を送って適応的な語長とすることもできる。また、これ
らの量子化において四捨五入動作を行うことは量子化誤
差を小さくする上で有効である。
ビットレートをある一定時間単位で一定ビットレートと
する事や、全ての前記量子化機能の出力ビットレートを
ある一定時間単位で一定ビットレートとする事は、ディ
スク、テープ等の記録媒体への記録方式を簡単化するう
えで有効である。
細分化された小ブロック中のサンプルデータを、前記小
ブロック内では同一のブロックフローティング及び語長
をもつ量子化を行う事は効率的な高能率符号を実現する
うえで有効である。これらの場合、時間領域サンプル若
しくは周波数領域サンプルを、複数サンプル毎にブロッ
クフローティングし、前記前段の量子化誤差を更に量子
化したサンプルデータの為のスケールファクタを、少な
くとも前記前段の量子化出力の為のスケールファクタか
ら求める事や、前記前段の量子化誤差を更に量子化した
サンプルデータの為のスケールファクタを、少なくとも
前記前段の量子化出力の為のスケールファクタ及びワー
ドレングスから求める事は高能率符号化の効率を高める
うえで有効である。
た小ブロック中のサンプルを得るために、フィルタなど
の非ブロック化周波数分析を行なった後、このフィルタ
などの非ブロック化周波数分析の出力を直交変換等のブ
ロック化周波数分析をする事により、時間領域、周波数
領域で聴覚マスキングを考慮した量子化雑音の発生が可
能となり、聴覚上好ましい周波数分析を得ることが可能
となる。この時、前記非ブロック化周波数分析の周波数
帯域幅が少なくとも最低域の2帯域で同じであることは
コストを低減するうえで役に立つ。また、この非ブロッ
ク化周波数分析の周波数帯域幅が少なくとも最高域で高
域程広くすることにより臨界帯域に基づく聴覚の効果を
効率的に利用することが可能となる。このブロック化周
波数分析は、入力信号の時間特性により適応的にそのブ
ロックサイズが変更されることにより入力信号の時間特
性に対応した最適な処理が可能となる。また、ブロック
サイズの変更は少なくとも2つの前記非ブロック化周波
数分析の出力帯域毎に独立に行うことは、周波数成分の
間の相互干渉を防いで各帯域成分独立に最適な処理を行
う上で効果的である。
ルのスケールファクタにより計算することによってビッ
ト配分計算の簡易化が図られる。また、時間領域サンプ
ル若しくは周波数領域サンプルを量子化した後、1サン
プルづつ単独で、前段の量子化誤差を更に量子化するよ
うな少なくとも1箇の量子化機能により、少なくとも2
箇の語に分解し、1つのシンクブロックの中に各量子化
出力毎に分離して記録し復号再生する事は、ビットレー
トを下げて再生する場合に除去すべきビット列部分を一
括して除去できるという点で有効である。
域サンプルを量子化した後、1サンプルづつ単独で、前
段の量子化誤差を更に量子化するような少なくとも1箇
の量子化機能により、少なくとも2箇の語に分解し、1
つのシンクブロックの中に各量子化出力を周波数又は時
間順に交互に記録し、時間領域サンプル若しくは周波数
領域サンプルから復号再生することは、ビットレートを
下げて再生する場合に周波数帯域を制限する形で除去す
べきビット列部分を一括して除去できるという点で有効
である。
ダ)と、本発明の高能率符号復号化装置(デコーダ)の
実施例について図面を参照しながら説明する。
入力ディジタル信号を、帯域分割符号化(SBC)、適
応変換符号化(ATC)、及び適応ビット配分て(AP
C−AB)の各技術を用いて高能率符号化する。この技
術について、図1を参照しながら説明する。
化装置では、入力ディジタル信号をフィルタなどにより
複数の周波数帯域に分割すると共に、各周波数帯域毎に
直交変換を行って、得られた周波数軸のスペクトルデー
タを、後述する人間の聴覚特性を考慮したいわゆる臨界
帯域幅(クリティカルバンド)毎に適応的にビット配分
して符号化している。この時、高域では臨界帯域幅を更
に分割した帯域を用いる。もちろんフィルタなどによる
非ブロッキングの周波数分割幅は等分割幅としてもよ
い。
換の前に入力信号に応じて適応的にブロックサイズ(ブ
ロック長)を変化させると共に、クリティカルバンド単
位若しくは高域では臨界帯域幅(クリティカルバンド)
を更に細分化したブロックでフローティング処理を行っ
ている。なお、このクリティカルバンドとは、人間の聴
覚特性を考慮して分割された周波数帯域であり、ある純
音の周波数近傍の同じ強さの狭帯域バンドノイズによっ
て当該純音がマスクされるときのそのノイズの持つ帯域
のことである。このクリティカルバンドは、高域ほど帯
域幅が広くなっており、例えば0〜20kHzの全周波
数帯域は例えば25のクリティカルバンドに分割されて
いる。
は例えば0〜22kHzのオーディオPCM信号が供給
されている。この入力信号は、例えばいわゆるQMFな
どの帯域分割フィルタ11により0〜11kHz帯域と
11k〜22kHz帯域とに分割され、0〜11kHz
帯域の信号は同じくいわゆるQMF等の帯域分割フィル
タ12により0〜5.5kHz帯域と5.5k〜11k
Hz帯域とに分割される。
22kHz帯域の信号は、直交変換回路の一例であるM
DCT(Modified Discrete Cosine Transform)回路1
3に送られ、上記帯域分割フィルタ12からの5.5k
〜11kHz帯域の信号はMDCT回路14に送られ、
上記帯域分割フィルタ12からの0〜5.5kHz帯域
の信号はMDCT回路15に送られることにより、それ
ぞれMDCT処理される。なお、各MDCT回路13、
14、15では、各帯域毎に設けたブロック決定回路1
9、20、21により決定されたブロックサイズに基づ
いてMDCT処理がなされる。
0、21により決定される各MDCT回路13、14、
15でのブロックサイズの具体例を図2のA及びBに示
す。なお、図2のAには直交変換ブロックサイズが長い
場合(ロングモードにおける直交変換ブロックサイズ)
を、図2のBには直交変換ブロックサイズが短い場合
(ショートモードにおける直交変換ブロックサイズ)を
示ししている。
ルタ出力は、それぞれ2つの直交変換ブロックサイズを
持つ。すなわち、低域側の0〜5.5kHz帯域の信号
及び中域の5.5k〜11kHz帯域の信号に対して
は、長いブロック長の場合(図2のA)は1ブロック内
のサンプル数を128サンプルとし、短いブロックが選
ばれた場合(図2のB)には1ブロック内のサンプル数
を32サンプル毎のブロックとしている。これに対して
高域側の11k〜22kHz帯域の信号に対しては、長
いブロック長の場合(図2のA)は1ブロック内のサン
プル数を256サンプルとし、短いブロックが選ばれた
場合(図2のB)には1ブロック内のサンプル数を32
サンプル毎のブロックとしている。このようにして短い
ブロックが選ばれた場合には各帯域の直交変換ブロック
のサンプル数を同じとして高域程時間分解能を上げ、な
おかつブロック化に使用するウインドウの種類を減らし
ている。
21で決定されたブロックサイズを示す情報は、後述の
適応ビット配分符号化回路16、17、18に送られる
と共に、出力端子23、25、27から出力される。
14、15にてMDCT処理されて得られた周波数領域
のスペクトルデータあるいはMDCT係数データは、い
わゆる臨界帯域(クリティカルバンド)または高域では
更にクリティカルバンドを分割した帯域毎にまとめられ
て適応ビット配分符号化回路16、17、18に送られ
ている。
8では、上記ブロックサイズの情報、及び臨界帯域(ク
リティカルバンド)または高域では更にクリティカルバ
ンドを分割した帯域毎に割り当てられたビット数に応じ
て各スペクトルデータ(あるいはMDCT係数データ)
を再量子化(正規化して量子化)するようにしている。
17、18によって符号化されたデータは、出力端子2
2、24、26を介して取り出される。また、当該適応
ビット配分符号化回路16、17、18では、どのよう
な信号の大きさに関する正規化がなされたかを示すスケ
ールファクタと、どのようなビット長で量子化がされた
かを示すビット長情報も求めており、これらも同時に出
力端子22、24、26から出力される。
14、15の出力からは、上記臨界帯域(クリティカル
バンド)または高域では更にクリティカルバンドを分割
した帯域毎のエネルギを、例えば当該バンド内での各振
幅値の2乗平均の平方根を計算すること等により求めら
れる。もちろん、上記スケールファクタそのものを以後
のビット配分の為に用いるようにしてもよい。この場合
には新たなエネルギ計算の演算が不要となるため、ハー
ド規模の節約となる。また、各バンド毎のエネルギの代
わりに、振幅値のピーク値、平均値等を用いることも可
能である。
ット配分回路での具体的なビット配分の方法を図3に示
すビット配分ストラテジを用いて説明する。
配分から、第1に、チャネル当たり128kbpsの基
礎ビット配分(ステップST2)と、第2に、64kb
psの付加ビット配分(ステップST3)との2つを求
める。
分(1) (ステップST4)と、ビット配分(2) (ステッ
プST5)とに分割使用される。
への上記基礎ビット配分の手法について説明する。ここ
ではスケールファクタの周波数領域の分布をみて適応的
にビット配分を行なう。
量を確定する。そのためには信号情報のスペクトル情報
のうちトーナリティ情報を使用する。ここでのトーナリ
ティの指標としては、信号スペクトルの隣接値間の差の
絶対値の和を信号スペクトル数で割った値を用いてい
る。なお、より簡単な指標としては、図4に示すよう
に、いわゆるブロックフローティングの為のブロック毎
のスケールファクタにおける隣接スケールファクタ指標
の間の差の平均値を用いることができる。このスケール
ファクタ指標は、概略スケールファクタの対数値に対応
している。
ット量をこのトーナリティを表す値に対応させて最大8
0kbps、最小10kbpsと設定している。このト
ーナリティ計算は次の式のように行う。
対応している。 n :ブロックフローティングバンド番号 N :ブロックフローティングバンドの数
標Tとビット配分(1) の配分量とは、図5に示すように
対応付けられる。ここでのビット配分(1) はスケ−ルフ
ァクタに依存した周波数、時間領域上の配分がなされ
る。
るビット量が決定されたら、次にビット配分(1) で使わ
れなかったビットについての配分すなわちビット配分
(2) に移る。ここでは多種のビット配分が行われるが以
下に2つの例を示す。
分を行う。この場合のビット配分に対する量子化雑音ス
ペクトル(ビット配分(2) の均一配分のノイズスペクト
ル)を図6に示す。これによれば、全周波数帯域で均一
の雑音レベル低減が行える。
レベルに対する依存性を持たせた聴覚的な効果を得るた
めのビット配分を行う。この場合のビット配分に対する
量子化雑音スペクトル(信号情報の周波数スペクトル及
びレベルに対する依存性を持たせた聴覚的な効果を得る
ためのビット配分によるノイズスペクトル)の一例を図
7に示す。この例では情報信号のスペクトルに依存させ
たビット配分を行っていて、特に情報信号のスペクトル
の低域側にウエイトをおいたビット配分を行い高域側に
比して起きる低域側でのマスキング効果の減少を補償し
ている。これは隣接臨界帯域間でのマスキングを考慮し
てスペクトルの低域側を重視したマスキングカーブの非
対象性に基づいている。
時のビット配分(割当)を示す図であり図6に対応した
ビット配分を表している。図9は信号情報の周波数スペ
クトル及びレベルに対応する依存性を持たせた聴覚的な
効果を得るためのビット配分を示す図であり図7に対応
したビット配分を表している。また、図6,図7の図中
Sは信号スペクトルを、NL1はビット配分(1) による
雑音レベルを、NL2はビット配分(2) による雑音レベ
ルを示している。図8,図9の図中AQ1はビット配分
(1) のビット量を、図中AQ2はビット配分(2) のビッ
ト量を示している。
る。 この場合の適応ビッ
ト配分回路の動作を図10で説明するとMDCT係数の
大きさが各ブロックごとに求められ、そのMDCT係数
が入力端子801に供給される。当該入力端子801に
供給されたMDCT係数は、帯域毎のエネルギ算出回路
803に与えられる。帯域毎のエネルギ算出回路803
では、クリティカルバンドまたは高域においてはクリテ
ィカルバンドを更に再分割したそれぞれの帯域に関する
信号エネルギを算出する。帯域毎のエネルギ算出回路8
03で算出されたそれぞれの帯域に関するエネルギは、
エネルギ依存ビット配分回路804に供給される。
使用可能総ビット発生回路802からの使用可能総ビッ
ト、本実施例では128Kbpsの内のある割合を用い
て白色の量子化雑音を作り出すようなビット配分を行
う。このとき、入力信号のトーナリティが高いほど、す
なわち入力信号のスペクトルの凸凹が大きいほど、この
ビット量が上記128Kbpsに占める割合が増加す
る。なお、入力信号のスペクトルの凸凹を検出するに
は、隣接するブロックのブロックフローティング係数の
差の絶対値の和を指標として使う。そして、求められた
使用可能なビット量につき、各帯域のエネルギの対数値
に比例したビット配分を行う。
算出回路805は、まず上記クリティカルバンド毎に分
割されたスペクトルデータに基づき、いわゆるマスキン
グ効果等を考慮した各クリティカルバンド毎の許容ノイ
ズ量を求め、次に聴覚許容雑音スペクトルを与えるよう
に使用可能総ビットからエネルギ依存ビットを引いたビ
ット分が配分される。このようにして求められたエネル
ギ依存ビットと聴覚許容雑音レベルに依存したビットは
加算されて、図1の適応ビット配分符号化回路16、1
7、18によって各クリティカルバンド毎若しくは高域
においてはクリティカルバンドを更に複数帯域に分割し
た帯域に割り当てられたビット数に応じて各スペクトル
データ(あるいはMDCT係数データ)が再量子化され
るようになっている。このようにして符号化されたデー
タは、図1の出力端子22、24、26を介して取り出
される。
依存のビット配分回路805中の聴覚許容雑音スペクト
ル算出回路について説明すると、MDCT回路13、1
4、15で得られたMDCT係数が当該ビット配分回路
805中の許容雑音スペクトル算出回路に与えられる。
をまとめて説明した一具体例の概略構成を示すブロック
回路図である。この図11において、入力端子521に
は、MDCT回路13、14、15からの周波数領域の
スペクトルデータが供給されている。
エネルギ算出回路522に送られて、上記クリティカル
バンド(臨界帯域)毎のエネルギが、例えば当該バンド
内での各振幅値2乗の総和を計算すること等により求め
られる。この各バンド毎のエネルギの代わりに、振幅値
のピーク値、平均値等が用いられることもある。このエ
ネルギ算出回路522からの出力として、例えば各バン
ドの総和値のスペクトルは、一般にバークスペクトルと
称されている。図12はこのような各クリティカルバン
ド毎のバークスペクトルSBを示している。ただし、こ
の図12では、図示を簡略化するため、上記クリティカ
ルバンドのバンド数を12バンド(B1〜B12)で表現
している。
ゆるマスキングに於ける影響を考慮するために、該バー
クスペクトルSBに所定の重み付け関数を掛けて加算す
るような畳込み(コンボリューション)処理を施す。こ
のため、上記帯域毎のエネルギ算出回路522の出力す
なわち該バークスペクトルSBの各値は、畳込みフィル
タ回路523に送られる。該畳込みフィルタ回路523
は、例えば、入力データを順次遅延させる複数の遅延素
子と、これら遅延素子からの出力にフィルタ係数(重み
付け関数)を乗算する複数の乗算器(例えば各バンドに
対応する25個の乗算器)と、各乗算器出力の総和をと
る総和加算器とから構成されるものである。
の特性により、ある信号によって他の信号がマスクされ
て聞こえなくなる現象をいうものであり、このマスキン
グ効果には、時間領域のオーディオ信号による時間軸マ
スキング効果と、周波数領域の信号による同時刻マスキ
ング効果とがある。これらのマスキング効果により、マ
スキングされる部分にノイズがあったとしても、このノ
イズは聞こえないことになる。このため、実際のオーデ
ィオ信号では、このマスキングされる範囲内のノイズは
許容可能なノイズとされる。
乗算器の乗算係数(フィルタ係数)の一具体例を示す
と、任意のバンドに対応する乗算器Mの係数を1とする
とき、乗算器M−1で係数0.15を、乗算器M−2で
係数0.0019を、乗算器M−3で係数0.0000
086を、乗算器M+1で係数0.4を、乗算器M+2
で係数0.06を、乗算器M+3で係数0.007を各
遅延素子の出力に乗算することにより、上記バークスペ
クトルSBの畳込み処理が行われる。ただし、Mは1〜
25の任意の整数である。
力は引算器524に送られる。該引算器524は、上記
畳込んだ領域での後述する許容可能なノイズレベルに対
応するレベルαを求めるものである。なお、当該許容可
能なノイズレベル(許容ノイズレベル)に対応するレベ
ルαは、後述するように、逆コンボリューション処理を
行うことによって、クリティカルバンドの各バンド毎の
許容ノイズレベルとなるようなレベルである。
ルαを求めるるための許容関数(マスキングレベルを表
現する関数)が供給される。この許容関数を増減させる
ことで上記レベルαの制御を行っている。当該許容関数
は、次に説明するような(n−ai)関数発生回路52
5から供給されているものである。
ベルαは、クリティカルバンドのバンドの低域から順に
与えられる番号をiとすると、次の式で求めることがで
きる。 α=S−(n−ai) この式において、n,aは定数でa>0、Sは畳込み処
理されたバークスペクトルの強度であり、式中(n-ai)が
許容関数となる。例としてn=38,a=−0.5 を用い
ることができる。
れ、このデータは、割算器526に伝送される。当該割
算器526では、上記畳込みされた領域での上記レベル
αを逆コンボリューションするためのものである。した
がって、この逆コンボリューション処理を行うことによ
り、上記レベルαからマスキングスレッショールドが得
られるようになる。すなわち、このマスキングスレッシ
ョールドが許容ノイズスペクトルとなる。なお、上記逆
コンボリューション処理は、複雑な演算を必要とする
が、本実施例では簡略化した割算器526を用いて逆コ
ンボリューションを行っている。
は、合成回路527を介して減算器528に伝送され
る。ここで、当該減算器528には、上記帯域毎のエネ
ルギ検出回路522からの出力、すなわち前述したバー
クスペクトルSBが、遅延回路529を介して供給され
ている。したがって、この減算器528で上記マスキン
グスレッショールドとバークスペクトルSBとの減算演
算が行われることで、図13に示すように、上記バーク
スペクトルSBは、当該マスキングスレッショールドM
Sのレベルで示すレベル以下がマスキングされることに
なる。なお、上記遅延回路529は、上記合成回路52
7以前の各回路での遅延量を考慮してエネルギ検出回路
522からのバークスペクトルSBを遅延させるために
設けられている。
補正回路530を介し、出力端子531を介して取り出
され、例えば配分ビット数情報が予め記憶されたROM
等(図示せず)に送られる。このROM等は、上記減算
回路528から許容雑音補正回路530を介して得られ
た出力(上記各バンドのエネルギと上記ノイズレベル設
定手段の出力との差分のレベル)に応じ、各バンド毎の
配分ビット数情報を出力する。
許容雑音レベルに依存したビットは加算されてその配分
ビット数情報が上記適応ビット配分符号化回路16、1
7、18に送られることで、ここでMDCT回路13、
14、15からの周波数領域の各スペクトルデータがそ
れぞれのバンド毎に割り当てられたビット数で量子化さ
れるわけである。
符号化回路16、17、18では、上記クリティカルバ
ンドの各バンド帯域毎(クリティカルバンド毎)若しく
は高域においては当該クリティカルバンドを更に複数帯
域に分割した帯域のエネルギ若しくはピーク値と、上記
ノイズレベル設定手段の出力との差分のレベルに応じて
配分されたビット数で上記各バンド毎のスペクトルデー
タを量子化することになる。
成の際には、最小可聴カーブ発生回路532から供給さ
れる図14に示すような人間の聴覚特性であるいわゆる
最小可聴カーブRCを示すデータと、上記マスキングス
レッショールドMSとを合成することができる。この最
小可聴カーブにおいて、雑音絶対レベルがこの最小可聴
カーブ以下ならば該雑音は聞こえないことになる。この
最小可聴カーブは、コーディングが同じであっても例え
ば再生時の再生ボリュームの違いで異なるものとなが、
現実的なディジタルシステムでは、例えば16ビットダ
イナミックレンジへの音楽のはいり方にはさほど違いが
ないので、例えば4kHz付近の最も耳に聞こえやすい
周波数帯域の量子化雑音が聞こえないとすれば、他の周
波数帯域ではこの最小可聴カーブのレベル以下の量子化
雑音は聞こえないと考えられる。したがって、このよう
に例えばシステムの持つダイナミックレンジの4kHz
付近の雑音が聞こえない使い方をすると仮定し、この最
小可聴カーブRCとマスキングスレッショールドMSと
を共に合成することで許容ノイズレベルを得るようにす
ると、この場合の許容ノイズレベルは、図14中の斜線
で示す部分までとすることができるようになる。なお、
本実施例では、上記最小可聴カーブの4kHzのレベル
を、例えば20ビット相当の最低レベルに合わせてい
る。また、この図14は、信号スペクトルSSも同時に
示している。
補正情報出力回路533から送られてくる例えば等ラウ
ドネスカーブの情報に基づいて、上記減算器528から
の出力における許容雑音レベルを補正している。ここ
で、等ラウドネスカーブとは、人間の聴覚特性に関する
特性曲線であり、例えば1kHzの純音と同じ大きさに
聞こえる各周波数での音の音圧を求めて曲線で結んだも
ので、ラウドネスの等感度曲線とも呼ばれる。またこの
等ラウドネス曲線は、図14に示した最小可聴カーブR
Cと略同じ曲線を描くものである。この等ラウドネス曲
線においては、例えば4kHz付近では1kHzのとこ
ろより音圧が8〜10dB下がっても1kHzと同じ大
きさに聞こえ、逆に、50Hz付近では1kHzでの音
圧よりも約15dB高くないと同じ大きさに聞こえな
い。このため、上記最小可聴カーブのレベルを越えた雑
音(許容ノイズレベル)は、この等ラウドネス曲線に応
じたカーブで与えられる周波数特性を持つようにするの
が良いことがわかる。このようなことから、上記等ラウ
ドネス曲線を考慮して上記許容ノイズレベルを補正する
ことは、人間の聴覚特性に適合していることがわかる。
スペクトル形状を使用可能総ビット128Kbpsの内
のある割合を用いるビット配分でつくる。この割合は入
力信号のトーナリティが高くなるほど減少する。
量分割手法について説明する。図10に戻って、MDC
T回路出力が供給される入力端子801からの信号は、
スペクトルの滑らかさ算出回路808にも与えられ、こ
こでスペクトルの滑らかさが算出される。本実施例で
は、信号スペクトルの絶対値の隣接値間の差の絶対値の
和を信号スペクトルの絶対値の和で割った値を、上記ス
ペクトルの滑らかさとして算出している。
の出力は、ビット分割率決定回路809に与えられ、こ
こでエネルギ依存のビット配分と、聴覚許容雑音スペク
トルによるビット配分間のビット分割率とが決定され
る。ビット分割率はスペクトルの滑らかさ算出回路80
8の出力値が大きいほど、スペクトルの滑らかさが無い
と考えて、エネルギ依存のビット配分よりも、聴覚許容
雑音スペクトルによるビット配分に重点をおいたビット
配分を行う。ビット分割率決定回路809は、それぞれ
エネルギ依存のビット配分及び聴覚許容雑音スペクトル
によるビット配分の大きさをコントロールするマルチプ
ライヤ811及び812に対してコントロール出力を送
る。ここで、仮にスペクトルが滑らかであり、エネルギ
依存のビット配分に重きをおくように、マルチプライヤ
811へのビット分割率決定回路809の出力が0.8
の値を取ったとき、マルチプライヤ812へのビット分
割率決定回路809の出力は1−0.8=0.2とす
る。これら2つのマルチプライヤの出力はアダー806
で足し合わされて最終的なビット配分情報となって、出
力端子807から出力される。
16に示す。また、これに対応する量子化雑音の様子を
図17、図18に示す。図15は信号のスペクトルが割
合平坦である場合を示しており、図16は信号スペクト
ルが高いトーナリティを示す場合を示している。また、
図15及び図16の図中QSは信号レベル依存分のビッ
ト量を示し、図中QNは聴覚許容雑音レベル依存のビッ
ト割当分のビット量を示している。図17及び図18の
図中Lは信号レベルを示し、図中NSは信号レベル依存
分による雑音低下分を、図中NNは聴覚許容雑音レベル
依存のビット割当分による雑音低下分を示している。
る場合を示す図15において、聴覚許容雑音レベルに依
存したビット配分は、全帯域に渡り大きい信号雑音比を
取るために役立つ。しかし低域及び高域では比較的少な
いビット配分が使用されている。これは聴覚的にこの帯
域の雑音に対する感度が小さいためである。信号エネル
ギレベルに依存したビット配分の分は量としては少ない
が、ホワイトな雑音スペクトルを生じるように、この場
合には中低域の信号レベルの高い周波数領域に重点的に
配分されている。
スペクトルが高いトーナリティを示す場合には、信号エ
ネルギレベルに依存したビット配分量が多くなり、量子
化雑音の低下は極めて狭い帯域の雑音を低減するために
使用される。聴覚許容雑音レベルに依存したビット配分
の集中はこれよりもきつくない。
分の和により、孤立スペクトル入力信号での特性の向上
が達成される。
に、次のようにして前記付加ビット配分(ステップST
3)部分を付け加える。
加ビット配分部分の分離及び再生時の結合について説明
する。
は、図1のMDCT回路13,14,15の出力である
MDCT係数が供給されるとする。すなわち、図19は
図1の適応ビット割当符号化回路に含まれるものであ
る。
に供給されたMDCT係数(MDCTサンプル)は正規
化回路905によって複数サンプル毎に、ブロックにつ
いての正規化処理すなわちブロックフローティングが施
される。この時どの程度のブロックフローティングが行
われたかを示す係数としてスケールファクタが得られ
る。
は、前記基礎ビット配分で与えられた各サンプル語長で
量子化を行なう。この時、量子化雑音を少なくするため
には四捨五入による量子化が行われる。
量子化器901の出力が差分器902に送られる。すな
わち、当該差分器902では、量子化器901の入力と
出力の差(量子化誤差)が取られる。この差分器902
からの出力は、さらに正規化回路906を介して第2の
量子化器903に送られる。
ビットが各サンプル毎に使用される。この時のフローテ
ィング係数は、第1の量子化器901で用いられたフロ
ーティング係数と語長から自動的に決定される。
側では、第1の量子化器901で用いられた語長が例え
ばNビットであったときには(2**N)で第2の量子
化器903で用いられるフローティング係数が得られ
る。
量子化器903では、上記基礎ビット配分のための第1
の量子化器901と同じように四捨五入処理を含むビッ
ト配分を行う。このようにして2つの量子化により、2
つのビット配分に分けられる。
ドレングスが固定的でない場合でも、前に述べたように
付加ビット配分の成分の大きさは基礎ビット配分のスケ
ールファクタとワードレングスから付加ビット配分のス
ケールファクタを算出できるので、ワードレングスのみ
がデコーダに必要とされる。本実施例では、付加ビット
配分のワードレングスは2ビットと固定されているの
で、付加ビット配分のためのワードレングスさえ必要で
はない。このようにして量子化器901及び903の出
力がそれぞれ四捨五入された効率の高い量子化が実現さ
れることになる。
ットレ−トは、両者とも固定にすると、ディスク、テ−
プ等のメディアに記録するときにシステムを簡単にする
ことができる。また、両者を可変としながら、トータル
で一定とすることもできる。もちろん一部の量子化器の
出力ビットレートのみを一定としてもよい。
する構成(デコーダ)では、上記正規化回路905,9
06に対応する逆正規化処理を行う逆正規化回路90
8,907が設けられ、回路908,907の出力が加
算器904で加算される。その加算出力が出力端子91
0から取りだされることになる。
れた信号を再び復号化するための基本的な本発明実施例
の高能率符号復号化装置を示している。
たMDCT係数は復号化装置入力端子122、124、
126に与えられ、使用されたブロックサイズ情報は入
力端子123、125、127に与えられる。復号化回
路116、117、118では適応ビット配分情報を用
いてビット割当を解除する。
15では周波数領域の信号が時間領域の信号に変換され
る。これらの部分帯域の時間領域信号は、IQMF回路
112、111により、全体域信号に復号化される。
bpsのビット配分と前記付加ビット配分の64kbp
sのそれぞれが上記復号化回路116、117、118
で復号化される。そしてこれらの2つの復号化部分は夫
々が復号化された後夫々の時間軸上サンプルが加算され
て精度の高いサンプルとなる。
113、114、115の各出力について基礎ビット配
分出力及び付加ビット配分をそれぞれ計算してから合成
し、IQMF回路112、111に送ることもできる。
8において基礎ビット配分及び付加ビット配分を正規化
処理を解いた後に加算し、それをIMDCT,IQMF
処理して最終出力を得るようにすることもできる。
たような本発明実施例の高能率符号化装置により符号化
された信号が記録若しくは伝送されるものであり、記録
メディアとしては例えば光ディスク,光磁気ディスク,
磁気ディスク等のディスク状の記録媒体に上記符号化信
号が記録されたものや、磁気テープ等のテープ状記録媒
体に上記符号化信号が記録されたもの、或いは、符号化
信号が記憶された半導体メモリ,ICカードなどを挙げ
ることができる。また、伝送メディアとしては、電線若
しくは光ケーブルや電波等を挙げることができる。
ータの並べ方については、図21に示すようになる。す
なわち、1つのシンクブロックは、シンク情報と、サブ
情報(スケールファクタ,ワードレングス)と、基礎ビ
ット配分と、付加ビット配分とからなるものとする。
数領域サンプルを量子化した後、1サンプルづつ単独
で、前段の量子化誤差を更に量子化するような少なくと
も1箇の量子化機能により、少なくとも2箇の語に分解
し、1つのシンクブロックの中に各量子化出力毎に分離
して記録若しくは伝送し、その後復号再生することは、
ビットレートを下げて再生する場合に除去すべきビット
列部分を一括して除去できるという点で有効である。
若しくは周波数領域サンプルを量子化した後、1サンプ
ルづつ単独で、前段の量子化誤差を更に量子化するよう
な少なくとも1箇の量子化機能により、少なくとも2箇
の語に分解し、1つのシンクブロックの中に各量子化出
力を周波数又は時間順に交互に記録若しくは伝送し、時
間領域サンプル若しくは周波数領域サンプルから復号再
生することは、ビットレートを下げて再生する場合に周
波数帯域を制限する形で除去すべきビット列部分を一括
して除去できるという点で有効である。
ィスクや光ディスクを用いた例えばいわゆるミニディス
ク(Mini Disc )や、磁気テ−プメディア、通信メディ
アなどに応用できる。
明においては以下の効果を得ることができる。すなわ
ち、 (1)エンコード時に使用されたビットレートよりも低
いビットレートを用いてデコードする時、例えばエンコ
ード側でエンコード処理後のビットの一部を別のデータ
転送用に流用するとき、音質劣化を最小に止める。 (2)既に低いビットレートで再生する再生機が使われ
ている時には、より高いビットレートを用いた音質の良
いシステムを導入するに当たっては既に用いられていた
低いビットレートで再生する再生機とバックワードの互
換性を有するシステムを提供できる。 (3)高価な記憶デバイス例えばICカードを用いた記
憶媒体に記録を行ないたいときに、記録時間を初期の設
定から延長したいときに記録済み若しくは記録中のエン
コード情報のビットレートを適宜減らして記録時間を延
ばし且つこの時の音質劣化を最小化できる。 (4)高音質のデコーダを、安価な通常良く使われるよ
りビットレートの低いビット配分を行うデコーダを複数
個使用して作成することができ、このことにより新たな
デコーダ用LSIの作成が不要となり安価に目的を達成
することが可能となる。
すブロック回路図である。
示す図である。
る。
方法を説明するための図である。
量を求める方法を説明するための図である。
スペクトルを示す図である。
クトル及びレベルに対する依存性を持たせた聴覚的な効
果を得るためのビット配分によるノイズスペクトルの例
を示す図である。
る。
クトル及びレベルに対する依存性を持たせた聴覚的な効
果を得るためのビット配分を用いたビット配分手法を示
す図である。
を示すブロック回路図である。
ルド算定機能の構成例を示すブロック回路図である。
ある。
ルドを示す図である。
ド、最小可聴限を示す図である。
号レベル依存及び聴覚許容雑音レベル依存のビット配分
を示す図である。
に対する信号レベル依存及び聴覚許容雑音レベル依存の
ビット配分を示す図である。
子化雑音レベルを示す図である。
雑音レベルを示す図である。
う具体的構成を示すブロック回路図である。
例を示すブロック回路図である。
の構成例を示す図である。
端子 116、117、118・・・適応ビット配分復号化回
路 113、114、115・・・IMDCT回路 112、111・・・IQMF回路 110・・・高能率復号化回路出力端子 520・・・許容雑音算出回路 521・・・許容雑音算出回路入力端子 522・・・帯域毎のエネルギ検出回路 523・・・畳込みフィルタ回路 524・・・引算器 525・・・n−ai関数発生回路 526・・・割算器 527・・・合成回路 528・・・減算器 530・・・許容雑音補正回路 532・・・最小可聴カーブ発生回路 533・・・補正情報出力回路 801・・・MDCT回路出力入力端子 802・・・使用可能総ビット発生回路 803・・・帯域毎のエネルギ算出回路 804・・・エネルギ依存のビット配分回路 805・・・聴覚許容雑音レベル依存のビット配分回路 806・・・アダー 807・・・各帯域のビット割当量出力端子 808・・・スペクトルの滑らかさ算出回路 809・・・ビット分割率決定回路 811、812・・・マルチプライヤ
Claims (37)
- 【請求項1】 入力信号の時間領域サンプル若しくは周
波数領域サンプルへのビット配分を行う高能率符号化装
置において、 上記時間領域サンプル若しくは周波数領域サンプルを量
子化した後、1サンプルづつ単独で、前段の量子化の量
子化誤差を更に量子化する少なくとも1箇の量子化手段
を有することにより、時間領域サンプル若しくは周波数
領域サンプルを少なくとも2箇の語に分解することを特
徴とする高能率符号化装置。 - 【請求項2】 前記量子化手段は四捨五入動作を行うこ
とを特徴とする請求項1記載の高能率符号化装置。 - 【請求項3】 少なくとも1つの前記量子化手段の出力
ビットレートを一定時間単位で一定ビットレートとする
ことを特徴とする請求項1又は2記載の高能率符号化装
置。 - 【請求項4】 全ての前記量子化手段の出力ビットレー
トを一定時間単位で一定ビットレートとすることを特徴
とする請求項3記載の高能率符号化装置。 - 【請求項5】 時間領域サンプル若しくは周波数領域サ
ンプルを、複数サンプル毎のブロックでブロックフロー
ティング処理し、前記前段の量子化の量子化誤差を更に
量子化するサンプルデータのためのスケールファクタ
を、少なくとも前段の量子化の量子化出力のためのスケ
ールファクタから求めることを特徴とする請求項1、
2、3、又は4記載の高能率符号化装置。 - 【請求項6】 前記前段の量子化の量子化誤差を更に量
子化するサンプルデータのためのスケールファクタを、
少なくとも前記前段の量子化の量子化出力のためのスケ
ールファクタ及びワードレングスから求めることを特徴
とする請求項5記載の高能率符号化装置。 - 【請求項7】 時間と周波数について細分化した小ブロ
ック中のサンプルデータに対しては、当該小ブロック内
で同一のブロックフローティング若しくは同一のブロッ
クフローティング及び語長をもつ量子化を行うことを特
徴とする請求項1、2、3、4、5、又は6記載の高能
率符号化装置。 - 【請求項8】 非ブロックで周波数分析を行う非ブロッ
ク化周波数分析によって、前記時間と周波数について細
分化した小ブロック中のサンプルデータを得ることを特
徴とする請求項7記載の高能率符号化装置。 - 【請求項9】 非ブロックで周波数分析を行う非ブロッ
ク化周波数分析によって前記時間と周波数について細分
化された小ブロック中のサンプルデータを得た後、上記
非ブロック化周波数分析の出力をブロック化して周波数
分析するブロック化周波数分析を行うことを特徴とする
請求項8記載の高能率符号化装置。 - 【請求項10】 前記非ブロック化周波数分析の周波数
帯域幅は少なくとも最低域の2帯域で同じであることを
特徴とする請求項9記載の高能率符号化装置。 - 【請求項11】 前記非ブロック化周波数分析はポリフ
ェーズ クワドラチャフィルタにより行うことを特徴と
する請求項8、9、又は10記載の高能率符号化装置。 - 【請求項12】 前記非ブロック化周波数分析の周波数
帯域幅は少なくとも最高域で高域程広いことを特徴とす
る請求項8、9、又は10記載の高能率符号化装置。 - 【請求項13】 前記非ブロック化周波数分析はクワド
ラチャ ミラー フィルタにより行うことを特徴とする
請求項8、9、10、又は12記載の高能率符号化装
置。 - 【請求項14】 前記ブロック化周波数分析はモディフ
ァイド離散コサイン変換であることを特徴とする請求項
9、10、11、12、又は13記載の高能率符号化装
置。 - 【請求項15】 前記ブロック化周波数分析は入力信号
の時間特性に基づいて適応的に上記ブロックのサイズを
変更して行うことを特徴とする請求項9、10、11、
12、13、又は14記載の高能率符号化装置。 - 【請求項16】 前記ブロックサイズの変更は少なくと
も2つの前記非ブロック化周波数分析の出力帯域毎に独
立に行うことを特徴とする請求項15記載の高能率符号
化装置。 - 【請求項17】 入力信号の時間領域サンプル若しくは
周波数領域サンプルへのビット配分を行って当該入力信
号を符号化し、この符号化した信号を記録媒体に記録す
る高能率符号化装置において、 上記時間領域サンプル若しくは周波数領域サンプルを量
子化した後、1サンプルづつ単独で、前段の量子化の量
子化誤差を更に量子化する少なくとも1箇の量子化手段
を有することにより、時間領域サンプル若しくは周波数
領域サンプルを少なくとも2箇の語に分解すると共に、
1つのシンクブロックの中に、全ての上記量子化手段の
出力サンプルをそれぞれ分離して、一定時間単位で記録
することを特徴とする高能率符号化装置。 - 【請求項18】 入力信号の時間領域サンプル若しくは
周波数領域サンプルへのビット配分を行って当該入力信
号を符号化し、この符号化した信号を記録媒体に記録す
る高能率符号化装置において、 上記時間領域サンプル若しくは周波数領域サンプルを量
子化した後、1サンプルづつ単独で前段の量子化の量子
化誤差を更に量子化する少なくとも1箇の量子化手段を
有することにより、時間領域サンプル若しくは周波数領
域サンプルを少なくとも2箇の語に分解すると共に、1
つのシンクブロックの中に、それぞれの上記量子化手段
の出力サンプルを上記量子化手段毎に時間順若しくは周
波数順に交互に記録することを特徴とする高能率符号化
装置。 - 【請求項19】 時間領域サンプル若しくは周波数領域
サンプルへのビット配分が行われて符号化された信号を
復号化する高能率符号復号化装置において、 上記時間領域サンプル若しくは周波数領域サンプルにつ
き、同一時間領域若しくは同一周波数領域のサンプルに
関する少なくとも2つの部分サンプルを合わせて1つの
サンプルとする合成手段を有することを特徴とする高能
率符号復号化装置。 - 【請求項20】 時間領域サンプル若しくは周波数領域
サンプルへのビット配分が行われて符号化された信号を
復号化する高能率符号復号化装置において、 上記時間領域サンプル若しくは周波数領域サンプルにつ
き、同一時間領域若しくは同一周波数領域のサンプルに
関する少なくとも2つの部分サンプルをそれぞれ別個に
全帯域幅領域の時間領域サンプルとした後合成して1つ
のサンプルとする合成手段を有することを特徴とする高
能率符号復号化装置。 - 【請求項21】 時間領域サンプル若しくは周波数領域
サンプルへのビット配分が行われて符号化された信号を
復号化する高能率符号復号化装置であって、 上記時間領域サンプル若しくは周波数領域サンプルにつ
き、同一時間領域若しくは同一周波数領域のサンプルに
関する少なくとも2つの部分サンプルをそれぞれ別個に
部分帯域幅領域の時間領域サンプルとした後、それぞれ
の部分帯域で前記部分サンプルを合わせて1つのサンプ
ルとし、さらに全帯域幅領域の時間領域サンプルへ合成
する合成手段を有することを特徴とする高能率符号復号
化装置。 - 【請求項22】 少なくとも1つの前記符号化された信
号のビットレートは、一定時間単位で一定ビットレート
であることを特徴とする請求項19、20、又は21記
載の高能率符号復号化装置。 - 【請求項23】 全ての前記符号化された信号のビット
レートは、一定時間単位で一定ビットレートであること
を特徴とする請求項22記載の高能率符号復号化装置。 - 【請求項24】 前記符号化された信号は、時間領域サ
ンプル若しくは周波数領域サンプルを複数サンプル毎の
ブロックでブロックフローティング処理し、前段の量子
化誤差を更に量子化したサンプルデータのためのスケー
ルファクタを、少なくとも上記時間領域サンプル若しく
は周波数領域サンプルを量子化した量子化出力のための
スケールファクタから求めたものであることを特徴とす
る請求項23記載の高能率符号復号化装置。 - 【請求項25】 時間と周波数について細分化された小
ブロック中の同一のブロックフローティング若しくは同
一のブロックフローティング及び語長をもつ量子化を行
ったサンプルデータを、復号化することを特徴とする請
求項19、20、21、22、23、又は24記載の高
能率符号復号化装置。 - 【請求項26】 前記時間と周波数について細分化され
た小ブロック中のサンプルデータから全帯域の時間信号
を得るために、非ブロックで周波数合成を行うことを特
徴とする請求項25記載の高能率符号復号化装置。 - 【請求項27】 前記時間と周波数について細分化され
た小ブロック中のサンプルデータに対して、ブロック化
して周波数合成するブロック化周波数合成を施した後、
当該ブロック化周波数合成の出力を前記非ブロック化周
波数合成の入力とし、前記非ブロック化周波数合成の出
力を得ることを特徴とする請求項26記載の高能率符号
復号化装置。 - 【請求項28】 前記非ブロック化周波数合成の周波数
帯域幅が少なくとも最低域の2帯域で同じであることを
特徴とする請求項26又は27記載の高能率符号復号化
装置。 - 【請求項29】 前記非ブロック化周波数合成はポリフ
ェーズ クワドラチャフィルタにより行うことを特徴と
する請求項26、27、又は28記載の高能率符号復号
化装置。 - 【請求項30】 前記非ブロック化周波数合成の周波数
帯域幅は少なくとも最高域で高域程広いことを特徴とす
る請求項26、27、又は28記載の高能率符号復号化
装置。 - 【請求項31】 前記ブロック化周波数合成は逆モディ
ファイド離散コサイン変換であることを特徴とする請求
項27、28、29、又は30記載の高能率符号復号化
装置。 - 【請求項32】 前記ブロック化周波数分析は入力信号
の時間特性に基づいて適応的に上記ブロックのサイズが
変更されてなるものであることを特徴とする請求項2
7、28、29、30、又は31記載の高能率符号復号
化装置。 - 【請求項33】 前記ブロックサイズの変更は少なくと
も2つの前記非ブロック化周波数合成の入力帯域毎に独
立に行うことを特徴とする請求項32記載の高能率符号
復号化装置。 - 【請求項34】 入力信号は複数チャネルからなり、 各チャネル毎の全ビット配分量は略各チャネルのスケー
ルファクタ又は短時間のブロック毎のサンプル最大値に
より決定されてなることを特徴とする請求項19、2
0、21、22、23、24、25、26、27、2
8、29、30、31、32、又は33記載の高能率符
号復号化装置。 - 【請求項35】 時間領域サンプル若しくは周波数領域
サンプルを量子化した後、1サンプルづつ単独で前段の
量子化の量子化誤差を更に量子化する少なくとも1箇の
量子化手段によって、少なくとも2箇の語に分解されて
いると共に、1つのシンクブロックの中に各量子化出力
毎に分離して記録媒体に記録がなされた、時間領域サン
プル若しくは周波数領域サンプルから、復号再生を行う
ことを特徴とする請求項19、20、21、22、2
3、24、25、26、27、28、29、30、3
1、32、33、又は34記載の高能率符号復号化装
置。 - 【請求項36】 時間領域サンプル若しくは周波数領域
サンプルを量子化した後、1サンプルづつ単独で前段の
量子化の量子化誤差を更に量子化する少なくとも1箇の
量子化手段によって、少なくとも2箇の語に分解されて
いると共に、1つのシンクブロックの中に各量子化出力
を周波数又は時間順に交互に記録媒体に記録がなされ
た、時間領域サンプル若しくは周波数領域サンプルか
ら、復号再生を行うことを特徴とする請求項19、2
0、21、22、23、24、25、26、27、2
8、29、30、31、32、33、又は34記載の高
能率符号復号化装置。 - 【請求項37】 請求項1、2、3、4、5記載の高能
率符号化装置により符号化された信号を記録若しくは伝
送することを特徴とするメディア。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP27938393A JP3227945B2 (ja) | 1993-11-09 | 1993-11-09 | 符号化装置 |
CN94191140A CN1111959C (zh) | 1993-11-09 | 1994-11-09 | 量化装置、量化方法、高效率编码装置、高效率编码方法、解码装置和高效率解码装置 |
US08/464,787 US5774844A (en) | 1993-11-09 | 1994-11-09 | Methods and apparatus for quantizing, encoding and decoding and recording media therefor |
PCT/JP1994/001888 WO1995013660A1 (fr) | 1993-11-09 | 1994-11-09 | Appareil de quantification, procede de quantification, codeur a haute efficacite, procede de codage a haute efficacite, decodeur, supports d'enregistrement et de codage a haute efficacite |
EP95900276A EP0692881B1 (en) | 1993-11-09 | 1994-11-09 | Quantization apparatus, quantization method, high efficiency encoder, high efficiency encoding method, decoder, high efficiency encoder and recording media |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP27938393A JP3227945B2 (ja) | 1993-11-09 | 1993-11-09 | 符号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07135470A true JPH07135470A (ja) | 1995-05-23 |
JP3227945B2 JP3227945B2 (ja) | 2001-11-12 |
Family
ID=17610381
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP27938393A Expired - Fee Related JP3227945B2 (ja) | 1993-11-09 | 1993-11-09 | 符号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3227945B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4609097B2 (ja) * | 2005-02-08 | 2011-01-12 | ソニー株式会社 | 音声符号化装置及び方法、並びに音声復号装置及び方法 |
JP4635709B2 (ja) * | 2005-05-10 | 2011-02-23 | ソニー株式会社 | 音声符号化装置及び方法、並びに音声復号装置及び方法 |
-
1993
- 1993-11-09 JP JP27938393A patent/JP3227945B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP3227945B2 (ja) | 2001-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5774844A (en) | Methods and apparatus for quantizing, encoding and decoding and recording media therefor | |
JP3404837B2 (ja) | 多層符号化装置 | |
US6104321A (en) | Efficient encoding method, efficient code decoding method, efficient code encoding apparatus, efficient code decoding apparatus, efficient encoding/decoding system, and recording media | |
JP3278900B2 (ja) | データ符号化装置及び方法 | |
JP2756515B2 (ja) | 可聴信号の知覚符号化方法および音声信号伝送方法 | |
US5737718A (en) | Method, apparatus and recording medium for a coder with a spectral-shape-adaptive subband configuration | |
JP3153933B2 (ja) | データ符号化装置及び方法並びにデータ復号化装置及び方法 | |
US6097880A (en) | Digital signal processing method, digital signal processing apparatus, digital signal recording method, digital signal recording apparatus, recording medium, digital signal transmission method and digital signal transmission apparatus | |
JP3250376B2 (ja) | 情報符号化方法及び装置並びに情報復号化方法及び装置 | |
JP3318931B2 (ja) | 信号符号化装置、信号復号化装置及び信号符号化方法 | |
JPH0846517A (ja) | 高能率符号化及び復号化システム | |
US6647063B1 (en) | Information encoding method and apparatus, information decoding method and apparatus and recording medium | |
JP3227948B2 (ja) | 復号化装置 | |
JP3227945B2 (ja) | 符号化装置 | |
JP3291948B2 (ja) | 高能率符号化方法及び装置、並びに伝送媒体 | |
JP3879250B2 (ja) | エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置 | |
WO1995016263A1 (fr) | Procede, dispositif et support concernant le traitement de l'information | |
JPH08123488A (ja) | 高能率符号化方法、高能率符号記録方法、高能率符号伝送方法、高能率符号化装置及び高能率符号復号化方法 | |
JP3318824B2 (ja) | デジタル信号符号化処理方法、デジタル信号符号化処理装置、デジタル信号記録方法、デジタル信号記録装置、記録媒体、デジタル信号伝送方法及びデジタル信号伝送装置 | |
JP2002050967A (ja) | 信号記録媒体 | |
JP3879249B2 (ja) | エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置 | |
JPH06324093A (ja) | オーディオ信号のスペクトル表示装置 | |
JPH07336231A (ja) | 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体 | |
JPH07181996A (ja) | 情報処理方法、情報処理装置、及びメディア | |
JPH07161140A (ja) | ディジタルオーディオ信号の伝送装置及び受信装置、並びにディジタルオーディオ信号の伝送方法及び受信方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20010807 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080907 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090907 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090907 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100907 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110907 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120907 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130907 Year of fee payment: 12 |
|
LAPS | Cancellation because of no payment of annual fees |