WO1995013660A1

WO1995013660A1 - Appareil de quantification, procede de quantification, codeur a haute efficacite, procede de codage a haute efficacite, decodeur, supports d'enregistrement et de codage a haute efficacite

Info

Publication number: WO1995013660A1
Application number: PCT/JP1994/001888
Authority: WO
Inventors: Kenzo Akagiri
Original assignee: Sony Corporation
Priority date: 1993-11-09
Filing date: 1994-11-09
Publication date: 1995-05-18
Also published as: EP0692881A4; CN1117776A; US5774844A; EP0692881A1; CN1111959C; EP0692881B1

Description

明細書量子化装置、量子化方法、高能率符号化装置、高能率符号化方法、複号化装置、高能率符号復号化装置及び記録メディア技術分野本発明は、映画フィルム呋写システム、ビデオテープレコーダ、ビデオディスクプレーヤ等のステレオや、いわゆるマルチサラウンド音饗システムにおいて用いられるビットレー卜の削減を行ういわゆる高能率符号化装置及び高能率符号化方法と、それらに用いられる量子化装置及び量子化方法と、量子化装置又は高能率符号化装置により量子化された信号が記録された記録メディアと、当該記録メディァから再生された量子化された信号を復号化する高能率符号復号化装置と、それに用いられる復号化装置に関するものである。背景技術オーディォ或いは音声等の信号の高能率符号化の手法及び装置には種々のものがあるが、例えば、時間領域のオーディオ信号等を単位時間毎にプロック化して、このブロック毎の時間軸の信号を周波数軸上の信号に変換（直交変換）して複数の周波数帯域に分割し、各帯域毎に符号化するプロック化周波数帯域分割方式であるいわゆる変換符号化方式や、時間領域のオーディォ信号等を単位時間毎にプロック化しないで、複数の周波数帯域に分割して符号化する非ブ口ック化周波数帯域分割方式である帯域分割符号化（サブ ·バンド • コーディング： S B C) 方式等を挙げることができる。また、上述の帯域分割符号化方式と変換符号化方式とを組み合わせた高能率符号化の手法及び装置も考えられており、この場合には、例えば、上記帯域分割符号化方式で帯域分割を行った後、該各帯域毎の信号を上記変換符号化方式で周波数領域の信号に直交変換し、この直交変換された各帯域毎に符号化を施すことになる。

ここで、上述した帯域分割符号化方式に使用される帯域分割用フィルタとしては、例えば QMF (Quadrature Mirror filter)等のフイルクがあり、これは 1976 R. E. Crochiere Digital coding of sp eech in subbands Bell Syst. Tech. J. Vol.55, No.8 1976 に述べられている。また、 ICASSP 83, BOSTON Polyphase Quadrature f i 1 ters-A new subband coding technique Joseph H. Rothwe i ler には、ポリフヱーズクヮドラチヤフィルタ（Polyphase Quadratur e filter) などの等バンド幅のフィルタ分割手法及び装置が述べられている。

また、上述した直交変換としては、例えば、入力オーディオ信号を所定単位時間（フレーム）でブロック化し、該ブロック毎に高速フ一リェ変換（F F T) 、離散コサイン変換（D C T) 、モディファィド D C T変換（MD C T) などを行うことで時間軸を周波数軸に変換するような直交変換がある。上記 MD C Tについては、 ICAS SP 1987 Subband/Transform Coding Using Filter Bank Designs B ased on Time Domain Aliasing Cancellation J. P. Pr incen A. B. B radley Univ. of Surrey Royal Melbourne Inst, of Tech.に; ベられている。さらに、周波数帯域分割された各周波数成分を量子化する場合の周波数分割幅としては、例えば人間の聴覚特性を考慮した帯域分割がある。すなわち、一般に臨界帯域（クリティカルバンド）と呼ばれている高域程帯域幅が広くなるような帯域幅で、オーディォ信号を複数（例えば 2 5バント）の帯域に分割することがある。また、このときの各帯域毎のデータを符号化する際には、各帯域毎に所定のビット配分或いは、各帯域毎に適応的なビット配分を行って、符号化が行われる。例えば、上記 MD C T処理されて得られた MD C T係数データを上記ビット配分によって符号化する際には、上記各ブロック毎の MD C T処理により得られる各帯域毎の MD C T係数データに対して、適応的な配分ビット数で符号化を行うことになる。上記ビット配分手法及びそのための装置としては、次の 2手法及び装置が知られている。

IEEE Transactions of Accoustics, Speech, and Signal Processi ng, VO1.ASSP-25. NO.4, August 1977 には、各帯域毎の信号の大きさをもとに、ビット配分を行うことが述べられている。また、 ICASSP 1980 The critical band coder -- digital encoding of the perc eptual requirements of the auditory system M. A. Kransner MIT には、聴覚マスキングを利用することで、各帯域毎に必要な信号対雑音比を得て固定的なビット配分を行う手法及び装置が述べられている。

しかし、これらのビット配分技術は、再生側（デコード側）においてある一定ビットレートで再生（デコ一ド）が行われることを期待したものであり、したがって、当該一定ビットレー卜を下回るビットレートでデコードを行った場合には著しい音質劣化をもたらす。すなわち、ェンコ一ド時に使用されたビットレートよりも低いビットレートを用いてデコードするために、例えばェンコード側でェンコード処理後のビッ卜の一部を別のデータ転送に流用するような場合は、デコード側においてェンコ一ド時のビットレ一トを下回るビットレー卜でデコードが行われることになるため、上記デコ一ド側においてェンコ一ド時のビットレー卜でデコードすることを期待する上述の既知のビット配分技術では、再生（デコ一ド）時に著しい音質劣化をもたらすようになる。

また、例えば既に低いビットレートで再生する再生機が使われているような場合において、より高いビットレートを用いた音質の良いシステムを導入しょうとしても、上記既に用いられている低いビットレ一卜で再生を行う再生機では良好な再生を行なうことが出来ない。

すなわち、従来のビット配分技術においては、バックワードの互換性が無かった。

また、音声、オーディオ等の信号を符号化した情報を例えばいわゆる I Cカードのような記憶デバイスを用いた記憶媒体に記録させるような場合においては、当該記憶デバィスが高価であることから- より長時間の記録がなされることが望まれ、また、音質劣化も最小とすることが望まれる。発明の開示本発明の目的は、上述のような音質劣化を最小に止めることができ、またバックヮードの互換性をも有する高能率符号化装置及び高能率符号化方法と、それらに用いられる量子化装置及び量子化方法と、これらに対応する高能率符号復号化装置、復号化装置及び記録メディアとからなるシステムを提供することである。

また、本発明の目的は、高価な記憶デバイスを用いた記憶媒体に記録を行うような場合において、長時間記録のために、例えば記録時間を初期の設定から延長するために、記録済み若しくは記録中のェンコ一ド情報のビットレートを適宜減らして記録時間を延ばし、且つこのときの音質劣化を最小とすることができる高能率符号化装置及び高能率符号化方法と、これらに用いられる量子化装置及び量子化方法と、これらに対応する高能率符号復号化装置、複号化装置及び記録メディアを提供することである。

さらに、本発明の目的は、本発明の量子化装置又は高能率符号化装置によって量子化された信号の再生装置（記録メディァから信号を再生して復号化する復号化装置又は高能率符号復号化装置）を構成する場合において、例えば、安価な通常良く使われる固定値以下のビットレートを用いてビット配分を行うデコーダを複数個使用して作成することができ、このことにより新たなデコーダ用 L S I (大規模集積回路）の作成を不要としてコストを抑えることができる安価な複号化装置又は高能率符号復号化装置を提供することである。

本発明は、上述の目的を達成するために提案されたものであり、本発明の量子化装置は、オーディオ、音声又は画像時間信号を、フィルタで周波数分解した時間領域サンプル若しくは周波数分解した時間領域サンプルを直交変換するか直接入力時間信号を直交変換した周波数領域サンプルを、量子化した後、 1 サンプルづっ単独で、前段の量子化誤差を更に量子化するような少なくとも 1個の量子化機能により、時間領域サンプル若しくは周波数領域サンプルを少なぐとも 2個の語に分解する。このとき、各語の語長を事前に決めておくことは、語長情報をエンコーダ（量子化装置）からデコーダ (復号化装置）に送付する必要がなくビットレート低減に有効である。もちろん語長情報を送って適応的な語長とすることもできる。これらの量子化において四捨五入動作を行い、量子化誤差を小さくする。

また、本発明の量子化装置では、少なくとも一つの量子化機能の出力ビットレートをある一定時間単位で一定ビットレートとしたり、全ての上記量子化機能の出力ビットレートをある一定時間単位で一定ビットレートとする。これらの場合、時間領域サンプル若しくは周波数領域サンプルを、複数サンプル毎にブロックフローティングし、上記前段の量子化誤差を更に量子化したサンプルデータのためのスケールファクタを、少なくとも当該前段の量子化出力のためのスケールファクタから求める。

また、本発明の量子化装置では、時間領域サンプル若しくは周波数領域サンプルを、複数サンプル毎にプロックフローティングし、上記前段の量子化誤差を更に量子化したサンプルデータのためのスケ一ルファクタを、少なくとも上記前段の量子化出力のためのスケールファクタ及びヮードレングスから求める。

以上の場合、時間と周波数について細分化された小プロック中のサンプルデータに対しては、上記小プロック内で同一のプロックフローティング及び語長をもつ量子化を行なう。また、上記時間と周波数について細分化された小プロック中のサンプルを得るためには、フィルタなどの非プロック化周波数分析を行った後、上記フィルタなどの非プロック化周波数分析の出力を直交変換等のブロック化周波数分析する。このとき、上記非ブロック化周波数分析の周波数帯域幅が少なくとも最低域の 2帯域で同じであることは、コストを低減するうえで役に立つ。また、上記非ブロック化周波数分析の周波数帯域幅が少なくとも最高域で高域程広いことは、臨界帯域に基づく聴覚の効果を利用するうえで重要である。さらに、上記ブロック化周波数分析では、入力信号の時間特性により適応的にそのプロックサイズを変更することにより、入力信号の時間特性に対応した最適な処理が可能となる。ここで、上記ブロックサイズの変更は、少なくとも 2つの上記非プロック化周波数分析の出力帯域ごとに独立に行うことは、周波数成分の間の相互干渉を防いで各帯域成分独立に最適な処理を行う上で効果的である。

また、各チャネルに与えられるビット配分量を各チャネルのスケールファクタ又はサンプル最大値により決めるのは、簡単な演算によるため、演算を低減させるうえで効果的である。これに加えて、各チャネルのスケールファクタで代表される振幅情報の時間的変化によつて各チヤネルに与えられるビット配分量を変化させることも、ビッ卜レートを下げるうえでは有益である。

さらに、本発明の量子化装置は、時間領域サンプル若しくは周波数領域サンプルを量子化した後、 1サンプルづっ単独で、前段の量子化誤差を更に量子化するような少なくとも 1個の量子化機能により、少なくとも 2個の語に分解し、 1つのシンクプロックの中に各量子化出力毎に分離する。その後、この量子化出力を、本発明の記録メディァに記録し、これを本発明の復号化装置によって復号再生する。

また、本発明の他の量子化装置は、時間領域サンプル若しくは周波数領域サンプルを量子化した後、 1サンプルづっ単独で、前段の量子化誤差を更に量子化するような少なくとも 1個の量子化機能により、少なくとも 2個の語に分解する。その後、本発明の記録メディァに対して、 1つのシンクブロックの中に各量子化出力を周波数又は時間順に交互に記録し、更にその後本発明の復号化装置では、これらの時間領域サンプル若しくは周波数領域サンプルから復号再生する。

また、本発明の量子化方法では、入力信号の時間領域若しくは周波数領域の所定サンプルを量子化して第 1の量子化値を生成し、上記所定サンプルと上記第 1の量子化値との量子化誤差を演算し、上記量子化誤差を 1サンプルづっ単独で量子化して第 2の量子化値を生成する。

また、本発明の量子化方法では、上記第 1の量子化値及び上記第 2の量子化値の少なくとも一方を四捨五入動作による量子化により生成する。

また、本発明の量子化方法では、上記第 ¹.の量子化値及び上記第 2の量子化値の少なくとも一方を一定ビットレートで出力する。また、本発明の量子化方法では、上記第 1の量子化値及び上記第 2の量子化値の総和が一定ビットレートとなるように出力する。また、本発明の量子化方法では、上記所定サンプルを複数のサンプルからなるブロック毎に第 1のスケールファクタを用いてブロックフローティング処理し、上記量子化誤差を上記第 1 のスケールファクタに基づいて求められた第 2のスケールファク夕で正規化する。また、本発明の量子化方法では、上記第 2のスケールファクタを上記第 1のスケールファクタ及び上記第 1の量子化値を生成する際のワードレングスに基づいて求める。

また、本発明の量子化方法では、時間と周波数について細分化した小プロック中のサンプルデータに対しては、当該小プロック内で同一のスケールファク夕及びヮードレングスで正規化及び量子化を行う。

本発明の高能率符号化装置は、オーディオ、音声又は面像時間信号を、フィルタで周波数分解した時間領域サンプル若しくは周波数分解した時間領域サンプルを直交変換するか直接入力時間信号を直交変換した周波数領域サンプルを、量子化した後、 1 サンプルづっ単独で、前段の量子化誤差を更に量子化するような少なくとも 1個の量子化機能により、時間領域サンプル若しくは周波数領域サンプルを少なくとも 2個の語に分解する。このとき、各語の語長を事前に決めておくことは、語長情報をエンコーダ（符号化装置）からデコーダ（複号化装置）に送付する必要がなくビットレート低減に有効である。もちろん語長情報を送って適応的な語長とすることもできる。これらの量子化において四捨五入動作を行い、量子化誤差を小さくする。

また、本発明の高能率符号化装置では、少なくとも一つの量子化機能の出力ビットレートをある一定時間単位で一定ビットレートとしたり、全ての上記量子化機能の出力ビットレートをある一定時間単位で一定ビットレートとする。これらの場合、時間領域サンプル若しくは周波数領域サンプルを、複数サンプル毎にプロックフローティングし、上記前段の量子化誤差を更に量子化したサンプルデ一夕のためのスケールファクタを、少なくとも当該前段の量子化出力のためのスケールファクタから求める。

また、本発明の高能率符号化装置では、時間領域サンプル若しくは周波数領域サンプルを、複数サンプル毎にプロックフローティングし、上記前段の量子化誤差を更に量子化したサンプルデータのためのスケールファクタを、少なくとも上記前段の量子化出力のためのスケールファクタ及びヮードレングスから求める。

以上の場合、時間と周波数について細分化された小プロック中のサンプルデータに対しては、上記小プロック内で同一のプロックフローティング及び語長をもつ量子化を行なう。また、上記時間と周波数について細分化された小プロック中のサンプルを得るためには、フィルタなどの非プロック化周波数分析を行った後、上記フィルタなどの非プロック化周波数分析の出力を直交変換等のプロック化周波数分析する。このとき、上記非ブロック化周波数分析の周波数帯域幅が少なくとも最低域の 2帯域で同じであることは、コストを低減するうえで役に立つ。また、上記非ブロック化周波数分析の周波数帯域幅が少なくとも最高域で高域程広いことは、臨界帯域に基づく聴覚の効果を利用するうえで重要である。さらに、上記ブロック化周波数分析では、入力信号の時間特性により適応的にそのブロックサイズを変更することにより、入力信号の時間特性に対応した最適な処理が可能となる。ここで、上記ブロックサイズの変更は、少なくとも 2つの上記非プロック化周波数分析の出力帯域ごとに独立に行うことは、周波数成分の間の相互干渉を防いで各帯域成分独立に最適な処理を行う上で効果的である。

また、各チャネルに与えられるビット配分量を各チャネルのスケ —ルファクタ又はサンプル最大値により決めるのは、簡単な演算によるため、演算を低減させるうえで効果的である。これに加えて、各チャネルのスケールファクタで代表される振幅情報の時間的変化によって各チヤネルに与えられるビット配分量を変化させることも、ビットレートを下げるうえでは有益である。

さらに、本発明の高能率符号化装置は、時間領域サンプル若しくは周波数領域サンプルを量子化した後、 1サンプルづっ単独で、前段の量子化誤差を更に量子化するような少なくとも 1個の量子化機能により、少なくとも 2個の語に分解し、 1つのシンクブロックの中に各量子化出力毎に分離して、本発明のメディアに記録し、これを本発明の高能率符号複号化装置によって復号再生する。

また、本発明の他の高能率符号化装置は、時間領域サンプル若しくは周波数領域サンプルを量子化した後、 1サンプルづっ単独で、前段の量子化誤差を更に量子化するような少なくとも 1個の量子化機能により、少なくとも 2個の語に分解する。その後、本発明の記録メディァに対して、 1つのシンクプロックの中に各量子化出力を周波数又は時間順に交互に記録し、その後本発明の高能率符号復号化装置では、これらの時間領域サンプル若しくは周波数領域サンプルから復号再生する。

本発明の高能率符号化方法では、総ビット配分を基礎ビット配分と付加ビット配分に分割し、上記入力信号の時間領域若しくは周波数領域の所定サンプルを上記基礎ビット配分に基づくワードレングスで量子化して第 1の量子化値を生成し、上記所定サンプルと上記第 1の量子化値との量子化誤差を演算し、上記量子化誤差を 1 サンプルづっ単独で量子化して第 2の量子化値を上記付加ビッ卜配分と 1. 2

して生成する。

また、本発明の高能率符号化方法では、上記第 1の量子化値及び上記第 2の量子化値の少なくとも一方を四捨五入動作による量子化により生成する。

また、本発明の高能率符号化方法では、上記第 1の量子化値及び上記第 2の量子化値の少なくとも一方を一定ビットレ一卜で出力する。

また、本発明の高能率符号化方法では、上記第 1の量子化値及び上記第 2の量子化値の総和が一定ビットレ一トとなるように出力すまた、本発明の高能率符号化方法では、上記所定サンプルを複数のサンプルからなるブロック毎に第 1のスケールファクタを用いてブロックフローティング処理し、上記量子化誤差を上記第 1のスケ —ルファクタに基づいて求められた第 2のスケールファク夕で正規化する。

また、本発明の高能率符号化方法では、上記第 2のスケールファクタを上記第 1 のスケールファクタ及び上記第 1 の量子化値を生成する際のヮードレングスに基づいて求める。

また、本発明の高能率符号化方法では、時間と周波数について細分化した小プロック中のサンプルデータに対しては、当該小プロック内で同一のスケールファクタ及びヮ一ドレングスで正規化及び量子化を行う。

そして、本発明によれば、時間領域サンプル若しくは周波数領域サンプルを量子化した後、 1サンプルづっ単独で、前段の量子化誤差を更に量子化するような少なくとも 1個の量子化機能により、時間領域サンプル若しくは周波数領域サンプルを少なくとも 2個の語に分解する。このとき、量子化された各語の語長を事前に決めておくことは、語長情報をエンコーダからデコーダに送付する必要がなく、ビットレート低減に有効である。もちろん、語長情報を送って適応的な語長とすることもできる。また、これらの量子化において四捨五入動作を行うことは、量子化誤差を小さくする上で有効である。

また、少なくとも 1つの量子化機能の出力ビットレートをある一定時間単位で一定ビットレ一トとすることや、全ての上記量子化機能の出力ビットレートをある一定時間単位で一定ビットレートとすることは、ディスク、テープ等の記録媒体への記録方式を簡単化するうえで有効である。

また、以上の場合、時間と周波数について細分化された小ブロック中のサンプルデータを上記小ブロック内では同一のプロックフ口 —ティング及び語長を持って量子化することは、効率的な高能率符号を実現するうえで有効である。これらの場合、時間領域サンプル若しくは周波数領域サンプルを複数サンプル毎にプロックフローティングし、上記前段の量子化誤差を更に量子化したサンプルデータのためのスケールファクタを少なくとも上記前段の量子化出力のためのスケールファクタから求めることや、上記前段の量子化誤差を更に量子化したサンプルデータのためのスケールファク夕を少なくとも上記前段の量子化出力のためのスケールファクタ及びワードレングスから求めることは、高能率符号の効率を高めるうえで有効である。

さらに、時間と周波数について細分化された小プロック中のサンプルを得るために、フィル夕などの非プロック化周波数分析を行なつた後、このフィルタなどの非プロック化周波数分析の出力を直交変換等のブロック化周波数分析をすることにより、時間領域、周波数領域で聴覚マスキングを考慮した量子化雑音の発生が可能となり、聴覚上好ましい周波数分析を得ることが可能となる。このとき、上記非プロック化周波数分析の周波数帯域幅が少なくとも最低域の 2 帯域で同じであることはコスト _ 1.を低減するうえで役に立つ。また、

4

この非プロック化周波数分析の周波数帯域幅を少なくとも最高域で高域程広くすることにより、臨界帯域に基づく聴覚の効果を効率的に利用することが可能となる。このブロック化周波数分析は、入力信号の時間特性により適応的にそのプロックサイズが変更されることにより入力信号の時間特性に対応した最適な処理が可能となる。また、プロックサイズの変更は少なくとも 2つの上記非プロック化周波数分析の出力帯域毎に独立に行うことは、周波数成分の間の相互干渉を防いで各帯域成分独立に最適な処理を行う上で効果的である。

さらに、チャネルビッ卜配分を各チャネルのスケールファクタによって計算することにより、ビット配分計算の簡易化を図ることができる。また、時間領域サンプル若しくは周波数領域サンプルを量子化した後、 1サンプルづっ単独で、前段の量子化誤差を更に量子化するような少なくとも 1個の量子化機能により、少なくとも 2個の語に分解し、 1つのシンクブロックの中に各量子化出力毎に分離して記録して、復号再生することは、ビットレ一トを下げて再生する場合に除去すべきビット列部分を一括して除去できるという点で有効である。また、時間領域サンプル若しくは周波数領域サンプルを量子化した後、 1サンプルづっ単独で、前段の量子化誤差を更に量子化するような少なくとも 1個の量子化機能により、少なくとも 2個の語に分解し、 1つのシンクブロックの中に各量子化出力を周波数又は時間順に交互に記録し、時間領域サンプル若しくは周波数領域サンプルから復号再生することは、ビットレートを下げて再生する場合に周波数帯域を制限する形で除去すべきビット列部分を一括して除去できるという点で有効である。図面の簡単な説明図 1は、本発明実施例の量子化装置が適用される高能率符号化装置の構成例を示すプロック回路図である。

図 2は、本実施例装置での信号の周波数及び時間分割を示す図である。

図 3は、本実施例のビット配分ストラテジを示す図である。

図 4は、トーナリティをスケールファクタから計算する方法を説明するための図である。

図 5は、トーナリティからビット配分（1) のビット配分量を求める方法を説明するための図である。

図 6は、ビット配分（2) において均一配分の時のノイズスぺクトルを示す図である。

図 7は、ビット配分（2) において情報信号の周波数スペクトル及びレベルに対する依存性を持たせた聴覚的な効果を得るためのビット配分によるノィズスペクトルの例を示す図である。図 8は、ビット配分（2) において均一配分を示す図である。図 9は、ビット配分（2) において情報信号の周波数スペクトル及びレベルに対する依存性を持たせた聴覚的な効果を得るためのビット配分を用いたビット配分手法を示す図である。

図 1 0は、本発明実施例の基礎ビット配分機能の構成例を示すブロック回路図である。

図 1 1 は、本発明実施例の聴覚マスキングスレツショールド算定機能の構成例を示すプロック回路図である。

図 1 2は、各臨界帯域信号によるマスキングを示す図である。図 1 3は、各臨界帯域信号によるマスキングスレショ一ルドを示す図である。

図 1 4は、情報スぺクトル、マスキングスレショ一ルド、最小可聴限を示す図である。

図 1 5は、信号スぺクトルが平坦な情報信号に対する信号レベル依存及び聴覚許容雑音レベル依存のビッ卜配分を示す図である。図 1 6は、信号スぺクトルのトナリティが高い情報信号に対する信号レベル依存及び聴覚許容雑音レベル依存のビット配分を示す図である。

図 1 7は、信号スぺクトルが平坦な情報信号に対する量子化雑音レベルを示す図である。

図 1 8は、トーナリティが高い情報信号に対する量子化雑音レべルを示す図である。

図 1 9は、基礎ビット配分と付加ビット配分の分割を行う具体的構成を示すプロック回路図である。

図 2 0は、本発明実施例の復号化装置の構成例を示すプロック回路図である。

図 2 1 は、本発明実施例の記録メディァにおけるビット配列の構成例を示す図である。発明を実施するための最良の形態以下、本発明の実施例について図面を参照しながら説明する。本実施例は、オーディオ P C M信号等の入力ディジタル信号を帯域分割符号化（S B C ) 、適応変換符号化（A T C ) 、及び適応ビット配分（A P C - A B ) の各技術を用いて高能率符号化する高能率符号化装置に、本発明を適用したものである。図 1は、この本発明を適用した高能率符号化装置の具体的な構成を示す図である。図 1に示す高能率符号化装置では、入力ディジタル信号をフィル夕などにより複数の周波数帯域に分割すると共に、各周波数帯域毎に直交変換を行って、得られた周波数軸のスぺクトルデータを、後述する人間の聴覚特性を考慮したいわゆる臨界帯域幅（クリティカルバンド）毎に適応的にビット配分して符号化している。このとき- 高域では臨界帯域幅を更に分割した帯域を用いる。もちろんフィル夕などによる非プロッキングの周波数分割幅は等分割幅としてもよい

さらに、この高能率符号化装置においては、直交変換の前に入力信号に応じて適応的にブロックサイズ（ブロック長）を変化させると共に、クリティカルバンド単位若しくは高域では臨界帯域幅（クリティカルバンド）を更に細分化したプロックでフローティング処理を行っている。なお、このクリティカルバンドとは、人間の聴覚特性を考慮して分割された周波数帯域であり、ある純音の周波数近傍の同じ強さの狭帯域バンドのノィズによって当該純音がマスクされるときのそのノィズが有する帯域のことである。このクリティカルバンドは、高域ほど帯域幅が広くなつており、例えば 0~2 0 k H zの全周波数帯域は例えば 2 5のクリティカルバンドに分割される。

すなわち、図 1において、入力端子 1 0には例えば 0〜 2 2 k H zのオーディオ P CM信号が供給されている。この入力信号は、例えばいわゆる QMFなどの帯域分割フィルタ 1 1により 0 ~ 1 l k H z帯域と 1 1 k ~ 2 2 k H z帯域とに分割され、 0〜 1 1 k H z 帯域の信号は同じくいわゆる QMF等の帯域分割フィルタ 1 2により 0〜5. 5 kH z帯域と 5. 5 k〜 1 1 k H z帯域とに分割される。

上記帯域分割フィルタ 1 1からの l l k~2 2 kH z帯域の信号は、直交変換回路の一例である MD C T (Modified Discrete Cosi ne Transform) 回路 1 3に送られ、上記帯域分割フィルタ 1 2からの 5. 5 k~ 1 1 k H z帯域の信号は MD C T回路 1 4に送られ、上記帯域分割フィルタ 1 2からの 0〜 5. 5 kH z帯域の信号は M D C T回路 1 5に送られる。そして、これらの信号は、そこでそれぞれ M D C T処理される。なお、各 MD CT回路 1 3、 1 4、 1 5 では、各帯域毎に設けたプロック決定回路 1 9、 2 0、 2 1により決定されたプロックサイズに基づいて MD C T処理がなされる。ここで、上記ブロック決定回路 1 9、 2 0、 2 1により決定される各 MD CT回路 1 3、 1 4、 1 5でのブロックサイズの具体例を図 2 A及び 2 Bに示す。なお、図 2 Aには直交変換プロックサイズ 1. 9一

が長い場合（ロングモードにおける直交変換ブロックサイズ）を、図 2 Bには直交変換プロックサイズが短い場合（ショートモードにおける直交変換ブロックサイズ）を示ししている。

この図 2の具体例においては、 3つのフィルタ出力に対しては、それぞれ 2つの直交変換プロックサイズが用いられる。すなわち、低域側の 0〜5. 5 k H z帯域の信号及び中域の 5. 5 k〜l ik H z帯域の信号に対しては、長いブロック長の場合（図 2 A) は 1 ブロック内のサンプル数を 1 2 8サンプルとし、短いブロックが選ばれた場合（図 2 B) には 1プロック内のサンプル数を 3 2サンプル毎のプロックとしている。これに対して高域側の 1 1 k~ 2 2 k H z帯域の信号に対しては、長いブロック長の場合（図 2の A) は 1ブロック内のサンプル数を 2 5 6サンプルとし、短いブロックが選ばれた場合（図 2の B) には 1ブロック内のサンプル数を 3 2サンプル毎のプロックとしている。このようにして短いプロックが選ばれた場合には各帯域の直交変換ブロックのサンプル数を同じとして高域程時間分解能を上げ、なおかつプロック化に使用するウインドウの種類を減らしている。

なお、上記ブロック決定回路 1 9、 2 0、 2 1で決定されたプロックサイズを示す情報は、後述の適応ビット配分符号化回路 1 6、 1 7、 1 8に送られると共に、出力端子 2 3、 2 5、 2 7から出力される。

再び図 1において、各 MD C T回路 1 3、 1 4、 1 5にて MD C T処理されて得られた周波数領域のスぺクトルデータあるいは MD C T係数データは、いわゆる臨界帯域（クリティカルバンド）または高域では更にクリティカルバンドを分割した帯域毎にまとめられ一 2. 0—

て、適応ビット配分符号化回路 1 6、 1 7、 1 8に送られている。適応ビット配分符号化回路 1 6、 1 7、 1 8では、上記ブロックサイズの情報、及び臨界帯域（クリティカルバンド）または高域では更にクリティカルバンドを分割した帯域毎に割り当てられたビット数に応じて各スぺクトルデータ（あるいは M D C T係数データ）を再量子化（正規化して量子化）するようにしている。

これら各適応ビット配分符号化回路 1 6、 1 7、 1 8によって符号化されたデータは、出力端子 2 2、 2 4、 2 6を介して出力される。また、当該適応ビット配分符号化回路 1 6、 1 7、 1 8では、どのような信号の大きさに関する正規化がなされたかを示すスケールファクタと、どのようなビット長で量子化がされたかを示すビッ卜長情報も求めており、これらも同時に出力端子 2 2、 2 4、 2 6 から出力される。

また、図 1 における各 M D C T回路 1 3、 1 4、 1 5の出力からは、上記臨界帯域（クリティカルバンド）または高域では更にクリティカルバンドを分割した帯域毎のエネルギを、例えば当該バンド内での各振幅値の 2乗平均の平方根を計算すること等により求められる。もちろん、上記スケールファクタそのものを以後のビット配分のために用いるようにしてもよい。この場合には新たなエネルギ計算の演算が不要となるため、ハード規模の節約となる。また、各バンド毎のエネルギの代わりに、振幅値のピーク値、平均値等を用いることも可能である。

つぎに、上記ビット配分を行うための適応ビット配分符号化回路 1 3、 1 4、 1 5での具体的なビット配分の方法を図 3に示すビット配分ストラテジを用いて説明する。一 2. 1

本実施例では、ステップ S T 1の総ビット配分から、

第 1に、チャネル当たり 1 2 8 k b p sの基礎ビット配分（ステップ S T 2 ) と、

第 2に、 6 4 k b p sの付加ビット配分（ステップ S T 3 ) との

2つを求める。

このうち基礎ビット配分は、更にビット配分（1) (ステップ S T 4 ) と、ビット配分（2) (ステップ S T 5 ) とに分割使用される。まず、ステップ S T 1からステップ S T 2への上記基礎ビット配分の手法について説明する。ここではスケールファク夕の周波数領域の分布をみて適応的にビット配分を行なう。

最初に、ビット配分（1) に使うべきビット量を確定する。そのためには信号情報のスぺクトル情報のうちトーナリティ情報を使用する。ここでのトーナリティの指標としては、信号スペクトルの隣接値間の差の絶対値の和を信号スぺクトル数で割った値を用いているなお、より簡単な指標としては、図 4に示すように、いわゆるプロックフローティングのためのブロック毎のスケールファクタにおける隣接スケールファクタ指標の間の差の平均値を用いることができる。このスケールファクタ指標は、概略スケールファクタの対数値に対応している。

実施例では、ビット配分（1) に使うべきビット量をこのトーナリティを表す値に対応させて最大 8 0 k b p s、最小 1 0 k b p s と設定している。

このトーナリティ計算は次の式のように行う。

T=(l/(WLmax*(N-l))(∑ ABS(SFn-SFn-D)

WLmax ：ワードレングス最大値 = 1 6 SFn スケールファクタ指標で概略ピーク値の対数に対応している。

n ：ブロックフローディングバンド番号

N ：ブロックフローティングバンドの数

このようにして求められたトーナリティ指標 Tとビット配分（1) の配分量とは、図 5に示すように対応付けられる。

ここでのゼット配分（1) はスケールファクタに依存した周波数、時間領域上の配分がなされる。

このようにしてビット配分（1) に使用されるビット量が決定されたら、次にビット配分（1) で使われなかったビッ卜についての配分すなわちビット配分（2) に移る。

ここでは多種のビット配分が行われるが、以下に 2つの例を示す c 第 1に、全てのサンプル値に対する均一配分を行う。この場合のビット配分に対する量子化雑音スぺクトル（ビット配分（2) の均一配分のノイズスぺクトル）を図 6に示す。これによれば、全周波数帯域で均一の雑音レベル低減が行える。

第 2に、信号情報の周波数スぺクトル及びレベルに対する依存性を持たせた聴覚的な効果を得るためのビット配分を行う。この場合のビット配分に対する量子化雑音スぺクトル（信号情報の周波数スベクトル及びレベルに対する依存性を持たせた聴覚的な効果を得るためのビット配分によるノィズスぺクトル）の一例を図 7に示す。この例では情報信号のスぺクトルに依存させたビット配分を行っていて、特に情報信号のスぺクトルの低域側にウェイトをおいたビット配分を行い高域側に比して起きる低域側でのマスキング効果の減少を補償している。これは隣接臨界帯域間でのマスキングを考慮し 1 3

てスぺクトルの低域側を重視したマスキングカーブの非対象性に基づいている。

なお、図 8はビット配分（2) の均一配分の時のビット配分（割当）を示す図であり、図 6に対応したビット配分を表している。図 9は信号情報の周波数スぺクトル及びレベルに対応する依存性を持たせた聴覚的な効果を得るためのビット配分を示す図であり、図 7 に対応したビット配分を表している。また、図 6、図 7の図中 Sは信号スぺクトルを、 N L 1 はビット配分（1) による雑音レベルを、 N L 2はビット配分（2) による雑音レベルを示している。図 8、図 9の図中 A Q 1はビット配分（1) のビット量を、図中 A Q 2はビット配分（2) のビット量を示している。

次に基礎ビット配分の別の手法を説明する。

この場合の適応ビット配分回路の動作を図 1 0で説明すると、 M D C T係数の大きさが各プロックごとに求められ、その M D C T係数が入力端子 8 0 1 に供給される。当該入力端子 8 0 1 に供給された M D C T係数は、帯域毎のエネルギ算出回路 8 0 3に与えられる ₍ 帯域毎のエネルギ算出回路 8 0 3では、クリティカルバンドまたは高域においてはクリティカルバンドを更に再分割したそれぞれの帯域に関する信号エネルギを算出する。帯域毎のエネルギ算出回路 8 0 3で算出されたそれぞれの帯域に関するエネルギは、エネルギ依存ビット配分回路 8 0 4に供給される。

エネルギ依存ビット配分回路 8 0 4では、使用可能総ビット発生回路 8 0 2からの使用可能総ビット、本実施例では 1 2 8 K b p s の内のある割合を用いて白色の量子化雑音を作り出すようなビット配分を行う。このとき、入力信号のトーナリティが高いほど、すな - 2. 4 -

わち入力信号のスぺクトルの凸凹が大きいほど、このビット量が上記 1 2 8 K b p sに占める割合が増加する。なお、入力信号のスぺク小ルの凸凹を検出するには、隣接するプロックのブロックフローティング係数の差の絶対値の和を指標として使う。そして、求められた使用可能なビット量にっき、各帯域のエネルギの対数値に比例したビッ卜配分を行う。

聴覚許容雑音レベルに依存したビット配分算出回路 8 0 5は、まず上記クリティカルバンド毎に分割されたスぺクトルデータに基づき、いわゆるマスキング効果等を考慮した各クリティカルバンド毎の許容ノイズ量を求める。次に、聴覚許容雑音スぺクトルを与えるように使用可能総ビッ卜からエネルギ依存ビットを引いたビット分が配分される。このようにして求められたエネルギ依存ビッ卜と聴覚許容雑音レベルに依存したビットは加算されて、図 1 の適応ビット配分符号化回路 1 6、 1 7、 1 8によって各クリティカルバンド毎若しくは高域においてはクリティカルバンドを更に複数帯域に分割した帯域に割り当てられたビット数に応じて各スぺクトルデータ

(あるいは M D C T係数データ）が再量子化されるようになっている。このようにして符号化されたデータは、図 1 の出力端子 2 2、 2 4、 2 6を介して取り出される。

さらに詳しく上記聴覚許容雑音スぺクトル依存のビット配分算出回路 8 0 5中の聴覚許容雑音スぺクトル算出回路について説明すると、 M D C T回路 1 3、 1 4、 1 5で得られた M D C T係数が当該ビット配分算出回路 8 0 5中の許容雑音スぺクトル算出回路に与えられる。

図 1 1は、上記許容雑音スぺクトル算出回路をまとめて説明するためのものであり、この許容雑音スぺクトル算出回路の具体的な概略構成を示すブロック回路図である。この図 1 1 において、入力端子 5 2 1には、 M D C T回路 1 3、 1 4、 1 5からの周波数領域のスぺクトルデータが供給されている。

この周波数領域の入力データは、帯域毎のエネルギ算出回路 5 2 2に送られて、ここで上記クリティカルバンド（臨界帯域）毎のェネルギが、例えば当該バンド内での各振幅値 2乗の総和を計算すること等により求められる。この各バンド毎のエネルギの代わりに、振幅値のピーク値、平均値等が用いられることもある。このエネルギ算出回路 5 2 2からの出力としての、例えば各バンドの総和値のスぺクトルは、一般にバークスぺクトルと称されている。図 1 2はこのような各クリティカルバンド毎のバークスぺクトル S Bを示している。ただし、この図 1 2では、図示を簡略化するため、上記クリティカルバンドのバンド数を 1 2バンド（B l ~ B 12) で表現している。

ここで、上記バークスぺクトル S Bのいわゆるマスキングに於ける影響を考慮するために、該バークスぺクトル S Bに所定の重み付け関数を掛けて加算するような畳込み（コンボリューシヨン）処理を施す。このため、上記帯域毎のエネルギ算出回路 5 2 2の出力、すなわち該バークスぺクトル S Bの各値は、畳込みフィルタ回路 5 2 3に送られる。該畳込みフィルタ回路 5 2 3は、例えば、入力デ一夕を順次遅延させる複数の遅延素子と、これらの遅延素子の出力にフィルタ係数（重み付け関数）を乗算する複数の乗算器（例えば各バンドに対応する 2 5個の乗算器）と、各乗算器の出力の総和をとる総和加算器とから構成されるものである。なお、上記マスキングとは、人間の聴覚上の特性により、ある信号によって他の信号がマスクされて聞こえなくなる現象をいうものであり、このマスキング効果には、時間領域のオーディオ信号による時間軸マスキング効果と、周波数領域の信号による同時刻マスキング効果とがある。これらのマスキング効果により、マスキングされる部分にノィズがあったとしても、このノイズは閬こえないことになる。このため、実際のオーディオ信号では、このマスキングされる範囲内のノィズは許容可能なノィズとされる。

また、上記畳込みフィルタ回路 5 2 3の各乗算器の乗算係数（フィルタ係数）の一具体例を示すと、任意のバンドに対応する乗算器 Mの係数を 1 とするとき、乗算器 M— 1、 M— 2、 M— 3、 M+ l、 M + 2、 M+ 3の各係数は 0. 1 5、 0. 0 0 1 9、 0. 0 0 0 0 0 8 6、 0. 4、 0. 0 6、 0. 0 0 7であり、この畳込みフィルタ回路 5 2 3では、乗算器 M— 1で係数 0. 1 5を、乗算器 M— 2 で係数 0. 0 0 1 9を、乗算器 M - 3で係数 0. 0 0 0 0 0 8 6を、乗算器 M+ 1 で係数 0. 4を、乗算器 M+ 2で係数 0. 0 6を、乗算器 M+ 3で係数 0. 0 0 7を各遅延素子の出力に乗算することにより、上記バークスぺクトル S Bの畳込み処理が行われる。ただし、 Mは 1〜2 5の任意の整数である。

次に、上記畳込みフィルタ回路 5 2 3の出力は引算器 5 2 4 に送られる。該引算器 5 2 4 は、上記畳込んだ領域での後述する許容可能なノィズレベルに対応するレベル αを求めるものである。なお、当該許容可能なノイズレベル（許容ノイズレベル）に対応するレべルひは、後述するように、逆コンボリューション処理を行うことによって、クリティカルバンドの各バンド毎の許容ノィズレベルとな - 2. 7 -

るようなレベルである。

ここで、上記引算器 5 2 4には、上記レベルひを求めるための許容関数（マスキングレベルを表現する関数）が供給される。この許容関数を増減させることで上記レベルの制御を行っている。当該許容関数は、次に説明するような（n— a i ) 関数発生回路 5 2 5 から供給されているものである。

すなわち、許容ノィズレベルに対応するレベル αは、クリティカルバンドのバンドの低域から順に与えられる番号を i とすると、次の式で求めることができる。

= S - ( n - a i )

この式において、 n , aは定数で a〉 0、 Sは畳込み処理されたバークスぺクトルの強度であり、式中（n- a i )が許容関数である。例として n = 3 8 , a =—0. 5 を用いることができる。

このようにして、上記レベル αが求められ、このデータは、割算器 5 2 6に送られる。当該割算器 5 2 6は、上記畳込みされた領域での上記レベルひを逆コンボリュ一ションするためのものである。したがって、この逆コンボリューション処理を行うことにより、上記レベル αからマスキングスレツショールドが得られる。すなわち、このマスキングスレツショールドが許容ノィズスぺクトルとなる。なお、上記逆コンボリユーション処理は、複雑な演算を必要とするが、本実施例では簡略化した割算器 5 2 6を用いて逆コンボリユーションを行っている。

次に、上記マスキングスレツショールドは、合成回路 5 2 7を介して減算器 5 2 8に送られる。ここで、当該減算器 5 2 8には、上記帯域毎のエネルギ検出回路 5 2 2の出力、すなわち前述したバー 2. 8

クスぺクトル S Bが、遅延回路 5 2 9を介して供給されている。したがって、この減算器 5 2 8で上記マスキングスレツショールドとバークスぺクトル S Bとの減算演算が行われることで、図 1 3に示すように、上記バークスぺクトル S Bは、当該マスキングスレツシヨールド M Sのレベルで示すレベル以下がマスキングされることになる。なお、上記遅延回路 5 2 9は、上記合成回路 5 2 7以前の各回路での遅延量を考慮してエネルギ検出回路 5 2 2からのバークスぺクトル S Bを遅延させるために設けられている。

当該減算器 5 2 8の出力は、許容雑音補正回路 5 3 0を介し、出力端子 5 3 1を介して取り出され、例えば配分ビット数情報が予め記憶された R O M等（図示せず）に送られる。この R O M等は、上記減算器 5 2 8から許容雑音補正回路 5 3 0を介して得られた出力 (上記遅延器 5 2 9の出力である各バンドのエネルギと、上記割算器 5 2 6の出力との差分のレベル）に応じ、各バンド毎の配分ビット数情報を出力する。

このようにしてエネルギ依存ビットと聴覚許容雑音レベルに依存したビットは加算されて、その配分ビット数情報が上記適応ビット配分符号化回路 1 6、 1 7、 1 8に送られることで、 M D C T回路 1 3、 1 4、 1 5からの周波数領域の各スペクトルデータがそれぞれのバンド毎に割り当てられたビット数で量子化される。

すなわち要約すれば、上記適応ビット配分符号化回路 1 6、 1 7、 1 8では、上記クリティカルバンドの各バンド帯域毎（クリティカルバンド毎）若しくは高域においては当該クリティカルバンドを更に複数帯域に分割した帯域のエネルギ若しくはピーク値と、上記割算器 5 2 6の出力との差分のレベルに応じて配分されたビット数で 2. 9 一

上記各バンド毎のスぺクトルデータを量子化することになる。

ところで、上述した合成回路 5 2 7では、最小可聴カーブ発生回路 5 3 2から供給される図 1 4に示すような人間の聴覚特性であるいわゆる最小可聴カーブ R Cを示すデータと、上記マスキングスレッショールド M Sとを合成することができる。この最小可聴カーブ R Cにおいて、雑音絶対レベルがこの最小可聴カーブ R C以下ならば該雑音は聞こえないことになる。この最小可聴カーブ R Cは、コ一ディングが同じであっても例えば再生時の再生ボリユームの違いで異なるものとなが、現実的なディジタルシステムでは、例えば 1 6 ビットダイナミックレンジへの音楽のはいり方にはさほど違いがないので、例えば 4 k H z付近の最も耳に閬こえやすい周波数帯域の量子化雑音が聞こえないとすれば、他の周波数帯域ではこの最小可聴カーブ R Cのレベル以下の量子化雑音は聞こえないと考えられる。したがって、このように例えばシステムの持つダイナミックレンジの 4 k H z付近の雑音が聞こえない使い方をすると仮定し、この最小可聴カーブ R Cとマスキングスレツショールド M Sとを共に合成することで許容ノィズレベルを得るようにすると、この場合の許容ノイズレベルは、図 1 4中の斜線で示す部分までとすることができるようになる。なお、本実施例では、上記最小可聴カーブ R C の 4 k H zのレベルを、例えば 2 0 ビット相当の最低レベルに合わせている。また、この図 1 4は、信号スぺクトル S Sも同時に示している。

また、上記許容雑音補正回路 5 3 0では、補正情報出力回路 5 3 3から送られてくる例えば等ラゥドネスカーブの情報に基づいて、上記減算器 5 2 8の出力における許容雑音レベルを補正している。 3. 0

ここで、等ラウドネスカーブとは、人間の聴覚特性に関する特性曲線であり、例えば 1 k H zの純音と同じ大きさに聞こえる各周波数での音の音圧を求めて曲線で結んだもので、ラウドネスの等感度曲線とも呼ばれる。またこの等ラウドネス曲線は、図 1 4に示した最小可聴カーブ R Cと略同じ曲線を描くものである。この等ラウドネス曲線においては、例えば 4 k H z付近では 1 k H zのところより音圧が 8〜 1 0 d B下がっても i k H zと同じ大きさに聞こえ、逆に、 5 0 H z付近では 1 k H zでの音圧よりも約 1 5 d B高くないと同じ大きさに聞こえない。このため、上記最小可聴カーブ R Cのレベルを越えた雑音（許容ノイズレベル）は、この等ラウドネス曲線に応じたカーブで与えられる周波数特性を持つようにするのが良いことがわかる。このようなことから、上記等ラウドネス曲線を考慮して上記許容ノィズレベルを補正することは、人間の聴覚特性に適合していることがわかる。

以上述べた聴覚許容雑音レベルに依存したスぺクトル形状を使用可能総ビット 1 2 8 K b p sの内のある割合を用いるビット配分でつくる。この割合は入力信号のトーナリティが高くなるほど減少する。

次に 2つのビット配分手法の間でのビット量分割手法について説明する。

図 1 0に戻って、 M D C T回路 1 3、 1 4、 1 5の出力が供給される入力端子 8 0 1からの信号は、スぺクトルの滑らかさ算出回路 8 0 8にも与えられ、ここでスぺクトルの滑らかさが算出される。本実施例では、信号スぺクトルの絶対値の隣接値間の差の絶対値の和を信号スぺクトルの絶対値の和で割った値を、上記スぺクトルの一 3. 1

滑らかさとして算出している。

上記スぺクトルの滑らかさ算出回路 8 0 8の出力は、ビッ卜分割率決定回路 8 0 9に与えられ、こでエネルギ依存のビット配分と、聴覚許容雑音スぺクトルによるビット配分間のビット分割率とが決定される。ビット分割率はスぺクトルの滑らかさ算出回路 8 0 8の出力値が大きいほど、スぺクトルの滑らかさが無いと考えて、エネルギ依存のビット配分よりも、聴覚許容雑音スぺクトルによるビット配分に重点をおいたビット配分を行う。ビット分割率決定回路 8 0 9は、それぞれエネルギ依存のビット配分及び聴覚許容雑音スぺクトルによるビット配分の大きさをコントロールするマルチプライャ 8 1 1及び 8 1 2に対してコントロール出力を送る。ここで、仮にスぺクトルが滑らかであり、エネルギ依存のビット配分に重きをおくように、マルチプライヤ 8 1 1へのビット分割率決定回路 8 0 9の出力が 0 . 8の値を取ったとき、マルチプライヤ 8 1 2へのビット分割率決定回路 8 0 9の出力は 1 — 0 . 8 = 0 . 2とする。これら 2つのマルチプライヤ 8 1 1、 8 1 2の出力は、ァダー 8 0 6 で足し合わされて最終的なビット配分情報となって、出力端子 8 0 7から出力される。

このときのビット配分の様子を図 1 5、図 1 6に示す。また、これに対応する量子化雑音の様子を図 1 7、図 1 8に示す。図 1 5は信号のスぺクトルが割合平坦である場合を示しており、図 1 6は信号スぺクトルが高いトーナリティを示す場合を示している。また、図 1 5及び図 1 6の図中 Q Sは信号レベル依存分のビット量を示し、図中 Q Nは聴覚許容雑音レベル依存のビット割当分のビット量を示している。図 1 7及び図 1 8の図中 Lは信号レベルを示し、図中 N - 3. 2 -

Sは信号レベル依存分による雑音低下分を、図中. N Nは聴覚許容雑音レベル依存のビット割当分による雑音低下分を示している。先ず、信号のスぺクトルが、割合平坦である場合を示す図 1 5において、聴覚許容雑音レベルに依存したビット配分は、全帯域に渡り大きい信号雑音比を取るために役立つ。しかし低域及び高域では比較的少ないビット配分が使用されている。これは聴覚的にこの帯域の雑音に対する感度が小さいためである。信号エネルギレベルに依存したビット配分の分は量としては少ないが、ホワイト的な雑音スぺクトルを生じるように、この場合には中低域の信号レベルの高い周波数領域に重点的に配分されている。

これに対して、図 1 6に示すように、信号スぺクトルが高いト一ナリティを示す場合には、信号エネルギレベルに依存したビット配分量が多くなり、量子化雑音の低下は極めて狭い帯域の雑音を低減するために使用される。聴覚許容雑音レベルに依存したビット配分の集中はこれよりもきつくない。

図 1 6に示すように、この両者のビット配分の和により、孤立スぺクトル入力信号での特性の向上が達成される。

以上の様にして得られた基礎ビット配分に、次のようにして上記付加ビット配分（ステップ S T 3 ) 部分を付け加える。

次に、図 1 9を用いて基礎ビット配分と付加ビット配分部分の分離及び再生時の結合について説明する。

先ず、図 1 9の構成の入力端子 9 0 0には、図 1の M D C T回路 1 3 , 1 4， 1 5の出力である M D C T係数が供給されるとする。すなわち、図 1 9のエンコーダ側は図 1 の適応ビット配分符号化回路 1 6、 1 7、 1 8に含まれるものである。 3. 3 -

この図 1 9において、上記入力端子 9 0 0に供給された M D C T 係数（M D C Tサンプル）は正規化回路 9 0 5によって複数サンプル毎に、ブロックについての正規化処理すなわちプロックフローティングが施される。このときどの程度のブロックフローティングが行われたかを示す係数としてスケールファクタが得られる。

次段の第 1の量子化器（quan t i zer) 9 0 1 は、上記基礎ビット配分で与えられた各サンプル語長（ワードレングス）で量子化を行なう。このとき、量子化雑音を少なくするためには四捨五入による量子化が行われる。

次に、上記正規化回路 9 0 5の出力と上記量子化器 9 0 1の出力が差分器 9 0 2に送られる。すなわち、当該差分器 9 0 2では、量子化器 9 0 1の入力と出力の差（量子化誤差）が取られる。この差分器 9 0 2の出力は、さらに正規化回路 9 0 6を介して第 2の量子化器 9 0 3に送られる。

当該第 2の量子化器 9 0 3では、例えば 2 ビッ卜が各サンプル毎に使用される。正規化回路 9 0 6におけるスケールファクタは、第 1の量子化器 9 0 1で用いられたスケールファクタとワードレングスから自動的に決定される。

すなわち、この図 1 9の構成のエンコーダ側では、第 1 の量子化器 9 0 1で用いられた語長が例えば Nビッ卜であったときには（ 2 * * N ) で正規化回路 9 0 6で用いられるスケールファク夕が得られる。

また、上記付加ビット配分のための第 2の量子化器 9 0 3では、上記基礎ビット配分のための第 1の量子化器 9 0 1 と同じように四捨五入処理を含むビット配分を行う。このようにして 2つの量子化 3. 4 一

により、 2つのビット配分に分けられる。

ここで、もし付加ビット配分のためのヮードレングスが固定的でない場合でも、前に述べたように付加ビット配分の成分の大きさは基礎ビット配分のスケールファクタとワードレングスから付加ビット配分のスケールファクタを算出できるので、ワードレングスのみがデコーダに必要とされる。本実施例では、付加ビット配分のヮ一ドレングスは 2 ビットと固定されているので、付加ビット配分のためのヮードレングスさえ必要ではない。このようにして量子化器 9 0 1及び 9 0 3の出力がそれぞれ四捨五入された効率の高い量子化が実現されることになる。

なお、量子化器 9 0 1及び 9 0 3の出力ビットレー卜は、両者とも固定にすると、ディスク、テープ等のメディアに記録するときにシステムを簡単にすることができる。また、両者を可変としながら、トータルで一定とすることもできる。もちろん一部の量子化器の出カビットレートのみを一定としてもよい。

なお、図 1 9の構成（エンコーダ）に対応する構成（デコーダ）には、上記正規化回路 9 0 5， 9 0 6 に対応する逆正規化処理を行う逆正規化回路 9 0 8 , 9 0 7が設けられ、逆正規化回路 9 0 8 , 9 0 7の出力が加算器 9 0 4で加算される。その加算出力が出力端子 9 1 0から取りだされることになる。

図 2 0は、このようにして高能率符号化された信号を再び復号化するための基本的な本発明実施例の復号化装置を示している。

この図 2 0において、各帯域の量子化された M D C T係数は復号化装置の入力端子 1 2 2、 1 2 4、 1 2 6に与えられ、使用されたブロックサイズ情報は入力端子 1 2 3、 1 2 5、 1 2 7に与えられる。復号化回路 1 1 6、 1 1 7、 1 1 8は、量子化された MD C T 係数と共に伝送されてきたスケールファクタ及びワードレングスでなる適応ビット配分情報を用いて、ビット割当を解除する。

次に、 11^0〇丁回路 1 1 3、 1 1 4、 1 1 5では、周波数領域の信号が時間領域の信号に変換される。これらの部分帯域の時間領域信号は、 I QMF回路 1 1 2、 1 1 1により、全体域信号に復号化される。

すなわち、上記基礎ビット配分の 1 2 8 k b p sのビット配分と上記付加ビット配分の 6 4 k b p sのそれぞれが上記復号化回路 1 1 6、 1 1 7、 1 1 8で復号化される。そしてこれらの 2つの復号化部分は夫々が復号化された後、夫々の時間軸上サンプルが加算されて精度の高いサンプルとなる。

もちろん図 2 0において、 11^0〇丁回路 1 1 3、 1 1 4、 1 1 5の各出力について基礎ビット配分出力及び付加ビット配分をそれぞれ計算してから合成し、 1 (3 回路 1 1 2、 1 1 1に送ることもできる。

さらには複号化回路 1 1 6、 1 1 7、 1 ： 8において基礎ビット配分及び付加ビット配分を正規化処理を解いた後に加算し、それを I MD CT, I QMF処理して最終出力を得るようにすることもできる。

次に、本発明実施例の記録メディアは、上述したような本発明実施例の量子化装置が適用される高能率符号化装置により量子化及び符号化された信号が記録されるものであり、記録メディアとしては例えば光ディスク，光磁気ディスク，磁気ディスク等のディスク状の記録媒体に上記符号化信号が記録されたものや、磁気テープ等の 3. 6

テープ状記録媒体に上記符号化信号が記録されたもの、或いは、符号化信号が記憶された半導体メモリ、いわゆる I C力一ドなどを挙げることができる。

なお、本発明実施例の記録メディァにおけるデータの並べ方については、図 2 1に示すようになる。すなわち、 1つのシンクプロックは、シンク情報と、サブ情報（スケールファクタ，ワードレングス）と、基礎ビット配分と、付加ビット配分とからなるものとするこの場合、時間領域サンプル若しくは周波数領域サンプルを量子化した後、 1 サンプルづっ単独で、前段の量子化誤差を更に量子化するような少なくとも 1個の量子化機能により、少なくとも 2個の語に分解し、 1つのシンクブロックの中に各量子化出力毎に分離して記録若しくは伝送し、その後復号再生することは、ビットレ一トを下げて再生する場合に除去すべきビット列部分を一括して除去できるという点で有効である。

また、別の方法として、時間領域サンプル若しくは周波数領域サンプルを量子化した後、 1サンプルづっ単独で、前段の量子化誤差を更に量子化するような少なくとも 1個の量子化機能により、少なくとも 2個の語に分解し、 1つのシンクブロックの中に各量子化出力を周波数又は時間順に交互に記録若しくは伝送し、時間領域サンプル若しくは周波数領域サンプルから復号再生することは、ビットレートを下げて再生する場合に周波数帯域を制限する形で除去すベきビット列部分を一括して除去できるという点で有効である。以上のようなビット配列は、特に光磁気ディスクゃ光ディスクを用いた例えばいわゆるミニディスク（Min i D i sc)や、磁気テープメディア、通信メディアなどに応用できる。以上の説明からも明らかなように、本発明においては以下の効果を得ることができる。すなわち、

( 1 ) ェンコ一ド時に使用されたビットレートよりも低いビットレ ―トを用いてデコードする時、例えばェンコ一ド側でェンコ一ド処理後のビッ卜の一部を別のデータ転送用に流用するとき、音質劣化を最小に止める。

( 2 ) 既に低いビットレー卜で再生する再生機が使われている時には、より高いビットレートを用いた音質の良いシステムを導入するに当たっては既に用いられていた低いビットレー卜で再生する再生機とバックヮードの互換性を有するシステムを提供できる。

( 3 ) 高価な記憶デバイス例えば I Cカードを用いた記憶媒体に記録を行ないたいときに、記録時間を初期の設定から延長したいときに記録済み若しくは記録中のェンコ一ド情報のビットレートを適宜減らして記録時間を延ばし且つこのときの音質劣化を最小化できる。

( 4 ) 高音質のデコーダを、安価な通常良く使われるよりビットレ一トの低いビット配分を行うデコーダを複数個使用して作成することができ、このことにより新たなデコーダ用 L S Iの作成が不要となり安価に目的を達成することが可能となる。

Claims

請求の範囲

1 . 入力信号の時間領域サンプル若しくは周波数領域サンプルを量子化する量子化装置において、

上記時間領域サンプル若しくは周波数領域サンプルを量子化した後、 1サンプルづっ単独で、前段の量子化における量子化誤差を更に量子化する少なくとも 1個の量子化手段を有することにより、時間領域サンプル若しくは周波数領域サンプルを少なくとも 2個の語に分解することを特徴とする量子化装置。

2 . 上記量子化手段は四捨五入動作を行うことを特徴とする請求項 1 に記載の量子化装置。

3 . 少なくとも一つの上記量子化手段の出力ビットレートを一定時間単位で一定ビットレートとすることを特徵とする請求項 1又は 2に記載の量子化装置。

4 . 全ての上記量子化手段の出力ビットレートを一定時間単位で —定ビットレートとすることを特徵とする請求項 3に記載の量子化装置。

5 . 時間領域サンプル若しくは周波数領域サンプルを、複数サンプル毎のプロックでブロックフローティング処理し、上記前段の量子化の量子化誤差を更に量子化するサンプルデータのためのスケールファクタを、少なくとも上記前段の量子化の量子化出力のためのスケールファクタから求めることを特徵とする請求項 1に記載の量子化装置。

6 . 上記前段の量子化の量子化誤差を更に量子化するサンプルデ —夕のためのスケールファクタを、少なくとも上記前段の量子化の一 3. 9 —

量子化出力のためのスケールファクタ及びヮードレングスから求めることを特徵とする請求項 5に記載の量子化装置。

7 . 時間と周波数について細分化した小ブロック中のサンプルデ ―夕に対しては、当該小プロック内で同一のプロックフローティング及び語長をもつ量子化を行うことを特徵とする請求項 5に記載の量子化装置。

8 . 時間領域サンプル若しくは周波数領域サンプルを量子化した信号を復号化する復号化装置であって、

上記時間領域サンプル若しくは周波数領域サンプルにっき、同一時間領域若しくは同一周波数領域のサンプルに関する少なくとも 2 つの部分サンプルを合わせて 1つのサンプルとする合成手段を有することを特徴とする復号化装置。

9 . 時間領域サンプル若しくは周波数領域サンプルを量子化した信号を復号化する復号化装置であって、

上記時間領域サンプル若しくは周波数領域サンプルにっき、同一時間領域若しくは同一周波数領域のサンプルに関する少なくとも 2 つの部分サンプルをそれぞれ別個に全帯域幅領域の時間領域サンプルとした後合成して 1つのサンプルとする合成手段を有することを特徵とする復号化装置。

1 0 . 時間領域サンプル若しくは周波数領域サンプルを量子化した信号を復号化する復号化装置であって、

上記時間領域サンプル若しくは周波数領域サンプルにっき、同一時間領域若しくは同一周波数領域のサンプルに関する少なくとも 2 つの部分サンプルをそれぞれ別個に部分帯域幅領域の時間領域サンプルとした後、それぞれの部分帯域で合わせて 1つのサンプルとし、 - 4. 0

さらに全帯域幅領域の時間領域サンプルへ合成する合成手段を有することを特徴とする復号化装置。

1 1 . 上記量子化の際には、時間領域サンプル若しくは周波数領域サンプルを量子化した後、 1サンプルづっ単独で、前段の量子化における量子化誤差を更に量子化する少なくとも 1個の量子化手段により、時間領域サンプル若しくは周波数領域サンプルが少なくとも 2個の語に分解され、少なくとも 1つの上記量子化手段の出力ビットレー卜が一定時間単位で一定ビットレ一卜となされていることを特徴とする請求項 8、 9、又は 1 0に記載の復号化装置。

1 2 . 上記量子化の際には、時間領域サンプル若しくは周波数領域サンプルを量子化した後、 1 サンプルづっ単独で、前段の量子化における量子化誤差を更に量子化する少なくとも 1個の量子化手段により、時間領域サンプル若しくは周波数領域サンプルが少なくとも 2個の語に分解され、全ての上記量子化手段の出力ビットレートがー定時間単位で一定ビットレートとなされていることを特徵とする請求項 1 1 に記載の複号化装置。

1 3 . 上記量子化の際には、時間領域サンプル若しくは周波数領域サンプルを複数サンプル毎のプロックでブロックフローティング処理し、前段の量子化の量子化誤差を更に量子化したサンプルデー夕のためのスケールファクタが、少なくとも上記前段の量子化の量子化出力のためのスケールファクタから求められていることを特徴とする請求項 1 2に記載の復号化装置。

1 4 . 時間領域サンプル若しくは周波数領域サンプルを量子化した後、 1サンプルづっ単独で、前段の量子化における量子化誤差を更に少なくとも 1回量子化することにより、時間領域サンプル若し一 4. 1 一

くは周波数領域サンプルを少なくとも 2個の量子化値に分解し、上記少なくとも 2個の量子化値を記録してなることを特徵とする記録メティア。

1 5 . 入力信号の時間領域若しくは周波数領域の所定サンプルを量子化する量子化方法において、

上記所定サンプルを量子化して第 1 の量子化値を生成し、上記所定サンプルと上記第 1の量子化値との量子化誤差を演算し、上記量子化誤差を 1サンプルづっ単独で量子化して第 2の量子化値を生成することを特徵とする量子化方法。

1 6 . 上記第 1の量子化値及び上記第 2の量子化値の少なくとも —方を四捨五入動作による量子化により生成することを特徴とする請求項 1 5に記載の量子化方法。

1 7 . 上記第 1の量子化値及び上記第 2の量子化値の少なくとも —方を一定ビットレー卜で出力することを特徴とする請求項 1 5に記載の量子化方法。

1 8 . 上記第 1の量子化値及び上記第 2の量子化値の総和が一定ビットレートとなるように出力することを特徴とする請求項 1 5に記載の量子化方法。

1 9 . 上記所定サンプルを複数のサンプルからなるブロック毎に第 1のスケールファクタを用いてプロックフローティング処理し、上記量子化誤差を上記第 1のスケールファクタに基づいて求められた第 2のスケールファクタで正規化することを特徵とする請求項 1 5に記載の量子化方法。

2 0 . 上記第 2のスケールファクタを上記第 1 のスケールファクタ及び上記第 1の量子化値を生成する際のヮ一ドレングスに基づい - 4. 2 -

て求めることを特徴とする請求項 1 5に記載の量子化方法。

2 1 . 時間と周波数について細分化した小ブロック中のサンプルデータに対しては、当該小プロック内で同一のスケールファクタ及びヮードレングスで正規化及び量子化を行うことを特徴とする請求項 1 5に記載の量子化方法。

2 2 . 入力信号の時間領域サンプル若しくは周波数領域サンプルへのビット配分を行う高能率符号化装置において、

上記時間領域サンプル若しくは周波数領域サンプルを量子化した後、 1サンプルづっ単独で、前段の量子化の量子化誤差を更に量子化する少なくとも 1個の量子化手段を有することにより、時間領域サンプル若しくは周波数領域サンプルを少なくとも 2個の語に分解することを特徴とする高能率符号化装置。

2 3 . 上記量子化手段は四捨五入動作を行うことを特徴とする請求項 2 2に記載の高能率符号化装置。

2 4 . 少なくとも 1つの上記量子化手段の出力ビットレー卜を一定時間単位で一定ビットレートとすることを特徴とする請求項 2 2 又は 2 3に記載の高能率符号化装置。

2 5 . 全ての上記量子化手段の出力ビットレートを一定時間単位で一定ビットレ一トとすることを特徵とする請求項 2 4に記載の高能率符号化装置。

2 6 . 時間領域サンプル若しくは周波数領域サンプルを、複数サプル毎のプロックでブロックフローティング処理し、上記前段の量子化の量子化誤差を更に量子化するサンプルデータのためのスケ一ルファクタを、少なくとも前段の量子化の量子化出力のためのスケールファクタから求めることを特徴とする請求項 2 2に記載の高能

4. 3 一

率符号化装置。

2 7 . 上記前段の量子化の量子化誤差を更に量子化するサンプル一夕のためのスケールファクタを、少なくとも上記前段の量子化の量子化出力のためのスケールファクタ及びワードレングスから求めることを特徵とする請求項 2 6に記載の高能率符号化装置。

2 8 . 時間と周波数について細分化した小ブロック中のサンプル —夕に対しては、当該小プロック内で同一のプロックフローティング若しくは同一のプロックフローティング及び語長をもつ量子化を行うことを特徴とする請求項 2 2に記載の高能率符号化装置。

2 9 . 入力信号の時間領域サンプル若しくは周波数領域サンプルへのビット配分を行って当該入力信号を符号化し、この符号化した信号を記録媒体に記録する高能率符号化装置において、

上記時間領域サンプル若しくは周波数領域サンプルを量子化した後、 1サンプルづっ単独で、前段の量子化の量子化誤差を更に量子化する少なくとも 1個の量子化手段を有することにより、時間領域サンプル若しくは周波数領域サンプルを少なくとも 2個の語に分解すると共に、 1つのシンクブロックの中に、全ての上記量子化手段の出力サンプルをそれぞれ分離して、一定時間単位で記録することを特徴とする高能率符号化装置。

3 0 . 入力信号の時間領域サンプル若しくは周波数領域サンプルへのビット配分を行って当該入力信号を符号化し、この符号化した信号を記録媒体に記録する高能率符号化装置において、

上記時間領域サンプル若しくは周波数領域サンプルを量子化した後、 1サンプルづっ単独で前段の量子化の量子化誤差を更に量子化する少なくとも 1個の量子化手段を有することにより、時間領域サンプル若しくは周波数領域サンプルを少なくとも 2個の語に分解すると共に、 1つのシンクブロックの中に、それぞれの上記量子化手段の出力サンプルを上記量子化手段毎に時間順若しくは周波数順に交互に記録することを特徵とする高能率符号化装置。

3 1 . 時間領域サンプル若しくは周波数領域サンプルへのビット配分が行われて符号化された信号を復号化する高能率符号復号化装置において、

上記時間領域サンプル若しくは周波数領域サンプルにっき、同一時間領域若しくは同一周波数領域のサンプルに関する少なくとも 2 つの部分サンプルを合わせて 1つのサンプルとする合成手段を有することを特徴とする高能率符号復号化装置。

3 2 . 時間領域サンプル若しくは周波数領域サンプルへのビット配分が行われて符号化された信号を復号化する高能率符号復号化装置において、

• 上記時間領域サンプル若しくは周波数領域サンプルにっき、同一時間領域若しくは同一周波数領域のサンプルに関する少なくとも 2 つの部分サンプルをそれぞれ別個に全帯域幅領域の時間領域サンプルとした後合成して 1つのサンプルとする合成手段を有することを特徵とする高能率符号復号化装置。

3 3 . 時間領域サンプル若しくは周波数領域サンプルへのビット配分が行われて符号化された信号を復号化する高能率符号復号化装であつし、

上記時間領域サンプル若しくは周波数領域サンプルにつき、同一時間領域若しくは同一周波数領域のサンプルに関する少なくとも 2 つの部分サンプルをそれぞれ別個に部分帯域幅領域の時間領域サン - 4. 5

プルとした後、それぞれの部分帯域で上記部分サンプルを合わせて 1つのサンプルとし、さらに全帯域幅領域の時間領域サンプルへ合成する合成手段を有することを特徴とする高能率符号復号化装置。

3 4 . 少なくとも 1つの上記符号化された信号のビットレートは、 —定時間単位で一定ビットレートであることを特徴とする請求項 3 1、 3 2又は 3 3に記載の高能率符号復号化装置。

3 5 . 全ての上記符号化された信号のビットレートは、一定時間単位で一定ビットレートであることを特徵とする請求項 3 4に記載の高能率符号復号化装置。

3 6 . 上記符号化された信号は、時間領域サンプル若しくは周波数領域サンプルを複数サンプル毎のプロックでブロックフローティング処理し、前段の量子化誤差を更に量子化したサンプルデータのためのスケールファクタを、少なくとも上記時間領域サンプル若しくは周波数領域サンプルを量子化した量子化出力のためのスケールファクタから求めたものであることを特徴とする請求項 3 5に記載の高能率符号復号化装置。

3 7 . 時間と周波数について細分化された小プロック中の同一のブロックフローティング若しくは同一のプロックフローティング及び語長をもつ量子化を行ったサンプルデータを、復号化することを特徴とする請求項 3 1に記載の高能率符号復号化装置。 .

3 8 . 入力信号を符号化する高能率符号化方法において、

総ビット配分を基礎ビット配分と付加ビット配分に分割し、上記入力信号の時間領域若しくは周波数領域の所定サンプルを上記基礎ビット配分に基づくヮードレングスで量子化して第 1の量子化値を生成し、

4 .6

上記所定サンプルと上記第 1の量子化値との量子化誤差を演算し、上記量子化誤差を 1サンプルづっ単独で量子化して第 2の量子化値を上記付加ビット配分として生成することを特徴とする高能率符号化方法。

3 9 . 上記第 1の量子化値及び上記第 2の量子化値の少なくとも —方を四捨五入動作による量子化により生成することを特徴とする請求項 3 8に記載の高能率符号化方法。

4 0 . 上記第 1の量子化値及び上記第 2の量子化値の少なくとも —方を一定ビットレートで出力することを特徴とする請求項 3 8に記載の高能率符号化方法。

4 1 . 上記第 1の量子化値及び上記第 2の量子化値の総和が一定ビットレートとなるように出力することを特徴とする請求項 3 8に記載の高能率符号化方法。

4 2 . 上記所定サンプルを複数のサンプルからなるブロック毎に第 1のスケールファクタを用いてブロックフローティング処理し、上記量子化誤差を上記第 1のスケールファクタに基づいて求められた第 2のスケールファクタで正規化することを特徵とする請求項

3 8に記載の高能率符号化方法。

4 3 . 上記第 2のスケールファクタを上記第 1のスケールファク夕及び上記第 1の量子化値を生成する際のヮードレングスに基づいて求めることを特徵とする請求項 3 8に記載の高能率符号化方法。

4 4 . 時間と周波数について細分化した小プロック中のサンプルデータに対しては、当該小プロック内で同一のスケールファクタ及びワードレングスで正規化及び量子化を行うことを特徴とする請求項 3 8に記載の高能率符号化方法。

4 5 . 符号化信号が記録された記録メディァにおいて、

総ビット配分を基礎ビット配分と付加ビット配分に分割し、上記入力信号の時間領域若しくは周波数領域の所定サンプルを上記基礎ビット配分に基づくヮ一ドレングスで量子化して第 1の量子化値を生成し、

上記所定サンプルと上記第 1の量子化値との量子化誤差を演算し、上記量子化誤差を 1サンプルづっ単独で量子化して第 2の量子化値を上記付加ビット配分として生成し、

上記第 1の量子化値及び上記第 2の量子化値を記録してなることを特徴とする記録メディァ。