JPH03167927A

JPH03167927A - 心理的聴覚基準で適応形量子化する変換ディジタルオーディオ放送信号用の信号圧縮装置

Info

Publication number: JPH03167927A
Application number: JP2273473A
Authority: JP
Inventors: Yannick Mahieux; ジァニック　マヒュー
Original assignee: Etat Francais
Current assignee: Etat Francais
Priority date: 1989-10-13
Filing date: 1990-10-15
Publication date: 1991-07-19
Anticipated expiration: 2016-05-21
Also published as: EP0423050A1; EP0423050B1; FR2653280B1; FR2653280A1; DE69015105D1; DE69015105T2; JP3168578B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（産業上の利用分野）この発明の分野はディジタルオーディオ信号の圧縮の分
野である。この発明はディジタルサウンド信号の記憶装
置に適用できるのと同じく、特にディジタルチャネルに
サウンド信号を伝送させることに適用できる。

より詳細には、この発明はビット割り当て装置に関して
おり、ディジタルオーディオ信号が周波数領域に変換さ
れいくつかの周波数帯域に分割された後、この装置によ
りディジタルオーディオ信号の適応形量子化が行われる
。

この発明は例えば欧州ＤＡＢ　（ディジタルオーディオ
放送）プロジェクトで開発されたような直接衛星放送シ
ステム、または更にＩＳＤＮ放送および高忠実度分配シ
ステムで使用される。この発明は、また特にディジタル
ディスクのような記憶装置にも適用できる。

ディジタルオーディオ信号には、特にサウンドの高忠実
度。初期の品質の保存、使用の柔軟性に関してアナログ
信号より利点が多い。しかし、オーディオ信号をディジ
タルの形に変換したビットレートは、特に信号の品質が
高い場合は非常に高く、その帯域幅は１５ＫＨｚを越え
る。

従って、ビットレートを下げる技術を使用することが必
要となる。

（従来の技術）広く普及し知られた方法により、すでに使用されている
技術には元のディジタルオーディオ信号を数学的に変換
するアルゴリズムが使用されている。変換符号化技術は
画像または音声の分野に広く使用されている。ご《最近
では、これらの技術はオーディオ（ほとんどが音楽）信
号の処理にも使用されている。

これらの技術を使用している実際の符号器では、信号は
先ず最初にいくつかの仮のブロックに分割され、その後
時間／周波数変換が行われる。

変換ブロックの係数が符号化され伝送される。復号器で
は、逆変換により復号され復元された信号が得られる。

詐学的な変換を行うことにより１番大きな係数に元の信
号のエネルギが集められ、その結果聴覚の悪化を制御し
最小まで減少させ、特に変換係数の１部を選択して除く
ことによりビットレートを減少させることができる。実
際には、周波数領域での動作はサウンドのスペクトル特
性にほとんど関係している知覚および聴覚の心理的特性
を検討するのに役立つ。ほとんどの実際の装置で心理的
聴覚基準を検討することは聞こえないスペクトル成分を
マスキング（ｍａｓｋｉｎｇ）する考えを基礎とした、
１９８１年、マッソン（Ｍａｓｓｏｎ）　．聴覚心理学
におけるツイッカー（ＺＷＩＣＫＥＲ）による分析に基
づいている。

これらの原理に基づいて作られた周知の装置は、次の設
計の好みにより互いに異なっている。

（１）主情報に対し補助情報（サイド情報）を伝送する
か伝送しないか；（２）伝送妨害の影響に打ち勝つ技術を使用するか使用
しないか；（３）ビットレートを減少させ信号の一連の符号化、復
号化を集中して行うために心理的聴覚器基準で検討する
技術；このように、この種の周知の第１の装置では、出願され
たフランス特許番号第８，　９０６，　１９４号“サウ
ンド　シグナル　コーディング　メソッド　アンド　エ
クイップメント（Ｓｏｕｎｄ　Ｓｉｇｎａｌ　Ｃｏｄｉ
ｎｇＭｅｔｈｏｄ　ａｎｄ　Ｅｑｕｉｐｍｅｎｔ）”に
記載されているように、サウンド信号をいくつかの標本
値のブロックに区切ること、時間／周波数変換と各ブロ
ックのｌ番意味のある係数の符号化を適応予測すること
、信号の静止を使用すること、が連続的に行われている
。この装置ではブロックを変換する間、補助情報が伝送
されており、これによりブロック間の相関を検討するこ
とが可能となる。他のすべての場合、この補助情報は主
信号の量子器に接続されるビット割り当てモジュールを
制ｔ卸するため単独に使用されている。この装置により
ビットレートを下げることができる。しかし、誤りが発
生したとき、受信ブロックの復元に鎖状の劣化が生ずる
が、これはビット割り当て器と復号量子器を制御してい
る補助情報を作るためのループを通して、誤りが次のブ
ロック、その次のブロックと順々に伝わるからである。

その他に、補助情報が適応符号化により各ブロックに伝
送されている装置も知られている。この種の装置は、例
えばポウチョウ（　Ｂｏｃｈｏｗ）の文献“マルチプロ
セッサ　インブレメンテーションオブ　アン　ＡＴＣ　
　オーディオ　コーデック（Ｍｕｌｔｉｐｒｏｃｅｓｓ
ｏｒ　Ｉｍｐｌｅｍｅｎｔａｔｉｏｎ　ｏｆ　ａｎ　Ａ
ＴＣＡｕｄｉｏ　（：ｏｄｅｃ）”　（１９８９年ＩＣ
ＡＳＳＰ会議の会報、グラスゴー）に記載されている。

この装置の欠点は、補助情報を連続的に符号化するには
、主情報に割り当てたビットレートの悪化に対して、ビ
ットレートを高くする必要があることである。

“ＩＥＥＥ　　ジャーナル　オン　セレクテッド　エリ
アズ　イン　コミュニケーション（Ｊｏｕｒｎａｌ○ｎ
Ｓｅｌｅｃｔｅｄ　Ａｒｅａｓ　ｉｎ　Ｃｏｍｍｕｎｉ
ｃａｔｉｏｎ）″，６巻，２号，　１９８８年，２月，
　３１４−３２３ページに記載のジョンストン（Ｊｏｎ
ｓｔｏｎ）著、゜゜トランスホーム　コーディングオブ
　オーディオ　シグナルズ　ユージング　パーセブチュ
アル　ノイズ　クライテリフ（Ｔｒａｎｓｆｏｒｍ　Ｃ
：ｏｄｉｎｇ　ｏｆ　Ａｕｄｉｏ　Ｓｉｇｎａｌｓ　Ｕ
ｓｉｎＰｅｒｃｅｐｔｕａｌ　Ｎｏｉｓｅ　Ｃｒｉｔｅ
ｒｉａ）”の文献にはビット短縮装置があり、この装置
に使用されている適仄量子器は、主信号の量子器に加え
られる予測アノ１ゴリズムの形をしたツィッカーの分析
による７２キングスレショルドを応用したものである。

こぐアルゴリズムでは雑音対マスキングスレショルト比
の最小を探している。ポウチョウの装置と同しく、補助
情報は連続して伝送される。更に、こＣ装置には量子器
の出力に可変長符号器、すなわ宅ハフマン符号器があり
、その接続は非常に複雑てある。

この発明の目的はこれらの種々の既知の装置Ｃ欠点を解
決することである。

（発明の目的）この発明の目的はより詳細には、ディジタルオーディオ
信号の圧縮装置を提供することであり、ビットレートを
大幅に下げるため、信号の伝送または記憶に使われるビ
ットの割り当て装置を使用しており信号の適応量子化の
装置を制御しているが、同時に信号の初めの品質を最大
限保護している。

この発明の他の目的は、こうようなビット割り当て装置
を提供することであり、動作原理には心理的聴覚基準が
考慮されている。

この発明の他の目的は、誤りを生ずる外乱すなわち妨害
が伝送チャネルに生ずるとき、信号の復元における鎖状
の劣化現象を最小にすることである。

この発明の補足的な目的は、この発明の好都合な実施態
様の１つであるが、補助信号のビットレート主情報のビ
ットレートを最適にすることにより主情報と補助情報を
一緒にして伝送する原理を提供することである。

この発明の目的は、更に一定のビット数を情報の各ブロ
ックの符号化に使用できるようにすることである。

（発明の要約）これらの目的は、他の事柄と同じく以下の説明で明らか
になるが、ビット割り当て装置により達成され、この種
の装置により変換ディジタルオーディオ信号の圧縮を量
子化するための装置を制御することができ、ビットレー
トが制限されているチャネルを通して伝送できるように
、またはディジタル情報の媒体となるものに記憶できる
ように設計されており、割り当てが変換信号の全てのス
ペクトラムをカバーしている一組の隣接帯域の中に各帯
域を特に割り当てることと、前記変換信号のスペクトラ
ムの記述に対応した補助情報の関数として、前記信号の
変換係数を表すためのいくつかの特別なビットから構成
されており、前記装置が心理的聴覚基準の関数として、
前記変換信号のスペクトル成分を予め除去する装置によ
り情報を得ている。

補助情報を用意するためスペクトル或分を除去すること
により量子化の操作に対し予め最適化が行われる。都合
の良いことに、前記装置には前記帯域のそれぞれにビッ
トの割り当てを最適にするため、心理的聴覚基準に基づ
くスペクトル成分のマスキングスレショルドを計算する
装置が（既知の方法で）含まれている。

なるべく、前記心理的聴覚基準はツイッキ一の心理的聴
覚マスキング基準に従うほうが良い。

この発明の大きな特徴によれば、量子化の前記装置には
少なくとも２つの異なる量子器と、前記量子器の１つを
前記変換信号のスペクトラムの前記帯域にそれぞれ選択
的に割り当てる装置が含まれており、その割り当て方は
マスク係数の前記除去を行った後の前記帯域内にあるい
くつかの成分の関数によっている。

この発明の好ましい実施態様において、前記装置は前記
帯域のそれぞれに量子化雑音対マスキングスレショルド
比を最小にする装置を含んでいる。

都合の良いことに、前記量子化雑音は次のグループの３
つの情報を少なくとも１つも情報を関数として決められ
ている：（１）前記帯域内で除去されない前記スペクトル成分の
標準偏差；（２）前記帯域のため選択された前記量子器の性能係数
；（３）前記帯域スペクトルの広がりに対する１つの情報
。

この発明の他の特徴によれば、スペクトル成分を予め除
去する前記装置により与えられる前記の情報は、マスク
された前記のスペクトル成分の指標を符号化するための
連なりの長さの符号化装置により用意されている。

なるべく、前記連なりの長さの符号化装置にはハフマン
タイプの可変長符号を使用することが好ましい。好都合
な特徴によれば、前記連なりの長さの符号化装置により
、周波数帯域を符号化するための特別な符号語を、除去
されている全ての前記成分に与えることができる。

好都合なことに、前記連なりの長さの符号化装置は、前
記符号化により与えられたビットレート利得に対する１
つの情報の関数として、選択装置により動かされている
。

この発明の他の大きな特徴によれば、前記装置はスペク
トラムの記述に対応した前記補助情報を符号化する装置
と連動している。

このように、主情報のビットレートに対し大きな逆効果
を生ずることなく、補助情報を際限なく伝送することが
可能となる。

なるべく、前記符号化装置には予測符号化装置が含まれ
ていることが好ましい。

このように、鎖状の劣化の生ずる危険性が主清報に関し
ては取り除かれる。この劣化はこの発明では補助情報に
のみ生ずる。

好都合なことに、前記予測符号化装置は対数変換装置、
差分ＭＩＣ符号化装置、およびハフマンタイプの可変長
符号による符号化装置からなるグループの装置を含んで
いる。

なるべく、前記符号化装置にはメモリのないブロック間
符号化装置が含まれていることが好ましく、前記予測符
号化装置とメモリのない前記符号化装置は予め決められ
た基準により選択されることが好ましい。

好都合なことに、前記の予め決められた基準は最小のど
ットレート基準と、伝送誤りの影響を最小にする基準の
両方または一方のいずれかである。

この発明の好都合な特徴によれば、スペクトラムの記述
に対応した前記補助情報と、聞こえない成分を除去する
前記装置により得られる前記情報と、スペクトルの広が
りに関する１つの情報を含むグループの情報の少なくと
も１つの情報は伝送され、または主情報ブロックのそれ
ぞれと一緒に記憶されている。

この発明の他の特徴によれば、前記変換ディジタル信号
は変形離散形余弦変換と、ブラッドリ−（Ｂｒａｄｌｅ
ｙ）の変換を用いた変換符号化装置により与えられてい
る。

好都合なことに、前記変換符号化装置には前記変換信号
を対称にした仮の信号の傾斜窓を作る装置がある。

なるべく、前記窓を作る装置が次式で定義される窓を使
用していることが好ましい；Ｆ（ｎ）＝：２．ｓｉｎ（−ｒｃ（ｎ＋０．５）／Ｎ）
　　ｎ＝０．１，−，Ｎ−１ここにＮは前記窓のサンプ
ル数である。

（実施例）以下、この発明を図面に基づき更に詳しく説明する。

第ｌ図の装置により、この発明の方法によるディジタル
オーディオデー夕の符号化が行われる。３２ｋＨｚ以上
の周波数で標本化された人力信号Ｘ（ｎ）１０は変換モ
ジュールｌ１に加えられる。標本化周波数は高忠実度サ
ウンドに使用されている周波数に対応している。

変換モジュール１１の好ましい実施態様には、好都合な
ことに変形離散形余弦変換０，ＩＤＣＴ）として知られ
ているプリンセンとブラッドリーにより発明された変換
が使用されている（゛アダブティブトランスホーム　コ
ーディング　インコーボレイティング　タイム　ドメイ
ン　アライジングキャンセレーション（Ａｄａｐｔｉｖ
ｅ　Ｔｒａｎｓｆｏｒｍ　ＣｏｄｉｎｇＩｎｃｏｒｐｏ
ｒａｔｉｎｇ　Ｔｉｍｅ　Ｄｏｍａｉｎ　Ａｌｉａｓｉ
ｎｇＣａｎｃｅｌｌａｔｉｏｎ）”、インスピーチ　コ
ミュニケーション（ｉｎ　Ｓｐｅｅｃｈ　Ｃｏｍｍｕｎ
ｉｃａｔｉｏｎ）．１９８７年１２月）。

この変換は余弦ベース（ｂａｓｅ）への投影に対応して
いる。変換係数は次式により定義される：ｙ（ｍ，ｋ）
：Ｎ−１ Σ　Ｘｍ（ｎ）．ｈ（Ｎ−１−ｎ）．ｃｏｓ（２−ｒｔ
（ｋ＋ｎ＝０％）　＜ｎ＋ｎ．）／Ｎ）ｋ＝ｏ，　　・・・　　Ｎ−１ここに、Ｎ：変換ブロックの大きさｈ（ｎ）：ブロックの重み付け窓ｍ　：ブロック変換数。

最も重要な利点は、変換チャネルを非常に離すことによ
り、スペクトルの平面に高性能重み付け窓ｈ（ｎ）を使
用することができることに関係している。エネルギーの
集中は例えば離散フーリエ変換（ＤＦＴ）よりも高く、
符号化される係数は真のスペクトラムに非常に近い。

変換が行われる前に標本化の仮のブロックは窓ｈ（ｎ）
により重み付けされる。例えば、正弦波状の窓の“傾斜
”窓が使用されており、ｈ　（ｎ）　＝２，　ｓｉｎ　
（　ｘ　（ｎ＋０．　５）／Ｎ）で定義され、ｎはＯか
らＮ−１まで変化し、Ｎは仮のブロック当たりの標本数
である。使用したＭＤＣＴは、この種の傾斜窓と完全に
一緒に作用する。実際、この種の窓は変換後にＮ／２個
の単一係数を得るため使用することができ、他のＮ／２
個の係数は符号を除くと同じである。これに対して、長
方形の窓は元の信号に対してスペクトルに広がりが生ず
る。それを応用するには、ブロックの大きさの５０％が
ブロック間でオーバーラップする必要があるので、変換
係数の数は各ブロックに伝送される元の信号の標本化の
元の数に等しい。このブロック間のオーバーラップは信
号の復元を完全に行うことができるようにするため必要
である。

変換モジュール１ｌから生ずる係数ｙ（ｋＨ２はいろい
ろな符号化モジュールｌ３、１４、ｌ５、１６、１７の
入力に加えられている。

それらの中の第１番目のブロックは変換信号ｌ２の中の
聞えないスペクトル成分を除去している。

この除去の作用は例えば以下に詳細に述べろツイッカー
の分析に基づいている。

この分析によりオーディオ信号の聞えない周波数に対応
しマスクされたラインを識別することが可能となる。こ
れらの聞えない成分に対応した変換係数は伝送されない
。

Ｍ　Ｄ　ＣＴは十分な周波数間隔により特徴づけられて
おり除去されたラインの数は大きい。その結果、伝送さ
れる数はかなり減少する。更にこれらの伝送されない係
数のレベルは一般に低いので、伝送される係数に使用さ
れる量子器はそれに応じて最適となる。

マスクライン１４を除去するモジュールは第２図につい
て以下により詳細に記載されている。

モジュールｌ４の出力に生ずるスペクトルラインは補助
情報の計算と符号化のためのモジュール１５に至る入口
となっている。モジュール１５により生ずる補助情報は
帯域幅が異なる周波数帯域により計算され、２つの異な
ったモードにより符号化される。信号が変動しない場合
、符号化は次のブロックに対して行われ（フレーム間の
相関が考慮される）、他方現在のブロックが変化するブ
ロックの場合、符号化はブロック間のメモリを考慮しな
いで行われる。

これらの符号化装置は第３図について以下により詳細に
述べられている。

マスクラインを除去するためと、補助情報を計算し符号
化するためのモジュール１４の出力は量子器１７を制御
するビット割り当てモジュール１６に加えられる。ビッ
ト割り当てブロック１６の出力には、変換信号１２のそ
れぞれの係数ｙ（ｋ）を示すのに用いられているビット
数がＲの情報１８が与えられている。このビット割り当
てはダイナミックであり、すなわち１つのブロックから
次のブロックの間変化している。更に、量子化雑音をマ
スクするように設計されている。

ビット割り当てモジュール１６には更に入力として、ス
ペクトル広がり関数による値があり、この関数の値は変
換信号１２の係数についてスペクトルの広がりを計算し
符号化するモジュール１３により与えられる周波数帯域
内で測定される。これにより、スペクトルの性質に非常
に集中しているかどうかということの特徴を与えること
ができる。

ビット割り当てモジュール１６の動作は以下により明ら
かにされる。

最後に、信号ｌ２の係数ｙ（ｋ）はビット割り当て数が
Ｒの情報１８に従ってモジュール１７で量子化される。

更にこの発明の大きな特徴によると、モジュール１４か
ら来るマスクラインの除去についての情報と同様に、補
助情報の符号器１５の出力で得られる情報１９により、
後で判るように現在のブロックに対しいくつかの量子器
から１つを選択することができる。

復号化は、符号化と全く対称な方法で行われる。

第２図にはマスクライン除去モジュール１４の機能図を
示す。

このモジュールの機能はマスク現象のため聞くことので
きないラインを除去することであり、その結果知覚的に
有益な情報のみが伝送される。

この手続きは、高周波成分の多いスペクトラムの広いサ
ウンドに特に有益である。非常に多くの係数がその後マ
スクされる。それはまさに高いビットレートを必要とす
るこの種の信号であり、？れは伝送される情報の量のた
めである。

この装置にはマスクライン検出モジュールが含まれてい
る。この検出は実際のスペクトラムに関しており、符号
器のみにより行われる。ツイッカーの分析により、周波
数マスキング曲線を使用することができる。第５図に示
すように、伝送されるラインのそれぞれに対し、上側の
臨界帯域当り−２５ｄＢのライン５２より下にあり、か
つ上側の臨界帯域当り−１　０ｄＢのライン５３より下
にあるラインは聞くことができないことが明らかになる
。これらの２つのスロープはそれぞれ前方および後方周
波数マスキングに対応している。

スペクトラムは２４個の臨界帯域Ｂ，．Ｂ．、Ｂ３に分
割され、前記帯域のそれぞれに対し伝達係数ａ０が掛算
される。

マスキングスレショルドの計算は゜゜臨界帯域内”マス
キングと“臨界帯域間”マスキングに分けられる。帯域
内マスキングは工つの同一の帯域Ｂ２内の全てのライン
５１．．５１■の全体のマスキング効果に対応している
。帯域内マスキングスレショ？ドは変換信号の各係数ｙ
（ｋ）の寄与分の和により計算される。

下限ｂｂ　（Ｊ）と上限ｂｈ（ｊ）により限界が定めら
れている臨界帯域ｊを考えるならば、帯域内マスキング
スレショルドに対する係数ｙ（ｋ）の寄与分Ｓｉｎ　（
ｊ）は次式で与えられる；Ｓｉｎ’　（ｉ）■ｅ　．　（ｙ（ｋ）　”．ａｏ　（
ｊ）　）ここにｂゎ（ｊ）＜ｉ＜ｋ−３およびｋ　＋　３　＜　ｉ　＜ｂｈ（ｊ）　ｅは−３０ｄＢに
等しい一定のシフト量。

気づくことができるように、係数ｙ（ｋ）のそれぞれは
４つの１番近い係数のマスキングスレショルドに影響を
与えない。この注意が必要なのは、スペクトルのピーク
の近くに発生する時間のずれたゼロセッティング（ｚｅ
ｒｏ−ｓｅｔｔｉｎｇ）を防ぐためである。

マスキングスレショルドはＳｉｎ’（ｉ）の和により得
られる：ｂｈ　（ｊ）Ｓｉｎ（ｉ）：　　Σ　　　　Ｓｉｎ’　（ｉ）ｉ：ｂ
ｂ（ｊ）ここに、ｂゎ（Ｊ）　＜　ｉ　＜ｂｈ（ｊ）およびｊ＝
−ｔ、・・・２４。

帯域間マスキングは各帯域Ｂ２において隣接帯域のマス
キングの影響を検討することから生ずる。

実際、後方マスキングのみ（帯域Ｂ２のライン５１３の
マスキング）が帯域間マスキングスレショルドを計算す
るのに検討される。前方マスキング（帯域Ｂ．）は低く
過ぎるので、ブロック当たりのマスクラインの数を実質
的に制限することができる（−１０ｄＢの代りに臨界帯
域当たり−２５ｄＢ）。

次の帯域のマスキングに対する各臨時帯域ｊの寄与分Ｓ
ｏｕｔ・（ｉ）は次式により計算される：ｉ＝ｊ＋１、
・・・、２４臨界帯域に対する全ての帯域間マスキングは次式に等し
い：ｊ：１最後に、臨界帯域ｊの係数ｙ（ｉ）に対し、最終的なマ
スキングスレショルドは次の和により得られる：Ｓ（ｉ）＝Ｓｉｎ（ｉ）＋Ｓｏｕｔ（ｊ）伝達係数ａｏ
　（ｊ）を掛算した係数ｙ（ｉ）のエネルギーはその後
このように決められたマスキングスレショルドと比較さ
れる。ａｏ　（ｊ）　−　ｙ”　（ｉ）　＜　Ｓ　（ｉ
）ならば係数ｙ（ｉ）はマスクされているとみなされる
。

この関数は第２図のサブモジュール２ｌにより行われる
。この図は第１図のマスクライン除去モジュールｌ４に
ついて主構成サブモジュールの詳細図を示している。

好都合なことに、サブモジュール１４のマスクラインの
検出はマスクラインの指標を符号化したあとに、ブロッ
ク２０で行われる。この符号器が必要なのは符号器にマ
スク係数の数を示すためであり、例えば連なりの長さの
符号化技術を用いるためである。Ｉｍ（ｋ）を係数ｙ　
（ｋ）がマスクされている時の１に等しいビットとする
。

級数｛　Ｉｍ　（ｋ）　．　ｋ＝ｏ、−，Ｎ／２｝には
可変長のＯとｌの連続した連なりがあり、サブモジュー
ル２２で形成される。可変長符号２３により伝送される
のは連なりの長さである。もし同じ状態にある非常に多
くのラインがとぎれることなく互いに続いているならば
、この補助情報に割り当てられるビットレートは低くな
る。

サブモジュール２３の可変長符号化は実験上の確率密度
から計算されるハフマン符号により行われることが好ま
しい。

連なりの符号化は１番目のマスクラインから前にだけ出
発する。このマスクライン数は９ビットで伝送される。

符号器では、連なりの長さの符号化を行うことは簡単に
全てのＯと１の連なりを探すことであり、それに対応し
たホフマン符号語とそれらを関連づけることである。

連なりの長さは最大値で制限される：Ｏの連なりに対し
係数は６４で、ｌの連なりに対し係数は１２８である。

これらの制限を越えると、長さがゼロの連なりとその逆
の状態が伝送される。長さが？ロの連なりに対し、関連
したハフマン符号語があり、その符号語はゼロが発生し
た後に計算される（ラインの外で）。

復号器では１番目のマスクラインを受信後、ハフマン符
号の復号が十分に行われる。符号語の０と１の長さの連
なりにより級数｛Ｉｍ（ｋ）　｝を正確に復元できる。

Ｏとｌの連なりが非常に断片的であるならば、補助情報
ビットレートは高くなる。マスクラインの数が小さけれ
ば非伝送利得はゼロか十分負である。この非伝送は継続
しないこと、または少なくともある周波数領域に閉じ込
めないことが適当である。

最後まで、係数当たりのビットの平均数が次の２つの場
合について計算される：（１）　　全ての係数を伝送の場合：Ｒ　，　（ｋ）　＝　（ＲＯ−Ｒ　．■）／（Ｎ／２）
ここに、Ｒ０はブロック当たりの全ビット数、Ｒ．■は
スペクトラムを描く補助情報の伝送に必要なビット数、
Ｒ＋ｆｉは実際には前のブ？ックの値である。

（２）　　連なりの長さの符号化を使用することにより
マスクラインを伝送しない場合：Ｒｚ（ｋ）＝（Ｒｏ−Ｒ，ｒ−Ｒ＋−）　（Ｎ／２−Ｎ
ｒ．，Ｉ）ここに、Ｒ．は連なりの長さの符号化の補助
のビットレート、Ｎ■はマスクラインの数である。

マスクラインの非伝送は、試験とサブモジュール２４を
計算するビットレートが次の関係を満すならば、対象と
なる帯域全てにわたり行われる：Ｒ．Ｉｎ＜Ｒｒｆｆｉ
．　（２（Ｒ−Ｒ＋ｆ．）／Ｎ）この関係が満たされな
ければ、この試験はＯと１の連なりを探す間は帯域幅が
等しく、対象としている帯域の４つの周波数サブ帯域内
で行われ、Ｒ．．（１）とＮ■（１）　（ｔ＝ｔ、・・
・、４）の部分的な値が計算される。

Ｒ＋ｍ（１）＜Ｎｒｍ（１）．（２（ＲＯ−Ｒｉｆｔ）
／Ｎならば、すなわちビットの利得は対象としている周
波数サブ帯域１に対して正となり、連なりの長さの符号
化はこのサブ帯域１の係数に加えられる。

もし前式が成立しなければ、この帯域の係数はマスクさ
れていないと取り扱われ、Ｏとされている■番目の係数
の指標はそれに応じて制限されている。

符号化有効認定サブモジュール２５は符号化を行う必要
性の有無により、可変長符号化サブモジュール２３を制
御する。

補助的な平均ビットレートはマスクライン当り０．８ビ
ットのオーダである。この値が低ければ連なりの長さの
符号化を使用することに時間をかける価値のあることが
判る。

第３図には補助情報の計算と符号化に対するモジュール
ｌ５の詳細な機能図を示している。

補助情報の伝送が必要なのは、ビット割り当てを計算し
、係数を量子化するためである。この補助情報１９は実
際には信号の正確な可変スペクトラムの記述子である。

前述の実施態様において、スペクトラム記述子は長さの
等しくない周波数帯域のサブモジュール３１で計算され
る。スペクトラムは、例えば５０個の周波数のグループ
に分割される。

これらの帯域の限界ｂｓｉ″′（ｊ）とｂ．　＋　”　
（ｊ）は臨界帯域内にある。一番狭い帯域（ｊ＝１、・
・・　１４）の幅は対応する臨界帯域と同じである。他
の帯域にある増加した帯域幅は最後の帯域（ｊ・５０）
に対し５６２．　５Ｈｚになる（すなわち１８個の係数
）。

スペクトラム記述子ａ　（ｊ）は、各バンドの非マスク
スベクトルラインの標準偏差に等しく、ここにｊ＝１、
・・・、５０Ｎｇ＋（ｊ）は帯域ｊ内の非マスク係数の数。

この発明によると、この情報を符号化する新奇性は連続
した変換ブロック間の相関は予測符号化により検討され
るということにある。このように、符号器により信号の
全ての相関（短期間および長期間）から利点が導かれる
。

補助情報の符号化は係数の量子化の場合と異なり、通常
知覚特性を考慮しないで行われる。しかし、主信号１０
１のビットレートに対し可能な限り最大のビット数を用
意することが必要であり、それ故補助情報１９のビット
レートを減らす必要がある。

スペクトラム記述子σ（ｍ．　ｊ）　（ｍ：ブロック数
）の成分を直接符号化するには、ビットレートを高くす
る必要がある。しかし、信号は一般にほとんど変化がな
いので、スペクトラム記述子の相関はブロック相互間で
高く。

この変化の少ない特性が有利になる最も直接的な方法は
予測符号化３２を動作させることである。

スペクトラムのダイナミックレンジが大きいため、σ（
ｍ．ｊ）に対する予測はｄＢ表示とすることが好ましい
。実際、差σ（ｍ．ｊ）一σ（ｍ−１．ｊ）よりも比σ
（ｍ．ｊ）／σ（ｍ−Ｌｊ）の方の予測利得が高い。

第４図に示すように、この予測符号化には対数目盛に変
換される作用子４１があり、この対数目盛は差動ＭＩＣ
符号器と可変長符号化装置４３により発生している。

予測は１次予測器４４により行われる。予測の係数σ１
は、０、９５と１の間の値をとる。この子測器４４の入
力は、それより以前の量子化値ｌｏｇ　（σ’　（ｍ．
　ｊ））である。

予測誤りｅ　（＋＋＋．ｊ）＝ｌｏｇ（ａ　（ｍ．ｊ））−　ｏ
　ｒ　Ｌｏｇ（ａ　’（ｍ−１．ｊ））ここにｊ＝１、
・・・、５０は例えばダイナミックレンジが［−２、２コに対し３２
個のレベルを有する均一量子器４５により量子化される
。

信号の長さは変化しないので、量子器４５の出力におけ
る符号語の確率密度の集中は高い。その結果、これらの
符号語がとる可変長符号化４３（ホフマン符号化）によ
り、スペクトラム記述子の伝送ビットレートをσ’　（
ｍ．　ｊ）の値に対し約２．５ビットに減らすことがで
きる。

ｌｏｇ　（σ’　（ｍ．　ｊ）　）の値は復号器で得ら
れる値に対応して逆量子器４７により与えられる値と、
予測器４４から生ずる前の値の和４６により得られる。

周波数帯域が完全にマスクされているならば（Ｎ．＋（
ｊ）・０）、帯域ｊに対して符号語を伝送する必要はな
い。実際、この場合σ（ｍ．ｊ）の値はマスクラインに
関する情報により復号器に知らされている。

しかし、ビットＩ　（ｍ，　ｋ）の伝送誤りをσ’　（
ｍ．　ｊ）の値に発生しないようにするため、冗長性を
符号化の中に慎重に取り入れてある：　Ｎ．．＝０なら
、特別な符号が伝送され、他の符号モードのように発生
の関数として計算される。

このように、帯域が完全にマスクされるようになると、
予測は最後の非伝送のゼロでない値σ’　（ｍ−ｐ．　
ｊ）に関係する。

スペクトルが変化する間は（信号が変化）、この量子化
の手続きは量子化の正確性を同じく保つためには、もは
や過大なビットレートを必要とする理由がない。従って
、σ（ｍ，ｊ）のメモリがなくサブモジュール３４に加
えられている符号化を使用する必要がある。

この２番目の符号化３４は以前のものと同じである。予
測は連続的な変換ブロックに対し行われるかわり、しば
しば発生する。予測誤りは次式により計算される：ｅ　（ｍ．ｊ）＝ｌｏｇ（ａ　（ｍ．ｊ））−ｌｏｇ（
　　ａ　’（ｍ．ｊ−１））ｅ（ｍ，ｊ）は例えばダイ
ナミックレンジが１００ｄＢで量子化のレベルが５０個
である均一量子器により符号化される。出力での符号語
もハフマン符号化を受けている。

１番目の値σ（ｍ，ｌ）は分離して伝送される。

符号化の種類を選択するモジュール３３は、使用されて
いるビット数により最適な符号化を選択する。フレーム
間の符号化に必要なビットレートが予め固定されたスレ
ショルドを越えると、２番目の種類の符号化３４が使用
される。この選択は選択ビットにより復号器に伝送され
る。

符号化の種類の選択に対しては、ビットレートを最小に
することよりも他の基準を取ることができる。例えば、
伝送誤りの影響を最小にするように動作させることがで
きる。

予測器４４は１次自動回帰形予測器（ＡＲ（１））であ
り、予測係数はｌに近い。従って、伝送誤りが無制限に
伝わる危険性がある。補助情報はなかでもビットの割り
当てに対して重要性が大きいので、フレーム間符号化を
再度初期化する必要がある。

このことにより、倍数が１６であるランクの全てのブロ
ックに対し信号が変化しない場合でも、メモリのないブ
ロック間符号化が使用されている。

係数ｙ（ｋ）は不均一適応形量子器により符号化される
。適応は量子化されたスペクトラム記述子σ’　（ｍ，
　ｊ）により行われ、ｊはｙ　（ｋ）が属する帯域の数
である。

各値σ’　（ｍ．　ｊ）は周波数帯域の幅が可変である
ため、またマスクラインを検出する装置により非ゼロ係
数である変数Ｎｓ　ｒ　（Ｊ）を表わしている。量子器
の性能の値はＮｓ　ｒ　（Ｊ）の量子化に対する係数の
関数として変化する。

この発明によると、符号化システムを最適にするために
Ｎｓ＋（ｊ）の関数としていくつかの量子器が利用でき
る。第６図には使用される量子器を選択するモジュール
の機能図が示されている。

例えば、以下の構成には６Ｌから６１，の５組の量子器
が使用されている。値Ｎ＊＋（ｊ）・ｌを試験するモジ
ュール６２は次の基準により選択器６３を制御する：（１）１番目の組に対しては、帯域が１つのゼロでない
係数を持つこと：Ｎｘ＋（ｊ）・ｌ、（２）２番目の組
に対しては′：　Ｎｓ＋　（ｊ）＝６、（３）３番目の
組に対しては：　６　＞Ｎ−ｔ（ｊ）＞２、（４）４番
目の組に対しては：　１０＞Ｎ．ｉ（ｊ）＞５、（５）
５番目の組に対しては：Ｎ−＋（ｊ）＞９、それぞれの
場合、例えば１ビットから６ビットの間で変化するビッ
ト数に対し最適な量子器が計算される。

２番目の選択器６４により、量子器６５１から６５６の
各組の中からビット数の関数Ｒ１８として、最適な量子
器となるように選択される。このように、量子器の選択
の最適化は量子化される係数の数の関数と、ビット割り
当てモジュールにより割り当てられたビット数により行
われる。

第７図には、この発明による各帯域へのビット割り当て
装置を示す。

ビット割り当ては知覚的な基準により量子雑音のスペク
トルを形作るように設計されている。

ビット割り当てによりマスキングスレショルド比に対し
雑音が最小にされる。この手続きは復号器で行われ、そ
の復号器は予め伝送されたスペクトラム記述子に基づい
ている・。

ビット割り当てにはマスキングスレショルドＳ（ｋ）を
計算するモジュールと（この計算はマスクラインの検出
を行うための計算と同じである）、比α（ｋ）．β（ｋ
）．σ２（ｋ）／ｓ　（ｋ）を量子化するためのモジュ
ール７２が含まれており、後者のモジュールはヤニック
　マイエックス（Ｙａｎｎｉｃｋ　Ｍａｈｉｅｕｘ）に
よる題名が゛トランスホーム　コーディング　オブ　オ
ーディオ　シグナルズ　ユージング　コレレーション　
ビトウィーン　サクセッセブ　トランスホーム　ブロッ
クス（Ｔｒａｎｓｆｏｒｍ　Ｃｏｄｉｎｇ　ｏｆＡｕｄ
ｉｏ　Ｓｉｇｎａｌｓ　Ｕｓｉｎｇ　Ｃｏｒｒｅｌａｔ
ｉｏｎ　ＢｅｔｗｅｅｎＳｕｃｃｅｓｓｉｖｅ　Ｔｒａ
ｎｓｆｏｍ　Ｂｌｏｃｋｓ）　”　　　（ＩＣＡＳＳＰ
会議の会報、グラスゴウ、１９８９年）の文献に記載さ
れたモジュールと同等である。

ａ２（ｋ）は帯域の全ての係数ｙ　（ｋ）に亘るスペク
トラム記述子の２乗である。σ２（ｋ）は量子化される
比の本質的なエレメントに関係している。係数は異なっ
た組の量子器で符号化されるので（Ｎｇ　＋　（Ｊ）に
よる）、ヤヤント（　Ｊａｙａｎｔ）とノル（Ｎｏｌｌ
）の研究、すなわち波形のディジタル符号化（ブレンテ
ィス　ホール　シグナル　ブロセセングシリーズ（Ｐｒ
ｅｎｔｉｃｅ　Ｈａｌｌ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓ
ｓｉｎｇＳｅｒｉｅｓ）　．　１９８４年）により、ビ
ットの割り当てに各組の量子器の性能の相対値を含める
必要がある。

関数α（ｋ）は係数ｙ　（ｋ）に使用されている量子器
の性能係数に等しい。テーブル７３には例えば予め計算
されたα（ｋ）の５つの値が含まれている。このテーブ
ルのアドレスはゼロでない係数の数により行われる。各
組の量子器の実際の性能の値を取ることにより、符号化
の品質をかなり改善できる。

部分的に関数β（ｋ）を計算するモジュール７４により
、ヤヤントとノルによるスペクトルの広がりγが計算さ
れる。この関数はスペクトラムが集中しているかどうか
示しており、次式により符号器で計算される：ビット割り当てのため、γは帯域幅の等しい４つの周波
数帯で計算される。これらの４つの値は６ビットの均一
量子化により符号器に伝送される。

これらの４つの周波数帯域のそれぞれにおいて、関数β
（ｋ）は非直線関数によるγの値に従い計算される。β
（ｋ）の役割はビ、ットの割り当てによりピークのある
スペクトラムの領域にビット数を多く与えることである
。実際、信号に含まれている正味のサウンドに対応した
係数ｙ　（ｋ）はより正確に符号化される必要があり、
マスキングスレショルドが有するレベルは信号のレベル
と比較すると雑音スペクトラムの場合より低い。

ブロック間の相関を用い、聞えないスペクトル成分をは
っきり検出することにより、３２ＫＨｚを越えた周波数
で標本化し、ほぼ６４ｋｂｉｔｓ／ｓの値まで高品質信
号のビットレートを下げることができ、元信号の品質を
聴覚による評価結果の観点から保つことができる。

【図面の簡単な説明】

第１図はこの発明によるビット割り当て装置を含むディ
ジタルオーディオ信号符号化装置のブロック図であり；第２図はマスクラインを除去するためのモジュールの機
能図であり；第３図は補助情報の計算および符号化のためのモジュー
ルの詳細な機能図を示し；第４図は補助情報の予測符号化のためのモジュールの機
能図であり；第５図はツイッカーの分析によるマスクラインを除去す
る原理を示す図であり；第６図はいくつかの量子器のｌつを選択するためのモジ
ュールの機能図を示し；第７図は各帯域に対しビット割り当てを行うための装置
の機能図である。図中、１０　　・・・　入力信号Ｘ（ｎ）　　１１　　・・・
　変換モジュール？２　　・・・　係数ｙ（ｋ）ｌ３、１４、ｌ５、１６、１７　　・・・　符号化モジ
ュール１８　　・・・　情報　　　　　１９　　・・・
　補助情報２０　　・・・　ブロック２１，　２２、２３、２４、２５、３１．　３４　　・
・・　サブモジュール３２　　・・・　予測符号化３３　　・・・　符号化の種類を選択するためのモジュ
ール４１　　・・・　変換のための作用子４３　　・・・　可変長符号化装置４４　　・・・　１次予測器　　４５　　・・・　均一
符号器４６　　・・・　和　　　　　　４７　　・・・
　逆量子器５１．，５１２、５１．・・・　ライン５２
，，５２■、５２３・・・ライン５３，，５３■、５３３・・・ライン６１，，６１■、・・・、６１５　　・・・量子器の組
６２　　・・・　試験のためのモジュール６３　　・・
・　選択器　　　　６４　　・・・　２番目の選択器６
５．、６５■、・・・、６５５　　・・・　量子器７２
　　・・・　量子化のためのモジュール７３　　・・・
　テーブル７４　　・・・　計算のためのモジュール１０１・・・
　主信号

Claims

【特許請求の範囲】（１）変換されたディジタルオーディオ信号の圧縮を量
子化するための装置を制御することができるタイプの装
置であり、ビットレートが制限されたチャンネルを通し
て伝送され、ディジタル情報の媒体となる物に記憶する
ように設計されており、割り当てが、変換された信号の
スペクトラムの全体をカバーしている一組の隣接帯域の
中に各帯域を特に割り当てることと、前記変換信号のス
ペクトラムの記述に対応した補助情報の関数として、前
記信号の変換係数を表すためのいくつかの特別なビット
から構成されており、前記装置が心理的聴覚基準の関数
として、前記変換信号のスペクトル成分を予め除去する
装置により情報を得ているビット割り当て装置。（２）前記装置が（既知の方法で）、ビット割り当てを
前記帯域のそれぞれに最適に行うため、心理的に聴覚基
準に基づきスペクトル成分のマスキングスレショルドを
計算するための装置を含む請求項１記載の装置。（３）前記心理的聴覚基準がツイッカーの心理的聴覚マ
スキング基準に基づき作用している請求項１または２の
いずれか１項に記載の装置。（４）前記量子化の装置が少なくとも２つの異なる量子
器と、前記変換信号のスペクトラムの前記帯域のそれぞ
れに前記量子器の１つをマスクされた係数の前記除去の
あとの前記帯域内にある成分の数の関数として選択的に
割り当てられるための装置を含む請求項１または２のい
ずれか１項に記載の装置。（５）前記装置が前記帯域内で量子化雑音対マスキング
スレショルド比を最小にするための装置を含む請求項１
または２のいずれか１項に記載の装置。（６）前記量子化雑音が次のグループの３つの情報の少
なくとも１つの情報の関数として決められる請求項５記
載の装置：（１）前記帯域内で除去されない前記スペクトル成分の
標準偏差：（２）前記帯域のため選択された前記量子器の性能係数
：（３）前記帯域のスペクトルの広がりに対する１つの情
報。（７）スペクトル成分を予め除去するための前記装置に
より与えられた情報が、前記マスクされたスペクトル成
分の指標を符号化する連なりの長さの符合化装置により
用意される請求項１記載の装置。（８）前記連なりの長さの符号化装置が、ハフマンタイ
プの可変長符号を使用している請求項７記載の装置。（９）前記連なりの長さの符号化装置が、周波数帯域を
符号化するための特別な符号語を除去されているすべて
の前記成分に与えている請求項７または８のいずれか１
項に記載の装置。（１０）前記連なりの長さの符号語が、前記符号化によ
り与えられるビットレート利得に対する１つの情報の関
数として選択装置により動かされている請求項７または
８のいずれか１項に記載の装置。（１１）スペクトラムの記述に対応した前記補助情報を
符号化するための装置と連動している請求項１記載の装
置。（１２）前記符号化装置が予測符号化装置を含んでいる
請求項１１記載の装置。（１３）前記予測符号化装置が、対数変換装置と、差動
ＭＩＣ符号化装置と、ハフマンタイプの可変長符号によ
り符号化される装置からなるグループの装置を含んでい
る請求項１２記載の装置。（１４）前記符号化装置に更にメモリのないブロック間
の符号化のための装置も含んでおり、前記予測符号化装
置とメモリ内前記符号化装置が予め決められた基準によ
り選択されている請求項１２または１３のいずれか１項
に記載の装置。（１５）前記予め決められた基準が最小のビットレート
基準と、伝送誤りの影響を最小にする基準の両方または
一方のいずれかである請求項１４記載の装置。（１６）スペクトルの記述に対応した前記補助情報と、
聞こえない成分を除去する前記装置により得られる前記
情報と、スペクトルの広がりに関する１つの情報を含む
グループの少なくとも１つの情報が伝送され、または主
情報ブロックのそれぞれと一緒に記憶されている請求項
１記載の装置。（１７）前記変換ディジタル信号が変形離散的余弦変換
のプリンセンとブラッドイータイプの変換を用いた変換
符号化装置により与えられている請求項１記載の装置。（１８）前記変換符号化装置が前記変換信号を対称にし
た仮の信号の傾斜窓を作るための装置を含んでいる請求
項１７記載の装置。（１９）前記の窓を作る装置が次式で定義される窓を使
用している請求項１８記載の装置：Ｆ（ｎ）＝２．ｓｉｎ（π（ｎ＋０．５）／Ｎ）ｎ＝０
、・・・、Ｎ−１ここにＮは前記窓の標本数である。