JPH08204574A

JPH08204574A - 適応的符号化システム

Info

Publication number: JPH08204574A
Application number: JP7028806A
Authority: JP
Inventors: Jong-Il Kim; 鐘一金
Original assignee: Daiu Denshi Kk; Daewoo Electronics Co Ltd
Current assignee: Daiu Denshi Kk; WiniaDaewoo Co Ltd
Priority date: 1995-01-09
Filing date: 1995-01-25
Publication date: 1996-08-09
Anticipated expiration: 2017-07-02
Also published as: EP0721257A1; EP0721257B1; JP3297240B2; US5627937A

Abstract

(57)【要約】【目的】入力ディジタルオーディオ信号を適応的に
符号化して、符号化効率と音質を向上させる新規なシス
テムを提供すること。【構成】Ｎ個のサブバンドフィルタ１１、１２と、
第１パラメータを測定する第１認知パラメータ測定デバ
イス２０と、各フレームの認知情報量を測定して、平均
及び標準偏差パラメータを算出し、Ｆ個のフレームを含
むチャンネル内フレームグループを発生する第２認知パ
ラメータ測定デバイス３０と、各チャンネル内フレーム
グループへのビットを適応的に特定し、ビット割当情報
を発生する第１ビット割当ユニット４０と、各サブバン
ドへのビットを特定し、ビット割当情報を発生する第２
ビット割当ユニット５０と、サブバンドオーディオ信号
を量子化するＮ個の量子化器７１、７２と、量子化済み
のオーディオ信号と共に、ビット割当情報をフォーマッ
トするフォーマッティング回路８０とを含む。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、ディジタルオーディオ
符号化システムに関するものであって、特に、人間の聴
覚特性に符合する各々の入力ディジタルオーディオ信号
への認知情報量に基づいて、複数のチャンネルからの入
力ディジタルオーディオ信号を適応的に符号化する改良
された符号化システムに関するものである。

【０００２】

【従来の技術】コンパクトディスク（ＣＤ）及び／また
はディジタルオーディオテープ（ＤＡＴ）のようなもの
に比肩しうる高音質のオーディオ信号を達成するため
に、ディジタル化されたオーディオ信号を伝送する。オ
ーディオ信号がディジタル形態で表現される場合、特
に、高精細度テレビ（ＨＤＴＶ）の場合、相当な量のデ
ータを伝送する必要がある。しかし、オーディオ信号に
割当てられた利用可能な周波数帯域幅は限定されている
ので、例えば、４８ｋＨｚにサンプリングされた１６ビ
ットパルス符号変調（ＰＣＭ）オーディオ信号、即ち、
１秒当り７６８ｋビットの相当な量のデータを、限定さ
れたオーディオ帯域（約１２８ｋＨｚ）を通して伝送す
るためには、データを圧縮するのことが必須である。

【０００３】多様なオーディオ圧縮デバイスまたは技法
の中で、ＨＤＴＶ応用のための心理音響アルゴリズム
（Ｐｓｙｃｈｏａｃｏｕｓｔｉｃａｌｇｏｒｉｔｈ
ｍ）を用いる、いわゆるＭＰＥＧオーディオアルゴリズ
ムが提案されてきた。

【０００４】このＭＰＥＧオーディオアルゴリズムはサ
ブバンドフィルタリング、心理音響モデリング、量子化
及び符号化、及びフレームフォーマッティングのような
４つの主な要素で形成されている。このサブバンドフィ
ルタリングは、入力ＰＣＭディジタルオーディオ信号を
時間領域から周波数領域へ写像するプロセスである。Ｂ
個（例えば、３２個）のサブバンドを有するフィルタバ
ンク（ＦｉｌｔｅｒＢａｎｋ）が用いられる。各々のサ
ブバンドにおいて、１２個または３６個のサンプルがグ
ループになって処理され、前記Ｂ個のサブバンドからの
グループ化されたサンプル、即ち、Ｂ×１２個またはＢ
×３６個のサンプルが１つのフレームで構成される。こ
の各々のフレームはオーディオ信号を符号化、伝送及び
復号化するための処理単位である。心理音響モデリング
は、各々のサブバンドまたはサブバンドの群に対して、
量子化及び符号化の処理を制御するための１セットのデ
ータ、例えば、信号対マスク比（Ｓｉｇｎａｌ−ｔｏ−
ＭａｓｋＲａｔｉｏ；ＳＭＲ）のデータを生成する。
その次に、サブバンドサンプルを量子化及び符号化する
プロセスで、そのＳＭＲデータを参照して利用可能なビ
ットを１つのフレームの各々のサブバンドに適応的に割
当てる。フレームフォーマットはフレームデータを他の
必要な附加情報と共に適切な形態でフォーマットして伝
送する。

【０００５】しかし、上述のＭＰＥＧオーディオ技法
は、各フレームに固定されたビットを割当てるので、そ
のフレームの間に連続的に変形されうる入力ディジタル
オーディオ信号の平均、標準偏差、認知情報量のような
統計的特性を反映できないという問題点を内包してい
る。

【０００６】その上に、異なる認知情報量を有する入力
ディジタルオーディオ信号が、かかる従来の技法を用い
る通常のデバイスへ提供される場合に、そのデバイスは
認知情報量とは無関係に、入力ディジタルオーディオ信
号を符号化するので、人間の聴覚特性を悪化させる。

【０００７】

【発明が解決しようとする課題】従って、本発明の主な
目的は、各々の入力ディジタルオーディオ信号への認知
情報量に基づいて、複数のチャンネルからの入力ディジ
タルオーディオ信号を適応的に符号化することによっ
て、符号化効率と音質とを向上させる新規なシステムを
提供することである。

【０００８】

【課題を達成するための手段】上記目的を達成するため
に、本発明によれば、Ｎ個（Ｎは正の整数）のチャンネ
ルからの入力ディジタルオーディオ信号を適応的に符号
化するものであって、該入力ディジタルオーディオ信号
の各々は複数のフレームを備えており、該各々のフレー
ムは複数のサブバンドを備える適応的符号化システムに
おいて、前記入力ディジタルオーディオ信号をサブバン
ド単位で受信して、フィルタリングする並列に配設され
たＮ個のサブバンドフィルタリング手段と、前記入力デ
ィジタルオーディオ信号における各サブバンドに対する
信号対マスク比データ、音圧レベル及びマスキング臨界
値を測定する第１測定手段と、前記測定された信号対マ
スク比データ、音圧レベル及びマスキング臨界値に基づ
いて、前記入力ディジタルオーディオ信号の各々に含ま
れた各々のフレームの認知情報量を測定することによっ
て、前記Ｎ個の全チャンネルの全体へのＮ×Ｆ個の現フ
レーム及び前フレーム（Ｆは正の整数）を含む前記測定
された認知情報量に対応するチャンネル間フレームグル
ープに対する平均及び標準偏差パラメータを算出し、前
記Ｎ個のチャンネルの各々に対してＦ個の現フレーム及
び前フレームを含むチャンネル内フレームグループを発
生する第２測定手段と、前記チャンネル内フレームグル
ープの各々に対して測定された認知情報量と前記平均及
び標準偏差パラメータに基づいて、前記チャンネル内フ
レームグループの各々へのビットを適応的に特定すると
共に、前記チャンネル内フレームグループの各々に対し
て特定されたビットに対応するビット割当情報を発生す
る第１ビット割当手段と、前記測定された信号対マスク
比データと前記発生されたビット割当情報に基づいて、
前記チャンネル内フレームグループの各々に含まれた各
々のサブバンドへのビットを特定すると共に、前記サブ
バンドの各々に対して特定されたビットに対応するビッ
ト割当情報を発生する第２ビット割当手段と、前記チャ
ンネル内フレームグループにおける各サブバンドへの発
生されたその対応するビット割当情報に応答して、前記
Ｎ個のチャンネルに対してフィルタリング済みのサブバ
ンドオーディオ信号を前記量子化する並列に配設された
Ｎ個の量子化手段と、前記量子化済みのオーディオ信号
と共に、前記発生されたビット割当情報をフォーマット
する手段とを含む適応的符号化システムが提供される。

【０００９】

【実施例】以下、本発明の適応的符号化システムについ
て、図面を参照しながら詳しく説明する。

【００１０】図１には、本発明による符号化システム１
００を概略的に示したブロック図が示されている。

【００１１】この符号化システム１００は、サブバンド
フィルタリングデバイス１０、第１及び第２認知パラメ
ータ測定デバイス２０、３０、第１、第２及び第３ビッ
ト割当ユニット４０、５０及び６０、量子化デバイス７
０及びフォーマッティング回路８０からなる。

【００１２】符号化システム１００において、Ｎ（例え
ば２）個のチャンネル、即ち、第１（またはＬ）及び第
２（またはＲ）チャンネルを通じて入力された、ｉ番目
のフレーム（現フレーム）の入力ディジタルオーディオ
信号Ｘ１（ｍ，ｉ）及びＸ２（ｓ，ｉ）は、第１認知パ
ラメータ測定デバイス２０及びサブバンドフィルタリン
グデバイス１０に供給される。ここで、各々の入力ディ
ジタルオーディオ信号は正の整数であるＭ個（即ち、ｍ
＝０，１，．．．，Ｍ−１）及びＳ個（即ち、ｓ＝０，
１，．．．，Ｓ−１）のサンプルを含む。このサンプル
数Ｍ及びＳは、前記チャンネルからの入力ディジタルオ
ーディオ信号の各々に対するサンプリング周波数に正比
例する。本明細書で用いられた「フレーム」は、一定の
個数のオーディオサンプルに対応するディジタルオーデ
ィオ信号の一部分を表すと共に、ディジタルオーディオ
信号の符号化及び復号化のための処理単位である。

【００１３】図示されたように、サブバンドフィルタリ
ングデバイス１０は、現フレームの入力ディジタルオー
ディオ信号を同時に受信するために並列結合された、複
数のサブバンドフィルタ、例えば２個のサブバンドフィ
ルタ１１及び１２を含む。このデバイス１０は当業者に
良く知られているサブバンドフィルタリング技法、例え
ば、ＩＳＯ／ＩＥＣＪＴＣＩ／ＳＣ２／ＷＧ１１、
「Ｐａｒｔ３，ＡｕｄｉｏＰｒｏｐｏｓａｌ」、ＣＤ
−１１１７２−３（１９９１年）に記述された、いわゆ
るＭＰＥＧオーディオアルゴリズムに開示されたような
方法を利用することによって、第１及び第２チャンネル
から該入力ディジタルオーディオ信号に対してフィルタ
リング処理を行う。即ち、各々のサブバンドフィルタ１
１、１２は、サンプリング周波数ｆｓを有する入力ディ
ジタルオーディオ信号を、サンプリング周波数ｆｓ／Ｂ
を有するＢ個（例えば、３２個）の同一の大きさのサブ
バンドに分割するように働き、その分割されたサブバン
ドオーディオサンプルを量子化デバイス７０へ供給す
る。

【００１４】一方、第１認知パラメータ測定デバイス２
０は、第１及び第２チャンネルからの現フレームの入力
ディジタルオーディオ信号を受信して、各々のサブバン
ドに対する信号対マスク比（ＳＭＲ）データＳＭＲ１、
ＳＭＲ２と、音圧レベルＰ１、Ｐ２と、マスキング臨界
値Ｍ１、Ｍ２とを測定する。その各々のサブバンドは例
えば、前記ＭＰＥＧオーディオアルゴリズムに議論され
た心理音響モデルを用いて第１及び第２チャンネルから
の現フレームに含まれている。第１チャンネルからの各
サブバンドへのＳＭＲ１データは、次式のように表され
る。

【００１５】ＳＭＲ１（ｊ）＝Ｐ１（ｊ）−Ｍ１（ｊ）ｄＢ・・・（１）

【００１６】ここで、ｊは、サブバンドインデックス
（ｊ＝０，１，．．．，Ｂ−１）であり、Ｂは、１つの
フレームにおける全サブバンド数であり、ＳＭＲ１
（ｊ）は、ｊ番目のサブバンドにおける信号対マスク比
であり、Ｐ１（ｊ）は、高速フーリエ変換（ＦＦＴ）技
法から測定されたｊ番目のサブバンドにおける音圧レベ
ルであり、Ｍ１（ｊ）は、ｊ番目のサブバンドにおける
マスキング臨界値である。

【００１７】ただし、ＳＭＲ１（ｊ）、Ｐ１（ｊ）及び
Ｍ１（ｊ）の単位は全てデシベル（ｄＢ）である。

【００１８】同様に、第２チャンネルからの各サブバン
ドへのＳＭＲ２データは、次式のように計算される。

【００１９】ＳＭＲ２（ｊ）＝Ｐ２（ｊ）−Ｍ２（ｊ）ｄＢ・・・（２）

【００２０】ここで、ｊは上記式のものと等しい。

【００２１】マスキング臨界値は可聴限界を表すもので
あって、固有の可聴限界または音の臨界値と、オーディ
オ信号の他の音調及び非音調成分の存在によって生じた
増分との和を表す。その次に、第１及び第２チャンネル
の信号対マスク比データＳＭＲ１（ｊ）、ＳＭＲ２
（ｊ）は、第３ビット割当ユニット６０へ供給され、第
１及び第２チャンネルの音圧レベルＰ１（ｊ）、Ｐ２
（ｊ）及びマスキング臨界値Ｍ１（ｊ）、Ｍ２（ｊ）
は、認知情報量測定器３２と平均及び標準偏差測定器３
４からなる第２認知情報量測定デバイス３０へ供給され
る。

【００２２】この認知情報量測定器３２は、第１認知パ
ラメータ測定デバイス２０からの音圧レベルＰ１
（ｊ）、Ｐ２（ｊ）とマスキング臨界値Ｍ１（ｊ）、Ｍ
２（ｊ）に基づいて、第１及び第２チャンネルのｉ番目
のフレーム（または、現フレーム）に対する認知情報量
ＰＥ１（ｉ）、ＰＥ２（ｉ）を測定するように働く。前
記第１チャンネルのｉ番目のフレームに対する認知情報
量ＰＥ１（ｉ）は、当業者には良く知られているよう
に、次式のように表される。

【００２３】

【数１】

【００２４】ここで、ｉ，ｊ及びＢは上述した式のもの
と等しい。

【００２５】同様に、第２チャンネルのｉ番目のフレー
ムに対する認知情報量ＰＥ２（ｉ）は、当業者には良く
知られているように、次式のように表される。

【００２６】

【数２】

【００２７】ここで、ｉ、ｊ及びＢは上述した式のもの
と等しい。

【００２８】上記式（３）及び式（４）は、いわゆるひ
ずみ率理論（ＲａｔｅＤｉｓｔｏｒｔｉｏｎＴｈｅ
ｏｒｙ）を適用することによって得られ、人間の聴覚特
性に基づいた認知情報量に一致する。次に、認知情報量
測定器３２で測定された、第１及び第２チャンネルのｉ
番目のフレームに対する認知情報量は、第２ビット割当
ユニット５０と平均及び標準偏差測定器３４へ送られ
る。

【００２９】この平均及び標準偏差測定器３４は、認知
情報量測定器３２から供給された第１及び第２チャンネ
ルのＱ個（例えば、４個）の現フレーム及びその前フレ
ームに対して測定された認知情報量（即ち、ＰＥ１（ｉ
−１），ＰＥ１（ｉ）及び、ＰＥ２（ｉ−１）及びＰＥ
２（ｉ））をグループ化させるように働く。その結果、
図２を参照して、以下で詳細に説明される第１ビット割
当ユニット４０の処理によって、その第１及び第２チャ
ンネルの間にビットを適応的に割当られるようにし、ま
た、第１及び第２チャンネルに対する４つの現フレーム
及び前フレームを含むチャンネル間のフレームグループ
に対して測定された全認知情報量を用いて、それらの統
計的特性を表す平均及び標準偏差パラメータを測定す
る。チャンネル間のフレームグループの全認知情報量に
対する平均パラメータＰＥｍは、当業者には良く知られ
ているように、次式のように表される。

【００３０】

【数３】

【００３１】ここで、Ｐは、チャンネル間のフレームグ
ループで用いられたフレームインデックス（ｐ＝０，
１，．．．，Ｑ−１）であり、Ｑは、チャンネル間のフ
レームグループの全フレーム数であり、ＰＥ（ｐ）は、
チャンネル間のフレームグループにおけるｐ番目のフレ
ームの認知情報量である。

【００３２】従って、チャンネル間のフレームグループ
の全認知情報量に対する標準偏差パラメータＰＥstd
は、当業者には良く知られているように、次式のように
得られる。

【００３３】

【数４】

【００３４】ここで、ｐ及びＱは上述した式のものと等
しい。

【００３５】本発明の好ましい実施例において、平均及
び標準偏差測定器３４は前記第１及び第２チャンネルの
各々に対するＦ個（例えば、２個）の現フレーム及びそ
の前フレームに対して測定された認知情報量（即ち、Ｐ
Ｅ１（ｉ）及びＰＥ１（ｉ−１）と、ＰＥ２（ｉ）及び
ＰＥ２（ｉ−１））を各々グループ化して、その認知情
報量によって第１及び第２チャンネルの各々にまたその
チャンネルの各々に含まれた各々のフレームに対してビ
ットを適応的に割当てると共に、また第１及び第２チャ
ンネルの２つのチャンネル内フレームグループに対する
認知情報量ＰＥ（１）及びＰＥ（２）を生成する。次
に、平均及び標準偏差測定器３４で生成させて、かつ測
定された第１及び第２チャンネルへの認知情報量ＰＥ
（１）、ＰＥ（２）及び平均及び標準偏差パラメータＰ
Ｅｍ、ＰＥstdは、第１ビット割当ユニット４０へ伝達
される。

【００３６】この第１ビット割当ユニット４０は、前記
平均及び標準偏差測定器３４からの認知情報量ＰＥ
（１）、ＰＥ（２）と平均及び標準偏差パラメータＰＥ
ｍ及びＰＥstdに基づいて、第１及び第２チャンネルの
２つのチャンネル内フレームグループへのビットを特定
すると共に、その２つのチャンネル内フレームグループ
に対して特定されたビットに対応するビット割当情報Ｃ
ＢＩ１、ＣＢＩ２を第２ビット割当ユニット５０及びフ
ォーマッティング回路８０へ供給する。図２には、図１
に示された第１ビット割当ユニット４０の詳細ブロック
が示されている。第１ビット割当ユニット４０は、決定
レベル測定器４１と、乗算器４２と、減算器４３と、分
周器４４と、ビット割当デバイス４５とからなる。この
決定レベル測定器４１は、ビット割当デバイス４５が第
１及び第２チャンネルの２つのチャンネル内フレームグ
ループに対してビットを割当てるために、図１に示され
た平均及び標準偏差測定器３４からの平均及び標準偏差
パラメータＰＥｍ及びＰＥstdに基づいて、前記チャン
ネル間のフレームグループの最適の決定レベルを測定す
るように働く。本発明の好ましい実施例において、チャ
ンネル間のフレームグループのｋ番目の決定レベルＤ
（ｋ）は、次式のように得られる。

【００３７】Ｄ（ｋ）＝ＮＦ・ＰＥstd・ｋ・・・（７）

【００３８】ここで、ｋは、決定レベルインデックス
（ｋ＝−ｑ〜ｑ）であり、ｑ、正の整数であり、ＮＦ
は、チャンネル間のフレームグループにおける正規化フ
ァクタである。

【００３９】上記式（７）からわかるように、チャンネ
ル間のフレームのｋ番目の決定レベルＤ（ｋ）と（ｋ−
１）番目の決定レベルＤ（ｋ−１）との間のレベル間隔
は、平均及び標準偏差測定器３４からの標準偏差パラメ
ータＰＥstdとそのチャンネル間のフレームグループの
正規化ファクタＮＦとに依存する。一方、決定レベルの
全数（即ち、２ｑ＋１）は予め定められている。この決
定レベルの全数は符号化装置の要求される符号化効率と
音質とに基づいて特定される。決定レベル測定器４１で
用いられたチャンネル間フレームグループの正規化ファ
クターＮＦは、実際の人間の聴覚特性と非常に符合する
チャンネル間フレームグループの最適の決定レベルを算
出すために、平均及び標準偏差測定器３４からの平均及
び標準偏差パラメータＰＥｍ、ＰＥstdと、そのメモリ
（図示せず）に予め記憶されたグローバル平均ＰＥgmと
グローバル標準偏差パラメータの平均ＰＥgstdとを用い
ることによって、特定されることが好ましい。このグロ
ーバル平均とグローバル標準偏差の平均パラメータの各
々は、予め定められた期間の間に測定された平均及び標
準偏差パラメータを用いることによって容易に測定され
る。本発明において、このチャンネル間フレームグルー
プの正規化ファクターＮＦは次式のように得られる。

【００４０】ＮＦ＝（ＰＥgstd／ＰＥgm）・（ＰＥｍ／ＰＥstd）・・・（８）

【００４１】上記式（７）及び（８）から分かるよう
に、チャンネル間のフレームグループの決定レベルは、
平均パラメータの整数倍として特定されたことに注目す
べきである。決定レベル測定器４１で測定されて、かつ
予め定められた決定レベル及びその決定レベルの全数は
ビット割当デバイス４５へ供給される。

【００４２】一方、乗算器４２は、図１に示された平均
及び標準偏差測定器３４から供給された平均パラメータ
ＰＥｍと、そのメモリ（図示せず）に記憶された二つの
チャンネル内グループの何れか１つに含まれたフレーム
の全数を表す係数Ｆ（例えば、２）とを乗じて、出力パ
ラメータ２・ＰＥｍを生成する。その後、図１に示した
平均及び標準偏差測定器３４からの２つのチャンネル内
フレームグループへの認知情報量ＰＥ（１）、ＰＥ
（２）及び乗算器４２で生成した出力パラメータ２・Ｐ
Ｅｍは減算器４３へ送られる。この減算器４３は認知情
報量ＰＥ（１）及びＰＥ（２）の各々を出力パラメータ
２・ＰＥｍから各減算して、偏差信号Ｅ（１）、Ｅ
（２）を生成する。分周器４４は減算器４３からの偏差
信号Ｅ（１）、Ｅ（２）を受信して、その信号をチャン
ネル内フレームグループの何れか１つに含まれた予め定
められたフレーム数Ｆ（例えば、２）に各々分周して、
ＣＫ偏差信号を平均することによって、最適の決定レベ
ルを算出するようにして、また分周済みの偏差信号Ｅ
（１）／２及びＥ（２）／２を生成するように働く。そ
の次に、前記決定レベル測定器４１で測定されて、かつ
予め定められた決定レベルＤ（ｋ）及び決定レベルの全
数（即ち、２ｑ＋１）と分周器４４からの偏差信号Ｅ
（１）／２、Ｅ（２）／２は、ビット割当デバイス４５
へ同時に供給される。

【００４３】このビット割当デバイス４５は、決定レベ
ル測定器４１からの決定レベル及び決定レベル全数と分
周器４４からの偏差信号に基づいて、第１及び第２チャ
ンネルの１つのチャンネル内フレームグループにおける
各フレームに対するビットを特定する。本発明の好まし
い実施例において、各チャンネルへのビット割当ＦＢ
は、次式のように決定される。

【００４４】ＦＢ（ｒ）＝Ｆ・ＦＢｍ＋（Ｆ・ＢＶ／（２ｑ＋１））・Ｉ・・・（９）

【００４５】ここで、Ｆは上述した式のものと等しく、
ＦＢｍは該フレームの平均ビット（例えば、３０７２ビ
ット、即ちサンプリング周波数が４８ｋＨｚ、オーディ
オデータが１６ビットＰＣＭ形態、従って、１チャンネ
ル当り１２８ｋビットの伝送率の場合）で、ＢＶは、予
め定められたビット変更値であり、（２ｑ＋１）は、予
め定められた決定レベルの全数であり、Ｉは、ｒ番目の
チャンネルにおけるレベルインデックスであり、ｒは、
チャンバーインデックスとして正の整数である。

【００４６】上記式（９）から分かるように、ｒ番目の
チャンネルに対するビット割当ＦＢ（ｒ）は、平均ビッ
トの全数Ｆ・ＦＢｍとその２番目の項から計算された可
変ビット数を加算することによって特定される。その予
め定められたビット変更値ＢＶは、各チャンネル内で変
更されるビット割当の最小ビットと最大ビットとの間の
ビット変動範囲を表す値として特定されてもよい。ま
た、ｒ番目のチャンネル内のフレームグループに対する
レベルインデックスＩは、決定レベル測定器４１からの
決定レベルＤ（ｋ）と分周器４４からの偏差信号Ｅ
（１）／２及びＥ（２）／２に基づいて得られる。本発
明の好ましい実施例において、フレームグループにおけ
るｒ番目のチャンネルに対するレベルインデックスＩ
は、次の表に示されたように表しうる（ここで、決定レ
ベルの間隔が１．２７で、決定レベルインデックスｋが
−２〜２と仮定する）。

【００４７】

【表１】

【００４８】上記表から分かるように、もしｒ番目のチ
ャンネルのチャンネル内フレームグループに対する偏差
信号Ｅ（ｒ）が決定レベル−２．５５〜−１．２８の間
に存在すれば、レベルインデックスＩは−１として選択
でき、また偏差信号が決定レベル−１．２７〜１．２６
の間に存在すれば、そのレベルインデックスＩは０とし
て選択できる。このような方法で、ｒ番目のチャンネル
内フレームグループに対するビット割当ＦＢ（ｒ）は上
記式（９）を用いることによって、効果的に特定され
る。

【００４９】次に、ビット割当デバイス４５で、各々の
チャンネルに対して特定されたビットに対応する、第１
及び第２チャンネルのビット割当情報ＣＢＩ１、ＣＢＩ
２と、図１の認知情報量測定器３２からの認知情報量Ｐ
Ｅ（ｉ）、ＰＥ（ｉ）とは第２ビット割当ユニット５０
へ同時に供給されると共に、各々のチャンネルに対する
ビット割当情報ＣＢＩ１、ＣＢＩ２はフォーマッティン
グ回路８０へ供給される。

【００５０】図１をもう１度参照すれば、第２ビット割
当ユニット５０は、第１及び第２チャンネルに対する２
つのチャンネル内フレームグループの各々に含まれた各
々のフレームへのビットを、認知情報量測定器３２から
のその対応する認知情報量と、第１ビット割当ユニット
４０からのビット割当情報ＣＢＩ１、ＣＢＩ２とに基づ
いて特定する。この第２ビット割当ユニット５０で、２
つのチャンネル内フレームグループの各々における各フ
レームへのビット割当は、ディジタルオーディオ符号化
装置で用いるものであって、本出願と同一の出願人によ
って係属中の米国特許出願に開示された適応的ディジタ
ルオーディオ符号化装置及びそのビット割当方法（Ａｄ
ａｐｔｉｖｅＤｉｇｉｔａｌＡｕｄｉｏＥｎｃｏ
ｄｉｎｇＡｐｐａｒａｔｕｓａｎｄａＢｉｔＡ
ｌｌｏｃａｔｉｏｎＭｅｔｈｏｄＴｈｅｒｅｏｆ）
のビット割当技法を用いることによって、好ましく特定
される。

【００５１】次に、この第２ビット割当ユニット５０に
おいて、この第１及び第２チャンネルに対する２つのチ
ャンネル内フレームグループの各々における各フレーム
に対して特定されたビットに対応する、第１及び第２チ
ャンネルのビット割当情報ＦＢＩ１、ＦＢＩ２と、図１
に示された第１認知パラメータ測定デバイス２０からの
信号対マスク比データＳＭＲ１（ｊ）、ＳＭＲ２（ｊ）
とは第３ビット割当ユニット６０へ同時に供給されると
共に、ビット割当情報ＦＢＩ１、ＦＢＩ２はフォーマッ
ティング回路８０へ供給される。

【００５２】第３ビット割当ユニット６０は、第１認知
パラメータ測定デバイス２０からの信号対マスク比デー
タＳＭＲ１、ＳＭＲ２と、第２ビット割当ユニット５０
からの各々のフレームへのビット割当情報ＦＢＩ１、Ｆ
ＢＩ２とを受け取って、２つのチャンネル内フレームグ
ループの各々のフレームに含まれた各サブバンドに対す
るビットを特定すると共に、第１及び第２チャンネルの
各サブバンドに対して特定ビットに対応するビット割当
情報ＳＢＩ１、ＳＢＩ２を前記量子化デバイス７０及び
フォーマッティング回路８０へ各々供給する。この第３
ビット割当ユニット６０で用いられたプロセス原理は、
第２ビット割当ユニット５０から伝送された各フレーム
への利用可能なビットを超過しない範囲内で、１フレー
ムに対する全信号対マスク比の最適化に基づく。次に、
第３ビット割当ユニット６０からの第１及び第２チャン
ネルの各々のサブバンドへのビット割当情報ＳＢＩ１、
ＳＢＩ２と、サブバンドフィルタ１１、１２からの分割
済みのサブバンドオーディオサンプルが、複数の量子化
器（例えば、７１、７２）からなる量子化デバイス７０
へ同時に供給される。

【００５３】この量子化器７１、７２の各々は、第３ビ
ット割当ユニット６０からのその対応するビット割当情
報に基づいて、そのサブバンドフィルタ１１、１２から
の対応する分割済みのサブバンドオーディオサンプルを
適応的に量子化して、第１及び第２チャンネルの各々に
対する量子化済みのオーディオ信号をフォーマッティン
グ回路８０へ供給すように働く。

【００５４】フォーマッティング回路８０において、量
子化器７１、７２の各々からの量子化済みのオーディオ
サンプルと、前記第１、第２及び第３ビット割当ユニッ
ト４０、５０及び６０からのビット割当情報とをフォー
マット化して、かつその伝送のための伝送器（図示せ
ず）へ伝送する。これによって、第１及び第２チャンネ
ルからの入力ディジタルオーディオ信号の符号化効率及
び音質を向上させる。サブバンドフィルタリングデバイ
ス１０の原理と機能、第１認知パラメータ測定デバイス
２０、第３ビット割当ユニット６０、量子化デバイス７
０及びフォーマッティング回路８０はＭＰＥＧオーディ
オアルゴリズムに議論されたものと基本的に同一であ
る。

【００５５】本発明は、特定の実施例について説明して
いるが、本発明の範囲を逸脱することなく、当業者は種
々の改変をなし得るであろう。

【００５６】

【発明の効果】従って、本発明のシステムによれば、複
数のチャンネルからの入力ディジタルオーディオ信号を
適応的に符号化することによって、符号化効率と音質を
向上することができる。

【図面の簡単な説明】

【図１】本発明による、複数のチャンネルからの入力デ
ィジタルオーディオ信号を適応的に符号化する新規な装
置を概略的に示す図である。

【図２】図１に示された第１ビット割当ユニットの詳細
なブロック図である。

【符号の説明】

１０サブバンドフィルタリングデバイス１１、１２サブバンドフィルタ２０第１認知パラメータ測定デバイス３０第２認知パラメータ測定デバイス３２認知情報量測定器３４平均及び標準偏差測定器４０第１ビット割当ユニット４１決定レベル測定器４２乗算器４３減算器４４分周器４５ビット割当デバイス５０第２ビット割当ユニット６０第３ビット割当ユニット７０量子化デバイス７１、７２量子化器８０フォーマッティング回路

Claims

【特許請求の範囲】

【請求項１】Ｎ個（Ｎは正の整数）のチャンネルか
らの入力ディジタルオーディオ信号を適応的に符号化す
るものであって、該入力ディジタルオーディオ信号の各
々は複数のフレームを備えており、該各々のフレームは
複数のサブバンドを備える適応的符号化システムにおい
て、前記入力ディジタルオーディオ信号をサブバンド単位で
受信してフィルタリングする、並列に配設されたＮ個の
サブバンドフィルタリング手段と、前記入力ディジタルオーディオ信号における各サブバン
ドに対する信号対マスク比データ、音圧レベル及びマス
キング臨界値を測定する第１測定手段と、前記測定された信号対マスク比データ、音圧レベル及び
マスキング臨界値に基づいて、前記入力ディジタルオー
ディオ信号の各々に含まれた各々のフレームの認知情報
量を測定することによって、前記Ｎ個の全チャンネルの
全数へのＮ×Ｆ個の現フレーム及び前フレーム（Ｆは正
の整数）を含む前記測定された認知情報量に対応するチ
ャンネル間フレームグループに対する平均及び標準偏差
パラメータを算出し、前記Ｎ個のチャンネルの各々に対
してＦ個の現フレーム及び前フレームを含むチャンネル
内フレームグループを発生する第２測定手段と、前記チャンネル内フレームグループの各々に対して測定
された認知情報量と前記平均及び標準偏差パラメータに
基づいて、前記チャンネル内フレームグループの各々へ
のビットを適応的に特定すると共に、前記チャンネル内
フレームグループの各々に対して特定されたビットに対
応するビット割当情報を発生する第１ビット割当手段
と、前記測定された信号対マスク比データと前記発生された
ビット割当情報に基づいて、前記チャンネル内フレーム
グループの各々に含まれた各々のサブバンドへのビット
を特定するとともに、前記サブバンドの各々に対して特
定されたビットに対応するビット割当情報を発生する第
２ビット割当手段と、前記チャンネル内フレームグループにおける各サブバン
ドへの発生されたその対応するビット割当情報に応答し
て、前記Ｎ個のチャンネルに対してフィルタリング済み
のサブバンドオーディオ信号を量子化する並列に配設さ
れた、Ｎ個の量子化手段と、前記量子化済みのオーディオ信号と共に、前記発生され
たビット割当情報とをフォーマットするフォーマッティ
ング手段とを有することを特徴とする適応的符号化シス
テム。
【請求項２】前記第１ビット割当手段が、前記測定された認知情報量と平均及び標準偏差パラメー
タに基づいて、前記チャンネル間フレームグループの決
定レベルを測定する手段と、前記平均パラメータを前記チャンネル内フレームグルー
プの各々に含まれたフレーム数を表す予め定められたフ
ァクターに乗算して、平均関数を発生する手段と、前記チャンネル内フレームグループへの各々の認知情報
量と前記発生された平均関数との間に偏差を表す偏差信
号を発生すると共に、その発生された偏差信号を前記予
め定められたファクターに分周し、平均偏差信号を発生
する手段と、前記測定された決定レベル、決定レベルの全数及び発生
された偏差信号の各々に基づいて、前記チャンネル内の
フレームグループの各々へのビットを適応的に特定する
とともに、前記チャンネル内のフレームグループの各々
への特定されたビットに対応するビット割当情報を発生
するビット割当手段とを有することを特徴とする請求項
１に記載の適応的符号化システム。
【請求項３】前記チャンネル間フレームグループの
各決定レベルＤが、次式のように決定され、Ｄ＝ＮＦ・ＰＥstd・ｋここで、ｋ；決定レベルインデックス（ｋ＝−ｑ〜ｑ）ｑ；正の整数ＮＦ；前記チャンネル間フレームグループにおける正規
化ファクターＰＥstd；前記チャンネル間フレームグループの標準偏
差パラメータであることを特徴とする請求項２に記載の適応的符号化
システム。
【請求項４】前記Ｎ個のチャンネルにおいて、ｒ番
目のチャンネルに対するビット割当ＦＢ（ｒ）は、下記
式のように得られ、ＦＢ（ｒ）＝Ｆ・ＦＢｍ＋（Ｆ・ＢＶ／（２ｑ＋１））・Ｉここで、ｒ；チャンネルインデックスとして用いられた
正の整数ＦＢｍ；一つのフレームに対する平均ビットの関数Ｆ；前記チャンネル内のフレームグループの各々に含ま
れたフレームの数を表すファクターＢＶ；予め定められたビット変更値２ｑ＋１；予め定められた決定レベルの全数Ｉ；前記ｒ番目のチャンネルにおけるレベルインデック
スであることを特徴とする請求項２に記載の適応的符号化
システム。