JP2908270B2

JP2908270B2 - 適応的符号化システム

Info

Publication number: JP2908270B2
Application number: JP7023465A
Authority: JP
Inventors: 鐘一金
Original assignee: Daiu Denshi Kk
Current assignee: Daiu Denshi Kk
Priority date: 1994-01-18
Filing date: 1995-01-18
Publication date: 1999-06-21
Anticipated expiration: 2014-06-21
Also published as: KR960012475B1; EP0663740A2; CN1119376A; JPH0851366A; US5613035A; EP0663740A3; KR950024447A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、ディジタルオーディオ
符号化システムに関する。特に、複数のチャンネルから
入力される入力ディジタルオーディオ信号を、人間の聴
覚特性に相応する各入力ディジタルオーディオ信号に対
する認知エントロピー(perceptual entropy)に基づいて
適応的に符号化する改良された符号化システムに関す
る。

【０００２】

【従来の技術】ディジタル化されたオーディオ信号を伝
送することによって、コンパクトディスク(CD)及び／ま
たはディジタルオーディオテープ(DAT)に相応する高音
質のオーディオ信号の伝送が可能である。オーディオ信
号をディジタル信号で表すときは、特に高精細度テレビ
(HDTV)の場合、大量のデータを伝送する必要がある。し
かし、オーディオ信号に割り当てられた周波数帯域は限
定されているため、例えば、４８ＫＨｚでサンプリング
された１６ビットパルス符号変調（PCM）オーディオ信
号、即ち、７６８Ｋｂｐｓといった大量のデータを限定
されたオーディオ帯域（約１２８ＫＨｚ）で伝送するた
めには、データの圧縮が必要である。

【０００３】様々なオーディオ信号圧縮装置または技法
の中で、ＨＤＴＶのため、心理音響アルゴリズム（Psyc
hoacoustic algorithm）を用いた、いわゆるＭＰＥＧ(M
oving Pictures Expert Group)オーディオアルゴリズム
が提案されてきた。

【０００４】このＭＰＥＧオーディオアルゴリズムは、
主に、サブバンドフィルタリング、心理音響モデリング
(psychoacoustic modeling)、量子化及び符号化、及び
フレームフォーマッティングの４つの要素からなる。サ
ブバンドフィルタリングは、入力ＰＣＭオーディオ信号
を時間領域から周波数領域へ写像するプロセスである。
Ｂ個（例えば、３２個）のサブバンドを有するフィルタ
バンク（Filterbank）を用いてもよい。各サブバンドで
は１２または３６サンプルがグループ化されて処理さ
れ、Ｂ個のサブバンドのグループ化されたサンプル、即
ち、Ｂ×１２個またはＢ×３６個のサンプルによって１
フレームが構成される。このフレームがオーディオ信号
の符号化、伝送、及び復号の処理単位となる。心理音響
モデリングは、各サブバンドまたはサブバンドのグルー
プに対して、例えば信号対マスク比(Signal-to-Mask Ra
tio;SMR)のようなデータのセットを生成し、量子化及び
符号化を制御する。次に、サブバンドのサンプルを量子
化する過程で、ＳＭＲを参照して、使用可能な(availab
le)ビットがフレームの各サブバンドに適応的に割り当
られる。フレームフォーマットはフレームデータを他の
必要な付加情報と共に、伝送に適した形にフォーマット
する。

【０００５】しかし、上述のＭＰＥＧオーディオ技法で
は、各フレームに割り当てられるビット数が固定である
ため、入力ディジタルオーディオ信号の平均値、標準偏
差、及び認知エントロピーといった、フレームによって
異なる統計的特性を反映することができない。

【０００６】さらに、異なる認知エントロピーを有する
入力ディジタルオーディオ信号がこのような従来技術を
用いた通常の装置に加えられると、入力ディジタルオー
ディオ信号は認知エントロピーと全く関係なく符号化さ
れるため、結果として人による認識がされにくくなる。

【０００７】

【発明が解決しようとする課題】従って、本発明の主な
目的は、複数のチャンネルから入力される入力ディジタ
ルオーディオ信号を、各入力ディジタルオーディオ信号
に対する認知エントロピーに基づいて適応的に符号化す
ることによって符号化効率と音質とを向上させる新しい
システムを提供することである。

【０００８】

【課題を達成するための手段】上記目的を達成するため
に、本発明によれば、Ｎ個（Ｎは正の整数）のチャンネ
ルから入力される入力ディジタルオーディオ信号を適応
的に符号化するシステムであって、前記入力ディジタル
オーディオ信号の各々が複数のフレームを含み、該フレ
ームの各々が複数のサブバンドを含んでおり、前記入力
ディジタルオーディオ信号を各サブバンド単位で受信し
フィルタリングする、並列に配置されたＮ個のサブバン
ドフィルタリング手段と、前記入力ディジタルオーディ
オ信号に含まれる各サブバンドに対して信号対マスク
比、音圧レベル、及びマスクしきい値を算定する第１算
定手段と、前記算定された信号対マスク比、音圧レベ
ル、及びマスクしきい値に基づいて、前記入力ディジタ
ルオーディオ信号のそれぞれに含まれるフレームの各々
に対して認知エントロピーを算定し、総数Ｎ個の前記チ
ャンネルに対しＮ×Ｍ個（Ｍは正の整数）の現フレーム
及び前フレームを含むフレームグループに対して、平均
値及び標準偏差を算定する第２算定手段と、前記算定さ
れた信号対マスク比、認知エントロピー、平均値及び標
準偏差に基づいて、前記フレームグループの各サブバン
ドに対して適応的にビットを決定し、前記サブバンドの
各々に対して決定されたビットに対応するビット割当情
報を発生するビット割当手段と、前記フレームグループ
の各サブバンドに対して発生される対応するビット割当
情報に応じて、前記Ｎ個のチャンネルに対してフィルタ
リングされたサブバンドオーディオ信号を量子化する並
列に配置されたＮ個の量子化手段と、前記ビット割当情
報と共に、前記量子化されたディジタルオーディオ信号
をフォーマットする手段とを含むことを特徴とする適応
的符号化システムが提供される。

【０００９】

【実施例】以下、本発明の適応的符号化システムについ
て、図面を参照しながら詳しく説明する。

【００１０】図１に、本発明による適応的符号化システ
ム１００を概略的に示したブロック図を示す。

【００１１】適応的符号化システム１００はサブバンド
フィルタリングデバイス１０、第１及び第２認知パラメ
ータ算定器２０，３０、第１及び第２ビット割当ユニッ
ト４０、５０、量子化デバイス６０及びフォーマッティ
ング回路７０とを含む。

【００１２】符号化システム１００に於いて、Ｎ個のチ
ャネル（この例では、２個、即ち、第１（またはＬ）チ
ャネル、及び第２（またはＲ）チャネル）を通して受容
されたｉ番目のフレーム（すなわち現フレーム）の入力
ディジタルオーディオ信号Ｘ１（ｍ，ｉ）及びＸ２
（ｓ，ｉ）は、前記第１認知パラメータ算定器２０及び
前記サブバンドフィルタリングデバイス１０に入力され
る。ここで、各入力ディジタルオーディオ信号は、それ
ぞれＭ個（即ち、ｍ＝０，１，．．．，Ｍ−１）及びＳ
個（即ち、ｓ＝０，１，．．．，Ｓ−１）のサンプルを
含む。Ｍ及びＳは正の整数である。本明細書で使われて
いる“フレーム”は、ある決まった数のオーディオサン
プルに対応するディジタルオーディオ信号の一部を意味
すると共に、ディジタルオーディオ信号の符号化及び復
号に於ける処理単位でもある。

【００１３】図示されているように、サブバンドフィル
タリングデバイス１０は、複数の現フレームの入力ディ
ジタルオーディオ信号を同時に受信するため、例えば２
つのサブバンドフィルタ１１及び１２のような並列に結
合された複数のサブバンドフィルタを含み、本技術分野
では公知のサブバンドフィルタリング技法、例えば、IS
O IEC JTCI/SC2/WG 11、“Part3,Audio Proposal”、CD
-11172-3（1991年）に記述された、いわゆるＭＰＥＧオ
ーディオアルゴリズムに開示された方法を用いることに
よって、第１チャンネル及び第２チャンネルから入力さ
れる入力ディジタルオーディオ信号のフィルタリングを
する。即ち、各々のサブバンドフィルタ１１及び１２
は、サンプリング周波数ｆｓの入力ディジタルオーディ
オ信号をサンプリング周波数ｆｓ／ＢのＢ個（例えば、
３２個）の同一の大きさのサブバンドに分ける働きを
し、その分けられたサブバンドオーディオサンプルを量
子化デバイス６０へと出力する。

【００１４】一方、第１認知パラメータ算定器２０は、
第１及び第２チャンネルから現フレームの入力ディジタ
ルオーディオ信号を受信し、現フレームの各サブバンド
に対する信号対マスク比（ＳＭＲ）データＳＭＲ１、Ｓ
ＭＲ２と、音圧レベルＰ１、Ｐ２と、マスクしきい値Ｍ
１、Ｍ２とを算定する。これらは、例えば前記ＭＰＥＧ
オーディオアルゴリズムで論議されている心理音響モデ
ルを用いて行われる。第１チャンネルから入力される各
サブバンドのＳＭＲ１データは、次の（式１）のように
表される。

【００１５】ＳＭＲ１（ｒ）＝Ｐ１（ｒ）−Ｍ１（ｒ）ｄＢ（式１）

【００１６】ここで、

【００１７】ｒ：サブバンドインデックス（ｒ＝０，
１，．．．，Ｂ−１）、

【００１８】Ｂ：１フレームのサブバンド数、

【００１９】ＳＭＲ１（ｒ）：第１チャンネルのｒ番目
のサブバンドに於ける信号対マスク比、

【００２０】Ｐ１（ｒ）：高速フーリエ変換（ＦＦＴ）
法から算定されたｒ番目のサブバンドに於ける音圧レベ
ル、

【００２１】Ｍ１（ｒ）：ｒ番目のサブバンドに於ける
マスクしきい値である。また、ＳＭＲ１（ｒ）、Ｐ１
（ｒ）及びＭ１（ｒ）の単位は全てデシベル（ｄＢ）で
ある。

【００２２】同様に、第２チャンネルから入力される各
サブバンドのＳＭＲ２データは、次の（式２）から得ら
れる。

【００２３】ＳＭＲ２（ｒ）＝Ｐ２（ｒ）−Ｍ２（ｒ）ｄＢ（式２）

【００２４】ここで、ｒは（式１）で定義したのと同じ
意味である。

【００２５】マスクしきい値は可聴限界を表すものであ
って、固有の可聴限界または音のしきい値と、オーディ
オ信号の他の音調及び非音調成分の存在によって生じる
増分との和である。次に、第１認知パラメータ算定器２
０で算定された第１及び第２チャンネルの信号対マスク
比ＳＭＲ１（ｒ）、ＳＭＲ２（ｒ）は第２ビット割当ユ
ニット５０へ入力されると共に、第１及び第２チャンネ
ルの音圧レベルＰ１（ｒ）、Ｐ２（ｒ）及びマスクしき
い値Ｍ１（ｒ）、Ｍ２（ｒ）は第２認知パラメータ算定
器３０へ入力される。

【００２６】第２認知パラメータ算定器３０は、第１認
知パラメータ算定器２０から入力される音圧レベルＰ１
（ｒ）、Ｐ２（ｒ）とマスクしきい値Ｍ１（ｒ），Ｍ２
（ｒ）に基づいて、第１及び第２チャンネルのｉ番目の
フレーム（または、現フレーム）に対する認知エントロ
ピーＰＥ１（ｉ）、ＰＥ２（ｉ）を算定する。また算定
された認知エントロピーに基づき、第１及び第２チャン
ネルの現フレーム及び前フレームを含むフレームグルー
プの統計的特性を表す平均値ＰＥｍ及び標準偏差ＰＥst
dを計算する。第２認知パラメータ算定器３０は、後で
図２を参照しながら詳細に説明する。

【００２７】フレームグループに含まれるｐ番目のフレ
ームの認知エントロピーＰＥ（ｐ）、平均値ＰＥｍ、及
び標準偏差ＰＥstdは、第２認知パラメータ算定器３０
で算定され、第１ビット割当ユニット４０へ入力され
る。この第１ビット割当ユニット４０は、第２認知パラ
メータ算定器３０から入力される認知エントロピー、平
均値、及び標準偏差に基づいて、フレームグループに含
まれる各フレームに対してビットを決定する働きをし、
さらに、第２ビット割当ユニット５０及びフォーマッテ
ィング回路７０に向けて、第１及び第２チャンネルの各
フレームに対して決定されたビットに対応するビット割
当情報ＦＢＩ１、ＦＢＩ２を出力する。第１ビット割当
ユニット４０の詳細な説明は、後に図３を参照して詳細
に説明する。

【００２８】図２を見ると、図１に示された第２認知パ
ラメータ算定器３０の詳細ブロック図が示されている。
この第２認知パラメータ算定器３０は認知エントロピー
計算器３２と、平均値及び標準偏差計算器３４とを含
む。認知エントロピー計算器３２は、図１に示された第
１認知パラメータ算定器２０から出力された第１及び第
２チャンネルの音圧レベルＰ１（ｒ）、Ｐ２（ｒ）及び
マスクしきい値Ｍ１（ｒ）、Ｍ２（ｒ）を受信して、第
１及び第２チャンネルのｉ番目のフレームに対する認知
エントロピーＰＥ１（ｉ）、ＰＥ２（ｉ）を計算する。
第１チャンネルのｉ番目のフレームに対する認知エント
ロピーＰＥ１（ｉ）は、本分野では知られているよう
に、（式３）のように表される。

【００２９】

【数１】

【００３０】ここで、ｒ、ｉ、及びＢは上記にて定義し
たのと同じ意味である。

【００３１】同様に、第２チャンネルのｉ番目のフレー
ムに対する認知エントロピーＰＥ２（ｉ）は、本分野で
は知られているように、（式４）のように表される。

【００３２】

【数２】

【００３３】ここで、ｒ、ｉ、及びＢは上記にて定義し
たのと同じ意味である。

【００３４】上記（式３）及び（式４）は、いわゆるひ
ずみ率理論（Rate Distortion Theory）を適用すること
によって得られ、人間の聴覚特性に基づいた認知エント
ロピーに一致する。しかる後、認知エントロピー計算器
３２で計算された、第１及び第２チャンネルのｉ番目の
フレームに対する認知エントロピーは、平均値及び標準
偏差計算器３４へ送られる。

【００３５】平均値及び標準偏差計算器３４は、認知エ
ントロピー計算器３２から入力されたＱ個（この例で
は、４個）の第１及び第２チャンネルの現フレーム及び
前フレームに対して算定された認知エントロピー（即
ち、ＰＥ１（ｉ−１）、ＰＥ１（ｉ）及び、ＰＥ２（ｉ
−１）及びＰＥ２（ｉ））をグループ化し、第１ビット
割当ユニット４０の処理によって、グループ化されたフ
レームの間でビットが適応的に割り当てられるようにし
ている。第１ビット割当ユニット４０については、後に
図３を参照して詳細に説明する。また、平均値及び標準
偏差計算機３４は、フレームグループの全認知エントロ
ピーを用いて、それらの統計的特性を表す平均値及び標
準偏差を計算する。フレームグループの全認知エントロ
ピーに対する平均値ＰＥｍは、本分野では知られている
ように、（式５）のように表される。

【００３６】

【数３】

【００３７】ここで、

【００３８】ｐ：フレームグループで用いられるフレー
ムインデックス（ｐ＝０，１，．．．，Ｑ−１）、

【００３９】Ｑ：フレームグループの全フレーム数、

【００４０】ＰＥ（ｐ）：フレームグループに於けるｐ
番目のフレームの認知エントロピーである。従って、フ
レームグループの全認知エントロピーに対する標準偏差
ＰＥstdは、本分野では知られているように、（式６）
のように得られる。

【００４１】

【数４】

【００４２】ここで、ｐ及びＱは上記で定義したのと同
じ意味である。

【００４３】平均値及び標準偏差計算器３４に於いてグ
ループ化され計算された平均値ＰＥｍ、標準偏差ＰＥst
d、及びｐ番目のフレームの認知エントロピーＰＥ
（ｐ）は、しかる後、図１に示されている第１ビット割
当ユニット４０へ入力される。

【００４４】図３を参照すると、図１に示されている第
１ビット割当ユニット４０の詳細なブロック図が示され
ている。この第１ビット割当ユニット４０は、決定レベ
ル算定器(dicision level estimator)４２とビット割当
デバイス４４とを含む。この決定レベル算定器４２は、
図２に示されている平均値及び標準偏差計算器３４から
入力される平均値及び標準偏差に基づいて、ビット割当
デバイス４４がフレームグループの各フレームに対して
ビットを適応的に割り当てるのに、最も適したフレーム
グループの決定レベルを算定する。本発明の好適実施例
によると、このフレームグループのｊ番目の決定レベル
Ｄ（ｊ）は（式７）のように得られる。

【００４５】Ｄ（ｊ）＝ＰＥｍ＋ｊ・ＰＥstd ・Ｗ式（７）

【００４６】ここで、

【００４７】ｊ：決定レベルインデックス（ｊ＝−ｑ〜
ｑ）、

【００４８】ｑ：正の整数、

【００４９】Ｗ：フレームグループに於ける重みファク
タである。

【００５０】上記（式７）からわかるように、ｐ番目の
フレームのｊ番目の決定レベルＤ（ｊ）と（ｊ−１）番
目の決定レベルＤ（ｊ−１）との間のレベル間隔は、平
均値及び標準偏差計算器３４から入力される標準偏差Ｐ
Ｅstdと、フレームグループの重みファクタＷの両方に
依存するが、決定レベルの全数（即ち、２ｑ＋１）は予
め定められている。決定レベル算定器４２で用いられた
フレームグループの重みファクタＷは、フレームグルー
プの決定レベルが最適になり実際の人間の聴覚特性によ
く合うように、平均値及び標準偏差計算器３４から入力
される平均値ＰＥｍ及び標準偏差ＰＥstdを用いて決定
されることが好ましい。本発明によると、フレームグル
ープの重みファクタＷは、表１に示されているように、
フレームグループの統計的特性を表す平均値ＰＥｍ及び
標準偏差ＰＥstdの両方に基づいて得ることができる。

【００５１】

【表１】

【００５２】上記の表１から分かるように、ＰＥstdが
予め定められた第１しきい値（例えば、０．０１２５）
より小さく、ＰＥｍが予め定められた第２しきい値（例
えば、０．１５）より小さい場合、重みファクタＷは０
となり、そうでない場合は、上記の表１を参照して、表
中の重みファクタの内のいずれか一つが選択される。即
ち、このＰＥstdが相対的に小さくて、ＰＥｍが相対的
に大きければ、より大きい値の重みファクタが選択さ
れ、ＰＥstdが相対的に大きくて、ＰＥｍがより小さけ
れば、より小さい値が選択される。

【００５３】ここで、決定レベルの数、平均値及び標準
偏差のしきい値、及び重みファクタは、要求されている
符号化システムの符号化効率と音質とに基づいて決定さ
れることが好ましいということが理解されるだろう。

【００５４】その次に、決定レベル算定器４２で算定さ
れた決定レベルＤ（ｊ）、あらかじめ決定された決定レ
ベルの全数（即ち、２ｑ＋１）、及び図２に示された平
均値及び標準偏差計算器３４から入力された認知エント
ロピーＰＥ（ｐ）はビット割当デバイス４４へ同時に入
力される。

【００５５】このビット割当デバイス４４は、フレー
ムグループの各フレームに対するビットを、決定レベル
算定器４２から入力される決定レベル及び決定レベルの
全数と、図２に示された平均値及び標準偏差計算器３４
から入力されるｐ番目のフレームの認知エントロピーと
に基づいて決定する。その後、フレームグループの第１
及び第２チャンネルの各フレームに対して決定されたビ
ットに対応するビット割当情報ＦＢＩ１、ＦＢＩ２を図
１の第２ビット割当ユニット５０及びフォーマッティン
グ回路７０へ出力する。本発明の好適実施例に於いて、
フレームグループに於けるｐ番目のフレームに対するビ
ット割当ＦＢ（ｐ）は、（式８）のように決定される。

【００５６】ＦＢ（ｐ）＝ＦＢｍ＋ＢＶ／（２ｑ＋１）・Ｉ（式８）

【００５７】ここで、ｐは上記で定義したのと同じ意味
である。また、

【００５８】ＦＢｍ：フレームの平均ビット(mean bit
s)（例えば、１チャンネル当たり１２８Ｋｂｐｓの伝送
速度で、サンプリング周波数が４８KHzの１６ビットＰ
ＣＭオーディオ信号の場合、１フレーム当たり３０７２
ビット）、

【００５９】ＢＶ：予め定められたビット分散値(bit v
ariation value)、

【００６０】２ｑ＋１：予め定められた決定レベルの全
数、

【００６１】Ｉ：ｐ番目のフレームに於けるレベルイン
デックス(level index)である。

【００６２】上記（式８）から分かるように、ｐ番目
のフレームに対するビット割当ＦＢ（ｐ）は、平均ビッ
トＦＢｍと（式８）の第２項で計算される可変ビット数
とを加算することによって決定される。予め定められた
ビット分散値ＢＶは、上記（式８）で定義されるよう
に、１フレームの平均ビットと同一の値として決定して
もよい。また、フレームグループのｐ番目のフレームに
対するレベルインデックスＩは、決定レベル算定器４２
から入力される決定レベルＤ（ｊ）と図２に示されてい
る平均値及び標準偏差計算器３４から入力される認知エ
ントロピーＰＥ（ｐ）とに基づいて得られる。本発明の
好適実施例に於いて、フレームグループのｐ番目のフレ
ームに対するレベルインデックスＩは、表２に示すよう
に表すことができる（ここで、決定レベルの間隔は１．
２７で、決定レベルインデックスｊは−２〜２と仮定し
ている）。

【００６３】

【表２】

【００６４】上記の表２から分かるように、もし認知
エントロピーＰＥ（ｐ）が決定レベル-2.55〜-1.28の間
に存在する場合は、ｐ番目のフレームのレベルインデッ
クスＩは-1として選択され、また、もし認知エントロピ
ーＰＥ（ｐ）が決定レベル-1.27〜1.26の間にある場合
は、レベルインデックスＩとして０が選択される。この
ような方法で、ｐ番目のフレームのビット割当ＦＢ
（ｐ）を上記（式８）を用いることによって、効果的に
決定することができる。

【００６５】しかる後、ビット割当デバイス４４にてフ
レームグループの各フレームに対して決定されたビット
に対応する第１及び第２チャンネルのビット割当情報Ｆ
ＢＩ１、ＦＢＩ２と、図１に示されている第１認知パラ
メータ算定器２０から入力される信号対マスク比ＳＭＲ
１（ｒ）、ＳＭＲ２（ｒ）とは、第２ビット割当ユニッ
ト５０へ同時に入力される。また、ビット割当情報ＦＢ
Ｉ１、ＦＢＩ２はフォーマッティング回路７０へも入力
される。

【００６６】再度図１を参照すると、第２ビット割当ユ
ニット５０は、第１認知パラメータ算定器２０から出力
された信号対マスク比ＳＭＲ１、ＳＭＲ２と第１ビット
割当ユニット４０から出力された各フレームのビット割
当情報ＦＢＩ１、ＦＢＩ２とを受信した後、前フレーム
グループの各フレームに含まれる各サブバンドに対して
ビットを決定する。その後、前記各サブバンドに対して
決定されたビットに対応するビット割当情報ＳＢＩ１、
ＳＢＩ２を量子化デバイス６０とフォーマッティング回
路７０へ出力する。第２ビット割当ユニット５０にて用
いられたプロセスの原理は、使用されるビット数が第１
ビット割当ユニット４０から送られてきたフレームに対
して使用可能なビット数を超過しないという条件の下で
の、１フレーム全体に渡る信号対マスク比の総合的な最
適化に基づく。続いて、第２ビット割当ユニット５０か
ら出力される第１及び第２チャンネルの各サブバンドに
対するビット割当情報ＳＢＩ１、ＳＢＩ２と、各サブバ
ンドフィルタ１１、１２から出力されるサブバンドオー
ディオサンプルとは、複数の量子化器（例えば、６１及
び６２）を含む量子化デバイス６０へ同時に入力され
る。

【００６７】各量子化器６１、６２は、第２ビット割当
ユニット５０から入力される対応するビット割当情報に
基づいて、各サブバンドフィルタ１１、１２から入力さ
れる対応するサブバンドオーディオサンプルを適応的に
量子化し、第１及び第２チャンネルそれぞれの量子化さ
れたオーディオ信号をフォーマッティング回路７０へと
出力する。

【００６８】このフォーマッティング回路７０では、各
量子化器６１、６２から入力された量子化されたオーデ
ィオ信号と、第１及び第２ビット割当ユニット４０、５
０から入力されるビット割当情報とをフォーマッティン
グすると共に、伝送のために伝送器（図示せず）へ伝送
する。これによって、入力ディジタルオーディオ信号の
符号化効率と音質が向上する。第２ビット割当ユニット
５０、量子化器６１、６２、及びフォーマッティング回
路７０は上述のＭＰＥＧオーディオアルゴリズムに於い
て見い出されるものと基本的に同じである。

【００６９】本発明は、特定の実施例について説明して
いるが、本発明の範囲を逸脱することなく、当業者は種
々の改変をなし得るであろう。

【００７０】

【発明の効果】本発明によれば、複数のチャンネルから
入力される入力ディジタルオーディオ信号を、各入力デ
ィジタルオーディオ信号に対する認知エントロピーに基
づいて適応的に符号化することによって、符号化効率と
音質を向上することができる。

【図面の簡単な説明】

【図１】複数のチャンネルから入力される入力ディジタ
ルオーディオ信号を適応的に符号化する本発明によるシ
ステムを概略的に示したブロック図である。

【図２】図１に示されている第２認知パラメータ算定器
の詳細なブロック図である。

【図３】図１に示されている第１ビット割当ユニットの
詳細なブロック図である。

【符号の説明】

１０サブバンドフィルタリングデバイス２０第１認知パラメータ算定器３０第２認知パラメータ算定器３２認知エントロピー計算器３４平均値及び標準偏差計算器４０第１ビット割当ユニット４２決定レベル算定器４４ビット割当デバイス５０第２ビット割当ユニット６１量子化器６２量子化器６０量子化デバイス７０フォーマッティング回路１００適応的符号化システム２ｑ＋１決定レベルの全数Ｄ（ｊ）フレームグループのｊ番目の決定レベルＦＢＩ１第１チャンネルのビット割当情報ＦＢＩ２第２チャンネルのビット割当情報Ｍ１（ｒ）第１チャンネルのｒ番目のサブバンドに於
けるマスクしきい値Ｍ２（ｒ）第２チャンネルのｒ番目のサブバンドに於
けるマスクしきい値Ｐ１（ｒ）第１チャンネルのｒ番目のサブバンドに於
ける音圧レベル、Ｐ２（ｒ）第２チャンネルのｒ番目のサブバンドに於
ける音圧レベル、ＰＥ１（ｉ）第１チャンネルのｉ番目のフレームに対
する認知エントロピーＰＥ２（ｉ）第２チャンネルのｉ番目のフレームに対
する認知エントロピーＰＥｍフレームグループの平均値ＰＥstd フレームグループの標準偏差ＰＥ（ｐ）フレームグループのｐ番目のフレームの認
知エントロピーＳＭＲ１（ｒ）第１チャンネルのｒ番目のサブバンド
に於ける信号対マスク比ＳＭＲ２（ｒ）第２チャンネルのｒ番目のサブバンド
に於ける信号対マスク比Ｘ１（ｍ，ｉ）第１チャンネルのｉ番目のフレームの
入力ディジタルオーディオ信号Ｘ２（ｓ，ｉ）第２チャンネルのｉ番目のフレームの
入力ディジタルオーディオ信号

フロントページの続き (56)参考文献特開昭60−96041（ＪＰ，Ａ) 特開平７−87328（ＪＰ，Ａ) 特開平７−183818（ＪＰ，Ａ) 特開平７−210196（ＪＰ，Ａ) 特開平７−87329（ＪＰ，Ａ) 特開平８−56163（ＪＰ，Ａ) ＩＥＥＥＳＩＧＮＡＬＰＲＯＣＥＳＳＩＮＧＬＥＴＴＥＲＳ，ＶＯＬ. １，ＮＯ．２，ｐ，26−28；”ＦａｓｔＳｕｂｂａｎｄＦｉｌｔｅｒｉｎｇｉｎＭＰＥＧＡｕｄｉｏＣｏｄｉｎｇ" (58)調査した分野(Int.Cl.⁶，ＤＢ名) H03M 7/30 G10L 7/04 G10L 9/18

Claims

(57)【特許請求の範囲】

【請求項１】Ｎ個（Ｎは正の整数）のチャンネルか
ら入力される入力ディジタルオーディオ信号を適応的に
符号化するシステムであって、前記入力ディジタルオーディオ信号の各々が複数のフレ
ームを含み、該フレームの各々が複数のサブバンドを含
んでおり、前記入力ディジタルオーディオ信号を各サブバンド単位
で受信しフィルタリングする、並列に配置されたＮ個の
サブバンドフィルタリング手段と、前記入力ディジタルオーディオ信号に含まれる各サブバ
ンドに対して信号対マスク比、音圧レベル、及びマスク
しきい値を算定する第１算定手段と、前記算定された信号対マスク比、音圧レベル、及びマス
クしきい値に基づいて、前記入力ディジタルオーディオ
信号のそれぞれに含まれるフレームの各々に対して認知
エントロピーを算定し、総数Ｎ個の前記チャンネルに対
しＮ×Ｍ個（Ｍは正の整数）の現フレーム及び前フレー
ムを含むフレームグループに対して平均値及び標準偏差
を算定する第２算定手段と、前記算定された信号対マスク比、認知エントロピー、平
均値、及び標準偏差に基づいて、前記フレームグループ
のサブバンドの各々に対して適応的にビットを決定し、
前記サブバンドの各々に対して決定されたビットに対応
するビット割当情報を生成するビット割当手段と、前記フレームグループの各サブバンドに対して生成され
る対応するビット割当情報に応じて、前記Ｎ個のチャン
ネルに対してフィルタリングされたサブバンドオーディ
オ信号を量子化する並列に配置されたＮ個の量子化手段
と、前記ビット割当情報と共に、前記量子化されたディジタ
ルオーディオ信号をフォーマットする手段とを含むこと
を特徴とする適応的符号化システム。
【請求項２】前記ビット割当手段が、前記算定された平均値及び標準偏差に基づいて、前記フ
レームグループの決定レベルを算定する手段と、前記算定された決定レベル、前記決定レベルの全数、前
記認知エントロピー、及び予め定められた平均ビットに
基づいて、前記フレームグループの各フレームに対して
ビットを決定すると共に、前記フレームの各々に対して
決定されたビットに対応するビット割当情報を発生する
第１ビット割当手段と、前記算定された信号対マスク比と前記生成されたビット
割当情報とに基づいて、前記各フレームのサブバンドの
各々に対してビットを決定すると共に、前記サブバンド
の各々に対して決定されたビットに対応するビット割当
情報を発生する第２ビット割当手段とを備えることを特
徴とする請求項１に記載の適応的符号化システム。
【請求項３】前記フレームグループの各決定レベル
Ｄが、Ｄ＝ＰＥｍ＋ｊ・ＰＥstd ・Ｗのように決定され、ここで、ｊ：決定レベルインデックス（ｊ＝−ｑ〜ｑ）、ｑ：正の整数、Ｗ：前記フレームグループに於ける重みファクタ、ＰＥｍ：前記フレームグループの平均値、ＰＥstd：前記フレームグループの標準偏差であることを特徴とする請求項２に記載の適応的符号化
システム。
【請求項４】ｐ番目のフレームのビット割当ＦＢ
（ｐ）が、ＦＢ（ｐ）＝ＦＢｍ＋ＢＶ／（２ｑ＋１）・Ｉのように得られ、ここで、ｐ：前記フレームグループに於けるフレームインデック
ス、ＦＢｍ：１フレームの平均ビットの関数、ＢＶ：予め定められたビット分散値、２ｑ＋１：予め定められた決定レベルの全数、Ｉ：前記ｐ番目のフレームのレベルインデックスであることを特徴とする請求項３に記載の適応的符号化
システム。