JPH10233692A

JPH10233692A - オーディオ信号符号化装置および符号化方法並びにオーディオ信号復号装置および復号方法

Info

Publication number: JPH10233692A
Application number: JP9005842A
Authority: JP
Inventors: Masaaki Isozaki; 正明五十崎
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1997-01-16
Filing date: 1997-01-16
Publication date: 1998-09-02
Also published as: US6301558B1

Abstract

(57)【要約】【課題】ハードウエアおよび信号処理の増加を最小限
に抑え、ディジタルオーディオ信号の階層符号化を行
う。【解決手段】入力ディジタルオーディオ信号がＦＦＴ
処理（ＳＴ２４）により発生した複数のスペクラム成分
が０〜３１のサブバンドに分割される。サブバンドの番
号Ｃｄを境界として、低中域（０〜Ｃ）と高域（Ｃ＋１
〜３１）とに分割される。心理聴覚モデルに基づいて各
階層のビット割当量がそれぞれ計算される。低中域の階
層については、単独で使用されることがあるので、高域
側の階層の成分を０として、マスキングレベルが計算さ
れる。ビット割当量とスケールファクタとから各階層の
ビット割当が決定され、各階層が量子化される（ＳＴ２
７）。そして、各階層がビットストリームにそれぞれフ
ォーマット化される（ＳＴ２８Ｌ，ＳＴ２８Ｈ）。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は、例えばディジタ
ル衛星放送によってディジタルオーディオ信号を伝送す
るのに適用されるオーディオ信号符号化装置および符号
化方法、並びにオーディオ信号復号装置および復号方法
に関する。

【０００２】

【従来の技術】デジタル衛星放送での情報の伝送には、
強力なエラー訂正符号が用いられている。従って、伝送
路のＣ／Ｎ比がある程度まで劣化しても、エラー訂正に
より送信信号と同じ品質の情報が受信できる。

【０００３】

【発明が解決しようとする課題】ところが、降雨時のよ
うに、Ｃ／Ｎが急激に低下し、エラー訂正符号が備える
エラー訂正能力を発生するエラーが越えてしまうと、内
容が把握できないほど急激に再生情報の品質が劣化して
しまう。一方、アナログ放送の場合では、Ｃ／Ｎの低下
と共に、緩やかに再生情報の品質が変化する。図１Ａ
は、横軸をエラーレートとし、縦軸を再生されるデータ
の品質とした場合に、ディジタル放送とアナログ放送の
上述した相違を概念的に示す。アナログ放送の場合で
は、破線で示すように、品質が除々に低下し、ディジタ
ル放送の場合では、実線で示すように、急激に品質が劣
化する。実際には、ディジタル放送の場合でも、アナロ
グ放送のように、除々に再生データの品質が低下する特
性（グレースフルデグラデーション）が好ましい。

【０００４】また、ネットワーク上でのオーディオデー
タの転送について考える。エンコーダ側、デコーダ側の
信号処理能力がリアルタイム処理をするのに十分な能力
を備えていたとしても、ネットワークが混みあっていて
十分なデータ転送量が確保できない場合には、リアルタ
イムに再生信号を得ることができない。この様な場合に
は、デコーダ側にデータが一定量だけ蓄積されるまでデ
コード処理ができないため、再生音が途切れ途切れとな
り、再生音質が著しく劣化する。さらに、ネットワーク
に接続されたデコーダ側のデータ処理能力が不充分な場
合でも、同様に、再生音声の品質の劣化が生じる。

【０００５】従って、この発明の一つの目的は、伝送路
のＣ／Ｎ比が劣化する時に、再生オーディオ信号の品質
の低下が除々に生じるようになされたオーディオ信号符
号化装置および符号化方法並びにオーディオ信号復号装
置および復号方法を提供することにある。

【０００６】すなわち、この発明は、図１Ｂに概念的に
示すように、伝送路のＣ／Ｎ比が悪くなった時に、再生
オーディオ信号の品質が段階的に低下するようなグレー
スフルデグラデーションをディジタル伝送においても実
現するものである。オーディオ信号を伝送する場合に、
例えば、伝送する信号を中低域、高域とに分離して符号
化し、品質低下が知覚されやすい中低域のデータはエラ
ー訂正能力を高くして伝送する。伝送路のＣ／Ｎが低下
していくと、先ずノイズが知覚されにくい高域成分から
劣化していくことになるため、グレースフルデグラデー
ションを実現することができる。

【０００７】この発明の他の目的は、ネットワーク上で
オーディオデータを転送するようなリアルタイム再生シ
ステムにおいて、ネットワークの状態、受信側の処理能
力等によって再生音が途切れ途切れになることが防止さ
れたオーディオ信号符号化装置および符号化方法並びに
オーディオ信号復号装置および復号方法を提供すること
にある。

【０００８】

【課題を解決するための手段】この発明は、ディジタル
オーディオ信号を伝送する時に適用されるオーディオ信
号符号化装置において、ディジタルオーディオ信号を周
波数に基づいて複数の階層データに分離し、複数の階層
データを符号化して、複数のビットストリームを生成す
る手段を有することを特徴とするオーディオ信号符号化
装置である。また、この発明は、このようにオーディオ
信号を符号化する符号化方法である。

【０００９】オーディオ信号の符号化方法の一例は、入
力ディジタルオーディオ信号を複数の周波数成分に分割
し、複数の周波数成分のそれぞれに対する割当ビット数
を決定し、決定された割当ビット数により複数の周波数
成分のデータを量子化し、量子化されたデータをビット
ストリームへフォーマット化するものである。

【００１０】この発明は、ディジタルオーディオ信号を
周波数に基づいて複数の階層データに分離し、複数の階
層データを符号化して、複数のビットストリームを生成
し、複数のビットストリームを受信し、復号するオーデ
ィオ信号復号装置において、受信された複数のビットス
トリームを複数の階層データへ復号すると共に、複数の
階層データの全体またはその一部を適応的に選択する手
段を有することを特徴とするオーディオ信号復号装置で
ある。また、この発明は、このようにオーディオ信号を
符号化する符号化方法である。

【００１１】さらに、この発明は、受信された複数のビ
ットストリームをそれぞれ複数の階層データへ復号化す
る手段と、選択指示信号に基づいて、復号された複数の
階層データを加算、または複数の階層データの一部を選
択する手段とからなることを特徴とするオーディオ信号
復号装置である。

【００１２】

【発明の実施の形態】以下、この発明をディジタル放送
に適用した一実施例について図面を参照して説明する。
図２は、この発明の一実施例のシステムの概略を示す。
図２Ａは、送信側の構成を示し、１で示す入力端子から
伝送するディジタルオーディオ信号が供給される。例え
ばオーディオ信号をサンプリング周波数４８ｋHzでもっ
てディジタル化することによって、ディジタルオーディ
オ信号が形成される。このディジタルオーディオ信号
は、１チャンネルのものであるが、実際には、２チャン
ネル（ステレオ）以上のチャンネル数の場合が多い。

【００１３】入力ディジタルオーディオ信号がソースエ
ンコーダ２に供給される。ソースエンコーダ２は、後述
するように、入力ディジタルオーディオ信号を低域およ
び中域成分（単に低中域成分と称する）と高域成分に周
波数分割し、各周波数成分の階層データをそれぞれ圧縮
符号（例えばＭＰＥＧ(Moving Pictures Expert Group)
規格のオーディオ符号化）により圧縮する。

【００１４】ＭＰＥＧオーディオのフォーマット自体
は、階層的に復号するような構造を持っていない。そこ
で、この発明では、デジタルオーディオ信号を、複数の
周波数成分の階層データに分離し、各々についてＭＰＥ
Ｇオーディオ方式でエンコードする。このように生成さ
れた複数のビットストリームを伝送することで、受信状
況、処理能力等に応じて階層的に復号することができ
る。ここでは、中低域、高域の２つの階層構造をもたせ
るようにしている。

【００１５】ソースエンコーダ２から低中域成分のビッ
トストリーム（符号化データ）ＢＳＬと高域成分のビッ
トストリーム（符号化データ）ＢＳＨとが出力され
る。これらのビットストリームがＥＣＣ（エラー訂正符
号）エンコーダ３および４にそれぞれ供給される。ＥＣ
Ｃエンコーダ３および４によって、ビットストリームＢ
ＳＬおよびＢＳＨに対してエラー訂正符号の符号化
がなされる。ＥＣＣエンコーダ３および４のそれぞれの
出力データがマルチプレクサ５へ供給され、一つのビッ
トストリームが形成される。

【００１６】このビットストリームが変調器６において
変調され、変調されたデータが送信部７に供給される。
変調器６は、ディジタル変調器であって、ＱＰＳＫ(Qua
drature Phase Shift Keying) 、ＱＡＭ(Quadrature Am
plitude Modulation) 、ＶＳＢ(Vestigial sideband)変
調等の方式によって、伝送データを変調する。送信部７
によって、変調データが送信アンテナ８が放送衛星（ま
たは通信衛星）に対して送信される。

【００１７】図２Ｂは、ディジタル放送の受信側の構成
を示す。受信アンテナ１１により受信された放送電波が
受信部１２を介して復調器１３に供給される。受信部１
２には、周波数変換器、チューナ等が含まれ、復調器１
３に対して変調データが供給される。復調器１３におけ
る復調の結果、復調器１３からビットストリームが出力
される。

【００１８】このビットストリームがデマルチプレクサ
１４に供給される。デマルチプレクサ１４によって、ビ
ットストリームが低中域データのビットストリームと高
域データのビットストリームとに分離される。ビットス
トリーム上で、二つの周波数成分のビットストリーム
は、所定の規則に従った位置に配置されている。必要に
応じて、ビットストリーム上の各周波数成分のビットス
トリームの位置を示す情報がビットストリーム中に挿入
される。

【００１９】デマルチプレクサ１４により分離された二
つのビットストリームがそれぞれＥＣＣデコーダ１５お
よび１６に供給される。ＥＣＣデコーダ１５および１６
において、エラー訂正符号により伝送中に生じたエラー
が訂正される。また、訂正できないエラーは、再生した
時に目立たないように修整される。

【００２０】ＥＣＣデコーダ１５からは、受信され、復
調され、エラー訂正された低中域のビットストリームＢ
ＳＬが出力される。ＥＣＣデコーダ１６からは、受信
され、復調され、エラー訂正された高域のビットストリ
ームＢＳＨが出力される。これらのビットストリーム
がソースデコーダ１７に供給される。ソースデコーダ１
７では、ソースエンコーダ２においてなされた符号化
（例えばＭＰＥＧ）の復号処理がなされる。また、ソー
スデコーダ１７では、受信状況等に応じて、低中域デー
タの階層および高域データの階層の両者を使用する状態
と、低中域データの階層のみを使用する状態とが適応的
に選択される。ソースデコーダ１７から出力端子１８に
ディジタルオーディオ信号が取り出される。

【００２１】この発明の一実施例は、上述したグレース
フルデグラデーションを実現するために、複数の周波数
成分へオーディオデータを分割し、階層構造を持つよう
にし、さらに、ＥＣＣエンコーダ３および４によりなさ
れるエラー訂正符号化の訂正能力を二つの周波数成分の
間で相違させるものである。図３は、エラー訂正能力を
相違させる方法の一例を示す。図３の例は、符号化され
たディジタルオーディオ信号の所定サンプル数を２次元
的に配列し、その水平方向と垂直方向にそれぞれエラー
訂正符号の符号化を行う積符号を使用する例である。勿
論、積符号以外のエラー訂正符号を使用することが可能
である。

【００２２】図３に示すように、ソースエンコーダから
のビットストリームの所定サンプル数を２次元的に配列
する場合、低中域データと高域データとを垂直方向に分
割して配列する。低中域データおよび高域データは、そ
れぞれ複数の行および複数の列を有するマトリクスに配
列される。そして、垂直方向のエラー訂正符号（Ｃ２）
の符号化は、低中域データと高域データとに対して共通
に行う。その結果、ｍ個のＣ２パリティが生成される。

【００２３】また、低中域データに対して水平方向のエ
ラー訂正符号（Ｃ１）の符号化がなされ、ｎ１個のＣ１
パリティが生成される。高域データに対してもＣ１符号
の符号化がなされ、ｎ２（＜ｎ１）個のＣ１パリティが
生成される。さらに、Ｃ２パリティに対して、Ｃ１符号
の符号化がなされ、ｎ１個のＣ１パリティが形成され
る。Ｃ１パリティの数は、破線で示すように、ｎ２でも
良い。

【００２４】なお、上述した例は、Ｃ２符号化を行い、
次にＣ１符号化を行う場合であるが、逆の順番で各符号
化を行うこともできる。この場合では、Ｃ１パリティに
対して、Ｃ２符号化がなされる。

【００２５】エラー訂正符号Ｃ１およびＣ２としては、
リード・ソロモン符号等のエラー訂正符号を使用するこ
とができる。エラー訂正符号の場合では、リード・ソロ
モン符号に限らず、パリティ数が多いほど、訂正できる
エラーシンボルの個数が多くなる。すなわち、エラー訂
正能力が増大する。従って、図３に示すように、Ｃ１パ
リティの個数がより多くなるように符号化された低中域
データは、高域データに比してエラーに対してより強く
なる。その結果、ディジタル放送のＣ／Ｎ比が低下した
時には、最初に高域データのエラーが多くなり、さら
に、Ｃ／Ｎ比が低下すると、低中域データのエラーも多
くなる。

【００２６】受信側では、伝送路でのエラーなどによる
受信状況（具体的にはＣ／Ｎ比）などに応じて、低中域
データおよび高域データの両階層データを使用するか、
低中域データのみを用いるかを適応的に選択するように
なされる。後述するように、ネットワークを介してオー
ディオデータを伝送する場合では、伝送路のデータ転送
量、受信側のデータ処理能力に応じて使用する階層デー
タが指示される。例えば受信側におけるエラー訂正を行
う時のエラー情報を参照して、受信状況を検出すること
ができる。低中域データは、音声を再生する上で、高域
データより重要度が高いので、Ｃ／Ｎ比の低下等に伴
い、低中域データのみを使用するようにすれば、グレー
スフルデグラデーションを実現することができる。

【００２７】図４は、エラー訂正能力を異ならせる方法
の他のいくつかの例を示す。図４Ａは、Ｃ１パリティの
個数を階層データによって異ならせる例であり、データ
を低域、中域、高域の３個の階層へ分割するものであ
る。低域データの階層に関するＣ１パリティの数をｎ１
１、中域データの階層に関するＣ１パリティの数をｎ１
２、高域データの階層に関するＣ１パリティの数をｎ１
３とすると、（ｎ１１＞ｎ１２＞ｎ１３）の関係とされ
る。それによって、Ｃ／Ｎ比が低下する時に、図１Ｂに
示すように、再生音声の品質が除々に低下するようにで
きる。

【００２８】図４Ｂおよび図４Ｃは、Ｃ２符号のパリテ
ィ数を各周波数成分に応じて異ならせる例である。図４
Ｂは、入力オーディオデータを低中域データと高域デー
タとの階層に分割し、音声の品質に対して重要度が高い
低中域データのＣ２パリティ数ｍ１を重要度が低い高域
データのＣ２パリティ数ｍ２より少なくした例である。
図４Ｃは、低域、中域、高域の３個の階層にデータを分
割し、それぞれに関するＣ２パリティの個数ｍ１１、ｍ
１２、ｍ１３を（ｍ１１＞ｍ１２＞ｍ１３）の関係に設
定するものである。なお、上述したように、パリティ数
を異ならせる方法以外に、エラー訂正能力を異ならせる
こともできる。例えば階層に応じて異なる種類のエラー
訂正符号を使用するようにしても良い。

【００２９】ソースエンコーダ２およびソースデコーダ
１７の一例は、図５に示す構成とされている。ソースエ
ンコーダ２は、入力端子２１からのディジタルオーディ
オ信号を低中域データＰＣＭＬと高域データＰＣＭ
Ｈへ分割するためのローパスフィルタ２２およびハイパ
スフィルタ２３と、ローパスフィルタ２２からの低中域
データを符号化するＭＰＥＧエンコーダ２４と、ハイパ
スフィルタ２３からの高域データを符号化するＭＰＥＧ
エンコーダ２５とからなる。

【００３０】ソースデコーダ１７は、符号化された低中
域データＢＳＬを復号するＭＰＥＧデコーダ２６と、
符号化された高域データＢＳＨを復号するＭＰＥＧデ
コーダ２７と、デコーダ２６および２７の復号出力を加
算する加算器２８と、デコーダ２６の出力および加算器
２８の出力の一方を選択するセレクタ２９とからなり、
セレクタ２９から復号ディジタルオーディオ信号が出力
端子３１に取り出される。セレクタ２９を制御するため
の制御信号３０は、受信状況（Ｃ／Ｎ比）等に基づいて
形成されたり、ユーザの指示に従って形成される。

【００３１】図６は、ローパスフィルタ２２の特性２２
ａおよびハイパスフィルタ２３の特性２３ａをそれぞれ
示す。これらの特性は、周波数ｆｃにおいて３db低下
し、各特性の傾斜が６dbオクターブで変化するものであ
る。

【００３２】図７は、ハイパスフィルタ２３の一例であ
る。ローパスフィルタ２２の出力を低中域データＰＣＭ
Ｌとして出力すると共に、減算器２３ｃに供給し、遅
延回路２３ｂを介された入力データから低中域データを
減算することによって、高域データＰＣＭＨを得るよ
うになされる。

【００３３】ローパスフィルタ２２およびハイパスフィ
ルタ２３を通って、ＭＰＥＧエンコーダ２４および２５
に入るまでの信号の遅延量と、符号化されるオーディオ
フレームの位相は、２つのデータ間で同一とされる。ま
た、圧縮率などの符号化条件は、階層間で等しい必要が
なく、例えば低中域データから生じたビットストリーム
ＢＳＬは、２８８kbpsとされ、高域データから生じた
ビットストリームＢＳＨは、９６kbpsのように設定して
も良い。

【００３４】ＭＰＥＧオーディオは、デジタルオーディ
オデータを転送する場合に、データ量を削減するため
に、符号化方式としてサブバンド符号化方式を用いてい
る。ＭＰＥＧエンコーダ２４、２５は、サブバンド符号
化のエンコーダであり、ＭＰＥＧデコーダ２６、２７
は、サブバンド符号化のデコーダである。サブバンド符
号化方式では、周波数軸方向の偏在の性質を利用して冗
長な情報を削減している。以下、このサブバンド符号化
を使用したＭＰＥＧオーディオ符号化方式について説明
する。

【００３５】図８は、Ｍ分割のサブバンド符号化方法の
エンコーダおよびデコーダの一例を示す。入力オーディ
オデータは、Ｍ個のバンドパスフィルタとそれぞれに対
して選択されたダウンサンプリング回路とからなる分解
フィルタ４１に供給される。ダウンサンプリング回路
は、データを１／Ｍにサブサンプリングする。信号帯域
が１／Ｍに減少するから、１／Ｍのダウンサンプリング
が可能である。分解フィルタ４１からの各サブバンドの
出力がＭ個の量子化器からなる量子化回路４２に供給さ
れ、サブバンド毎に所定のビット数のデータに量子化さ
れる。量子化回路４２の出力がパッキング回路４３に供
給され、ビットストリームのフォーマットに変換され
る。

【００３６】デコーダ側では、ビットストリームがアン
パッキング回路４４に供給され、各サブバンドのデータ
列に並びかえられ、Ｍ個の逆量子化器からなる逆量子化
回路４５に供給される。逆量子化回路４５に対して合成
フィルタ４６が接続される。逆量子化回路４５は、量子
化回路４２と逆の処理を行なう。合成フィルタ４６は、
Ｍ個のアップサンプリング回路と、Ｍ個のバンドパスフ
ィルタとからなる。アップサンプリング回路は、間引か
れたサンプルを補間する。バンドパスフィルタは、Ｍ分
割された帯域を元の帯域に合成するものである。合成フ
ィルタ４６から復号オーディオデータが得られる。

【００３７】図９は、上述のサブバンド符号化のエンコ
ーダおよびデコーダの信号処理を機能的に表すものであ
る。入力ディジタルオーディオ信号がダウンサンプリン
グを含む分解フィルタバンク５１によりサブバンドデー
タに分解され、量子化処理５２がなされる。また、サブ
バンドデータからスケールファクタ計算処理５３がなさ
れ、スケールファクタＳＦからビットアロケーション処
理５４がなされる。ビットアロケーション処理５４で決
定された量子化レベルによって、量子化処理５２がなさ
れる。

【００３８】各サブバンドのデータ量に応じて、全体で
一定のデータ量になるように量子化レベルを割り当てる
（この処理がビットアロケーションである）。各サブバ
ンドのデータは、各サブバンドの最大値に対応したスケ
ールファクタＳＦで正規化されたのち、この割り当てら
れた量子化レベルで量子化される。ビットアロケーショ
ンを行なう場合、人間の聴覚の最小可聴特性等の特性を
考慮してなされる。このために、入力ディジタルオーデ
ィオ信号が供給され、ビットアロケーションを制御する
ように、心理聴覚モデル計算回路５６が設けられてい
る。

【００３９】量子化処理５２の後にビットストリームへ
のフォーマット化処理５５がなされる。ビットストリー
ム上には、各サブバンドのスケールファクタＳＦと、量
子化ビット数（割当ビット数）ＡＬＬＯＣも挿入され
る。フォーマット化処理５５により形成されたビットス
トリームが上述したように、ＥＣＣエンコーダに供給さ
れる。

【００４０】ＥＣＣデコーダによってエラー訂正の処理
を経た後に、ビットストリームに対してサブバンド符号
化のデコーダ処理がなされる。最初にビットストリーム
の復号処理６１がされ、ビットストリームの状態から各
サブバンドのデータ列に並び換えられるとともに、ビッ
トストリーム中のスケールファクタＳＦ、量子化ビット
数ＡＬＬＯＣが分離される。逆量子化処理６２におい
て、これらのスケールファクタＳＦ、ＡＬＬＯＣを使用
して逆量子化がなされる。逆量子化処理６２からのサブ
バンドデータが合成フィルタバンク６３において合成さ
れ、復元ディジタルオーディオデータが得られる。

【００４１】図１０は、分割数３２、符号長３８４サン
プルを例とする、サブバンド符号化の符号化処理を示
す。ＭＰＥＧレイヤー１では、１つの処理単位（オーデ
ィオフレーム長）が３８４サンプルである。入力された
オーディオデータは、分割フィルタで、３２個の周波数
領域に分割される。３８４サンプル分のオーディオデー
タを、３２個の周波数成分（サブバンド）に分割し、そ
れぞれ１／３２にダウンサンプリングする。その結果、
１２サンプルで一つのサブバンドブロックが構成され
る。図１０Ａは、あるサブバンドＳＵＢｎの１２サン
プルを示す。この中の最大絶対値（サンプル例えばＳｎ
（６））がスケールファクタＳＦ（例えば６ビットのコ
ードで表される）とされ、その値によって、他の１１個
のサンプルの値が割算され、正規化がなされる。

【００４２】各サブバンドのスケールファクタＳＦの大
きさから各サブバンドの量子化ビット数が決定される。
図１０Ｂは、このビットアロケーションの一例を示し、
この図から分かるように、スケールファクタＳＦが大き
いサブバンドほど、割り当てられる量子化ビット数が多
くされる。ビットアロケーションを行なう場合、スケー
ルファクタＳＦの大きさだけでなく、人間の聴覚の性質
を利用した、心理聴覚モデルを用いて決定することも可
能である。

【００４３】すなわち、人間の聴覚は、聴覚マスキング
効果と最小可聴限特性とがある。聴覚マスキング効果と
は、大きなレベルの音によって周波数上で隣接する小さ
なレベルの音が聞こえなくなることである。また、最小
可聴限特性は、聞き取れるレベルの最小値が周波数によ
って異なる特性である。これらの聴覚の性質を利用すれ
ば、聞こえない音の伝送を省略したり、聞こえにくい音
に対して割り当てる量子化ビット数を少なくしても、再
生音声の品質の低下が少ない。このように、聴覚特性を
利用することによって、伝送データ量を圧縮することが
できる。

【００４４】各サブバンドデータは、割り当てられたＡ
ＬＬＯＣによって指示される量子化レベルによって量子
化される。そして、図１０Ｃに示すようなビットストリ
ームにフォーマット化される。図１０Ｃは、１オーディ
オフレームを示し、先頭に符号の状態等のサイド情報を
伝送するためのヘッダ（例えば２バイト）が位置し、次
に、各サブバンドの割り当てビット数をそれぞれ表す量
子化ビット数ＡＬＬＯＣ（４ビット×３２）が位置す
る。その後に各サブバンドのスケールファクタＳＦ（６
ビット×３２）が位置する。さらに、その後に、データ
（３２×１２サンプル）が位置する。データは、低い周
波数から高い周波数の順に配列される。

【００４５】本来は、このように３２個のバンドのデー
タを伝送するところを、低域のバンドからデータ量（Ａ
ＭＯＵＮＴ）に応じた数のサブバンドだけにビットを割
り当てることによって、周波数制限による音質の劣化と
のバランスで、さらにデータ量を削減することができ
る。符号の圧縮率は、量子化の際に、総計で何ビット割
り当てるかによって決定される。

【００４６】図１１は、伝送符号量をコントロールする
場合のビットストリームの構成例である。各サブバンド
ブロックには、符号化時の各サブバンドデータに対して
割り当てられた量子化ビット数を示す情報（ＡＬＬＯ
Ｃ）と、各サブバンドブロック内のデータの最大値を示
す情報（ＳＦ）が低域のバンドから順に、ＡＭＯＵＮＴ
に示されたバンド数だけ記録されている。データ領域に
は、１２サンプルで１つのサブバンドを構成するデータ
ブロックが周波数の低いバンドから高いバンドの順に、
ＡＭＯＵＮＴに示されたバンド数だけ記録されている。

【００４７】また、各ブロックの先頭には、符号化の状
態を表すヘッダが付加される。この例では、符号化の際
の圧縮率を表すＲＡＴＥ（４ビット）と、記録されてい
るバンドの数を表すＡＭＯＵＮＴ（４ビットでバンド数
を表す）の情報を含んでいる。ＡＭＯＵＮＴ情報は、階
層の境界を示し、復号時に必要なものであるが、このＡ
ＭＯＵＮＴ情報を必ずしも伝送する必要はない。実際
に、ＭＰＥＧレイヤーI,IIのフォーマットでは存在しな
い。すなわち、ＡＭＯＵＮＴ情報に対応したサブバンド
の位置のＡＬＬＯＣの値のみを有効にし、その他のバン
ドの位置は、量子化ビット量が０を示す値に設定して伝
送する。復号側では、後述する境界のサーチ方法によっ
てその境界を決定することができる。そして、３８４個
のオーディオサンプルからなる１オーディオフレームに
対してビットストリームの１ブロックが構成される。ヘ
ッダ、ＡＬＬＯＣ、ＳＦのバイト数は固定であるが、デ
ータ領域のバイト数は、圧縮率によって変化する。図１
１においては、割り当てられたサブバンド数の一例（３
２）が示されている。

【００４８】図１２は、上述したＭＰＥＧオーディオレ
イヤー１の符号化の処理を示し、図１３は、その復号の
処理を示す。この例では、符号化ブロックの単位で１回
の処理ループを回してる。符号化ブロックの長さを３８
４サンプルとすると、３８４サンプル分のオーディオデ
ータが入力される時間 (３８４ＦＳ：ＦＳは、サンプリ
ング周波数）の間に１ループ分の処理が終われば、リア
ルタイムに処理を継続させることができる。

【００４９】図１２に示す符号化の処理では、オーディ
オデータの入力（ＳＴ１）、分割フィルタの計算（ＳＴ
２）、スケールファクタの計算（ＳＴ３）、心理聴覚モ
デルの計算（ＳＴ４）、ビット割当の計算（ＳＴ５）が
なされる。計算されたビット割当に従って量子化（ＳＴ
６）がなされる。そして、フォーマット化（ＳＴ７）が
なされ、ビットストリームが出力される（ＳＴ８）。

【００５０】また、図１３に示す復号処理では、ビット
ストリームの入力（ＳＴ９）から開始して、ビットスト
リームの復号（フォーマット分解）（ＳＴ１０）がなさ
れ、量子化ビット数を示す情報（ＡＬＬＯＣ）と、各サ
ブバンドブロック内のデータの最大値を示す情報（Ｓ
Ｆ）を使用して逆量子化がなされる（ＳＴ１１）。そし
て、合成フィルタの計算（ＳＴ１２）がされ、復号され
たオーディオデータの出力（ＳＴ１３）がなされる。

【００５１】図９中でそれぞれ破線で囲んで示すエンコ
ーダブロック５０およびデコーダブロック６０は、それ
ぞれ図１２および図１３に示す処理を行い、より具体的
には、それぞれＤＳＰ（Digital Signal Processor）に
より構成される。そして、時分割方式によって１つのＤ
ＳＰまたはＩＣ（集積回路）で、２チャンネル分のエン
コード処理が可能とされている。

【００５２】図１４は、エンコーダブロック５０または
デコーダブロックをＤＳＰにより構成する場合の一例の
構成を示す。図１４に示す構成は、エンコーダおよびデ
コーダとして機能することができ、何れの機能を有する
かは、プログラムに従って決定される。図１４におい
て、７１がＤＳＰであり、ＤＳＰ７１のシリアルポート
に対して入力データシリアルデータとして供給され、ま
た、クロックがＤＳＰ７１に供給される。７２は、ＤＳ
Ｐコントローラであり、ＣＰＵインターフェースに接続
され、また、基準パルスが供給される。７３は、ＦＩＦ
Ｏであり、ＤＳＰコントローラ７２とＦＩＦＯ７３との
間にデータバス７４およびアドレスバス７５が設けられ
ている。ＦＩＦＯ７３から出力データが取り出される。

【００５３】７６がデータ用メモリとしてのＳＲＡＭで
あり、７７がプログラム格納用のＲＯＭである。ＤＳＰ
７１、ＳＲＡＭ７６およびＲＯＭ７７は、データバス７
４およびアドレスバスと結合されている。ＤＳＰコント
ローラ７２からＤＳＰ７１に対する外部割込みが発生す
る。例えば５０ＭHzのクロックで動作するＤＳＰ７１に
対して、３８４サンプル分の時間間隔のパルスを使って
割り込みをかけ、この割り込みが発生した時にエンコー
ド処理のプロセスを実行する。

【００５４】図１２のフローチャートおよび図１４のブ
ロック図を参照して符号化処理について以下により詳細
に説明する。

【００５５】（１）オーディオデータの入力（ステップ
ＳＴ１）入力オーディオデータはシリアルポートからサンプリン
グクロックに同期してサンプル毎にＤＳＰ７１の外部メ
モリ（ＳＲＡＭ７６）に常に転送されている。転送先の
メモリアドレスがサンプリングクロック毎にカウントア
ップしている。このプロセスでは、転送先のメモリアド
レスは初期設定する。また、このシリアルポートからの
入力されたデータを別の作業領域にコピーする。

【００５６】（２）分割フィルタの計算（ステップＳＴ
２）入力データを分割フィルタで３２個の周波数領域の信号
成分に分割する。

【００５７】（３）スケールファクタの計算（ステップ
ＳＴ３）各々のサブバンドデータの中での最大値を検出し、その
最大値を６ビットにコード化したものをスケールファク
タＳＦとしている。この処理も入力信号に依存せず、一
定の処理時間となる。

【００５８】（４）心理聴覚モデルの計算（ステップＳ
Ｔ４）図１５に心理聴覚モデルによるマスキングレベルの計算
の流れを示す。入力信号に対して、５１２ポイントのＦ
ＦＴ処理を行い、振幅スペクトラムを求める（図１５
Ａ）。図１５Ａにおいて、周波数軸にそって絶対最小可
聴レベルの特性が細い実線で示され、また、矢印で示す
入力信号の両側に存在するマスキング効果が生じる領域
が破線で示されている。

【００５９】入力信号の各周波数成分から、人の聴覚モ
デルでのノイズがマスキングされるレベルを計算する
（図１５Ｂ）。このマスキングレベル以下の音圧の周波
数成分は知覚できないため、このマスキングレベルを越
えた周波数成分の入力信号のみにビットを割り当てる。
次ぎに、図１５Ｃに示すように、周波数領域で得られた
マスキングレベルを、３２個のサブバンド領域でのノイ
ズマスキングレベルに変換する。この部分での計算結果
によって、後段のビット割り当て量が左右される。

【００６０】（５）ビット割当の計算（ステップＳＴ
５）各サブバンドのノイズマスキングレベルと信号の大きさ
から、各サブバンドの量子化ビット数ＡＬＬＯＣを決定
する。量子化の際に、トータルで何ビット割り当てるか
は、符号の圧縮率によって変化する。

【００６１】（６）量子化（ステップＳＴ６）各サブバンドデータは、スケールファクターによって正
規化されたのち、割り当てられた量子化ビット数によっ
て量子化される。処理時間は一定となる。

【００６２】（７）フォーマッティング（ステップＳＴ
７）符号化されたデータを決められたデータ列にならべ、ビ
ットストリームを生成する。

【００６３】（８）ビットストリームの出力（ステップ
ＳＴ８）エンコード結果を出力用ＦＩＦＯ７３に対して書き込
む。

【００６４】次に、デコーダの処理を図１３のフローチ
ャートおよび図１４のブロック図を参照して以下に説明
する。

【００６５】（９）ビットストリームの入力（ステップ
ＳＴ９）ビットストリームの入力は、ＤＳＰ７１の外部メモリ７
６に連続または断続的に転送されている。オーディオフ
レームの先頭は、ビットストリームのヘッダに含まれる
同期信号から検出される。

【００６６】（１０）ビットストリームの復号（ステッ
プＳＴ１０）ビットストリームから各バンドのスケールファクタ、量
子化ビット数、データを得る。

【００６７】（１１）逆量子化（ステップＳＴ１１）各バンドの量子化されているデータは、スケールファク
タと割り当てられた量子化ビット数によってサブバンド
データに変換される。

【００６８】（１２）合成フィルタの計算（ステップＳ
Ｔ１２）３２個のサブバンドデータを合成フィルタで合成し、再
生音を復号する。

【００６９】（１３）オーディオデータの出力（ステッ
プＳＴ１３）復号したオーディオデータを、シリアルポートからサン
プリングクロックに同期してサンプル毎に出力する。

【００７０】上述したＭＰＥＧオーディオで採用されて
いるサブバンド符号化方式は、受信側で階層的な操作が
できないため、階層構造を利用するシステムを構成でき
ない。この発明の一実施例では、入力オーディオデータ
を低中域データＰＣＭＬと高域データＰＣＭＨに分
割し、各周波数成分をＭＰＥＧエンコーダ２４、２５に
よりそれぞれ符号化している。それによって、階層符号
化を実現している。

【００７１】上述した一実施例では、２つの階層構造を
処理するのに、通常の２倍の回路または処理能力と、入
力フィルタ、デコーダ側の出力段の加算器が必要とな
る。この点を改善したのが以下に説明する、この発明の
他の実施例である。

【００７２】図１６は、この発明の他の実施例のエンコ
ーダ１５０およびデコーダ１６０の構成を示し、図１７
は、エンコーダの処理を示すフローチャートであり、図
１８Ａおよび図１８Ｂは、マスキングレベルの計算を説
明するための図である。図１６の構成から分かるよう
に、この発明の他の実施例は、エンコーダ１５０におい
ては、フォーマット化処理１５５Ｌおよび１５５Ｈを必
要とし、デコーダ１６０においては、ビットストリーム
復号処理１６１Ｌおよび１６１Ｈを必要とする。しかし
ながら、これ以外には、既存のエンコーダおよびデコー
ダと比して、新たに追加する構成を殆ど必要としない。

【００７３】フォーマット化処理１５５Ｌからは、低中
域データのビットストリームＢＳＬが出力され、フォー
マット化処理１５５Ｈからは、高域データのビットスト
リームＢＳＨが出力される。図示しないが、上述した
一実施例と同様に、これらのビットストリームがそれぞ
れＥＣＣエンコーダへ供給される。ＥＣＣエンコーダで
は、低中域データのビットストリームに対するエラー訂
正能力が高域データのビットストリームに対するエラー
訂正能力より高いものとなるように、エラー訂正符号の
符号化処理がなされる。

【００７４】他の実施例において、入力オーディオデー
タを低中域成分と高域成分の二つの階層データへ分割す
る例について説明する。図１２に示される符号化処理中
のステップＳＴ２（分割フィルタの計算）と同様の処理
によって、３２分割されたサブバンドデータを、周波数
の低い順から、ＳＤ（０），ＳＤ（１），・・・・・Ｓ
Ｄ（３１）と表す。これらのサブバンドデータの中の例
えばＳＤ（０）〜ＳＤ（Ｃ）を中低域の階層データＳＤ
Ｌとし、ＳＤ（Ｃ＋１）〜ＳＤ（３１）を高域の階層
データＳＤＨとする。サンプリング周波数が４８ｋHz
の場合には、１バンドの幅が７５０Hzになるので、低中
域と高域の境界の周波数ｆｃが７５０×（Ｃ＋１）Hzに
なる。この境界の位置は、分離するサブバンドを変える
ことで任意に変更できる。

【００７５】このように分割された２つのサブバンドデ
ータのグループＳＤＬおよびＳＤＨに対して、それぞ
れ独立に決められたビットレートになるように、ビット
割り当てをおこない、２つのビットストリームを生成す
る。

【００７６】図１７のフローチャートに示すように、オ
ーディオデータの入力されると（ステップＳＴ２１）、
分割フィルタの計算がなされ（ステップＳＴ２）、０〜
３１バンドの信号成分が形成される。そして、０〜３１
バンドのスケールファクタが計算される（ステップＳＴ
２３）。

【００７７】一方、入力オーディオデータは、ＦＦＴ処
理（ステップＳＴ２４）を受ける。これは、心理聴覚モ
デルの計算（マスキングレベルの計算）のために必要と
される周波数成分の解析である。そして、各サブバンド
に対応する、マスキングレベルを計算する。このマスキ
ングレベルの計算は、低中域側スペクトラムのマスキン
グレベルの計算処理（ステップＳＴ２５Ｌ）と、高域側
スペクトラムのマスキングレベルの計算処理（ステップ
ＳＴ２５Ｈ）とからなる。

【００７８】受信側で、低中域の階層データのみを使用
して再生音を得た時には、高域の階層の成分によるマス
キング効果が得られないため、低中域と高域の境界の量
子化ノイズが知覚される可能性がある。また、高域の階
層データのみを使用して再生音を得ることはない。よっ
て、図１８Ａに示すように、低中域サブバンドデータＳ
ＤＬ側のマスキングレベルを計算する時には、高域サ
ブバンドデータＳＤＨの信号は、無信号であるとして処
理し、ＳＤＨ側のマスキングレベルを計算する時に
は、ＳＤＬの信号があるものとして計算する。

【００７９】階層数は２個に限らず、例えば図１８Ｂに
示すように、周波数ｆｃｌおよびｆｃｈにおいて、オー
ディオ信号を低域、中域、高域の３つの成分に分割する
ようにしても良い。さらに、各階層の符号化条件は、同
じである必要はない。この３個の階層の場合のマスキン
グレベルを計算する場合には、低域の階層データのマス
キングレベルは、中域および高域の階層データが無信号
であるとして計算される。中域の階層データのマスキン
グレベルは、高域の階層データが無信号であるとして計
算される。一般的には、複数の階層に分割したときのマ
スキングレベルの計算には、処理される階層よりも高い
周波数の階層の信号は無信号であるとして計算する。但
し、一部の帯域のサブバンドデータを使用しないでマス
キングレベルを計算する時には、使用しない帯域のサブ
バンドデータによるマスキング効果が使えない分だけ、
符号化効率は低下する。

【００８０】マスキングレベルの計算の処理の後に、ビ
ット割当量の計算がなされる。図１７中のステップＳＴ
２６Ｌ、ＳＴ２６Ｈに示すように、各階層のサブバンド
のマスキングレベルと信号の大きさから、各階層ごとに
それぞれ独立に決められたビットレートになるように、
各サブバンドの量子化ビット数を決定する。サイドイン
フォメーションに必要なビット数も各階層ごとに管理す
る。階層の数が増えると、サイドインフォメーションの
量が増えるため、全体としての符号化効率は低下するこ
とになる。

【００８１】ステップＳＴ２３で計算されたスケールフ
ァクタと、ステップＳＴ２６ＬおよびＳＴ２６Ｈにおい
て各階層毎に計算されたビット割当量を参照して、０〜
３１のサブバンドデータが量子化される（ステップＳＴ
２７）。

【００８２】そして、ビットストリームのフォーマット
化の処理がなされる。この場合、低中域の階層では、Ｃ
＋１〜３１番目のバンドのビット割り当て量を０として
計算する（ステップＳＴ２８Ｌ）。同様に、高域の階層
では、０〜Ｃバンドのビット割り当て量を０として計算
する（ステップＳＴ２８Ｈ）。そして、ビットストリー
ムＢＳＬが出力され（ステップＳＴ２９Ｌ）、ビット
ストリームＢＳＨが出力される（ステップＳＴ２９
Ｈ）。

【００８３】上述したこの発明の他の実施例による符号
化の方法では、入力側の周波数分離フィルタが不要で、
オーディオデータの入力、分割フィルタの計算、スケー
ルファクタの計算、量子化のプロセスは、既存のものと
同様である。データパッキング、ビットストリームの出
力の処理が階層の数だけ必要とされるが、全体に対する
処理量の増加はわずかである。心理聴覚モデルの計算、
ビット割り当ての計算においては、若干の変更が必要だ
が、処理量が従来とほぼ同じとなる。よって、２階層に
エンコードした場合には、従来のエンコーダの処理量の
数％の増加にとどめることが可能となる。

【００８４】デコーダ１６０では、図示しないエラー訂
正回路によるエラー訂正処理がなされ、エラー訂正後の
ビットストリームＢＳＬ、ＢＳＨに対してビットス
トリーム復号処理１６１Ｌおよび１６１Ｈがなされる。
これらの処理によって、階層化された２つのビットスト
リームＢＳＬ、ＢＳＨをそれぞれアンフォーマット
し、各サブバンドの量子化された値を得る。

【００８５】このビットストリーム復号処理１６１Ｌお
よび１６１Ｈの前段、またはその内部において、ビット
ストリーム選択処理がなされる。すなわち、ディジタル
放送の場合では、受信状況が良好な場合では、二つのビ
ットストリームＢＳＬ、ＢＳＨを選択し、受信状況
が悪い場合では、低中域側のビットストリームＢＳＬの
みを選択する。ビットストリームＢＳＨを選択しなか
った場合には、ビットストリームＢＳＨを復号したと
きに得られる高域のサブバンドデータを無信号として処
理する。

【００８６】図１９は、復号処理を示すフローチャート
である。ビットストリーム復号処理（ＳＴ３１Ｌおよび
ＳＴ３１Ｈ）によって、ビットストリームがアンフォー
マット化され、低中域階層と高域階層のそれぞれのサブ
バンドデータＳＤＡＴＡとサイド情報（スケールファク
タＳＦ、量子化ビット数ＡＬＬＯＣ）とが分離される。
逆量子化処理６２（図１６）、ステップＳＴ３２（図１
９）において、サイド情報を用いてサブバンドデータの
逆量子化がなされる。すなわち、低中域側の階層のビッ
トストリームＢＳＬに含まれるサイド情報（スケール
ファクタＳＦ、割り当てビット数ＡＬＬＯＣ）を用い
て、０〜Ｃのバンドのサブバンドデータがそれぞれ逆量
子化され、高域側の階層のビットストリームＢＳＨに
含まれるサイド情報（スケールファクタＳＦ、割り当て
ビット数ＡＬＬＯＣ）を用いて、Ｃ＋１〜３１のバンド
のサブバンドデータがそれぞれ逆量子化される。

【００８７】逆量子化により得られた低中域側のサブバ
ンドデータおよび高域側のサブバンドデータは、合成フ
ィルタバンク６３（図１６）、ステップＳＴ３３（図１
９）において、合成フィルタで処理される。このように
して再生音のデータが復号される（ステップＳＴ３
４）。

【００８８】上述したこの発明の他の実施例の復号処理
では、出力側の加算処理が不要で、オーディオデータの
出力、合成フィルタの計算、逆量子化のプロセスは、既
存のものと同じである。ビットストリームの復号処理が
階層の数だけ必要とされるが、全体に対する処理量の増
加はわずかである。よって、２階層のビットストリーム
の復号の場合には、従来のデコーダ処理量の数％の増加
にとどめることが可能となる。このように、この発明の
他の実施例は、階層構造を有するエンコード、デコード
処理を、従来の数％程度の処理量の増加で実行可能とな
る。従って、従来と同様にＤＳＰを用いた構成により実
現可能となる。また、同一構成を用いて、モード選択に
より階層構造の有無に応じた処理が実行可能となる。

【００８９】この発明の他の実施例のデコーダの処理に
おいて、階層の数、並びに周波数分割の境界位置（境界
のサブバンド番号）Ｃｄは、デコーダ側で既知でない場
合には、Ｃｄをサーチすることが必要である。階層数、
Ｃｄを指示するＩＤデータを伝送しても良いが、その場
合には、サイド情報が増加し、符号化効率が低下する。
図２０は、この境界のサブバンド番号Ｃｄをサーチする
場合の処理の一例を示すフローチャートである。なお、
このサーチの処理は、ビットストリームＢＳＨの復号処
理１６１Ｈでなされる。

【００９０】図２０中のステップＳＴ４１において、初
期設定（ｉ＝０，Ｃｄ＝３１）がされる。次にｉ番目の
バンドのビット割当量が０かどうかが決定される（ステ
ップＳＴ４２）。高域側のビットストリームの場合、低
域側のビット割当が０とされているので、これが０の場
合には、処理がステップＳＴ４４に移り、ｉがインクリ
メントされる。若し、ビット割当が０でない場合では、
境界のサブバンドの番号Ｃｄがｉと決定される（ステッ
プＳＴ４３）。

【００９１】ｉがインクリメントされてから（ｉ＝３
２）かどうかが決定される（ステップＳＴ４５）。ｉが
３２まで到達してない時は、ステップＳＴ４２に処理が
戻り、上述した処理が繰り返される。ｉ＝３２の場合で
は、処理が終了する。この図２０に示す処理によって、
周波数の低い側から割当ビットが０とならなくなるサブ
バンド番号を検出し、検出されたサブバンド番号を境界
のサブバンド番号Ｃｄとして認識することができる。

【００９２】図２１は、デコーダ側で境界のサブバンド
番号Ｃｄをデコーダ側でサーチする他の方法を示すフロ
ーチャートである。他の方法は、低域のビットストリー
ムＢＳＬを使用して高域側から割当ビットが０となら
なくなる位置を検出する。サーチ処理の他の例は、ビッ
トストリームＢＳＬの復号処理１６１Ｌでなされる。
最初に、（ｉ＝３１，Ｃｄ＝３１）と設定する（ステッ
プＳＴ５１）。

【００９３】次に、ｉ番目のサブバンドのビット割当量
が０かどうかが決定される（ステップＳＴ５２）。ビッ
トストリームＢＳＬの場合では、高域側のビット割当
量が０である。従って、ビット割当量が０でない時に
は、Ｃｄ＝ｉとされる（ステップＳＴ５３）。若し、ビ
ット割当量が０であれば、ｉがデクレメント（ｉ−１）
される（ステップＳＴ５４）。そして、ｉ＝０かどうか
が決定される。ｉが０でなければ、処理がステップＳＴ
５２に戻り、上述した処理が繰り返される。

【００９４】図２２は、境界のサブバンド番号を説明す
るものであり、横軸が０〜３１のサブバンド番号であ
り、縦軸が割当ビット（ＡＬＬＯＣ）である。符号化処
理では、図２２Ａに示すように、各サブバンドに対する
割当ビットが決定される。符号化処理における境界のサ
ブバンド番号は、Ｃｅである。

【００９５】次に低中域のビットストリームＢＳＬを
復号した時に、図２２Ｂに示すように、境界のサブバン
ド番号Ｃｄが求められる。高域側のビットストリームＢ
ＳＨを復号した時に、図２２Ｃに示すように、境界のサ
ブバンド番号Ｃｄは、符号化時のＣｅとずれたものとな
る。この場合には、ＣｄとＣｅの間の割り当てビット数
は０になっているため、復号処理には影響を及ぼさな
い。

【００９６】なお、デコーダ側においては、階層構造の
ストリームを一実施例と同様に複数のデコーダを用いて
復号し、その結果を加算しても良い。

【００９７】以上の実施例は、この発明をディジタル放
送の送信側システムおよび受信側システムに対して適用
した例であるが、ネットワークを介して結合されたコン
ピュータ同士のデータ転送に対しても適用できる。図２
３は、このようなデータ転送に対してこの発明を適用し
たシステムの構成例である。

【００９８】図２３において、８０で示すコンピュータ
と９０で示すコンピュータとがネットワークを介して結
合されている。コンピュータ８０は、ディジタルオーデ
ィオ信号が入力され、上述したようなサブバンド符号化
に基づく符号化を行うＭＰＥＧエンコーダ８１と、ＭＰ
ＥＧエンコーダ８１からのビットストリームＢＳが蓄え
られるデータストレージ８２とを含む。このデータスト
レージ８２からネットワークに対してビットストリーム
が送出される。このビットストリームは、上述したこの
発明の一実施例または他の実施例による処理と同様の処
理によって、階層構造を有している。

【００９９】ネットワークを転送されたビットストリー
ムがコンピュータ９０のデータストレージ９１に格納さ
れる。そして、データストレージ９１からのビットスト
リームＢＳがＭＰＥＧデコーダ９２に供給され、復号が
なされる。ＭＰＥＧデコーダ９２から復号オーディオ信
号が得られる。

【０１００】図２３に示すシステムにおいて、コンピュ
ータ８０は、データをネットワークを介して受信側のコ
ンピュータ９０の応答が返ってくるまでの時間等に基づ
いて、ネットワークの混雑の程度を検出する。このネッ
トワークの混雑の程度に応じて、使用する階層を選択
し、選択すべき階層を受信側のコンピュータ９０に対し
て指示する。例えば３階層の場合では、ネットワークが
混雑していない場合では、全階層のデータを使用するこ
とを受信側へ指示し、また、ネットワークが中程度の混
雑の場合では、低域および中域の階層のデータを使用す
ることを受信側へ指示し、さらに、ネットワークが混雑
しているときは、低域の階層のデータのみを使用するこ
とを受信側へ指示する。このように、ネットワークの混
雑状況に適応して使用する階層が選択される。

【０１０１】図２３に示すシステムにおいて、コンピュ
ータ８０および９０がそれぞれリアルタイム処理をする
のに必要な信号処理能力を有している。しかしながら、
ネットワークが混み合っているために、充分なデータを
伝送できないと、コンピュータ９０では、データストレ
ージ９１にデータが一定量以上蓄積されるまで、復号処
理ができない。その結果、再生音声が途切れ途切れにな
る。一方、この発明を適用した場合では、ネットワーク
が混み合っていることを検出し、混み合っている程度に
応じて、使用する階層が選択される。それによって、ネ
ットワークが混雑していても、再生音声の品質の劣化を
防止することができる。

【０１０２】また、上述した図２３のシステムでは、受
信側のコンピュータが十分なリアルタイム処理能力を有
しているものとしたが、若し、受信側のコンピュータの
処理能力が比較的高くない場合では、使用する階層を全
階層とせずに、この処理能力に応じて一部の階層のみを
使用するようにしても良い。

【０１０３】また、以上の説明では、ＭＰＥＧオーディ
オレイヤー１での適用例について説明したが、同様な処
理は、他のオーディオ符号の伝送においても可能であ
る。例えばオーディオ信号を複数の周波数成分に分離
し、各周波数成分をＤＣＴ（Discrete Cosine Transfor
m)の符号化を行う符号化を使用しても良い。

【０１０４】

【発明の効果】この発明は、ＭＰＥＧオーディオのよう
なオーディオ圧縮符号を断層化できるため、受信側の受
信状況、ネットワークの混雑の程度、受信側の処理能力
などに応じて、復号する階層を適応的に選択すること
で、劣化の少ない再生音を得られる。

【０１０５】また、この発明は、複数の階層を形成する
と共に、エラー訂正能力を階層によって異ならせること
によって、ディジタル放送の場合において、グレースフ
ルデグラレーションを実現することができる。

【０１０６】さらに、この発明の他の実施例では、サブ
バンド符号化の場合に、サブバンド成分によって、周波
数分離を行うことによって、ビットストリームのフォー
マット化の処理以外に、処理の増加を抑えることができ
る。

【図面の簡単な説明】

【図１】従来のディジタル放送の特性とこの発明の特性
とをそれぞれ示す略線図である。

【図２】この発明の一実施例の送信側および受信側のそ
れぞれの構成を示すブロック図である。

【図３】この発明の一実施例におけるエラー訂正符号の
構成を示す略線図である。

【図４】エラー訂正符号のいくつかの例を示す略線図で
ある。

【図５】この発明の一実施例におけるソースエンコーダ
の構成を示すブロック図である。

【図６】周波数分割用のフィルタの特性を示す略線図で
ある。

【図７】周波数分割用のフィルタの構成例を示すブロッ
ク図である。

【図８】サブバンド符号化のエンコーダおよびデコーダ
の一例を示すブロック図である。

【図９】サブバンド符号化の信号処理に沿ったエンコー
ダおよびデコーダのブロック図である。

【図１０】サブバンド符号化の説明に用いる略線図であ
る。

【図１１】ビットストリームの一例を示す略線図であ
る。

【図１２】サブバンド符号化の符号化処理を説明するた
めののフローチャートである。

【図１３】サブバンド符号化の復号処理を説明するため
のフローチャートである。

【図１４】サブバンド符号化のエンコーダおよびデコー
ダのハードウエア構成の一例を示すブロック図である。

【図１５】サブバンド符号化におけるマスキングレベル
の計算方法を説明するための略線図である。

【図１６】この発明の他の実施例の信号処理に沿ったエ
ンコーダおよびデコーダのブロック図である。

【図１７】この発明の他の実施例の符号化処理を示すフ
ローチャートである。

【図１８】この発明の他の実施例におけるマスキングレ
ベルの計算方法を説明するための略線図である。

【図１９】この発明の他の実施例の復号処理を示すフロ
ーチャートである。

【図２０】この発明の他の実施例における境界位置を決
定する方法の一例を示すフローチャートである。

【図２１】この発明の他の実施例における境界位置を決
定する方法の他の例を示すフローチャートである。

【図２２】この発明の他の実施例における境界位置を決
定する方法の説明に用いる略線図である。

【図２３】この発明のさらに他の実施例のシステム構成
を示すブロック図である。

【符号の説明】

１・・・ディジタルオーディオ信号の入力端子、２・・
・ソースエンコーダ、３，４・・・エラー訂正エンコー
ダ、２４，２５・・・ＭＰＥＧエンコーダ、２６，２７
・・・ＭＰＥＧデコーダ、５２・・・量子化処理、５４
・・・ビットアロケーション処理、５５，１５５Ｌ，１
５５Ｈ・・・ビットストリームフォーマット化処理、６
１，１６１Ｌ，１６１Ｈ・・・ビットストリーム復号処
理

Claims

【特許請求の範囲】

【請求項１】ディジタルオーディオ信号を伝送する時
に適用されるオーディオ信号符号化装置において、ディジタルオーディオ信号を周波数に基づいて複数の階
層データに分離し、上記複数の階層データを符号化し
て、複数のビットストリームを生成する手段を有するこ
とを特徴とするオーディオ信号符号化装置。
【請求項２】請求項１において、さらに、複数のビットストリームに対してエラー訂正符
号化を行うエラー訂正符号化手段を有し、上記複数の階層データの内の低域側の階層データに関し
て、上記エラー訂正符号化により生じる訂正能力を高域
側の階層データに比して高くすることを特徴とするオー
ディオ信号符号化装置。
【請求項３】請求項１において、入力ディジタルオーディオ信号を上記複数の階層データ
に分離する手段と、上記複数の階層のデータをそれぞれ符号化し、複数のビ
ットストリームを生成する複数の符号化手段とを有する
ことを特徴とするオーディオ信号符号化装置。
【請求項４】請求項１において、入力ディジタルオーディオ信号を複数の周波数成分に分
割し、上記複数の周波数成分のそれぞれに対する割当ビ
ット数を決定し、決定された割当ビット数により上記複
数の周波数成分のデータを量子化し、量子化されたデー
タをビットストリームへフォーマット化する符号化手段
を備え、上記複数の周波数成分を複数の階層に分割し、上記複数の階層について、上記割当ビット数の決定の処
理および上記量子化の処理を行い、上記量子化の処理により得られた複数のデータを複数の
ビットストリームへそれぞれフォーマット化するように
したことを特徴とするオーディオ信号符号化装置。
【請求項５】請求項４において、上記符号化手段は、割当ビット数を決定する場合に、心
理聴覚モデルを用いて、入力信号に応じたマスキングレ
ベルを利用するものであって、計算対象となる階層の周波数帯域よりも高い周波数の階
層の周波数成分を無音としてマスキングレベルを決定す
ることを特徴とするオーディオ信号符号化装置。
【請求項６】請求項１において、ビットストリームを転送するためのネットワークの混雑
の程度を検出し、上記ネットワークの混雑の程度に応じ
て受信側が使用する階層データを指示する情報を送信す
ることを特徴とするオーディオ信号符号化装置。
【請求項７】請求項１において、ビットストリームを受信する側の処理能力に応じて受信
側が使用する階層データを指示する情報を送信すること
を特徴とするオーディオ信号符号化装置。
【請求項８】ディジタルオーディオ信号を伝送する時
に適用されるオーディオ信号符号化方法において、ディジタルオーディオ信号を周波数に基づいて複数の階
層データに分離し、上記複数の階層データを符号化し
て、複数のビットストリームを生成することを特徴とす
るオーディオ信号符号化方法。
【請求項９】ディジタルオーディオ信号を周波数に基
づいて複数の階層データに分離し、上記複数の階層デー
タを符号化して、複数のビットストリームを生成し、上
記複数のビットストリームを受信し、復号するオーディ
オ信号復号装置において、受信された複数のビットストリームを複数の階層データ
へ復号すると共に、複数の階層データの全体またはその
一部を適応的に選択する手段を有することを特徴とする
オーディオ信号復号装置。
【請求項１０】請求項８において、さらに、複数のビットストリームに対してエラー訂正符
号の復号を行うエラー訂正手段を有し、エラー訂正され
たビットストリームを復号することを特徴とするオーデ
ィオ信号復号装置。
【請求項１１】請求項８において、受信された複数のビットストリームをそれぞれ複数の階
層データへ復号化する手段と、選択指示信号に基づいて、復号された複数の階層データ
を加算、または上記複数の階層データの一部を選択する
手段とからなることを特徴とするオーディオ信号復号装
置。
【請求項１２】ディジタルオーディオ信号を周波数に
基づいて複数の階層データに分離し、上記複数の階層デ
ータを符号化して、複数のビットストリームを生成し、
上記複数のビットストリームを受信し、復号するオーデ
ィオ信号復号方法において、受信された複数のビットストリームを複数の階層データ
へ復号すると共に、複数の階層データの全体またはその
一部を適応的に選択することを特徴とするオーディオ信
号復号方法。