JP2002156998A - オーディオ信号のビットストリーム処理方法、この処理方法を記録した記録媒体、及び処理装置 - Google Patents

オーディオ信号のビットストリーム処理方法、この処理方法を記録した記録媒体、及び処理装置

Info

Publication number
JP2002156998A
JP2002156998A JP2000349994A JP2000349994A JP2002156998A JP 2002156998 A JP2002156998 A JP 2002156998A JP 2000349994 A JP2000349994 A JP 2000349994A JP 2000349994 A JP2000349994 A JP 2000349994A JP 2002156998 A JP2002156998 A JP 2002156998A
Authority
JP
Japan
Prior art keywords
bit
scale factor
audio signal
bit rate
factor information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000349994A
Other languages
English (en)
Inventor
Masaichiro Maeda
雅一郎 前田
Shinichi Nakamura
伸一 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2000349994A priority Critical patent/JP2002156998A/ja
Publication of JP2002156998A publication Critical patent/JP2002156998A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【課題】 デコード側での処理の複雑化を回避しつつ、
広汎なビットレートに対応出来るオーディオ信号のビッ
トストリーム処理方法、この処理方法を記録した記録媒
体、及び処理装置を提供すること。 【解決手段】 1つのブロック内におけるスケールファ
クター情報sfを比較し、比較大な部分をアンパック情
報用のビットプールに入れる。次に、コンポーネントデ
ータcdからスペクトル成分を取り出し、取り出したス
ペクトル成分の中から、上記アンパック情報用ビットプ
ールに格納したスケールファクター情報sfに対応する
領域のスペクトル成分を、コンポーネントデータ用のビ
ットプールに格納する。この処理をビットプールが溢れ
るまで繰り返し、溢れる直前までにビットプールに格納
された上記スケールファクター情報sf及びコンポーネ
ントデータをビットストリームとして出力することを特
徴としている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、オーディオ信号
のビットストリーム処理方法、この処理方法を記録した
記録媒体、及び処理装置に関するもので、特に音質劣化
を防止しつつ低ビットレート化を実現するための技術に
係るものである。
【0002】
【従来の技術】近年、インターネット上における音楽や
動画像の配信が広く普及しつつある。また、携帯用MP
3(MPEG-1 Audio Layer-3, MPEG : Moving Picture Ex
pertsGroup)プレーヤー等によれば、インターネット上
で配信された音楽や、CD(Compact Disc)等に記録さ
れた音楽を、半導体メモリにデジタル・コピーして、こ
れらの音楽を戸外で楽しむことが出来る。
【0003】このようなインターネット上での音楽配信
技術や音楽情報のデジタル・コピー技術は、オーディオ
信号の高能率符号化技術の発展により実現したものであ
る。なぜなら高能率符号化技術によって、情報量を節約
しつつ音質の向上を図ることが可能となったからであ
る。例えば前述のMPEG-1 Audio Layer-3の圧縮方法によ
れば、64kbpsのビットレートでCDと同程度の音
質を得ることが出来る。
【0004】従来のオーディオ信号の一般的な記録再生
システムについて、図18を用いて説明する。図18は
記録再生システムの概略を示すブロック図である。
【0005】図示するようにオーディオ信号の記録再生
システム100は、オーディオ信号を所定のビットレー
トで符号化するエンコーダ110と、エンコーダ110
により符号化されたオーディオ信号を伝送する伝送路1
20と、伝送路120により伝送されたオーディオ信号
を記録する蓄積装置140と、蓄積装置140に記録さ
れたオーディオ信号を再生するデコーダ150とを備え
ている。
【0006】前記エンコーダ110は、入力されたオー
ディオ信号を例えば128kbpsのビットレートで符
号化する。この符号化の規格は種々発表されており、そ
れらの規格によれば、符号化されたビットストリームは
主信号(コンポーネントデータ)と制御信号(アンパッ
ク情報)とが多重化されたものとなる。すなわち、12
8kbpsのビットレートで符号化されたオーディオ信
号は、上記コンポーネントデータとアンパック情報とが
多重化された128kbpsのビットストリームとして
伝送路120を伝送される。コンポーネントデータは、
オーディオ信号をエンコードした後それを量子化して得
られた信号であり、アンパック情報はこのコンポーネン
トデータを伸長するために必要な信号である。こうして
伝送された128kbpsのビットストリームとしての
オーディオ信号は蓄積装置140に記録される。その
後、蓄積装置140より読み出され、デコーダ150に
おいて128kbpsのビットレートで復号化されて再
生される。
【0007】上記のような記録再生システムでは、デコ
ーダで復号化する際のビットレートは、エンコーダで符
号化した際のビットレートになる。すなわち、エンコー
ダ110において128kbpsのビットレートで符号
化されたビットストリームは、デコーダ150において
も128kbpsのビットレートで復号化する必要があ
る。
【0008】しかしながら、オーディオ信号の受信側に
おいて、一方では高音質の音楽を聴きたいという希望が
あって、128kbpsのオーディオ信号を要求する
が、他方ではそれ程の高音質の音楽を聴きたいという希
望が無く、オーディオ信号のビットレートは64kbp
sや32kbps程度で構わない、といったように、要
求するビットレートが異なる場合がある。このような場
合に送信側は、受信側が要求するそれぞれのビットレー
トで符号化したビットストリームを用意してオーディオ
信号を供給する必要がある。しかし、これら複数のオー
ディオ信号を同時に供給しようとすると、伝送路をそれ
ぞれのビットストリーム毎に別途用意するか、または既
存の伝送路の伝送容量を増大しなければ対応できないと
いう問題があった。
【0009】また、オーディオ信号の受信側の一方にお
いて、蓄積装置140の容量が十分でないために128
kbpsより低いビットレートで記録したい、という要
請がある場合もある。しかし、上記のように複数のビッ
トレートで符号化したオーディオ信号を供給することが
困難であることから、受信側が多くの音楽を記録するた
めには蓄積装置140の容量を増やす他に方法が無かっ
た。すなわち、受信側を救済する手段が無かった。
【0010】上記の問題を解決するためのいくつかの提
案がなされている。それらは、例えば特開平10−28
5043号や特開平6−164408号に記載されてい
る。特開平10−285043号に記載の方法によれ
ば、独自の符号化方法により効率的にオーディオ信号の
階層符号化を行うことにより、複数のビットレートで符
号化しつつ高品質のオーディオ信号を供給することが可
能である。
【0011】しかしながら、上記方法ではエンコード
側、すなわちオーディオ信号の送信側で階層符号化を行
う必要がある。そして、受信側は結局のところ、送信側
から送られてくるビットストリームのビットレートに依
存することは変わらない。また、独自の階層符号化を行
うため、デコーダではこの階層符号化方法に基づく復号
化を行わねばならず、デコード側に大きな負担を課する
ものであった。
【0012】また、特開平6−164408号に記載の
方法は、符号化されたオーディオ信号の記録媒体間にお
けるデータ記録、再生装置に関するものである。すなわ
ち、記録媒体間の情報のダビング時に、一方の記録媒体
に記録されている圧縮情報を、伸長処理を行わずに更に
追加圧縮を行い、且つ不必要な情報の削除を行うこと
で、記録媒体の容量を効率よく使用できる。
【0013】しかし、上記公報記載の方法では一旦圧縮
した信号の性質を利用して、更に他の符号化方法を用い
て圧縮率を向上させている。そのため、この方法を新規
に適用する場合には二重の符号化方法が必要になるとい
う問題がある。また、特開平10−285043号記載
の方法と同様に、デコーダでは二重の符号化方法に基づ
く複合化を行わなければならないため、やはりデコード
側には大きな負担が生ずるという問題があった。
【0014】
【発明が解決しようとする課題】上記従来のオーディオ
信号の記録再生システムによれば、複数のビットレート
で符号化されたオーディオ信号を、1系統の伝送路で同
時に供給することが困難であった。
【0015】そこで、オーディオ信号を階層符号化した
ビットストリームとすることで、複数のビットレートに
対応するオーディオ信号を1系統の伝送路で供給する方
法が考案された。しかし、本方法ではオーディオ信号の
送信側(エンコード側)で階層符号化を行う必要があ
る。そして、受信側(デコード側)は結局のところ、エ
ンコーダから送られてくるビットストリームのビットレ
ートに依存することは変わらない。更に、独自の階層符
号化を行うため、デコーダではこの階層符号化方法に基
づく復号化を行わねばならず、従前のデコーダでは対応
できなくなるという問題があった。
【0016】また、記録媒体間の情報のダビング時に、
一方の記録媒体に記録されている圧縮情報を、伸長処理
を行わずに更に追加圧縮を行い、且つ不必要な情報の削
除を行う方法が考案されている。しかし上記方法では、
一旦圧縮した信号の性質を利用して、更に他の符号化方
法を用いて圧縮率を向上させているため、この方法を新
規に適用する場合には二重の符号化方法が必要になると
いう問題がある。更に、デコーダでは二重の符号化方法
に基づく複合化を行わなければならないため、この方法
でも従前のデコーダをそのまま使用することが出来ない
という問題があった。
【0017】この発明は、上記事情に鑑みてなされたも
ので、その目的は、デコード側での処理の複雑化を回避
しつつ、広汎なビットレートに対応出来るオーディオ信
号のビットストリーム処理方法、この処理方法を記載し
た記録媒体、及び処理装置を提供することにある。
【0018】
【課題を解決するための手段】この発明に係る第1のオ
ーディオ信号のビットストリーム処理方法は、オーディ
オ信号を第1ビットレートで符号化することにより生成
された第1ビットストリームを、前記第1ビットレート
よりビットレートの低い第2ビットレートを有する第2
ビットストリームに変換するオーディオ信号のビットス
トリームの処理方法であって、前記第1ビットレートで
符号化されたオーディオ信号の所定時間内に含まれ、一
定周波数領域内のスペクトル成分の概略振幅を示す複数
のスケールファクター情報を比較するステップと、前記
ステップにより比較した結果大きいと判断されたスケー
ルファクター情報及び該スケールファクター情報に対応
する一定周波数領域のスペクトル成分を含むコンポーネ
ントデータからなる第2ビットストリームを生成するス
テップとを具備することを特徴としている。
【0019】また、この発明に係る第2のオーディオ信
号のビットストリームの処理方法は、オーディオ信号を
第1ビットレートで符号化することにより生成された第
1ビットストリームを、前記第1ビットレートよりビッ
トレートの低い第2ビットレートを有する第2ビットス
トリームを含むスケーラブルストリームに変換するオー
ディオ信号のビットストリームの処理方法であって、前
記第1ビットレートで符号化されたオーディオ信号の所
定時間内に含まれ、一定周波数領域内のスペクトル成分
の概略振幅を示す複数のスケールファクター情報を比較
するステップと、前記ステップにより比較した結果大き
いと判断されたスケールファクター情報及び該スケール
ファクター情報に対応する一定周波数領域のスペクトル
成分を含むコンポーネントデータからなり、少なくとも
前記第2ビットストリームを含む複数のビットストリー
ムにより階層化されたスケーラブルストリームを生成す
るステップとを具備することを特徴としている。
【0020】また、上記第1、第2のオーディオ信号の
ビットストリームの処理方法において、前記第1ビット
レートで符号化されたオーディオ信号の所定時間内に含
まれる複数のスケールファクター情報を比較した結果、
小さいと判断された前記スケールファクター情報に対応
するコンポーネントデータ内に、信号レベルの大きいス
ペクトル成分が含まれている場合には、前記小さいと判
断されたスケールファクター情報及び該スケールファク
ター情報に対応するコンポーネントデータを優先的に変
換後のビットストリームの一構成とすることを特徴とし
ている。
【0021】上記第1の方法であると、オーディオ信号
の所定時間内に含まれる複数のスケールファクター情報
を比較し、その結果、大きいと判断されたスケールファ
クター情報と該スケールファクター情報に対応するコン
ポーネントデータとにより第2ビットストリームを構成
している。すなわち、第1ビットレートで符号化された
第1ビットストリームにおいて、信号レベルの大きい周
波数帯域のデータにより新たなビットストリーム(第2
ビットストリーム)を生成することでオーディオ信号の
ビットストリームの低ビットレート化を実現している。
このようにして低ビットレート化されたオーディオ信号
は、低ビットレート化する前の信号と同様の構成、すな
わちスケールファクター情報とコンポーネントデータと
からなる構成を維持しているため、デコーダで新たな処
理を必要としないので、従来のデコーダをそのまま利用
でき、音楽情報の受信側での負担を軽減できる。また、
エンコーダで符号化されたビットレートより低いビット
レートであれば、変換後のビットレートに制限は当然に
受けない。すなわち、音楽情報の受信側は各々の蓄積装
置の容量に合わせて希望のビットレートで記録、再生す
ることが可能となる。更に、比較の結果大きいと判断さ
れたスケールファクター情報(信号レベルの大きい周波
数成分)を順次取り出してビットストリームを構成して
いるため、低ビットレート化した際の音質劣化を最小限
に抑えることが出来る。
【0022】また、上記第2の方法によれば、オーディ
オ信号のビットストリームを複数の階層を有するスケー
ラブルストリームとし、それぞれの階層のビットストリ
ームを、オーディオ信号の所定時間内に含まれるスケー
ルファクター情報を比較し、その結果大きいと判断され
たスケールファクター情報と該スケールファクター情報
に対応するコンポーネントデータとにより構成してい
る。そのため、上記第1の方法と同様に従来のデコーダ
をそのまま利用でき、更に音質劣化も防止できる。ま
た、複数のビットレートを有するスケーラブルストリー
ムとしてオーディオ信号を送信するため、送信側より受
信側が圧倒的に多いような場合には、受信側の処理構成
を簡素化できる。
【0023】更に、上記第1、第2の方法において、比
較の結果小さいと判断されたスケールファクター情報、
すなわち新たに生成するビットストリームから除かれる
べきスケールファクター情報に対応するコンポーネント
データ内に、信号レベルの大きいスペクトル成分が含ま
れているような場合には、これを優先的に新たなビット
ストリーム内に含ませることで、再生音質の劣化を更に
効果的に防止できる。
【0024】
【発明の実施の形態】以下、この発明の実施形態を図面
を参照して説明する。この説明に際し、全図にわたり、
共通する部分には共通する参照符号を付す。
【0025】この発明の第1の実施形態に係るオーディ
オ信号のビットストリーム処理方法、この処理方法を記
録した記録媒体、及び処理装置について図1を用いて説
明する。図1はオーディオ信号の記録再生システムの概
略を示すブロック図である。
【0026】図示するようにオーディオ信号の記録再生
システム10は、オーディオ信号を所定のビットレート
で符号化するエンコーダ11と、エンコーダ11により
符号化されたオーディオ信号を伝送する伝送路12と、
伝送路12により伝送されたオーディオ信号のアンパッ
クリパック処理を行うアンパックリパック回路13と、
アンパックリパック処理されたオーディオ信号を記録す
る蓄積装置14aと、蓄積装置14aに記録されたオー
ディオ信号を再生するデコーダ15aと、伝送路12に
より伝送されたオーディオ信号を直接記録する蓄積装置
14bと、蓄積装置14bに記録されたオーディオ信号
を、デコーダ15aとは異なるビットレートで再生する
デコーダ15bとを備えている。すなわち、本記録再生
システム10は、オーディ信号の送信側が1系統である
のに対して、互いに異なるビットレートでオーディオ信
号を復号化する2系統の受信側が存在するものである。
【0027】上記記録再生システムを構成する各要素を
具体化するものとしては、インターネット上での音楽配
信の場合、エンコーダ11には音楽情報の配信元のサー
バを、伝送路12には通信回線を、蓄積装置14a、1
4bにはクライアント側のハードディスクを、デコーダ
15a、15bにはクライアント側の音楽情報再生用ソ
フトウェアを例に挙げることが出来る。また別の例を挙
げれば、蓄積装置14a、14bは半導体メモリであ
り、デコーダ15a、15bはMP3プレーヤーであっ
ても良いし、伝送路12は電波やテープ、ディスク等の
記録メディアであっても良い。
【0028】前記エンコーダ11は、オーディオ信号を
例えば128kbpsのビットレート(第1ビットレー
ト)で符号化する。エンコーダ11で符号化されたオー
ディオ信号は、従来技術で説明したようにコンポーネン
トデータcdとアンパック情報apとが多重化された1
28kbpsのビットストリーム(第1ビットストリー
ム)である。この128kbpsのビットストリームは
伝送路12により伝送される。
【0029】前記伝送路12によってオーディオ信号の
ビットストリームを伝送された受信側では、オーディオ
信号をエンコーダ11で符号化されたビットレートのま
まで記録しても蓄積容量に問題のない場合には、アンパ
ックリパック処理を行わずにそのまま蓄積装置にビット
ストリームを記録する。そして、デコーダにおいて12
8kbpsのビットレートで復号化し、オーディオ信号
を再生する。これが、蓄積装置14b、デコーダ15b
を有する系統である。
【0030】一方、蓄積装置の容量が十分でない等の理
由により蓄積装置内の使用量を制限したい場合や、特に
音質にはこだわらず、低ビットレートのオーディオ信号
で構わないような場合には、アンパックリパック回路1
3でオーディオ信号のビットストリームのアンパックリ
パック処理を行う。アンパックリパック処理を行うこと
により、128kbpsのビットレートを例えば64k
bps等の低ビットレート(第2ビットレート)へ変換
して、蓄積装置に記録する。そして、デコーダにおいて
64kbpsのビットレートで復号化し、オーディオ信
号を再生する。これがアンパックリパック回路13、蓄
積装置14a、及びデコーダ15aを有する系統であ
る。
【0031】次に、上記アンパックリパック回路13に
おけるアンパックリパック処理について図2を用いて説
明する。図2はアンパックリパック処理のフローチャー
トである。
【0032】まず、アンパックリパック回路13は伝送
路12から受信した128kbpsのビットストリーム
が含んでいるアンパック情報apから、スケールファク
ター情報sfを取り出す(ステップS10)。
【0033】このスケールファクター情報sfについ
て、図3乃至図5を用いて説明する。図3は時間領域で
観測したオーディオ信号、図4は図3のオーディオ信号
の一定時間長を周波数領域で観測した周波数スペクト
ル、図5は図4に対応するオーディオ信号のスケールフ
ァクター情報である。
【0034】図3に示すように、エンコーダ11で符号
化されたオーディオ信号は、一定の時間長毎に分割され
ている(分割された1つの時間領域をフレームと呼
ぶ)。なお、各フレーム間での信号の不連続の発生を防
止するため、各フレームは隣接するフレームにその一部
が重複するように設定されている(この例では各フレー
ムの50%が次のフレームに重複するように設定してい
るが、フレームの設定の方法にはその他様々にある)。
【0035】そして、図3に示した波形の1フレームの
周波数スペクトルが図4に示すものであったとする。1
フレームに相当する周波数スペクトルを1ブロックとす
ると、この1ブロックは一定の周波数帯域b1〜bk
(kは2以上の自然数)に分割されている(分割された
1つの周波数帯域をバンドと呼ぶ)。そして、図5に示
すように、それぞれのバンドb1〜bk内に含まれるス
ペクトル成分の概略の振幅を示すものがスケールファク
ター情報sfである。言い換えれば、各バンドb1〜b
kの高さは、各々のバンドb1〜bk内に含まれる複数
のスペクトル成分の振幅の平均値と考えて良い。なお、
スケールファクター情報sfという用語はMPEG方式
において使用されているものであって、ドルビー(Dolb
y社の登録商標)デジタル符号化方式では指数部(expon
ent)と呼ばれている。用語は異なるが両者は基本的に
同種の情報であり、この情報によってビットストリーム
内に含まれているコンポーネントデータcd内における
様々な情報の格納方法を知ることが出来る。
【0036】次に、伝送路12から伝送されるビットス
トリームの最大ビットレートを格納できる程度の容量に
ビットプールの容量を設定する(ステップS11)。ビ
ットプールは一種の仮想的なバッファであって、この容
量は基本的には復号化の際のビットレートに依存し、復
号化ビットレートが低いほどビットプールの容量は小さ
くなる。復号化のビットレートが固定ビットレートであ
る場合には、ビットプールの容量は単位時間あたりのビ
ットレートに対応して設定すればよい。他方、可変ビッ
トレートの場合には、ビットプールの容量は単位時間あ
たりの最大ビットレートに対応して設定すればよい。本
実施形態においては、復号化ビットレートは64kbp
sの固定ビットレートであるから、ビットプールの容量
はこの64kbitに対応した値に設定する。なお、ビ
ットプールはアンパック情報ap用の領域とコンポーネ
ントデータcd用の領域とから構成されている。但し、
アンパック情報apには、スケールファクター情報sf
が差分値として伝送される場合のスケールファクター情
報の初期値、再生音量を決める場合に必要なゲインコン
トロール情報、2チャンネル成分を和・差信号として伝
送する場合のカップリング情報、窓の種類を示す窓情
報、サンプリング周波数、コピー禁止フラグ、オリジナ
ルフラグ、チャンネル割り当て情報などが含まれてい
る。そのため、アンパック情報ap用のビットプールの
容量は上記情報の量も勘案して決定されるため、ビット
プールの容量とビットレートとは決して等しくなるもの
ではない。
【0037】次に、1つのブロック内における各バンド
のスケールファクター情報sfを比較し、その結果最も
大きいと判断されたバンドに相当するスケールファクタ
ー情報sfをアンパック情報ap用のビットプールに入
れる(ステップS12)。前述の通りスケールファクタ
ー情報sfは各バンド(周波数帯域)の信号の概略の振
幅を示しているものである。よって、振幅の大きい周波
数帯域、すなわち当該ブロックに相当する情報の主要な
成分からビットプールへ格納することになる。
【0038】次に、コンポーネントデータcdからスペ
クトル成分を取り出す(ステップS13)。そして、取
り出したスペクトル成分の中から、上記アンパック情報
ap用ビットプールに格納したスケールファクター情報
sfに対応する領域のスペクトル成分を、コンポーネン
トデータcd用のビットプールに格納する(ステップS
14)。
【0039】上記のように、当該ブロックにおける主要
な成分に対応するスケールファクター情報sf及びコン
ポーネントデータcdをビットプールに格納した後、ビ
ットプールが溢れたか否かを判定する(ステップS1
5)。
【0040】ビットプールが溢れていない場合には、当
該フレームが所定のビットレートに達したかどうかを判
定する(ステップS16)。これは、目標とするデータ
量へ当該フレームが圧縮されたかどうかを判定している
ことになる。目標とするデータ量まで圧縮が完了してい
なければ、再びステップS12の処理へ戻り、次に大き
いと判断されたスケールファクター情報sf及びそのス
ケールファクター情報sfに対応するコンポーネントデ
ータcdをビットプールへ格納する。このように、当該
フレームについて所定のビットレートに達するまで、ス
ケールファクター情報sfが大きい順に、該スケールフ
ァクター情報sf及びそのスケールファクター情報sf
に対応するコンポーネントデータcdをビットプールへ
格納する処理を繰り返す。
【0041】その結果、当該フレームが所定のビットレ
ートに達した場合、すなわち、図5(a)に示すブロッ
クが、図5(b)に示すように10kbitsのデータ
量であったとすると、図6(a)、(b)に示すように
データを削減した結果5kbitsのデータ量になった
ときに、このフレームについての処理を終了する。そし
て、次のフレームへ進み(ステップS17)、ステップ
S12からステップS17の処理を繰り返す。
【0042】ビットプールが溢れていた場合、すなわち
アンパック情報ap用のビットプールとコンポーネント
データcd用のビットプールとの和が、ビットプールの
容量を越えたならば、コンポーネントデータcd用のビ
ットプールに最後に格納したコンポーネントデータcd
を削除する(ステップS18)。続いて、アンパック情
報ap用のビットプールに最後に格納したスケールファ
クター情報sfを削除する(ステップS19)。
【0043】そして、上記ビットプールに格納された各
情報をアンパックリパック回路13から蓄積装置14a
へビットストリーム(第2ビットストリーム)として出
力して(ステップS20)、処理を終了する。その結
果、第4番目のフレームまでの処理が終了した場合に
は、図7に示すように、アンパック情報ap用ビットプ
ールにはフレーム1からフレーム4までのスケールファ
クター情報sfが格納され、コンポーネントデータcd
用ビットプールにはスケールファクター情報に対応した
フレーム1からフレーム4までのコンポーネントデータ
cd(スペクトル成分)が格納される。
【0044】その後、蓄積装置14aに記録された上記
信号はデコーダ15aにおいて64kbpsのビットレ
ートで復号化され、オーディオ信号として再生される。
【0045】上記実施形態によれば、オーディオ信号の
各フレーム内における各バンドのスケールファクター情
報sfを比較している。そして、それらの中で大きいと
判断されたものから順次スケールファクター情報sfを
取り出して行き、アンパック情報用apのビットプール
に格納する。また、取り出されたスケールファクター情
報sfに対応するスペクトル成分をコンポーネントデー
タcd用のビットプールに格納する。1つのフレーム内
からのデータの取り出しは、取り出したデータ量が所望
の値(ビットレート)になるまで繰り返す。所望のビッ
トレートに達したならば次のフレームについて同様の処
理を行う。なお、ビットプールには予め所望のビットレ
ートに対応した容量を与えておき、その容量を越える直
前までビットプールに格納したデータにより新たなビッ
トストリームを生成している。
【0046】このように、信号レベルの大きい周波数帯
域のデータによりビットストリームを生成することによ
り、オーディオ信号のビットストリームの低ビットレー
ト化を実現している。低ビットレート化されたビットス
トリームは、低ビットレート化する前の信号と同様の構
成、すなわちスケールファクター情報sfとコンポーネ
ントデータcdとからなる構成を維持している。そのた
めデコーダでは新たな処理を特に必要としないので、従
前のデコーダをそのまま利用でき、音楽情報の受信側で
の負担を軽減できる。
【0047】また、アンパックリパック回路における変
換後のビットストリームは、エンコーダで符号化された
ビットレートより低いビットレートであれば、そのビッ
トレートに制限は当然に受けない。すなわち、音楽情報
の受信側は各々の蓄積装置の容量に合わせて希望のビッ
トレートで記録、再生することが可能となる。更に、ス
ケールファクター情報sfの大きい情報から順次取り出
してビットストリームを構成しているため、低ビットレ
ート化した際の音質劣化を最小限に抑えることが出来
る。また、エンコーダすなわち音楽情報の送信側におけ
る二重の符号化の必要がないため、送信側での負担も軽
減することが出来る。
【0048】なお上記実施形態では、ビットプールが溢
れた時点で当該ブロックにおけるスケールファクター情
報sf及びコンポーネントデータcdの抽出を終了させ
ている。しかし、ビットプールが溢れる直前で各データ
の抽出を終了させても良い。この方法では、最後にビッ
トプールに格納したスケールファクター情報sf及びコ
ンポーネントデータcdを削除する工程を省くことが出
来るので、アンパックリパック処理を簡略化できる。
【0049】更に、アンパックリパック回路は図2のフ
ローチャートに示した処理を行うことが出来れば足り、
上記処理の記録された記録媒体と、この記録媒体に記録
された処理が可能なコンピュータとの組み合わせであっ
ても構わない。
【0050】次にこの発明の第2の実施形態に係るオー
ディオ信号のビットストリーム処理方法、この処理方法
を記録した記録媒体、及び処理装置について図8を用い
て説明する。図8はオーディオ信号の記録再生システム
の概略を示すブロック図である。上記第1の実施形態で
は受信側でアンパック処理及びリパック処理を行うもの
であった。それに対して本実施形態は送信側でアンパッ
ク処理を行い、受信側ではリパック処理のみを行うもの
である。
【0051】図示するように、本実施形態に係るオーデ
ィオ信号の記録再生システム10は、オーディオ信号を
所定のビットレートで符号化するエンコーダ11と、エ
ンコーダ11により符号化されたオーディオ信号を更に
階層符号化するアンパックスケーラブルパッキング回路
16と、アンパックスケーラブルパッキング回路16に
より階層符号化されたオーディオ信号を伝送する伝送路
12と、伝送路12により伝送されたオーディオ信号の
リパック処理を行うリパック回路17a、17bと、リ
パック処理されたオーディオ信号を記録する蓄積装置1
4c、14dと、蓄積装置14c、14dにそれぞれ記
録されたオーディオ信号を再生するデコーダ15c、1
5dとを備えている。すなわち、本記録再生システム1
0は、オーディオ信号の送信側が1系統であるのに対し
て、互いに異なるビットレートでオーディオ信号を復号
化する2系統の受信側が存在するものである。また、別
の見方をすれば、1系統の受信側が2種類の復号化ビッ
トレートのうちのいずれかを選択するような場合である
と考えることが出来る。
【0052】前記エンコーダ11は、オーディオ信号を
例えば128kbpsのビットレート(第1ビットレー
ト)で符号化する。エンコーダ11で符号化されたオー
ディオ信号は、第1の実施形態で説明したように、コン
ポーネントデータ信号cdとアンパック情報apとが多
重化された128kbpsのビットストリーム(第1ビ
ットレート)である。この128kbpsのビットスト
リームはアンパックスケーラブルパッキング回路16に
送られ階層符号化される。そして、階層符号化されたビ
ットストリーム(スケーラブルストリーム)は伝送路1
2によって受信側へ伝送される。前記伝送路12によっ
てオーディオ信号のスケーラブルストリームを受信した
受信側では、リパック回路17a、17bにおいてリパ
ック処理を行う。そして、リパック処理を行ったオーデ
ィオ信号を蓄積装置14c、14dに一旦記録し、デコ
ーダ15c、15dでそれぞれ64kbps(第2ビッ
トレート)、128kbpsのビットレートで復号化し
てオーディオ信号を再生する。
【0053】次に、上記アンパックスケーラブルパッキ
ング回路16における階層符号化処理について図9を用
いて説明する。図9は階層符号化処理のフローチャート
である。ここでは一例として、スケーラブルストリーム
の基本階層に割り当てるビットプールの容量を256k
bits、平均転送レートを64kbps、最大転送レ
ートを128kbpsに設定するものとする。
【0054】まずアンパックスケーラブルパッキング回
路16は、エンコーダ11から受信した128kbps
のビットストリームのアンパック情報apからスケール
ファクター情報sfを取り出す(ステップS30)。
【0055】次に、スケーラブルストリームの階層数k
を決定する(ステップS31)。ここでは例としてk=
2の場合について説明する。そしてスケーラブルストリ
ームの階層番号nをn=1に設定する(ステップS3
2)。なお、ビットプールは階層数kと同じ数だけ設け
られる。本実施形態ではk=2であるから、アンパック
情報ap用及びコンポーネントデータcd用とから構成
されるビットプールが2つ設けられることになる。
【0056】次に、第1階層(n=1)のビットレート
の最大値が格納できるように第1階層のビットプールの
容量を決定する(ステップS33)。この容量は第1の
実施形態で説明したように、復号化ビットレートに加え
て様々な要因により決まる値である。
【0057】次に、1つのブロック内における各バンド
のスケールファクター情報sfを比較し、その結果最も
大きいと判断されたバンドに相当するスケールファクタ
ー情報sfを、第1階層のアンパック情報ap用ビット
プールに格納する(ステップS34)。この処理ステッ
プも第1の実施形態のステップS12と同様である。
【0058】次に、コンポーネントデータcdからスペ
クトル成分を取り出す(ステップS35)。そして、上
記第1階層のアンパック情報ap用ビットプールに格納
したスケールファクター情報sfに対応する領域のスペ
クトル成分を、第1階層のコンポーネントデータcd用
ビットプールに格納する(ステップS36)。
【0059】上記のように、当該ブロックにおける主要
な成分に対応するスケールファクター情報sf及びコン
ポーネントデータcdを第1階層のビットプールに格納
した後、ビットプールが溢れたか否かを判定する(ステ
ップS37)。
【0060】ビットプールが溢れていない場合には、当
該フレームが所定のビットレートに達したかどうかを判
定する(ステップS38)。これは、目標とするデータ
量へ当該フレームが圧縮されたかどうかを判定している
ことになる。目標とするデータ量まで圧縮が完了してい
なければ、再びステップS34の処理へ戻り、次に大き
いと判断されたスケールファクター情報sf及びそのス
ケールファクター情報sfに対応するコンポーネントデ
ータcdをビットプールへ格納する。このように、当該
フレームについて所定のビットレートに達するまで、ス
ケールファクター情報sfが大きい順に、該スケールフ
ァクター情報sf及びそのスケールファクター情報sf
に対応するコンポーネントデータcdをビットプールへ
格納する処理を繰り返す。
【0061】その結果、当該フレームが所定のビットレ
ートに達すると、このフレームについての処理を終了す
る。そして、次のフレームへ進み(ステップS39)、
ステップS34からステップS39の処理を繰り返す。
【0062】そして、第1階層のビットプールが溢れ
た、すなわち、アンパック情報ap用のビットプールと
コンポーネントデータcd用のビットプールの和が、第
1階層のビットプールの容量を越えた場合には、最後に
格納したコンポーネントデータcdを削除する(ステッ
プS40)。引き続き、アンパック情報ap用のビット
プールに最後に格納したスケールファクター情報sfを
削除する(ステップS41)。
【0063】次に、スケーラブルストリームの次の階層
に移る、すなわち階層番号nをn=2とする(ステップ
S42)。
【0064】そして、最終段kの階層についての処理が
終了したか否かを判定し(ステップS43)、終了して
いなければ処理ステップS33に戻り、次の階層につい
て同様の処理を行う。すなわち、本実施形態では第2階
層の処理に入る。
【0065】まず、第2階層(n=2)のビットレート
の最大値が格納できるように第2階層のビットプールの
容量を決定する。そして、第1階層の場合と同様に、第
2階層のビットプールが溢れるまで、スケールファクタ
ー情報sf及びコンポーネントデータcdをそれぞれ第
2階層のアンパック情報用及びコンポーネントデータ用
のビットプールに格納する。
【0066】ここで、各階層におけるスケールファクタ
ー情報の格納方法の概念について、図10(a)、
(b)及び図11(a)、(b)を用いて具体的に説明
する。まず、エンコーダによって符号化されたオーディ
オ信号のスケールファクター情報sfが図10(a)に
示すようなものであったとする。第1階層では図10
(a)に示すスケールファクター情報sfを大きいもの
から順に取り出していくわけであり、その取り出した結
果が図10(b)のようであったとする。
【0067】次に第2階層の処理に進むが、図10
(a)のスケールファクター情報sfから第1ビットプ
ールに格納した図10(b)に示すスケールファクター
情報sfを除くと、図11(a)のようになる。よって
第2階層では、図11(a)に示すスケールファクター
情報sfを大きい順に取り出していくことになるから、
第2階層のビットプールに格納されるスケールファクタ
ー情報は図11(b)のようになる。
【0068】第2階層のビットプールが溢れたならば、
第2階層のビットプールに最後に格納したスケールファ
クター情報sf及びコンポーネントデータcdを削除す
る。
【0069】以上により最終段kの階層の処理が終了す
るので、第1、第2階層のビットプールに格納した各情
報からなるスケーラブルストリームを出力して(ステッ
プS44)、アンパックスケーラブルパッキング回路1
6の処理を終了する。
【0070】このスケーラブルストリームは伝送路12
によって受信側へと伝送される。図8に示すように、ス
ケーラブルストリームはアンパック情報1とコンポーネ
ントデータ1(第2ビットストリーム)、及びアンパッ
ク情報2とコンポーネントデータ2とを有するビットス
トリームである。そして、アンパック情報1とコンポー
ネントデータ1からなり64kbpsのビットレートの
第1階層と、アンパック情報1、2、コンポーネントデ
ータ1、2とからなり128kbpsのビットレートを
有する第2階層とが混合されている。
【0071】次に、上記アンパックスケーラブルパッキ
ング回路16により階層符号化されたビットストリーム
を受信したリパック回路17a、17bにおける処理に
ついて図12を用いて説明する。図12はリパック処理
のフローチャートであり、リパック処理は、階層化され
たビットストリームをデコーダ15c、15dにおいて
復号可能なビットストリームに変換することを目的とす
る。
【0072】まず、復号化する際の目標のビットレート
または平均ビットレートを決定する(ステップS5
0)。そして、受信したスケーラブルストリームの階層
番号nをn=1に設定する(ステップS51)。
【0073】次に、第1階層のスケールファクター情報
sfを取り出し(ステップS52)、当該スケールファ
クター情報sfに基づき第1階層のコンポーネントデー
タcdからスペクトル成分を取り出す(ステップS5
3)。次にスケーラブルストリームの階層番号nをn=
2とする(ステップS54)。
【0074】そして、取り出したスケールファクター情
報sf及びコンポーネントデータcdが目標のビットレ
ートに達したか否かを判定する(ステップS55)。達
していなければ処理ステップS52に戻り、スケーラブ
ルストリームの第2階層について同様の処理を行う。こ
のように、目標のビットレートに達するまで各階層につ
いてスケールファクター情報sf及びコンポーネントデ
ータcdを取り出す処理を続ける。本実施形態におい
て、64kbpsでデコードする場合には、スケーラブ
ルストリームの第1階層までの処理で目標のビットレー
ト(64kbps)に達する。よって、リパック回路1
7aはスケーラブルストリームの第1階層までの処理で
終了する。一方、128kbpsでデコードする場合に
は、第1階層までの処理だけでは目標のビットレート
(128kbps)に達しないので、第2階層まで処理
を行ってリパック回路17bは処理を終了する。
【0075】取り出したスケールファクター情報sf及
びコンポーネントデータcdが目標のビットレートに達
した場合には、スケールファクター情報sfを含むアン
パック情報の再構成が必要か否かを判定する(ステップ
S56)。そして、必要と判定された場合にのみアンパ
ック情報の再構成を行う(ステップS57)。
【0076】次に取り出したコンポーネントデータcd
の再構成が必要か否かを判定する(ステップS58)。
そして、必要と判定された場合にのみコンポーネントデ
ータcdの再構成を行う(ステップS59)。
【0077】上記アンパック情報ap及びコンポーネン
トデータcdの再構成が必要か否かの判断は、スケーラ
ブルストリームの基本階層のビットレートと目標のビッ
トレートとが等しいか否かによって行う。すなわち、ス
ケーラブルストリームの基本階層は自己完結しており、
基本階層のみに着目すれば、階層符号化の影響を全く受
けない。それに対して第2階層まで必要となった場合に
は、スケーラブルストリームの第2階層には付加情報が
含まれていると言うことが出来るので、この付加情報と
基本階層に含まれる情報とを、周波数領域または時間領
域において並び替える必要がある。これが再構成の意味
であり、結局、第2階層以上のデータを必要とする場合
に、アンパック情報ap及びコンポーネントデータcd
の再構成が必要となる。
【0078】そして、上記のようにして取り出した基本
階層に含まれるアンパック情報ap1とコンポーネント
データcd1からなるビットストリーム、及び基本階層
と第2階層とに含まれるアンパック情報ap1、ap2
とコンポーネントデータcd1、cd2からなるビット
ストリームを、それぞれ蓄積装置14c、14dへ出力
(ステップS60)してリパック処理を終了する。な
お、上記リパック処理はビットプールを使用して行って
も良い。
【0079】その後、蓄積装置14c、14dに記録さ
れた上記信号は、デコーダ15c、15dにおいてそれ
ぞれ64kbps、128kbpsのビットレートで復
号化され、オーディオ信号として再生される。
【0080】上記第2の実施形態によれば、オーディオ
信号のビットストリームを複数の階層を有するスケーラ
ブルストリームとしている。そして、まず基本階層にお
いて、信号レベルの大きな周波数帯域のデータのみによ
り構成することで低ビットレート化されたビットストリ
ームを生成し、第2階層以降は下位の階層(第2階層に
対しては基本階層、第3階層に対しては基本階層及び第
2階層、…)で小さいと判断されて当該下位の階層に取
り込まれなかったスケールファクター情報sfの中で、
信号レベルの大きな周波数帯域のデータによりビットス
トリームを生成している。このようにして生成されたス
ケーラブルストリームは、低ビットレート化する前の信
号と同様の構成、すなわちスケールファクター情報sf
とコンポーネントデータcdとからなる構成を維持して
いるため、上記第1の実施形態と同様に従前のデコーダ
をそのまま利用でき、更に音質劣化も防止できる。
【0081】また、複数のビットレートを有するスケー
ラブルストリームとしてオーディオ信号を送信するた
め、送信側より受信側が圧倒的に多いような場合には、
受信側の処理構成を簡素化できる。
【0082】なお、本実施形態におけるアンパックスケ
ーラブルパッキング回路での階層符号化処理では、階層
数kをk=2に設定した場合について説明したが、階層
数を更に増やしても構わないのは勿論である。このよう
に階層数を増やすことにより、細かなビットレート調整
が可能となる。本実施形態では、階層数kが2であるス
ケーラブルストリームに64kbpsと128kbps
のビットストリームが含まれている。例えばスケーラブ
ルストリームの階層数kを9に設定し、各階層を8kb
ps間隔のビットレートを有するように構成したとす
る。すると、当該スケーラブルストリームに含まれるビ
ットストリームのビットレートは64、72、80、8
8、96、104、112、120、128kbpsと
なり、9段階にスケール調整可能なスケーラブルストリ
ームとなるため、受信側の復号化ビットレートの要求に
幅広く対応することが可能である。
【0083】また、ビットプールへのスケールファクタ
ー情報sf及びコンポーネントデータcdの格納は、第
1の実施形態同様にビットプールが溢れる直前で各デー
タの抽出を終了させても良い。この方法では、最後にビ
ットプールに格納したスケールファクター情報sf及び
コンポーネントデータcdを削除する工程を省くことが
出来るので、アンパックリパック処理を簡略化できる。
【0084】更に、アンパックスケーラブルパッキング
回路、リパック回路はそれぞれ図9、図12のフローチ
ャートに示した処理を行うことが出来れば足り、上記処
理の記録された記録媒体と、この記録媒体に記録された
処理が可能なコンピュータとの組み合わせであっても構
わない。
【0085】更にリパック処理において、処理ステップ
S56の判断基準は目標のビットレートに達したか否か
ではなく、目標の階層数に達したか否か、であっても同
様の効果が得られる。
【0086】上記第1、第2の実施形態では、当該ブロ
ックにおける各バンドのスケールファクター情報sfを
比較して、その結果大きいと判断されたバンドに相当す
るスケールファクター情報sfから順次ビットプールに
格納している。しかし、スケールファクター情報sfを
比較した結果、小さいと判断されたバンド内に信号レベ
ルの非常に大きい成分が含まれていた場合には、この小
さいと判断されたバンドに相当するスケールファクター
情報sfを優先的にビットプールに格納しても良い。図
4の周波数スペクトルを例に挙げれば、バンド14には
振幅の大きい1本のスペクトルが存在する。しかし、そ
の周辺の周波数のスペクトルの振幅が小さいために、各
バンドの概略の振幅(前述のように振幅の平均値と考え
ても良い)を示すスケールファクター情報sfのみを見
ると、小さいと判断されて新たなビットストリームに取
り込まれない可能性がある。確かにスケールファクター
情報sfとしては小さいものの、その中の振幅の大きな
スペクトルは音楽データとして重要なものである可能性
がある。そこで、処理ステップS13、または処理ステ
ップS35でコンポーネントデータcdからスペクトル
成分を取り出した際に、そのバンドのスケールファクタ
ー情報sfが小さくても、バンド14に見られるような
スペクトルが存在する場合には、そのバンドに対応する
スケールファクター情報sf及びコンポーネントデータ
cdを優先的に取り出す。すなわち、単純にスケールフ
ァクター情報sfの比較によってのみ判断を下すのでは
なく、コンポーネントデータcdの値も加味し、総合的
に判断した上で取り出すスケールファクター情報sf及
びコンポーネントデータcdを決定する。この方法を採
ることで、再生時の音楽の高品質化が効果的に実現でき
る。
【0087】また、信号レベルの大きな周波数帯域に隣
接する高周波側及び低周波側の周波数帯域の音は通常聞
こえていない、という特性が人間の耳には存在する(音
のマスキング)。よって、例えばエンコーダで符号化さ
れたオーディオ信号のスケールファクター情報sfが図
5(a)に示すようなものであった場合に、必ずしも図
6(b)に示すようにスケールファクター情報sfの大
きなものからビットストリームを生成するのではなく、
図13に示すように取り出したスケールファクター情報
sfに隣接するバンドのスケールファクター情報sfを
取り出さないという方法を用いても構わない。このよう
に、スケールファクター情報sfを取り出す基準は必ず
しも振幅の大きいものから順次取り出す必要はなく、例
えば振幅が最大のもの、3番目に大きいもの、5番目に
大きいもの、…といった順序で取り出していっても構わ
ない。また、周波数によって人間の耳の感度は変化する
ことが知られているが、これらの人間の聴覚特性を活か
しつつ、取り出すスケールファクター情報sf及びコン
ポーネントデータcdを決定してもよい。
【0088】ここで、上記第1、第2の実施形態におい
て、所望のビットレートの設定方法について説明する。
エンコーダ11が出力するビットストリームは、その符
号化方式によって、ビットレートがフレーム毎に割り当
てられている方式と、可変の値を持つ方式とがある。可
変ビットレートでは、伝送路やデコーダ側のビットスト
リーム入力バッファの必要容量を規定したり、平均ビッ
トレートと最大ビットレートを規定したりしている。前
者の符号化方式にはMPEG-1 Layer-1、Layer-2、Dolby A
C-3等があり、後者にはMPEG-1 Layer-3、MPEG-2 AAC等
がある。元のオーディオ信号の符号化方式が固定ビット
レートである場合には、階層符号化を行う際のビットレ
ートは自明である。すなわち、所望のビットレートを取
りうる最大の値とする場合には、比例方式を用いてもビ
ットレートは一意に決まる。一方、元のオーディオ信号
の符号化方式が可変ビットレートである場合には、種々
の変形が可能となる。例えば、階層符号化されたビット
ストリームの平均ビットレートを満足しつつ、最大ビッ
トレートの比例配分にしたり、または重み付けした比例
配分位置を用いたり、あるいは固定ビットレートに変更
したりすることが可能である。
【0089】ここで、1つのビットプールに、図14
(a)、(b)乃至図17(a)、(b)に示す4つの
フレームが格納される場合を考える。図14(a)、
(b)乃至図17(a)、(b)はそれぞれスケールフ
ァクター情報sf及びその容量を示しており、順次フレ
ーム1、2、3、4とする。
【0090】図14、図17にそれぞれ示すフレーム1
及びフレーム4は、そのデータ量が10kbitsであ
る。それに対して図15のフレーム12は全周波数領域
に渡って信号レベルが小さく、そのデータ量も3kbi
tsに過ぎない。逆に図16のフレーム3の信号レベル
は大きく、そのデータ量は20kbitsに達する。前
述の最大ビットレートの比例配分にすると、それぞれの
フレームにおいて半分のデータ量に削減されることにな
る。
【0091】また、図15(a)、(b)のフレーム2
は相対的にデータ量が小さいために、単純にデータ量を
半分にすると、再生音質に重大な影響を与える可能性が
ある。他方で図16(a)、(b)のフレーム3はデー
タ量が非常に大きく、データ量を半分にしてもまだ十分
なデータ量を保持しているため、更にデータ量を削減し
ても再生音質に与える影響が少ない場合がある。このよ
うな際に、データ量の小さいフレーム2ではデータの削
減を殆ど行わず、データ量の大きいフレーム3では大幅
なデータの削減を行うという方式が重み付けした比例配
分である。
【0092】すなわち、ビットプールには数フレーム分
のスケールファクター情報sf及びコンポーネントデー
タcdが格納されているが、ビットレートを例えば半分
に落とす場合に、各々のフレームにおけるオーディオ信
号が半分のビットレートに変換されている必要は無い。
全体としてみた際に、ビットレートが半分になっていれ
ばよいわけである。
【0093】なお、元のオーディオ信号のうちの一部の
成分のみによって新たなビットストリームを生成するこ
とによって低ビットレート化を図っているため、このビ
ットレートの変換は非可逆変換であり、デコーダで再生
されるオーディオ信号はエンコーダでエンコードされた
直後のオーディオ信号とは異なる信号である。しかし上
記のように、人間の聴覚特性等を活かして削減する成分
を決定することにより、音楽を聴くという観点からは殆
ど悪影響を及ぼさずに低ビットレート化が実現できる。
【0094】更に、ビットプールにスケールファクター
情報sf及びコンポーネントデータcdを格納する際に
は、そのままビットプールに格納するのではなく、ハフ
マン符号化等の可逆圧縮を行うことが、データ圧縮の観
点から望ましい。
【0095】また、上記第1、第2の実施形態で説明し
た記録再生システムは、受信側が2系統である場合を例
に挙げたが、1系統の場合にも適用でき、当然ながら3
系統以上の場合にも適用できる。むしろ、受信側が多数
存在する場合に本発明の効果は顕著に現れると言うこと
も出来る。勿論、上記第1、第2の実施形態を組み合わ
せた形で本発明を実施することも可能である。すなわ
ち、送信側でスケーラブルストリームを生成して音楽情
報を提供し、受信側ではスケーラブルストリームが含む
いずれかのビットレートのビットストリームを更にアン
パックリパック処理して所望のビットレートに変換す
る、という形態である。これは、特に例外的な場合と考
えられるが、受信側がある特定のビットレートで音楽情
報を記録、再生したいという要請があって、スケーラブ
ルストリームがそのビットレートのビットストリームを
含んでいないような場合に適用できる。
【0096】更に、全ての実施形態に渡って「スケール
ファクター情報」という文言を用いて説明を行ったが、
前述の通りこの用語はMPEG方式で用いられているも
のである。しかし、本発明はMPEG方式で符号化され
たオーディオ信号の処理方法に限られるものではなく、
各周波数帯域における周波数スペクトルの概略レベルを
示す情報と、その情報に基づくスペクトル成分とを含む
形態で符号化されたオーディオ信号であれば、適宜変形
して広く適用することが可能である。
【0097】なお、本願発明は上記実施形態に限定され
るものではなく、実施段階ではその要旨を逸脱しない範
囲で種々に変形することが可能である。更に、上記実施
形態には種々の段階の発明が含まれており、開示される
複数の構成要件における適宜な組み合わせにより種々の
発明が抽出されうる。例えば、実施形態に示される全構
成要件からいくつかの構成要件が削除されても、発明が
解決しようとする課題の欄で述べた課題が解決でき、発
明の効果の欄で述べられている効果が得られる場合に
は、この構成要件が削除された構成が発明として抽出さ
れうる。
【0098】
【発明の効果】以上説明したように、この発明によれ
ば、デコード側での処理の複雑化を回避しつつ、広汎な
ビットレートに対応出来るオーディオ信号のビットスト
リーム処理方法、この処理方法を記録した記録媒体、及
び処理装置を提供することができる。
【図面の簡単な説明】
【図1】この発明の第1の実施形態に係るオーディオ信
号の記録再生システムの概略構成を示すブロック図。
【図2】この発明の第1の実施形態に係るオーディオ信
号の記録再生システムにおけるビットレートの変換方法
を示すフローチャート。
【図3】時間領域におけるオーディ信号の波形図。
【図4】オーディオ信号の周波数スペクトル。
【図5】エンコーダで符号化された直後の(a)図はス
ケールファクター情報、(b)図はそのデータ量を示す
図。
【図6】図5において、大きいスケールファクター情報
から順に取り出すことにより生成したビットストリーム
の(a)図はスケールファクター情報、(b)図はデー
タ量を示す図。
【図7】ビットプール内部の構造を示す概念図。
【図8】この発明の第2の実施形態に係るオーディオ信
号の記録再生システムの概略構成を示すブロック図。
【図9】この発明の第2の実施形態に係るオーディオ信
号の記録再生システムにおけるオーディオ信号の階層符
号化方法を示すフローチャート。
【図10】スケーラブルストリームの生成方法の概念に
ついて説明するための図であり、(a)図はエンコーダ
で符号化された直後のスケールファクター情報を示し、
(b)図は第1階層のビットストリームのスケールファ
クター情報を示す図。
【図11】スケーラブルストリームの生成方法の概念に
ついて説明するための図であり、(a)図はエンコーダ
で符号化された直後のスケールファクター情報から第1
階層で取り出したスケールファクター情報を除いた状態
を示し、(b)図は第2階層のビットストリームのスケ
ールファクター情報を示す図。
【図12】この発明の第2の実施形態に係るオーディオ
信号の記録再生システムにおいて、階層符号化されたオ
ーディオ信号のリパック処理方法を示すフローチャー
ト。
【図13】スケールファクター情報から順に取り出すこ
とにより生成したビットストリームのスケールファクタ
ー情報を示す図。
【図14】エンコーダで符号化された直後の(a)図は
スケールファクター情報、(b)図はそのデータ量を示
す図。
【図15】エンコーダで符号化された直後の(a)図は
スケールファクター情報、(b)図はそのデータ量を示
す図。
【図16】エンコーダで符号化された直後の(a)図は
スケールファクター情報、(b)図はそのデータ量を示
す図。
【図17】エンコーダで符号化された直後の(a)図は
スケールファクター情報、(b)図はそのデータ量を示
す図。
【図18】従来のオーディオ信号の記録再生システムの
概略構成を示すブロック図。
【符号の説明】
10、110…記録再生システム 11、110…エンコーダ 12、120…伝送路 13…アンパックリパック回路 14a〜14d、140…蓄積装置 15a〜15d、150…デコーダ 16…アンパックスケーラブルパッキング回路 17a、17b…リパック回路
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5D045 DA20 5K041 AA08 BB01 CC01 DD01 FF31 HH39 JJ24

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 オーディオ信号を第1ビットレートで符
    号化することにより生成された第1ビットストリーム
    を、前記第1ビットレートよりビットレートの低い第2
    ビットレートを有する第2ビットストリームに変換する
    オーディオ信号のビットストリームの処理方法であっ
    て、 前記第1ビットレートで符号化されたオーディオ信号の
    所定時間内に含まれ、一定周波数領域内のスペクトル成
    分の概略振幅を示す複数のスケールファクター情報を比
    較するステップと、 前記ステップにより比較した結果大きいと判断されたス
    ケールファクター情報及び該スケールファクター情報に
    対応する一定周波数領域のスペクトル成分を含むコンポ
    ーネントデータからなる第2ビットストリームを生成す
    るステップとを具備することを特徴とするオーディオ信
    号のビットストリームの処理方法。
  2. 【請求項2】 オーディオ信号を第1ビットレートで符
    号化することにより生成された第1ビットストリーム
    を、前記第1ビットレートよりビットレートの低い第2
    ビットレートを有する第2ビットストリームを含むスケ
    ーラブルストリームに変換するオーディオ信号のビット
    ストリームの処理方法であって、 前記第1ビットレートで符号化されたオーディオ信号の
    所定時間内に含まれ、一定周波数領域内のスペクトル成
    分の概略振幅を示す複数のスケールファクター情報を比
    較するステップと、 前記ステップにより比較した結果大きいと判断されたス
    ケールファクター情報及び該スケールファクター情報に
    対応する一定周波数領域のスペクトル成分を含むコンポ
    ーネントデータからなり、少なくとも前記第2ビットス
    トリームを含む複数のビットストリームにより階層化さ
    れたスケーラブルストリームを生成するステップとを具
    備することを特徴とするオーディオ信号のビットストリ
    ームの処理方法。
  3. 【請求項3】 前記第1ビットレートで符号化されたオ
    ーディオ信号の所定時間内に含まれる複数のスケールフ
    ァクター情報を比較した結果、小さいと判断された前記
    スケールファクター情報に対応するコンポーネントデー
    タ内に、信号レベルの大きいスペクトル成分が含まれて
    いる場合には、 前記小さいと判断されたスケールファクター情報及び該
    スケールファクター情報に対応するコンポーネントデー
    タを優先的に変換後のビットストリームの一構成とする
    ことを特徴とする請求項1または2記載のオーディオ信
    号のビットストリームの処理方法。
  4. 【請求項4】 オーディオ信号を第1ビットレートで符
    号化することにより生成され、アンパック情報とコンポ
    ーネントデータとを含む第1ビットストリームを、前記
    第1ビットレートよりビットレートの低い第2ビットレ
    ートを有する第2ビットストリームに変換するオーディ
    オ信号のビットストリームの処理方法であって、 前記第2ビットレートに略対応する容量を有し、前記ア
    ンパック情報用と前記コンポーネントデータ用の領域と
    から構成されるビットプールを作成するビットプール作
    成ステップと、 前記第1ビットレートで符号化されたオーディオ信号の
    所定時間内に含まれ、一定周波数領域内のスペクトル成
    分の概略振幅を示す複数のスケールファクター情報を比
    較して、その結果大きいと判断されたスケールファクタ
    ー情報及び該スケールファクター情報に対応する一定周
    波数領域のスペクトル成分を含むコンポーネントデータ
    を順次、前記アンパック情報用及び前記コンポーネント
    データ用の前記ビットプールに各々格納するデータ格納
    ステップと、 前記データ格納ステップによってビットプールに格納し
    たスケールファクター情報及びコンポーネントデータか
    らなる第2ビットストリームを生成するビットストリー
    ム生成ステップとを具備することを特徴とするオーディ
    オ信号のビットストリームの処理方法。
  5. 【請求項5】 オーディオ信号を第1ビットレートで符
    号化することにより生成され、アンパック情報とコンポ
    ーネントデータとを含む第1ビットストリームを、前記
    第1ビットレートよりビットレートの低い第2ビットレ
    ートを有するビットストリームを含むスケーラブルスト
    リームに変換するオーディオ信号のビットストリームの
    処理方法であって、 前記スケーラブルストリームの各々の階層のビットレー
    トに対応する容量を有し、前記アンパック情報用と前記
    コンポーネントデータ用の領域とから構成されるビット
    プールを、前記階層の数k(kは2以上の自然数)だけ
    作成するビットプール作成ステップと、 前記第1ビットレートで符号化されたオーディオ信号の
    所定時間内に含まれ、一定周波数領域内のスペクトル成
    分の概略振幅を示す複数のスケールファクター情報を比
    較して、その結果大きいと判断されたスケールファクタ
    ー情報及び該スケールファクター情報に対応する一定周
    波数領域のスペクトル成分を含むコンポーネントデータ
    を順次、第n(nはk以下の自然数)階層の前記アンパ
    ック情報用及び前記コンポーネントデータ用の前記ビッ
    トプールに格納するデータ格納ステップと、 前記データ格納ステップによって第n階層の前記ビット
    プールに格納したスケールファクター情報及びコンポー
    ネントデータからなる第n階層のビットストリームを生
    成するビットストリーム生成ステップと、 前記データ格納ステップと前記ビットストリーム生成ス
    テップとを、前記第k階層まで(n=k)繰り返し行
    い、第1階層のビットストリームから第k階層のビット
    ストリームで構成され、少なくとも前記第1階層を含む
    ビットストリームが第2ビットレートを有するスケーラ
    ブルストリームを生成するスケーラブルストリーム生成
    ステップとを具備することを特徴とするオーディオ信号
    のビットストリームの処理方法。
  6. 【請求項6】 前記スケーラブルストリームにおいて、
    前記階層数nが高次になるに従って各階層のビットスト
    リームが有するスケールファクター情報が小さくなるこ
    とを特徴とする請求項5記載のオーディオ信号のビット
    ストリームの処理方法。
  7. 【請求項7】 前記スケーラブルストリームを受信した
    後、 所定のビットレートを設定するビットレート設定ステッ
    プと、 前記スケーラブルストリームのアンパック情報からスケ
    ールファクター情報を取り出すスケールファクター情報
    抽出ステップと、 前記スケーラブルストリームのコンポーネントデータか
    らスペクトル成分を取り出すスペクトル成分抽出ステッ
    プと、 前記所望のビットレートに達するまで前記スケールファ
    クター情報抽出ステップ及びスペクトル成分抽出ステッ
    プを階層を上げて繰り返すステップと、 前記ステップにおいて、前記所望のビットストリームま
    で階層を上げて処理がなされた後、アンパック情報の再
    構成が必要か調べ、必要な場合にはアンパック情報を再
    構成するアンパック情報再構成ステップと、 コンポーネントデータの再構成が必要か調べ、必要な場
    合にはコンポーネントデータを再構成するコンポーネン
    トデータ再構成ステップと、 前記アンパック情報及びコンポーネントデータを他の情
    報と共にビットストリームとして出力する出力ステップ
    と を具備することを特徴とする請求項5または6記載のオ
    ーディオ信号のビットストリームの処理方法。
  8. 【請求項8】 前記データ格納ステップにおいて、 前記第1ビットレートで符号化されたオーディオ信号の
    所定時間内に含まれる複数のスケールファクター情報を
    比較した結果、小さいと判断された前記スケールファク
    ター情報に対応するコンポーネントデータ内に、信号レ
    ベルの大きいスペクトル成分が含まれている場合には、 前記小さいと判断されたスケールファクター情報及び該
    スケールファクター情報に対応するコンポーネントデー
    タを優先的に、前記アンパック情報用及び前記コンポー
    ネントデータ用の前記ビットプールへ各々格納すること
    を特徴とする請求項4乃至7いずれか1項記載のオーデ
    ィオ信号のビットストリームの処理方法。
  9. 【請求項9】 前記大きいと判断されたスケールファク
    ター情報により生成されたビットストリームにおいて、 前記オーディオ信号の所定時間内に含まれる前記スケー
    ルファクター情報は固定ビットレートを有することを特
    徴とする請求項1乃至8いずれか1項記載のオーディオ
    信号のビットストリームの処理方法。
  10. 【請求項10】 前記大きいと判断されたスケールファ
    クター情報により生成されたビットストリームにおい
    て、 前記オーディオ信号の所定時間内に含まれる前記スケー
    ルファクター情報は、前記第1、第2ビットレートの比
    率に比例するビットレートを有することを特徴とする請
    求項1乃至8いずれか1項記載のオーディオ信号のビッ
    トストリームの処理方法。
  11. 【請求項11】 前記大きいと判断されたスケールファ
    クター情報により生成されたビットストリームにおい
    て、 前記オーディオ信号の所定時間内に含まれる前記スケー
    ルファクター情報は、各々の音の特性に応じた重み付け
    をされたビットレートを有することを特徴とする請求項
    1乃至8いずれか1項記載のオーディオ信号のビットス
    トリームの処理方法。
  12. 【請求項12】 請求項1、2、4、5、7のいずれか
    1項記載のオーディオ信号のビットストリームの処理方
    法を記録したことを特徴とする記録媒体。
  13. 【請求項13】 第1ビットレートで符号化された第1
    ビットストリームを受信して、前記第1ビットストリー
    ムを前記第1ビットレートよりビットレートの低い第2
    ビットストリームに変換するアンパックリパック回路
    と、 前記アンパックリパック回路で生成された前記第2ビッ
    トストリームを記録する蓄積装置と、 前記蓄積装置に記録された前記第2ビットストリームを
    復号化してオーディオ信号を再生するデコーダとを具備
    し、前記アンパックリパック回路は、 前記第1ビットレートで符号化されたオーディオ信号の
    所定時間内に含まれ、一定周波数領域内のスペクトル成
    分の概略振幅を示す複数のスケールファクター情報を比
    較し、その結果大きいと判断されたスケールファクター
    情報及び該スケールファクター情報に対応する一定周波
    数領域のスペクトル成分を含むコンポーネントデータか
    らなる第2ビットストリームを生成することを特徴とす
    るオーディオ信号のビットストリームの処理装置。
  14. 【請求項14】 第1ビットレートで符号化された第1
    ビットストリームを受信して、該第1ビットストリーム
    を階層符号化してスケーラブルストリームを生成するア
    ンパックスケーラブルパッキング回路と、 前記アンパックスケーラブルパッキング回路で生成され
    たスケーラブルストリームを受信してリパック処理を行
    い、前記スケーラブルストリームから前記第1ビットレ
    ートよりビットレートの低い第2ビットレートを有する
    第2ビットストリームを取り出すリパック回路と、 前記リパック回路で取り出した前記第2ビットストリー
    ムを記録する蓄積装置と、 前記蓄積装置に記録された前記第2ビットストリームを
    復号化してオーディオ信号を再生するデコーダとを具備
    し、前記アンパックスケーラブルパッキング回路は、 前記第1ビットレートで符号化されたオーディオ信号の
    所定時間内に含まれ、一定周波数領域内のスペクトル成
    分の概略振幅を示す複数のスケールファクター情報を比
    較し、その結果大きいと判断されたスケールファクター
    情報及び該スケールファクター情報に対応する一定周波
    数領域のスペクトル成分を含むコンポーネントデータか
    らなり、少なくとも前記第2ビットレートを有する前記
    第2ビットストリームを含む複数のビットストリームに
    より階層化されたスケーラブルストリームを生成するこ
    とを特徴とするオーディオ信号のビットストリームの処
    理装置。
JP2000349994A 2000-11-16 2000-11-16 オーディオ信号のビットストリーム処理方法、この処理方法を記録した記録媒体、及び処理装置 Pending JP2002156998A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000349994A JP2002156998A (ja) 2000-11-16 2000-11-16 オーディオ信号のビットストリーム処理方法、この処理方法を記録した記録媒体、及び処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000349994A JP2002156998A (ja) 2000-11-16 2000-11-16 オーディオ信号のビットストリーム処理方法、この処理方法を記録した記録媒体、及び処理装置

Publications (1)

Publication Number Publication Date
JP2002156998A true JP2002156998A (ja) 2002-05-31

Family

ID=18823302

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000349994A Pending JP2002156998A (ja) 2000-11-16 2000-11-16 オーディオ信号のビットストリーム処理方法、この処理方法を記録した記録媒体、及び処理装置

Country Status (1)

Country Link
JP (1) JP2002156998A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004272260A (ja) * 2003-03-07 2004-09-30 Samsung Electronics Co Ltd 帯域拡張技術を利用したデジタルデータの符号化方法、その装置、復号化方法およびその装置
KR100908117B1 (ko) * 2002-12-16 2009-07-16 삼성전자주식회사 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치
KR20100083235A (ko) * 2009-01-13 2010-07-22 삼성전자주식회사 블루투스를 이용한 적응형 음질 제어 장치 및 방법
JP2016010090A (ja) * 2014-06-26 2016-01-18 ソニー株式会社 復号装置および方法、並びにプログラム
US11594235B2 (en) 2013-07-22 2023-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Noise filling in multichannel audio coding

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100908117B1 (ko) * 2002-12-16 2009-07-16 삼성전자주식회사 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치
US8046234B2 (en) 2002-12-16 2011-10-25 Samsung Electronics Co., Ltd. Method and apparatus for encoding/decoding audio data with scalability
JP2004272260A (ja) * 2003-03-07 2004-09-30 Samsung Electronics Co Ltd 帯域拡張技術を利用したデジタルデータの符号化方法、その装置、復号化方法およびその装置
KR20100083235A (ko) * 2009-01-13 2010-07-22 삼성전자주식회사 블루투스를 이용한 적응형 음질 제어 장치 및 방법
KR101580990B1 (ko) 2009-01-13 2015-12-30 삼성전자주식회사 블루투스를 이용한 적응형 음질 제어 장치 및 방법
US11594235B2 (en) 2013-07-22 2023-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Noise filling in multichannel audio coding
US11887611B2 (en) 2013-07-22 2024-01-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Noise filling in multichannel audio coding
JP2016010090A (ja) * 2014-06-26 2016-01-18 ソニー株式会社 復号装置および方法、並びにプログラム
US10573325B2 (en) 2014-06-26 2020-02-25 Sony Corporation Decoding device, decoding method, and program

Similar Documents

Publication Publication Date Title
JP2004272260A (ja) 帯域拡張技術を利用したデジタルデータの符号化方法、その装置、復号化方法およびその装置
JPH10105193A (ja) 音声符号化伝送方式
JP2006317972A (ja) オーディオデータ編集方法とこれを適用した記録媒体及びデジタルオーディオプレーヤー
KR19990082402A (ko) 광대역 오디오신호 부호장치, 광대역 오디오신호 복호장치, 광대역 오디오신호 부호 복호장치 및 광대역 오디오신호 기록매체
KR20020002241A (ko) 디지털 오디오장치
US20070297624A1 (en) Digital audio encoding
US20020169601A1 (en) Encoding device, decoding device, and broadcast system
US20090207775A1 (en) Signal processing apparatus
JP2002156998A (ja) オーディオ信号のビットストリーム処理方法、この処理方法を記録した記録媒体、及び処理装置
JPH0846516A (ja) 情報符号化方法及び装置、情報復号化方法及び装置、並びに記録媒体
JP3304750B2 (ja) ロスレス符号装置とロスレス記録媒体とロスレス復号装置とロスレス符号復号装置
US20010032072A1 (en) Apparatus and method for converting reproducing speed
JP4013800B2 (ja) データ作成方法及びデータ記録装置
US6463405B1 (en) Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband
JP3304739B2 (ja) ロスレス符号装置とロスレス記録媒体とロスレス復号装置とロスレス符号復号装置
JP3226711B2 (ja) 圧縮情報再生装置および圧縮情報再生方法
JP2000311445A (ja) ディジタルデータプレーヤー、そのデータ処理方法及び記録媒体
JP4174859B2 (ja) デジタルオーディオ信号のミキシング方法およびミキシング装置
Gerzon et al. The MLP lossless compression system for PCM audio
JP2005149608A (ja) 音声データ記録/再生システムとその音声データ記録媒体
WO1995016263A1 (fr) Procede, dispositif et support concernant le traitement de l'information
US20030083864A1 (en) File creating method and data reproduction method
JP2002109824A (ja) ディジタル音声信号の記録方法、およびその装置
JP2001134294A (ja) オーディオ信号のビットストリームの処理方法及び処理装置
JP2000347697A (ja) 音声記録再生装置および記録媒体