JPH10233692A - オーディオ信号符号化装置および符号化方法並びにオーディオ信号復号装置および復号方法 - Google Patents
オーディオ信号符号化装置および符号化方法並びにオーディオ信号復号装置および復号方法Info
- Publication number
- JPH10233692A JPH10233692A JP9005842A JP584297A JPH10233692A JP H10233692 A JPH10233692 A JP H10233692A JP 9005842 A JP9005842 A JP 9005842A JP 584297 A JP584297 A JP 584297A JP H10233692 A JPH10233692 A JP H10233692A
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- data
- encoding
- frequency
- hierarchical data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
- H04L1/004—Arrangements for detecting or preventing errors in the information received by using forward error control
- H04L1/0056—Systems characterized by the type of code used
- H04L1/0064—Concatenated codes
- H04L1/0065—Serial concatenated codes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
- H04L1/004—Arrangements for detecting or preventing errors in the information received by using forward error control
- H04L1/0056—Systems characterized by the type of code used
- H04L1/007—Unequal error protection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
- H04L1/0078—Avoidance of errors by organising the transmitted data in a format specifically designed to deal with errors, e.g. location
- H04L1/0083—Formatting with frames or packets; Protocol or part of protocol for error control
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L27/00—Modulated-carrier systems
- H04L27/26—Systems using multi-frequency codes
- H04L27/2601—Multicarrier modulation systems
- H04L27/2602—Signal structure
- H04L27/2604—Multiresolution systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Error Detection And Correction (AREA)
Abstract
(57)【要約】
【課題】 ハードウエアおよび信号処理の増加を最小限
に抑え、ディジタルオーディオ信号の階層符号化を行
う。 【解決手段】 入力ディジタルオーディオ信号がFFT
処理(ST24)により発生した複数のスペクラム成分
が0〜31のサブバンドに分割される。サブバンドの番
号Cdを境界として、低中域(0〜C)と高域(C+1
〜31)とに分割される。心理聴覚モデルに基づいて各
階層のビット割当量がそれぞれ計算される。低中域の階
層については、単独で使用されることがあるので、高域
側の階層の成分を0として、マスキングレベルが計算さ
れる。ビット割当量とスケールファクタとから各階層の
ビット割当が決定され、各階層が量子化される(ST2
7)。そして、各階層がビットストリームにそれぞれフ
ォーマット化される(ST28L,ST28H)。
に抑え、ディジタルオーディオ信号の階層符号化を行
う。 【解決手段】 入力ディジタルオーディオ信号がFFT
処理(ST24)により発生した複数のスペクラム成分
が0〜31のサブバンドに分割される。サブバンドの番
号Cdを境界として、低中域(0〜C)と高域(C+1
〜31)とに分割される。心理聴覚モデルに基づいて各
階層のビット割当量がそれぞれ計算される。低中域の階
層については、単独で使用されることがあるので、高域
側の階層の成分を0として、マスキングレベルが計算さ
れる。ビット割当量とスケールファクタとから各階層の
ビット割当が決定され、各階層が量子化される(ST2
7)。そして、各階層がビットストリームにそれぞれフ
ォーマット化される(ST28L,ST28H)。
Description
【0001】
【発明の属する技術分野】この発明は、例えばディジタ
ル衛星放送によってディジタルオーディオ信号を伝送す
るのに適用されるオーディオ信号符号化装置および符号
化方法、並びにオーディオ信号復号装置および復号方法
に関する。
ル衛星放送によってディジタルオーディオ信号を伝送す
るのに適用されるオーディオ信号符号化装置および符号
化方法、並びにオーディオ信号復号装置および復号方法
に関する。
【0002】
【従来の技術】デジタル衛星放送での情報の伝送には、
強力なエラー訂正符号が用いられている。従って、伝送
路のC/N比がある程度まで劣化しても、エラー訂正に
より送信信号と同じ品質の情報が受信できる。
強力なエラー訂正符号が用いられている。従って、伝送
路のC/N比がある程度まで劣化しても、エラー訂正に
より送信信号と同じ品質の情報が受信できる。
【0003】
【発明が解決しようとする課題】ところが、降雨時のよ
うに、C/Nが急激に低下し、エラー訂正符号が備える
エラー訂正能力を発生するエラーが越えてしまうと、内
容が把握できないほど急激に再生情報の品質が劣化して
しまう。一方、アナログ放送の場合では、C/Nの低下
と共に、緩やかに再生情報の品質が変化する。図1A
は、横軸をエラーレートとし、縦軸を再生されるデータ
の品質とした場合に、ディジタル放送とアナログ放送の
上述した相違を概念的に示す。アナログ放送の場合で
は、破線で示すように、品質が除々に低下し、ディジタ
ル放送の場合では、実線で示すように、急激に品質が劣
化する。実際には、ディジタル放送の場合でも、アナロ
グ放送のように、除々に再生データの品質が低下する特
性(グレースフルデグラデーション)が好ましい。
うに、C/Nが急激に低下し、エラー訂正符号が備える
エラー訂正能力を発生するエラーが越えてしまうと、内
容が把握できないほど急激に再生情報の品質が劣化して
しまう。一方、アナログ放送の場合では、C/Nの低下
と共に、緩やかに再生情報の品質が変化する。図1A
は、横軸をエラーレートとし、縦軸を再生されるデータ
の品質とした場合に、ディジタル放送とアナログ放送の
上述した相違を概念的に示す。アナログ放送の場合で
は、破線で示すように、品質が除々に低下し、ディジタ
ル放送の場合では、実線で示すように、急激に品質が劣
化する。実際には、ディジタル放送の場合でも、アナロ
グ放送のように、除々に再生データの品質が低下する特
性(グレースフルデグラデーション)が好ましい。
【0004】また、ネットワーク上でのオーディオデー
タの転送について考える。エンコーダ側、デコーダ側の
信号処理能力がリアルタイム処理をするのに十分な能力
を備えていたとしても、ネットワークが混みあっていて
十分なデータ転送量が確保できない場合には、リアルタ
イムに再生信号を得ることができない。この様な場合に
は、デコーダ側にデータが一定量だけ蓄積されるまでデ
コード処理ができないため、再生音が途切れ途切れとな
り、再生音質が著しく劣化する。さらに、ネットワーク
に接続されたデコーダ側のデータ処理能力が不充分な場
合でも、同様に、再生音声の品質の劣化が生じる。
タの転送について考える。エンコーダ側、デコーダ側の
信号処理能力がリアルタイム処理をするのに十分な能力
を備えていたとしても、ネットワークが混みあっていて
十分なデータ転送量が確保できない場合には、リアルタ
イムに再生信号を得ることができない。この様な場合に
は、デコーダ側にデータが一定量だけ蓄積されるまでデ
コード処理ができないため、再生音が途切れ途切れとな
り、再生音質が著しく劣化する。さらに、ネットワーク
に接続されたデコーダ側のデータ処理能力が不充分な場
合でも、同様に、再生音声の品質の劣化が生じる。
【0005】従って、この発明の一つの目的は、伝送路
のC/N比が劣化する時に、再生オーディオ信号の品質
の低下が除々に生じるようになされたオーディオ信号符
号化装置および符号化方法並びにオーディオ信号復号装
置および復号方法を提供することにある。
のC/N比が劣化する時に、再生オーディオ信号の品質
の低下が除々に生じるようになされたオーディオ信号符
号化装置および符号化方法並びにオーディオ信号復号装
置および復号方法を提供することにある。
【0006】すなわち、この発明は、図1Bに概念的に
示すように、伝送路のC/N比が悪くなった時に、再生
オーディオ信号の品質が段階的に低下するようなグレー
スフルデグラデーションをディジタル伝送においても実
現するものである。オーディオ信号を伝送する場合に、
例えば、伝送する信号を中低域、高域とに分離して符号
化し、品質低下が知覚されやすい中低域のデータはエラ
ー訂正能力を高くして伝送する。伝送路のC/Nが低下
していくと、先ずノイズが知覚されにくい高域成分から
劣化していくことになるため、グレースフルデグラデー
ションを実現することができる。
示すように、伝送路のC/N比が悪くなった時に、再生
オーディオ信号の品質が段階的に低下するようなグレー
スフルデグラデーションをディジタル伝送においても実
現するものである。オーディオ信号を伝送する場合に、
例えば、伝送する信号を中低域、高域とに分離して符号
化し、品質低下が知覚されやすい中低域のデータはエラ
ー訂正能力を高くして伝送する。伝送路のC/Nが低下
していくと、先ずノイズが知覚されにくい高域成分から
劣化していくことになるため、グレースフルデグラデー
ションを実現することができる。
【0007】この発明の他の目的は、ネットワーク上で
オーディオデータを転送するようなリアルタイム再生シ
ステムにおいて、ネットワークの状態、受信側の処理能
力等によって再生音が途切れ途切れになることが防止さ
れたオーディオ信号符号化装置および符号化方法並びに
オーディオ信号復号装置および復号方法を提供すること
にある。
オーディオデータを転送するようなリアルタイム再生シ
ステムにおいて、ネットワークの状態、受信側の処理能
力等によって再生音が途切れ途切れになることが防止さ
れたオーディオ信号符号化装置および符号化方法並びに
オーディオ信号復号装置および復号方法を提供すること
にある。
【0008】
【課題を解決するための手段】この発明は、ディジタル
オーディオ信号を伝送する時に適用されるオーディオ信
号符号化装置において、ディジタルオーディオ信号を周
波数に基づいて複数の階層データに分離し、複数の階層
データを符号化して、複数のビットストリームを生成す
る手段を有することを特徴とするオーディオ信号符号化
装置である。また、この発明は、このようにオーディオ
信号を符号化する符号化方法である。
オーディオ信号を伝送する時に適用されるオーディオ信
号符号化装置において、ディジタルオーディオ信号を周
波数に基づいて複数の階層データに分離し、複数の階層
データを符号化して、複数のビットストリームを生成す
る手段を有することを特徴とするオーディオ信号符号化
装置である。また、この発明は、このようにオーディオ
信号を符号化する符号化方法である。
【0009】オーディオ信号の符号化方法の一例は、入
力ディジタルオーディオ信号を複数の周波数成分に分割
し、複数の周波数成分のそれぞれに対する割当ビット数
を決定し、決定された割当ビット数により複数の周波数
成分のデータを量子化し、量子化されたデータをビット
ストリームへフォーマット化するものである。
力ディジタルオーディオ信号を複数の周波数成分に分割
し、複数の周波数成分のそれぞれに対する割当ビット数
を決定し、決定された割当ビット数により複数の周波数
成分のデータを量子化し、量子化されたデータをビット
ストリームへフォーマット化するものである。
【0010】この発明は、ディジタルオーディオ信号を
周波数に基づいて複数の階層データに分離し、複数の階
層データを符号化して、複数のビットストリームを生成
し、複数のビットストリームを受信し、復号するオーデ
ィオ信号復号装置において、受信された複数のビットス
トリームを複数の階層データへ復号すると共に、複数の
階層データの全体またはその一部を適応的に選択する手
段を有することを特徴とするオーディオ信号復号装置で
ある。また、この発明は、このようにオーディオ信号を
符号化する符号化方法である。
周波数に基づいて複数の階層データに分離し、複数の階
層データを符号化して、複数のビットストリームを生成
し、複数のビットストリームを受信し、復号するオーデ
ィオ信号復号装置において、受信された複数のビットス
トリームを複数の階層データへ復号すると共に、複数の
階層データの全体またはその一部を適応的に選択する手
段を有することを特徴とするオーディオ信号復号装置で
ある。また、この発明は、このようにオーディオ信号を
符号化する符号化方法である。
【0011】さらに、この発明は、受信された複数のビ
ットストリームをそれぞれ複数の階層データへ復号化す
る手段と、選択指示信号に基づいて、復号された複数の
階層データを加算、または複数の階層データの一部を選
択する手段とからなることを特徴とするオーディオ信号
復号装置である。
ットストリームをそれぞれ複数の階層データへ復号化す
る手段と、選択指示信号に基づいて、復号された複数の
階層データを加算、または複数の階層データの一部を選
択する手段とからなることを特徴とするオーディオ信号
復号装置である。
【0012】
【発明の実施の形態】以下、この発明をディジタル放送
に適用した一実施例について図面を参照して説明する。
図2は、この発明の一実施例のシステムの概略を示す。
図2Aは、送信側の構成を示し、1で示す入力端子から
伝送するディジタルオーディオ信号が供給される。例え
ばオーディオ信号をサンプリング周波数48kHzでもっ
てディジタル化することによって、ディジタルオーディ
オ信号が形成される。このディジタルオーディオ信号
は、1チャンネルのものであるが、実際には、2チャン
ネル(ステレオ)以上のチャンネル数の場合が多い。
に適用した一実施例について図面を参照して説明する。
図2は、この発明の一実施例のシステムの概略を示す。
図2Aは、送信側の構成を示し、1で示す入力端子から
伝送するディジタルオーディオ信号が供給される。例え
ばオーディオ信号をサンプリング周波数48kHzでもっ
てディジタル化することによって、ディジタルオーディ
オ信号が形成される。このディジタルオーディオ信号
は、1チャンネルのものであるが、実際には、2チャン
ネル(ステレオ)以上のチャンネル数の場合が多い。
【0013】入力ディジタルオーディオ信号がソースエ
ンコーダ2に供給される。ソースエンコーダ2は、後述
するように、入力ディジタルオーディオ信号を低域およ
び中域成分(単に低中域成分と称する)と高域成分に周
波数分割し、各周波数成分の階層データをそれぞれ圧縮
符号(例えばMPEG(Moving Pictures Expert Group)
規格のオーディオ符号化)により圧縮する。
ンコーダ2に供給される。ソースエンコーダ2は、後述
するように、入力ディジタルオーディオ信号を低域およ
び中域成分(単に低中域成分と称する)と高域成分に周
波数分割し、各周波数成分の階層データをそれぞれ圧縮
符号(例えばMPEG(Moving Pictures Expert Group)
規格のオーディオ符号化)により圧縮する。
【0014】MPEGオーディオのフォーマット自体
は、階層的に復号するような構造を持っていない。そこ
で、この発明では、デジタルオーディオ信号を、複数の
周波数成分の階層データに分離し、各々についてMPE
Gオーディオ方式でエンコードする。このように生成さ
れた複数のビットストリームを伝送することで、受信状
況、処理能力等に応じて階層的に復号することができ
る。ここでは、中低域、高域の2つの階層構造をもたせ
るようにしている。
は、階層的に復号するような構造を持っていない。そこ
で、この発明では、デジタルオーディオ信号を、複数の
周波数成分の階層データに分離し、各々についてMPE
Gオーディオ方式でエンコードする。このように生成さ
れた複数のビットストリームを伝送することで、受信状
況、処理能力等に応じて階層的に復号することができ
る。ここでは、中低域、高域の2つの階層構造をもたせ
るようにしている。
【0015】ソースエンコーダ2から低中域成分のビッ
トストリーム(符号化データ)BS Lと高域成分のビッ
トストリーム(符号化データ)BS Hとが出力され
る。これらのビットストリームがECC(エラー訂正符
号)エンコーダ3および4にそれぞれ供給される。EC
Cエンコーダ3および4によって、ビットストリームB
S LおよびBS Hに対してエラー訂正符号の符号化
がなされる。ECCエンコーダ3および4のそれぞれの
出力データがマルチプレクサ5へ供給され、一つのビッ
トストリームが形成される。
トストリーム(符号化データ)BS Lと高域成分のビッ
トストリーム(符号化データ)BS Hとが出力され
る。これらのビットストリームがECC(エラー訂正符
号)エンコーダ3および4にそれぞれ供給される。EC
Cエンコーダ3および4によって、ビットストリームB
S LおよびBS Hに対してエラー訂正符号の符号化
がなされる。ECCエンコーダ3および4のそれぞれの
出力データがマルチプレクサ5へ供給され、一つのビッ
トストリームが形成される。
【0016】このビットストリームが変調器6において
変調され、変調されたデータが送信部7に供給される。
変調器6は、ディジタル変調器であって、QPSK(Qua
drature Phase Shift Keying) 、QAM(Quadrature Am
plitude Modulation) 、VSB(Vestigial sideband)変
調等の方式によって、伝送データを変調する。送信部7
によって、変調データが送信アンテナ8が放送衛星(ま
たは通信衛星)に対して送信される。
変調され、変調されたデータが送信部7に供給される。
変調器6は、ディジタル変調器であって、QPSK(Qua
drature Phase Shift Keying) 、QAM(Quadrature Am
plitude Modulation) 、VSB(Vestigial sideband)変
調等の方式によって、伝送データを変調する。送信部7
によって、変調データが送信アンテナ8が放送衛星(ま
たは通信衛星)に対して送信される。
【0017】図2Bは、ディジタル放送の受信側の構成
を示す。受信アンテナ11により受信された放送電波が
受信部12を介して復調器13に供給される。受信部1
2には、周波数変換器、チューナ等が含まれ、復調器1
3に対して変調データが供給される。復調器13におけ
る復調の結果、復調器13からビットストリームが出力
される。
を示す。受信アンテナ11により受信された放送電波が
受信部12を介して復調器13に供給される。受信部1
2には、周波数変換器、チューナ等が含まれ、復調器1
3に対して変調データが供給される。復調器13におけ
る復調の結果、復調器13からビットストリームが出力
される。
【0018】このビットストリームがデマルチプレクサ
14に供給される。デマルチプレクサ14によって、ビ
ットストリームが低中域データのビットストリームと高
域データのビットストリームとに分離される。ビットス
トリーム上で、二つの周波数成分のビットストリーム
は、所定の規則に従った位置に配置されている。必要に
応じて、ビットストリーム上の各周波数成分のビットス
トリームの位置を示す情報がビットストリーム中に挿入
される。
14に供給される。デマルチプレクサ14によって、ビ
ットストリームが低中域データのビットストリームと高
域データのビットストリームとに分離される。ビットス
トリーム上で、二つの周波数成分のビットストリーム
は、所定の規則に従った位置に配置されている。必要に
応じて、ビットストリーム上の各周波数成分のビットス
トリームの位置を示す情報がビットストリーム中に挿入
される。
【0019】デマルチプレクサ14により分離された二
つのビットストリームがそれぞれECCデコーダ15お
よび16に供給される。ECCデコーダ15および16
において、エラー訂正符号により伝送中に生じたエラー
が訂正される。また、訂正できないエラーは、再生した
時に目立たないように修整される。
つのビットストリームがそれぞれECCデコーダ15お
よび16に供給される。ECCデコーダ15および16
において、エラー訂正符号により伝送中に生じたエラー
が訂正される。また、訂正できないエラーは、再生した
時に目立たないように修整される。
【0020】ECCデコーダ15からは、受信され、復
調され、エラー訂正された低中域のビットストリームB
S Lが出力される。ECCデコーダ16からは、受信
され、復調され、エラー訂正された高域のビットストリ
ームBS Hが出力される。これらのビットストリーム
がソースデコーダ17に供給される。ソースデコーダ1
7では、ソースエンコーダ2においてなされた符号化
(例えばMPEG)の復号処理がなされる。また、ソー
スデコーダ17では、受信状況等に応じて、低中域デー
タの階層および高域データの階層の両者を使用する状態
と、低中域データの階層のみを使用する状態とが適応的
に選択される。ソースデコーダ17から出力端子18に
ディジタルオーディオ信号が取り出される。
調され、エラー訂正された低中域のビットストリームB
S Lが出力される。ECCデコーダ16からは、受信
され、復調され、エラー訂正された高域のビットストリ
ームBS Hが出力される。これらのビットストリーム
がソースデコーダ17に供給される。ソースデコーダ1
7では、ソースエンコーダ2においてなされた符号化
(例えばMPEG)の復号処理がなされる。また、ソー
スデコーダ17では、受信状況等に応じて、低中域デー
タの階層および高域データの階層の両者を使用する状態
と、低中域データの階層のみを使用する状態とが適応的
に選択される。ソースデコーダ17から出力端子18に
ディジタルオーディオ信号が取り出される。
【0021】この発明の一実施例は、上述したグレース
フルデグラデーションを実現するために、複数の周波数
成分へオーディオデータを分割し、階層構造を持つよう
にし、さらに、ECCエンコーダ3および4によりなさ
れるエラー訂正符号化の訂正能力を二つの周波数成分の
間で相違させるものである。図3は、エラー訂正能力を
相違させる方法の一例を示す。図3の例は、符号化され
たディジタルオーディオ信号の所定サンプル数を2次元
的に配列し、その水平方向と垂直方向にそれぞれエラー
訂正符号の符号化を行う積符号を使用する例である。勿
論、積符号以外のエラー訂正符号を使用することが可能
である。
フルデグラデーションを実現するために、複数の周波数
成分へオーディオデータを分割し、階層構造を持つよう
にし、さらに、ECCエンコーダ3および4によりなさ
れるエラー訂正符号化の訂正能力を二つの周波数成分の
間で相違させるものである。図3は、エラー訂正能力を
相違させる方法の一例を示す。図3の例は、符号化され
たディジタルオーディオ信号の所定サンプル数を2次元
的に配列し、その水平方向と垂直方向にそれぞれエラー
訂正符号の符号化を行う積符号を使用する例である。勿
論、積符号以外のエラー訂正符号を使用することが可能
である。
【0022】図3に示すように、ソースエンコーダから
のビットストリームの所定サンプル数を2次元的に配列
する場合、低中域データと高域データとを垂直方向に分
割して配列する。低中域データおよび高域データは、そ
れぞれ複数の行および複数の列を有するマトリクスに配
列される。そして、垂直方向のエラー訂正符号(C2)
の符号化は、低中域データと高域データとに対して共通
に行う。その結果、m個のC2パリティが生成される。
のビットストリームの所定サンプル数を2次元的に配列
する場合、低中域データと高域データとを垂直方向に分
割して配列する。低中域データおよび高域データは、そ
れぞれ複数の行および複数の列を有するマトリクスに配
列される。そして、垂直方向のエラー訂正符号(C2)
の符号化は、低中域データと高域データとに対して共通
に行う。その結果、m個のC2パリティが生成される。
【0023】また、低中域データに対して水平方向のエ
ラー訂正符号(C1)の符号化がなされ、n1個のC1
パリティが生成される。高域データに対してもC1符号
の符号化がなされ、n2(<n1)個のC1パリティが
生成される。さらに、C2パリティに対して、C1符号
の符号化がなされ、n1個のC1パリティが形成され
る。C1パリティの数は、破線で示すように、n2でも
良い。
ラー訂正符号(C1)の符号化がなされ、n1個のC1
パリティが生成される。高域データに対してもC1符号
の符号化がなされ、n2(<n1)個のC1パリティが
生成される。さらに、C2パリティに対して、C1符号
の符号化がなされ、n1個のC1パリティが形成され
る。C1パリティの数は、破線で示すように、n2でも
良い。
【0024】なお、上述した例は、C2符号化を行い、
次にC1符号化を行う場合であるが、逆の順番で各符号
化を行うこともできる。この場合では、C1パリティに
対して、C2符号化がなされる。
次にC1符号化を行う場合であるが、逆の順番で各符号
化を行うこともできる。この場合では、C1パリティに
対して、C2符号化がなされる。
【0025】エラー訂正符号C1およびC2としては、
リード・ソロモン符号等のエラー訂正符号を使用するこ
とができる。エラー訂正符号の場合では、リード・ソロ
モン符号に限らず、パリティ数が多いほど、訂正できる
エラーシンボルの個数が多くなる。すなわち、エラー訂
正能力が増大する。従って、図3に示すように、C1パ
リティの個数がより多くなるように符号化された低中域
データは、高域データに比してエラーに対してより強く
なる。その結果、ディジタル放送のC/N比が低下した
時には、最初に高域データのエラーが多くなり、さら
に、C/N比が低下すると、低中域データのエラーも多
くなる。
リード・ソロモン符号等のエラー訂正符号を使用するこ
とができる。エラー訂正符号の場合では、リード・ソロ
モン符号に限らず、パリティ数が多いほど、訂正できる
エラーシンボルの個数が多くなる。すなわち、エラー訂
正能力が増大する。従って、図3に示すように、C1パ
リティの個数がより多くなるように符号化された低中域
データは、高域データに比してエラーに対してより強く
なる。その結果、ディジタル放送のC/N比が低下した
時には、最初に高域データのエラーが多くなり、さら
に、C/N比が低下すると、低中域データのエラーも多
くなる。
【0026】受信側では、伝送路でのエラーなどによる
受信状況(具体的にはC/N比)などに応じて、低中域
データおよび高域データの両階層データを使用するか、
低中域データのみを用いるかを適応的に選択するように
なされる。後述するように、ネットワークを介してオー
ディオデータを伝送する場合では、伝送路のデータ転送
量、受信側のデータ処理能力に応じて使用する階層デー
タが指示される。例えば受信側におけるエラー訂正を行
う時のエラー情報を参照して、受信状況を検出すること
ができる。低中域データは、音声を再生する上で、高域
データより重要度が高いので、C/N比の低下等に伴
い、低中域データのみを使用するようにすれば、グレー
スフルデグラデーションを実現することができる。
受信状況(具体的にはC/N比)などに応じて、低中域
データおよび高域データの両階層データを使用するか、
低中域データのみを用いるかを適応的に選択するように
なされる。後述するように、ネットワークを介してオー
ディオデータを伝送する場合では、伝送路のデータ転送
量、受信側のデータ処理能力に応じて使用する階層デー
タが指示される。例えば受信側におけるエラー訂正を行
う時のエラー情報を参照して、受信状況を検出すること
ができる。低中域データは、音声を再生する上で、高域
データより重要度が高いので、C/N比の低下等に伴
い、低中域データのみを使用するようにすれば、グレー
スフルデグラデーションを実現することができる。
【0027】図4は、エラー訂正能力を異ならせる方法
の他のいくつかの例を示す。図4Aは、C1パリティの
個数を階層データによって異ならせる例であり、データ
を低域、中域、高域の3個の階層へ分割するものであ
る。低域データの階層に関するC1パリティの数をn1
1、中域データの階層に関するC1パリティの数をn1
2、高域データの階層に関するC1パリティの数をn1
3とすると、(n11>n12>n13)の関係とされ
る。それによって、C/N比が低下する時に、図1Bに
示すように、再生音声の品質が除々に低下するようにで
きる。
の他のいくつかの例を示す。図4Aは、C1パリティの
個数を階層データによって異ならせる例であり、データ
を低域、中域、高域の3個の階層へ分割するものであ
る。低域データの階層に関するC1パリティの数をn1
1、中域データの階層に関するC1パリティの数をn1
2、高域データの階層に関するC1パリティの数をn1
3とすると、(n11>n12>n13)の関係とされ
る。それによって、C/N比が低下する時に、図1Bに
示すように、再生音声の品質が除々に低下するようにで
きる。
【0028】図4Bおよび図4Cは、C2符号のパリテ
ィ数を各周波数成分に応じて異ならせる例である。図4
Bは、入力オーディオデータを低中域データと高域デー
タとの階層に分割し、音声の品質に対して重要度が高い
低中域データのC2パリティ数m1を重要度が低い高域
データのC2パリティ数m2より少なくした例である。
図4Cは、低域、中域、高域の3個の階層にデータを分
割し、それぞれに関するC2パリティの個数m11、m
12、m13を(m11>m12>m13)の関係に設
定するものである。なお、上述したように、パリティ数
を異ならせる方法以外に、エラー訂正能力を異ならせる
こともできる。例えば階層に応じて異なる種類のエラー
訂正符号を使用するようにしても良い。
ィ数を各周波数成分に応じて異ならせる例である。図4
Bは、入力オーディオデータを低中域データと高域デー
タとの階層に分割し、音声の品質に対して重要度が高い
低中域データのC2パリティ数m1を重要度が低い高域
データのC2パリティ数m2より少なくした例である。
図4Cは、低域、中域、高域の3個の階層にデータを分
割し、それぞれに関するC2パリティの個数m11、m
12、m13を(m11>m12>m13)の関係に設
定するものである。なお、上述したように、パリティ数
を異ならせる方法以外に、エラー訂正能力を異ならせる
こともできる。例えば階層に応じて異なる種類のエラー
訂正符号を使用するようにしても良い。
【0029】ソースエンコーダ2およびソースデコーダ
17の一例は、図5に示す構成とされている。ソースエ
ンコーダ2は、入力端子21からのディジタルオーディ
オ信号を低中域データPCM Lと高域データPCM
Hへ分割するためのローパスフィルタ22およびハイパ
スフィルタ23と、ローパスフィルタ22からの低中域
データを符号化するMPEGエンコーダ24と、ハイパ
スフィルタ23からの高域データを符号化するMPEG
エンコーダ25とからなる。
17の一例は、図5に示す構成とされている。ソースエ
ンコーダ2は、入力端子21からのディジタルオーディ
オ信号を低中域データPCM Lと高域データPCM
Hへ分割するためのローパスフィルタ22およびハイパ
スフィルタ23と、ローパスフィルタ22からの低中域
データを符号化するMPEGエンコーダ24と、ハイパ
スフィルタ23からの高域データを符号化するMPEG
エンコーダ25とからなる。
【0030】ソースデコーダ17は、符号化された低中
域データBS Lを復号するMPEGデコーダ26と、
符号化された高域データBS Hを復号するMPEGデ
コーダ27と、デコーダ26および27の復号出力を加
算する加算器28と、デコーダ26の出力および加算器
28の出力の一方を選択するセレクタ29とからなり、
セレクタ29から復号ディジタルオーディオ信号が出力
端子31に取り出される。セレクタ29を制御するため
の制御信号30は、受信状況(C/N比)等に基づいて
形成されたり、ユーザの指示に従って形成される。
域データBS Lを復号するMPEGデコーダ26と、
符号化された高域データBS Hを復号するMPEGデ
コーダ27と、デコーダ26および27の復号出力を加
算する加算器28と、デコーダ26の出力および加算器
28の出力の一方を選択するセレクタ29とからなり、
セレクタ29から復号ディジタルオーディオ信号が出力
端子31に取り出される。セレクタ29を制御するため
の制御信号30は、受信状況(C/N比)等に基づいて
形成されたり、ユーザの指示に従って形成される。
【0031】図6は、ローパスフィルタ22の特性22
aおよびハイパスフィルタ23の特性23aをそれぞれ
示す。これらの特性は、周波数fcにおいて3db低下
し、各特性の傾斜が6dbオクターブで変化するものであ
る。
aおよびハイパスフィルタ23の特性23aをそれぞれ
示す。これらの特性は、周波数fcにおいて3db低下
し、各特性の傾斜が6dbオクターブで変化するものであ
る。
【0032】図7は、ハイパスフィルタ23の一例であ
る。ローパスフィルタ22の出力を低中域データPCM
Lとして出力すると共に、減算器23cに供給し、遅
延回路23bを介された入力データから低中域データを
減算することによって、高域データPCM Hを得るよ
うになされる。
る。ローパスフィルタ22の出力を低中域データPCM
Lとして出力すると共に、減算器23cに供給し、遅
延回路23bを介された入力データから低中域データを
減算することによって、高域データPCM Hを得るよ
うになされる。
【0033】ローパスフィルタ22およびハイパスフィ
ルタ23を通って、MPEGエンコーダ24および25
に入るまでの信号の遅延量と、符号化されるオーディオ
フレームの位相は、2つのデータ間で同一とされる。ま
た、圧縮率などの符号化条件は、階層間で等しい必要が
なく、例えば低中域データから生じたビットストリーム
BS Lは、288kbpsとされ、高域データから生じた
ビットストリームBS Hは、96kbpsのように設定して
も良い。
ルタ23を通って、MPEGエンコーダ24および25
に入るまでの信号の遅延量と、符号化されるオーディオ
フレームの位相は、2つのデータ間で同一とされる。ま
た、圧縮率などの符号化条件は、階層間で等しい必要が
なく、例えば低中域データから生じたビットストリーム
BS Lは、288kbpsとされ、高域データから生じた
ビットストリームBS Hは、96kbpsのように設定して
も良い。
【0034】MPEGオーディオは、デジタルオーディ
オデータを転送する場合に、データ量を削減するため
に、符号化方式としてサブバンド符号化方式を用いてい
る。MPEGエンコーダ24、25は、サブバンド符号
化のエンコーダであり、MPEGデコーダ26、27
は、サブバンド符号化のデコーダである。サブバンド符
号化方式では、周波数軸方向の偏在の性質を利用して冗
長な情報を削減している。以下、このサブバンド符号化
を使用したMPEGオーディオ符号化方式について説明
する。
オデータを転送する場合に、データ量を削減するため
に、符号化方式としてサブバンド符号化方式を用いてい
る。MPEGエンコーダ24、25は、サブバンド符号
化のエンコーダであり、MPEGデコーダ26、27
は、サブバンド符号化のデコーダである。サブバンド符
号化方式では、周波数軸方向の偏在の性質を利用して冗
長な情報を削減している。以下、このサブバンド符号化
を使用したMPEGオーディオ符号化方式について説明
する。
【0035】図8は、M分割のサブバンド符号化方法の
エンコーダおよびデコーダの一例を示す。入力オーディ
オデータは、M個のバンドパスフィルタとそれぞれに対
して選択されたダウンサンプリング回路とからなる分解
フィルタ41に供給される。ダウンサンプリング回路
は、データを1/Mにサブサンプリングする。信号帯域
が1/Mに減少するから、1/Mのダウンサンプリング
が可能である。分解フィルタ41からの各サブバンドの
出力がM個の量子化器からなる量子化回路42に供給さ
れ、サブバンド毎に所定のビット数のデータに量子化さ
れる。量子化回路42の出力がパッキング回路43に供
給され、ビットストリームのフォーマットに変換され
る。
エンコーダおよびデコーダの一例を示す。入力オーディ
オデータは、M個のバンドパスフィルタとそれぞれに対
して選択されたダウンサンプリング回路とからなる分解
フィルタ41に供給される。ダウンサンプリング回路
は、データを1/Mにサブサンプリングする。信号帯域
が1/Mに減少するから、1/Mのダウンサンプリング
が可能である。分解フィルタ41からの各サブバンドの
出力がM個の量子化器からなる量子化回路42に供給さ
れ、サブバンド毎に所定のビット数のデータに量子化さ
れる。量子化回路42の出力がパッキング回路43に供
給され、ビットストリームのフォーマットに変換され
る。
【0036】デコーダ側では、ビットストリームがアン
パッキング回路44に供給され、各サブバンドのデータ
列に並びかえられ、M個の逆量子化器からなる逆量子化
回路45に供給される。逆量子化回路45に対して合成
フィルタ46が接続される。逆量子化回路45は、量子
化回路42と逆の処理を行なう。合成フィルタ46は、
M個のアップサンプリング回路と、M個のバンドパスフ
ィルタとからなる。アップサンプリング回路は、間引か
れたサンプルを補間する。バンドパスフィルタは、M分
割された帯域を元の帯域に合成するものである。合成フ
ィルタ46から復号オーディオデータが得られる。
パッキング回路44に供給され、各サブバンドのデータ
列に並びかえられ、M個の逆量子化器からなる逆量子化
回路45に供給される。逆量子化回路45に対して合成
フィルタ46が接続される。逆量子化回路45は、量子
化回路42と逆の処理を行なう。合成フィルタ46は、
M個のアップサンプリング回路と、M個のバンドパスフ
ィルタとからなる。アップサンプリング回路は、間引か
れたサンプルを補間する。バンドパスフィルタは、M分
割された帯域を元の帯域に合成するものである。合成フ
ィルタ46から復号オーディオデータが得られる。
【0037】図9は、上述のサブバンド符号化のエンコ
ーダおよびデコーダの信号処理を機能的に表すものであ
る。入力ディジタルオーディオ信号がダウンサンプリン
グを含む分解フィルタバンク51によりサブバンドデー
タに分解され、量子化処理52がなされる。また、サブ
バンドデータからスケールファクタ計算処理53がなさ
れ、スケールファクタSFからビットアロケーション処
理54がなされる。ビットアロケーション処理54で決
定された量子化レベルによって、量子化処理52がなさ
れる。
ーダおよびデコーダの信号処理を機能的に表すものであ
る。入力ディジタルオーディオ信号がダウンサンプリン
グを含む分解フィルタバンク51によりサブバンドデー
タに分解され、量子化処理52がなされる。また、サブ
バンドデータからスケールファクタ計算処理53がなさ
れ、スケールファクタSFからビットアロケーション処
理54がなされる。ビットアロケーション処理54で決
定された量子化レベルによって、量子化処理52がなさ
れる。
【0038】各サブバンドのデータ量に応じて、全体で
一定のデータ量になるように量子化レベルを割り当てる
(この処理がビットアロケーションである)。各サブバ
ンドのデータは、各サブバンドの最大値に対応したスケ
ールファクタSFで正規化されたのち、この割り当てら
れた量子化レベルで量子化される。ビットアロケーショ
ンを行なう場合、人間の聴覚の最小可聴特性等の特性を
考慮してなされる。このために、入力ディジタルオーデ
ィオ信号が供給され、ビットアロケーションを制御する
ように、心理聴覚モデル計算回路56が設けられてい
る。
一定のデータ量になるように量子化レベルを割り当てる
(この処理がビットアロケーションである)。各サブバ
ンドのデータは、各サブバンドの最大値に対応したスケ
ールファクタSFで正規化されたのち、この割り当てら
れた量子化レベルで量子化される。ビットアロケーショ
ンを行なう場合、人間の聴覚の最小可聴特性等の特性を
考慮してなされる。このために、入力ディジタルオーデ
ィオ信号が供給され、ビットアロケーションを制御する
ように、心理聴覚モデル計算回路56が設けられてい
る。
【0039】量子化処理52の後にビットストリームへ
のフォーマット化処理55がなされる。ビットストリー
ム上には、各サブバンドのスケールファクタSFと、量
子化ビット数(割当ビット数)ALLOCも挿入され
る。フォーマット化処理55により形成されたビットス
トリームが上述したように、ECCエンコーダに供給さ
れる。
のフォーマット化処理55がなされる。ビットストリー
ム上には、各サブバンドのスケールファクタSFと、量
子化ビット数(割当ビット数)ALLOCも挿入され
る。フォーマット化処理55により形成されたビットス
トリームが上述したように、ECCエンコーダに供給さ
れる。
【0040】ECCデコーダによってエラー訂正の処理
を経た後に、ビットストリームに対してサブバンド符号
化のデコーダ処理がなされる。最初にビットストリーム
の復号処理61がされ、ビットストリームの状態から各
サブバンドのデータ列に並び換えられるとともに、ビッ
トストリーム中のスケールファクタSF、量子化ビット
数ALLOCが分離される。逆量子化処理62におい
て、これらのスケールファクタSF、ALLOCを使用
して逆量子化がなされる。逆量子化処理62からのサブ
バンドデータが合成フィルタバンク63において合成さ
れ、復元ディジタルオーディオデータが得られる。
を経た後に、ビットストリームに対してサブバンド符号
化のデコーダ処理がなされる。最初にビットストリーム
の復号処理61がされ、ビットストリームの状態から各
サブバンドのデータ列に並び換えられるとともに、ビッ
トストリーム中のスケールファクタSF、量子化ビット
数ALLOCが分離される。逆量子化処理62におい
て、これらのスケールファクタSF、ALLOCを使用
して逆量子化がなされる。逆量子化処理62からのサブ
バンドデータが合成フィルタバンク63において合成さ
れ、復元ディジタルオーディオデータが得られる。
【0041】図10は、分割数32、符号長384サン
プルを例とする、サブバンド符号化の符号化処理を示
す。MPEGレイヤー1では、1つの処理単位(オーデ
ィオフレーム長)が384サンプルである。入力された
オーディオデータは、分割フィルタで、32個の周波数
領域に分割される。384サンプル分のオーディオデー
タを、32個の周波数成分(サブバンド)に分割し、そ
れぞれ1/32にダウンサンプリングする。その結果、
12サンプルで一つのサブバンドブロックが構成され
る。図10Aは、あるサブバンドSUB nの12サン
プルを示す。この中の最大絶対値(サンプル例えばSn
(6))がスケールファクタSF(例えば6ビットのコ
ードで表される)とされ、その値によって、他の11個
のサンプルの値が割算され、正規化がなされる。
プルを例とする、サブバンド符号化の符号化処理を示
す。MPEGレイヤー1では、1つの処理単位(オーデ
ィオフレーム長)が384サンプルである。入力された
オーディオデータは、分割フィルタで、32個の周波数
領域に分割される。384サンプル分のオーディオデー
タを、32個の周波数成分(サブバンド)に分割し、そ
れぞれ1/32にダウンサンプリングする。その結果、
12サンプルで一つのサブバンドブロックが構成され
る。図10Aは、あるサブバンドSUB nの12サン
プルを示す。この中の最大絶対値(サンプル例えばSn
(6))がスケールファクタSF(例えば6ビットのコ
ードで表される)とされ、その値によって、他の11個
のサンプルの値が割算され、正規化がなされる。
【0042】各サブバンドのスケールファクタSFの大
きさから各サブバンドの量子化ビット数が決定される。
図10Bは、このビットアロケーションの一例を示し、
この図から分かるように、スケールファクタSFが大き
いサブバンドほど、割り当てられる量子化ビット数が多
くされる。ビットアロケーションを行なう場合、スケー
ルファクタSFの大きさだけでなく、人間の聴覚の性質
を利用した、心理聴覚モデルを用いて決定することも可
能である。
きさから各サブバンドの量子化ビット数が決定される。
図10Bは、このビットアロケーションの一例を示し、
この図から分かるように、スケールファクタSFが大き
いサブバンドほど、割り当てられる量子化ビット数が多
くされる。ビットアロケーションを行なう場合、スケー
ルファクタSFの大きさだけでなく、人間の聴覚の性質
を利用した、心理聴覚モデルを用いて決定することも可
能である。
【0043】すなわち、人間の聴覚は、聴覚マスキング
効果と最小可聴限特性とがある。聴覚マスキング効果と
は、大きなレベルの音によって周波数上で隣接する小さ
なレベルの音が聞こえなくなることである。また、最小
可聴限特性は、聞き取れるレベルの最小値が周波数によ
って異なる特性である。これらの聴覚の性質を利用すれ
ば、聞こえない音の伝送を省略したり、聞こえにくい音
に対して割り当てる量子化ビット数を少なくしても、再
生音声の品質の低下が少ない。このように、聴覚特性を
利用することによって、伝送データ量を圧縮することが
できる。
効果と最小可聴限特性とがある。聴覚マスキング効果と
は、大きなレベルの音によって周波数上で隣接する小さ
なレベルの音が聞こえなくなることである。また、最小
可聴限特性は、聞き取れるレベルの最小値が周波数によ
って異なる特性である。これらの聴覚の性質を利用すれ
ば、聞こえない音の伝送を省略したり、聞こえにくい音
に対して割り当てる量子化ビット数を少なくしても、再
生音声の品質の低下が少ない。このように、聴覚特性を
利用することによって、伝送データ量を圧縮することが
できる。
【0044】各サブバンドデータは、割り当てられたA
LLOCによって指示される量子化レベルによって量子
化される。そして、図10Cに示すようなビットストリ
ームにフォーマット化される。図10Cは、1オーディ
オフレームを示し、先頭に符号の状態等のサイド情報を
伝送するためのヘッダ(例えば2バイト)が位置し、次
に、各サブバンドの割り当てビット数をそれぞれ表す量
子化ビット数ALLOC(4ビット×32)が位置す
る。その後に各サブバンドのスケールファクタSF(6
ビット×32)が位置する。さらに、その後に、データ
(32×12サンプル)が位置する。データは、低い周
波数から高い周波数の順に配列される。
LLOCによって指示される量子化レベルによって量子
化される。そして、図10Cに示すようなビットストリ
ームにフォーマット化される。図10Cは、1オーディ
オフレームを示し、先頭に符号の状態等のサイド情報を
伝送するためのヘッダ(例えば2バイト)が位置し、次
に、各サブバンドの割り当てビット数をそれぞれ表す量
子化ビット数ALLOC(4ビット×32)が位置す
る。その後に各サブバンドのスケールファクタSF(6
ビット×32)が位置する。さらに、その後に、データ
(32×12サンプル)が位置する。データは、低い周
波数から高い周波数の順に配列される。
【0045】本来は、このように32個のバンドのデー
タを伝送するところを、低域のバンドからデータ量(A
MOUNT)に応じた数のサブバンドだけにビットを割
り当てることによって、周波数制限による音質の劣化と
のバランスで、さらにデータ量を削減することができ
る。符号の圧縮率は、量子化の際に、総計で何ビット割
り当てるかによって決定される。
タを伝送するところを、低域のバンドからデータ量(A
MOUNT)に応じた数のサブバンドだけにビットを割
り当てることによって、周波数制限による音質の劣化と
のバランスで、さらにデータ量を削減することができ
る。符号の圧縮率は、量子化の際に、総計で何ビット割
り当てるかによって決定される。
【0046】図11は、伝送符号量をコントロールする
場合のビットストリームの構成例である。各サブバンド
ブロックには、符号化時の各サブバンドデータに対して
割り当てられた量子化ビット数を示す情報(ALLO
C)と、各サブバンドブロック内のデータの最大値を示
す情報(SF)が低域のバンドから順に、AMOUNT
に示されたバンド数だけ記録されている。データ領域に
は、12サンプルで1つのサブバンドを構成するデータ
ブロックが周波数の低いバンドから高いバンドの順に、
AMOUNTに示されたバンド数だけ記録されている。
場合のビットストリームの構成例である。各サブバンド
ブロックには、符号化時の各サブバンドデータに対して
割り当てられた量子化ビット数を示す情報(ALLO
C)と、各サブバンドブロック内のデータの最大値を示
す情報(SF)が低域のバンドから順に、AMOUNT
に示されたバンド数だけ記録されている。データ領域に
は、12サンプルで1つのサブバンドを構成するデータ
ブロックが周波数の低いバンドから高いバンドの順に、
AMOUNTに示されたバンド数だけ記録されている。
【0047】また、各ブロックの先頭には、符号化の状
態を表すヘッダが付加される。この例では、符号化の際
の圧縮率を表すRATE(4ビット)と、記録されてい
るバンドの数を表すAMOUNT(4ビットでバンド数
を表す)の情報を含んでいる。AMOUNT情報は、階
層の境界を示し、復号時に必要なものであるが、このA
MOUNT情報を必ずしも伝送する必要はない。実際
に、MPEGレイヤーI,IIのフォーマットでは存在しな
い。すなわち、AMOUNT情報に対応したサブバンド
の位置のALLOCの値のみを有効にし、その他のバン
ドの位置は、量子化ビット量が0を示す値に設定して伝
送する。復号側では、後述する境界のサーチ方法によっ
てその境界を決定することができる。そして、384個
のオーディオサンプルからなる1オーディオフレームに
対してビットストリームの1ブロックが構成される。ヘ
ッダ、ALLOC、SFのバイト数は固定であるが、デ
ータ領域のバイト数は、圧縮率によって変化する。図1
1においては、割り当てられたサブバンド数の一例(3
2)が示されている。
態を表すヘッダが付加される。この例では、符号化の際
の圧縮率を表すRATE(4ビット)と、記録されてい
るバンドの数を表すAMOUNT(4ビットでバンド数
を表す)の情報を含んでいる。AMOUNT情報は、階
層の境界を示し、復号時に必要なものであるが、このA
MOUNT情報を必ずしも伝送する必要はない。実際
に、MPEGレイヤーI,IIのフォーマットでは存在しな
い。すなわち、AMOUNT情報に対応したサブバンド
の位置のALLOCの値のみを有効にし、その他のバン
ドの位置は、量子化ビット量が0を示す値に設定して伝
送する。復号側では、後述する境界のサーチ方法によっ
てその境界を決定することができる。そして、384個
のオーディオサンプルからなる1オーディオフレームに
対してビットストリームの1ブロックが構成される。ヘ
ッダ、ALLOC、SFのバイト数は固定であるが、デ
ータ領域のバイト数は、圧縮率によって変化する。図1
1においては、割り当てられたサブバンド数の一例(3
2)が示されている。
【0048】図12は、上述したMPEGオーディオレ
イヤー1の符号化の処理を示し、図13は、その復号の
処理を示す。この例では、符号化ブロックの単位で1回
の処理ループを回してる。符号化ブロックの長さを38
4サンプルとすると、384サンプル分のオーディオデ
ータが入力される時間 (384FS:FSは、サンプリ
ング周波数)の間に1ループ分の処理が終われば、リア
ルタイムに処理を継続させることができる。
イヤー1の符号化の処理を示し、図13は、その復号の
処理を示す。この例では、符号化ブロックの単位で1回
の処理ループを回してる。符号化ブロックの長さを38
4サンプルとすると、384サンプル分のオーディオデ
ータが入力される時間 (384FS:FSは、サンプリ
ング周波数)の間に1ループ分の処理が終われば、リア
ルタイムに処理を継続させることができる。
【0049】図12に示す符号化の処理では、オーディ
オデータの入力(ST1)、分割フィルタの計算(ST
2)、スケールファクタの計算(ST3)、心理聴覚モ
デルの計算(ST4)、ビット割当の計算(ST5)が
なされる。計算されたビット割当に従って量子化(ST
6)がなされる。そして、フォーマット化(ST7)が
なされ、ビットストリームが出力される(ST8)。
オデータの入力(ST1)、分割フィルタの計算(ST
2)、スケールファクタの計算(ST3)、心理聴覚モ
デルの計算(ST4)、ビット割当の計算(ST5)が
なされる。計算されたビット割当に従って量子化(ST
6)がなされる。そして、フォーマット化(ST7)が
なされ、ビットストリームが出力される(ST8)。
【0050】また、図13に示す復号処理では、ビット
ストリームの入力(ST9)から開始して、ビットスト
リームの復号(フォーマット分解)(ST10)がなさ
れ、量子化ビット数を示す情報(ALLOC)と、各サ
ブバンドブロック内のデータの最大値を示す情報(S
F)を使用して逆量子化がなされる(ST11)。そし
て、合成フィルタの計算(ST12)がされ、復号され
たオーディオデータの出力(ST13)がなされる。
ストリームの入力(ST9)から開始して、ビットスト
リームの復号(フォーマット分解)(ST10)がなさ
れ、量子化ビット数を示す情報(ALLOC)と、各サ
ブバンドブロック内のデータの最大値を示す情報(S
F)を使用して逆量子化がなされる(ST11)。そし
て、合成フィルタの計算(ST12)がされ、復号され
たオーディオデータの出力(ST13)がなされる。
【0051】図9中でそれぞれ破線で囲んで示すエンコ
ーダブロック50およびデコーダブロック60は、それ
ぞれ図12および図13に示す処理を行い、より具体的
には、それぞれDSP(Digital Signal Processor)に
より構成される。そして、時分割方式によって1つのD
SPまたはIC(集積回路)で、2チャンネル分のエン
コード処理が可能とされている。
ーダブロック50およびデコーダブロック60は、それ
ぞれ図12および図13に示す処理を行い、より具体的
には、それぞれDSP(Digital Signal Processor)に
より構成される。そして、時分割方式によって1つのD
SPまたはIC(集積回路)で、2チャンネル分のエン
コード処理が可能とされている。
【0052】図14は、エンコーダブロック50または
デコーダブロックをDSPにより構成する場合の一例の
構成を示す。図14に示す構成は、エンコーダおよびデ
コーダとして機能することができ、何れの機能を有する
かは、プログラムに従って決定される。図14におい
て、71がDSPであり、DSP71のシリアルポート
に対して入力データシリアルデータとして供給され、ま
た、クロックがDSP71に供給される。72は、DS
Pコントローラであり、CPUインターフェースに接続
され、また、基準パルスが供給される。73は、FIF
Oであり、DSPコントローラ72とFIFO73との
間にデータバス74およびアドレスバス75が設けられ
ている。FIFO73から出力データが取り出される。
デコーダブロックをDSPにより構成する場合の一例の
構成を示す。図14に示す構成は、エンコーダおよびデ
コーダとして機能することができ、何れの機能を有する
かは、プログラムに従って決定される。図14におい
て、71がDSPであり、DSP71のシリアルポート
に対して入力データシリアルデータとして供給され、ま
た、クロックがDSP71に供給される。72は、DS
Pコントローラであり、CPUインターフェースに接続
され、また、基準パルスが供給される。73は、FIF
Oであり、DSPコントローラ72とFIFO73との
間にデータバス74およびアドレスバス75が設けられ
ている。FIFO73から出力データが取り出される。
【0053】76がデータ用メモリとしてのSRAMで
あり、77がプログラム格納用のROMである。DSP
71、SRAM76およびROM77は、データバス7
4およびアドレスバスと結合されている。DSPコント
ローラ72からDSP71に対する外部割込みが発生す
る。例えば50MHzのクロックで動作するDSP71に
対して、384サンプル分の時間間隔のパルスを使って
割り込みをかけ、この割り込みが発生した時にエンコー
ド処理のプロセスを実行する。
あり、77がプログラム格納用のROMである。DSP
71、SRAM76およびROM77は、データバス7
4およびアドレスバスと結合されている。DSPコント
ローラ72からDSP71に対する外部割込みが発生す
る。例えば50MHzのクロックで動作するDSP71に
対して、384サンプル分の時間間隔のパルスを使って
割り込みをかけ、この割り込みが発生した時にエンコー
ド処理のプロセスを実行する。
【0054】図12のフローチャートおよび図14のブ
ロック図を参照して符号化処理について以下により詳細
に説明する。
ロック図を参照して符号化処理について以下により詳細
に説明する。
【0055】(1)オーディオデータの入力(ステップ
ST1) 入力オーディオデータはシリアルポートからサンプリン
グクロックに同期してサンプル毎にDSP71の外部メ
モリ(SRAM76)に常に転送されている。転送先の
メモリアドレスがサンプリングクロック毎にカウントア
ップしている。このプロセスでは、転送先のメモリアド
レスは初期設定する。また、このシリアルポートからの
入力されたデータを別の作業領域にコピーする。
ST1) 入力オーディオデータはシリアルポートからサンプリン
グクロックに同期してサンプル毎にDSP71の外部メ
モリ(SRAM76)に常に転送されている。転送先の
メモリアドレスがサンプリングクロック毎にカウントア
ップしている。このプロセスでは、転送先のメモリアド
レスは初期設定する。また、このシリアルポートからの
入力されたデータを別の作業領域にコピーする。
【0056】(2)分割フィルタの計算(ステップST
2) 入力データを分割フィルタで32個の周波数領域の信号
成分に分割する。
2) 入力データを分割フィルタで32個の周波数領域の信号
成分に分割する。
【0057】(3)スケールファクタの計算(ステップ
ST3) 各々のサブバンドデータの中での最大値を検出し、その
最大値を6ビットにコード化したものをスケールファク
タSFとしている。この処理も入力信号に依存せず、一
定の処理時間となる。
ST3) 各々のサブバンドデータの中での最大値を検出し、その
最大値を6ビットにコード化したものをスケールファク
タSFとしている。この処理も入力信号に依存せず、一
定の処理時間となる。
【0058】(4)心理聴覚モデルの計算(ステップS
T4) 図15に心理聴覚モデルによるマスキングレベルの計算
の流れを示す。入力信号に対して、512ポイントのF
FT処理を行い、振幅スペクトラムを求める(図15
A)。図15Aにおいて、周波数軸にそって絶対最小可
聴レベルの特性が細い実線で示され、また、矢印で示す
入力信号の両側に存在するマスキング効果が生じる領域
が破線で示されている。
T4) 図15に心理聴覚モデルによるマスキングレベルの計算
の流れを示す。入力信号に対して、512ポイントのF
FT処理を行い、振幅スペクトラムを求める(図15
A)。図15Aにおいて、周波数軸にそって絶対最小可
聴レベルの特性が細い実線で示され、また、矢印で示す
入力信号の両側に存在するマスキング効果が生じる領域
が破線で示されている。
【0059】入力信号の各周波数成分から、人の聴覚モ
デルでのノイズがマスキングされるレベルを計算する
(図15B)。このマスキングレベル以下の音圧の周波
数成分は知覚できないため、このマスキングレベルを越
えた周波数成分の入力信号のみにビットを割り当てる。
次ぎに、図15Cに示すように、周波数領域で得られた
マスキングレベルを、32個のサブバンド領域でのノイ
ズマスキングレベルに変換する。この部分での計算結果
によって、後段のビット割り当て量が左右される。
デルでのノイズがマスキングされるレベルを計算する
(図15B)。このマスキングレベル以下の音圧の周波
数成分は知覚できないため、このマスキングレベルを越
えた周波数成分の入力信号のみにビットを割り当てる。
次ぎに、図15Cに示すように、周波数領域で得られた
マスキングレベルを、32個のサブバンド領域でのノイ
ズマスキングレベルに変換する。この部分での計算結果
によって、後段のビット割り当て量が左右される。
【0060】(5)ビット割当の計算(ステップST
5) 各サブバンドのノイズマスキングレベルと信号の大きさ
から、各サブバンドの量子化ビット数ALLOCを決定
する。量子化の際に、トータルで何ビット割り当てるか
は、符号の圧縮率によって変化する。
5) 各サブバンドのノイズマスキングレベルと信号の大きさ
から、各サブバンドの量子化ビット数ALLOCを決定
する。量子化の際に、トータルで何ビット割り当てるか
は、符号の圧縮率によって変化する。
【0061】(6)量子化(ステップST6) 各サブバンドデータは、スケールファクターによって正
規化されたのち、割り当てられた量子化ビット数によっ
て量子化される。処理時間は一定となる。
規化されたのち、割り当てられた量子化ビット数によっ
て量子化される。処理時間は一定となる。
【0062】(7)フォーマッティング(ステップST
7) 符号化されたデータを決められたデータ列にならべ、ビ
ットストリームを生成する。
7) 符号化されたデータを決められたデータ列にならべ、ビ
ットストリームを生成する。
【0063】(8)ビットストリームの出力(ステップ
ST8) エンコード結果を出力用FIFO73に対して書き込
む。
ST8) エンコード結果を出力用FIFO73に対して書き込
む。
【0064】次に、デコーダの処理を図13のフローチ
ャートおよび図14のブロック図を参照して以下に説明
する。
ャートおよび図14のブロック図を参照して以下に説明
する。
【0065】(9)ビットストリームの入力(ステップ
ST9) ビットストリームの入力は、DSP71の外部メモリ7
6に連続または断続的に転送されている。オーディオフ
レームの先頭は、ビットストリームのヘッダに含まれる
同期信号から検出される。
ST9) ビットストリームの入力は、DSP71の外部メモリ7
6に連続または断続的に転送されている。オーディオフ
レームの先頭は、ビットストリームのヘッダに含まれる
同期信号から検出される。
【0066】(10)ビットストリームの復号(ステッ
プST10) ビットストリームから各バンドのスケールファクタ、量
子化ビット数、データを得る。
プST10) ビットストリームから各バンドのスケールファクタ、量
子化ビット数、データを得る。
【0067】(11)逆量子化(ステップST11) 各バンドの量子化されているデータは、スケールファク
タと割り当てられた量子化ビット数によってサブバンド
データに変換される。
タと割り当てられた量子化ビット数によってサブバンド
データに変換される。
【0068】(12)合成フィルタの計算(ステップS
T12) 32個のサブバンドデータを合成フィルタで合成し、再
生音を復号する。
T12) 32個のサブバンドデータを合成フィルタで合成し、再
生音を復号する。
【0069】(13)オーディオデータの出力(ステッ
プST13) 復号したオーディオデータを、シリアルポートからサン
プリングクロックに同期してサンプル毎に出力する。
プST13) 復号したオーディオデータを、シリアルポートからサン
プリングクロックに同期してサンプル毎に出力する。
【0070】上述したMPEGオーディオで採用されて
いるサブバンド符号化方式は、受信側で階層的な操作が
できないため、階層構造を利用するシステムを構成でき
ない。この発明の一実施例では、入力オーディオデータ
を低中域データPCM Lと高域データPCM Hに分
割し、各周波数成分をMPEGエンコーダ24、25に
よりそれぞれ符号化している。それによって、階層符号
化を実現している。
いるサブバンド符号化方式は、受信側で階層的な操作が
できないため、階層構造を利用するシステムを構成でき
ない。この発明の一実施例では、入力オーディオデータ
を低中域データPCM Lと高域データPCM Hに分
割し、各周波数成分をMPEGエンコーダ24、25に
よりそれぞれ符号化している。それによって、階層符号
化を実現している。
【0071】上述した一実施例では、2つの階層構造を
処理するのに、通常の2倍の回路または処理能力と、入
力フィルタ、デコーダ側の出力段の加算器が必要とな
る。この点を改善したのが以下に説明する、この発明の
他の実施例である。
処理するのに、通常の2倍の回路または処理能力と、入
力フィルタ、デコーダ側の出力段の加算器が必要とな
る。この点を改善したのが以下に説明する、この発明の
他の実施例である。
【0072】図16は、この発明の他の実施例のエンコ
ーダ150およびデコーダ160の構成を示し、図17
は、エンコーダの処理を示すフローチャートであり、図
18Aおよび図18Bは、マスキングレベルの計算を説
明するための図である。図16の構成から分かるよう
に、この発明の他の実施例は、エンコーダ150におい
ては、フォーマット化処理155Lおよび155Hを必
要とし、デコーダ160においては、ビットストリーム
復号処理161Lおよび161Hを必要とする。しかし
ながら、これ以外には、既存のエンコーダおよびデコー
ダと比して、新たに追加する構成を殆ど必要としない。
ーダ150およびデコーダ160の構成を示し、図17
は、エンコーダの処理を示すフローチャートであり、図
18Aおよび図18Bは、マスキングレベルの計算を説
明するための図である。図16の構成から分かるよう
に、この発明の他の実施例は、エンコーダ150におい
ては、フォーマット化処理155Lおよび155Hを必
要とし、デコーダ160においては、ビットストリーム
復号処理161Lおよび161Hを必要とする。しかし
ながら、これ以外には、既存のエンコーダおよびデコー
ダと比して、新たに追加する構成を殆ど必要としない。
【0073】フォーマット化処理155Lからは、低中
域データのビットストリームBS Lが出力され、フォー
マット化処理155Hからは、高域データのビットスト
リームBS Hが出力される。図示しないが、上述した
一実施例と同様に、これらのビットストリームがそれぞ
れECCエンコーダへ供給される。ECCエンコーダで
は、低中域データのビットストリームに対するエラー訂
正能力が高域データのビットストリームに対するエラー
訂正能力より高いものとなるように、エラー訂正符号の
符号化処理がなされる。
域データのビットストリームBS Lが出力され、フォー
マット化処理155Hからは、高域データのビットスト
リームBS Hが出力される。図示しないが、上述した
一実施例と同様に、これらのビットストリームがそれぞ
れECCエンコーダへ供給される。ECCエンコーダで
は、低中域データのビットストリームに対するエラー訂
正能力が高域データのビットストリームに対するエラー
訂正能力より高いものとなるように、エラー訂正符号の
符号化処理がなされる。
【0074】他の実施例において、入力オーディオデー
タを低中域成分と高域成分の二つの階層データへ分割す
る例について説明する。図12に示される符号化処理中
のステップST2(分割フィルタの計算)と同様の処理
によって、32分割されたサブバンドデータを、周波数
の低い順から、SD(0),SD(1),・・・・・S
D(31)と表す。これらのサブバンドデータの中の例
えばSD(0)〜SD(C)を中低域の階層データSD
Lとし、SD(C+1)〜SD(31)を高域の階層
データSD Hとする。サンプリング周波数が48kHz
の場合には、1バンドの幅が750Hzになるので、低中
域と高域の境界の周波数fcが750×(C+1)Hzに
なる。この境界の位置は、分離するサブバンドを変える
ことで任意に変更できる。
タを低中域成分と高域成分の二つの階層データへ分割す
る例について説明する。図12に示される符号化処理中
のステップST2(分割フィルタの計算)と同様の処理
によって、32分割されたサブバンドデータを、周波数
の低い順から、SD(0),SD(1),・・・・・S
D(31)と表す。これらのサブバンドデータの中の例
えばSD(0)〜SD(C)を中低域の階層データSD
Lとし、SD(C+1)〜SD(31)を高域の階層
データSD Hとする。サンプリング周波数が48kHz
の場合には、1バンドの幅が750Hzになるので、低中
域と高域の境界の周波数fcが750×(C+1)Hzに
なる。この境界の位置は、分離するサブバンドを変える
ことで任意に変更できる。
【0075】このように分割された2つのサブバンドデ
ータのグループSD LおよびSD Hに対して、それぞ
れ独立に決められたビットレートになるように、ビット
割り当てをおこない、2つのビットストリームを生成す
る。
ータのグループSD LおよびSD Hに対して、それぞ
れ独立に決められたビットレートになるように、ビット
割り当てをおこない、2つのビットストリームを生成す
る。
【0076】図17のフローチャートに示すように、オ
ーディオデータの入力されると(ステップST21)、
分割フィルタの計算がなされ(ステップST2)、0〜
31バンドの信号成分が形成される。そして、0〜31
バンドのスケールファクタが計算される(ステップST
23)。
ーディオデータの入力されると(ステップST21)、
分割フィルタの計算がなされ(ステップST2)、0〜
31バンドの信号成分が形成される。そして、0〜31
バンドのスケールファクタが計算される(ステップST
23)。
【0077】一方、入力オーディオデータは、FFT処
理(ステップST24)を受ける。これは、心理聴覚モ
デルの計算(マスキングレベルの計算)のために必要と
される周波数成分の解析である。そして、各サブバンド
に対応する、マスキングレベルを計算する。このマスキ
ングレベルの計算は、低中域側スペクトラムのマスキン
グレベルの計算処理(ステップST25L)と、高域側
スペクトラムのマスキングレベルの計算処理(ステップ
ST25H)とからなる。
理(ステップST24)を受ける。これは、心理聴覚モ
デルの計算(マスキングレベルの計算)のために必要と
される周波数成分の解析である。そして、各サブバンド
に対応する、マスキングレベルを計算する。このマスキ
ングレベルの計算は、低中域側スペクトラムのマスキン
グレベルの計算処理(ステップST25L)と、高域側
スペクトラムのマスキングレベルの計算処理(ステップ
ST25H)とからなる。
【0078】受信側で、低中域の階層データのみを使用
して再生音を得た時には、高域の階層の成分によるマス
キング効果が得られないため、低中域と高域の境界の量
子化ノイズが知覚される可能性がある。また、高域の階
層データのみを使用して再生音を得ることはない。よっ
て、図18Aに示すように、低中域サブバンドデータS
D L側のマスキングレベルを計算する時には、高域サ
ブバンドデータSD Hの信号は、無信号であるとして処
理し、SD H側のマスキングレベルを計算する時に
は、SD Lの信号があるものとして計算する。
して再生音を得た時には、高域の階層の成分によるマス
キング効果が得られないため、低中域と高域の境界の量
子化ノイズが知覚される可能性がある。また、高域の階
層データのみを使用して再生音を得ることはない。よっ
て、図18Aに示すように、低中域サブバンドデータS
D L側のマスキングレベルを計算する時には、高域サ
ブバンドデータSD Hの信号は、無信号であるとして処
理し、SD H側のマスキングレベルを計算する時に
は、SD Lの信号があるものとして計算する。
【0079】階層数は2個に限らず、例えば図18Bに
示すように、周波数fclおよびfchにおいて、オー
ディオ信号を低域、中域、高域の3つの成分に分割する
ようにしても良い。さらに、各階層の符号化条件は、同
じである必要はない。この3個の階層の場合のマスキン
グレベルを計算する場合には、低域の階層データのマス
キングレベルは、中域および高域の階層データが無信号
であるとして計算される。中域の階層データのマスキン
グレベルは、高域の階層データが無信号であるとして計
算される。一般的には、複数の階層に分割したときのマ
スキングレベルの計算には、処理される階層よりも高い
周波数の階層の信号は無信号であるとして計算する。但
し、一部の帯域のサブバンドデータを使用しないでマス
キングレベルを計算する時には、使用しない帯域のサブ
バンドデータによるマスキング効果が使えない分だけ、
符号化効率は低下する。
示すように、周波数fclおよびfchにおいて、オー
ディオ信号を低域、中域、高域の3つの成分に分割する
ようにしても良い。さらに、各階層の符号化条件は、同
じである必要はない。この3個の階層の場合のマスキン
グレベルを計算する場合には、低域の階層データのマス
キングレベルは、中域および高域の階層データが無信号
であるとして計算される。中域の階層データのマスキン
グレベルは、高域の階層データが無信号であるとして計
算される。一般的には、複数の階層に分割したときのマ
スキングレベルの計算には、処理される階層よりも高い
周波数の階層の信号は無信号であるとして計算する。但
し、一部の帯域のサブバンドデータを使用しないでマス
キングレベルを計算する時には、使用しない帯域のサブ
バンドデータによるマスキング効果が使えない分だけ、
符号化効率は低下する。
【0080】マスキングレベルの計算の処理の後に、ビ
ット割当量の計算がなされる。図17中のステップST
26L、ST26Hに示すように、各階層のサブバンド
のマスキングレベルと信号の大きさから、各階層ごとに
それぞれ独立に決められたビットレートになるように、
各サブバンドの量子化ビット数を決定する。サイドイン
フォメーションに必要なビット数も各階層ごとに管理す
る。階層の数が増えると、サイドインフォメーションの
量が増えるため、全体としての符号化効率は低下するこ
とになる。
ット割当量の計算がなされる。図17中のステップST
26L、ST26Hに示すように、各階層のサブバンド
のマスキングレベルと信号の大きさから、各階層ごとに
それぞれ独立に決められたビットレートになるように、
各サブバンドの量子化ビット数を決定する。サイドイン
フォメーションに必要なビット数も各階層ごとに管理す
る。階層の数が増えると、サイドインフォメーションの
量が増えるため、全体としての符号化効率は低下するこ
とになる。
【0081】ステップST23で計算されたスケールフ
ァクタと、ステップST26LおよびST26Hにおい
て各階層毎に計算されたビット割当量を参照して、0〜
31のサブバンドデータが量子化される(ステップST
27)。
ァクタと、ステップST26LおよびST26Hにおい
て各階層毎に計算されたビット割当量を参照して、0〜
31のサブバンドデータが量子化される(ステップST
27)。
【0082】そして、ビットストリームのフォーマット
化の処理がなされる。この場合、低中域の階層では、C
+1〜31番目のバンドのビット割り当て量を0として
計算する(ステップST28L)。同様に、高域の階層
では、0〜Cバンドのビット割り当て量を0として計算
する(ステップST28H)。そして、ビットストリー
ムBS Lが出力され(ステップST29L)、ビット
ストリームBS Hが出力される(ステップST29
H)。
化の処理がなされる。この場合、低中域の階層では、C
+1〜31番目のバンドのビット割り当て量を0として
計算する(ステップST28L)。同様に、高域の階層
では、0〜Cバンドのビット割り当て量を0として計算
する(ステップST28H)。そして、ビットストリー
ムBS Lが出力され(ステップST29L)、ビット
ストリームBS Hが出力される(ステップST29
H)。
【0083】上述したこの発明の他の実施例による符号
化の方法では、入力側の周波数分離フィルタが不要で、
オーディオデータの入力、分割フィルタの計算、スケー
ルファクタの計算、量子化のプロセスは、既存のものと
同様である。データパッキング、ビットストリームの出
力の処理が階層の数だけ必要とされるが、全体に対する
処理量の増加はわずかである。心理聴覚モデルの計算、
ビット割り当ての計算においては、若干の変更が必要だ
が、処理量が従来とほぼ同じとなる。よって、2階層に
エンコードした場合には、従来のエンコーダの処理量の
数%の増加にとどめることが可能となる。
化の方法では、入力側の周波数分離フィルタが不要で、
オーディオデータの入力、分割フィルタの計算、スケー
ルファクタの計算、量子化のプロセスは、既存のものと
同様である。データパッキング、ビットストリームの出
力の処理が階層の数だけ必要とされるが、全体に対する
処理量の増加はわずかである。心理聴覚モデルの計算、
ビット割り当ての計算においては、若干の変更が必要だ
が、処理量が従来とほぼ同じとなる。よって、2階層に
エンコードした場合には、従来のエンコーダの処理量の
数%の増加にとどめることが可能となる。
【0084】デコーダ160では、図示しないエラー訂
正回路によるエラー訂正処理がなされ、エラー訂正後の
ビットストリームBS L、BS Hに対してビットス
トリーム復号処理161Lおよび161Hがなされる。
これらの処理によって、階層化された2つのビットスト
リームBS L、BS Hをそれぞれアンフォーマット
し、各サブバンドの量子化された値を得る。
正回路によるエラー訂正処理がなされ、エラー訂正後の
ビットストリームBS L、BS Hに対してビットス
トリーム復号処理161Lおよび161Hがなされる。
これらの処理によって、階層化された2つのビットスト
リームBS L、BS Hをそれぞれアンフォーマット
し、各サブバンドの量子化された値を得る。
【0085】このビットストリーム復号処理161Lお
よび161Hの前段、またはその内部において、ビット
ストリーム選択処理がなされる。すなわち、ディジタル
放送の場合では、受信状況が良好な場合では、二つのビ
ットストリームBS L、BS Hを選択し、受信状況
が悪い場合では、低中域側のビットストリームBS Lの
みを選択する。ビットストリームBS Hを選択しなか
った場合には、ビットストリームBS Hを復号したと
きに得られる高域のサブバンドデータを無信号として処
理する。
よび161Hの前段、またはその内部において、ビット
ストリーム選択処理がなされる。すなわち、ディジタル
放送の場合では、受信状況が良好な場合では、二つのビ
ットストリームBS L、BS Hを選択し、受信状況
が悪い場合では、低中域側のビットストリームBS Lの
みを選択する。ビットストリームBS Hを選択しなか
った場合には、ビットストリームBS Hを復号したと
きに得られる高域のサブバンドデータを無信号として処
理する。
【0086】図19は、復号処理を示すフローチャート
である。ビットストリーム復号処理(ST31Lおよび
ST31H)によって、ビットストリームがアンフォー
マット化され、低中域階層と高域階層のそれぞれのサブ
バンドデータSDATAとサイド情報(スケールファク
タSF、量子化ビット数ALLOC)とが分離される。
逆量子化処理62(図16)、ステップST32(図1
9)において、サイド情報を用いてサブバンドデータの
逆量子化がなされる。すなわち、低中域側の階層のビッ
トストリームBS Lに含まれるサイド情報(スケール
ファクタSF、割り当てビット数ALLOC)を用い
て、0〜Cのバンドのサブバンドデータがそれぞれ逆量
子化され、高域側の階層のビットストリームBS Hに
含まれるサイド情報(スケールファクタSF、割り当て
ビット数ALLOC)を用いて、C+1〜31のバンド
のサブバンドデータがそれぞれ逆量子化される。
である。ビットストリーム復号処理(ST31Lおよび
ST31H)によって、ビットストリームがアンフォー
マット化され、低中域階層と高域階層のそれぞれのサブ
バンドデータSDATAとサイド情報(スケールファク
タSF、量子化ビット数ALLOC)とが分離される。
逆量子化処理62(図16)、ステップST32(図1
9)において、サイド情報を用いてサブバンドデータの
逆量子化がなされる。すなわち、低中域側の階層のビッ
トストリームBS Lに含まれるサイド情報(スケール
ファクタSF、割り当てビット数ALLOC)を用い
て、0〜Cのバンドのサブバンドデータがそれぞれ逆量
子化され、高域側の階層のビットストリームBS Hに
含まれるサイド情報(スケールファクタSF、割り当て
ビット数ALLOC)を用いて、C+1〜31のバンド
のサブバンドデータがそれぞれ逆量子化される。
【0087】逆量子化により得られた低中域側のサブバ
ンドデータおよび高域側のサブバンドデータは、合成フ
ィルタバンク63(図16)、ステップST33(図1
9)において、合成フィルタで処理される。このように
して再生音のデータが復号される(ステップST3
4)。
ンドデータおよび高域側のサブバンドデータは、合成フ
ィルタバンク63(図16)、ステップST33(図1
9)において、合成フィルタで処理される。このように
して再生音のデータが復号される(ステップST3
4)。
【0088】上述したこの発明の他の実施例の復号処理
では、出力側の加算処理が不要で、オーディオデータの
出力、合成フィルタの計算、逆量子化のプロセスは、既
存のものと同じである。ビットストリームの復号処理が
階層の数だけ必要とされるが、全体に対する処理量の増
加はわずかである。よって、2階層のビットストリーム
の復号の場合には、従来のデコーダ処理量の数%の増加
にとどめることが可能となる。このように、この発明の
他の実施例は、階層構造を有するエンコード、デコード
処理を、従来の数%程度の処理量の増加で実行可能とな
る。従って、従来と同様にDSPを用いた構成により実
現可能となる。また、同一構成を用いて、モード選択に
より階層構造の有無に応じた処理が実行可能となる。
では、出力側の加算処理が不要で、オーディオデータの
出力、合成フィルタの計算、逆量子化のプロセスは、既
存のものと同じである。ビットストリームの復号処理が
階層の数だけ必要とされるが、全体に対する処理量の増
加はわずかである。よって、2階層のビットストリーム
の復号の場合には、従来のデコーダ処理量の数%の増加
にとどめることが可能となる。このように、この発明の
他の実施例は、階層構造を有するエンコード、デコード
処理を、従来の数%程度の処理量の増加で実行可能とな
る。従って、従来と同様にDSPを用いた構成により実
現可能となる。また、同一構成を用いて、モード選択に
より階層構造の有無に応じた処理が実行可能となる。
【0089】この発明の他の実施例のデコーダの処理に
おいて、階層の数、並びに周波数分割の境界位置(境界
のサブバンド番号)Cdは、デコーダ側で既知でない場
合には、Cdをサーチすることが必要である。階層数、
Cdを指示するIDデータを伝送しても良いが、その場
合には、サイド情報が増加し、符号化効率が低下する。
図20は、この境界のサブバンド番号Cdをサーチする
場合の処理の一例を示すフローチャートである。なお、
このサーチの処理は、ビットストリームBS Hの復号処
理161Hでなされる。
おいて、階層の数、並びに周波数分割の境界位置(境界
のサブバンド番号)Cdは、デコーダ側で既知でない場
合には、Cdをサーチすることが必要である。階層数、
Cdを指示するIDデータを伝送しても良いが、その場
合には、サイド情報が増加し、符号化効率が低下する。
図20は、この境界のサブバンド番号Cdをサーチする
場合の処理の一例を示すフローチャートである。なお、
このサーチの処理は、ビットストリームBS Hの復号処
理161Hでなされる。
【0090】図20中のステップST41において、初
期設定(i=0,Cd=31)がされる。次にi番目の
バンドのビット割当量が0かどうかが決定される(ステ
ップST42)。高域側のビットストリームの場合、低
域側のビット割当が0とされているので、これが0の場
合には、処理がステップST44に移り、iがインクリ
メントされる。若し、ビット割当が0でない場合では、
境界のサブバンドの番号Cdがiと決定される(ステッ
プST43)。
期設定(i=0,Cd=31)がされる。次にi番目の
バンドのビット割当量が0かどうかが決定される(ステ
ップST42)。高域側のビットストリームの場合、低
域側のビット割当が0とされているので、これが0の場
合には、処理がステップST44に移り、iがインクリ
メントされる。若し、ビット割当が0でない場合では、
境界のサブバンドの番号Cdがiと決定される(ステッ
プST43)。
【0091】iがインクリメントされてから(i=3
2)かどうかが決定される(ステップST45)。iが
32まで到達してない時は、ステップST42に処理が
戻り、上述した処理が繰り返される。i=32の場合で
は、処理が終了する。この図20に示す処理によって、
周波数の低い側から割当ビットが0とならなくなるサブ
バンド番号を検出し、検出されたサブバンド番号を境界
のサブバンド番号Cdとして認識することができる。
2)かどうかが決定される(ステップST45)。iが
32まで到達してない時は、ステップST42に処理が
戻り、上述した処理が繰り返される。i=32の場合で
は、処理が終了する。この図20に示す処理によって、
周波数の低い側から割当ビットが0とならなくなるサブ
バンド番号を検出し、検出されたサブバンド番号を境界
のサブバンド番号Cdとして認識することができる。
【0092】図21は、デコーダ側で境界のサブバンド
番号Cdをデコーダ側でサーチする他の方法を示すフロ
ーチャートである。他の方法は、低域のビットストリー
ムBS Lを使用して高域側から割当ビットが0となら
なくなる位置を検出する。サーチ処理の他の例は、ビッ
トストリームBS Lの復号処理161Lでなされる。
最初に、(i=31,Cd=31)と設定する(ステッ
プST51)。
番号Cdをデコーダ側でサーチする他の方法を示すフロ
ーチャートである。他の方法は、低域のビットストリー
ムBS Lを使用して高域側から割当ビットが0となら
なくなる位置を検出する。サーチ処理の他の例は、ビッ
トストリームBS Lの復号処理161Lでなされる。
最初に、(i=31,Cd=31)と設定する(ステッ
プST51)。
【0093】次に、i番目のサブバンドのビット割当量
が0かどうかが決定される(ステップST52)。ビッ
トストリームBS Lの場合では、高域側のビット割当
量が0である。従って、ビット割当量が0でない時に
は、Cd=iとされる(ステップST53)。若し、ビ
ット割当量が0であれば、iがデクレメント(i−1)
される(ステップST54)。そして、i=0かどうか
が決定される。iが0でなければ、処理がステップST
52に戻り、上述した処理が繰り返される。
が0かどうかが決定される(ステップST52)。ビッ
トストリームBS Lの場合では、高域側のビット割当
量が0である。従って、ビット割当量が0でない時に
は、Cd=iとされる(ステップST53)。若し、ビ
ット割当量が0であれば、iがデクレメント(i−1)
される(ステップST54)。そして、i=0かどうか
が決定される。iが0でなければ、処理がステップST
52に戻り、上述した処理が繰り返される。
【0094】図22は、境界のサブバンド番号を説明す
るものであり、横軸が0〜31のサブバンド番号であ
り、縦軸が割当ビット(ALLOC)である。符号化処
理では、図22Aに示すように、各サブバンドに対する
割当ビットが決定される。符号化処理における境界のサ
ブバンド番号は、Ceである。
るものであり、横軸が0〜31のサブバンド番号であ
り、縦軸が割当ビット(ALLOC)である。符号化処
理では、図22Aに示すように、各サブバンドに対する
割当ビットが決定される。符号化処理における境界のサ
ブバンド番号は、Ceである。
【0095】次に低中域のビットストリームBS Lを
復号した時に、図22Bに示すように、境界のサブバン
ド番号Cdが求められる。高域側のビットストリームB
S Hを復号した時に、図22Cに示すように、境界のサ
ブバンド番号Cdは、符号化時のCeとずれたものとな
る。この場合には、CdとCeの間の割り当てビット数
は0になっているため、復号処理には影響を及ぼさな
い。
復号した時に、図22Bに示すように、境界のサブバン
ド番号Cdが求められる。高域側のビットストリームB
S Hを復号した時に、図22Cに示すように、境界のサ
ブバンド番号Cdは、符号化時のCeとずれたものとな
る。この場合には、CdとCeの間の割り当てビット数
は0になっているため、復号処理には影響を及ぼさな
い。
【0096】なお、デコーダ側においては、階層構造の
ストリームを一実施例と同様に複数のデコーダを用いて
復号し、その結果を加算しても良い。
ストリームを一実施例と同様に複数のデコーダを用いて
復号し、その結果を加算しても良い。
【0097】以上の実施例は、この発明をディジタル放
送の送信側システムおよび受信側システムに対して適用
した例であるが、ネットワークを介して結合されたコン
ピュータ同士のデータ転送に対しても適用できる。図2
3は、このようなデータ転送に対してこの発明を適用し
たシステムの構成例である。
送の送信側システムおよび受信側システムに対して適用
した例であるが、ネットワークを介して結合されたコン
ピュータ同士のデータ転送に対しても適用できる。図2
3は、このようなデータ転送に対してこの発明を適用し
たシステムの構成例である。
【0098】図23において、80で示すコンピュータ
と90で示すコンピュータとがネットワークを介して結
合されている。コンピュータ80は、ディジタルオーデ
ィオ信号が入力され、上述したようなサブバンド符号化
に基づく符号化を行うMPEGエンコーダ81と、MP
EGエンコーダ81からのビットストリームBSが蓄え
られるデータストレージ82とを含む。このデータスト
レージ82からネットワークに対してビットストリーム
が送出される。このビットストリームは、上述したこの
発明の一実施例または他の実施例による処理と同様の処
理によって、階層構造を有している。
と90で示すコンピュータとがネットワークを介して結
合されている。コンピュータ80は、ディジタルオーデ
ィオ信号が入力され、上述したようなサブバンド符号化
に基づく符号化を行うMPEGエンコーダ81と、MP
EGエンコーダ81からのビットストリームBSが蓄え
られるデータストレージ82とを含む。このデータスト
レージ82からネットワークに対してビットストリーム
が送出される。このビットストリームは、上述したこの
発明の一実施例または他の実施例による処理と同様の処
理によって、階層構造を有している。
【0099】ネットワークを転送されたビットストリー
ムがコンピュータ90のデータストレージ91に格納さ
れる。そして、データストレージ91からのビットスト
リームBSがMPEGデコーダ92に供給され、復号が
なされる。MPEGデコーダ92から復号オーディオ信
号が得られる。
ムがコンピュータ90のデータストレージ91に格納さ
れる。そして、データストレージ91からのビットスト
リームBSがMPEGデコーダ92に供給され、復号が
なされる。MPEGデコーダ92から復号オーディオ信
号が得られる。
【0100】図23に示すシステムにおいて、コンピュ
ータ80は、データをネットワークを介して受信側のコ
ンピュータ90の応答が返ってくるまでの時間等に基づ
いて、ネットワークの混雑の程度を検出する。このネッ
トワークの混雑の程度に応じて、使用する階層を選択
し、選択すべき階層を受信側のコンピュータ90に対し
て指示する。例えば3階層の場合では、ネットワークが
混雑していない場合では、全階層のデータを使用するこ
とを受信側へ指示し、また、ネットワークが中程度の混
雑の場合では、低域および中域の階層のデータを使用す
ることを受信側へ指示し、さらに、ネットワークが混雑
しているときは、低域の階層のデータのみを使用するこ
とを受信側へ指示する。このように、ネットワークの混
雑状況に適応して使用する階層が選択される。
ータ80は、データをネットワークを介して受信側のコ
ンピュータ90の応答が返ってくるまでの時間等に基づ
いて、ネットワークの混雑の程度を検出する。このネッ
トワークの混雑の程度に応じて、使用する階層を選択
し、選択すべき階層を受信側のコンピュータ90に対し
て指示する。例えば3階層の場合では、ネットワークが
混雑していない場合では、全階層のデータを使用するこ
とを受信側へ指示し、また、ネットワークが中程度の混
雑の場合では、低域および中域の階層のデータを使用す
ることを受信側へ指示し、さらに、ネットワークが混雑
しているときは、低域の階層のデータのみを使用するこ
とを受信側へ指示する。このように、ネットワークの混
雑状況に適応して使用する階層が選択される。
【0101】図23に示すシステムにおいて、コンピュ
ータ80および90がそれぞれリアルタイム処理をする
のに必要な信号処理能力を有している。しかしながら、
ネットワークが混み合っているために、充分なデータを
伝送できないと、コンピュータ90では、データストレ
ージ91にデータが一定量以上蓄積されるまで、復号処
理ができない。その結果、再生音声が途切れ途切れにな
る。一方、この発明を適用した場合では、ネットワーク
が混み合っていることを検出し、混み合っている程度に
応じて、使用する階層が選択される。それによって、ネ
ットワークが混雑していても、再生音声の品質の劣化を
防止することができる。
ータ80および90がそれぞれリアルタイム処理をする
のに必要な信号処理能力を有している。しかしながら、
ネットワークが混み合っているために、充分なデータを
伝送できないと、コンピュータ90では、データストレ
ージ91にデータが一定量以上蓄積されるまで、復号処
理ができない。その結果、再生音声が途切れ途切れにな
る。一方、この発明を適用した場合では、ネットワーク
が混み合っていることを検出し、混み合っている程度に
応じて、使用する階層が選択される。それによって、ネ
ットワークが混雑していても、再生音声の品質の劣化を
防止することができる。
【0102】また、上述した図23のシステムでは、受
信側のコンピュータが十分なリアルタイム処理能力を有
しているものとしたが、若し、受信側のコンピュータの
処理能力が比較的高くない場合では、使用する階層を全
階層とせずに、この処理能力に応じて一部の階層のみを
使用するようにしても良い。
信側のコンピュータが十分なリアルタイム処理能力を有
しているものとしたが、若し、受信側のコンピュータの
処理能力が比較的高くない場合では、使用する階層を全
階層とせずに、この処理能力に応じて一部の階層のみを
使用するようにしても良い。
【0103】また、以上の説明では、MPEGオーディ
オレイヤー1での適用例について説明したが、同様な処
理は、他のオーディオ符号の伝送においても可能であ
る。例えばオーディオ信号を複数の周波数成分に分離
し、各周波数成分をDCT(Discrete Cosine Transfor
m)の符号化を行う符号化を使用しても良い。
オレイヤー1での適用例について説明したが、同様な処
理は、他のオーディオ符号の伝送においても可能であ
る。例えばオーディオ信号を複数の周波数成分に分離
し、各周波数成分をDCT(Discrete Cosine Transfor
m)の符号化を行う符号化を使用しても良い。
【0104】
【発明の効果】この発明は、MPEGオーディオのよう
なオーディオ圧縮符号を断層化できるため、受信側の受
信状況、ネットワークの混雑の程度、受信側の処理能力
などに応じて、復号する階層を適応的に選択すること
で、劣化の少ない再生音を得られる。
なオーディオ圧縮符号を断層化できるため、受信側の受
信状況、ネットワークの混雑の程度、受信側の処理能力
などに応じて、復号する階層を適応的に選択すること
で、劣化の少ない再生音を得られる。
【0105】また、この発明は、複数の階層を形成する
と共に、エラー訂正能力を階層によって異ならせること
によって、ディジタル放送の場合において、グレースフ
ルデグラレーションを実現することができる。
と共に、エラー訂正能力を階層によって異ならせること
によって、ディジタル放送の場合において、グレースフ
ルデグラレーションを実現することができる。
【0106】さらに、この発明の他の実施例では、サブ
バンド符号化の場合に、サブバンド成分によって、周波
数分離を行うことによって、ビットストリームのフォー
マット化の処理以外に、処理の増加を抑えることができ
る。
バンド符号化の場合に、サブバンド成分によって、周波
数分離を行うことによって、ビットストリームのフォー
マット化の処理以外に、処理の増加を抑えることができ
る。
【図1】従来のディジタル放送の特性とこの発明の特性
とをそれぞれ示す略線図である。
とをそれぞれ示す略線図である。
【図2】この発明の一実施例の送信側および受信側のそ
れぞれの構成を示すブロック図である。
れぞれの構成を示すブロック図である。
【図3】この発明の一実施例におけるエラー訂正符号の
構成を示す略線図である。
構成を示す略線図である。
【図4】エラー訂正符号のいくつかの例を示す略線図で
ある。
ある。
【図5】この発明の一実施例におけるソースエンコーダ
の構成を示すブロック図である。
の構成を示すブロック図である。
【図6】周波数分割用のフィルタの特性を示す略線図で
ある。
ある。
【図7】周波数分割用のフィルタの構成例を示すブロッ
ク図である。
ク図である。
【図8】サブバンド符号化のエンコーダおよびデコーダ
の一例を示すブロック図である。
の一例を示すブロック図である。
【図9】サブバンド符号化の信号処理に沿ったエンコー
ダおよびデコーダのブロック図である。
ダおよびデコーダのブロック図である。
【図10】サブバンド符号化の説明に用いる略線図であ
る。
る。
【図11】ビットストリームの一例を示す略線図であ
る。
る。
【図12】サブバンド符号化の符号化処理を説明するた
めののフローチャートである。
めののフローチャートである。
【図13】サブバンド符号化の復号処理を説明するため
のフローチャートである。
のフローチャートである。
【図14】サブバンド符号化のエンコーダおよびデコー
ダのハードウエア構成の一例を示すブロック図である。
ダのハードウエア構成の一例を示すブロック図である。
【図15】サブバンド符号化におけるマスキングレベル
の計算方法を説明するための略線図である。
の計算方法を説明するための略線図である。
【図16】この発明の他の実施例の信号処理に沿ったエ
ンコーダおよびデコーダのブロック図である。
ンコーダおよびデコーダのブロック図である。
【図17】この発明の他の実施例の符号化処理を示すフ
ローチャートである。
ローチャートである。
【図18】この発明の他の実施例におけるマスキングレ
ベルの計算方法を説明するための略線図である。
ベルの計算方法を説明するための略線図である。
【図19】この発明の他の実施例の復号処理を示すフロ
ーチャートである。
ーチャートである。
【図20】この発明の他の実施例における境界位置を決
定する方法の一例を示すフローチャートである。
定する方法の一例を示すフローチャートである。
【図21】この発明の他の実施例における境界位置を決
定する方法の他の例を示すフローチャートである。
定する方法の他の例を示すフローチャートである。
【図22】この発明の他の実施例における境界位置を決
定する方法の説明に用いる略線図である。
定する方法の説明に用いる略線図である。
【図23】この発明のさらに他の実施例のシステム構成
を示すブロック図である。
を示すブロック図である。
1・・・ディジタルオーディオ信号の入力端子、2・・
・ソースエンコーダ、3,4・・・エラー訂正エンコー
ダ、24,25・・・MPEGエンコーダ、26,27
・・・MPEGデコーダ、52・・・量子化処理、54
・・・ビットアロケーション処理、55,155L,1
55H・・・ビットストリームフォーマット化処理、6
1,161L,161H・・・ビットストリーム復号処
理
・ソースエンコーダ、3,4・・・エラー訂正エンコー
ダ、24,25・・・MPEGエンコーダ、26,27
・・・MPEGデコーダ、52・・・量子化処理、54
・・・ビットアロケーション処理、55,155L,1
55H・・・ビットストリームフォーマット化処理、6
1,161L,161H・・・ビットストリーム復号処
理
Claims (12)
- 【請求項1】 ディジタルオーディオ信号を伝送する時
に適用されるオーディオ信号符号化装置において、 ディジタルオーディオ信号を周波数に基づいて複数の階
層データに分離し、上記複数の階層データを符号化し
て、複数のビットストリームを生成する手段を有するこ
とを特徴とするオーディオ信号符号化装置。 - 【請求項2】 請求項1において、 さらに、複数のビットストリームに対してエラー訂正符
号化を行うエラー訂正符号化手段を有し、 上記複数の階層データの内の低域側の階層データに関し
て、上記エラー訂正符号化により生じる訂正能力を高域
側の階層データに比して高くすることを特徴とするオー
ディオ信号符号化装置。 - 【請求項3】 請求項1において、 入力ディジタルオーディオ信号を上記複数の階層データ
に分離する手段と、 上記複数の階層のデータをそれぞれ符号化し、複数のビ
ットストリームを生成する複数の符号化手段とを有する
ことを特徴とするオーディオ信号符号化装置。 - 【請求項4】 請求項1において、 入力ディジタルオーディオ信号を複数の周波数成分に分
割し、上記複数の周波数成分のそれぞれに対する割当ビ
ット数を決定し、決定された割当ビット数により上記複
数の周波数成分のデータを量子化し、量子化されたデー
タをビットストリームへフォーマット化する符号化手段
を備え、 上記複数の周波数成分を複数の階層に分割し、 上記複数の階層について、上記割当ビット数の決定の処
理および上記量子化の処理を行い、 上記量子化の処理により得られた複数のデータを複数の
ビットストリームへそれぞれフォーマット化するように
したことを特徴とするオーディオ信号符号化装置。 - 【請求項5】 請求項4において、 上記符号化手段は、割当ビット数を決定する場合に、心
理聴覚モデルを用いて、入力信号に応じたマスキングレ
ベルを利用するものであって、 計算対象となる階層の周波数帯域よりも高い周波数の階
層の周波数成分を無音としてマスキングレベルを決定す
ることを特徴とするオーディオ信号符号化装置。 - 【請求項6】 請求項1において、 ビットストリームを転送するためのネットワークの混雑
の程度を検出し、上記ネットワークの混雑の程度に応じ
て受信側が使用する階層データを指示する情報を送信す
ることを特徴とするオーディオ信号符号化装置。 - 【請求項7】 請求項1において、 ビットストリームを受信する側の処理能力に応じて受信
側が使用する階層データを指示する情報を送信すること
を特徴とするオーディオ信号符号化装置。 - 【請求項8】 ディジタルオーディオ信号を伝送する時
に適用されるオーディオ信号符号化方法において、 ディジタルオーディオ信号を周波数に基づいて複数の階
層データに分離し、上記複数の階層データを符号化し
て、複数のビットストリームを生成することを特徴とす
るオーディオ信号符号化方法。 - 【請求項9】 ディジタルオーディオ信号を周波数に基
づいて複数の階層データに分離し、上記複数の階層デー
タを符号化して、複数のビットストリームを生成し、上
記複数のビットストリームを受信し、復号するオーディ
オ信号復号装置において、 受信された複数のビットストリームを複数の階層データ
へ復号すると共に、複数の階層データの全体またはその
一部を適応的に選択する手段を有することを特徴とする
オーディオ信号復号装置。 - 【請求項10】 請求項8において、 さらに、複数のビットストリームに対してエラー訂正符
号の復号を行うエラー訂正手段を有し、エラー訂正され
たビットストリームを復号することを特徴とするオーデ
ィオ信号復号装置。 - 【請求項11】 請求項8において、 受信された複数のビットストリームをそれぞれ複数の階
層データへ復号化する手段と、 選択指示信号に基づいて、復号された複数の階層データ
を加算、または上記複数の階層データの一部を選択する
手段とからなることを特徴とするオーディオ信号復号装
置。 - 【請求項12】 ディジタルオーディオ信号を周波数に
基づいて複数の階層データに分離し、上記複数の階層デ
ータを符号化して、複数のビットストリームを生成し、
上記複数のビットストリームを受信し、復号するオーデ
ィオ信号復号方法において、 受信された複数のビットストリームを複数の階層データ
へ復号すると共に、複数の階層データの全体またはその
一部を適応的に選択することを特徴とするオーディオ信
号復号方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9005842A JPH10233692A (ja) | 1997-01-16 | 1997-01-16 | オーディオ信号符号化装置および符号化方法並びにオーディオ信号復号装置および復号方法 |
US09/005,963 US6301558B1 (en) | 1997-01-16 | 1998-01-12 | Audio signal coding with hierarchical unequal error protection of subbands |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9005842A JPH10233692A (ja) | 1997-01-16 | 1997-01-16 | オーディオ信号符号化装置および符号化方法並びにオーディオ信号復号装置および復号方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH10233692A true JPH10233692A (ja) | 1998-09-02 |
Family
ID=11622279
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9005842A Pending JPH10233692A (ja) | 1997-01-16 | 1997-01-16 | オーディオ信号符号化装置および符号化方法並びにオーディオ信号復号装置および復号方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6301558B1 (ja) |
JP (1) | JPH10233692A (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005157390A (ja) * | 2003-11-26 | 2005-06-16 | Samsung Electronics Co Ltd | 付加情報の挿入されたmpeg−4bsacオーディオビットストリームの符号化方法および復号化方法ならびに符号化装置および復号化装置 |
WO2005066937A1 (ja) * | 2004-01-08 | 2005-07-21 | Matsushita Electric Industrial Co., Ltd. | 信号復号化装置及び信号復号化方法 |
WO2005076622A1 (ja) * | 2004-02-06 | 2005-08-18 | Sony Corporation | 情報処理装置および情報処理方法、プログラム、並びにデータ構造 |
WO2006054583A1 (ja) * | 2004-11-18 | 2006-05-26 | Canon Kabushiki Kaisha | オーディオ信号符号化装置および方法 |
JP2007133323A (ja) * | 2005-11-14 | 2007-05-31 | Canon Inc | オーディオ信号符号化装置および方法 |
JPWO2006028009A1 (ja) * | 2004-09-06 | 2008-05-08 | 松下電器産業株式会社 | スケーラブル復号化装置および信号消失補償方法 |
JP2009527789A (ja) * | 2006-02-23 | 2009-07-30 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の処理方法及び装置 |
US8370138B2 (en) | 2006-03-17 | 2013-02-05 | Panasonic Corporation | Scalable encoding device and scalable encoding method including quality improvement of a decoded signal |
JP2019191594A (ja) * | 2012-12-13 | 2019-10-31 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 音声音響符号化装置、音声音響復号装置、音声音響符号化方法及び音声音響復号方法 |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1163891C (zh) * | 1998-02-17 | 2004-08-25 | 松下电器产业株式会社 | 图像和/或声音记录装置 |
DE69924922T2 (de) * | 1998-06-15 | 2006-12-21 | Matsushita Electric Industrial Co., Ltd., Kadoma | Audiokodierungsmethode und Audiokodierungsvorrichtung |
US6813281B1 (en) * | 1999-08-17 | 2004-11-02 | Samsung Electronics Co., Ltd. | Method of assigning audio channel identification, method for selecting audio channel using the same, and optical recording and reproducing apparatus suitable therefor |
US6725110B2 (en) * | 2000-05-26 | 2004-04-20 | Yamaha Corporation | Digital audio decoder |
US7159164B1 (en) * | 2000-06-05 | 2007-01-02 | Qualcomm Incorporated | Method and apparatus for recovery of particular bits of a frame |
CN1199360C (zh) * | 2000-07-17 | 2005-04-27 | 皇家菲利浦电子有限公司 | 数据流的编码 |
US7039716B1 (en) * | 2000-10-30 | 2006-05-02 | Cisco Systems, Inc. | Devices, software and methods for encoding abbreviated voice data for redundant transmission through VoIP network |
KR100357266B1 (ko) * | 2000-12-06 | 2002-10-19 | 엘지전자 주식회사 | 데이터 분할 기법을 이용한 영상 부호화 전송방법 |
US6996522B2 (en) * | 2001-03-13 | 2006-02-07 | Industrial Technology Research Institute | Celp-Based speech coding for fine grain scalability by altering sub-frame pitch-pulse |
WO2002102049A2 (en) * | 2001-06-11 | 2002-12-19 | Broadcom Corporation | System and method for multi-channel video and audio encoding on a single chip |
AU2002343212B2 (en) * | 2001-11-14 | 2006-03-09 | Panasonic Intellectual Property Corporation Of America | Encoding device, decoding device, and system thereof |
JP2004128988A (ja) * | 2002-10-03 | 2004-04-22 | Ntt Docomo Inc | 通信システム、受信装置、送信装置及び通信方法 |
JP3899005B2 (ja) | 2002-10-03 | 2007-03-28 | 株式会社エヌ・ティ・ティ・ドコモ | 変調装置、変調方法、復調装置及び復調方法 |
KR100513729B1 (ko) * | 2003-07-03 | 2005-09-08 | 삼성전자주식회사 | 계층적인 대역폭 구조를 갖는 음성 압축 및 복원 장치와그 방법 |
US7739577B2 (en) * | 2004-06-03 | 2010-06-15 | Inphase Technologies | Data protection system |
US7769584B2 (en) | 2004-11-05 | 2010-08-03 | Panasonic Corporation | Encoder, decoder, encoding method, and decoding method |
JP4639073B2 (ja) * | 2004-11-18 | 2011-02-23 | キヤノン株式会社 | オーディオ信号符号化装置および方法 |
US8521314B2 (en) * | 2006-11-01 | 2013-08-27 | Dolby Laboratories Licensing Corporation | Hierarchical control path with constraints for audio dynamics processing |
KR20130086552A (ko) * | 2012-01-25 | 2013-08-02 | 한국전자통신연구원 | 점진 열화 순방향 오류 정정 방법 및 이를 수행하는 장치 |
JP5447628B1 (ja) | 2012-09-28 | 2014-03-19 | パナソニック株式会社 | 無線通信装置及び通信端末 |
US9798622B2 (en) * | 2014-12-01 | 2017-10-24 | Intel Corporation | Apparatus and method for increasing resilience to raw bit error rate |
RU2714365C1 (ru) * | 2016-03-07 | 2020-02-14 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Способ гибридного маскирования: комбинированное маскирование потери пакетов в частотной и временной области в аудиокодеках |
US10461780B2 (en) | 2017-01-13 | 2019-10-29 | Cisco Technology, Inc. | Malleable error control code structures suitable for adaptive error protection |
DE112017007504B4 (de) * | 2017-07-05 | 2021-05-06 | Mitsubishi Electric Corporation | Audiodecodiervorrichtung für digitalen Rundfunk |
WO2020164751A1 (en) * | 2019-02-13 | 2020-08-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and decoding method for lc3 concealment including full frame loss concealment and partial frame loss concealment |
WO2020165260A1 (en) * | 2019-02-13 | 2020-08-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-mode channel coding with mode specific coloration sequences |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06259099A (ja) * | 1992-04-20 | 1994-09-16 | Mitsubishi Electric Corp | 半導体メモリオーディオ記録・再生装置 |
JPH07123132A (ja) * | 1993-08-31 | 1995-05-12 | Canon Inc | 通信方法及び装置 |
JPH07162375A (ja) * | 1993-12-03 | 1995-06-23 | Matsushita Electric Ind Co Ltd | ディジタル伝送装置 |
JPH07212761A (ja) * | 1994-01-17 | 1995-08-11 | Toshiba Corp | 階層符号化装置及び階層復号化装置 |
JPH07250330A (ja) * | 1994-03-11 | 1995-09-26 | Toshiba Corp | 階層符号化伝送方式及び送受信装置 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5226084A (en) * | 1990-12-05 | 1993-07-06 | Digital Voice Systems, Inc. | Methods for speech quantization and error correction |
US5495552A (en) * | 1992-04-20 | 1996-02-27 | Mitsubishi Denki Kabushiki Kaisha | Methods of efficiently recording an audio signal in semiconductor memory |
JP3343965B2 (ja) * | 1992-10-31 | 2002-11-11 | ソニー株式会社 | 音声符号化方法及び復号化方法 |
DE4240226C2 (de) * | 1992-11-30 | 1996-12-12 | Deutsche Forsch Luft Raumfahrt | Verfahren zum digitalen Übertragen von hierarchischen HDTV-, EDTV- und SDTV-Fernsehsignalen |
JP2591430B2 (ja) * | 1993-06-30 | 1997-03-19 | 日本電気株式会社 | ベクトル量子化装置 |
US5761438A (en) * | 1993-08-31 | 1998-06-02 | Canon Kabushiki Kaisha | Apparatus for measuring the amount of traffic of a network at a predetermined timing and compressing data in the packet without changing the size of the packet |
JP3277692B2 (ja) * | 1994-06-13 | 2002-04-22 | ソニー株式会社 | 情報符号化方法、情報復号化方法及び情報記録媒体 |
JP2930092B2 (ja) * | 1994-11-15 | 1999-08-03 | 日本電気株式会社 | 画像符号化装置 |
US5699481A (en) * | 1995-05-18 | 1997-12-16 | Rockwell International Corporation | Timing recovery scheme for packet speech in multiplexing environment of voice with data applications |
DE59610391D1 (de) * | 1995-06-12 | 2003-06-05 | Siemens Ag | Verfahren und Codiereinrichtung zur gesicherten Übertragung von Daten mittels Mehrkomponenten-Codierung |
DE19547707A1 (de) * | 1995-12-20 | 1997-07-03 | Thomson Brandt Gmbh | Verfahren, Encoder und Decoder zur Übertragung von hierarchisch in mehrere Teile gegliederten digitalen Signalen |
US5757821A (en) * | 1996-07-22 | 1998-05-26 | Telefonaktiebolaget Lm Ericsson | Method and apparatus for detecting communication signals having unequal error protection |
US5974376A (en) * | 1996-10-10 | 1999-10-26 | Ericsson, Inc. | Method for transmitting multiresolution audio signals in a radio frequency communication system as determined upon request by the code-rate selector |
-
1997
- 1997-01-16 JP JP9005842A patent/JPH10233692A/ja active Pending
-
1998
- 1998-01-12 US US09/005,963 patent/US6301558B1/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06259099A (ja) * | 1992-04-20 | 1994-09-16 | Mitsubishi Electric Corp | 半導体メモリオーディオ記録・再生装置 |
JPH07123132A (ja) * | 1993-08-31 | 1995-05-12 | Canon Inc | 通信方法及び装置 |
JPH07162375A (ja) * | 1993-12-03 | 1995-06-23 | Matsushita Electric Ind Co Ltd | ディジタル伝送装置 |
JPH07212761A (ja) * | 1994-01-17 | 1995-08-11 | Toshiba Corp | 階層符号化装置及び階層復号化装置 |
JPH07250330A (ja) * | 1994-03-11 | 1995-09-26 | Toshiba Corp | 階層符号化伝送方式及び送受信装置 |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7974840B2 (en) | 2003-11-26 | 2011-07-05 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding/decoding MPEG-4 BSAC audio bitstream having ancillary information |
JP2005157390A (ja) * | 2003-11-26 | 2005-06-16 | Samsung Electronics Co Ltd | 付加情報の挿入されたmpeg−4bsacオーディオビットストリームの符号化方法および復号化方法ならびに符号化装置および復号化装置 |
WO2005066937A1 (ja) * | 2004-01-08 | 2005-07-21 | Matsushita Electric Industrial Co., Ltd. | 信号復号化装置及び信号復号化方法 |
JP2005222014A (ja) * | 2004-01-08 | 2005-08-18 | Matsushita Electric Ind Co Ltd | 信号復号化装置及び信号復号化方法 |
US7411522B2 (en) | 2004-01-08 | 2008-08-12 | Matsushita Electric Industrial Co., Ltd. | Signal decoding apparatus and signal decoding method |
JP4733939B2 (ja) * | 2004-01-08 | 2011-07-27 | パナソニック株式会社 | 信号復号化装置及び信号復号化方法 |
US7636055B2 (en) | 2004-01-08 | 2009-12-22 | Panasonic Corporation | Signal decoding apparatus and signal decoding method |
WO2005076622A1 (ja) * | 2004-02-06 | 2005-08-18 | Sony Corporation | 情報処理装置および情報処理方法、プログラム、並びにデータ構造 |
US8483053B2 (en) | 2004-02-06 | 2013-07-09 | Sony Corporation | Information processing device, information processing method, program, and data structure |
JPWO2006028009A1 (ja) * | 2004-09-06 | 2008-05-08 | 松下電器産業株式会社 | スケーラブル復号化装置および信号消失補償方法 |
JP4989971B2 (ja) * | 2004-09-06 | 2012-08-01 | パナソニック株式会社 | スケーラブル復号化装置および信号消失補償方法 |
WO2006054583A1 (ja) * | 2004-11-18 | 2006-05-26 | Canon Kabushiki Kaisha | オーディオ信号符号化装置および方法 |
US7613605B2 (en) | 2004-11-18 | 2009-11-03 | Canon Kabushiki Kaisha | Audio signal encoding apparatus and method |
JP2007133323A (ja) * | 2005-11-14 | 2007-05-31 | Canon Inc | オーディオ信号符号化装置および方法 |
JP2009527789A (ja) * | 2006-02-23 | 2009-07-30 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の処理方法及び装置 |
US8370138B2 (en) | 2006-03-17 | 2013-02-05 | Panasonic Corporation | Scalable encoding device and scalable encoding method including quality improvement of a decoded signal |
JP5173795B2 (ja) * | 2006-03-17 | 2013-04-03 | パナソニック株式会社 | スケーラブル符号化装置およびスケーラブル符号化方法 |
JP2019191594A (ja) * | 2012-12-13 | 2019-10-31 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 音声音響符号化装置、音声音響復号装置、音声音響符号化方法及び音声音響復号方法 |
JP2022050609A (ja) * | 2012-12-13 | 2022-03-30 | フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 音声音響符号化装置、音声音響復号装置、音声音響符号化方法及び音声音響復号方法 |
Also Published As
Publication number | Publication date |
---|---|
US6301558B1 (en) | 2001-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH10233692A (ja) | オーディオ信号符号化装置および符号化方法並びにオーディオ信号復号装置および復号方法 | |
US6122618A (en) | Scalable audio coding/decoding method and apparatus | |
US8275625B2 (en) | Adaptive variable bit rate audio encoding | |
JP2693893B2 (ja) | ステレオ音声符号化方法 | |
Noll | MPEG digital audio coding | |
US5835030A (en) | Signal encoding method and apparatus using selected predetermined code tables | |
US6108625A (en) | Scalable audio coding/decoding method and apparatus without overlap of information between various layers | |
US9659566B2 (en) | Device and method for generating and decoding a side channel signal transmitted with a main channel signal | |
JP3428024B2 (ja) | 信号符号化方法及び装置,信号復号化方法及び装置,記録媒体,並びに信号伝送装置 | |
US5581654A (en) | Method and apparatus for information encoding and decoding | |
US5845251A (en) | Method, system and product for modifying the bandwidth of subband encoded audio data | |
JPH05313694A (ja) | データ圧縮伸張装置 | |
JP4454664B2 (ja) | オーディオ符号化装置及びオーディオ符号化方法 | |
WO1995002925A1 (fr) | Procede et dispositif de codage a haute efficacite, procede et dispositif de decodage a haute efficacite, systeme de codage/decodage et support d'enregistrement a haute efficacite | |
JP2006126826A (ja) | オーディオ信号符号化/復号化方法及びその装置 | |
KR100378796B1 (ko) | 디지탈 오디오 부호화기 및 복호화 방법 | |
WO2006011444A1 (ja) | 中継装置及び信号復号化装置 | |
JPH07336234A (ja) | 信号符号化方法及び装置並びに信号復号化方法及び装置 | |
RU2214047C2 (ru) | Способ и устройство для масштабируемого кодирования/декодирования аудиосигналов | |
Sinha et al. | Unequal error protection methods for perceptual audio coders | |
JPH11145842A (ja) | 音声帯域分割復号装置 | |
US6161088A (en) | Method and system for encoding a digital audio signal | |
JP4173209B2 (ja) | ディジタル化されたオーディオ信号の符号化方法及び装置 | |
JPH08123488A (ja) | 高能率符号化方法、高能率符号記録方法、高能率符号伝送方法、高能率符号化装置及び高能率符号復号化方法 | |
JP3594829B2 (ja) | Mpegオーディオの復号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040831 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20050105 |