JP3336618B2 - 高能率符号化方法及び高能率符号化信号の復号化方法 - Google Patents
高能率符号化方法及び高能率符号化信号の復号化方法Info
- Publication number
- JP3336618B2 JP3336618B2 JP50447495A JP50447495A JP3336618B2 JP 3336618 B2 JP3336618 B2 JP 3336618B2 JP 50447495 A JP50447495 A JP 50447495A JP 50447495 A JP50447495 A JP 50447495A JP 3336618 B2 JP3336618 B2 JP 3336618B2
- Authority
- JP
- Japan
- Prior art keywords
- bit
- amount
- channel
- sample data
- bits
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/665—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/667—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Description
に関し、特に複数チヤンネルのデジタル音声信号につい
て、人間の聴覚特性を利用して高能率符号化及び又は復
号化するものに関する。詳しくは、本発明は、放送、通
信、映画、ビデオテープレコーダ、又はデイスクプレー
ヤのステレオ音響システム、又は3チヤンネル以上のチ
ヤンネルからなるマルチプル・サラウンド音響システム
に関する。
なる、ビツト・レートの削減を行う高能率符号化方法
と、これに対応する高能率符号の復号化方法、及び高能
率符号の復号化再生方法に関する。
た信号を記録する高能率符号化信号記録方法及び記録が
なされた記録メデイアに関するものである。
た信号を伝送する高能率符号化信号伝送方法に関するも
のである。
率符号化方法及び高能率符号化装置には、多くの技術が
知られている。
を、時間軸に沿って、所定の単位時間でブロツク化し、
このブロツク毎の時間領域の信号を周波数領域の信号に
直交変換する。さらに、複数の周波数帯域にブロツク化
し、各周波数帯域毎に再量子化・符号化する、ブロツク
化周波数帯域分割方式がある。一般には、変換符号方法
(Transform Coding)と呼ばれる。
あり、例えば米国特許明細書第5,301,205号に開示され
ている。
単位時間毎にブロツク化しないで、20程度の複数の周波
数帯域に分割して符号化する非ブロツク化周波数帯域分
割方法がある。一般には帯域分割符号化(Sub Band Cod
ing:SBC)と呼ばれるものが知られている。例えば、米
国特許明細書第4,896,362号、米国特許明細書5,105,463
号に開示されている。
わせた高能率符号化の方法及び装置も考えられている。
この場合には、上記帯域分割符号化で帯域分割を行った
後、各帯域毎の信号を周波数領域の信号に直交変換し、
この直交変換された各帯域毎の信号に符号化を施す方法
である。
484に開示されている。
タとしては、例えばクオドラチヤ・ミラー・フイルタ
(Quarature Mirror Filter:QMF)等のフイルタがあ
る。これは1976 R.E.Crochire Digital coding of spee
ch in subbands Bell Syst.Tech.J.Vol.55,No.8 1976に
おいて、述べられている。
s−A new subband coding technique Joseph H.Rothwei
lerには、等バンド幅のフイルタ分割方法及び装置が述
べられている。
イオ信号を所定単位時間(フレーム)でブロツク化し、
ブロツク毎に高速フーリエ変換(Fast Fourier Transfo
rm:FFT)、離散コサイン変換(Discrete Cosine Transf
orm:DCT)、モデイフアイド離散コサイン変換(Modifie
d Discrete Cosine Transform:MDCT)などを行うことで
時間軸を周波数軸に変換する方法が知られている。
このMDCTについては、ICASSP 1987 Subband/Transform
Coding Using Filter Bank Designs Based on Time Dom
ain Aliasing Cancellation J.P.Princen A.B.Bradley
Univ.of Surrey Royal Melbourne Inst.of Tech.に述べ
られている。
としては、人間の聴覚特性を考慮して帯域分割幅を決め
ることが有効である。具体的には、クリテイカル・バン
ドと呼ばれている高域程、帯域幅が広くなるような帯域
幅が使用され、0〜20kHzのオーデイオ信号は複数(例
えば25バンド)の帯域に分割される。
て分割された周波数帯域をいい、ある純音の周波数近傍
の同じ強さの狭帯域バンドノイズによって、当該純音が
マスクあれるときのそのノイズの持つ帯域のことであ
る。
は、各帯域毎に所定の又は適応的なビツト配分(bit al
location)によって決定されたビツト量にて、符号化が
行われる。例えば、上記MDCTにより得られたMDCT係数デ
ータを符号化する際に、決定されたビツト量で符号化が
行われることになる。
ている。
l Processing,vol.ASSP−25,No.4,August 1977では、各
帯域毎の信号の大きさをもとに、適応的なビツト配分を
行う技術が述べられている。
al encoding of the perceptual requirements of the
auditory system M.A.Kransner MITでは、聴覚マスキン
グを利用することで、各帯域毎に必要な信号対雑音比を
得て、固定的なビツト配分を行う技術が述べられてい
る。
においては伝送路容量、又は伝送速度で決まるビツト・
レートにより、単位時間あたりのビツト量に制限があ
る。そこで、ビツト・レートを満たすために、前述した
ような、高能率符号化方法が使用される。
独立に各チヤンネル毎でのビツト配分を考慮したもので
ある(以下簡単のため、独立配分:Independent Allocat
ionという)。言い換えれば、各チヤンネルのビツト量
は、ある固定量である。よって複数チヤンネルの間にま
たがるようなビツト配分は考慮されていない。
平成5年特許願第15,492号及びこの出願に対応る米国特
許出願08/184,471号の明細書及び図面において、複数の
チヤンネルに使用できる共通のビツトを確保しておき、
ビツトが必要とされるチヤンネルに対して、適当な量の
ビツトを配分することを提案している。
立していないことから、チヤンネル間ビツト配分(以下
簡単のため、従属配分:Dependent Allocationという)
という。
で、音質向上には寄与するものであった。しかし、共通
のビツトを常に確保しておくことは、冗長なことでもあ
る。
要求するビツト量には、各チヤンネルの情報量により、
差が生じる。
ンネルが要求するビツト量が基準の120%であり、逆に
左チヤンネルが要求するビツト量が基準の50%であった
とする。このような場合、右チヤンネルに許容されるビ
ツト量は、基準の100%迄であり、不足する20%によ
り、音質劣化を生じる。
なビツト量があり、いわゆるオーバー・クオリテイとし
て、冗長な基準の50%のビツト量はその左チヤンネルの
ために使用される。もちろん、冗長なビツトは音質向上
に寄与するが、人間の聴覚には知覚されない程度の向上
に過ぎない。
った基準の50%のビツト量を、右チヤンネルで不足する
20%(以下簡単のため、補助配分:Subsidiary Allocati
onという)のために使用することが考えられる。
したまま、所定のビツト・レートを満足することができ
る。
り、複数チヤンネルの組により1つの情報を構成する場
合が多い。よって、複数チヤンネルの何れかのチヤンネ
ルで冗長なビツトが発生する場合があり、従属配分が有
効であると考えられる。
すなわち、従来のデコーダ(高能率復号化装置)では、
独立配分に基づくエンコード信号が記録された記録媒体
を復号するものである。
記録された記録媒体は、従来のデコーダ(復号化装置)
では復号できない。
された記録媒体を復号するための復号化装置が、既に市
場にある記録媒体、即ち、独立配分でのみエンコードさ
れた信号が記録された記録媒体をもデコードできなけれ
ば、使用者の著しい不利となる。
縮信号を得ることができる技術を提供することを目的と
する。
可能で、かつ、従来の独立配分が行われていても、復号
化の際に大きな音質劣化を生ずること無く再生できるよ
うにする、高能率符号化技術を提案することを目的とす
る。
復号化方法の提供を目的とする さらに、本発明技術による符号化装置、符号化信号の
復号化装置、及び符号化装置と復号化装置とからなるシ
ステムの提供を目的とする。
置により形成された符号化信号が記録された記録メデイ
アを提供することを目的とするものである。
置により形成された符号化信号を伝送する伝送方法、伝
送装置を提供することを目的とする。
高能率符号化方法は、複数チヤンネルの信号に対し、複
数チヤンネルの時間領域でのサンプル・データ若しくは
周波数領域でのサンプル・データへのチヤンネル間で、
適応的ビツト配分を行う高能率符号化方法である。即
ち、一定の基準値よりも大きいビツト量を要求するチヤ
ンネルへのビツト配分を、多くても一定の基準値を越え
ない第1のビツト配分量と、残りの第2のビツト配分量
とに分解する。
使用できたビツト量に相当する一定の基準値の範囲と
し、従来のシステムとの互換性を考慮したものである。
使用できたビツト量を上回る部分であり、そのチヤンネ
ルの音質を考慮したものである。
る。
て、全チヤンネルの総ビツト配分量は、略一定にする。
ためのスケール・フアクタ及びワードレングスから、前
記第2のビツト配分量に関するサンプル・データのため
のスケール・フアクタを求める。
量を考慮した量とされる。
るビツト配分量から上記第1のビツト配分量を引いた量
である。
中のサンプル・データに対し、前記小ブロツク内では同
一の量子化を行う。前記小ブロツク中のサンプル・デー
タを得るために、非ブロツク化周波数特性の分析を行っ
た後、前記非ブロツク化周波数特性の分析の出力を、更
にブロツク化周波数特性の分析を行う。
は、少なくとも最低域の2帯域で同じである。前記非ブ
ロツク化周波数特性の分析は、PQF(Polyphase Quadrat
ure filter)である。前記非ブロツク化周波数特性の分
析の周波数帯域幅は、高域は低域より広くする。なお、
前記非ブロツク化周波数特性の分析には、QMF(Quadrat
ure Mirror filter)をも使用できる。
記ブロツク化周波数特性の分析では、入力信号の時間特
性により適応的にブロツク・サイズを変更する。前記ブ
ロツク・サイズの変更は、少なくとも2つの前記非ブロ
ツク化周波数特性の分析の出力毎に独立に行う。
2のビツト配分部分との和は、各チヤンネルのスケール
・フアクタ又はサンプル・データの最大値により変化す
る。
ク値又は平均値等の振幅の時間的変化により、変化す
る。または、各チヤンネルのスケール・フアクタの時間
的変化により、変化する。
ンネルの余剰ビツトの合計ビツト量である。
に、複数チヤンネルの信号に対し、複数チヤンネルの時
間領域若しくは周波数領域でのサンプル・データへの適
応的従属配分が行われた符号化信号を、復号化するため
の高能率符号の復号化方法である。上記符号化時には、
一定の基準量よりも大きいビツト量が配分されるチヤン
ネルへのビツト配分量を、多くても前記一定の基準量を
越えない第1のビツト配分量と残りの第2のビツト配分
量に分解していることを特徴としいてる。
示すようにすることも可能である。
の合計の全チヤンネルについての総ビツト量は略一定で
ある。前記第2のビツト配分量に関するサンプル・デー
タのためのスケール・フアクタは、前記第1のビツト配
分量に関するサンプル・データのためのスケール・フア
クタおよびワードレングスから求める。
ビツト配分量であり、上記第2のビツト配分量は補助配
分ビツトを含むビツト配分量である。
中の同一の量子化を行ったサンプル・データを、復号化
する。前記小ブロツク中のサンプル・データを、ブロツ
ク化周波数合成した後、前記ブロツク化周波数合成の出
力を非ブロツク化周波数合成の入力とし、非ブロツク化
周波数合成の出力を得る。前記非ブロツク化周波数合成
の周波数帯域幅が少なくとも最低域の2帯域で同じであ
る。
ブロツク化周波数合成の周波数帯域幅は、高域は低域よ
り広く設定される。前記非ブロツク化周波数合成は、QM
Fとすることもできる。前記ブロツク化周波数合成は逆M
DCTである。前記ブロツク化周波数合成では、入力信号
の時間特性により適応的にそのブロツク・サイズを変更
する。前記ブロツク・サイズの変更は、少なくとも2つ
の前記非ブロツク化周波数合成の入力帯域毎に独立に行
う。
のビツト配分量との和が略各チヤンネルのスケール・フ
アクタ又はサンプル最大値により決定されている。ま
た、複数のチヤンネルを持ち、一定の基準量よりも大き
いビツト量が配分されたチヤンネルの検出を、チヤンネ
ルへの配分ビツト量が前記一定の基準量より小さい第2
の基準量よりも大きいか等しいことを検出することによ
り行う。
のシンク・ブロツク(連続信号を所定時間単位でブロツ
ク化したもの)の中に分離して記録され取り出された、
少なくとも2つのサンプル・ブロツク群よりなる。即
ち、複数チヤンネルのための一定の基準量よりも大きい
ビツト量を配分する第1のビツト配分のサンプル群と、
複数チヤンネルのための前記第1のビツト配分サンプル
群の残りの第2のビツト配分のサンプル群とよりなる。
準量よりも大きいビツト量を配分する第1のビツト配分
サンプル群と、当該第1のビツト配分サンプル群の残り
の第2のビツト配分サンプル群とから復号再生を行う。
シンク・ブロツクの中に、複数チヤンネルのための一定
の基準量よりも大きいビツト量を配分する第1のビツト
配分サンプル群と、複数チヤンネルのための前記第1の
ビツト配分サンプル群の残りの第2のビツト配分サンプ
ル群とを分離して記録することを特徴とする。
ビツト配分サンプル群と、上記第2のビツト配分サンプ
ル群とが、各チヤンネル毎に交互に記録される。
化方法により符号化した信号を記録してなるものであ
る。
であり、テープであり、さらには半導体メモリーを内蔵
したカードである。
ツトの含まれたビツト配分と、補助配分ビツトの含まれ
ないビツト配分を求めるようにしている。上記補助配分
ビツトの含まれないビツト配分は、各チヤンネル毎に独
立に求められ、概略チヤンネル毎に一定のビツト配分量
を持つ。
が、補助配分ビツトの含まれないビツト配分量よりも大
きいチヤンネルについては、補助配分された時間領域も
しくは周波数領域の情報サンプルを、補助配分ビツトの
含まれないビツト配分に基づく情報サンプル(A)と残
りの情報サンプル(B)とに分割する。
含まれたビツト配分に基づく情報サンプル(C)と補助
配分ビツトの含まれないビツト配分に基づく情報サンプ
ル(A)との差の大きさを持つ情報サンプルとして求め
る。
分ビツトを含まないビツト配分量と同じかそれよりも小
さいチヤンネルについては、補助配分ビツトされた時間
領域もしくは周波数領域のサンプル情報(C)を、その
チヤンネルのビツト配分として用いる。
符号化信号を復号化するデコーダを用いた場合に、当該
デコーダでは、補助配分ビツトの含まれたビツト配分量
が補助配分ビツトの含まれないビツト配分量よりも大き
いチヤンネルについては、補助配分ビツトの含まれない
ビツト配分に基づく情報サンプル(A)を再生する。
助配分ビツトの含まれないビツト配分量と同じかそれよ
りも小さいチヤンネルについては補助配分された情報サ
ンプル(C)を再生すればよいことになる。
れたビツト配分量が補助配分ビツトの含まれないビツト
配分量よりも大きいチヤンネルについては、補助配分ビ
ツトされたサンプル情報を、補助配分ビツトの含まれな
いビツト配分に基づく情報サンプル(A)と、残りの情
報サンプル(B)との両者を用いて、より高音質な再生
音を再生することができる。そのためには情報サンプル
(A)と情報サンプル(B)とをそれぞれデコードした
ものを加算すればよい。
情報サンプル(B)のビツト配分量の合計の全チヤンネ
ルについての総ビツト配分量を概略一定とする事によ
り、ビツト・レートが一定であることが望まれる記録メ
デイア上への記録を可能にする事ができる。
に関するサンプル・データの正規化の為のスケール・フ
アクタを、前記情報サンプル(A)のサンプル・データ
の為のスケール・フアクタおよびワードレングスから求
めることにより、前記情報サンプル(B)のビツト配分
に関するスケール・フアクタをエンコード側からデコー
ド側に送付することなく、デコード側で発生でき、した
がって、記録や伝送に必要な情報量を低減することがで
きる。
くサンプル情報(A)を得るために、四捨五入処理を含
む量子化を行うことは量子化雑音の低減のために有効で
ある。
たチヤンネルがどれかをデコーダ側が知るためには、チ
ヤンネルへのビツト配分量が前記一定の基準量より小さ
い第2の基準量よりも大きいことにより行う事はエンコ
ード側からデコード側に専用のデータを送付する必要が
なく有益である。
化された小ブロツク中のサンプルに対し、当該小ブロツ
ク内では同一の量子化を行うようにしている。前記小ブ
ロツク中のサンプルを得るためには、フイルタなどの非
ブロツク化周波数特性の分析を行った後、当該フイルタ
などの非ブロツク化周波数特性の分析の出力を直交変換
等のブロツク化周波数特性の分析を行う。
帯域幅が少なくとも最低域の2帯域で同じであることは
コストを低減するうえで役に立つ。また、前記非ブロツ
ク化周波数特性の分析の周波数帯域幅が高域が低域より
広いことは、臨界帯域に基づく聴覚の効果を利用するう
えで重要である。
特性により適応的にそのブロツク・サイズを変更するこ
とにより入力信号の時間特性に対応した最適な処理が可
能となる。前記ブロツク・サイズの変更を少なくとも2
つの前記非ブロツク化周波数特性の分析の出力帯域毎に
独立に行うことは、周波数成分の間の相互干渉を防いで
各帯域成分独立に最適な処理を行うえで効果的である。
チヤンネルのスケール・フアクタまたはサンプル最大値
により決めるのは、演算を低減させるうえで効果的であ
る。
タで代表される振幅情報の時間的変化により各チヤンネ
ルに与えられるビツト配分量を変化させることも、量子
化雑音を検知し難くするうえで有益である。更にシンク
の為の情報を含むひとつのシンクブロツクの中に、複数
チヤンネルの為の前記第1のビツト配分サンプル群と複
数チヤンネルの為の前記第2のビツト配分サンプル群と
を分離して記録する。
の基準量よりも大きいビツト量を配分するチヤンネルへ
のビツト配分量を、多くても一定の基準量を越えない第
1のビツト配分量と残りの第2のビツト配分量に分解
し、複数チヤンネルの時間領域でのサンプル若しくは周
波数領域でのサンプル・データへのチヤンネル間で可変
ビツト配分を行うようにすることにより、従属配分を利
用した高音質再生が可能となる。さらに、通常良く使わ
れる各チヤンネル個別に固定値以下のビツト・レートを
用いてチヤンネル毎で周波数領域及び時間領域での適応
ビツト配分技術が適用されるデコーダでも大きな音質劣
化無く再生できるようにすることができる。従って、互
換性を保ち、異なる記録メデイア間での情報の授受が可
能となる。
のビツト・レートを用いて、各チヤンネル毎で周波数領
域及び時間領域での適応ビツト配分技術を使用するデコ
ーダを用いることが可能となる。したがって高品質の音
質を必要とするオーデイオシステムや映画の音声記録再
生に好適なシステムを与えることができる。
・データの為のスケール・フアクタを、前記第1のビツ
ト配分量に関するサンプル・データの為のスケール・フ
アクタおよびワードレングスから求めることにより、前
記第2のビツト配分に関するサンプル・データの為のス
ケール・フアクタをエンコード側からデコード側に送付
することなくデコード側で作り、記録や伝送に必要な情
報量を低減することができる。
ツトの含まれないビツト配分である第1のビツト配分量
のビツト量が、前記一定の基準量より小さい第2の基準
量よりも大きいことにより、前記第2のビツト配分を行
ったチヤンネルをデコード側が知る事は、エンコード側
からデコード側に専用のデータを送付する必要がなくな
る。
プル情報を得るために四捨五入処理を含む量子化を行う
ことは、各チヤンネル別に固定値以下のビツト・レート
を用いてチヤンネル毎に周波数領域及び時間領域での適
応ビツト配分技術を使用するデコードにおいて、量子化
雑音の低減のために有効である。
ブロツク中のサンプルを得るために、フイルタなどの非
ブロツク化周波数特性の分析を行った後、このフイルタ
などの非ブロツク化周波数特性の分析の出力を直交変換
等でブロツク化周波数特性の分析する事により、時間領
域、周波数領域で聴覚マスキングを生かした量子化雑音
の求め方が可能となり、聴覚上好ましい周波数特性の分
析を得ることが可能となる。
帯域幅が少なとも最低域の2帯域で同じであること、コ
ストを低減するうえで役に立つ。
少なくとも最高域で高域程広くすることにより臨界帯域
に基づく聴覚の効果を効率的に利用することが可能とな
る。
性により適応的にそのブロツク・サイズが変更されるこ
とにより入力信号の時間特性に対応した最適な処理が可
能となる。
非ブロツク化周波数特性の分析の出力帯域ごとに独立に
行うことは、周波数成分の間の相互干渉を防いで各帯域
成分独立に最適な処理を行うえで効果的である。
フアクタによって計算することによりそのビツト配分計
算の簡易化が図られる。
すブロツク回路図である。
ける信号の周波数及び時間分割を示す図である。
ンネルでのビツト配分用パラメータを求める構成の一例
を示すブロツク回路図である。
らビツト配分を行う概念を示す図である。
慮したビツト配分の為のパラメータの求め方を示す図で
ある。
テイとの間の関係を示す図である。
率との間の関係を示す図である。
ある。
依存性を持たした聴覚的な効果を得るためのビツト配分
によるノイズスペクトルの例を示す図である。
2者を用いたビツト配分方法を実現する構成を示すブロ
ツク回路図である。
回路図である。
シヨールドの例を示す図である。
ド、最小可聴限を示す図である。
依存および聴覚許容雑音レベル依存のビツト配分を示す
図である。
依存および聴覚許容雑音レベル依存のビツト配分を示す
図である。
レベルを示す図である。
レベルを示す図である。
配分の関係を示す図である。
ク回路図である。
に示す図である。
例を示すブロツク回路図である。
のフローチヤートである。
符号化装置(エンコーダ)と、本発明の高能率符号の復
号化方法(高能率符号の復号化再生方法)が適用される
高能率符号の復号化装置(デコーダ)の実施例につい
て、図面を参照しながら説明する。
ル信号を、帯域分割符号化(SBC)、適応変換符号化(A
TC)及び適応ビツト配分にて(APC−AB)の各技術を用
いて高能率符号化する。この技術について、図1を参照
しながら説明する。
置を示す。
複数の周波数帯域に分割し、各周波数帯域毎に直交変換
を行って周波数領域のスペクトル・データとし、得られ
たスペクトル・データを、クリテイカル・バンド毎に適
応的にビツト配分して符号化する、高能率符号化装置で
ある。
た帯域を用いる。もちろんQMFによる非ブロツキングの
周波数分割幅は、等分割幅としてもよい。
力信号に応じて、適応的にブロツク・サイズ(ブロツク
長)を変化させると共に、クリテイカル・バンド単位、
もしくは高域ではクリテイカル・バンドを更に細分化し
た帯域でフローテイング処理を行っている。
に基づき正規化する処理をいう。
が供給されている。通常のオーデイオ帯域は、0〜20kH
zで充分とされるが、22kHzまで高域を拡張することで、
より高品位のオーデイオ信号を扱う。
イルタ11により、0〜11kHz帯域と11k〜22kHz帯域とに
分割される。更に0〜11kHz帯域の信号は、同じくQMFで
構成されるの帯域分割フイルタ12により、0〜5.5kHz帯
域と5.5.k〜11kHz帯域とに分割される。
は、直交変換回路であるMDCT回路13〜15に送られことに
より、それぞれMDCT係数に変換される。なお、各MDCT回
路13〜15では、各帯域毎に、ブロツク決定回路19〜21に
より決定されたブロツク・サイズに基づいてMDCTされ
る。
る各MDCT回路13〜15でのブロツク・サイズの具体例を図
2A及び図2Bに示す。なお、図2Aには直交変換ブロツク・
サイズが時間軸で長い場合(ロング・モードという)
を、図2Bには直交変換ブロツク・サイズが時間軸で短い
場合(シヨート・モードという)を示ししている。
力は、それぞれ2つの直交変換ブロツク・サイズを持
つ。
ec)の場合、低域側の0〜5.5kHz帯域の信号及び中域の
5.5k〜11kHz帯域の信号に対しては、1ブロツク内のサ
ンプル数を128サンプルとする。これに対して、図2Bに
示すように短いブロツク長(2.9msec)の場合には、1
ブロツク内のサンプル数を32としている。
いブロツク長の場合(図2A)は、1ブロツク内のサンプ
ル数を256サンプルとし、短いブロツク長(1.45msec)
の場合(図2B)には、1ブロツク内のサンプル数を32サ
ンプルとしている。
帯域の直交変換ブロツクのサンプル数を同じにして高域
程時間分解能を上げ、なおかつMDCTのためのウインドウ
の種類を減らしている。
ツク・サイズを示す信号は、各MDCT回路13〜15に供給さ
れてそのウインドウが切り換えられ、また後述の適応ビ
ツト配分符号化回路16〜18に送られると共に、出力端子
25〜27から出力され、記録・伝送のために使用される。
れて得られた周波数領域のスペクトル・データであるMD
CT係数データは、クリテイカル・バンドまたは高域では
更にクリテイカル・バンドを分割した帯域毎にまとめら
れて、適応ビツト配分符号化回路16〜18に送られてい
る。
・サイズの情報、及びクリテイカル・バンド毎または高
域では更にクリテイカル・バンドを分割した帯域毎に、
割り当てられたビツト量に応じて各MDCT係数データを正
規化及び再量子化する。
ヤンネルに指定されたビツト量を上限として、各ブロツ
ク毎にビツト量の配分を行う。
(MDCT係数)が適応ビツト配分回路30へ端子29を介して
供給され、一方、適応ビツト配分回路30からは、各チヤ
ンネルのブロツクで使用できるビツト量が、端子28を介
して適応ビツト配分符号化回路16〜18に供給される。
ータは、出力端子22〜24を介して取り出される。同時
に、当該適応ビツト配分符号化回路16〜18からは、正規
化に関するスケール・フアクタ信号と、どのワード長で
再量子化がされたかを示すワード長信号が得られ、これ
らの信号もサブ情報として、出力端子22〜24から出力さ
れる。
クリテイカル・バンドまたは高域では更にクリテイカル
・バンドを分割した帯域毎のエネルギを、当該帯域毎の
各振幅値の2乗平均の平方根を計算すること等により求
められる。
フアクタそのものを以後のビツト配分の為に用いるよう
にしてもよい。この場合にはエネルギ計算の演算が不要
となるため、ハード規模の節約となる。また、各バンド
毎のエネルギの代わりに、振幅値のピーク値、平均値を
用いることも可能である。
路30の具体的な構成及び動作を、図3を用いて説明す
る。なお、この図3の例では、映画を例として、オーデ
イオ信号のチヤンネル数を8(CH1〜CH8)としている。
ては、チヤンネルCH1を用いて説明する(他のチヤンネ
ルについては同一の指示符号を付して説明は省略してい
る)。
ルの入力端子31に供給される。なお、この端子31は、図
1の端子29と対応している。この入力信号はマツピング
回路(Mapping)32により入力信号の周波数分析(スペ
クトル分布)が得られる。
合には、サブバンド信号として時間領域サンプル・デー
タが得られることになり。また直交変換を使用する場合
及びフイルタリング後に直交変換を使用する場合には、
周波数領域サンプル・データが得られることになる。
ng)回路33によって複数サンプル・データ毎にまとめら
れる。前述のように、フイルタを使用した場合には時間
領域の複数サンプルがまとめられることになり、直交変
換及びフイルタリング後に直交変換を使用した場合に
は、周波数領域の複数サンプルがまとめられることにな
る。
グされるサンプルデータの時間変化(V)を、時間変化
算出回路34により算出する。入力信号の過渡的変化を、
ビツト配分に反映させることにより、より高品位な信号
が得られる。
とめられた各サンプルは、正規化回路37で正規化され
る。ここで、正規化のための係数であるスケール・フア
クタ(SF)は、スケール・フアクタ算出回路35によって
得られる。複数のサンプルに1の共通するスケール・フ
アクタを使用することで、デジタル信号を効率的に圧縮
する。
出される。トーナリテイ(T)とは、入力信号のスペク
トル分布の起伏を示し、起伏が大きい入力信号をトーナ
リテイが高い信号という。詳細は後述する。
ール・フアクタ(SF)及びトーナリテイ(T)等のパラ
メータは、ビツト配分回路38でビツト配分計算のために
使用される。
的ビツト配分である。さらに詳細には、各チヤンネルの
入力信号のスペクトル分布や過渡特性に応じた独立配分
と、各チヤンネル間の相関を利用した従属配分とがあ
る。更に各チヤンネルの重要度・使用目的・信号の帯域
幅等により配分に調整が加えられる。
ビツト量を、全チヤンネルで800kbpsとすると、本実施
例のビツト配分回路38では、従属配分ビツトを含む第1
のビツト配分(第1のビツト配分量)と、従属配分ビツ
トを含まない第2のビツト配分(第2のビツト配分量)
の2つを求める。
では端子28)を介して、適応ビツト配分符号化回路に供
給される。
て説明する。ここでは、スケール・フアクタ(SF)の周
波数領域の分布をみて適応的にビツト配分を行う。
の周波数領域の分布に応じて、従属配分を行うことで、
有効なビツト配分を行うことが可能である。
より再生される場合のように、同一音場のなかで混合さ
れて左右の耳に達する場合を考える。この場合、全チヤ
ンネル信号が加算されたものによりマスキング効果が作
用すると考えられる。
いて各チヤンネルが同一のノイズ・レベルになるように
ビツト配分を行うことが有効である。
てのノイズ・レベルが大きい場合は、そのチヤンネルで
ノイズとして知覚されてしまうからである。またあるチ
ヤンネルを他のチヤンネルに比べてのノイズ・レベルを
小さくしても、結局は、他のチヤンネルのノイズ・レベ
ルで全体のノイズ・レベルが決まるからである。
大きさに比例したビツト配分を行えばよい。すなわち、
以下の式によってビツト配分を行う。
チヤンネルへのビツト配分量、SFnはスケール・フアク
タ指標であり、概略ピーク値の対数に対応している。n
は各チヤンネル毎のブロツク・フローテイングバンド番
号、mはチヤンネル番号、Stは全チヤンネルのスケール
・フアクタ指標の和である。なお、図4A、図4Hでは、チ
ヤンネルCH1とチヤンネルCH8のみ示しチヤンネルCH2〜C
H7については図示を省略している。
信号の時間変化特性(V)を検出して、この指標によっ
て独立配分量を変えるプロセスを持つ。この時間変化を
表す指標を求める方法を、図5A〜図5Hにより説明する。
あるとすると、それぞれのチヤンネルの情報入力信号に
ついて、ビツト配分の時間単位であるビツト配分時間ブ
ロツクを時間的に4分割し、それぞれの小時間ブロツク
(サブブロツク)のピーク値を得る。
るところの差分の大きさに応じてチヤンネル間でビツト
を分け合う。ここで、このビツト配分のために8チヤン
ネル合計でCbit使えるとしたとき、各チヤンネルの各サ
ブブロツクのピーク値が小から大へと変わるところの差
分の大きさがそれぞれa(図5A)、b(図5B)、・・・
・h(図5H)デシベル(dB)とすると、それぞれ C*a/T、C*b/T、・・・・・、C*h/Tビツト(bit) (ここで、T=a+b+c+d+e+f+g+hであ
る) と配分することができる。
てのビツト配分量を大きくする。なお、図5A〜図5Hに
は、チヤンネルCH1、CH2、CH8に対応する図5A、図5B、
図5Hのみ示し、チヤンネルCH3〜CH7に対応する図5C〜図
5Gについては省略している。
法について説明する。第2のビツト配分方法として、更
に2つのビツト配分方法について説明する。
1)とビツト配分(2−2)とする。以下のビツト配分
では各チヤンネルに割り当てるビツト量は、各チヤンネ
ルで固定された値とする。
2つのチヤンネルには147kbpsという比較的大きいビツ
トを割り当て、サブウーハーチヤンネルには高々2kbp
s、それ以外のチヤンネルには100kbpsを割り当ててお
く。
定する。そのためには、信号情報(a)のスペクトル情
報のうち、トーナリテイ情報(T)及び信号情報(b)
の時間変化情報(V)を使用する。
と、信号スペクトルの隣接値間の差の絶対値の和を、信
号スペクトル数で割った値を、指標として用いている。
より簡単にはブロツク・フローテイングの為のブロツク
ごとのスケール・フアクタの、隣接スケール・フアクタ
指標の間の差の平均値を用いる。スケール・フアクタ指
標は、概略スケール・フアクタの対数値に対応してい
る。
ト量を、このトーナリテイを表す値に対応させて最大80
kbps、最小10kbpsに設定する。ここでは簡単のために、
全チヤンネルそれぞれの割当を等しく100kbpsとしてい
る。
ール・フアクタ指標で概略ピーク値の対数に対応してい
る。nはブロツク・フローテイングバンド番号である。
ビツト配分(2−1)のビツト配分量とは、図6に示す
ように対応付けられる。
1)とそれに付加するその他の少なくとも1つのビツト
配分との分割率は、信号の時間変化特性(V)に依存す
る。本実施例では、直交変換時間ブロツク・サイズを更
に分割した時間区間毎に、信号情報のピーク値を隣接ブ
ロツク毎に比較している。このことにより、時間軸及び
周波数軸の2次元で比較して、信号の振幅が急激に大き
くなる部分を検出し、その状態により分割率を決定して
いる。
ク値の小から大への変化をdB値で表しもののチヤンネル
に関する和、Vmは各チヤンネルの時間サブブロツクのピ
ーク値の小から大への変化をdB値で表しもので一番大き
いものの大きさ(但し最大値を30dBに制限しVmaxであわ
らす。mはチヤンネル番号、Chはチヤンネル数、Vavは
時間サブブロツクのピーク値の小から大への変化をdB値
で表しもののチヤンネル平均である。
分(2−1)の配分量とは、図7に示すように対応付け
られる。最終的にビツト配分(2−1)への配分量は次
の式で求められる。
量、BfはTvaより求められたビツト配分量、BtはVavより
求められたビツト配分量である。
に依存した周波数、時間領域上の配分がなされる。
ツト量が決定されたならば、次にビツト配分(2−1)
で使われなかったビツトについての配分、送ちビツト配
分(2−2)を決定する。ビツト配分(2−2)では、
以下に示す様々なビツト配分が行われる。
一部を使用して、全てのサンプル値に対する均一配分を
行う。
す。この場合、雑音レベルは全周波数帯域で均一に低減
する。即ち、第1のビツト配分でのノイズ・レベル(点
線NL1)が、均一配分により、点線NL2で示すノイズ・レ
ベルに均一に低減する。
い、滑らかな信号であるときに有効である。
トを使用して、信号情報の周波数スペクトル及びレベル
に対する依存性を持たせた、聴覚的な効果を得るための
ビツト配分を行う。
の一例を図9に示す。この例では信号のスペクトルに依
存させたビツト配分を行っていて、特に信号のスペクト
ルの低域側にウエイトをおいたビツト配分を行い、高域
側に比して起きる低域側でのマスキング効果の減少を補
償している。これは隣接臨界帯域間でのマスキングを考
慮して、スペクトルの低域側を重視したマスキングカー
ブの非対象性に基づいている。
が行われている。即ち、第1のビツト配分でのノイズ・
レベル(点線NL1)が、上記周波数スペクトル及びレベ
ルに対する依存性を持たせた聴覚的な効果を得るための
ビツト配分により、点線NL2で示すノイズ・レベルに低
減する。
クトルのピークをつなげたものを示す。
(2−2)に付加されるビツト配分との和が、図3のビ
ツト配分回路38で得られる。最終的なビツト配分は以上
の各ビツト配分の和として与えられる。
を次に説明する。
明する。
(MDCT係数)の和として与えられる。MDCT係数は、入力
端子801に供給される。当該入力端子801に供給されたMD
CT係数は、帯域毎のエネルギ算出回路803に与えられ
る。帯域毎のエネルギ算出回路803では、クリテイカル
・バンドまたは高域においては、クリテイカル・バンド
を更に再分割したそれぞれの帯域に関する信号エネルギ
を算出する。帯域毎のエネルギ算出回路803で算出され
たそれぞれの帯域に関するエネルギは、エネルギ依存ビ
ツト配分回路804に供給される。
ツト発生回路802からの使用可能総ビツト、本実施例で
は128kbpsのある割合、例えば100kbpsを用いて白色の量
子化雑音を作り出すようなビツト配分を行う。このと
き、入力信号のトーナリテイが高いほど、すなわち入力
信号のスペクトルの凸凹が大きいほど、このビツト量が
上記128kbpsに占める割合が増加する。
隣接するブロツクのブロツク・フローテイング係数の差
の絶対値の和を指標として使う。そして、求められた使
用可能なビツト量につき、各帯域のエネルギの対数値に
比例したビツト配分を行う。
5は、まず上記クリテイカル・バンド毎に分割されたス
ペクトル・データに基づき、いわゆるマスキング効果等
を考慮した各クリテイカル・バンド毎の許容ノイズ量を
求める。次に聴覚許容雑音スペクトルを与えるように使
用可能総ビツトからエネルギ依存ビツトを引いたビツト
分が配分される。このようにして求められたエネルギ依
存ビツトと聴覚許容雑音レベルに依存したビツトは加算
されて、ビツト配分信号として、出力端子807から出力
される。
16〜18において、各クリテイカル・バンド毎もしくは高
域においてはクリテイカル・バンドを更に複数帯域に分
割した帯域に割り当てられたビツト量に応じて、各スペ
クトル・データ(あるいはMDCT係数データ)を再量子化
するようにしている。このようにして符号化されたデー
タは、図1の出力端子22〜24を介して取り出される。
ト配分回路805中の聴覚許容雑音スペクトル算出回路に
ついて説明すると、MDCT回路13〜15で得られたMDCT係数
が上記許容雑音算出回路に与えられる。
体例の概略構成を示すブロツク図である。この図11にお
いて、入力端子521には、MDCT回路13〜15からの周波数
領域のスペクトル・データが供給されている。
出回路522に送られて、上記クリテイカル・バンド(臨
界帯域)毎のエネルギが、例えば当該バンド内での各振
幅値2乗の総和を計算すること等により求められる。こ
の各バンド毎のエネルギの代わりに、振幅値のピーク
値、平均値等が用いられることもある。このエネルギ算
出回路522からの出力として、例えば各バンドの総和値
のスペクトルは、一般にバークスペクトルと称されてい
る。図12はこのような各クリテイカル・バンド毎のバー
クスペクトルSBを示している。ただし、この図12では、
図示を簡略化するため、上記クリテイカル・バンドのバ
ンド数を12バンド(B1〜B12)で表現している。
グに於ける影響を考慮するために、該バークスペクトル
SBに所定の重み付け関数を掛けて加算するような畳込み
(コンボリユーシヨン)処理を施す。このため、上記帯
域毎のエネルギ算出回路522の出力すなわち該バークス
ペクトルSBの各値は、畳込みフイルタ回路523に送られ
る。該畳込みフイルタ回路523は、例えば、入力データ
を順次遅延させる複数の遅延素子と、これら遅延素子か
らの出力にフイルタ係数(重み付け関数)を乗算する複
数の乗算器(例えば各バンドに対応する25個の乗算器)
と、各乗算器出力の総和をとる総和加算器とから構成さ
れるものである。
り、ある信号によって他の信号がマスクされて聞こえな
くなる現象をいうものであり、このマスキング効果に
は、時間領域のオーデイオ信号による時間軸マスキング
効果と、周波数領域の信号による同時刻マスキング効果
とがある。これらのマスキング効果により、マスキング
される部分にノイズがあったとしても、このノイズは聞
こえないことになる。このため、実際のオーデイオ信号
では、このマスキングされる範囲内のノイズは許容可能
なノイズとされる。
算係数(フイルタ係数)の一具体例を示すと、任意のバ
ンドに対応する乗算器Mの係数を1とするとき、乗算器
M−1で係数0.15を、乗算器M−2で係数0.0019を、乗
算器M−3で係数0.0000086を、乗算器M+1で係数0.4
を、乗算器M+2で係数0.06を、乗算器M+3で係数0.
007を各遅延素子の出力に乗算することにより、上記バ
ークスペクトルSBの畳込み処理が行われる。ただし、M
は1〜25の任意の整数である。
に送られる。該引算器524は、上記畳込んだ領域での後
述する許容可能なノイズ・レベルに対応するレベルαを
求めるものである。なお、当該許容可能なノイズ・レベ
ル(許容ノイズ・レベル)に対応するレベルαは、後述
するように、逆コンボリユーシヨン処理を行うことによ
って、クリテイカル・バンドの各バンド毎の許容ノイズ
・レベルとなるようなレベルである。ここで、上記引算
器524には、上記レベルαを求めるるための許容関数
(マスキングレベルを表現する関数)が供給される。こ
の許容関数を増減させることで上記レベルαの制御を行
っている。当該許容関数は、次に説明するような(n−
ai)関数発生回路525から供給されているものである。
は、クリテイカル・バンドのバンドの低域から順に与え
られる番号をiとすると、次の式で求めることができ
る。
理されたバークスペクトルの強度であり、式中(n−a
i)が許容関数となる。例としてn=38、a=−0.5を用
いることができる。
タは、割算器526に伝送される。当該割算器526では、上
記畳込みされた領域での上記レベルαを逆コンボリユー
シヨンするためのものである。したがって、この逆コン
ボリユーシヨン処理を行うことにより、上記レベルαか
らマスキング・スレツシヨールドが得られるようにな
る。すなわち、このマスキング・スレツシヨールドが許
容ノイズスペクトルとなる。なお、上記逆コンボリユー
シヨン処理は、複雑な演算を必要とするが、本実施例で
は簡略化した割算器526を用いて逆コンボリユーシヨン
を行っている。
路527を介して減算器528に伝送される。ここで、当該減
算器528には、上記帯域毎のエネルギ検出回路522からの
出力、すなわち前述したバークスペクトルSBが、遅延回
路529を介して供給されている。
ツシヨールドとバークスペクトルSBとの減算演算が行わ
れることで、図13に示すように、上記バークスペクトル
SBは、該マスキング・スレツシヨールドMSのレベルで示
すレベル以下がマスキングされることになる。なお、遅
延回路529は上記合成回路527以前の各回路での遅延量を
考慮してエネルギ検出回路522からのバークスペクトルS
Bを遅延させるために設けられている。
介し、出力端子531を介して取り出され、例えば配分ビ
ツト量情報が予め記憶されたROM等(図示せず)に送ら
れる。このROM等は、上記減算回路528から許容雑音補正
回路530を介して得られた出力(上記各バンドのエネル
ギと上記ノイズ・レベル設定手段の出力との差分のレベ
ル)に応じ、各バンド毎の配分ビツト量情報を出力す
る。
ベルに依存したビツトは加算されてその配分ビツト量情
報が図1の端子28を介して上記適応ビツト配分符号化回
路16〜18に送られることで、ここでMDCT回路13〜15から
の周波数領域の各スペクトル・データがそれぞれのバン
ド毎に割り当てられたビツト量で量子化されるわけであ
る。
18では、上記クリテイカル・バンドの各バンド帯域(ク
リテイカル・バンド)毎もしくは高域においてはクリテ
イカル・バンドを更に複数帯域に分割した帯域のエネル
ギもしくはピーク値と上記ノイズ・レベル設定手段の出
力との差分のレベルに応じて配分されたビツト量で上記
各バンド毎のスペクトル・データを量子化することにな
る。
最小可聴カーブ発生回路532から供給される図13に示す
ような人間の聴覚特性であるいわゆる最小可聴カーブRC
を示すデータと、上記マスキング・スレツシヨールドMS
とを合成することができる。この最小可聴カーブにおい
て、雑音絶対レベルがこの最小可聴カーブ以下ならば該
雑音は聞こえないことになる。
ても、再生時の再生音量の違いで異なるものとなる。し
かし、実際に音楽を音源とするようなデイジタル・オー
デイオ・システムでは、例えば16ビツト量子化によるデ
ジタル記録では、最小可聴カーブに大差が無い。
域の量子化雑音が聞こえなければ、他の周波数帯域の最
小可聴カーブのレベル以下の量子化雑音は聞こえないと
考えてよい。
ミツクレンジの4kHz付近の雑音が聞こえない使い方をす
ると仮定し、この最小可聴カーブRCとマスキング・スレ
ツシヨールドMSとを共に合成することで許容ノイズ・レ
ベルを得るようにすると、この場合の許容ノイズ・レベ
ルは、図13中の斜線で示す部分までとすることができる
ようになる。なお、本実施例では、上記最小可聴カーブ
の4kHzのレベルを、例えば20ビツト相当の最低レベルに
合わせている。また、この図13は、信号スペクトルSSも
同時に示している。
回路533から送られてくる例えば等ラウドネス・カーブ
の情報に基づいて、上記減算器528からの出力における
許容雑音レベルを補正している。ここで、等ラウドネス
・カーブとは、人間の聴覚特性に関する特性曲線であ
り、例えば1kHzの純音と同じ大きさに聞こえる各周波数
での音の音圧を求めて曲線で結んだもので、ラウドネス
の等感度曲線とも呼ばれる。
カーブRCと略同じ曲線を描くものである。この等ラウド
ネス曲線においては、例えば4kHz付近では1kHzのところ
より音圧が8〜10dB下がっても1kHzと同じ大きさに聞こ
え、逆に、50Hz付近では1kHzでの音圧よりも約15dB高く
ないと同じ大きさに聞こえない。
(許容ノイズ・レベル)は、該等ラウドネス曲線に応じ
たカーブで与えられる周波数特性を持つようにするのが
良いことがわかる。このようなことから、上記等ラウド
ネス曲線を考慮して上記許容ノイズ・レベルを補正する
ことは、人間の聴覚特性に適合していることがわかる。
形状を使用可能総ビツト128kbpsの内の、ある割合のビ
ツト配分でつくる。この割合は入力信号のトーナリテイ
が高くなるほど減少する。
について説明する。
1からの信号は、スペクトルの滑らかさ算出回路808にも
与えられ、ここでスペクトルの滑らかさが算出される。
本実施例では、信号スペクトルの絶対値の隣接値間の差
の絶対値の和を、信号スペクトルの絶対値の和で割った
値を、上記スペクトルの滑らかさとして算出している。
ツト分割率決定回路809に与えられ、ここでエネルギ依
存のビツト配分と、聴覚許容雑音スペクトルによるビツ
ト配分間のビツト分割率とが決定される。ビツト分割率
はスペクトルの滑らかさ算出回路808の出力値が大きい
ほど、スペクトルの滑らかさが無いと考えて、エネルギ
依存のビツト配分よりも、聴覚許容雑音スペクトルによ
るビツト配分に重点をおいたビツト配分を行う。ビツト
分割率決定回路809は、それぞれエネルギ依存のビツト
配分及び聴覚許容雑音スペクトルによるビツト配分の大
きさをコントロールするマルチプライヤ811及び812に対
してコントロール出力を送る。ここで、仮にスペクトル
が滑らかであり、エネルギ依存のビツト配分に重きをお
くように、マルチプライヤ811へのビツト分割率決定回
路809の出力が0.8の値を取ったとき、マルチプライヤ81
2へのビツト分割率決定回路809の出力は 1−0.8=0.2 とする。これら2つのマルチプライヤの出力はアダー80
6で足し合わされて最終的なビツト配分情報となって、
出力端子807から出力される。
た、これに対応する量子化雑音の様子を図16、図17に示
す。
を示しており、図15は信号スペクトルが高いトーナリテ
イを示す場合を示している。また、図14及び図15の図
中、斜線で示すQSは信号レベル依存分のビツト量を示
す。
分のビツト量を示す。図16及び図17の図中において、SS
は信号レベルを示し、NSは信号レベル依存分のビツト割
当による雑音低下分を、NNは聴覚許容雑音レベル依存の
ビツト割当による雑音低下分を示している。
す図14において、聴覚許容雑音レベルに依存したビツト
配分は、全帯域に渡り大きい信号雑音比を取るために役
立つ。しかし低域及び高域では比較的少ないビツト配分
が使用されている。これは聴覚的にこの雑音に対する感
度が小さいためである。信号エネルギレベルに依存した
ビツト配分の分は量としては少ないが、白色雑音スペク
トルを生じるように、この場合には中低域の信号レベル
の高い周波数領域に重点的に配分されている。
高いトーナリテイを示す場合には、信号エネルギレベル
に依存したビツト配分量が多くなり、量子化雑音の低下
は極めて狭い帯域の雑音を低減するために使用される。
聴覚許容雑音レベルに依存したビツト配分の集中はこれ
よりもきつくない。
り、孤立スペクトル入力信号での特性の向上が達成され
る。
配分と、従属配分ビツトを含まないビツト配分との2つ
を用いて、次のようにして第1と第2の量子化を行う。
いて、各チヤンネルが要求する、言い換えれば各チヤン
ネルの音質を低下させずに必要とされるビツト数を示
す。
H8)、又は格子模様部及び斜線模様部の両者の和(CH1,
CH3,CH6)が各チヤンネルが要求するビツト量を示す。
この内、斜線模様部は補助配分ビツトに相当するビツト
量を示す。点模様部は余剰ビツト(R)を示し、ビツト
・レートで許容される各チヤンネルの上限ビツト量(14
7kbps)と各チヤンネルが実際に要求するビツト量(各
チヤンネル内での許容ビツト量を少ない値、例えば2kbp
sに規定している場合は、その上限)との差である。
ツト量が147kbpsを越えるチヤンネルは、チヤンネルCH
1、チヤンネルCH3、チヤンネルCH6である。
を含むビツト配分量が147kbpsを越えるチヤンネルにつ
いて、例えばチヤンネルCH1について、ある一定のビツ
ト量、例えば147kbpsを最大とする部分(I)と147kbps
を越える部分(S)とに2分して考える。
ツト量で量子化される部分と、補助配分のビツト量で量
子化される部分とに分割し、各々がそのビツト量にて量
子化されるものとする。
Bを含む10ビツト部とLSBを含む6ビツト部とに分解し、
10ビツト部を独立配分で、6ビツト部を補助配分にて量
子化するような処理を考える。
配分の各サンプルについて、複数サンプルごとのブロツ
クについての正規化処理、すなわちブロツク・フローテ
イングを行う。この時どの程度のブロツク・フローテイ
ングが行われたかを示す係数として、スケール・フアク
タが得られる。
ゲイン調整器905でゲイン調整される。
ビツト量(147kbps)により、各サンプル語長で量子化
器(quantizer)901が再量子化を行う。この時、量子化
雑音を少なくするためには、四捨五入による再量子化が
行われる。
の場合のサンプル語長を固定とすることも可能である。
この場合、前記ビツト量(147kbps)に接近したビツト
量とすることは難しい。
適応可変とすることである。このためには、例えば上記
量子化器901からのデータ量を積算し、147kbpsに接近す
るように、上記量子化器901をフイード・バツク制御す
る。
られ、それがゲイン調整器906でゲイン調整された後、
第2の量子化器903に与えられる。
と、前記補助配分ビツトを含まないビツト配分によるサ
ンプル語長との差のサンプル語長が得られる。即ち、前
記入力信号のLSB側の数ビツトが得られる。
用いられたフローテイング係数と語長から自動的に決定
される。すなわち第1の量子化器901で用いられた語長
がNビツトであったときには、(2**N)で第2の量
子化器903で用いられるフローテイング係数が得られ
る。
うに、ビツト配分による、四捨五入処理を含む再量子化
を行う。
147kbpsをこえるチヤンネルは、147kbps以下でなるべく
147kbpsに近いビツト配分によるデータと、残りのビツ
ト配分によるデータとに分けられる。
ビツト配分となったチヤンネルは、そのままそのビツト
配分を使用する。
子模様部(I)で示す独立配分に相当するビツトにも、
斜線模様部で示す補助配分ビツト(S)にも含まれるよ
うにする。
に関係無く、独立配分ビツトと従属配分ビツトとの和と
する。
様部(I)の70%を独立配分によるビツトとし、残りの
30%を従属配分によるビツトとする。また、補助ビツト
(斜線部分(S))については、同様に、70%を独立配
分によるビツトとし、残りの30%を従属配分によるビツ
トとする。この場合、補助ビツトの50%を独立配分によ
るビツトとし、残りの50%を従属配分によるビツトとす
ることもできる。
は、独立配分によるビツトが配分されるとし、斜線模様
部で示す補助配分ビツト(S)は従属配分によるビツト
が配分されるとする。即ち、各チヤンネルの全ビツトに
ついて、補助ビツトは全て従属配分ビツトによるものと
する。
1、チヤンネルCH3、及びチヤンネルCH6についてのみ、
チヤンネル間の相関を考慮したビツト配分、即ち従属配
分を使用してビツト配分を行い、補助配分ビツトとす
る。この方法でのメリツトは、ビツト配分のための計算
が容易になることである。
の大きさは、図19で示されるようにビツト配分(1)の
スケール・フアクタとワード・レングスからスケール・
フアクタを算出できるので、ワード・レングスのみがデ
コーダに必要とされる。
を図22に示す。
0)。次に基準量を超えるビツト量を要求しているチヤ
ンネルを特定する(S11)。続いて、各チヤンネルの余
剰ビツト(R)の合計(ΣR)を算出する(S12)。こ
こで、基準量を超えるビツト量を要求しているチヤンネ
ルについては、基準量を超えるビツト量(S)の合計を
(ΣS)求める(S13)。
(S)の合計とを比較し(S14)、もし基準量を超える
ビツト量(S)の合計が余剰ビツト(R)の合計より多
い場合は、基準量を超えるビツト量(S)の合計が余剰
ビツト(R)の合計以下となる迄、各チヤンネルの基準
量を超えるビツト量(S)を減らす(S15)。
ビツト量の一部で独立配分を行う(S16)。続いて、配
分ビツト量の残りで従属配分(S17)を行う。
に補助配分を行うか否かの判定を行い(S18)、基準量
を超えるビツト配分がなされたチヤンネルについては、
補助配分を行う(S19)。基準量を超えないビツト配分
がなされたチヤンネルについては、補助配分を行わない
(S20)。
い。しかし、実際には、データのためのビツトだけで無
く、そのデータを復元するためのサブ情報のためのビツ
トも考慮しなければならない。
ドを設ける。経験上、19kbps程度あればサブ情報のため
には充分と考えられ。よって、このビツト量と、データ
のためにビツト量とを考慮して、147kbpsが最下限とし
て設定する。
8kbpsを上回り147kbpsを下回る場合には、128kbpsを越
えるデータ部分により、サブ情報に使用できるビツトが
少なくなる。このような場合には、このチヤンネルは前
記補助配分ビツトを含まないビツト配分で128kbpsより
も小さく、できるだけ128kbps近いビツト配分を行う。
この処理により、若干の音質低下となるが、ビツト削減
量としては最大19kbps、即ちサブ情報分であり、互換性
を考慮すると、この方がメリツトがある。
bpsを越える場合について、図18Bにより説明する。
量、例えば128kbpsを最大とする部分(I a)と128kbps
を越える部分(I b,S)とに2分して考える。
子化される部分と、128kbpsを越える配分で量子化され
る部分とに分割し、各々が配分されたビツト量にて量子
化されるものとする。
と第2の量子化器903では、四捨五入処理を含むビツト
配分を行う。
で、かつ128kbpsに近いビツト配分により量子化され、
符号化される。
分のビツト配分により量子化され、符号化される。
用できるビツト量には、限りがあることに注意が必要で
ある。
ことに注意が必要である。例えば、前記図18Aの例にお
いて、補助配分に必要な全ビツト量は、CH1、CH3、及び
CH6の斜線部分(S)の合計、更に詳細には、各チヤン
ネルのサブ情報をも考慮しなければならない。
とすれは、図18Aでは、CH2、CH4、CH5、CH7及びCH8の各
チヤンネルの余剰ビツト(R)の合計が、補助配分に使
用できる最大ビツト量に相当する。本実施例のように、
ビツト・レートの上限が800kbpsならば、補助配分に使
用できるビツト量はかなり少なくなる。
じて、補助配分に使用するビツトに制限を与えなければ
ならない。前述した図22の例のように、配分ビツト量を
削減する(S15)。他に、一律に配分量を削減したり、
特定チヤンネルを優先して配分することも効果がある。
ケール・フアクタについては、独立配分に相当するビツ
ト配分によるデータのスケール・フアクタとワード・レ
ングスとから算出できるので、ワードレングスのみを伝
送すれば良い。
ヤンネルのデータは、所定の時間を単位とするシンク・
ブロツクに配列される。各チヤンネルのデータの並べ方
は、図20に模式的に示す。
る。即ち、シンクブロツク中に、先ず、 (1)前記補助配分を使用しないチヤンネル・データ、
即ち128kbps以下のビツト配分によるチヤンネル・デー
タ(CH2、CH4、CH5、CH7、CH8)、格子模様で示す、 (2)前記補助配分を使用するチヤンネル・データの
内、ある一定のビツト量、例えば128kbpsを最大とする
部分のチヤンネル・データ(CH1、CH3、CH6)、白抜き
で示す、 (3)前記補助配分を使用するチヤンネル・データのう
ち、128kbpsを越える補助配分による部分のチヤンネル
・データ(CH1、CH3、CH6)、斜線模様で示す。このよ
うに配列することにより、次のような処理が可能とな
る。
(1)部、(2)部のチヤンネル・データのみを使用す
る。よって、全チヤンネルについて、補助配分を使用し
ないデータと同様に扱うことができる。補助配分による
データを使用しないため、補助配分によるチヤンネル・
データ(CH1、CH3、CH6)は、例えばMSB部のみのデコー
ドとなる。よって、量子化ステツプが粗く再量子化され
たこととなり、音質は劣化する。しかし、聴覚上は問題
とならない程度の劣化とされる。
使用される。よって、補助配分によるチヤンネル・デー
タ(CH1、CH3、CH6)は、MSB部とLSB部とが合成された
完全なワードをなす。よって、極めて高品質な音声信号
をデコードできる。
は、3を例示している。実際には、音質的に重要な前方
の2チヤンネルにのみ補助配分ビツトを使用すると決め
れば、シンク・ブロツクの処理が簡単になる。逆に、補
助配分ビツトを使用するチヤンネルを決めない、即ち入
力信号に応じて適応的に補助配分ビツトを使用するチヤ
ンネルが切り替わる場合は、各データにチヤンネルIDを
付与することで、簡単に対応できる。このIDのために
は、チヤンネルあたり3ビツトのデータの増加に過ぎな
い。
では、ゲイン調整器906に対応してゲイン調整器907が、
ゲイン調整器905に対応してゲイン調整器908が設けら
れ、これらゲイン調整器907,908の出力が加算器904で加
算される。その加算出力が出力端子910から取りだされ
れる。
るデータとの加算出力であり、完全なデータとされる。
び復号化するための基本的な本発明実施例の復号化装置
を示している。
は、復号化装置入力端子122〜124に与えられ、使用され
たブロツク・サイズ情報は、入力端子125〜127に与えら
れる。復号化回路116〜118では適応ビツト配分情報を用
いてビツト割当を解除する。
時間領域の信号に変換される。これらの部分帯域の時間
領域信号は、I−QMF回路112、111により、全帯域信号
に復号化される。
れたチヤンネルと、前記147kbps以上のビツト配分
(2)が行われたチヤンネルにおける128kbpsを最大と
する部分と、補助配分ビツトによる部分とのそれぞれが
上記復号化回路116〜118で復号化される。
れた後、LSB部・MSB部として1ワードとされ、1つの精
度の高いサンプルとなる。
な本発明実施例の高能率符号化装置により符号化された
信号が記録されるものである。前述した映画フイルの
他、光デイスク、光磁気デイスク、磁気デイスク等のデ
イスク上の記録媒体に上記符号化信号が記録されたもの
や、磁気テープ等に上記符号化信号が記録されたもの、
或いは、符号化信号が記憶された半導体メモリ、I−C
カードなどを挙げることができる。
の高能率符号化信号記録方法は、一つのシンクブロツク
の中に、複数チヤンネルのための一定の基準量よりも大
きいビツト量を配分する第1のビツト配分量に関するサ
ンプル群と、複数チヤンネルのための前記第1のビツト
配分量に関するサンプル群残りの第2のビツト配分サン
プル群とを分離して記録している。さらに、この記録
は、各チヤンネル毎に交互に行われる。
装置、又は方法を実施例として詳細に説明した。
明はデジタル音声信号に止まらず、デジタル画像信号に
も適用できることは勿論である。
るようなものにおいて、要求されるビツト配分が大きい
複雑な図柄の画像チヤンネルについては、所定値を上回
る部分については、補助配分として同様に扱うことが可
能である。
率符号化方法と、これに対応する高能率符号の復号化方
法、及び高能率符号の復号化再生方法、その高能率符号
化方法により符号化された信号を記録する高能率符号化
信号記録方法及び記録がなされた記録メデイアにおいて
は、マルチチヤンネルシステムの圧縮に対して従属配分
技術を用いて音質を上げた圧縮信号を、従属配分を利用
して高音質で再生することが可能である。
のビツト・レートを用いてチヤンネル毎でのビツト配分
を行うデコーダでも、大きな音質劣化無く再生できるよ
うになる。さらに、このことにより、例えば映画フイル
ム上の音声信号は同時に他の光デイスク・メデイアへの
転用が容易となる。また、フイルム上の信号の再生装置
は、安価な通常良く使われる各チヤンネル個別に固定値
以下のビツト・レートを用いてチヤンネル毎でのビツト
配分を行うデコーダでも作成することが可能となる。
Claims (9)
- 【請求項1】複数のチャンネルの各デジタル信号のサン
プル・データを所定のビット量により再量子化して、符
号化する高能率符号化方法であって、 予め決められた一定の基準量よりも大なるビット量を配
分するチャンネルを特定するステップと、 上記チャンネルへ配分するビット量を、多くとも前記一
定の基準量を越えない第1のビット量と、残りの第2の
ビット量とに配分するステップと、 上記第1のビット量によるビットを使用して、上記サン
プル・データの一部を再量子化するステップと、 上記第2のビット量によるビットを使用して、少なくと
も上記サンプル・データの他部を再量子化するステップ
と、 上記再量子化されたサンプル・データの一部と上記再量
子化されたサンプル・データの他部とを合成するステッ
プとを備え、 前記第2のビット量は、前記一定の基準量でビット量を
配分すると仮定したときの前記基準量を越えないチャン
ネルにおける余剰ビットの合計ビット量以下である ことを特徴とする高能率符号化方法。 - 【請求項2】上記各チャンネルの上記サンプル・データ
を再量子化するステップは、更に、 複数のサンプル・データを共通のスケール・ファクタに
より正規化するステップと、 上記共通のスケール・ファクタにより正規化された各サ
ンプル・データのワード長を規定するステップと を有することを特徴とする請求の範囲1記載の高能率符
号化方法。 - 【請求項3】前記第1のビット量によるデータと前記第
2のビット量によるデータとは、シンク・ブロックにお
いて、異なる領域に位置することを特徴とする、請求の
範囲1記載の高能率符号化方法。 - 【請求項4】前記予め決められた一定の基準量は、前記
サンプル・データ以外のサブ情報のためのビット量をも
考慮した基準量であることを特徴とする請求の範囲1記
載の高能率符号化方法。 - 【請求項5】上記第1のビット量は、各チャンネル毎に
独立して配分するビット配分によるものであり、 上記第2のビット量は、チャンネル間で関係して配分す
るビット配分によるものであることを特徴とする請求の
範囲1記載の高能率符号化方法。 - 【請求項6】各チャンネルの信号のエネルギ値又はピー
ク値又は平均値の振幅情報又はスケール・ファクタの時
間的変化により、上記チャンネル間で関係して配分する
ビット量を変化させることを特徴とする請求の範囲5記
載の高能率符号化方法。 - 【請求項7】複数のチャンネルの各デジタル信号のサン
プル・データを所定のビット量により再量子化して、符
号化する符号化方法による高能率符号化信号の復号化方
法であって、 上記符号化方法は、 予め決められた一定の基準量よりも大なるビット量を配
分するチャンネルを特定するステップと、 上記チャンネルへ配分するビット量を、多くとも前記一
定の基準量を越えない第1のビット量と、残りの第2の
ビット量とに配分するステップと、 上記第1のビット量によるビットを使用して、上記サン
プル・データの一部を再量子化するステップと、 上記第2のビット量によるビットを使用して、少なくと
も上記サンプル・データの他部を再量子化するステップ
と、 上記再量子化されたサンプル・データの一部と上記再量
子化されたサンプル・データの他部とを合成するステッ
プとを備えるとともに、 前記第2のビット量は、前記一定の基準量でビット量を
配分すると仮定したときの前記基準量を越えないチャン
ネルにおける余剰ビットの合計ビット量以下であり、 上記合成されたサンプル・データは記録又は伝送され、
記録又は伝送されたサンプル・データのうち、少なくと
も上記第1のビット量によるサンプル・データをそのチ
ャンネルのサンプル・データとして、上記複数チャンネ
ルの少なくとも1のデジタル信号を得る ことを特徴とする高能率符号化信号の復号化方法。 - 【請求項8】複数のチャンネルの各デジタル信号のサン
プル・データを所定のビット量により再量子化して、符
号化する符号化方法による高能率符号化信号の復号化方
法であつて、 上記符号化方法は、 予め決められた一定の基準量よりも大なるビット量を配
分するチャンネルを特定するステップと、 上記チャンネルへ配分するビット量を、多くとも前記一
定の基準量を越えない第1のビット量と、残りの第2の
ビット量とに配分するステップと、 上記第1のビット量によるビットを使用して、上記サン
プル・データの一部を再量子化するステップと、 上記第2のビット量によるビットを使用して、少なくと
も上記サンプル・データの他部を再量子化するステップ
と、 上記再量子化されたサンプル・データの一部と上記再量
子化されたサンプル・データの他部とを合成するステッ
プとを備えるとともに、 前記第2のビット量は、前記一定の基準量でビット量を
配分すると仮定したときの前記基準量を越えないチャン
ネルにおける余剰ビットの合計ビット量以下であり、 上記合成されたサンプル・データは記録又は伝送され、
記録又は伝送されたサンプル・データのうち、上記第1
のビット量によるサンプル・データのみをそのチャンネ
ルのサンプル・データとして、上記複数チャンネルの少
なくとも1のデジタル信号を得ることを特徴とする、高
能率符号化信号の復号化方法。 - 【請求項9】前記第2のビット配分量に関するサンプル
・データのためのスケール・ファクタを、前記第1のビ
ット配分量に関するサンプル・データのためのスケール
・ファクタおよびワード長から求めることを特徴とする
請求の範囲7記載の高能率符号化信号の復号化方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP17676093 | 1993-07-16 | ||
JP5-176760 | 1993-07-16 | ||
PCT/JP1994/001166 WO1995002925A1 (fr) | 1993-07-16 | 1994-07-15 | Procede et dispositif de codage a haute efficacite, procede et dispositif de decodage a haute efficacite, systeme de codage/decodage et support d'enregistrement a haute efficacite |
Publications (1)
Publication Number | Publication Date |
---|---|
JP3336618B2 true JP3336618B2 (ja) | 2002-10-21 |
Family
ID=16019335
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP50447495A Expired - Fee Related JP3336618B2 (ja) | 1993-07-16 | 1994-07-15 | 高能率符号化方法及び高能率符号化信号の復号化方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US6104321A (ja) |
EP (1) | EP0669724A4 (ja) |
JP (1) | JP3336618B2 (ja) |
KR (1) | KR100339324B1 (ja) |
CN (1) | CN1065382C (ja) |
AU (1) | AU686199B2 (ja) |
TW (1) | TW272341B (ja) |
WO (1) | WO1995002925A1 (ja) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
SE519552C2 (sv) * | 1998-09-30 | 2003-03-11 | Ericsson Telefon Ab L M | Flerkanalig signalkodning och -avkodning |
US6366888B1 (en) * | 1999-03-29 | 2002-04-02 | Lucent Technologies Inc. | Technique for multi-rate coding of a signal containing information |
JP2001134295A (ja) * | 1999-08-23 | 2001-05-18 | Sony Corp | 符号化装置および符号化方法、記録装置および記録方法、送信装置および送信方法、復号化装置および符号化方法、再生装置および再生方法、並びに記録媒体 |
US7016835B2 (en) * | 1999-10-29 | 2006-03-21 | International Business Machines Corporation | Speech and signal digitization by using recognition metrics to select from multiple techniques |
AU2001289164A1 (en) * | 2000-08-25 | 2002-03-04 | Applied Micro Circuit Corporation | Transmitting a multibit signal on a single connector |
US7003467B1 (en) * | 2000-10-06 | 2006-02-21 | Digital Theater Systems, Inc. | Method of decoding two-channel matrix encoded audio to reconstruct multichannel audio |
US6476735B2 (en) * | 2000-12-02 | 2002-11-05 | Daniel David Lang | Method of encoding bits using a plurality of frequencies |
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
JP4676140B2 (ja) | 2002-09-04 | 2011-04-27 | マイクロソフト コーポレーション | オーディオの量子化および逆量子化 |
US7299190B2 (en) | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
US7199954B2 (en) * | 2003-07-15 | 2007-04-03 | Hitachi Global Storage Technologies Netherlands, B.V. | Method, apparatus and program storage device for determining sector block sizes using existing controller signals |
KR20050028193A (ko) * | 2003-09-17 | 2005-03-22 | 삼성전자주식회사 | 오디오 신호에 적응적으로 부가 정보를 삽입하기 위한방법, 오디오 신호에 삽입된 부가 정보의 재생 방법, 및그 장치와 이를 구현하기 위한 프로그램이 기록된 기록 매체 |
US7460990B2 (en) | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
JP3909709B2 (ja) * | 2004-03-09 | 2007-04-25 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 雑音除去装置、方法、及びプログラム |
US7539612B2 (en) | 2005-07-15 | 2009-05-26 | Microsoft Corporation | Coding and decoding scale factor information |
US8190425B2 (en) | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
US7831434B2 (en) | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
US7953604B2 (en) * | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
US7966175B2 (en) | 2006-10-18 | 2011-06-21 | Polycom, Inc. | Fast lattice vector quantization |
JP5254983B2 (ja) | 2007-02-14 | 2013-08-07 | エルジー エレクトロニクス インコーポレイティド | オブジェクトベースオーディオ信号の符号化及び復号化方法並びにその装置 |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
CN101197774B (zh) * | 2007-12-12 | 2012-01-04 | 上海华为技术有限公司 | 一种对业务流量进行控制的方法与装置 |
WO2009096898A1 (en) * | 2008-01-31 | 2009-08-06 | Agency For Science, Technology And Research | Method and device of bitrate distribution/truncation for scalable audio coding |
US20120095729A1 (en) * | 2010-10-14 | 2012-04-19 | Electronics And Telecommunications Research Institute | Known information compression apparatus and method for separating sound source |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
Family Cites Families (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4184049A (en) * | 1978-08-25 | 1980-01-15 | Bell Telephone Laboratories, Incorporated | Transform speech signal coding with pitch controlled adaptive quantizing |
NL8101199A (nl) * | 1981-03-12 | 1982-10-01 | Philips Nv | Systeem voor het kwantiseren van signalen. |
US4455649A (en) * | 1982-01-15 | 1984-06-19 | International Business Machines Corporation | Method and apparatus for efficient statistical multiplexing of voice and data signals |
US4535472A (en) * | 1982-11-05 | 1985-08-13 | At&T Bell Laboratories | Adaptive bit allocator |
JPS59223032A (ja) * | 1983-06-01 | 1984-12-14 | Sony Corp | ディジタル信号伝送装置 |
US4748579A (en) * | 1985-08-14 | 1988-05-31 | Gte Laboratories Incorporated | Method and circuit for performing discrete transforms |
JPH0734291B2 (ja) * | 1986-07-28 | 1995-04-12 | 株式会社日立製作所 | デイジタル信号記録再生システム |
JPH061916B2 (ja) * | 1986-10-28 | 1994-01-05 | 日本電気株式会社 | 帯域分割符号化復号化装置 |
DE3688980T2 (de) * | 1986-10-30 | 1994-04-21 | Ibm | Verfahren zur Multigeschwindigkeitskodierung von Signalen und Einrichtung zur Durchführung dieses Verfahrens. |
DE3639753A1 (de) * | 1986-11-21 | 1988-06-01 | Inst Rundfunktechnik Gmbh | Verfahren zum uebertragen digitalisierter tonsignale |
NL8700985A (nl) * | 1987-04-27 | 1988-11-16 | Philips Nv | Systeem voor sub-band codering van een digitaal audiosignaal. |
FR2625060B1 (fr) * | 1987-12-16 | 1990-10-05 | Guichard Jacques | Procede et dispositifs de codage et de decodage pour la transmission d'images a travers un reseau a debit variable |
US5034965A (en) * | 1988-11-11 | 1991-07-23 | Matsushita Electric Industrial Co., Ltd. | Efficient coding method and its decoding method |
US5109417A (en) * | 1989-01-27 | 1992-04-28 | Dolby Laboratories Licensing Corporation | Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio |
US5142656A (en) * | 1989-01-27 | 1992-08-25 | Dolby Laboratories Licensing Corporation | Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio |
US5222189A (en) * | 1989-01-27 | 1993-06-22 | Dolby Laboratories Licensing Corporation | Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio |
US4932062A (en) * | 1989-05-15 | 1990-06-05 | Dialogic Corporation | Method and apparatus for frequency analysis of telephone signals |
DE69031517T2 (de) * | 1989-06-30 | 1998-02-26 | Nippon Electric Co | Variable Blocklängenkodierung für unterschiedliche Charakteristiken der Eingangsabtastwerte |
JP2844695B2 (ja) * | 1989-07-19 | 1999-01-06 | ソニー株式会社 | 信号符号化装置 |
US5115240A (en) * | 1989-09-26 | 1992-05-19 | Sony Corporation | Method and apparatus for encoding voice signals divided into a plurality of frequency bands |
JPH03117919A (ja) * | 1989-09-30 | 1991-05-20 | Sony Corp | ディジタル信号符号化装置 |
US5185800A (en) * | 1989-10-13 | 1993-02-09 | Centre National D'etudes Des Telecommunications | Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion |
JPH03132228A (ja) * | 1989-10-18 | 1991-06-05 | Victor Co Of Japan Ltd | 直交変換信号符号化復号化方式 |
US5040217A (en) * | 1989-10-18 | 1991-08-13 | At&T Bell Laboratories | Perceptual coding of audio signals |
US5502789A (en) * | 1990-03-07 | 1996-03-26 | Sony Corporation | Apparatus for encoding digital data with reduction of perceptible noise |
JP2861238B2 (ja) * | 1990-04-20 | 1999-02-24 | ソニー株式会社 | ディジタル信号符号化方法 |
US5049992A (en) * | 1990-08-27 | 1991-09-17 | Zenith Electronics Corporation | HDTV system with receivers operable at different levels of resolution |
US5134475A (en) * | 1990-12-11 | 1992-07-28 | At&T Bell Laboratories | Adaptive leak hdtv encoder |
CA2052604A1 (en) * | 1991-03-04 | 1992-09-05 | Andrew F. Lum | Carrier-free metalworking lubricant and method of making and using same |
JP2853717B2 (ja) * | 1991-03-08 | 1999-02-03 | 日本電気株式会社 | 可変ビット型adpcmトランスコーダ |
EP0506394A2 (en) * | 1991-03-29 | 1992-09-30 | Sony Corporation | Coding apparatus for digital signals |
JP3134337B2 (ja) * | 1991-03-30 | 2001-02-13 | ソニー株式会社 | ディジタル信号符号化方法 |
CA2075156A1 (en) * | 1991-08-02 | 1993-02-03 | Kenzo Akagiri | Digital encoder with dynamic quantization bit allocation |
JP3134455B2 (ja) * | 1992-01-29 | 2001-02-13 | ソニー株式会社 | 高能率符号化装置及び方法 |
JPH0629934A (ja) * | 1992-07-10 | 1994-02-04 | Nippon Hoso Kyokai <Nhk> | 適応差分符号化伝送方法 |
JP3343962B2 (ja) * | 1992-11-11 | 2002-11-11 | ソニー株式会社 | 高能率符号化方法及び装置 |
JP3186292B2 (ja) * | 1993-02-02 | 2001-07-11 | ソニー株式会社 | 高能率符号化方法及び装置 |
JP3123290B2 (ja) * | 1993-03-09 | 2001-01-09 | ソニー株式会社 | 圧縮データ記録装置及び方法、圧縮データ再生方法、記録媒体 |
JP3173218B2 (ja) * | 1993-05-10 | 2001-06-04 | ソニー株式会社 | 圧縮データ記録方法及び装置、圧縮データ再生方法、並びに記録媒体 |
-
1994
- 1994-07-12 TW TW083106320A patent/TW272341B/zh not_active IP Right Cessation
- 1994-07-15 JP JP50447495A patent/JP3336618B2/ja not_active Expired - Fee Related
- 1994-07-15 WO PCT/JP1994/001166 patent/WO1995002925A1/ja not_active Application Discontinuation
- 1994-07-15 KR KR1019950701063A patent/KR100339324B1/ko not_active IP Right Cessation
- 1994-07-15 US US08/403,698 patent/US6104321A/en not_active Expired - Lifetime
- 1994-07-15 EP EP94921102A patent/EP0669724A4/en not_active Withdrawn
- 1994-07-15 CN CN94190600A patent/CN1065382C/zh not_active Expired - Lifetime
- 1994-07-15 AU AU71952/94A patent/AU686199B2/en not_active Ceased
Also Published As
Publication number | Publication date |
---|---|
EP0669724A1 (en) | 1995-08-30 |
CN1065382C (zh) | 2001-05-02 |
CN1113401A (zh) | 1995-12-13 |
KR100339324B1 (ko) | 2002-10-04 |
US6104321A (en) | 2000-08-15 |
WO1995002925A1 (fr) | 1995-01-26 |
TW272341B (ja) | 1996-03-11 |
EP0669724A4 (en) | 1998-09-16 |
AU7195294A (en) | 1995-02-13 |
AU686199B2 (en) | 1998-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3336618B2 (ja) | 高能率符号化方法及び高能率符号化信号の復号化方法 | |
EP0692881B1 (en) | Quantization apparatus, quantization method, high efficiency encoder, high efficiency encoding method, decoder, high efficiency encoder and recording media | |
EP0575110B1 (en) | Compressing and expanding digital signals | |
JP3278900B2 (ja) | データ符号化装置及び方法 | |
KR100550504B1 (ko) | 디지탈 신호 처리 방법, 디지탈 신호 처리 장치, 디지탈신호 기록 방법, 디지탈 신호 기록 장치, 기록 매체,디지탈 신호 전송 방법, 및 디지탈 신호 전송 장치 | |
US5737718A (en) | Method, apparatus and recording medium for a coder with a spectral-shape-adaptive subband configuration | |
JPH07160292A (ja) | 多層符号化装置 | |
KR100556505B1 (ko) | 재생 및 기록 장치, 디코딩 장치, 기록 장치, 재생 및 기록 방법, 디코딩 방법, 및 기록 방법 | |
US20010047256A1 (en) | Multi-format recording medium | |
JPH0846517A (ja) | 高能率符号化及び復号化システム | |
EP0734019A1 (en) | Information processing method, information processing device and media | |
JPH08123488A (ja) | 高能率符号化方法、高能率符号記録方法、高能率符号伝送方法、高能率符号化装置及び高能率符号復号化方法 | |
JP3879250B2 (ja) | エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置 | |
JP3291948B2 (ja) | 高能率符号化方法及び装置、並びに伝送媒体 | |
JP3227945B2 (ja) | 符号化装置 | |
JP3318824B2 (ja) | デジタル信号符号化処理方法、デジタル信号符号化処理装置、デジタル信号記録方法、デジタル信号記録装置、記録媒体、デジタル信号伝送方法及びデジタル信号伝送装置 | |
JP3879249B2 (ja) | エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置 | |
JP3227948B2 (ja) | 復号化装置 | |
JPH07181996A (ja) | 情報処理方法、情報処理装置、及びメディア | |
JPH06324093A (ja) | オーディオ信号のスペクトル表示装置 | |
JPH07161140A (ja) | ディジタルオーディオ信号の伝送装置及び受信装置、並びにディジタルオーディオ信号の伝送方法及び受信方法 | |
JP3141853B2 (ja) | オーディオ信号処理方法 | |
JP3200886B2 (ja) | オーディオ信号処理方法 | |
JPH08167247A (ja) | 高能率符号化方法及び装置、並びに伝送媒体 | |
JPH11272294A (ja) | エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080809 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080809 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090809 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100809 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110809 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120809 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130809 Year of fee payment: 11 |
|
LAPS | Cancellation because of no payment of annual fees |