JP3970342B2 - 音響信号の知覚符号化 - Google Patents

音響信号の知覚符号化 Download PDF

Info

Publication number
JP3970342B2
JP3970342B2 JP28702794A JP28702794A JP3970342B2 JP 3970342 B2 JP3970342 B2 JP 3970342B2 JP 28702794 A JP28702794 A JP 28702794A JP 28702794 A JP28702794 A JP 28702794A JP 3970342 B2 JP3970342 B2 JP 3970342B2
Authority
JP
Japan
Prior art keywords
channel
channels
matrix
input
perceptually
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP28702794A
Other languages
English (en)
Other versions
JPH07199993A (ja
Inventor
ディヴィッド ジョンストン ジェームス
シンハ デーペン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
AT&T Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AT&T Corp filed Critical AT&T Corp
Publication of JPH07199993A publication Critical patent/JPH07199993A/ja
Application granted granted Critical
Publication of JP3970342B2 publication Critical patent/JP3970342B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Algebra (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【0001】
【発明の背景】
本発明は情報信号の処理、より詳細には、音声(voice )及び音楽(music )を表わす信号を含む音響信号(audio signals )を効率的に符号化する技法に関する。
【0002】
近年、いわゆる知覚音響符号化(perceptual audio coding 、PAC)と呼ばれるものに対してかなりの努力が向けられている。この技法によると、音響信号の一連の時間領域ブロックの各々が周波数領域において符号化される。より詳細には、各ブロックの周波数領域表現がコーダバンド(coder bands )に分割され、これらの各々が個別に、精神−音響基準(psycho-acoustic criteria)に基づいて、音響信号が大幅に“圧縮(compressed)”されるような方法にて符号化されるが、これは、その音響信号を表現するために要求されるビットの数がその音響信号がより単純なデジタル形式、例えば、PCM語の形式にて表現された場合と比較してかなり少なくなることを意味する。
【0003】
この音響信号が2以上の入力チャネル、例えば、立体音響(ステレオ)音楽の左及び右チャネルから構成される場合は、上に説明の知覚符号化は同数のいわゆるマトリックスチャネル(matrixed channels )に関して実行される。最も素直な実現においては、各マトリックスチャネルが、各々の入力チャネルから直接に誘導される。従って、例えば、ステレオ音楽の場合、知覚符号化は、”L”と称される左ステレオ入力チャネルの時間を通じての周波数領域表現を符号化し、また、ここでは”R”と称される別個の右ステレオ入力チャネルの時間を通じての周波数領域表現の符号化を行なうことを意味する。ただし、これは実際にステレオ音楽チャネルの場合は常に成立するが、入力チャネルが互いに高い相関性を持つ場合は、各コーダバンドに対して実行される符号化を二つの符号化モード(coding modes)の間で切り替え、各モードにおいて異なる一組のマトリックスチャネルを使用することによって更なる圧縮を達成することができる。このモードの一方においては、この一組のマトリックスチャネルが単に入力チャネルL及びRから構成される。他方のモードにおいては、この一組の二つのマトリックスチャネルは、S=(L+R)/2及びD=(L−R)/2から構成される。このS及びDチャネルは、和(sum 、S)/差(difference、D)チャネルと呼ばれる。この技法は、以降、“Johnstonの特許”と称され、ここに参照のために編入される、1994年2月8日付けでJ.D.Johnstonに交付された合衆国特許第5,285,498号において教示されている。
【0004】
より最近では、この技術は、二つ以上のチャネルの音響、例えば、5−チャネル音響の知覚符号化に向けられている(ただし、当業者においてはこの説明を続けて行くと明らかになるように、本発明は5つ以外のチャネルを持つシステム内で実現することも可能である。)。5−チャネル音響システムの入力チャネルは、典型的には、3つの“正面(front )”チャネル及び2つの“後部(back)”チャネルから構成される。これら正面チャネルは、従来の左及び右ステレオチャネルに加えて、その時間を通じての周波数領域表現がここではCと称せられる中央(center)チャネルを含む。これらチャネルは、鑑賞者(リスナー)の正面の、それぞれ、左、右、及び真正面の所に置かれたスピーカで再生されることを企図する。後部チャネルは、“左縁(left surround )”及び“右縁(right surround)”チャネルと称され、時間を通じてのこれらの周波数領域表現はここではLS及びRSと呼ばれる。これらのチャネルは、リスナの後ろの、それぞれ、左及び右の所に置かれたスピーカの所で再生されることが企図される。
【0005】
【本件発明の概要】
ステレオ、つまり、2−チャネル音響の符号化のために符号化モード間で切替を行なうことに関するJohnstonの特許の上述した教示は、ここでも同様に知覚符号化自身によって提供されるよりも大きな更なる圧縮を達成するために5−チャネルシステムに適用することができる。例えば、正面チャネルを二つのモード間で切り替え、後部チャネルを二つのモード間で切り替えることができる。正面チャネルに対するこれら二つの符号化モードは、(a)その一組のマトリックスチャネルがL、R、及びCから構成されるモード、及び(b)その一組のマトリックスチャネルがS、D及びCから構成されるモードであり得る。同様にして、後部チャネルに対するこれら二つの符号化モードは、(a)その一組のマトリックスチャネルがLS及びRSから構成されるモード、及び(b)その一組のマトリックスチャネルが、SS=(LS+RS)/2及びSD=(LS−RS)/2によって与えられる後部和/差チャネル、つまりSS及びSDから構成されるモードであり得る。
【0006】
ただし、我々は、2−チャネル以上、例えば、5−チャネル、符号化のためのより高度なモード切替え手法を発明した。本発明によると、複数のモード間での切替えによってさらに追加の圧縮が達成されるが、これら複数のモードの少なくとも一つは、そのマトリックスチャネル一組の内に、それから自身の予測が引かれた入力チャネル又は和/差チャネルによって与えられる少なくとも一つのマトリックスチャネルを含む。もし、ある予測が“良好”予測である場合、つまり、予測されているチャネルに良く一致する場合は、それらの差を表わすために必要とされるビットの数は予測されたチャネルを直接に要求されるビットの数よりかなり低くなり、こうして上に述べた追加の圧縮が達成される。
【0007】
【外1】
Figure 0003970342
【0008】
【外2】
Figure 0003970342
【0009】
これらの好ましい実施例においては、各コーダバンドに対してどの符号化モードが使用されるべきかの選択は、これらモードの内のどれがこれを符号化するために最も少ないビットを要求するかを決定することによって行なわれる。
【0010】
【詳細な記述】
本開示を簡素化するために、以下の発明及び出版物、つまり、1991年8月13日付けでK.Brandenburg らに交付された合衆国特許第5,040,217号、194年4月23日付けでJ.L.Hallらに交付された合衆国特許第5,341,457号、J.D.JohnstonによるIEEE Journal on Selected Areas in Communications、Vol.6,No.2(1998年2月号)に掲載の論文『知覚ノイズ基準を使用する音響信号の変換符号化(Transform Coding of Audio Signals Using Perceptual Noise Criteria )』、1988年3月10日付けで申請された国際特許出願(PCT)WO88/01811号、AES 90th Convention(1991)に掲載の論文『アスペクト: 高品質音楽信号の適応スペクトルエントロピ符号化(Aspec:Adaptive Spectral Entropy Coding of High Quality Music Signals)』、Johnston,J. によるICASSP、(1988年)に掲載の論文『ノイズマスキング基準を使用する知覚エントロピの推定(Estimation of Perceptual Entropy Using Noise Masking Criteria )、J.D.JohnstonによるICASSP、(1989年)に掲載の論文『広帯域ステレオ信号の知覚変換符号化(Perceptual Transform Coding of Wideband Stereo Signals)』、E.F.Schroeder 及びJ.J.PlatteによるIEEE Trans. on Consumer Electronics 、Vol.CE-33 、N0.4、1987年11月号に掲載の論文『“MSC”、CD−品質及び256kBIT/SECを持つステレオ音響符号化("MSC”、Stereo Audio Coding with CD-Quality and 256 kBIT/SEC)、及びJohnstonによるVol.2 、 No.2 、IEEE J.S.C.A. (1988年2月号)に掲載の論文『ノイズ基準を使用する音響信号の変換符号化(Transform Coding of Audio Signals Using Noise Cirteria)』が本開示内に参照の目的であたかも完全に説明されているかのように編入される。
【0011】
説明の簡明化のために、本発明の一例としての実施例は(“プロセッサ”と呼ばれる機能ブロックを含む)個別の機能ブロックから構成されるものとして記載される。これらブロックが代表する機能は、これらに限定されるものではないがソフトウエアを実行する能力を持つハードウエアを含めた、共有又は専用ハードウエアのいずれかの使用を通じて提供される。説明のための複数の実施例は、デジタル信号プロセッサ(DSP)ハードウエア、及び以下に説明される動作を遂行するソフトウエアから構成される。本発明による大規模集積(VLSI)ハードウエアの実施例、並びにハイブリッドDSP/VLSIの実施例も提供される。
【0012】
図1は本発明で実現されるシステムの全体ブロック図である。図1において、リード101上のアナログ音響信号が前処理プロセッサ102に供給され、ここでこれは(典型的には48KHzで)サンプリングされ、標準の様式にてリード103上の16ビット/サンプルのデジタルパルス符号変調(PCM)信号に変換される。このPCM信号は知覚音響符号器(PAC)104に供給されるが、これはPCM信号を圧縮し、圧縮されたPAC信号を通信チャネル又は記憶媒体106に向かうリード105上に出力する。記憶媒体は、例えば、磁気テープ、コンパクトディクス又は他の記憶媒体でもよい。この通信チャネル又は記憶媒体からのリード107上の圧縮されたPAC符号化された信号は知覚音響復号器108に供給されるが、これは圧縮PAC符号化された信号を伸張(decompresses)し、リード109上に元のアナログ信号のデジタル表現であるPCM信号を出力する。知覚音響復号器から、リード109上のPCM信号は、後置プロセッサ110に供給されるが、これはアナログ表現を生成する。
【0013】
知覚音響符号器104の説明のための実施例が図2にブロック図形式にて示される。図2の知覚音響符号器は、好ましくは、分析フィルタバンク202、知覚モデルプロセッサ204、複合符号器205、量子化器/レートループプロセッサ206及びエントロピ符号化器208から構成される。
【0014】
知覚音響符号器104の様々な要素の構造及び動作は、ステレオ信号を処理する場合は、Johnstonの図2内の同様の要素の構造及び動作におおむね類似し、従って、ここでは、本発明の詳細な説明に必要な範囲を越えては詳細には説明しない。ここでの説明には、複合符号器(composite coder )205の説明が含まれるが、これに対して、Johnstonの特許の図2には、明示的な対応要素が示されてない(ただし、符号化モード間の切り替えに関係するこの要素の機能は、Johnstonの特許においては分析フィルタバンク202内において暗黙的に遂行される)。
【0015】
図2の説明に戻るが、リード103上のアナログ音響入力信号は、一例として、時間領域において、一組の入力チャネル、つまり、それぞれ、1(t)、r(t)、c(t)、ls(t)及びrs(t)と命名される左(left)、右(right )、中央(center)正面(front )チャネル、左縁(left surround )及び右縁(right surround)後部(back) チャネル、のPCMサンプルから構成される5−チャネル信号である。分析フィルタバンク202はこれらサンプルを受信し、これらを時間領域ブロックに分割する。より詳細には、フィルタバンク202は、これらブロックに対して、二つのウインドウ長間で切り替えを行なうが、ここで“短い”ウインドウは128個の時間サンプルを含み、“長い”ウインドウは1024個の時間サンプルを含む。各ブロックに対して、フィルタバンク202は、問題のブロックに対する各チャネルの周波数領域表現を提供するために5つのチャネルの各々に関して個別に修正離散コサイン変換(Modified Discrete Cosine Transform)を遂行する。各チャネルの周波数領域表現は、長いウインドウ長ブロックに対する49個のコーダバンドに分割された1024の一様の間隔を持つ周波数スペクトルライン、及び短いウインドウ長ブロックに対する14のコーダバンドに分割された128の一様の間隔を持つ周波数スペクトルラインを含む。左、右、中央、左縁及び右縁入力チャネルは、図面においては、L(f)、R(f)、C(f)、LS(f)及びRS(f) と命名されているが、ただし、以降は便宜上、L、R、C、LS及びRSと命名する。
【0016】
分析フィルタバンク202の出力は、複合符号器205に加えられるが、これは後に詳細に説明される方法にて5つのマトリックスチャネルM1(f)−M5(f)を生成し、これらは量子化器/レートループプロセッサ(quantizer/rate loop processor )206に加えられる。後者は、こけらのマトリックスチャネルを符号化するが、これは、(a) 与えられたブロックに対する各マトリックスチャネルの周波数スペクトルラインの各々の符号付きの規模を表わす二進データを生成し、(b) このデータを復号器によって必要とされる他の情報と共にフォーマット化することによって達成される。このデータは、Johnstonの特許及びここでも以下において説明されているような様々な“ハウスキーピング(housekeeping)”データ、並びに、本発明の実現の過程において生成されるデータ、例えば、以下に説明される、ある与えられたブロック内の各コーダバンドを符号化するときに使用された符号化モードの指標、並びに、これも以下に説明される、幾つかの予測係数の値を含む。
【0017】
量子化器/レートループプロセッサ206の出力はエントロピ符号化器208に供給される。後者は前者と連絡して動作することにより一層の圧縮を達成する。
【0018】
上に述べたように、複合符号器205の出力は5つのマトリックスチャネルを含む。複合符号器205は複数の符号化モードを持つが、各々は異なる一組のマトリックスチャネルによって特性化され、各コーダバンドに対して説明されるような方法にて異なる符号化モードが個別に呼び出される。幾つかのモード内の幾つかのマトリックスチャネルは入力チャネルL、R、C、LS及びRSであり、これらマトリックスチャネルの他の幾つかは、いわゆる和/差チャネル、つまり、S=(L+R)/2、D=(L−R)/2、SS=(LS+RS)/2及びSD=(LS−RS)/2である。
【0019】
ただし、本発明によると、これらモードの少なくとも一つは、それからそれ自身の予測が引かれた入力チャネル又は和/差チャネルによって与えられる少なくとも一つのマトリックスチャネルを含む。ここで説明の一例としての実施例においては、正面(front )チャネルを符号化するために6つのモードが提供される。正面入力チャネルL、R及びCに直接に関わりのある3つのモードは以下である。
【数1】
Figure 0003970342
【0020】
正面和(sum )/差(difference)チャネルS及びDと関係のある他の3つのモードは以下の通りである。
【数2】
Figure 0003970342
【0021】
後部(back)チャネルに対しては8つのモードが提供される。後部チャネルLS及びRSと直接に関係のある4つのモードは以下の通りである。
【数3】
Figure 0003970342
【0022】
後部和/差チャネルSS及びDSと関係のある他の4つのモードは以下の通りである。
【数4】
Figure 0003970342
【0023】
【外3】
Figure 0003970342
【0024】
【外4】
Figure 0003970342
【0025】
【外5】
Figure 0003970342
【0026】
上の式(1)、式(2)、式(3)及び式(4)から分かるように、和/差チャネルはペアの正面チャネル又はペアの後部チャネル間でのみ形成される。おそらく、3つ又はそれ以上の入力チャネルを巻き込み、更に、おそらく正面と後部チャネル間の和及び差を巻き込むようなより複雑な組合わせ、つまり、“基底変換(basis transformations )”が圧縮の観点からは有利な場合もある。ただし、このようなより複雑な基底変換は考えない方が良い。これは、この場合は、知覚符号化の推進原理である量子化ノイズのマスキングが、5スピーカの視聴覚室環境においてのみか、いわゆる5入力チャネルのステレオダウンミックス(stereo downmix)の場合、例えば、ヘッドホーン再生に対する二つのチャネルに対しても効果を及ぼすことを確保する必要があるためである。さらに、このより複雑な基底変換は、通常、符号化のために(以下に説明されるように)より低いノイズしきい値を使用することを要求し、これは、結果として、達成される圧縮の量を低減する。
【0027】
我々は、次に、(a) 任意の特定の符号化モードの5つのマトリックスチャネルの符号化をいかに遂行するか、及び(b) ある与えられたブロックに対するある特定のコーダバンドを符号化するために使用されるべきモードをどのように決定すべきかの問題を扱う。
【0028】
より詳細には、Johnstonの特許は、各ブロックに対して、知覚モデルプロセッサが各コーダバンドについて各マトリックスチャネルに対するノイズしきい値をいかにして生成するかを説明する。ここで、このしきい値は、量子化器/レートループプロセッサにとって、その各々のマトリックスチャネルの符号化における致命的なパラメータである。従って、2−チャネルシステムに対する各コーダバンドに対して、各々、L、R、S及びDに対する4つのノイズしきい値が生成される。これらノイズしきい値は知覚モデムプロセッサ204によってリード214を介して複合符号器205に供給される。L及びRがJohnstonの特許の一つの符号化モードの際のある特定のコーダバンドに対する符号化されたチャネルである場合、これらの各々のしきい値がこれらチャネルを符号化するために使用される。同様に、S及びDが他の符号化モードの際の符号化されたチャネルである場合、それらの各々のしきい値がそれらのチャネルを符号化するために使用される。
【0029】
【外6】
Figure 0003970342
【0030】
ある特定の符号化モードが選択される様式が図3の流れ図によって図解されている。この流れ図は、これとの関係で、正面チャネルに対して及びある特定のコーダバンドに対して遂行される処理を表わす。類似する処理が各コーダバンドに対して正面及び後部チャネルの両方に対して個別に遂行される。具体的には、[]内の項目は、後部チャネルに対して遂行される処理に関する。
【0031】
最初に、知覚モデルプロセッサ204によって前述の9つのしきい値が生成される(ブロック301)。次に、複合符号器205内において、正面チャネルに対する符号化モードが入力チャネルを巻き込むタイプであるべきか、又は和/差チャネルを巻き込むタイプであるべきか、つまり、モード(1)の一つであるべきか、又はモード(2)の一つであるべきかの判定が行なわれる。この判定を行なうに当って採用される一つの基準は、LとRに対するしきい値を比較することである(ブロック303)。これらが所定の量、例えば、2dB以上異なる場合は、入力チャネル符号化、つまり、(1)内の3つのモードの一つが使用される。これらに所定の量以上の差がない場合は、ここでは実現されてない一つのアプローチにおいては、ただちに、和/差符号化、つまり(2)内の3つのモードの一つが選択される。ただし、ここでは、より高度なアプローチが使用される。より詳細には、我々は、LとRが高度に相関を持つ場合、(a) このケースにおいては高度の圧縮が達成されるのみでなく、(b)これがいわゆるノイズ局所化(noise localization) を制御するという理由から、和/差マトリックスチャネルの使用が望ましいことを認識する。ただし、ノイズ局所化の制御は、L及びRに対するしきい値を適当に下げることによっても達成することができるばかりでなく、これら下げられたしきい値にてL及びRを符号化した場合、しばしば、S及びDの符号化よりも少ないビットで済む場合がある。従って、L及びRを下げたしきい値にて符号化するか、又はS及びDを符号化するか、どちらのアプローチの方がより少数のビットを要求するかを決定するために、従来の技術において教示されている“知覚エントロピ(perceptual entropy)”基準が使用される。符号化モードが一度(1)又は(2)であることから狭く絞られると(ブロック307)、使用されるべき特定の符号化モードが、単純に、再度、最少数のビットを要求するモードを同定するために前述の知覚エントロピ基準を使用することによって選択される(ブロック309又は314)。類似するプロセスが後部チャネルに対して遂行され、正面及び後部チャネルの両方に対してどの符号化モードが使用されたかの指標が符号化されたチャネルそれら自身と共に格納又は送信される。
【0032】
図2の符号器の更なる新規の特徴点の一つは、これら5つの入力チャネル及び4つの和/差チャネルに対するしきい値の生成に関する。いわゆる広域マスキングしきい値(global masking threshold)を使用する符号器のこの特徴は、その信号成分が他のマトリックスチャネル内のノイズをマスクするために最強であるマトリックスチャネル内の信号成分のマスキング能力を利用する。
【0033】
この特徴の使用を理解するために、我々は、符号器104内に、従来の技術において周知の符号器と同様に、基本的に、ビット単位にて測定された過剰チャネル能力(excess channel capacity )のカウントである“ビット貯蔵(bit reservoir )”が維持されることを考慮することから始める。このカウントは、本質的には、(a) 過去における平均出力ビット速度での利用可能なビット伝送スロット(bit transmission slots)の数と、(b) 実際に符号化されたビットの数との間の差の測定値である。ビット貯蔵のカウントの最大サイズは、そのシステム内において許される緩衝(潜在能力)の量に依存する。この未使用能力は、将来のブロックがそれらのブロックの内容を表現するために平均以上のビット数を要求するかどうかの事実を扱うために使用することができる。こうして、各ブロックに対して生成された符号化されたビット数がブロックからブロックへと変動し、一般的には、(毎秒平均ベースで見た場合)ある時はこの速度より高くなったり、ある時はこれよりも低くなったりはするが、比較的一定の出力ビット速度を支持することができる。典型的には、ビット貯蔵容量は、ブロック当りの平均ビット速度の5倍とされる。
【0034】
ビット貯蔵がその最大容量に達すると、これは、ビット要件が一貫して平均出力ビット速度よりも低かったことの指標であり、このために、ノイズしきい値を低下し、こうして、より細かい量子化を遂行することにより、これら余剰の能力を消費することが得策である。これは、これがより品質の良い再生を提供するという点において有利である。ただし、任意的な代替として、単純に、マーク、又は情報を持たないビットを送信することも可能である。
【0035】
ただし、修正段階が取られない限り、システムの緩衝能力が全て消費されてしまい、符号化ビットが失われ始めるという時点に備えて、ビット貯蔵が空になった場合に対処する技法が絶対に必要である。従来の技術は、この問題を、(a) ビット貯蔵が枯渇した場合、及び(b) これに加えて、現ブロックに対するビット要件がその時点でのブロック当りの平均出力ビット速度を超える場合に、粗い量子化に切り換えることによって対処する。実現上は、これは、各ノイズしきい値に1以上の一連の増加する定数を掛けて、ビット要件を再計算する動作を、現ブロックに対するビット要件が収容されるようになるときまで反復することによって達成される。将来のブロックのビット要件がいったん平均速度以下になったら、通常のしきい値が再度使用され、ビット貯蔵の補給が開始される。
【0036】
この従来の技術による手法は、ビット貯蔵枯渇問題を扱うためには効果的であるが、これは復号された信号内に重大なアーティファクト(arifact) の問題を与える危険がある。これは、このしきい値を増加する機構が、我々が有利であると理解する、精神−音響(psycho-acoustic )考察に基づくことなく、コーダバンドを横断して決定論的であるために起こる。
【0037】
符号器の前述の新規の特徴によると、精神−音響考察を考慮に入れたビット貯蔵枯渇に対する手法が使用される。この手法は、5つの全てのマトリックスチャネルを横断して一定である各コーダバンドに対する“広域マスキングしきい値(global masking threshold)”を確立する。この大域マスキングしきい値の値は以下に説明されるように計算されるが、現時点では、これはリスニングルーム環境(listening room environment)内のリスナ(listener)によって気づかれることのない任意のチャネル内の最大ノイズレベルを表わすことを示すのみで十分である。
【0038】
差し迫ったビット貯蔵枯渇に際してノイズしきい値の値を制御するためにどのように広域マスキングしきい値が使用されるかが図4−6内に解説される。図4は、具体的には、一例として、Lの最初の4つのコーダバンドに対するしきい値レベル、並びにこれらバンドの各々に対して確立される広域マスキングしきい値を示す(他の各チャネルに対しても類似の表現を使用することができる)。図4によって表わされる時点において、ビット貯蔵は80%枯渇のレベルのちょうど下にあるものと想定される。このために、この時点では、標準のしきい値の値が使用される。ただし、枯渇レベルが80%に到達するとただちに、各しきい値に対する下限、一例として、広域マスキングしきい値の50%が採用され、結果として、この下限よりも小さな全てのしきい値がこれと等しくなるように増加される。各コーダバンドに対して異なる広域マスキングしきい値が設定され、また、ノイズしきい値が各バンドに対して異なるために、これは、幾つかのしきい値は他よりも多く増加され、幾つかは全く増加されないことを意味する。これが図5に図解されるが、ここでは、コーダバンド1及び3に対するしきい値は増加されず、一方、コーダバンド2及び4に対するしきい値は増加されていることがわかる。この手法は、追加のノイズがこれらしきい値の増加の結果として導入されるが、これら追加のノイズは、それがリスナによって気づかれる可能性が最も低いコーダバンド内に導入されるという意味において優れている。ここでの動作機構は、以下のより適切なポイントにおいて説明される。
【0039】
後の時点において、ビット貯蔵が枯渇のさらに厳しい状態に達したことが観察された場合は、広域マスキングしきい値のさらに高いパーセントが下限として設定され、結果として、これらしきい値の幾つかがさらに増加される。もし、終極的に、下限が一杯の広域マスキングしきい値に設定されなければならず、そして、それでもビット貯蔵の枯渇が続くようであれば、各しきい値がさらに1よりも大きな定数に対応する広域マスキングしきい値の値を掛けることによって与えられる値に増加され、こうして、しきい値の設定において、ここでも引き続いて、少なくともある程度は、精神−音響的な考慮が反映される。これが図6に示される。いったん、ビット貯蔵の蓄積が開始されると、ノイズしきい値の下限を決定するためにますます低い広域マスキングしきい値のパーセントが使用され、80%に到達した時点で、これらのしきい値はそれらの標準の値に戻される。
【0040】
各コーダバンドに対する広域マスキングしきい値の実際の値は、そのバンドに対する5つの入力チャネルしきい値の最大から安全マージン(safety margin )を引いたもとのされる。一方、この安全マージンは、Johnstonの特許において定義される周波数依存両耳マスキングレベル差(MLD)に、定数4−5dBを加えたものとされる。
【0041】
広域マスキングしきい値の値がこのようにして決定されるものとすると、我々は、現在、上に説明された手法がなぜ効果的であるかを理解できる位置にある。ここで何が起こっているかといえば、この技法がその信号成分が他のマトリックスチャネル内のノイズをマスクするために最強であるマトリックスチャネル内の信号要素のマスキング能力を活用するということである。
【0042】
(上に説明されたように終極的に必要とされない限り、)ノイズしきい値の下限を設定するために、なぜ、最初に、広域マスキングしきい値のあるパーセントのみが使用されるかについては、少なくとも二つの理由がある。一つの理由は、もし一杯の広域しきい値が使用された場合には、ノイズが視聴覚室環境内の全てのリスナーに対して、特に、スピーカ付近のリスナに対しては、完全にマスクされない可能性があるためである。もう一つの理由は、前述のステレオダウンミックスチャネル(stereo downmixed channels )内のノイズが完全にマスクされない確率が前述の下限を設定するために使用される広域マスキングしきい値のパーセントの増加と共に増加するためである。
【0043】
図7は、記憶媒体700、一例として、磁気テープの一部分を示すが、この上に本発明に従って生成されたPAC−符号化されたデータが格納され、ここからその後、これらデータが、図1との関係で上に説明されたように、読み出され、復号され、リスナに提供される。データは、フレーム...Fi-1 、Fi 、Fi+1 、...にて格納され、各々のフレームは入力信号の1つのブロックに対応する。これらフレームは記憶媒体上に順番に格納され、2−チャネルPACに対して従来の技術において教示されるそれと非常に類似する所定のフォーマットに準拠する。一例として、この図面にはフレームFi の全体が明示的に示される。これらには以下のフィールド、つまり、フレームの開始を定義する同期語701、この例においては5とされる入力信号内のチャネルの数を示すチャネル標識702、そのフレームが長いウインドウを表わすか又は短いウインドウを表わすかを示すウインドウタイプ標識704、各コーダバンド内の問題のブロックを符号化するために14の符号化モードのどれが使用されたかを示す、所定のコードブックを使用してハフマン符号化形式にて表わされる符号化モード標識706、5つの各マトリックスチャネルに対して各々のdc値を指定するdc値709、その値が“1”であるときは、予測係数がフレーム内に明示的に指定されており、この場合は、これらが予測係数フィールド713内に提供されていることを示し、一方、“0”であるときは、全ての予測係数が値1を持つこと又はこれらが上に説明された方法にて復号器内で計算されるべきあることを示し、これら二つのオプション間の選択がシステムが設計される時点で事前に決定される予測係数標識710、及び各々が(このケースにおいては)5つのマトリックスチャネルM1(f)からM5(f)の対応する一つに対する符号化されたデータを含むPACデータフィールド714−718が含まれる。従来の技術による2−チャネルPACシステムの場合と同様に、フィールド714−718の各々の一つの中のPAC−符号化されたデータは、ハフマン符号化形式にて表現される。各チャネル内の様々な符号化バンドに対するデータを符号化するために様々なハフマンコード・コードブック(Huffman code codebooks)が使用され、各フィールド714−718内のデータはまた問題のマトリックスチャネルのどのコーダバンドを符号化するためにどのコードブックが使用されたかを識別する情報も含む。
【0044】
図7に示されるフォーマットは、PACフレームを他のタイプの記憶媒体、例えば、コンパクトディスク、光ディスク、半導体メモリ等に格納するためにも使用できるものである。
【0045】
図8は図1のPAC復号器109の一つの説明のための実施例である。図7に示されるようにフレームのシーケンスとしてフォーマット化された入りビット流は、ビット流パーサ(bit stream parser )801によってその様々な成分に構文解析される。この図面には明示的には示されていないが、パーサ801は、PAC−符号化されたデータを復号器内の次の機能ブロック、つまり、エントロピ復号器804に供給するばかりでなく、図7との関連で上に説明された様々な標識及び他の値を復号器の様々な要素のそれらを必要とする一つにも供給する。(同様に、図2においては明示的には示されていないが、それらが量子化器/レートループプロセッサ106自体の中で生成されないという範囲で、復号器104の様々な要素によって生成された標識及び他の様々な値が、各フレームのフォーマット内に編入することができるようにこれに供給されることも理解できるものである。)
【0046】
復号器109によって遂行される処理に続いて、エントロピ復号器804は、エントロピ符号器208の逆の機能を遂行し、その出力として5つのマトリックスチャネルM1 (f)...M5 (f)を提供する。デマトリクサ(dematrixer)807はマトリックスチャネルから周波数領域入力チャネルL、R、C、LS及びRSを回復するが、これらは、図2においては、L(f)、R(f)、C(f)、LS(f)及びRS(f) と命名されている。これら周波数領域入力チャネルは、次に、逆修正離散コサイン変換(Inverse Modified Discrete Cosine Transfor 、逆MDCT)プロセッサ808によって5つの時間領域チャネル1(t)、r(t)、c(t)、ls(t)及びrs(t)を生成するために処理される。
【0047】
すぐ上に説明されたような図8に示される要素の各々によって遂行される処理は素直に遂行することができ、従って、さらに詳細に説明される必要はない。実際、この処理は、2−チャネルPACに対して従来の技術において遂行されるのと非常に類似するものである。
【0048】
上記は単に本発明の原理を図解するものであり、当業者においては、ここでは明示的に示されたり、説明されてないが、本発明の原理を具現し、従って、本発明の精神及び範囲に入る様々な代替構成を考案できるものである。
【図面の簡単な説明】
【図1】本発明が一例としてこの中で実現されるシステムのブロック図である。
【図2】図1のシステム内で使用される知覚音響符号器のブロック図である。
【図3】本発明の原理を実現する知覚音響符号器内で遂行されるプロセスの流れ図である。
【図4】広域マスキングしきい値の使用に関係する知覚音響符号器の一つの新規な特徴を図解する図である。
【図5】広域マスキングしきい値の使用に関係する知覚音響符号器の一つの新規な特徴を図解する図である。
【図6】広域マスキングしきい値の使用に関係する知覚音響符号器の一つの新規な特徴を図解する図である。
【図7】PAC−符号化された音響のフォーマットを示す図である。
【図8】図1のシステム内で使用された知覚音響復号器のブロック図である。

Claims (10)

  1. 一組の入力チャネルから構成される音響信号を知覚的に符号化する方法であって、この方法が、
    該入力チャネルに応動して一組のマトリックスチャネルを生成する工程、及び
    該マトリックスチャネルを知覚的に符号化する工程を含み、
    該一組のマトリックスチャネルの少なくとも個別の一つのマトリックスチャネルが、(a) 該入力チャネルの個別の一つ、又はこれらの二つのチャネルの和又は差と(b) (a)の予測との差として決定されることを特徴とする方法。
  2. 請求項1に記載の音響信号を知覚的に符号化する方法において、該出力に、(a) 該知覚的に符号化されたマトリックスチャネル、及びb)該入力チャネルの知覚符号化を二者択一的に加える工程がさらに含まれることを特徴とする方法。
  3. 請求項1に記載の音響信号を知覚的に符号化する方法において、通信チャネル又は記憶媒体に、(a) 該知覚的に符号化されたマトリックスチャネル、及び、(b) 該入力チャネルの知覚符号化を二者択一的に加える工程がさらに含まれることを特徴とする方法。
  4. 請求項1に記載の音響信号を知覚的に符号化する方法において、該音響信号内において、該入力チャネルが周波数領域内で表現され、該マトリックスチャネルの各々が一連の時間領域ブロックの各々に対して周波数スペクトルラインによって表現されるように、該生成工程が該入力チャネルから該一組のマトリックスチャネルを生成する工程からなることを特徴とする方法。
  5. 請求項4に記載の音響信号を知覚的に符号化する方法において、該周波数スペクトルラインが複数のコーダバンドに分割され、各コーダバンドの周波数スペクトルバンドの規模がそのコーダバンドと関連するノイズしきい値の関数として量子化された値によって表わされることを特徴とする方法。
  6. 一組の入力チャネルからなる音響信号を処理する装置であって、この装置が
    該入力チャネルに応答して生成された所定の複数の一組のマトリックスチャネルを知覚的に符号化する手段(205)、及び
    該知覚的に符号化されたチャネルを、(a) 通信チャネル、及び(b) 記憶媒体の選択された一つに加えるための手段(206、208)を含み、
    該一組のマトリックスチャネルの個別の一つのチャネルが該入力チャネルであり、該一組のマトリックスチャネルの複数の他のチャネルが少なくとも個別の一つのマトリックスチャネルを含み、これが、(a) 該入力チャネルの個別の一つ、又はそれらの二つチャネルの間の和又は差、と(b) (a) の予測との差として決定されることを特徴とする装置。
  7. 請求項6に記載の音響信号を処理する装置において、該音響信号内において、該入力チャネルが一連の時間領域ブロックの各々に対して複数のコーダバンドに分割された周波数スペクトルラインによって表現され、各コーダの周波数スペクトルラインの規模がそのコーダバンドと関連するノイズしきい値の関数として量子化された値によって表現されることを特徴とする装置。
  8. 知覚的に符号化された音響信号を処理する方法であって、該知覚的に符号化された音響信号が一組の入力チャネルに応答して一組のマトリックスチャネルを生成し、該マトリックスチャネルを知覚的に符号化し、そして該知覚的に符号化されたマトリックスチャネルを通信チャネル又は記憶媒体に加える工程を通じて生成されたものであり、
    この方法が
    該通信チャネル又は記憶媒体から該知覚的に符号化されたマトリックスチャネルを受信する工程、
    該受信された知覚的に符号化されたマトリックスチャネルを復号する工程、及び
    該復号されたマトリックスチャネルから該入力チャネルを回復する工程を含み、
    該一組のマトリックスチャネルが、(i) 該入力チャネルと、(ii)一組のマトリックスチャネルの選択された一つから構成され、ここで、該マトリックスチャネルの少なくとも個別の一つのチャネルが、(a) 該入力チャネルの個別の一つ、又はそれらの二つの間の和、又は差と、(b) (a) の予測との差として決定されることを特徴とする方法。
  9. 知覚的に符号化された音響信号を処理する装置であって、該知覚的に符号化された音響信号が一組の入力チャネルに応答して一組のマトリックスチャネルを生成し、該マトリックスチャネルを知覚的に符号化し、そして該知覚的に符号化されたマトリックスチャネルを通信チャネル又は記憶媒体に加えて生成されたものであり、
    この装置が
    該通信チャネル又は記憶媒体から該知覚的に符号化されたマトリックスチャネルを受信する手段(801)、
    該受信された知覚的に符号化されたマトリックスチャネルを復号する手段(804)、及び
    該復号されたマトリックスチャネルから該入力チャネルを回復する手段(807)を含み、
    該一組のマトリックスチャネルの複数のマトリックスチャネルの少なくとも個別の一つのチャネルが、(a) 該入力チャネルの個別の一つ、又はそれらの二つの間の和又は差、と(b) (a) の予測との差として決定されるることを特徴とする装置。
  10. 一組の入力チャネルから構成される知覚的に符号化された音響信号を表わす情報が格納される物品(700)であって、該知覚的に符号化された音響信号が以下の工程、つまり
    該入力チャネルに応答して一組のマトリックスチャネルを生成する工程、及び
    該マトリックスチャネルを知覚的に符号化する工程を含み、
    該一組のマトリックスチャネルの複数のマトリックスチャネルの少なくとも個別の一つチャネルが、(a) 該入力チャネルの個別の一つ、又はそれらの二つの間の和、又は差、と(b) (a) の予測との差として決定されることを特徴とする物品。
JP28702794A 1993-11-23 1994-11-22 音響信号の知覚符号化 Expired - Lifetime JP3970342B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/156,495 US5488665A (en) 1993-11-23 1993-11-23 Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels
US156495 1998-09-18

Publications (2)

Publication Number Publication Date
JPH07199993A JPH07199993A (ja) 1995-08-04
JP3970342B2 true JP3970342B2 (ja) 2007-09-05

Family

ID=22559816

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28702794A Expired - Lifetime JP3970342B2 (ja) 1993-11-23 1994-11-22 音響信号の知覚符号化

Country Status (6)

Country Link
US (2) US5488665A (ja)
EP (1) EP0655876B1 (ja)
JP (1) JP3970342B2 (ja)
KR (1) KR100351219B1 (ja)
CA (1) CA2117829C (ja)
DE (1) DE69432012T2 (ja)

Families Citing this family (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5632005A (en) * 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
US5488665A (en) * 1993-11-23 1996-01-30 At&T Corp. Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels
DE4405659C1 (de) * 1994-02-22 1995-04-06 Fraunhofer Ges Forschung Verfahren zum kaskadierten Codieren und Decodieren von Audiodaten
JP2842276B2 (ja) * 1995-02-24 1998-12-24 日本電気株式会社 広帯域信号符号化装置
KR0174085B1 (ko) * 1995-08-09 1999-04-01 조백제 다채널 오디오 복호화기의 복합 디코딩장치
KR100346734B1 (ko) * 1995-09-22 2002-11-23 삼성전자 주식회사 고속분석필터및합성필터를구비한오디오부호화기및복호화기
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5734729A (en) * 1996-01-17 1998-03-31 Compaq Computer Corporation Apparatus for eliminating audio noise when power is cycled to a computer
JP3948752B2 (ja) * 1996-04-10 2007-07-25 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 複数情報信号符号化用符号化装置
KR100472402B1 (ko) * 1996-04-10 2005-07-25 코닌클리케 필립스 일렉트로닉스 엔.브이. 복수의정보신호의부호화장치및방법
CN1106085C (zh) * 1996-04-26 2003-04-16 德国汤姆逊-布朗特公司 对数字音频信号编码的方法和装置
EP0803989B1 (en) * 1996-04-26 1999-06-16 Deutsche Thomson-Brandt Gmbh Method and apparatus for encoding of a digitalized audio signal
DE19628292B4 (de) 1996-07-12 2007-08-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Codieren und Decodieren von Stereoaudiospektralwerten
JP3215053B2 (ja) * 1996-09-11 2001-10-02 富士通株式会社 移動通信装置
US5864813A (en) * 1996-12-20 1999-01-26 U S West, Inc. Method, system and product for harmonic enhancement of encoded audio signals
US6516299B1 (en) 1996-12-20 2003-02-04 Qwest Communication International, Inc. Method, system and product for modifying the dynamic range of encoded audio signals
US6463405B1 (en) 1996-12-20 2002-10-08 Eliot M. Case Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband
US6782365B1 (en) 1996-12-20 2004-08-24 Qwest Communications International Inc. Graphic interface system and product for editing encoded audio data
US5864820A (en) * 1996-12-20 1999-01-26 U S West, Inc. Method, system and product for mixing of encoded audio signals
US6477496B1 (en) 1996-12-20 2002-11-05 Eliot M. Case Signal synthesis by decoding subband scale factors from one audio signal and subband samples from different one
US5845251A (en) * 1996-12-20 1998-12-01 U S West, Inc. Method, system and product for modifying the bandwidth of subband encoded audio data
TW429700B (en) * 1997-02-26 2001-04-11 Sony Corp Information encoding method and apparatus, information decoding method and apparatus and information recording medium
US5946352A (en) * 1997-05-02 1999-08-31 Texas Instruments Incorporated Method and apparatus for downmixing decoded data streams in the frequency domain prior to conversion to the time domain
US6111844A (en) * 1997-07-03 2000-08-29 At&T Corp. Quality degradation through compression/decompression
US6266419B1 (en) 1997-07-03 2001-07-24 At&T Corp. Custom character-coding compression for encoding and watermarking media content
JP3279228B2 (ja) * 1997-08-09 2002-04-30 日本電気株式会社 符号化音声復号装置
US6091773A (en) * 1997-11-12 2000-07-18 Sydorenko; Mark R. Data compression method and apparatus
US6405338B1 (en) * 1998-02-11 2002-06-11 Lucent Technologies Inc. Unequal error protection for perceptual audio coders
US6141645A (en) * 1998-05-29 2000-10-31 Acer Laboratories Inc. Method and device for down mixing compressed audio bit stream having multiple audio channels
US6122619A (en) * 1998-06-17 2000-09-19 Lsi Logic Corporation Audio decoder with programmable downmixing of MPEG/AC-3 and method therefor
US20060265091A1 (en) * 1998-08-14 2006-11-23 Bruce Mihura Audio entertainment system for storing and playing audio information
SE519552C2 (sv) * 1998-09-30 2003-03-11 Ericsson Telefon Ab L M Flerkanalig signalkodning och -avkodning
JP4835643B2 (ja) * 1998-10-13 2011-12-14 日本ビクター株式会社 音声符号化方法及び音声復号方法
US6931372B1 (en) * 1999-01-27 2005-08-16 Agere Systems Inc. Joint multiple program coding for digital audio broadcasting and other applications
US6735561B1 (en) * 2000-03-29 2004-05-11 At&T Corp. Effective deployment of temporal noise shaping (TNS) filters
ATE387044T1 (de) * 2000-07-07 2008-03-15 Nokia Siemens Networks Oy Verfahren und vorrichtung für die perzeptuelle tonkodierung von einem mehrkanal tonsignal mit verwendung der kaskadierten diskreten cosinustransformation oder der modifizierten diskreten cosinustransformation
US6934676B2 (en) 2001-05-11 2005-08-23 Nokia Mobile Phones Ltd. Method and system for inter-channel signal redundancy removal in perceptual audio coding
AUPR647501A0 (en) * 2001-07-19 2001-08-09 Vast Audio Pty Ltd Recording a three dimensional auditory scene and reproducing it for the individual listener
AU2002325063B2 (en) * 2001-07-19 2007-11-01 Personal Audio Pty Ltd Recording a three dimensional auditory scene and reproducing it for the individual listener
US6987889B1 (en) * 2001-08-10 2006-01-17 Polycom, Inc. System and method for dynamic perceptual coding of macroblocks in a video frame
US6975774B2 (en) * 2002-03-18 2005-12-13 Tektronix, Inc. Quantifying perceptual information and entropy
US7426462B2 (en) * 2003-09-29 2008-09-16 Sony Corporation Fast codebook selection method in audio encoding
US7349842B2 (en) * 2003-09-29 2008-03-25 Sony Corporation Rate-distortion control scheme in audio encoding
US7283968B2 (en) * 2003-09-29 2007-10-16 Sony Corporation Method for grouping short windows in audio encoding
US7325023B2 (en) * 2003-09-29 2008-01-29 Sony Corporation Method of making a window type decision based on MDCT data in audio encoding
DE102004009954B4 (de) * 2004-03-01 2005-12-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals
DE102005010057A1 (de) 2005-03-04 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms
KR100707186B1 (ko) * 2005-03-24 2007-04-13 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체
US7418394B2 (en) * 2005-04-28 2008-08-26 Dolby Laboratories Licensing Corporation Method and system for operating audio encoders utilizing data from overlapping audio segments
KR100718132B1 (ko) * 2005-06-24 2007-05-14 삼성전자주식회사 오디오 신호의 비트스트림 생성 방법 및 장치, 그를 이용한부호화/복호화 방법 및 장치
US7917176B2 (en) * 2006-02-14 2011-03-29 Nec Laboratories America, Inc. Structured codebook and successive beamforming for multiple-antenna systems
KR101186133B1 (ko) * 2006-10-10 2012-09-27 퀄컴 인코포레이티드 오디오 신호들을 인코딩 및 디코딩하는 방법 및 장치
US8041042B2 (en) * 2006-11-30 2011-10-18 Nokia Corporation Method, system, apparatus and computer program product for stereo coding
EP2260487B1 (en) * 2008-03-04 2019-08-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Mixing of input data streams and generation of an output data stream therefrom
CN102037507B (zh) 2008-05-23 2013-02-06 皇家飞利浦电子股份有限公司 参数立体声上混合设备、参数立体声译码器、参数立体声下混合设备、参数立体声编码器
US8630848B2 (en) * 2008-05-30 2014-01-14 Digital Rise Technology Co., Ltd. Audio signal transient detection
JP5446258B2 (ja) * 2008-12-26 2014-03-19 富士通株式会社 オーディオ符号化装置
FR2943867A1 (fr) * 2009-03-31 2010-10-01 France Telecom Traitement d'egalisation de composantes spatiales d'un signal audio 3d
US20130253923A1 (en) * 2012-03-21 2013-09-26 Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Industry Multichannel enhancement system for preserving spatial cues
EP2830051A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
EP2830053A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
US5341457A (en) * 1988-12-30 1994-08-23 At&T Bell Laboratories Perceptual coding of audio signals
GB8913758D0 (en) * 1989-06-15 1989-08-02 British Telecomm Polyphonic coding
US5040217A (en) * 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals
JPH0451200A (ja) * 1990-06-18 1992-02-19 Fujitsu Ltd 音声符号化方式
CA2090052C (en) * 1992-03-02 1998-11-24 Anibal Joao De Sousa Ferreira Method and apparatus for the perceptual coding of audio signals
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
US5377051A (en) * 1993-01-13 1994-12-27 Hitachi America, Ltd. Digital video recorder compatible receiver with trick play image enhancement
US5488665A (en) * 1993-11-23 1996-01-30 At&T Corp. Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels

Also Published As

Publication number Publication date
EP0655876A1 (en) 1995-05-31
KR950016011A (ko) 1995-06-17
DE69432012T2 (de) 2003-11-06
DE69432012D1 (de) 2003-02-20
EP0655876B1 (en) 2003-01-15
CA2117829A1 (en) 1995-05-24
CA2117829C (en) 1998-06-30
US5717764A (en) 1998-02-10
US5488665A (en) 1996-01-30
JPH07199993A (ja) 1995-08-04
KR100351219B1 (ko) 2003-01-24

Similar Documents

Publication Publication Date Title
JP3970342B2 (ja) 音響信号の知覚符号化
JP3258424B2 (ja) 知覚モデルに基づく音声信号符号化方法とその装置
JP2923406B2 (ja) オーディオ信号処理方法
JP4731774B2 (ja) 高品質オーディオ用縮尺自在符号化方法
US6295009B1 (en) Audio signal encoding apparatus and method and decoding apparatus and method which eliminate bit allocation information from the encoded data stream to thereby enable reduction of encoding/decoding delay times without increasing the bit rate
KR100277819B1 (ko) 심리음향성 적응 비트 할당을 이용한 다중 채널 예측 분할대역부호화기
EP0797324B1 (en) Enhanced joint stereo coding method using temporal envelope shaping
JP5265358B2 (ja) パラメトリックマルチチャネルオーディオ符号化とマトリックスサラウンドマルチチャネル符号化との間のギャップを埋めるための概念
KR101183857B1 (ko) 다중 채널 오디오 신호를 인코딩/디코딩하기 위한 방법 및 장치
KR100947013B1 (ko) 멀티채널 오디오 신호의 시간적 및 공간적 정형
US20040174911A1 (en) Method and apparatus for encoding and/or decoding digital data using bandwidth extension technology
US20070168183A1 (en) Audio distribution system, an audio encoder, an audio decoder and methods of operation therefore
EP2395503A2 (en) Audio signal encoding and decoding method, and apparatus for same
KR20090007396A (ko) 손실 인코딩된 데이터 스트림 및 무손실 확장 데이터 스트림을 이용하여 소스 신호를 무손실 인코딩하기 위한 방법 및 장치
JP4927264B2 (ja) オーディオ信号を符号化する方法
JP3964860B2 (ja) ステレオオーディオの符号化方法、ステレオオーディオ符号化装置、ステレオオーディオの復号化方法、ステレオオーディオ復号化装置及びコンピュータで読み取り可能な記録媒体
JP3277699B2 (ja) 信号符号化方法及び装置並びに信号復号化方法及び装置
US6463405B1 (en) Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband
KR20000056661A (ko) 디지털 오디오 데이터의 역방향 디코딩 방법
KR20040086878A (ko) 대역 확장 기법을 이용한 오디오 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
JP3854313B2 (ja) 複数の情報信号のエンコーディング

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20031203

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040512

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040810

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20041208

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20050128

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070606

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100615

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110615

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110615

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120615

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130615

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term