JP2800068B2 - 少なくとも2つの信号を符号化するために選択される符号化のタイプの決定方法 - Google Patents

少なくとも2つの信号を符号化するために選択される符号化のタイプの決定方法

Info

Publication number
JP2800068B2
JP2800068B2 JP7508926A JP50892695A JP2800068B2 JP 2800068 B2 JP2800068 B2 JP 2800068B2 JP 7508926 A JP7508926 A JP 7508926A JP 50892695 A JP50892695 A JP 50892695A JP 2800068 B2 JP2800068 B2 JP 2800068B2
Authority
JP
Japan
Prior art keywords
coding
signal
signals
affected
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP7508926A
Other languages
English (en)
Other versions
JPH08507424A (ja
Inventor
ユルゲン ヘルレ
ベルンハルト グリル
エルンスト エベルライン
カールハインツ ブランデンブルク
ディーター ザイツァー
Original Assignee
フラウンホーファー ゲゼルシャフト ツア フォルデルング デア アンゲヴァンテン フォルシュング エー ファウ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from DE4345171A external-priority patent/DE4345171C2/de
Application filed by フラウンホーファー ゲゼルシャフト ツア フォルデルング デア アンゲヴァンテン フォルシュング エー ファウ filed Critical フラウンホーファー ゲゼルシャフト ツア フォルデルング デア アンゲヴァンテン フォルシュング エー ファウ
Publication of JPH08507424A publication Critical patent/JPH08507424A/ja
Application granted granted Critical
Publication of JP2800068B2 publication Critical patent/JP2800068B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Analogue/Digital Conversion (AREA)

Description

【発明の詳細な説明】 本発明は、請求項1および請求項2の序文に記載の、
各々の信号が周波数ドメインに変換され、スペクトル値
から始めて、少なくとも2つの信号の各々の場合の類似
に対して、類似の測度が決定される、少なくとも2つの
信号を符号化するために選択される符号化のタイプの決
定方法に関する。
特に、本発明は、少なくとも2つが互いに独立してい
ないが、少なくとも部分的に冗長な又は関連のない情報
を含む2以上の信号の符号化のための最適な符号化の選
択に関する。
一般的に、ディジタルオーディオ信号のデータ縮小符
号化のための方法では、信号は最初に時間ドメインから
周波数ドメインに変換される。互いに独立していない信
号に関すれば、2つ又は複数のチャネルの間の冗長度を
考慮したデータ縮小符号化を用いるのが通例である。
そのような符号化はいわゆる中心/サイド符号化とし
て知られるようになった(ジェイ.デー.ジョンストン
著,“広帯ステレオ信号の知覚変換符号化"IC ASSP,IEE
E,1989年,1993頁〜1996頁)。この中心/サイド符号化
では、左右のチャネルを基礎として、ステレオ信号の合
計又は中心が符号化される一方、他方では、ステレオ信
号の差又はサイドが符号化される。
その間に一般的となった他のタイプの符号化は、強度
ステレオの方法であり、“ステレオ音響的ディジタルオ
ーディオ信号のサブバンド符号化”(IC ASSP公表,IEE
E,トロント,3601頁〜3604頁)の表題の刊行物に記載さ
れている。強度ステレオの方法では、2つのチャネルを
基礎として、単一信号が形成され、信号の左/右分布に
よって、補助情報項目と共に送信される。
出願人のドイツ特許DE 41 36 825 C1には、信号が比
較的少しの類似を有していたり、完全に互いに独立して
いる場合、そのような方法では、強い干渉が起こり得る
ことが述べられている。中心/サイド符号化では、左右
のチャネルでの信号の強く異なったコンポジションは、
チャネルに現に存在する信号によってマスクできない人
工物となる。強度ステレオの方法を用いると、左右のチ
ャネルが、互いに十分に離れたスペクトル値を有する場
合、空間的音影響の破壊が起こり得る。
この問題に対処するために、それを基礎として異なっ
たタイプの符号化の間でスイッチングオーバーが行われ
る類似の測度を決定するために、周波数ドメインに変換
された信号のスペクトル値を用いることが、この文献で
提案されている。スペクトル値が高い類似の測度を作る
場合には、その文献に記載されている方法で中心/サイ
ド符号化が用いられ、一方、低い類似の測度の場合で、
チャネルの低いスペクトルの類似を考慮する場合、チャ
ネルの分離の符号化が行われる。心理音響学的モデルに
よって、マスキングしきい値を計算するために、符号化
される信号を用いることは、この特許から同様に既知で
ある。中心/サイド符号化のステージの下流に接続さ
れ、マスキングを考慮してデータ縮小を行うデータ縮小
ステージを駆動するために、前記マスキングしきい値は
用いられる。
DE 41 36 825 C1には、請求項8に間接的に言及する
請求項15において、零にセットされ得るスペクトル値を
決定するに際してのマスキングしきい値の使用のみが記
載されている。
変化しない中心/サイド符号化の方法と比較して、ま
た、変化しない強度ステレオの方法と比較して、ドイツ
特許41 36 825は、かなり質のよいエンハンスメントを
既に達成しているが、さらにデータ速度が縮小した場合
には、送信されるデータの質のさらなるエンハンスメン
トが望ましい。
それゆえに、本発明の目的は、この従来技術から始ま
って、符号化されたデータの質を改善するとともに、又
は、これらのデータを基礎として復号された信号の質を
改善するとともに、さらなるデータの縮小を達成する、
少なくとも2つの信号を符号化するために選択される符
号化のタイプの決定方法を提供することである。
この目的は、請求項1,請求項2及び請求項3に記載の
方法によって達成される。
本発明の第1の態様によれば、相当するスペクトル値
を生成するために、符号化の2つのタイプの1つに従っ
て符号化されるべき2つの信号の周波数変換が行われる
のみならず、同時に、信号の少なくとも1つが、高い類
似の測度の決定の場合に用いられる符号化のタイプに従
い、符号化の誤りに影響される少なくとも1つの信号を
生成するために、再び復号され、同様に周波数ドメイン
に変換される。心理音響学的計算によって決定される聴
取しきい値が、各々の実可聴スペクトルコンポーネント
を選択又は評価するのに用いられ、これは、符号化の誤
りに影響される信号のスペクトル値と、符号化の誤りに
影響されるこの信号と関連する信号のスペクトル値との
両方から始まる。続いて、それを基礎として符号化の少
なくとも2つのタイプの1つが選択される類似の測度
が、少なくとも符号化の誤りに影響される信号および関
連する信号の上記のように選択された可聴スペクトルコ
ンポーネントを基礎として計算される。
本発明の第2の態様によれば、相当するスペクトル値
を生成するために、符号化の2つのタイプの1つに従っ
て符号化されるべき2つの信号の周波数変換が行われる
のみならず、同時に、信号の少なくとも1つが、周波数
ドメインに変換された後、高い類似の測度の決定の場合
に用いられる符号化のタイプに従い、符号化の誤りに影
響される少なくとも1つの信号を生成するために、再び
復号される。心理音響学的計算によって決定される聴取
しきい値が、各々の実可聴スペクトルコンポーネントを
選択又は評価するのに用いられ、これは、符号化の誤り
に影響される信号のスペクトル値と、符号化の誤りに影
響されるこの信号と関連する信号のスペクトル値との両
方から始まる。続いて、それを基礎として符号化の少な
くとも2つのタイプの1つが選択される類似の測度が、
少なくとも符号化の誤りに影響される信号および関連す
る信号の選択され、又は、評価された可聴スペクトルコ
ンポーネントを基礎として計算される。
従来技術と対比して、本発明では、符号化の少なくと
も2つのタイプの1つの選択を行うために、データ縮小
タイプの符号化の場合に起こるような、信号のスペクト
ルコンポーネントおよび符号化の誤りに影響される相当
する信号のスペクトルコンポーネントの両方の心理音響
学的評価が使用される。
本発明の第3の態様によれば、例えば2つの異なった
チャネルに相当する2つの信号のスペクトル値から始め
て、心理音響学的計算によって決定される聴取しきい値
を用いて、実可聴スペクトルコンポーネントの選択又は
評価が行われ、それを基礎として符号化の少なくとも2
つのタイプの1つが選択される類似の測度が、少なくと
も2つの信号の上記のように選択され、又は、評価され
た可聴スペクトルコンポーネントを基礎として計算され
る。従来技術と対比して、本発明のこの方法では、符号
化された信号のデータ縮小を目的とせず、少なくとも、
それだけを目的とせず、それによって符号化のタイプの
選択が行われる類似の測度の決定のために、心理音響学
的計算によって決定される聴取しきい値が用いられる。
本発明の3つの態様に共通するこの概念は、従来技術と
明確な対照をなし、心理音響学的計算の観点からの符号
化のタイプの選択が可能となる。
本発明に係る方法の好ましい発展は、従属項に開示さ
れる。
本発明に係る方法を実施するための装置の好ましい実
施例を添付図面を参照して以下に詳細に説明するが、 図1aは、選択される符号化のタイプを決定するための
方法の重要な部分を実行するための装置の第1の実施例
を示し、 図1bは、選択される符号化のタイプを決定するための
方法の重要な部分を実行するための装置の第2の実施例
であり、第1の実施例と比較して、少し変更された実施
例を示し、 図2は、選択される符号化のタイプを決定するための
本発明に係る方法の重要な部分を実行するための装置の
第3の実施例を示し、 図3は、図1に記載の装置の出力信号を基礎として、
類似の測度を決定するための装置のブロック図を示し、 図4は、図2に記載の装置の出力信号を基礎として、
類似の測度を決定するための装置のブロック図を示し、 図5は、図1に記載の装置の出力信号を基礎として、
類似の測度を決定するための装置であり、図3と比較し
て変更された装置のブロック図を示し、 図6は、時間/周波数変換を実行し、短時間エネルギ
ーを決定するための図1及び図2に記載の装置の場合の
各々の信号の各々の第1のブロックの構造を説明するた
めのブロック図を示し、 図7は、等しくない時間/周波数分解能での人間の聴
力の特性に調和した変換を実行するための操作モード及
び、ハイブリッド又は多相フィルターバンクの構造を説
明するための表を示す。
図1aは、選択される符号化のタイプを決定するための
本発明の第1の態様に係る方法の重要な部分を実行する
ための装置のブロック図を示す。ここに示した実施例
は、2つのステレオチャネルk1,k2の分離した符号化
と、最初に引用した文献でパーセー(per se)として記
載されている“強度ステレオ符号化の方法”に係る符号
化との間のスイッチングオーバーを制御するために用い
られ得る。
しかし、ここで強調する通り、本発明に係る方法は、
2つのステレオチャネルk1,k2の分離した符号化、又
は、強度ステレオの方法に係るチャネルの符号化を選択
するのに適しているのみならず、他方より一方がより適
している符号化の少なくとも2つの任意のタイプから符
号化のタイプを選択するのに役立ち、互いに相当の類似
を有する信号の符号化は選択されず、その結果、比較的
高いビット縮小が達成される。以下に詳細に説明される
本発明に係る方法の出願は、例えばISO/MPEG層1〜3の
ように、ステレオ信号の符号化に制限されるものではな
く、例えばMPEG2について行われるような例えばマルチ
チャネル符号化にも適している。
図1aで図解するように、そこに示す装置は、それぞれ
が3つの相当するブロックb1,b2,b3を有する4つの信号
処理分岐z1,z2,z3,z4を含む。
ブロックb1は、入力側の個別時間信号k1,k2,ki1,ki2
の時間/周波数変換に用いられる。入力側のオーディオ
データを時間ドメインから周波数又はスペクトルドメイ
ンに変換するためのパーセー(per se)として知られる
任意の周波数変換方法がここで考えられる。例えばFFT,
DCT,MDCTのような方法で、多相フィルターバンク又はハ
イブリッドフィルターバンクの使用がここで考えられ
る。
しかし、以下により詳細に説明するように、本発明で
は、人間の聴力の特性に適応した等しくない時間及び周
波数分解能を有する変換方法を用いるのが好ましい。心
理音響学の分野でパーセー(per se)として知られるよ
うなこのような方法の場合には、低周波数グループのみ
が相当する幅を有する一方、周波数グループの幅は、特
定の周波数から始めて増加するが、図7の表を参照し
て、さらに詳細に説明する。周波数グループの幅及び時
間分解能の積に対して0.5のハイゼンベルグリミット
で、周波数グループの幅が増加するに従って、時間分解
能は減少する。
第2のブロックb2では、変換によって得られたスペク
トル値は、例えば相当する時間の二乗と合計によって、
独立周波数グループバンドに対する短時間エネルギー値
へと変換される。このようにして得られた独立周波数グ
ループの幅に対する短時間エネルギー値は、心理音響学
的マスキング効果を考慮する目的で実エネルギーから実
可聴コンポーネントのみを得るために、関連する信号に
対する心理音響学的計算から得られる聴取しきい値を用
いて、第3のブロックb3において、選択され、又は、評
価される。本発明の目的のために必須ではないが、ブロ
ックb3において、人間の内耳のモデル評価の目的で、内
部表現又はさらにイメージを実行することも可能であ
り、このモデル評価は、人間の内耳の非直線性を描写し
ている。この目的のためにxαの形の関数が、例えば指
数αが0.1<α<10の範囲で用いられる。
上述の計算は、値x1,x2を得るために、第1の2つの
分岐z1,z2内のステレオ信号の2つの原チャネルk1,k2の
ためだけに行われるのではない。同様に、これらの計算
は、出力値xi1,xi2を形成するために、符号化の誤りに
影響される2つの信号ki1,ki2のために実行され、符号
化の誤りに影響される値は、より大きな類似の場合に適
用される符号化のタイプを使用して後者を最初に符号化
することによって、2つの原チャネルk1,k2から得ら
れ、符号化のこのタイプは、好ましい実施例では、強度
ステレオタイプの符号化である。このように通常の符号
化によって得られた符号化された信号は、符号化の誤り
に影響される信号ki1,ki2を得るために、強度ステレオ
の方法を用いて、パーセー(per se)として知られる方
法で復号される。
出力信号x1,x2,xi1,xi2を基礎として、符号化の各々
のより有利なタイプを選択するための類似の測度の決定
は、様々な方法で行われ、図3および図5を参照して以
下の記載で説明する。しかし、符号化の誤りに影響され
ない関連する信号x1又はx2を参照して、符号化の誤りに
影響される出力信号xi1又はxi2の1つの類似だけの評価
だけで十分である。それから類似の測度が得られる出力
側のこれらのスペクトル値の間の誤りの測度は、減法に
よって最も簡単なケースで決定され得るが、計算のこの
タイプが唯一の可能なものではない。
図1bは、選択される符号化のタイプを決定するための
方法の重要な部分を実行するための装置の第2の実施例
であり、第1の実施例と比較して、少し変更された実施
例を示す。本発明のこの実施例では、第3及び第4の分
岐z3,z4内の信号k1,k2は、ブロックb1において、最初に
周波数ドメインに変換され、周波数ドメインへの変換後
まで、高い類似の測度の決定の場合に使用される符号化
のタイプに従属せず、符号化の誤りに影響される2つの
信号ki1,ki2を生成するために、再び復合される。符号
化の誤りに影響される信号ki1,ki2のスペクトル値xi1,x
i2及び符号化の誤りに影響されるこれらの信号と関連す
る信号のスペクトル値の両方から始めて、心理音響学的
計算によって決定される聴取しきい値が、各々の実可聴
スペクトルコンポーネントの選択又は評価のために用い
られる。続いて、それを基礎として符号化の少なくとも
2つのタイプの1つが選択される類似の測度が、少なく
とも符号化の誤りに影響される信号および関連する信号
の上記のように選択され、又は、評価された可聴スペク
トルコンポーネントを基礎として計算される。
本発明に係る第3の方法の各々のより適切な符号化の
方法の選択のために、類似の測度を決定するための装置
を図2に示す。図1a及び図1bと比較して、図2の装置
は、図1a及び図1bの第1の2つの分岐z1,z2と全く同じ
く一致することがわかる。第3及び第4の分岐z3,z4
は、ここでは取り除くことができる。第1の2つの分岐
z1,z2の同一性から、これらの分岐のブロックによって
実行される信号処理の新しい説明は不要である。図2の
装置では、時間/周波数変換及び短時間エネルギー値の
形成及びそれらの選択又は変換が、原チャネルk1,k2の
実可聴スペクトルコンポーネントx1,x2を得るために、
2つの原チャネルk1,k2を基礎として使用され、これら
の実可聴の選択又は評価されたスペクトルコンポーネン
トx1,x2の類似の測度は、しきい値kと比較される。類
似の測度がしきい値kを越えたならば、より高いデータ
縮小を基礎として、ほぼ相当するステレオ信号の符号化
により適する符号化のタイプが選択される。好ましい実
施例では、これには、強度ステレオ符号化の方法が用い
られる。類似の測度がこのしきい値k以下ならば、好ま
しい実施例では、チャネルは、分離して符号化される。
選択される符号化のタイプを決定する本発明に係る方
法を実行するための図1a及び図1bに示す装置の出力信号
を処理するのが可能な装置を図3に示す。ここで、スペ
クトル符号化の誤りx1引くxi1,x2引くxi2が、各々、し
きい値kと比較される。2つの誤り値x1引くxi1,x2引く
xi2が、各々、しきい値k以下ならば、より強いデータ
縮小方法が用いられ、好ましい実施例では、強度ステレ
オの方法である。
図5は、選択される符号化のタイプを決定する図1a及
び図1bに示す装置の出力信号を基礎として、図3に係る
類似の測度を決定するための装置の変更された実施例を
示す。2つの相互に相当する回路セクションは、xi1引
くx1,xi2引くx2の差が、各々、符号化の誤り信号を生成
するために形成されるノード及び各々の場合に1つの信
号ブロックを通して、各々の相当する有効信号x1及びx2
のみならず、各々の誤り信号xi1引くx1,xi2引くx2を合
計するための2つのブロックb4,b5を各々含む。これら
の誤り及び有効信号コンポーネントのブロックでの絶対
合計後、合計された絶対誤り信号の商が、合計された絶
対有効信号を参照して、さらに先のブロックb6で形成さ
れ、しきい値kと比較される。誤りの関連する測度が、
2つのチャネルの1つで、しきい値kを越えると、いか
なる強度ステレオ符合化も行われないが、分離した符号
化が使用されなければならない。
ここでの目的は、図6を参照して、各々、図1a,図1b
及び図2に記載の分岐z1,z2及びz1〜z4のブロックb1及
びb2の可能な実施例について説明することである。しか
し、単オーディオ信号の時間/周波数変換及び短時間エ
ネルギー値の形成は、共に、符号化のタイプの選択の分
野の当業者にとってそうでないとしても、符号化の分野
の当業者にとっては、知られている方法であることをこ
こで強調しておく。
図6に示すように、単入力信号は、32(0〜31)の
“多バンド”での時間単入力信号の時間/周波数変換を
行う多相フィルターバンクPFに供給される。これらのバ
ンドに関しては、図7の右側の部分の“多相実装",左及
び中央欄を参照できる。当業者が図7から理解できるよ
うに、各々のスケールファクタバンドに対するバンド幅
は、人間の聴力の特性の周波数グループ幅及び関連する
時間分解能をシミュレーションするために、周波数の点
で低いスケールファクタバンド数の場合には一定であ
り、限界周波数まで上がらない。32の多バンド(0〜3
1)のスペクトル値は、ブロックb2aで、続いて、多相フ
ィルターバンクb1で、エネルギー値を形成するために二
乗される。一方、これに続くブロックでは、各々異なる
合計長さ(図7の右側の欄を比較する)を通して、各々
のスケールファクタバンドに対する短時間エネルギー値
を計算するために、合計が行われ、合計長さは、各々、
合計される連続値の数を示す。さらに、32の多バンド
が、適当な周波数バンドを結合することによって、スケ
ールファクタバンドの縮小数を形成するために結合され
る。ISO層IIIの場合には、21のスケールファクタバンド
の合計が選択され、短時間エネルギーの形成は、SB−N
o.10からの連続値の合計によって、各々のスケールファ
クタバンドのために実装される。
心理音響学的に計算された聴取しきい値の使用による
聴度の点での個々のスペクトル値の重み付けは、一般的
な専門知識であるので、図6と図1又は図2に係るブロ
ックb3のより詳細な実施例は再現しないこととする。
聴取しきい値の計算の目的で以下の専門文献が参照で
きる。「ISO/IEC 11172 国際標準“1.5Mbit/sまでのデ
ィジタル記憶媒体の動画及び関連するオーディオの符号
化",第3部:オーディオ,付録D:心理音響学的モデル」 聴度及び内部表現の点でのスペクトルコンポーネント
の重み付けに関しては、以下の標準文献が参照できる。
「ジョン ジー ビアエンド,ジャン エー ステマ
ーディンク著:“心理音響学的音表現に基づく知覚オー
ディオ質測度",オーディオ工学協会誌,40巻,No.12,1992
年12月」 「イー ジッカー,エッチ ファステル著:“心理音
響学",スプリンガー フェアラーク,ベルリン ハイデ
ルベルク,1990年,8.7.1章“特定ラウドネス”」
───────────────────────────────────────────────────── フロントページの続き (72)発明者 エベルライン エルンスト ドイツ連邦共和国 D―91091 グロー センゼーバッハ ヴァルトシュトラーセ 28 ベー (72)発明者 ブランデンブルク カールハインツ ドイツ連邦共和国 D―91054 エアラ ンゲン ハーグシュトラーセ 32 (72)発明者 ザイツァー ディーター ドイツ連邦共和国 D―91054 エアラ ンゲン フンボルトシュトラーセ 14 (56)参考文献 特開 平6−242798(JP,A) 特開 平6−242797(JP,A) 特開 平3−167927(JP,A) 特表 平8−501666(JP,A) 特表 平7−508375(JP,A) (58)調査した分野(Int.Cl.6,DB名) H03M 7/30 G10L 9/18 H04N 5/00 H04S 5/00,7/00

Claims (9)

    (57)【特許請求の範囲】
  1. 【請求項1】信号の周波数ドメインへの変換が行われ、
    スペクトル値から始めて、符号化の少なくとも2つのタ
    イプの選択された1つを基礎として、類似の測度が決定
    される、少なくとも2つの信号(k1,k2)を符号化する
    ために選択される符号化のタイプの決定方法において、 符号化の誤りに影響される少なくとも1つの信号(ki1,
    ki2)を生成するために、高い類似の測度の決定の場合
    に用いられる符号化のタイプで、信号(k1,k2)の少な
    くとも1つが符号化され、復号され、 符号化の誤りに影響される信号(ki1,ki2)及び符号化
    の誤りに影響されない関連する信号(k1,k2)が周波数
    ドメインに変換され、 符号化の誤りに影響される信号のスペクトル値及び符号
    化の誤りに影響されない関連する信号のスペクトル値の
    両方から始めて、心理音響学的計算によって決定される
    聴取しきい値を用いて、各々の実可聴スペクトルコンポ
    ーネントの選択又は評価が行われ、 少なくとも符号化の誤りに影響される信号及び符号化の
    誤りに影響されない関連する信号の上記のように選択さ
    れ又は評価された可聴スペクトルコンポーネントを基礎
    として、類似の測度が計算されることを特徴とする、方
    法。
  2. 【請求項2】信号の周波数ドメインへの変換が行われ、
    スペクトル値から始めて、符号化の少なくとも2つのタ
    イプの選択された1つを基礎として、類似の測度が決定
    される、少なくとも2つの信号(k1,k2)を符号化する
    ために選択される符号化のタイプの決定方法において、 周波数ドメインへの変換後、符号化の誤りに影響される
    少なくとも1つの信号(ki1,ki2)を生成するために、
    高い類似の測度の決定の場合に用いられる符号化のタイ
    プで、信号(k1,k2)の少なくとも1つが符号化され、
    復号され、 符号化の誤りに影響される信号のスペクトル値及び符号
    化の誤りに影響されない関連する信号のスペクトル値の
    両方から始めて、心理音響学的計算によって決定される
    聴取しきい値を用いて、各々の実可聴スペクトルコンポ
    ーネントの選択又は評価が行われ、 少なくとも符号化の誤りに影響される信号及び符号化の
    誤りに影響されない関連する信号の上記のように選択さ
    れ又は評価された可聴スペクトルコンポーネントを基礎
    として、類似の測度が計算されることを特徴とする、方
    法。
  3. 【請求項3】少なくとも2つの信号の周波数ドメインへ
    の変換が行われ、スペクトル値から始めて、符号化の少
    なくとも2つのタイプの選択された1つを基礎として、
    これらの信号の相互の類似に対する類似の測度が決定さ
    れる、少なくとも2つの信号(k1,k2)を符号化するた
    めに選択される符号化のタイプの決定方法において、 各々の信号(k1,k2)のスペクトル値から始めて、心理
    音響学的計算によって決定される聴取しきい値を用い
    て、実可聴スペクトルコンポーネントの選択又は評価が
    行われ、 符号化のタイプを選択する目的のための少なくとも2つ
    の信号(k1,k2)の上記のように選択され又は評価され
    た可聴スペクトルコンポーネントを基礎として、類似の
    測度が決定されることを特徴とする、方法。
  4. 【請求項4】各々の信号(k1,k2)の実可聴スペクトル
    コンポーネントの選択又は評価の目的のために、周波数
    グループ幅の機能として選択される周波数ドメイン内の
    短時間エネルギー値が最初に決定され、 可聴エネルギー値が、計算された聴取しきい値と比較す
    ることによって、これらの短時間エネルギー値から選択
    され、又は、評価されることを特徴とする、請求項1な
    いし請求項3のいずれかに記載の方法。
  5. 【請求項5】周波数グループ幅の増加の場合に関する周
    波数ドメインに対する人間の耳の時間分解能に従って減
    少する周期の間、各々の周波数ドメインに対して、短時
    間エネルギー値が決定されることを特徴とする、請求項
    4に記載の方法。
  6. 【請求項6】実可聴スペクトル値を選択し、又は、評価
    する目的のため、人間の内耳の非直線性を描写した機能
    が、選択又は評価されたスペクトルコンポーネントに適
    用されることを特徴とする、請求項4または請求項5に
    記載の方法。
  7. 【請求項7】人間の内耳の非直線性を描写した機能は
    (Xα)の形で、指数αは0.1<α<10の範囲であるこ
    とを特徴とする、請求項6に記載の方法。
  8. 【請求項8】関連する少なくとも1つの信号(k1,k2)
    のスペクトルコンポーネント(x1,x2)のみならず、符
    号化の誤りに影響される少なくとも1つの信号(ki1,ki
    2)の実可聴スペクトルコンポーネント(xi1,xi2)の変
    換及び選択又は評価は、各々のチャネルに対して行わ
    れ、 類似の測度は、各チャネルに対する誤りの各々の測度を
    基礎として決定され、誤りの各々の測度は、符号化の誤
    りに影響されない関連する信号(x1,x2)のみならず、
    符号化の誤りに影響される信号(ki1,ki2)の可聴スペ
    クトルコンポーネント(xi1,x1;xi2,x2)を基礎として
    各々のチャネルに対して決定されることを特徴とする、
    請求項1または請求項2に記載の方法。
  9. 【請求項9】類似の測度は、しきい値(k)と比較さ
    れ、 類似の測度がしきい値kを下まわる場合、チャネルの分
    離した符号化が行われる一方、他の場合には、チャネル
    の強度ステレオ符号化が行われることを特徴とする、請
    求項1ないし請求項8のいずれかに記載の方法。
JP7508926A 1993-09-15 1994-07-08 少なくとも2つの信号を符号化するために選択される符号化のタイプの決定方法 Expired - Lifetime JP2800068B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
DE4331376.0 1993-09-15
DE4331376A DE4331376C1 (de) 1993-09-15 1993-09-15 Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
DE4345171A DE4345171C2 (de) 1993-09-15 1993-09-15 Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
DE4345171.3 1993-09-15

Publications (2)

Publication Number Publication Date
JPH08507424A JPH08507424A (ja) 1996-08-06
JP2800068B2 true JP2800068B2 (ja) 1998-09-21

Family

ID=25929591

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7508926A Expired - Lifetime JP2800068B2 (ja) 1993-09-15 1994-07-08 少なくとも2つの信号を符号化するために選択される符号化のタイプの決定方法

Country Status (11)

Country Link
US (1) US5736943A (ja)
EP (1) EP0719483B1 (ja)
JP (1) JP2800068B2 (ja)
KR (1) KR0171100B1 (ja)
AT (1) ATE152871T1 (ja)
AU (1) AU678270B2 (ja)
CA (1) CA2161263C (ja)
DE (1) DE4331376C1 (ja)
DK (1) DK0719483T3 (ja)
RU (1) RU2124272C1 (ja)
WO (1) WO1995008227A1 (ja)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4437287C2 (de) * 1994-10-18 1996-10-24 Fraunhofer Ges Forschung Verfahren zur Messung der Erhaltung stereophoner Audiosignale und Verfahren zur Erkennung gemeinsam codierter stereophoner Audiosignale
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
DE19628293C1 (de) * 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
DE19628292B4 (de) * 1996-07-12 2007-08-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Codieren und Decodieren von Stereoaudiospektralwerten
DE19706268A1 (de) * 1997-02-18 1998-08-20 Christian Wenz Dateiformatspezifisches Packverfahren
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
DE19742655C2 (de) * 1997-09-26 1999-08-05 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Codieren eines zeitdiskreten Stereosignals
US6012025A (en) * 1998-01-28 2000-01-04 Nokia Mobile Phones Limited Audio coding method and apparatus using backward adaptive prediction
JP4831117B2 (ja) * 1998-10-13 2011-12-07 日本ビクター株式会社 音声符号化方法及び音声復号方法
DE60132853D1 (de) * 2000-07-07 2008-04-03 Nokia Siemens Networks Oy Verfahren und Vorrichtung für die perzeptuelle Tonkodierung von einem mehrkanal Tonsignal mit Verwendung der kaskadierten diskreten Cosinustransformation oder der modifizierten diskreten Cosinustransformation
JP4618873B2 (ja) * 2000-11-24 2011-01-26 パナソニック株式会社 オーディオ信号符号化方法、オーディオ信号符号化装置、音楽配信方法、および、音楽配信システム
US6654827B2 (en) 2000-12-29 2003-11-25 Hewlett-Packard Development Company, L.P. Portable computer system with an operating system-independent digital data player
US7539615B2 (en) * 2000-12-29 2009-05-26 Nokia Siemens Networks Oy Audio signal quality enhancement in a digital network
US7660424B2 (en) * 2001-02-07 2010-02-09 Dolby Laboratories Licensing Corporation Audio channel spatial translation
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
ATE288617T1 (de) 2001-11-29 2005-02-15 Coding Tech Ab Wiederherstellung von hochfrequenzkomponenten
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
EP1611772A1 (en) * 2003-03-04 2006-01-04 Nokia Corporation Support of a multichannel audio extension
TWI393120B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 用於音訊信號編碼及解碼之方法和系統、音訊信號編碼器、音訊信號解碼器、攜帶有位元流之電腦可讀取媒體、及儲存於電腦可讀取媒體上的電腦程式
CN1969318B (zh) * 2004-09-17 2011-11-02 松下电器产业株式会社 音频编码装置、解码装置以及方法
US8902977B2 (en) 2006-01-09 2014-12-02 Thomson Licensing Method and apparatus for providing reduced resolution update mode for multi-view video coding
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
MX2008012382A (es) * 2006-03-29 2008-11-18 Thomson Licensing Metodos y aparatos para usarse en un sistema de codificacion de video de multiples vistas.
CN101611633B (zh) 2006-07-06 2012-10-03 汤姆逊许可证公司 用于针对多视角视频编码和解码解耦合帧号和/或图像顺序计数(poc)的方法和装置
RU2443074C2 (ru) * 2006-07-06 2012-02-20 Томсон Лайсенсинг Способ и устройство для отделения номера кадра и/или счетчика очередности изображения (рос) для мультивидового видеокодирования и видеодекодирования
RU2459283C2 (ru) * 2007-03-02 2012-08-20 Панасоник Корпорэйшн Кодирующее устройство, декодирующее устройство и способ
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
WO2009150290A1 (en) * 2008-06-13 2009-12-17 Nokia Corporation Method and apparatus for error concealment of encoded audio data
US8620643B1 (en) 2009-07-31 2013-12-31 Lester F. Ludwig Auditory eigenfunction systems and methods
JP5533502B2 (ja) * 2010-09-28 2014-06-25 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
WO2014170530A1 (en) * 2013-04-15 2014-10-23 Nokia Corporation Multiple channel audio signal encoder mode determiner
CN105741835B (zh) * 2016-03-18 2019-04-16 腾讯科技(深圳)有限公司 一种音频信息处理方法及终端

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5341457A (en) * 1988-12-30 1994-08-23 At&T Bell Laboratories Perceptual coding of audio signals
DE4136825C1 (ja) * 1991-11-08 1993-03-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
DE4217276C1 (ja) * 1992-05-25 1993-04-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De
US5278909A (en) * 1992-06-08 1994-01-11 International Business Machines Corporation System and method for stereo digital audio compression with co-channel steering
JP3123286B2 (ja) * 1993-02-18 2001-01-09 ソニー株式会社 ディジタル信号処理装置又は方法、及び記録媒体
US5581654A (en) * 1993-05-25 1996-12-03 Sony Corporation Method and apparatus for information encoding and decoding

Also Published As

Publication number Publication date
AU7187994A (en) 1995-04-03
US5736943A (en) 1998-04-07
AU678270B2 (en) 1997-05-22
DE4331376C1 (de) 1994-11-10
WO1995008227A1 (de) 1995-03-23
EP0719483A1 (de) 1996-07-03
DK0719483T3 (da) 1997-08-25
CA2161263C (en) 1999-06-15
CA2161263A1 (en) 1995-03-23
EP0719483B1 (de) 1997-05-07
RU2124272C1 (ru) 1998-12-27
KR0171100B1 (ko) 1999-03-30
ATE152871T1 (de) 1997-05-15
JPH08507424A (ja) 1996-08-06

Similar Documents

Publication Publication Date Title
JP2800068B2 (ja) 少なくとも2つの信号を符号化するために選択される符号化のタイプの決定方法
EP2301016B1 (en) Efficient use of phase information in audio encoding and decoding
KR101251426B1 (ko) 디코딩 명령으로 오디오 신호를 인코딩하기 위한 장치 및방법
EP2175671B1 (en) Method, device, encoder apparatus, decoder apparatus and audio system
US7693721B2 (en) Hybrid multi-channel/cue coding/decoding of audio signals
JP3926399B2 (ja) オーディオ信号コーディング中にノイズ置換を信号で知らせる方法
JP5284638B2 (ja) 方法、デバイス、エンコーダ装置、デコーダ装置、及びオーディオシステム
US8583424B2 (en) Spatial synthesis of multichannel audio signals
US5812672A (en) Method for reducing data in the transmission and/or storage of digital signals of several dependent channels
KR20110082553A (ko) 멀티-채널 오디오 신호의 바이노럴 렌더링
KR101637407B1 (ko) 부가적인 출력 채널들을 제공하기 위하여 스테레오 출력 신호를 발생시키기 위한 장치와 방법 및 컴퓨터 프로그램
KR100917845B1 (ko) 상호상관을 이용한 다채널 오디오 신호 복호화 장치 및 그방법
JP3993229B2 (ja) 第1および第2主信号成分の送信および受信
EP1345332A1 (en) Coding method, apparatus, decoding method, and apparatus
Brandenburg Introduction to perceptual coding
Bosi High-quality multichannel audio coding: Trends and challenges
Baumgarte et al. Audio coder enhancement using scalable binaural cue coding with equalized mixing
CN101097716A (zh) 数字信号处理设备、处理方法和再现设备
JPH09135173A (ja) 符号化装置および符号化方法、復号化装置および復号化方法、伝送装置および伝送方法、並びに記録媒体
JPH11508110A (ja) 複数の情報信号のエンコーディング
Reimers et al. MPEG Source Coding of Audio Signals
JPH09102741A (ja) 符号化方法および装置、復号化方法および装置、並びに記録媒体

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080710

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080710

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090710

Year of fee payment: 11

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term