JPH08507424A - 少なくとも2つの信号を符号化するために選択される符号化のタイプの決定方法 - Google Patents

少なくとも2つの信号を符号化するために選択される符号化のタイプの決定方法

Info

Publication number
JPH08507424A
JPH08507424A JP7508926A JP50892695A JPH08507424A JP H08507424 A JPH08507424 A JP H08507424A JP 7508926 A JP7508926 A JP 7508926A JP 50892695 A JP50892695 A JP 50892695A JP H08507424 A JPH08507424 A JP H08507424A
Authority
JP
Japan
Prior art keywords
coding
signal
signals
affected
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7508926A
Other languages
English (en)
Other versions
JP2800068B2 (ja
Inventor
ユルゲン ヘルレ
ベルンハルト グリル
エルンスト エベルライン
カールハインツ ブランデンブルク
ディーター ザイツァー
Original Assignee
フラウンホーファー ゲゼルシャフト ツア フォルデルング デア アンゲヴァンテン フォルシュング エー ファウ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from DE4345171A external-priority patent/DE4345171C2/de
Application filed by フラウンホーファー ゲゼルシャフト ツア フォルデルング デア アンゲヴァンテン フォルシュング エー ファウ filed Critical フラウンホーファー ゲゼルシャフト ツア フォルデルング デア アンゲヴァンテン フォルシュング エー ファウ
Publication of JPH08507424A publication Critical patent/JPH08507424A/ja
Application granted granted Critical
Publication of JP2800068B2 publication Critical patent/JP2800068B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

(57)【要約】 互いに独立していない複数の信号(k1,k2)の符号化の場合に、符号化の適切なタイプの選択が、類似の測度の機能として行われる。本発明の1つの態様によれば、類似の測度は、符号化の誤りに影響される信号(ki1,ki2)を作るために、輝度−ステレオの方法に従って、信号(k1,k2)の1つを最初に符号化し、それを復号することによって決定され、後者の信号及び関連する信号は周波数ドメインに変換される。周波数ドメインでは、精神音響計算によって決定される聴取しきい値を用いて、符号化の誤りに影響されない関連する信号(k1,k2)のみならず、符号化の誤りに影響される信号(ki1,ki2)の実オーディオスペクトルコンポーネントの選択又は評価が行われる。輝度−ステレオ符号化は、高い類似の測度の場合に行われ、他の場合には、チャネルの分離した符号化が行われる。

Description

【発明の詳細な説明】 少なくとも2つの信号を符号化するために 選択される符号化のタイプの決定方法 本発明は、請求項1および請求項2の序文に記載の、各々の信号が周波数ドメ インに変換され、スペクトル値から始めて、少なくとも2つの信号の各々の場合 の類似に対して、類似の測度が決定される、少なくとも2つの信号を符号化する ために選択される符号化のタイプの決定方法に関する。 特に、本発明は、少なくとも2つが互いに独立していないが、少なくとも部分 的に冗長な又は関連のない情報を含む2以上の信号の符号化のための最適な符号 化の選択に関する。 一般的に、ディジタルオーディオ信号のデータ縮小符号化のための方法では、 信号は最初に時間ドメインから周波数ドメインに変換される。互いに独立してい ない信号に関すれば、2つ又は複数のチャネルの間の冗長度を考慮したデータ縮 小符号化を用いるのが通例である。 そのような符号化はいわゆる中心/サイド符号化として知られるようになった (ジェイ.デー.ジョンストン著,”広帯ステレオ信号の知覚変換符号化”IC ASSP,IEEE,1989年,1993頁〜1996頁)。この中心/サ イド符号化では、左右のチャネルを基礎として、ステレオ信号の合計又は中心が 符号化される一方、他方では、ステレオ信号の差又はサイドが符号化される。 その間に一般的となった他のタイプの符号化は、輝度−ステレオの方法であり 、”ステレオ音響的ディジタルオーディオ信号のサブバンド符号化”(IC A SSP公表,IEEE,トロント,3601頁〜3604頁)の表題の刊行物に 記載されている。輝度−ス テレオの方法では、2つのチャネルを基礎として、単一信号が形成され、信号の 左/右分布によって、補助情報項目と共に送信される。 出願人のドイツ特許DE 41 36 825 C1には、信号が比較的少し の類似を有していたり、完全に互いに独立している場合、そのような方法では、 強い干渉が起こり得ることが述べられている。中心/サイド符号化では、左右の チャネルでの信号の強く異なったコンポジションは、チャネルに現に存在する信 号によってマスクできない人工物となる。輝度−ステレオの方法を用いると、左 右のチャネルが、互いに十分に離れたスペクトル値を有する場合、空間的音影響 の破壊が起こり得る。 この問題に対処するために、それを基礎として異なったタイプの符号化の間で スイッチングオーバーが行われる類似の測度を決定するために、周波数ドメイン に変換された信号のスペクトル値を用いることが、この文献で提案されている。 スペクトル値が高い類似の測度を作る場合には、その文献に記載されている方法 で中心/サイド符号化が用いられ、一方、低い類似の測度の場合で、チャネルの 低いスペクトルの類似を考慮する場合、チャネルの分離の符号化が行われる。精 神音響モデルによって、マスキングしきい値を計算するために、符号化される信 号を用いることは、この特許から同様に既知である。中心/サイド符号化のステ ージの下流に接続され、マスキングを考慮してデータ縮小を行うデータ縮小ステ ージを駆動するために、前記マスキングしきい値は用いられる。 DE 41 36 825 C1には、請求項8に間接的に言及する請求項1 5において、零にセットされ得るスペクトル値を決定するに際してのマスキング しきい値の使用のみが記載されている。 変化しない中心/サイド符号化の方法と比較して、また、変化しない輝度−ス テレオの方法と比較して、ドイツ特許41 36 8 25は、かなり質のよいエンハンスメントを既に達成しているが、さらにデータ 速度が縮小した場合には、送信されるデータの質のさらなるエンハンスメントが 望ましい。 それゆえに、本発明の目的は、この従来技術から始まって、符号化されたデー タの質を改善するとともに、又は、これらのデータを基礎として復号された信号 の質を改善するとともに、さらなるデータの縮小を達成する、少なくとも2つの 信号を符号化するために選択される符号化のタイプの決定方法を提供することで ある。 この目的は、請求項1,請求項2及び請求項3に記載の方法によって達成され る。 本発明の第1の態様によれば、相当するスペクトル値を生成するために、符号 化の2つのタイプの1つに従って符号化されるべき2つの信号の周波数変換が行 われるのみならず、同時に、信号の少なくとも1つが、高い類似の測度の決定の 場合に用いられる符号化のタイプに従い、符号化の誤りに影響される少なくとも 1つの信号を生成するために、再び復号され、同様に周波数ドメインに変換され る。精神音響計算によって決定される聴取しきい値が、各々の実オーディオスペ クトルコンポーネントを選択又は評価するのに用いられ、これは、符号化の誤り に影響される信号のスペクトル値と、符号化の誤りに影響されるこの信号と関連 する信号のスペクトル値との両方から始まる。続いて、それを基礎として符号化 の少なくとも2つのタイプの1つが選択される類似の測度が、少なくとも符号化 の誤りに影響される信号および関連する信号の上記のように選択されたオーディ オスペクトルコンポーネントを基礎として計算される。 本発明の第2の態様によれば、相当するスペクトル値を生成するために、符号 化の2つのタイプの1つに従って符号化されるべき2つの信号の周波数変換が行 われるのみならず、同時に、信号の少な くとも1つが、周波数ドメインに変換された後、高い類似の測度の決定の場合に 用いられる符号化のタイプに従い、符号化の誤りに影響される少なくとも1つの 信号を生成するために、再び復号される。精神音響計算によって決定される聴取 しきい値が、各々の実オーディオスペクトルコンポーネントを選択又は評価する のに用いられ、これは、符号化の誤りに影響される信号のスペクトル値と、符号 化の誤りに影響されるこの信号と関連する信号のスペクトル値との両方から始ま る。続いて、それを基礎として符号化の少なくとも2つのタイプの1つが選択さ れる類似の測度が、少なくとも符号化の誤りに影響される信号および関連する信 号の選択され、又は、評価されたオーディオスペクトルコンポーネントを基礎と して計算される。 従来技術と対比して、本発明では、符号化の少なくとも2つのタイプの1つの 選択を行うために、データ縮小タイプの符号化の場合に起こるような、信号のス ペクトルコンポーネントおよび符号化の誤りに影響される相当する信号のスペク トルコンポーネントの両方の精神音響評価が使用される。 本発明の第3の態様によれば、例えば2つの異なったチャネルに相当する2つ の信号のスペクトル値から始めて、精神音響計算によって決定される聴取しきい 値を用いて、実オーディオスペクトルコンポーネントの選択又は評価が行われ、 それを基礎として符号化の少なくとも2つのタイプの1つが選択される類似の測 度が、少なくとも2つの信号の上記のように選択され、又は、評価されたオーデ ィオスペクトルコンポーネントを基礎として計算される。従来技術と対比して、 本発明のこの方法では、符号化された信号のデータ縮小を目的とせず、少なくと も、それだけを目的とせず、それによって符号化のタイプの選択が行われる類似 の測度の決定のために、精神音響計算によって決定される聴取しきい値が用いら れる。本発明 の3つの態様に共通するこの概念は、従来技術と明確な対照をなし、精神音響の 観点からの符号化のタイプの選択が可能となる。 本発明に係る方法の好ましい発展は、従属項に開示される。 本発明に係る方法を実施するための装置の好ましい実施例を添付図面を参照し て以下に詳細に説明するが、 図1aは、選択される符号化のタイプを決定するための方法の重要な部分を実 行するための装置の第1の実施例を示し、 図1bは、選択される符号化のタイプを決定するための方法の重要な部分を実 行するための装置の第2の実施例であり、第1の実施例と比較して、少し変更さ れた実施例を示し、 図2は、選択される符号化のタイプを決定するための本発明に係る方法の重要 な部分を実行するための装置の第3の実施例を示し、 図3は、図1に記載の装置の出力信号を基礎として、類似の測度を決定するた めの装置のブロック図を示し、 図4は、図2に記載の装置の出力信号を基礎として、類似の測度を決定するた めの装置のブロック図を示し、 図5は、図1に記載の装置の出力信号を基礎として、類似の測度を決定するた めの装置であり、図3と比較して変更された装置のブロック図を示し、 図6は、時間/周波数変換を実行し、短時間エネルギーを決定するための図1 及び図2に記載の装置の場合の各々の信号の各々の第1のブロックの構造を説明 するためのブロック図を示し、 図7は、等しくない時間/周波数分解能での人間の聴力の特性に調和した変換 を実行するための操作モード及び、ハイブリッド又は多相フィルターバンクの構 造を説明するための表を示す。 図1aは、選択される符号化のタイプを決定するための本発明の第1の態様に 係る方法の重要な部分を実行するための装置のブロック図を示す。ここに示した 実施例は、2つのステレオチャネルk1 ,k2の分離した符号化と、最初に引用した文献でパーセー(per se)と して記載されている”輝度−ステレオ符号化の方法”に係る符号化との間のスイ ッチングオーバーを制御するために用いられ得る。 しかし、ここで強調する通り、本発明に係る方法は、2つのステレオチャネル k1,k2の分離した符号化、又は、輝度−ステレオの方法に係るチャネルの符 号化を選択するのに適しているのみならず、他方より一方がより適している符号 化の少なくとも2つの任意のタイプから符号化のタイプを選択するのに役立ち、 互いに相当の類似を有する信号の符号化は選択されず、その結果、比較的高いビ ット縮小が達成される。以下に詳細に説明される本発明に係る方法の出願は、例 えばISO/MPEG層1〜3のように、ステレオ信号の符号化に制限されるも のではなく、例えばMPEG2について行われるような例えばマルチチャネル符 号化にも適している。 図1aで図解するように、そこに示す装置は、それぞれが3つの相当するブロ ックb1,b2,b3を有する4つの信号処理分岐z1,z2,z3,z4を含 む。 ブロックb1は、入力側の個別時間信号k1,k2,ki1,ki2の時間/ 周波数変換に用いられる。入力側のオーディオデータを時間ドメインから周波数 又はスペクトルドメインに変換するためのパーセー(per se)として知ら れる任意の周波数変換方法がここで考えられる。例えばFFT,DCT,MDC Tのような方法で、多相フィルターバンク又はハイブリッドフィルターバンクの 使用がここで考えられる。 しかし、以下により詳細に説明するように、本発明では、人間の聴力の特性に 適応した等しくない時間及び周波数分解能を有する変換方法を用いるのが好まし い。精神音響の分野でパーセー(per se)として知られるようなこのよう な方法の場合には、低周波 数グループのみが相当する幅を有する一方、周波数グループの幅は、特定の周波 数から始めて増加するが、図7の表を参照して、さらに詳細に説明する。周波数 グループの幅及び時間分解能の積に対して0.5のハイゼンベルグリミットで、 周波数グループの幅が増加するに従って、時間分解能は減少する。 第2のブロックb2では、変換によって得られたスペクトル値は、例えば相当 する時間の二乗と合計によって、独立周波数グループバンドに対する短時間エネ ルギー値へと変換される。このようにして得られた独立周波数グループの幅に対 する短時間エネルギー値は、精神音響マスキング効果を考慮する目的で実エネル ギーから実オーディオコンポーネントのみを得るために、関連する信号に対する 精神音響計算から得られる聴取しきい値を用いて、第3のブロックb3において 、選択され、又は、評価される。本発明の目的のために必須ではないが、ブロッ クb3において、人間の内耳のモデル評価の目的で、内部表現又はさらにイメー ジを実行することも可能であり、このモデル評価は、人間の内耳の非直線性を描 写している。この目的のために、xαの形の関数が、例えば指数αが0.1<α <10の範囲で用いられる。 上述の計算は、値x1,x2を得るために、第1の2つの分岐z1,z2内の ステレオ信号の2つの原チャネルk1,k2のためだけに行われるのではない。 同様に、これらの計算は、出力値xi1,xi2を形成するために、符号化の誤 りに影響される2つの信号ki1,ki2のために実行され、符号化の誤りに影 響される値は、より大きな類似の場合に適用される符号化のタイプを使用して後 者を最初に符号化することによって、2つの原チャネルk1,k2から得られ、 符号化のこのタイプは、好ましい実施例では、輝度−ステレオタイプの符号化で ある。このように通常の符号化によって得られた符号化された信号は、符号化の 誤りに影響される信号ki 1,ki2を得るために、輝度−ステレオの方法を用いて、パーセー(per se)として知られる方法で復号される。 出力信号x1,x2,xi1,xi2を基礎として、符号化の各々のより有利 なタイプを選択するための類似の測度の決定は、様々な方法で行われ、図3およ び図5を参照して以下の記載で説明する。しかし、符号化の誤りに影響されない 関連する信号x1又はx2を参照して、符号化の誤りに影響される出力信号xi 1又はxi2の1つの類似だけの評価だけで十分である。それから類似の測度が 得られる出力側のこれらのスペクトル値の間の誤りの測度は、減法によって最も 簡単なケースで決定され得るが、計算のこのタイプが唯一の可能なものではない 。 図1bは、選択される符号化のタイプを決定するための方法の重要な部分を実 行するための装置の第2の実施例であり、第1の実施例と比較して、少し変更さ れた実施例を示す。本発明のこの実施例では、第3及び第4の分岐z3,z4内 の信号k1,k2は、ブロックb1において、最初に周波数ドメインに変換され 、周波数ドメインへの変換後まで、高い類似の測度の決定の場合に使用される符 号化のタイプに従属せず、符号化の誤りに影響される2つの信号ki1,ki2 を生成するために、再び復合される。符号化の誤りに影響される信号ki1,k i2のスペクトル値xi1,xi2及び符号化の誤りに影響されるこれらの信号 と関連する信号のスペクトル値の両方から始めて、精神音響計算によって決定さ れる聴取しきい値が、各々の実オーディオスペクトルコンポーネントの選択又は 評価のために用いられる。続いて、それを基礎として符号化の少なくとも2つの タイプの1つが選択される類似の測度が、少なくとも符号化の誤りに影響される 信号および関連する信号の上記のように選択され、又は、評価されたオーディオ スペクトルコンポーネントを基礎として計算される。 本発明に係る第3の方法の各々のより適切な符号化の方法の選択のために、類 似の測度を決定するための装置を図2に示す。図1a及び図1bと比較して、図 2の装置は、図1a及び図1bの第1の2つの分岐z1,z2と全く同じく一致 することがわかる。第3及び第4の分岐z3,z4は、ここでは取り除くことが できる。第1の2つの分岐z1,z2の同一性から、これらの分岐のブロックに よって実行される信号処理の新しい説明は不要である。図2の装置では、時間/ 周波数変換及び短時間エネルギー値の形成及びそれらの選択又は変換が、原チャ ネルk1,k2の実オーディオスペクトルコンポーネントx1,x2を得るため に、2つの原チャネルk1,k2を基礎として使用され、これらの実オーディオ の選択又は評価されたスペクトルコンポーネントx1,x2の類似の測度は、し きい値kと比較される。類似の測度がしきい値kを越えたならば、より高いデー タ縮小を基礎として、ほぼ相当するステレオ信号の符号化により適する符号化の タイプが選択される。好ましい実施例では、これには、輝度−ステレオ符号化の 方法が用いられる。類似の測度がこのしきい値k以下ならば、好ましい実施例で は、チャネルは、分離して符号化される。 選択される符号化のタイプを決定する本発明に係る方法を実行するための図1 a及び図1bに示す装置の出力信号を処理するのが可能な装置を図3に示す。こ こで、スペクトル符号化の誤りx1引くxi1,x2引くxi2が、各々、しき い値kと比較される。2つの誤り値x1引くxi1,x2引くxi2が、各々、 しきい値k以下ならば、より強いデータ縮小方法が用いられ、好ましい実施例で は、輝度−ステレオの方法である。 図5は、選択される符号化のタイプを決定する図1a及び図1bに示す装置の 出力信号を基礎として、図3に係る類似の測度を決定するための装置の変更され た実施例を示す。2つの相互に相当する 回路セクションは、xi1引くx1,xi2引くx2の差が、各々、符号化の誤 り信号を生成するために形成されるノード及び各々の場合に1つの信号ブロック を通して、各々の相当する有効信号x1及びx2のみならず、各々の誤り信号x i1引くx1,xi2引くx2を合計するための2つのブロックb4,b5を各 々含む。これらの誤り及び有効信号コンポーネントのブロックでの絶対合計後、 合計された絶対誤り信号の商が、合計された絶対有効信号を参照して、さらに先 のブロックb6で形成され、しきい値kと比較される。誤りの関連する測度が、 2つのチャネルの1つで、しきい値kを越えると、いかなる輝度−ステレオ符号 化も行われないが、分離した符号化が使用されなければならない。 ここでの目的は、図6を参照して、各々、図1a,図1b及び図2に記載の分 岐z1,z2及びz1〜z4のブロックb1及びb2の可能な実施例について説 明することである。しかし、単オーディオ信号の時間/周波数変換及び短時間エ ネルギー値の形成は、共に、符号化のタイプの選択の分野の当業者にとってそう でないとしても、符号化の分野の当業者にとっては、知られている方法であるこ とをここで強調しておく。 図6に示すように、単入力信号は、32(0〜31)の”多バンド”での時間 単入力信号の時間/周波数変換を行う多相フィルターバンクPFに供給される。 これらのバンドに関しては、図7の右側の部分の”多相実装”,左及び中央欄を 参照できる。当業者が図7から理解できるように、各々のスケールファクタバン ドに対するバンド幅は、人間の聴力の特性の周波数グループ幅及び関連する時間 分解能をシミュレーションするために、周波数の点で低いスケールファクタバン ド数の場合には一定であり、限界周波数まで上がらない。32の多バンド(0〜 31)のスペクトル値は、ブロックb2aで、続いて、多相フィルターバンクb 1で、エネルギー値を形成 するために二乗される。一方、これに続くブロックでは、各々異なる合計長さ( 図7の右側の欄を比較する)を通して、各々のスケールファクタバンドに対する 短時間エネルギー値を計算するために、合計が行われ、合計長さは、各々、合計 される連続値の数を示す。さらに、32の多バンドが、適当な周波数バンドを結 合することによって、スケールファクタバンドの縮小数を形成するために結合さ れる。ISO層IIIの場合には、21のスケールファクタバンドの合計が選択 され、短時間エネルギーの形成は、SB−No.10からの連続値の合計によって 、各々のスケールファクタバンドのために実装される。 精神音響で計算された聴取しきい値の使用による聴度の点での個々のスペクト ル値の重み付けは、一般的な専門知識であるので、図6と図1又は図2に係るブ ロックb3のより詳細な実施例は再現しないこととする。 聴取しきい値の計算の目的で以下の専門文献が参照できる。「ISO/IEC 11172 国際標準 ”1.5Mbit/sまでのディジタル記憶媒体の動 画及び関連するオーディオの符号化”,第3部:オーディオ,付録D:精神音響 モデル」 聴度及び内部表現の点でのスペクトルコンポーネントの重み付けに関しては、 以下の標準文献が参照できる。 「ジョン ジー ビアエンド,ジァン エー ステマーディンク著:”精神音 響音表現に基づく知覚オーディオ質測度”,オーディオ工学協会誌,40巻,No .12,1992年12月」 「イー ジッカー,エッチ ファステル著:”精神音響”,スプリンガー フ ェアラーク,ベルリン ハイデルベルク,1990年,8.7.1章”特定ラウ ドネス”」
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,DE, DK,ES,FR,GB,GR,IE,IT,LU,M C,NL,PT,SE),AU,CA,JP,KR,N O,RU,UA,US (72)発明者 エベルライン エルンスト ドイツ連邦共和国 D―91091 グローセ ンゼーバッハ ヴァルトシュトラーセ 28 ベー (72)発明者 ブランデンブルク カールハインツ ドイツ連邦共和国 D―91054 エアラン ゲン ハーグシュトラーセ 32 (72)発明者 ザイツァー ディーター ドイツ連邦共和国 D―91054 エアラン ゲン フンボルトシュトラーセ 14

Claims (1)

  1. 【特許請求の範囲】 1.信号の周波数ドメインへの変換が行われ、スペクトル値から始めて、符号 化の少なくとも2つのタイプの選択された1つを基礎として、類似の測度が決定 される、少なくとも2つの信号(k1,k2)を符号化するために選択される符 号化のタイプの決定方法において、 符号化の誤りに影響される少なくとも1つの信号(ki1,ki2)を生成す るために、高い類似の測度の決定の場合に用いられる符号化のタイプで、信号( k1,k2)の少なくとも1つが符号化され、復号され、 符号化の誤りに影響される信号(ki1,ki2)及び符号化の誤りに影響さ れない関連する信号(k1,k2)が周波数ドメインに変換され、 符号化の誤りに影響される信号のスペクトル値及び符号化の誤りに影響されな い関連する信号のスペクトル値の両方から始めて、精神音響計算によって決定さ れる聴取しきい値を用いて、各々の実オーディオスペクトルコンポーネントの選 択又は評価が行われ、 少なくとも符号化の誤りに影響される信号及び符号化の誤りに影響されない関 連する信号の上記のように選択され又は評価されたオーディオスペクトルコンポ ーネントを基礎として、類似の測度が計算されることを特徴とする、方法。 2.信号の周波数ドメインへの変換が行われ、スペクトル値から始めて、符号 化の少なくとも2つのタイプの選択された1つを基礎として、類似の測度が決定 される、少なくとも2つの信号(k1,k2)を符号化するために選択される符 号化のタイプの決定方法において、 周波数ドメインへの変換後、符号化の誤りに影響される少なくと も1つの信号(ki1,ki2)を生成するために、高い類似の測度の決定の場 合に用いられる符号化のタイプで、信号(k1,k2)の少なくとも1つが符号 化され、復号され、 符号化の誤りに影響される信号のスペクトル値及び符号化の誤りに影響されな い関連する信号のスペクトル値の両方から始めて、精神音響計算によって決定さ れる聴取しきい値を用いて、各々の実オーディオスペクトルコンポーネントの選 択又は評価が行われ、 少なくとも符号化の誤りに影響される信号及び符号化の誤りに影響されない関 連する信号の上記のように選択され又は評価されたオーディオスペクトルコンポ ーネントを基礎として、類似の測度が計算されることを特徴とする、方法。 3.少なくとも2つの信号の周波数ドメインへの変換が行われ、スペクトル値 から始めて、符号化の少なくとも2つのタイプの選択された1つを基礎として、 これらの信号の相互の類似に対する類似の測度が決定される、少なくとも2つの 信号(k1,k2)を符号化するために選択される符号化のタイプの決定方法に おいて、 各々の信号(k1,k2)のスペクトル値から始めて、精神音響計算によって 決定される聴取しきい値を用いて、実オーディオスペクトルコンポーネントの選 択又は評価が行われ、 符号化のタイプを選択する目的のための少なくとも2つの信号(k1,k2) の上記のように選択され又は評価されたオーディオスペクトルコンポーネントを 基礎として、類似の測度が決定されることを特徴とする、方法。 4.各々の信号(k1,k2)の実オーディオスペクトルコンポーネントの選 択又は評価の目的のために、周波数グループ幅の機能として選択される周波数ド メイン内の短時間エネルギー値が最初に決定され、 オーディオエネルギー値が、計算された聴取しきい値と比較する ことによって、これらの短時間エネルギー値から選択され、又は、評価されるこ とを特徴とする、請求項1ないし請求項3のいずれかに記載の方法。 5.周波数グループ幅の増加の場合に関する周波数ドメインに対する人間の耳 の時間分解能に従って減少する周期の間、各々の周波数ドメインに対して、短時 間エネルギー値が決定されることを特徴とする、請求項4に記載の方法。 6.実オーディオスペクトル値を選択し、又は、評価する目的のために、人間 の内耳の非直線性を描写した機能が、選択又は評価されたスペクトルコンポーネ ントに適用されることを特徴とする、請求項4または請求項5に記載の方法。 7.人間の内耳の非直線性を描写した機能は(xα)の形で、指数αは0.1 <α<10の範囲であることを特徴とする、請求項6に記載の方法。 8.各々関連する1つの信号(k1,k2)のスペクトルコンポーネント(x 1,x2)のみならず、符号化の誤りに影響される各々の1つの信号(ki1, ki2)の実オーディオスペクトルコンポーネントの変換及び選択又は評価は、 各々のチャネルに対して行われ、 類似の測度は、各チャネルに対する誤りの各々の測度を基礎として決定され、 誤りの各々の測度は、符号化の誤りに影響されない関連する信号(x1,x2) のみならず、符号化の誤りに影響される信号(ki1,ki2)の実スペクトル コンポーネント(xi1,x1;xi2,x2)を基礎として各々のチャネルに 対して決定されることを特徴とする、請求項1または請求項2に記載の方法。 9.類似の測度は、しきい値(k)と比較され、 類似の測度がしきい値kを越えた場合、チャネルの分離した符号化が行われる 一方、他の場合には、チャネルの輝度−ステレオ符号 化が行われることを特徴とする、請求項1ないし請求項8のいずれかに記載の方 法。
JP7508926A 1993-09-15 1994-07-08 少なくとも2つの信号を符号化するために選択される符号化のタイプの決定方法 Expired - Lifetime JP2800068B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
DE4345171A DE4345171C2 (de) 1993-09-15 1993-09-15 Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
DE4331376.0 1993-09-15
DE4331376A DE4331376C1 (de) 1993-09-15 1993-09-15 Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
DE4345171.3 1993-09-15

Publications (2)

Publication Number Publication Date
JPH08507424A true JPH08507424A (ja) 1996-08-06
JP2800068B2 JP2800068B2 (ja) 1998-09-21

Family

ID=25929591

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7508926A Expired - Lifetime JP2800068B2 (ja) 1993-09-15 1994-07-08 少なくとも2つの信号を符号化するために選択される符号化のタイプの決定方法

Country Status (11)

Country Link
US (1) US5736943A (ja)
EP (1) EP0719483B1 (ja)
JP (1) JP2800068B2 (ja)
KR (1) KR0171100B1 (ja)
AT (1) ATE152871T1 (ja)
AU (1) AU678270B2 (ja)
CA (1) CA2161263C (ja)
DE (1) DE4331376C1 (ja)
DK (1) DK0719483T3 (ja)
RU (1) RU2124272C1 (ja)
WO (1) WO1995008227A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006030754A1 (ja) * 2004-09-17 2006-03-23 Matsushita Electric Industrial Co., Ltd. オーディオ符号化装置、復号化装置、方法、及びプログラム
JP2008282036A (ja) * 1998-10-13 2008-11-20 Victor Co Of Japan Ltd 音声信号伝送装置、音声信号受信装置及び音声信号伝送システム
JP2012073351A (ja) * 2010-09-28 2012-04-12 Fujitsu Ltd オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4437287C2 (de) * 1994-10-18 1996-10-24 Fraunhofer Ges Forschung Verfahren zur Messung der Erhaltung stereophoner Audiosignale und Verfahren zur Erkennung gemeinsam codierter stereophoner Audiosignale
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
DE19628293C1 (de) * 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
DE19628292B4 (de) 1996-07-12 2007-08-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Codieren und Decodieren von Stereoaudiospektralwerten
DE19706268A1 (de) * 1997-02-18 1998-08-20 Christian Wenz Dateiformatspezifisches Packverfahren
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
DE19742655C2 (de) * 1997-09-26 1999-08-05 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Codieren eines zeitdiskreten Stereosignals
US6012025A (en) * 1998-01-28 2000-01-04 Nokia Mobile Phones Limited Audio coding method and apparatus using backward adaptive prediction
ATE387044T1 (de) * 2000-07-07 2008-03-15 Nokia Siemens Networks Oy Verfahren und vorrichtung für die perzeptuelle tonkodierung von einem mehrkanal tonsignal mit verwendung der kaskadierten diskreten cosinustransformation oder der modifizierten diskreten cosinustransformation
JP4618873B2 (ja) * 2000-11-24 2011-01-26 パナソニック株式会社 オーディオ信号符号化方法、オーディオ信号符号化装置、音楽配信方法、および、音楽配信システム
US6654827B2 (en) 2000-12-29 2003-11-25 Hewlett-Packard Development Company, L.P. Portable computer system with an operating system-independent digital data player
WO2002054744A1 (en) * 2000-12-29 2002-07-11 Nokia Corporation Audio signal quality enhancement in a digital network
US7660424B2 (en) * 2001-02-07 2010-02-09 Dolby Laboratories Licensing Corporation Audio channel spatial translation
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
JP3870193B2 (ja) 2001-11-29 2007-01-17 コーディング テクノロジーズ アクチボラゲット 高周波再構成に用いる符号器、復号器、方法及びコンピュータプログラム
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
WO2004080125A1 (en) * 2003-03-04 2004-09-16 Nokia Corporation Support of a multichannel audio extension
TWI393120B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 用於音訊信號編碼及解碼之方法和系統、音訊信號編碼器、音訊信號解碼器、攜帶有位元流之電腦可讀取媒體、及儲存於電腦可讀取媒體上的電腦程式
WO2007081713A1 (en) * 2006-01-09 2007-07-19 Thomson Licensing Method and apparatus for providing reduced resolution update mode for multi-view video coding
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
MX2008012382A (es) * 2006-03-29 2008-11-18 Thomson Licensing Metodos y aparatos para usarse en un sistema de codificacion de video de multiples vistas.
CN101496407B (zh) 2006-07-06 2013-02-06 汤姆逊许可证公司 用于针对多视角视频编码和解码解耦合帧号和/或图像顺序计数(poc)的方法和装置
WO2008005575A2 (en) * 2006-07-06 2008-01-10 Thomson Licensing Method and apparatus for decoupling frame number and/or picture order count (poc) for multi-view video encoding and decoding
RU2459283C2 (ru) * 2007-03-02 2012-08-20 Панасоник Корпорэйшн Кодирующее устройство, декодирующее устройство и способ
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
KR101228165B1 (ko) * 2008-06-13 2013-01-30 노키아 코포레이션 프레임 에러 은폐 방법, 장치 및 컴퓨터 판독가능한 저장 매체
US8620643B1 (en) * 2009-07-31 2013-12-31 Lester F. Ludwig Auditory eigenfunction systems and methods
WO2014170530A1 (en) * 2013-04-15 2014-10-23 Nokia Corporation Multiple channel audio signal encoder mode determiner
CN105741835B (zh) * 2016-03-18 2019-04-16 腾讯科技(深圳)有限公司 一种音频信息处理方法及终端

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5341457A (en) * 1988-12-30 1994-08-23 At&T Bell Laboratories Perceptual coding of audio signals
DE4136825C1 (ja) * 1991-11-08 1993-03-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
DE4217276C1 (ja) * 1992-05-25 1993-04-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De
US5278909A (en) * 1992-06-08 1994-01-11 International Business Machines Corporation System and method for stereo digital audio compression with co-channel steering
JP3123286B2 (ja) * 1993-02-18 2001-01-09 ソニー株式会社 ディジタル信号処理装置又は方法、及び記録媒体
US5581654A (en) * 1993-05-25 1996-12-03 Sony Corporation Method and apparatus for information encoding and decoding

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008282036A (ja) * 1998-10-13 2008-11-20 Victor Co Of Japan Ltd 音声信号伝送装置、音声信号受信装置及び音声信号伝送システム
JP2008282035A (ja) * 1998-10-13 2008-11-20 Victor Co Of Japan Ltd 音声信号伝送装置、音声信号受信装置及び音声信号伝送システム
JP2008282034A (ja) * 1998-10-13 2008-11-20 Victor Co Of Japan Ltd 音声信号伝送装置、音声信号受信装置及び音声信号伝送システム
JP2008299339A (ja) * 1998-10-13 2008-12-11 Victor Co Of Japan Ltd 音声信号伝送装置、音声信号受信装置及び音声信号伝送システム
JP2008299340A (ja) * 1998-10-13 2008-12-11 Victor Co Of Japan Ltd 音声信号伝送装置、音声信号受信装置及び音声信号伝送システム
WO2006030754A1 (ja) * 2004-09-17 2006-03-23 Matsushita Electric Industrial Co., Ltd. オーディオ符号化装置、復号化装置、方法、及びプログラム
US7860721B2 (en) 2004-09-17 2010-12-28 Panasonic Corporation Audio encoding device, decoding device, and method capable of flexibly adjusting the optimal trade-off between a code rate and sound quality
JP4809234B2 (ja) * 2004-09-17 2011-11-09 パナソニック株式会社 オーディオ符号化装置、復号化装置、方法、及びプログラム
JP2012073351A (ja) * 2010-09-28 2012-04-12 Fujitsu Ltd オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム

Also Published As

Publication number Publication date
CA2161263C (en) 1999-06-15
AU678270B2 (en) 1997-05-22
JP2800068B2 (ja) 1998-09-21
EP0719483A1 (de) 1996-07-03
RU2124272C1 (ru) 1998-12-27
DE4331376C1 (de) 1994-11-10
AU7187994A (en) 1995-04-03
US5736943A (en) 1998-04-07
WO1995008227A1 (de) 1995-03-23
KR0171100B1 (ko) 1999-03-30
ATE152871T1 (de) 1997-05-15
DK0719483T3 (da) 1997-08-25
CA2161263A1 (en) 1995-03-23
EP0719483B1 (de) 1997-05-07

Similar Documents

Publication Publication Date Title
JPH08507424A (ja) 少なくとも2つの信号を符号化するために選択される符号化のタイプの決定方法
EP2301016B1 (en) Efficient use of phase information in audio encoding and decoding
AU2016202800B2 (en) Signal processing apparatus and method, and program
KR101629862B1 (ko) 파라메트릭 스테레오 업믹스 장치, 파라메트릭 스테레오 디코더, 파라메트릭 스테레오 다운믹스 장치, 파라메트릭 스테레오 인코더
EP1869774B1 (en) Adaptive grouping of parameters for enhanced coding efficiency
US7916873B2 (en) Stereo compatible multi-channel audio coding
FI112979B (fi) Digitaalisen datan erittäin tehokas koodauslaite
US7693721B2 (en) Hybrid multi-channel/cue coding/decoding of audio signals
JP4603037B2 (ja) マルチチャネルオーディオ信号を表示するための装置と方法
RU2411594C2 (ru) Кодирование и декодирование аудио
JP3336617B2 (ja) 信号符号化又は復号化装置,及び信号符号化又は復号化方法,並びに記録媒体
CN101223821B (zh) 音频解码器
CN103765509B (zh) 编码装置及方法、解码装置及方法
WO2011013381A1 (ja) 符号化装置および復号装置
MX2012009785A (es) Aparato para generar señal de mezcla descendente mejorada, metodo para generar señal de mezcla descendente mejorada y programa de computadora.
WO1995021489A1 (fr) Methode et appareil de codage de donnees, methode et appareil de decodage de donnees, support d'enregistrement de donnees et mode de transmission de donnees
US5812672A (en) Method for reducing data in the transmission and/or storage of digital signals of several dependent channels
KR101637407B1 (ko) 부가적인 출력 채널들을 제공하기 위하여 스테레오 출력 신호를 발생시키기 위한 장치와 방법 및 컴퓨터 프로그램
US6995699B2 (en) Encoding method, and encoding apparatus, and decoding method and decoding apparatus
JP2006003580A (ja) オーディオ信号符号化装置及びオーディオ信号符号化方法
JP2006325162A (ja) バイノーラルキューを用いてマルチチャネル空間音声符号化を行うための装置
JP4046454B2 (ja) オーディオデータ符号化装置
Suresh Spatialization Parameter Estimation in MDCT Domain for Stereo Audio

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080710

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080710

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090710

Year of fee payment: 11

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term