JP4987736B2 - オーディオ断片またはオーディオデータストリームの符号化ステレオ信号を生成するための装置および方法 - Google Patents

オーディオ断片またはオーディオデータストリームの符号化ステレオ信号を生成するための装置および方法 Download PDF

Info

Publication number
JP4987736B2
JP4987736B2 JP2007557373A JP2007557373A JP4987736B2 JP 4987736 B2 JP4987736 B2 JP 4987736B2 JP 2007557373 A JP2007557373 A JP 2007557373A JP 2007557373 A JP2007557373 A JP 2007557373A JP 4987736 B2 JP4987736 B2 JP 4987736B2
Authority
JP
Japan
Prior art keywords
channel
stereo
signal
encoded
uncoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007557373A
Other languages
English (en)
Other versions
JP2008532395A (ja
Inventor
プログスティース ヤン
ムント ハーラルト
ポップ ハーラルト
Original Assignee
フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. filed Critical フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー.
Publication of JP2008532395A publication Critical patent/JP2008532395A/ja
Application granted granted Critical
Publication of JP4987736B2 publication Critical patent/JP4987736B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S3/004For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Catalysts (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、マルチチャネルオーディオ技術に関し、特に、ヘッドホン技術に関連するマルチチャネルオーディオの応用に関する。
国際特許出願WO99/49574およびWO99/14983は、対向して配置されたヘッドホンラウンドスピーカ対を駆動し、ステレオ表現のみならずマルチチャネル表現もあるオーディオシーンの空間知覚を、ユーザが二つのヘッドホンを介して得るようにするためのオーディオ信号処理技術を開示する。こうして、ユーザが、例として5.1オーディオシステムを装備する再生室に座っているとすると、リスナは、自分のヘッドホンを介して、最良の場合で自分の空間知覚に等しいオーディオ断片の空間知覚を得ることになる。この目的のため、図2に示すように、ヘッドホンのラウンドスピーカごとに、マルチチャネルオーディオ断片またはマルチチャネルオーディオデータストリームのチャネルが別個のフィルタへ供給され、後述するとおり、所属が同じのそれぞれのフィルタ処理されたチャネルを加算する。
図2の左側には、オーディオ断片またはオーディオデータストリームのマルチチャネル表現をともに表すマルチチャネル入力20が存在する。このようなシナリオを、図10に例示的に模式図で示す。図10は、所謂5.1オーディオシステムが配置される再生空間200を示す。5.1オーディオシステムは、中央ラウンドスピーカ201、前方左ラウンドスピーカ202、前方右ラウンドスピーカ203、後方左ラウンドスピーカ204および後方右ラウンドスピーカ205を備える。5.1オーディオシステムは、低周波強化チャネルとも呼ばれる追加のサブウーファ206を備える。再生空間200の所謂「スイートスポット」では、左ヘッドホンラウンドスピーカ209および右ヘッドホンラウンドスピーカ210を備えるヘッドホン208を装着したリスナ207が存在する。
図2に示す処理手段は、図10でラウンドスピーカから左ラウンドスピーカ209への音声チャネルを記述するフィルタHiLによりマルチチャネル入力20の各チャネル1、2および3をフィルタ処理し、かつさらに5つのラウンドスピーカのひとつから右耳またはヘッドホン208の右ラウンドスピーカ210への音声を表すフィルタHiRにより同じチャネルをフィルタ処理するよう構成されている。
たとえば、図2のチャネル1が、図10のラウンドスピーカ202が発する前方左チャネルの場合、フィルタHiLは、破線212で示すチャンネルを表すと考えられ、フィルタH1Rが破線213により示されるチャネルを表すと考えられる。図10に破線214で例示するとおり、左ヘッドホンラウンドスピーカ209は、直接の音声を受信するのみならず、再生空間のエッジの初期反射をも受信し、かつ拡散残響で表現される後期反射も当然受信する。
このようなフィルタの表現について図11に示す。特に、図11は、たとえば図2のフィルタH1L等のフィルタのインパルス応答の例を示す模式図である。図11の線212により表される直接のまたは一次の音声は、フィルタの始まりのピークで表される一方、図10に214で例示する初期反射は、図11にいくつかの(離散的)小ピークを有する中心領域により再生される。ラウンドスピーカ202の音声は原則的には、任意の頻度で反射されるため、拡散残響は一般に個々のピークについて分解しなくなり、図11で「拡散残響」と呼ばれる後方で減少するエネルギにより表されるとおり、エネルギは反射ごと、伝播距離が伸びるごとに当然減少する。
図2に示す各フィルタは、こうして、図11のインパルス応答を示す模式図により表されるプロファイルを概ね有するフィルタインパルス応答を含む。個々のフィルタのインパルス応答が、再生空間、ラウンドスピーカの位置決め、たとえば、再生空間における数人の在室者や家具のために起こる、再生空間における可能な減衰特性に依存し、かつ理論的には個々のラウンドスピーカ201〜206の特性にも依存することになる。
すべてのラウンドスピーカの信号が、リスナ207の耳に重ね合わされるという事実が、図2の加算器22および23により示される。こうして、各チャネルは、左の耳については、対応のフィルタによりフィルタ処理され、左耳用フィルタが出力する信号を単に加算して、左耳が左耳L用ヘッドホン出力信号を得られるようになっている。同様に、図10に示す右耳または右のヘッドホンラウンドスピーカ210については、加算器23による加算が行われて、右耳用の対応のフィルタによりフィルタ処理されたすべてのラウンドスピーカ信号を重ね合わせることにより、右耳用のヘッドホン出力信号が得られる。
直接の音声とは別に、初期反射および、特に拡散残響が存在し、このことは、合成的または「ぎこちない」トーンに聞こえないようにし、一方その音響特性により、リスナに、実際にコンサートルームに座っているかのような印象を持たせるために、空間知覚にとっては特に重要性が高いことから、個々のフィルタ21のインパルス応答はすべてかなりの長さになる。2つのフィルタを有するマルチチャネル表現の個々のマルチチャネルの畳込み自体がすでにかなりの計算タスクとなっている。サブウーファチャネルも別個に扱う場合には、個々のマルチチャネルごとに2つのフィルタ、すなわち、左耳と右耳にそれぞれ1つずつ必要なので、5.1マルチチャネル表現をヘッドホンで再生するには、全部で12個の完全に異なるフィルタを必要とする。図11から明らかなとおり、すべてのフィルタが、直接の音声のみならず、初期反射および拡散残響も考慮できるように非常に長いインパルス応答を有するが、そうすることによってのみオーディオ断片に正しい音声再生と良好な空間印象を与えることになる。
この周知の概念を実施に移すため、図10に示すように、マルチチャネルプレーヤ220とは別に、図10の線224および226で表す2つのラウンドスピーカ209および210のための信号を与える、非常に複雑な仮想音声処理222が必要である。
マルチチャネルヘッドホン音声を生成するためのヘッドホンシステムは、複雑で、かさ高くかつ高価である。これは、高い計算出力、この必要な高い計算出力のために必要な高い電流要件およびインパルス応答について行われる評価のための高い作動メモリ要件ならびに接続されるプレーヤの高い容積または高価な素子によるものである。この種の応用は、したがって、家庭用のPCのサウンドカード、ラップトップのサウンドカードまたはホームステレオシステムに限られる。
特に、マルチチャネルヘッドホン音声は、ますます成長を続ける携帯用CDプレーヤ、特にハードウェアプレーヤ等の携帯プレーヤのマーケットにとっては、近づきがたい状態のままである。というのも、たとえば12の異なるフィルタでマルチチャネルをフィルタ処理するための計算要件は、プロセッサのリソースに関しても、一般に電池で駆動する装置の電流要件に関しても、この価格区分では実現不可能である。これは、スケールの底の(下の)部分にある価格区分を指す。
しかしながら、まさにこの価格区分が、商品の数が多いだけに、経済的に非常に興味ある区分である。
発明の目的は、マルチチャネル品質のヘッドホン再生を単純な再生装置上で可能にする効率的な信号処理概念を提供することである。
この目的は、請求項1に記載の符号化ステレオ信号を生成するための装置、請求項11に記載の符号化ステレオ信号を生成するための方法、または請求項12に記載のコンピュータプログラムにより達成される。
本発明は、オーディオ断片またはオーディオデータストリーム、たとえばオーディオ断片の5.1表現等のマルチチャネル表現に対して、ハードウエアプレーヤの外部、たとえば高計算出力を有するプロバイダのコンピュータ内等で、ヘッドホン信号処理を行うことにより、CDプレーヤやハードディスクプレーヤ等全ての利用可能なプレーヤで、高品質で魅力あるマルチチャネルヘッドホン音声が入手できるとする知見に基づく。しかしながら、発明によれば、ヘッドホン信号処理の結果は、プレイされるだけでなく、典型的オーディオステレオエンコーダへ送られ、このエンコーダが左右のヘッドホンチャネルから符号化ステレオ信号を生成する。
そして、この符号化ステレオ信号を、マルチチャネル表現を含んでいない他の符号化ステレオ信号と同様に、ハードウエアプレーヤまたはCD形態の携帯CDプレーヤなどに送ることができる。再生または再プレイ装置が、既存の装置にリソースや手段を追加する必要なしに、ヘッドホンマルチチャネル音声をユーザに提供する。当然、ヘッドホン信号処理の結果、すなわち、左右ヘッドホン信号は、先行技術の場合のようにヘッドホン内で再生されるのではなく、符号化され、符号化ステレオデータとして出力される。
この出力は、記憶でも送信等でもよい。符号化ステレオデータを有するファイルは、ユーザが自分の装置で何かを変更する必要なく、ステレオ再生用に設計された再生装置へ容易に供給され得る。
こうして、ヘッドホン信号処理の結果から符号化ステレオ信号を生成する発明の概念により、かなり改良され、よりリアルな品質をユーザに提供するマルチチャネル表現を全ての簡単で広範な、また将来はさらに広範なハードウエアプレーヤにおいて、採用することが可能となる。
本発明の好ましい実施例では、開始ポイントが符号化マルチチャネル表現、すなわち一つまたは典型的に2つの基本チャネルを含み、さらにパラメトリックデータを含むパラメトリック表現であり、基本チャネルとパラメトリックデータに基づきマルチチャネル表現のマルチチャネルが生成される。マルチチャネル復号化のための周波数領域に基づく方法が好ましいので、本発明によれば、ヘッドホン信号処理は、インパルス応答により時間信号を畳込むことによって時間領域では行わず、フィルタ送信関数による乗算により周波数領域で行う。
これにより、ヘッドホン信号処理の前に少なくとも1つの再変換を省くことができ、これは、次のステレオエンコーダも周波数領域で動作する場合には、時間領域へ行く必要のないヘッドホンステレオ信号のステレオ符号化が、ふたたび時間領域へ行くことなく行えるため、特に有利である。時間領域が関与しない、または少なくとも変換の回数が減ることによる、マルチチャネル表現から符号化ステレオ信号への処理は、時間効率を計算する場合のみならず、処理ステージが減れば、オーディオ信号に導入されるアーティファクトも減るので、品質損失が制限されるという点でも興味深い。
特に、ステレオエンコーダにとって好ましい、音響心理学的マスキング閾値を考慮する量子化を行うブロックによる方法においては、連結した符号化アーティファクトを出来るだけ防止することが重要である。
本発明の特に好ましい実施例では、1つまたは好ましくは2つの基本チャネルを有するBCC表現がマルチチャネル表現として使用される。通常BCCデコーダで行われるように、BCC法は、周波数領域で動作するので、マルチチャネルは、合成の後、時間領域へ変換されることはない。その代わり、ブロックの形のマルチチャネルのスペクトル表現を使用し、これに対して、ヘッドホン信号処理を行う。このため、フィルタの変換関数、すなわち、インパルス応答のフーリエ変換を利用して、フィルタ変換関数によりマルチチャネルのスペクトル表現の乗算を行う。フィルタのインパルス応答が時間的にBCCデコーダの出力のスペクトルコンポーネントのブロックより長ければ、たとえば、WO94/01933等に開示される、この種の手段に必要とされる対応のスペクトル重み付けをするために、フィルタのインパルス応答が時間領域で分離され、ブロックごとに変換されるブロックによるフィルタ処理が好ましい。
次に、発明の好ましい実施例について、添付の図面を参照しながら詳細に説明する。
図1は、オーディオ断片またはオーディオデータストリームの符号化ステレオ信号を生成するための本発明の装置の基本回路ブロック図である。ステレオ信号は、符号化されない形で、符号化されない第1のステレオチャネル10aおよび符号化されない第2のステレオチャネル10bを含みかつオーディオ断片またはオーディオデータストリームのマルチチャネル表現から生成され、このマルチチャネル表現は、2を超える数のマルチチャネルに関する情報を含む。後述のとおり、マルチチャネル表現は、符号化されていない形式でも符号化された形式でもどちらでもよい。マルチチャネル表現が符号化されない形式の場合、3以上の数のマルチチャネルを含む。好ましい応用のシナリオでは、マルチチャネル表現が5つのマルチチャネルと1つのサブウーファチャネルとを備える。
しかしながら、マルチチャネル表現は、符号化形式であり、この符号化形式は、一般に、1つまたはいくつかの基本チャネルおよび1つまたは2つの基本チャネルからの3以上のマルチチャネルを合成するためのパラメータを備えることになる。こうして、マルチチャネルデコーダ11は、マルチチャネル表現から2を超える数のマルチチャネルを与えるための手段の例である。しかしながら、マルチチャネル表現がすでに、5+1PCMチャネル形式等で符号化されていない場合には、与える手段は、ヘッドホン信号処理を実行して符号化されていない第1のステレオチャネル10aと符号化されていない第2のステレオチャネル10bとを有する符号化されていないステレオ信号を生成するための手段12の入力端末に相当する。
ヘッドホン信号処理を行うための手段12は、図2を参照して説明するとおり、第1のステレオチャネルに関しては、第1のフィルタ関数により、かつ第2のステレオチャネルに関しては、第2のフィルタ関数でそれぞれマルチチャネル表現のマルチチャネルを評価し、それぞれの評価されたマルチチャネルを加算して符号化されていない第1および第2のステレオチャネルを得るよう形成されることが好ましい。これについては、ヘッドホン信号処理を行う手段12の下流は、ステレオエンコーダ13であり、これは、第1の符号化されていないステレオチャネル10aと第2の符号化されていないステレオチャネル10bとを符号化して、ステレオエンコーダ13の出力14に符号化ステレオ信号を得るように形成される。ステレオエンコーダは、符号化ステレオ信号を送信するために必要なデータレートが、符号化されていないステレオ信号を送信するために必要なデータレートより小さくなるように、データレートの低減を行う。
本発明の概念によれば、「サラウンド」とも呼ばれるマルチチャネルトーンをハードウエアプレーヤ等の単純なプレーヤを介してステレオヘッドホンへ供給することが可能になる。
例として、あるチャネルの和を単純なヘッドホン信号処理として形成し、ステレオデータのための出力チャネルを得る。改良された方法は、より複雑なアルゴリズムで作用し、再生品質の向上が得られる。
なお、本発明の概念によれば、マルチチャネル復号化を行いかつヘッドホン信号処理を行うための計算が集中するステップを、プレーヤ自体で行わず、外部で行うことが可能となる点を説明する。この発明の概念の結果が、たとえばMP3ファイル、AACファイル、HE−AACファイルまたは他のステレオファイル等の符号化ステレオファイルである。
他の実施例では、個々のブロックの出力データおよび入力データは、それぞれ簡単にポートさせ、標準化された方法で生成したり記憶させたりできるので、マルチチャネル復号化、ヘッドホン信号処理およびステレオ符号化を、異なる装置上で行うことができる。
次に、図7を参照して、マルチチャネルデコーダ11が、マルチチャネル表現が周波数領域で与えられるように、フィルタバンクまたはFFT関数を含む発明の好ましい実施例について説明する。特に、個々のマルチチャネルが、チャネルごとのスペクトル値のブロックとして生成される。発明的には、ヘッドホン信号処理は、時間チャネルをフィルタインパルス応答で畳み込むことにより時間領域では行わないが、フィルタインパルス応答のスペクトル表現をマルチチャネルの周波数表現に乗算する。符号化されていないステレオ信号は、ヘッドホン信号処理の出力で達成され、これは、時間領域にはなく、左および右のステレオチャネルを含み、このステレオチャネルが、スペクトル値のブロックのシーケンスとして与えられ、スペクトル値の各ブロックが、ステレオチャネルの短期スペクトルを表す。
図8に示す実施例では、ヘッドホン信号処理ブロック12は、入力側にあり、時間領域または周波数領域データを供給される。出力側では、符号化されていないステレオチャネルが周波数領域で生成され、すなわちここでもスペクトル値のブロックのシーケンスとして生成される。変換に基づき、すなわち、ヘッドホン信号処理12とステレオエンコーダ13との間の周波数/時間変換および次の時間/周波数変換を行う必要無しにスペクトル値を処理するステレオエンコーダが、この場合のステレオエンコーダ13として好ましい。出力側では、ステレオエンコーダ13が、符号化ステレオ信号を有するファイルを出力し、符号化ステレオ信号は、補助情報とは別に、スペクトル値の符号化された形を含む。
本発明の特に好ましい実施例では、図1のブロック11の入力のマルチチャネル表現から図1の手段の出力14の符号化ステレオファイルの途中で、時間領域に対する変換およびおそらくは、周波数領域に対する再変換も行う必要なしに、連続周波数領域処理を行う。MP3エンコーダまたはAACエンコーダをステレオエンコーダとして使用する場合、ヘッドホン信号処理ブロックの出力のフーリエスペクトルをMDCTスペクトルに変換することが好ましい。そして、本発明によれば、ヘッドホン信号処理ブロックのチャネルの畳み込み/評価についての厳密な形式において必要とされる位相情報が、そのような位相が正しい態様で動作していないMDCT表現に変換され、そのため時間領域から周波数領域へ、すなわちMDCTスペクトルへの変換のための手段が、ステレオエンコーダには必要とされず、この点が通常のMP3エンコーダまたは通常のAACエンコーダとは対照的である。
図9は、好ましいステレオエンコーダの一般的な回路ブロック図である。ステレオエンコーダは、入力側にジョイントステレオモジュール15を備え、このモジュールは、適応的な対応で、たとえば中央/サイド符号化という形での共通のステレオ符号化が、左および右チャネルを別個に処理するよりも高い符号化利得を与えるかどうかを決定することが好ましい。ジョイントステレオモジュール15は、さらに、インテンシティステレオ符号化を行うよう構成されてもよく、インテンシティステレオ符号化では、高い周波数では特に、可聴なアーティファクトの発生なしに、かなりの符号化利得が得られる。そして、ジョイントステレオモジュール15の出力は、たとえばTNSフィルタ処理、雑音置換等、他の異なる冗長抑制手段を用いてさらに処理され、その結果は、音響心理学的マスキング閾値を用いてスペクトル値の量子化を行う量子化器16へ供給される。ここで、量子化器ステップサイズは、量子化により導入される雑音が音響心理学的マスキング閾値より低く保たれ、損失量子化により導入されるひずみが可聴状態になることなく、データレートの低減が達成されるよう選択される。量子化器16の下流には、量子化されたスペクトル値の無損失エントロピ符号化を行うエントロピエンコーダ17がある。エントロピエンコーダの出力では、符号化ステレオ信号が存在するが、符号化ステレオ信号は、エントロピ符号化スペクトル値とは別に、復号化のために必要な補助情報を含む。
次に、図3から図6を用いて、マルチチャネルデコーダの好ましい実現例と好ましいマルチチャネルの説明を行う。
マルチチャネルオーディオ信号を送信するのに必要なデータの量を低減するためのいくつかの技術がある。これらの技術は、ジョイントステレオ技術とも呼ばれる。この目的のため、ジョイントステレオ装置60を示す図3を参照する。この装置は、たとえばインテンシティステレオ(IS)技術またはバイノーラルキュー符号化技術(BCC)を実現する装置である。この装置は一般に2つ以上のチャネルCH1、CH2、...、CHnを入力信号として受信しかつ単一の搬送波チャネルおよびパラメトリックマルチチャネル情報を出力する。パラメトリックデータは、もとのチャネル(CH1、CH2、...、CHn)の近似値をデコーダで計算できるように規定される。
通常、搬送波チャネルは、基底信号を比較的良好に表すサブバンドサンプル、スペクトル係数、時間領域サンプル等を含み、一方パラメトリックデータは、このようなサンプルやスペクトル係数を含んでいないが、乗算による重み付け、時間シフティング、周波数シフティング等のある再構成アルゴリズムを制御するための制御パラメータを含む。パラメトリックマルチチャネル情報は、こうして、信号または関連のチャネルの比較的大雑把な表現を含む。数字で表す、搬送波チャネルにより必要とされるデータ量は、60〜70kbits/sの範囲にあり、チャネルに対してパラメトリック補助情報が必要とするデータ量は、1.5〜2.5kbits/sの範囲にある。なお、上記の数字は圧縮データに当てはまる。非圧縮CDチャネルは当然およそ10倍のデータレートが必要である。パラメトリックデータの例としては、後述のとおり、既知のスケールファクタ、インテンシティステレオ情報またはBCCパラメータがある。
インテンシティステレオ符号化技術については、ジェイ・ヘレ、ケイ・エイチ・ブランデンブルグ、ディー・レデラーによる「インテンシティ・ステレオ符号化」と題するAES予稿3799、1994年2月、アムステルダム(AES Preprint 3799 entitled "Intensity Stereo Coding" by J. Herre, K.H. Brandenburg, D. Lederer, February 1994, Amsterdam)に記載される。一般には、インテンシティステレオの概念は、二つの立体音響オーディオチャネルのデータに適用される主軸変換に基づく。殆どのデータポイントが、第1の主軸中心に集中すれば、符号化利得は、符号化が起こる前のある角度だけ両方の信号を回転させることにより達成できる。しかしながら、このことは、実際の立体音響再生技術に常にあてはまるとは限らない。したがって、第2の直交成分をビットストリームでの送信から除外して、この技術を変更する。このように、左右チャネルについて再構成された信号は、同じ伝送信号を様々に重み付けまたはスケーリングしたバージョンからなる。それにもかかわらず、再構成信号は、振幅において異なる一方、位相情報については同じである。しかしながら、元のオーディオチャネルのエネルギ時間エンベロープは、一般に周波数選択性の態様で作用する選択的スケーリング動作により維持される。これは、支配的な空間情報がエネルギエンベロープにより決まる高周波数での人の音声知覚に対応する。
また、実際の実現例では、送信信号、すなわち搬送波チャネルは、両方の成分を回転させるのではなく、左右のチャネルの和信号から生成される。また、この処理、すなわちスケーリング動作を行うためのインテンシティステレオパラメータを生成する処理は、周波数選択性の態様、すなわちスケール係数帯ごと、エンコーダ周波数区分ごとに独立して行われる。両方のチャネルを結合して、結合されたまたは「搬送波」チャネルを形成し、この結合されたチャネルに加えて、インテンシティステレオ情報を形成することが好ましい。インテンシティステレオ情報は、第1のチャネルのエネルギ、第2のチャネルのエネルギ、または結合チャネルのエネルギに依存する。
BCC技術については、ティー・ファーラー、エフ・バウムガルトの「ステレオおよびマルチチャネルオーディオ圧縮に適用するバイノーラルキュー符号化」と題するAES会議論文5577、2002年、5月、ミュンヘン(AES Convention Paper 5574 entitled "Binaural Cue Coding applied to stereo and multichannel audio compression" by T. Faller, F. Baumgarte, May 2002, Munich)に記載される。BCC符号化では、いくつかのオーディオ入力チャネルが、オーバーラッピング窓で、DFTに基づく変換を用いて、スペクトル表現に変換される。結果として得られるスペクトルは、重ならない部分に分割され、その各々がインデックスを有する。各区分は、等価直角帯域幅(ERB)に比例する帯域幅を有する。チャネル間レベル差(ICLD)およびチャネル間時間差(ICTD)が、各区分および各フレームkについて決定される。ICLDおよびICTDは量子化され符号化されて、最終的には補助情報としてのBCCビットストリームに到達する。チャネル間レベル差およびチャネル間時間差は、参照チャネルに関して各チャネルごとに与えられる。そして、処理をする信号の特定の区分に依存して予め定められた方式によりパラメータを計算する。
デコーダ側では、デコーダは一般にモノ信号およびBCCビットストリームを受ける。モノ信号は、周波数領域に変換されて、空間合成ブロックへ入力され、同ブロックは復号化ICLDおよびICTDの値も受ける。空間合成ブロックでは、BCCパラメータ(ICLDおよびICTD)を用いて、モノ信号を重み付けし、マルチチャネル信号を合成し、同マルチチャネル信号は、周波数/時間変換を経て、元のマルチチャネルオーディオ信号の再構成を表す。
BCCの場合、ジョイントステレオモジュール60が、パラメトリックチャネルデータが量子化および符号化ICLDまたはICTDパラメータになるように、チャネル補助情報を出力するよう作用し、元のチャネルの1つがチャネル補助情報を符号化するための参照チャネルとして使用される。
通常、搬送波信号は、関与する元のチャネルの和からなる。
上記の技術はもちろん搬送波チャネルのみを処理できるデコーダのためのモノ表現を与えるに過ぎず、ひとつを超える数の入力チャネルの1つまたは複数の近似値を生成するためにパラメトリックデータを処理することはできない。
このBCC技術については、米国特許公開US2003/0219130Al、US2003/0026441AlおよびUS2003/0035553Alに記載される。また、ティー・ファーラーおよびエフ・バウムガルトの「バイノーラル・キュー符号化、パートII:構成および応用」、オーディオおよび音声処理に関するIEEE論文誌、第11巻、第6号、2003年11月("Binaural Cue Coding. Part II: Schemes and Applications" by T. Faller and F. Baumgarte, IEEE Trans. On Audio and Speech Proc., Vol. 11, No. 6, November 2003)という専門家による出版物も引用する。
次に、マルチチャネルオーディオ符号化のための典型的なBCC構成について、図4〜図6を参照して詳細に述べる。
図5は、マルチチャネルオーディオ信号を符号化/送信するためのこのようなBCC構成を示す。BCCエンコーダ112の入力110におけるマルチチャネルオーディオ入力信号は、所謂ダウンミックスブロック114においてミックスダウンされる。この例では、入力110の元のマルチチャネル信号は、前方左のチャネル、前方右のチャネル、左サラウンドチャネル、右サラウンドチャネル、および中央チャネルを有する5チャネルのサラウンド信号である。本発明の好ましい実施例では、ダウンミックスブロック114が、これら5つのチャネルを単純に加算して1つのモノ信号にすることで、和信号を生成する。
先行技術では、他のダウンミックス構成が知られており、マルチチャネル入力信号を用いて、単一のチャネルを有するダウンミクスチャネルが得られる。
この単一のチャネルは、和信号の線115上に出力される。BCC分析ブロック116から得られた補助情報を補助情報線117上に出力する。
上記のとおり、チャネル間レベル差(ICLD)およびチャネル間時間差(ICTD)をBCC分析ブロックで計算する。ここで、BCC分析ブロック116は、チャネル間相関値(ICC値)も計算することができる。和信号と補助情報とを量子化および符号化された形式で、BCCデコーダ120へ送信する。BCCデコーダは、送信された和信号をいくつかのサブバンドに分割し、スケーリングを行い、遅延を行い、かつ他の処理ステップを行って、出力するマルチチャネルオーディオチャネルのサブバンドを与える。この処理は、出力121における再構成マルチチャネル信号のICLD、ICTDおよびICCパラメータ(キュー)が、BCCエンコーダ112の入力110における元のマルチチャネル信号に対応するキューと一致するように行われる。この目的で、BCCデコーダ120は、BCC合成ブロック122および補助信号処理ブロック123を備える。
次に、BCC合成ブロック122の内部設定について図6を参照して説明する。線115上の和信号が、時間/周波数変換ユニットまたはフィルタバンクFB125へ供給される。ブロック125の出力では、N個のサブバンド信号か、または極端な場合、オーディオフィルタバンク125が1:1の変換、すなわちN個の時間領域サンプルからN個のスペクトル係数を生成する変換を行った場合には、スペクトル係数のブロックが存在する。
BCC合成ブロック122は、遅延ステージ126、レベル変更ステージ127、相関処理ステージ128および逆フィルタバンクステージIFB129をさらに備える。ステージ129の出力では、たとえば、5チャネルサラウンドシステムの場合、5つのチャネルを有する再構成マルチチャネルオーディオ信号が、図5または図4に示すようなラウンドスピーカ124のセットへ出力されてもよい。
入力信号snを、素子125により、周波数領域またはフィルタバンク領域へ変換する。素子125により出力される信号を、コピーノード130により示すとおり、同信号のいくつかのバージョンが得られるようコピーする。元の信号のバージョンの数は、出力信号における出力チャネルの数に等しい。そして、ノード130の元の信号の各バージョンに、ある遅延d、d、...、d、...、dNを与える。遅延パラメータは、図5の補助情報処理ブロック123により計算され、図5のBCC分析ブロック116により計算されたチャネル間時間差から生成される。
同じことが、乗算パラメータa1、a2、...a、...、aに当てはまり、これらもBCC分析ブロック116により計算されたチャネルレベル差に基づき、補助情報処理ブロック123により計算される。
BCC分析ブロック116により計算されるICCパラメータは、ブロック128の出力に、遅延されレベルを操作された信号間にある相関が得られるように、ブロック128の機能性を制御するために使用される。なお、ステージ126、127および128の順序は、図6に示す順序と異なってもよい。
また、オーディオ信号のフレームによる処理において、BCC分析をフレーム的に、すなわち時間的に可変に行い、図6のフィルタバンク分割によりわかるとおり、周波数によるBCC分析をさらに得てもよい。これは、BCCパラメータがスペクトル帯ごとに得られることを意味する。また、これは、オーディオフィルタバンク125が入力信号をたとえば32の帯域パス信号に分ける場合、BCC分析ブロックが32の帯域の各々についてBCCパラメータのセットを取得することも意味する。図6でより詳細に示す、図5のBCC合成ブロック122も、例として上に述べた32の帯域に基づく再構成を行う。
次に、個々のBCCパラメータを決定するために使用されるシナリオについて、図4を参照して説明する。通常、ICLD、ICTDおよびICCパラメータは、チャネル対の間で規定され得る。しかしながら、ICLDおよびICTDパラメータは、参照チャネルおよび各他のチャネルとの間で決定することが好ましい。これについては、図4Aに示す。
ICCパラメータは、異なる態様で規定してもよい。図4Bに示すとおり、一般に、ICCパラメータは、エンコーダにおいて可能な全てのチャネル対の間で決定され得る。図4Cに示すように、随時2つの最も強いチャネルの間でICCパラメータのみを計算するという提案がなされている。この図の例では、随時にチャネル1および2の間のICCパラメータが計算され、別の時に、チャネル1および5の間のICCパラメータが計算される。そして、デコーダは、デコーダにおける最強チャネルの間のチャネル間相関を合成し、残りのチャネル対については、ある種の発見的ルールを用いて、チャネル間コヒーレンスを計算かつ合成する。
たとえば、送信されたICLDパラメータに基づく乗算パラメータa1、aの計算に関しては、AES会議論文、第5574を引用する。ICLDパラメータは、元のマルチチャネル信号のエネルギ分布を表す。普遍性を失わず、図4Aに示すように、それぞれのチャネルと前方左のチャネルとの間のエネルギ差分を表す4つのICLDパラメータをとるのが好ましい。補助情報処理ブロック122においては、乗算パラメータa1、...、aは、再構成出力チャネル全ての合計エネルギーが同じ(または送信された和信号のエネルギに比例するように)であるように、ICLDパラメータから生成される。
図7に示す実施例では、図6の逆フィルタバンクIFB129により得られる周波数/時間変換は省く。その代わり、これらの逆フィルタバンクの入力での個々のチャネルのスペクトル表現を使用し、図7のヘッドホン信号処理装置へ供給して、追加の周波数/時間変換を行わずに、マルチチャネルごとにそれぞれ2つのフィルタで個々のマルチチャネルの評価を行う。
周波数領域で生じる完全な処理に関しては、この場合、マルチチャネルデコーダ、すなわちたとえば図6のフィルタバンク125およびステレオエンコーダが同じ時間/周波数分解能を有する必要がある。また、同じ1つのフィルタバンクを用いることが好ましく、そうすれば、図1に示すとおり、全体の処理に1つのフィルタバンクで済ますことが出来るので特に有利である。この場合、マルチチャネルデコーダおよびステレオエンコーダにおける変換を計算する必要がないので、特に効率的な処理が結果として行われる。
発明の概念においては、入力データおよび出力データそれぞれが、こうして、変換/フィルタバンクにより周波数領域で符号化されるのが好ましく、かつマスキング効果を用いて音響心理学的ガイドラインのもと符号化されることが好ましい。デコーダにおいては特に、信号のスペクトル表現が必要である。この例は、MP3ファイル、AACファイルまたはAC3ファイルである。しかしながら、所謂マトリックス処理の場合のように、入力データおよび出力データそれぞれが和と差を形成することによって符号化されてもよい。この例が、ドルビー・プロロジック(Dolby ProLogic)、ロジック7(Logic7)またはサークル・サラウンド(Circle Surround)である。また、MP3サラウンドの場合のように、マルチチャネル表現のデータは特にパラメトリック法により符号化されてもよく、この方法は、BCC技術に基づくものである。
状況に応じて、生成するための本発明の方法を、ハードウエアまたはソフトウエアのいずれで実現してもよい。これは、デジタル記憶媒体、特に電子的に読み出し可能な制御信号を有するディスクやCD上で実現され、ディスクやCDは、方法が実行されるように、プログラム可能なコンピュータシステムと協働することができる。一般に、本発明は、コンピュータで実行し、発明の方法を実行するための機械で読み取り可能な担体上に記憶されたプログラム符号を有するコンピュータプログラム製品においても実現される。言い換えれば、本発明は、コンピュータ上で実行すれば、方法を実行するためのプログラム符号を有するコンピュータプログラムとしても、実現することもできる。
符号化ステレオ信号を生成するための本発明の装置の回路ブロック図である。 図1のヘッドホン信号処理の実現例を詳細に示す図である。 チャネルデータおよびパラメトリックマルチチャネル情報を生成するための周知のジョイントステレオエンコーダの図である。 BCC符号化/復号化のためのICLD、ICTDおよびICCパラメータを決定するための構成の図である。 BCCエンコーダ/デコーダ列のブロック図である。 図5のBCC合成ブロックの実現例のブロック図である。 時間領域への変換を伴わないマルチチャネルデコーダとヘッドホン信号処理との間のカスケードを示す図である。 時間領域への変換を伴わないヘッドホン信号処理とステレオエンコーダとの間のカスケードを示す図である。 好ましいステレオエンコーダの基本ブロック図である。 図2のフィルタ関数を決定するための再生シナリオの原則を示す図である。 図10により決定されるフィルタの予測されるインパルス応答の原則を示す図である。

Claims (12)

  1. 2を超える数のマルチチャネルに関する情報を有するオーディオ断片またはオーディオデータストリームのマルチチャネル表現から第1のステレオチャネルおよび第2のステレオチャネルを有するオーディオ断片またはオーディオデータストリームの符号化ステレオ信号を生成するための装置であって、装置が、
    マルチチャネル表現から2を超える数のマルチチャネルを与えるための手段(11)と、
    符号化されていない第1のステレオチャネル(10a)および符号化されていない第2のステレオチャネル(10b)を有する符号化されていないステレオ信号を生成するようヘッドホン信号処理を行うための手段(12)を備え、処理を行うための手段(12)が、
    第1のステレオチャネルについては、マルチチャネルを再生するためのラウンドスピーカの仮想位置およびリスナの仮想第1耳位置から生成される第1のフィルタ関数(H iL )で、かつ第2のステレオチャネルについては、ラウンドスピーカの仮想位置およびリスナの仮想第2耳位置から生成される第2のフィルタ関数(H iR )で、各マルチチャネルを評価し、マルチチャネルごとに評価第1チャネルおよび評価第2チャネルを生成するよう構成され、リスナの2つの仮想耳位置は相違し、処理を行うための手段(12)が、さらに
    評価第1チャネルを加算して(22)、符号化されていない第1のステレオチャネル(10a)を取得し、かつ評価第2チャネルを加算して(23)、符号化されていない第2のステレオチャネル(10b)を取得するよう形成され、さらに
    符号化されていない第1のステレオチャネル(10a)および符号化されていない第2のステレオチャネル(10b)を符号化して、符号化ステレオ信号(14)を取得するためのステレオエンコーダ(13)とを備え、
    ステレオエンコーダが、符号化ステレオ信号を送信するために必要なデータレートが、符号化されていないステレオ信号を送信するために必要なデータレートより小さくなるよう構成される、装置。
  2. 処理を行うための手段(12)が、
    直接音声、反射および拡散反響を考慮した第1のフィルタ関数(HiLおよび直接音声、反射および拡散反響を考慮した第2のフィルタ関数(HiRを使用するよう構成される、請求項1に記載の装置。
  3. 第1および第2のフィルタ関数が、直接音声を表す小さい時間値でのピークと、反射を表す中間時間値でのいくつかのより小さなピークと、個々のピークにはもはや分解されずかつ拡散反響を表す連続する領域とを含むフィルタインパルス応答に対応する、請求項2に記載の装置。
  4. マルチチャネル表現が、1つまたはいくつかの基本チャネルおよび1つまたはいくつかの基本チャネルからのマルチチャネルを計算するためのパラメトリック情報を含み、かつ
    与えるための手段(11)が、1つまたはいくつかの基本チャネルおよびパラメトリック情報から少なくとも3つのマルチチャネルを計算するよう構成される、請求項1から請求項3のいずれかに記載の装置。
  5. 与えるための手段(11)が、出力側で、マルチチャネルごとにブロックによる周波数領域表現を与えるよう構成され、かつ
    処理を行うための手段(12)が、第1および第2のフィルタ関数の周波数領域表現によりブロックによる周波数領域表現を評価するよう構成される、請求項4に記載の装置。
  6. 処理を行うための手段(12)が、符号化されていない第1のステレオチャネルおよび符号化されていない第2のステレオチャネルのブロックによる周波数領域表現を与えるように構成され、かつ
    ステレオエンコーダ(13)が、変換系のエンコーダであり、かつ周波数領域表現から時間表現への変換を伴わないで、符号化されていない第1のステレオチャネルおよび符号化されていない第2のステレオチャネルのブロックによる周波数領域表現を処理するように構成される、請求項1から請求項5のいずれかに記載の装置。
  7. ステレオエンコーダ(13)が、第1および第2のステレオチャネルの共通ステレオ符号化(15)を行うよう構成される、請求項1から請求項6のいずれかに記載の装置。
  8. ステレオエンコーダ(13)が、音響心理学的マスキング閾値を用いてスペクトル値のブロックを量子化(16)し、かつこれにエントロピ符号化(17)を行って、符号化ステレオ信号を取得する、請求項1から請求項7のいずれかに記載の装置。
  9. 与えるための手段(11)が、BCCデコーダとして構成される、請求項1から請求項8のいずれかに記載の装置。
  10. 与えるための手段(11)が、いくつかの出力を有するフィルタバンクを備えるマルチチャネルデコーダとして構成され、
    処理を行うための手段(12)が、第1および第2のフィルタ関数により、フィルタバンク出力にある信号を評価するよう構成され、かつ
    ステレオエンコーダ(13)が、周波数領域における符号化されていない第1のステレオチャネルおよび周波数領域における符号化されていない第2のステレオチャネルを量子化し(16)、これにエントロピ符号化(17)を行って、符号化ステレオ信号を取得するよう構成される、請求項1から請求項9のいずれかに記載の装置。
  11. 2を超える数のマルチチャネルに関する情報を含むオーディオ断片またはオーディオデータストリームのマルチチャネル表現から第1のステレオチャネルおよび第2のステレオチャネルを有するオーディオ断片またはオーディオデータストリームの符号化ステレオ信号を生成するための方法であって、方法が、
    マルチチャネル表現から2を超える数のマルチチャネルを与えるステップ(11)と、
    符号化されていない第1のステレオチャネル(10a)および符号化されていない第2のステレオチャネル(10b)を有する符号化されていないステレオ信号を生成するようにヘッドホン信号処理を行うステップ(12)を備え、処理を行うステップ(12)が、
    第1のステレオチャネルについては、マルチチャネルを再生するためのラウンドスピーカの仮想位置およびリスナの仮想第1耳位置から生成される第1のフィルタ関数(H iL )で、かつ第2のステレオチャネルについては、ラウンドスピーカの仮想位置およびリスナの仮想第2耳位置から生成される第2のフィルタ関数(H iR )で、各マルチチャネルを評価して、マルチチャネルごとに評価第1チャネルおよび評価第2チャネルを生成するステップを含み、リスナの2つの仮想耳位置は相違し、処理を行うステップ(12)が、さらに
    評価第1チャネルを加算して(22)、符号化されていない第1のステレオチャネル(10a)を取得するステップと、
    評価第2チャネルを加算して(23)、符号化されていない第2のステレオチャネル(10b)を取得するステップとを含み、さらに
    符号化されていない第1のステレオチャネル(10a)および符号化されていない第2のステレオチャネル(10b)を符号化して、符号化ステレオ信号(14)を取得するためのステレオ符号化を行うステップ(13)と備え、
    ステレオ符号化を行うステップが、符号化ステレオ信号を送信するために必要なデータレートが、符号化されていないステレオ信号を送信するために必要なデータレートより小さくなるよう実行される方法。
  12. コンピュータで実行して、請求項11に記載の符号化ステレオ信号を生成するための方法を実行するためのプログラムコードを有するコンピュータプログラム。
JP2007557373A 2005-03-04 2006-02-22 オーディオ断片またはオーディオデータストリームの符号化ステレオ信号を生成するための装置および方法 Active JP4987736B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE102005010057A DE102005010057A1 (de) 2005-03-04 2005-03-04 Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms
DE102005010057.0 2005-03-04
PCT/EP2006/001622 WO2006094635A1 (de) 2005-03-04 2006-02-22 Vorrichtung und verfahren zum erzeugen eines codierten stereo-signals eines audiostücks oder audiodatenstroms

Publications (2)

Publication Number Publication Date
JP2008532395A JP2008532395A (ja) 2008-08-14
JP4987736B2 true JP4987736B2 (ja) 2012-07-25

Family

ID=36649539

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007557373A Active JP4987736B2 (ja) 2005-03-04 2006-02-22 オーディオ断片またはオーディオデータストリームの符号化ステレオ信号を生成するための装置および方法

Country Status (20)

Country Link
US (1) US8553895B2 (ja)
EP (2) EP1854334B1 (ja)
JP (1) JP4987736B2 (ja)
KR (1) KR100928311B1 (ja)
CN (1) CN101133680B (ja)
AT (1) ATE461591T1 (ja)
AU (1) AU2006222285B2 (ja)
BR (1) BRPI0608036B1 (ja)
CA (1) CA2599969C (ja)
DE (2) DE102005010057A1 (ja)
ES (1) ES2340796T3 (ja)
HK (1) HK1111855A1 (ja)
IL (1) IL185452A (ja)
MX (1) MX2007010636A (ja)
MY (1) MY140741A (ja)
NO (1) NO339958B1 (ja)
PL (1) PL1854334T3 (ja)
RU (1) RU2376726C2 (ja)
TW (1) TWI322630B (ja)
WO (1) WO2006094635A1 (ja)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102005010057A1 (de) * 2005-03-04 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms
US7876904B2 (en) * 2006-07-08 2011-01-25 Nokia Corporation Dynamic decoding of binaural audio signals
KR101499785B1 (ko) 2008-10-23 2015-03-09 삼성전자주식회사 모바일 디바이스를 위한 오디오 처리 장치 및 그 방법
ES2643163T3 (es) 2010-12-03 2017-11-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para codificación de audio espacial basada en geometría
US9530419B2 (en) * 2011-05-04 2016-12-27 Nokia Technologies Oy Encoding of stereophonic signals
FR2976759B1 (fr) * 2011-06-16 2013-08-09 Jean Luc Haurais Procede de traitement d'un signal audio pour une restitution amelioree.
JP6007474B2 (ja) * 2011-10-07 2016-10-12 ソニー株式会社 音声信号処理装置、音声信号処理方法、プログラムおよび記録媒体
US20140341404A1 (en) * 2012-01-17 2014-11-20 Koninklijke Philips N.V. Multi-Channel Audio Rendering
US9602927B2 (en) * 2012-02-13 2017-03-21 Conexant Systems, Inc. Speaker and room virtualization using headphones
KR20140017338A (ko) * 2012-07-31 2014-02-11 인텔렉추얼디스커버리 주식회사 오디오 신호 처리 장치 및 방법
JP6160072B2 (ja) * 2012-12-06 2017-07-12 富士通株式会社 オーディオ信号符号化装置および方法、オーディオ信号伝送システムおよび方法、オーディオ信号復号装置
MX347551B (es) 2013-01-15 2017-05-02 Koninklijke Philips Nv Procesamiento de audio binaural.
CN104919820B (zh) * 2013-01-17 2017-04-26 皇家飞利浦有限公司 双耳音频处理
EP2757559A1 (en) * 2013-01-22 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for spatial audio object coding employing hidden objects for signal mixture manipulation
CN104982042B (zh) 2013-04-19 2018-06-08 韩国电子通信研究院 多信道音频信号处理装置及方法
CN108806704B (zh) 2013-04-19 2023-06-06 韩国电子通信研究院 多信道音频信号处理装置及方法
US9412385B2 (en) * 2013-05-28 2016-08-09 Qualcomm Incorporated Performing spatial masking with respect to spherical harmonic coefficients
US9319819B2 (en) * 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
TWI634547B (zh) * 2013-09-12 2018-09-01 瑞典商杜比國際公司 在包含至少四音訊聲道的多聲道音訊系統中之解碼方法、解碼裝置、編碼方法以及編碼裝置以及包含電腦可讀取的媒體之電腦程式產品
KR102244379B1 (ko) 2013-10-21 2021-04-26 돌비 인터네셔널 에이비 오디오 신호들의 파라메트릭 재구성
ES2922373T3 (es) * 2015-03-03 2022-09-14 Dolby Laboratories Licensing Corp Realce de señales de audio espacial por decorrelación modulada
EP3067885A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
AU2016312404B2 (en) 2015-08-25 2020-11-26 Dolby International Ab Audio decoder and decoding method
TWI577194B (zh) * 2015-10-22 2017-04-01 山衛科技股份有限公司 環境音源辨識系統及其環境音源辨識之方法
EP3208800A1 (en) * 2016-02-17 2017-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for stereo filing in multichannel coding
US10187740B2 (en) * 2016-09-23 2019-01-22 Apple Inc. Producing headphone driver signals in a digital audio signal processing binaural rendering environment
WO2018073759A1 (en) * 2016-10-19 2018-04-26 Audible Reality Inc. System for and method of generating an audio image
CN112261545A (zh) * 2019-07-22 2021-01-22 海信视像科技股份有限公司 显示装置
US11523239B2 (en) 2019-07-22 2022-12-06 Hisense Visual Technology Co., Ltd. Display apparatus and method for processing audio

Family Cites Families (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US602349A (en) * 1898-04-12 Abrading mechanism
US5632005A (en) 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
JPH04240896A (ja) * 1991-01-25 1992-08-28 Fujitsu Ten Ltd 音場制御装置
FR2688371B1 (fr) * 1992-03-03 1997-05-23 France Telecom Procede et systeme de spatialisation artificielle de signaux audio-numeriques.
US5703999A (en) * 1992-05-25 1997-12-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Process for reducing data in the transmission and/or storage of digital signals from several interdependent channels
JP3636361B2 (ja) 1992-07-07 2005-04-06 レイク・テクノロジイ・リミテッド 高精度及び高効率を有するディジタルフィルタ
DE4236989C2 (de) * 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
JPH06269097A (ja) * 1993-03-11 1994-09-22 Sony Corp 音響装置
US5488665A (en) 1993-11-23 1996-01-30 At&T Corp. Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels
JP3404837B2 (ja) 1993-12-07 2003-05-12 ソニー株式会社 多層符号化装置
US5659619A (en) * 1994-05-11 1997-08-19 Aureal Semiconductor, Inc. Three-dimensional virtual audio display employing reduced complexity imaging filters
US5982903A (en) * 1995-09-26 1999-11-09 Nippon Telegraph And Telephone Corporation Method for construction of transfer function table for virtual sound localization, memory with the transfer function table recorded therein, and acoustic signal editing scheme using the transfer function table
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5742689A (en) * 1996-01-04 1998-04-21 Virtual Listening Systems, Inc. Method and device for processing a multichannel signal for use with a headphone
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
DE69718735T2 (de) * 1996-04-10 2003-11-13 Koninklijke Philips Electronics N.V., Eindhoven Kodiervorrichtung zum kodieren einer vielzahl von informationssignalen
DK1025743T3 (da) 1997-09-16 2013-08-05 Dolby Lab Licensing Corp Anvendelse af filtereffekter i stereohovedtelefoner for at forbedre den rumlige opfattelse af en kilde rundt om en lytter
ATE501606T1 (de) * 1998-03-25 2011-03-15 Dolby Lab Licensing Corp Verfahren und vorrichtung zur verarbeitung von audiosignalen
AUPP271598A0 (en) * 1998-03-31 1998-04-23 Lake Dsp Pty Limited Headtracked processing for headtracked playback of audio signals
CN1065400C (zh) 1998-09-01 2001-05-02 国家科学技术委员会高技术研究发展中心 兼容ac-3和mpeg-2的音频编解码器
EP1026680A1 (en) * 1998-09-02 2000-08-09 Matsushita Electric Industrial Co., Ltd. Signal processor
DE19932062A1 (de) 1999-07-12 2001-01-18 Bosch Gmbh Robert Verfahren zur Aufbereitung von quellcodierten Audiodaten sowie Sender und Empfänger hierzu
JP2001100792A (ja) * 1999-09-28 2001-04-13 Sanyo Electric Co Ltd 符号化方法、符号化装置およびそれを備える通信システム
JP3335605B2 (ja) * 2000-03-13 2002-10-21 日本電信電話株式会社 ステレオ信号符号化方法
JP3616307B2 (ja) * 2000-05-22 2005-02-02 日本電信電話株式会社 音声・楽音信号符号化方法及びこの方法を実行するプログラムを記録した記録媒体
JP2002191099A (ja) * 2000-09-26 2002-07-05 Matsushita Electric Ind Co Ltd 信号処理装置
JP3228474B2 (ja) * 2001-01-18 2001-11-12 日本ビクター株式会社 音声符号化装置及び音声復号化方法
JP2002262385A (ja) * 2001-02-27 2002-09-13 Victor Co Of Japan Ltd 音像定位信号の生成方法、及び音像定位信号生成装置
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
JP2003009296A (ja) * 2001-06-22 2003-01-10 Matsushita Electric Ind Co Ltd 音響処理装置および音響処理方法
US20050141722A1 (en) * 2002-04-05 2005-06-30 Koninklijke Philips Electronics N.V. Signal processing
KR101021079B1 (ko) * 2002-04-22 2011-03-14 코닌클리케 필립스 일렉트로닉스 엔.브이. 파라메트릭 다채널 오디오 표현
KR100522593B1 (ko) 2002-07-08 2005-10-19 삼성전자주식회사 다채널 입체음향 사운드 생성방법 및 장치
AU2003244932A1 (en) * 2002-07-12 2004-02-02 Koninklijke Philips Electronics N.V. Audio coding
KR20040027015A (ko) * 2002-09-27 2004-04-01 (주)엑스파미디어 스트리밍시 오디오의 대역폭을 줄이기 위하여 몰입형오디오를 이용한 새로운 다운믹싱 기법
JP4084990B2 (ja) * 2002-11-19 2008-04-30 株式会社ケンウッド エンコード装置、デコード装置、エンコード方法およびデコード方法
JP4369140B2 (ja) 2003-02-17 2009-11-18 パナソニック株式会社 オーディオ高能率符号化装置、オーディオ高能率符号化方法、オーディオ高能率符号化プログラム及びその記録媒体
FR2851879A1 (fr) * 2003-02-27 2004-09-03 France Telecom Procede de traitement de donnees sonores compressees, pour spatialisation.
JP2004309921A (ja) * 2003-04-09 2004-11-04 Sony Corp 符号化装置、符号化方法及びプログラム
US7949141B2 (en) * 2003-11-12 2011-05-24 Dolby Laboratories Licensing Corporation Processing audio signals with head related transfer function filters and a reverberator
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US20050276430A1 (en) * 2004-05-28 2005-12-15 Microsoft Corporation Fast headphone virtualization
US20050273324A1 (en) * 2004-06-08 2005-12-08 Expamedia, Inc. System for providing audio data and providing method thereof
JP2005352396A (ja) * 2004-06-14 2005-12-22 Matsushita Electric Ind Co Ltd 音響信号符号化装置および音響信号復号装置
DE102005010057A1 (de) * 2005-03-04 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms

Also Published As

Publication number Publication date
IL185452A (en) 2011-07-31
RU2376726C2 (ru) 2009-12-20
US8553895B2 (en) 2013-10-08
AU2006222285B2 (en) 2009-01-08
WO2006094635A1 (de) 2006-09-14
ATE461591T1 (de) 2010-04-15
EP2094031A2 (de) 2009-08-26
TWI322630B (en) 2010-03-21
JP2008532395A (ja) 2008-08-14
BRPI0608036B1 (pt) 2019-05-07
KR100928311B1 (ko) 2009-11-25
EP1854334A1 (de) 2007-11-14
AU2006222285A1 (en) 2006-09-14
IL185452A0 (en) 2008-01-06
US20070297616A1 (en) 2007-12-27
NO339958B1 (no) 2017-02-20
EP2094031A3 (de) 2014-10-01
HK1111855A1 (en) 2008-08-15
CA2599969C (en) 2012-10-02
PL1854334T3 (pl) 2010-09-30
MY140741A (en) 2010-01-15
ES2340796T3 (es) 2010-06-09
CN101133680A (zh) 2008-02-27
KR20070100838A (ko) 2007-10-11
BRPI0608036A2 (pt) 2009-11-03
DE102005010057A1 (de) 2006-09-07
DE502006006444D1 (de) 2010-04-29
RU2007136792A (ru) 2009-04-10
TW200701823A (en) 2007-01-01
NO20075004L (no) 2007-10-03
CN101133680B (zh) 2012-08-08
EP1854334B1 (de) 2010-03-17
CA2599969A1 (en) 2006-09-14
MX2007010636A (es) 2007-10-10

Similar Documents

Publication Publication Date Title
JP4987736B2 (ja) オーディオ断片またはオーディオデータストリームの符号化ステレオ信号を生成するための装置および方法
US20200335115A1 (en) Audio encoding and decoding
RU2407226C2 (ru) Генерация пространственных сигналов понижающего микширования из параметрических представлений мультиканальных сигналов
TWI555011B (zh) 處理音源訊號之方法、訊號處理單元、二進制轉譯器、音源編碼器以及音源解碼器
KR101251426B1 (ko) 디코딩 명령으로 오디오 신호를 인코딩하기 위한 장치 및방법
JP4589962B2 (ja) レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法
JP4712799B2 (ja) マルチチャネル出力信号を発生するためのマルチチャネルシンセサイザおよび方法
NO344093B1 (no) Kompatibel flerkanal-koding/dekoding.
US8880413B2 (en) Binaural spatialization of compression-encoded sound data utilizing phase shift and delay applied to each subband
KR20070107698A (ko) 오디오 소스의 파라메트릭 조인트 코딩
MX2008010631A (es) Codificacion y decodificacion de audio

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080526

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20081218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100706

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100713

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101012

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101019

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110510

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110808

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110815

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120403

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120425

R150 Certificate of patent or registration of utility model

Ref document number: 4987736

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150511

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250