JP2007533221A - 低ビットレート用パラメトリック表現の生成方法 - Google Patents

低ビットレート用パラメトリック表現の生成方法 Download PDF

Info

Publication number
JP2007533221A
JP2007533221A JP2007507759A JP2007507759A JP2007533221A JP 2007533221 A JP2007533221 A JP 2007533221A JP 2007507759 A JP2007507759 A JP 2007507759A JP 2007507759 A JP2007507759 A JP 2007507759A JP 2007533221 A JP2007533221 A JP 2007533221A
Authority
JP
Japan
Prior art keywords
channel
channels
signal
parameter
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007507759A
Other languages
English (en)
Other versions
JP4688867B2 (ja
Inventor
フレドリック ヘン
ヨナス レーデン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB filed Critical Dolby International AB
Publication of JP2007533221A publication Critical patent/JP2007533221A/ja
Application granted granted Critical
Publication of JP4688867B2 publication Critical patent/JP4688867B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Abstract

低ビットレートへの適用に特に適したマルチチャネル信号のパラメトリック表現を生成するために、再生機構内の最大サウンドエネルギの位置を、方向パラメータ情報を用いて符号化して送信する。マルチチャネル再生(54)を行うために、方向パラメータ情報で特定した出力チャネルのエネルギ配分を、方向パラメータ情報で制御するが、残りの臨場感チャネル(59)内のエネルギ配分を、方向パラメータ情報で制御しない。
【選択図】図5c

Description

本発明は、空間パラメータを用いた、オーディオ信号のマルチチャネル表現の符号化に関する。本発明は、出力チャネルの数よりも少ない数の、数多くのチャネルからマルチチャネル信号を再生するパラメータを定義して推定する、新規の方法を教示する。特に、マルチチャネル表現用のビットレートを最小化して、考えられ得る全てのチャネル構成に対するデータを容易に符号化して復号化可能にする、マルチチャネル信号の符号化表現を提供することを目的としている。
例えば、放送システムにおいて、マルチチャネルオーディオに対する関心がますます高まっていることに伴い、低ビットレートデジタルオーディオ符号化技術に対する要求が明白になっている。モノラルダウンミックス信号と、さらに、ステレオイメージの非常にコンパクトなパラメトリック表現とから、元のステレオイメージと非常によく似ているステレオイメージを再生することが可能であることが、国際特許出願PCT/SE02/01372“低ビットレート音声符号化に適用する効率的で拡張可能なパラメトリックステレオ符号化(Efficient and scalable Parametric Stereo Coding for Low Bitrate Audio Coding Applications)”に記載されている。この基本原理は、入力信号を周波数帯域と時間セグメントとに分割して、これらの周波数帯域と時間セグメントとに対して、内部チャネル強度差(IID)と、内部チャネルコヒーレンス(ICC)とを推定するものである。第1のパラメータは、指定の周波数帯域内の2つのチャネル間のエネルギ測定値であり、第2のパラメータは、指定の周波数帯域に対する2つのチャネル間の相関の推定値である。デコーダ側では、送信したIIDデータに従って、2つの出力チャネルに間にモノラル信号を配信して、元のステレオチャネルのチャネル相関特性を維持するために、非相関臨場感信号を付加することにより、モノラル信号からステレオイメージが再生される。
ステレオ信号からマルチチャネル出力を生成するいくつかのマトリックス化技術が、存在する。これらの技術は大抵の場合、位相差に基づいてバックチャネルを生成する。フロントチャネルと比較して、バックチャネルは若干遅れることがよくある。性能を最大にするために、マルチチャネル信号から2つのステレオベースチャネルに対して、エンコーダ側で特別のダウンミキシング規則を用いて、ステレオファイルが生成される。これらのシステムは一般に、バックチャネルに一定の臨場感サウンドを持つ安定したフロント音像を有しており、複雑な音声材料を異なるスピーカに分離する機能には制限がある。
いくつかのマルチチャネル構成が存在する。最も良く知られている構成は、5.1構成である(センターチャネル、フロント左/右、サラウンド左/右、およびLFEチャネル)。国際電気通信連合(ITU)の無線通信標準化部門BS.775により、任意のチャネル構成よりも少ない数のチャネルからなるチャネル構成を得るためのダウンミキシング方法が、いくつか定義されている。ダウンミキシングに基づいて全チャネルを復号化しなければならないやり方の代わりに、チャネルを復号化する前に、当面の再生チャネル構成に適切なパラメータを受信機に抽出させることができるマルチチャネル表現を備えることは望ましい。別の選択肢は、デコーダ側で任意のスピーカの組み合わせに対してマッピング可能なパラメータを備えることである。さらに、固有に拡張可能なパラメータセットは、拡張可能または埋め込み符号化の視点から望ましい。例えば、サラウンドチャネルに対応するデータを、ビットストリームのエンハンスメントレイヤに保存することができる。
和信号またはダウンミックス信号と、さらにパラメトリック副情報とを用いるマルチチャネル信号の別の表現として、本技術では、バイノーラルキュー符号化(BCC)が周知である。この技術は、“バイノーラルキュー符号化パート1:音響心理学の原理および設計原理(Binaural Cue Coding Part 1:Psycho−Acoustic Fundamentals and Design Principles)”、IEEE会報、スピーチオーディオ処理学会紀要、11巻、第6号、2993年11月、“バイノーラルキュー符号化パートII:方法および応用例(Binaural Cue Coding Part II:Schemes and Applications)”、C.フォーラ(Faller)およびF.バウムガルテ(Baumgarte)、IEEE会報、スピーチオーディオ処理学会紀要11巻、第6号、2993年11月に記載されている。
一般に、バイノーラルキュー符号化は、1つのダウンミキシングオーディオチャネルと副情報とに基づくマルチチャネル空間レンダリング方法である。BCCエンコーダが算出して、BCCデコーダがオーディオ再生またはオーディオレンダリングに用いるいくつかのパラメータには、内部チャネルレベル差、内部チャネル時間差、および内部チャネルコヒーレンスパラメータが含まれる。これらの内部チャネルキューが、空間イメージを認識する決定要因である。これらのパラメータが、元のマルチチャネル信号の時間サンプルブロックに対して与えられ、マルチチャネル信号サンプルの各ブロックが、いくつかの周波数帯域に対していくつかのキューを有するように、これらが、任意の選択可能な周波数となる。C個の再生チャネルといった一般的な場合は、チャネル対の間の各サブバンド、すなわち、基準チャネルを基準とする各チャネルに対して、内部チャネルレベル差および内部チャネル時間差を考える。1つのチャネルを、各内部チャネルレベル差に対する基準チャネルとして定義する。内部チャネルレベル差および内部チャネル時間差があるので、用いられる再生機構のスピーカ対の一方の間の任意の方向に対して音源を描写することができる。描写した音源の幅または拡散性を求めるために、全オーディオチャネルに対してサブバンド毎に1つのパラメータを考えることで十分である。このパラメータは、内部チャネルコヒーレンスパラメータである。考えられ得る全てのチャネル対が同じ内部チャネルコヒーレンスパラメータを持つように、サブバンド信号を変調して描写した音源の幅が制御される。
BCC符号化では、基準チャネル1と任意の他のチャネルとの間で、全内部チャネルレベル差が求められる。例えば、センターチャネルが基準チャネルとして求められる場合は、左チャネルとセンターチャネルとの間の第1の内部チャネルレベル差、右チャネルとセンターチャネルとの間の第2の内部チャネルレベル差、左サラウンドチャネルとセンターチャネルとの間の第3の内部チャネルレベル差、および右サラウンドチャネルとセンターチャネルとの間の第4の内部チャネルレベル差を算出する。このシナリオは、5チャネル方式を説明するものである。5チャネル方法がさらに、“サブウーファー”チャネルとしても周知である、低周波数エンハンスメントチャネルを含む場合は、低周波数エンハンスメントチャネルと、1つの基準チャネルである、センターチャネルとの間の第5の内部チャネルレベル差が算出される。
“モノラル”チャネルとも呼ぶ1つのダウンミックスチャネルと、ICLD(内部チャネルレベル差)、ICTD(内部チャネル時間差)、およびICC(内部チャネルコヒーレンス)等の送信したキューとを用いて元のマルチチャネルを再生する場合は、これらのキューを用いてモノラル信号のスペクトル係数が変更される。レベル変更を求める正の実数を各スペクトル係数に対して用いることにより、レベル変更が行われる。各スペクトル係数に対して位相変更を求めるものの大きさの複素数を用いて、内部チャネル時間差が生成される。別の関数により、コヒーレンスの影響を算出する。はじめに基準チャネルに対して係数を計算することにより、各チャネルのレベル変更に対する係数が算出される。各周波数分割に対して、全チャネルの出力の合計が、和信号の出力と同じであるように、基準チャネルに対する係数が算出される。そして、基準チャネルに対するレベル変更係数に基づいて、個別のICLDパラメータを用いて、他のチャネルに対するレベル変更係数が算出される。
従って、BCC合成を行うために、基準チャネルに対するレベル変更係数が算出される。この算出を行うために、1つの周波数帯域に対して全ICLDパラメータが必要である。次に、1つのチャネルに対するこのレベル変更に基づいて、他のチャネルに対するレベル変更係数、すなわち、基準チャネルでないチャネルを算出することができる。
完璧な再生を行うには、内部チャネルレベル差それぞれを全て必要とする点で、このアプローチには欠点がある。誤りを犯しやすい伝送チャネルが存在する場合に、この要件にはさらに問題がある。マルチチャネル出力信号それぞれを算出するのに内部チャネルレベル差をそれぞれ必要とするので、送信した内部チャネルレベル差内にそれぞれエラーがあると、再生マルチチャネル信号内にエラーが発生することになる。また、フロント左チャネル、フロント右チャネル、またはセンターチャネルに情報の多くが含まれるので、伝送中に内部チャネルレベル差を損失すると、再生が全くできなくなる。マルチチャネル再生にさほど重要なチャネルではないが、例えば、左サラウンドチャネルまたは右サラウンドチャネルに限ってこの内部チャネルレベル差が必要である。フロント左チャネルを、以下では左チャネルと呼ぶ。フロント右チャネルを、以下では右チャネルと呼ぶ。低周波数エンハンスメントチャネルの内部チャネルレベル差が伝送中に損失すると、この状況はさらに悪化する。低周波数エンハンスメントチャネルは、聴取者の聴取の快適さにとってさほど決定的なものではないのが、この状況では、マルチチャネル再生を全然行えないか、または誤ったマルチチャネル再生だけが行われることになる。従って、1つの内部チャネルレベル差にエラーは、再生出力チャネルそれぞれでのエラーに伝搬することになる。
このようなマルチチャネルパラメータ化方法は、エネルギ配分を完全に再生する意図に基づいているが、空間エネルギ配分に対する内部チャネルレベル差またはバランスパラメータを多数送信する必要があるので、エネルギ配分をこのように正確に再生するための代償は、ビットレートの増加である。これらのエネルギ配分方法は当然、元のチャネルの時間波形を正確に再生しないが、それにもかかわらず、正確なエネルギ配分特性のために、十分な出力チャネル品質となる。
しかしながら、低ビットレートに適用するためには、これらの方法では依然として非常に数多くのビットを必要とし、このために、このよう低ビットレートに適用するためには、マルチチャネル再生については考慮せずに、モノラルまたはステレオ再生だけで満足する結果となっていた。
国際特許出願PCT/SE02/01372 "両耳キュー符号化パート1:音響心理学の原理および設計原理(Binaural Cue Coding Part 1:Psycho−Acoustic Fundamentals and Design Principles)" 、C.フォーラ(Faller)およびF.バウムガルテ(Baumgarte)、IEEE会報、スピーチオーディオ処理学会紀要、11巻、第6号、2003年11月 "両耳用キュー符号化パートII:方法および応用例(Binaural Cue Coding Part II:Schemes and Applications)"、C.フォーラ(Faller)およびF.バウムガルテ(Baumgarte)、IEEE会報、スピーチオーディオ処理学会紀要11巻、第6号、2003年11月
本発明の目的は、低ビットレートの制約があっても、マルチチャネル再生が可能な、マルチチャネル処理方法を提供することである。
この目的は、請求項1に記載のパラメトリック表現を生成する装置、請求項19に記載のマルチチャネル信号再生装置、請求項28に記載のパラメトリック表現の生成方法、請求項29に記載のマルチチャネル信号再生方法、請求項30に記載のコンピュータプログラム、または請求項31に記載のパラメータ表現により、達成される。
本発明は、サウンドエネルギを再生する再生機構内で、マルチチャネル表現に関する聴取者の主な主観的聴取感を、指定の領域/方向を認識することによって聴取者が感じ取るという知見に基づいている。この領域/方向を、ある程度の精度で聴取者が特定することができる。しかしながら、個別のスピーカ間でサウンドエネルギを配分することは、主観的聴取印象にはさほど重要でない。例えば、好ましくは再生機構の中心点である基準点と2つのスピーカとの間に渡って、全チャネルのサウンドエネルギの集中が、再生機構セクタ内にある場合は、他のスピーカ間でどのようにエネルギを配分するかは、聴取者の主観的品質印象にはさほど重要でない。再生マルチチャネル信号を元のマルチチャネル信号と比較する場合、再生音場の特定の領域内にサウンドエネルギに集中していることが、元のマルチチャネル信号の対応する状況に類似している場合は、ユーザは高い度合いで満足するということがわかっている。
この視点では、このような方法では、再生機構内で、全チャネル間に完全な配分を符号化して送信することに専念されていたので、従来技術のパラメトリックマルチチャネル方法では、ある量の冗長情報を処理して送信していることが明らかである。
本発明によれば、最大ローカルサウンドエネルギを含む領域だけが符号化され、このローカル最大サウンドエネルギにさほど寄与しない、他のチャネル間のエネルギの配分は無視されるので、この情報を送信するビットを必要としない。従って、本発明は、従来技術の全エネルギ配分システムと比較して、音場からより少ない情報を符号化して送信するので、ビットレート条件に非常に制約があっても、マルチチャネル再生が可能になる。
換言すれば、本発明は、基準位置に対する最大ローカルサウンド領域の方向を求め、この情報に基づいて、サウンド最大が位置している、またはサウンド最大を取り巻く2つのスピーカがある、セクタを形成するスピーカ等のスピーカのサブグループが、デコーダ側で選択される。この選択には、最大エネルギ領域に対する送信した方向情報を用いるだけである。デコーダ側では、最大ローカルサウンド領域が再生されるように、選択したチャネル内の信号エネルギが設定される。選択したチャネル内のエネルギは、元のマルチチャネル信号内の対応するチャネルのエネルギと異なるようにでき、そして、必ず異なるようになる。それにもかかわらず、最大ローカルサウンドの方向は、元の信号内のローカル最大方向と全く同じであるか、少なくとも非常によく似ている。残りのチャネルに対する信号は、臨場感信号として合成して生成される。臨場感信号も、通常モノラルチャネルである、送信したベースチャネルから導出される。しかしながら、臨場感チャネルを生成するには、本発明では、必ずしも、送信した情報を必要としない。その代わりに、非相関信号を生成するために反射器または任意の他の周知の装置を用いるというように、臨場感チャネルに対する非相関信号がモノラル信号から導出される。
選択したチャネルと残りのチャネルとの合成エネルギを、確実にモノラル信号または元の信号と同じにするために、エネルギ条件を満たすように、選択したチャネルおよび残りのチャネル内の全信号をスケーリングして、レベル制御が行われる。しかしながら、チャネルを選択して、選択したチャネル内のエネルギ間のエネルギ比を調整するために用いる送信した方向情報により、このエネルギ最大領域が求められるので、この全チャネルのスケーリングは、エネルギ最大領域を移動することにならない。
次に、2つの好適な実施の形態について、簡単に述べる。本発明は、オーディオ信号のパラメータ化マルチチャネル表現の問題に関する。好適な一実施の形態は、マルチチャネルオーディオ信号内のサウンド位置を符号化して復号化する方法を含む。任意のマルチチャネル信号であるマルチチャネル信号をエンコーダ側でダウンミキシングし、マルチチャネル信号内のチャネル対を選択し、エンコーダで、選択したチャネル間のサウンドを位置決めするパラメータを算出し、位置決めしたパラメータとチャネル対の選択とを符号化し、デコーダ側で、ビットストリームデータから復号化した、選択と位置決めしたパラメータとに基づいて、マルチチャネルオーディオを再生する。
別の実施の形態は、マルチチャネルオーディオ信号内でサウンド位置を符号化して復号化する方法を含む。任意のマルチチャネル信号であるマルチチャネル信号をエンコーダ側でダウンミキシングし、マルチチャネル信号を表す角度および半径を算出し、角度および半径を符号化し、デコーダ側で、ビットストリームデータから復号化した角度および半径に基づいて、マルチチャネルオーディオを再生する。
添付の図面を参照して、例示により、本発明について説明する。これにより、本発明の範囲または精神を限定するものではない。
図1aは、ルート・パンパラメータシステムの実行可能な信号方式を示す。
図1bは、ルート・パンパラメータシステムの実行可能な信号方式を示す。
図1cは、ルート・パンパラメータシステムの実行可能な信号方式を示す。
図1dは、ルート・パンパラメータシステムデコーダの実行可能なブロック図を示す。
図2は、ルート・パンパラメータシステムの実行可能な信号方式を示す。
図3aは、実行可能な2つのチャネルパニングを示す。
図3bは、実行可能な3つのチャネルパニングを示す。
図4aは、角度・半径パラメータシステムの実行可能な信号方式を示す。
図4bは、角度・半径パラメータシステムの実行可能な信号方式を示す。
図5aは、元のマルチチャネル信号のパラメトリック表現を生成する本発明の装置のブロック図を示す。
図5bは、マルチチャネル信号再生するための本発明の装置の概略ブロック図を示す。
図5cは、図5bの出力チャネル生成装置の好適な実施の形態を示す。
図6aは、ルート・パンの実施の形態の全体的なフローチャートを示す。
図6bは、好適な角度・半径の実施の形態のフローチャートを示す。
以下の説明する実施の形態は、オーディオ信号のマルチチャネル表現に関する本発明の原理を説明するものに過ぎない。ここに説明する構成および詳細の変更および変形は、当業者にとって明らかであることを理解されたい。従って、ここに記載し説明する実施の形態で示す特定の詳細ではなく、本発明の特許請求の範囲によってのみ、限定されるものである。
以下で‘ルート・パン’と呼ぶ、本発明の第1の実施の形態は、スピーカアレイに渡ってオーディオ音源を位置付けるために、以下のパラメータを用いる。
2つの(または3つの)スピーカの間のサウンドを連続して位置付けるパノラマパラメータと、
パノラマパラメータを、スピーカ対(または3つのスピーカ)を定義するルーティング情報に適用する。
図1a〜1cは、この方法を示す。一般的な5つのスピーカ機構を用いている。左フロントチャネルスピーカ(L)、102、111および122、センターチャネルスピーカ(C)、103、112および123、右フロントチャネルスピーカ(R)、104、113および124、左サラウンドチャネルスピーカ(Ls)101、110および121、および右サラウンドチャネルスピーカ(Rs)105、114、および125を含む。元の5チャネル入力信号は、エンコーダでモノラル信号にダウンミックスされるモノラル信号が、符号化され、送信され、または保存される。
図1aの例では、エンコーダが、サウンドエネルギが基本的に104(R)と105(Rs)に集中していることを決定する。従って、チャネル104および105が、パノラマパラメータが適用されるスピーカ対として選択されている。従来技術の方法により、パノラマパラメータが推定され、符号化されて、送信される。これは、矢印107で示されている。これは、この特定のスピーカ対の選択で仮想音源を位置付ける限界である。同様に、従来技術の方法により、チャネル対に対するオプションのステレオ幅パラメータを導出して、送信することができる。図2の表により定義される3つのビット‘ルート’信号により、チャネル選択を送信することができる。PSPはパラメトリックステレオ対(Parametric Stereo Pair)を表し、表の第2列は、ルート信号の任意の値でパニングおよびオプションのステレオ幅情報をどのスピーカに適用するか示している。DAPは導出した臨場感対(Perived Ambionc Pair)を示している。すなわち、臨場感信号を生成するためにPSPを任意の従来技術の方法で処理することにより、得られるステレオ信号である。表の第3列は、DAP信号をどのスピーカ対に供給するか定義している。臨場感レベル信号により、定義済みのまたはオプションのいずれかの相対レベルをエンコーダから送信する。0から3のルート値は、4チャネルシステムを回転させることに対応する(現在のセンターチャネルスピーカ(C)を無視して)、90度の段階で“フロント”チャネルのPSPと、“バック”チャネルに対するDAPとを含む(およそ、スピーカアレイ配置による)。従って、図1aはルート値1に対応し、106は、DAP信号の空間到達範囲を形成する。明らかに、この方法は、0〜3のルート値に対応するスピーカ対を選択することにより、部屋の360度に渡ってサウンド対象を移動することが可能にする。
図1dは、従来技術によるパラメトリックステレオデコーダ130、臨場感信号生成装置131、およびチャネルセレクタ132を備える、ルート・パンデコーダの実行可能な一実施の形態を示すブロック図である。パラメトリックステレオデコーダは、入力としてベースチャネル(ダウンミックス)信号133、パノラマ信号134、およびステレオ幅信号135(従来技術によるパラメトリックステレオビットストリーム方法136に対応する)を受信し、PSP信号137を生成して、PSP信号は、チャネルセレクタに供給される。また、PSPは臨場感生成装置に供給されて、従来技術の方法により、例えば、遅延を行い反射器により、DAP信号138を生成する。これも、チャネルセレクタに送信される。チャネルセレクタは、ルート信号139(パノラマ信号とともに、方向パラメータ情報140を生成する)を受信して、図2の表に基づいて、PSP信号とDAP信号とを対応する出力チャネル141に接続する。チャネルセレクタ内のラインは、図1aおよび図2に示す、ルート=1の場合に対応する。オプションとして、臨場感生成装置は、入力として臨場感レベル信号142を受信して、臨場感生成装置出力レベルを制御する。別の実施の形態では、DAP生成するために、臨場感生成装置131が信号134および135も用いる。
図1bは、この方法の別の可能性を示す。ここで、隣り合っていない111(L)および114(Rs)が、スピーカ対として選択される。従って、仮想音源は、矢印116で示すように、パンパラメータにより、対角線上に移動可能である。115は、対応するDAP信号の配置を示している。図2の4および5のルート値は、この対角パニングに対応する。
上記の実施の形態の変形例として、2つの隣り合っていないスピーカを選択した場合に、図3bに示すように、3方向パニング方法により、選択したスピーカ対の間のスピーカが供給される。図3aは従来のステレオパニング方法を示し、図3bは3方向パニング方法を示す。ともに、従来技術による方法である。図1cは、3方向パニング方法の応用例を示す。例えば、102(L)および104(R)がスピーカ対を形成する場合は、信号は、中央位置パン値として103(C)を経由される。この場合をさらに、図1dのチャネルセレクタ132に破線で示す。3方向パニングを用いているので、一般化パラメトリックステレオデコーダのセンターチャネル出力143がアクティブになっている。サウンド段を安定させるために、重複が大きいパン曲線を用いることもできる。中央位置パニングで外側のスピーカが再生に寄与する。全パニング範囲に渡って一定に出力できるように、中央のスピーカからの信号がその分減衰する。さらに3方向パニングを用いることができるルーティングの例としては、C−R−RsおよびL−[LsとR]−Rsがあげられる(すなわち中央位置パニングにより、2つのLsおよびRから信号を得る)。もちろん、3方向パニングが適用されるかどうかについて、ルート信号により送信される。あるいは、少なくとも1つのスピーカが間にある2つの隣り合っていないスピーカをルート信号で表す場合は、3方向パニングを行うというように、定義済みの動作とすることもできる。
上記の方法は、1つの音源には十分対処する。例えばヘリコプターが周囲を旋回しているといった、特別なサウンドエフェクトに有益である。もし、異なる周波数帯域に対して個別のルーティングおよびパニングを用いる場合は、周波数が異なっていて、別々の位置にある複数の音源に対処する。
以下で‘角度・半径’と呼ぶ本発明の第2の実施の形態は、上記の方法を一般化したものである。位置決めのために、以下のパラメータを用いられる。
全スピーカアレイに渡ってサウンドを連続して位置決めする角度パラメータ(360度範囲)と、
スピーカアレイに渡ってサウンドの広がりを制御する半径パラメータ(0〜1範囲)とを用いる。
換言すれば、極座標、角度αおよび半径rにより、複数のスピーカの音楽素材を表すことができる。αは全360度をカバーできるので、サウンドを任意の方向にマッピングすることができる。半径rにより、2つの隣り合うスピーカだけでなく、いくつかのスピーカにもサウンドをマッピングすることが可能になる。上記の3方向パニングの一般化として考えることができる。半径パラメータにより、重複量を算出する(例えば、大きな値のrが小さな重複に対応する)。
上記の実施の形態を例示すると、0〜1で定義する[r]の範囲内の半径を考える。0は、全スピーカが同じ量のエネルギを有することを意味し、1は、[α]で定義する方向に最も近い2つの隣り合うスピーカ間に、2つのチャネルパニングを適用するものとして解釈することができる。エンコーダでは、例えば、入力スピーカ構成と、各スピーカ内のエネルギとを用いて[α、r]を抽出して、質量の中心と全く同様に、サウンド中心点を算出することができる。一般に、サウンド中心点は、再生機構内の別のスピーカよりも、サウンドエネルギをより多く発するスピーカにより近い。サウンド中心点を算出するには、再生機構内のスピーカの空間位置を用いることができる。オプションとしてスピーカの方向特性と、個別のチャネルの電気信号エネルギに直接依存する、各スピーカが発するサウンドエネルギとを用いることができる。
次に、マルチチャネルスピーカ機構に位置するサウンド中心点は、角度および半径[α、r]を用いてパラメータ化される。
デコーダ側では、各スピーカにおける定義量のサウンドに全ての[α、r]の組み合わせを与えるために、現在用いているスピーカ構成に複数のスピーカパニング規則が用いられる。従って、エンコーダ側で存在したように、デコーダ側で同じ音源方向が生成される。
本発明の別の利点は、正確なサウンド配置をさらに行うために、デコーダで現在あるスピーカ構成にパラメータ化をマッピングできるので、エンコーダおよびデコーダチャネル構成が同じである必要がないことである。
401から405が図1aの101から105に対応する図4aに、右フロントスピーカ(R)404の近くにサウンド408がある場合を例示する。r407が1、α406が右フロントスピーカ(R)404と右サラウンドスピーカ(RS)405との間に向いている。デコーダは、右フロントスピーカ(R)404と右サラウンドスピーカ(RS)との間に2つのチャネルパニングを適用する。
410〜414が図1aの101から105に対応する図4bに、音像417の全体的な方向が左フロントスピーカ411に近い場合を例示する。抽出したα415は音像の中央に向いていて、抽出したα415およびr416に属する送信したオーディオ信号を配分するために、マルチスピーカパニングを用いて音像幅を再生することを、抽出したr416が確実にする。
定義済みの規則を用いて、角度・半径によるパラメータ化を合成することができる。臨場感信号が生成され、(αの)反対方向に付加される。あるいは、臨場感信号に対し角度・半径を別々に送信することを用いることができる。
好適な実施の形態では、本発明の方法を特定のシナリオに適応させるために、信号方式がさらに用いられる。上記の2つの基本方向パラメータ方法は、全シナリオを十分にカバーしていない。しばしば、“フルサウンド段”がL−C−Rに渡って必要であったり、また、1つのバックチャネルから有向サウンドが欲しかったりすることがある。機能を拡張して、この状況に対応させるためのいくつかの可能性がある。

1.必要に応じて、パラメータセットをさらに送信する。
例えば、ダウンミックス信号とパラメータとの間の関係が1:1となるように、システムにデフォルト設定を行うが、時折第2のパラメータセットを送信して、1:2構成に対応するダウンミックス信号を動作させる。明らかに、復号化パラメータを重畳することにより、このやり方でさらに任意の音源を得ることができる。

2.デフォルトのパニング動作を作動しないようにするために、デコーダ側規則を用いる(ルーティングおよびパニングまたは角度・半径値によるが)。個別の周波数帯域に対し別々のパラメータ前提である実施可能な1つの規則は、“基本的に他と異なるように少ない数の周波数だけを経由させてパンして、‘少ない数の帯域’に対する‘他のもの’のパニングを補間して、‘少数のもの’に対する送信したパニングを適用したり、また、例1と同じ作用を得たりすることができる場合”である。この動作のオン/オフを切り替えるために、フラグが用いられる。

換言すれば、この例は、個別の周波数帯域に対して別々のパラメータを用いている。以下に従って、周波数方向で補間を行っている。他(メイングループ)と(外側層が)基本的に異なるように少ない数の周波数帯域を経由させてパンする場合は、上記の説明に従って、さらにパラメータセットとして、外側層のパラメータを補間する(送信していないが)。前記少数の周波数帯域に対し、メイングループのパラメータを周波数方向が補間される。最後に、少ない数の帯域に利用できる2つのパラメータセットが重畳される。これにより、少ない数の外側層帯域に対する主方向でのスペクトルホールを回避しながら、パラメータをさらに送信することなく、メイングループとは基本的に異なる方向に、音源をさらに配置できる。この動作のオン/オフを切り替えるために、フラグが用いられる。

3.特別プリセットマッピングをいくつか送信する。例えば、
a)全スピーカに対するルート信号
b)任意の1つのスピーカに対するルート信号
c)スピーカの選択したサブセットに対するルート信号(>2)。
上記の3つの拡張した場合は、角度・半径方法ばかりでなく、ルート・パン方法も適用する。以下の例から明らかなように、プリセットマッピングは、ルート・パンの場合に特に有益である。臨場感信号についても説明する。
ようやく、図2に実施可能な特別プリセットマッピングの例を示す。最後の2つのルート値、6および7は、パニング情報をまったく送信しないといった、特別の場合に対応する。そして、第4列に従ってダウンミックス信号がマッピングされる。最終列に従って、臨場感信号は生成されマッピングされる。最終行により定義される場合は、“拡散音場の中央にいる”結果を生成する。この例によるシステムに対するビットストリームはさらに、スピーカアレイ内でPSP列におけるスピーカ対が隣り合っていない場合はいつも、3方向パニングを有効にするフラグを含むことができる。
さらに、本発明の例では、ダイレクトサウンドに1つの角度・半径パラメータセットを用い、臨場感サウンドに第2の角度・半径パラメータセットを用いるシステムである。この例では、モノラル信号が送信され、ダイレクトサウンドをパニングする角度・半径パメータセットと、臨場感に角度・半径パラメータセットを用いて適用する非相関臨場感信号の生成との両方に用いる。概略的に、ビットストリームの例は次のようになる。

<angle_direct,radius_direct>
<angle_ambience,radius_ambience>
<M>

さらに、本発明の例では、2つのルート・パンによるパラメータ化および角度・半径によるパラメータ化と、2つのモノラル信号とを用いる。この例では、角度・半径パラメータが、モノラル信号M1からダイレクトサウンドパニングを記述する。さらに、M2から生成した臨場感信号をどのように適用するか記述するために、ルート・パンが用いられる。従って、チャネルについて臨場感信号が適用され、また、例として、図2の臨場感表現を用いることができるかについて、送信したルート値が記述する。対応するビットストリーム例は次のようになる。

<angle_direct,radius_direct>
<route,ambience_level>
<M1_direct>
<M2_ambience>

本発明によるマルチチャネルスピーカ機構内のサウンドの空間位置決めに対するパラメータ化方法は、数多くのやり方で適用できるブロックを構成している。

i)周波数範囲
(全周波数帯域に対する)グローバルルーティングまたは、
帯域毎のルーティング

ii)パラメータセットの数
静的(時間に対し固定)または、
動的(必要に応じてさらにセットを送信する)

iii)信号適用、すなわち符号化
ダイレクト(ドライ)サウンドまたは、
アンビエント(ウェット)サウンド

iv)ダウンミックス信号の数とパラメータセットとの関係、例えば、
1:1(モノラルダウンミックスおよび1つのパラメータセット)、
2:1(ステレオダウンミックスおよび1つのパラメータセット)または、
1:2(モノラルダウンミックスおよび2つのパラメータセット)

ダウンミックス信号Mが、元の全入力チャネルの合計となると考える。これを適用するように重み付けして、適用するように位相は全入力の合計を調整できる。

v)ダウンミックス信号とパラメータセットとを重畳する、例えば、
1:1+1:1(2つの異なるモノラルダウンミックスおよび対応する1つのパラメータセット)

後者は、適応ダウンミックスおよび符号化に有益である。例えば、アレイ(ビーム形成)アルゴリズム、信号分離(第1の最大信号、第2の最大信号等の符号化)である。
理解しやすいように、以下では、従来技術による、2つのチャネル間(図3a)または3つのチャネル間で(図3b)バランスパラメータを用いるパニングについて説明する。一般に、バランスパラメータは、例えば、再生機構内の2つのスピーカの2つの異なる空間位置の間での音源配置を表す。図3aおよび図3bは、左チャネルと右チャネルとの間のこのような状況を示す。
図3aは、スピーカ対に渡って、パノラマパラメータがエネルギ配分とどのように関係しているかを示す例である。x軸は、間隔[−1、1]に渡るパノラマパラメータである。これは、[最も左、最も右]に対応している。y軸は、[0、1]に渡る。0は0出力に対応し、1は全相対出力レベルに対応する。曲線301は、パニングパラメータにより、左チャネルに対してどの程度の出力を配分するかを示し、302は、右チャネルに対し対応する出力を示している。従って、−1のパラメータ値は、全入力が左スピーカにパンされ、右スピーカには全くパンしないことを示す。結果として、1のパニング値に対しても同様に当てはまる。
図3bは、3方向パニング状況を示す。3つの考えられる曲線311、312および313を示している。図3aと同様に、x軸は、[−1、1]をカバーし、y軸は、[0、1]に渡っている。上記のように、曲線311および312は、左および右チャネルに対してどの程度信号を配分するかを示している。曲線312は、センターチャネルに対してどの程度信号が配分されるかを示している。
次に、図5a〜図6bについて、本発明の概念を説明する。図5aは、少なくとも3つの元のチャネルを有する元のマルチチャネル信号に関して、パラメトリック表現を生成する本発明の装置を示す。ベースチャネルに加えて用いられる方向パラメータ情報を含むパラメトリック表現は、少なくとも2つのチャネルを有する出力信号表現のために、少なくとも3つの元のチャネルから算出される。さらに、図1a、図1b、図1c、図4a、図4bで説明した、元のチャネルは、再生機構内の異なる空間位置に位置付けられた音源に対応付けられている。各再生機構は、基準位置10(図1a)を有している。これは、好ましくは、スピーカ101〜105が配置された、円の中心である。
本発明の装置は、方向パラメータ情報を求めるための方向情報計算器50を含む。本発明によれば、方向パラメータ情報は、再生機構内の基準位置10から、少なくとも3つの元のチャネルの合成サウンドエネルギが集中する領域の方向を示す。この領域を、図1aにセクタ12として示している。この領域は、基準位置10から右チャネル104と、基準位置10から右サラウンドチャネル105とに延びる線で定義されている。現在のオーディオ分野では、例えば、領域12に支配的な音源が位置していると仮定している。また、全5つのチャネルまたは少なくとも右および右サラウンドチャネル間の最大ローカルサウンドエネルギが、位置14に位置していると仮定している。また、基準位置からこの領域への方向、特に、最大ローカルエネルギ14への方向は、方向矢印16で示されている。方向矢印は、基準位置10および最大ローカルエネルギ位置14で規定されている。
第1の実施の形態によれば、方向パラメータ情報として、チャネル対を表すルート情報と、2つの選択したチャネル間のエネルギ配分を表すバランスパラメータまたはパンパラメータとを有している。最大再生エネルギは、2方向矢印18に沿ってしか移動することができない。マルチチャネル再生での最大ローカルエネルギを矢印18に沿って配置できる程度または位置を、パンパラメータまたはバランスパラメータにより算出する。例えば、最大ローカルサウンドが図1aの14にある場合は、この実施の形態では、この点を正確に符号化することができない。しかしながら、最大ローカルエネルギ方向を符号化するには、この方向を表すバランスパラメータがパラメータとなる。これにより、再生最大ローカルエネルギが矢印18と矢印16との交点に存在することになる。これを、図1aに“バランス(パン)”として示す。
ルート・パン方法のエンコーダの実施可能な一実施の形態では、図1aの最大ローカルエネルギ14と、対応する角度・半径とをはじめに算出する。角度を用いて、チャネル対(または3つの)が選択され、ルートパラメータ値を生成する。最後に、角度が、選択したチャネル対に対するパン値に変換される。オプションとして臨場感レベルパラメータを算出するために、半径が用いられる。
しかしながら、図1aの実施の形態には利点がある。チャネル対およびバランスを求めるために、最大ローカルエネルギ14を必ずしも正確に算出する必要がないことである。その代わりに、元のチャネル内のエネルギを確認して、最も高いエネルギを有する2つのチャネル(または、例えば、L−C−Rの3チャネル)を選択することにより、必要な方向情報がチャネルから単に導出される。この特定したチャネル対(3つ)は、最大ローカルエネルギ14が位置する再生機構内のセクタ12を構成する。従って、チャネル対を選択することは、すでにおおまかに方向を確定している。バランスパラメータにより、方向の“微細に調整する”が実行される。おおまかに近似するために、本発明では、選択したチャネル内のエネルギ間の商を単純に算出することにより、バランスパラメータを求める。従って、選択していない他のチャネルC、L、Lsがあるので、チャネル対の選択とバランスパラメータとにより符号化した方向16が、他のスピーカがあるので、実際の最大ローカルエネルギ方向から若干はずれてしまうことになる。しかしながら、ビットレートを低減するために、図1aのルート・パン実施の形態では、このような逸脱が許容される。
図5aの装置はまた、パラメトリック表現が方向パラメータ情報を含むように、パラメトリック表現を生成するためのデータ出力生成装置52を含む。好適な実施の形態では、基準位置から最大ローカルエネルギへの(少なくとも)おおまかな方向を含む方向パラメータ情報は、エンコーダからデコーダに送信した内部チャネルレベル差情報にすぎないことに留意されたい。従って、従来技術のBCC方法とは異なり、本発明は、5つのチャネルシステムに対して4または5のバランスパラメータを送信しないで、1つのバランスパラメータを送信するだけである。
好ましくは、方向情報計算器50は、合成エネルギが集中する領域が、再生機構内の全サウンドエネルギの少なくとも50%を含むように、方向情報を求める。
さらに、またはあるいは、好ましくは、方向情報計算器50は、領域が、やはりこの領域内に位置する、最大ローカルエネルギ値の75%を超えるローカルエネルギ値を有する、再生機構内の位置だけを含むように、方向情報を求める。
図5bは、本発明のデコーダ機構を示す。特に、図5bは、少なくとも1つのベースチャネルと、少なくとも3つの元のチャネルの合成サウンドエネルギが集中し、少なくとも1つのベースチャネルを導出した再生機構内の位置から再生機構内の領域への方向を表す、方向パラメータ情報を含むパラメトリック表現を用いる、マルチチャネル信号再生装置を示す。特に、本発明の装置は、少なくとも1つのベースチャネルとパラメトリック表現とを受信する入力インターフェース53を含む。ベースチャネルとパラメトリック表現とは、1つのデータストリーム、または異なるデータストリームに含めることができる。入力インターフェースは、ベースチャネルおよび方向パラメータ情報を、出力チャネル生成装置54に出力する。
出力チャネル生成装置は、基準位置に対して再生機構内に配置する多数の出力チャネルを生成するために作動している。出力チャネルの数は、ベースチャネルの数よりも多い。本発明によれば、出力チャネル生成装置は、基準点から再生出力チャネルの合成エネルギが集中する領域への方向が、方向パラメータ情報の示す方向と同じであるように、方向パラメータ情報に応答して、出力チャネルを生成するために作動する。このために、出力チャネル生成装置54は、基準位置に関する情報を必要とする。これを送信することもできるし、好ましくは、所定のものとする。また、出力チャネル生成装置54は、再生機構内のスピーカの異なる空間位置に関する情報を必要とする。再生出力チャネル出力55で、出力チャネル生成装置と接続する。この情報は好ましくは所定のものであり、通常の5プラス1機構、または変更した機構、あるいは、7チャネルまたはそれ以上またはそれ以下のチャネルを有するはチャネル構成を示す特定の情報ビットにより、容易に送信することができる。
図5bの本発明の出力チャネル生成装置54の好適な実施の形態は、図5cに含まれる。方向情報は、チャネルセレクタに入力される。チャネルセレクタ56は、方向情報が求めるエネルギの出力チャネルを選択する。図1の実施の形態では、選択したチャネルは、チャネル対のチャネルで、これを、方向情報ルートビットである程度明確に送信する(図2の第1列)。
図4の実施の形態では、チャネルセレクタ56が選択したチャネルが暗黙的に送信される。これは、再生装置に接続した再生機構と必ずしも関係する必要はない。その代わりに、角度αを、再生機構内の特定の方向に向ける。この事実に関わらず、再生スピーカ機構が元のチャネル機構と全く同じであるかどうか、角度αが位置付けられている、セクタを構成するスピーカをチャネルセレクタ56が判定することができる。幾何学的算出、または好ましくは参照テーブルにより、これを行うことができる。
また、角度は、セクタを構成するチャネル間のエネルギ配分を示す。特定の角度αさらに、チャネルのパニングまたは平衡化を定義する。図4aについて考えると、“サウンドエネルギの中心”として示される、ある点で円を通る角度は、右サラウンドスピーカ405よりも右スピーカ404に近い。従って、サウンドエネルギの中心点と、この点から右スピーカ404および右サラウンドスピーカ405までの距離とに基づいて、デコーダは、スピーカ404とスピーカ405との間のバランスパラメータを算出する。次に、チャネルセレクタ56は、そのチャネル選択をアップミキサに送信する。チャネルセレクタは、全出力チャネルから少なくとも2つのチャネルを選択することになる。図4bの実施の形態では、3つ以上のスピーカがある。それにもかかわらず、特別全スピーカ情報を送信する場合を除いて、チャネルが全スピーカを選択することはない。次に、アップミキサ57は、方向情報に明示的に送信したバランスパラメータに基づいて、または送信した角度から導出したバランス値に基づいて、ベースチャネル線58を介して受信したモノラル信号のアップミキシングを行う。好適な実施の形態では、内部チャネルコヒーレンスパラメータについても送信して、選択したチャネルを算出するために、アップミキサ57によって用いられる。選択したチャネルは、最大ローカルサウンドを再生するダイレクトまたは“ドライサウンド”を出力する。この最大ローカルサウンドの位置は、送信した方向情報により符号化される。
好ましくは、他のチャネル、すなわち、残りのチャネルまたは選択していないチャネルも、出力信号を準備する。他のチャネルに対する出力信号は、臨場感信号生成装置を用いて生成される。この装置は、例えば、非相関“ウェット”サウンドを生成する反射器を含む。好ましくは、非相関サウンドもベースチャネルから導出され、残りのチャネルに入力される。好ましくは、図5bの本発明の出力チャネル生成装置54は、レベル制御装置60を含む。レベル制御装置60は、出力チャネルの全エネルギが送信したベースチャネル内のエネルギと同じであるか、またはある関係を有するように、残りのチャネルのみならずアップミキシングした選択したチャネルをスケーリングする。もちろん、レベル制御は、全チャネルに対してグローバルエネルギスケーリングを行うことができるが、方向パラメータ情報により符号化され送信されても、基本的にサウンドエネルギ密度を変更しない。
上述のように、低ビットレートの実施の形態では、本発明は、残りの臨場感チャネルを生成するための送信情報を全く必要としない。その代わりに、臨場感チャネルの信号は、定義済みの非相関規則に従って、送信したモノラル信号から導出して、残りのチャネルに転送する。臨場感チャネルのレベルと、選択したチャネルのレベルとの間のレベル差は、この低ビットレートの実施の形態では、あらかじめ定義されている。
より良い出力品質を供給するがビットレートの増加を必要とする、より高機能の装置には、臨場感サウンドエネルギ方向は、エンコーダ側で算出され、送信される。また、臨場感サウンドの“マスタチャネル”である、第2のダウンミキシングチャネルを生成することができる。好ましくは、非臨場感サウンドから元のマルチチャネル信号内の臨場感サウンドを分離することにより、この臨場感マスタチャネルがエンコーダ側で生成される。
図6aは、ルート・パン実施の形態のフローチャートを示す。ステップ61では、最も高いエネルギを有するチャネル対が選択される。次に、この対の間のバランスパラメータが算出される(62)。次に、チャネル対およびバランスパラメータが、方向パラメータ情報としてデコーダに送信される(36)。デコーダ側では、チャネル対とチャネル間のバランスと算出する(64)ために、送信した方向パラメータ情報が用いられる。チャネル対とバランス値とに基づいて、例えば、通常のモノラル/ステレオアップミキサ(PSP)を用いて、ダイレクトチャネルの信号が生成される(65)。また、1つ以上の非相関臨場感信号(DAP)を用いて、残りのチャネルの非相関臨場感信号が生成される(66)。
角度・半径の実施の形態が、図6bのフローチャートとして示される。ステップ71では、(仮想)再生機構内のサウンドエネルギの中心が算出される。サウンドの中心および基準位置に基づいて、基準位置からエネルギの中心までのベクトルの角度および距離が算出される(72)。
次に、ステップ73に示すように、角度および距離は、方向パラメータ情報(角度)および拡散測定値(距離)として送信される。拡散測定値は、ダイレクト信号を生成するのにいくつのスピーカを作動させればいいかを示すものである。換言すれば、拡散測定値は、領域の場所を示している。エネルギが集中する位置は、2つのスピーカの間の接続線に位置しているが(このような位置は、これらのスピーカの間のバランスパラメータにより、完全に定義される)、2つのスピーカは、このような接続線には位置していない。このような位置を再生するには、3つ以上のスピーカが必要である。
好適な実施の形態では、全ダイレクトスピーカが完全相関信号を発する場合と比較して、サウンド幅を合成して増加するために、拡散パラメータを一種のコヒーレンスパラメータとして用いられる。この場合では、“ダイレクト”チャネルの信号に付加する非相関信号を生成する反射器または任意の他の装置を制御するために、ベクトルの長さが用いられる。
デコーダ側では、図6bのステップ74に示すように、角度、距離、基準位置および再生チャネル機構を用いて、再生機構内のチャネルサブグループが算出される。ステップ75では、角度、半径で制御する1〜n個のアップミキシング信号、従って、サブグループに含まれるチャネルの数で、サブグループの信号が生成される。サブグループ内のチャネルの数が少ない場合、例えば、2に等しい場合は、つまり半径の値が大きい場合は、ベクトルの角度により示されるバランスパラメータを用いる単純なアップミキシングが、図6aの実施の形態として用いることができる。しかしながら、半径が減少し、従って、サブグループ内のチャネル数が増加する場合は、デコーダ側で参照テーブルを用いることが考えられる。デコーダ側は、入力として、角度・半径を有し、出力として特定のベクトルおよびレベルパラメータに対応付けられた、サブグループにおける各チャネルのIDを有している。好ましくは、選択したサブグループ内の出力チャネルそれぞれの信号エネルギを算出するために、パーセントパラメータはモノラル信号エネルギに適用される。図6bのステップ76で述べたように、非相関臨場感信号は生成され、選択していないスピーカに転送される。
本発明の方法の特定の実施要件によるが、本発明の方法を、ハードウェアまたはソフトウェアで実施することができる。本発明の方法を実行するプログラム可能コンピュータシステムと協働する、デジタル記憶媒体、特に、電気的に読み取り可能な制御信号を格納したディスクまたはCDを用いることにより、実施することができる。従って、一般に、本発明は、機械読み取り可能キャリアに格納したプログラムコードを有するコンピュータプログラム製品である。コンピュータプログラム製品をコンピュータ上で実行する場合は、プログラムコードにより本発明の方法を実行する。換言すれば、従って、本発明の方法は、コンピュータプログラムをコンピュータ上で実行する場合は、少なくとも1つの本発明の方法を実行するプログラムコードを有するコンピュータプログラムである。
ルート・パンパラメータシステムの実施可能な信号方式を示す。 ルート・パンパラメータシステムの実施可能な信号方式を示す。 ルート・パンパラメータシステムの実施可能な信号方式を示す。 ルート・パンパラメータシステムデコーダの実施可能なブロック図を示す。 ルート・パンパラメータシステムの実施可能な信号方式を示す。 実施可能な2つのチャネルパニングを示す。 実施可能な3つのチャネルパニングを示す。 角度・半径パラメータシステムの実施可能な信号方式を示す。 角度・半径パラメータシステムの実施可能な信号方式を示す。 元のマルチチャネル信号のパラメトリック表現を生成する本発明の装置のブロック図を示す。 マルチチャネル信号再生するための本発明の装置の概略ブロック図を示す。 図5bの出力チャネル生成装置の好適な実施の形態を示す。 ルート・パンの実施の形態の全体的なフローチャートを示す。 好適な角度・半径の実施の形態のフローチャートを示す。

Claims (32)

  1. 少なくとも3つの元のチャネル(L、R、Rs)を有する元のマルチチャネル信号のパラメトリック表現を生成する装置であって、前記パラメータ表現は、ベースチャネルの他に方向パラメータ情報を含み、前記少なくとも3つの元のチャネルから導出した方向パラメータ情報を用いて、少なくとも2つのチャネルを有する出力信号を生成し、前記元のチャネルは再生機構内の異なる空間位置にある音源(103、104、105)に対応付けられていて、前記再生機構は基準位置(10)を有し、
    前記再生機構内の前記基準位置(16)から、前記少なくとも3つの元のチャネルの合成サウンドエネルギが集中している(14)領域(12)への方向を示す前記方向パラメータ情報を求める方向情報計算器(54)と、
    前記パラメータ表現が前記方向パラメータ情報を含むように、前記パラメータ表現を生成するデータ出力生成装置(52)とを備える、装置。
  2. 前記方向情報計算器(50)が、
    前記少なくとも3つの元のチャネルから前記最も高いエネルギを有する元のチャネル対を検索する(61)、または少なくとも4つの元のチャネルから前記最も高いエネルギを有する3つの元のチャネルを検索する、チャネル対検索器と、
    前記元のチャネル対の間のバランスを示すバランスパラメータを算出する(62)バランスパラメータ計算器とを備え、
    前記データ出力生成装置(52)が、前記元のチャネル対の表示および前記バランスパラメータを前記方向パラメータ情報として、前記パラメトリック表現に含めるようにする、請求項1に記載の装置。
  3. 前記チャネル対検索器が、前記元のチャネル対を複数の符号語の符号語として符号化し、各符号語が、前記元のチャネルのうちの考えられるチャネル対と対応付けられている、請求項2に記載の装置。
  4. 前記方向情報計算器が、チャネルサブグループが再生するエネルギ配分に関する情報だけを含むように、前記方向パラメータ情報を算出し、前記チャネルサブグループが、少なくとも2つのチャネルを含み、最大で、元のチャネル数よりも少ない数の数多くのチャネルを含む、請求項1ないし請求項3のいずれかに記載の装置。
  5. 前記方向情報計算器が、基準線(9)と、前記基準位置から前記合成サウンドエネルギが集中する領域を指すベクトルとの間の角度を算出し(72)、
    前記データ出力生成装置が、前記角度に関する情報を前記方向パラメータ情報として前記パラメトリック表現に含めるようにする、請求項1または請求項4に記載の装置。
  6. 前記方向情報計算器(50)が、前記再生機構内のサウンドエネルギの中心点を算出して、
    前記方向情報計算器(50)がさらに、前記基準線と前記基準位置から前記サウンド中心点への前記ベクトルとの間の角度を算出する、請求項5に記載の装置。
  7. 前記ベクトルの長さを算出する拡散計算器をさらに備え、前記ベクトルの前記長さが、前記元のマルチチャネル信号のサウンド拡散状況を示し、
    前記データ出力生成装置が、前記ベクトルの前記長さの情報を拡散パラメータとして前記パラメトリック表現に含めるようにする、請求項5または請求項6に記載の装置。
  8. 前記拡散計算器が、0から1の間で前記ベクトルの前記長さをスケーリングし、
    0の前記長さが前記基準点に対応し、1の前記長さが線に対応し、前記音源の前記異なる空間位置を特定することができる、請求項7に記載の装置。
  9. 前記方向情報計算器(50)が、別の位置の別の角度を算出し、前記別の位置が、前記元のチャネル内の臨場感サウンドの前記合成サウンドエネルギが集中する領域にある、請求項5ないし請求項8のいずれかに記載の装置。
  10. 前記マルチチャネル信号の臨場感チャネルを再生する場合は、前記方向情報計算器(50)が、前記元の信号から前記臨場感信号を抽出し、前記抽出した臨場感信号を処理して前記別の角度とともに用いるベースチャネルをさらに得る、請求項9に記載の装置。
  11. 前記方向情報計算器(50)が、前記合成エネルギが集中する前記領域に、前記再生機構内の前記全サウンドエネルギの少なくとも50%が含まれるように、前記方向情報を求める、請求項1ないし請求項10のいずれかに記載の装置。
  12. 前記方向情報計算器(50)が、前記領域に、前記領域内に位置する最大ローカルエネルギ値の75%を超えるローカルエネルギ値を有する前記再生機構内の位置が含まれるように、前記方向情報を求める、請求項1ないし請求項11のいずれかに記載の装置。
  13. 少なくとも1つのベースチャネルを得るために、前記元のチャネルをダウンミキシングするためのダウンミキサをさらに備え、
    前記データ出力生成装置が、前記少なくとも1つのダウンミキシングチャネルを前記パラメータ表現に含めるようにする、請求項1ないし請求項12のいずれかに記載の装置。
  14. 前記元のマルチチャネル信号を用いて臨場感信号レベルを算出する臨場感信号レベル計算器をさらに備え、
    前記データ出力生成装置が、前記臨場感信号レベルを前記パラメトリック表現に含めるようにする、請求項1ないし請求項13のいずれかに記載の装置。
  15. 前記データ出力生成装置が、3方向パニングインジケータを前記パラメトリック表現に入力する、請求項1ないし請求項14のいずれかに記載の装置。
  16. 前記元のマルチチャネル信号に基づいて、少なくとも1つのパラメータがさらに必要かどうか判定するパラメータ算出制御装置をさらに備え、
    前記パラメータ算出制御装置が、前記データ出力生成装置を制御して、前記少なくとも1つのパラメータをさらに前記パラメトリック表現に含めるようにする、請求項1ないし請求項15のいずれかに記載の装置。
  17. 前記方向情報計算器(50)が、前記方向パラメータ情報に加えて用いられる方向パラメータ情報をさらに算出して、
    前記データ出力生成装置が、前記方向パラメータ情報の代わりに前記別の方向パラメータ情報と、制御信号とを前記パラメトリック表現に含めるようにし、
    前記制御信号が、前記パラメトリック表現に含まれていない前記方向パラメータ情報に加えて、前記別の方向パラメータ情報を用いられることをマルチチャネル再生装置に知らせる信号で、補間により、前記パラメトリック表現における他の方向パラメータ情報を用いて導出した信号である、請求項1ないし請求項16のいずれかに記載の装置。
  18. 前記方向情報計算器(50)が、前記元のマルチチャネル信号の2以上の周波数帯域の方向パラメータ情報、または前記元のマルチチャネル信号の2以上の時間区分の方向パラメータ情報を求める、請求項1ないし請求項17のいずれかに記載の装置。
  19. 少なくとも1つのベースチャネルと、基準再生機構における位置から、前記再生機構における少なくとも3つの元のチャネルの合成サウンドエネルギが集中し、前記少なくとも1つのベースチャネルを導出した領域への方向を示す方向パラメータ情報を含むパラメトリック表現とを用いるマルチチャネル信号再生装置であって、
    前記基準位置(10)に対して、前記再生機構内に位置する、ベースチャネルの数よりも多い、多数の出力チャネルを生成する出力チャネル生成装置(54)を備え、
    前記出力チャネル生成装置(54)が、前記基準位置(10)から前記再生出力チャネルの前記合成エネルギが集中する領域への方向が、前記方向パラメータ情報によって示される前記方向に依存するように、前記方向パラメータ情報に応答して、前記出力チャネルを生成する、装置。
  20. 前記出力チャネル生成装置が、前記方向パラメータ情報に基づいて、少なくとも2つの出力チャネルを算出し、前記ベースチャネルから導出した信号を用い、前記信号が、臨場感信号を生成するための残りの出力チャネルに対し、遅延、利得、相関または等化の点で、前記ベースチャネルと異なっている、請求項19に記載の装置。
  21. 前記方向パラメータ情報が選択したチャネル対に関する情報を含み、前記バランスパラメータが、前記選択した出力チャネル対の間のバランスを示し、
    前記出力チャネル生成装置(54)が、前記チャネル対の間のエネルギ配分を、前記バランスパラメータにより求めるように、前記選択した出力チャネル対を算出し、前記選択した出力チャネル対に含まれていないチャネルの臨場感チャネル信号を算出する、請求項19または請求項20に記載の装置。
  22. 前記出力チャネル生成装置(54)が、そのエネルギが定義済みの設定に基づくように、または前記残りのチャネルの合成エネルギが前記パラメトリック表現にさらに含まれている臨場感パラメータに依存するように、前記残りのチャネルを算出する、請求項20または請求項21に記載の装置。
  23. 前記方向パラメータ情報が、前記再生機構における前記基準位置(10)に関する角度を含み、前記角度が、前記再生機構における基準位置から発するベクトルを定義し、
    前記出力チャネル生成装置(54)が、前記角度を、前記再生機構における全チャネルのサブグループにマッピングして、前記角度に基づいて、前記サブグループにおける前記チャネル間のエネルギ配分を求める、請求項19または請求項20に記載の装置。
  24. 前記方向パラメータ情報がさらに、ベクトルの長さに関する情報を含み、
    前記出力チャネル生成装置(54)が、前記サブグループにおける数多くのチャネルが前記ベクトルの前記長さに依存するように、前記角度をマッピングする、請求項23に記載の装置。
  25. 前記出力チャネル生成装置が、前記装置と接続して再生を行う前記再生機構に依存するマッピング規則を用いて前記角度をマッピングして、前記マッピング規則は、前記ベクトルが位置するセクタを構成する、2つの隣り合うチャネルのエネルギが、前記セクタの外側のチャネルのエネルギよりも高くなるようになっている、請求項23または請求項24に記載の装置。
  26. 前記出力チャネル生成装置(54)が、前記少なくとも1つのベースチャネルに基づいて非相関信号を生成する非相関器(59)を備え、
    前記出力チャネル生成装置がさらに、前記パラメトリック表現に含まれるコヒーレンスパラメータに基づいて、前記非相関信号をダイレクトサウンド出力チャネルに付加し、または、
    前記非相関信号を、前記方向パラメータ情報により制御されないエネルギの配分を有する臨場感出力チャネルに含めるようにする、請求項19ないし請求項25のいずれかに記載の装置。
  27. 前記パラメータ方向情報が、前記再生機構における互いに隣り合わない出力チャネルを特定し、
    前記出力チャネル生成装置が、前記パラメータ方向情報に基づいて前記2つの特定したチャネル間のエネルギ配分と、前記特定したチャネル間の少なくとも1つのチャネルとを算出するために、少なくとも3つのチャネルパニングを行う、請求項19ないし請求項26のいずれかに記載の装置。
  28. 少なくとも3つの元のチャネル(L、R、Rs)を有する元のマルチチャネル信号のパラメトリック表現の生成方法であって、前記パラメータ表現は、ベースチャネルに加えて方向パラメータ情報を含み、前記少なくとも3つの元のチャネルから導出した方向パラメータ情報を用いて、少なくとも2つのチャネルを有する出力信号を生成し、前記元のチャネルは再生機構における異なる空間位置にある音源(103、104、105)に対応付けられていて、前記再生機構は基準位置(10)を有し、
    前記再生機構における前記基準位置(16)から、前記少なくとも3つの元のチャネルの合成サウンドエネルギが集中している(14)領域(12)への方向を示す前記方向パラメータ情報を求め(54)、
    前記パラメータ表現が前記方向パラメータ情報を含むように、前記パラメータ表現を生成する(52)、方法。
  29. 少なくとも1つのベースチャネルと、基準再生機構における位置から、前記再生機構おける少なくとも3つの元のチャネルの合成サウンドエネルギが集中し、前記少なくとも1つのベースチャネルを導出した領域への方向を示す方向パラメータ情報を含むパラメトリック表現とを用いるマルチチャネル信号再生方法であって、
    前記基準位置(10)に対して、前記再生機構において位置する、ベースチャネルの数よりも多い、多数の出力チャネルを生成し(54)、
    前記生成ステップ(54)が、前記基準位置(10)から前記再生出力チャネルの前記合成エネルギが集中する領域への方向が、前記方向パラメータ情報により示される前記方向に依存するように、前記方向パラメータ情報に応答して、前記出力チャネルが生成される、方法。
  30. コンピュータ上で実行する場合は、請求項28または請求項29に記載の方法を実施する機械読み取り可能命令を有するコンピュータプログラム。
  31. 基準再生機構における位置から前記再生機構における少なくとも3つの元のチャネルの合成サウンドエネルギが集中し、少なくとも1つのベースチャネルを導出した領域への方向を示す、方向パラメータ情報を含む、パラメータ表現。
  32. 請求項19に記載の装置に入力があった場合に、マルチチャネル再生を制御する、請求項31に記載のパラメータ表現。
JP2007507759A 2004-04-16 2005-04-14 低ビットレート用パラメトリック表現の生成方法 Active JP4688867B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SE0400997-3 2004-04-16
SE0400997A SE0400997D0 (sv) 2004-04-16 2004-04-16 Efficient coding of multi-channel audio
PCT/EP2005/003950 WO2005101905A1 (en) 2004-04-16 2005-04-14 Scheme for generating a parametric representation for low-bit rate applications

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2010029362A Division JP5165707B2 (ja) 2004-04-16 2010-02-12 低ビットレート用パラメトリック表現の生成方法

Publications (2)

Publication Number Publication Date
JP2007533221A true JP2007533221A (ja) 2007-11-15
JP4688867B2 JP4688867B2 (ja) 2011-05-25

Family

ID=32294333

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2007507759A Active JP4688867B2 (ja) 2004-04-16 2005-04-14 低ビットレート用パラメトリック表現の生成方法
JP2010029362A Active JP5165707B2 (ja) 2004-04-16 2010-02-12 低ビットレート用パラメトリック表現の生成方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2010029362A Active JP5165707B2 (ja) 2004-04-16 2010-02-12 低ビットレート用パラメトリック表現の生成方法

Country Status (8)

Country Link
US (1) US8194861B2 (ja)
EP (1) EP1745676B1 (ja)
JP (2) JP4688867B2 (ja)
KR (1) KR100855561B1 (ja)
CN (1) CN1957640B (ja)
HK (1) HK1101848A1 (ja)
SE (1) SE0400997D0 (ja)
WO (1) WO2005101905A1 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009543389A (ja) * 2006-07-08 2009-12-03 ノキア コーポレイション バイノーラル音響信号の動的な復号
JP2010521910A (ja) * 2007-03-21 2010-06-24 フラウンホファー・ゲゼルシャフト・ツール・フォルデルング・デル・アンゲバンテン・フォルシュング・アインゲトラーゲネル・フェライン 多チャンネル音声フォーマット間の変換のための方法および装置
JP2013514696A (ja) * 2009-12-17 2013-04-25 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 第1のパラメトリック空間オーディオ信号を第2のパラメトリック空間オーディオ信号に変換する装置および方法
JP2014175743A (ja) * 2013-03-07 2014-09-22 Sharp Corp 音声信号変換装置及び方法
US8908873B2 (en) 2007-03-21 2014-12-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US9015051B2 (en) 2007-03-21 2015-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Reconstruction of audio channels with direction parameters indicating direction of origin

Families Citing this family (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
EP1779385B1 (en) * 2004-07-09 2010-09-22 Electronics and Telecommunications Research Institute Method and apparatus for encoding and decoding multi-channel audio signal using virtual source location information
KR100663729B1 (ko) 2004-07-09 2007-01-02 한국전자통신연구원 가상 음원 위치 정보를 이용한 멀티채널 오디오 신호부호화 및 복호화 방법 및 장치
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
KR100803212B1 (ko) * 2006-01-11 2008-02-14 삼성전자주식회사 스케일러블 채널 복호화 방법 및 장치
DE102006017280A1 (de) 2006-04-12 2007-10-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals
JP4946305B2 (ja) * 2006-09-22 2012-06-06 ソニー株式会社 音響再生システム、音響再生装置および音響再生方法
EP2122613B1 (en) 2006-12-07 2019-01-30 LG Electronics Inc. A method and an apparatus for processing an audio signal
KR100735891B1 (ko) * 2006-12-22 2007-07-04 주식회사 대원콘보이 차량용 오디오 믹서장치
US8200351B2 (en) * 2007-01-05 2012-06-12 STMicroelectronics Asia PTE., Ltd. Low power downmix energy equalization in parametric stereo encoders
US20080232601A1 (en) * 2007-03-21 2008-09-25 Ville Pulkki Method and apparatus for enhancement of audio reconstruction
US8612237B2 (en) * 2007-04-04 2013-12-17 Apple Inc. Method and apparatus for determining audio spatial quality
DE602007007581D1 (de) * 2007-04-17 2010-08-19 Harman Becker Automotive Sys Akustische Lokalisierung eines Sprechers
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
DE102007048973B4 (de) * 2007-10-12 2010-11-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
WO2009069228A1 (ja) * 2007-11-30 2009-06-04 Pioneer Corporation センターチャンネル定位装置
KR101439205B1 (ko) * 2007-12-21 2014-09-11 삼성전자주식회사 오디오 매트릭스 인코딩 및 디코딩 방법 및 장치
US9111525B1 (en) * 2008-02-14 2015-08-18 Foundation for Research and Technology—Hellas (FORTH) Institute of Computer Science (ICS) Apparatuses, methods and systems for audio processing and transmission
US8386267B2 (en) * 2008-03-19 2013-02-26 Panasonic Corporation Stereo signal encoding device, stereo signal decoding device and methods for them
WO2009128663A2 (en) * 2008-04-16 2009-10-22 Lg Electronics Inc. A method and an apparatus for processing an audio signal
US8326446B2 (en) * 2008-04-16 2012-12-04 Lg Electronics Inc. Method and an apparatus for processing an audio signal
KR101061128B1 (ko) * 2008-04-16 2011-08-31 엘지전자 주식회사 오디오 신호 처리 방법 및 이의 장치
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
WO2010008198A2 (en) * 2008-07-15 2010-01-21 Lg Electronics Inc. A method and an apparatus for processing an audio signal
CN102100009B (zh) 2008-07-15 2015-04-01 Lg电子株式会社 处理音频信号的方法和装置
US8023660B2 (en) 2008-09-11 2011-09-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues
EP2347410B1 (en) * 2008-09-11 2018-04-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues
JP5237463B2 (ja) * 2008-12-11 2013-07-17 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マルチチャンネルオーディオ信号を生成するための装置
EP2396637A1 (en) * 2009-02-13 2011-12-21 Nokia Corp. Ambience coding and decoding for audio applications
WO2010122455A1 (en) * 2009-04-21 2010-10-28 Koninklijke Philips Electronics N.V. Audio signal synthesizing
TWI413110B (zh) * 2009-10-06 2013-10-21 Dolby Int Ab 以選擇性通道解碼的有效多通道信號處理
EP2360681A1 (en) * 2010-01-15 2011-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for extracting a direct/ambience signal from a downmix signal and spatial parametric information
US20120113224A1 (en) * 2010-11-09 2012-05-10 Andy Nguyen Determining Loudspeaker Layout Using Visual Markers
TWI413105B (zh) * 2010-12-30 2013-10-21 Ind Tech Res Inst 多語言之文字轉語音合成系統與方法
AU2012279349B2 (en) * 2011-07-01 2016-02-18 Dolby Laboratories Licensing Corporation System and tools for enhanced 3D audio authoring and rendering
TW202339510A (zh) * 2011-07-01 2023-10-01 美商杜比實驗室特許公司 用於適應性音頻信號的產生、譯碼與呈現之系統與方法
JP5810903B2 (ja) * 2011-12-27 2015-11-11 富士通株式会社 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム
WO2013186593A1 (en) * 2012-06-14 2013-12-19 Nokia Corporation Audio capture apparatus
CN104782145B (zh) * 2012-09-12 2017-10-13 弗劳恩霍夫应用研究促进协会 为3d音频提供增强的导引降混性能的装置及方法
US9530430B2 (en) * 2013-02-22 2016-12-27 Mitsubishi Electric Corporation Voice emphasis device
CN110085239B (zh) 2013-05-24 2023-08-04 杜比国际公司 对音频场景进行解码的方法、解码器及计算机可读介质
US9666198B2 (en) 2013-05-24 2017-05-30 Dolby International Ab Reconstruction of audio scenes from a downmix
EP2830052A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
CN105531761B (zh) 2013-09-12 2019-04-30 杜比国际公司 音频解码系统和音频编码系统
JP6612753B2 (ja) * 2013-11-27 2019-11-27 ディーティーエス・インコーポレイテッド 高チャンネル数マルチチャンネルオーディオのためのマルチプレットベースのマトリックスミキシング
CN111182443B (zh) * 2014-01-08 2021-10-22 杜比国际公司 包括编码hoa表示的位流的解码方法和装置
CN105657633A (zh) 2014-09-04 2016-06-08 杜比实验室特许公司 生成针对音频对象的元数据
CN108293165A (zh) * 2015-10-27 2018-07-17 无比的优声音科技公司 增强音场的装置和方法
EP3424048A1 (en) * 2016-03-03 2019-01-09 Nokia Technologies OY Audio signal encoder, audio signal decoder, method for encoding and method for decoding
GB201718341D0 (en) * 2017-11-06 2017-12-20 Nokia Technologies Oy Determination of targeted spatial audio parameters and associated spatial audio playback
GB2572420A (en) 2018-03-29 2019-10-02 Nokia Technologies Oy Spatial sound rendering
GB2572650A (en) 2018-04-06 2019-10-09 Nokia Technologies Oy Spatial audio parameters and associated spatial audio playback
GB2574239A (en) 2018-05-31 2019-12-04 Nokia Technologies Oy Signalling of spatial audio parameters
GB2574667A (en) * 2018-06-15 2019-12-18 Nokia Technologies Oy Spatial audio capture, transmission and reproduction
GB201818959D0 (en) 2018-11-21 2019-01-09 Nokia Technologies Oy Ambience audio representation and associated rendering

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001510953A (ja) * 1997-07-16 2001-08-07 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 低ビットレート多重オーデイオチャンネル符号・復号方法及び装置
JP2002511683A (ja) * 1998-04-07 2002-04-16 ドルビー、レイ・ミルトン 低ビットレート空間符号化方法及び装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4251688A (en) * 1979-01-15 1981-02-17 Ana Maria Furner Audio-digital processing system for demultiplexing stereophonic/quadriphonic input audio signals into 4-to-72 output audio signals
EP0520068B1 (en) 1991-01-08 1996-05-15 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
JP2985704B2 (ja) * 1995-01-25 1999-12-06 日本ビクター株式会社 サラウンド信号処理装置
US6072878A (en) * 1997-09-24 2000-06-06 Sonic Solutions Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics
TW510143B (en) * 1999-12-03 2002-11-11 Dolby Lab Licensing Corp Method for deriving at least three audio signals from two input audio signals
EP1275272B1 (en) * 2000-04-19 2012-11-21 SNK Tech Investment L.L.C. Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics in three dimensions
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
BRPI0304542B1 (pt) * 2002-04-22 2018-05-08 Koninklijke Philips Nv “Método e codificador para codificar um sinal de áudio de multicanal, sinal de áudio multicanal codificado, e, método e decodificador para decodificar um sinal de áudio de multicanal codificado”
KR20050021484A (ko) * 2002-07-16 2005-03-07 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
KR20050116828A (ko) * 2003-03-24 2005-12-13 코닌클리케 필립스 일렉트로닉스 엔.브이. 다채널 신호를 나타내는 주 및 부 신호의 코딩
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
JP2008000001A (ja) * 2004-09-30 2008-01-10 Osaka Univ 免疫刺激オリゴヌクレオチドおよびその医薬用途
JP4983109B2 (ja) * 2006-06-23 2012-07-25 オムロン株式会社 電波検知回路及び遊技機

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001510953A (ja) * 1997-07-16 2001-08-07 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 低ビットレート多重オーデイオチャンネル符号・復号方法及び装置
JP2002511683A (ja) * 1998-04-07 2002-04-16 ドルビー、レイ・ミルトン 低ビットレート空間符号化方法及び装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009543389A (ja) * 2006-07-08 2009-12-03 ノキア コーポレイション バイノーラル音響信号の動的な復号
JP4708493B2 (ja) * 2006-07-08 2011-06-22 ノキア コーポレイション バイノーラル音響信号の動的な復号
JP2010521910A (ja) * 2007-03-21 2010-06-24 フラウンホファー・ゲゼルシャフト・ツール・フォルデルング・デル・アンゲバンテン・フォルシュング・アインゲトラーゲネル・フェライン 多チャンネル音声フォーマット間の変換のための方法および装置
US8290167B2 (en) 2007-03-21 2012-10-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US8908873B2 (en) 2007-03-21 2014-12-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US9015051B2 (en) 2007-03-21 2015-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Reconstruction of audio channels with direction parameters indicating direction of origin
JP2013514696A (ja) * 2009-12-17 2013-04-25 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 第1のパラメトリック空間オーディオ信号を第2のパラメトリック空間オーディオ信号に変換する装置および方法
US9196257B2 (en) 2009-12-17 2015-11-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal
JP2014175743A (ja) * 2013-03-07 2014-09-22 Sharp Corp 音声信号変換装置及び方法

Also Published As

Publication number Publication date
HK1101848A1 (en) 2007-10-26
EP1745676B1 (en) 2013-06-12
KR100855561B1 (ko) 2008-09-01
WO2005101905A1 (en) 2005-10-27
CN1957640B (zh) 2011-06-29
CN1957640A (zh) 2007-05-02
US8194861B2 (en) 2012-06-05
JP4688867B2 (ja) 2011-05-25
EP1745676A1 (en) 2007-01-24
JP5165707B2 (ja) 2013-03-21
US20070127733A1 (en) 2007-06-07
SE0400997D0 (sv) 2004-04-16
KR20070001227A (ko) 2007-01-03
JP2010154548A (ja) 2010-07-08

Similar Documents

Publication Publication Date Title
JP5165707B2 (ja) 低ビットレート用パラメトリック表現の生成方法
JP4589962B2 (ja) レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法
KR102294767B1 (ko) 고채널 카운트 멀티채널 오디오에 대한 멀티플렛 기반 매트릭스 믹싱
AU2014295309B2 (en) Apparatus, method, and computer program for mapping first and second input channels to at least one output channel
US9865270B2 (en) Audio encoding and decoding
JP5638037B2 (ja) オーディオソースのパラメトリックジョイント符号化
CA2610430C (en) Channel reconfiguration with side information
KR100885700B1 (ko) 신호 디코딩 방법 및 장치
US7107211B2 (en) 5-2-5 matrix encoder and decoder system
KR102392773B1 (ko) 음향 신호의 렌더링 방법, 장치 및 컴퓨터 판독 가능한 기록 매체
NO342804B1 (no) Kompatibel flerkanal-koding/dekoding

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090309

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20090309

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090811

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091109

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100330

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100628

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100727

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100729

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100809

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100816

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110203

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110215

R150 Certificate of patent or registration of utility model

Ref document number: 4688867

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140225

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250