JP2007533221A - 低ビットレート用パラメトリック表現の生成方法 - Google Patents
低ビットレート用パラメトリック表現の生成方法 Download PDFInfo
- Publication number
- JP2007533221A JP2007533221A JP2007507759A JP2007507759A JP2007533221A JP 2007533221 A JP2007533221 A JP 2007533221A JP 2007507759 A JP2007507759 A JP 2007507759A JP 2007507759 A JP2007507759 A JP 2007507759A JP 2007533221 A JP2007533221 A JP 2007533221A
- Authority
- JP
- Japan
- Prior art keywords
- channel
- channels
- signal
- parameter
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000007246 mechanism Effects 0.000 claims abstract description 54
- 238000000034 method Methods 0.000 claims description 48
- 238000004091 panning Methods 0.000 claims description 40
- 230000008929 regeneration Effects 0.000 claims description 9
- 238000011069 regeneration method Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 6
- 238000009792 diffusion process Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims 1
- 230000011664 signaling Effects 0.000 description 13
- 230000000875 corresponding effect Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 7
- 230000005236 sound signal Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000005259 measurement Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 239000002131 composite material Substances 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- ASNHGEVAWNWCRQ-UHFFFAOYSA-N 4-(hydroxymethyl)oxolane-2,3,4-triol Chemical compound OCC1(O)COC(O)C1O ASNHGEVAWNWCRQ-UHFFFAOYSA-N 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011067 equilibration Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
Abstract
【選択図】図5c
Description
図1aは、ルート・パンパラメータシステムの実行可能な信号方式を示す。
図1bは、ルート・パンパラメータシステムの実行可能な信号方式を示す。
図1cは、ルート・パンパラメータシステムの実行可能な信号方式を示す。
図1dは、ルート・パンパラメータシステムデコーダの実行可能なブロック図を示す。
図2は、ルート・パンパラメータシステムの実行可能な信号方式を示す。
図3aは、実行可能な2つのチャネルパニングを示す。
図3bは、実行可能な3つのチャネルパニングを示す。
図4aは、角度・半径パラメータシステムの実行可能な信号方式を示す。
図4bは、角度・半径パラメータシステムの実行可能な信号方式を示す。
図5aは、元のマルチチャネル信号のパラメトリック表現を生成する本発明の装置のブロック図を示す。
図5bは、マルチチャネル信号再生するための本発明の装置の概略ブロック図を示す。
図5cは、図5bの出力チャネル生成装置の好適な実施の形態を示す。
図6aは、ルート・パンの実施の形態の全体的なフローチャートを示す。
図6bは、好適な角度・半径の実施の形態のフローチャートを示す。
2つの(または3つの)スピーカの間のサウンドを連続して位置付けるパノラマパラメータと、
パノラマパラメータを、スピーカ対(または3つのスピーカ)を定義するルーティング情報に適用する。
全スピーカアレイに渡ってサウンドを連続して位置決めする角度パラメータ(360度範囲)と、
スピーカアレイに渡ってサウンドの広がりを制御する半径パラメータ(0〜1範囲)とを用いる。
1.必要に応じて、パラメータセットをさらに送信する。
例えば、ダウンミックス信号とパラメータとの間の関係が1:1となるように、システムにデフォルト設定を行うが、時折第2のパラメータセットを送信して、1:2構成に対応するダウンミックス信号を動作させる。明らかに、復号化パラメータを重畳することにより、このやり方でさらに任意の音源を得ることができる。
2.デフォルトのパニング動作を作動しないようにするために、デコーダ側規則を用いる(ルーティングおよびパニングまたは角度・半径値によるが)。個別の周波数帯域に対し別々のパラメータ前提である実施可能な1つの規則は、“基本的に他と異なるように少ない数の周波数だけを経由させてパンして、‘少ない数の帯域’に対する‘他のもの’のパニングを補間して、‘少数のもの’に対する送信したパニングを適用したり、また、例1と同じ作用を得たりすることができる場合”である。この動作のオン/オフを切り替えるために、フラグが用いられる。
換言すれば、この例は、個別の周波数帯域に対して別々のパラメータを用いている。以下に従って、周波数方向で補間を行っている。他(メイングループ)と(外側層が)基本的に異なるように少ない数の周波数帯域を経由させてパンする場合は、上記の説明に従って、さらにパラメータセットとして、外側層のパラメータを補間する(送信していないが)。前記少数の周波数帯域に対し、メイングループのパラメータを周波数方向が補間される。最後に、少ない数の帯域に利用できる2つのパラメータセットが重畳される。これにより、少ない数の外側層帯域に対する主方向でのスペクトルホールを回避しながら、パラメータをさらに送信することなく、メイングループとは基本的に異なる方向に、音源をさらに配置できる。この動作のオン/オフを切り替えるために、フラグが用いられる。
3.特別プリセットマッピングをいくつか送信する。例えば、
a)全スピーカに対するルート信号
b)任意の1つのスピーカに対するルート信号
c)スピーカの選択したサブセットに対するルート信号(>2)。
<angle_direct,radius_direct>
<angle_ambience,radius_ambience>
<M>
さらに、本発明の例では、2つのルート・パンによるパラメータ化および角度・半径によるパラメータ化と、2つのモノラル信号とを用いる。この例では、角度・半径パラメータが、モノラル信号M1からダイレクトサウンドパニングを記述する。さらに、M2から生成した臨場感信号をどのように適用するか記述するために、ルート・パンが用いられる。従って、チャネルについて臨場感信号が適用され、また、例として、図2の臨場感表現を用いることができるかについて、送信したルート値が記述する。対応するビットストリーム例は次のようになる。
<angle_direct,radius_direct>
<route,ambience_level>
<M1_direct>
<M2_ambience>
本発明によるマルチチャネルスピーカ機構内のサウンドの空間位置決めに対するパラメータ化方法は、数多くのやり方で適用できるブロックを構成している。
i)周波数範囲
(全周波数帯域に対する)グローバルルーティングまたは、
帯域毎のルーティング
ii)パラメータセットの数
静的(時間に対し固定)または、
動的(必要に応じてさらにセットを送信する)
iii)信号適用、すなわち符号化
ダイレクト(ドライ)サウンドまたは、
アンビエント(ウェット)サウンド
iv)ダウンミックス信号の数とパラメータセットとの関係、例えば、
1:1(モノラルダウンミックスおよび1つのパラメータセット)、
2:1(ステレオダウンミックスおよび1つのパラメータセット)または、
1:2(モノラルダウンミックスおよび2つのパラメータセット)
ダウンミックス信号Mが、元の全入力チャネルの合計となると考える。これを適用するように重み付けして、適用するように位相は全入力の合計を調整できる。
v)ダウンミックス信号とパラメータセットとを重畳する、例えば、
1:1+1:1(2つの異なるモノラルダウンミックスおよび対応する1つのパラメータセット)
後者は、適応ダウンミックスおよび符号化に有益である。例えば、アレイ(ビーム形成)アルゴリズム、信号分離(第1の最大信号、第2の最大信号等の符号化)である。
Claims (32)
- 少なくとも3つの元のチャネル(L、R、Rs)を有する元のマルチチャネル信号のパラメトリック表現を生成する装置であって、前記パラメータ表現は、ベースチャネルの他に方向パラメータ情報を含み、前記少なくとも3つの元のチャネルから導出した方向パラメータ情報を用いて、少なくとも2つのチャネルを有する出力信号を生成し、前記元のチャネルは再生機構内の異なる空間位置にある音源(103、104、105)に対応付けられていて、前記再生機構は基準位置(10)を有し、
前記再生機構内の前記基準位置(16)から、前記少なくとも3つの元のチャネルの合成サウンドエネルギが集中している(14)領域(12)への方向を示す前記方向パラメータ情報を求める方向情報計算器(54)と、
前記パラメータ表現が前記方向パラメータ情報を含むように、前記パラメータ表現を生成するデータ出力生成装置(52)とを備える、装置。 - 前記方向情報計算器(50)が、
前記少なくとも3つの元のチャネルから前記最も高いエネルギを有する元のチャネル対を検索する(61)、または少なくとも4つの元のチャネルから前記最も高いエネルギを有する3つの元のチャネルを検索する、チャネル対検索器と、
前記元のチャネル対の間のバランスを示すバランスパラメータを算出する(62)バランスパラメータ計算器とを備え、
前記データ出力生成装置(52)が、前記元のチャネル対の表示および前記バランスパラメータを前記方向パラメータ情報として、前記パラメトリック表現に含めるようにする、請求項1に記載の装置。 - 前記チャネル対検索器が、前記元のチャネル対を複数の符号語の符号語として符号化し、各符号語が、前記元のチャネルのうちの考えられるチャネル対と対応付けられている、請求項2に記載の装置。
- 前記方向情報計算器が、チャネルサブグループが再生するエネルギ配分に関する情報だけを含むように、前記方向パラメータ情報を算出し、前記チャネルサブグループが、少なくとも2つのチャネルを含み、最大で、元のチャネル数よりも少ない数の数多くのチャネルを含む、請求項1ないし請求項3のいずれかに記載の装置。
- 前記方向情報計算器が、基準線(9)と、前記基準位置から前記合成サウンドエネルギが集中する領域を指すベクトルとの間の角度を算出し(72)、
前記データ出力生成装置が、前記角度に関する情報を前記方向パラメータ情報として前記パラメトリック表現に含めるようにする、請求項1または請求項4に記載の装置。 - 前記方向情報計算器(50)が、前記再生機構内のサウンドエネルギの中心点を算出して、
前記方向情報計算器(50)がさらに、前記基準線と前記基準位置から前記サウンド中心点への前記ベクトルとの間の角度を算出する、請求項5に記載の装置。 - 前記ベクトルの長さを算出する拡散計算器をさらに備え、前記ベクトルの前記長さが、前記元のマルチチャネル信号のサウンド拡散状況を示し、
前記データ出力生成装置が、前記ベクトルの前記長さの情報を拡散パラメータとして前記パラメトリック表現に含めるようにする、請求項5または請求項6に記載の装置。 - 前記拡散計算器が、0から1の間で前記ベクトルの前記長さをスケーリングし、
0の前記長さが前記基準点に対応し、1の前記長さが線に対応し、前記音源の前記異なる空間位置を特定することができる、請求項7に記載の装置。 - 前記方向情報計算器(50)が、別の位置の別の角度を算出し、前記別の位置が、前記元のチャネル内の臨場感サウンドの前記合成サウンドエネルギが集中する領域にある、請求項5ないし請求項8のいずれかに記載の装置。
- 前記マルチチャネル信号の臨場感チャネルを再生する場合は、前記方向情報計算器(50)が、前記元の信号から前記臨場感信号を抽出し、前記抽出した臨場感信号を処理して前記別の角度とともに用いるベースチャネルをさらに得る、請求項9に記載の装置。
- 前記方向情報計算器(50)が、前記合成エネルギが集中する前記領域に、前記再生機構内の前記全サウンドエネルギの少なくとも50%が含まれるように、前記方向情報を求める、請求項1ないし請求項10のいずれかに記載の装置。
- 前記方向情報計算器(50)が、前記領域に、前記領域内に位置する最大ローカルエネルギ値の75%を超えるローカルエネルギ値を有する前記再生機構内の位置が含まれるように、前記方向情報を求める、請求項1ないし請求項11のいずれかに記載の装置。
- 少なくとも1つのベースチャネルを得るために、前記元のチャネルをダウンミキシングするためのダウンミキサをさらに備え、
前記データ出力生成装置が、前記少なくとも1つのダウンミキシングチャネルを前記パラメータ表現に含めるようにする、請求項1ないし請求項12のいずれかに記載の装置。 - 前記元のマルチチャネル信号を用いて臨場感信号レベルを算出する臨場感信号レベル計算器をさらに備え、
前記データ出力生成装置が、前記臨場感信号レベルを前記パラメトリック表現に含めるようにする、請求項1ないし請求項13のいずれかに記載の装置。 - 前記データ出力生成装置が、3方向パニングインジケータを前記パラメトリック表現に入力する、請求項1ないし請求項14のいずれかに記載の装置。
- 前記元のマルチチャネル信号に基づいて、少なくとも1つのパラメータがさらに必要かどうか判定するパラメータ算出制御装置をさらに備え、
前記パラメータ算出制御装置が、前記データ出力生成装置を制御して、前記少なくとも1つのパラメータをさらに前記パラメトリック表現に含めるようにする、請求項1ないし請求項15のいずれかに記載の装置。 - 前記方向情報計算器(50)が、前記方向パラメータ情報に加えて用いられる方向パラメータ情報をさらに算出して、
前記データ出力生成装置が、前記方向パラメータ情報の代わりに前記別の方向パラメータ情報と、制御信号とを前記パラメトリック表現に含めるようにし、
前記制御信号が、前記パラメトリック表現に含まれていない前記方向パラメータ情報に加えて、前記別の方向パラメータ情報を用いられることをマルチチャネル再生装置に知らせる信号で、補間により、前記パラメトリック表現における他の方向パラメータ情報を用いて導出した信号である、請求項1ないし請求項16のいずれかに記載の装置。 - 前記方向情報計算器(50)が、前記元のマルチチャネル信号の2以上の周波数帯域の方向パラメータ情報、または前記元のマルチチャネル信号の2以上の時間区分の方向パラメータ情報を求める、請求項1ないし請求項17のいずれかに記載の装置。
- 少なくとも1つのベースチャネルと、基準再生機構における位置から、前記再生機構における少なくとも3つの元のチャネルの合成サウンドエネルギが集中し、前記少なくとも1つのベースチャネルを導出した領域への方向を示す方向パラメータ情報を含むパラメトリック表現とを用いるマルチチャネル信号再生装置であって、
前記基準位置(10)に対して、前記再生機構内に位置する、ベースチャネルの数よりも多い、多数の出力チャネルを生成する出力チャネル生成装置(54)を備え、
前記出力チャネル生成装置(54)が、前記基準位置(10)から前記再生出力チャネルの前記合成エネルギが集中する領域への方向が、前記方向パラメータ情報によって示される前記方向に依存するように、前記方向パラメータ情報に応答して、前記出力チャネルを生成する、装置。 - 前記出力チャネル生成装置が、前記方向パラメータ情報に基づいて、少なくとも2つの出力チャネルを算出し、前記ベースチャネルから導出した信号を用い、前記信号が、臨場感信号を生成するための残りの出力チャネルに対し、遅延、利得、相関または等化の点で、前記ベースチャネルと異なっている、請求項19に記載の装置。
- 前記方向パラメータ情報が選択したチャネル対に関する情報を含み、前記バランスパラメータが、前記選択した出力チャネル対の間のバランスを示し、
前記出力チャネル生成装置(54)が、前記チャネル対の間のエネルギ配分を、前記バランスパラメータにより求めるように、前記選択した出力チャネル対を算出し、前記選択した出力チャネル対に含まれていないチャネルの臨場感チャネル信号を算出する、請求項19または請求項20に記載の装置。 - 前記出力チャネル生成装置(54)が、そのエネルギが定義済みの設定に基づくように、または前記残りのチャネルの合成エネルギが前記パラメトリック表現にさらに含まれている臨場感パラメータに依存するように、前記残りのチャネルを算出する、請求項20または請求項21に記載の装置。
- 前記方向パラメータ情報が、前記再生機構における前記基準位置(10)に関する角度を含み、前記角度が、前記再生機構における基準位置から発するベクトルを定義し、
前記出力チャネル生成装置(54)が、前記角度を、前記再生機構における全チャネルのサブグループにマッピングして、前記角度に基づいて、前記サブグループにおける前記チャネル間のエネルギ配分を求める、請求項19または請求項20に記載の装置。 - 前記方向パラメータ情報がさらに、ベクトルの長さに関する情報を含み、
前記出力チャネル生成装置(54)が、前記サブグループにおける数多くのチャネルが前記ベクトルの前記長さに依存するように、前記角度をマッピングする、請求項23に記載の装置。 - 前記出力チャネル生成装置が、前記装置と接続して再生を行う前記再生機構に依存するマッピング規則を用いて前記角度をマッピングして、前記マッピング規則は、前記ベクトルが位置するセクタを構成する、2つの隣り合うチャネルのエネルギが、前記セクタの外側のチャネルのエネルギよりも高くなるようになっている、請求項23または請求項24に記載の装置。
- 前記出力チャネル生成装置(54)が、前記少なくとも1つのベースチャネルに基づいて非相関信号を生成する非相関器(59)を備え、
前記出力チャネル生成装置がさらに、前記パラメトリック表現に含まれるコヒーレンスパラメータに基づいて、前記非相関信号をダイレクトサウンド出力チャネルに付加し、または、
前記非相関信号を、前記方向パラメータ情報により制御されないエネルギの配分を有する臨場感出力チャネルに含めるようにする、請求項19ないし請求項25のいずれかに記載の装置。 - 前記パラメータ方向情報が、前記再生機構における互いに隣り合わない出力チャネルを特定し、
前記出力チャネル生成装置が、前記パラメータ方向情報に基づいて前記2つの特定したチャネル間のエネルギ配分と、前記特定したチャネル間の少なくとも1つのチャネルとを算出するために、少なくとも3つのチャネルパニングを行う、請求項19ないし請求項26のいずれかに記載の装置。 - 少なくとも3つの元のチャネル(L、R、Rs)を有する元のマルチチャネル信号のパラメトリック表現の生成方法であって、前記パラメータ表現は、ベースチャネルに加えて方向パラメータ情報を含み、前記少なくとも3つの元のチャネルから導出した方向パラメータ情報を用いて、少なくとも2つのチャネルを有する出力信号を生成し、前記元のチャネルは再生機構における異なる空間位置にある音源(103、104、105)に対応付けられていて、前記再生機構は基準位置(10)を有し、
前記再生機構における前記基準位置(16)から、前記少なくとも3つの元のチャネルの合成サウンドエネルギが集中している(14)領域(12)への方向を示す前記方向パラメータ情報を求め(54)、
前記パラメータ表現が前記方向パラメータ情報を含むように、前記パラメータ表現を生成する(52)、方法。 - 少なくとも1つのベースチャネルと、基準再生機構における位置から、前記再生機構おける少なくとも3つの元のチャネルの合成サウンドエネルギが集中し、前記少なくとも1つのベースチャネルを導出した領域への方向を示す方向パラメータ情報を含むパラメトリック表現とを用いるマルチチャネル信号再生方法であって、
前記基準位置(10)に対して、前記再生機構において位置する、ベースチャネルの数よりも多い、多数の出力チャネルを生成し(54)、
前記生成ステップ(54)が、前記基準位置(10)から前記再生出力チャネルの前記合成エネルギが集中する領域への方向が、前記方向パラメータ情報により示される前記方向に依存するように、前記方向パラメータ情報に応答して、前記出力チャネルが生成される、方法。 - コンピュータ上で実行する場合は、請求項28または請求項29に記載の方法を実施する機械読み取り可能命令を有するコンピュータプログラム。
- 基準再生機構における位置から前記再生機構における少なくとも3つの元のチャネルの合成サウンドエネルギが集中し、少なくとも1つのベースチャネルを導出した領域への方向を示す、方向パラメータ情報を含む、パラメータ表現。
- 請求項19に記載の装置に入力があった場合に、マルチチャネル再生を制御する、請求項31に記載のパラメータ表現。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SE0400997-3 | 2004-04-16 | ||
SE0400997A SE0400997D0 (sv) | 2004-04-16 | 2004-04-16 | Efficient coding of multi-channel audio |
PCT/EP2005/003950 WO2005101905A1 (en) | 2004-04-16 | 2005-04-14 | Scheme for generating a parametric representation for low-bit rate applications |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010029362A Division JP5165707B2 (ja) | 2004-04-16 | 2010-02-12 | 低ビットレート用パラメトリック表現の生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007533221A true JP2007533221A (ja) | 2007-11-15 |
JP4688867B2 JP4688867B2 (ja) | 2011-05-25 |
Family
ID=32294333
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007507759A Active JP4688867B2 (ja) | 2004-04-16 | 2005-04-14 | 低ビットレート用パラメトリック表現の生成方法 |
JP2010029362A Active JP5165707B2 (ja) | 2004-04-16 | 2010-02-12 | 低ビットレート用パラメトリック表現の生成方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010029362A Active JP5165707B2 (ja) | 2004-04-16 | 2010-02-12 | 低ビットレート用パラメトリック表現の生成方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US8194861B2 (ja) |
EP (1) | EP1745676B1 (ja) |
JP (2) | JP4688867B2 (ja) |
KR (1) | KR100855561B1 (ja) |
CN (1) | CN1957640B (ja) |
HK (1) | HK1101848A1 (ja) |
SE (1) | SE0400997D0 (ja) |
WO (1) | WO2005101905A1 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009543389A (ja) * | 2006-07-08 | 2009-12-03 | ノキア コーポレイション | バイノーラル音響信号の動的な復号 |
JP2010521910A (ja) * | 2007-03-21 | 2010-06-24 | フラウンホファー・ゲゼルシャフト・ツール・フォルデルング・デル・アンゲバンテン・フォルシュング・アインゲトラーゲネル・フェライン | 多チャンネル音声フォーマット間の変換のための方法および装置 |
JP2013514696A (ja) * | 2009-12-17 | 2013-04-25 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 第1のパラメトリック空間オーディオ信号を第2のパラメトリック空間オーディオ信号に変換する装置および方法 |
JP2014175743A (ja) * | 2013-03-07 | 2014-09-22 | Sharp Corp | 音声信号変換装置及び方法 |
US8908873B2 (en) | 2007-03-21 | 2014-12-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
US9015051B2 (en) | 2007-03-21 | 2015-04-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Reconstruction of audio channels with direction parameters indicating direction of origin |
Families Citing this family (61)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7460990B2 (en) | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
EP1779385B1 (en) * | 2004-07-09 | 2010-09-22 | Electronics and Telecommunications Research Institute | Method and apparatus for encoding and decoding multi-channel audio signal using virtual source location information |
KR100663729B1 (ko) | 2004-07-09 | 2007-01-02 | 한국전자통신연구원 | 가상 음원 위치 정보를 이용한 멀티채널 오디오 신호부호화 및 복호화 방법 및 장치 |
EP1691348A1 (en) * | 2005-02-14 | 2006-08-16 | Ecole Polytechnique Federale De Lausanne | Parametric joint-coding of audio sources |
US7562021B2 (en) * | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
US7630882B2 (en) * | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
KR100803212B1 (ko) * | 2006-01-11 | 2008-02-14 | 삼성전자주식회사 | 스케일러블 채널 복호화 방법 및 장치 |
DE102006017280A1 (de) | 2006-04-12 | 2007-10-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals |
JP4946305B2 (ja) * | 2006-09-22 | 2012-06-06 | ソニー株式会社 | 音響再生システム、音響再生装置および音響再生方法 |
EP2122613B1 (en) | 2006-12-07 | 2019-01-30 | LG Electronics Inc. | A method and an apparatus for processing an audio signal |
KR100735891B1 (ko) * | 2006-12-22 | 2007-07-04 | 주식회사 대원콘보이 | 차량용 오디오 믹서장치 |
US8200351B2 (en) * | 2007-01-05 | 2012-06-12 | STMicroelectronics Asia PTE., Ltd. | Low power downmix energy equalization in parametric stereo encoders |
US20080232601A1 (en) * | 2007-03-21 | 2008-09-25 | Ville Pulkki | Method and apparatus for enhancement of audio reconstruction |
US8612237B2 (en) * | 2007-04-04 | 2013-12-17 | Apple Inc. | Method and apparatus for determining audio spatial quality |
DE602007007581D1 (de) * | 2007-04-17 | 2010-08-19 | Harman Becker Automotive Sys | Akustische Lokalisierung eines Sprechers |
US7761290B2 (en) | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US8046214B2 (en) | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
DE102007048973B4 (de) * | 2007-10-12 | 2010-11-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung |
US8249883B2 (en) * | 2007-10-26 | 2012-08-21 | Microsoft Corporation | Channel extension coding for multi-channel source |
WO2009069228A1 (ja) * | 2007-11-30 | 2009-06-04 | Pioneer Corporation | センターチャンネル定位装置 |
KR101439205B1 (ko) * | 2007-12-21 | 2014-09-11 | 삼성전자주식회사 | 오디오 매트릭스 인코딩 및 디코딩 방법 및 장치 |
US9111525B1 (en) * | 2008-02-14 | 2015-08-18 | Foundation for Research and Technology—Hellas (FORTH) Institute of Computer Science (ICS) | Apparatuses, methods and systems for audio processing and transmission |
US8386267B2 (en) * | 2008-03-19 | 2013-02-26 | Panasonic Corporation | Stereo signal encoding device, stereo signal decoding device and methods for them |
WO2009128663A2 (en) * | 2008-04-16 | 2009-10-22 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
US8326446B2 (en) * | 2008-04-16 | 2012-12-04 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
KR101061128B1 (ko) * | 2008-04-16 | 2011-08-31 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 이의 장치 |
KR101428487B1 (ko) * | 2008-07-11 | 2014-08-08 | 삼성전자주식회사 | 멀티 채널 부호화 및 복호화 방법 및 장치 |
WO2010008198A2 (en) * | 2008-07-15 | 2010-01-21 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
CN102100009B (zh) | 2008-07-15 | 2015-04-01 | Lg电子株式会社 | 处理音频信号的方法和装置 |
US8023660B2 (en) | 2008-09-11 | 2011-09-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues |
EP2347410B1 (en) * | 2008-09-11 | 2018-04-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues |
JP5237463B2 (ja) * | 2008-12-11 | 2013-07-17 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャンネルオーディオ信号を生成するための装置 |
EP2396637A1 (en) * | 2009-02-13 | 2011-12-21 | Nokia Corp. | Ambience coding and decoding for audio applications |
WO2010122455A1 (en) * | 2009-04-21 | 2010-10-28 | Koninklijke Philips Electronics N.V. | Audio signal synthesizing |
TWI413110B (zh) * | 2009-10-06 | 2013-10-21 | Dolby Int Ab | 以選擇性通道解碼的有效多通道信號處理 |
EP2360681A1 (en) * | 2010-01-15 | 2011-08-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for extracting a direct/ambience signal from a downmix signal and spatial parametric information |
US20120113224A1 (en) * | 2010-11-09 | 2012-05-10 | Andy Nguyen | Determining Loudspeaker Layout Using Visual Markers |
TWI413105B (zh) * | 2010-12-30 | 2013-10-21 | Ind Tech Res Inst | 多語言之文字轉語音合成系統與方法 |
AU2012279349B2 (en) * | 2011-07-01 | 2016-02-18 | Dolby Laboratories Licensing Corporation | System and tools for enhanced 3D audio authoring and rendering |
TW202339510A (zh) * | 2011-07-01 | 2023-10-01 | 美商杜比實驗室特許公司 | 用於適應性音頻信號的產生、譯碼與呈現之系統與方法 |
JP5810903B2 (ja) * | 2011-12-27 | 2015-11-11 | 富士通株式会社 | 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム |
WO2013186593A1 (en) * | 2012-06-14 | 2013-12-19 | Nokia Corporation | Audio capture apparatus |
CN104782145B (zh) * | 2012-09-12 | 2017-10-13 | 弗劳恩霍夫应用研究促进协会 | 为3d音频提供增强的导引降混性能的装置及方法 |
US9530430B2 (en) * | 2013-02-22 | 2016-12-27 | Mitsubishi Electric Corporation | Voice emphasis device |
CN110085239B (zh) | 2013-05-24 | 2023-08-04 | 杜比国际公司 | 对音频场景进行解码的方法、解码器及计算机可读介质 |
US9666198B2 (en) | 2013-05-24 | 2017-05-30 | Dolby International Ab | Reconstruction of audio scenes from a downmix |
EP2830052A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension |
CN105531761B (zh) | 2013-09-12 | 2019-04-30 | 杜比国际公司 | 音频解码系统和音频编码系统 |
JP6612753B2 (ja) * | 2013-11-27 | 2019-11-27 | ディーティーエス・インコーポレイテッド | 高チャンネル数マルチチャンネルオーディオのためのマルチプレットベースのマトリックスミキシング |
CN111182443B (zh) * | 2014-01-08 | 2021-10-22 | 杜比国际公司 | 包括编码hoa表示的位流的解码方法和装置 |
CN105657633A (zh) | 2014-09-04 | 2016-06-08 | 杜比实验室特许公司 | 生成针对音频对象的元数据 |
CN108293165A (zh) * | 2015-10-27 | 2018-07-17 | 无比的优声音科技公司 | 增强音场的装置和方法 |
EP3424048A1 (en) * | 2016-03-03 | 2019-01-09 | Nokia Technologies OY | Audio signal encoder, audio signal decoder, method for encoding and method for decoding |
GB201718341D0 (en) * | 2017-11-06 | 2017-12-20 | Nokia Technologies Oy | Determination of targeted spatial audio parameters and associated spatial audio playback |
GB2572420A (en) | 2018-03-29 | 2019-10-02 | Nokia Technologies Oy | Spatial sound rendering |
GB2572650A (en) | 2018-04-06 | 2019-10-09 | Nokia Technologies Oy | Spatial audio parameters and associated spatial audio playback |
GB2574239A (en) | 2018-05-31 | 2019-12-04 | Nokia Technologies Oy | Signalling of spatial audio parameters |
GB2574667A (en) * | 2018-06-15 | 2019-12-18 | Nokia Technologies Oy | Spatial audio capture, transmission and reproduction |
GB201818959D0 (en) | 2018-11-21 | 2019-01-09 | Nokia Technologies Oy | Ambience audio representation and associated rendering |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001510953A (ja) * | 1997-07-16 | 2001-08-07 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | 低ビットレート多重オーデイオチャンネル符号・復号方法及び装置 |
JP2002511683A (ja) * | 1998-04-07 | 2002-04-16 | ドルビー、レイ・ミルトン | 低ビットレート空間符号化方法及び装置 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4251688A (en) * | 1979-01-15 | 1981-02-17 | Ana Maria Furner | Audio-digital processing system for demultiplexing stereophonic/quadriphonic input audio signals into 4-to-72 output audio signals |
EP0520068B1 (en) | 1991-01-08 | 1996-05-15 | Dolby Laboratories Licensing Corporation | Encoder/decoder for multidimensional sound fields |
JP2985704B2 (ja) * | 1995-01-25 | 1999-12-06 | 日本ビクター株式会社 | サラウンド信号処理装置 |
US6072878A (en) * | 1997-09-24 | 2000-06-06 | Sonic Solutions | Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics |
TW510143B (en) * | 1999-12-03 | 2002-11-11 | Dolby Lab Licensing Corp | Method for deriving at least three audio signals from two input audio signals |
EP1275272B1 (en) * | 2000-04-19 | 2012-11-21 | SNK Tech Investment L.L.C. | Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics in three dimensions |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
BRPI0304542B1 (pt) * | 2002-04-22 | 2018-05-08 | Koninklijke Philips Nv | Método e codificador para codificar um sinal de áudio de multicanal, sinal de áudio multicanal codificado, e, método e decodificador para decodificar um sinal de áudio de multicanal codificado |
KR20050021484A (ko) * | 2002-07-16 | 2005-03-07 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 코딩 |
KR20050116828A (ko) * | 2003-03-24 | 2005-12-13 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 다채널 신호를 나타내는 주 및 부 신호의 코딩 |
US7394903B2 (en) * | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
JP2008000001A (ja) * | 2004-09-30 | 2008-01-10 | Osaka Univ | 免疫刺激オリゴヌクレオチドおよびその医薬用途 |
JP4983109B2 (ja) * | 2006-06-23 | 2012-07-25 | オムロン株式会社 | 電波検知回路及び遊技機 |
-
2004
- 2004-04-16 SE SE0400997A patent/SE0400997D0/xx unknown
-
2005
- 2005-04-14 JP JP2007507759A patent/JP4688867B2/ja active Active
- 2005-04-14 CN CN2005800170783A patent/CN1957640B/zh active Active
- 2005-04-14 WO PCT/EP2005/003950 patent/WO2005101905A1/en active Application Filing
- 2005-04-14 EP EP05730925.4A patent/EP1745676B1/en active Active
- 2005-04-14 KR KR1020067021440A patent/KR100855561B1/ko active IP Right Grant
-
2006
- 2006-10-16 US US11/549,939 patent/US8194861B2/en active Active
-
2007
- 2007-07-20 HK HK07107843.7A patent/HK1101848A1/xx unknown
-
2010
- 2010-02-12 JP JP2010029362A patent/JP5165707B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001510953A (ja) * | 1997-07-16 | 2001-08-07 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | 低ビットレート多重オーデイオチャンネル符号・復号方法及び装置 |
JP2002511683A (ja) * | 1998-04-07 | 2002-04-16 | ドルビー、レイ・ミルトン | 低ビットレート空間符号化方法及び装置 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009543389A (ja) * | 2006-07-08 | 2009-12-03 | ノキア コーポレイション | バイノーラル音響信号の動的な復号 |
JP4708493B2 (ja) * | 2006-07-08 | 2011-06-22 | ノキア コーポレイション | バイノーラル音響信号の動的な復号 |
JP2010521910A (ja) * | 2007-03-21 | 2010-06-24 | フラウンホファー・ゲゼルシャフト・ツール・フォルデルング・デル・アンゲバンテン・フォルシュング・アインゲトラーゲネル・フェライン | 多チャンネル音声フォーマット間の変換のための方法および装置 |
US8290167B2 (en) | 2007-03-21 | 2012-10-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
US8908873B2 (en) | 2007-03-21 | 2014-12-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
US9015051B2 (en) | 2007-03-21 | 2015-04-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Reconstruction of audio channels with direction parameters indicating direction of origin |
JP2013514696A (ja) * | 2009-12-17 | 2013-04-25 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 第1のパラメトリック空間オーディオ信号を第2のパラメトリック空間オーディオ信号に変換する装置および方法 |
US9196257B2 (en) | 2009-12-17 | 2015-11-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal |
JP2014175743A (ja) * | 2013-03-07 | 2014-09-22 | Sharp Corp | 音声信号変換装置及び方法 |
Also Published As
Publication number | Publication date |
---|---|
HK1101848A1 (en) | 2007-10-26 |
EP1745676B1 (en) | 2013-06-12 |
KR100855561B1 (ko) | 2008-09-01 |
WO2005101905A1 (en) | 2005-10-27 |
CN1957640B (zh) | 2011-06-29 |
CN1957640A (zh) | 2007-05-02 |
US8194861B2 (en) | 2012-06-05 |
JP4688867B2 (ja) | 2011-05-25 |
EP1745676A1 (en) | 2007-01-24 |
JP5165707B2 (ja) | 2013-03-21 |
US20070127733A1 (en) | 2007-06-07 |
SE0400997D0 (sv) | 2004-04-16 |
KR20070001227A (ko) | 2007-01-03 |
JP2010154548A (ja) | 2010-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5165707B2 (ja) | 低ビットレート用パラメトリック表現の生成方法 | |
JP4589962B2 (ja) | レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法 | |
KR102294767B1 (ko) | 고채널 카운트 멀티채널 오디오에 대한 멀티플렛 기반 매트릭스 믹싱 | |
AU2014295309B2 (en) | Apparatus, method, and computer program for mapping first and second input channels to at least one output channel | |
US9865270B2 (en) | Audio encoding and decoding | |
JP5638037B2 (ja) | オーディオソースのパラメトリックジョイント符号化 | |
CA2610430C (en) | Channel reconfiguration with side information | |
KR100885700B1 (ko) | 신호 디코딩 방법 및 장치 | |
US7107211B2 (en) | 5-2-5 matrix encoder and decoder system | |
KR102392773B1 (ko) | 음향 신호의 렌더링 방법, 장치 및 컴퓨터 판독 가능한 기록 매체 | |
NO342804B1 (no) | Kompatibel flerkanal-koding/dekoding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20090309 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20090309 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090811 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20091109 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20091116 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100330 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20100628 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20100727 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20100729 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100809 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20100816 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110203 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110215 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4688867 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140225 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |