JP7378575B2 - 空間変換領域における音場表現を処理するための装置、方法、またはコンピュータプログラム - Google Patents
空間変換領域における音場表現を処理するための装置、方法、またはコンピュータプログラム Download PDFInfo
- Publication number
- JP7378575B2 JP7378575B2 JP2022506492A JP2022506492A JP7378575B2 JP 7378575 B2 JP7378575 B2 JP 7378575B2 JP 2022506492 A JP2022506492 A JP 2022506492A JP 2022506492 A JP2022506492 A JP 2022506492A JP 7378575 B2 JP7378575 B2 JP 7378575B2
- Authority
- JP
- Japan
- Prior art keywords
- sound field
- virtual
- spatial
- transformation
- loudspeaker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000009466 transformation Effects 0.000 title claims description 196
- 238000000034 method Methods 0.000 title claims description 59
- 238000012545 processing Methods 0.000 title claims description 55
- 238000004590 computer program Methods 0.000 title claims description 10
- 239000011159 matrix material Substances 0.000 claims description 53
- 230000005236 sound signal Effects 0.000 claims description 39
- 239000013598 vector Substances 0.000 claims description 27
- 238000006243 chemical reaction Methods 0.000 claims description 20
- 230000008569 process Effects 0.000 claims description 19
- 238000000354 decomposition reaction Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 8
- 235000009508 confectionery Nutrition 0.000 claims description 7
- 238000004091 panning Methods 0.000 claims description 7
- 230000007704 transition Effects 0.000 claims description 6
- 238000012546 transfer Methods 0.000 claims description 5
- 230000002238 attenuated effect Effects 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims 2
- 238000001228 spectrum Methods 0.000 claims 1
- 238000001914 filtration Methods 0.000 description 23
- 238000012986 modification Methods 0.000 description 10
- 230000004048 modification Effects 0.000 description 10
- 238000009877 rendering Methods 0.000 description 10
- 238000003491 array Methods 0.000 description 8
- 238000013459 approach Methods 0.000 description 7
- 238000012937 correction Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 230000003068 static effect Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 210000005069 ears Anatomy 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- WFKWXMTUELFFGS-UHFFFAOYSA-N tungsten Chemical compound [W] WFKWXMTUELFFGS-UHFFFAOYSA-N 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000003278 mimic effect Effects 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 241000712899 Lymphocytic choriomeningitis mammarenavirus Species 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000001093 holography Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/04—Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
- H04S7/304—For headphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/13—Application of wave-field synthesis in stereophonic audio systems
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
Description
この実施形態において、第1の空間変換(1020)への入力は、時間-周波数領域におけるL次アンビソニックス信号である。アンビソニックス信号は、各チャネル(アンビソニックス成分または係数と呼ばれる)がいわゆる空間基底関数の係数に相当するマルチチャネル信号を表す。球面調和関数[FourierAcoust]または円筒調和関数[FourierAcoust]など、様々なタイプの空間基底関数が存在する。円筒調和関数は、(たとえば、2D音再生の場合)2D空間における音場を記述するときに使用され得、(たとえば、2Dおよび3D音再生の場合)2Dおよび3D空間における音場を記述するために使用され得る。一般性を失うことなく、球面調和関数を用いる後者の場合について、以下で検討する。この場合、(L+1)2個の個別の信号(成分)からなるアンビソニックス信号は、ベクトル
a(k,n)=[A0,0(k,n),A1,-1(k,n),...,Al,m(k,n),...,AL,L(k,n)]T
によって示され、ここで、kおよびnは、それぞれ周波数インデックスおよび時間インデックスであり、0≦l≦Lは、レベル(次数)であり、-l≦m≦lは、アンビソニックス係数(成分)Al,m(k,n)のモードである。一次アンビソニックス信号(L=1)は、たとえば、SoundFieldマイクロフォンを使用して測定され得る。高次アンビソニックス信号は、たとえば、EigenMikeを使用して測定され得る。記録場所は、それぞれ、座標系の中心と基準位置とを表す。
この実施形態において、第1の空間変換(1020)への入力は、M個のラウドスピーカ信号である。ラウドスピーカ対応設定は、任意であり得、たとえば、一般的な5.1、7.1、11.1、または22.2のラウドスピーカ設定であり得る。ラウドスピーカ設定のスイートスポットは、基準位置を表す。m番目のラウドスピーカ位置(m≦M)は、方位角
a(k,n)=[A1(k,n),A2(k,n),...,AM(k,n)]T
は、時間-周波数領域におけるM個の入力ラウドスピーカ信号を含み、kおよびnは、それぞれ周波数インデックスおよび時間インデックスである。さらに、
この実施形態において、第1の空間変換(1020)への入力は、M個のマイクロフォンを有するマイクロフォンアレイの信号である。マイクロフォンは、無指向性、カージオイド特性、またはダイポール特性などの様々な指向性を有することができる。マイクロフォンは、同時マイクロフォンアレイ(指向性マイクロフォンを使用する場合)、線形マイクロフォンアレイ、円形マイクロフォンアレイ、不均一平面アレイ、または球形マイクロフォンアレイなどの様々な構成において配置され得る。多くのアプリケーションにおいて、平面または球形マイクロフォンアレイが好まれる。実際の典型的なマイクロフォンアレイは、たとえば、3cmのアレイ半径のM=8個の無指向性マイクロフォンを有する円形マイクロフォンアレイによって与えられる。
a(k,n)=[A1(k,n),A2(k,n),...,AM(k,n)]T
を与えられ、ここで、kおよびnは、それぞれ周波数インデックスおよび時間インデックスであり、A1...M(k,n)は、d1...Mに位置するM個のマイクロフォンの信号である。
この実施形態において、第1の空間変換(1020)への入力は、M個のオーディオオブジェクト信号と、それらに付随する位置メタデータである。実施形態1bと同様に、J個の仮想ラウドスピーカ信号は、たとえば、VBAPパンニング手法[Vbap]を使用して計算され得る。VBAPパンニング手法1025は、オーディオオブジェクト入力信号のM個の位置と仮想ラウドスピーカのJ個の位置とに応じて、J個の仮想ラウドスピーカ信号をレンダリングする。明らかに、VBAPパンニング手法以外のレンダリング手法が代わりに使用され得る。オーディオオブジェクトの位置メタデータは、静的なオブジェクトの位置または時間的に変動するオブジェクトの位置を示し得る。
空間フィルタリング(1030)は、s(k,n)に空間ウィンドウ
Gj(p)=(||nj-p||)-β
として計算され得、ここで、p=[x,y,z]は、直交座標における所望の聴取位置である。考慮される座標系の図が図5に示されており、ここで、Oは、基準位置であり、Lは、所望の聴取位置であり、pは、対応する聴取位置ベクトルである。仮想ラウドスピーカは、実線の円上に位置し、黒点は、例示的な仮想ラウドスピーカを表す。上記の式における丸括弧内の項は、所望の聴取位置とj番目の仮想ラウドスピーカ位置との間の距離である。係数βは、距離減衰係数である。たとえば、β=0.5の場合、所望の聴取位置と仮想ラウドスピーカ位置との間の距離に反比例して、j番目の仮想ラウドスピーカに対応するパワーを増幅することになる。これは、仮想ラウドスピーカによって表される音源または空間領域に近づくときにラウドネスを増加させる効果を模倣する。
位置修正(1040)の目的は、所望の聴取向きでの所望の聴取位置の視点(POV)から仮想ラウドスピーカ位置を計算することである。
n'j=nj-p
によって表され得る。所望の聴取回転が基準回転とは異なる場合、修正された仮想ラウドスピーカ位置を計算するときに、追加の回転行列が適用され得、すなわち、
n'j=(nj-p)R
となる。たとえば、(基準向きに対する)所望の聴取向きが方位角φに対応する場合、回転行列は、[RotMat]のように計算され、
この実施形態は、アンビソニックス領域におけるオーディオ出力信号を計算するための第2の空間変換(1050)の実装形態について説明する。
a'(k,n)=[A'0,0(k,n),A'1,-1(k,n),…,A'l,m(k,n),…,A'L',L'(k,n)]T
は、所望のアンビソニックスレベル(次数)L'までの出力信号を含む。
この実施形態は、ラウドスピーカ領域におけるオーディオ出力信号を計算するための第2の空間変換(1050)の実装形態について説明する。この場合、修正された仮想ラウドスピーカ位置
第2の空間変換(1050)は、バイノーラル音再生のためのバイノーラル領域における出力信号を作成することができる。1つの方法は、J個の(フィルタリングされた)仮想ラウドスピーカ信号
a'(k,n)=[A'left(k,n),A'right(k,n)]T
は、2つのバイノーラルオーディオ信号を含む。
前の実施形態から、出力信号a'(k,n)は、単一の行列乗算を適用することによって、入力信号a(k,n)から計算され得、すなわち、
1000 音場プロセッサ
1001 音場表現、入力
1010 分析フィルタバンク
1020 前方変換ブロック、前方変換、第1または前方空間変換、第1の空間変換
1021 前方変換規則
1022 平面波分解(PWD)
1023 ダウンミックス問題
1024 ビームフォーミング
1030 空間フィルタ、空間フィルタブロック、ブロック、空間フィルタリング
1031 空間フィルタ規則、空間フィルタ
1040 位置修正ブロック、位置修正、ブロック
1040a 仮想スピーカ位置決定器、ブロック
1040b ブロック
1050 後方変換ブロック、ブロック、後方変換定義、後方変換、空間後方変換、第2または後方空間変換、第2の空間変換
1051 後方変換規則
1053 変換
1060 合成フィルタバンク
1071 完全な変換定義、結合された行列
1072 部分的な変換定義
1073 別の(部分的な)変換定義、部分的な変換定義
1080 メモリ
1081 プロセッサ
1082 メモリリトリーバ
1090 (行列)プロセッサ、行列プロセッサ
1092 行列計算機、計算機
1100 検出器
1200 出力インターフェース
1201 処理された音場記述、ライン上の信号、信号、処理された音場表現、音フィルタ表現
Claims (31)
- 音場表現(1001)に関する定義された基準点または定義された聴取向きに関連する前記音場表現を処理するための装置であって、
処理された音場記述(1201)を取得するために、前記定義された基準点からの目標聴取位置の偏差、または前記定義された聴取向きからの目標聴取向きの偏差を使用して、前記音場表現を処理するための音場プロセッサ(1000)であって、前記処理された音場記述(1201)が、レンダリングされたきに、前記定義された基準点とは異なる前記目標聴取位置における前記音場表現の印象もしくは前記定義された聴取向きとは異なる前記目標聴取向きに対する前記音場表現の印象を提供する音場プロセッサ(1000)か、または前記処理された音場記述(1201)を取得するために、空間フィルタ(1030)を使用して前記音場表現を処理するための音場プロセッサ(1000)であって、前記処理された音場記述(1201)が、レンダリングされたときに、空間的にフィルタリングされた音場記述の印象を提供する、音場プロセッサ(1000)を備え、
前記音場プロセッサ(1000)が、前記偏差または前記空間フィルタ(1030)が前方変換規則(1021)および後方変換規則(1051)が関連付けられた空間変換領域に関連して前記音場表現に適用されるように、前記音場表現を処理するように構成され、
前記音場プロセッサ(1000)が、前記空間変換のための前記前方変換規則(1021)を使用することであって、前記前方変換規則(1021)が仮想スピーカ位置のセットにおける仮想スピーカのセットに関連する、ことと、前記変換領域内で前記空間フィルタ(1030)を使用することと、前記仮想スピーカ位置のセットを使用して前記空間変換のための前記後方変換規則(1051)を使用することとによって前記音場表現を処理するように構成されるか、または
前記音場プロセッサ(1000)が、前記空間変換のための前記前方変換規則(1021)を使用することであって、前記前方変換規則(1021)が仮想スピーカ位置のセットにおける仮想スピーカのセットに関連する、ことと、前記偏差を使用して前記仮想スピーカ位置のセットから導出された修正された仮想スピーカ位置のセットを使用して前記空間変換のための前記後方変換規則(1051)を使用することとによって前記音場表現を処理するように構成されるか、または
前記音場プロセッサ(1000)が、前記空間変換のための前記前方変換規則(1021)を使用することであって、前記前方変換規則(1021)が仮想スピーカ位置のセットにおける仮想スピーカのセットに関連する、ことと、前記変換領域において前記空間フィルタ(1030)を使用することと、前記偏差を使用して前記仮想スピーカ位置のセットから導出された修正された仮想スピーカ位置のセットを使用して前記空間変換のための前記後方変換規則(1051)を使用することとによって前記音場表現を処理するように構成される、
装置。 - 前記定義された基準点からの前記目標聴取位置の前記偏差を検出するため、または前記定義された聴取向きからの前記目標聴取向きの前記偏差を検出するため、または前記目標聴取位置を検出するための検出器(1100)であって、かつ前記定義された基準点からの前記目標聴取位置の前記偏差を決定するため、または前記目標聴取向きを検出するため、または前記定義された聴取向きからの前記目標聴取向きの前記偏差を決定するための検出器(1100)をさらに備える、請求項1に記載の装置。
- 前記音場表現(1001)が、前記空間変換領域とは異なるオーディオ信号領域における複数のオーディオ信号を含み、前記音場プロセッサ(1000)は、前記処理された音場記述(1201)を前記空間変換領域とは異なる前記オーディオ信号領域において発生させるように構成された、請求項1または2に記載の装置。
- 前記音場プロセッサ(1000)が、目標聴取位置または目標聴取向きのグリッドのグリッド点ごとに、事前に計算された変換定義(1071、1072、1073)または変換規則(1021、1051)を記憶する(1080)ように構成され、前記事前に計算された変換定義が、前記前方変換規則(1021)、前記空間フィルタ(1030)、および前記後方変換規則(1051)のうちの少なくとも2つを表し、
前記音場プロセッサ(1000)が、目標聴取位置または目標聴取向きに関連するグリッド点に関する前記変換定義または変換規則を選択し(1081、1082)、前記選択された変換定義または変換規則を適用する(1090)ように構成された、
請求項1から3のいずれか一項に記載の装置。 - 前記事前に計算された変換定義が、N行およびM列の次元を有する変換行列であり、NおよびMが2よりも大きい整数であり、
前記音場表現がM個のオーディオ信号を有し、前記処理された音場表現(1201)がN個のオーディオ信号を有するか、またはその逆である、
請求項4に記載の装置。 - 前記音場プロセッサ(1000)が、変換定義(1071)を前記音場表現(1001)に適用する(1090)ように構成され、
前記音場プロセッサ(1000)が、前記定義された基準点または前記定義された聴取向きに関連する前記仮想スピーカの前記仮想スピーカ位置を使用して前記前方変換規則(1021)を計算し、前記目標聴取位置または前記目標聴取向きに関連する前記仮想スピーカの前記修正された仮想スピーカ位置を使用して前記後方変換規則(1051)を計算し、
前記変換定義(1071)を取得するために前記前方変換規則(1021)と前記後方変換規則(1051)とを組み合わせる(1092)ように構成された、
請求項1から3のいずれか一項に記載の装置。 - 前記音場プロセッサ(1000)が、変換定義(1071)を前記音場表現(1001)に適用するように構成され、
前記音場プロセッサ(1000)が、前記定義された基準点または前記定義された聴取向きに関連する前記仮想スピーカの前記仮想スピーカ位置を使用して前記前方変換規則(1021)を計算し、前記空間フィルタ(1030)を計算し、前記同じまたは修正された仮想スピーカ位置を使用して前記後方変換規則(1051)を計算し、前記変換定義(1071)を取得するために、前記前方変換規則(1021)と、前記空間フィルタ(1030)と、前記後方変換規則(1051)とを組み合わせる(1092)ように構成された、
請求項1から3のいずれか一項に記載の装置。 - 前記音場プロセッサ(1000)が、前記定義された基準点または前記定義された聴取向きに関連する事前定義された仮想スピーカ位置における前記仮想スピーカのための仮想ラウドスピーカ信号を取得するために、前記前方変換規則(1021)を使用して、前記音場表現(1001)をオーディオ信号領域から空間領域に前方変換し(1020)、
前記目標聴取位置または前記目標聴取向きに関連する前記修正された仮想スピーカ位置に基づいて、前記後方変換規則(1051)を使用して、前記仮想ラウドスピーカ信号を前記オーディオ信号領域に後方変換し(1050)、
フィルタリングされた仮想ラウドスピーカ信号を取得するために、前記空間フィルタ(1030)を前記仮想ラウドスピーカ信号に適用し、前記目標聴取位置もしくは前記目標聴取向きに関連する前記修正された仮想スピーカ位置、または前記定義された基準位置もしくは聴取向きに関連する前記仮想スピーカ位置に基づいて、前記後方変換規則(1051)を使用して、前記フィルタリングされた仮想ラウドスピーカ信号を後方変換する(1050)
ように構成された、
請求項1から3のいずれか一項に記載の装置。 - 前記音場プロセッサ(1000)が、
前記前方変換規則(1021)と前記空間フィルタ(1030)とを計算し、部分変換定義(1072)を取得するために前記前方変換規則(1021)と前記空間フィルタ(1030)とを組み合わせ、
フィルタリングされた仮想ラウドスピーカ信号を取得するために、前記部分変換定義(1072)を前記音場表現(1001)に適用し(1090)、
前記目標聴取位置もしくは前記目標聴取向きに関連する前記修正された仮想スピーカ位置に基づいて、もしくは前記定義された基準点もしくは所望の聴取向きに関連する前記仮想スピーカ位置に基づいて、前記後方変換規則(1051)を使用して、前記フィルタリングされた仮想ラウドスピーカ信号を後方変換する(1050)
ように構成され、または
前記音場プロセッサ(1000)が、
前記目標聴取位置もしくは前記目標聴取向きに関連する前記修正された仮想スピーカ位置、もしくは前記定義された基準点もしくは聴取向きに関連する前記仮想スピーカ位置に基づいて、前記空間フィルタ(1030)と前記後方変換規則(1051)とを計算し、
部分変換定義(1073)を取得するために、前記空間フィルタ(1030)と前記後方変換規則(1051)とを組み合わせ(1092)、
事前定義された仮想スピーカ位置における前記仮想スピーカのための仮想ラウドスピーカ信号を取得するために、前記音場表現をオーディオ信号領域から空間領域に前方変換し(1020)、
前記部分変換定義(1073)を前記仮想ラウドスピーカ信号に適用する(1090)
ように構成された、
請求項1から3のいずれか一項に記載の装置。 - 前記前方変換規則(1021)、前記空間フィルタ(1030)、前記後方変換規則(1051)、変換定義もしくは部分変換定義、もしくは事前に計算された変換定義のうちの少なくとも1つが、行列を含み、またはオーディオ信号領域が、時間領域もしくは時間-周波数領域である、請求項1から9のいずれか一項に記載の装置。
- 前記音場表現(1001)が、複数のアンビソニックス信号を含み、前記音場プロセッサ(1000)が、平面波分解(1022)と、前記定義された聴取位置もしくは前記定義された聴取向きに関連する前記仮想スピーカの前記仮想スピーカ位置とを使用して、前記前方変換規則(1021)を計算し(1022)、または
前記音場表現が、スイートスポットを有する定義されたラウドスピーカ設定のための複数のラウドスピーカチャネルを含み、前記スイートスポットが、前記定義された基準位置を表し、前記音場プロセッサ(1000)が、前記スイートスポットに関連する前記仮想スピーカ位置における前記仮想スピーカを有する仮想ラウドスピーカ設定への前記ラウドスピーカチャネルのアップミックス規則もしくはダウンミックス規則(1023)を使用して前記前方変換規則(1021)を計算するように構成され、または
前記音場表現が、前記定義された基準位置としてのアレイ中心に関連する複数の実際のもしくは仮想マイクロフォン信号を含み、前記音場プロセッサ(1000)が、前記複数のマイクロフォン信号に対する前記仮想スピーカのうちの仮想スピーカの仮想スピーカ位置ごとのビームフォーミング操作(1024)を表すビームフォーミング重みとして、前記前方変換規則(1021)を計算するように構成され、または
前記音場表現が、関連する位置情報を有する複数のオーディオオブジェクトを含むオーディオオブジェクト表現を含み、前記音場プロセッサ(1000)が、前記オーディオオブジェクトに関する前記位置情報を使用して、前記定義された基準位置に関連する前記仮想スピーカ位置における前記仮想スピーカに対して前記オーディオオブジェクトをパンニングするためのパンニング操作(1025)を表す前記前方変換規則(1021)を計算するように構成された、
請求項1から10のいずれか一項に記載の装置。 - 前記音場プロセッサ(1000)が、前記前方変換規則(1021)において使用される前記仮想スピーカの前記仮想スピーカ位置に応じて、加えて、前記定義された基準位置、前記定義された聴取向き、前記目標聴取位置、および前記目標聴取向きのうちの少なくとも1つに応じて、前記空間フィルタ(1030)をウィンドウ係数のセットとして計算するように構成された、
請求項1から11のいずれか一項に記載の装置。 - 前記音場プロセッサ(1000)が、前記空間音が、前記目標聴取向きによって示される視線方向に向かって強調されるように、前記空間フィルタ(1030)を非負の実数値ゲイン値のセットとして計算するように構成され、または前記音場プロセッサ(1000)が、前記空間フィルタ(1030)を空間ウィンドウとして計算するように構成された、
請求項1から12のいずれか一項に記載の装置。 - 前記音場プロセッサ(1000)が、前記空間フィルタ(1030)を、
目標視線方向に向けられた共通の1次空間ウィンドウとして、前記目標聴取位置と対応する仮想ラウドスピーカ位置との間の距離に従って減衰もしくは増幅される共通の1次空間ウィンドウとして、または
ズームイン動作の場合はより狭くなり、ズームアウト動作の場合はより広くなる矩形空間ウィンドウとして、または
対応するオーディオオブジェクトがズームされたビデオ画像から消えたときに、側方における音源を減衰させるウィンドウとして
計算するように構成された、
請求項1から13のいずれか一項に記載の装置。 - 前記音場プロセッサ(1000)が、修正された仮想ラウドスピーカ位置を使用して前記後方変換規則(1051)を計算するように構成され、前記音場プロセッサ(1000)が、
更新された位置ベクトルを取得するために、
前記定義された基準点から前記仮想スピーカ位置への元の位置ベクトル、
前記目標聴取位置もしくは前記目標聴取向きから導出された偏差ベクトル、および/または
事前定義された回転とは異なる目標回転を示す回転行列
を使用して、仮想ラウドスピーカごとの前記修正された仮想ラウドスピーカ位置を計算する(1040b)ように構成され、前記更新された位置ベクトルが、関連する仮想スピーカのための前記後方変換規則(1051)に使用される、
請求項1から14のいずれか一項に記載の装置。 - 前記処理された音場記述(1201)が、複数のアンビソニックス信号を含み、前記音場プロセッサ(1000)が、修正されたスピーカ位置において評価された、もしくは前記目標向きに関連するすべての仮想スピーカ信号にわたる加重和を表す調和分解を使用して前記後方変換規則(1052)を計算するように構成され、または
前記処理された音場記述(1201)が、定義された出力ラウドスピーカ設定のための複数のラウドスピーカチャネルを含み、前記音場プロセッサ(1000)が、前記定義された出力ラウドスピーカ設定における仮想スピーカの位置を使用して、前記修正された仮想スピーカ位置から導出された、もしくは前記目標向きに関連するラウドスピーカフォーマット変換行列を使用して前記後方変換規則(1053)を計算するように構成され、または
前記処理された音場記述(1201)が、バイノーラル出力を含み、前記音場プロセッサ(1000)が、前記修正されたスピーカ位置に関連する頭部伝達関数を使用するか、もしくは定義された中間出力ラウドスピーカ設定に関連するラウドスピーカフォーマット変換規則(1055)と前記定義された出力ラウドスピーカ設定に関連する頭部伝達関数(1056)とを使用して、前記バイノーラル出力信号を計算するように構成された、
請求項1から15のいずれか一項に記載の装置。 - 前記装置が、様々な事前定義された偏差に関連する事前に計算された係数のセットが記憶されたメモリ(1080)を備え、
前記音場プロセッサ(1000)が、
前記様々な事前定義された偏差の中から、検出された偏差に最も近い前記事前定義された偏差を検索し、
前記メモリ(1080)から前記最も近い所定の偏差に関連付けられた前記事前に計算された係数のセットを取得し、
前記取得された係数の事前に計算されたセットを前記音場プロセッサ(1000)に転送する
ように構成された、
請求項1から3のいずれか一項に記載の装置。 - 前記音場表現(1001)が、3次元ビデオまたは球面ビデオに関連付けられ、前記定義された基準点が、前記3次元ビデオまたは前記球面ビデオの中心であり、
検出器(1100)が、実際の視聴点が前記中心とは異なることを示すユーザ入力を検出するように構成され、前記実際の視聴点が、前記目標聴取位置と同一であり、
前記検出器が、前記ユーザ入力から前記検出された偏差を導出するように構成されるか、または前記検出器(1100)が、実際の視聴向きが前記中心に向けられた前記定義された聴取向きとは異なることを示すユーザ入力を検出するように構成され、実際の視聴向きが、前記目標聴取向きと同一であり、前記検出器が、前記ユーザ入力から前記検出された偏差を導出するように構成された、
請求項2から17のいずれか一項に記載の装置。 - 前記音場表現(1001)が、3次元ビデオまたは球面ビデオに関連付けられ、前記定義された基準点が、前記3次元ビデオまたは前記球面ビデオの中心であり、
前記音場プロセッサ(1000)が、前記処理された音場表現が、前記3次元ビデオもしくは前記球面ビデオのための表示領域に対する前記音場記述内に含まれる少なくとも1つのサウンドオブジェクトの標準的なもしくはリトルプラネット投影、または前記標準的なもしくは前記リトルプラネット投影間の移行を表すように、前記音場表現を処理するように構成され、前記表示領域が、ユーザ入力と定義された視聴方向とによって定義される、
請求項1から18のいずれか一項に記載の装置。 - 前記音場プロセッサ(1000)が、
前記音場記述を、仮想ラウドスピーカ位置の第1のセットに関連付けられた仮想ラウドスピーカ関連表現に変換する動作であって、前記仮想ラウドスピーカ位置の第1のセットが前記定義された基準点に関連付けられた、動作と、
前記仮想ラウドスピーカ位置の第1のセットを、仮想ラウドスピーカ位置の修正されたセットに変換する動作であって、前記仮想ラウドスピーカ位置の修正されたセットが前記目標聴取位置に関連付けられた、動作と、
前記仮想ラウドスピーカ関連表現を、前記仮想ラウドスピーカ位置の修正されたセットに関連付けられた前記処理された音場記述(1201)に変換する動作と
を行うように構成され、
前記音場プロセッサ(1000)が、検出された偏差を使用して、前記仮想ラウドスピーカ位置の修正されたセットを計算するように構成された、
請求項1から19のいずれか一項に記載の装置。 - 仮想ラウドスピーカ位置のセットが、前記定義された聴取向きに関連付けられ、前記仮想ラウドスピーカ位置の修正されたセットが、前記目標聴取向きに関連付けられ、
前記目標聴取向きが、検出された偏差および前記定義された聴取向きから計算される、
請求項1から20のいずれか一項に記載の装置。 - 仮想ラウドスピーカ位置のセットが、前記定義された聴取位置および前記定義された聴取向きに関連付けられ、
前記定義された聴取位置が、関連するビデオの第1の投影点および投影向きに対応し、投影面を表す表示領域上に前記関連するビデオの第1の投影を結果として生じ、
前記仮想ラウドスピーカ位置の修正されたセットが、前記関連するビデオの第2の投影点および第2の投影向きに関連付けられ、前記投影面に対応する前記表示領域上に前記関連するビデオの第2の投影を結果として生じる、
請求項1から21のいずれか一項に記載の装置。 - 前記音場プロセッサ(1000)が、
前記音場表現(1001)を時間-周波数領域表現に変換するための時間-スペクトル変換器(1010)を備える、
請求項1から22のいずれか一項に記載の装置。 - 前記音場プロセッサ(1000)が、前記偏差と前記空間フィルタ(1030)とを使用して、前記音場表現(1001)を処理するように構成された、
請求項1から23のいずれか一項に記載の装置。 - 前記音場表現(1001)が、入力次数を有するアンビソニックス信号であり、
前記処理された音場記述(1201)が、出力次数を有するアンビソニックス信号であり、
前記音場プロセッサ(1000)が、前記出力次数が前記入力次数と等しくなるように、前記処理された音場記述(1201)を計算するように構成された、
請求項1から24のいずれか一項に記載の装置。 - 前記音場プロセッサ(1000)が、前記偏差に関連する処理行列を取得し、前記処理行列を前記音場表現(1001)に適用するように構成され、前記音場表現が、少なくとも2つの音場成分を有し、前記処理行列が、N×N行列であり、Nが、2に等しいか、または2よりも大きい、
請求項1から25のいずれか一項に記載の装置。 - 検出器(1100)が、方向と長さとを有するベクトルとして前記偏差を検出するように構成され、
前記ベクトルが、前記定義された基準点から前記目標聴取位置への線形遷移を表す、
請求項2から26のいずれか一項に記載の装置。 - 前記音場プロセッサ(1000)が、前記目標聴取位置が前記定義された基準点よりもサウンドオブジェクトまたは空間領域に近い場合、前記処理された音場記述(1201)によって表される前記サウンドオブジェクトまたは前記空間領域のラウドネスが、前記音場表現によって表される前記サウンドオブジェクトまたは前記空間領域のラウドネスよりも大きくなるように、前記音場表現(1001)を処理するように構成された、
請求項1から27のいずれか一項に記載の装置。 - 前記音場プロセッサ(1000)が、仮想スピーカごとに、前記定義された基準点に対して個別の方向を決定し、前記決定された方向において球面調和関数を評価することによって、前記音場表現(1001)を用いて逆球面調和分解を実行し、仮想ラウドスピーカ位置から前記目標聴取位置までの修正された方向を決定し、前記修正されたラウドスピーカ位置において評価された前記球面調和関数を使用して、球面調和分解を実行するように構成された、請求項1から28のいずれか一項に記載の装置。
- 音場表現(1001)に関する定義された基準点または定義された聴取向きに関連する前記音場表現を処理するための方法であって、
前記定義された基準点からの目標聴取位置の偏差、または前記定義された聴取向きからの目標聴取向きの偏差を検出するステップと、
処理された音場記述(1201)を取得するために、前記偏差を使用して、前記音場表現を処理するステップ(1000)であって、前記処理された音場記述(1201)が、レンダリングされたきに、前記定義された聴取位置とは異なる前記目標聴取位置における前記音場表現の印象もしくは前記定義された聴取向きとは異なる前記目標聴取向きに対する前記音場表現の印象を提供する、ステップ(1000)か、または前記処理された音場記述(1201)を取得するために、空間フィルタ(1030)を使用して前記音場表現を処理するためのステップ(1000)であって、前記処理された音場記述が、レンダリングされたときに、空間的にフィルタリングされた音場記述の印象を提供する、ステップ(1000)を含み、
前記偏差または前記空間フィルタ(1030)が、前方変換規則(1021)および後方変換規則(1051)が関連付けられた空間変換領域に関連して前記音場表現に適用され、
前記処理するステップ(1000)が、前記空間変換のための前記前方変換規則(1021)を使用するステップであって、前記前方変換規則(1021)が仮想スピーカ位置のセットにおける仮想スピーカのセットに関連する、ステップと、前記変換領域内で前記空間フィルタ(1030)を使用するステップと、前記仮想スピーカ位置のセットを使用して前記空間変換のための前記後方変換規則(1051)を使用するステップとを含むか、または
前記処理するステップ(1000)が、前記空間変換のための前記前方変換規則(1021)を使用するステップであって、前記前方変換規則(1021)が仮想スピーカ位置のセットにおける仮想スピーカのセットに関連する、ステップと、前記偏差を使用して前記仮想スピーカ位置のセットから導出された修正された仮想スピーカ位置のセットを使用して前記空間変換のための前記後方変換規則(1051)を使用するステップとを含むか、または
前記処理するステップ(1000)が、前記空間変換のための前記前方変換規則(1021)を使用するステップであって、前記前方変換規則(1021)が仮想スピーカ位置のセットにおける仮想スピーカのセットに関連する、ステップと、前記変換領域において前記空間フィルタ(1030)を使用するステップと、前記偏差を使用して前記仮想スピーカ位置のセットから導出された修正された仮想スピーカ位置のセットを使用して前記空間変換のための前記後方変換規則(1051)を使用するステップとを含む、
方法。 - コンピュータまたはプロセッサ上で実行されるときに、請求項30に記載の音場表現を処理するための方法を実行するためのコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EPPCT/EP2019/070373 | 2019-07-29 | ||
PCT/EP2019/070373 WO2021018378A1 (en) | 2019-07-29 | 2019-07-29 | Apparatus, method or computer program for processing a sound field representation in a spatial transform domain |
PCT/EP2020/071120 WO2021018830A1 (en) | 2019-07-29 | 2020-07-27 | Apparatus, method or computer program for processing a sound field representation in a spatial transform domain |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022546926A JP2022546926A (ja) | 2022-11-10 |
JP7378575B2 true JP7378575B2 (ja) | 2023-11-13 |
Family
ID=67551354
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022506492A Active JP7378575B2 (ja) | 2019-07-29 | 2020-07-27 | 空間変換領域における音場表現を処理するための装置、方法、またはコンピュータプログラム |
Country Status (9)
Country | Link |
---|---|
US (1) | US20240163628A1 (ja) |
EP (1) | EP4005246A1 (ja) |
JP (1) | JP7378575B2 (ja) |
KR (1) | KR20220038478A (ja) |
CN (1) | CN114450977A (ja) |
BR (1) | BR112022001584A2 (ja) |
CA (1) | CA3149297A1 (ja) |
MX (1) | MX2022001147A (ja) |
WO (2) | WO2021018378A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115424609A (zh) * | 2022-08-16 | 2022-12-02 | 青岛大学 | 一种自动语音识别方法、系统、介质、设备及终端 |
CN116719005B (zh) * | 2023-08-10 | 2023-10-03 | 南京隼眼电子科技有限公司 | 基于fpga的定点数据处理方法、装置及存储介质 |
CN117436293A (zh) * | 2023-12-21 | 2024-01-23 | 国网浙江省电力有限公司电力科学研究院 | 基于声场重构的低频变压器测点仿真方法和电子设备 |
CN117910279B (zh) * | 2024-03-18 | 2024-05-28 | 西北工业大学 | 基于空间坐标旋转变换的三维声场快速处理方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013105413A1 (ja) | 2012-01-11 | 2013-07-18 | ソニー株式会社 | 音場制御装置、音場制御方法、プログラム、音場制御システム及びサーバ |
JP2014072871A (ja) | 2012-10-02 | 2014-04-21 | Sony Corp | 音声処理装置および方法、プログラム並びに記録媒体 |
WO2015107926A1 (ja) | 2014-01-16 | 2015-07-23 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
WO2019012131A1 (en) | 2017-07-14 | 2019-01-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | CONCEPT FOR GENERATING AN ENHANCED AUDIO FIELD DESCRIPTION OR A MODIFIED AUDIO FIELD DESCRIPTION USING A MULTIPOINT SOUND FIELD DESCRIPTION |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140314256A1 (en) * | 2013-03-15 | 2014-10-23 | Lawrence R. Fincham | Method and system for modifying a sound field at specified positions within a given listening space |
CN105723743A (zh) * | 2013-11-19 | 2016-06-29 | 索尼公司 | 声场再现设备和方法以及程序 |
US20150189455A1 (en) * | 2013-12-30 | 2015-07-02 | Aliphcom | Transformation of multiple sound fields to generate a transformed reproduced sound field including modified reproductions of the multiple sound fields |
CN109891502B (zh) * | 2016-06-17 | 2023-07-25 | Dts公司 | 一种近场双耳渲染方法、系统及可读存储介质 |
US10262665B2 (en) * | 2016-08-30 | 2019-04-16 | Gaudio Lab, Inc. | Method and apparatus for processing audio signals using ambisonic signals |
CN109891503B (zh) * | 2016-10-25 | 2021-02-23 | 华为技术有限公司 | 声学场景回放方法和装置 |
US9980075B1 (en) * | 2016-11-18 | 2018-05-22 | Stages Llc | Audio source spatialization relative to orientation sensor and output |
-
2019
- 2019-07-29 WO PCT/EP2019/070373 patent/WO2021018378A1/en active Application Filing
-
2020
- 2020-07-27 KR KR1020227006476A patent/KR20220038478A/ko not_active Application Discontinuation
- 2020-07-27 WO PCT/EP2020/071120 patent/WO2021018830A1/en active Search and Examination
- 2020-07-27 BR BR112022001584A patent/BR112022001584A2/pt unknown
- 2020-07-27 CN CN202080068309.8A patent/CN114450977A/zh active Pending
- 2020-07-27 JP JP2022506492A patent/JP7378575B2/ja active Active
- 2020-07-27 MX MX2022001147A patent/MX2022001147A/es unknown
- 2020-07-27 EP EP20745204.6A patent/EP4005246A1/en active Pending
- 2020-07-27 CA CA3149297A patent/CA3149297A1/en active Pending
-
2024
- 2024-01-02 US US18/402,663 patent/US20240163628A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013105413A1 (ja) | 2012-01-11 | 2013-07-18 | ソニー株式会社 | 音場制御装置、音場制御方法、プログラム、音場制御システム及びサーバ |
JP2014072871A (ja) | 2012-10-02 | 2014-04-21 | Sony Corp | 音声処理装置および方法、プログラム並びに記録媒体 |
WO2015107926A1 (ja) | 2014-01-16 | 2015-07-23 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
WO2019012131A1 (en) | 2017-07-14 | 2019-01-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | CONCEPT FOR GENERATING AN ENHANCED AUDIO FIELD DESCRIPTION OR A MODIFIED AUDIO FIELD DESCRIPTION USING A MULTIPOINT SOUND FIELD DESCRIPTION |
Non-Patent Citations (1)
Title |
---|
Archontis Politis et. al.,PARAMETRIC SPATIAL AUDIO EFFECTS,Proc. of the 15th Int. Conference on Digital Audio Effects (DAFx-12),2012年09月17日 |
Also Published As
Publication number | Publication date |
---|---|
KR20220038478A (ko) | 2022-03-28 |
CN114450977A (zh) | 2022-05-06 |
JP2022546926A (ja) | 2022-11-10 |
CA3149297A1 (en) | 2021-02-04 |
WO2021018378A1 (en) | 2021-02-04 |
BR112022001584A2 (pt) | 2022-03-22 |
US20220150657A1 (en) | 2022-05-12 |
US20240163628A1 (en) | 2024-05-16 |
MX2022001147A (es) | 2022-03-25 |
WO2021018830A1 (en) | 2021-02-04 |
EP4005246A1 (en) | 2022-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11463834B2 (en) | Concept for generating an enhanced sound field description or a modified sound field description using a multi-point sound field description | |
JP7378575B2 (ja) | 空間変換領域における音場表現を処理するための装置、方法、またはコンピュータプログラム | |
CN106664501B (zh) | 基于所通知的空间滤波的一致声学场景再现的系统、装置和方法 | |
KR101715541B1 (ko) | 복수의 파라메트릭 오디오 스트림들을 생성하기 위한 장치 및 방법 그리고 복수의 라우드스피커 신호들을 생성하기 위한 장치 및 방법 | |
US11863962B2 (en) | Concept for generating an enhanced sound-field description or a modified sound field description using a multi-layer description | |
RU2793625C1 (ru) | Устройство, способ или компьютерная программа для обработки представления звукового поля в области пространственного преобразования | |
US12022276B2 (en) | Apparatus, method or computer program for processing a sound field representation in a spatial transform domain | |
WO2018066376A1 (ja) | 信号処理装置および方法、並びにプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220331 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230320 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20230619 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230920 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231002 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231031 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7378575 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |