JP2020005278A - 変調された脱相関による空間的オーディオ信号の向上 - Google Patents
変調された脱相関による空間的オーディオ信号の向上 Download PDFInfo
- Publication number
- JP2020005278A JP2020005278A JP2019150274A JP2019150274A JP2020005278A JP 2020005278 A JP2020005278 A JP 2020005278A JP 2019150274 A JP2019150274 A JP 2019150274A JP 2019150274 A JP2019150274 A JP 2019150274A JP 2020005278 A JP2020005278 A JP 2020005278A
- Authority
- JP
- Japan
- Prior art keywords
- channels
- output
- decorrelation
- decorrelated
- input audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 98
- 230000006872 improvement Effects 0.000 title description 2
- 238000000034 method Methods 0.000 claims abstract description 216
- 230000008569 process Effects 0.000 claims abstract description 151
- 230000010363 phase shift Effects 0.000 claims description 26
- 239000011159 matrix material Substances 0.000 claims description 25
- 238000012545 processing Methods 0.000 claims description 6
- 230000002776 aggregation Effects 0.000 abstract 2
- 238000004220 aggregation Methods 0.000 abstract 2
- 230000006870 function Effects 0.000 description 98
- 238000006243 chemical reaction Methods 0.000 description 8
- 230000002596 correlated effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000012546 transfer Methods 0.000 description 5
- 238000009877 rendering Methods 0.000 description 4
- 230000001276 controlling effect Effects 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 101100457838 Caenorhabditis elegans mod-1 gene Proteins 0.000 description 1
- 101150110972 ME1 gene Proteins 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000003090 exacerbative effect Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Stereophonic System (AREA)
Abstract
Description
本願は2015年3月3日に出願された米国仮特許出願第62/127,613号および2016年2月23日に出願された米国仮特許出願第62/298,905号の優先権を主張するものである。両出願の内容はここに参照によってその全体において組み込まれる。
本発明は、複数のオーディオ・チャネルから構成されるオーディオ信号の操作に関し、詳細には、より低い分解能の空間的特性をもつ入力オーディオ信号からより高い分解能の空間的特性をもつオーディオ信号を生成するために使われる方法に関する。
Nチャネル音場フォーマットは、そのパン関数PN(φ)によって定義されてもよい。特に、G=PN(φ)で、Gは利得値のN×1列ベクトルを表わし、φはオブジェクトの空間位置を定義する。
例示的なシナリオから始める。図1のAのパンナーA(1)は、次のパンナーの式に従って、四次水平Bフォーマット音場を生成するよう構成されている(用語BF4hは水平方向の(horizontal)4次のBフォーマット(B-Format)を示すために使われていることを注意しておく)。
図1Bに示した例では、フォーマット変換器(3)はNrチャネル入力音場信号(6)を入力として受け取り、Npチャネル出力音場信号(7)を出力する。フォーマット変換器(3)は一般に、聴取者の再生環境における最終的なスピーカー配置に関する情報は受け取らない。聴取者が十分多数のスピーカーを有すると想定することにすれば(これは先述したNS≧Npという想定である)スピーカー配置は安全に無視できる。ただし、本開示に記載される方法は、再生環境がより少数のスピーカーをもつ聴取者についても適切な聴取経験を生成するであろう。
Spkr(t)=DecodeMatrix×Y(t) (6)
一つのスピーカーに注目すると、アレイ内の他のスピーカーを無視することができ、DecodeMatrix〔デコード行列〕の一つの行を見ることができる。これをデコード行ベクトルDecN(φs)と呼ぶことにする。これは、DecodeMatrixのこの行が、Nチャネル音場信号を角φsに位置しているスピーカーにデコードするために意図されていることを示している。
これで図2からの三つの主たる処理ブロックを合わせることができる。それにより、位置φにパンされる入力オーディオ・オブジェクトが、聴取者再生環境における位置φsに位置するスピーカーに供給される信号において現われる仕方:
gain3,9(φ,φs)=Dec9(φs)×H×P3(φ) (11)
を定義することができる。
。
複数のスピーカーが聴取者のまわりの円に配置されるとき、図3に示される利得曲線は、スピーカー利得をすべて示すよう、プロットし直されることができる。それにより、それらのスピーカーがどのように互いと相互作用するかを見ることができる。
式(4)および(5)から、BF1hフォーマットを定義する三つのパン利得値は、BF4hフォーマットを定義する9個のパン利得値の部分集合であることがわかる。よって、低分解能信号X(t)は、高分解能信号Y(t)から、単純な線形投影Mpによって導出されたものであることができる。
図6および図7のフォーマット変換器は聴取者にとっていくらか受け入れられる再生経験を提供するものの、図5における重なり合う曲線が証左となるように、近隣のスピーカーの間のきわめて大きな度合いの相関を生じることがある。
Δ1=z-256 (20)
Δ2=z-512 (21)
を定義する(当業者におなじみのz変換記法を使っている)。
p=modk×Dec9(φs)×HLS
を形成する。積pは行ベクトル(1×3ベクトル)であり、各要素はφsのsinおよびcos関数での代数表現である。
p≡Dec9(φs)×Qk
を満たす(一意的な)行列Qkを見出すべく、解く。
ある代替的実施形態では、第二の脱相関器は次によって置き換えられる:
本稿に開示されるさまざまな例において、第一の変調プロセスは第一の変調関数に関わり、第二の変調プロセスは第二の変調関数に関わり、第二の変調関数は第一の変調関数に約90度または約−90度の位相シフトを加えたものである。図8を参照して上記した手順において、BF1h入力信号のBF4h出力信号への変換は、第一の変調関数mod1(φs)=cos3φsおよび第二の変調関数mod2(φs)=sin3φsに関わっていた。しかしながら、他の実装は、第二の変調関数が第一の変調関数に約90度または約−90度の位相シフトを加えたものである他の変調関数を使って実装されてもよい。
代替的な変調関数mod1(φs)=cos2φsおよびmod2(φs)=sin2φsを使う、前節で与えた例は、最後の二行に0を含むQ行列を生じる。結果として、これらの代替的な変調関数により、出力フォーマットは、
BF1(4チャネル、一次アンビソニックス、WXYZフォーマットとしても知られる)。これはmod1(φs)=cos2φsおよびmod2(φs)=sin2φsのような変調関数を使ってBF2(9チャネル二次アンビソニックス)にフォーマット変換されうる;または
BF2(9チャネル、二次アンビソニックス、WXYZフォーマットとしても知られる)。これはmod1(φs)=cos4φsおよびmod2(φs)=sin4φsのような変調関数を使ってBF3(16チャネル六次アンビソニックス)にフォーマット変換されうる。
図11は、オーディオ・オブジェクトをレンダリングするのに好適なシステムを示している。ここで、フォーマット変換器(3)は、より低分解能のBF1h信号x1(t)…x3(t)から9チャネルのBF4h信号y1(t)…y9(t)を生成するために使われる。
{size=0}{GainZerothGain=0,GainFirstGain=0,GainDirectGain=1}
size1=1/2のとき、利得値は:
{size=1/2}{GainZerothGain=1,GainFirstGain=1,GainDirectGain=0}
size1=1のとき、利得値は:
{size=1}{GainZerothGain=√3,GainFirstGain=0,GainDirectGain=0}
。
図12に示されるようなアップミキサーは、低分解能音場信号(たとえばBF1h)を入力として取る方向制御論理プロセス(18)の使用によって動作する。たとえば、方向制御論理プロセス(18)は、できるだけ正確に方向制御されるべき入力音場信号の成分を識別し(そしてそれらの成分を処理して高分解能出力信号z1(t)…z9(t)を形成し)てもよい。たとえば、方向制御論理(18)は、現在の優勢音方向に基づいて一つまたは複数のチャネルの利得を変更してもよく、方向制御されたオーディオ・データのNp個のオーディオ・チャネルを出力してもよい。図12に示した例では、p=9であり、よって方向制御論理プロセス(18)が方向制御されたオーディオ・データの9個のチャネルを出力する。
本開示において記述される実装へのさまざまな修正が当業者には容易に明白になりうる。本稿で定義される一般原理は、本開示の精神または範囲から外れることなく、他の実装に適用されてもよい。たとえば、本稿に記載されるフォーマット変換器が有益になる他の多くの応用があることは理解されるであろう。このように、請求項は、本稿に示される実装に限定されることは意図されておらず、本開示、本稿に開示される原理および新規な特徴と整合する最も広い範囲を与えられるものである。
〔態様1〕
オーディオ信号を処理する方法であって:
Nr個の入力オーディオ・チャネルを含む入力オーディオ信号を受領する段階であって、前記入力オーディオ信号は、第一の音場フォーマット分解能をもつ第一の音場フォーマットを表わし、Nrは2以上の整数である、段階と;
前記入力オーディオ・チャネルのうち二つ以上のチャネルの集合に第一の脱相関プロセスを適用して脱相関チャネルの第一の集合を生成する段階であって、前記第一の脱相関プロセスは、入力オーディオ・チャネルの前記集合のチャネル間相関を維持する、段階と;
脱相関チャネルの前記第一の集合に第一の変調プロセスを適用して、脱相関され変調された出力チャネルの第一の集合を生成する段階と;
脱相関され変調された出力チャネルの前記第一の集合を、二つ以上の脱相関されていない出力チャネルと組み合わせて、Np個の出力オーディオ・チャネルを含む出力オーディオ信号を生成する段階であって、Npは3以上の整数であり、前記出力チャネルは、前記第一の音場フォーマットより相対的に高い分解能の音場フォーマットである第二の音場フォーマットを表わし、前記脱相関されていない出力チャネルは、前記出力オーディオ信号の、より低い分解能の成分と一致し、前記脱相関され変調された出力チャネルは前記出力オーディオ信号の、より高い分解能の成分と一致する、段階とを含む、
方法。
〔態様2〕
前記変調プロセスは脱相関チャネルの前記第一の集合に線形行列を適用することに関わる、態様1記載の方法。
〔態様3〕
前記組み合わせることは、脱相関されて変調された出力チャネルの前記第一の集合をNr個の脱相関されていない出力チャネルと組み合わせることに関わる、態様1または2記載の方法。
〔態様4〕
前記第一の脱相関プロセスを適用することは、前記Nr個の入力オーディオ・チャネルのそれぞれに同一の脱相関プロセスを適用することに関わる、態様1ないし3のうちいずれか一項記載の方法。
〔態様5〕
前記入力オーディオ・チャネルのうち二つ以上のチャネルの前記集合に第二の脱相関プロセスを適用して、脱相関チャネルの第二の集合を生成する段階であって、前記第二の脱相関プロセスは、入力オーディオ・チャネルの前記集合のチャネル間相関を維持する、段階と;
脱相関チャネルの前記第二の集合に第二の変調プロセスを適用して、脱相関され変調された出力チャネルの第二の集合を生成する段階とをさらに含み、
前記組み合わせることは、脱相関され変調された出力チャネルの前記第二の集合を、脱相関され変調された出力チャネルの前記第一の集合および前記二つ以上の脱相関されていない出力チャネルと組み合わせることに関わる、
態様1ないし4のうちいずれか一項記載の方法。
〔態様6〕
前記第一の脱相関プロセスは第一の脱相関関数を含み、前記第二の脱相関プロセスは第二の脱相関関数を含み、前記第二の脱相関関数は前記第一の脱相関関数に約90度または約−90度の位相シフトを加えたものを含む、態様5記載の方法。
〔態様7〕
前記第一の変調プロセスは第一の変調関数を含み、前記第二の変調プロセスは第二の変調関数を含み、前記第二の変調関数は前記第一の変調関数に約90度または約−90度の位相シフトを加えたものを含む、態様5または6記載の方法。
〔態様8〕
前記脱相関、変調および組み合わせは、前記出力オーディオ信号がデコードされてスピーカーのアレイに提供されるときに:
a)前記スピーカーのアレイにおけるエネルギーの空間分布が、前記入力オーディオ信号が最小二乗デコーダを介して前記スピーカーのアレイにデコードされることから帰結するエネルギーの空間分布と実質的に同じであり、;かつ、
b)前記スピーカーのアレイ内の隣り合うスピーカー間の相関が、前記入力オーディオ信号が最小二乗デコーダを介して前記スピーカーのアレイにデコードされることから帰結する相関と実質的に異なる、
よう前記出力オーディオ信号を生成する、態様1ないし7のうちいずれか一項記載の方法。
〔態様9〕
前記脱相関されていない出力チャネルは、前記Nr個の入力オーディオ・チャネルに最小二乗フォーマット変換器を適用することによって生成される、態様1ないし8のうちいずれか一項記載の方法。
〔態様10〕
前記入力オーディオ信号を受領する段階は、オーディオ方向制御論理プロセスから第一の出力を受領することに関わり、前記第一の出力は前記Nr個の入力オーディオ・チャネルを含み、当該方法はさらに、前記出力オーディオ信号の前記Np個のオーディオ・チャネルを、前記オーディオ方向制御論理プロセスからの第二の出力と組み合わせる段階を含み、前記第二の出力は、現在の優勢音方向に基づいて一つまたは複数のチャネルの利得が変更された、方向制御されたオーディオ・データのNp個のオーディオ・チャネルを含む、態様1ないし9のうちいずれか一項記載の方法。
〔態様11〕
ソフトウェアが記憶されている非一時的な媒体であって、前記ソフトウェアは:
Nr個の入力オーディオ・チャネルを含む入力オーディオ信号を受領する段階であって、前記入力オーディオ信号は、第一の音場フォーマット分解能をもつ第一の音場フォーマットを表わし、Nrは2以上の整数である、段階と;
前記入力オーディオ・チャネルのうち二つ以上のチャネルの集合に第一の脱相関プロセスを適用して脱相関チャネルの第一の集合を生成する段階であって、前記第一の脱相関プロセスは、入力オーディオ・チャネルの前記集合のチャネル間相関を維持する、段階と;
脱相関チャネルの前記第一の集合に第一の変調プロセスを適用して、脱相関され変調された出力チャネルの第一の集合を生成する段階と;
脱相関され変調された出力チャネルの前記第一の集合を、二つ以上の脱相関されていない出力チャネルと組み合わせて、Np個の出力オーディオ・チャネルを含む出力オーディオ信号を生成する段階であって、Npは3以上の整数であり、前記出力チャネルは、前記第一の音場フォーマットより相対的に高い分解能の音場フォーマットである第二の音場フォーマットを表わし、前記脱相関されていない出力チャネルは、前記出力オーディオ信号の、より低い分解能の成分と一致し、前記脱相関され変調された出力チャネルは前記出力オーディオ信号の、より高い分解能の成分と一致する、段階と
を実行するよう一つまたは複数のデバイスを制御するための命令を含んでいる、非一時的な媒体。
〔態様12〕
前記変調プロセスは脱相関チャネルの前記第一の集合に線形行列を適用することに関わる、態様11記載の非一時的な媒体。
〔態様13〕
前記組み合わせることは、脱相関されて変調された出力チャネルの前記第一の集合をNr個の脱相関されていない出力チャネルと組み合わせることに関わる、態様11または12記載の非一時的な媒体。
〔態様14〕
前記第一の脱相関プロセスを適用することは、前記Nr個の入力オーディオ・チャネルのそれぞれに同一の脱相関プロセスを適用することに関わる、態様11ないし13のうちいずれか一項記載の非一時的な媒体。
〔態様15〕
前記ソフトウェアは:
前記入力オーディオ・チャネルのうち二つ以上のチャネルの前記集合に第二の脱相関プロセスを適用して、脱相関チャネルの第二の集合を生成する段階であって、前記第二の脱相関プロセスは、入力オーディオ・チャネルの前記集合のチャネル間相関を維持する、段階と;
脱相関チャネルの前記第二の集合に第二の変調プロセスを適用して、脱相関され変調された出力チャネルの第二の集合を生成する段階とを実行するための命令を含み、
前記組み合わせることは、脱相関され変調された出力チャネルの前記第二の集合を、脱相関され変調された出力チャネルの前記第一の集合および前記二つ以上の脱相関されていない出力チャネルと組み合わせることに関わる、
態様11ないし14のうちいずれか一項記載の非一時的な媒体。
〔態様16〕
前記第一の脱相関プロセスは第一の脱相関関数を含み、前記第二の脱相関プロセスは第二の脱相関関数を含み、前記第二の脱相関関数は前記第一の脱相関関数に約90度または約−90度の位相シフトを加えたものを含む、態様15記載の非一時的な媒体。
〔態様17〕
前記第一の変調プロセスは第一の変調関数を含み、前記第二の変調プロセスは第二の変調関数を含み、前記第二の変調関数は前記第一の変調関数に約90度または約−90度の位相シフトを加えたものを含む、態様15または16記載の非一時的な媒体。
〔態様18〕
インターフェース・システムおよび制御システムを有する装置であって、
前記制御システムは:
Nr個の入力オーディオ・チャネルを含む入力オーディオ信号を前記インターフェース・システムを介して受領する段階であって、前記入力オーディオ信号は、第一の音場フォーマット分解能をもつ第一の音場フォーマットを表わし、Nrは2以上の整数である、段階と;
前記入力オーディオ・チャネルのうち二つ以上のチャネルの集合に第一の脱相関プロセスを適用して脱相関チャネルの第一の集合を生成する段階であって、前記第一の脱相関プロセスは、入力オーディオ・チャネルの前記集合のチャネル間相関を維持する、段階と;
脱相関チャネルの前記第一の集合に第一の変調プロセスを適用して、脱相関され変調された出力チャネルの第一の集合を生成する段階と;
脱相関され変調された出力チャネルの前記第一の集合を、二つ以上の脱相関されていない出力チャネルと組み合わせて、Np個の出力オーディオ・チャネルを含む出力オーディオ信号を生成する段階であって、Npは3以上の整数であり、前記出力チャネルは、前記第一の音場フォーマットより相対的に高い分解能の音場フォーマットである第二の音場フォーマットを表わし、前記脱相関されていない出力チャネルは、前記出力オーディオ信号の、より低い分解能の成分と一致し、前記脱相関され変調された出力チャネルは前記出力オーディオ信号の、より高い分解能の成分と一致する、段階とを実行できる、
装置。
〔態様19〕
前記変調プロセスは脱相関チャネルの前記第一の集合に線形行列を適用することに関わる、態様18記載の装置。
〔態様20〕
前記組み合わせることは、脱相関されて変調された出力チャネルの前記第一の集合をNr個の脱相関されていない出力チャネルと組み合わせることに関わる、態様18または19記載の装置。
〔態様21〕
前記第一の脱相関プロセスを適用することは、前記Nr個の入力オーディオ・チャネルのそれぞれに同一の脱相関プロセスを適用することに関わる、態様18ないし20のうちいずれか一項記載の装置。
〔態様22〕
前記制御システムは:
前記入力オーディオ・チャネルのうち二つ以上のチャネルの前記集合に第二の脱相関プロセスを適用して、脱相関チャネルの第二の集合を生成する段階であって、前記第二の脱相関プロセスは、入力オーディオ・チャネルの前記集合のチャネル間相関を維持する、段階と;
脱相関チャネルの前記第二の集合に第二の変調プロセスを適用して、脱相関され変調された出力チャネルの第二の集合を生成する段階とをさらに実行でき、
前記組み合わせることは、脱相関され変調された出力チャネルの前記第二の集合を、脱相関され変調された出力チャネルの前記第一の集合および前記二つ以上の脱相関されていない出力チャネルと組み合わせることに関わる、
態様18ないし21のうちいずれか一項記載の装置。
〔態様23〕
前記第一の脱相関プロセスは第一の脱相関関数を含み、前記第二の脱相関プロセスは第二の脱相関関数を含み、前記第二の脱相関関数は前記第一の脱相関関数に約90度または約−90度の位相シフトを加えたものを含む、態様22記載の装置。
〔態様24〕
前記第一の変調プロセスは第一の変調関数を含み、前記第二の変調プロセスは第二の変調関数を含み、前記第二の変調関数は前記第一の変調関数に約90度または約−90度の位相シフトを加えたものを含む、態様22または23記載の装置。
〔態様25〕
インターフェース・システムおよび制御手段を有する装置であって、
前記制御手段は:
Nr個の入力オーディオ・チャネルを含む入力オーディオ信号を前記インターフェース・システムを介して受領する段階であって、前記入力オーディオ信号は、第一の音場フォーマット分解能をもつ第一の音場フォーマットを表わし、Nrは2以上の整数である、段階と;
前記入力オーディオ・チャネルのうち二つ以上のチャネルの集合に第一の脱相関プロセスを適用して脱相関チャネルの第一の集合を生成する段階であって、前記第一の脱相関プロセスは、入力オーディオ・チャネルの前記集合のチャネル間相関を維持する、段階と;
脱相関チャネルの前記第一の集合に第一の変調プロセスを適用して、脱相関され変調された出力チャネルの第一の集合を生成する段階と;
脱相関され変調された出力チャネルの前記第一の集合を、二つ以上の脱相関されていない出力チャネルと組み合わせて、Np個の出力オーディオ・チャネルを含む出力オーディオ信号を生成する段階であって、Npは3以上の整数であり、前記出力チャネルは、前記第一の音場フォーマットより相対的に高い分解能の音場フォーマットである第二の音場フォーマットを表わし、前記脱相関されていない出力チャネルは、前記出力オーディオ信号の、より低い分解能の成分と一致し、前記脱相関され変調された出力チャネルは前記出力オーディオ信号の、より高い分解能の成分と一致する、段階とを実行するための手段である、
装置。
〔態様26〕
前記変調プロセスは脱相関チャネルの前記第一の集合に線形行列を適用することに関わる、態様25記載の装置。
〔態様27〕
前記組み合わせることは、脱相関されて変調された出力チャネルの前記第一の集合をNr個の脱相関されていない出力チャネルと組み合わせることに関わる、態様25または26記載の装置。
〔態様28〕
前記第一の脱相関プロセスを適用することは、前記Nr個の入力オーディオ・チャネルのそれぞれに同一の脱相関プロセスを適用することに関わる、態様25ないし27のうちいずれか一項記載の装置。
〔態様29〕
前記制御手段は:
前記入力オーディオ・チャネルのうち二つ以上のチャネルの前記集合に第二の脱相関プロセスを適用して、脱相関チャネルの第二の集合を生成する段階であって、前記第二の脱相関プロセスは、入力オーディオ・チャネルの前記集合のチャネル間相関を維持する、段階と;
脱相関チャネルの前記第二の集合に第二の変調プロセスを適用して、脱相関され変調された出力チャネルの第二の集合を生成する段階とを実行するための手段を含み、
前記組み合わせることは、脱相関され変調された出力チャネルの前記第二の集合を、脱相関され変調された出力チャネルの前記第一の集合および前記二つ以上の脱相関されていない出力チャネルと組み合わせることに関わる、
態様25ないし28のうちいずれか一項記載の装置。
〔態様30〕
前記第一の脱相関プロセスは第一の脱相関関数を含み、前記第二の脱相関プロセスは第二の脱相関関数を含み、前記第二の脱相関関数は前記第一の脱相関関数に約90度または約−90度の位相シフトを加えたものを含む、態様29記載の装置。
〔態様31〕
前記第一の変調プロセスは第一の変調関数を含み、前記第二の変調プロセスは第二の変調関数を含み、前記第二の変調関数は前記第一の変調関数に約90度または約−90度の位相シフトを加えたものを含む、態様29または30記載の装置。
Claims (11)
- オーディオ信号を処理する方法であって、当該方法は:
Nr個の入力オーディオ・チャネルを含む入力オーディオ信号を受領する段階であって、前記入力オーディオ信号は、第一の音場フォーマット分解能をもつ第一の音場フォーマットを表わし、Nrは2以上の整数である、段階と;
前記入力オーディオ・チャネルのうち二つ以上のチャネルの集合に第一の脱相関プロセスを適用して脱相関チャネルの第一の集合を生成する段階であって、前記第一の脱相関プロセスは、入力オーディオ・チャネルの前記集合のチャネル間相関を維持する、段階と;
脱相関チャネルの前記第一の集合に第一の変調プロセスを適用して、脱相関され変調された出力チャネルの第一の集合を生成する段階と;
脱相関され変調された出力チャネルの前記第一の集合を、前記Nr個の入力オーディオ・チャネルから導出されたNr個の脱相関されていない出力チャネルと組み合わせて、Np個の出力オーディオ・チャネルを含む出力オーディオ信号を生成する段階であって、Npは3以上の整数である、段階とを含み、前記Np個の出力オーディオ・チャネルが、前記出力オーディオ信号の、より低い分解能の成分と一致する前記Nr個の脱相関されていない出力チャネルおよび前記出力オーディオ信号の、より高い分解能の成分と一致する前記脱相関され変調された出力チャネルを含み、
前記Nr個の脱相関されていない出力チャネルのうちの少なくとも一つは前記Nr個の入力オーディオ・チャネルにスケール因子を適用することによって導出されたものである
ことを特徴とする、
方法。 - 前記変調プロセスは脱相関チャネルの前記第一の集合に線形行列を適用することに関わる、請求項1記載の方法。
- 前記第一の脱相関プロセスを適用することは、前記Nr個の入力オーディオ・チャネルのそれぞれに同一の脱相関プロセスを適用することに関わる、請求項1または2記載の方法。
- 前記入力オーディオ・チャネルのうち二つ以上のチャネルの前記集合に第二の脱相関プロセスを適用して、脱相関チャネルの第二の集合を生成する段階であって、前記第二の脱相関プロセスは、入力オーディオ・チャネルの前記集合のチャネル間相関を維持する、段階と;
脱相関チャネルの前記第二の集合に第二の変調プロセスを適用して、脱相関され変調された出力チャネルの第二の集合を生成する段階とをさらに含み、
前記組み合わせることは、脱相関され変調された出力チャネルの前記第二の集合を、脱相関され変調された出力チャネルの前記第一の集合および前記二つ以上の脱相関されていない出力チャネルと組み合わせることに関わる、
請求項1ないし3のうちいずれか一項記載の方法。 - 前記第一の脱相関プロセスは第一の脱相関関数を含み、前記第二の脱相関プロセスは第二の脱相関関数を含み、前記第二の脱相関関数は前記第一の脱相関関数に約90度または約−90度の位相シフトを加えたものを含む、請求項4記載の方法。
- 前記第一の変調プロセスは第一の変調関数を含み、前記第二の変調プロセスは第二の変調関数を含み、前記第二の変調関数は前記第一の変調関数に約90度または約−90度の位相シフトを加えたものを含む、請求項4または5記載の方法。
- 前記脱相関されていない出力チャネルは、前記Nr個の入力オーディオ・チャネルに最小二乗フォーマット変換器を適用することによって生成される、請求項1ないし6のうちいずれか一項記載の方法。
- 前記入力オーディオ信号を受領する段階は、オーディオ方向制御論理プロセスから第一の出力を受領することに関わり、前記第一の出力は前記Nr個の入力オーディオ・チャネルを含み、当該方法はさらに、前記出力オーディオ信号の前記Np個のオーディオ・チャネルを、前記オーディオ方向制御論理プロセスからの第二の出力と組み合わせる段階を含み、前記第二の出力は、現在の優勢音方向に基づいて一つまたは複数のチャネルの利得が変更された、方向制御されたオーディオ・データのNp個のオーディオ・チャネルを含む、請求項1ないし7のうちいずれか一項記載の方法。
- 前記第一の音場フォーマットおよび前記第二の音場フォーマットがBフォーマットである、請求項1ないし8のうちいずれか一項記載の方法。
- 請求項1ないし9のうちいずれか一項記載の方法を実行するよう一つまたは複数のデバイスを制御するための命令を含むソフトウェアが記憶されている非一時的な媒体。
- インターフェース・システム;および
請求項1ないし9のうちいずれか一項記載の方法を実行できる制御システムを有する、
装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021128119A JP7321218B2 (ja) | 2015-03-03 | 2021-08-04 | 変調された脱相関による空間的オーディオ信号の向上 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562127613P | 2015-03-03 | 2015-03-03 | |
US62/127,613 | 2015-03-03 | ||
US201662298905P | 2016-02-23 | 2016-02-23 | |
US62/298,905 | 2016-02-23 | ||
JP2017542860A JP6576458B2 (ja) | 2015-03-03 | 2016-03-02 | 変調された脱相関による空間的オーディオ信号の向上 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017542860A Division JP6576458B2 (ja) | 2015-03-03 | 2016-03-02 | 変調された脱相関による空間的オーディオ信号の向上 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021128119A Division JP7321218B2 (ja) | 2015-03-03 | 2021-08-04 | 変調された脱相関による空間的オーディオ信号の向上 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020005278A true JP2020005278A (ja) | 2020-01-09 |
JP6926159B2 JP6926159B2 (ja) | 2021-08-25 |
Family
ID=55854783
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017542860A Active JP6576458B2 (ja) | 2015-03-03 | 2016-03-02 | 変調された脱相関による空間的オーディオ信号の向上 |
JP2019150274A Active JP6926159B2 (ja) | 2015-03-03 | 2019-08-20 | 変調された脱相関による空間的オーディオ信号の向上 |
JP2021128119A Active JP7321218B2 (ja) | 2015-03-03 | 2021-08-04 | 変調された脱相関による空間的オーディオ信号の向上 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017542860A Active JP6576458B2 (ja) | 2015-03-03 | 2016-03-02 | 変調された脱相関による空間的オーディオ信号の向上 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021128119A Active JP7321218B2 (ja) | 2015-03-03 | 2021-08-04 | 変調された脱相関による空間的オーディオ信号の向上 |
Country Status (6)
Country | Link |
---|---|
US (5) | US10210872B2 (ja) |
EP (3) | EP3266021B1 (ja) |
JP (3) | JP6576458B2 (ja) |
CN (2) | CN112002337B (ja) |
ES (1) | ES2922373T3 (ja) |
WO (1) | WO2016141023A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016141023A1 (en) | 2015-03-03 | 2016-09-09 | Dolby Laboratories Licensing Corporation | Enhancement of spatial audio signals by modulated decorrelation |
WO2016210174A1 (en) | 2015-06-25 | 2016-12-29 | Dolby Laboratories Licensing Corporation | Audio panning transformation system and method |
US10015618B1 (en) * | 2017-08-01 | 2018-07-03 | Google Llc | Incoherent idempotent ambisonics rendering |
SG11202007629UA (en) * | 2018-07-02 | 2020-09-29 | Dolby Laboratories Licensing Corp | Methods and devices for encoding and/or decoding immersive audio signals |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007043388A1 (ja) * | 2005-10-07 | 2007-04-19 | Matsushita Electric Industrial Co., Ltd. | 音響信号処理装置および音響信号処理方法 |
JP2008507184A (ja) * | 2004-07-14 | 2008-03-06 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオチャネル変換 |
JP2013517687A (ja) * | 2010-01-22 | 2013-05-16 | ドルビー ラボラトリーズ ライセンシング コーポレイション | マルチチャネル脱相関を使った改善されたマルチチャネル上方混合 |
US20160157039A1 (en) * | 2013-07-22 | 2016-06-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-Channel Decorrelator, Multi-Channel Audio Decoder, Multi-Channel Audio Encoder, Methods and Computer Program using a Premix of Decorrelator Input Signals |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11275696A (ja) * | 1998-01-22 | 1999-10-08 | Sony Corp | ヘッドホン、ヘッドホンアダプタおよびヘッドホン装置 |
KR100922910B1 (ko) * | 2001-03-27 | 2009-10-22 | 캠브리지 메카트로닉스 리미티드 | 사운드 필드를 생성하는 방법 및 장치 |
US8363865B1 (en) | 2004-05-24 | 2013-01-29 | Heather Bottum | Multiple channel sound system using multi-speaker arrays |
DE102005010057A1 (de) * | 2005-03-04 | 2006-09-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms |
CN101248483B (zh) * | 2005-07-19 | 2011-11-23 | 皇家飞利浦电子股份有限公司 | 多声道音频信号的生成 |
CN102395098B (zh) * | 2005-09-13 | 2015-01-28 | 皇家飞利浦电子股份有限公司 | 生成3d声音的方法和设备 |
US8515468B2 (en) | 2005-09-21 | 2013-08-20 | Buckyball Mobile Inc | Calculation of higher-order data from context data |
WO2007118583A1 (en) * | 2006-04-13 | 2007-10-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal decorrelator |
US9015051B2 (en) * | 2007-03-21 | 2015-04-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Reconstruction of audio channels with direction parameters indicating direction of origin |
ES2796552T3 (es) * | 2008-07-11 | 2020-11-27 | Fraunhofer Ges Forschung | Sintetizador de señales de audio y codificador de señales de audio |
EP2560161A1 (en) * | 2011-08-17 | 2013-02-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Optimal mixing matrices and usage of decorrelators in spatial audio processing |
CN103165136A (zh) * | 2011-12-15 | 2013-06-19 | 杜比实验室特许公司 | 音频处理方法及音频处理设备 |
EP2830336A3 (en) * | 2013-07-22 | 2015-03-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Renderer controlled spatial upmix |
KR102327504B1 (ko) * | 2013-07-31 | 2021-11-17 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 공간적으로 분산된 또는 큰 오디오 오브젝트들의 프로세싱 |
EP2980789A1 (en) * | 2014-07-30 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for enhancing an audio signal, sound enhancing system |
WO2016141023A1 (en) | 2015-03-03 | 2016-09-09 | Dolby Laboratories Licensing Corporation | Enhancement of spatial audio signals by modulated decorrelation |
-
2016
- 2016-03-02 WO PCT/US2016/020380 patent/WO2016141023A1/en active Application Filing
- 2016-03-02 EP EP16718934.9A patent/EP3266021B1/en active Active
- 2016-03-02 ES ES19172220T patent/ES2922373T3/es active Active
- 2016-03-02 US US15/546,258 patent/US10210872B2/en active Active
- 2016-03-02 CN CN202010914886.6A patent/CN112002337B/zh active Active
- 2016-03-02 JP JP2017542860A patent/JP6576458B2/ja active Active
- 2016-03-02 EP EP19172220.6A patent/EP3611727B1/en active Active
- 2016-03-02 EP EP22170424.0A patent/EP4123643B1/en active Active
- 2016-03-02 CN CN201680011460.1A patent/CN107430861B/zh active Active
-
2019
- 2019-02-14 US US16/276,397 patent/US10593338B2/en active Active
- 2019-08-20 JP JP2019150274A patent/JP6926159B2/ja active Active
-
2020
- 2020-03-11 US US16/816,189 patent/US11081119B2/en active Active
-
2021
- 2021-08-02 US US17/392,172 patent/US11562750B2/en active Active
- 2021-08-04 JP JP2021128119A patent/JP7321218B2/ja active Active
-
2023
- 2023-01-23 US US18/158,032 patent/US20230230600A1/en not_active Abandoned
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008507184A (ja) * | 2004-07-14 | 2008-03-06 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオチャネル変換 |
WO2007043388A1 (ja) * | 2005-10-07 | 2007-04-19 | Matsushita Electric Industrial Co., Ltd. | 音響信号処理装置および音響信号処理方法 |
JP2013517687A (ja) * | 2010-01-22 | 2013-05-16 | ドルビー ラボラトリーズ ライセンシング コーポレイション | マルチチャネル脱相関を使った改善されたマルチチャネル上方混合 |
US20160157039A1 (en) * | 2013-07-22 | 2016-06-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-Channel Decorrelator, Multi-Channel Audio Decoder, Multi-Channel Audio Encoder, Methods and Computer Program using a Premix of Decorrelator Input Signals |
Also Published As
Publication number | Publication date |
---|---|
JP2018511213A (ja) | 2018-04-19 |
EP3266021A1 (en) | 2018-01-10 |
US20220028400A1 (en) | 2022-01-27 |
US20200273469A1 (en) | 2020-08-27 |
US20230230600A1 (en) | 2023-07-20 |
CN112002337B (zh) | 2024-08-09 |
EP3611727B1 (en) | 2022-05-04 |
JP2021177668A (ja) | 2021-11-11 |
WO2016141023A1 (en) | 2016-09-09 |
EP4123643A1 (en) | 2023-01-25 |
EP4123643B1 (en) | 2024-06-19 |
US20190180760A1 (en) | 2019-06-13 |
US10593338B2 (en) | 2020-03-17 |
EP3266021B1 (en) | 2019-05-08 |
CN107430861B (zh) | 2020-10-16 |
CN107430861A (zh) | 2017-12-01 |
US11081119B2 (en) | 2021-08-03 |
US20180018977A1 (en) | 2018-01-18 |
JP7321218B2 (ja) | 2023-08-04 |
ES2922373T3 (es) | 2022-09-14 |
US10210872B2 (en) | 2019-02-19 |
JP6576458B2 (ja) | 2019-09-18 |
CN112002337A (zh) | 2020-11-27 |
EP3611727A1 (en) | 2020-02-19 |
US11562750B2 (en) | 2023-01-24 |
JP6926159B2 (ja) | 2021-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6926159B2 (ja) | 変調された脱相関による空間的オーディオ信号の向上 | |
CN109891502B (zh) | 一种近场双耳渲染方法、系统及可读存储介质 | |
US9402144B2 (en) | Apparatus for changing an audio scene and an apparatus for generating a directional function | |
AU2022291443A1 (en) | Method for and apparatus for decoding an ambisonics audio soundfield representation for audio playback using 2D setups | |
US8175280B2 (en) | Generation of spatial downmixes from parametric representations of multi channel signals | |
US8488796B2 (en) | 3D audio renderer | |
WO2015089468A2 (en) | Apparatus and method for sound stage enhancement | |
KR102007991B1 (ko) | 다채널 오디오 신호의 바이노럴 렌더링 방법 및 장치 | |
BR112017014288B1 (pt) | Aparelho e método de processamento de sinal de áudio | |
KR101637407B1 (ko) | 부가적인 출력 채널들을 제공하기 위하여 스테레오 출력 신호를 발생시키기 위한 장치와 방법 및 컴퓨터 프로그램 | |
JP6629739B2 (ja) | 音声処理装置 | |
Bu et al. | The design of Ambisonic reproduction system based on dynamic gain parameters |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190820 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200925 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201006 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210104 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210706 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210804 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6926159 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |