JP2020519950A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2020519950A5 JP2020519950A5 JP2019561833A JP2019561833A JP2020519950A5 JP 2020519950 A5 JP2020519950 A5 JP 2020519950A5 JP 2019561833 A JP2019561833 A JP 2019561833A JP 2019561833 A JP2019561833 A JP 2019561833A JP 2020519950 A5 JP2020519950 A5 JP 2020519950A5
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- object position
- spatial
- frequency subband
- input audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 claims description 62
- 239000011159 matrix material Substances 0.000 claims description 21
- 230000001419 dependent Effects 0.000 claims description 3
- 230000002238 attenuated Effects 0.000 claims description 2
- 238000004091 panning Methods 0.000 claims description 2
- 201000005804 Eastern equine encephalitis Diseases 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
Description
第12のEEEは、マルチチャネルの空間的オーディオ・フォーマットの入力信号を処理するための装置に関する。本装置は、受領された空間的オーディオ・フォーマットの入力信号に基づいてオブジェクト位置メタデータを決定するプロセッサと、受領された空間的オーディオ・フォーマットの入力信号に基づいてオブジェクト・オーディオ信号を抽出する抽出器とを備える。受領された空間的オーディオ・フォーマットの入力信号に基づいてオブジェクト・オーディオ信号を抽出することは、オブジェクト・オーディオ信号および残差オーディオ信号を決定することを含む。
いくつかの態様を記載しておく。
〔態様1〕
マルチチャネルの空間的フォーマットの入力オーディオ信号を処理する方法であって:
前記入力オーディオ信号に基づいてオブジェクト位置を決定し;
決定されたオブジェクト位置に基づいて、前記入力オーディオ信号からオブジェクト・オーディオ信号を抽出することを含み、
前記オブジェクト位置を決定することは、いくつかの周波数サブバンドのそれぞれについて、一つまたは複数の音到来方向を決定することを含む、
方法。
〔態様2〕
前記決定されたオブジェクト位置に基づいて、前記入力オーディオ信号からオブジェクト・オーディオ信号を抽出することは:
前記入力オーディオ信号の前記いくつかの周波数サブバンドの各周波数サブバンドについて、各オブジェクト位置について、その周波数サブバンドおよびそのオブジェクト位置についての混合利得を決定し;
前記いくつかの周波数サブバンドの各周波数サブバンドについて、各オブジェクト位置について、前記入力オーディオ信号、その周波数サブバンドおよびそのオブジェクト位置についての前記混合利得、およびその空間的フォーマットの空間的マッピング関数に基づいて、周波数サブバンド出力信号を生成し;
各オブジェクト位置について、そのオブジェクト位置についての前記周波数サブバンド出力信号を足し合わせることによって出力信号を生成することを含む、
態様1記載の方法。
〔態様3〕
前記オブジェクト位置についての前記混合利得は、周波数依存である、態様2記載の方法。
〔態様4〕
前記空間的フォーマットが複数のチャネルを定義し;
前記空間的マッピング関数は、前記空間的フォーマットの前記複数のチャネルから所与の位置におけるオーディオ信号を抽出するための、その空間的フォーマットの空間的デコード関数である、
態様2または3記載の方法。
〔態様5〕
前記空間的フォーマットの空間的パン関数は、ソース位置におけるソース信号を、前記空間的フォーマットによって定義される前記複数のチャネルにマッピングするための関数であり、
前記空間的デコード関数は、前記空間的パン関数および前記空間的デコード関数の相続く適用が、単位球上のすべての位置について1の利得を与えるように定義される、
態様4記載の方法。
〔態様6〕
所与の周波数サブバンドおよび所与のオブジェクト位置について前記混合利得を決定することは、その所与のオブジェクト位置と、その所与の周波数サブバンドにおける前記入力オーディオ信号の共分散行列とに基づく、態様2記載の方法。
〔態様7〕
前記所与の周波数サブバンドおよび前記所与のオブジェクト位置についての前記混合利得は、前記所与の周波数サブバンドにおける前記入力オーディオ信号についてのステアリング関数を、前記所与のオブジェクト位置において評価したものに依存する、態様6記載の方法。
〔態様8〕
前記ステアリング関数は、前記所与の周波数サブバンドにおける前記入力オーディオ信号の共分散行列に基づく、態様7記載の方法。
〔態様9〕
前記所与の周波数サブバンドおよび前記所与のオブジェクト位置についての前記混合利得を決定することは、前記所与のオブジェクト位置の時間を追った変化率にさらに基づき、前記混合利得は、前記所与のオブジェクト位置の変化率に依存して減衰させられる、態様6ないし8のうちいずれか一項記載の方法。
〔態様10〕
各周波数サブバンドについて、各オブジェクト位置について、周波数サブバンド出力信号を生成することは:
利得行列および空間的デコード行列を前記入力オーディオ信号に適用することを含み、前記利得行列は、その周波数サブバンドについての決定された混合利得を含み、
前記空間的デコード行列は、各オブジェクト位置について一つで、複数のマッピング・ベクトルを含み、各マッピング・ベクトルは、それぞれのオブジェクト位置で前記空間的デコード関数を評価することによって得られる、
態様2記載の方法。
〔態様11〕
前記複数の出力信号を前記空間的フォーマットに再エンコードして、マルチチャネルの空間的フォーマットのオーディオ・オブジェクト信号を得て;
前記入力オーディオ信号から該オーディオ・オブジェクト信号を減算して、マルチチャネルの空間的フォーマットの残差オーディオ信号を得ることをさらに含む、
態様1記載の方法。
〔態様12〕
前記残差オーディオ信号にダウンミックスを適用して、ダウンミックスされた残差オーディオ信号を得ることをさらに含み、前記ダウンミックスされた残差オーディオ信号のチャネル数は、前記入力オーディオ信号のチャネル数より少ない、
態様11記載の方法。
〔態様13〕
前記オブジェクト位置を決定することはさらに:
前記いくつかの周波数サブバンドについての優勢な音到来方向の諸集合の和集合を決定し;
前記和集合に対してクラスタリング・アルゴリズムを適用して、前記複数のオブジェクト位置を決定することを含む、
態様1記載の方法。
〔態様14〕
音到来の優勢方向の前記集合を決定することは:
その周波数サブバンド内の前記入力オーディオ信号の共分散行列から諸要素を抽出することと;
その周波数サブバンド内の前記オーディオ入力信号の投影関数の極大を決定することであって、前記投影関数は、前記オーディオ入力信号の前記共分散行列および前記空間的フォーマットの空間的パン関数に基づく、こととのうちの少なくとも一方に関わる、
態様13記載の方法。
〔態様15〕
各優勢方向は、関連する重みをもち;
前記クラスタリング・アルゴリズムは、前記優勢方向の重み付けされたクラスタリングを実行する、
態様13または14記載の方法。
〔態様16〕
前記クラスタリング・アルゴリズムは:k平均アルゴリズム、重み付けされたk平均アルゴリズム、期待値最大化アルゴリズム、および重み付けされた平均アルゴリズムのうちの一つである、
態様13ないし15のうちいずれか一項記載の方法。
〔態様17〕
前記オブジェクト位置を示すオブジェクト位置メタデータを生成することをさらに含む、
態様1ないし16のうちいずれか一項記載の方法。
〔態様18〕
前記オブジェクト・オーディオ信号は、受領された空間的オーディオ・フォーマットの入力信号の前記いくつかのサブバンドの各サブバンドにおいて線形混合行列に基づいて決定される、態様1ないし17のうちいずれか一項記載の方法。
〔態様19〕
行列係数はそれぞれの周波数帯域ごとに異なる、態様18記載の方法。
〔態様20〕
オブジェクト・オーディオ信号を抽出することは、前記入力オーディオ信号から前記オブジェクト・オーディオ信号の寄与を差し引くことによって決定される、態様1ないし19のうちいずれか一項記載の方法。
〔態様21〕
マルチチャネルの空間的フォーマットの入力オーディオ信号を処理するための装置であって、当該装置は:
前記入力オーディオ信号を解析して、前記入力オーディオ信号に含まれるオーディオ・オブジェクトの複数のオブジェクト位置を決定する段階であって、該解析することは、いくつかの周波数サブバンドの各周波数サブバンドについて、一つまたは複数の優勢な音到来方向を決定することを含む、段階と;
前記入力オーディオ信号の前記いくつかの周波数サブバンドの各周波数サブバンドについて、各オブジェクト位置について、その周波数サブバンドおよびそのオブジェクト位置についての混合利得を決定する段階と;
前記いくつかの周波数サブバンドの各周波数サブバンドについて、各オブジェクト位置について、前記入力オーディオ信号、その周波数サブバンドおよびそのオブジェクト位置についての前記混合利得、およびその空間的フォーマットの空間的マッピング関数に基づいて、周波数サブバンド出力信号を生成する段階と;
各オブジェクト位置について、そのオブジェクト位置についての前記周波数サブバンド出力信号を足し合わせることによって出力信号を生成する段階とを実行するよう適応されたプロセッサを有する、
装置。
いくつかの態様を記載しておく。
〔態様1〕
マルチチャネルの空間的フォーマットの入力オーディオ信号を処理する方法であって:
前記入力オーディオ信号に基づいてオブジェクト位置を決定し;
決定されたオブジェクト位置に基づいて、前記入力オーディオ信号からオブジェクト・オーディオ信号を抽出することを含み、
前記オブジェクト位置を決定することは、いくつかの周波数サブバンドのそれぞれについて、一つまたは複数の音到来方向を決定することを含む、
方法。
〔態様2〕
前記決定されたオブジェクト位置に基づいて、前記入力オーディオ信号からオブジェクト・オーディオ信号を抽出することは:
前記入力オーディオ信号の前記いくつかの周波数サブバンドの各周波数サブバンドについて、各オブジェクト位置について、その周波数サブバンドおよびそのオブジェクト位置についての混合利得を決定し;
前記いくつかの周波数サブバンドの各周波数サブバンドについて、各オブジェクト位置について、前記入力オーディオ信号、その周波数サブバンドおよびそのオブジェクト位置についての前記混合利得、およびその空間的フォーマットの空間的マッピング関数に基づいて、周波数サブバンド出力信号を生成し;
各オブジェクト位置について、そのオブジェクト位置についての前記周波数サブバンド出力信号を足し合わせることによって出力信号を生成することを含む、
態様1記載の方法。
〔態様3〕
前記オブジェクト位置についての前記混合利得は、周波数依存である、態様2記載の方法。
〔態様4〕
前記空間的フォーマットが複数のチャネルを定義し;
前記空間的マッピング関数は、前記空間的フォーマットの前記複数のチャネルから所与の位置におけるオーディオ信号を抽出するための、その空間的フォーマットの空間的デコード関数である、
態様2または3記載の方法。
〔態様5〕
前記空間的フォーマットの空間的パン関数は、ソース位置におけるソース信号を、前記空間的フォーマットによって定義される前記複数のチャネルにマッピングするための関数であり、
前記空間的デコード関数は、前記空間的パン関数および前記空間的デコード関数の相続く適用が、単位球上のすべての位置について1の利得を与えるように定義される、
態様4記載の方法。
〔態様6〕
所与の周波数サブバンドおよび所与のオブジェクト位置について前記混合利得を決定することは、その所与のオブジェクト位置と、その所与の周波数サブバンドにおける前記入力オーディオ信号の共分散行列とに基づく、態様2記載の方法。
〔態様7〕
前記所与の周波数サブバンドおよび前記所与のオブジェクト位置についての前記混合利得は、前記所与の周波数サブバンドにおける前記入力オーディオ信号についてのステアリング関数を、前記所与のオブジェクト位置において評価したものに依存する、態様6記載の方法。
〔態様8〕
前記ステアリング関数は、前記所与の周波数サブバンドにおける前記入力オーディオ信号の共分散行列に基づく、態様7記載の方法。
〔態様9〕
前記所与の周波数サブバンドおよび前記所与のオブジェクト位置についての前記混合利得を決定することは、前記所与のオブジェクト位置の時間を追った変化率にさらに基づき、前記混合利得は、前記所与のオブジェクト位置の変化率に依存して減衰させられる、態様6ないし8のうちいずれか一項記載の方法。
〔態様10〕
各周波数サブバンドについて、各オブジェクト位置について、周波数サブバンド出力信号を生成することは:
利得行列および空間的デコード行列を前記入力オーディオ信号に適用することを含み、前記利得行列は、その周波数サブバンドについての決定された混合利得を含み、
前記空間的デコード行列は、各オブジェクト位置について一つで、複数のマッピング・ベクトルを含み、各マッピング・ベクトルは、それぞれのオブジェクト位置で前記空間的デコード関数を評価することによって得られる、
態様2記載の方法。
〔態様11〕
前記複数の出力信号を前記空間的フォーマットに再エンコードして、マルチチャネルの空間的フォーマットのオーディオ・オブジェクト信号を得て;
前記入力オーディオ信号から該オーディオ・オブジェクト信号を減算して、マルチチャネルの空間的フォーマットの残差オーディオ信号を得ることをさらに含む、
態様1記載の方法。
〔態様12〕
前記残差オーディオ信号にダウンミックスを適用して、ダウンミックスされた残差オーディオ信号を得ることをさらに含み、前記ダウンミックスされた残差オーディオ信号のチャネル数は、前記入力オーディオ信号のチャネル数より少ない、
態様11記載の方法。
〔態様13〕
前記オブジェクト位置を決定することはさらに:
前記いくつかの周波数サブバンドについての優勢な音到来方向の諸集合の和集合を決定し;
前記和集合に対してクラスタリング・アルゴリズムを適用して、前記複数のオブジェクト位置を決定することを含む、
態様1記載の方法。
〔態様14〕
音到来の優勢方向の前記集合を決定することは:
その周波数サブバンド内の前記入力オーディオ信号の共分散行列から諸要素を抽出することと;
その周波数サブバンド内の前記オーディオ入力信号の投影関数の極大を決定することであって、前記投影関数は、前記オーディオ入力信号の前記共分散行列および前記空間的フォーマットの空間的パン関数に基づく、こととのうちの少なくとも一方に関わる、
態様13記載の方法。
〔態様15〕
各優勢方向は、関連する重みをもち;
前記クラスタリング・アルゴリズムは、前記優勢方向の重み付けされたクラスタリングを実行する、
態様13または14記載の方法。
〔態様16〕
前記クラスタリング・アルゴリズムは:k平均アルゴリズム、重み付けされたk平均アルゴリズム、期待値最大化アルゴリズム、および重み付けされた平均アルゴリズムのうちの一つである、
態様13ないし15のうちいずれか一項記載の方法。
〔態様17〕
前記オブジェクト位置を示すオブジェクト位置メタデータを生成することをさらに含む、
態様1ないし16のうちいずれか一項記載の方法。
〔態様18〕
前記オブジェクト・オーディオ信号は、受領された空間的オーディオ・フォーマットの入力信号の前記いくつかのサブバンドの各サブバンドにおいて線形混合行列に基づいて決定される、態様1ないし17のうちいずれか一項記載の方法。
〔態様19〕
行列係数はそれぞれの周波数帯域ごとに異なる、態様18記載の方法。
〔態様20〕
オブジェクト・オーディオ信号を抽出することは、前記入力オーディオ信号から前記オブジェクト・オーディオ信号の寄与を差し引くことによって決定される、態様1ないし19のうちいずれか一項記載の方法。
〔態様21〕
マルチチャネルの空間的フォーマットの入力オーディオ信号を処理するための装置であって、当該装置は:
前記入力オーディオ信号を解析して、前記入力オーディオ信号に含まれるオーディオ・オブジェクトの複数のオブジェクト位置を決定する段階であって、該解析することは、いくつかの周波数サブバンドの各周波数サブバンドについて、一つまたは複数の優勢な音到来方向を決定することを含む、段階と;
前記入力オーディオ信号の前記いくつかの周波数サブバンドの各周波数サブバンドについて、各オブジェクト位置について、その周波数サブバンドおよびそのオブジェクト位置についての混合利得を決定する段階と;
前記いくつかの周波数サブバンドの各周波数サブバンドについて、各オブジェクト位置について、前記入力オーディオ信号、その周波数サブバンドおよびそのオブジェクト位置についての前記混合利得、およびその空間的フォーマットの空間的マッピング関数に基づいて、周波数サブバンド出力信号を生成する段階と;
各オブジェクト位置について、そのオブジェクト位置についての前記周波数サブバンド出力信号を足し合わせることによって出力信号を生成する段階とを実行するよう適応されたプロセッサを有する、
装置。
Claims (17)
- マルチチャネルの空間的フォーマットの入力オーディオ信号を処理する方法であって、前記空間的フォーマットは高次アンビソニックスまたはBフォーマットの一方であり、複数のチャネルを定義し、当該方法は:
前記入力オーディオ信号に基づいてオブジェクト位置を決定し;
決定されたオブジェクト位置に基づいて、前記入力オーディオ信号からオブジェクト・オーディオ信号を抽出することを含み、
前記オブジェクト位置を決定することは、いくつかの周波数サブバンドのそれぞれについて、一つまたは複数の音到来方向を決定することを含み、
前記決定されたオブジェクト位置に基づいて、前記入力オーディオ信号からオブジェクト・オーディオ信号を抽出することは:
前記入力オーディオ信号の前記いくつかの周波数サブバンドの各周波数サブバンドについて、各オブジェクト位置について、その周波数サブバンドおよびそのオブジェクト位置についての混合利得を決定する段階と;
前記いくつかの周波数サブバンドの各周波数サブバンドについて、各オブジェクト位置について、前記入力オーディオ信号、その周波数サブバンドおよびそのオブジェクト位置についての前記混合利得、およびその空間的フォーマットの空間的マッピング関数に基づいて、周波数サブバンド出力信号を生成する段階であって、前記空間的マッピング関数は、前記空間的フォーマットの前記複数のチャネルから所与の位置におけるオーディオ信号を抽出するための、その空間的フォーマットの空間的デコード関数である、段階と;
各オブジェクト位置について、そのオブジェクト位置についての前記周波数サブバンド出力信号を足し合わせることによって出力信号を生成する段階とを含む、
方法。 - 前記オブジェクト位置についての前記混合利得は、周波数依存である、請求項1記載の方法。
- 前記空間的フォーマットの空間的パン関数は、ソース位置におけるソース信号を、前記空間的フォーマットによって定義される前記複数のチャネルにマッピングするための関数であり、
前記空間的デコード関数は、前記空間的パン関数および前記空間的デコード関数の相続く適用が、単位球上のすべての位置について1の利得を与えるように定義される、
請求項1記載の方法。 - 所与の周波数サブバンドおよび所与のオブジェクト位置について前記混合利得を決定することは、その所与のオブジェクト位置と、前記所与の周波数サブバンドにおける前記入力オーディオ信号についてのステアリング関数を、前記所与のオブジェクト位置において評価したものとに基づき、前記ステアリング関数は、前記所与の周波数サブバンドにおける前記入力オーディオ信号の前記複数のチャネルの共分散行列に基づく、請求項1記載の方法。
- 前記所与の周波数サブバンドおよび前記所与のオブジェクト位置についての前記混合利得を決定することは、前記所与のオブジェクト位置の時間を追った変化率にさらに基づき、前記混合利得は、前記所与のオブジェクト位置の変化率に依存して減衰させられる、請求項4記載の方法。
- 各周波数サブバンドについて、各オブジェクト位置について、周波数サブバンド出力信号を生成することは:
利得行列および空間的デコード行列を前記入力オーディオ信号に適用することを含み、前記利得行列は、その周波数サブバンドについての決定された混合利得を含み、
前記空間的デコード行列は、各オブジェクト位置について一つで、複数のマッピング・ベクトルを含み、各マッピング・ベクトルは、それぞれのオブジェクト位置で前記空間的デコード関数を評価することによって得られる、
請求項1記載の方法。 - 前記複数の出力信号を前記空間的フォーマットに再エンコードして、マルチチャネルの空間的フォーマットのオーディオ・オブジェクト信号を得て;
前記入力オーディオ信号から該オーディオ・オブジェクト信号を減算して、マルチチャネルの空間的フォーマットの残差オーディオ信号を得ることをさらに含む、
請求項1記載の方法。 - 前記残差オーディオ信号にダウンミックスを適用して、ダウンミックスされた残差オーディオ信号を得ることをさらに含み、前記ダウンミックスされた残差オーディオ信号のチャネル数は、前記入力オーディオ信号のチャネル数より少ない、
請求項7記載の方法。 - 前記オブジェクト位置を決定することはさらに:
前記いくつかの周波数サブバンドについての優勢な音到来方向の諸集合の和集合を決定し;
前記和集合に対してクラスタリング・アルゴリズムを適用して、前記複数のオブジェクト位置を決定することを含む、
請求項1記載の方法。 - 音到来の優勢方向の前記集合を決定することは:
その周波数サブバンド内の前記入力オーディオ信号の共分散行列から諸要素を抽出することと;
その周波数サブバンド内の前記オーディオ入力信号の投影関数の極大を決定することであって、前記投影関数は、前記オーディオ入力信号の前記共分散行列および前記空間的フォーマットの空間的パン関数に基づく、こととのうちの少なくとも一方に関わる、
請求項9記載の方法。 - 各優勢方向は、関連する重みをもち;
前記クラスタリング・アルゴリズムは、前記優勢方向の重み付けされたクラスタリングを実行する、
請求項9または10記載の方法。 - 前記クラスタリング・アルゴリズムは:k平均アルゴリズム、重み付けされたk平均アルゴリズム、期待値最大化アルゴリズム、および重み付けされた平均アルゴリズムのうちの一つである、
請求項9ないし11のうちいずれか一項記載の方法。 - 前記オブジェクト位置を示すオブジェクト位置メタデータを生成することをさらに含む、
請求項1ないし12のうちいずれか一項記載の方法。 - 前記オブジェクト・オーディオ信号は、受領された空間的フォーマットの入力信号の前記いくつかのサブバンドの各サブバンドにおいて線形混合行列に基づいて決定される、請求項1ないし13のうちいずれか一項記載の方法。
- 行列係数はそれぞれの周波数帯域ごとに異なる、請求項14記載の方法。
- オブジェクト・オーディオ信号を抽出することは、前記入力オーディオ信号から前記オブジェクト・オーディオ信号の寄与を差し引くことによって決定される、請求項1ないし15のうちいずれか一項記載の方法。
- マルチチャネルの空間的フォーマットの入力オーディオ信号を処理するための装置であって、前記空間的フォーマットは高次アンビソニックスまたはBフォーマットの一方であり、複数のチャネルを定義し、当該装置は:
前記入力オーディオ信号を解析して、前記入力オーディオ信号に含まれるオーディオ・オブジェクトの複数のオブジェクト位置を決定する段階であって、該解析することは、いくつかの周波数サブバンドの各周波数サブバンドについて、一つまたは複数の優勢な音到来方向を決定することを含む、段階と;
前記入力オーディオ信号の前記いくつかの周波数サブバンドの各周波数サブバンドについて、各オブジェクト位置について、その周波数サブバンドおよびそのオブジェクト位置についての混合利得を決定する段階と;
前記いくつかの周波数サブバンドの各周波数サブバンドについて、各オブジェクト位置について、前記入力オーディオ信号、その周波数サブバンドおよびそのオブジェクト位置についての前記混合利得、およびその空間的フォーマットの空間的マッピング関数に基づいて、周波数サブバンド出力信号を生成する段階であって、前記空間的マッピング関数は、前記空間的フォーマットの前記複数のチャネルから所与の位置におけるオーディオ信号を抽出するための、その空間的フォーマットの空間的デコード関数である、段階と;
各オブジェクト位置について、そのオブジェクト位置についての前記周波数サブバンド出力信号を足し合わせることによって出力信号を生成する段階とを実行するよう適応されたプロセッサを有する、
装置。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762503657P | 2017-05-09 | 2017-05-09 | |
US62/503,657 | 2017-05-09 | ||
EP17179315.1 | 2017-07-03 | ||
EP17179315 | 2017-07-03 | ||
US201762598068P | 2017-12-13 | 2017-12-13 | |
US62/598,068 | 2017-12-13 | ||
PCT/US2018/030680 WO2018208560A1 (en) | 2017-05-09 | 2018-05-02 | Processing of a multi-channel spatial audio format input signal |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2020519950A JP2020519950A (ja) | 2020-07-02 |
JP2020519950A5 true JP2020519950A5 (ja) | 2021-07-26 |
JP7224302B2 JP7224302B2 (ja) | 2023-02-17 |
Family
ID=62111278
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019561833A Active JP7224302B2 (ja) | 2017-05-09 | 2018-05-02 | マルチチャネル空間的オーディオ・フォーマット入力信号の処理 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10893373B2 (ja) |
EP (1) | EP3622509B1 (ja) |
JP (1) | JP7224302B2 (ja) |
CN (1) | CN110800048B (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021013346A1 (en) * | 2019-07-24 | 2021-01-28 | Huawei Technologies Co., Ltd. | Apparatus for determining spatial positions of multiple audio sources |
US11750745B2 (en) * | 2020-11-18 | 2023-09-05 | Kelly Properties, Llc | Processing and distribution of audio signals in a multi-party conferencing environment |
US11930348B2 (en) * | 2020-11-24 | 2024-03-12 | Naver Corporation | Computer system for realizing customized being-there in association with audio and method thereof |
KR102505249B1 (ko) * | 2020-11-24 | 2023-03-03 | 네이버 주식회사 | 사용자 맞춤형 현장감 실현을 위한 오디오 콘텐츠를 전송하는 컴퓨터 시스템 및 그의 방법 |
JP2022083445A (ja) * | 2020-11-24 | 2022-06-03 | ネイバー コーポレーション | ユーザカスタム型臨場感を実現するためのオーディオコンテンツを製作するコンピュータシステムおよびその方法 |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8204261B2 (en) * | 2004-10-20 | 2012-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
EP1691348A1 (en) * | 2005-02-14 | 2006-08-16 | Ecole Polytechnique Federale De Lausanne | Parametric joint-coding of audio sources |
EP1761110A1 (en) * | 2005-09-02 | 2007-03-07 | Ecole Polytechnique Fédérale de Lausanne | Method to generate multi-channel audio signals from stereo signals |
US8705747B2 (en) * | 2005-12-08 | 2014-04-22 | Electronics And Telecommunications Research Institute | Object-based 3-dimensional audio service system using preset audio scenes |
CN103137132B (zh) * | 2006-12-27 | 2016-09-07 | 韩国电子通信研究院 | 用于编码多对象音频信号的设备 |
CN101889307B (zh) * | 2007-10-04 | 2013-01-23 | 创新科技有限公司 | 相位-幅度3d立体声编码器和解码器 |
US8705749B2 (en) * | 2008-08-14 | 2014-04-22 | Dolby Laboratories Licensing Corporation | Audio signal transformatting |
EP2249334A1 (en) | 2009-05-08 | 2010-11-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio format transcoder |
PL2285139T3 (pl) * | 2009-06-25 | 2020-03-31 | Dts Licensing Limited | Urządzenie i sposób konwersji przestrzennego sygnału audio |
US8219394B2 (en) * | 2010-01-20 | 2012-07-10 | Microsoft Corporation | Adaptive ambient sound suppression and speech tracking |
EP2469741A1 (en) | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
EP2817802B1 (en) * | 2012-02-24 | 2016-12-07 | Dolby International AB | Audio processing |
WO2014013070A1 (en) | 2012-07-19 | 2014-01-23 | Thomson Licensing | Method and device for improving the rendering of multi-channel audio signals |
US9479886B2 (en) * | 2012-07-20 | 2016-10-25 | Qualcomm Incorporated | Scalable downmix design with feedback for object-based surround codec |
MY176406A (en) | 2012-08-10 | 2020-08-06 | Fraunhofer Ges Forschung | Encoder, decoder, system and method employing a residual concept for parametric audio object coding |
EP2738962A1 (en) | 2012-11-29 | 2014-06-04 | Thomson Licensing | Method and apparatus for determining dominant sound source directions in a higher order ambisonics representation of a sound field |
EP2765791A1 (en) | 2013-02-08 | 2014-08-13 | Thomson Licensing | Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field |
GB2515089A (en) | 2013-06-14 | 2014-12-17 | Nokia Corp | Audio Processing |
GB2517690B (en) * | 2013-08-26 | 2017-02-08 | Canon Kk | Method and device for localizing sound sources placed within a sound environment comprising ambient noise |
EP2866227A1 (en) * | 2013-10-22 | 2015-04-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
CN104683933A (zh) | 2013-11-29 | 2015-06-03 | 杜比实验室特许公司 | 音频对象提取 |
US10492014B2 (en) * | 2014-01-09 | 2019-11-26 | Dolby Laboratories Licensing Corporation | Spatial error metrics of audio content |
JP6374980B2 (ja) | 2014-03-26 | 2018-08-15 | パナソニック株式会社 | サラウンドオーディオ信号処理のための装置及び方法 |
US9847087B2 (en) | 2014-05-16 | 2017-12-19 | Qualcomm Incorporated | Higher order ambisonics signal compression |
US9838819B2 (en) | 2014-07-02 | 2017-12-05 | Qualcomm Incorporated | Reducing correlation between higher order ambisonic (HOA) background channels |
EP2963948A1 (en) | 2014-07-02 | 2016-01-06 | Thomson Licensing | Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a HOA signal representation |
EP2963949A1 (en) | 2014-07-02 | 2016-01-06 | Thomson Licensing | Method and apparatus for decoding a compressed HOA representation, and method and apparatus for encoding a compressed HOA representation |
EP3164868A1 (en) | 2014-07-02 | 2017-05-10 | Dolby International AB | Method and apparatus for decoding a compressed hoa representation, and method and apparatus for encoding a compressed hoa representation |
CN105336335B (zh) * | 2014-07-25 | 2020-12-08 | 杜比实验室特许公司 | 利用子带对象概率估计的音频对象提取 |
CN105989852A (zh) * | 2015-02-16 | 2016-10-05 | 杜比实验室特许公司 | 分离音频源 |
CN106303897A (zh) * | 2015-06-01 | 2017-01-04 | 杜比实验室特许公司 | 处理基于对象的音频信号 |
EP3329485B1 (en) * | 2015-07-29 | 2020-08-26 | Dolby Laboratories Licensing Corporation | System and method for spatial processing of soundfield signals |
EP3357259B1 (en) | 2015-09-30 | 2020-09-23 | Dolby International AB | Method and apparatus for generating 3d audio content from two-channel stereo content |
US9961475B2 (en) | 2015-10-08 | 2018-05-01 | Qualcomm Incorporated | Conversion from object-based audio to HOA |
-
2018
- 2018-05-02 CN CN201880041822.0A patent/CN110800048B/zh active Active
- 2018-05-02 JP JP2019561833A patent/JP7224302B2/ja active Active
- 2018-05-02 EP EP18722375.5A patent/EP3622509B1/en active Active
- 2018-05-02 US US16/611,843 patent/US10893373B2/en active Active
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2020519950A5 (ja) | ||
JP6508491B2 (ja) | マルチチャネルオーディオ信号内の音声成分を強調するための信号処理装置 | |
US8532999B2 (en) | Apparatus and method for generating a multi-channel synthesizer control signal, multi-channel synthesizer, method of generating an output signal from an input signal and machine-readable storage medium | |
EP3259755B1 (en) | Separating audio sources | |
RU2596592C2 (ru) | Пространственный аудио процессор и способ обеспечения пространственных параметров на основе акустического входного сигнала | |
US9955277B1 (en) | Spatial sound characterization apparatuses, methods and systems | |
CN110619882B (zh) | 用于降低去相关器电路中瞬态信号的时间伪差的系统和方法 | |
JP5681290B2 (ja) | デコードされたマルチチャネルオーディオ信号またはデコードされたステレオ信号を後処理するためのデバイス | |
JP7224302B2 (ja) | マルチチャネル空間的オーディオ・フォーマット入力信号の処理 | |
JP6987075B2 (ja) | オーディオ源分離 | |
EP3170174A1 (en) | Decomposing audio signals | |
JP6520937B2 (ja) | オーディオ信号処理装置および方法、符号化装置および方法、並びにプログラム | |
JP2016536856A (ja) | 二つ以上の基本信号からのマルチチャンネル信号の導出 | |
KR20170101614A (ko) | 분리 음원을 합성하는 장치 및 방법 | |
CN109285553A (zh) | 对高阶高保真立体声信号应用动态范围压缩的方法和设备 | |
KR20180079975A (ko) | 음원의 공간적 위치 및 비음수 행렬 분해를 이용한 음원 분리 방법 및 장치 | |
KR101658001B1 (ko) | 강인한 음성 인식을 위한 실시간 타겟 음성 분리 방법 | |
WO2018208560A1 (en) | Processing of a multi-channel spatial audio format input signal | |
WO2019217808A1 (en) | Determining sound locations in multi-channel audio | |
Gunawan et al. | Investigation of various algorithms on multichannel audio compression | |
JP2005091560A (ja) | 信号分離方法および信号分離装置 | |
JP2017503214A (ja) | マルチ・チャンネル・オーディオ信号分類器 | |
Park et al. | Multichannel audio signal source separation based on an interchannel loudness vector sum | |
Miyauchi et al. | Depth Estimation of Sound Images Using Directional Clustering and Activation-Shared Nonnegative Matrix Factorization |