JP2014527381A - 直接−拡散分解方法 - Google Patents

直接−拡散分解方法 Download PDF

Info

Publication number
JP2014527381A
JP2014527381A JP2014530780A JP2014530780A JP2014527381A JP 2014527381 A JP2014527381 A JP 2014527381A JP 2014530780 A JP2014530780 A JP 2014530780A JP 2014530780 A JP2014530780 A JP 2014530780A JP 2014527381 A JP2014527381 A JP 2014527381A
Authority
JP
Japan
Prior art keywords
direct
channels
correlation coefficient
output signal
component output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014530780A
Other languages
English (en)
Other versions
JP5965487B2 (ja
Inventor
ジェフ トンプソン
ブランドン スミス
アーロン ワーナー
ゾラン フェイゾ
ジャン−マルク ジョット
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DTS Inc
Original Assignee
DTS Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DTS Inc filed Critical DTS Inc
Publication of JP2014527381A publication Critical patent/JP2014527381A/ja
Application granted granted Critical
Publication of JP5965487B2 publication Critical patent/JP5965487B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • G10L21/0308Voice signal separating characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Complex Calculations (AREA)
  • Stereophonic System (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

複数のチャンネルを有する信号を直接及び拡散成分に分解するための方法及び装置が開示される。複数の信号から信号の各ペア間の相関係数を推定することができる。推定した相関係数と複数のチャンネルの各々の直接エネルギー率を関連付ける線形システムの式を構築することができる。線形システムを解いて直接エネルギー率を推定することができる。直接エネルギー率に部分的に基づいて直接成分出力信号及び拡散成分出力信号を生成することができる。
【選択図】 図1

Description

[0002] 本開示は、オーディオ信号の処理に関し、詳細には、オーディオ信号を直接及び拡散成分に分解する方法に関する。
[0004] オーディオ信号は通常、様々な空間特性を有する音響成分のミックスからなる。簡単な実施例において、ステージ上のソロミュージシャンが発生する音響は、複数のマイクロフォンによって取り込むことができる。各マイクロフォンは、ミュージシャンからマイクロフォンに直接的に伝わる直接音響成分だけでなく、ミュージシャンが発生する音響の残響音、聴衆ノイズ、及び拡張又は拡散音源から生じる他の背景音を含む他の音響成分を取り込む。各マイクロフォンが発生する信号は、直接成分と拡散成分とを含むと考えることができる。
[0005] 多くのオーディオ信号処理用途において、信号を別個の空間成分に分離し、各成分を独立して分析及び処理できるようにすることは有益である。詳細には、任意のオーディオ信号を直接及び拡散成分に分離することは、共通の課題である。例えば、空間フォーマット変換アルゴリズムは、直接成分が高度に局所化可能なまま、拡散成分が所望の包囲感覚を維持するように、直接及び拡散成分を独立して処理することができる。また、バイノーラルレンダリング法は、独立した処理を直接及び拡散成分に適用し、ここでは直接成分は仮想点音源としてレンダリングされ、拡散成分は拡散音響場としてレンダリングされる。本発明において、信号の直接及び拡散成分への分離は、直接−拡散分解と呼ぶことにする。
[0006] 本出願で使用される用語は、関連文献で利用される用語とは僅かに異なる場合がある。関連の論文では、直接及び拡散成分は、一般に、主成分及び周囲成分、又は非拡散成分及び拡散成分と呼ばれる。本発明は、直接及び拡散成分の別個の空間特性を強調するために用語「直接」及び「拡散」を使用しており、すなわち、直接成分は一般に、高指向性の音響事象からなり、拡散成分は一般に、空間的に分布した音響事象からなる。加えて、本出願において、用語「相関」及び「相関係数」とは、タイムラグがゼロで評価した2つの信号間の正規化相互相関評価基準を意味する。
[0007] 直接−拡散分解のためのプロセスのフローチャートである。 [0008] 直接−拡散分解のための別のプロセスのフローチャートである。 [0009] 直接−拡散分解のための別のプロセスのフローチャートである。 [0010] 直接−拡散分解のための別のプロセスのフローチャートである。 [0011] コンピュータデバイスのブロック図である。
[0012]本明細書全体を通じて、図に示される要素には3桁の参照符号が割り当てられており、最上位の桁が、要素が示された図面番号であり、下位の2桁が要素に固有のものである。図と連動して説明されない要素は、同じ参照符号を有する既に説明された用途と同じ特性及び機能を有すると考えられる。
(方法の説明)
[0014] 図1は、複数のチャンネルを含む、入力信号
の直接−拡散分解のプロセス100のフローチャートである。入力信号
は、以下の信号モデルで表される複素Nチャンネルオーディオ信号とすることができる。
ここで、
は直接ベース、
は拡散ベース、
は直接エネルギー、
は拡散エネルギー、
は直接成分位相シフト、
はチャンネル・インデックス、
は時間インデックスである。本出願の以下の部分において、用語「直接成分」は、
を指し、用語「拡散成分」は、
を指す。各チャンネルにおいて、直接及び拡散ベースは、複素ゼロ平均固定確率変数であり、直接及び拡散エネルギーは正の実数定数であり、直接成分位相シフトは一定値であるものとする。また、直接及び拡散ベースの期待エネルギーは、一般性を喪失することなく全てのチャンネルについて単一であり、すなわち、
(ここで、
は期待値を表す)であるものとする。直接及び拡散ベースの期待エネルギーは単一であるとされたが、スカラー
及び
は、各チャンネルにおいて任意の直接及び拡散エネルギーを考慮する。直接及び拡散成分は、信号持続時間全体で固定であるものとされるが、実際の実施構成では信号は時間局在化セグメントに分割され、ここで各セグメント内の成分は固定であるものとする。
[0015] 直接及び拡散成分の空間特性に関して、幾つかの仮定条件を設定することができる。具体的には、直接成分は、入力信号のチャンネル間で相関化され、拡散成分は、チャンネル間で及び直接成分との両方で非相関化されるものとする。直接成分がチャンネル間で相関化される仮定条件は、式(1)において、チャンネル依存のエネルギー
及び位相シフト
とは異なり、チャンネル間で同一である単一の直接ベース
によって表される。拡散成分が非相関化される仮定条件は、式(1)において、各チャンネルに対して固有の拡散ベース
によって表される。直接及び拡散成分が非相関化される仮定条件に基づくと、ミックス信号
の期待エネルギーは、次式となる。
この信号モデルは、チャンネル位置には依存せず、すなわち、特定のチャンネル位置に基づく仮定は存在しない点に留意されたい。
[0016] チャンネルiとjの間の相関係数は、次式で定義される。
ここで
は複素共役を表し、
及び
はそれぞれチャンネルi及びjの標準偏差である。一般に、相関係数は複素数値である。相関係数の大きさは、ゼロと1の間に限定されるという特性を有し、ここで、1に近づく傾向のある大きさは、チャンネルi及びjが相関していることを示している。一方で、0に近づく傾向のある大きさは、チャンネルi及びjが非相関化であることを示している。相関係数の位相は、チャンネルi及びj間の位相差を示している。
[0017] 式(1)の直接及び拡散信号モデルを式(4)の相関係数にあてはめることによって、次式が求められる。
ここで、
である。
[0018] 上述のように、直接成分は、チャンネル間で相関化されるものと仮定され、拡散成分は、チャンネル間で及び直接成分と両方で非相関化されるものと仮定される。これらの空間仮定条件は、チャンネルi及びj間の相関係数を用いて以下のように数式表現することができる。

[0019] 直接−拡散信号モデルについての相関係数の大きさは、式(2)の直接及び拡散エネルギーの仮定条件及び式(7)の空間仮定条件を式(5)にあてはめることによって導かれ、次式が得られる。
直接−拡散信号モデルについての相関係数の大きさは、チャンネルi及びjの直接及び拡散エネルギーレベルにのみ依存することは明らかである。
[0020] 同様に、直接−拡散信号モデルについての相関係数の位相は、直接−拡散空間仮定条件をあてはめることによって導かれ、次式が得られる。
直接−拡散信号モデルについての相関係数の位相は、チャンネルi及びjの直接成分の位相シフトにのみ依存することは明らかである。
[0021] チャンネルのペア間の相関係数は、110において推定することができる。チャンネルi及びj間の相関係数の推定の一般式は、次式で得られる。
ここで、Tは総和の長さを表す。この式は、総和が信号長全体にわたって実施される場合の定常信号を対象としている。しかしながら、対象となる実際の信号は非定常であることが一般的であり、従って、連続した時間局在化相関係数の推定値は、適切に短い総和長Tを用いることが好ましいとすることができる。この手法は、時間的に変化する直接及び拡散成分を追跡するには十分とすることができるが、真の平均計算(すなわち、全体の時間間隔Tにわたる総和)を必要とし、結果として高い計算及びメモリ要件となる。
[0022] 110にて用いることができるより効率的な手法は、次式のように指数移動平均を用いて真の平均を近似するものである。
ここで、


λは、相関係数推定値の有効平均長を制御する、範囲
の忘却係数である。この再帰的数式は、時間的に変化する直接及び拡散成分の追跡に対する柔軟な制御を維持しながら、式(10)の方法と比べて必要とされる計算及びメモリリソースが少ないという利点を有する。相関係数推定値の時定数τは、次式のように忘却係数λの関数である。
ここで
は、信号
のサンプリングレートである(時間周波数実施構成において、
は有効サブ帯域サンプリングレートである)。
[0023] 相関係数推定値の大きさは、小さな忘却係数λを用いた再帰的数式で計算したときにはかなり過大に推定される場合がある。この1に偏ったバイアスは、信号履歴と比べて現在時間サンプルの比較的高い重み付けに起因しており、相関係数推定値の大きさは、総和長
又は忘却係数
においては1に等しい点に留意されたい。推定した相関係数は、任意選択的に120において、以下のように忘却係数λの関数として過大推定の経験的分析に基づいて補正することができる。
ここで
は、相関係数推定値の補正済みの大きさである。この補正法は、平均相関関数の範囲が、
から約
で表されるという経験的観測に基づいている。従って、この補正法は、
から
の範囲で相関係数を線形的に拡張することができ、ここで、当初は
を下回っている係数は、
演算子によりゼロに設定される。
[0024] 130において、線形システムは、全ての固有のチャンネルペアについてのペアの相関係数並びにマルチチャンネル信号の全てのチャンネルについての直接エネルギー率(DEF)から構築することができる。i番目のチャンネルのDEFφは、全エネルギーに対する直接エネルギーの比
として定義される。チャンネルi及びjのペアについての相関係数は、次式のように、これらのチャンネルのDEFと直接相関性があることは式(8)及び式(15)から明らかである。
対数をとると、次式が得られる。
[0025] 任意の数のチャンネルNのマルチチャンネル信号において、固有のチャンネルペアの数
が存在する(
に対して成立する)。線形システムは、M個のペア相関係数とN個のチャンネル当たりのDEFから次式のように構築することができる。
又は、行列方程式として次式のように表すことができる。
ここで、
は、全ての固有チャンネルペアi及びjについての対数大きさのペア相関係数からなる長さMのベクトルであり、
は、チャンネルペアインデックスに対応する行/列インデックスの非ゼロ要素からなる、サイズ
の疎行列であり、
は、各チャンネルiについてのチャンネル当たりの対数DEFからなる長さNのベクトルである。
[0026] 一例として、130において、5チャンネル信号の線形システムは、次式のように構築することができる。
ここでは、10個のペア相関係数の各々についての10個の固有の式が存在する。
[0027] 典型的な状況において、任意のNチャンネルオーディオ信号の真のチャンネル当たりのDEFは未知である。しかしながら、ペアの相関係数の推定値は、110及び120において計算し、次いで、これを利用して、140において式(18)の線形システムを解くことによって、チャンネル当たりのDEFを推定することができる
[0028]
をチャンネルペアi及びjについてのサンプル相関係数、すなわち、式(4)の形式期待値の推定値とする。全ての固有チャンネルペアi及びjについてサンプル相関係数が推定されると、式(18)の線形システムが得られ、140において式(18)を解いて、各チャンネルiについてのDEF
を推定することができる。
[0029]
のマルチチャンネル信号において、チャンネル当たりのDEF推定値よりも多くのペア相関係数推定値が存在し、過剰決定システムをもたらす。140において最小二乗法を使用し、過剰決定線形システムに対する解を近似することができる。例えば、線形最小二乗法は、各式についての誤差二乗和を最小にする。線形最小二乗法は、次式のように適用することができる。
ここで、
は、各チャンネルiについてのチャンネル当たりの対数DEF推定値からなる長さNのベクトルであり、
は、全ての固有のチャンネルペアi及びjについての対数大きさのペア相関係数推定値からなる長さMのベクトルであり、
は行列転置、
は行列反転である。線形最小二乗法の利点は、計算の複雑さが比較的低く、ここで全ての必要とされる行列反転は一度だけ計算される。線形最小二乗法の潜在的欠点は、誤差分布に対する明示的な制御が存在しないことである。例えば、拡散成分の誤差増大を犠牲にして、直接成分の誤差を最小限にすることが望ましいとすることができる。誤差分布に対する制御が求められる場合、各式において加重二乗和誤差が最小にされる加重最小二乗法を適用することができる。加重最小二乗法は、次式で適用することができる。
ここでWは、対角に沿って各式の重み付けからなるサイズ
の対角行列である。望ましい挙動に基づいて、特定の特性を有する式についての近似誤差を低減するよう重み付けを選ぶことができる(例えば、強い直接成分、強い拡散成分、比較的高いエネルギー成分、その他)。加重最小二乗法の欠点は、計算の複雑さが著しく高く、各線形システムの近似には行列反転が必要とされる。
[0030]
のマルチチャンネル信号において、ペア相関係数推定値とチャンネル当たりのDEF推定値とが同数で存在し、臨界システムをもたらす。しかしながら、ペアの相関係数推定値は通常は大きな分散を示すので、線形システムが一貫していることは保証されない。過剰決定の場合と同様に、140において、線形最小二乗法又は加重最小二乗法を利用して、臨界システムが一貫していない場合でも近似解を計算することができる。
[0031]
の2チャンネルステレオ信号において、ペア相関係数推定値よりも多くのチャンネル当たりのDEF推定値が存在し、劣決定システムをもたらす。この場合、チャンネル当たりにDEF推定値又は等拡散エネルギーなど、解を計算するために更なる信号仮定条件が必要とされる。
[0032]
140において、線形システムを解くことによって、各チャンネルについてのDEFを推定した後、150において、チャンネル当たりのDEF推定値を用いて直接及び拡散マスクを生成することができる。用語「マスク」は、一般に、信号成分の所望の増幅又は減衰を達成するために信号に対して加える乗法的修正を指す。マスクは、時間周波数分析合成フレームワークにおいて適用されることが多く、ここでマスクは、一般に「時間周波数マスク」と呼ばれる。実数値の乗法マスクをマルチチャンネル信号に適用することにより、直接及び拡散分解を実施することができる。
[0033] マルチチャンネル入力信号
に基づいて、
及び
は、それぞれ、直接成分出力信号と拡散成分出力信号と定義される。式(3)及び式(15)から、DEFから導出された実数値マスクは、

として適用することができ、分解された直接及び拡散成分の期待エネルギーは、真の直接及び拡散エネルギー

にほぼ等しい。
[0034] この場合、
はマルチチャンネル出力信号であり、
の各チャンネルは、マルチチャンネル入力信号
の対応するチャンネルの直接成分と同じ期待エネルギーを有する。同様に、
はマルチチャンネル出力信号であり、
の各チャンネルは、マルチチャンネル入力信号
の対応するチャンネルの拡散成分と同じ期待エネルギーを有する。
[0035] 分解された直接及び拡散出力信号の期待エネルギーは、入力信号の真の直接及び拡散エネルギーに近いが、分解成分の合計は、必ずしも観測される信号に等しいとは限らず、すなわち、
において、
である。観測信号を分解するのに実数値マスクが使用されるので、結果として得られる直接及び拡散成分出力信号が完全に相関化され、直接及び拡散成分が非相関化される上記の仮定条件が破棄される。
[0036] 出力信号
及び
が観察された入力信号
に等しいことが望ましい場合には、単純な正規化をマスクに適用することができる。

この正規化は、分解された直接成分及び拡散成分の出力信号のエネルギーレベルに影響を及ぼし、式(24)はもはや成立しない点に留意されたい。
[0037] 直接成分及び拡散成分の出力信号
及び
はそれぞれ、150からの直接及び拡散マスクとマルチチャンネル入力信号
の遅延コピーとを乗算することにより生成することができる。160において、マルチチャンネル入力信号は、処理110〜150を完了して直接及び拡散マスクを生成するのに必要な処理時間に等しい時間期間だけ遅延させることができる。直接及び拡散出力信号は、ここでは、上述の空間フォーマット変換又はバイノーラルレンダリングのような用途で用いることができる。
[0038] プロセス100は、説明を簡単にするために一連の連続した処理として図示されているが、複数チャンネル及び複数の時間サンプルに対して異なる処理を同時に実施しするように並行プロセス及び/又はパイプラインで実施してもよい。
[0039] 図1のプロセス100と同様のマルチチャンネル直接−拡散分解プロセスは、時間周波数分析フレームワークで実施することができる。特に、式(1)〜式(3)において確立された信号モデル、及び式(4)〜(25)において要約される分析は、任意の時間周波数表現の各周波数帯域について成立すると考えられる。
[0040] 時間周波数フレームワークは、複数の要因によって誘起される。最初に、時間周波数手法は、直接成分の周波数が実質的に重なり合わない条件で、複数の直接成分を含む信号の独立した分析及び分解を可能にする。第2に、時間局在化分析を伴う時間周波数手法は、時間的に変化する直接及び拡散エネルギーを有する非定常信号の堅牢な分解を可能にする。第3に、時間周波数手法は、人間の聴覚系が時間及び周波数の関数として空間音響情報を引き出し、ここではバイノーラル音響情報の周波数分解能が等価方形帯域幅(ERB)スケールにほぼ従うことを示唆する音響心理学研究と一致している。これらの要因に基づいて、時間周波数フレームワーク内で直接−拡散分解を実施することは当然のことである。
[0041] 図2は、時間周波数フレームワークにおけるマルチチャンネル信号
の直接/拡散分解のプロセス200のフローチャートである。210において、マルチチャンネル信号
は、複数の周波数帯域に分離又は分割することができる。
という表記は、複素時間周波数信号を表すのに用いられ、ここでmは時間フレームインデックスを表し、kは周波数インデックスを表す。例えば、マルチチャンネル信号
は、短時間フーリエ変換(STFT)を用いて周波数帯域に分離することができる。別の実施例として、2つの複素変調4分割鏡映対称フィルタバンク(QMF)のカスケードからなるハイブリッドフィルタバンクを用いて、マルチチャンネル信号を複数の周波数帯域に分離することができる。ハイブリッドQMFの利点は、高周波において周波数分解能の低減が一般に許容可能であることに起因して、STFTと比べてメモリ要件が少ないことである。
[0042] 220において、各周波数帯域におけるチャンネルの各ペアについて相関係数推定を行うことができる。各相関係数推定は、プロセス100の処理110に関して説明したように行うことができる。任意選択的に、各相関係数推定は、プロセス100の処理120に関して説明したように補正することができる。
[0043] 230において、220から得た相関係数推定値は、知覚帯域にグループ化することができる。例えば、220から得た相関係数推定値は、バーク帯域にグループ化することができ、又は等矩形帯域幅スケールに従ってグループ化することができ、或いは、何らかの他の方法で帯域にグループ化することができる。220から得た相関係数推定値は、隣接する帯域間の知覚差違がほぼ同じであるようにグループ化することができる。相関係数推定値は、例えば、同じ知覚帯域内の周波数帯域について相関係数推定値を平均することによってグループ化することができる。
[0044] 240において、線形システムは、プロセス100の処理130及び140に関して説明したように生成して、各知覚帯域について解くことができる。250において、直接及び拡散マスクは、プロセス100の処理150に関して説明したように、各知覚帯域について生成することができる。
[0045] 260において、250から得た直接及び拡散マスクは非グループ化することができ、すなわち、230において周波数帯域をグループ化するのに用いた処理を260において反転させ、各周波数帯域に対して直接及び拡散マスクを提供することができる。例えば、230において3つの周波数帯域を単一の知覚帯域に結合した場合、260において、当該知覚帯域のマスクは、3つの周波数帯域の各々に適用されることになる。
[0046] 直接成分及び拡散成分出力信号
及び
はそれぞれ、マルチ帯域マルチチャンネル入力信号
の遅延コピーを260から得られた非グループ化直接及び拡散マスクと乗算することにより決定することができる。270において、マルチ帯域マルチチャンネル入力信号は、処理220〜260を完了して直接及び拡散マスクを生成するのに必要な処理時間に等しい時間期間分、遅延させることができる。直接成分及び拡散成分出力信号
及び
はそれぞれ、合成フィルタバンク280により時間領域信号
及び
に変換することができる。
[0047] プロセス200は、説明を簡単にするために一連の連続した処理として図示されているが、複数チャンネル及び複数の時間サンプルに対して異なる処理を同時に実施しするように並行プロセス及び/又はパイプラインで実施してもよい。
[0048] プロセス100及びプロセス200は、実数値のマスクを用いて、全て直接又は拡散成分からなる信号に良好に機能する。しかしながら、実数値のマスクは、ミックスした成分の位相を保持する理由から、直接及び拡散成分のミックスを含む信号の分解にはあまり効果的ではない。換言すると、分解された直接成分の出力信号は、入力信号の拡散成分からの位相情報を含むことになり、逆もまた同様である。
[0049] 図3は、マルチチャンネル信号のDEFに基づく直接成分及び拡散成分の出力信号を推定するプロセス300のフローチャートである。プロセス300は、例えば、プロセス100の処理110〜140又はプロセス200の処理210〜240を用いて、DEFが計算された後で始まる。プロセス200を用いた場合、プロセス300は、各知覚帯域について独立して実施することができる。プロセス300は、直接成分の大きさ及び位相の両方を完全に推定するために、ベースとなる直接成分がチャンネル間で同一であるという仮定条件を利用する。
[0050] 分解された直接成分出力信号
を、真の直接成分
の推定値とする。
ここで
は真の直接ベースの推定値、
は真の直接エネルギーの推定値、
は真の直接成分位相シフトの推定値である。プロセス300において、分解した直接成分出力信号及び分解した拡散成分出力信号は、元の加法信号モデルに従うと仮定する。すなわち、
となる。本方法において、これは、極形式で複素値直接ベース推定値
を表現するのに有用であり、次式が得られる。
ここで
は真の大きさの推定値であり、
は直接ベースの真の位相の推定値である。直接成分出力信号
は、成分
及び
を独立して推定することにより推定することができる。
[0051] 372において、直接エネルギー推定値
は次式のように決定することができる。
ここで
は式(6)で表されたチャンネルiの全エネルギーの推定値である。式(3)及び(15)から、推定した直接エネルギーの期待値は真の直接エネルギーにほぼ等しいことが明らかであり、すなわち、次式となる。
[0052] 374において、直接ベースの大きさ
を推定することができる。直接及び拡散ベースは確率変数である。直接及び拡散成分の期待エネルギーは、実質的に
及び
によって決定され、各時間サンプルnについての瞬間エネルギーは確率論的なものである。直接ベースの確率的性質は、直接成分はチャンネル間で相関化されるという仮定条件により、全チャンネルにおいて同一であるものとする。直接ベースの瞬間的大きさ
を推定するために、観測信号の瞬間大きさの加重平均
は、全チャンネルi間で計算される。直接エネルギーのより高い比を有するチャンネルにより大きな重み付けを加えることにより、直接ベースの瞬間的大きさは、次式のように、拡散成分からの最小の影響で確実に推定することができる。
による上記の正規化によって、式(2)で確立された適切な期待エネルギーが確保され、すなわち、
となる。
[0053] 376において、
位相角
及び
を推定することができる。所与のチャンネルiについてのチャンネル当たりの位相シフト
は、サンプル相関係数
の位相から計算することができ、これは、式(9)に従ってチャンネルi及びjの直接成分の位相シフト間の差違を近似する。絶対位相シフト
を推定するために、ここではゼロラジアンとして選ばれた既知の絶対位相シフトで基準チャンネルを固定する必要がある。インデックスlが最大DEF推定値
を有するチャンネルを表すとすると、全チャンネルiについてのチャンネル当たりの位相シフト
は、次式で計算することができる。
チャンネルlに対するチャンネル当たりの位相シフト推定値
の計算は、直接エネルギーの高い比を有するチャンネルについて推定位相差がより正確になるという仮定条件によってなされる。
[0054] チャンネル当たりの位相シフト
の推定値が決定されると、瞬間位相
の推定値を計算することができる。大きさと同様に、直接及び拡散ベースの瞬間位相は、各時間サンプルnについて確率論的である。直接ベースの瞬間位相
を推定するために、観測信号の瞬間位相
の加重平均は、次式のように、全チャンネルi間で計算することができる。
式(29)と同様に、重み付けは、直接エネルギーのより高い比を有するチャンネルを重くするようにDEF推定値
として選ばれる。チャンネル間で平均したときに直接ベースの瞬間位相が一致するように、各チャンネルiからチャンネル当たりの位相シフト
を除去する必要がある。
[0055] 378において、分解した直接成分出力信号
は、式(27)、並びに372による
の推定値、374による
の推定値、及び376による
及び
の推定値を用いて、各チャンネルiについて生成することができる。次いで、分解した拡散成分出力信号は、380において、次式の加法信号モデルを加えることにより生成することができる。
[0056] 図4は、時間周波数フレームワークにおけるマルチチャンネル信号
の直接−拡散分解のためのプロセス400のフローチャートである。プロセス400は、プロセス200と同様である。処理410、420、430、440、450、460、470、及び480は、プロセス200における対応する処理と同じ機能を有する。図4に関してこれらの処理の説明は繰り返さない。
[0057] プロセス200は、相関係数の式がレベル依存である理由から、直接成分として離散的成分を識別することが困難であることが分かっている。この問題を改善するために、所与のチャンネルペアについての相関係数推定値は、ペアが比較的低いエネルギーを有するチャンネルを含む場合には、高バイアスにすることができる。425において、各チャンネルペアについて、相対及び/又は絶対チャンネルエネルギーの差違を決定することができる。各チャンネルペアについて420にて行った相関係数推定は、ペア間の相対又は絶対エネルギー差違が所定閾値を超えた場合には高バイアスに又は過大に推定することができる。或いは、例えば、プロセス400の処理410、420、430、及び440を用いることにより計算されたDEFは、チャンネルの推定エネルギーに基づいてチャンネルについて高バイアスに又は過大に推定することができる。
[0058] プロセス200はまた、相関係数推定値が比較的長い時間ウィンドウにわたって計算されるので、過渡信号成分を直接成分として識別することが困難であることが分かっている。この問題を改善するために、所与のチャンネルペアについての相関係数推定値はまた、ペアが識別された過渡状態を有するチャンネルを含む場合には、高バイアスにすることができる。415において、各チャンネルの各周波数帯域において過渡状態を検出することができる。チャンネルペアについて420にて行った相関係数推定は、ペアの少なくとも1つのチャンネルが過渡状態を含むと判定された場合には高バイアスに又は過大に推定することができる。或いは、例えば、プロセス400の処理410、420、430、及び440を用いることにより計算されたDEFは、過渡状態を含むと判定されたチャンネルについて高バイアスに又は過大に推定することができる。
[0059] 完全な拡散信号成分の相関係数推定は、直接信号の相関係数推定値よりも実質的に高い分散を有することができる。435において、知覚帯域の相関係数推定値の分散を決定することができる。所与の知覚帯域における所与のチャンネルペアの相関係数推定値の分散が所定分散閾値を上回った場合には、チャンネルペアは、完全な分散信号を含むと決定することができる。
[0060] 455において、直接及び拡散マスクは、処理アーチファクトを低減するために時間及び/又は周波数にわたって円滑化することができる。例えば、指数的に重み付けされた移動平均フィルタを適用し、時間にわたって直接及び拡散マスク値を円滑にすることができる。円滑化は、時間内で動的又は可変とすることができる。例えば、円滑化の程度は、435にて決定されるように、相関係数推定値の分散に依存することができる。比較的低い直接エネルギー成分を有するチャンネルのマスク値はまた、周波数にわたって円滑化することができる。例えば、マスク値の幾何平均は、局所周波数領域(すなわち、複数の隣接する周波数帯域)にわたって計算することができ、平均値は、直接信号成分が僅かか又は存在しないチャンネルのマスク値として用いることができる。
[0061] (装置の説明)
[0062] 図5は、マルチチャンネル入力信号
の直接−拡散分解用の装置500のブロック図である。装置500は、本明細書で記載される機能及び特徴を提供するソフトウェア及び/又はハードウェアを含むことができる。装置500は、プロセッサ510、メモリ520、及び記憶デバイス530を含むことができる。
[0063] プロセッサ510は、マルチチャンネル入力信号
を受け入れて、k周波数帯域における直接成分及び拡散成分出力信号
及び
それぞれを出力するよう構成することができる。直接成分及び拡散成分出力信号は、有線又は別の伝播媒体を介してプロセッサ510の外部のエンティティに伝わる信号として出力することができる。直接成分及び拡散成分出力信号は、プロセッサ510上で作動する別のプロセスへのデータストリームとして出力することができる。直接成分及び拡散成分出力信号は、他の何らかの方法で出力することができる。
[0064] プロセッサ510は、マイクロプロセッサ、デジタル信号プロセッサ、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、プログラム可能ロジックデバイス(PLD)、及びプログラム可能ロジックアレイ(PLA)など、アナログ回路、デジタル回路、ファームウェア、及び1つ又はそれ以上の処理デバイスのうちの1つ又はそれ以上を含むことができる。プロセッサのハードウェアは、本明細書で記載される機能及び特徴を提供する種々の専用ユニット、回路、及びインタフェースを含むことができる。プロセッサ510は、複数の演算を並行に実施できるマルチプロセッサコア又は処理チャンネルを含むことができる。
[0065] プロセッサ510は、メモリ520に結合することができる。メモリ510は、例えば、静的又は動的ランダムアクセスメモリとすることができる。プロセッサ510は、入力信号データ、中間結果、及び出力データを含むデータをメモリ520内に記憶することができる。
[0066] プロセッサ510は、記憶デバイス530に結合することができる。記憶デバイス530は、プロセッサ510が実行したときに、装置500に対して本明細書で記載される方法を実施させるようにする命令を記憶することができる。記憶デバイスは、不揮発性記憶媒体との間で読み込み及び/又は書き込み可能にするデバイスである。記憶デバイスは、ハードディスクドライブ、DVDドライブ、フラッシュメモリデバイス、及びその他を含む。記憶デバイス530は、記憶媒体を含むことができる。これらの記憶媒体には、例えば、ハードディスクなどの磁気媒体、コンパクトディスク(CD−ROM及びCD−RW)及びデジタル多用途ディスク(DVD及びDVD±RW)などの光学媒体、フラッシュメモリデバイス、他の記憶媒体が挙げられる。用語「記憶媒体」は、データを記憶するための物理デバイスを意味し、信号及び波形を伝播するような一時的媒体を含まない。
[0067] プロセッサ510、メモリ520、及び記憶デバイス530の全ての部分は、説明を簡単にするために図5において別個の機能要素として示されたが、フィールドプログラマブルアレイ又はデジタル信号プロセッサ回路などの単一の物理デバイス内にパッケージングすることができる。
[0068] (まとめ)
[0069] 本明細書全体を通じて、図示した実施形態及び実施例は、開示され又は請求項に記載された装置及び手順に対する限定ではなく例示とみなすべきである。本明細書で提示される実施例の多くは、方法動作及びシステム要素の特定の組合せを含むが、これら動作及び要素は、同じ目的を達成するために他の方法で組み合わせることができる点を理解されたい。フローチャートに関しては、追加のステップ又はより少ないステップをとることができ、本明細書に記載の方法を実現するために、図示のステップを組み合わせるか、又は更に改善することができる。1つの実施形態のみ関連して考察された動作、要素、及び特徴は、他の実施形態において類似の役割から除外されることを意図するものではない。
[0070] 本明細書で使用される「複数」とは、2つ又はそれ以上を意味する。本明細書で使用される要素の「セット」とは、このような要素のうちの1つ又はそれ以上を含むことができる。本発明の明細書又は請求項において使用される用語「備える」、「含む」、「保持する」、「有する」、「含有する」、「伴う」及び同様の用語は、オープン(非制限)であると理解すべきであり、すなわち、限定ではなく含むことを意味している。それぞれ「からなる」及び「本質的にからなる」という移行句は、請求項に関してはクローズ又はセミクローズの移行句である。請求項の要素を修飾するために「第1の」、「第2の」、「第3の」、その他などの序数用語を請求項において使用することは、それ自体で、ある請求項の要素が、何らかの優先度、先行性、又は方法の動作が実施される別の又は一時的な順序よりも優先する1つの請求項の要素の順序を意味するものではなく、特定の名称を有する1つの請求項の要素と、同じ名称を有する(序数用語を用いない)別の要素と区別して、これらの請求項の用語を識別する単に標識として使用される。本明細書で使用される「及び/又は」は、記載の要素が代替形態であるが、この代替形態はまた記載の要素の何らかの組合せを含むことを意味する。
110:チャンネルのペア間の相関係数を推定する
120:推定した相関係数を補正する
130:線形システムを構築する
140:線形システムを解く
150:直接及び拡散マスクを生成する
160:先行遅延する

Claims (20)

  1. 複数のチャンネルを有する入力信号の直接−拡散分解のための方法(100、200、400)であって、
    複数の信号から信号の各ペア間の相関係数を推定するステップ(110、220、420)と、
    前記推定した相関係数と前記複数のチャンネルの各々の直接エネルギー率とを関連付ける線形システムの式を構築するステップ(130、240、440)と、
    前記線形システムを解いて前記直接エネルギー率を推定するステップ(140、240、440)と、
    前記直接エネルギー率に部分的に基づいて直接成分出力信号及び拡散成分出力信号を生成するステップ(280、480)と、
    を含む、方法。
  2. 前記チャンネルの各々を複数の周波数帯域に分離するステップ(210、410)と、
    前記複数の周波数帯域各々について独立して、前記推定ステップ、前記構築ステップ、前記解くステップ、及び前記生成ステップを実行するステップと、
    を更に含む、請求項1に記載の装置。
  3. 前記線形システムの各式は、次式の形式を有し、
    ここで、
    が前記複数のチャンネルのうちのチャンネルi及びj間の前記相関係数、
    及び
    がチャンネルi及びjの前記直接エネルギー率である、請求項1に記載の方法。
  4. 前記信号の各ペア間の相関係数を推定するステップが、再帰的数式を用いて実行される、請求項1に記載の方法。
  5. 所定値を下回る相関係数推定値をゼロに設定し、
    前記所定値を上回るか又は等しい前記相関係数推定値の範囲を[0,1]の範囲まで線形的に拡張する、
    ことによって再帰的な前記相関係数推定値を補正するステップ(120、220、420)を更に含む、請求項4に記載の方法。
  6. 前記直接成分出力信号及び拡散成分出力信号を生成するステップが更に、
    前記複数のチャンネルの各々の直接エネルギー率に基づいて直接及び拡散マスクを生成するステップ(150、250、450)と、
    前記入力信号と前記直接及び拡散マスクを乗算して前記直接成分出力信号及び拡散成分出力信号を供給するステップと、
    を含む、請求項1に記載の方法。
  7. 前記直接成分出力信号及び拡散成分出力信号を生成するステップが更に、
    前記複数のチャンネルの直接エネルギー率に部分的に基づいて直接ベースの大きさ(374)及び位相角(376)を推定するステップと、
    それぞれの直接エネルギー率に部分的に基づいて前記複数のチャンネルの各々についての直接成分エネルギー(372)及び位相シフト(376)を推定するステップと、
    前記各々の直接成分エネルギー及び位相シフトと前記直接ベースの大きさ及び位相角とから前記複数のチャンネルの各々についての直接成分出力信号(378)を生成するステップと、
    を含む、請求項1に記載の方法。
  8. それぞれの入力信号チャンネルからそれぞれの前記推定した直接成分を差し引くことにより、前記複数のチャンネルの各々についての拡散成分出力信号(380)を推定するステップを更に含む、請求項7に記載の方法。
  9. 前記線形システムを解くステップが更に、線形最小二乗法及び加重最小二乗法のうちの一方を用いて過剰決定システムの式を解くステップを含む、請求項1に記載の方法。
  10. 複数の入力信号チャンネルを有する入力信号の直接−拡散分解のための方法(200、400)であって、
    前記複数の入力信号チャンネルの各々を複数の周波数帯域に分離するステップ(210、410)と、
    前記複数の周波数帯域の各々について、前記複数の入力信号チャンネルから信号の各ペア間の相関係数を推定するステップ(220、420)と、
    前記推定した相関係数と前記複数の周波数帯域の各々についての直接エネルギー率とを関連付ける線形システムの式を構築するステップ(240、440)と、
    前記線形システムを解いて、前記複数の周波数帯域の各々について前記複数の入力信号チャンネルの各々に対する前記直接エネルギー率を推定するステップ(240、440)と、
    前記直接エネルギー率に部分的に基づいて前記複数の周波数帯域の各々について直接成分出力信号及び拡散成分出力信号を生成するステップと、
    を含む、方法。
  11. 前記複数の周波数帯域の各々について前記線形システムの各式は、次式の形式を有し、
    ここで、
    が前記複数のチャンネルのうちのチャンネルi及びj間の前記相関係数、
    及び
    がチャンネルi及びjの前記直接エネルギー率である、請求項10に記載の方法。
  12. 前記信号の各ペア間の相関係数を推定するステップが、再帰的数式を用いて実行される、請求項11に記載の方法。
  13. 所定値を下回る相関係数推定値をゼロに設定し、
    前記所定値を上回るか又は等しい前記相関係数推定値の範囲を[0,1]の範囲まで線形的に拡張する、
    ことによって再帰的な前記相関係数推定値を補正するステップ(220、420)を更に含む、請求項12に記載の方法。
  14. 前記直接成分出力信号及び拡散成分出力信号を生成するステップが更に、
    前記複数のチャンネルの各々の直接エネルギー率に基づいて前記複数の周波数帯域の各々について直接及び拡散マスクを生成するステップ(250、450)と、
    前記複数の周波数帯域の各々について、前記入力信号と前記直接及び拡散マスクを乗算して前記直接成分出力信号及び拡散成分出力信号を供給するステップと、
    を含む、請求項10に記載の方法。
  15. 前記直接及び拡散マスクを時間及び/又は周波数にわたって円滑化するステップを更に含む、請求項14に記載の方法。
  16. 前記直接及び拡散マスクを円滑化するステップが更に、
    前記複数の入力信号チャンネル及び前記複数の周波数帯域についての前記相関関係推定値の分散の推定値に部分的に基づいて前記直接及び拡散マスクを円滑化するステップを含む、請求項15に記載の方法。
  17. 前記複数の周波数帯域のうちの1つにおいて前記複数の入力信号チャンネルから信号のペア間の相関係数を推定するステップが更に、
    前記信号ペア間の差違(425)が所定閾値を上回る場合、前記信号のペア間の相関係数を過大推定するステップを含む、請求項10に記載の方法。
  18. 前記複数の周波数帯域のうちの1つにおいて前記複数の入力信号チャンネルから信号のペア間の相関係数を推定するステップが更に、
    前記信号のペアの1つが過渡状態(415)を含む場合、前記信号のペア間の相関係数を過大推定するステップを含む、請求項10に記載の方法。
  19. 前記線形システムを解くステップが更に、線形最小二乗法及び加重最小二乗法のうちの一方を用いて過剰決定システムの式を解くステップを含む、請求項10に記載の方法。
  20. 複数のチャンネルを有する入力信号の直接−拡散分解のための装置(500)であって、
    プロセッサ(510)と、
    前記プロセッサに結合されたメモリ(520)と、
    前記プロセッサに結合された記憶デバイス(530)と、
    を備え、
    前記プロセッサによって実行されたときに、
    複数の信号から信号の各ペア間の相関係数を推定するステップ(110、220、320)と、
    前記推定した相関係数と前記複数のチャンネルの各々の直接エネルギー率とを関連付ける線形システムの式を構築するステップ(130、240、440)と、
    前記線形システムを解いて前記直接エネルギー率を推定するステップ(140、240、440)と、
    前記直接エネルギー率に部分的に基づいて直接成分出力信号及び拡散成分出力信号を生成するステップ(280、480)と、
    を含む動作をコンピュータデバイスに実行させる命令を前記記憶デバイスが記憶する、装置(500)。
JP2014530780A 2011-09-13 2012-09-13 直接−拡散分解方法 Active JP5965487B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201161534235P 2011-09-13 2011-09-13
US61/534,235 2011-09-13
US201261676791P 2012-07-27 2012-07-27
US61/676,791 2012-07-27
PCT/US2012/055103 WO2013040172A1 (en) 2011-09-13 2012-09-13 Direct-diffuse decomposition

Publications (2)

Publication Number Publication Date
JP2014527381A true JP2014527381A (ja) 2014-10-09
JP5965487B2 JP5965487B2 (ja) 2016-08-03

Family

ID=47883722

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014530780A Active JP5965487B2 (ja) 2011-09-13 2012-09-13 直接−拡散分解方法

Country Status (9)

Country Link
US (1) US9253574B2 (ja)
EP (1) EP2756617B1 (ja)
JP (1) JP5965487B2 (ja)
KR (1) KR102123916B1 (ja)
CN (1) CN103875197B (ja)
BR (1) BR112014005807A2 (ja)
PL (1) PL2756617T3 (ja)
TW (1) TWI590229B (ja)
WO (1) WO2013040172A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015143805A (ja) * 2014-01-31 2015-08-06 ブラザー工業株式会社 雑音抑圧装置、雑音抑圧方法、及びプログラム

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105336332A (zh) 2014-07-17 2016-02-17 杜比实验室特许公司 分解音频信号
CN105657633A (zh) 2014-09-04 2016-06-08 杜比实验室特许公司 生成针对音频对象的元数据
US10187740B2 (en) * 2016-09-23 2019-01-22 Apple Inc. Producing headphone driver signals in a digital audio signal processing binaural rendering environment
CA3078420A1 (en) 2017-10-17 2019-04-25 Magic Leap, Inc. Mixed reality spatial audio
IL276510B2 (en) 2018-02-15 2024-02-01 Magic Leap Inc Virtual reverberation in mixed reality
ES2909343T3 (es) * 2018-04-05 2022-05-06 Fraunhofer Ges Forschung Aparato, método o programa informático para estimar una diferencia de tiempo entre canales
US10779082B2 (en) 2018-05-30 2020-09-15 Magic Leap, Inc. Index scheming for filter parameters
EP4049466A4 (en) 2019-10-25 2022-12-28 Magic Leap, Inc. REVERBER FOOTPRINT ESTIMATION

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070269063A1 (en) * 2006-05-17 2007-11-22 Creative Technology Ltd Spatial audio coding based on universal spatial cues
WO2010113434A1 (ja) * 2009-03-31 2010-10-07 パナソニック株式会社 音響再生装置及び音響再生方法
JP2010541350A (ja) * 2007-09-26 2010-12-24 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 周囲信号を抽出するための重み付け係数を取得する装置および方法における周囲信号を抽出する装置および方法、並びに、コンピュータプログラム

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5185805A (en) * 1990-12-17 1993-02-09 David Chiang Tuned deconvolution digital filter for elimination of loudspeaker output blurring
US7412380B1 (en) * 2003-12-17 2008-08-12 Creative Technology Ltd. Ambience extraction and modification for enhancement and upmix of audio signals
US8019614B2 (en) 2005-09-02 2011-09-13 Panasonic Corporation Energy shaping apparatus and energy shaping method
US8180067B2 (en) 2006-04-28 2012-05-15 Harman International Industries, Incorporated System for selectively extracting components of an audio input signal
US9088855B2 (en) * 2006-05-17 2015-07-21 Creative Technology Ltd Vector-space methods for primary-ambient decomposition of stereo audio signals
US8204237B2 (en) 2006-05-17 2012-06-19 Creative Technology Ltd Adaptive primary-ambient decomposition of audio signals
US8345899B2 (en) * 2006-05-17 2013-01-01 Creative Technology Ltd Phase-amplitude matrixed surround decoder
WO2008046530A2 (en) 2006-10-16 2008-04-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for multi -channel parameter transformation
US8374355B2 (en) * 2007-04-05 2013-02-12 Creative Technology Ltd. Robust and efficient frequency-domain decorrelation method
JP2010538571A (ja) * 2007-09-06 2010-12-09 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US8107631B2 (en) 2007-10-04 2012-01-31 Creative Technology Ltd Correlation-based method for ambience extraction from two-channel audio signals
US8103005B2 (en) * 2008-02-04 2012-01-24 Creative Technology Ltd Primary-ambient decomposition of stereo audio signals using a complex similarity index
EP2196988B1 (en) 2008-12-12 2012-09-05 Nuance Communications, Inc. Determination of the coherence of audio signals
US8660281B2 (en) * 2009-02-03 2014-02-25 University Of Ottawa Method and system for a multi-microphone noise reduction
US8705769B2 (en) * 2009-05-20 2014-04-22 Stmicroelectronics, Inc. Two-to-three channel upmix for center channel derivation
EP2360681A1 (en) * 2010-01-15 2011-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for extracting a direct/ambience signal from a downmix signal and spatial parametric information
EP2464146A1 (en) * 2010-12-10 2012-06-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decomposing an input signal using a pre-calculated reference curve

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070269063A1 (en) * 2006-05-17 2007-11-22 Creative Technology Ltd Spatial audio coding based on universal spatial cues
JP2010541350A (ja) * 2007-09-26 2010-12-24 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 周囲信号を抽出するための重み付け係数を取得する装置および方法における周囲信号を抽出する装置および方法、並びに、コンピュータプログラム
WO2010113434A1 (ja) * 2009-03-31 2010-10-07 パナソニック株式会社 音響再生装置及び音響再生方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015143805A (ja) * 2014-01-31 2015-08-06 ブラザー工業株式会社 雑音抑圧装置、雑音抑圧方法、及びプログラム

Also Published As

Publication number Publication date
BR112014005807A2 (pt) 2019-12-17
US9253574B2 (en) 2016-02-02
EP2756617A1 (en) 2014-07-23
WO2013040172A1 (en) 2013-03-21
CN103875197B (zh) 2016-05-18
KR20140074918A (ko) 2014-06-18
KR102123916B1 (ko) 2020-06-17
PL2756617T3 (pl) 2017-05-31
CN103875197A (zh) 2014-06-18
JP5965487B2 (ja) 2016-08-03
US20130182852A1 (en) 2013-07-18
TW201322252A (zh) 2013-06-01
EP2756617B1 (en) 2016-11-09
TWI590229B (zh) 2017-07-01
EP2756617A4 (en) 2015-06-03

Similar Documents

Publication Publication Date Title
JP5965487B2 (ja) 直接−拡散分解方法
US10354634B2 (en) Method and system for denoise and dereverberation in multimedia systems
Vincent et al. Oracle estimators for the benchmarking of source separation algorithms
JP6385376B2 (ja) 音声信号処理のためのマルチチャネル直接・環境分解のための装置及び方法
EP2671222B1 (en) Determining the inter-channel time difference of a multi-channel audio signal
AU2015295518B2 (en) Apparatus and method for enhancing an audio signal, sound enhancing system
WO2009046225A2 (en) Correlation-based method for ambience extraction from two-channel audio signals
EP3133833B1 (en) Sound field reproduction apparatus, method and program
EP2649814A1 (en) Apparatus and method for decomposing an input signal using a downmixer
JP2017533459A (ja) マルチチャネルオーディオ信号内の音声成分を強調するための信号処理装置
JP5195979B2 (ja) 信号分離装置、および信号分離方法、並びにコンピュータ・プログラム
JP6280983B2 (ja) 信号対ダウンミックス比に基づいたセンター信号スケーリング及び立体音響強調のための装置及び方法
US10473628B2 (en) Signal source separation partially based on non-sensor information
Steinmetz et al. High-Fidelity Noise Reduction with Differentiable Signal Processing
Bagchi et al. Extending instantaneous de-mixing algorithms to anechoic mixtures
Dal Santo et al. RIR2FDN: An improved room impulse response analysis and synthesis
Mirzahasanloo et al. A generalized speech enhancement framework for bilateral cochlear implants using a single processor
Bouafif et al. Separation and mixing parameters estimation for localization in distance based on features extraction
Ciaramella et al. BSS Toolbox for delayed and convolved mixtures
BR112017000645B1 (pt) Aparelho e método para reforço de um sistema de reforço de som e sinal de áudio

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150820

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160601

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160701

R150 Certificate of patent or registration of utility model

Ref document number: 5965487

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250