JP2019514056A - オーディオ源分離 - Google Patents
オーディオ源分離 Download PDFInfo
- Publication number
- JP2019514056A JP2019514056A JP2018552048A JP2018552048A JP2019514056A JP 2019514056 A JP2019514056 A JP 2019514056A JP 2018552048 A JP2018552048 A JP 2018552048A JP 2018552048 A JP2018552048 A JP 2018552048A JP 2019514056 A JP2019514056 A JP 2019514056A
- Authority
- JP
- Japan
- Prior art keywords
- matrix
- audio
- frequency
- wiener filter
- updated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000926 separation method Methods 0.000 title description 23
- 239000011159 matrix material Substances 0.000 claims abstract description 340
- 238000000034 method Methods 0.000 claims abstract description 86
- 230000003595 spectral effect Effects 0.000 claims description 31
- 230000002123 temporal effect Effects 0.000 claims description 8
- 230000001419 dependent effect Effects 0.000 claims description 7
- 230000007423 decrease Effects 0.000 claims description 3
- 230000005236 sound signal Effects 0.000 description 21
- 238000012804 iterative process Methods 0.000 description 10
- 230000000875 corresponding effect Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000003860 storage Methods 0.000 description 4
- 239000000203 mixture Substances 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000002922 simulated annealing Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Otolaryngology (AREA)
- General Health & Medical Sciences (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
・共分散行列はRXX、RSS、RXSなどと記されることがあり、共分散行列のすべての非対角項を0にすることによって得られる対応する行列はΣX、ΣSなどと記されることがある。
・演算子‖・‖はベクトルについてのL2ノルムおよび行列についてのフロベニウス・ノルムを表わすために使われることがある。いずれの場合にも、この演算子は典型的にはすべての要素の平方の和の平方根からなる。
・表現A.Bは二つの行列AおよびBの要素ごとの積を表わすことがある。さらに、表現
・表現BHは、Bが実数値の行列であればBの転置を表わすことがあり、Bが複素数値の行列であればBの共役転置を表わすことがある。
任意の後続のクリップについて、源のスペクトル・パワー行列は、前のクリップについての前に推定されたウィーナー・フィルタ・パラメータΩをオーディオ・チャネル302の共分散行列に適用することによって初期化されてもよい。
〔EEE1〕
I個のオーディオ・チャネル(302)からJ個のオーディオ源(301)を抽出する方法(100)であって、I、J>1であり、前記オーディオ・チャネル(302)は複数のクリップを含み、各クリップはN個のフレームを含み、N>1であり、I個のオーディオ・チャネル(302)は、周波数領域でチャネル行列として表現可能であり、J個のオーディオ源(301)は周波数領域で源行列として表現可能であり、当該方法(100)は、現在のクリップのフレームnについて、少なくとも一つの周波数ビンfについて、かつ現在の反復工程について、
・ウィーナー・フィルタ行列を、
・前記源行列から前記チャネル行列の推定を提供するよう適応された混合行列、および
・J個のオーディオ源(301)のスペクトル・パワーを示すJ個のオーディオ源(301)のパワー行列に基づいて、
更新する段階(102)であって、前記ウィーナー・フィルタ行列は、前記チャネル行列から前記源行列の推定を提供するよう構成される、段階と;
・I個のオーディオ・チャネル(302)およびJ個のオーディオ源(301)の相互共分散行列ならびにJ個のオーディオ源(301)の自己共分散行列を、
・更新されたウィーナー・フィルタ行列、および
・I個のオーディオ・チャネル(302)の自己共分散行列に基づいて、
更新する段階(103)と;
・前記混合行列および前記パワー行列を
・I個のオーディオ・チャネル(302)およびJ個のオーディオ源(301)の更新された相互共分散行列、および/または
・J個のオーディオ源(301)の更新された自己共分散行列に基づいて、更新する段階(104)とを含む、
方法(100)。
〔EEE2〕
当該方法(100)が、現在のクリップのフレームnについてのI個のオーディオ・チャネル(302)の自己共分散行列を、一つまたは複数の以前のクリップの諸フレームからおよび一つまたは複数の将来のクリップの諸フレームから決定することを含む、EEE1記載の方法(100)。
〔EEE3〕
当該方法(100)が、I個のオーディオ・チャネル(302)を時間領域から周波数領域に変換することによって前記チャネル行列を決定することを含む、EEE1または2記載の方法(100)。
〔EEE4〕
前記チャネル行列が短期フーリエ変換を使って決定される、EEE3記載の方法(100)。
〔EEE5〕
・当該方法(100)が、現在のクリップのフレームnについておよび少なくとも一つの周波数ビンfについての前記源行列の推定を、Sfn=ΩfnXfnとして決定することを含み;
・Sfnは前記源行列の推定であり;
・Ωfnは前記ウィーナー・フィルタ行列であり;
・Xfnは前記チャネル行列である、
EEE1ないし4のうちいずれか一項記載の方法(100)。
〔EEE6〕
当該方法(100)が、最大反復回数に達するまでまたは前記混合行列に関する収束基準が満たされるまで前記の更新する段階(102、103、104)を実行して前記ウィーナー・フィルタ行列を決定することを含む、EEE1ないし5のうちいずれか一項記載の方法(100)。
〔EEE7〕
・周波数領域がF個の周波数ビンに細分され;
・前記ウィーナー・フィルタ行列が、F個の周波数ビンについて決定され:
・前記F個の周波数ビンは ̄F個の周波数バンドにグループ化され、 ̄F<Fであり;
・I個のオーディオ・チャネル(302)の前記自己共分散行列は、 ̄F個の周波数バンドについて決定され;
・J個のオーディオ源(301)の前記パワー行列は、 ̄F個の周波数バンドについて決定される、
EEE1ないし6のうちいずれか一項記載の方法(100)。
〔EEE8〕
・前記ウィーナー・フィルタ行列は、ノイズ・パワー項を含むノイズ・パワー行列に基づいて更新され;
・前記ノイズ・パワー項は反復工程数が増すとともに減少する、
EEE1ないし7のうちいずれか一項記載の方法(100)。
〔EEE9〕
・現在のクリップのフレームnについて、周波数バンド ̄f内にある周波数ビンfについて、前記ウィーナー・フィルタ行列は、I<Jについては
・Ωfnは更新されたウィーナー・フィルタ行列であり、
・
・Afnは前記混合行列であり、
・ΣBはノイズ・パワー行列である、
EEE1ないし8のうちいずれか一項記載の方法(100)。
〔EEE10〕
前記ウィーナー・フィルタ行列は、J個のオーディオ源(301)に関して直交制約条件を適用することによって更新される、EEE1ないし9のうちいずれか一項記載の方法(100)。
〔EEE11〕
前記ウィーナー・フィルタ行列は、J個のオーディオ源(301)の前記自己共分散行列の非対角項のパワーを低下させるために逐次反復的に更新される、EEE10記載の方法(100)。
〔EEE12〕
・前記ウィーナー・フィルタ行列は勾配
・
・
・[ ]Dは括弧内に含まれる行列においてすべての非対角要素を0と置いた対角行列であり、
・εは小さな実数である、
EEE10または11記載の方法(100)。
〔EEE13〕
・I個のオーディオ・チャネル(302)およびJ個のオーディオ源(301)の相互共分散行列は、
・
・
・
EEE1ないし12のうちいずれか一項記載の方法(100)。
〔EEE14〕
・J個のオーディオ源(301)の前記自己共分散行列は
・
・
・
EEE1ないし13のうちいずれか一項記載の方法(100)。
〔EEE15〕
前記混合行列を更新すること(104)は、
・フレームnについてのJ個のオーディオ源(301)の周波数独立な自己共分散行列
・フレームnについてI個のオーディオ・チャネル(302)およびJ個のオーディオ源(301)の周波数独立な相互共分散行列
EEE1ないし14のうちいずれか一項記載の方法(100)。
〔EEE16〕
・前記混合行列は、
・Anは、フレームnについての周波数独立な混合行列である、
EEE15記載の方法(100)。
〔EEE17〕
・当該方法が、周波数依存の重み付け項efnを、I個のオーディオ・チャネル(302)の自己共分散行列
・周波数独立の自己共分散行列
EEE15または16記載の方法(100)。
〔EEE18〕
・前記パワー行列を更新すること(104)は、周波数ビンfについてかつフレームnについてのj番目のオーディオ源(301)についての更新されたパワー行列項(ΣS)jj,fnを、
EEE1ないし17のうちいずれか一項記載の方法(100)。
〔EEE19〕
・前記パワー行列を更新すること(104)は、J個のオーディオ源(301)について、スペクトル・シグネチャーWおよび時間シグネチャーHを、前記パワー行列の非負行列因子分解を使って決定することを含み、
・j番目のオーディオ源(301)についてのスペクトル・シグネチャーWおよび時間シグネチャーHは、j番目のオーディオ源(301)についての更新されたパワー行列項(ΣS)jj,fnに基づいて決定され、
・前記パワー行列を更新すること(104)は、j番目のオーディオ源(301)についてのさらなる更新されたパワー行列項(ΣS)jj,fnを
EEE18記載の方法(100)。
〔EEE20〕
当該方法(100)がさらに、
・前記混合行列を、現在のクリップの直前のクリップのフレームについて決定された混合行列を使って初期化する(101)ことを含み;
・前記パワー行列を、現在のクリップのフレームnについてのI個のオーディオ・チャネル(302)の自己共分散行列に基づき、かつ、現在のクリップの直前のクリップのフレームについて決定されたウィーナー・フィルタ行列に基づいて初期化する(101)ことを含む、
EEE1ないし19のうちいずれか一項記載の方法(100)。
〔EEE21〕
プロセッサ上での実行のために、かつコンピューティング装置上で実行されたときに請求項1ないし20のうちいずれか一項記載の方法段階を実行するために適応されているソフトウェア・プログラムを有する、記憶媒体。
〔EEE22〕
I個のオーディオ・チャネル(302)からJ個のオーディオ源(301)を抽出するシステムであって、I、J>1であり、前記オーディオ・チャネル(302)は複数のクリップを含み、各クリップはN個のフレームを含み、N>1であり、前記I個のオーディオ・チャネル(302)は、周波数領域でチャネル行列として表現可能であり、前記J個のオーディオ源(301)は周波数領域で源行列として表現可能であり、当該システムは、現在のクリップのフレームnについて、少なくとも一つの周波数ビンfについて、かつ現在の反復工程について、
・ウィーナー・フィルタ行列を、
・前記源行列から前記チャネル行列の推定を提供するよう構成された混合行列、および
・J個のオーディオ源(301)のスペクトル・パワーを示すJ個のオーディオ源(301)のパワー行列に基づいて、
更新する段階であって、前記ウィーナー・フィルタ行列は、前記チャネル行列から前記源行列の推定を提供するよう構成される、段階と;
・I個のオーディオ・チャネル(302)およびJ個のオーディオ源(301)の相互共分散行列ならびにJ個のオーディオ源(301)の自己共分散行列を、
・更新されたウィーナー・フィルタ行列、および
・I個のオーディオ・チャネル(302)の自己共分散行列に基づいて
更新する段階と;
・前記混合行列および前記パワー行列を
・I個のオーディオ・チャネル(302)およびJ個のオーディオ源(301)の更新された相互共分散行列、および/または
・J個のオーディオ源(301)の更新された自己共分散行列に基づいて、
更新する段階とを実行するよう構成されている、
システム。
Claims (15)
- I個のオーディオ・チャネル(302)からJ個のオーディオ源(301)を抽出する方法(100)であって、I、J>1であり、前記オーディオ・チャネル(302)は複数のクリップを含み、各クリップはN個のフレームを含み、N>1であり、I個のオーディオ・チャネル(302)は、周波数領域でチャネル行列として表現可能であり、J個のオーディオ源(301)は周波数領域で源行列として表現可能であり、周波数領域はF個の周波数ビンに細分され、前記F個の周波数ビンは ̄F個の周波数バンドにグループ化され、 ̄F<Fであり;当該方法(100)は、現在のクリップのフレームnについて、少なくとも一つの周波数ビンfについて、かつ現在の反復工程について、
・ウィーナー・フィルタ行列を、
・前記源行列から前記チャネル行列の推定を提供するよう適応された混合行列、および
・J個のオーディオ源(301)のスペクトル・パワーを示すJ個のオーディオ源(301)のパワー行列に基づいて、
更新する段階(102)であって、前記ウィーナー・フィルタ行列は、前記チャネル行列から前記源行列の推定を提供するよう構成され、前記ウィーナー・フィルタ行列が前記F個の周波数ビンのそれぞれについて決定される、段階と;
・I個のオーディオ・チャネル(302)およびJ個のオーディオ源(301)の相互共分散行列ならびにJ個のオーディオ源(301)の自己共分散行列を、
・更新されたウィーナー・フィルタ行列、および
・I個のオーディオ・チャネル(302)の自己共分散行列に基づいて、
更新する段階(103)と;
・前記混合行列および前記パワー行列を
・I個のオーディオ・チャネル(302)およびJ個のオーディオ源(301)の更新された相互共分散行列、および/または
・J個のオーディオ源(301)の更新された自己共分散行列に基づいて、
更新する段階(104)であって、J個のオーディオ源(301)の前記パワー行列は、前記 ̄F個の周波数バンドについて決定されるだけである、段階とを含む、
方法(100)。 - 当該方法(100)が、現在のクリップのフレームnについてのI個のオーディオ・チャネル(302)の自己共分散行列を、一つまたは複数の以前のクリップの諸フレームからおよび一つまたは複数の将来のクリップの諸フレームから決定することを含む、請求項1記載の方法(100)。
- 当該方法(100)が、I個のオーディオ・チャネル(302)を時間領域から周波数領域に変換することによって前記チャネル行列を決定することを含み、
任意的に、前記チャネル行列は短期フーリエ変換を使って決定される、
請求項1または2記載の方法(100)。 - ・当該方法(100)が、現在のクリップのフレームnについておよび少なくとも一つの周波数ビンfについての前記源行列の推定を、Sfn=ΩfnXfnとして決定することを含み;
・Sfnは前記源行列の推定であり;
・Ωfnは前記ウィーナー・フィルタ行列であり;
・Xfnは前記チャネル行列である、
請求項1ないし3のうちいずれか一項記載の方法(100)。 - 当該方法(100)が、最大反復回数に達するまでまたは前記混合行列に関する収束基準が満たされるまで前記の更新する段階(102、103、104)を実行して前記ウィーナー・フィルタ行列を決定することを含む、請求項1ないし4のうちいずれか一項記載の方法(100)。
- I個のオーディオ・チャネル(302)の前記自己共分散行列は、前記 ̄F個の周波数バンドについて決定されるだけである、請求項1ないし5のうちいずれか一項記載の方法(100)。
- ・前記ウィーナー・フィルタ行列は、ノイズ・パワー項を含むノイズ・パワー行列に基づいて更新され;
・前記ノイズ・パワー項は反復工程数が増すとともに減少する、
請求項1ないし6のうちいずれか一項記載の方法(100)。 - 前記ウィーナー・フィルタ行列は、J個のオーディオ源(301)に関して直交制約条件を適用することによって更新され、
任意的に、前記ウィーナー・フィルタ行列は、J個のオーディオ源(301)の前記自己共分散行列の非対角項のパワーを低下させるために逐次反復的に更新される、
請求項1ないし8のうちいずれか一項記載の方法(100)。 - ・I個のオーディオ・チャネル(302)およびJ個のオーディオ源(301)の相互共分散行列は、
・
・
・
および/または
・J個のオーディオ源(301)の前記自己共分散行列は
・
・
・
請求項1ないし10のうちいずれか一項記載の方法(100)。 - 前記混合行列を更新すること(104)は、
・フレームnについてのJ個のオーディオ源(301)の周波数独立な自己共分散行列
・フレームnについてI個のオーディオ・チャネル(302)およびJ個のオーディオ源(301)の周波数独立な相互共分散行列
任意的に、
・前記混合行列は、
・Anは、フレームnについての周波数独立な混合行列である、
請求項1ないし11のうちいずれか一項記載の方法(100)。 - ・前記パワー行列を更新すること(104)は、周波数ビンfについてかつフレームnについてのj番目のオーディオ源(301)についての更新されたパワー行列項(ΣS)jj,fnを、
任意的に、
・前記パワー行列を更新すること(104)は、J個のオーディオ源(301)について、スペクトル・シグネチャーWおよび時間シグネチャーHを、前記パワー行列の非負行列因子分解を使って決定することを含み、
・j番目のオーディオ源(301)についてのスペクトル・シグネチャーWおよび時間シグネチャーHは、j番目のオーディオ源(301)についての更新されたパワー行列項(ΣS)jj,fnに基づいて決定され、
・前記パワー行列を更新すること(104)は、j番目のオーディオ源(301)についてのさらなる更新されたパワー行列項(ΣS)jj,fnを
請求項1ないし13のうちいずれか一項記載の方法(100)。 - 当該方法(100)がさらに、
・前記混合行列を、現在のクリップの直前のクリップのフレームについて決定された混合行列を使って初期化する(101)ことを含み;
・前記パワー行列を、現在のクリップのフレームnについてのI個のオーディオ・チャネル(302)の自己共分散行列に基づき、かつ、現在のクリップの直前のクリップのフレームについて決定されたウィーナー・フィルタ行列に基づいて初期化する(101)ことを含む、
請求項1ないし14のうちいずれか一項記載の方法(100)。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNPCT/CN2016/078819 | 2016-04-08 | ||
CN2016078819 | 2016-04-08 | ||
US201662330658P | 2016-05-02 | 2016-05-02 | |
US62/330,658 | 2016-05-02 | ||
EP16170722 | 2016-05-20 | ||
EP16170722.9 | 2016-05-20 | ||
PCT/US2017/026296 WO2017176968A1 (en) | 2016-04-08 | 2017-04-06 | Audio source separation |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019514056A true JP2019514056A (ja) | 2019-05-30 |
JP6987075B2 JP6987075B2 (ja) | 2021-12-22 |
Family
ID=66171209
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018552048A Active JP6987075B2 (ja) | 2016-04-08 | 2017-04-06 | オーディオ源分離 |
Country Status (3)
Country | Link |
---|---|
US (2) | US10410641B2 (ja) |
EP (1) | EP3440670B1 (ja) |
JP (1) | JP6987075B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021096453A (ja) * | 2019-12-17 | 2021-06-24 | 北京小米智能科技有限公司Beijing Xiaomi Intelligent Technology Co.,Ltd. | オーディオ信号処理方法、装置、端末及び記憶媒体 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6987075B2 (ja) * | 2016-04-08 | 2021-12-22 | ドルビー ラボラトリーズ ライセンシング コーポレイション | オーディオ源分離 |
US11750985B2 (en) * | 2018-08-17 | 2023-09-05 | Cochlear Limited | Spatial pre-filtering in hearing prostheses |
US10930300B2 (en) * | 2018-11-02 | 2021-02-23 | Veritext, Llc | Automated transcript generation from multi-channel audio |
KR20190096855A (ko) * | 2019-07-30 | 2019-08-20 | 엘지전자 주식회사 | 사운드 처리 방법 및 장치 |
WO2021022235A1 (en) * | 2019-08-01 | 2021-02-04 | Dolby Laboratories Licensing Corporation | Systems and methods for covariance smoothing |
CN117012202B (zh) * | 2023-10-07 | 2024-03-29 | 北京探境科技有限公司 | 语音通道识别方法、装置、存储介质及电子设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007522536A (ja) * | 2003-11-14 | 2007-08-09 | キネテイツク・リミテツド | 動的ブラインド信号分離 |
US20140058736A1 (en) * | 2012-08-23 | 2014-02-27 | Inter-University Research Institute Corporation, Research Organization of Information and systems | Signal processing apparatus, signal processing method and computer program product |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7088831B2 (en) | 2001-12-06 | 2006-08-08 | Siemens Corporate Research, Inc. | Real-time audio source separation by delay and attenuation compensation in the time domain |
JP2005227512A (ja) | 2004-02-12 | 2005-08-25 | Yamaha Motor Co Ltd | 音信号処理方法及びその装置、音声認識装置並びにプログラム |
JP4675177B2 (ja) | 2005-07-26 | 2011-04-20 | 株式会社神戸製鋼所 | 音源分離装置,音源分離プログラム及び音源分離方法 |
JP4496186B2 (ja) | 2006-01-23 | 2010-07-07 | 株式会社神戸製鋼所 | 音源分離装置、音源分離プログラム及び音源分離方法 |
JP4672611B2 (ja) | 2006-07-28 | 2011-04-20 | 株式会社神戸製鋼所 | 音源分離装置、音源分離方法及び音源分離プログラム |
US20080208538A1 (en) | 2007-02-26 | 2008-08-28 | Qualcomm Incorporated | Systems, methods, and apparatus for signal separation |
JP5195652B2 (ja) | 2008-06-11 | 2013-05-08 | ソニー株式会社 | 信号処理装置、および信号処理方法、並びにプログラム |
WO2010068997A1 (en) | 2008-12-19 | 2010-06-24 | Cochlear Limited | Music pre-processing for hearing prostheses |
TWI397057B (zh) | 2009-08-03 | 2013-05-21 | Univ Nat Chiao Tung | 音訊分離裝置及其操作方法 |
US8787591B2 (en) | 2009-09-11 | 2014-07-22 | Texas Instruments Incorporated | Method and system for interference suppression using blind source separation |
JP5299233B2 (ja) | 2009-11-20 | 2013-09-25 | ソニー株式会社 | 信号処理装置、および信号処理方法、並びにプログラム |
US8521477B2 (en) | 2009-12-18 | 2013-08-27 | Electronics And Telecommunications Research Institute | Method for separating blind signal and apparatus for performing the same |
US8743658B2 (en) | 2011-04-29 | 2014-06-03 | Siemens Corporation | Systems and methods for blind localization of correlated sources |
JP2012238964A (ja) | 2011-05-10 | 2012-12-06 | Funai Electric Co Ltd | 音分離装置、及び、それを備えたカメラユニット |
US20120294446A1 (en) | 2011-05-16 | 2012-11-22 | Qualcomm Incorporated | Blind source separation based spatial filtering |
US9966088B2 (en) | 2011-09-23 | 2018-05-08 | Adobe Systems Incorporated | Online source separation |
WO2014034555A1 (ja) * | 2012-08-29 | 2014-03-06 | シャープ株式会社 | 音声信号再生装置、方法、プログラム、及び記録媒体 |
GB2510631A (en) | 2013-02-11 | 2014-08-13 | Canon Kk | Sound source separation based on a Binary Activation model |
RS1332U (en) | 2013-04-24 | 2013-08-30 | Tomislav Stanojević | FULL SOUND ENVIRONMENT SYSTEM WITH FLOOR SPEAKERS |
KR101735313B1 (ko) | 2013-08-05 | 2017-05-16 | 한국전자통신연구원 | 위상 왜곡을 보상한 실시간 음원분리장치 |
TW201543472A (zh) | 2014-05-15 | 2015-11-16 | 湯姆生特許公司 | 即時音源分離之方法及系統 |
CN105989851B (zh) * | 2015-02-15 | 2021-05-07 | 杜比实验室特许公司 | 音频源分离 |
CN105989852A (zh) * | 2015-02-16 | 2016-10-05 | 杜比实验室特许公司 | 分离音频源 |
JP6987075B2 (ja) * | 2016-04-08 | 2021-12-22 | ドルビー ラボラトリーズ ライセンシング コーポレイション | オーディオ源分離 |
-
2017
- 2017-04-06 JP JP2018552048A patent/JP6987075B2/ja active Active
- 2017-04-06 EP EP17717053.7A patent/EP3440670B1/en active Active
- 2017-04-06 US US16/091,069 patent/US10410641B2/en active Active
-
2019
- 2019-09-05 US US16/561,836 patent/US10818302B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007522536A (ja) * | 2003-11-14 | 2007-08-09 | キネテイツク・リミテツド | 動的ブラインド信号分離 |
US20140058736A1 (en) * | 2012-08-23 | 2014-02-27 | Inter-University Research Institute Corporation, Research Organization of Information and systems | Signal processing apparatus, signal processing method and computer program product |
JP2014041308A (ja) * | 2012-08-23 | 2014-03-06 | Toshiba Corp | 信号処理装置、方法及びプログラム |
Non-Patent Citations (1)
Title |
---|
OZEROV, ALEXEY ET AL.: ""MULTICHANNEL NONNEGATIVE MATRIX FACTORIZATION IN CONVOLUTIVE MIXTURES. WITH APPLICATION TO BLIND AU", PROC. OF 2009IEEE ICASSP, JPN6021007859, 19 April 2009 (2009-04-19), pages 3137 - 3140, XP031459935, ISSN: 0004461878 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021096453A (ja) * | 2019-12-17 | 2021-06-24 | 北京小米智能科技有限公司Beijing Xiaomi Intelligent Technology Co.,Ltd. | オーディオ信号処理方法、装置、端末及び記憶媒体 |
US11206483B2 (en) | 2019-12-17 | 2021-12-21 | Beijing Xiaomi Intelligent Technology Co., Ltd. | Audio signal processing method and device, terminal and storage medium |
JP7014853B2 (ja) | 2019-12-17 | 2022-02-01 | 北京小米智能科技有限公司 | オーディオ信号処理方法、装置、端末及び記憶媒体 |
Also Published As
Publication number | Publication date |
---|---|
EP3440670B1 (en) | 2022-01-12 |
US20190122674A1 (en) | 2019-04-25 |
JP6987075B2 (ja) | 2021-12-22 |
US10818302B2 (en) | 2020-10-27 |
US10410641B2 (en) | 2019-09-10 |
EP3440670A1 (en) | 2019-02-13 |
US20190392848A1 (en) | 2019-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6987075B2 (ja) | オーディオ源分離 | |
CN110100457B (zh) | 基于噪声时变环境的加权预测误差的在线去混响算法 | |
US11894010B2 (en) | Signal processing apparatus, signal processing method, and program | |
KR101834913B1 (ko) | 복수의 입력 오디오 신호를 잔향제거하기 위한 신호 처리 장치, 방법 및 컴퓨터가 판독 가능한 저장매체 | |
Mertins et al. | Room impulse response shortening/reshaping with infinity-and $ p $-norm optimization | |
CN108172231A (zh) | 一种基于卡尔曼滤波的去混响方法及系统 | |
JP6225245B2 (ja) | 信号処理装置、方法及びプログラム | |
CN111863015A (zh) | 一种音频处理方法、装置、电子设备和可读存储介质 | |
KR102410850B1 (ko) | 잔향 제거 오토 인코더를 이용한 잔향 환경 임베딩 추출 방법 및 장치 | |
RU2616534C2 (ru) | Ослабление шума при передаче аудиосигналов | |
JP2023536104A (ja) | 機械学習を用いたノイズ削減 | |
CN109074811B (zh) | 音频源分离 | |
JP6644356B2 (ja) | 音源分離システム、方法及びプログラム | |
JP6790659B2 (ja) | 音響処理装置および音響処理方法 | |
Zheng et al. | Statistical analysis and improvement of coherent-to-diffuse power ratio estimators for dereverberation | |
JP4714892B2 (ja) | 耐高残響ブラインド信号分離装置及び方法 | |
WO2022247427A1 (zh) | 信号滤波方法及装置、存储介质、电子装置 | |
JP2014164191A (ja) | 信号処理装置、方法及びプログラム | |
EP4038609B1 (en) | Source separation | |
CN115588438B (zh) | 一种基于双线性分解的wls多通道语音去混响方法 | |
JP7270869B2 (ja) | 情報処理装置、出力方法、及び出力プログラム | |
JP2018191255A (ja) | 収音装置、その方法、及びプログラム | |
Golokolenko et al. | The Method of Random Directions Optimization for Stereo Audio Source Separation. | |
Kim et al. | Online speech dereverberation using RLS-WPE based on a full spatial correlation matrix integrated in a speech enhancement system | |
WO2023041583A1 (en) | Apparatus and method for narrowband direction-of-arrival estimation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200406 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210303 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210316 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210610 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211102 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211130 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6987075 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |