JP6644197B2 - 雑音除去装置および雑音除去方法 - Google Patents
雑音除去装置および雑音除去方法 Download PDFInfo
- Publication number
- JP6644197B2 JP6644197B2 JP2019540211A JP2019540211A JP6644197B2 JP 6644197 B2 JP6644197 B2 JP 6644197B2 JP 2019540211 A JP2019540211 A JP 2019540211A JP 2019540211 A JP2019540211 A JP 2019540211A JP 6644197 B2 JP6644197 B2 JP 6644197B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- steering vector
- vector
- target sound
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title description 21
- 239000013598 vector Substances 0.000 claims description 216
- 238000001228 spectrum Methods 0.000 claims description 37
- 238000003379 elimination reaction Methods 0.000 claims description 35
- 230000008030 elimination Effects 0.000 claims description 33
- 230000000873 masking effect Effects 0.000 claims description 12
- 230000002452 interceptive effect Effects 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000010606 normalization Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000004378 air conditioning Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/178—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
- G10K11/1781—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions
- G10K11/17813—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions characterised by the analysis of the acoustic paths, e.g. estimating, calibrating or testing of transfer functions or cross-terms
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/18—Methods or devices for transmitting, conducting or directing sound
- G10K11/26—Sound-focusing or directing, e.g. scanning
- G10K11/34—Sound-focusing or directing, e.g. scanning using electrical steering of transducer arrays, e.g. beam steering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K2200/00—Details of methods or devices for transmitting, conducting or directing sound in general
- G10K2200/10—Beamforming, e.g. time reversal, phase conjugation or similar
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K2210/00—Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
- G10K2210/10—Applications
- G10K2210/128—Vehicles
- G10K2210/1282—Automobiles
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02087—Noise filtering the noise being separate speech, e.g. cocktail party
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/13—Acoustic transducers and sound field adaptation in vehicles
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Otolaryngology (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
上述した雑音除去技術により、例えば、空調設備などの機器から発生する騒音により聞き取りにくくなっている音声を明瞭化する、または複数の話者が同時に発話している際に所望の話者の音声のみを抽出することが可能となる。このように、雑音除去技術は、音声を人間にとって聞き取りやすくするだけでなく、音声認識処理の前処理として雑音を除去することにより、音声認識処理の雑音に対する頑健性を向上させることができる。
しかし、特許文献1に記載された音信号処理装置は、目的音を抽出するために音源の到来方向に関する情報として目的音の到来方向のみを用いているため、妨害音源が目的音源に対してどのような位置に存在するかが考慮されていない。そのため、特許文献1に記載された音信号処理装置は、目的音の到来方向と妨害音の到来方向が近い場合、またはセンサアレイによって観測される目的音と妨害音の位相差の差異が小さい場合等において、雑音除去性能が低下するという課題があった。
これは、目的音と妨害音の位相差が発生しにくい低周波数領域の時間−周波数マスキングにおいて、妨害音の時間−周波数スペクトルを誤って通過させる可能性が高く、高品質な出力信号を得ることが困難なためである。
また、この発明を実施するための形態において、音響センサの具体例として、無指向性のマイクロホンを用いて、センサアレイはマイクロホンアレイを用いて説明する。なお、音響センサは無指向性マイクロホンに限定されるものではなく、例えば、指向性マイクロホンまたは超音波センサも適用可能である。
図1は、実施の形態1に係る雑音除去装置100の構成を示すブロック図である。
雑音除去装置100は、観測信号取得部101、ベクトル記憶部102、目的音ベクトル選択部103、妨害音ベクトル選択部104および信号処理部105を備える。
また、雑音除去装置100には、複数のマイクロホン200a,200b,200c,・・・を備えたマイクロホンアレイ200および外部機器300が接続されている。
雑音除去装置100は、マイクロホンアレイ200によって観測された観測信号と、ベクトル記憶部102に記憶されたステアリングベクトルのうち目的音ベクトル選択部103および妨害音ベクトル選択部104が選択して出力したステアリングベクトルとに基づいて、信号処理部105が観測信号から雑音を除去した出力信号を生成し、外部機器300に出力する。
ベクトル記憶部102は、予め測定または生成された複数のステアリングベクトルを記憶する記憶領域である。ステアリングベクトルは、マイクロホンアレイ200から見た音の到来方向に対応したベクトルである。ベクトル記憶部102に記憶されるステアリングベクトルは、マイクロホンアレイ200を用いて事前に測定した、ある方向に対するインパルス応答を離散フーリエ変換し、得られた周波数スペクトルを任意のマイクロホンの周波数スペクトルによって除算し、正規化したスペクトルである。即ち、マイクロホンアレイ200を構成するマイクロホンの数をMとするとき、M個のマイクロホンによって測定されたインパルス応答を離散フーリエ変換して得られる周波数スペクトルS1(ω)〜SM(ω)を用いて構成した、以下の式(1)に示す複素ベクトルa(ω)をステアリングベクトルとする。式(1)において、ωは離散周波数、Tはベクトルの転置を表す。
ただし、以下では、説明の簡略化のため、目的音ベクトル選択部103および妨害音ベクトル選択部104は、それぞれ単一の目的音ステアリングベクトルおよび妨害音ステアリングベクトルを選択して出力するものとする。即ち、信号処理部105の出力信号は、単一の雑音が除去された目的音の信号とする。また以下では、目的音ベクトル選択部103が選択し、出力する目的音ステアリングベクトルを、目的音ステアリングベクトルatrg(ω)と記載する。同様に、妨害音ベクトル選択部104が選択し、出力する妨害音ステアリングベクトルを、妨害音ステアリングベクトルadst(ω)と記載する。
Y(ω,τ)=w(ω)Hx(ω,τ) (2)
x(ω,τ)=(X1(ω,τ),・・・,XM(ω,τ)) (3)
w(ω)Hatrg(ω)=1 (4)
w(ω)Hadst(ω)=0 (5)
AHw(ω)=r (6)
A=(atrg(ω) adst(ω)) (7)
r=(1 0)T (8)
w(ω)=A+r (9)
上述した式(9)におけるA+は、行列AのMoore−Penroseの擬似逆行列である。信号処理部105は、上述した式(9)により求めた線形フィルタ係数w(ω)を用いて、上述した式(2)の計算を行う。これにより、信号処理部105は、雑音が除去された時間−周波数スペクトルY(ω,τ)を取得する。信号処理部105は、取得した時間−周波数スペクトルY(ω,τ)を離散逆フーリエ変換し、時間波形を再構成して最終的な出力信号として出力する。
図2Aおよび図2Bは、雑音除去装置100のハードウェア構成例を示す図である。
雑音除去装置100におけるベクトル記憶部102は、ストレージ100aにより実現される。また、雑音除去装置100における観測信号取得部101、目的音ベクトル選択部103、妨害音ベクトル選択部104および信号処理部105の各機能は、処理回路により実現される。即ち、雑音除去装置100は、上記各機能を実現するための処理回路を備える。当該処理回路は、図2Aに示すように専用のハードウェアである処理回路100bであってもよいし、図2Bに示すようにメモリ100dに格納されているプログラムを実行するプロセッサ100cであってもよい。
メモリ100dは、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ、EPROM(Erasable Programmable ROM)、EEPROM(Electrically EPROM)等の不揮発性または揮発性の半導体メモリであってもよいし、ハードディスク、フレキシブルディスク等の磁気ディスクであってもよいし、ミニディスク、CD(Compact Disc)、DVD(Digital Versatile Disc)等の光ディスクであってもよい。
図3は、実施の形態1に係る雑音除去装置100の信号処理部105の動作を示すフローチャートである。
図3のフローチャートでは、雑音除去装置100が雑音除去処理を行っている間は、目的音源および雑音源の位置が変化しないものとして説明を行う。即ち、雑音除去処理を行っている間は、目的音ステアリングベクトル、および妨害音ステアリングベクトルが変化しないものとする。
信号処理部105は、目的音ベクトル選択部103が選択した目的音ステアリングベクトルと、妨害音ベクトル選択部104が選択した妨害音ステアリングベクトルとから、線形フィルタ係数w(ω)を求める(ステップST1)。信号処理部105は、観測信号取得部101から入力される観測信号を一時格納領域(図示しない)に蓄積する(ステップST2)。
上述した実施の形態1では、信号処理部105を線形ビームフォーミングに基づく方法により実装する構成を示したが、この実施の形態2では信号処理部105を非線形処理に基づく方法により実装する構成を示す。ここで、非線形処理とは、例えば時間−周波数マスキングなどである。
実施の形態2に係る雑音除去装置100の構成を示すブロック図は、実施の形態1と同一であるため記載を省略する。また、実施の形態2に係る雑音除去装置100の構成要素は、実施の形態1で使用した符号と同一の符号を付して説明する。
以下では、信号処理部105が、観測信号取得部101から入力された観測信号と、予め測定されたベクトル記憶部102に記憶されたステアリングベクトルとの類似度に基づいて、時間−周波数マスキングによる信号処理を行う構成を示す。
式(11)によって、時間−周波数マスクB(ω、τ)は、目的音の時間−周波数スペクトルのみを通過させ、目的音以外の時間−周波数スペクトルを遮断する。
Y(ω,τ)=B(ω,τ)X1(ω,τ) (12)
信号処理部105は、得られた時間−周波数スペクトルY(ω,τ)を離散逆フーリエ変換し、時間波形を再構成し、出力信号を生成する。信号処理部105は、生成した出力信号を、外部機器300に出力する。
図4のフローチャートで示した処理を行う前提として、雑音除去装置100が、雑音除去処理を行っている間は、目的音ステアリングベクトル、および妨害音ステアリングベクトルが変化しないものとする。
なお、以下では、実施の形態1に係る雑音除去装置100と同一のステップには図3で使用した符号と同一の符号を付し、説明を省略または簡略化する。
まず、実施の形態1または実施の形態2で示した雑音除去装置100を、録音システムに適用した場合について説明する。
図5は、実施の形態1または実施の形態2に係る雑音除去装置100の適用例を示す図である。図5では、雑音除去装置100を、例えば会議の音声を録音する録音システムに適用した場合を示している。
図5に示すように、雑音除去装置100は、会議机400の上に配置される。会議机400の周囲に配置された複数の椅子500に会議参加者が着座する。雑音除去装置100のベクトル記憶部102は、予め、雑音除去装置100に接続されたマイクロホンアレイ200から見た各椅子500の配置方向に対応するステアリングベクトルを測定した結果を記憶しているものとする。
会議参加者が各椅子500に着座した会議が開始されると、マイクロホンアレイ200が各会議参加者の音声を集音し、観測信号として雑音除去装置100に出力する。雑音除去装置100の観測信号取得部101は、入力された観測信号をデジタル信号に変換して信号処理部105に出力する。信号処理部105は、観測信号取得部101から入力された観測信号と、目的音ベクトル選択部103が選択した目的音ステアリングベクトルと、妨害音ベクトル選択部104が選択した妨害音ステアリングベクトルとを用いて、会議参加者の個別の発話を抽出する。外部機器300は、信号処理部105が抽出した会議参加者の個別の発話の音声信号を録音する。これにより、録音システムを用いて、例えば議事録の作成を容易に行うことができる。
会議参加者が各椅子500に着座して会議が開始されると、マイクロホンアレイ200が会議参加者の音声を集音し、観測信号として雑音除去装置100に出力する。雑音除去装置100の観測信号取得部101は、入力された観測信号をデジタル信号に変換して信号処理部105に出力する。信号処理部105は、観測信号取得部101から入力された観測信号と、目的音ベクトル選択部103が選択した目的音ステアリングベクトルと、妨害音ベクトル選択部104が選択した妨害音ステアリングベクトルとを用いて、ある会議参加者の発話のみを抽出する。外部機器300は、信号処理部105が抽出したある会議参加者の発話の音声信号を録音する。
図6は、実施の形態1または実施の形態2に係る雑音除去装置100の適用例を示す図である。図6では、雑音除去装置100を車両内のハンズフリー通話システムまたは音声認識システムに適用した場合を示している。雑音除去装置100は、例えば、車両600の前方、即ち運転席601および助手席602に対して車両600の前方に配置される。
Claims (7)
- 予め取得された、2個以上の音響センサを備えたセンサアレイに対する音の到来方向を示すステアリングベクトルから、目的音の到来方向を示す目的音ステアリングベクトルを選択する目的音ベクトル選択部と、
前記予め取得されたステアリングベクトルから、前記目的音以外の妨害音の到来方向を示す妨害音ステアリングベクトルを選択する妨害音ベクトル選択部と、
前記センサアレイから得られる2以上の観測信号と、前記目的音ベクトル選択部が選択した前記目的音ステアリングベクトルと、前記妨害音ベクトル選択部が選択した前記妨害音ステアリングベクトルとに基づいて、前記妨害音の時間−周波数スペクトルを遮断するマスクを用いた時間−周波数マスキングにより、前記観測信号から前記妨害音を除去した信号を取得する信号処理部とを備え、
前記時間−周波数マスキングは、前記2以上の観測信号から時間−周波数ごとのステアリングベクトルを推定し、当該推定した観測信号のステアリングベクトルと、前記目的音ステアリングベクトルおよび前記妨害音ステアリングベクトルとの類似度を算出し、当該算出した類似度が最大となるステアリングベクトルが、前記目的音ステアリングベクトルである場合に、前記観測信号の時間−周波数スペクトルを通過させ、前記算出した類似度が最大となるステアリングベクトルが前記目的音ステアリングベクトルでない場合に、前記観測信号の時間−周波数スペクトルを遮断することを特徴とする雑音除去装置。 - 前記予め取得された音の到来方向を示すステアリングベクトルを記憶するベクトル記憶部を備えたことを特徴とする請求項1記載の雑音除去装置。
- 前記予め取得された音の到来方向を示すステアリングベクトルは、ユーザが着座すると推定された位置から前記センサアレイへの音の到来方向を示すステアリングベクトルであることを特徴とする請求項1記載の雑音除去装置。
- 前記信号処理部は、前記着座すると推定された位置に着座したユーザの音声を、前記観測信号から抽出または除去することを特徴とする請求項3記載の雑音除去装置。
- 前記予め取得された音の到来方向を示すステアリングベクトルは、車両内の運転席および助手席から前記センサアレイへの音の到来方向を示すステアリングベクトルであることを特徴とする請求項1記載の雑音除去装置。
- 前記信号処理部は、前記運転席または前記助手席に着座したユーザの音声を、前記観測信号から抽出または除去することを特徴とする請求項5記載の雑音除去装置。
- 目的音ベクトル選択部が、予め取得された、2個以上の音響センサを備えたセンサアレイに対する音の到来方向を示すステアリングベクトルから、目的音の到来方向を示す目的音ステアリングベクトルを選択するステップと、
妨害音ベクトル選択部が、前記予め取得されたステアリングベクトルから、前記目的音以外の妨害音の到来方向を示す妨害音ステアリングベクトルを選択するステップと、
信号処理部が、前記センサアレイから得られる2以上の観測信号と、前記選択した前記目的音ステアリングベクトルと、前記選択した前記妨害音ステアリングベクトルとに基づいて、前記妨害音の時間−周波数スペクトルを遮断するマスクを用いた時間−周波数マスキングにより、前記観測信号から前記妨害音を除去した信号を取得するステップとを備え、
前記時間−周波数マスキングは、前記2以上の観測信号から時間−周波数ごとのステアリングベクトルを推定し、当該推定した観測信号のステアリングベクトルと、前記目的音ステアリングベクトルおよび前記妨害音ステアリングベクトルとの類似度を算出し、当該算出した類似度が最大となるステアリングベクトルが、前記目的音ステアリングベクトルである場合に、前記観測信号の時間−周波数スペクトルを通過させ、前記算出した類似度が最大となるステアリングベクトルが前記目的音ステアリングベクトルでない場合に、前記観測信号の時間−周波数スペクトルを遮断することを特徴とする雑音除去方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2017/032311 WO2019049276A1 (ja) | 2017-09-07 | 2017-09-07 | 雑音除去装置および雑音除去方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019049276A1 JPWO2019049276A1 (ja) | 2019-12-26 |
JP6644197B2 true JP6644197B2 (ja) | 2020-02-12 |
Family
ID=65633745
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019540211A Active JP6644197B2 (ja) | 2017-09-07 | 2017-09-07 | 雑音除去装置および雑音除去方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20210098014A1 (ja) |
JP (1) | JP6644197B2 (ja) |
CN (1) | CN111052766B (ja) |
DE (1) | DE112017007800T5 (ja) |
WO (1) | WO2019049276A1 (ja) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9565493B2 (en) | 2015-04-30 | 2017-02-07 | Shure Acquisition Holdings, Inc. | Array microphone system and method of assembling the same |
US9554207B2 (en) | 2015-04-30 | 2017-01-24 | Shure Acquisition Holdings, Inc. | Offset cartridge microphones |
US10367948B2 (en) | 2017-01-13 | 2019-07-30 | Shure Acquisition Holdings, Inc. | Post-mixing acoustic echo cancellation systems and methods |
CN112335261B (zh) | 2018-06-01 | 2023-07-18 | 舒尔获得控股公司 | 图案形成麦克风阵列 |
US11297423B2 (en) | 2018-06-15 | 2022-04-05 | Shure Acquisition Holdings, Inc. | Endfire linear array microphone |
US11310596B2 (en) | 2018-09-20 | 2022-04-19 | Shure Acquisition Holdings, Inc. | Adjustable lobe shape for array microphones |
US11558693B2 (en) | 2019-03-21 | 2023-01-17 | Shure Acquisition Holdings, Inc. | Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition and voice activity detection functionality |
US11438691B2 (en) | 2019-03-21 | 2022-09-06 | Shure Acquisition Holdings, Inc. | Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition functionality |
US11303981B2 (en) | 2019-03-21 | 2022-04-12 | Shure Acquisition Holdings, Inc. | Housings and associated design features for ceiling array microphones |
WO2020237206A1 (en) | 2019-05-23 | 2020-11-26 | Shure Acquisition Holdings, Inc. | Steerable speaker array, system, and method for the same |
WO2020243471A1 (en) | 2019-05-31 | 2020-12-03 | Shure Acquisition Holdings, Inc. | Low latency automixer integrated with voice and noise activity detection |
EP4018680A1 (en) | 2019-08-23 | 2022-06-29 | Shure Acquisition Holdings, Inc. | Two-dimensional microphone array with improved directivity |
US12028678B2 (en) | 2019-11-01 | 2024-07-02 | Shure Acquisition Holdings, Inc. | Proximity microphone |
CN110970046B (zh) * | 2019-11-29 | 2022-03-11 | 北京搜狗科技发展有限公司 | 一种音频数据处理的方法及装置、电子设备、存储介质 |
JP7004875B2 (ja) * | 2019-12-20 | 2022-01-21 | 三菱電機株式会社 | 情報処理装置、算出方法、及び算出プログラム |
US11552611B2 (en) | 2020-02-07 | 2023-01-10 | Shure Acquisition Holdings, Inc. | System and method for automatic adjustment of reference gain |
WO2021243368A2 (en) | 2020-05-29 | 2021-12-02 | Shure Acquisition Holdings, Inc. | Transducer steering and configuration systems and methods using a local positioning system |
KR20220016423A (ko) * | 2020-07-31 | 2022-02-09 | 현대자동차주식회사 | 차량 및 그의 제어방법 |
JP7171095B2 (ja) * | 2020-10-05 | 2022-11-15 | 株式会社オーディオテクニカ | 音源定位装置、音源定位方法及びプログラム |
JP2024505068A (ja) | 2021-01-28 | 2024-02-02 | シュアー アクイジッション ホールディングス インコーポレイテッド | ハイブリッドオーディオビーム形成システム |
JP2022135451A (ja) * | 2021-03-05 | 2022-09-15 | 本田技研工業株式会社 | 音響処理装置、音響処理方法およびプログラム |
CN113782046B (zh) * | 2021-09-09 | 2024-09-17 | 清华大学 | 一种用于远距离语音识别的麦克风阵列拾音方法及系统 |
CN114242104A (zh) * | 2021-12-31 | 2022-03-25 | 西安讯飞超脑信息科技有限公司 | 语音降噪的方法、装置、设备及存储介质 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003271191A (ja) * | 2002-03-15 | 2003-09-25 | Toshiba Corp | 音声認識用雑音抑圧装置及び方法、音声認識装置及び方法並びにプログラム |
JP4066197B2 (ja) * | 2005-02-24 | 2008-03-26 | ソニー株式会社 | マイクロフォン装置 |
JP2006243664A (ja) * | 2005-03-07 | 2006-09-14 | Nippon Telegr & Teleph Corp <Ntt> | 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体 |
EP1923866B1 (en) * | 2005-08-11 | 2014-01-01 | Asahi Kasei Kabushiki Kaisha | Sound source separating device, speech recognizing device, portable telephone, sound source separating method, and program |
JP4912036B2 (ja) * | 2006-05-26 | 2012-04-04 | 富士通株式会社 | 指向性集音装置、指向性集音方法、及びコンピュータプログラム |
JP2010091912A (ja) * | 2008-10-10 | 2010-04-22 | Equos Research Co Ltd | 音声強調システム |
CN102164328B (zh) * | 2010-12-29 | 2013-12-11 | 中国科学院声学研究所 | 一种用于家庭环境的基于传声器阵列的音频输入系统 |
JP2012150237A (ja) * | 2011-01-18 | 2012-08-09 | Sony Corp | 音信号処理装置、および音信号処理方法、並びにプログラム |
JP2012234150A (ja) * | 2011-04-18 | 2012-11-29 | Sony Corp | 音信号処理装置、および音信号処理方法、並びにプログラム |
CN103178881B (zh) * | 2011-12-23 | 2017-08-25 | 南京中兴新软件有限责任公司 | 主瓣干扰抑制方法及装置 |
JP2013201525A (ja) * | 2012-03-23 | 2013-10-03 | Mitsubishi Electric Corp | ビームフォーミング処理装置 |
US9291697B2 (en) * | 2012-04-13 | 2016-03-22 | Qualcomm Incorporated | Systems, methods, and apparatus for spatially directive filtering |
CN104065798B (zh) * | 2013-03-21 | 2016-08-03 | 华为技术有限公司 | 声音信号处理方法及设备 |
JP5958717B2 (ja) * | 2013-07-19 | 2016-08-02 | パナソニックIpマネジメント株式会社 | 指向性制御システム、指向性制御方法、収音システム及び収音制御方法 |
JP2015046759A (ja) * | 2013-08-28 | 2015-03-12 | 三菱電機株式会社 | ビームフォーミング処理装置およびビームフォーミング処理方法 |
CN104200817B (zh) * | 2014-07-31 | 2017-07-28 | 广东美的制冷设备有限公司 | 语音控制方法和系统 |
US10650841B2 (en) * | 2015-03-23 | 2020-05-12 | Sony Corporation | Sound source separation apparatus and method |
JP6724905B2 (ja) * | 2015-04-16 | 2020-07-15 | ソニー株式会社 | 信号処理装置、信号処理方法、およびプログラム |
WO2017056288A1 (ja) * | 2015-10-01 | 2017-04-06 | 三菱電機株式会社 | 音響信号処理装置、音響処理方法、監視装置および監視方法 |
JP6584930B2 (ja) * | 2015-11-17 | 2019-10-02 | 株式会社東芝 | 情報処理装置、情報処理方法およびプログラム |
JP6434657B2 (ja) * | 2015-12-02 | 2018-12-05 | 日本電信電話株式会社 | 空間相関行列推定装置、空間相関行列推定方法および空間相関行列推定プログラム |
JP6594222B2 (ja) * | 2015-12-09 | 2019-10-23 | 日本電信電話株式会社 | 音源情報推定装置、音源情報推定方法、およびプログラム |
CN106887236A (zh) * | 2015-12-16 | 2017-06-23 | 宁波桑德纳电子科技有限公司 | 一种声像联合定位的远距离语音采集装置 |
-
2017
- 2017-09-07 JP JP2019540211A patent/JP6644197B2/ja active Active
- 2017-09-07 CN CN201780094342.6A patent/CN111052766B/zh active Active
- 2017-09-07 US US16/635,101 patent/US20210098014A1/en not_active Abandoned
- 2017-09-07 WO PCT/JP2017/032311 patent/WO2019049276A1/ja active Application Filing
- 2017-09-07 DE DE112017007800.8T patent/DE112017007800T5/de active Granted
Also Published As
Publication number | Publication date |
---|---|
CN111052766B (zh) | 2021-07-27 |
DE112017007800T5 (de) | 2020-06-25 |
JPWO2019049276A1 (ja) | 2019-12-26 |
US20210098014A1 (en) | 2021-04-01 |
WO2019049276A1 (ja) | 2019-03-14 |
CN111052766A (zh) | 2020-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6644197B2 (ja) | 雑音除去装置および雑音除去方法 | |
JP5156260B2 (ja) | 雑音を除去して目的音を抽出する方法、前処理部、音声認識システムおよびプログラム | |
JP5007442B2 (ja) | 発話改善のためにマイク間レベル差を用いるシステム及び方法 | |
JP6389259B2 (ja) | マイクロホンアレイを使用した残響音の抽出 | |
US20170140771A1 (en) | Information processing apparatus, information processing method, and computer program product | |
EP2777297B1 (en) | Method and apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an ambisonics representation of the sound field | |
JP5124014B2 (ja) | 信号強調装置、その方法、プログラム及び記録媒体 | |
JP5573517B2 (ja) | 雑音除去装置および雑音除去方法 | |
US9093079B2 (en) | Method and apparatus for blind signal recovery in noisy, reverberant environments | |
Schmidt et al. | Signal processing for in-car communication systems | |
BR112015014380B1 (pt) | Filtro e método para filtragem espacial informada utilizando múltiplas estimativas da direção de chegada instantânea | |
EP1538867B1 (en) | Handsfree system for use in a vehicle | |
JP6840302B2 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
JP4457221B2 (ja) | 音源分離方法およびそのシステム、並びに音声認識方法およびそのシステム | |
JP2007180896A (ja) | 音声信号処理装置および音声信号処理方法 | |
JP2007047427A (ja) | 音声処理装置 | |
JP5405130B2 (ja) | 音再生装置および音再生方法 | |
US20130253923A1 (en) | Multichannel enhancement system for preserving spatial cues | |
JP6567216B2 (ja) | 信号処理装置 | |
Reindl et al. | An acoustic front-end for interactive TV incorporating multichannel acoustic echo cancellation and blind signal extraction | |
JP7004875B2 (ja) | 情報処理装置、算出方法、及び算出プログラム | |
CN111863017B (zh) | 一种基于双麦克风阵列的车内定向拾音方法及相关装置 | |
KR102699927B1 (ko) | 다채널 음성향상을 위한 인수분해 mvdr 빔포밍 장치 및 방법 | |
JP6956929B2 (ja) | 情報処理装置、制御方法、及び制御プログラム | |
Jeyasingh et al. | Enhancement of speech through source separation for conferencing systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191002 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20191002 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20191023 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191029 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191210 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200107 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6644197 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |