JP2004334218A - マイクロホンアレイ方法及びシステム、並びにこれを用いた音声認識方法及び装置 - Google Patents
マイクロホンアレイ方法及びシステム、並びにこれを用いた音声認識方法及び装置 Download PDFInfo
- Publication number
- JP2004334218A JP2004334218A JP2004137875A JP2004137875A JP2004334218A JP 2004334218 A JP2004334218 A JP 2004334218A JP 2004137875 A JP2004137875 A JP 2004137875A JP 2004137875 A JP2004137875 A JP 2004137875A JP 2004334218 A JP2004334218 A JP 2004334218A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- sound signal
- unit
- separated
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 90
- 230000005236 sound signal Effects 0.000 claims abstract description 100
- 239000011159 matrix material Substances 0.000 claims abstract description 75
- 238000000926 separation method Methods 0.000 claims description 14
- 238000003491 array Methods 0.000 claims description 10
- 238000009499 grossing Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 6
- 238000012935 Averaging Methods 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 2
- 230000008878 coupling Effects 0.000 claims 1
- 238000010168 coupling process Methods 0.000 claims 1
- 238000005859 coupling reaction Methods 0.000 claims 1
- 238000000605 extraction Methods 0.000 claims 1
- 230000009466 transformation Effects 0.000 abstract 2
- 230000002708 enhancing effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 29
- 238000001228 spectrum Methods 0.000 description 14
- 239000013598 vector Substances 0.000 description 14
- 238000004364 calculation method Methods 0.000 description 12
- 238000007796 conventional method Methods 0.000 description 7
- 230000007423 decrease Effects 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000007476 Maximum Likelihood Methods 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/40—Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
- H04R2201/401—2D or 3D arrays of transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/40—Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
- H04R2201/403—Linear arrays of transducers
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Quality & Reliability (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Abstract
【解決手段】 サウンド信号を入力されるためにマイクロホンアレイを用いる入力部101と、入力された信号を周波数成分別に分離する離散フーリエ変換部102と、前記アレイをサブアレイの集合と見なしてサブアレイの広域空間共分散行列を求め、これらの平均を求める平均空間共分散行列推定部104と、推定された共分散行列を通じて信号源の位置を決定する広域MUSIC部105と、推定された共分散行列を用いて信号の歪曲を補正する広域MV部106と、周波数領域の信号を時間領域に復元する逆離散フーリエ変換部107と、を含むように、マイクロホンアレイシステムを構成する。
【選択図】図2
Description
また、本発明は前記マイクロホンアレイ方法及びシステムを用いた音声認識方法及び音声認識装置に関する。
図2は、本発明の一実施形態によって具現されたマイクロホンアレイシステムのブロック図である。
音声認識モジュールについて説明すれば次の通りである。まず、特徴抽出部201は逆離散フーリエ変換部107を通じて受けたデジタルサウンド信号に基づいて信号源の特徴を抽出する。抽出された特徴ベクトルはパターン比較部202に入力され、パターン比較部202はこれと類似したサウンドを探すためのパターンが保存されている基準パターン保存部203に保存されているパターンと特徴ベクトルとを比較する。両者を比較してマッチングされる程度の最も大きいパターン(相関度の最も大きいパターン)の相関度(マッチング点数)を決定部204に送る。決定部204はマッチング点数が一定程度以上であれば該当サウンド情報に該当する情報を決定する。
のrankはDとなる。
のrankがDになれば、信号副空間次元がDとなるので残りの固有ベクトルと直交され、結果的に干渉信号の方向に ナル(null)を形成する。もし、K個のコヒーレントな信号を分離するためには、信号源数より1つ以上多いセンサー数より構成されたサブアレイセンサーがK個あるべきなので、少なくとも全体アレイセンサーの数は2K以上にならねばならない。
を目的信号源の入射角推定とビーム形成方法に用いることによって反響環境で現れる性能低下を防止しうる。
一般に、広域MUSIC部105で行われるMUSICアルゴリズムは前述したように全ての周波数ビンに対して演算を行うので、MUSICアルゴリズムを用いる音声認識システムの計算に手間がたくさんかかる問題点がある。したがって、本発明では多数のマイクロホンで構成されるマイクロホンアレイから信号を受信した後、所定の基準によって受信した信号のうち音声信号が存在する可能性が高い周波数ビンを選択し、広域MUSIC部105をして前記選択された周波数ビンに対してのみMUSICアルゴリズム演算を行わせる周波数ビン選択部1110を前記図11で示したように信号歪曲補正モジュールに追加することによって、MUSICアルゴリズムの演算減少によるシステムの性能向上を図れる。また、共分散行列生成部1120は、前記図2で示した広域SS法を用いた空間共分散行列推定部104でもよいし、共分散行列を生成する他の形態の論理ブロックである場合も有り得る。この際、離散フーリエ変換部102では高速フーリエ変換も可能である。
102 離散フーリエ変換部
104 平均空間共分散行列推定部
105 広域MUSIC部
106 広域MV部
107 逆離散フーリエ変換部
Claims (25)
- サウンド信号を入力されるために複数のマイクロホンを用いる入力部と、
前記入力部に入力された各サウンド信号を狭域の信号に分離する周波数分離部と、
前記入力部の複数のマイクロホンを仮想のサブアレイの結合と仮定して各サブアレイ別に空間共分散行列を求め、これらを平均して平均空間共分散行列を算出する空間平滑法を用いて、前記周波数分離部を通じて分離されたサウンド信号の各周波数成分に対する空間共分散行列を求める平均空間共分散行列推定部と、
前記空間平滑法を通じて求められた平均空間共分散行列に基づいて前記サウンド信号の入射角を決定する信号源位置決定部と、
前記信号源位置決定部を通じて得たサウンド信号の入射角に基づいて前記サウンド信号の各周波数成分に掛け合わせる加重値を求め、これを掛け合わせる信号歪曲補正部と、
補正された各周波数成分を用いてサウンド信号を復元する信号復元部と、を含むことを特徴とするマイクロホンアレイシステム。 - 前記周波数分離部は離散フーリエ変換を用いて周波数を分離し、前記信号復元部は逆離散フーリエ変換を通じてサウンド信号を復元することを特徴とする請求項1に記載のマイクロホンアレイシステム。
- 前記信号源位置決定部は、前記入力部から受信したサウンド信号を前記周波数分離部により分離されたサウンド信号の各周波数成分に分離し、前記分離された周波数成分のうちから所定の基準によって選択された周波数成分に対してのみMUSICアルゴリズム演算を行うことによって前記サウンド信号の入射角を決定することを特徴とする請求項1に記載のマイクロホンアレイシステム。
- 前記信号源位置決定部は、前記入力部から受信したサウンド信号を前記周波数分離部により分離されたサウンド信号の各周波数成分に分離し、前記分離されたサウンド信号を同じ周波数成分ごとに複数のグループに分けて各グループ別に音声の存在する可能性を測定する音声信号検出部と、
前記グループのうちから前記可能性が高い順に所定数だけのグループを選択するグループ選択部と、
前記選択されたグループに属する周波数成分に対してMUSICアルゴリズム演算を行う演算部と、を含むことを特徴とする請求項4に記載のマイクロホンアレイシステム。 - サウンド信号を入力されるために複数のマイクロホンを用いる入力部、前記入力部に入力された各サウンド信号を狭域の信号に分離する周波数分離部、前記入力部の複数のマイクロホンを仮想のサブアレイの結合と仮定して各サブアレイ別に空間共分散行列を求め、これらを平均して平均空間共分散行列を算出する空間平滑法を用いて、前記周波数分離部を通じて分離されたサウンド信号の各周波数成分に対する空間共分散行列を求める平均空間共分散行列推定部、前記空間平滑法を通じて求められた平均共分散行列に基づいて前記サウンド信号の入射角を決定する信号源位置検索部、前記信号源位置検索部を通じて得たサウンド信号の入射角に基づいて前記サウンド信号の各周波数成分に掛け合わせる加重値を求め、これを掛け合わせる信号歪曲補正部、及び補正された各周波数成分を用いてサウンド信号を復元する信号復元部を含むマイクロホンアレイシステムと、
前記マイクロホンアレイシステムから入力されたサウンド信号の特徴を抽出する特徴抽出部と、
前記抽出された特徴と比較されるパターンを保存する基準パターン保存部と、
前記基準パターン保存部のパターンと前記抽出された特徴とを比較する比較部と、
前記比較された結果で音声認識の如何を判定する決定部と、を含むことを特徴とする音声認識装置。 - 前記信号源位置決定部は前記入力部から受信したサウンド信号を前記周波数分離部により分離されたサウンド信号の各周波数成分に分離し、前記分離された周波数成分のうちから所定の基準によって選択された周波数成分に対してのみMUSICアルゴリズム演算を行うことによって前記サウンド信号の入射角を決定することを特徴とする請求項6に記載の音声認識装置。
- 前記信号源位置決定部は、
前記入力部から受信したサウンド信号を前記周波数分離部により分離されたサウンド信号の各周波数成分に分離し、前記分離されたサウンド信号を同じ周波数成分ごとに複数のグループに分けて各グループ別に音声の存在可能性を測定する音声信号検出部と、
前記グループのうちから前記可能性が高い順に所定数だけのグループを選択するグループ選択部と、
前記選択されたグループに属する周波数成分に対してMUSICアルゴリズム演算を行う演算部と、を含むことを特徴とする請求項8に記載の音声認識装置。 - 複数のマイクロホンで構成されたアレイから広域のサウンド信号を入力される第1段階と、
入力された信号を複数の狭域に分離する第2段階と、
前記アレイを複数のマイクロホンで構成されたサブアレイの集合と仮定してサブアレイ別に前記分離された帯域別に所定の方式で空間共分散行列を求め、これを各帯域別に平均して帯域別に平均空間共分散行列を求める第3段階と、
前記平均空間共分散行列で前記サウンド信号の入射角を所定の公式で求める第4段階と、
前記求められた入射角に基づいて前記狭域に分離された信号に掛け合わせる加重値を計算し、これを前記狭域に分離された信号に掛け合わせる第5段階と、
前記加重値を掛け合わせた狭域信号から広域信号に復元する第6段階と、を含むことを特徴とするマイクロホンアレイ方法。 - 前記第2段階は離散フーリエ変換により、第6段階は逆離散フーリエ変換によることを特徴とする請求項10に記載のマイクロホンアレイ方法。
- 前記第4段階は、前記第1段階で受信したサウンド信号を前記第2段階で分離されたサウンド信号の各周波数成分に分離し、前記分離された周波数成分のうちから所定の基準によって選択された周波数成分に対してのみMUSICアルゴリズム演算を行うことによって前記サウンド信号の入射角を決定する段階を含むことを特徴とする請求項10に記載のマイクロホンアレイ方法。
- 前記第4段階は前記第1段階で受信したサウンド信号を前記第2段階で分離されたサウンド信号の各周波数成分に分離する段階、前記分離された各周波数成分を複数のグループに分けて各グループ別に音声の存在可能性を測定する段階、前記可能性の高い順に所定数だけのグループを選択する段階、前記選択されたグループに属する周波数成分に対してMUSICアルゴリズム演算を行う段階を含むことを特徴とする請求項13に記載のマイクロホンアレイ方法。
- 複数のマイクロホンで構成されたアレイから広域のサウンド信号を入力される第1段階と、
入力された信号を複数の狭域に分離する第2段階と、
前記アレイを複数のマイクロホンで構成されたサブアレイの集合と仮定してサブアレイ別に前記分離された帯域別に所定の方式で空間共分散行列を求め、これを各帯域別に平均して帯域別に平均空間共分散行列を求める第3段階と、
前記平均空間共分散行列で前記サウンド信号の入射角を所定の公式で求める第4段階と、
前記求められた入射角に基づいて前記狭域に分離された信号に掛け合わせる加重値を計算し、これを前記狭域に分離された信号に掛け合わせる第5段階と、
前記加重値を掛け合わせた狭域信号から広域信号に復元する第6段階と、
前記復元された広域信号の特徴を抽出する第7段階と、
前記抽出された特徴と基準パターンとを比較する第8段階と、
前記特徴と基準パターンとを比較した結果で音声認識如何を決定する第9段階と、を含むことを特徴とする音声認識方法。 - 前記第2段階は離散フーリエ変換により、第6段階は逆離散フーリエ変換によることを特徴とする請求項15に記載の音声認識方法
- 前記第4段階は、前記第1段階で受信したサウンド信号を前記第2段階で分離されたサウンド信号の各周波数成分に分離し、前記分離された周波数成分のうちから所定の基準によって選択された周波数成分に対してのみMUSICアルゴリズム演算を行うことによって前記サウンド信号の入射角を決定する段階を含むことを特徴とする請求項15に記載の音声認識方法。
- 前記第4段階は、前記第1段階で受信したサウンド信号を前記第2段階で分離されたサウンド信号の各周波数成分に分離する段階、前記分離されたサウンド信号を同じ周波数成分ごとに複数のグループに分けて各グループ別に音声の存在する可能性を測定する段階、前記可能性の高い順に所定数だけのグループを選択する段階、前記選択されたグループに属する周波数成分に対してMUSICアルゴリズム演算を行う段階を含む請求項18に記載の音声認識方法。
- サウンド信号を入力される複数のマイクロホンを含む信号入力部と、
前記信号入力部に入力されたサウンド信号を狭域の信号に分離する周波数分離部と、
前記周波数分離部により分離されたサウンド信号の各周波数成分のうちから所定の基準によって選択された周波数成分に対してMUSICアルゴリズム演算を行う信号処理部と、
前記信号処理部の処理結果を用いて音声信号の方向を検出する方向検出部と、を含むことを特徴とする音声認識装置。 - 前記周波数分離部は離散フーリエ変換を用いて周波数を分離することを特徴とする請求項20に記載の音声認識装置。
- 前記信号処理部は、前記信号入力部から受信したサウンド信号を前記周波数分離部により分離されたサウンド信号の各周波数成分に分離し、前記分離された各周波数成分を複数のグループに分けて各グループ別に音声の存在可能性を測定する音声信号検出部と、
前記グループのうちから前記可能性の高い順に所定数だけのグループを選択するグループ選択部と、
前記選択されたグループに属する周波数成分に対してMUSICアルゴリズム演算を行う演算部と、を含むことを特徴とする請求項20に記載の音声認識装置。 - 複数のマイクロホンからサウンド信号を受信する(a)段階と、
前記受信したサウンド信号を狭域の信号に分離する(b)段階と、
前記分離されたサウンド信号の各周波数成分のうちから所定の基準によって選択された周波数成分に対してMUSICアルゴリズム演算を行う(c)段階と、
前記(c)段階の演算結果を用いて音声信号の方向を検出する(d)段階と、を含むことを特徴とする音声認識装置。 - 前記(b)段階は離散フーリエ変換を用いて周波数を分離する段階であることを特徴とする請求項23に記載の音声認識方法。
- 前記(c)段階は、前記(a)段階から受信したサウンド信号を前記(b)段階により分離されたサウンド信号の各周波数成分に分離し、前記分離されたサウンド信号を同じ周波数成分ごとに複数のグループに分けて各グループ別に音声の存在する可能性を測定する段階と、
前記グループのうちから前記可能性の高い順に所定数だけのグループを選択する段階と、
前記選択されたグループに属する周波数成分に対してMUSICアルゴリズム演算を行う段階と、を含むことを特徴とする請求項23に記載の音声認識方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20030028340 | 2003-05-02 | ||
KR1020040013029A KR100621076B1 (ko) | 2003-05-02 | 2004-02-26 | 마이크로폰 어레이 방법 및 시스템 및 이를 이용한 음성인식 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004334218A true JP2004334218A (ja) | 2004-11-25 |
JP4248445B2 JP4248445B2 (ja) | 2009-04-02 |
Family
ID=32993173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004137875A Expired - Fee Related JP4248445B2 (ja) | 2003-05-02 | 2004-05-06 | マイクロホンアレイ方法及びシステム、並びにこれを用いた音声認識方法及び装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7567678B2 (ja) |
EP (1) | EP1473964A3 (ja) |
JP (1) | JP4248445B2 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005253071A (ja) * | 2004-03-02 | 2005-09-15 | Microsoft Corp | マイクロフォン・アレイを使用するビーム・フォーミングのシステムおよび方法 |
WO2006077745A1 (ja) * | 2005-01-20 | 2006-07-27 | Nec Corporation | 信号除去方法、信号除去システムおよび信号除去プログラム |
JP2011518358A (ja) * | 2008-04-22 | 2011-06-23 | ボーズ・コーポレーション | ヒアリングアシスタンス装置 |
US9078077B2 (en) | 2010-10-21 | 2015-07-07 | Bose Corporation | Estimation of synthetic audio prototypes with frequency-based input signal decomposition |
JP2017505461A (ja) * | 2014-04-30 | 2017-02-16 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | いくつかの入力オーディオ信号の残響を除去するための信号処理の装置、方法、およびコンピュータプログラム |
US10665249B2 (en) | 2017-06-23 | 2020-05-26 | Casio Computer Co., Ltd. | Sound source separation for robot from target voice direction and noise voice direction |
CN111983357A (zh) * | 2020-08-21 | 2020-11-24 | 国网重庆市电力公司电力科学研究院 | 一种结合声纹检测功能的超声可视化故障检测方法 |
Families Citing this family (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100657912B1 (ko) * | 2004-11-18 | 2006-12-14 | 삼성전자주식회사 | 잡음 제거 방법 및 장치 |
JP4873913B2 (ja) * | 2004-12-17 | 2012-02-08 | 学校法人早稲田大学 | 音源分離システムおよび音源分離方法、並びに音響信号取得装置 |
EP1736964A1 (en) * | 2005-06-24 | 2006-12-27 | Nederlandse Organisatie voor toegepast-natuurwetenschappelijk Onderzoek TNO | System and method for extracting acoustic signals from signals emitted by a plurality of sources |
US20080130914A1 (en) * | 2006-04-25 | 2008-06-05 | Incel Vision Inc. | Noise reduction system and method |
US8949120B1 (en) | 2006-05-25 | 2015-02-03 | Audience, Inc. | Adaptive noise cancelation |
JP4867516B2 (ja) * | 2006-08-01 | 2012-02-01 | ヤマハ株式会社 | 音声会議システム |
US8073681B2 (en) | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
US7818176B2 (en) | 2007-02-06 | 2010-10-19 | Voicebox Technologies, Inc. | System and method for selecting and presenting advertisements based on natural language processing of voice-based input |
US8249867B2 (en) * | 2007-12-11 | 2012-08-21 | Electronics And Telecommunications Research Institute | Microphone array based speech recognition system and target speech extracting method of the system |
TWI474690B (zh) * | 2008-02-15 | 2015-02-21 | Koninkl Philips Electronics Nv | 偵測無線麥克風訊號的無線電感測器及其方法 |
US8144896B2 (en) * | 2008-02-22 | 2012-03-27 | Microsoft Corporation | Speech separation with microphone arrays |
US9305548B2 (en) | 2008-05-27 | 2016-04-05 | Voicebox Technologies Corporation | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US8325909B2 (en) * | 2008-06-25 | 2012-12-04 | Microsoft Corporation | Acoustic echo suppression |
KR101178801B1 (ko) * | 2008-12-09 | 2012-08-31 | 한국전자통신연구원 | 음원분리 및 음원식별을 이용한 음성인식 장치 및 방법 |
JP5277887B2 (ja) * | 2008-11-14 | 2013-08-28 | ヤマハ株式会社 | 信号処理装置およびプログラム |
US8326637B2 (en) | 2009-02-20 | 2012-12-04 | Voicebox Technologies, Inc. | System and method for processing multi-modal device interactions in a natural language voice services environment |
FR2948484B1 (fr) * | 2009-07-23 | 2011-07-29 | Parrot | Procede de filtrage des bruits lateraux non-stationnaires pour un dispositif audio multi-microphone, notamment un dispositif telephonique "mains libres" pour vehicule automobile |
CN102111697B (zh) * | 2009-12-28 | 2015-03-25 | 歌尔声学股份有限公司 | 一种麦克风阵列降噪控制方法及装置 |
US8718290B2 (en) | 2010-01-26 | 2014-05-06 | Audience, Inc. | Adaptive noise reduction using level cues |
US20110200205A1 (en) * | 2010-02-17 | 2011-08-18 | Panasonic Corporation | Sound pickup apparatus, portable communication apparatus, and image pickup apparatus |
US8473287B2 (en) | 2010-04-19 | 2013-06-25 | Audience, Inc. | Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system |
US9378754B1 (en) * | 2010-04-28 | 2016-06-28 | Knowles Electronics, Llc | Adaptive spatial classifier for multi-microphone systems |
US10726861B2 (en) * | 2010-11-15 | 2020-07-28 | Microsoft Technology Licensing, Llc | Semi-private communication in open environments |
JP5629249B2 (ja) * | 2011-08-24 | 2014-11-19 | 本田技研工業株式会社 | 音源定位システム及び音源定位方法 |
US9373338B1 (en) * | 2012-06-25 | 2016-06-21 | Amazon Technologies, Inc. | Acoustic echo cancellation processing based on feedback from speech recognizer |
US9076450B1 (en) * | 2012-09-21 | 2015-07-07 | Amazon Technologies, Inc. | Directed audio for speech recognition |
CN105230044A (zh) | 2013-03-20 | 2016-01-06 | 诺基亚技术有限公司 | 空间音频装置 |
CN104091598A (zh) * | 2013-04-18 | 2014-10-08 | 腾讯科技(深圳)有限公司 | 一种音频文件的相似计算方法及装置 |
CN104090876B (zh) * | 2013-04-18 | 2016-10-19 | 腾讯科技(深圳)有限公司 | 一种音频文件的分类方法及装置 |
US9812150B2 (en) | 2013-08-28 | 2017-11-07 | Accusonus, Inc. | Methods and systems for improved signal decomposition |
US20150264505A1 (en) | 2014-03-13 | 2015-09-17 | Accusonus S.A. | Wireless exchange of data between devices in live events |
US10468036B2 (en) | 2014-04-30 | 2019-11-05 | Accusonus, Inc. | Methods and systems for processing and mixing signals using signal decomposition |
EP3195145A4 (en) | 2014-09-16 | 2018-01-24 | VoiceBox Technologies Corporation | Voice commerce |
CN110895929B (zh) * | 2015-01-30 | 2022-08-12 | 展讯通信(上海)有限公司 | 语音识别方法及装置 |
CN104599679A (zh) * | 2015-01-30 | 2015-05-06 | 华为技术有限公司 | 一种基于语音信号构造聚焦协方差矩阵的方法及装置 |
WO2016159395A1 (ko) * | 2015-03-27 | 2016-10-06 | 알피니언메디칼시스템 주식회사 | 공간 스무딩 연산이 간단한 빔포밍 장치, 초음파 이미징 장치 및 빔포밍 방법 |
US10013981B2 (en) | 2015-06-06 | 2018-07-03 | Apple Inc. | Multi-microphone speech recognition systems and related techniques |
US9865265B2 (en) | 2015-06-06 | 2018-01-09 | Apple Inc. | Multi-microphone speech recognition systems and related techniques |
US9734845B1 (en) * | 2015-06-26 | 2017-08-15 | Amazon Technologies, Inc. | Mitigating effects of electronic audio sources in expression detection |
CN105204001A (zh) * | 2015-10-12 | 2015-12-30 | Tcl集团股份有限公司 | 一种声源定位的方法及系统 |
KR102476600B1 (ko) | 2015-10-21 | 2022-12-12 | 삼성전자주식회사 | 전자 장치, 그의 음성 인식 방법 및 비일시적 컴퓨터 판독가능 기록매체 |
US9721582B1 (en) * | 2016-02-03 | 2017-08-01 | Google Inc. | Globally optimized least-squares post-filtering for speech enhancement |
CN106548783B (zh) * | 2016-12-09 | 2020-07-14 | 西安Tcl软件开发有限公司 | 语音增强方法、装置及智能音箱、智能电视 |
EP4184950A1 (en) * | 2017-06-09 | 2023-05-24 | Oticon A/s | A microphone system and a hearing device comprising a microphone system |
CN109887494B (zh) | 2017-12-01 | 2022-08-16 | 腾讯科技(深圳)有限公司 | 重构语音信号的方法和装置 |
US10979805B2 (en) * | 2018-01-04 | 2021-04-13 | Stmicroelectronics, Inc. | Microphone array auto-directive adaptive wideband beamforming using orientation information from MEMS sensors |
US10755728B1 (en) * | 2018-02-27 | 2020-08-25 | Amazon Technologies, Inc. | Multichannel noise cancellation using frequency domain spectrum masking |
CN109712626B (zh) * | 2019-03-04 | 2021-04-30 | 腾讯科技(深圳)有限公司 | 一种语音数据处理方法及装置 |
CN110265020B (zh) * | 2019-07-12 | 2021-07-06 | 大象声科(深圳)科技有限公司 | 语音唤醒方法、装置及电子设备、存储介质 |
CN110412509A (zh) * | 2019-08-21 | 2019-11-05 | 西北工业大学 | 一种基于mems麦克风阵列的声源定位系统 |
CN112820310B (zh) * | 2019-11-15 | 2022-09-23 | 北京声智科技有限公司 | 一种来波方向估计方法及装置 |
CN113138367A (zh) * | 2020-01-20 | 2021-07-20 | 中国科学院上海微系统与信息技术研究所 | 一种目标定位方法、装置、电子设备及存储介质 |
CN113284504A (zh) * | 2020-02-20 | 2021-08-20 | 北京三星通信技术研究有限公司 | 姿态检测方法、装置、电子设备及计算机可读存储介质 |
CN112786069B (zh) * | 2020-12-24 | 2023-03-21 | 北京有竹居网络技术有限公司 | 语音提取方法、装置和电子设备 |
CN113096684A (zh) * | 2021-06-07 | 2021-07-09 | 成都启英泰伦科技有限公司 | 一种基于双麦克风阵列的目标语音提取方法 |
CN113362856A (zh) * | 2021-06-21 | 2021-09-07 | 国网上海市电力公司 | 一种应用于电力物联网的声音故障检测方法以及装置 |
CN115201753B (zh) * | 2022-09-19 | 2022-11-29 | 泉州市音符算子科技有限公司 | 一种低功耗多频谱分辨的语音定位方法 |
CN117636858B (zh) * | 2024-01-25 | 2024-03-29 | 深圳市一么么科技有限公司 | 一种智能家具控制器及控制方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4882755A (en) * | 1986-08-21 | 1989-11-21 | Oki Electric Industry Co., Ltd. | Speech recognition system which avoids ambiguity when matching frequency spectra by employing an additional verbal feature |
FR2687496B1 (fr) * | 1992-02-18 | 1994-04-01 | Alcatel Radiotelephone | Procede de reduction de bruit acoustique dans un signal de parole. |
JP3302300B2 (ja) | 1997-07-18 | 2002-07-15 | 株式会社東芝 | 信号処理装置および信号処理方法 |
JP3677143B2 (ja) | 1997-07-31 | 2005-07-27 | 株式会社東芝 | 音声処理方法および装置 |
JPH11164389A (ja) | 1997-11-26 | 1999-06-18 | Matsushita Electric Ind Co Ltd | 適応ノイズキャンセラ装置 |
US6049607A (en) * | 1998-09-18 | 2000-04-11 | Lamar Signal Processing | Interference canceling method and apparatus |
US6289309B1 (en) * | 1998-12-16 | 2001-09-11 | Sarnoff Corporation | Noise spectrum tracking for speech enhancement |
JP2000221999A (ja) | 1999-01-29 | 2000-08-11 | Toshiba Corp | 雑音除去機能付き音声入力装置及び音声入出力装置 |
US6594367B1 (en) * | 1999-10-25 | 2003-07-15 | Andrea Electronics Corporation | Super directional beamforming design and implementation |
US6952482B2 (en) * | 2001-10-02 | 2005-10-04 | Siemens Corporation Research, Inc. | Method and apparatus for noise filtering |
US7084801B2 (en) * | 2002-06-05 | 2006-08-01 | Siemens Corporate Research, Inc. | Apparatus and method for estimating the direction of arrival of a source signal using a microphone array |
US7146315B2 (en) * | 2002-08-30 | 2006-12-05 | Siemens Corporate Research, Inc. | Multichannel voice detection in adverse environments |
-
2004
- 2004-04-30 EP EP04252563A patent/EP1473964A3/en not_active Withdrawn
- 2004-05-03 US US10/836,207 patent/US7567678B2/en not_active Expired - Fee Related
- 2004-05-06 JP JP2004137875A patent/JP4248445B2/ja not_active Expired - Fee Related
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005253071A (ja) * | 2004-03-02 | 2005-09-15 | Microsoft Corp | マイクロフォン・アレイを使用するビーム・フォーミングのシステムおよび方法 |
JP4690072B2 (ja) * | 2004-03-02 | 2011-06-01 | マイクロソフト コーポレーション | マイクロフォン・アレイを使用するビーム・フォーミングのシステムおよび方法 |
WO2006077745A1 (ja) * | 2005-01-20 | 2006-07-27 | Nec Corporation | 信号除去方法、信号除去システムおよび信号除去プログラム |
US7925504B2 (en) | 2005-01-20 | 2011-04-12 | Nec Corporation | System, method, device, and program for removing one or more signals incoming from one or more directions |
JP2011518358A (ja) * | 2008-04-22 | 2011-06-23 | ボーズ・コーポレーション | ヒアリングアシスタンス装置 |
US8611554B2 (en) | 2008-04-22 | 2013-12-17 | Bose Corporation | Hearing assistance apparatus |
US9078077B2 (en) | 2010-10-21 | 2015-07-07 | Bose Corporation | Estimation of synthetic audio prototypes with frequency-based input signal decomposition |
JP2017505461A (ja) * | 2014-04-30 | 2017-02-16 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | いくつかの入力オーディオ信号の残響を除去するための信号処理の装置、方法、およびコンピュータプログラム |
US9830926B2 (en) | 2014-04-30 | 2017-11-28 | Huawei Technologies Co., Ltd. | Signal processing apparatus, method and computer program for dereverberating a number of input audio signals |
US10665249B2 (en) | 2017-06-23 | 2020-05-26 | Casio Computer Co., Ltd. | Sound source separation for robot from target voice direction and noise voice direction |
CN111983357A (zh) * | 2020-08-21 | 2020-11-24 | 国网重庆市电力公司电力科学研究院 | 一种结合声纹检测功能的超声可视化故障检测方法 |
Also Published As
Publication number | Publication date |
---|---|
US20040220800A1 (en) | 2004-11-04 |
US7567678B2 (en) | 2009-07-28 |
EP1473964A2 (en) | 2004-11-03 |
EP1473964A3 (en) | 2006-08-09 |
JP4248445B2 (ja) | 2009-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4248445B2 (ja) | マイクロホンアレイ方法及びシステム、並びにこれを用いた音声認識方法及び装置 | |
US7496482B2 (en) | Signal separation method, signal separation device and recording medium | |
US10127922B2 (en) | Sound source identification apparatus and sound source identification method | |
US9042573B2 (en) | Processing signals | |
CN107976651B (zh) | 一种基于麦克风阵列的声源定位方法及装置 | |
JP5229053B2 (ja) | 信号処理装置、および信号処理方法、並びにプログラム | |
JP4690072B2 (ja) | マイクロフォン・アレイを使用するビーム・フォーミングのシステムおよび方法 | |
US8363850B2 (en) | Audio signal processing method and apparatus for the same | |
US7647209B2 (en) | Signal separating apparatus, signal separating method, signal separating program and recording medium | |
EP3566461B1 (en) | Method and apparatus for audio capture using beamforming | |
EP2530484B1 (en) | Sound source localization apparatus and method | |
JP6240995B2 (ja) | 移動体、音響源マップ作成システムおよび音響源マップ作成方法 | |
US20080130914A1 (en) | Noise reduction system and method | |
JP4910568B2 (ja) | 紙擦れ音除去装置 | |
JP2009288215A (ja) | 音響処理装置及びその方法 | |
Grondin et al. | Time difference of arrival estimation based on binary frequency mask for sound source localization on mobile robots | |
CN111445920A (zh) | 一种多声源的语音信号实时分离方法、装置和拾音器 | |
KR100621076B1 (ko) | 마이크로폰 어레이 방법 및 시스템 및 이를 이용한 음성인식 방법 및 장치 | |
US10063966B2 (en) | Speech-processing apparatus and speech-processing method | |
JP2017151216A (ja) | 音源方向推定装置、音源方向推定方法、およびプログラム | |
Bai et al. | Acoustic source localization and deconvolution-based separation | |
Sun et al. | Indoor multiple sound source localization using a novel data selection scheme | |
JP2024082932A (ja) | 音響処理装置、音響処理方法およびプログラム | |
JP2018142822A (ja) | 音響信号処理装置、方法及びプログラム | |
Yamamoto et al. | Localization of multiple environmental sound sources by music method with weighted histogram |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20061026 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20061027 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080304 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080604 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080902 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081112 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081216 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090113 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120123 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |