JPWO2018037643A1 - 情報処理装置、情報処理方法及びプログラム - Google Patents
情報処理装置、情報処理方法及びプログラム Download PDFInfo
- Publication number
- JPWO2018037643A1 JPWO2018037643A1 JP2018535458A JP2018535458A JPWO2018037643A1 JP WO2018037643 A1 JPWO2018037643 A1 JP WO2018037643A1 JP 2018535458 A JP2018535458 A JP 2018535458A JP 2018535458 A JP2018535458 A JP 2018535458A JP WO2018037643 A1 JPWO2018037643 A1 JP WO2018037643A1
- Authority
- JP
- Japan
- Prior art keywords
- information processing
- processing apparatus
- sound
- noise
- weight
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S3/00—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
- G01S3/80—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
- G01S3/802—Systems for determining direction or deviation from predetermined direction
- G01S3/808—Systems for determining direction or deviation from predetermined direction using transducers spaced apart and measuring phase or time difference between signals therefrom, i.e. path-difference systems
- G01S3/8083—Systems for determining direction or deviation from predetermined direction using transducers spaced apart and measuring phase or time difference between signals therefrom, i.e. path-difference systems determining direction of source
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S3/00—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
- G01S3/02—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using radio waves
- G01S3/74—Multi-channel systems specially adapted for direction-finding, i.e. having a single antenna system capable of giving simultaneous indications of the directions of different signals
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S3/00—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
- G01S3/02—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using radio waves
- G01S3/04—Details
- G01S3/06—Means for increasing effective directivity, e.g. by combining signals having differently oriented directivity characteristics or by sharpening the envelope waveform of the signal derived from a rotating or oscillating beam antenna
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
Abstract
Description
1.はじめに
1.1.概要
1.2.MUSIC法
1.3.GEVD−MUSIC法
2.構成例
3.処理の流れ
4.変形例
4.1.第1の変形例
4.2.第2の変形例
4.3.第3の変形例
4.4.第4の変形例
4.5.第5の変形例
5.実験結果
6.ハードウェア構成例
7.まとめ
<1.1.概要>
図1は、本開示の一実施形態に係る情報処理装置1の概要を説明するための図である。情報処理装置1は、収音装置を有し、ユーザ2からの音声に基づく操作を、収音結果の音声認識により受け付ける。ただし、図1に示すように、情報処理装置1は、周囲にテレビ受像機3及びエアコンディショナー4等の雑音源がある環境において使用されることが想定される。そこで、情報処理装置1は、雑音源が周囲にあり且つ話者との距離が数メール離れている環境において、ユーザ2からの音声に基づく操作を受け付け可能であることが望ましい。さらには、情報処理装置1は、音声認識開始ボタンの押下又はリモートコントローラによる指示なしに、ユーザ2からの音声に基づく操作を受け付け可能であることが望ましい。
音源方向推定手法のひとつに、MUSIC(Multiple Signal Classification)法がある。MUSIC法は、雑音が白色であるという仮定の下、標準固有値分解で求まった固有ベクトルを利用する方法である。
上述したMUSIC法の実環境での性能低下の対策として、雑音を白色化してから固有値分解を行って(即ち、一般化固有値分解、GEVD(Generalized Eigen Value Decomposition))MUSIC法を適用する、GEVD−MUSIC法が提案されている。
図2は、本実施形態に係る情報処理装置1の論理的な構成の一例を示すブロック図である。図2に示すように、情報処理装置1は、収音装置群10、取得部20、出力部30、記憶部40及び制御部50を含む。
Fourier Transform)を適用して周波数領域の信号に変換する。例えば、フレーム長及びフレームシフトは、それぞれ32ms(ミリ秒)及び10msであってもよい。
図4は、本実施形態に係る情報処理装置1による音源方向推定処理の流れの一例を示すフローチャートである。図4に示すように、まず、情報処理装置1は、収音装置群10による収音結果を示す音響信号を取得する(ステップS102)。次いで、情報処理装置1は、取得された音響信号が定常雑音を観測した信号である度合に応じた第1の重みを計算する(ステップS104)。例えば、情報処理装置1は、音声尤度及びパワーに基づいて第1の重みを計算する。次に、情報処理装置1は、第1の空間相関行列を計算し、第1の重みを適用した第2の空間相関行列を計算し、これらの空間相関行列に基づき固有値分解を行う(ステップS106、S108、S110)。次いで、情報処理装置1は、固有値分解の結果及び伝達関数に基づいて空間スペクトルを計算する(ステップS112)。次に、情報処理装置1は、空間スペクトルの寄与度に基づいて第2の重みを計算する(ステップS114)。次いで、情報処理装置1は、第2の重みにより重み付けして空間スペクトルを統合する(ステップS116)。次に、情報処理装置1は、統合された現在及び過去の空間スペクトルの値を用いて閾値を計算する(ステップS118)。そして、情報処理装置1は、統合された空間スペクトルのうち閾値を超えてピークが立つ方向を、音源方向として推定する(ステップS120)。以上により、処理は終了する。
以下、各種変形例を説明する。ただし、上記説明した事項と重複する内容に関しては、説明を省略する。
第1の変形例では、音響信号の定常性が、音響信号の特徴量に基づいて計算される。より詳しくは、第1の変形例では、定常雑音パワー及び信号パワーの比に基づく重みに代えて、音響信号の特徴量が示す突発性雑音尤度に基づく重みが用いられる。
第2の変形例では、音源方向の推定のために、空間スペクトルに加えて指向性パターンが用いられる。指向性パターンとは、各方向から音が到来している度合いであり、具体的には、音源方向に対する感度の高い空間フィルタに対応する方向とゲインとの対応関係データである。
第3の変形例では、情報処理装置1自身が音声又は音楽等の音を再生する場合に、その再生信号が雑音として第2の空間相関行列の計算に加味される。
第4の変形例では、雑音源の移動性が加味される。
第5の変形例では、第2の空間相関行列を用いた音声強調フィルタにより音声が強調された音響信号が生成される。
以下では、提案手法と比較手法との比較実験の結果を説明する。ここで、提案手法とは、図2〜図4を参照して上記説明した、本実施形態に係る情報処理装置1による音源方向の推定を指す。比較手法とは、定常雑音推定を行わない手法を指し、より具体的には、図3に示した情報処理装置1の構成のうち、音源種類推定部100から信号パワー推定部108及び定常雑音パワー推定部110を省略した構成を有する。なお、重み決定部112の出力は、音声の場合は0で非音声の場合は1となる。
最後に、図15を参照して、本実施形態に係る情報処理装置のハードウェア構成について説明する。図15は、本実施形態に係る情報処理装置のハードウェア構成の一例を示すブロック図である。なお、図15に示す情報処理装置900は、例えば、図2及び図7にそれぞれ示した情報処理装置1を実現し得る。本実施形態に係る情報処理装置1による情報処理は、ソフトウェアと、以下に説明するハードウェアとの協働により実現される。
以上、図1〜図15を参照して、本開示の一実施形態について詳細に説明した。上記説明したように、本実施形態に係る情報処理装置1は、収音装置群による収音結果を示す音響信号を取得し、音響信号が定常雑音を観測した信号である度合に応じた第1の重みを計算し、第1の重みを第2の空間相関行列に適用する。これにより、第2の空間相関行列の計算のために採用された雑音区間の適切さが、定常雑音を観察した信号である度合により評価され、その評価が第2の空間相関行列の計算に反映されることとなる。よって、どの区間を雑音空間として採用されるかに過度に依存することが防止され、音源方向を推定する際の推定精度を向上させることが可能となる。
(1)
収音装置群による収音結果を示す音響信号を取得する取得部と、
前記取得部により取得された前記音響信号が定常雑音を観測した信号である度合に応じた第1の重みを計算し、前記第1の重みを雑音信号から得られる空間相関行列である雑音空間相関行列に適用する制御部と、
を備える情報処理装置。
(2)
前記制御部は、前記第1の重みを適用した雑音空間相関行列及び推定対象の前記音響信号の空間相関行列に基づく一般化固有値分解により得られる固有値に基づいて、前記収音装置群からみた音源方向を推定する、前記(1)に記載の情報処理装置。
(3)
前記制御部は、前記一般化固有値分解の対象となる前記第1の重みを適用した前記雑音空間相関行列を、過去の前記第1の重みを適用した前記雑音空間相関行列に基づいて逐次的に更新する、前記(2)に記載の情報処理装置。
(4)
前記制御部は、前記一般化固有値分解の計算結果に基づいて計算された空間スペクトルを前記固有値に基づく第2の重みにより重み付けして統合し、統合された前記空間スペクトルのピークが立つ方向を前記音源方向として推定する、前記(2)又は(3)に記載の情報処理装置。
(5)
前記制御部は、過去の空間スペクトルの値を用いて逐次的に更新される閾値を超えて空間スペクトルのピークが立つ方向を前記音源方向として推定する、前記(4)に記載の情報処理装置。
(6)
前記制御部は、前記一般化固有値分解の計算結果に基づいて各方向から音が到来している度合いを示す指向性パターンを計算し、前記空間スペクトル及び前記指向性パターンの双方でピークが立つ方向を前記音源方向として推定する、前記(4)又は(5)に記載の情報処理装置。
(7)
前記音源方向は、音声の到来方向である、前記(2)〜(6)のいずれか一項に記載の情報処理装置。
(8)
前記第1の重みは、連続値である、前記(1)〜(7)のいずれか一項に記載の情報処理装置。
(9)
前記制御部は、前記音響信号に音声が含まれる度合に基づいて前記第1の重みを計算する、前記(1)〜(8)のいずれか一項に記載の情報処理装置。
(10)
前記制御部は、前記音響信号の定常性に基づいて前記第1の重みを計算する、前記(1)〜(9)のいずれか一項に記載の情報処理装置。
(11)
前記定常性は、前記音響信号のパワーに基づいて計算される、前記(10)に記載の情報処理装置。
(12)
前記定常性は、前記音響信号の特徴量に基づいて計算される、前記(10)又は(11)に記載の情報処理装置。
(13)
前記制御部は、音源の移動性を推定し、推定結果に応じて前記第1の重みを計算する、前記(1)〜(12)のいずれか一項に記載の情報処理装置。
(14)
前記制御部は、収音装置群により収音される音であって、再生装置により再生される音の再生信号に基づいて前記雑音空間相関行列を計算する、前記(1)〜(13)のいずれか一項に記載の情報処理装置。
(15)
前記制御部は、前記雑音空間相関行列に基づいて目的音が強調された音響信号を生成する、前記(1)〜(14)のいずれか一項に記載の情報処理装置。
(16)
収音装置群による収音結果を示す音響信号を取得することと、
取得された前記音響信号が定常雑音を観測した信号である度合に応じた第1の重みをプロセッサにより計算し、前記第1の重みを雑音信号から得られる空間相関行列である雑音空間相関行列に適用することと、
を含む情報処理方法。
(17)
コンピュータを、
収音装置群による収音結果を示す音響信号を取得する取得部と、
前記取得部により取得された前記音響信号が定常雑音を観測した信号である度合に応じた第1の重みを計算し、前記第1の重みを雑音信号から得られる空間相関行列である雑音空間相関行列に適用する制御部と、
として機能させるためのプログラム。
2 ユーザ
3 テレビ受像機
4 エアコンディショナー
10 収音装置群
20 取得部
30 出力部
40 記憶部
50 制御部
60 再生装置
100 音源種類推定部
102 音響特徴量変換部
104 音声非音声推定部
106 音声モデル記憶部
108 信号パワー推定部
110 定常雑音パワー推定部
112 重み決定部
114 音響特徴量変換部
116 突発性雑音推定部
118 雑音モデル記憶部
120 移動音源推定部
200 GEVD−MUSIC処理部
202 第1相関行列計算部
204 第2相関行列計算部
206 固有値分解部
208 伝達関数記憶部
210 空間スペクトル算出部
212 周波数重み算出部
214 周波数情報統合部
216 指向性パターン算出部
218 周波数情報統合部
302 周波数変換部
304 閾値更新部
306 ピーク検出部
308 ピーク検出部
310 音源方向推定部
312 伝達特性推定部
314 音声強調フィルタ生成部
316 音声強調部
Claims (17)
- 収音装置群による収音結果を示す音響信号を取得する取得部と、
前記取得部により取得された前記音響信号が定常雑音を観測した信号である度合に応じた第1の重みを計算し、前記第1の重みを雑音信号から得られる空間相関行列である雑音空間相関行列に適用する制御部と、
を備える情報処理装置。 - 前記制御部は、前記第1の重みを適用した雑音空間相関行列及び推定対象の前記音響信号の空間相関行列に基づく一般化固有値分解により得られる固有値に基づいて、前記収音装置群からみた音源方向を推定する、請求項1に記載の情報処理装置。
- 前記制御部は、前記一般化固有値分解の対象となる前記第1の重みを適用した前記雑音空間相関行列を、過去の前記第1の重みを適用した前記雑音空間相関行列に基づいて逐次的に更新する、請求項2に記載の情報処理装置。
- 前記制御部は、前記一般化固有値分解の計算結果に基づいて計算された空間スペクトルを前記固有値に基づく第2の重みにより重み付けして統合し、統合された前記空間スペクトルのピークが立つ方向を前記音源方向として推定する、請求項2に記載の情報処理装置。
- 前記制御部は、過去の空間スペクトルの値を用いて逐次的に更新される閾値を超えて空間スペクトルのピークが立つ方向を前記音源方向として推定する、請求項4に記載の情報処理装置。
- 前記制御部は、前記一般化固有値分解の計算結果に基づいて各方向から音が到来している度合いを示す指向性パターンを計算し、前記空間スペクトル及び前記指向性パターンの双方でピークが立つ方向を前記音源方向として推定する、請求項4に記載の情報処理装置。
- 前記音源方向は、音声の到来方向である、請求項2に記載の情報処理装置。
- 前記第1の重みは、連続値である、請求項1に記載の情報処理装置。
- 前記制御部は、前記音響信号に音声が含まれる度合に基づいて前記第1の重みを計算する、請求項1に記載の情報処理装置。
- 前記制御部は、前記音響信号の定常性に基づいて前記第1の重みを計算する、請求項1に記載の情報処理装置。
- 前記定常性は、前記音響信号のパワーに基づいて計算される、請求項10に記載の情報処理装置。
- 前記定常性は、前記音響信号の特徴量に基づいて計算される、請求項10に記載の情報処理装置。
- 前記制御部は、音源の移動性を推定し、推定結果に応じて前記第1の重みを計算する、請求項1に記載の情報処理装置。
- 前記制御部は、収音装置群により収音される音であって、再生装置により再生される音の再生信号に基づいて前記雑音空間相関行列を計算する、請求項1に記載の情報処理装置。
- 前記制御部は、前記雑音空間相関行列に基づいて目的音が強調された音響信号を生成する、請求項1に記載の情報処理装置。
- 収音装置群による収音結果を示す音響信号を取得することと、
取得された前記音響信号が定常雑音を観測した信号である度合に応じた第1の重みをプロセッサにより計算し、前記第1の重みを雑音信号から得られる空間相関行列である雑音空間相関行列に適用することと、
を含む情報処理方法。 - コンピュータを、
収音装置群による収音結果を示す音響信号を取得する取得部と、
前記取得部により取得された前記音響信号が定常雑音を観測した信号である度合に応じた第1の重みを計算し、前記第1の重みを雑音信号から得られる空間相関行列である雑音空間相関行列に適用する制御部と、
として機能させるためのプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016162779 | 2016-08-23 | ||
JP2016162779 | 2016-08-23 | ||
PCT/JP2017/018875 WO2018037643A1 (ja) | 2016-08-23 | 2017-05-19 | 情報処理装置、情報処理方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2018037643A1 true JPWO2018037643A1 (ja) | 2019-06-20 |
JP6888627B2 JP6888627B2 (ja) | 2021-06-16 |
Family
ID=61245721
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018535458A Active JP6888627B2 (ja) | 2016-08-23 | 2017-05-19 | 情報処理装置、情報処理方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11346917B2 (ja) |
JP (1) | JP6888627B2 (ja) |
WO (1) | WO2018037643A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10580429B1 (en) * | 2018-08-22 | 2020-03-03 | Nuance Communications, Inc. | System and method for acoustic speaker localization |
JP7126659B2 (ja) * | 2019-02-18 | 2022-08-29 | 日本電信電話株式会社 | 信号処理装置、信号処理方法及び信号処理プログラム |
CN110992974B (zh) | 2019-11-25 | 2021-08-24 | 百度在线网络技术(北京)有限公司 | 语音识别方法、装置、设备以及计算机可读存储介质 |
CN115273850A (zh) * | 2022-09-28 | 2022-11-01 | 科大讯飞股份有限公司 | 一种自主移动设备语音控制方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014056181A (ja) * | 2012-09-13 | 2014-03-27 | Honda Motor Co Ltd | 音源方向推定装置、音響処理システム、音源方向推定方法、及び音源方向推定プログラム |
JP2014187685A (ja) * | 2013-01-24 | 2014-10-02 | Nippon Telegr & Teleph Corp <Ntt> | 収音装置 |
JP2016100735A (ja) * | 2014-11-20 | 2016-05-30 | 日本電信電話株式会社 | フィルタ生成装置、収音装置、フィルタ生成方法及びプログラム |
WO2017094862A1 (ja) * | 2015-12-02 | 2017-06-08 | 日本電信電話株式会社 | 空間相関行列推定装置、空間相関行列推定方法および空間相関行列推定プログラム |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9185487B2 (en) * | 2006-01-30 | 2015-11-10 | Audience, Inc. | System and method for providing noise suppression utilizing null processing noise subtraction |
WO2010091077A1 (en) * | 2009-02-03 | 2010-08-12 | University Of Ottawa | Method and system for a multi-microphone noise reduction |
US8219394B2 (en) * | 2010-01-20 | 2012-07-10 | Microsoft Corporation | Adaptive ambient sound suppression and speech tracking |
JP5870476B2 (ja) * | 2010-08-04 | 2016-03-01 | 富士通株式会社 | 雑音推定装置、雑音推定方法および雑音推定プログラム |
BR112012031656A2 (pt) * | 2010-08-25 | 2016-11-08 | Asahi Chemical Ind | dispositivo, e método de separação de fontes sonoras, e, programa |
WO2013030345A2 (en) * | 2011-09-02 | 2013-03-07 | Gn Netcom A/S | A method and a system for noise suppressing an audio signal |
JP6001248B2 (ja) * | 2011-09-20 | 2016-10-05 | トヨタ自動車株式会社 | 音源検出装置 |
US10107887B2 (en) * | 2012-04-13 | 2018-10-23 | Qualcomm Incorporated | Systems and methods for displaying a user interface |
JP6334895B2 (ja) * | 2013-11-15 | 2018-05-30 | キヤノン株式会社 | 信号処理装置及びその制御方法、プログラム |
JP6136995B2 (ja) * | 2014-03-07 | 2017-05-31 | 株式会社Jvcケンウッド | 雑音低減装置 |
US9553681B2 (en) * | 2015-02-17 | 2017-01-24 | Adobe Systems Incorporated | Source separation using nonnegative matrix factorization with an automatically determined number of bases |
CN106157967A (zh) * | 2015-04-28 | 2016-11-23 | 杜比实验室特许公司 | 脉冲噪声抑制 |
JP6547451B2 (ja) * | 2015-06-26 | 2019-07-24 | 富士通株式会社 | 雑音抑圧装置、雑音抑圧方法、及び雑音抑圧プログラム |
-
2017
- 2017-05-19 WO PCT/JP2017/018875 patent/WO2018037643A1/ja active Application Filing
- 2017-05-19 JP JP2018535458A patent/JP6888627B2/ja active Active
- 2017-05-19 US US16/322,758 patent/US11346917B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014056181A (ja) * | 2012-09-13 | 2014-03-27 | Honda Motor Co Ltd | 音源方向推定装置、音響処理システム、音源方向推定方法、及び音源方向推定プログラム |
JP2014187685A (ja) * | 2013-01-24 | 2014-10-02 | Nippon Telegr & Teleph Corp <Ntt> | 収音装置 |
JP2016100735A (ja) * | 2014-11-20 | 2016-05-30 | 日本電信電話株式会社 | フィルタ生成装置、収音装置、フィルタ生成方法及びプログラム |
WO2017094862A1 (ja) * | 2015-12-02 | 2017-06-08 | 日本電信電話株式会社 | 空間相関行列推定装置、空間相関行列推定方法および空間相関行列推定プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6888627B2 (ja) | 2021-06-16 |
US11346917B2 (en) | 2022-05-31 |
WO2018037643A1 (ja) | 2018-03-01 |
US20210382131A1 (en) | 2021-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7158806B2 (ja) | オーディオ認識方法、ターゲットオーディオを位置決める方法、それらの装置、およびデバイスとコンピュータプログラム | |
JP6454916B2 (ja) | 音声処理装置、音声処理方法及びプログラム | |
JP5572445B2 (ja) | 残響抑圧装置、及び残響抑圧方法 | |
US9100734B2 (en) | Systems, methods, apparatus, and computer-readable media for far-field multi-source tracking and separation | |
JP6074263B2 (ja) | 雑音抑圧装置及びその制御方法 | |
JP2021036297A (ja) | 信号処理装置、信号処理方法、及びプログラム | |
US20170140771A1 (en) | Information processing apparatus, information processing method, and computer program product | |
US20150310857A1 (en) | Apparatus and method for providing an informed multichannel speech presence probability estimation | |
US8693287B2 (en) | Sound direction estimation apparatus and sound direction estimation method | |
JPWO2018037643A1 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2019503107A (ja) | 音響信号を向上させるための音響信号処理装置および方法 | |
JP4910568B2 (ja) | 紙擦れ音除去装置 | |
JP4521549B2 (ja) | 上下、左右方向の複数の音源の分離方法、そのためのシステム | |
KR20120080409A (ko) | 잡음 구간 판별에 의한 잡음 추정 장치 및 방법 | |
JP7370014B2 (ja) | 収音装置、収音方法、及びプログラム | |
JP6225245B2 (ja) | 信号処理装置、方法及びプログラム | |
JP2018169473A (ja) | 音声処理装置、音声処理方法及びプログラム | |
US11310593B2 (en) | Voice input device and method for estimation of utterance direction | |
JP6265903B2 (ja) | 信号雑音減衰 | |
JP6314475B2 (ja) | 音声信号処理装置及びプログラム | |
JP6631127B2 (ja) | 音声判定装置、方法及びプログラム、並びに、音声処理装置 | |
JPWO2021070278A1 (ja) | 雑音抑圧装置、雑音抑圧方法、及び雑音抑圧プログラム | |
Bai et al. | Kalman filter-based microphone array signal processing using the equivalent source model | |
JP2018142822A (ja) | 音響信号処理装置、方法及びプログラム | |
JP6361360B2 (ja) | 残響判定装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190208 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20190214 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20190515 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190522 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200511 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200511 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210420 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210503 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6888627 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |