JP5550456B2 - 残響抑圧装置、及び残響抑圧方法 - Google Patents
残響抑圧装置、及び残響抑圧方法 Download PDFInfo
- Publication number
- JP5550456B2 JP5550456B2 JP2010124873A JP2010124873A JP5550456B2 JP 5550456 B2 JP5550456 B2 JP 5550456B2 JP 2010124873 A JP2010124873 A JP 2010124873A JP 2010124873 A JP2010124873 A JP 2010124873A JP 5550456 B2 JP5550456 B2 JP 5550456B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- unit
- audio signal
- separation matrix
- calculated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
- H04M9/082—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
算出したパラメータを用いて前記区間数を算出するようにしてもよい。
図1は、本実施形態における残響抑圧装置を組み込んだロボットが取得する音声信号の一例を説明する図である。ロボット1は、図1に示すように、基体部11と、基体部11にそれぞれ可動連結される頭部12(可動部)と、脚部13(可動部)と、腕部14(可動部)とを備えている。また、ロボット1は、背負う格好で基体部11に収納部15を装着している。なお、基体部11には、スピーカ20(音声出力部140)が収納され、頭部12にはマイクロホン30が収納されている。なお、図1は、ロボット1を側面から見た図であり、マイクロホン30およびスピーカ20はそれぞれ複数収納されている。
ロボット1が発話している時に、ヒト2が割り込んで発話することをバージ・イン(Barge−in)と呼ぶ。バージ・インが発生しているとき、ロボット1には、当該ロボット1の発話のために、割り込んできたヒト2の発話を聞き分けることが困難である。
そして、ヒト2およびロボット1が発話している場合、ロボット1のマイクロホン30には、ヒト2の発話Suが空間を経由して伝達する残響音を含むヒト2の音声信号huと、ロボット1の発話Srが空間を経由して伝達する残響音を含むロボット1の音声信号hrとが入力される。
STFT部112から入力された信号x(ω、t)は、バッファ201を介して強制空間球面化部210の空間球面化部211に入力され、STFT部112から入力された信号sr(ω、t)は、バッファ202を介して強制空間球面化部210の分散正規化部212に入力される。そして、強制空間球面化部210は、入力された信号x(ω、t)と信号sr(ω、t)を、球面化と分散正規化により白色化し、白色化した信号をICA部221に出力する。そして、ICA部221には、強制空間球面化部210から白色化された信号が入力される。ICA部221は、入力された信号を用いて、第1評価関数を最小値にするように繰り返しICA処理を行って分離フィルタを算出し、算出した分離フィルタを用いて分離する音声信号を算出する。そして、ICA部221は、算出結果をスケーリング部231に出力し、スケーリングされた信号を直接音選択部241に出力する。なお、スケーリング部231は、projection Back処理を用いてスケーリングを行い、直接音選択部241は、入力された信号からパワーが最大のものを選択して、選択した信号を分離データ出力部115に出力する。
すなわち、MCSB−ICA部113の空間球面化部211には、変換された信号x(ω、t)が周波数ωごとに入力され、周波数ωをインデックスとして順次、次式(24)を用いて空間球面化を行い、z(t)を算出する。
さらに、MCSB−ICA部113の分散正規化部212には、変換された信号sr(ω,t)が周波数ωごとに入力され、周波数ωをインデックスとして順次、次式(26)を用いてスケールの正規化を行う。
次に、さらに演算コストを削減する方法について、図5を用いて説明する。図5は、ステップ・サイズの区間線形モデリングを説明する図である。図5(a)は、区間線形モデリングを行わない場合のステップ・サイズを示す図であり、図5(b)は、区間モデリングを行う場合のステップ・サイズを示す図である。すなわち、図5(b)のように、ステップ・サイズの関数を全て演算した場合、演算量が多い。このため、いくつかの区間に分け、分けた区間内で線形近似することで演算量を大幅に削減する。
観測された項である式(45)と既知の音源の項である式(46)に対する第i番目の要素のステップ・サイズ・パラメータは、遅延フレームの個数の項とほとんど同じであり、すなわち式(47)である。
そして、l回目の繰り返しから(l+1)回目の繰り返しまでのステップ・サイズである式(65)の更新規則は、式(66)のように表される。
次に、区間数Pを算出するために、次式(67)〜式(68)の規則を用いてYi(t)の球面化により収束速度を早める。
強制空間球面化は、MCSB−ICA部113の空間球面化部211と分散正規化部212により以下のように行われる。空間球面化部211には、変換された信号x(ω、t)が周波数ωごとに入力され、周波数ωをインデックスとして順次、式(24)を用いて空間球面化を行い、z(t)に変換する。分散正規化部212には、変換された信号sr(ω,t)が周波数ωごとに入力され、周波数ωをインデックスとして順次、式(26)を用いてスケールの正規化を行う。
空間球面化部211は、このように演算されたz(ω,t)をICA部221に出力し、分散正規化部212は、このように正規化された式(26)の値をICA部221に出力する。
まず、ICA部221は、i=1番目の分離音s[j](t)の予測値(式(5))を、式(36)を用いて算出する(ステップS4)。
次に、ICA部221は、ステップ・サイズのパラメータγを、式(71)により算出する。
次に、ICA部221は、算出した区間数Pとステップ・サイズのパラメータγとを用いて、式(66)により式(62)のステップ・サイズを算出して更新する(ステップS7、図6のステップ・サイズμ算出工程403)。
なお、ステップ・サイズの推定のための反復回数は、q回(qは1以上、L未満の自然数)で停止するようにしても良い。
iがL以上の場合(ステップS13;No)、ICA部221は、算出された各分離音s(t)の推定値結果をスケーリング部231に出力し、スケーリングされた信号を直接音選択部241に出力する。なお、スケーリング部231は、projection Back処理等を用いてスケーリングを行い、直接音選択部241は、入力された信号からパワーが最大のものを選択して分離データ出力部115に出力する(ステップS15)。
すなわち、直接音選択部241は、複数のマイク30が取得した音声信号から、ヒト2の発話信号huから残響成分を抑圧して、ヒト2の直接発話である音声信号Suを選択している。
第1実施形態との違いは、ステップS6aの処理である。第1実施形態では、ステップ・サイズu演算用のパラメータYi(t)を球面化して算出したが、第2実施形態では、時間減衰を考慮せず、すなわち、球面化を行わずにステップ・サイズuのパラメータYi(t)を算出する(ステップS6a)。なお、時間減衰を考慮しないとは、Yi(t)の要素が1の場合に相当する。すなわち、パラメータYi(t)の要素数に応じて、要素数が1の場合は、第2実施形態のように球面化を行わずにパラメータYi(t)を算出してステップ・サイズuを算出し、要素数が1以上の場合は、第1実施形態のように球面化を行ってパラメータYi(t)を算出してステップ・サイズuを算出する。
次に、本実施形態の残響抑圧装置を備えるロボット1で行った実験方法と実験結果の一例を説明する。図9〜図12は、実験条件である。音声データに対するこのインパルス応答は、通常の部屋(環境I;残響時間RT20=240msec,4.2m×7.0m)と、ホールに似た部屋(環境II;残響時間RT20=670msec,7.55m×9.55m)の2つの部屋において、16KHzで記録された。
図9は、実験に用いたデータ及び残響抑圧装置の設定条件である。図9のように、インパルス応答は16KHzサンプル、残響時間は240msと670ms、ロボット1とヒト2との距離は1.5m、ロボット1とヒト2の角度は0度、45度、90度、−45度、−90度、使用したマイクロホン30の本数は2本(ロボット1の頭部に設置)、STFT分析はハニング窓のサイズ64ms(512ポイント)かつシフト量24ms(160ポイント)、入力信号データ(16ビット、PCM(Pulse Code Modulation))は[−1.0 1.0]に正規化されたものである。また、ロボット1の頭部に取り付けられたマイクロホン30の本数は2本である。
また、ユーザ(ヒト2)の音声およびロボットの音声について200個の日本語の文章を使用し、これらの文章を対応する記録されたインパルス応答に畳み込んだ。また、音声認識エンジンは、公知のJulius(http://julius.sourceforge.jp/)を使用している。さらに、200人の男性と女性の話者によって発せられた明瞭な音声の150個の文章を使ってtriphoneベースの音響モデル(3状態および4混合)を学習した(閉じた語)。統計的言語モデルは、2万語からなり、これらの語は新聞から抽出した。
さらに、各実験において図11の6つの条件で実験を行った。図11は、実験条件を説明する図である。図11のように、実験条件1は、本実施形態の方法を用いた方法で、区間数P=1、パラメータはαγ= 0.2およびβγ=5.0×10−3であり、実験条件2は、本実施形態の方法を用いた方法で、区間数P=2、パラメータはαγ= 0.2およびβγ=5.0×10−3であり、実験条件3は、本実施形態の方法を用いた方法で、区間数P=0、パラメータはαγ= 0.2およびβγ=5.0×10−3である。なお、区間数P=2は(B0,B1,B2)=(0,4,N)、区間数P=1は(B0,B1)=(0,N)と設定した。ここで、区間数P=0は、すべてのμ(n)について同じ適応ステップ・サイズを使用することを意味している。さらに、サブICAフィルタの最大反復回数は、3に設定した。
実験条件4は、ステップ・サイズをアニーリング・ベースで算出した値を用いる場合(λ=0.9)であり、実験条件5は、ステップ・サイズμを0.05に固定した場合であり、実験条件6は、ステップ・サイズμを0.1に固定した場合である。なお、アニーリング・ベースにおいてステップ・サイズの算出は、パラメータαγ= 0.6およびβγ=5.0×10−3である。
次に、本実施形態の方法において、実験条件1の区間数P=2および実験条件2の区間数P=1は、ほとんどすべての状況において、他のすべての実験条件4〜6に勝っていた。なお、区間数P=0の結果は、1つの適応ステップ・サイズでの性能を意味し、すなわち、区間線型モデルを適用していない場合の実験結果を意味している。この点において、区間数P=2の実験条件1またはP=1の実験条件2の方が、区間数P=0の実験条件3より収束速度が速く、例えば10程度の少ない反復回数でも音声認識率が高い(分離性能が良い)。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM(Read Only Memory)、CD−ROM等の可搬媒体、USB(Universal Serial Bus) I/F(インタフェース)を介して接続されるUSBメモリー、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリーのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
20・・・スピーカ
30、31、32・・・マイクロホン
100・・・残響抑圧装置
101・・・制御部
102・・・音声生成部
111・・・音声取得部
112・・・STFT部(白色化部)
113・・・MCSB−ICA部(第1評価関数算出部、残響成分抑圧部、分離行列更新部)
114・・・記憶部
115・・・分離データ出力部
210・・・強制空間球面化部
211・・・空間球面化部
212・・・分散正規化部
221・・・ICA部
231・・・スケーリング部
241・・・直接音選択部
Claims (8)
- 音声信号を生成し、生成した音声信号を出力する音声信号出力部と、
前記音声信号出力部と音源とから発せられた音源信号を集音する複数のマイクロホンによって、前記生成された音声信号と前記生成された音声信号以外を含む入力信号を取得する音声取得部と、
前記生成された音声信号と前記入力信号と前記音源信号との相関関係を示す分離行列を算出するとともに、前記音源信号の分離度を前記入力信号に基づいて評価する第1評価関数を算出する第1評価関数算出部と、
前記第1評価関数に基づき音源信号の分離度が所定値より高くなる場合の前記分離行列である最適分離行列を算出し、前記算出した最適分離行列に基づいて、前記生成された音声信号以外の音声信号であって、残響成分が抑圧された当該音声信号を1人の人の音声信号として前記入力信号から分離することにより残響成分を抑圧する残響成分抑圧部と、
前記分離行列の更新量の大きさを定めるステップ・サイズの関数を、複数の区間に分け当該複数の区間毎に線形関数を用いて近似し、前記近似した線形関数に基づき前記ステップ・サイズを算出し、前記算出されたステップ・サイズを用いて、前記第1評価関数に基づき音源信号の前記分離度が前記所定値より高くなるように前記分離行列の更新を繰り返す分離行列更新部と、
を備えることを特徴とする残響抑圧装置。 - 前記分離行列更新部は、
前記線形関数を用いて近似した各区間の両端のステップ・サイズを用いて前記ステップ・サイズを前記複数の区間について区間毎に算出し、前記ステップ・サイズを評価するための第2評価関数を最小にするように前記ステップ・サイズを算出する
ことを特徴とする請求項1に記載の残響抑圧装置。 - 前記分離行列更新部は、
前記線形関数を用いて近似した各区間の両端のステップ・サイズは、互いに隣り合う区間において連続するように前記複数の区間毎に、前記線形関数を用いて近似する
ことを特徴とする請求項1または請求項2に記載の残響抑圧装置。 - 前記入力信号と前記生成された音声信号に対して球面化と分散正規化とを行うことで白色化する白色化部、
を更に備え、
前記第1評価関数算出部は、前記白色化された入力信号に基づき前記分離行列を算出する
ことを特徴とする請求項1から請求項3のいずれか1項に記載の残響抑圧装置。 - 前記白色化部は、
前記白色化された信号に対して時間相関を強制的に除去し、当該時間相関を強制的に除去した信号から、前記白色化された信号に対して前記生成された音声信号と前記入力信号との相関を強制的に除去する
ことを特徴とする請求項4に記載の残響抑圧装置。 - 前記残響成分抑圧部は、
前記複数の区間の数である区間数を算出するためのパラメータを球面化して算出し、
算出したパラメータを用いて前記区間数を算出する
ことを特徴とする請求項1から請求項5のいずれか1項に記載の残響抑圧装置。 - 前記残響成分抑圧部は、
独立成分分析法を用いて前記分離行列の更新と、前記生成された音声信号以外の音声信号であって、前記入力信号から残響成分が抑圧された当該音声信号を分離することにより残響成分を抑圧する
ことを特徴とする請求項1から請求項6のいずれか1項に記載の残響抑圧装置。 - 音声信号出力部が、音声信号を生成し、生成した音声信号を出力する音声信号出力工程と、
音声取得部が、前記音声信号出力部と音源とから発せられた音源信号を集音する複数のマイクロホンによって、前記生成された音声信号と前記生成された音声信号以外を含む入力信号を取得する音声取得工程と、
第1評価関数算出部が、前記生成された音声信号と前記入力信号と前記音源信号との相関関係を示す分離行列を算出するとともに、前記音源信号の分離度を前記入力信号に基づいて評価する第1評価関数を算出する第1評価関数算出工程と、
残響成分抑圧部が、前記第1評価関数算出工程により算出された前記第1評価関数に基づき音源信号の分離度が所定値より高くなる場合の前記分離行列である最適分離行列を算出し、前記算出した最適分離行列に基づいて、前記生成された音声信号以外の音声信号であって、残響成分が抑圧された当該音声信号を1人の人の音声信号として前記入力信号から分離することにより残響成分を抑圧する残響成分抑圧工程と、
分離行列更新部が、前記分離行列の更新量の大きさを定めるステップ・サイズの関数を、複数の区間に分け当該複数の区間毎に線形関数を用いて近似し、前記近似した線形関数に基づき前記ステップ・サイズを算出し、前記算出されたステップ・サイズを用いて、前記第1評価関数に基づき音源信号の前記分離度が前記所定値より高くなるように前記分離行列の更新を繰り返す分離行列更新工程と、
を備えることを特徴とする残響抑圧方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US21776009P | 2009-06-04 | 2009-06-04 | |
US61/217,760 | 2009-06-04 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010282193A JP2010282193A (ja) | 2010-12-16 |
JP5550456B2 true JP5550456B2 (ja) | 2014-07-16 |
Family
ID=43380761
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010124873A Active JP5550456B2 (ja) | 2009-06-04 | 2010-05-31 | 残響抑圧装置、及び残響抑圧方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8391505B2 (ja) |
JP (1) | JP5550456B2 (ja) |
Families Citing this family (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2337375B1 (en) * | 2009-12-17 | 2013-09-11 | Nxp B.V. | Automatic environmental acoustics identification |
JP5634347B2 (ja) * | 2011-08-08 | 2014-12-03 | 三菱電機株式会社 | 信号分離装置及び信号分離方法 |
US10540992B2 (en) | 2012-06-29 | 2020-01-21 | Richard S. Goldhor | Deflation and decomposition of data signals using reference signals |
US10473628B2 (en) * | 2012-06-29 | 2019-11-12 | Speech Technology & Applied Research Corporation | Signal source separation partially based on non-sensor information |
CN104793522A (zh) * | 2015-04-21 | 2015-07-22 | 西北农林科技大学 | 一种喷药机器人的声控系统 |
US10264030B2 (en) | 2016-02-22 | 2019-04-16 | Sonos, Inc. | Networked microphone device control |
US10509626B2 (en) | 2016-02-22 | 2019-12-17 | Sonos, Inc | Handling of loss of pairing between networked devices |
US9820039B2 (en) | 2016-02-22 | 2017-11-14 | Sonos, Inc. | Default playback devices |
US10095470B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Audio response playback |
US9978390B2 (en) | 2016-06-09 | 2018-05-22 | Sonos, Inc. | Dynamic player selection for audio signal processing |
US10134399B2 (en) | 2016-07-15 | 2018-11-20 | Sonos, Inc. | Contextualization of voice inputs |
US10115400B2 (en) | 2016-08-05 | 2018-10-30 | Sonos, Inc. | Multiple voice services |
JP6703460B2 (ja) * | 2016-08-25 | 2020-06-03 | 本田技研工業株式会社 | 音声処理装置、音声処理方法及び音声処理プログラム |
US10181323B2 (en) | 2016-10-19 | 2019-01-15 | Sonos, Inc. | Arbitration-based voice recognition |
US10475449B2 (en) | 2017-08-07 | 2019-11-12 | Sonos, Inc. | Wake-word detection suppression |
US10048930B1 (en) | 2017-09-08 | 2018-08-14 | Sonos, Inc. | Dynamic computation of system response volume |
US10446165B2 (en) * | 2017-09-27 | 2019-10-15 | Sonos, Inc. | Robust short-time fourier transform acoustic echo cancellation during audio playback |
US10621981B2 (en) | 2017-09-28 | 2020-04-14 | Sonos, Inc. | Tone interference cancellation |
US10482868B2 (en) | 2017-09-28 | 2019-11-19 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US10051366B1 (en) | 2017-09-28 | 2018-08-14 | Sonos, Inc. | Three-dimensional beam forming with a microphone array |
US10466962B2 (en) | 2017-09-29 | 2019-11-05 | Sonos, Inc. | Media playback system with voice assistance |
US10529353B2 (en) * | 2017-12-11 | 2020-01-07 | Intel Corporation | Reliable reverberation estimation for improved automatic speech recognition in multi-device systems |
US11175880B2 (en) | 2018-05-10 | 2021-11-16 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
US10959029B2 (en) | 2018-05-25 | 2021-03-23 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
US11076035B2 (en) | 2018-08-28 | 2021-07-27 | Sonos, Inc. | Do not disturb feature for audio notifications |
US10587430B1 (en) | 2018-09-14 | 2020-03-10 | Sonos, Inc. | Networked devices, systems, and methods for associating playback devices based on sound codes |
US11024331B2 (en) | 2018-09-21 | 2021-06-01 | Sonos, Inc. | Voice detection optimization using sound metadata |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US10692518B2 (en) | 2018-09-29 | 2020-06-23 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection via multiple network microphone devices |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
US11183183B2 (en) | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US10602268B1 (en) | 2018-12-20 | 2020-03-24 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
US10867604B2 (en) | 2019-02-08 | 2020-12-15 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing |
US11120794B2 (en) | 2019-05-03 | 2021-09-14 | Sonos, Inc. | Voice assistant persistence across multiple network microphone devices |
US11200894B2 (en) | 2019-06-12 | 2021-12-14 | Sonos, Inc. | Network microphone device with command keyword eventing |
US10871943B1 (en) | 2019-07-31 | 2020-12-22 | Sonos, Inc. | Noise classification for event detection |
US11189286B2 (en) | 2019-10-22 | 2021-11-30 | Sonos, Inc. | VAS toggle based on device orientation |
WO2021100136A1 (ja) * | 2019-11-20 | 2021-05-27 | 日本電信電話株式会社 | 音源信号推定装置、音源信号推定方法、プログラム |
US11200900B2 (en) | 2019-12-20 | 2021-12-14 | Sonos, Inc. | Offline voice control |
US11562740B2 (en) | 2020-01-07 | 2023-01-24 | Sonos, Inc. | Voice verification for media playback |
US11308958B2 (en) | 2020-02-07 | 2022-04-19 | Sonos, Inc. | Localized wakeword verification |
US11482224B2 (en) | 2020-05-20 | 2022-10-25 | Sonos, Inc. | Command keywords with input detection windowing |
US11984123B2 (en) | 2020-11-12 | 2024-05-14 | Sonos, Inc. | Network device interaction by range |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5694474A (en) * | 1995-09-18 | 1997-12-02 | Interval Research Corporation | Adaptive filter for signal processing and method therefor |
CA2186416C (en) * | 1995-09-26 | 2000-04-18 | Suehiro Shimauchi | Method and apparatus for multi-channel acoustic echo cancellation |
US5774562A (en) * | 1996-03-25 | 1998-06-30 | Nippon Telegraph And Telephone Corp. | Method and apparatus for dereverberation |
JPH09261133A (ja) | 1996-03-25 | 1997-10-03 | Nippon Telegr & Teleph Corp <Ntt> | 残響抑圧方法および装置 |
JP4313728B2 (ja) * | 2004-06-17 | 2009-08-12 | 日本電信電話株式会社 | 音声認識方法、その装置およびプログラム、その記録媒体 |
JP4234174B2 (ja) * | 2004-06-30 | 2009-03-04 | パイオニア株式会社 | 残響調整装置、残響調整方法、残響調整プログラムおよびそれを記録した記録媒体、並びに、音場補正システム |
JP4653674B2 (ja) * | 2005-04-28 | 2011-03-16 | 日本電信電話株式会社 | 信号分離装置、信号分離方法、そのプログラムおよび記録媒体 |
JP4556875B2 (ja) * | 2006-01-18 | 2010-10-06 | ソニー株式会社 | 音声信号分離装置及び方法 |
JP4444345B2 (ja) * | 2007-06-08 | 2010-03-31 | 本田技研工業株式会社 | 音源分離システム |
JP5178370B2 (ja) * | 2007-08-09 | 2013-04-10 | 本田技研工業株式会社 | 音源分離システム |
WO2009110574A1 (ja) * | 2008-03-06 | 2009-09-11 | 日本電信電話株式会社 | 信号強調装置、その方法、プログラム及び記録媒体 |
JP5530741B2 (ja) * | 2009-02-13 | 2014-06-25 | 本田技研工業株式会社 | 残響抑圧装置及び残響抑圧方法 |
-
2010
- 2010-05-31 JP JP2010124873A patent/JP5550456B2/ja active Active
- 2010-06-01 US US12/791,428 patent/US8391505B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US8391505B2 (en) | 2013-03-05 |
JP2010282193A (ja) | 2010-12-16 |
US20100329472A1 (en) | 2010-12-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5550456B2 (ja) | 残響抑圧装置、及び残響抑圧方法 | |
JP5572445B2 (ja) | 残響抑圧装置、及び残響抑圧方法 | |
JP5124014B2 (ja) | 信号強調装置、その方法、プログラム及び記録媒体 | |
US20170140771A1 (en) | Information processing apparatus, information processing method, and computer program product | |
JP4774100B2 (ja) | 残響除去装置、残響除去方法、残響除去プログラム及び記録媒体 | |
Yoshioka et al. | Making machines understand us in reverberant rooms: Robustness against reverberation for automatic speech recognition | |
US8160273B2 (en) | Systems, methods, and apparatus for signal separation using data driven techniques | |
JP5738020B2 (ja) | 音声認識装置及び音声認識方法 | |
JP4532576B2 (ja) | 処理装置、音声認識装置、音声認識システム、音声認識方法、及び音声認識プログラム | |
JP6703460B2 (ja) | 音声処理装置、音声処理方法及び音声処理プログラム | |
US20080208538A1 (en) | Systems, methods, and apparatus for signal separation | |
Schmid et al. | Variational Bayesian inference for multichannel dereverberation and noise reduction | |
JP6124949B2 (ja) | 音声処理装置、音声処理方法、及び音声処理システム | |
JP2004347761A (ja) | 音声認識装置、音声認識方法、該音声認識方法をコンピュータに対して実行させるためのコンピュータ実行可能なプログラムおよび記憶媒体 | |
Doclo et al. | Multimicrophone noise reduction using recursive GSVD-based optimal filtering with ANC postprocessing stage | |
Nesta et al. | A flexible spatial blind source extraction framework for robust speech recognition in noisy environments | |
JPWO2019026973A1 (ja) | ニューラルネットワークを用いた信号処理装置、ニューラルネットワークを用いた信号処理方法及び信号処理プログラム | |
JP4348393B2 (ja) | 信号歪み除去装置、方法、プログラム及びそのプログラムを記録した記録媒体 | |
JP2007093630A (ja) | 音声強調装置 | |
US20230306980A1 (en) | Method and System for Audio Signal Enhancement with Reduced Latency | |
Takeda et al. | ICA-based efficient blind dereverberation and echo cancellation method for barge-in-able robot audition | |
Takeda et al. | Upper-limit evaluation of robot audition based on ICA-BSS in multi-source, barge-in and highly reverberant conditions | |
Kinoshita et al. | A linear prediction-based microphone array for speech dereverberation in a realistic sound field | |
Miyoshi et al. | Calculating inverse filters for speech dereverberation | |
Takeda et al. | Automatic estimation of reverberation time with robot speech to improve ICA-based robot audition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131001 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131202 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140107 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140305 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140425 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140520 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5550456 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |