JP2009014937A - エコー抑圧装置、エコー抑圧方法及びコンピュータプログラム - Google Patents

エコー抑圧装置、エコー抑圧方法及びコンピュータプログラム Download PDF

Info

Publication number
JP2009014937A
JP2009014937A JP2007175581A JP2007175581A JP2009014937A JP 2009014937 A JP2009014937 A JP 2009014937A JP 2007175581 A JP2007175581 A JP 2007175581A JP 2007175581 A JP2007175581 A JP 2007175581A JP 2009014937 A JP2009014937 A JP 2009014937A
Authority
JP
Japan
Prior art keywords
echo
sound signal
sound
correlation
ratio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007175581A
Other languages
English (en)
Other versions
JP4916394B2 (ja
Inventor
Naoji Matsuo
直司 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2007175581A priority Critical patent/JP4916394B2/ja
Priority to DE102008027848A priority patent/DE102008027848B4/de
Priority to US12/142,826 priority patent/US8644496B2/en
Priority to CN2008101357059A priority patent/CN101339769B/zh
Publication of JP2009014937A publication Critical patent/JP2009014937A/ja
Application granted granted Critical
Publication of JP4916394B2 publication Critical patent/JP4916394B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)

Abstract

【課題】エコーキャンセラ等に適用され、例えばダブルトーク及びシングルトークの境界において境界の判定に遅延を生じさせることがなく、複数チャネルで音を出力するシステムに適用した場合、装置の大型化を防止し、しかも適応処理を行わないため推定能力を超えて残留エコーが大きくなるという問題を生じさせることがないエコー抑圧装置、エコー抑圧方法及びコンピュータプログラムを提供する。
【解決手段】スピーカ等の音出力部に出力させる音の基となる参照音信号、及びマイクロホン等の音入力部が入力した音に基づく観測音信号を周波数軸上の成分に変換し、変換後の参照音信号及び観測音信号の比及び相関を示す値を求め、該比及び相関の値の大小を比較し、比較した結果並びに比及び相関からエコーの推定に要する推定係数を導出し、導出した推定係数を用いて、エコーを推定し、推定したエコーに基づいて観測音信号を抑圧する。
【選択図】図2

Description

本発明は、音信号を生成して音を音出力部から出力させる音出力装置、及び音入力部が入力した音に基づく観測音信号を処理する音処理装置と連携して稼働可能であり、観測音信号のエコーを抑圧するエコー抑圧装置、該エコー抑圧装置を用いて実現するエコー抑圧方法、並びに前記抑圧装置を実現するコンピュータプログラムに関する。
例えば、従来のカーナビゲーションシステムにおける音声認識では、話者が発声する前に発話スイッチを押下することにより、カーナビゲーションシステムを消音し、カーナビゲーションシステムのスピーカから出力された音が、エコーとしてマイクロホンに回り込み、音声の誤認識の要因となることを防止している。これに対し、出力音を消音することなく音声認識による操作を行いたいという使用者からの要望がある。この様な要望に応えるためにはスピーカからマイクロホンに回り込む音を抑圧するエコー抑圧方法が必要となる。また車両内の音響、即ちカーオーディオシステムでは、マルチチャネルに対応すべく複数のスピーカが用いられているため、マルチチャネルのカーオーディオシステムから音声認識等の用途に用いられるマイクロホンに回り込むエコーに対応するエコー抑圧方法が要求される。
そこでモノラルチャネルのオーディオシステムに対応するエコー抑圧方法をマルチチャネルのオーディオシステムに適用したエコー抑圧装置が提案されている。図12は、従来の第1のエコー抑圧装置の構成を示す模式図である。図12中1000は、エコー抑圧装置であり、エコー抑圧装置1000は、マルチチャネルオーディオ2000から出力された複数チャネルの音信号を、複数のスピーカ2001,2001,…へ出力し、各スピーカ2001,2001,…は、夫々の音信号に基づく出力を行う。そしてエコー抑圧装置1000は、マイクロホン2002にて受音した音から、出力された複数チャネルの音に基づくエコーを除去する。エコーの除去は、受音した音に基づく観測音信号y(t)から、出力する複数チャネル(n)の音に基づく参照音信号x1(t),…,xn(t)を、夫々のチャネルの参照音信号x1(t),…,xn(t)に対応した複数の抑圧機構(エコーキャンセラ)1001−1,…,1001−nにて夫々に対応するエコーを抑圧することにより行う。
またモノラルチャネルのオーディオシステムに対応するエコー抑圧方法をマルチチャネルのオーディオシステムに適用したエコー抑圧装置は、図12以外の形態についても提案されている。図13は、従来の第2のエコー抑圧装置の構成を示す模式図である。第2のエコー抑圧装置1000は、複数チャネルの音に基づく参照音信号x1(t),…,xn(t)を加算する加算機構1002にて加算参照音信号x(t)を生成し、一の抑圧機構1001にて、観測音信号y(t)から、加算参照音信号x(t)に基づいてエコーを抑圧する。
図14は、従来のエコー抑圧装置が備える抑圧機構1001の機能構成を示す機能ブロック図である。抑圧機構1001は、話者が発声しているダブルトークの状態及び発声していないシングルトークの状態を検出する検出部10010と、学習同定法を用いた適応処理により、エコーの推定に要するフィルタ係数を更新するフィルタ係数更新部10011と、フィルタ係数を用いた数百次の積和演算により、参照音信号x(t)から、エコー信号x’(t)を推定する線形FIRフィルタ10012と、観測音信号y(t)からエコー信号x’(t)を減算することによりエコーの抑圧を行った抑圧結果r(t)を出力する減算部10013とを備えている。検出部10010は、抑圧結果r(t)の強度変化に基づいてシングルトークの状態とダブルトークの状態とを検出し、ダブルトークの状態時には、フィルタ係数更新部10011のフィルタ係数の更新を停止させる。フィルタ係数更新部10011は、抑圧結果r(t)に基づいてフィルタ係数を求める。
なお図12に示したエコー抑圧装置1000では、図14に示す抑圧機構1001を参照音信号x1(t),…,xn(t)毎に備えている。この様なエコー抑圧方法は、例えば特許文献1に開示されている。
特開2002−237769号公報
しかしながら図14に示した様な学習同定法を用いた適応処理では、過去の学習結果に基づいてエコーを抑圧するため、ダブルトーク及びシングルトークの境界等の観測音信号の大きな変化に対する追従性が悪いという問題がある。このため話者の発声開始直後の状態をシングルトークとして検出したり、発声終了直後のエコーのみの状態をダブルトークとして検出したりすることにより、誤った音声認識処理を行うという問題に繋がる。
また図12に示した様に各チャネルに対応する抑圧機構を要する方法では、コストの増大、装置の大型化等の問題がある。特に設置スペースの制約が大きいカーナビゲーションシステムに適用する場合、大型化の問題は深刻である。
さらに図13に示した様に参照音信号を加算してモノラルチャネルの加算参照音信号とした場合には、抑圧できていない残留エコーが大きくなるという問題が生じる。これはマルチチャネルオーディオ2000による音楽等の音の出力では、各スピーカの再生音及び強度が独立して変化するため、複数経路のエコーを一の適応処理にて学習し、推定することができないためである。
本発明は斯かる事情に鑑みてなされたものであり、参照音信号及び観測音信号を周波数軸上の成分に変換し、変換後の参照音信号及び観測音信号の比及び相関を示す値を求め、該比及び相関の値の大小を比較し、比較した結果並びに比及び相関からエコーの推定に要する推定係数を導出し、導出した推定係数を用いて、エコーを推定し、推定したエコーに基づいて観測音信号を抑圧することにより、学習同定法を用いた適応処理ではないため、ダブルトーク及びシングルトークの境界等の観測音信号の大きな変化に対しても境界の判定に遅延を生じさせることがなく、従って誤認識を防止することが可能なエコー抑圧装置、該エコー抑圧装置を用いて実現するエコー抑圧方法、並びに前記抑圧装置を実現するコンピュータプログラムの提供を主たる目的とする。
また本発明は、参照音信号が複数の場合に、各参照音信号を加算した信号に基づいて、エコー抑制処理を行うことにより、チャネル毎の抑圧処理を要しないため、コストの増大を防止し、装置の大型化を防止することが可能であり、しかも学習同定法を用いた適応処理ではないため推定能力を超えて残留エコーが大きくなるという問題を生じさせることがないエコー抑圧装置等の提供を他の目的とする。
第1発明に係るエコー抑圧装置は、音信号を生成して音を音出力部から出力させる音出力装置、及び音入力部が入力した音に基づく観測音信号を処理する音処理装置と連携可能であり、前記観測音信号のエコーを抑圧するエコー抑圧装置において、音出力部に出力させる音の基となる参照音信号、及び音入力部が入力した音に基づく観測音信号を周波数軸上の成分に変換する変換部と、前記参照音信号及び前記観測音信号の周波数軸上の成分の比及び相関を示す値を求める計算部と、前記比及び前記相関の値の大小を比較する比較部と、比較した結果並びに前記比及び前記相関から前記エコーの推定に要する推定係数を導出する導出部と、前記推定係数を用いて、前記エコーを推定する推定部と、推定した前記エコーに基づいて前記観測音信号を抑圧する抑圧部とを備えることを特徴とする。
第2発明に係るエコー抑圧装置は、第1発明において、更に、前記参照音信号が複数の場合に、各参照音信号を加算する加算部を備え、前記変換部は、観測音信号及び加算された参照音信号を周波数軸上の成分に変換する様に構成してあることを特徴とする。
第3発明に係るエコー抑圧装置は、第1発明又は第2発明において、前記計算部は、計算の対象となる周波数を含む所定周波数範囲内における参照音信号の各周波数での値と観測音信号の各周波数での値との相関を求める様に構成してあり、計算の対象となる周波数に応じて、前記所定周波数範囲を変更する様に構成してあることを特徴とする。
第4発明に係るエコー抑圧装置は、第1発明乃至第3発明のいずれかにおいて、前記導出部は、更に、前記比と前記相関との大小関係に関する閾値を複数設定し、前記複数の閾値と前記比と前記相関とに基づき、シングルトーク状態かダブルトーク状態かを判定する様に構成してあることを特徴とする。
第5発明に係るエコー抑圧装置は、第4発明において、前記導出部は、前記比と前記相関とに基づき、シングルトーク状態かダブルトーク状態かを判定する際に用いる閾値を、周波数に応じて変更する様に構成してあることを特徴とする。
第6発明に係るエコー抑圧装置は、第1発明乃至第5発明のいずれかにおいて、前記計算部は、周波数軸上の成分に変換した観測音信号の振幅スペクトル及び参照音信号の振幅スペクトルに基づいて、比及び相関を示す値を求める様に構成してあることを特徴とする。
第7発明に係るエコー抑圧装置は、第6発明において、前記推定部は、エコーの振幅スペクトルを推定する様に構成してあり、前記抑圧部は、エコーの振幅スペクトルに対する観測音信号の振幅スペクトルの比が所定の閾値以上である場合に、観測音信号の振幅スペクトルを抑圧する様に構成してあることを特徴とする。
第8発明に係るエコー抑圧装置は、第7発明において、前記抑圧部は、抑圧の対象となる周波数に応じて閾値を変更する様に構成してあることを特徴とする。
第9発明に係るエコー抑圧方法は、音信号を生成して音を音出力部から出力させる音出力装置、及び音入力部が入力した音に基づく観測音信号を処理する音処理装置と連携可能なエコー抑圧装置に、前記観測音信号のエコーを抑圧させるエコー抑圧方法であって、前記音出力部に出力させる音の基となる参照音信号、及び前記音入力部が入力した音に基づく観測音信号を周波数軸上の成分に変換する手順と、前記参照音信号及び前記観測音信号の変換後の周波数軸上の成分の比及び相関を示す値を求める手順と、前記比及び前記相関の値の大小を比較する手順と、比較した結果並びに前記比及び前記相関からエコーの推定に要する推定係数を導出する手順と、前記推定係数を用いて、前記エコーを推定する手順と、前記エコーに基づいて前記観測音信号を抑圧する手順とを含むことを特徴とする。
第10発明に係るコンピュータプログラムは、コンピュータにロードして、該コンピュータ上で実行される手順を定義したプログラムであって、音信号を生成して音を音出力部から出力させる音出力装置、及び音入力部が入力した音に基づく音信号を処理する音処理装置と連携させ、前記観測音信号のエコーを抑圧させるコンピュータプログラムにおいて、コンピュータに、前記参照音信号及び前記観測音信号を変換した周波数軸上の成分の比及び相関を示す値を求める手順と、前記比及び前記相関の値の大小を比較する手順と、比較した結果並びに前記比及び前記相関からエコーの推定に要する推定係数を導出する手順と、前記推定係数を用いて、エコーを推定する手順と、推定したエコーに基づいて前記観測音信号を抑圧する手順とを実行させることを特徴とする。
第1発明、第9発明及び第10発明では、比及び相関の関係からダブルトークの状態か、シングルトークの状態かをリアルタイムに判別し、エコーの推定方法を適宜変更することにより、過去の信号を参照することが無いため、学習同定法を用いた適応処理の様に、ダブルトーク及びシングルトークの境界の判定に遅延を生じさせることがない。
第2発明では、マルチチャネルオーディオに対応することが可能であり、夫々の参照音信号毎にエコーを推定する必要がないため、チャンネル毎の抑圧部を設ける必要がなく、従って抑圧回路のコストの増大を防止し、設置スペースの拡大を防止することが可能である。また学習同定法を用いた適応処理ではないため推定能力を超えて残留エコーが大きくなるという問題を生じさせることがない。
第3発明では、例えば話者が発声した音と、参照音信号に基づき出力された音との差を検出し難い低周波数領域程、算出に用いる所定周波数範囲を拡大することにより、相関の感度を相対的に上げることができ、ダブルトークの検出精度を向上させることが可能である。
第4発明では、例えば比が相関の第1の閾値未満である場合に、参照音信号及び観測音信号の相関が高いシングルトークの状態にあると見なし、推定係数として扱う比及び参照音信号に基づきエコーを推定することが可能である。また例えば信号比が相関の第2の閾値以上である場合に、参照音信号及び観測音信号の相関が低いダブルトークの状態になると見なし、推定係数として扱う相関及び参照音信号に基づきエコーを推定することが可能である。
第5発明では、低周波数から高周波数になる程、閾値を小さくすることにより、ダブルトークに対する検出精度を高くして話者の発生に対する歪みを抑制することが可能であり、また低周波数から高周波数になる程、閾値を大きくすることにより、シングルトークに対する検出精度を高くして残留エコーの発生を抑制することが可能である。
第6発明及び第7発明では、複素数スペクトルの実部に基づく振幅スペクトルを用いることにより、計算負荷を軽減することが可能である。
第8発明では、低周波数から高周波数になる程、閾値を小さくすることにより、ダブルトークに対する検出精度を高くして話者の発生に対する歪みを抑制することが可能であり、また低周波数から高周波数になる程、閾値を大きくすることにより、シングルトークに対する検出精度を高くして残留エコーの発生を抑制することが可能である。
本発明に係るエコー抑圧装置、エコー抑圧方法及びコンピュータプログラムは、スピーカ等の音出力部に出力させる音の基となる参照音信号、及びマイクロホン等の音入力部が受け付けた音に基づく観測音信号を周波数軸上の成分に変換し、変換後の参照音信号及び観測音信号の比及び相関を示す値を求め、該比及び相関の値の大小を比較し、比較した結果並びに比及び相関からエコーの推定に要する推定係数を導出し、導出した推定係数を用いて、エコーを推定し、推定したエコーに基づいて観測音信号を抑圧する。
この構成により、本発明では、比及び相関の関係からダブルトークの状態か、シングルトークの状態かを判別し、エコーの推定方法を適宜変更することにより、過去の信号を参照することが無いため、学習同定法を用いた適応処理の様に、ダブルトーク及びシングルトークの境界の判定に遅延を生じさせることがない等、優れた効果を奏する。従って例えば音声認識処理に適用した場合、発声開始時、発声終了直後等の境界における誤認識を抑制することが可能である等、優れた効果を奏する。
また本発明は、複数の出力部を用いたマルチチャネルオーディオに適用した場合、各チャネルの参照音信号を加算した信号に基づいて処理を行うことにより、夫々の参照音信号毎にエコーを推定する必要がないため、チャネル毎の抑圧部を設ける必要がない等、優れた効果を奏する。このためコストの増大を防止し、設置スペースの拡大を防止することが可能である等、優れた効果を奏する。また学習同定法を用いた適応処理ではないため推定能力を超えて残留エコーが大きくなるという問題を生じさせることがない等、優れた高価を奏する。
さらに本発明は、音信号を変換した複素スペクトルに共役複素数を乗じて実数化した値、又は複素スペクトルの実数部に基づく振幅スペクトルを用いることにより、複素数に基づく複雑な演算を回避し、計算負荷を軽減することが可能である等、優れた効果を奏する。
さらに本発明は、算出の対象となる周波数を含む所定周波数範囲内における観測音信号の各周波数での値の総和及び参照音信号の各周波数での値の総和の比を相関として用いており、算出の対象となる周波数に応じて、所定周波数範囲を変更する。
この構成により、本発明では、例えば話者が発声した音と、参照音信号に基づき出力された音との差を検出し難い低周波数領域程、算出に用いる所定周波数範囲を拡大することにより、相関の感度を相対的に上げることができ、ダブルトークの検出精度を向上させることが可能である等、優れた効果を奏する。
さらに本発明は、比と相関との大小関係に関する閾値を複数設定し、複数の閾値と比と相関とに基づき、シングルトーク状態かダブルトーク状態かを判定する様に構成してある。具体的な例として、本発明は、比が相関の第1の閾値である第1定数未満である場合に、比の値に基づいて推定係数を導出する様に構成してあり、比が相関の第1定数より大きい閾値である第2定数以上である場合に、相関の値に基づいて推定係数を導出する様に構成してあり、比が相関の第1定数倍以上で、かつ第2定数倍未満である場合に、比及び相関の値に基づいて推定係数を導出する様に構成してある。
この構成により、本発明では、比が相関の第1定数倍未満である場合に、参照音信号及び観測音信号の相関が高いシングルトークの状態にあると見なし、推定係数として扱う比及び参照音信号に基づき補正量としてエコーを推定し、比が相関の第2定数倍以上である場合に、参照音信号及び観測音信号の相関が低いダブルトークの状態になると見なし、推定係数として扱う相関及び参照音信号に基づき補正量としてエコーを推定することが可能である等、優れた効果を奏する。更に比が相関の第1定数倍以上で、かつ第2定数倍未満である場合に、比及び相相関に基づき、例えば加重平均値を推定係数とすることにより、シングルトーク及びダブルトークの境界における不連続な変化を抑制することが可能である等、優れた効果を奏する。また低周波数から高周波数になる程、第1定数及び第2定数を小さくすることにより、ダブルトークに対する検出精度を高くし、話者の発声に対する歪みを抑制することが可能であり、低周波数から高周波数になる程、第1定数及び第2定数を大きくすることにより、シングルトークに対する検出精度を高くし、残留エコーの発生を抑制することが可能である等、優れた効果を奏する。
以下、本発明をその実施の形態を示す図面に基づいて詳述する。
実施の形態1.
図1は、本発明の実施の形態1に係るエコー抑圧装置の構成例を示す模式図である。図1中1は、例えばテレビ会議システム、車両に搭載されるカーナビゲーションシステム等のコンピュータを用いたエコー抑圧装置であり、エコー抑圧装置1は、マルチチャネルオーディオ等の音出力装置2及び音声認識システム等の音処理装置3と連携して動作する。音出力装置2から出力される複数チャネルのアナログ信号である出力音信号は、スピーカ等の複数の音出力部20,20,…から音として出力される。またコンデンサマイクロホン等の音入力部30は、外部の音を受け付け、受け付けた音に基づいてアナログ信号である入力音信号を生成し、音処理装置3へ出力する。エコー抑圧装置1は、音出力部20,20,…から夫々出力された音に基づくエコーを、音入力部30が受け付けた音から除去するエコーキャンセラの機能を備えている。なお以降の説明において、特にエコー抑圧装置1内のn個(nは自然数)の出力音信号を参照音信号x1(t),…,xn(t)として示し、入力音信号を観測音信号y(t)として示す。
さらにエコー抑圧装置1は、複数の参照音信号x1,…,xnを加算して加算参照音信号x(t)を生成するアナログミキサー等の加算機構10と、生成した加算参照音信号x(t)を8000Hz等の周期で標本化してデジタル信号に変換し、デジタル信号に変換した際の折り返し誤差(エイリアジング)を防止すべく、LPF(Low Pass Filter )によるアンチエイリアジングフィルタ処理を行う第1A/D(Analog to Digital )変換機構11と、観測音信号y(t)を増幅するアンプ等の増幅機構12と、増幅した観測音信号y(t)を8000Hz等の周期で標本化してデジタル信号に変換し、アンチエイリアジングフィルタ処理を行う第2A/D変換機構13と、加算参照音信号x(t)に基づいて、観測音信号y(t)を補正するエコー抑圧処理を行い、処理結果となるデジタル信号である抑圧結果信号r(t)を出力するDSP(Digital Signal Processor)等のエコー抑圧機構14と、抑圧結果信号r(t)をアナログ信号に変換して音処理装置3へ出力するD/A(Digital to Analog )変換機構15とを備えている。エコー抑圧機構14は、本発明のコンピュータプログラム100及びデータ等のファームウェアが組み込まれた演算回路であり、ファームウェアとして組み込まれた本発明のコンピュータプログラム100を実行することにより、コンピュータは、本発明のエコー抑圧装置1として動作する。そして音処理装置3は、受け付けた抑圧結果信号r(t)に基づいて音声認識等の処理を実行する。
図2は、本発明の実施の形態1に係るエコー抑圧装置1が備えるエコー抑圧機構14の機能構成例を示す機能ブロック図である。エコー抑圧装置1が備えるエコー抑圧機構14は、デジタル信号に変換した加算参照音信号x(t)及び観測音信号y(t)から20〜40ms程度の所定時間長のフレームを夫々生成する。なお各フレームは、10ms〜20ms程度ずつオーバーラップしており、各フレームに対しては、ハミング窓、ハニング窓等の窓関数、高域強調フィルタによるフィルタリング等の音声認識の分野で一般的なフレーム処理が施される。この様にして生成した各フレームに対して以下に説明する様々な機能による信号処理を実行する。
エコー抑圧機構14は、本発明のコンピュータプログラム100を実行することにより、フレーム単位の加算参照音信号x(t)をFFT(高速フーリエ変換:Fast Fourier Transformation)処理にて周波数軸上の成分に変換することにより、参照音信号X(f)を生成する第1FFT変換部140、及びフレーム単位の観測音信号y(t)をFFT処理にて周波数軸上の成分に変換することにより、観測音信号Y(f)を生成する第2FFT変換部141として機能する。変換された参照音信号X(f)及び観測音信号Y(f)は、複素スペクトルとなる。なお周波数軸上に変換する方法として、DCT(離散コサイン変換:Discrete Cosine Transform )等の変換方法を用いる様にしても良い。
さらにエコー抑圧機構14は、本発明のコンピュータプログラム100を実行することにより、観測音信号Y(f)及び参照音信号X(f)の対応する周波数fについての信号比G1(f)と、観測音信号Y(f)及び参照音信号X(f)の対応する周波数fについて、類似性の程度を比で示す相関G2(f)とを求める計算部142として機能する。計算部142は、観測音信号Y(f)及び参照音信号X(f)の計算の対象となる各周波数fについて、下記の式(1)に基づいて信号比G1(f)を求める。なお観測音信号Y(f)及び参照音信号X(f)は複素スペクトルであるので、参照音信号X(f)の共役複素数X* (f)を乗じて実数化した上で信号比を求める。
G1(f)={Y(f)・X* (f)}/{X(f)・X* (f)} …式(1)
但し、G1(f):信号比
Y(f):観測音信号
X(f):参照音信号
* (f):参照音信号の共役複素数
また計算部142は、観測音信号Y(f)及び参照音信号X(f)の計算の対象となる各周波数fについて、下記の式(2)に基づいて相関G2(f)を算出する。相関は、計算の対象となる周波数fを中心とした所定周波数範囲内でおいて、観測音信号Y(f)の各周波数fでの値の総和及び参照音信号X(f)の各周波数fでの値の総和の比である。なお観測音信号Y(f)及び参照音信号X(f)は複素スペクトルであるので、参照音信号X(f)の共役複素数X* (f)を乗じて実数化した上で相関G2(f)を求める。
G2(f)=Σ{Y(f)・X* (f)}/Σ{X(f)・X* (f)} …式(2)
但し、G2(f):相関
さらにエコー抑圧機構14は、本発明のコンピュータプログラム100を実行することにより、算出した信号比G1(f)及び相関G2(f)を比較する比較部143、並びに比較した結果に基づいて信号比G1(f)及び相関G2(f)からエコーの推定に要するエコー推定係数G(f)を導出する導出部144として機能する。比較部143は、下記の式(3)に基づいて信号比G1(f)の信号強度|G1(f)|と相関G2(f)の信号強度|G2(f)|の所定の定数α倍との大小関係を比較する。
|G1(f)|<α|G2(f)| …式(3)
但し、|G1(f)|:信号比G1(f)の信号強度
|G2(f)|:相関G2(f)の信号強度
α:定数
導出部144は、信号比G1(f)の信号強度|G1(f)|が相関G2(f)の信号強度|G2(f)|の定数α倍未満である場合、観測音信号Y(f)及び参照音信号X(f)の相関が高いシングルトークの状態であると判定し、G(f)=G1(f)であるエコー推定係数G(f)を導出する。また信号比G1(f)の信号強度|G1(f)|が相関G2(f)の信号強度|G2(f)|の定数α倍以上である場合、観測音信号Y(f)及び参照音信号X(f)の相関が低いダブルトークの状態であると判定し、G(f)=G2(f)であるエコー推定係数G(f)を導出する。即ち定数αは、シングルトーク状態かダブルトーク状態かを判定する閾値として用いられる。
さらにエコー抑圧機構14は、本発明のコンピュータプログラム100を実行することにより、導出したエコー推定係数G(f)及び参照音信号X(f)に基づいて、観測音信号Y(f)を補正する補正量としてエコーのスペクトルX’(f)を推定するエコー推定部145として機能する。エコー推定部145は、下記の式(4)に基づきエコー推定係数G(f)及び参照音信号X(f)の積としてエコーX’(f)を求める。
X’(f)=G(f)・X(f) …式(4)
但し、X’(f):エコー
さらにエコー抑圧機構14は、本発明のコンピュータプログラム100を実行することにより、算出したエコーX’(f)に基づいて観測音信号Y(f)を抑圧し、抑圧した結果である抑圧結果信号R(f)を出力するエコー抑圧部146として機能する。エコー抑圧部146は、下記の式(5)に基づき観測音信号Y(f)からエコーX’(f)を減じる信号補正を行うことにより、エコーを抑圧した結果を示す周波数軸上の成分として抑圧結果信号R(f)を求める。
R(f)=Y(f)−X’(f) …式(5)
但し、R(f):抑圧結果
そしてエコー抑圧機構14は、本発明のコンピュータプログラム100を実行することにより、周波数軸上の成分である抑圧結果信号R(f)をIFFT(逆フーリエ変換)処理にて時間軸上の信号に変換するIFFT変換部147として機能する。時間軸上の信号に変換された抑圧結果信号r(t)は、D/A変換機構15にてアナログ信号に変換された上で、音処理装置3へ出力される。
次に本発明の実施の形態1に係るエコー抑圧装置1の処理について説明する。エコー抑圧装置1は、加算機構10により、音処理装置3から出力され音出力部20,20,…が受け付けるn個の参照音信号x1(t),…,xn(t)を取得し、取得したn個の参照音信号x1(t),…,xn(t)を加算した加算参照音信号x(t)を生成する。そしてエコー抑圧装置1は、加算参照音信号x(t)に対し、第1A/D変換機構11により、A/D変換及びアンチエイリアジングフィルタ処理を行い、デジタル信号に変換した加算参照音信号x(t)をエコー抑圧機構14に出力する。
またエコー抑圧装置1は、音入力部30により、受け付けた音に基づいて観測音信号y(t)を生成し、生成した観測音信号y(t)に対し、増幅機構12にて増幅を行い、第2A/D変換機構13により、A/D変換及びアンチエイリアジングフィルタ処理を行い、デジタル信号に変換した観測音信号y(t)をエコー抑圧機構14に出力する。
図3は、本発明の実施の形態1に係るエコー抑圧装置1の処理の一例を示すフローチャートである。エコー抑圧装置1のエコー抑圧機構14は、受け付けた加算参照音信号x(t)及び観測音信号y(t)をフレーム化し(S101)、第1FFT変換部140及び第2FFT変換部141の処理により、加算参照音信号x(t)及び観測音信号y(t)を夫々周波数軸上の成分である参照音信号X(f)及び観測音信号Y(f)に変換する(S102)。
エコー抑圧装置1のエコー抑圧機構14は、計算部142の処理により、参照音信号X(f)及び観測音信号Y(f)の各周波数fについて、信号比G1(f)を求め(S103)、更に参照音信号X(f)及び観測音信号Y(f)の各周波数fについて、相関G2(f)を求める(S104)。ステップS103における信号比G1(f)の計算には、前述した式(1)が用いられ、ステップS104における相関G2(f)の計算には、前述した式(2)が用いられる。なおステップS103及びS104の処理は並行して実行することも可能である。
エコー抑圧装置1のエコー抑圧機構14は、比較部143の処理により、信号比G1(f)及び相関G2(f)を比較し(S105)、導出部144の処理により、比較した結果に基づいて信号比G1(f)及び相関G2(f)からエコーの推定に要するエコー推定係数G(f)を導出する(S106)。ステップS106におけるエコー推定係数G(f)の導出には、前述の式(3)に基づいて、信号比G1(f)又は相関G2(f)が選択される。
エコー抑圧装置1のエコー抑圧機構14は、エコー推定部145の処理により、エコー推定係数G(f)及び参照音信号X(f)に基づいて、エコーX’(f)を推定する(S107)。ステップS107では、前述の式(4)を用い、観測音信号Y(f)を補正する補正量として、エコーの推定値であるエコーX’(f)を求める。
エコー抑圧装置1のエコー抑圧機構14は、エコー抑圧部146の処理により、エコーX’(f)に基づいて観測音信号Y(f)を抑圧して抑圧結果信号R(f)を生成する(S108)。ステップS108では、前述の式(5)を用いて観測音信号Y(f)からエコーX’(f)を減じる補正を行うことによりエコーを抑圧する。
そしてエコー抑圧装置1のエコー抑圧機構14は、IFFT変換部147の処理により、周波数軸上の成分である抑圧結果信号R(f)を時間軸上の信号である抑圧結果信号r(t)に変換し(S109)、変換した抑圧結果信号r(t)を、D/A変換手段18にてアナログ信号に変換し、音処理装置3へ出力する。
音処理装置3では、受け付けた抑圧結果信号r(t)に基づいて、音声認識処理等の処理を実行する。この様にして本発明の実施の形態1に係るエコー抑圧装置1のエコー抑圧処理が実行される。
次に本発明の実施の形態1に係るエコー抑圧装置1によるエコー抑圧処理の結果について説明する。図4は、本発明の実施の形態1に係るエコー抑圧処理の結果の一例を示すグラフである。図4(a)は、本発明の実施の形態1に係るエコー抑圧処理にて処理される参照音信号x(t)の振幅スペクトル|X(f)|及び観測音信号y(t)の振幅スペクトル|Y(f)|の一例を示すグラフであり、横軸に周波数fをとり、縦軸に信号強度dBをとってその関係を示している。なお実線が参照音信号x(t)の振幅スペクトル|X(f)|であり、点線が観測音信号y(t)の振幅スペクトル|Y(f)|である。図4(b)は、本発明の実施の形態1に係るエコー抑圧処理による処理結果を示す抑圧結果信号r(t)の振幅スペクトル|R(f)|の一例を示すグラフであり、横軸に周波数fをとり、縦軸に信号強度をとってその関係を示している。図4(a)及び(b)は、ダブルトークの状態での振幅スペクトルを示しており、図4(a)が処理前、図4(b)が処理後を示している。また図4(a)及び図4(b)において、丸印で示した箇所が話者の音声に基づくピークである。
図4(a)に示す様に話者の音声が含まれる周波数では、参照音信号x(t)の振幅スペクトル|X(f)|と、観測音信号y(t)の振幅スペクトル|Y(f)|との相関が小さくなっている。また図4(a)の処理結果である図4(b)では、全体的に強度のレベルが低くなっているが、話者の音声が含まれる周波数ではピークの強度があまり変化していない。これは話者の音声以外のエコーが抑圧されたことを示している。
前記実施の形態1では、相関G2(f)の算出に要する周波数範囲が一定の帯域幅である形態を示したが、本発明はこれに限らず、周波数に応じて帯域幅を変化させることも可能である。次に実施の形態1において、周波数に応じて帯域幅を変化させる形態について説明する。帯域幅を変化させる場合、相関G2(f)を算出する前述の式(2)は、下記の式(6)に変形される。
Figure 2009014937
なお式(6)において、標本化時のサンプル個数を示す次数N(f)を帯域幅として用いる。式(6)において、帯域幅を示す次数N(f)を一定にすると、式(2)となるが、ここでは帯域幅を示す次数が変化するものとする。図5は、本発明の実施の形態1に係るエコー抑圧方法において、帯域幅N(f)を変化させる場合の周波数fと帯域幅N(f)との関係を示すグラフである。図5は、横軸に周波数fをとり、縦軸に帯域幅を示す次数N(f)をとってその関係を示している。図5に示す様に帯域幅は、低周波数領域程広くなっている。これは話者が発生した音と、エコーとの差が検出し難い低周波数領域程、帯域幅を大きくすることでサンプル数を増やし、相関の感度を相対的に上げ、ダブルトークの検出精度を向上させるためである。
帯域幅を変化させる場合、図3に例示したフローチャートのステップS104は、計算部142により、各周波数fについて、周波数fに応じて決定される周波数範囲内における参照音信号X(f)の総和及び観測音信号X(f)の総和に基づく相関G2(f)を求める処理となる。
また前記実施の形態1では、信号比G1(f)及び相関G2(f)の一方を選択してエコー推定係数G(f)とする形態を示したが、本発明はこれに限らず、シングルトーク及びダブルトークの境界における不連続な変化を抑制するため、相関G2(f)に乗じる定数として、第1定数α1及び第1定数α1より大きい第2定数α2を設定し、信号比G1(f)及び相関G2(f)の加重平均をエコー推定係数G(f)とする区間を設けても良い。次に実施の形態1において、エコー推定係数G(f)の導出方法が異なる形態について説明する。
図6は、本発明の実施の形態1に係るエコー抑圧方法において、相関G2(f)及び信号比G1(f)の強度比|G2(f)|/|G1(f)|と、エコー推定係数G(f)に係る係数β(f)との関係を示すグラフである。図6は、横軸に相関G2(f)及び信号比G1(f)の強度比|G2(f)|/|G1(f)|をとり、縦軸にエコー推定係数G(f)に係る係数β(f)をとってその関係を示したグラフである。係数β(f)は、エコー推定係数G(f)の導出に要する係数であり、係数β(f)を用いた下記の式(7)に基づいてエコー推定係数G(f)が導出される。
G(f)=β(f)・G1(f)+{1−β(f)} …式(7)
但し、β(f):エコー推定係数G(f)に係る係数
図6に示す様に強度比|G2(f)|/|G1(f)|が第1定数α1未満の場合、係数β(f)=0となるので、相関G2(f)がエコー推定係数G(f)となり、強度比|G2(f)|/|G1(f)|が第2定数α2以上の場合、係数β(f)=1となるので、信号比G1(f)がエコー推定係数G(f)となる。そして強度比|G2(f)|/|G1(f)|が第1定数α1以上第2定数α2未満である場合、図6に示す関係から強度比|G2(f)|/|G1(f)|に応じて係数β(f)の値が決定され、決定された値に基づき式(7)に示した信号比G1(f)及び相関G2(f)の加重平均の結果により、エコー推定係数G(f)が導出される。
エコー推定係数G(f)の導出方法を変更する場合、図3に例示したフローチャートのステップS106は、導出部144により、信号比G1(f)が相関G2(f)の第1定数α1倍未満である場合に、信号比G1(f)がエコー推定係数G(f)となり、信号比G1(f)が相関G2(f)の第1定数α1より大きい第2定数α2倍以上である場合に、相関G2(f)がエコー推定係数G(f)となり、信号比G1(f)が相関G2(f)の第1定数α1倍以上で、かつ第2定数α2倍未満である場合に、信号比G1(f)及び相関G2(f)の加重平均値がエコー推定係数G(f)となる様にして、エコー推定係数G(f)を導出する処理となる。
さらに第1定数α1及び第2定数α2は、周波数fに応じて変化させることも可能である。図7は、本発明の実施の形態1に係るエコー抑圧方法において、周波数fに応じて第1定数α1及び第2定数α2を変化させる場合の周波数fと第1定数α1(f)及び第2定数α2(f)との関係を示すグラフである。図7では、横軸に周波数fをとり、縦軸に周波数fに依存する第1定数α1(f)及び第2定数α2(f)をとってその関係を示している。図7(a)は、低周波数から高周波数になる程、第1定数α1(f)及び第2定数α2(f)を小さくすることにより、ダブルトークに対する検出精度を高くし、話者の発声に対する歪みを抑制する形態である。図7(b)は、低周波数から高周波数になる程、第1定数α1(f)及び第2定数α2(f)を大きくすることにより、シングルトークに対する検出精度を高くし、残留エコーの発生を抑制する形態である。なお一の定数αを用いる場合にも、周波数fに依存するα(f)とすることが可能である。
実施の形態2.
実施の形態2は、実施の形態1において、補正に関する演算に実数である振幅スペクトルを用いる形態である。実施の形態2に係るエコー抑圧装置の構成例は、図1を用いて示した実施の形態1と同様であるので、実施の形態1を参照するものとし、その説明を省略する。また以降の説明において、実施の形態1と同様の構成については、実施の形態1と同様の符号を付し、その説明を省略する。
図8は、本発明の実施の形態2に係るエコー抑圧装置1が備えるエコー抑圧機構14の機能構成例を示す機能ブロック図である。エコー抑圧装置1が備えるエコー抑圧機構14は、デジタル信号に変換した加算参照音信号x(t)及び観測音信号y(t)から所定時間長のフレームを夫々生成する。そしてエコー抑圧機構14は、本発明のコンピュータプログラム100を実行することにより、第1FFT変換部140及び第2FFT変換部141として機能する。第1FFT変換部140にて生成された参照音信号X(f)及び第2FFT変換部141にて生成された観測音信号Y(f)は、複素スペクトルである。実施の形態2では、第1FFT変換部140及び第2FFT変換部141にて生成された複素スペクトルの実数部である振幅スペクトルを用いて処理を行う。なお以降の説明において、複素スペクトルである参照音信号X(f)の振幅スペクトルを参照音信号|X(f)|として示し、複素スペクトルである観測音信号Y(f)の振幅スペクトルを観測音信号|Y(f)|として示す。
さらにエコー抑圧機構14は、本発明のコンピュータプログラム100を実行することにより、計算部142として機能する。計算部142にて処理される観測音信号|Y(f)|及び参照音信号|X(f)|は、振幅スペクトルであるので、共役複素数X* (f)を乗じることによる実数化は不要である。従って実施の形態2において、計算部142は、式(1)に替えて、下記の式(8)により、実数である信号比|G1(f)|’を求める。
|G1(f)|’=|Y(f)|/|X(f)| …式(8)
但し、|G1(f)|’:信号比
|Y(f)|:観測音信号
|X(f)|:参照音信号
また実施の形態2において、計算部142は、式(2)に替えて、下記の式(9)により、実数である相関|G2(f)|’を求める。
|G2(f)|’=Σ{|Y(f)|・|X(f)|}/Σ|X(f)|2 …式(9)
但し、|G2(f)|’:相関
さらにエコー抑圧機構14は、本発明のコンピュータプログラム100を実行することにより、比較部143及び導出部144として機能する。比較部143は、式(3)に替えて、下記の式(10)により、信号比|G1(f)|’と、相関|G2(f)|’の所定の定数α倍との大小関係を比較する。
|G1(f)|’<α|G2(f)|’ …式(10)
導出部144は、信号比|G1(f)|が相関|G2(f)|の定数α倍未満である場合、観測音信号Y(f)及び参照音信号X(f)の相関が高いシングルトークの状態であると判定し、|G(f)|=|G1(f)|であるエコー推定係数|G(f)|を導出する。また信号比|G1(f)|が相関|G2(f)|の定数α倍以上である場合、観測音信号Y(f)及び参照音信号X(f)の相関が低いダブルトークの状態であると判定し、|G(f)|=|G2(f)|である実数のエコー推定係数|G(f)|を導出する。
さらにエコー抑圧機構14は、本発明のコンピュータプログラム100を実行することにより、エコー推定部145として機能する。実施の形態2において、エコー推定部145は、式(4)に替えて、下記の式(11)により、実数であるエコー|X’(f)|を求める。
|X’(f)|=|G(f)|・|X(f)| …式(11)
但し、|X’(f)|:エコー
さらにエコー抑圧機構14は、本発明のコンピュータプログラム100を実行することにより、エコー抑圧部146として機能する。実施の形態2において、エコー抑圧部146は、式(5)に替えて、下記の式(12)により、実数である抑圧結果信号|R(f)|を算出する。
|R(f)|=|Y(f)|−|X’(f)| …式(12)
但し、|R(f)|:抑圧結果信号
そしてエコー抑圧機構14は、本発明のコンピュータプログラム100を実行することにより、実数である抑圧結果信号R(f)と、第2FFT変換部141にて生成された観測音信号Y(f)の虚数部とを合成し、合成した信号をIFFT処理にて時間軸上の信号に変換するIFFT変換部147として機能する。時間軸上の信号に変換された抑圧結果信号r(t)は、D/A変換機構15にてアナログ信号に変換された上で、音処理装置3へ出力される。
音処理装置3では、受け付けた抑圧結果信号r(t)に基づいて、音声認識処理等の処理を実行する。この様にして実施の形態2に係る本発明のエコー抑圧装置1のエコー抑圧処理が実行される。
次に本発明の実施の形態2に係るエコー抑圧装置1の処理について説明する。エコー抑圧装置1は、実施の形態1と同様の処理により、n個の参照音信号x1(t),…,xn(t)及び観測音信号y(t)に基づく信号をエコー抑圧機構14に出力する。
図9は、本発明の実施の形態2に係るエコー抑圧装置1の処理の一例を示すフローチャートである。エコー抑圧装置1のエコー抑圧機構14は、受け付けた加算参照音信号x(t)及び観測音信号y(t)をフレーム化し(S201)、第1FFT変換部140及び第2FFT変換部141の処理により、加算参照音信号x(t)及び観測音信号y(t)を夫々周波数軸上の成分である参照音信号X(f)及び観測音信号Y(f)に変換し(S202)、参照音信号X(f)及び観測音信号Y(f)から振幅スペクトルである参照音信号|X(f)|及び観測音信号|Y(f)|を夫々取り出す(S203)。
エコー抑圧装置1のエコー抑圧機構14は、計算部142の処理により、参照音信号|X(f)|及び観測音信号|Y(f)|の各周波数fについて、信号比|G1(f)|’を求め(S204)、更に参照音信号|X(f)|及び観測音信号|Y(f)|の各周波数fについて、相関|G2(f)|’を求め(S205)。ステップS204における信号比|G1(f)|’の算出には、前述した式(8)が用いられ、ステップS205における相関|G2(f)|’の算出には、前述した式(9)が用いられる。
エコー抑圧装置1のエコー抑圧機構14は、比較部143の処理により、信号比|G1(f)|’及び相関|G2(f)|’を比較し(S206)、導出部144の処理により、比較した結果に基づいて信号比|G1(f)|’及び相関|G2(f)|’からエコーの推定に要するエコー推定係数|G(f)|を導出する(S207)。ステップS207におけるエコー推定係数|G(f)|の導出には、前述した式(8)に基づいて、信号比|G1(f)|’又は相関|G2(f)|’が選択される。
エコー抑圧装置1のエコー抑圧機構14は、エコー推定部145の処理により、エコー推定係数|G(f)|及び参照音信号|X(f)|に基づいて、エコー|X’(f)|を推定する(S208)。ステップS208では、前述の式(11)を用い、観測音信号|Y(f)|を補正する補正量として、エコーの推定値であるエコー|X’(f)|を求める。
エコー抑圧装置1のエコー抑圧機構14は、エコー抑圧部146の処理により、エコー|X’(f)|に基づいて観測音信号|Y(f)|を抑圧して抑圧結果信号|R(f)|を生成する(S209)。ステップS209では、前述の式(12)を用いて観測音信号|Y(f)|からエコー|X’(f)|を減じる補正を行うことによりエコーを抑圧する。
そしてエコー抑圧装置1のエコー抑圧機構14は、IFFT変換部147の処理により、実数である抑圧結果信号|R(f)|と、第2FFT変換部141にて生成された観測音信号Y(f)の虚数部とを合成し(S210)、合成した信号を時間軸上の信号である抑圧結果信号r(t)に変換し(S211)、変換した抑圧結果信号r(t)を、D/A変換手段18にてアナログ信号に変換し、音処理装置3へ出力する。
音処理装置3では、受け付けた抑圧結果信号r(t)に基づいて、音声認識処理等の処理を実行する。この様にして本発明の実施の形態2に係るエコー抑圧装置1のエコー抑圧処理が実行される。
前記実施の形態2では、エコー抑圧部146による補正として、観測音信号|Y(f)|からエコー|X’(f)|を減じることによりエコーを抑圧する処理を示したが、本発明はこれに限らず、観測音信号|Y(f)|を減衰させることによりエコーを抑圧することも可能である。次に実施の形態2において、観測音信号|Y(f)|を減衰させることによりエコーを抑圧する形態について説明する。
図10は、本発明の実施の形態2に係るエコー抑圧方法において、減衰に係る比|Y(f)|/|X’(f)|と、減衰に係る係数g(f)との関係を示すグラフである。図10は、横軸に減衰に係る比|Y(f)|/|X’(f)|をとり、縦軸に減衰に係る係数g(f)をとってその関係を示したグラフである。減衰に係る比|Y(f)|/|X’(f)|は、観測音信号|Y(f)|及びエコー|X’(f)|の比である。減衰に係る係数g(f)は、観測音信号|Y(f)|に乗じて抑圧結果信号|R(f)|を算出するための係数であり、0≦g(f)≦1の値をとり、値が大きい程、減衰量が小さくなる。減衰に係る比|Y(f)|/|X’(f)|には、第1閾値γ1及び第2閾値γ2が設定されており、減衰に係る比|Y(f)|/|X’(f)|が第1閾値γ1未満の場合、減衰に係る係数g(f)=0となり、第2閾値γ2以上の場合、減衰に係る係数g(f)=1となる。そして減衰に係る比|Y(f)|/|X’(f)|が第1閾値γ1以上第2閾値γ2未満である場合、図10に示す関係から減衰に係る比|Y(f)|/|X’(f)|に応じて減衰に係る係数g(f)の値が決定される。また減衰に係る係数g(f)、観測音信号|Y(f)|及び抑圧結果信号|R(f)|の関係は下記の式(13)にて示される。
|R(f)|=g(f)・|Y(f)| …式(13)
但し、g(f):減衰に係る係数
減衰に係る係数g(f)を用いる場合、図9に例示したフローチャートのステップS209は、エコー抑圧部146の処理により、観測音信号|Y(f)|及びエコー|X’(f)|に基づいて減衰に係る係数g(f)を導出し、導出した減衰に係る係数g(f)に基づいて観測音信号|Y(f)|を補正して抑圧結果信号|R(f)|を生成する処理となる。なお抑圧結果信号|R(f)|の生成には、式(13)が用いられ、観測音信号|Y(f)|を減衰に係る係数g(f)に基づいて減衰させることにより、エコーを抑圧する処理となる。
さらに第1閾値γ1及び第2閾値γ2は、周波数fに応じて変化させることも可能である。図11は、本発明の実施の形態2に係るエコー抑圧方法において、周波数fに応じて第1閾値γ1及び第2閾値γ2を変化させる場合の周波数fと第1閾値γ1(f)及び第2閾値γ2(f)との関係を示すグラフである。図11では、横軸に周波数fをとり、縦軸に周波数fに依存する第1閾値γ1(f)及び第2閾値γ2(f)をとってその関係を示している。図11(a)は、低周波数から高周波数になる程、第1閾値γ1(f)及び第2閾値γ2(f)を小さくすることにより、ダブルトークに対する検出精度を高くし、話者の発声に対する歪みを抑制する形態である。図11(b)は、低周波数から高周波数になる程、第1閾値γ1(f)及び第2閾値γ2(f)を大きくすることにより、シングルトークに対する検出精度を高くし、残留エコーの発生を抑制する形態である。
前記実施の形態1及び2は、本発明の無限にある実施の形態の一部を例示したに過ぎず、各種ハードウェア及びソフトフェア等の構成は、適宜設定することが可能であり、また例示した基本的な処理以外にも様々な処理を組み合わせることが可能である。例えば前記実施の形態1及び2では、出力部が複数である形態を示したが、本発明はこれに限らず、一の出力部を備える装置に適用することも可能である。また音処理装置としては、テレビ会議システム、ナビゲーションシステム等の音声、音響に係る様々なシステムに適用することが可能であり、更にはエコー抑圧装置、音出力装置及び音処理装置を一の装置として構成する様にしても良い。
以上の実施の形態に関し、更に以下の付記を開示する。
(付記1)
音信号を生成して音を音出力部から出力させる音出力装置、及び音入力部が入力した音に基づく観測音信号を処理する音処理装置と連携可能であり、前記観測音信号のエコーを抑圧するエコー抑圧装置において、
音出力部に出力させる音の基となる参照音信号、及び音入力部が入力した音に基づく観測音信号を周波数軸上の成分に変換する変換部と、
前記参照音信号及び前記観測音信号の周波数軸上の成分の比及び相関を示す値を求める計算部と、
前記比及び前記相関の値の大小を比較する比較部と、
比較した結果並びに前記比及び前記相関から前記エコーの推定に要する推定係数を導出する導出部と、
前記推定係数を用いて、前記エコーを推定する推定部と、
推定した前記エコーに基づいて前記観測音信号を抑圧する抑圧部と
を備えることを特徴とするエコー抑圧装置。
(付記2)
更に、前記参照音信号が複数の場合に、各参照音信号を加算する加算部を備え、
前記変換部は、観測音信号及び加算された参照音信号を周波数軸上の成分に変換する様に構成してある
ことを特徴とする付記1に記載のエコー抑圧装置。
(付記3)
前記計算部は、
計算の対象となる周波数を含む所定周波数範囲内における参照音信号の各周波数での値と観測音信号の各周波数での値との相関を求める様に構成してあり、
計算の対象となる周波数に応じて、前記所定周波数範囲を変更する様に構成してある
ことを特徴とする付記1又は付記2に記載のエコー抑圧装置。
(付記4)
前記導出部は、
前記比が前記相関の所定倍未満である場合に、前記比の値に基づいて推定係数を導出する様に構成してあり、
前記比が前記相関の所定倍以上である場合に、前記相関の値に基づいて補正係数を導出する様に構成してある
ことを特徴とする付記1乃至付記3のいずれかに記載のエコー抑圧装置。
(付記5)
前記導出部は、
更に、前記比と前記相関との大小関係に関する閾値を複数設定し、前記複数の閾値と前記比と前記相関とに基づき、シングルトーク状態かダブルトーク状態かを判定する様に構成してあることを特徴とする付記1乃至付記3のいずれかに記載のエコー抑圧装置。
(付記6)
前記導出部は、前記比と前記相関とに基づき、シングルトーク状態かダブルトーク状態かを判定する際に用いる閾値を、周波数に応じて変更する様に構成してあることを特徴とする付記5に記載のエコー抑圧装置。
(付記7)
前記計算部は、観測音信号を変換した複素スペクトルに参照音信号を変換した複素スペクトルの共役複素数を乗じた値及び参照音信号を変換した複素スペクトルに参照音信号を変換した複素スペクトルの共役複素数を乗じた値に基づいて、前記比及び前記相関を示す値を求める様に構成してあることを特徴とする付記1乃至付記6のいずれかに記載のエコー抑圧装置。
(付記8)
前記計算部は、周波数軸上の成分に変換した観測音信号の振幅スペクトル及び参照音信号の振幅スペクトルに基づいて、比及び相関を示す値を求める様に構成してあることを特徴とする付記1乃至付記7のいずれかに記載のエコー抑圧装置。
(付記9)
前記推定部は、エコーの振幅スペクトルを推定する様に構成してあり、
前記抑圧部は、エコーの振幅スペクトルに対する観測音信号の振幅スペクトルの比が所定の閾値以上である場合に、観測音信号の振幅スペクトルを抑圧する様に構成してある
ことを特徴とする付記8に記載のエコー抑圧装置。
(付記10)
前記抑圧部は、抑圧の対象となる周波数に応じて閾値を変更する様に構成してあることを特徴とする付記9に記載のエコー抑圧装置。
(付記11)
音信号を生成して音を音出力部から出力させる音出力装置、及び音入力部が入力した音に基づく観測音信号を処理する音処理装置と連携可能なエコー抑圧装置に、前記観測音信号のエコーを抑圧させるエコー抑圧方法であって、
前記音出力部に出力させる音の基となる参照音信号、及び前記音入力部が入力した音に基づく観測音信号を周波数軸上の成分に変換する手順と、
前記参照音信号及び前記観測音信号の変換後の周波数軸上の成分の比及び相関を示す値を求める手順と、
前記比及び前記相関の値の大小を比較する手順と、
比較した結果並びに前記比及び前記相関からエコーの推定に要する推定係数を導出する手順と、
前記推定係数を用いて、前記エコーを推定する手順と、
前記エコーに基づいて前記観測音信号を抑圧する手順と
を含むことを特徴とするエコー抑圧方法。
(付記12)
コンピュータにロードして、該コンピュータ上で実行される手順を定義したプログラムであって、音信号を生成して音を音出力部から出力させる音出力装置、及び音入力部が入力した音に基づく音信号を処理する音処理装置と連携させ、前記観測音信号のエコーを抑圧させるコンピュータプログラムにおいて、
コンピュータに、
前記参照音信号及び前記観測音信号を変換した周波数軸上の成分の比及び相関を示す値を求める手順と、
前記比及び前記相関の値の大小を比較する手順と、
比較した結果並びに前記比及び前記相関からエコーの推定に要する推定係数を導出する手順と、
前記推定係数を用いて、エコーを推定する手順と、
推定したエコーに基づいて前記観測音信号を抑圧する手順と
を実行させることを特徴とするコンピュータプログラム。
本発明の実施の形態1に係るエコー抑圧装置の構成例を示す模式図である。 本発明の実施の形態1に係るエコー抑圧装置が備えるエコー抑圧機構の機能構成例を示す機能ブロック図である。 本発明の実施の形態1に係るエコー抑圧装置の処理の一例を示すフローチャートである。 本発明の実施の形態1に係るエコー抑圧処理の結果の一例を示すグラフである。 本発明の実施の形態1に係るエコー抑圧方法において、帯域幅を変化させる場合の周波数と帯域幅との関係を示すグラフである。 本発明の実施の形態1に係るエコー抑圧方法において、相関及び信号比の強度比と、エコー推定係数に係る係数との関係を示すグラフである。 本発明の実施の形態1に係るエコー抑圧方法において、周波数に応じて第1定数及び第2定数を変化させる場合の周波数と第1定数及び第2定数との関係を示すグラフである。 本発明の実施の形態2に係るエコー抑圧装置が備えるエコー抑圧機構の機能構成例を示す機能ブロック図である。 本発明の実施の形態2に係るエコー抑圧装置の処理の一例を示すフローチャートである。 本発明の実施の形態2に係るエコー抑圧方法において、減衰に係る比と、減衰に係る係数との関係を示すグラフである。 本発明の実施の形態2に係るエコー抑圧方法において、周波数に応じて第1閾値及び第2閾値を変化させる場合の周波数と第1閾値及び第2閾値の関係を示すグラフである。 従来の第1のエコー抑圧装置の構成を示す模式図である。 従来の第2のエコー抑圧装置の構成を示す模式図である。 従来のエコー抑圧装置が備える抑圧機構の機能構成を示す機能ブロック図である。
符号の説明
1 エコー抑圧装置
10 加算機構
14 エコー抑圧機構
140 第1FFT変換部
141 第2FFT変換部
142 計算部
143 比較部
144 導出部
145 エコー推定部
146 エコー抑圧部
147 IFFT変換手段
2 音出力装置
20 音出力部
3 音処理装置
30 音入力部
100 コンピュータプログラム

Claims (10)

  1. 音信号を生成して音を音出力部から出力させる音出力装置、及び音入力部が入力した音に基づく観測音信号を処理する音処理装置と連携可能であり、前記観測音信号のエコーを抑圧するエコー抑圧装置において、
    音出力部に出力させる音の基となる参照音信号、及び音入力部が入力した音に基づく観測音信号を周波数軸上の成分に変換する変換部と、
    前記参照音信号及び前記観測音信号の周波数軸上の成分の比及び相関を示す値を求める計算部と、
    前記比及び前記相関の値の大小を比較する比較部と、
    比較した結果並びに前記比及び前記相関から前記エコーの推定に要する推定係数を導出する導出部と、
    前記推定係数を用いて、前記エコーを推定する推定部と、
    推定した前記エコーに基づいて前記観測音信号を抑圧する抑圧部と
    を備えることを特徴とするエコー抑圧装置。
  2. 更に、前記参照音信号が複数の場合に、各参照音信号を加算する加算部を備え、
    前記変換部は、観測音信号及び加算された参照音信号を周波数軸上の成分に変換する様に構成してある
    ことを特徴とする請求項1に記載のエコー抑圧装置。
  3. 前記計算部は、
    計算の対象となる周波数を含む所定周波数範囲内における参照音信号の各周波数での値と観測音信号の各周波数での値との相関を求める様に構成してあり、
    計算の対象となる周波数に応じて、前記所定周波数範囲を変更する様に構成してある
    ことを特徴とする請求項1又は請求項2に記載のエコー抑圧装置。
  4. 前記導出部は、
    更に、前記比と前記相関との大小関係に関する閾値を複数設定し、前記複数の閾値と前記比と前記相関とに基づき、シングルトーク状態かダブルトーク状態かを判定する様に構成してあることを特徴とする請求項1乃至請求項3のいずれかに記載のエコー抑圧装置。
  5. 前記導出部は、前記比と前記相関とに基づき、シングルトーク状態かダブルトーク状態かを判定する際に用いる閾値を、周波数に応じて変更する様に構成してあることを特徴とする請求項4に記載のエコー抑圧装置。
  6. 前記計算部は、周波数軸上の成分に変換した観測音信号の振幅スペクトル及び参照音信号の振幅スペクトルに基づいて、比及び相関を示す値を求める様に構成してあることを特徴とする請求項1乃至請求項5のいずれかに記載のエコー抑圧装置。
  7. 前記推定部は、エコーの振幅スペクトルを推定する様に構成してあり、
    前記抑圧部は、エコーの振幅スペクトルに対する観測音信号の振幅スペクトルの比が所定の閾値以上である場合に、観測音信号の振幅スペクトルを抑圧する様に構成してある
    ことを特徴とする請求項6に記載のエコー抑圧装置。
  8. 前記抑圧部は、抑圧の対象となる周波数に応じて閾値を変更する様に構成してあることを特徴とする請求項7に記載のエコー抑圧装置。
  9. 音信号を生成して音を音出力部から出力させる音出力装置、及び音入力部が入力した音に基づく観測音信号を処理する音処理装置と連携可能なエコー抑圧装置に、前記観測音信号のエコーを抑圧させるエコー抑圧方法であって、
    前記音出力部に出力させる音の基となる参照音信号、及び前記音入力部が入力した音に基づく観測音信号を周波数軸上の成分に変換する手順と、
    前記参照音信号及び前記観測音信号の変換後の周波数軸上の成分の比及び相関を示す値を求める手順と、
    前記比及び前記相関の値の大小を比較する手順と、
    比較した結果並びに前記比及び前記相関からエコーの推定に要する推定係数を導出する手順と、
    前記推定係数を用いて、前記エコーを推定する手順と、
    前記エコーに基づいて前記観測音信号を抑圧する手順と
    を含むことを特徴とするエコー抑圧方法。
  10. コンピュータにロードして、該コンピュータ上で実行される手順を定義したプログラムであって、音信号を生成して音を音出力部から出力させる音出力装置、及び音入力部が入力した音に基づく音信号を処理する音処理装置と連携させ、前記観測音信号のエコーを抑圧させるコンピュータプログラムにおいて、
    コンピュータに、
    前記参照音信号及び前記観測音信号を変換した周波数軸上の成分の比及び相関を示す値を求める手順と、
    前記比及び前記相関の値の大小を比較する手順と、
    比較した結果並びに前記比及び前記相関からエコーの推定に要する推定係数を導出する手順と、
    前記推定係数を用いて、エコーを推定する手順と、
    推定したエコーに基づいて前記観測音信号を抑圧する手順と
    を実行させることを特徴とするコンピュータプログラム。
JP2007175581A 2007-07-03 2007-07-03 エコー抑圧装置、エコー抑圧方法及びコンピュータプログラム Active JP4916394B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2007175581A JP4916394B2 (ja) 2007-07-03 2007-07-03 エコー抑圧装置、エコー抑圧方法及びコンピュータプログラム
DE102008027848A DE102008027848B4 (de) 2007-07-03 2008-06-11 Echounterdrücker, Echounterdrückungsverfahren und computerlesbares Speichermedium
US12/142,826 US8644496B2 (en) 2007-07-03 2008-06-20 Echo suppressor, echo suppressing method, and computer readable storage medium
CN2008101357059A CN101339769B (zh) 2007-07-03 2008-07-03 回音抑制器、回音抑制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007175581A JP4916394B2 (ja) 2007-07-03 2007-07-03 エコー抑圧装置、エコー抑圧方法及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2009014937A true JP2009014937A (ja) 2009-01-22
JP4916394B2 JP4916394B2 (ja) 2012-04-11

Family

ID=40092711

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007175581A Active JP4916394B2 (ja) 2007-07-03 2007-07-03 エコー抑圧装置、エコー抑圧方法及びコンピュータプログラム

Country Status (4)

Country Link
US (1) US8644496B2 (ja)
JP (1) JP4916394B2 (ja)
CN (1) CN101339769B (ja)
DE (1) DE102008027848B4 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011203700A (ja) * 2010-03-26 2011-10-13 Toshiba Corp 音声判別装置

Families Citing this family (84)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100660607B1 (ko) * 2005-04-27 2006-12-21 김봉석 에코기능을 구비한 리모컨
US8361632B2 (en) * 2008-10-03 2013-01-29 3M Innovative Properties Company Cloud point-resistant adhesives and laminates
US9124769B2 (en) 2008-10-31 2015-09-01 The Nielsen Company (Us), Llc Methods and apparatus to verify presentation of media content
US8219394B2 (en) * 2010-01-20 2012-07-10 Microsoft Corporation Adaptive ambient sound suppression and speech tracking
KR20120072243A (ko) * 2010-12-23 2012-07-03 한국전자통신연구원 음향/음성 인식을 위한 잡음 제거 장치 및 그 방법
JP5649488B2 (ja) * 2011-03-11 2015-01-07 株式会社東芝 音声判別装置、音声判別方法および音声判別プログラム
CN102740214B (zh) * 2011-04-01 2014-09-10 中国科学院声学研究所 一种基于反馈信号频谱估计的啸叫抑制方法
JP2013042334A (ja) * 2011-08-15 2013-02-28 Sony Corp 情報処理装置、情報処理方法、およびプログラム
CN103325379A (zh) 2012-03-23 2013-09-25 杜比实验室特许公司 用于声学回声控制的方法与装置
EP2912833B1 (en) 2012-10-23 2017-06-21 Interactive Intelligence, INC. System and method for acoustic echo cancellation
CN105261363A (zh) * 2015-09-18 2016-01-20 深圳前海达闼科技有限公司 一种语音识别的方法、装置及终端
DE102015222105A1 (de) 2015-11-10 2017-05-11 Volkswagen Aktiengesellschaft Audiosignalverarbeitung in einem Fahrzeug
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US10095470B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Audio response playback
US10509626B2 (en) 2016-02-22 2019-12-17 Sonos, Inc Handling of loss of pairing between networked devices
US9947316B2 (en) 2016-02-22 2018-04-17 Sonos, Inc. Voice control of a media playback system
US9965247B2 (en) 2016-02-22 2018-05-08 Sonos, Inc. Voice controlled media playback system based on user profile
US9772817B2 (en) 2016-02-22 2017-09-26 Sonos, Inc. Room-corrected voice detection
US9978390B2 (en) 2016-06-09 2018-05-22 Sonos, Inc. Dynamic player selection for audio signal processing
US10134399B2 (en) 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
US10152969B2 (en) 2016-07-15 2018-12-11 Sonos, Inc. Voice detection by multiple devices
US10115400B2 (en) 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
US9942678B1 (en) 2016-09-27 2018-04-10 Sonos, Inc. Audio playback settings for voice interaction
US9743204B1 (en) 2016-09-30 2017-08-22 Sonos, Inc. Multi-orientation playback device microphones
US10181323B2 (en) 2016-10-19 2019-01-15 Sonos, Inc. Arbitration-based voice recognition
US11183181B2 (en) 2017-03-27 2021-11-23 Sonos, Inc. Systems and methods of multiple voice services
JP6833616B2 (ja) * 2017-05-29 2021-02-24 株式会社トランストロン エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム
US10475449B2 (en) 2017-08-07 2019-11-12 Sonos, Inc. Wake-word detection suppression
CN107452398B (zh) * 2017-08-09 2021-03-16 深圳创维数字技术有限公司 回声获取方法、电子设备及计算机可读存储介质
US10048930B1 (en) 2017-09-08 2018-08-14 Sonos, Inc. Dynamic computation of system response volume
US10446165B2 (en) 2017-09-27 2019-10-15 Sonos, Inc. Robust short-time fourier transform acoustic echo cancellation during audio playback
US10482868B2 (en) * 2017-09-28 2019-11-19 Sonos, Inc. Multi-channel acoustic echo cancellation
US10051366B1 (en) 2017-09-28 2018-08-14 Sonos, Inc. Three-dimensional beam forming with a microphone array
US10621981B2 (en) 2017-09-28 2020-04-14 Sonos, Inc. Tone interference cancellation
US10466962B2 (en) 2017-09-29 2019-11-05 Sonos, Inc. Media playback system with voice assistance
US10192567B1 (en) * 2017-10-18 2019-01-29 Motorola Mobility Llc Echo cancellation and suppression in electronic device
US10880650B2 (en) 2017-12-10 2020-12-29 Sonos, Inc. Network microphone devices with automatic do not disturb actuation capabilities
US10818290B2 (en) 2017-12-11 2020-10-27 Sonos, Inc. Home graph
US11343614B2 (en) 2018-01-31 2022-05-24 Sonos, Inc. Device designation of playback and network microphone device arrangements
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
US10847178B2 (en) 2018-05-18 2020-11-24 Sonos, Inc. Linear filtering for noise-suppressed speech detection
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US10681460B2 (en) 2018-06-28 2020-06-09 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
US10461710B1 (en) 2018-08-28 2019-10-29 Sonos, Inc. Media playback system with maximum volume setting
US11076035B2 (en) 2018-08-28 2021-07-27 Sonos, Inc. Do not disturb feature for audio notifications
US10878811B2 (en) 2018-09-14 2020-12-29 Sonos, Inc. Networked devices, systems, and methods for intelligently deactivating wake-word engines
US10587430B1 (en) 2018-09-14 2020-03-10 Sonos, Inc. Networked devices, systems, and methods for associating playback devices based on sound codes
US11024331B2 (en) 2018-09-21 2021-06-01 Sonos, Inc. Voice detection optimization using sound metadata
US10811015B2 (en) 2018-09-25 2020-10-20 Sonos, Inc. Voice detection optimization based on selected voice assistant service
CN110956973A (zh) * 2018-09-27 2020-04-03 深圳市冠旭电子股份有限公司 一种回声消除方法、装置及智能终端
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US10692518B2 (en) 2018-09-29 2020-06-23 Sonos, Inc. Linear filtering for noise-suppressed speech detection via multiple network microphone devices
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
EP3654249A1 (en) 2018-11-15 2020-05-20 Snips Dilated convolutions and gating for efficient keyword spotting
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11132989B2 (en) 2018-12-13 2021-09-28 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US10602268B1 (en) 2018-12-20 2020-03-24 Sonos, Inc. Optimization of network microphone devices using noise classification
CN111294473B (zh) * 2019-01-28 2022-01-04 展讯通信(上海)有限公司 信号处理方法及装置
US10867604B2 (en) 2019-02-08 2020-12-15 Sonos, Inc. Devices, systems, and methods for distributed voice processing
US11315556B2 (en) 2019-02-08 2022-04-26 Sonos, Inc. Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification
CN109640223B (zh) * 2019-02-22 2020-08-11 昆腾微电子股份有限公司 一种啸叫抑制方法、装置、音响及扩音系统
CN111835383B (zh) * 2019-04-17 2022-04-01 达发科技(苏州)有限公司 回音与近端串扰消除系统
US11120794B2 (en) 2019-05-03 2021-09-14 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
US11361756B2 (en) 2019-06-12 2022-06-14 Sonos, Inc. Conditional wake word eventing based on environment
US10586540B1 (en) 2019-06-12 2020-03-10 Sonos, Inc. Network microphone device with command keyword conditioning
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
JP7183119B2 (ja) * 2019-06-13 2022-12-05 株式会社デンソーテン 音声信号処理装置
US10871943B1 (en) 2019-07-31 2020-12-22 Sonos, Inc. Noise classification for event detection
US11138975B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US11138969B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
US11200900B2 (en) 2019-12-20 2021-12-14 Sonos, Inc. Offline voice control
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
US11556307B2 (en) 2020-01-31 2023-01-17 Sonos, Inc. Local voice data processing
US11308958B2 (en) 2020-02-07 2022-04-19 Sonos, Inc. Localized wakeword verification
US11308962B2 (en) 2020-05-20 2022-04-19 Sonos, Inc. Input detection windowing
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
US11727919B2 (en) 2020-05-20 2023-08-15 Sonos, Inc. Memory allocation for keyword spotting engines
US11698771B2 (en) 2020-08-25 2023-07-11 Sonos, Inc. Vocal guidance engines for playback devices
CN112053700B (zh) * 2020-08-31 2023-02-07 浙江大华技术股份有限公司 场景识别方法、装置、电子设备以及计算机可读存储介质
US11984123B2 (en) 2020-11-12 2024-05-14 Sonos, Inc. Network device interaction by range
US11551700B2 (en) 2021-01-25 2023-01-10 Sonos, Inc. Systems and methods for power-efficient keyword detection
CN114760389B (zh) * 2022-06-16 2022-09-02 腾讯科技(深圳)有限公司 语音通话方法、装置、计算机存储介质及电子设备
CN117135536A (zh) * 2023-03-29 2023-11-28 荣耀终端有限公司 回声消除方法和电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003309493A (ja) * 2002-04-17 2003-10-31 Nippon Telegr & Teleph Corp <Ntt> 反響低減方法、反響低減装置、反響低減プログラム
JP2006121588A (ja) * 2004-10-25 2006-05-11 Nippon Telegr & Teleph Corp <Ntt> エコー抑圧方法、この方法を実施する装置、プログラムおよびその記録媒体
WO2006087813A1 (ja) * 2005-02-21 2006-08-24 Fujitsu Limited エコーキャンセラ
WO2007049643A1 (ja) * 2005-10-26 2007-05-03 Nec Corporation エコー抑圧方法及び装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5442712A (en) * 1992-11-25 1995-08-15 Matsushita Electric Industrial Co., Ltd. Sound amplifying apparatus with automatic howl-suppressing function
DE19714966C2 (de) * 1997-04-10 1999-04-01 Siemens Ag Vorrichtung zur Rückhördämpfung
DE19806015C2 (de) * 1998-02-13 1999-12-23 Siemens Ag Verfahren zur Verbesserung der akustischen Rückhördämpfung in Freisprecheinrichtungen
JP3420705B2 (ja) 1998-03-16 2003-06-30 日本電信電話株式会社 エコー抑圧方法及び装置並びにエコー抑圧プログラムが記憶されたコンピュータに読取り可能な記憶媒体
US6510224B1 (en) * 1999-05-20 2003-01-21 Telefonaktiebolaget L M Ericsson Enhancement of near-end voice signals in an echo suppression system
JP3607625B2 (ja) 2001-02-08 2005-01-05 日本電信電話株式会社 多チャネル反響抑圧方法、その装置、そのプログラム及びその記録媒体
US6965640B2 (en) * 2001-08-08 2005-11-15 Octasic Inc. Method and apparatus for generating a set of filter coefficients providing adaptive noise reduction
JP3568922B2 (ja) * 2001-09-20 2004-09-22 三菱電機株式会社 エコー処理装置
JP3922997B2 (ja) * 2002-10-30 2007-05-30 沖電気工業株式会社 エコーキャンセラ
US7272224B1 (en) * 2003-03-03 2007-09-18 Apple Inc. Echo cancellation
US7251322B2 (en) * 2003-10-24 2007-07-31 Microsoft Corporation Systems and methods for echo cancellation with arbitrary playback sampling rates
US6864812B1 (en) * 2004-02-05 2005-03-08 Broadcom Corporation Hardware efficient implementation of finite impulse response filters with limited range input signals
JP4591685B2 (ja) * 2004-03-31 2010-12-01 ヤマハ株式会社 ダブルトーク状態判定方法、エコーキャンセル方法、ダブルトーク状態判定装置、エコーキャンセル装置およびプログラム
US20080219432A1 (en) * 2005-06-01 2008-09-11 Tecteon Pic Echo Delay Detector
US8073147B2 (en) * 2005-11-15 2011-12-06 Nec Corporation Dereverberation method, apparatus, and program for dereverberation
EP1827002A1 (en) * 2006-02-22 2007-08-29 Alcatel Lucent Method of controlling an adaptation of a filter
US8275120B2 (en) * 2006-05-30 2012-09-25 Microsoft Corp. Adaptive acoustic echo cancellation

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003309493A (ja) * 2002-04-17 2003-10-31 Nippon Telegr & Teleph Corp <Ntt> 反響低減方法、反響低減装置、反響低減プログラム
JP2006121588A (ja) * 2004-10-25 2006-05-11 Nippon Telegr & Teleph Corp <Ntt> エコー抑圧方法、この方法を実施する装置、プログラムおよびその記録媒体
WO2006087813A1 (ja) * 2005-02-21 2006-08-24 Fujitsu Limited エコーキャンセラ
WO2007049643A1 (ja) * 2005-10-26 2007-05-03 Nec Corporation エコー抑圧方法及び装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011203700A (ja) * 2010-03-26 2011-10-13 Toshiba Corp 音声判別装置

Also Published As

Publication number Publication date
CN101339769A (zh) 2009-01-07
DE102008027848A1 (de) 2009-01-08
US20090010445A1 (en) 2009-01-08
JP4916394B2 (ja) 2012-04-11
US8644496B2 (en) 2014-02-04
CN101339769B (zh) 2012-07-18
DE102008027848B4 (de) 2012-09-27

Similar Documents

Publication Publication Date Title
JP4916394B2 (ja) エコー抑圧装置、エコー抑圧方法及びコンピュータプログラム
JP4854630B2 (ja) 音処理装置、利得制御装置、利得制御方法及びコンピュータプログラム
JP4957810B2 (ja) 音処理装置、音処理方法及び音処理プログラム
JP5071480B2 (ja) エコー抑制装置、エコー抑制システム、エコー抑制方法及びコンピュータプログラム
JP5573517B2 (ja) 雑音除去装置および雑音除去方法
JP6668995B2 (ja) 雑音抑圧装置、雑音抑圧方法及び雑音抑圧用コンピュータプログラム
JP6135106B2 (ja) 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム
JPWO2013065088A1 (ja) 雑音抑圧装置
JP2023133472A (ja) ギャップ信頼度を用いた背景雑音推定
KR101182017B1 (ko) 휴대 단말기에서 복수의 마이크들로 입력된 신호들의잡음을 제거하는 방법 및 장치
JP2012195801A (ja) 会話支援装置
JP4413205B2 (ja) エコー抑圧方法、装置、エコー抑圧プログラム、記録媒体
JP4568193B2 (ja) 収音装置とその方法とそのプログラムとその記録媒体
JP5982900B2 (ja) 雑音抑制装置、マイクロホンアレイ装置、雑音抑制方法、及びプログラム
JP5466581B2 (ja) 反響消去方法、反響消去装置及び反響消去プログラム
JP2003250193A (ja) 反響消去方法、この方法を実施する装置、プログラムおよびその記録媒体
JP6638248B2 (ja) 音声判定装置、方法及びプログラム、並びに、音声信号処理装置
JP5228903B2 (ja) 信号処理装置および方法
JP2009124454A (ja) エコー消去方法、装置、プログラム、および記録媒体
JP4478045B2 (ja) エコー消去装置、エコー消去方法、エコー消去プログラムおよびその記録媒体
JP6544182B2 (ja) 音声処理装置、プログラム及び方法
JP2023130254A (ja) 音声処理装置および音声処理方法
CN115240700A (zh) 一种声学设备及其声音处理方法
Freudenberger et al. An FLMS based two-microphone speech enhancement system for in-car applications
JP2017067990A (ja) 音声処理装置、プログラム及び方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100416

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111104

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120124

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120124

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150203

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4916394

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150