JP5071480B2 - エコー抑制装置、エコー抑制システム、エコー抑制方法及びコンピュータプログラム - Google Patents

エコー抑制装置、エコー抑制システム、エコー抑制方法及びコンピュータプログラム Download PDF

Info

Publication number
JP5071480B2
JP5071480B2 JP2009529874A JP2009529874A JP5071480B2 JP 5071480 B2 JP5071480 B2 JP 5071480B2 JP 2009529874 A JP2009529874 A JP 2009529874A JP 2009529874 A JP2009529874 A JP 2009529874A JP 5071480 B2 JP5071480 B2 JP 5071480B2
Authority
JP
Japan
Prior art keywords
sound
sound signal
echo
correction amount
observation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009529874A
Other languages
English (en)
Other versions
JPWO2009028023A1 (ja
Inventor
太介 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2009028023A1 publication Critical patent/JPWO2009028023A1/ja
Application granted granted Critical
Publication of JP5071480B2 publication Critical patent/JP5071480B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)

Description

本発明は、音信号に基づく音を音出力部から出力させる音出力装置、及び音入力部が受音した音に基づく音信号を処理する音処理装置と連携し、音入力部が受音した音に基づく観測音信号のエコーを抑制するエコー抑制装置、該エコー抑制装置を備えるエコー抑制システム、前記エコー抑制装置を用いて行うエコー抑制方法、前記エコー抑制装置を実現するためのコンピュータプログラムに関する。
テレビ会議システム、ハンズフリー通話装置、音声出力及び音声認識機能を有するカーナビゲーションシステム等のスピーカ及びマイクロホンを備える装置では、スピーカから出力された音に基づくエコーを、マイクロホンが受音した音から除去するエコーキャンセラの機能が求められている。
図1は、従来のエコーキャンセラの構成を示す模式図である。図1中100は、エコーキャンセラであり、エコーキャンセラ100は、参照音信号x(t)に基づいて音を出力するスピーカ101及び受音した音に基づいて観測音信号y(t)を生成するマイクロホン102を備えている。またエコーキャンセラ100は、観測音信号y(t)からのエコーの除去に用いる適応フィルタ103を備えている。
マイクロホン102は、話者の発する音声等の受音すべき音だけでなく、スピーカ101から出力された音、その他の雑音等の様々な音を受音する。即ちスピーカ101から参照音信号x(t)に基づいて出力された音は、外部環境の音場を通ってマイクロホン102に受音される。このスピーカ101及びマイクロホン102間のインパルス応答をh(t)とすると、その推定値a(t)を適応フィルタ103にて求め、参照音信号x(t)をa(t)を適応フィルタに通したx’(t)を導出する。推定値a(t)を推定する方法としては、最急降下法、LMS(Least Mean Square)法、学習同定法等の方法が用いられる。そして観測音信号y(t)からx’(t)を減算することによりスピーカ101の出力に基づくエコーを除去して差分信号e(t)を導出する。なおy(t)に含まれている信号がスピーカ101の出力に基づく残留エコーのみである場合に、差分信号e(t)の電力が最小となる様に適応フィルタ103を動作させて推定する(例えば非特許文献1参照。)。
古井貞煕著、音響・音声工学、初版、株式会社近代科学社、1992年9月、p84−85
しかしながら非特許文献1に開示されている様な従来の方法では、例えば音楽が流れている環境下での性能に問題がある。具体的には、スピーカから音楽を出力している状態で、エコーキャンセラ処理を行った場合、適応フィルタの性能限界のため、音楽が残留エコーとして残り易いという問題がある。音楽が残留エコーとして残った状態で音声認識を行うと、残留エコーの区間が音声区間と判定される場合があり、誤認識に繋がるという問題がある。また話者が発した音声の前後に残留エコーが含まれていると、他の単語と誤認識されるという問題がある。
これらの誤認識に係る問題を解決するためには、話者が発声していないシングルトークと呼ばれる状態では、残留エコーのパワーを可及的に小さくし、話者が発声しているダブルトークと呼ばれる状態では、発声した音声を残しつつエコーのみを抑制することが必要となる。
本発明は斯かる事情に鑑みてなされたものであり、参照音信号に対する観測音信号のパワー比を算出し、算出したパワー比に応じて観測音信号を補正することにより、エコーを抑制することが可能なエコー抑制装置、該エコー抑制装置を備えるエコー抑制システム、前記エコー抑制装置を用いて行うエコー抑制方法、前記エコー抑制装置を実現するためのコンピュータプログラムの提供を目的とする。
本願は、音信号に基づく音を音出力部から出力させる音出力装置、及び音入力部が受音した音に基づく音信号を処理する音処理装置と連携して動作可能であり、音入力部が受音した音に基づく観測音信号のエコーを抑制するエコー抑制装置において、前記音出力装置から音出力部へ出力する参照音信号及び前記観測音信号に基づいて推定した該観測音信号のエコー成分を除去するエコー除去部と、前記参照音信号に対する前記観測音信号のパワー比を算出する比算出部と、算出したパワー比に応じて、前記エコー成分を除去した観測音信号に対する補正量を算出する補正量算出部と、前記エコー成分を除去した観測音信号に残留する残留エコーを抑制すべく、算出した補正量に基づいて、前記エコー成分を除去した観測音信号を補正する補正部と、補正した観測音信号を前記音処理装置へ出力する出力部とを備え、前記補正量算出部は、前記エコー成分を除去した観測音信号に基づくスペクトルを導出するスペクトル導出部と、導出したスペクトルに基づくスペクトル包絡を導出する包絡導出部と、前記パワー比が所定値以下である場合に、前記パワー比に応じて前記スペクトル包絡を補正する補正係数を求める係数部とを備え、前記補正係数にて前記スペクトル包絡を補正した結果に基づいて、前記エコー成分を除去した観測音信号のスペクトル形状を補正する補正量を算出する様に構成してあるエコー抑制装置を開示する。
本願は、前記補正量算出部は、パワー比が所定値以下である場合に、パワー比に応じて前記観測音信号の残留エコーを抑制すべく補正量を算出する様に構成してあるエコー抑制装置を開示する。
本願は、前記補正量算出部は、パワー比の時間変化を平滑化した結果に基づいて補正量を算出する様に構成してあるエコー抑制装置を開示する。
本願は、前記補正量算出部は、前記観測音信号及び前記参照音信号の周波数帯域毎に補正量を算出する様に構成してあり、周波数帯域毎に算出した補正量に、周波数帯域毎に予め設定されている帯域補正係数を乗じて補正量を算出する様に構成してあるエコー抑制装置を開示する。
本願は、音信号に基づく音を出力部から出力させる音出力装置と、音入力部が受音した音に基づく音信号を処理する音処理装置と、前記音出力装置及び音処理装置と連携する前記エコー抑制装置とを備えるエコー抑制システムを開示する。
本願は、音信号に基づく音を音出力部から出力させる音出力装置、及び音入力部が受音した音に基づく音信号を処理する音処理装置と連携可能なエコー抑制装置に、音入力部が受音した音に基づく観測音信号のエコーを抑制させるエコー抑制方法において、前記エコー抑制装置は、前記音出力装置から音出力部へ出力する参照音信号及び前記観測音信号に基づいて推定した該観測音信号のエコー成分を除去する手順と、前記参照音信号に対する前記観測音信号のパワー比を算出する手順と、前記エコー成分を除去した観測音信号に基づくスペクトル導出する手順と、導出したスペクトルに基づくスペクトル包絡を導出する手順と、前記パワー比が所定値以下である場合に、前記パワー比に応じて前記スペクトル包絡を補正する補正係数を求める手順と、前記補正係数にて前記スペクトル包絡を補正した結果に基づいて、前記エコー成分を除去した観測音信号のスペクトル形状を補正する補正量を算出する手順と、前記エコー成分を除去した観測音信号に残留する残留エコーを抑制すべく、算出した補正量に基づいて、前記エコー成分を除去した観測音信号を補正する手順と、補正した観測音信号を前記音処理装置へ出力する手順とを実行するエコー抑制方法を開示する。
本願は、音信号に基づく音を音出力部から出力させる音出力装置、及び音入力部が受音した音に基づく音信号を処理する音処理装置と連携し、音入力部が受音した音に基づく観測音信号のエコー成分を除去し、前記出力装置へ出力するコンピュータに、エコー成分を除去した観測音信号に残留する残留エコーを抑制すべく、エコー成分を除去した観測音信号を補正する補正量を算出させるコンピュータプログラムであって、コンピュータに、前記音出力装置から音出力部へ出力する参照音信号及び前記観測音信号に基づいて推定した該観測音信号のエコー成分を除去させる手順と、前記参照音信号に対する前記観測音信号のパワー比を算出させる手順と、前記エコー成分を除去した観測音信号に基づくスペクトル導出させる手順と、導出したスペクトルに基づくスペクトル包絡を導出させる手順と、前記パワー比が所定値以下である場合に、前記パワー比に応じて前記スペクトル包絡を補正する補正係数を求めさせる手順と、前記補正係数にて前記スペクトル包絡を補正した結果に基づいて、前記エコー成分を除去した観測音信号のスペクトル形状を補正する補正量を算出させる手順とを実行させるコンピュータプログラムを開示する。
本願に記載のエコー抑制装置、エコー抑制システム、エコー抑制方法及びコンピュータプログラムでは、例えば参照音信号に基づいて音楽を出力している環境下で、話者が発声する音声を受音する場合に、話者が発声していないシングルトークと呼ばれる状態においては、観測音信号のパワー及び参照音信号のパワーの時間変化が類似していることから、パワー比に基づいてシングルトークの状態にあるか否かを推定することができるので、観測音信号に対して適切な補正を行い、残留エコーを除去することが可能である。また本発明では、パワー比を加味して補正量を算出するので、参照音信号のパワーが大きい場合でも、シングルトークの状態か、話者が発声しているダブルトークと呼ばれる状態であるかを推定してエコーを除去することが可能である。
本願に記載のエコー抑制装置等では、シングルトークの状態にある場合には、ダブルトークの状態にある場合と比べてパワー比が小さくなることから、パワー比に応じて観測音信号を抑制することにより、シングルトークの状態と見なせる区間の残留エコーのパワーを小さくすることができるので、エコーを除去することが可能である。
本願に記載のエコー抑制装置等では、時間変化を平滑化したパワー比を用いて補正量を算出することにより、例えば時間変化を平滑化したパワー比で、パワー比を除した結果を補正量の算出に用いることにより、外部環境の音場の時間変化を均すことができるので、外部環境の音場の時間変化に関わらず、一定の演算処理により、補正量を算出することが可能である。従って例えばカーナビゲーションシステムに適用した場合には、車両走行時のロードノイズの変化、再生中の音楽の変化等の外部環境の音場の時間変化による影響を抑制し、一定の演算処理にて、エコーを除去することが可能である。
本願に記載のエコー抑制装置等では、パワー比が所定値以下であるシングルトークの状態にあると見なせる場合に、スペクトル包絡を補正して、スペクトルの緩やかな変化による影響を排除し、シングルトークの状態でのエコーによる影響を排除することが可能である。
本願に記載のエコー抑制装置等では、周波数帯域毎に処理することにより、エコー以外の雑音が混入しやすい低周波数帯の重みを小さくする等の処理を行うことが可能である。
本発明に係るエコー抑制装置、エコー抑制システム、エコー抑制方法及びコンピュータプログラムは、音信号に基づく音を音出力部から出力させる音出力装置、及び音入力部が受音した音に基づく音信号を処理する音処理装置と連携し、音出力装置から音出力部へ出力する参照音信号及び観測音信号に基づいて推定したエコー成分を除去し、参照音信号に対する観測音信号のパワー比を算出し、算出したパワー比に応じて、エコー成分を除去した観測音信号に対する補正量を求め、求めた補正量に基づいて、エコー成分を除去した観測音信号を補正し、補正した観測音信号を前記音処理装置へ出力する。
この構成により、本発明では、例えば参照音信号に基づいて音楽を出力している環境下で、話者が発声する音声を受音する場合に、話者が発声していないシングルトークと呼ばれる状態においては、観測音信号のパワー及び参照音信号のパワーの時間変化が類似していることから、パワー比に基づいてシングルトークの状態にあるか否かを推定することができるので、エコーを除去した観測音信号に対して適切な補正を行い、残留エコーを除去することが可能である等、優れた効果を奏する。
また本発明は、パワー比に基づく補正の方法として、パワー比が所定値以下である場合に、パワー比に応じて観測音信号を抑制した結果に基づいて補正量を算出する。通常、シングルトーク状態では、ダブルトークの状態よりパワー比が小さくなる。本発明では、この特性に鑑みて、パワー比に応じて観測音信号を抑制することにより、シングルトークの状態と見なせる区間の残留エコーのパワーを小さくすることができるので、エコーを除去することが可能である等、優れた効果を奏する。
本発明は、パワー比に基づく補正の方法として、観測音信号のスペクトル形状を補正する補正量を算出する。特に観測音信号に基づくスペクトルを導出し、導出したスペクトルに基づくスペクトル包絡を導出し、パワー比が所定値以下である場合に、パワー比に応じてスペクトル包絡を補正する補正係数を算出し、補正係数にてスペクトル包絡を補正した結果に基づいて、観測音信号のスペクトル形状を補正する補正量を算出する。
この構成により、本発明では、パワー比が所定値以下であるシングルトークの状態と見なせる区間において、スペクトル包絡を補正して、スペクトルの緩やかな変化による影響を排除し、シングルトークの状態と見なせる区間での残留エコーによる影響を排除することが可能である等、優れた効果を奏する。
本発明は、時間変化を平滑化したパワー比で、パワー比を除することにより、外部環境の音場の時間変化を均すことができるので、外部環境の音場の時間変化に関わらず、一定の演算処理により、補正量を算出することが可能である等、優れた効果を奏する。従って例えばカーナビゲーションシステムに適用した場合には、車両走行時のロードノイズの変化、再生中の音楽の変化等の外部環境の音場の時間変化による影響を抑制し、残留エコーを除去することが可能である等、優れた効果を奏する。
また本発明は、観測音信号及び参照音信号の周波数帯域毎に補正量を算出し、周波数帯域毎に算出した補正量に、周波数帯域毎に予め設定されている帯域補正係数を乗じて補正量を算出することにより、目的に応じて周波数帯域毎の強調又は抑制を行うことができるので、例えばエコーが混入しやすい低周波数帯の重みを小さくする等の処理を行うことが可能である等、優れた効果を奏する。
従来のエコーキャンセラの構成を示す模式図である。 本発明の実施の形態1に係るエコー抑制装置の構成例を示す模式図である。 本発明の実施の形態1に係るエコー抑制装置の補正量算出処理にて用いられるデータの変化の一例を示すグラフである。 本発明の実施の形態1に係るエコー抑制装置の補正量算出処理にて用いられるデータの変化の一例を示すグラフである。 本発明の実施の形態1に係るエコー抑制装置の補正量算出処理にて用いられるデータの変化の一例を示すグラフである。 本発明の実施の形態1に係るエコー抑制装置の補正量算出処理にて用いられるデータの変化の一例を示すグラフである。 本発明の実施の形態1に係るエコー抑制装置の平滑化パワー比と補正量との関係の一例を示すグラフである。 本発明の実施の形態1に係るエコー抑制装置の補正量算出処理にて用いられるデータの変化の一例を示すグラフである。 本発明の実施の形態1に係るエコー抑制装置の信号補正処理の一例を示すフローチャートである。 本発明の実施の形態1に係るエコー抑制装置の補正量算出処理の一例を示すフローチャートである。 本発明の実施の形態2に係るエコー抑制装置の構成例を示す模式図である。 本発明の実施の形態2に係るエコー抑制装置の平滑化パワー比とスペクトルを補正する補正係数との関係の一例を示すグラフである。 本発明の実施の形態2に係るエコー抑制装置の補正量算出処理の一例を示すフローチャートである。 本発明の実施の形態3に係るエコー抑制装置の補正量算出処理にて用いられるデータの変化の一例を示すグラフである。 本発明の実施の形態3に係るエコー抑制装置の補正量算出処理の一例を示すフローチャートである。 本発明の実施の形態4に係るエコー抑制装置の構成例を示す模式図である。
符号の説明
1 エコー抑制装置
10 適応フィルタ
11 補正部
12 補正量算出部
120 コンピュータプログラム
121 分割手段
122 合成手段
2 音出力装置
20 音出力部
3 音処理装置
30 音入力部
100 エコーキャンセラ
101 スピーカ
102 マイクロホン
103 適応フィルタ
以下、本発明をその実施の形態を示す図面に基づいて詳述する。
実施の形態1.
図2は、本発明の実施の形態1に係るエコー抑制装置の構成例を示す模式図である。図2中1は、例えばテレビ会議システム、車両に搭載されるカーナビゲーションシステム等のコンピュータを用いたエコー抑制装置であり、エコー抑制装置1は、オーディオシステム等の音出力装置2及び音声認識システム等の音処理装置3と連携して動作する。音出力装置2から出力される出力音信号は、スピーカ等の音出力部20から音として出力される。またコンデンサマイクロホン等の音入力部30は、外部の音を受音し、受音した音に基づいて入力音信号を生成し、音処理装置3へ出力する。エコー抑制装置1は、音出力部20から夫々出力された音に基づくエコーを、音入力部30が受音した音から除去するエコーキャンセラの機能を備えている。なお以降の説明において、特にエコー抑制装置1内の出力音信号を参照音信号として示し、入力音信号を観測音信号として示す。
さらにエコー抑制装置1は、観測音信号からのエコーの除去に用いる適応フィルタ10と、適応フィルタ10により除去しきれていない残留エコーを除去すべく信号を補正する補正部11と、補正部11による補正量を算出する補正量算出部12とを備えている。なお図2中に破線で示した箇所は、背景技術として説明したエコーキャンセラに相当する。本実施の形態では、エコーキャンセラとして適応フィルタ10を用いる形態を示しているが、本発明はこれに限らず、参照音信号及び観測音信号をFFT等の方法にて周波数軸上の信号に変換し、周波数領域でエコーを除去する等、適応フィルタ10以外の他の公知の方法により観測音信号からエコーを除去する様にしても良い。
補正量算出部12は、ファームウェアとしてコンピュータプログラム120を記録するメモリ等の記憶回路、各種制御及び演算を行うMPU等の制御回路とを備え、記憶回路に記憶したコンピュータプログラム120を、制御回路にて実行し、各種演算を行うことで、コンピュータは、本発明のエコー抑制装置1として機能する。なおここでは、便宜上、記憶回路及び制御回路を用いてコンピュータプログラム120を実行するものとして説明するが、ファームウェアとしてコンピュータプログラム120を実行するのではなく、ハードウェアとして専用のVLSI等の演算回路を設計する様にしても良い。
エコー抑制装置1が、例えば音声認識機能を有するナビゲーションシステムである場合、音処理装置3は、補正された観測音信号に基づいて音声認識処理を実行する。
次に図2を用いて本発明の実施の形態1に係るエコー抑制装置1が備えるエコー抑制装置1の信号処理について説明する。音出力装置2から出力され音出力部20から音楽等の音を出力させる参照音信号は、サンプリング番号tを用いた参照音信号x(t)として示し、また話者の発声音等の音入力部30が受音した音に基づく観測音信号は、サンプリング番号tを用いた観測音信号y(t)として示す。サンプリング番号tとは、アナログ信号である音を8000〜16000Hzのサンプリング周波数でデジタル信号に変換する際の各サンプルを特定する番号である。なお出力時期及び入力時期が同じである参照音信号x(t)及び観測音信号y(t)に対しては、同じサンプリング番号tが付与される。
音入力部30は、話者の発声音等の受音すべき音だけでなく、音出力部20から出力された音楽、その他の雑音等の様々な音を受音する。即ち音出力部20から参照音信号x(t)に基づいて出力された音は、外部環境の音場を通って音入力部30に受音される。この音出力部20及び音入力部30間のインパルス応答をh(t)とすると、その推定値a(t)を適応フィルタ10にて求め、参照音信号x(t)を推定値a(t)の適応フィルタ10に通したx’(t)を導出する。そして観測音信号y(t)からx’(t)を減算することにより音出力部20の出力に基づくエコーを除去した差分信号e(t)を算出する。なお観測音信号y(t)に含まれている信号が音出力部20の出力に基づくエコーのみである場合に、差分信号e(t)の電力が最小となる様に適応フィルタ10を動作させて推定する。
また補正量算出部12は、参照音信号x(t)及び観測音信号y(t)を受け付け、参照音信号x(t)に対する観測音信号y(t)のパワー比を算出し、算出したパワー比に応じて観測音信号y(t)に対する補正量、特にここでは適応フィルタ10によるエコー除去後の観測音信号である差分信号e(t)に対する補正量を算出し、算出した補正量を補正部11へ出力する。
補正部11は、補正量算出部12から補正量を受け付け、受け付けた補正量に基づいて、適応フィルタ10によるエコー除去後の観測音信号である差分信号e(t)を補正した補正信号e’(t)を、音処理装置3へ出力する。
次に補正量の算出方法について更に詳細に説明する。補正量算出部12では、参照音信号x(t)及び観測音信号y(t)を受け付け、受け付けた参照音信号x(t)及び観測音信号y(t)の夫々数100サンプル分を1フレームとし、フレーム毎に夫々の対数パワーを算出する。なおフレーム番号nを用いて参照音信号x(t)に係るフレームの対数パワーをpowX(n)と示し、観測音信号y(t)に係るフレームの対数パワーをpowY(n)として示す。ここでパワーとは、例えばフレームに含まれる音信号のパワースペクトルの積分値として示されるフレームパワーであり、対数パワーとは、フレームパワーの常用対数である。なおパワーとしては、フレームに含まれる音信号の振幅の二乗値等の値を適宜定義することが可能である。
図3は、本発明の実施の形態1に係るエコー抑制装置1の補正量算出処理にて用いられるデータの変化の一例を示すグラフである。図3(a)は、参照音信号x(t)の対数パワーpowX(n)のフレーム毎の変化を示すグラフであり、横軸に時間を示す指標としてフレーム番号(n)をとり、dB単位の対数パワーの変化を示している。また図3(b)は、観測音信号y(t)の対数パワーpowY(n)のフレーム毎の変化を示すグラフであり、横軸に時間を示す指標としてフレーム番号(n)をとり、dB単位の対数パワーの変化を示している。図3において、話者が発声していない区間をシングルトークとして示し、話者が発声している区間をダブルトークとして示している。図3に示す様にシングルトークの区間では、観測音信号y(t)に対する参照音信号x(t)の影響が相対的に大きくなるため、参照音信号x(t)の対数パワーpowX(n)及び観測音信号y(t)の対数パワーpowY(n)は、類似した変化の波形を示す。またダブルトークの区間では、話者の発声等の観測音信号y(t)側にのみ影響する音が存在するため、参照音信号x(t)の対数パワーpowX(n)及び観測音信号y(t)の対数パワーpowY(n)は、異なる変化の波形となる。
図4は、本発明の実施の形態1に係るエコー抑制装置1の補正量算出処理にて用いられるデータの変化の一例を示すグラフである。図4は、観測音信号y(t)からx’(t)を減算して得られた差分信号e(t)の対数パワーpowE(n)のフレーム毎の変化を示すグラフであり、横軸に時間を示す指標としてフレーム番号(n)をとり、dB単位の対数パワーの変化を示している。図4に示す様に適応フィルタ10の機能によりエコーを除去した差分信号e(t)の対数パワーpowE(n)は、シングルトークの区間及びダブルトークの区間のいずれにおいても大きな変化を示す波形を示している。本発明では、シングルトークの区間において、参照音信号x(t)の対数パワーpowX(n)及び観測音信号y(t)の対数パワーpowY(n)が類似した変化の波形を示すことに鑑み、観測音信号y(t)の対数パワーpowY(n)から参照音信号x(t)の対数パワーpowX(n)を減じた結果に基づいて、差分信号e(t)を補正することにより、シングルトークの区間で、差分信号e(t)のパワーを可及的に小さくしてエコーを除去する。
図5は、本発明の実施の形態1に係るエコー抑制装置1の補正量算出処理にて用いられるデータの変化の一例を示すグラフである。図5は、観測音信号y(t)の対数パワーpowY(n)から参照音信号x(t)の対数パワーpowX(n)を減じた値{powY(n)−powX(n)}のフレーム毎の変化を示すグラフであり、横軸に時間を示す指標としてフレーム番号(n)をとり、dB単位の対数パワーの変化を示している。観測音信号y(t)の対数パワーpowY(n)と参照音信号x(t)の対数パワーpowX(t)との差は、観測音信号y(t)のパワーを参照音信号x(t)のパワーで除した商、即ち参照音信号x(t)に対する観測音信号y(t)のパワー比を示す。以降の説明では、フレームn毎の観測音信号y(t)の対数パワーpowY(n)と参照音信号x(t)の対数パワーpowX(n)との差をパワー比{powY(n)−powX(n)}という。図5に示す様にパワー比{powY(n)−powX(n)}の変化は、ダブルトークの区間の方がシングルトークの区間より大きくなっており、シングルトークの区間の変化と、ダブルトークの区間の変化との差が明確になっている。図5に示す様に、補正量算出部12は、参照音信号x(t)に対する観測音信号y(t)のパワー比を算出する。
前述した様にシングルトークの区間では、パワー比{powY(n)−powX(n)}の変化が小さく、またダブルトークの区間と比べて小さい値をとり、シングルトークの区間とダブルトークの区間との差が明確になっていることから、パワー比{powY(n)−powX(n)}に基づいて、差分信号e(t)を補正することにより、参照音信号x(t)の影響を排除することが可能となる。但し、本発明では、更に参照音信号x(t)の緩やかな時間変化による影響を排除してシングルトークの区間とダブルトークの区間との差を明確にする。
参照音信号x(t)の緩やかな時間変化による影響を排除して、シングルトークの区間におけるパワー比{powY(n)−powX(n)}の変化を平滑化する方法として、補正量算出部12は、下記の式1を用いた計算を行う。
subYX(n)=α×subYX(n−1)+(1−α)×{powY(n)−powX(n)} …式1
式1において、subYX(n)は、パワー比{powY(n)−powX(n)}の時間平均であり、αは、時間平均を算出する上での時間定数である。時間定数αとしては、0.95等の数値(但し、0<α<1)が用いられる。
図6は、本発明の実施の形態1に係るエコー抑制装置1の補正量算出処理にて用いられるデータの変化の一例を示すグラフである。図6(a)は、図5に示したパワー比{powY(n)−powX(n)}のグラフである。図6(b)は、式1を用いて算出した時間平均subYX(n)のフレーム毎の変化を示すグラフであり、横軸に時間を示す指標としてフレーム番号(n)をとり、dB単位の対数パワーの変化を示している。図6(b)に示す様に式1を用いて算出した時間平均subYX(n)は、パワー比{powY(n)−powX(n)}の緩やかな時間変化を示している。補正量算出部12は、パワー比{powY(n)−powX(n)}から時間平均subYX(n)の影響を排除すべく、パワー比{powY(n)−powX(n)}から時間平均subYX(n)を減じて、時間変化を平滑化したパワー比Et(n)を算出する。なお以降の説明においては、時間変化を平滑化したパワー比Et(n)を、平滑化パワー比powEt(n)という。但し、powEt(n)が負の値をとる場合、その値を0としている。(c)は、平滑化パワー比powEt(n)のフレーム毎の変化を示すグラフであり、横軸に時間を示す指標としてフレーム番号(n)をとり、dB単位の対数パワーの変化を示している。図6(c)に示す様に平滑化パワー比powEt(n)は、シングルトークの区間において、ほぼ0dBの値をとる。
補正量算出部12は、平滑化パワー比powEt(n)に基づき、補正部11にて補正する補正量を算出する。図7は、本発明の実施の形態1に係るエコー抑制装置1の平滑化パワー比と補正量との関係の一例を示すグラフである。図7は、横軸に平滑化パワー比powEt(n)をとり、縦軸に補正量をとってその関係を示したグラフである。図7に示す様に、補正量は、平滑化パワー比powEt(n)が、所定値以下である場合に、平滑化パワー比powEt(n)に応じて差分信号e(t)を抑制する様に補正量が算出される。図7に示す例では、平滑化パワー比powEt(n)が6dB以下である場合に、平滑化パワー比powEt(n)に応じた補正量が求まるが、その補正量は、平滑化パワー比powEt(n)が小さい程、大きくなる。即ち平滑化パワー比powEt(n)が小さい場合、その区間はシングルトークの区間である可能性が高く、その区間の差分信号e(t)は、残留エコーである可能性が高いと判断し、差分信号e(t)を抑制するのである。
そして補正量算出部12にて算出された補正量は、補正部11へ渡され、補正部11は、受け付けた補正量に基づいて、差分信号e(t)を補正することにより、補正信号e’(t)を導出し、導出した補正信号e’(t)を音声認識機能を備える音処理装置3へ出力する。
図8は、本発明の実施の形態1に係るエコー抑制装置1の補正量算出処理にて用いられるデータの変化の一例を示すグラフである。図8(a)は、差分信号の対数パワーpowE(n)のフレーム毎の変化を示すグラフであり、横軸に時間を示す指標としてフレーム番号(n)をとり、dB単位の対数パワーを示している。図8(b)は、補正信号の対数パワーpowE’(t)のフレーム毎の変化を示すグラフであり、横軸に時間を示す指標としてフレーム番号(n)をとり、dB単位の対数パワーを示している。図8(c)は、図8(a)及び(b)を重ねたグラフであり、点線が図8(a)であり、実線が図8(b)である。図8(a),(b),(c)から明らかな様に、本発明の信号補正方法を適用することにより、シングルトークの区間において、差分信号の対数パワーpowE(n)が抑制されている。
次に上述した構成の本発明の実施の形態1に係るエコー抑制装置1の処理について説明する。図9は、本発明の実施の形態1に係るエコー抑制装置1の信号補正処理の一例を示すフローチャートである。エコー抑制装置1は、音入力部30にて受音した音に基づいて観測音信号y(t)を生成し(S101)、適応フィルタ10の処理により、音入力部30が生成した観測音信号y(t)から音出力部20の出力に基づくエコーを除去した差分信号e(t)を算出する(S102)。
エコー抑制装置1は、補正量算出部12により、参照音信号x(t)及び観測音信号y(t)に基づいて補正量を算出する補正量算出処理を実行し(S103)、補正部11により、補正量に基づいて差分信号e(t)を補正することにより、補正信号e’(t)を生成する(S104)。そしてエコー抑制装置1は、生成した補正信号e’(t)を音処理装置3へ出力する(S105)。
そして音処理装置3は、入力された補正信号e’(t)に基づいて、音声認識処理等の処理を実行する。
図10は、本発明の実施の形態1に係るエコー抑制装置1の補正量算出処理の一例を示すフローチャートである。補正量算出処理として、図9を用いて説明した信号補正処理のステップS103における補正量算出処理を詳述する。エコー抑制装置1の補正量算出部12は、記憶回路に記憶しているコンピュータプログラム120を実行する制御回路の制御に基づいて、観測音信号y(t)を参照音信号x(t)で除することにより、参照音信号x(t)に対する観測音信号y(t)のパワー比を算出する(S201)。ステップS201のパワー比は、観測音信号y(t)の対数パワーpowY(n)から参照音信号x(t)の対数パワーpowX(n)を減じることで算出することもできる。
エコー抑制装置1の補正量算出部12は、パワー比{powY(n)−powX(n)}の時間変化を平滑化したパワー比の時間平均subYX(n)を算出する(S202)。ステップS202の時間平均subYX(n)は、前述の式1を用いて算出される。
エコー抑制装置1の補正量算出部12は、パワー比{powY(n)−powX(n)}を時間平均subYX(n)で除して平滑化パワー比powEt(n)を算出する(S203)。ステップS203の平滑化パワー比powEt(n)は、パワー比{powY(n)−powX(n)}の対数から、時間平均subYX(n)の対数を減じることにより算出することもできる。
そしてエコー抑制装置1の補正量算出部12は、平滑化パワー比powEt(n)が所定値以下である場合に、平滑化パワー比powEt(n)に応じて差分信号e(t)を抑制する補正量を算出する(S204)。ステップS204の補正量の算出は、図7のグラフの関係を示す数式に基づき、平滑化パワー比powEt(n)の対数が例えば6dB以下である場合に、平滑化パワー比powEt(n)に応じて差分信号e(t)から減じる補正量を算出することにより行われる。この様にして算出された補正量は、補正量算出部12から補正部11へ出力される。
前記実施の形態1に示した補正によるエコー抑制方法は本願の無数にある形態の一例であり、例えば差分信号を補正する形態を示したが、本発明はこれに限らず、観測音信号を直接補正する補正量を算出する等、様々な形態に展開することが可能である。また時間平均を考慮せずに、パワー比から補正量を算出する様にしても良い等、様々な形態に展開することが可能である。
実施の形態2.
実施の形態2は、実施の形態1とは異なる方法にて補正量を算出する形態である。図11は、本発明の実施の形態2に係るエコー抑制装置の構成例を示す模式図である。実施の形態2では、補正量算出部12に参照音信号x(t)及び観測音信号y(t)並びに差分信号e(t)が入力される。補正量算出部12は、平滑化パワー比powEt(n)に基づき、補正部11にて、差分信号e(t)のスペクトル形状を平坦化すべく補正量(補正係数)を算出する。具体的には差分信号e(t)からスペクトルを導出し、導出したスペクトルに対してケプストラム分析を行うことにより、スペクトルの低次、例えば3次以下の成分であるスペクトル包絡を導出する。そして導出したスペクトル包絡を0に近付けるべく、スペクトル包絡に乗じる補正係数を算出する。なおその他の構成については、実施の形態1と同様であるので、実施の形態1と同様の符号を付し、その説明を省略する。また平滑化パワー比powEt(n)を算出するまでの処理も実施の形態1と同様であるので、実施の形態1と同様の符号を付し、その説明を省略する。
図12は、本発明の実施の形態2に係るエコー抑制装置1の平滑化パワー比とスペクトルを補正する補正係数との関係の一例を示すグラフである。図12は、横軸に平滑化パワー比powEt(n)をとり、縦軸に補正係数をとってその関係を示したグラフである。図12に示す様に、平滑化パワー比powE(t)が所定値以上である場合、補正係数は1.0である。補正係数は、スペクトル包絡に乗じる係数であるので、補正係数が1.0である場合、スペクトル包絡に対する補正量は0となる。平滑化パワー比powE(t)が所定値以下である場合、平滑化パワー比powE(t)に応じて差分信号e(t)を抑制する様にスペクトル包絡に乗じる補正係数が算出される。図12に示す例では、平滑化パワー比powE(t)が5dB以下である場合に、平滑化パワー比powE(t)に応じてスペクトル包絡を補正する補正係数が求まるが、その補正係数は、平滑化パワー比powEt(n)が小さい程、小さくなり、補正量としては大きくなる。即ち平滑化パワー比powEt(n)が小さい場合、その区間はシングルトークの区間である可能性が高く、その区間の差分信号e(t)は、残留エコーである可能性が高いと判断し、スペクトル形状を平坦化すべく差分信号e(t)を抑制するのである。
次に本発明の実施の形態2に係るエコー抑制装置1の処理について説明する。実施の形態2は、実施の形態1の補正量算出処理を変更した形態であるので、補正量算出処理について説明する。図13は、本発明の実施の形態2に係るエコー抑制装置1の補正量算出処理の一例を示すフローチャートである。エコー抑制装置1の補正量算出部12は、記憶回路に記憶しているコンピュータプログラム120を実行する制御回路の制御により、参照音信号x(t)に対する観測音信号y(t)のパワー比{powY(n)−powX(n)}を算出し(S301)、パワー比{powY(n)−powX(n)}の時間変化を平滑化したパワー比の時間平均subYX(n)を算出し(S302)、パワー比{powY(n)−powX(n)}を時間平均subYX(n)で除して平滑化パワー比powEt(n)を算出する(S303)。
またエコー抑制装置1の補正量算出部12は、差分信号e(t)からスペクトルを導出する(S304)。ステップS304のスペクトルの導出は、FFT等の周波数変換関数を用いて行われる。
エコー抑制装置1の補正量算出部12は、導出したスペクトルをケプストラムに変換し、変換したケプストラムに係る所定の次数より低次の成分、例えば3次以下の成分を逆FFT処理してスペクトル包絡を導出する(S305)。
ステップS304の処理について説明する。差分信号e(t)をFFT処理したスペクトル|e(ω)|は、高次成分及び低次成分のFFTを夫々示すG(ω)及びH(ω)を用いた下記の式2で示すことができる。
e(ω)=G(ω)H(ω) …式2
式2の対数は、下記の式3で示すことができる。
log10|e(ω)|=log10|G(ω)|+log10|H(ω)| …式3
式3を、周波数ωを変数として逆FFTしたものがケプストラムc(τ)である。なお式2の右辺第1項は、スペクトルの高次の成分である微細構造を示し、右辺第2項は、スペクトルの低次の成分であるスペクトル包絡を示す。
エコー抑制装置1の補正量算出部12は、平滑化パワー比powEt(n)が所定値以下である場合に、平滑化パワー比powEt(n)に応じてスペクトル包絡を補正する補正係数を算出する(S306)。ステップS306の補正係数の算出は、図12のグラフの関係を示す数式に基づき、平滑化パワー比powEt(n)の対数が例えば5dB以下である場合に、平滑化パワー比powEt(n)に応じてスペクトル包絡を補正する補正係数を算出することにより行われる。なお平滑化パワー比powEt(n)が所定値以上である場合についても補正係数を算出する様にしても良いが、補正係数は0であるので、実質的な補正は行われない。
そしてエコー抑制装置1の補正量算出部12は、補正係数及びスペクトル包絡の積に基づいて差分信号e(t)から減じる補正量を算出する(S307)。この様にして算出された補正量は、補正量算出部12から補正部11へ出力される。
実施の形態3.
実施の形態3は、実施の形態1において実施の形態1とは異なる方法にて補正量を算出する形態である。なお実施の形態3に係るエコー抑制装置の構成例は、実施の形態1の変形である実施の形態2と同様であるので、実施の形態1及び実施の形態2を参照するものとし、その詳細な説明を省略する。また平滑化パワー比powEt(n)を算出するまでの処理は、実施の形態1と同様であるので、実施の形態1と同様の符号を付し、その説明を省略する。
実施の形態3では、補正量算出部12において、観測音信号y(t)の対数パワーpowY(n)の変化を平滑化する方法として、下記の式4を用いた計算を行う。
avepowY(n)=β×avepowY(n−1)+(1−β)×powY(n) …式4
式4において、avepowY(n)は、観測音信号y(t)の対数パワーpowY(n)の時間平均であり、βは、時間平均を算出する上での時間定数である。時間定数βとしては、0.95等の数値(但し、0<β<1)が用いられる。なお以降の説明においては、平滑化観測音信号avepowY(n)という。
さらに補正量算出部12は、式4を用いて算出された平滑化観測音信号avepowY(n)を、平滑化パワー比powEt(n)に加算する下記の式5を用いてレンジ補正を行った平滑化パワー比powEt’(n)を算出する。
powEt’(n)=powEt(n)+avepowY(n) …式5
式5は、平滑化パワー比powEt(n)に平滑化観測音信号avepowY(n)を加算する演算を示しており、式5に示す演算を行うことにより、平滑化パワー比powEt(n)のレンジを平滑化観測音信号avepowY(n)により補正したpowEt’(n)を算出することができる。
図14は、本発明の実施の形態3に係るエコー抑制装置1の補正量算出処理にて用いられるデータの変化の一例を示すグラフである。図14(a)は、平滑化パワー比powEt(n)のフレーム毎の変化を示すグラフであり、横軸に時間を示す指標としてフレーム番号(n)をとり、dB単位の対数パワーの変化を示している。図14(b)は、式4を用いて算出した時間平均avepowY(n)のフレーム毎の変化を示すグラフであり、横軸に時間を示す指標としてフレーム番号(n)をとり、dB単位の対数パワーの変化を示している。図14(c)は、式5を用いて算出したpowEt’(n)のフレーム毎の変化を示すグラフであり、横軸に時間を示す指標としてフレーム番号(n)をとり、dB単位の対数パワーの変化を示している。平滑化パワー比powEt(n)に平滑化観測音信号avepowY(n)を加算したpowEt’(n)は、レンジ補正がなされており、補正信号e’(t)の対数パワーとして用いることが可能である。
次に本発明の実施の形態3に係るエコー抑制装置1の処理について説明する。実施の形態3は、実施の形態1の補正量算出処理を変更した形態であるので、補正量算出処理について説明する。図15は、本発明の実施の形態3に係るエコー抑制装置1の補正量算出処理の一例を示すフローチャートである。エコー抑制装置1の補正量算出部12は、記憶回路に記憶しているコンピュータプログラム120を実行する制御回路の制御により、参照音信号x(t)に対する観測音信号y(t)のパワー比{powY(n)−powX(n)}を算出し(S401)、パワー比{powY(n)−powX(n)}の時間変化を平滑化したパワー比の時間平均subYX(n)を算出し(S402)、パワー比{powY(n)−powX(n)}を時間平均subYX(n)で除して平滑化パワー比powEt(n)を算出する(S403)。
さらにエコー抑制装置1の補正量算出部12は、観測音信号y(t)の対数パワーpowY(n)の時間変化を平滑化した平滑化観測音信号avepowY(n)を算出する(S404)。ステップS404の平滑化観測音信号avepowY(n)は、前述の式4を用いて算出される。
エコー抑制装置1の補正量算出部12は、平滑化観測音信号avepowY(n)を、平滑化パワー比powEt(n)に加算して、レンジ補正を行った平滑化パワー比powEt’(n)を算出する(S405)。ステップS405のpowEt’(n)は、前述の式5を用いて算出される。なおステップS405の平滑化観測音信号avepowY(n)及び平滑化パワー比powEt(n)とは、対数パワーであるので、対数ではなく正数を用いて演算する場合、ステップS405は積算を行うことになる。
そしてエコー抑制装置1の補正量算出部12は、差分信号e(t)を、powEt’(n)に補正すべく補正量を算出する(S406)。この様にして算出された補正量は、補正量算出部12から補正部11へ出力される。
前記実施の形態3では、差分信号e(t)を、powEt’(n)に補正すべく補正量を算出する形態を示したが、本発明はこれに限らず、powE(n)及びpowEt’(n)を所定の重みで加重平均した結果に基づいて、補正信号e’(t)を算出する様にしても良い。
また前記実施の形態3では、観測音信号y(t)の対数パワーpowY(n)の時間平均として算出した平滑化観測音信号avepowY(n)に基づいて、平滑化パワー比powEt(n)のレンジ補正を行ったが、本発明はこれに限らず、観測音信号y(t)の対数パワーpowX(n)の時間平均、差分信号e(t)の対数パワーpowE(n)の時間平均等の他の信号に基づいてレンジ補正を行うことも可能である。
実施の形態4.
実施の形態4は、実施の形態1において、信号を周波数帯域に基づいて分割し、分割した周波数帯域毎に補正量を算出する形態である。図16は、本発明の実施の形態4に係るエコー抑制装置の構成例を示す模式図である。実施の形態4における補正量算出部12は、参照音信号x(t)及び観測音信号y(t)を周波数帯域に基づいて分割する分割手段121と、周波数帯域毎に算出した補正量を合成する合成手段122とを備えている。なおその他の構成については、実施の形態1と同様であるので、実施の形態1と同様の符号を付し、その説明を省略する。
分割手段121は、参照音信号x(t)及び観測音信号y(t)に対してFFT等の周波数変換関数を用いてスペクトルを導出し、導出したスペクトルを周波数帯域に基づいて2〜6程度の信号に分割し、周波数帯域毎にパワースペクトルを積分することで、powX(n,i)及びpowY(n,i)を算出する。但し、iとは、夫々の周波数帯域を示す帯域番号である。そして夫々の周波数帯域について、実施の形態1に示した方法を用いて周波数帯域毎の補正量(i)を算出する。
そして合成手段122は、周波数帯域毎の補正量(i)を合成して差分信号e(t)に対する補正量を算出する。なお周波数帯域毎の補正量(i)の合成に対しては、周波数帯域毎に重み係数を設定することが可能である。例えば夫々の周波数帯域に対し、低波長域から(0.1,0.2,0,3,…)という重み係数を設定することにより、低波長域に混入しやすい雑音を抑制することが可能となる。
前記実施の形態1乃至4は、夫々独立した実施に限るものではなく、状況に応じて適宜組み合わせて実施することが可能である。
また前記実施の形態1乃至4は、本発明の無限にある実施の形態の一部を例示したに過ぎず、各種ハードウェア及びソフトフェア等の構成は、適宜設定することが可能であり、また例示した基本的な処理以外にも様々な処理を組み合わせることが可能である。

Claims (7)

  1. 音信号に基づく音を音出力部から出力させる音出力装置、及び音入力部が受音した音に基づく音信号を処理する音処理装置と連携して動作可能であり、音入力部が受音した音に基づく観測音信号のエコーを抑制するエコー抑制装置において、
    前記音出力装置から音出力部へ出力する参照音信号及び前記観測音信号に基づいて推定した該観測音信号のエコー成分を除去するエコー除去部と、
    前記参照音信号に対する前記観測音信号のパワー比を算出する比算出部と、
    算出したパワー比に応じて、前記エコー成分を除去した観測音信号に対する補正量を算出する補正量算出部と、
    前記エコー成分を除去した観測音信号に残留する残留エコーを抑制すべく、算出した補正量に基づいて、前記エコー成分を除去した観測音信号を補正する補正部と、
    補正した観測音信号を前記音処理装置へ出力する出力部と
    を備え
    前記補正量算出部は、
    前記エコー成分を除去した観測音信号に基づくスペクトルを導出するスペクトル導出部と、
    導出したスペクトルに基づくスペクトル包絡を導出する包絡導出部と、
    前記パワー比が所定値以下である場合に、前記パワー比に応じて前記スペクトル包絡を補正する補正係数を求める係数部と
    を備え、
    前記補正係数にて前記スペクトル包絡を補正した結果に基づいて、前記エコー成分を除去した観測音信号のスペクトル形状を補正する補正量を算出する様に構成してある
    ことを特徴とするエコー抑制装置。
  2. 前記補正量算出部は、パワー比が所定値以下である場合に、パワー比に応じて前記観測音信号の残留エコーを抑制すべく補正量を算出する様に構成してあることを特徴とする請求項1に記載のエコー抑制装置。
  3. 前記補正量算出部は、パワー比の時間変化を平滑化した結果に基づいて補正量を算出する様に構成してあることを特徴とする請求項1又は請求項2に記載のエコー抑制装置。
  4. 前記補正量算出部は、
    前記観測音信号及び前記参照音信号の周波数帯域毎に補正量を算出する様に構成してあり、
    周波数帯域毎に算出した補正量に、周波数帯域毎に予め設定されている帯域補正係数を乗じて補正量を算出する様に構成してある
    ことを特徴とする請求項1乃至請求項のいずれかに記載のエコー抑制装置。
  5. 音信号に基づく音を出力部から出力させる音出力装置と、
    音入力部が受音した音に基づく音信号を処理する音処理装置と、
    前記音出力装置及び音処理装置と連携する請求項1乃至請求項のいずれかに記載のエコー抑制装置と
    を備えることを特徴とするエコー抑制システム。
  6. 音信号に基づく音を音出力部から出力させる音出力装置、及び音入力部が受音した音に基づく音信号を処理する音処理装置と連携可能なエコー抑制装置に、音入力部が受音した音に基づく観測音信号のエコーを抑制させるエコー抑制方法において、
    前記エコー抑制装置は、
    前記音出力装置から音出力部へ出力する参照音信号及び前記観測音信号に基づいて推定した該観測音信号のエコー成分を除去する手順と、
    前記参照音信号に対する前記観測音信号のパワー比を算出する手順と、
    前記エコー成分を除去した観測音信号に基づくスペクトル導出する手順と、
    導出したスペクトルに基づくスペクトル包絡を導出する手順と、
    前記パワー比が所定値以下である場合に、前記パワー比に応じて前記スペクトル包絡を補正する補正係数を求める手順と、
    前記補正係数にて前記スペクトル包絡を補正した結果に基づいて、前記エコー成分を除去した観測音信号のスペクトル形状を補正する補正量を算出する手順と、
    前記エコー成分を除去した観測音信号に残留する残留エコーを抑制すべく、算出した補正量に基づいて、前記エコー成分を除去した観測音信号を補正する手順と、
    補正した観測音信号を前記音処理装置へ出力する手順と
    を実行することを特徴とするエコー抑制方法。
  7. 音信号に基づく音を音出力部から出力させる音出力装置、及び音入力部が受音した音に基づく音信号を処理する音処理装置と連携し、音入力部が受音した音に基づく観測音信号のエコー成分を除去し、前記出力装置へ出力するコンピュータに、エコー成分を除去した観測音信号に残留する残留エコーを抑制すべく、エコー成分を除去した観測音信号を補正する補正量を算出させるコンピュータプログラムであって、
    コンピュータに、
    前記音出力装置から音出力部へ出力する参照音信号及び前記観測音信号に基づいて推定した該観測音信号のエコー成分を除去させる手順と、
    前記参照音信号に対する前記観測音信号のパワー比を算出させる手順と、
    前記エコー成分を除去した観測音信号に基づくスペクトル導出させる手順と、
    導出したスペクトルに基づくスペクトル包絡を導出させる手順と、
    前記パワー比が所定値以下である場合に、前記パワー比に応じて前記スペクトル包絡を補正する補正係数を求めさせる手順と、
    前記補正係数にて前記スペクトル包絡を補正した結果に基づいて、前記エコー成分を除去した観測音信号のスペクトル形状を補正する補正量を算出させる手順と
    を実行させることを特徴とするコンピュータプログラム。
JP2009529874A 2007-08-24 2007-08-24 エコー抑制装置、エコー抑制システム、エコー抑制方法及びコンピュータプログラム Expired - Fee Related JP5071480B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2007/066470 WO2009028023A1 (ja) 2007-08-24 2007-08-24 エコー抑制装置、エコー抑制システム、エコー抑制方法及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JPWO2009028023A1 JPWO2009028023A1 (ja) 2010-11-25
JP5071480B2 true JP5071480B2 (ja) 2012-11-14

Family

ID=40386767

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009529874A Expired - Fee Related JP5071480B2 (ja) 2007-08-24 2007-08-24 エコー抑制装置、エコー抑制システム、エコー抑制方法及びコンピュータプログラム

Country Status (4)

Country Link
US (1) US8391471B2 (ja)
JP (1) JP5071480B2 (ja)
DE (1) DE112007003625T5 (ja)
WO (1) WO2009028023A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101445186B1 (ko) 2013-08-27 2014-10-01 (주) 로임시스템 비선형 보정 반향 제거장치

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4438720B2 (ja) * 2005-08-17 2010-03-24 ソニー株式会社 エコーキャンセラ及びマイク装置
US8582781B2 (en) * 2009-01-20 2013-11-12 Koplar Interactive Systems International, L.L.C. Echo modulation methods and systems
JP5493817B2 (ja) * 2009-12-17 2014-05-14 沖電気工業株式会社 エコーキャンセラ
JP5156043B2 (ja) * 2010-03-26 2013-03-06 株式会社東芝 音声判別装置
JPWO2013136742A1 (ja) * 2012-03-14 2015-08-03 パナソニックIpマネジメント株式会社 車載通話装置
US8655418B2 (en) * 2012-05-31 2014-02-18 Continental Automotive Systems, Inc Method and apparatus for a frequency domain echo suppression filter
US9210270B2 (en) 2012-11-15 2015-12-08 Qualcomm Incorporated Echo cancellation for ultrasound
US10542153B2 (en) * 2017-08-03 2020-01-21 Bose Corporation Multi-channel residual echo suppression
US10200540B1 (en) 2017-08-03 2019-02-05 Bose Corporation Efficient reutilization of acoustic echo canceler channels
US10594869B2 (en) 2017-08-03 2020-03-17 Bose Corporation Mitigating impact of double talk for residual echo suppressors
WO2019070722A1 (en) 2017-10-03 2019-04-11 Bose Corporation SPACE DIAGRAM DETECTOR
US10964305B2 (en) 2019-05-20 2021-03-30 Bose Corporation Mitigating impact of double talk for residual echo suppressors
CN111161748B (zh) * 2020-02-20 2022-09-23 百度在线网络技术(北京)有限公司 一种双讲状态检测方法、装置以及电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07226793A (ja) * 1994-02-10 1995-08-22 Fujitsu Ltd 信号伝達系の応答の変化を検出する装置
JPH08223088A (ja) * 1995-02-15 1996-08-30 Matsushita Electric Ind Co Ltd エコーキャンセラ
JPH11331046A (ja) * 1998-03-16 1999-11-30 Nippon Telegr & Teleph Corp <Ntt> エコー抑圧方法及び装置並びにエコー抑圧プログラムが記憶されたコンピュータに読取り可能な記憶媒体
JP2002084212A (ja) * 2000-09-08 2002-03-22 Nippon Telegr & Teleph Corp <Ntt> 反響抑圧方法、反響抑圧装置及び反響抑圧プログラム記憶媒体
JP2002237769A (ja) * 2001-02-08 2002-08-23 Nippon Telegr & Teleph Corp <Ntt> 多チャネル反響抑圧方法、その装置、そのプログラム及びその記録媒体
JP2005250266A (ja) * 2004-03-05 2005-09-15 Nippon Telegr & Teleph Corp <Ntt> エコー抑圧方法、この方法を実施する装置、プログラムおよび記録媒体
WO2006049260A1 (ja) * 2004-11-08 2006-05-11 Nec Corporation 信号処理の方法、信号処理の装置および信号処理用プログラム

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69129719T2 (de) * 1990-02-16 1999-01-14 Fujitsu Ltd., Kawasaki, Kanagawa Sprechvorrichtung mit einer wechselseitigen freisprechfunktion
JP2538176B2 (ja) * 1993-05-28 1996-09-25 松下電器産業株式会社 エコ―制御装置
DE69532394T2 (de) * 1994-02-10 2004-11-04 Nippon Telegraph And Telephone Corp. Verfahren und Vorrichtung zur Echokompensation mit Anwendung der "fast projection scheme"
US5668794A (en) * 1995-09-29 1997-09-16 Crystal Semiconductor Variable gain echo suppressor
JP2982718B2 (ja) * 1996-11-01 1999-11-29 日本電気株式会社 衛星通信装置
JP3396393B2 (ja) 1997-04-30 2003-04-14 沖電気工業株式会社 エコー・雑音成分除去装置
JP3220979B2 (ja) 1998-01-09 2001-10-22 日本電気株式会社 音声スイッチ
US6570986B1 (en) * 1999-08-30 2003-05-27 Industrial Technology Research Institute Double-talk detector
US7139342B1 (en) * 2000-05-12 2006-11-21 National Semiconductor Corporation System and method for cancelling signal echoes in a full-duplex transceiver front end
JP4162860B2 (ja) 2001-01-12 2008-10-08 アルパイン株式会社 不要音信号除去装置
EP1393461B1 (en) * 2001-05-17 2006-07-19 STMicroelectronics Asia Pacific Pte Ltd. Echo canceller and a method of cancelling echo
US6961422B2 (en) * 2001-12-28 2005-11-01 Avaya Technology Corp. Gain control method for acoustic echo cancellation and suppression
JP3753996B2 (ja) * 2002-03-20 2006-03-08 日本電信電話株式会社 反響抑圧装置、反響抑圧方法及びプログラム
US7346012B2 (en) * 2002-12-13 2008-03-18 Tioga Technologies Ltd. Transceiver with accelerated echo canceller convergence
US7046794B2 (en) 2003-12-12 2006-05-16 Motorola, Inc. Double talk activity detector and method for an echo canceler circuit
US7386142B2 (en) * 2004-05-27 2008-06-10 Starkey Laboratories, Inc. Method and apparatus for a hearing assistance system with adaptive bulk delay
JP4297055B2 (ja) * 2005-01-12 2009-07-15 ヤマハ株式会社 カラオケ装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07226793A (ja) * 1994-02-10 1995-08-22 Fujitsu Ltd 信号伝達系の応答の変化を検出する装置
JPH08223088A (ja) * 1995-02-15 1996-08-30 Matsushita Electric Ind Co Ltd エコーキャンセラ
JPH11331046A (ja) * 1998-03-16 1999-11-30 Nippon Telegr & Teleph Corp <Ntt> エコー抑圧方法及び装置並びにエコー抑圧プログラムが記憶されたコンピュータに読取り可能な記憶媒体
JP2002084212A (ja) * 2000-09-08 2002-03-22 Nippon Telegr & Teleph Corp <Ntt> 反響抑圧方法、反響抑圧装置及び反響抑圧プログラム記憶媒体
JP2002237769A (ja) * 2001-02-08 2002-08-23 Nippon Telegr & Teleph Corp <Ntt> 多チャネル反響抑圧方法、その装置、そのプログラム及びその記録媒体
JP2005250266A (ja) * 2004-03-05 2005-09-15 Nippon Telegr & Teleph Corp <Ntt> エコー抑圧方法、この方法を実施する装置、プログラムおよび記録媒体
WO2006049260A1 (ja) * 2004-11-08 2006-05-11 Nec Corporation 信号処理の方法、信号処理の装置および信号処理用プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101445186B1 (ko) 2013-08-27 2014-10-01 (주) 로임시스템 비선형 보정 반향 제거장치

Also Published As

Publication number Publication date
DE112007003625T5 (de) 2010-07-15
WO2009028023A1 (ja) 2009-03-05
US20100150376A1 (en) 2010-06-17
JPWO2009028023A1 (ja) 2010-11-25
US8391471B2 (en) 2013-03-05

Similar Documents

Publication Publication Date Title
JP5071480B2 (ja) エコー抑制装置、エコー抑制システム、エコー抑制方法及びコンピュータプログラム
JP4916394B2 (ja) エコー抑圧装置、エコー抑圧方法及びコンピュータプログラム
JP4283212B2 (ja) 雑音除去装置、雑音除去プログラム、及び雑音除去方法
JP4957810B2 (ja) 音処理装置、音処理方法及び音処理プログラム
JP4753821B2 (ja) 音信号補正方法、音信号補正装置及びコンピュータプログラム
JP5444472B2 (ja) 音源分離装置、音源分離方法、及び、プログラム
EP3276621B1 (en) Noise suppression device and noise suppressing method
JP2001134287A (ja) 雑音抑圧装置
JP2005195895A (ja) 雑音除去装置、及び音声認識装置、並びにカーナビゲーション装置
JP6545419B2 (ja) 音響信号処理装置、音響信号処理方法、及びハンズフリー通話装置
JP2012195801A (ja) 会話支援装置
JP2003140700A (ja) ノイズ除去方法及び装置
JPH11265199A (ja) 送話器
JP5466581B2 (ja) 反響消去方法、反響消去装置及び反響消去プログラム
JP2008072600A (ja) 音響信号処理装置、音響信号処理プログラム、音響信号処理方法
JP2003250193A (ja) 反響消去方法、この方法を実施する装置、プログラムおよびその記録媒体
JP2009049977A (ja) エコーキャンセラ
CN113519169B (zh) 用于音频啸叫衰减的方法和装置
US10109291B2 (en) Noise suppression device, noise suppression method, and computer program product
JP2023130254A (ja) 音声処理装置および音声処理方法
JP4209348B2 (ja) エコー抑圧方法、この方法を実施する装置、プログラムおよび記録媒体
JP2022011893A (ja) ノイズ抑圧回路
JP2013130815A (ja) 雑音抑圧装置
KR20110028104A (ko) 뮤지컬 노이즈 제거 장치 및 그 방법

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120724

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120806

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150831

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees