WO2016056167A1 - エコーキャンセル装置、エコーキャンセルプログラム及びエコーキャンセル方法 - Google Patents

エコーキャンセル装置、エコーキャンセルプログラム及びエコーキャンセル方法 Download PDF

Info

Publication number
WO2016056167A1
WO2016056167A1 PCT/JP2015/004520 JP2015004520W WO2016056167A1 WO 2016056167 A1 WO2016056167 A1 WO 2016056167A1 JP 2015004520 W JP2015004520 W JP 2015004520W WO 2016056167 A1 WO2016056167 A1 WO 2016056167A1
Authority
WO
WIPO (PCT)
Prior art keywords
signal
echo
frequency
voice
unit
Prior art date
Application number
PCT/JP2015/004520
Other languages
English (en)
French (fr)
Inventor
永井 俊明
Original Assignee
株式会社Jvcケンウッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社Jvcケンウッド filed Critical 株式会社Jvcケンウッド
Priority to CN201580053286.2A priority Critical patent/CN106797233B/zh
Priority to EP15849568.9A priority patent/EP3206304A4/en
Publication of WO2016056167A1 publication Critical patent/WO2016056167A1/ja
Priority to US15/481,370 priority patent/US9866702B2/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

 従来のエコーキャンセル装置は、十分にエコー信号を減衰させることができない問題があった。エコーキャンセル装置は、ターゲット周波数以上の周波数成分が抑圧された第1の音声信号を出力し、ターゲット周波数よりも高い周波数成分を含む音響信号(S2)を取得する装置であって、音響信号(S2)からエコー信号成分を低減した送話信号を生成するエコー信号低減処理部(18)と、出力音声信号(S1)が音声区間かつ音響信号(S2)にエコー信号成分が含まれる場合にエコー信号低減処理部にフィルタ係数の更新を指示するフィルタ係数更新判断部(17)と、を有し、フィルタ係数更新判断部(17)は、音響信号(S2)の特徴量を算出し、ターゲット周波数以下の周波数帯の第1の特徴量と、ターゲット周波数よりも高い周波数帯の第2の特徴量と、の差が予め設定した更新判断閾値以上であった場合に、フィルタ係数の更新を指示する。

Description

エコーキャンセル装置、エコーキャンセルプログラム及びエコーキャンセル方法
 本発明はエコーキャンセル装置、エコーキャンセルプログラム及びエコーキャンセル方法に関し、特に、自装置が出力した音声信号が自装置のマイクロフォンを介して入力されることで生じるエコー信号成分を低減するエコーキャンセル装置、エコーキャンセルプログラム及びエコーキャンセル方法に関する。
 近年、携帯電話等の通話装置を手に持つことなく通話を行うための補助装置としてハンズフリー通話装置が多く利用されている。このハンズフリー通話装置は、携帯電話等にイヤホンとマイクとを組み合わせたヘッドセットを接続するヘッドセットタイプと、スピーカーとマイクとを携帯電話等に接続するスピーカータイプがある。これらハンズフリー通話装置のうち、スピーカーとマイクとを用いたタイプは、ケーブル等が利用者に絡むことがないため、特に、自動車運転等における利用に向いているとされている。
 しかしながら、スピーカータイプのハンズフリー装置では、スピーカーから発した音声信号がマイクに回り込み、通話先の相手に送られてしまうエコーが発生する。通話中にエコーが発生すると、互いに音声信号が反響して音声の明瞭性が低下、もしくはハウリングを起こして通話が困難になることがある。このようなエコー問題をはじめとした通話明瞭度を向上させるための技術が、例えば、特許文献1、2に開示されている。
 特許文献1は、周囲のノイズレベルが高い場合でも十分な通話明瞭度を得るための周波数特性制御方法について開示している。特許文献1では、送話音響信号及び受話音響信号の周波数スペクトルをそれぞれ検出する。それら周波数スペクトル間のレベル差の大きさに従って、70%以上の通話明瞭度を得るために必要な下限周波数以上の周波数範囲で受話周波数スペクトルをノイズ周波数スペクトルのレベル以上にする。ノイズ周波数スペクトルと受話周波数スペクトルとの最大レベル差が所定限度値以下の場合は、必要下限周波数より低い受話周波数スペクトルの成分レベルをレベル変更量に従って上昇させ、最大レベル差が所定限度値を超える場合には、必要下限周波数より低い受話周波数スペクトルの成分レベルを低下させ、同時に必要下限周波数以上の受話周波数スペクトルの成分レベルを上昇させる。
 特許文献2は、エコーを除去するエコーキャンセラについて開示している。特許文献2に記載のエコーキャンセラは、受話信号から特定周波数の特定周波数成分を除去した信号をエコー経路に出力する特定周波数成分除去手段と、特定周波数成分除去手段が除去した特定周波数と同じ周波数の周波数成分を、送話信号から検出する特定周波数成分検出手段と、特定周波数成分検出手段により検出された特定周波数成分のパワーに基づきノイズパワーを求め、エコー成分を含む周波数成分のパワーに基づきノイズ及びエコー成分を含む合算パワーを求めるノイズ計算手段と、ノイズ計算手段により求められたノイズパワーと合算パワーとを用いて、当該エコーキャンセラの制御パラメータを求める制御パラメータ計算手段とを備える。
特開平07-221832号公報 特開2011-130170号公報
 しかしながら、特許文献1に記載の技術では、ノイズ成分とエコー信号成分とを切り分けることが出来ず、エコーを低減することができない問題がある。また、特許文献2に開示された技術では、送話信号の出力と共に話者が音声を発するダブルトーク状態においてはノイズパワーに話者が発した音声成分が含まれてしまい、正しくエコー成分を検出できずにエコーキャンセル効果が劣化する問題がある。つまり、特許文献1、2を用いても、エコー信号成分の抑圧効果が不十分な場合があり、通話品質を十分に高めることが出来ない問題がある。
 そこで、本実施の形態は、予め定められたターゲット周波数以上の周波数成分が抑圧された出力音声信号を空間に第1の音声信号として出力する音声出力部と、空間を介して伝搬する第2の音声信号を収音して、前記ターゲット周波数よりも高い周波数成分を含む音響信号を生成する音声入力部と、前記出力音声信号を遅延させる遅延処理部と、前記遅延処理部で遅延した前記出力音声信号が音声信号成分を含む音声区間であることを検出して音声区間情報を生成する音声区間検出処理部と、前記音声区間情報が前記音声区間であることを示す場合に、前記音響信号に前記出力音声信号に対応するエコー信号成分の有無を判断し、前記エコー信号成分が含まれていると判断した場合に係数更新信号をイネーブル状態とするフィルタ係数更新判断部と、前記音響信号から前記エコー信号成分の抑圧度合いを設定するフィルタ係数を前記係数更新信号に応じて更新しながら、前記音響信号から前記エコー信号成分を低減した送話信号を生成するエコー信号低減処理部と、を有し、前記フィルタ係数更新判断部は、前記音響信号の特徴量を算出し、前記ターゲット周波数以下の周波数帯の第1の特徴量と、前記ターゲット周波数よりも高い周波数帯の第2の特徴量と、の差が予め設定した更新判断閾値以上であった場合に、前記係数更新信号をイネーブル状態とするエコーキャンセル装置を提供する。
 そこで、本実施の形態は、予め定められたターゲット周波数以上の周波数成分が抑圧された出力音声信号を空間に第1の音声信号として出力する音声出力部と、空間を介して伝搬する第2の音声信号を収音して、前記ターゲット周波数よりも高い周波数成分を含む音響信号を生成する音声入力部と、プログラムを実行する演算部と、を有するエコーキャンセル装置において前記出力音声信号に対応するエコー信号成分を抑圧するエコーキャンセルプログラムであって、前記出力音声信号を遅延させる遅延処理と、前記遅延処理で遅延した前記出力音声信号が音声信号成分を含む音声区間であることを検出して音声区間情報を生成する音声区間検出処理と、前記音響信号から前記エコー信号成分の抑圧度合いを設定するフィルタ係数を更新しながら、前記音響信号から前記エコー信号成分を低減した送話信号を生成するエコー信号低減処理と、前記音声区間情報が前記音声区間であることを示す場合に、前記音響信号に前記出力音声信号に対応するエコー信号成分の有無を判断し、前記エコー信号成分が含まれていると判断した場合に前記フィルタ係数の更新を指示するフィルタ係数更新判断処理と、を行い、前記フィルタ係数更新判断処理において、前記音響信号の特徴量を算出し、前記ターゲット周波数以下の周波数帯の第1の特徴量と、前記ターゲット周波数よりも高い周波数帯の第2の特徴量と、の差が予め設定した更新判断閾値以上であった場合に、前記フィルタ係数の更新を指示するエコーキャンセルプログラムを提供する。
 そこで、本実施の形態は、予め定められたターゲット周波数以上の周波数成分が抑圧された出力音声信号を空間に第1の音声信号として出力する音声出力部と、空間を介して伝搬する第2の音声信号を収音して、前記ターゲット周波数よりも高い周波数成分を含む音響信号を生成する音声入力部と、を有するエコーキャンセル装置において前記出力音声信号に対応するエコー信号成分を抑圧するエコーキャンセル方法であって、前記出力音声信号を遅延させ、遅延した前記出力音声信号が音声信号成分を含む音声区間であることを検出して音声区間情報を生成し、前記音響信号から前記エコー信号成分の抑圧度合いを設定するフィルタ係数を更新しながら、前記音響信号から前記エコー信号成分を低減した送話信号を生成し、前記音響信号の特徴量を算出し、前記ターゲット周波数以下の周波数帯の第1の特徴量と、前記ターゲット周波数よりも高い周波数帯の第2の特徴量と、の差をエコー信号判断値として算出し、前記音声区間情報が前記音声区間であることを示し、かつ、前記エコー信号判断値が予め設定した更新判断閾値以上であった場合に、前記音響信号に前記出力音声信号に対応するエコー信号成分が有ると判断して、前記フィルタ係数の更新を指示するエコーキャンセル方法を提供する。
 本実施の形態によれば、高いエコー信号の抑制効果を発揮するエコーキャンセル装置、エコーキャンセルプログラム及びエコーキャンセル方法を提供する。
実施の形態1にかかるエコーキャンセル装置が適用されるハンズフリー装置の設置状態を説明するブロック図である。 実施の形態1にかかるエコーキャンセル装置が適用されるハンズフリー装置を含む通話システムを説明するブロック図である。 実施の形態1にかかるエコーキャンセル装置のブロック図である。 実施の形態1にかかるエコーキャンセル装置の動作を説明するフローチャートである。 実施の形態1にかかるエコーキャンセル装置で扱う音声信号の特徴を説明する図である。 実施の形態1にかかるエコーキャンセル装置に入力される雑音信号の特徴を説明する図である。 実施の形態1にかかるエコーキャンセル装置で扱う音声信号の時間波形とスペクトログラムを説明する図である。 実施の形態1にかかるエコーキャンセル装置で扱う音声信号のスペクトルを説明する図である。 実施の形態1にかかるエコーキャンセル装置で扱う音声信号において帯域制限した場合の時間波形とスペクトログラムを説明する図である。 実施の形態1にかかるエコーキャンセル装置で扱う音声信号において帯域制限した場合のスペクトルを説明する図である。 実施の形態2にかかるエコーキャンセル装置のブロック図である。 エコーキャンセル装置でエコーキャンセル処理を施す前の音声信号の時間波形とスペクトログラムを説明する図である。 エコーキャンセル装置でエコーキャンセル処理を施す前の音声信号のスペクトルを説明する図である。 エコーキャンセル装置でエコーキャンセル処理を施した後の音声信号の残留エコー信号成分の時間波形とスペクトログラムを説明する図である。 エコーキャンセル装置でエコーキャンセル処理を施した後の音声信号の残留エコー信号成分のスペクトルを説明する図である。 実施の形態3にかかるエコーキャンセル装置のブロック図である。 実施の形態3にかかるエコーキャンセル装置の動作を説明するフローチャートである。
 実施の形態1
 以下、図面を参照して実施の形態について説明する。説明の明確化のため、以下の記載及び図面は、適宜、省略、及び簡略化がなされている。各図面において、同一の要素には同一の符号が付されており、必要に応じて重複説明は省略されている。
 また、以下で説明する機能ブロックの各構成は、ハードウェア又はソフトウェア、もしくはその両方によって構成され、1つのハードウェア又はソフトウェアから構成してもよいし、複数のハードウェア又はソフトウェアから構成してもよい。各機能(各処理)を、CPUやメモリ等を有する演算部(例えば、コンピュータ)により実現してもよい。例えば、記憶装置に実施形態における作成方法を行うためのプログラムを格納し、各機能を、記憶装置に格納されたプログラムをCPUで実行することにより実現してもよい。
 これらのプログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD-ROM(Read Only Memory)、CD-R、CD-R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(random access memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
 図1に実施の形態1にかかるエコーキャンセル装置1を含むハンズフリー装置の構成を説明するブロック図を示す。図1に示す構成は、ハンズフリー装置の構成の一例であり、スピーカーとマイクとを有していれば他の構成であっても良い。また、図1に示した例は、ハンズフリー装置を自動車の車内に設けた例であるが、ハンズフリー装置は、自動車以外の場所で用いられても構わない。
 図1に示すように、ハンズフリー装置は、自動車の車内に設けられる。また、実施の形態1にかかるハンズフリー装置は、自動車の車体に設けられたマイクロフォン(以下、単にマイクと称す)とスピーカーSPとを有する。実施の形態1にかかるハンズフリー装置は、マイクロフォンを音声入力部として利用し、スピーカーSPを音声出力部として利用する。
 実施の形態1にかかるハンズフリー装置は、音声の入出力インタフェースとして利用されるものであり、通話先との通話は携帯電話等を用いて行う。そこで、図2に実施の形態1にかかるハンズフリー装置を含む通話システムを説明するブロック図を示す。図2に示すように、実施の形態1にかかるハンズフリー装置は、携帯電話との間で受話信号と送話信号を送受信することで、携帯電話の音声入力インタフェースとして機能する。そして、実施の形態1にかかるエコーキャンセル装置1は、ハンズフリー装置内に設けられるものとする。また、実施の形態1にかかる通話システムでは、携帯電話とエコーキャンセル装置1とが同じサンプリングレートで音声信号を扱うものとする。以下で、実施の形態1にかかるエコーキャンセル装置1の詳細について説明する。
 図3に実施の形態1にかかるエコーキャンセル装置1のブロック図を示す。なお、図3で示す例は、エコーキャンセル装置1が16kHzのサンプリングレートでサンプリングされた受話信号と送話信号を扱うものとする。
 図3に示すように、実施の形態1にかかるエコーキャンセル装置1は、受話信号入力部11、送話信号出力部12、音声出力部13、音声入力部14、遅延処理部15、音声区間検出処理部16、フィルタ係数更新判断部17、エコー信号低減処理部18、帯域制限部19を有する。
 受話信号入力部11は、外部から与えられる送話信号を受信して、内部に出力する。帯域制限部19は、受話信号入力部11から与えられた送話信号に帯域制限処理を施して、出力音声信号を出力する。帯域制限部19は、例えば、ローパスフィルタであって、受話信号のターゲット周波数以上の帯域を制限して出力音声信号を生成する。ここで、ターゲット周波数は予め定められているものとする。
 音声出力部13は、帯域制限部19から出力された出力音声信号S1を空間に第1の音声信号として出力する。音声出力部13が出力する出力音声信号S1は、ターゲット周波数以下の周波数成分を含むように帯域制限がされているため、第1の音声信号(例えば、図3のエコー信号)はターゲット周波数以上の音声成分が抑制された状態である。
 音声入力部14は、空間を介して伝搬する第2の音声信号を収音して、ターゲット周波数よりも高い周波数成分を含む音響信号S2を生成する。ここで、第2の音声信号には、話者が発する音声成分、騒音源から発せられるロードノイズ、第1の音声信号として出力されたエコー信号成分が含まれる。
 送話信号出力部12は、エコー信号低減処理部18において音響信号S2に対してエコーキャンセル処理がなされた後に生成される送話信号を携帯電話に出力する。
 遅延処理部15は、出力音声信号S1を遅延させて音声区間検出処理部16に与える。ここで、遅延処理部15による出力音声信号S1の遅延量は、音声出力部13により出力された第1の音声信号が車室空間の空間伝搬係数を経て変化したエコー信号が第2の音声信号に含まれる形で収音されるところまでの合計遅延時間に相当する時間である。
 音声区間検出処理部16は、遅延処理部15で遅延された出力音声信号S1が音声信号成分を含む音声区間であることを検出して音声区間情報を生成する。この音声区間情報は、フィルタ係数更新判断部17に与えられる。ここで、音声区間検出処理部16では、出力音声信号S1において、一定の時間間隔において予め設定した閾値を超える振幅レベルの信号の存在の有無を確認することで音声区間の有無を検出する。例えば、時間間隔を5msecに設定し、閾値を-24dBに設定した時、遅延処理部15で遅延処理した出力音声信号S1の振幅レベルの絶対値を確認し、-24dBを超える振幅レベルを検知した場合に音声区間と判定し、この振幅レベルを下回った場合に非音声区間と判定する。
 フィルタ係数更新判断部17は、音声区間情報が音声区間であることを示す場合に、音響信号に出力音声信号S1に対応するエコー信号成分の有無を判断し、エコー信号成分が含まれていると判断した場合に係数更新信号S3をイネーブル状態とする。ここで、フィルタ係数更新判断部17は、音響信号の特徴量を算出し、ターゲット周波数以下の周波数帯の第1の特徴量と、ターゲット周波数よりも高い周波数帯の第2の特徴量と、の差が予め設定した更新判断閾値以上であった場合に、係数更新信号S3をイネーブル状態とする。
 フィルタ係数更新判断部17は、エコー経路推定処理判断部21、特徴量検出処理部22、周波数信号変換処理部23を有する。周波数信号変換処理部23は、音響信号S2を周波数信号に変換する。より具体的には、周波数信号変換処理部23は、FFT(Fast Fourier Transform)或いはDCT(discrete cosine transform)を用いて、音響信号S2を時間領域から周波数領域の信号に変換する。また、周波数信号変換処理部23は、ターゲット周波数よりも高い周波数帯域までの音声を記録可能なサンプリングレート(例えば、16kHz)で音響信号S2を周波数信号に変換するものとする。
 周波数信号変換処理部23は、例えば、サンプリングレートが16kHz、周波数信号変換処理のサンプル数を1024sampleとした場合、周波数分解能を(1)式により求めると、15.625Hzとなる。
Figure JPOXMLDOC01-appb-M000001
 また、この場合の周波数変換周期の時間は(2)式により算出すると0.032secとなる。
Figure JPOXMLDOC01-appb-M000002
特徴量検出処理部22は、波数変換処理部にて変換された周波数信号から第1の特徴量及び第2の特徴量を算出する。より具体的には、特徴量検出処理部22は、周波数領域の信号に変換された音響信号S2のスペクトル信号からスペクトルの特徴量を検出する。エコースペクトルの特徴量の検出方法は、音響信号S2の広域周波数帯域のスペクトル強度を検出する。具体的な検出方法は後述する。
 さらに、特徴量検出処理部22では、車室内の話者が発話した話者スペクトル信号も同時に検出する。話者スペクトルの特徴量の検出は、ターゲット周波数以上でかつ音声スペクトル強度が検出可能な周波数帯域におけるスペクトル強度の時間変化を監視する方法がある。
 エコー経路推定処理判断部21は、音声区間検出処理部16が出力した音声区間情報と特徴量検出処理部22のスペクトル特徴量検出情報を用いて、エコー経路推定処理を実行するか否かを判断する。より具体的には、音声区間情報が音声区間であることを示す場合に、第1の特徴量及び第2の特徴量との差が予め設定した更新判断閾値以上であった場合に係数更新信号S3をイネーブル状態とする。特徴量検出処理部22が出力するスペクトル特徴量検出情報は、車室内の騒音による影響による誤検出を防ぐために、音声区間情報を用いて、音声区間情報が音声区間であるときに特徴量検出処理部22が算出するターゲット周波数帯域におけるスペクトル特徴量検出情報を用いる。ターゲット周波数帯域のスペクトル特徴量検出情報が閾値を超えていると判断した場合、エコー信号が含まれていると判断し、エコー経路推定処理を実行するようにエコー信号低減処理部18の適応フィルタ部31へ通知する。しかし、エコー信号が含まれており、かつ車室内の話者が発話したとき、いわゆるダブルトーク状態でエコー推定処理を実行すると適応フィルタ係数の更新に誤差が生じ、エコーキャンセル効果が低下してしまう。このためダブルトーク状態では、エコー推定処理を実行しないように適応フィルタ部31へ通知する。
 エコー信号低減処理部18は、音響信号S2から出力音声信号に対応するエコー信号成分の抑圧度合いを設定するフィルタ係数を係数更新信号S2に応じて更新しながら、音響信号S2からエコー信号成分を低減した送話信号を生成する。エコー信号低減処理部18は、適応フィルタ部31、加算器32を有する。
 適応フィルタ部31は、係数更新信号S3に応じてフィルタ係数を更新しながら、遅延処理部遅延処理部15により遅延された出力音声信号S1と加算部32が出力した送話信号とに基づき疑似エコー信号を生成する。適応フィルタ部31は、例えば、LMS(Least Mean Square)アルゴリズムで300Tap程度のフィルタ長でよい。この適応フィルタ部31では、遅延処理部15で遅延させた出力音声信号S1を参照信号として用いる。また、適応フィルタ部31では、加算器32で加算処理した後の残留エコー信号を誤差信号として用いる。そして、適応フィルタ部31は、エコー経路推定処理判断部21がエコー経路推定処理をする判断をした場合(例えば、係数更新信号S3がイネーブル状態となっている場合)に適応フィルタの係数を更新する。
 加算器32は、音響信号S2から適応フィルタ部31が出力した疑似エコー信号成分を減算して送話信号を出力する。
 続いて、実施の形態1にかかるエコーキャンセル装置1の動作について説明する。以下の説明では、特にエコーキャンセル装置1におけるエコーキャンセル処理について説明する。そこで、図4に、実施の形態1にかかるエコーキャンセル装置1の動作を説明するフローチャートを示す。
 図4に示すように、実施の形態1にかかるエコーキャンセル装置1は、エコーキャンセル処理を開始すると、まず、出力音声信号S1の音声区間情報をフィルタ係数更新判断部17にて取得する(ステップS11)。そして、フィルタ係数更新判断部17は、出力音声信号S1に音声信号が含まれているか否かを判定する(ステップS12)。このステップS12において、音声区間情報が非音声区間であると判断された場合(ステップS12のNOの枝)、音響信号S2にエコー成分が含まれないため、エコーキャンセル装置1はエコーキャンセル処理を実施することなくエコーキャンセル処理を終了する。
 一方、ステップS12において、音声区間情報が音声区間であると判断された場合(ステップS12のYESの枝)、周波数信号変換処理部23にて音響信号S2の周波数変換処理が行われる(ステップS13)。その後、特徴量検出処理部22にて高域周波数帯域の特徴量抽出処理が行われる(ステップS14)。そして、エコー経路推定処理判断部21にてエコー信号の有無の検出処理が行われる(ステップS15)。
 ステップS15のエコー信号の検出処理において、エコー信号が検出されなかった場合(ステップS15のNOの枝)、エコーキャンセル装置1は、エコーキャンセル処理を実施することなくエコーキャンセル処理を終了する。一方、ステップS15のエコー信号の検出処理において、エコー信号が検出された場合(ステップS15のYESの枝)、適応フィルタ部31においてエコー経路推定処理と(ステップS16)、疑似エコー信号生成処理(ステップS17)とを実施する。そして、加算器32にてエコー信号除去処理を実施する(ステップS18)。
 ここで、ステップS14の特徴量抽出処理と、ステップS15について、音響信号S2の具体的な例を示してより詳細に説明する。そこで、まず、音響信号S2として入力される音声信号の特徴を説明する図を図5に示す。図5で示す例は、静かな部屋で音声のみを録音した音声信号の波形である。この図5では、上部に音声信号の時間信号波形を示し、下部に音声信号のスペクトログラムを示した。なお、図5では、時間波形(上部)のグラフは横軸を時間、縦軸を振幅とするものであり、スペクトログラム(下部)のグラフは横軸を時間、縦軸を周波数とし、信号のスペクトル強度を濃淡で示したものである。
 図5に示すように、音声スペクトルは、子音と母音とで高いスペクトル強度を示す周波数帯域が異なる。母音は10~4000Hzの範囲でスペクトル強度が強く、4000Hz~8000Hzの範囲でスペクトル強度が弱くなる傾向がある。子音は、3000Hz~9000Hzの範囲でスペクトル強度が強く、9000Hz~15000Hzの範囲でスペクトル強度が弱くなる傾向がある。
 また、図6に実施の形態1にかかるエコーキャンセル装置1に入力される雑音信号の特徴を説明する図を示す。図6に示す図は、自動車が高速道路を走行している状態で自動車の車内で収音したロードノイズのスペクトル信号のグラフである。この図6に示すグラフは、横軸を周波数、縦軸をロードノイズの信号強度とするものである。
 図6に示すように、ロードノイズは、20~1500Hzに強いスペクトルを有する。特に、ロードノイズでは500Hz以下の低域周波数において非常に強いスペクトルを有する。つまり、ロードノイズは、2000Hz以上の周波数帯域の音声信号に与える影響は少ない。
 続いて、図7に実施の形態1にかかるエコーキャンセル装置1で扱う音声信号の時間波形とスペクトログラムを説明する図を示す。また、図8に実施の形態1にかかるエコーキャンセル装置で扱う音声信号のスペクトルを説明する図を示す。図7及び図8に示す例は、サンプリングレートを16kHzとした波形であって、帯域制限部19による帯域制限処理を行ってない状態の音声信号を示すものである。図7及び図8に示すように、サンプリングレートを16kHzとした場合、音声信号の再生周波数帯域は8kHz程度まである。
 一方、図9及び図10に図7及び図8で示した音声信号に帯域制限処理を施した場合の音声信号の特徴を説明する図を示す。図9及び図10に示す例は、ターゲット周波数を4kHzとしたものであり、帯域制限部19で4kHz以上の周波数帯域の信号成分を減衰させたものである。図9及び図10に示すようにターゲット周波数(例えば、4kHz)を上限とした帯域制限を行うと、ターゲット周波数以上の周波数帯の音声成分はほぼなくなる。
 実施の形態1にかかるエコーキャンセル装置1では、図7及び図8に示した特徴を有する音響信号S2を取得可能な音声入力部14及び周波数信号変換処理部23において、図9及び図10で示した特徴を有するエコー信号を含む音響信号S2が取得される。そして、実施の形態1にかかるエコーキャンセル装置1では、図9及び図10で示した特徴を有するエコー信号を含む音響信号S2に基づきエコー信号の有無を判断する。そこで、特徴量検出処理部22及びエコー経路推定処理判断部21における処理を具体的な数値例を挙げて説明する。
 まず、音声入力部14がサンプリングレート16kHzで音響信号S2を生成し、周波数信号変換処理部23がサンプル数を1024sample、周波数分解能15.625Hzで周波数変換処理を実施し、出力音声信号S1の帯域が制限されるターゲット周波数が4kHzで設定されている場合、ターゲット周波数に相当する周波数信号は256番目のスペクトル信号となる。そこで、特徴量検出処理部22は、第1の特徴量として3750Hzの周波数信号となる240番目のスペクトル信号から256番目のスペクトル信号の強度の平均値を算出する。また、特徴量検出処理部22は、第2の特徴量として256番目のスペクトル信号から4250Hzの周波数信号となる272番目のスペクトル信号の強度の平均値を算出する。ステップS14の特徴量検出処理では、特徴量検出処理部22が上記の特徴量を算出する。
 そして、エコー経路推定処理判断部21は、ステップS15のエコー信号検出処理において、第1の特徴量と第2の特徴量との差が予め設定した更新判断閾値(例えば、12dB)以上を超えているか否かに基づきエコー信号の有無を判定する。具体的には、第1の特徴量と第2の特徴量との差が更新判断閾値を下回っていれば、エコー信号はないとしてエコー経路推定処理判断部21は係数更新信号S3をディスエーブル状態とする。また、第1の特徴量と第2の特徴量との差が更新判断閾値以上であれば、エコー信号が有るとしてエコー経路推定処理判断部21は係数更新信号S3をイネーブル状態とする。
 ここで、実施の形態1にかかるエコー経路推定処理判断部21では、音響信号S2の特徴量の算出とともに、話者が発話した話者スペクトル信号も同時に検出する。そこで、以下で話者スペクトル信号の検出方法について説明する。
 例えば、ハンズフリー通話装置1のサンプリングレートが16kHz、ターゲット周波数が4kHz、周波数変換処理のフレームサイズが1024sampleに設定されていた場合、周波数分解能は15.625Hz、1フレームあたりの時間は32msec、マイクより収音可能な周波数は8kHzとなる。スペクトル信号においてターゲット周波数の4kHzに相当するスペクトル信号は256番目になる。そこで、特徴量検出処理部22は、話者スペクトル信号の検出においては音声帯域の上限を最大の512番目の8kHzとして、この256番目から512番目までの256個のスペクトル信号のスペクトル強度を算出する。そして、エコー経路推定処理判断部21は、現在フレームと過去フレームの話者スペクトル信号のスペクトル強度を比較することで話者の音声区間を検出する。エコー経路推定処理判断部21は、現在フレームが音声区間である場合、係数更新信号S3をディスエーブル状態に維持することで、適応フィルタ部31のフィルタ係数の更新を停止させる。
 また、ハンズフリー通話装置1のサンプリングレートが人間音声の周波数帯域を十分に超えるシステムである場合、検出する周波数帯域に上限を設ければよい。例えば、ハンズフリー通話装置1のサンプリングレートが64kHz、ターゲット周波数が4kHz、周波数変換処理のフレームサイズを4096sample、とする場合、周波数分解能は15.625Hz、1フレームあたりの時間は32msec、マイクより収音可能な周波数は32kHzまでとなる。スペクトル信号でターゲット周波数の4kHzに相当するスペクトル信号は256番目になる。この場合、特徴量検出処理部22が検出する音声帯域の上限を640番目の10kHzとする。そして、特徴量検出処理部22は、256番目から640番目までの384個のスペクトル信号についてスペクトル信号の強度を算出する。エコー経路推定処理判断部21は、現在フレームと過去フレームのスペクトル強度を比較することで話者の音声区間を検出する。
 スペクトル強度の比較には、過去フレームのスペクトルに対し現在フレームのスペクトルの方がある閾値(例えば12dB)を超えているか否かを判断する。さらに、閾値を超えるスペクトル信号の個数がある閾値(例えば、100[個])を超えるか否かより車室内の話者の音声であるかを判断する。過去フレームのスペクトル信号は、次の(3)式で更新することができる。なお、(3)式において、iはスペクトル番号を示す。
Figure JPOXMLDOC01-appb-M000003
 上記説明より、実施の形態1にかかるエコーキャンセル装置1では、収音可能な周波数帯域よりも低い周波数のターゲット周波数で帯域制限がされた出力音声信号S1を出力し、収音した音声から生成される音響信号S2のターゲット周波数以下の所定の周波数帯の音響信号S2の第1の特徴量とターゲット周波数より高い所定の周波数帯の音響信号S2の第2の特徴量とを比較することでエコー信号の有無を検出する。これにより、実施の形態1にかかるエコーキャンセル装置1は、高い精度でエコー信号の有無を検出することができる。
 また、実施の形態1にかかるエコーキャンセル装置は、第1の特徴量及び第2の特徴量の算出に用いるスペクトル信号の周波数帯をターゲット周波数の近傍に限定している。そのため、実施の形態1にかかるエコーキャンセル装置1は、エコー信号の検出に用いるメモリ量を削減することができる。また、第1の特徴量及び第2の特徴量の算出に用いるスペクトル信号の周波数帯をターゲット周波数の近傍に限定することで、実施の形態1にかかるエコーキャンセル装置1は、ロードノイズ等の影響を受けることなく、エコー信号の有無を検出することができる。
 さらに、実施の形態1にかかるエコーキャンセル装置1は、第1の特徴量及び第2の特徴量の算出と共に、ターゲット周波数よりも高い周波数帯域の音響信号S2のスペクトル信号から話者が発した音声の話者スペクトルの有無を検出する。そして、実施の形態1にかかるエコーキャンセル装置1は、音響信号S2が話者スペクトルを含む音声区間であると判断した場合、適応フィルタ部31のフィルタ係数の更新を停止する。これにより、実施の形態1にかかるエコーキャンセル装置1は、話者の発話によるフィルタ係数の誤った更新を防止してエコーキャンセル効果を高めることができる。
 実施の形態2
 実施の形態2では、出力音声信号S1の周波数帯域の制限方法の別の形態について説明する。そこで、実施の形態2にかかるエコーキャンセル装置2のブロック図を図11に示す。図11に示すように、実施の形態2にかかるエコーキャンセル装置2は、実施の形態1にかかるエコーキャンセル装置1から帯域制限部19を除いたものである。
 実施の形態2にかかるエコーキャンセル装置2では、携帯電話等から受信する受話信号よりも高いサンプリングレートで音響信号S2を生成し、この音響信号S2から送話信号を生成する。これにより、実施の形態2にかかるエコーキャンセル装置2では、出力音声信号S1の周波数帯域を音響信号S2の周波数帯域よりも低く制限する。
 具体的には、例えば、受話信号のサンプリングレートが8kHzであった場合、出力音声信号S1の周波数帯域は4kHzに制限される。一方、音響信号S2のサンプリングレートを16kHzとした場合、音響信号S2の周波数帯域は8kHzとなる。これにより、実施の形態2では、出力音声信号S1から生成されるエコー信号の信号特性が図9及び図10に示した周波数帯域制限が施された信号と同等とし、かつ、音響信号S2の信号特性を図7及び図8に示した帯域制限を施していない信号と同等とすることができる。つまり、実施の形態2にかかるエコーキャンセル装置2では、エコーキャンセル装置2を送話信号のサンプリングレートよりも高いサンプリングレートで動作させることで、実施の形態1にかかるエコーキャンセル装置1と同等なエコー信号の検出及びエコーキャンセル処理を実施することが可能となる。
 なお、人の音声信号の特徴は、性別や個人差はあるが基本周波数はおおむね100~250Hzに強いスペクトルがあり、倍音構造より基本周波数を基準に2倍、3倍、4倍、・・・・n倍の周波数帯域になるに連れてスペクトル強度は弱くなる特徴がある。人の音声信号は、おおむね10~12kHz程度までスペクトル信号が存在する。
 上記説明より、実施の形態2にかかるエコーキャンセル装置2では、帯域制限部19を用いることなく、実施の形態1にかかるエコーキャンセル装置1と同等なエコー信号の検出及びエコーキャンセル処理を行うことができる。
 実施の形態3
 実施の形態3では、1回のエコーキャンセル処理を施した後に送話信号中に残留する残留エコー信号成分を除去する残留エコーキャンセル処理を実施の形態1にかかるエコーキャンセル装置1に追加した例について説明する。そこで、まず、残留エコー信号成分について説明する。
 図12及び図13に、エコーキャンセル装置でエコーキャンセル処理を施す前の音声信号の特徴を説明する図を示す。図12は、音声信号の時間波形とスペクトログラムを説明する図であり、図13は、音声信号のスペクトルを説明する図である。一方、図14及び図15にエコーキャンセル装置でエコーキャンセル処理を施した後の音声信号の残留エコー信号成分を説明する図を示す。図14は、残留エコー信号成分の時間波形とスペクトログラムを説明する図であり、図15は、残留エコー信号成分のスペクトルを説明する図である。
 実施の形態1、2で説明したエコーキャンセル処理を施した場合であっても、適応フィルタ部31のフィルタ係数に誤差を含んでしまった場合には、適応フィルタ部31で生成した疑似エコー信号により、完全にエコー信号をキャンセルすることができない可能性がある。この場合、図12及び図13の音声信号に対して図14及び図15で示した残留エコー信号成分が残留する。実施の形態3にかかるエコーキャンセル装置3では、この残留エコー信号成分を除去する。
 そこで、実施の形態3にかかるエコーキャンセル装置3のブロック図を図16に示す。図16に示すように、実施の形態3にかかるエコーキャンセル装置3は、実施の形態1にかかるエコーキャンセル装置1のエコー信号低減処理部18と送話信号出力部12との間に残留エコー信号抑圧部41を追加したものである。
 残留エコー信号抑圧部41は、エコー信号低減処理部18が出力した送話信号を第1の送話信号として入力し、第1の送話信号に含まれる残留エコー信号成分を抑圧して第2の送話信号として出力する。残留エコー信号抑圧部41は、周波数信号変換処理部42、残留エコー信号減衰処理判断部43、残留エコー信号抑圧処理部44、時間信号変換処理部45を有する。なお、周波数信号変換処理部42及び残留エコー信号減衰処理判断部43内の特徴量検出処理部52は、周波数信号変換処理部23及び特徴量検出処理部22と同等のブロックであるため、図16では、特徴量検出処理部22が第1の特徴量検出処理部、周波数信号変換処理部23が第1の周波数信号変換処理部、周波数信号変換処理部42が第2の周波数信号変換処理部、特徴量検出処理部52が第2の特徴量検出処理部となる。
 周波数信号変換処理部42は、加算器32が出力するエコーキャンセル処理後の第1の送話信号を時間領域から周波数領域の信号(周波数信号)に変換する。周波数信号変換処理部42はFFT或いはDCTを用いて第1の送話信号を周波数信号に変換する。
 残留エコー信号減衰処理判断部43は、残留エコー信号の有無を判断して残留エコー信号抑圧処理を施すか否かを決定する。そこで、残留エコー信号減衰処理判断部43は、エコー経路推定処理判断部51及び特徴量検出処理部52を有する。
 特徴量検出処理部52は、残留エコースペクトルの特徴量を検出する。特徴量検出処理部52における残留エコースペクトルの特徴量算出方法は、特徴量検出処理部22のスペクトル算出方法と同様の方法を採用することができる。
 エコー経路推定処理判断部51は、特徴量検出処理部52の残留エコースペクトルの検出情報により、残留エコー信号成分があると判断した場合に残留エコー信号抑圧処理部44に残留エコー信号抑圧処理の実施を指示する。
 残留エコー信号抑圧処理部44は、定常スペクトル推定処理と、残留エコースペクトル推定処理と、残留エコースペクトル抑圧処理とを実施する。定常スペクトル推定処理は、残留エコーおよび話者による発話が無いときに定常スペクトル強度の情報について更新する。定常スペクトル情報は(4)式により更新される。なお、(4)式においてiは、スペクトル番号を示す。
Figure JPOXMLDOC01-appb-M000004
 残留エコースペクトル推定処理は、残留エコー信号成分を検出し、話者による発話が無いときに残留スペクトル強度の情報について更新する。残留スペクトル情報は(5)式により更新される。なお、(5)式においてiは、スペクトル番号を示す。
Figure JPOXMLDOC01-appb-M000005
 残留エコースペクトル抑圧処理は、残留エコースペクトルと定常エコースペクトルの差分量を現在のスペクトル信号から差し引くことで残留エコー信号を抑圧することができる。残留エコースペクトル抑圧方法は、(6)式及び(7)式で求めることができる。なお、(6)式及び(7)式においてiは、スペクトル番号を示す。
Figure JPOXMLDOC01-appb-M000006
Figure JPOXMLDOC01-appb-M000007
 時間信号変換処理部45は、残留エコー信号成分を抑圧したスペクトル信号を周波数領域から時間領域に変換する周波数逆変換処理を行うことで第2の送話信号を生成する。
 続いて、実施の形態3にかかるエコーキャンセル装置3の残留エコー信号成分の抑圧処理の動作について、図17に示すフローチャートを用いて説明する。図17に示すように、実施の形態3にかかるエコーキャンセル装置3では、残留エコー抑圧処理を開始すると、まず、周波数信号変換処理部42による周波数変換処理(ステップS21)と特徴量検出処理部52による高域周波数帯域の特徴量抽出処理(ステップS22)を行う。
 そして、エコーキャンセル装置3では、ステップS22で抽出された特徴量に基づきエコー経路推定処理判断部51で残留エコー信号の検出処理を行う(ステップS23)。このステップS23において、残留エコー信号成分があると判断された場合(ステップS23のYESの枝)には、エコー経路推定処理判断部51にて音声信号の有無を検出する(ステップS26)。一方、ステップS23において、残留エコー信号成分がないと判断された場合(ステップS23のNOの枝)においても、エコー経路推定処理判断部51にて音声信号の有無を検出する(ステップS24)。
 ステップS24において、音声信号が検出された場合(ステップS24のYESの枝)には、エコーキャンセル装置3は、エコー信号の抑圧処理を施すことなく第1の送話信号に時間信号変換処理を施して(ステップS29)、残留エコー抑圧処理を終了する。一方、ステップS24において、音声信号が検出さなかった場合(ステップS24のNOの枝)には、残留エコー信号抑圧処理部44において定常スペクトル推定処理(ステップS25)を行った後に第1の送話信号に時間信号変換処理を施して(ステップS29)、残留エコー抑圧処理を終了する。
 ステップS26において、音声信号が検出された場合(ステップS27のYESの枝)には、残留エコー信号抑圧処理部44において残留エコースペクトル抑圧処理(ステップS28)を行った後に、残留エコースペクトル抑圧後の第1の送話信号に時間信号変換処理を施して(ステップS29)、残留エコー抑圧処理を終了する。一方、ステップS26において、音声信号が検出さなかった場合(ステップS26のNOの枝)には、残留エコー信号抑圧処理部44において残留エコースペクトル推定処理(ステップS27)を行った後に残留エコースペクトル抑圧処理(ステップS28)を行う。その後、エコーキャンセル装置3は、残留エコースペクトル抑圧後の第1の送話信号に時間信号変換処理を施して(ステップS29)、残留エコー抑圧処理を終了する。
 上記説明より、実施の形態3にかかるエコーキャンセル装置3では、エコーキャンセル処理後に残留したエコー信号成分についても抑圧処理を施す。これにより、実施の形態3にかかるエコーキャンセル装置3は、実施の形態1にかかるエコーキャンセル装置1よりも高いエコーキャンセル効果を奏する。
 なお、本実施の形態は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。
 この出願は、2014年10月8日に出願された日本出願特願2014-206855を基礎とする優先権を主張し、その開示の全てをここに取り込む。
 本実施の形態は、エコーキャンセル装置及びエコーキャンセルプログラムに適用できるものである。
 1 エコーキャンセル装置
 2 エコーキャンセル装置
 3 エコーキャンセル装置
 11 受話信号入力部
 12 送話信号出力部
 13 音声出力部
 14 音声入力部
 15 遅延処理部
 16 音声区間検出処理部
 17 フィルタ係数更新判断部
 18 エコー信号低減処理部
 19 帯域制限部
 21 エコー経路推定処理判断部
 22 特徴量検出処理部
 23 周波数信号変換処理部
 31 適応フィルタ部
 32 加算器
 41 残留エコー信号抑圧部
 42 周波数信号変換処理部
 43 残留エコー信号減衰処理判断部
 44 残留エコー信号抑圧処理部
 45 時間信号変換処理部
 51 エコー経路推定処理判断部
 52 特徴量検出処理部
 S1 出力音声信号
 S2 音響信号
 S3 係数更新信号

Claims (9)

  1.  予め定められたターゲット周波数以上の周波数成分が抑圧された出力音声信号を空間に第1の音声信号として出力する音声出力部と、
     空間を介して伝搬する第2の音声信号を収音して、前記ターゲット周波数よりも高い周波数成分を含む音響信号を生成する音声入力部と、
     前記出力音声信号を遅延させる遅延処理部と、
     前記遅延処理部で遅延した前記出力音声信号が音声信号成分を含む音声区間であることを検出して音声区間情報を生成する音声区間検出処理部と、
     前記音声区間情報が前記音声区間であることを示す場合に、前記音響信号に前記出力音声信号に対応するエコー信号成分の有無を判断し、前記エコー信号成分が含まれていると判断した場合に係数更新信号をイネーブル状態とするフィルタ係数更新判断部と、
     前記音響信号から前記エコー信号成分の抑圧度合いを設定するフィルタ係数を前記係数更新信号に応じて更新しながら、前記音響信号から前記エコー信号成分を低減した送話信号を生成するエコー信号低減処理部と、を有し、
     前記フィルタ係数更新判断部は、前記音響信号の特徴量を算出し、前記ターゲット周波数以下の周波数帯の第1の特徴量と、前記ターゲット周波数よりも高い周波数帯の第2の特徴量と、の差が予め設定した更新判断閾値以上であった場合に、前記係数更新信号をイネーブル状態とするエコーキャンセル装置。
  2.  外部から受信した受話信号の前記ターゲット周波数以上の帯域を制限して前記出力音声信号を生成して前記音声出力部と前記遅延処理部に出力する帯域制限部を有する請求項1に記載のエコーキャンセル装置。
  3.  前記出力音声信号は、前記音響信号よりもサンプリングレートが低く設定された信号である請求項1に記載のエコーキャンセル装置。
  4.  前記フィルタ係数更新判断部は、前記音声区間情報が前記音声区間であることを示し、かつ、前記音響信号に話者の音声成分が含まれている場合は前記係数更新信号をディスエーブル状態とする請求項1乃至3のいずれか1項に記載のエコーキャンセル装置。
  5.  前記フィルタ係数更新判断部は、
     前記音響信号を周波数信号に変換する周波数信号変換処理部と、
     前記周波数信号変換処理部にて変換された周波数信号から前記第1の特徴量及び前記第2の特徴量を算出する特徴量検出処理部と、
     前記音声区間情報が前記音声区間であることを示す場合に、前記第1の特徴量及び前記第2の特徴量との差が予め設定した更新判断閾値以上であった場合に前記係数更新信号をイネーブル状態とするエコー経路推定処理判断部と、を有する請求項1乃至4のいずれか1項に記載のエコーキャンセル装置。
  6.  前記エコー信号低減処理部は、適応フィルタ部と、加算部と、を有し、
     前記適応フィルタ部は、前記係数更新信号に応じて前記フィルタ係数を更新しながら、前記遅延処理部により遅延された前記出力音声信号と前記加算部が出力した送話信号とに基づき疑似エコー信号を生成し、
     前記加算部は、前記音響信号から前記疑似エコー信号を減算して前記送話信号を出力する請求項1乃至5のいずれか1項に記載のエコーキャンセル装置。
  7.  前記送話信号を第1の送話信号として入力し、前記第1の送話信号に含まれる残留エコー信号成分を抑圧して第2の送話信号として出力する残留エコー信号抑圧部を更に有する請求項1乃至6のいずれか1項に記載のエコーキャンセル装置。
  8.  予め定められたターゲット周波数以上の周波数成分が抑圧された出力音声信号を空間に第1の音声信号として出力する音声出力部と、
     空間を介して伝搬する第2の音声信号を収音して、前記ターゲット周波数よりも高い周波数成分を含む音響信号を生成する音声入力部と、
     プログラムを実行する演算部と、を有するエコーキャンセル装置において前記出力音声信号に対応するエコー信号成分を抑圧するエコーキャンセルプログラムであって、
     前記出力音声信号を遅延させる遅延処理と、
     前記遅延処理で遅延した前記出力音声信号が音声信号成分を含む音声区間であることを検出して音声区間情報を生成する音声区間検出処理と、
     前記音響信号から前記エコー信号成分の抑圧度合いを設定するフィルタ係数を更新しながら、前記音響信号から前記エコー信号成分を低減した送話信号を生成するエコー信号低減処理と、
     前記音声区間情報が前記音声区間であることを示す場合に、前記音響信号に前記出力音声信号に対応するエコー信号成分の有無を判断し、前記エコー信号成分が含まれていると判断した場合に前記フィルタ係数の更新を指示するフィルタ係数更新判断処理と、を行い、
     前記フィルタ係数更新判断処理において、前記音響信号の特徴量を算出し、前記ターゲット周波数以下の周波数帯の第1の特徴量と、前記ターゲット周波数よりも高い周波数帯の第2の特徴量と、の差が予め設定した更新判断閾値以上であった場合に、前記フィルタ係数の更新を指示するエコーキャンセルプログラム。
  9.  予め定められたターゲット周波数以上の周波数成分が抑圧された出力音声信号を空間に第1の音声信号として出力する音声出力部と、
     空間を介して伝搬する第2の音声信号を収音して、前記ターゲット周波数よりも高い周波数成分を含む音響信号を生成する音声入力部と、を有するエコーキャンセル装置において前記出力音声信号に対応するエコー信号成分を抑圧するエコーキャンセル方法であって、
     前記出力音声信号を遅延させ、
     遅延した前記出力音声信号が音声信号成分を含む音声区間であることを検出して音声区間情報を生成し、
     前記音響信号から前記エコー信号成分の抑圧度合いを設定するフィルタ係数を更新しながら、前記音響信号から前記エコー信号成分を低減した送話信号を生成し、
     前記音響信号の特徴量を算出し、前記ターゲット周波数以下の周波数帯の第1の特徴量と、前記ターゲット周波数よりも高い周波数帯の第2の特徴量と、の差をエコー信号判断値として算出し、
     前記音声区間情報が前記音声区間であることを示し、かつ、前記エコー信号判断値が予め設定した更新判断閾値以上であった場合に、前記音響信号に前記出力音声信号に対応するエコー信号成分が有ると判断して、前記フィルタ係数の更新を指示するエコーキャンセル方法。
PCT/JP2015/004520 2014-10-08 2015-09-07 エコーキャンセル装置、エコーキャンセルプログラム及びエコーキャンセル方法 WO2016056167A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201580053286.2A CN106797233B (zh) 2014-10-08 2015-09-07 回波消除装置、回波消除方法以及记录介质
EP15849568.9A EP3206304A4 (en) 2014-10-08 2015-09-07 Echo cancellation device, echo cancellation program, and echo cancellation method
US15/481,370 US9866702B2 (en) 2014-10-08 2017-04-06 Echo cancellation device, non-transitory computer readable medium storing echo cancellation program, and echo cancellation

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014206855A JP6201949B2 (ja) 2014-10-08 2014-10-08 エコーキャンセル装置、エコーキャンセルプログラム及びエコーキャンセル方法
JP2014-206855 2014-10-08

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US15/481,370 Continuation US9866702B2 (en) 2014-10-08 2017-04-06 Echo cancellation device, non-transitory computer readable medium storing echo cancellation program, and echo cancellation

Publications (1)

Publication Number Publication Date
WO2016056167A1 true WO2016056167A1 (ja) 2016-04-14

Family

ID=55652810

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2015/004520 WO2016056167A1 (ja) 2014-10-08 2015-09-07 エコーキャンセル装置、エコーキャンセルプログラム及びエコーキャンセル方法

Country Status (5)

Country Link
US (1) US9866702B2 (ja)
EP (1) EP3206304A4 (ja)
JP (1) JP6201949B2 (ja)
CN (1) CN106797233B (ja)
WO (1) WO2016056167A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111081246A (zh) * 2019-12-24 2020-04-28 北京达佳互联信息技术有限公司 直播机器人唤醒方法、装置、电子设备及存储介质

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10366708B2 (en) 2017-03-20 2019-07-30 Bose Corporation Systems and methods of detecting speech activity of headphone user
US10249323B2 (en) 2017-05-31 2019-04-02 Bose Corporation Voice activity detection for communication headset
WO2019070722A1 (en) * 2017-10-03 2019-04-11 Bose Corporation SPACE DIAGRAM DETECTOR
US10438605B1 (en) * 2018-03-19 2019-10-08 Bose Corporation Echo control in binaural adaptive noise cancellation systems in headsets
JP6961545B2 (ja) * 2018-07-02 2021-11-05 株式会社東芝 音信号処理装置、音信号処理方法、およびプログラム
US11418655B2 (en) 2018-07-18 2022-08-16 Google Llc Echo detection
KR102167469B1 (ko) * 2018-12-19 2020-10-19 주식회사 이엠텍 피드백 처리 방법
CN109831733B (zh) * 2019-02-26 2020-11-24 北京百度网讯科技有限公司 音频播放性能的测试方法、装置、设备和存储介质
CN110099183B (zh) * 2019-05-06 2021-09-17 湖南国科微电子股份有限公司 一种音频数据处理装置、方法以及通话设备
US10964305B2 (en) 2019-05-20 2021-03-30 Bose Corporation Mitigating impact of double talk for residual echo suppressors
CN110475180A (zh) * 2019-08-23 2019-11-19 科大讯飞(苏州)科技有限公司 车载多音区音频处理系统及方法
CN110648679B (zh) * 2019-09-25 2023-07-14 腾讯科技(深圳)有限公司 回声抑制参数的确定方法和装置、存储介质及电子装置
CN115462058A (zh) * 2020-05-11 2022-12-09 雅马哈株式会社 信号处理方法、信号处理装置及程序
CN112037810B (zh) * 2020-09-25 2023-10-03 杭州网易智企科技有限公司 一种回音处理方法、装置、介质和计算设备
CN112526473A (zh) * 2020-11-17 2021-03-19 中国人民解放军海军航空大学 一种群目标个数判别方法及系统
CN115240696B (zh) * 2022-07-26 2023-10-03 北京集智数字科技有限公司 一种语音识别方法及可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011061449A (ja) * 2009-09-09 2011-03-24 Oki Electric Industry Co Ltd エコーキャンセラ
JP2013078118A (ja) * 2011-09-15 2013-04-25 Jvc Kenwood Corp ノイズ低減装置、音声入力装置、無線通信装置、およびノイズ低減方法
JP2013168857A (ja) * 2012-02-16 2013-08-29 Jvc Kenwood Corp ノイズ低減装置、音声入力装置、無線通信装置、およびノイズ低減方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2586845B2 (ja) 1993-12-07 1997-03-05 日本電気株式会社 電話機及びその周波数特性制御方法
GB2284970B (en) 1993-12-07 1998-09-09 Nec Corp Frequency spectrum control of received acoustic signal in a telephone set
US6052462A (en) * 1997-07-10 2000-04-18 Tellabs Operations, Inc. Double talk detection and echo control circuit
JP2000252881A (ja) * 1999-02-25 2000-09-14 Mitsubishi Electric Corp ダブルトーク検知装置並びにエコーキャンセラ装置およびエコーサプレッサー装置
JP3693588B2 (ja) * 2000-11-01 2005-09-07 富士通株式会社 エコー抑制システム
JP3727258B2 (ja) * 2001-08-13 2005-12-14 富士通株式会社 エコー抑制処理システム
JP4457639B2 (ja) * 2003-11-04 2010-04-28 沖電気工業株式会社 エコーキャンセラ
JP5002302B2 (ja) * 2007-03-30 2012-08-15 本田技研工業株式会社 能動型騒音制御装置
JP2009290825A (ja) * 2008-06-02 2009-12-10 Yamaha Corp 音響エコーキャンセラ
JP5493817B2 (ja) 2009-12-17 2014-05-14 沖電気工業株式会社 エコーキャンセラ
JP5887535B2 (ja) * 2012-02-17 2016-03-16 パナソニックIpマネジメント株式会社 エコー消去装置、エコー消去方法、及び、通話装置
US9697847B2 (en) * 2013-03-14 2017-07-04 Semiconductor Components Industries, Llc Acoustic signal processing system capable of detecting double-talk and method
US9191493B2 (en) * 2013-12-09 2015-11-17 Captioncall, Llc Methods and devices for updating an adaptive filter for echo cancellation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011061449A (ja) * 2009-09-09 2011-03-24 Oki Electric Industry Co Ltd エコーキャンセラ
JP2013078118A (ja) * 2011-09-15 2013-04-25 Jvc Kenwood Corp ノイズ低減装置、音声入力装置、無線通信装置、およびノイズ低減方法
JP2013168857A (ja) * 2012-02-16 2013-08-29 Jvc Kenwood Corp ノイズ低減装置、音声入力装置、無線通信装置、およびノイズ低減方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3206304A4 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111081246A (zh) * 2019-12-24 2020-04-28 北京达佳互联信息技术有限公司 直播机器人唤醒方法、装置、电子设备及存储介质
CN111081246B (zh) * 2019-12-24 2022-06-24 北京达佳互联信息技术有限公司 直播机器人唤醒方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
EP3206304A4 (en) 2017-09-06
JP2016076860A (ja) 2016-05-12
US20170214800A1 (en) 2017-07-27
EP3206304A1 (en) 2017-08-16
CN106797233B (zh) 2020-09-29
CN106797233A (zh) 2017-05-31
JP6201949B2 (ja) 2017-09-27
US9866702B2 (en) 2018-01-09

Similar Documents

Publication Publication Date Title
JP6201949B2 (ja) エコーキャンセル装置、エコーキャンセルプログラム及びエコーキャンセル方法
KR101444100B1 (ko) 혼합 사운드로부터 잡음을 제거하는 방법 및 장치
JP5293817B2 (ja) 音声信号処理装置及び音声信号処理方法
EP2805322B1 (en) Pre-shaping series filter for active noise cancellation adaptive filter
EP2244254B1 (en) Ambient noise compensation system robust to high excitation noise
KR20170142001A (ko) 전자 장치, 그의 반향 신호 제거 방법 및 비일시적 컴퓨터 판독가능 기록매체
US20080292108A1 (en) Dereverberation system for use in a signal processing apparatus
AU2017405291B2 (en) Method and apparatus for processing speech signal adaptive to noise environment
ES2337956T3 (es) Circuito de reduccion del eco acustico para un dispositivo "manos libres" utilizable con un telefono movil.
JP6545419B2 (ja) 音響信号処理装置、音響信号処理方法、及びハンズフリー通話装置
JP2007003702A (ja) 雑音除去装置、通信端末、及び、雑音除去方法
EP2643834A1 (en) System and method for producing an audio signal
JP2003500936A (ja) エコー抑止システムにおけるニアエンド音声信号の改善
JP5595605B2 (ja) 音声信号復元装置および音声信号復元方法
KR20100003530A (ko) 전자기기에서 음성 신호의 잡음 제거 장치 및 방법
CN112019967B (zh) 一种耳机降噪方法、装置、耳机设备及存储介质
JP6857344B2 (ja) オーディオ信号を処理するための装置および方法
JP6109450B2 (ja) エコーキャンセラ装置およびエコーキャンセル方法
KR101396873B1 (ko) 두 개의 마이크로폰을 포함하는 통신장치에서의 잡음제거방법 및 장치
JP2009094802A (ja) 通信装置
KR101557779B1 (ko) 두 개의 마이크로폰을 포함하는 통신장치에서의 잡음제거방법 및 장치
JP5466581B2 (ja) 反響消去方法、反響消去装置及び反響消去プログラム
WO2009107750A1 (ja) 音響エコーキャンセラ
JP2009015209A (ja) 音声明瞭度改善システム及び音声明瞭度改善方法
RU2786157C2 (ru) Устройство эхоподавления, способ эхоподавления и программа эхоподавления

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15849568

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

REEP Request for entry into the european phase

Ref document number: 2015849568

Country of ref document: EP