JP2004228939A - エコー処理装置及び音声処理装置 - Google Patents

エコー処理装置及び音声処理装置 Download PDF

Info

Publication number
JP2004228939A
JP2004228939A JP2003014502A JP2003014502A JP2004228939A JP 2004228939 A JP2004228939 A JP 2004228939A JP 2003014502 A JP2003014502 A JP 2003014502A JP 2003014502 A JP2003014502 A JP 2003014502A JP 2004228939 A JP2004228939 A JP 2004228939A
Authority
JP
Japan
Prior art keywords
signal
echo
transmission signal
frequency
double talk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2003014502A
Other languages
English (en)
Inventor
Masaya Takahashi
真哉 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2003014502A priority Critical patent/JP2004228939A/ja
Publication of JP2004228939A publication Critical patent/JP2004228939A/ja
Abandoned legal-status Critical Current

Links

Images

Landscapes

  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

【課題】装置規模が小さく受信信号の品質劣化が無く正確にダブルトークを検知して送信信号の音響エコー成分を抑圧するエコー処理装置及び音声処理装置を得る。
【解決手段】受信信号のサンプリング周波数より高いサンプリング周波数でデジタル信号に変換された送信信号から、受信信号が存在する周波数帯域の上限以上の周波数成分を抽出する抽出手段と、上記抽出手段で抽出された周波数成分を用いてダブルトーク判定を行うダブルトーク検出手段と、上記ダブルトーク検出手段のダブルトーク判定結果に従ってフィルタ係数更新の停止および開始を行いながら、送信信号の音響エコー成分を抑圧するエコーキャンセラ手段とを備える。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
この発明は、車載電話及び携帯電話等の音声通信において、音響エコーを低減するエコー処理装置及び音声処理装置に関するものである。
【0002】
【従来の技術】
スピーカから出力されてエコー路を経てマイクに入力される音響エコーを低減するエコー処理装置において、適応フィルタでエコー経路の伝達特性を推定してこの伝達特性を現すフィルタ係数を求め、このフィルタ係数と受信信号から擬似エコーを生成し、音響エコーから差し引くエコー処理装置では、伝達特性の推定誤差が大きくなることを避けるためエコー信号と近端話者の音声が送信信号に同時に入力されるダブルトーク状態をできるだけ早く検知し、伝達特性の推定、即ちフィルタ係数の更新を即座に停止することが非常に重要である。しかし送信信号にエコー信号のみが含まれるのか近端話者の音声も同時に含まれるのかを正確に区別することは難しく、近端話者の音声を検知するための様々な方法が考案されている。
【0003】
この種の従来のエコー処理技術として、例えば、特開昭62−65525号公報に開示されたものがある。図4は、この従来技術の構成を概略的に示した構成図であり、点線1で囲まれた部分はディジタル信号処理を行う部分である。
【0004】
以下、図4の従来技術を説明する。
図4の従来のエコー処理装置では、電話回線を通じた通話を前提としており、受信信号は、周波数帯域が電話回線の信号帯域である0.3KHz〜3.4KHzに制限されたディジタル信号である。この受信信号は、D/A変換器2においてサンプリング周波数8KHzでアナログ信号に変換される。そして増幅器3を経由してスピーカ4から外部出力され、エコー経路を経てエコー信号としてマイク5に入力される。なおD/A変換器2では、遮断周波数3.4KHzのローパスフィルタ処理も行うものとする。
【0005】
マイク5に入力されたエコー信号は、増幅器6を経てA/D変換器7でアナログ信号からディジタル信号である送信信号に変換される。このときA/D変換器7では0.3KHz〜3.4KHzの帯域制限フィルタ処理も行うものとする。
適応フィルタ手段13で、禁止ゲート16を経由して入力されたエコー抑圧送信信号と受信信号からエコー経路の伝達特性、即ち適応フィルタ係数が推定されて擬似エコーが生成され、減算手段14で、送信信号から適応フィルタ手段13で生成された擬似エコーが差し引かれてエコー抑圧が行われる。
【0006】
また、増幅器6から出力されるアナログ信号はA/D変換器7の他にハイパスフィルタ17とローパスフィルタ18に入力される。ハイパスフィルタ17は3.4KHz以上の信号のみを通過させ、ローパスフィルタ18は0.3KHz以下の信号のみを通過させる。双方のフィルタの出力はレベル検出19、20に入力され、どちらかが一定以上のレベルであることが検出されるとOR回路21から禁止ゲート16を閉じる信号が出力され、適応フィルタ手段13の伝達特性推定即ちフィルタ係数の更新が停止される。
【0007】
エコー信号は元々0.3KHz〜3.4KHzに帯域制限されているので、レベル検出19、20でレベル検出されることは無いが、近端話者の音声は帯域制限されていないので、レベル検出19、20でレベル検出された信号は近端話者の音声入力とみなされ、ダブルトークの可能性があるとして禁止ゲートが閉じられることになる。
【0008】
このようにして従来のエコー処理装置では、エコー信号と近端話者の音声を周波数帯域成分の差異で区別して近端話者の音声を検知し、近端話者の音声が検知された場合に、ダブルトークの可能性があると判定してフィルタ係数の更新を停止していた。
【0009】
また、従来のエコー処理技術として、例えば、特開2000−101484公報に開示されたものがある。図5は、この従来技術の構成を概略的に示した構成図であり、点線1で囲まれた部分はディジタル信号処理を行う部分で、DSP(ディジタル信号処理プロセッサ)で実施される。
【0010】
以下、図5の従来技術を説明するが、図4と同一又は相当の部分については同一符号を付して説明は省略する。
【0011】
フィルタ23は受信信号が存在する帯域内の周波数成分を抑圧する(受信信号の特定成分を除去する)ディジタルフィルタで構成され、フィルタ22はフィルタ23と逆の特性を持つフィルタで構成される。ここでは、フィルタ23を一定の遮断周波数以上の成分を抑圧するローパスフィルタで構成する場合、フィルタ22を同じ遮断周波数を持つハイパスフィルタで構成されるとする。
【0012】
受信信号はローパスフィルタ23を通過すると高域成分が抑圧され、D/A変換器2、増幅器3、スピーカ4を経由してエコー信号としてマイク5に入力され、A/D変換器7でディジタルの送信信号になる。フィルタ22はフィルタ23と同じ遮断周波数で送信信号の低域を抑圧する。もし送信信号の成分がエコー信号だけであれば、結果的に全帯域の成分が抑圧された信号が出力される。一方近端話者の音声は高域成分を残しているのでフィルタ22を通過しても高域成分が存在する信号が出力される。
【0013】
ダブルトーク検出手段11ではフィルタ22から出力された信号のパワーが一定以上であれば近端話者の音声と判定し、ダブルトークの可能性があると判定して適応フィルタ手段13のフィルタ係数更新を停止させる指令を適応フィルタ手段13に出力する。すると、適応フィルタ手段13では適応フィルタ係数の更新が停止される。
【0014】
このように図5の従来のエコー処理装置では、フィルタ23で受信信号が存在する帯域内の周波数成分を抑圧し、受信信号の周波数成分をわざと変形させることで、近端話者の音声とエコー信号とを区別できるようにし、近端話者の音声を検知してフィルタ係数の更新を停止していた。
【0015】
【特許文献1】
特開昭62−65525号公報(第3頁〜第5頁、第1図)
【0016】
【特許文献2】
特開2000−101484公報(第4頁〜第9頁、第1図)
【0017】
【発明が解決しようとする課題】
しかしながら、図4に示した従来のエコー処理装置では近端話者の音声を検出するためハイパスフィルタ、ローパスフィルタ、レベル検出器で構成される回路が必要で、装置規模が大きくなる課題があった。
【0018】
また、図5に示した従来のエコー処理装置では近端話者の音声と区別するため受信信号の周波数成分に変形を加えるので受信信号の品質が劣化する課題があった。
【0019】
この発明は上記のような課題を解決するためになされたもので、装置規模が小さく受信信号の品質劣化が無く正確にダブルトークを検知して送信信号の音響エコー成分を抑圧するエコー処理装置及び音声処理装置を得ることを目的とする。
【0020】
【課題を解決するための手段】
本発明に係るエコー処理装置は、受信信号のサンプリング周波数より高いサンプリング周波数でデジタル信号に変換された送信信号から、受信信号が存在する周波数帯域の上限以上の周波数成分を抽出する抽出手段と、上記抽出手段で抽出された周波数成分を用いてダブルトーク判定を行うダブルトーク検出手段と、上記ダブルトーク検出手段のダブルトーク判定結果に従ってフィルタ係数更新の停止および開始を行いながら、送信信号の音響エコー成分を抑圧するエコーキャンセラ手段とを備えたものである。
【0021】
また、本発明の係る音声処理装置は、受信信号をデジタル信号からアナログ信号に変換するD/A変換器と、上記D/A変換器でアナログ信号に変換された受信信号に応じた音響を出力するスピーカと、外部の音響を入力し、送信信号として上記入力した外部の音響に対応したアナログ信号を出力するマイクと、上記マイクから出力された送信信号を受信信号のサンプリング周波数より高いサンプリング周波数でアナログ信号からデジタル信号に変換するA/D変換器と、上記A/D変換器でデジタル信号に変換された送信信号から受信信号が存在する周波数帯域の上限以上の周波数成分を抽出する抽出手段と、上記抽出手段で抽出された周波数成分を用いてダブルトーク判定を行うダブルトーク検出手段と、上記ダブルトーク検出手段のダブルトーク判定結果に従ってフィルタ係数更新の停止および開始を行いながら、送信信号の音響エコー成分を抑圧するエコーキャンセラ手段とを備えたものである。
【0022】
【発明の実施の形態】
以下、この発明の実施の一形態を説明する。
実施の形態1.
図1はこの発明の実施の形態1によるエコー処理装置の構成を示すブロック構成図である。
図において点線1で囲まれた部分はエコー処理装置の基本部分で、例えば、DSP(ディジタル信号処理プロセッサ)のソフトウエア処理で実施される。本実施の形態において、基本部分1は、デジタル信号の受信信号をアップサンプリングして出力すると共に、入力されたデジタル信号の送信信号をダウンサンプリングし、当該ダウンサンプリングされた送信信号の音響エコー成分を抑圧して出力する。
【0023】
D/A変換器2は、上記基本部分1から出力された受信信号をデジタル信号からアナログ信号に変換する。本実施の形態では、上記基本部分1でアップサンプリングされた受信信号をデジタル信号からアナログ信号に変換する。
【0024】
増幅器3は、上記D/A変換器2でアナログ信号に変換された受信信号を増幅する。
スピーカ4は、上記増幅器3で増幅されたアナログ信号の受信信号に応じた音響を出力する。
マイク5は、外部の音響を入力し、送信信号として上記入力した外部の音響に対応したアナログ信号を出力する。本実施の形態では、例えば、マイク5近傍で発せられた近端話者の音声、上記スピーカ4から出力された音響等を入力する。増幅器6は、上記マイク5に入力されたアナログ信号の送信信号を増幅する。A/D変換器7は、上記増幅器6で増幅された送信信号をアナログ信号からデジタル信号に変換する。
【0025】
また、基本部分1において、アップサンプリング手段8は、デジタル信号の受信信号のサンプリング周波数をアップさせる。本実施の形態では、上記受信信号を上記A/D変換器7のサンプリング周波数と同一のサンプリング周波数の時系列信号にアップサンプリングする。
ダウンサンプリング手段9は、デジタル信号の送信信号のサンプリング周波数をダウンさせる。本実施の形態では、上記送信信号をアップサンプリング前の受信信号と同一のサンプリング周波数の時系列信号にダウンサンプリングする。
抽出手段10は、デジタル信号に変換された送信信号から受信信号が存在する周波数帯域以上の周波数成分を抽出するものであり、本実施の形態では、フィルタ10を用いる。
【0026】
ダブルトーク検出手段11は、上記フィルタ10で抽出された周波数成分を用いてダブルトーク判定を行う。本実施の形態では、受信信号、送信信号、上記フィルタ10で抽出された周波数成分、及び送信信号のエコー成分を抑圧したエコー抑圧送信信号を用いてダブルトーク判定を行う。
【0027】
エコーキャンセラ手段12は、上記ダブルトーク検出手段11のダブルトーク判定結果を用いて、送信信号の音響エコー成分を抑圧するものであり、本実施の形態では、適応フィルタ手段13と減算手段14で構成され、ダウンサンプリング手段9を通過したデジタル信号の送信信号から擬似エコー信号を差し引いて、送信信号のエコー成分を除去し、エコー抑圧送信信号を出力する。
【0028】
エコーキャンセラ手段12において、適応フィルタ手段13は、受信信号及びエコー抑圧送信信号を用いてエコー経路の伝達特性即ち適応フィルタ係数を推定して擬似エコー信号を生成すると共に、上記ダブルトーク検出手段11のダブルトーク判定結果を用いて上記適応フィルタ係数の更新を制御する。
減算手段14は、上記ダウンサンプリング手段9を通過したデジタル信号の送信信号から上記適応フィルタ手段13で生成された擬似エコー信号を差し引く。
【0029】
なお、本実施の形態においては、D/A変換器2とA/D変換器7は、互いに同一のサンプリング周波数と互いに同一の高域遮断周波数で構成されている。
【0030】
次に動作について説明する。
図1において、基本部分1に入力された受信信号は、例えば、電話通話用の信号帯域である0.3KHz〜3.4KHzに制限されており、サンプリング周波数8KHzでサンプリングされているデジタル信号であるとする。まず、アップサンプリング手段8は、上記サンプリング周波数8KHzでサンプリングされている受信信号が入力されると、この受信信号を、例えばサンプリング周波数16KHzにアップサンプリングする。このアップサンプリングは、例えば、受信信号の2サンプル間に振幅ゼロのサンプルを1サンプルずつ挿入し、遮断周波数3.4KHzのローパスフィルタ処理(例えばIIR型ディジタルフィルタで実施)を施すことで実施する。このアップサンプリングの技術は文献(城戸健一著「ディジタル信号処理入門」丸善株式会社出版、昭和60年7月20日発行)に示されている。
【0031】
次に、D/A変換器2は、上記サンプリング周波数16KHzにアップサンプリングされた受信信号をサンプリング周波数16KHzでアナログ信号に変換する。ここでD/A変換器2は、例えば、遮断周波数7.0KHzのローパスフィルタ処理も行うものとする。そして、増幅器3が、上記アナログ信号に変換された受信信号を増幅し、スピーカ4が、上記増幅された受信信号に応じた音響を出力する。
【0032】
スピーカ4から外部出力された音響は、エコー経路を経てエコー信号としてマイク5に入力される。また、この時、上記マイク5の近傍で近端話者が発声した場合には、その音声もマイク5に入力される。そして上記マイク5は上記入力した外部の音響に対応したアナログ信号を出力する。
【0033】
次に、増幅器6が、上記マイク5から出力されたアナログ信号の送信信号を増幅し、A/D変換器7が、増幅されたアナログ信号をデジタル信号の送信信号に変換する。このときA/D変換器7では、上記D/A変換器2と同じサンプリング周波数16KHzで変換し、上記D/A変換器2と同じ高域遮断周波数を持つ0.3KHz〜7.0KHzの帯域制限フィルタ処理も行うものとする。
【0034】
市販のA/D変換器とD/A変換器の多くは両者一体として装置化され同一のサンプリング周波数と同一の高域遮断周波数で動作することが多いが、上記のように受信信号側にアップサンプリング手段13を設けることでA/D変換器7と同じサンプリング周波数と高域遮断周波数でD/A変換器2が動作するようにするので、市販の一体型A/D、D/A変換器を適用することができる。
【0035】
A/D変換器7から出力されたデジタル信号の送信信号は、ダウンサンプリング手段9、フィルタ10、及びダブルトーク検出手段11に出力される。
ダウンサンプリング手段9では、送信信号をサンプリング周波数8KHzにダウンサンプリングする。このダウンサンプリングは、例えば、入力された送信信号を遮断周波数3.4KHzのローパスフィルタ処理(例えばIIR型ディジタルフィルタで実施)した後、2サンプルごとに間引いて抽出すことで実施する。このダウンサンプリングの技術は文献(城戸健一著「ディジタル信号処理入門」丸善株式会社出版、昭和60年7月20日発行)に示されている。
【0036】
サンプリング周波数8KHzにダウンサンプリングされた送信信号が入力されると、エコーキャンセラ手段12では、適応フィルタ手段13が受信信号とエコー抑圧送信信号からエコー経路の伝達特性即ち適応フィルタ係数を推定し、擬似エコーを生成する。そして、減算手段14が上記ダウンサンプリングされた送信信号から上記擬似エコーを差し引いてエコー抑圧を行う。
ここで、適応フィルタ手段13に入出力される信号のサンプリング周波数は全て8KHzであり、サンプリング周波数の違いによる性能劣化を生じることなく擬似エコー生成やエコー抑圧処理ができる。
【0037】
また、フィルタ10では、上記A/D変換器7から出力された送信信号が入力されると、その送信信号から受信信号が存在する周波数帯域の上限以上の周波数成分を抽出し、ダブルトーク検出手段11に出力する。
フィルタ10は、ここでは、ハイパスフィルタ特性を持つ例えば8次のIIR型ディジタルフィルタで構成されており、送信信号が入力されると、送信信号の3.4KHz以下の成分を抑圧し、ダブルトーク検出手段11に出力する。図2にフィルタ10の特性を示す。
【0038】
ダブルトーク検出手段11は、上記A/D変換器7から出力された送信信号、上記フィルタ10から出力された3.4KHz以下が抑圧された送信信号(以降、ハイパス送信信号と呼称)、エコー抑圧送信信号及び受信信号を入力し、送信信号にエコー信号と近端話者の音声信号が同時に含まれるダブルトークの状態かあるいは受信信号が無音かを判定して、そのダブルトーク判定結果を適応フィルタ手段13に伝達する。
【0039】
適応フィルタ手段13は、ダブルトークか受信信号が無音である場合には、適応フィルタ係数の更新を停止し、フィルタ係数の算出精度劣化を防止する。また、適応フィルタ手段13は、ダブルトークでもなく受信信号が無音でもない場合に、適応フィルタ係数の更新を行う。
【0040】
以下にダブルトーク検出手段11の動作を詳しく説明する。
ここでサンプリング周波数は、送信信号(ダウンサンプリング前)とハイパス送信信号が16KHz、受信信号とエコー抑圧送信信号が8KHzである。
【0041】
まず、ダブルトーク検出手段11は、受信信号の平均パワーX、送信信号の平均パワーS、ハイパス送信信号の平均パワーSh、エコー抑圧送信信号の平均パワーEを求める。平均パワーは例えば、一定区間毎にその区間内のサンプルの二乗和をサンプル数で平均化する方法で求める。
【0042】
次に、ダブルトーク検出手段11は、過去に求めた送信信号の平均パワーSの内の最低値、例えば、過去1秒に求めた上記一定区間毎の送信信号の平均パワーSの内の最低値を、この最低値を求めた区間の送信信号に周期性が無い場合に限り背景雑音パワーNs値として抽出する。周期性の有無は、例えば、送信信号の自己相関係数の最大値と予め設定した閾値とを比較することで判定する。自己相関係数の最大値が閾値を越えれば周期性あり、越えなければ無しと判定する。
【0043】
そして、送信信号の平均パワーSの値が背景雑音パワーNsにあらかじめ設定した定数を加えた値より多く、しかも周期性がある場合、その区間の送信信号を有音区間として検出する。
さらに、所定時間、例えば過去1秒間における有音区間の平均パワーをVsとして求め、有音区間の平均パワーVsと背景雑音パワーNsの比(Vs/Ns)をRsとして求める。
【0044】
次に、ダブルトーク検出手段11は、ダブルトーク判定を行う。例えば、以下の条件式(1)〜(4)を用いてダブルトーク判定を行う。
【0045】
X<p1 ・・・(1)
S>p2*X(但しp2<=0.5) ・・・(2)
E>p3*S ・・・(3)
Sh>p4 ・・・(4)
【0046】
ダブルトーク検出手段11は、これら条件式において、式(1)が成立した場合は、受信信号が無音であると判定する。
また、式(1)が不成立でかつ式(2)と式(4)が成立した場合は、(3)の成立不成立に関わらずダブルトークであると判定する。
さらに、式(1)と式(2)が不成立でかつ式(3)と式(4)が成立した場合は、エコー抑圧量が小さく、エコー信号以外の入力音が多いかことによるダブルトークと判定する。
【0047】
ここで、式(1)〜(4)中のp1とp3は所定の定数であり、使用環境に応じて決定されるが、例えば、p1=100、p3=0.5とする。p2とp4は先の求めたRsの値によって変化する可変値であり、Rsが大きく、例えば36を超える場合、即ち背景雑音の量が少ない場合は、p2は0.3、p4は100に設定し、36超えない場合、即ち背景雑音の量が大きい場合は、p2は0.5、p4は300に設定する。
【0048】
ハイパス送信信号の平均パワーShは送信信号の高域成分のパワーであり、これが大きい場合は近端話者の音声が入力されていると考えられる。また、送信信号の平均パワーSは送信信号の全帯域のパワーで、エコー信号と近端話者の音声の両方かどちらか一方の存在を示している。
【0049】
ダブルトーク判定手段11は、送信信号の平均パワーSを用いた式(2)や(3)が成り立っても、ハイパス送信信号の平均パワーShを用いた式(4)が成り立たなければ、ダブルトークであると判定しない。したがって、送信信号がエコー信号のみでなるシングルトークをダブルトークと誤判定することが少なくなり、精度の良いダブルトーク判定が行える。
【0050】
また、背景雑音の量が少ない場合は、ハイパス送信信号の平均パワーShに含まれる背景雑音が少なく、ハイパス送信信号の平均パワーShの値の信頼性が高いと判断してp4が小さな値に設定され、同様にp2も小さく設定されるので、ハイパス送信信号の平均パワーShの大きさによってダブルトークを正確に判定し易くなる。
【0051】
以上のように、この実施の形態によれば、送信信号に含まれる電話通話音声の周波数帯域外の周波数成分の有無を利用して行うダブルトーク判定を、A/D変換後のディジタル信号対するソフトウエア処理で実施するようにしたので、DSPだけによる小さな装置規模で受信信号の品質劣化無く精度の良いダブルトーク判定が行えるエコー処理装置を実現できる。
【0052】
また、この実施の形態によれば、マイクに入力された音響を電話通信音声の周波数帯域より高い周波数成分を保持できるサンプリング周波数でA/D変換するようにしたので、送信信号に含まれる電話通話音声の周波数帯域より高い周波数成分の有無を利用してダブルトーク判定を行うことができる。
【0053】
また、この実施の形態によれば、電話通信音声の周波数帯域より高い周波数成分を保持するサンプリング周波数でA/D変換するA/D変換器のサンプリング周波数と同じサンプリング周波数の時系列信号にアップサンプリングするアップサンプリング手段を備え、A/D変換器とD/A変換器のサンプリング周波数と高域遮断周波数を同一にするようにしたので、市販の一体型A/D、D/A変換器を適用でき、小さな装置規模で簡単にエコー処理装置が実現できる。
【0054】
また、この実施の形態によれば、エコーキャンセラ手段の前段にデジタル信号に変換された送信信号を受信信号と同一のサンプリング周波数の時系列信号にダウンサンプリングするダウンサンプリング手段を設け、適応フィルタ手段に入出力される信号を全て同一のサンプリング周波数としたので、サンプリング周波数の違いによる性能劣化を生じることなく擬似エコー生成やエコー抑圧処理を実現できる。
【0055】
また、この実施の形態によれば、送信信号から抽出された受信信号が存在する周波数帯域の上限以上の周波数成分、即ち、ハイパス送信信号の平均パワーShを用いてダブルトーク判定を行うようにしているので、受信信号は変形されずにスピーカから出力され、受信信号の品質劣化が無くダブルトーク判定を行うことができる。
【0056】
また、この実施の形態によれば、送信信号から抽出された受信信号が存在する周波数帯域の上限以上の周波数成分、即ち、ハイパス送信信号の平均パワーShを用いて、当該ハイパス送信信号の平均パワーShが大きい場合にはダブルトークであると判定しにくくし、上記ハイパス送信信号の平均パワーShが小さい場合にはダブルトークであると判定しやすくするように、ダブルトーク判定を行うようにしているので、送信信号がエコー信号のみでなるシングルトークをダブルトークと誤判定することが少なくなり、精度の良いダブルトーク判定を行うことができる。
【0057】
また、この実施の形態によれば、背景雑音成分の量に応じてダブルトーク判定を行うようにしているので、より精度の良いダブルトーク判定を行うことができる。
【0058】
実施の形態2.
図3はこの発明の実施の形態2によるエコー処理装置を示すブロック構成図であり、図1と同一または相当部分に同一符号を付して説明を省略する。
【0059】
図3において、抽出手段15は、デジタル信号に変換された送信信号から受信信号が存在する周波数帯域の上限以上の周波数成分を抽出するものであり、本実施の形態では、上記送信信号の背景雑音成分を抑圧可能なノイズサプレッサ15を用いる。このノイズサプレッサ15は、デジタル信号の送信信号の背景雑音成分を抑圧すると共に、所定の周波数成分のみを通過させるフィルタ処理を行う。また、本実施の形態において、ノイズサプレッサー15は、エコーキャンセラ手段12を迂回する位置に配置されている。
【0060】
次に動作について説明する。
図3において、基本部分1に入力された受信信号は、例えば、電話通話用の信号帯域である0.3KHz〜3.4KHzに制限されており、サンプリング周波数8KHzでサンプリングされているデジタル信号であるとする。
【0061】
図3において、図1と同一符号を付した部分は、上記実施の形態1と同様に動作する。まず、アップサンプリング手段8は、上記サンプリング周波数8KHzでサンプリングされている受信信号が入力されると、この受信信号を、例えばサンプリング周波数16KHzにアップサンプリングする。
【0062】
次に、D/A変換器2は、上記サンプリング周波数16KHzにアップサンプリングされた受信信号をサンプリング周波数16KHzでアナログ信号に変換すると、増幅器3が、上記アナログ信号に変換された受信信号を増幅し、スピーカ4が、上記増幅された受信信号に応じた音響を出力する。
【0063】
スピーカ4から外部出力された音響は、エコー経路を経てエコー信号としてマイク5に入力される。また、この時、上記マイク5の近傍で近端話者が発声した場合には、その音声もマイク5に入力される。そして上記マイク5は上記入力された外部の音響を送信信号として、上記入力した外部の音響に対応したアナログ信号を出力する。
【0064】
次に、増幅器6が、上記マイク5から出力されたアナログ信号の送信信号を増幅し、A/D変換器7が、送信信号をアナログ信号からデジタル信号に変換する。
【0065】
A/D変換器7から出力されたデジタル信号の送信信号は、本実施の形態においては、ダウンサンプリング手段9、ノイズサプレッサ15に出力される。
【0066】
ダウンサンプリング手段9が、デジタル信号の送信信号をサンプリング周波数8KHzにダウンサンプリングしてエコーキャンセラ手段12に出力すると、当該エコーキャンセラ手段12は、上記実施の形態1と同様に送信信号のエコー抑圧を行う。
ここで、本実施の形態においても、適応フィルタ手段13に入出力される信号は全て8KHzであり、サンプリング周波数の違いによる性能劣化を生じることなく擬似エコー生成やエコー抑圧処理ができる。
【0067】
また、ノイズプレッサー15は、上記A/D変換器7から出力されたデジタル信号の送信信号が入力されると、その送信信号の背景雑音成分を抑圧すると共に、所定の周波数成分のみを通過させてダブルトーク検出手段11に出力する。即ち、送信信号の背景雑音成分を抑圧すると共に、送信信号から受信信号が存在する周波数帯域の上限以上の周波数成分を抽出し、上記背景雑音成分が抑圧された送信信号と、背景雑音成分が抑圧され受信信号が存在する周波数帯域の上限以上の周波数成分が抽出された送信信号とをダブルトーク検出手段11に出力する。
【0068】
ノイズプレッサー15は、まず、例えば、文献(Steven F.Boll, ”Suppression of Acoustic noise in speech using spectral subtraction”, IEEE Trans. ASSP. Vol. ASSP−27, No.2, April 1979)に開示されているスペクトルサブトラクション法に基づいた背景雑音抑圧処理を行う。具体的には、送信信号をフーリエ変換によって周波数軸に一旦変換し、周波数軸上で送信信号に含まれる背景雑音成分を抑圧する。続いて、ノイズプレッサー15は、背景雑音成分を抑圧した送信信号に対して周波数軸上で3.4KHz以下の周波数成分を抑圧し、逆フーリエ変換で時間軸に変換してダブルトーク検出手段11に出力する。
このようにして、ノイズサプレッサー15にて背景雑音成分が抑圧処理されると共に、遮断周波数3.4KHzのハイパスフィルタ処理と同等の処理が送信信号に為されることになる。
【0069】
ダブルトーク検出手段11は、上記ノイズサプレッサ15から出力された背景雑音成分が抑圧されたデジタル信号の送信信号、上記ノイズサプレッサ15から出力された背景雑音成分が抑圧され3.4KHz以下の周波数成分が抑圧された送信信号(以降、ハイパス送信信号と呼称)、エコー抑圧送信信号及び受信信号を入力し、送信信号にエコー信号と近端話者の音声信号が同時に含まれるダブルトークの状態かあるいは受信信号が無音かを判定して、そのダブルトーク判定結果を適応フィルタ手段13に伝達する。
【0070】
ここで、ダブルトーク検出手段11に入力される送信信号に含まれる背景雑音成分の量はノイズサプレッサー15によって減少されているので、算出されるRs(有音区間の平均パワーVsと背景雑音パワーNsの比(Vs/Ns))の値が大きくなり、Rsが36を超える場合が増える。
このため式(2)、式(3)の成立不成立に係わらず式(1)が不成立で式(4)が成立した場合にはダブルトークと判定される場合が増え、送信信号の平均パワーSやエコー抑圧送信信号の平均パワーEの値が小さくてもダブルトークを正確に検知できる場合が増える。
【0071】
上記ダブルトーク検出手段11のダブルトーク判定結果が適応フィルタ13に入力されると、当該ダブルトーク判定結果に基づいて、適応フィルタ手段13は、ダブルトークか受信信号が無音である場合には、適応フィルタ係数の更新を停止し、フィルタ係数の算出精度劣化を防止する。また、適応フィルタ手段13は、ダブルトークでもなく受信信号が無音でもない場合に、適応フィルタ係数の更新を行う。
【0072】
またここで、ノイズサプレッサー15はエコーキャンセラ手段12を迂回する位置に配置され、ノイズサプレッサー15で背景雑音を抑圧されて変形を受けた送信信号はダブルトーク検出手段11にのみ入力されるようにしているので、ノイズサプレッサー15の導入により適応フィルタ手段13で生成する擬似エコー信号が劣化することはない。
【0073】
以上のように、この実施の形態によれば、ノイズサプレッサを用いて、送信信号に含まれる背景雑音成分を抑圧するようにしたので、上記実施の形態1の効果に加え、送信信号に背景雑音が含まれる場合でも精度良くダブルトーク判定を行うことができる。
【0074】
また、この実施の形態によれば、ノイズサプレッサを用いて、送信信号に含まれる背景雑音成分を抑圧すると共に、同時にハイパスフィルタと同等の処理をするようにしたので、ハイパスフィルタを別に設ける必要が無く、処理量も少なくすることができる。
【0075】
また、この実施の形態によれば、ノイズサプレッサーをエコーキャンセラ手段を迂回する位置に配置し、ノイズサプレッサーで背景雑音を抑圧されて変形を受けた送信信号の出力がダブルトーク検出手段にのみ入力されるようにしているので、ノイズサプレッサーの導入によるエコーキャンセラ手段の性能劣化を生じることなく擬似エコー生成やエコー抑圧処理を実現できる。
【0076】
実施の形態3.
上記実施の形態1及び実施の形態2において、A/D変換器とD/A変換器のサンプリング周波数と高域遮断周波数を同一にする場合について説明したが、例えば、一体型A/D、D/A変換器を適用しない場合は、A/D変換器とD/A変換器のサンプリング周波数と高域遮断周波数を異なるものにしても良い。例えば、上記実施の形態1または実施の形態2において、アップサンプリング手段を削除し、サンプリング周波数8kHz、高域遮断周波数3.4kHzのD/A変換器を用いるようにしても良い。
【0077】
【発明の効果】
以上のように、本発明のエコー処理装置によれば、デジタル信号に変換された送信信号から受信信号が存在する周波数帯域の上限以上の周波数成分を抽出する抽出手段と、上記抽出手段で抽出された周波数成分を用いてダブルトーク判定を行うダブルトーク検出手段と、上記ダブルトーク検出手段のダブルトーク判定結果を用いて、送信信号の音響エコー成分を抑圧するエコーキャンセラ手段とを備えるようにしたので、小さな装置規模で受信信号の品質劣化無く精度の良いダブルトーク判定が行えるエコー処理装置を実現できる効果がある。
【0078】
また、本発明の音声処理装置によれば、受信信号をデジタル信号からアナログ信号に変換するD/A変換器と、上記D/A変換器でアナログ信号に変換された受信信号に応じた音響を出力するスピーカと、外部の音響を入力し、送信信号として上記入力した外部の音響に対応したアナログ信号を出力するマイクと、上記マイクから出力された送信信号をアナログ信号からデジタル信号に変換するA/D変換器と、上記A/D変換器でデジタル信号に変換された送信信号から受信信号が存在する周波数帯域の上限以上の周波数成分を抽出する抽出手段と、上記抽出手段で抽出された周波数成分を用いてダブルトーク判定を行うダブルトーク検出手段と、上記ダブルトーク検出手段のダブルトーク判定結果を用いて、送信信号の音響エコー成分を抑圧するエコーキャンセラ手段とを備えるようにしたので、小さな装置規模で受信信号の品質劣化無く精度の良いダブルトーク判定が行える音声処理装置を実現できる効果がある。
【図面の簡単な説明】
【図1】この発明の実施の形態1によるエコー処理装置を示すブロック構成図である。
【図2】この発明の実施の形態1によるフィルタの動作を示す説明図である。
【図3】この発明の実施の形態2によるエコー処理装置を示すブロック構成図である。
【図4】従来のエコー処理装置を示すブロック構成図である。
【図5】従来のエコー処理装置を示すブロック構成図である。
【符号の説明】
1 エコー処理装置の基本部分、2 D/A変換器、3,6 増幅器、4 スピーカ、5 マイク、7 A/D変換器、8 アップサンプリング手段、9 ダウンサンプリング手段、10 フィルタ(抽出手段)、11 ダブルトーク検出手段、12 エコーキャンセラ手段、13 適応フィルタ手段、14 減算手段、15 ノイズサプレッサ(抽出手段)、16 禁止ゲート、17 ハイパスフィルタ、18 ローパスフィルタ、19,20 レベル検出器、21 OR回路、22,23 フィルタ。

Claims (7)

  1. 受信信号のサンプリング周波数より高いサンプリング周波数でデジタル信号に変換された送信信号から、受信信号が存在する周波数帯域の上限以上の周波数成分を抽出する抽出手段と、
    上記抽出手段で抽出された周波数成分を用いてダブルトーク判定を行うダブルトーク検出手段と、
    上記ダブルトーク検出手段のダブルトーク判定結果に従ってフィルタ係数更新の停止および開始を行いながら、送信信号の音響エコー成分を抑圧するエコーキャンセラ手段と
    を備えたことを特徴とするエコー処理装置。
  2. 上記ダブルトーク検出手段は、上記送信信号に含まれる背景雑音成分の量に応じてダブルトーク判定を行うことを特徴とする請求項1に記載のエコー処理装置。
  3. 上記抽出手段は、上記送信信号の背景雑音成分を抑圧可能に構成され、
    上記ダブルトーク検出手段は、上記抽出手段で背景雑音成分を抑圧された送信信号と、上記抽出手段で背景雑音成分を抑圧された送信信号から抽出された受信信号が存在する周波数帯域の上限以上の周波数成分とを用いて、ダブルトーク判定を行うように構成された
    ことを特徴とする請求項1又は請求項2に記載のエコー処理装置。
  4. 上記デジタル信号に変換された送信信号を上記受信信号と同一のサンプリング周波数の時系列信号にダウンサンプリングするダウンサンプリング手段を備え、
    上記エコーキャンセラ手段は、上記ダウンサンプリング手段でダウンサンプリングされた送信信号の音響エコー成分を抑圧するように構成された
    ことを特徴とする請求項1ないし請求項3のいずれかに記載のエコー処理装置。
  5. 上記受信信号を上記デジタル信号に変換された送信信号と同一のサンプリング周波数の時系列にアップサンプリングするアップサンプリング手段を備えたことを特徴とする請求項1ないし請求項4のいずれかに記載のエコー処理装置。
  6. 受信信号をデジタル信号からアナログ信号に変換するD/A変換器と、
    上記D/A変換器でアナログ信号に変換された受信信号に応じた音響を出力するスピーカと、
    外部の音響を入力し、送信信号として上記入力した外部の音響に対応したアナログ信号を出力するマイクと、
    上記マイクから出力された送信信号を受信信号のサンプリング周波数より高いサンプリング周波数でアナログ信号からデジタル信号に変換するA/D変換器と、
    上記A/D変換器でデジタル信号に変換された送信信号から受信信号が存在する周波数帯域の上限以上の周波数成分を抽出する抽出手段と、
    上記抽出手段で抽出された周波数成分を用いてダブルトーク判定を行うダブルトーク検出手段と、
    上記ダブルトーク検出手段のダブルトーク判定結果に従ってフィルタ係数更新の停止および開始を行いながら、送信信号の音響エコー成分を抑圧するエコーキャンセラ手段と
    を備えたことを特徴とする音声処理装置。
  7. 上記受信信号を上記A/D変換器のサンプリング周波数と同一のサンプリング周波数の時系列信号にアップサンプリングするアップサンプリング手段を備え、
    上記D/A変換器は、上記アップサンプリング手段でアップサンプリングされた受信信号のサンプリング周波数と同一のサンプリング周波数で上記受信信号をデジタル信号からアナログ信号に変換するように構成された
    ことを特徴とする請求項6に記載の音声処理装置。
JP2003014502A 2003-01-23 2003-01-23 エコー処理装置及び音声処理装置 Abandoned JP2004228939A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003014502A JP2004228939A (ja) 2003-01-23 2003-01-23 エコー処理装置及び音声処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003014502A JP2004228939A (ja) 2003-01-23 2003-01-23 エコー処理装置及び音声処理装置

Publications (1)

Publication Number Publication Date
JP2004228939A true JP2004228939A (ja) 2004-08-12

Family

ID=32902533

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003014502A Abandoned JP2004228939A (ja) 2003-01-23 2003-01-23 エコー処理装置及び音声処理装置

Country Status (1)

Country Link
JP (1) JP2004228939A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015170867A (ja) * 2014-03-04 2015-09-28 沖電気工業株式会社 トーク状態検出器、トーク状態検出方法、エコーキャンセラ及びエコーサプレッサ
WO2019044664A1 (ja) * 2017-08-28 2019-03-07 株式会社ソニー・インタラクティブエンタテインメント 音声信号処理装置
CN113746500A (zh) * 2020-05-28 2021-12-03 瑞昱半导体股份有限公司 回音抵消系统以及回音抵消方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015170867A (ja) * 2014-03-04 2015-09-28 沖電気工業株式会社 トーク状態検出器、トーク状態検出方法、エコーキャンセラ及びエコーサプレッサ
WO2019044664A1 (ja) * 2017-08-28 2019-03-07 株式会社ソニー・インタラクティブエンタテインメント 音声信号処理装置
US11600288B2 (en) 2017-08-28 2023-03-07 Sony Interactive Entertainment Inc. Sound signal processing device
CN113746500A (zh) * 2020-05-28 2021-12-03 瑞昱半导体股份有限公司 回音抵消系统以及回音抵消方法
CN113746500B (zh) * 2020-05-28 2023-08-22 瑞昱半导体股份有限公司 回音抵消系统以及回音抵消方法

Similar Documents

Publication Publication Date Title
JP5450567B2 (ja) クリアな信号の取得のための方法及びシステム
US6792107B2 (en) Double-talk detector suitable for a telephone-enabled PC
JP5036874B2 (ja) エコー消去装置
US5732134A (en) Doubletalk detection by means of spectral content
US9172817B2 (en) Communication system
JP4282260B2 (ja) エコーキャンセラ
JPWO2002095975A1 (ja) エコー処理装置
JP4377952B1 (ja) 適応フィルタ及びこれを有するエコーキャンセラ
WO2005125168A1 (en) Echo canceling apparatus, telephone set using the same, and echo canceling method
EP0666655B1 (fr) Procédé et dispositif d'analyse d'un signal de retour et annuleur d'écho adaptatif en comportant application
KR20080072056A (ko) 핸즈-프리 통신 시스템에서 더블 토크 검출을 위한 방법 및장치
WO2001054296A1 (fr) Dispositif de communication de sons et processeur d'echo
US8369511B2 (en) Robust method of echo suppressor
JP4345208B2 (ja) 反響及び雑音除去装置
EP1940042B1 (en) Echo processing method and device
JP2004228939A (ja) エコー処理装置及び音声処理装置
KR20010072327A (ko) 에코 제거 시스템에서 마이크로폰의 과부하 영향을경감하기 위한 방법들 및 장치
KR100324736B1 (ko) 음향반향제거방법및회로
CN111968663A (zh) 一种回声残留判断方法
JP4903843B2 (ja) 適応フィルタ及びこれを有するエコーキャンセラ
JP4964267B2 (ja) 適応フィルタ及びこれを有するエコーキャンセラ
Ezzaidi et al. A new algorithm for double talk detection and separation in the context of digital mobile radio telephone
WO2022202012A1 (ja) エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム
JP2980141B2 (ja) センタクリッパ回路
JP4903842B2 (ja) 適応フィルタ及びこれを有するエコーキャンセラ

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20040709

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051222

A977 Report on retrieval

Effective date: 20080212

Free format text: JAPANESE INTERMEDIATE CODE: A971007

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080219

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080414

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090120

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20090212