JP4559914B2

JP4559914B2 - 音響結合量推定方法、その装置、そのプログラム及びその記録媒体

Info

Publication number: JP4559914B2
Application number: JP2005151144A
Authority: JP
Inventors: 和則小林; 陽一羽田; 賢一古家; 章俊片岡
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2005-05-24
Filing date: 2005-05-24
Publication date: 2010-10-13
Anticipated expiration: 2025-05-24
Also published as: JP2006332872A

Description

本発明は、音響結合量を推定する技術に関する。

近年、テレビ会議システムや音声会議システム等のハンズフリー通信システムの導入が様々な分野で進められている。このようなハンズフリー通信システムは、従来の電話通話装置の様に送受話器を手に持つことなく、自然な対面通話を実現することができるという利点を有する。
しかし、このようなハンズフリー通信システムを良好に作動させるためには、反響の問題を解決しなければならない。すなわち、このようなシステムの場合、送話者側の端末装置に設置されたマイクロホンから入力された音声の情報は、増幅器、通信路等を通じて受話者側の端末装置に送られ、そこに設置されたスピーカから音声として出力される。この出力された音声の一部は、さらに受話者側の端末装置に設置されたマイクロホンにより受音され、受話信号として、増幅器、通信路等を通じて送話者側の端末装置に送信され、送話者側のスピーカから音声として出力される。ここで、この送話者側のスピーカから出力される音声は、送話者自身が発話した音声である。このように自分の発声した音声が自身のスピーカから再生される反響現象を音響エコーと呼ぶ。この音響エコーは、ハンズフリー通信システムにおいて通話の障害、不快感その他の悪影響を生じさせる。特に、この送話者側のスピーカから再生された発声が、更に送話者側のマイクロホンにより受音された場合、信号の閉ループが形成される。そして、このループゲインが１より大きい場合にはハウリング現象が発生して通話は不能となる。

このような音響エコーに起因する問題を解消するため、近年、音声スイッチ、反響消去装置その他の反響エコーによる悪影響を緩和する装置が利用されている（例えば、特許文献１参照）。この様な音声スイッチ或いは反響消去装置においては、ループゲインを１以下にしてハウリングを防止するための音声スイッチの減衰量の適切な設定や、送受話の状態の判別が大変に重要である。そして、このような減衰量設定や送受話状態判定には音響結合量が用いられる。
以下、従来の音響結合量推定方法について説明する。

図２２は、従来の音響結合量推定装置２００の構成を示す構成図である。従来の音響結合量推定装置２００は、受話レベル計算部２０１と、受話検出部２０２と、送話レベル計算部２０３と、音響結合量計算部２０４と、時間平滑部２０５とにより構成される。
受話レベル計算部２０１は、受話信号（スピーカ出力信号）ｘ（ｔ）を時間平均し、受話レベルＲ（ｔ）を求める。この計算は、たとえば、以下の式（１）を用いて行われる。
R(t)=a・R(t‐1)+(1‐a)・|x(t)| …(1)
ただし、ａは予め設定された０＜ａ＜１の平滑化係数である。ａが１に近いほど、より緩やかなレベル変化となる。

受話検出部２０２は、予め設定された固定閾値ＴＲと受話レベルＲ（ｔ）を比較し、受話レベルＲ（ｔ）が固定閾値ＴＲよりも大きい場合（Ｒ（ｔ）＞ＴＲ）に受話があったと判定する。送話レベル計算部２０３は、受話レベル計算部２０１と同様にして、送話信号（マイクロホン受話信号）ｙ（ｔ）の送話レベルｓ（ｔ）を求める。そして、音響結合量計算部２０４は、受話検出部２０２において受話があったと判定された場合にのみ、受話レベルＲ（ｔ）と送話レベルＳ（ｔ）の比から、推定音響結合量の瞬時値ＡＣ’（ｔ）を求める。これを式で表せば、式（２）となる。

AC'(t)=S(t)/R(t) …(2)
時間平滑部２０５は、推定音響結合量の瞬時値ＡＣ’（ｔ）を時間平滑化して、より正確な推定音響結合量ＡＣ（ｔ）を求める。ただし、ダブルトーク時においては送話信号に送話音声が混合しているので、推定音響結合量の瞬時値ＡＣ’（ｔ）は、真の値よりも大きな値となってしまう。この影響を少なくするため、この場合にはディップホールドを用いた時間平滑化が行われる。このディップホールドを用いた平滑化は、例えば式（３ａ）（３ｂ）により実現される。

AC(t)=b・AC(t・1)+(1‐b)・AC'(t) for AC(t‐1)>AC'(t) …(3a)
AC(t)=c・AC(t‐1)+(1‐c)・AC'(t) for AC(t‐1)<AC'(t) …(3b)
ただし、ｂは推定音響結合量増加時の平滑化係数であり、ｃは推定音響結合量減少時の平滑化係数であり、それぞれ０＜ｂ，０＜ｃ＜１の値をあらかじめ設定する。ｂ＞＞ｃとなるように設定すれば、推定音響結合量増加時に非常に緩やかな値の上昇となり、ディップホールドの効果が得られる。
以上のように従来技術では音響結合量の推定が行われる。
特開平０７−２２６９９４号公報

しかし、上述した従来の音響結合量推定方法では、受話があったか否かの判断に使用する固定閾値ＴＲの適切な設定が困難である。すなわち、この固定閾値ＴＲを低く設定しすぎた場合、送話信号のエコー成分対雑音成分比が悪い状態で音響結合量を推定することとなり、推定精度が悪くなってしまう。一方、固定閾値ＴＲを高く設定しすぎた場合には、受話検出部２０２において受話があったと判定される回数が減少し、推定音響結合量の瞬時値ＡＣ’（ｔ）の単位時間当たりの算出回数も減少する。これは推定音響結合量の推定速度の低下につながる。また、受話信号のレベルや、送話信号に含まれるノイズレベルなどは、環境や通話相手によって大きく変化するため、固定的な１つの固定閾値ＴＲで、効果的な受話検出を行うことは難しい。そのため、上述した従来の音響結合量推定方法では、音響結合量を精度よく高速に推定を行うことが困難である。

本発明はこのような点に鑑みてなされたものであり、音響結合量を精度よく効率的に推定することが可能な技術的思想を提供することを目的とする。

本発明では上記課題を解決するために、第１の本発明では、受話レベル計算手段に受話信号が入力され、当該受話レベル計算手段において、当該受話信号のパワーレベル（以下「受話レベル」という。）を算出して出力する。また、受話検出手段において、受話レベルと予め設定された固定閾値とを比較し、当該固定閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力する。そして、ピーク区間検出手段において、受話レベルがピーク区間のものであるか否かを判定し、その判定結果を出力する。ここで「ピーク区間」とは、受話レベルがピーク値をとる時間を含むある幅をもった時間区間を意味する。また、送話レベル計算手段に送話信号が入力され、当該送話レベル計算手段において、当該送話信号のパワーレベル（以下「送話レベル」という。）を算出して出力する。そして、少なくとも受話検出手段から受話があった旨の情報が出力され、ピーク区間検出手段から受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、音響結合量計算手段において、受話レベルと送話レベルとの比から音響結合量の瞬時値を算出して出力する。その後、時間平滑手段において、音響結合量の瞬時値から音響結合量を算出して出力する。

ここで、本発明では、少なくとも受話検出手段から受話があった旨の情報が出力され、ピーク区間検出手段から受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、音響結合量の瞬時値を算出する。すなわち、本発明では、受話レベルが、固定閾値よりも大きく、ピーク区間に属する場合にのみ音響結合量の瞬時値が算出される。一般に送話信号のノイズレベルは、ほぼ一定の値をとる。よって、受話レベルがピーク区間にある場合、通常、その受話信号がスピーカから再生され、マイクロホンによって受音された送話信号のエコー成分対雑音成分比はよい。また、ピーク区間にある受話レベルであってもそのピーク自体が小さな場合は送話信号のエコー成分対雑音成分比が悪化する状況も想定されるが、このような状況は受話レベルが固定閾値を下回る場合を対象としないことで排除できる。また、本発明では、受話信号が必ず持つピークという受話レベル自身の時間変動に基づき、音響結合量の瞬時値を算出するか否かを判断するので、受話信号が入力されたときには必ず音響結合量の算出が行われ、高速な推定が実現される。以上述べたように、本発明では、固定的な閾値のみを用いる場合に比べ、エコー成分対雑音成分比が高い送話信号を効率的に選択し、音響結合量を精度よく高速に算出することができる。

また、第２の本発明では、受話レベル計算手段に受話信号が入力され、当該受話レベル計算手段において、当該受話信号の受話レベルを算出して出力し、受話ノイズレベル推定手段において、受話レベルから受話信号の受話ノイズレベルを算出して出力し、受話検出手段において、受話ノイズレベルの定数倍の閾値及び予め設定された固定閾値と、受話レベルとを比較し、これら両方の閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力する。そして、ピーク区間検出手段において、受話レベルがピーク区間のものであるか否かを判定し、その判定結果を出力し、送話レベル計算手段に送話信号が入力され、当該送話レベル計算手段において、当該送話信号のパワーレベル（以下「送話レベル」という。）を算出して出力する。また、送話ノイズレベル推定手段において、送話レベルから送話信号のノイズレベルの推定値（以下「送話ノイズレベル」という。）を算出して出力する。そして、少なくとも受話検出手段から受話があった旨の情報が出力され、ピーク区間検出手段から受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、音響結合量計算手段において、受話レベルから受話ノイズレベルを減じた値と送話レベルから送話ノイズレベルを減じた値との比から音響結合量の瞬時値を算出して出力する。その後、時間平滑手段において、音響結合量の瞬時値から音響結合量を算出して出力する。

ここで、第２の本発明では、さらに受話ノイズレベル及び送話ノイズレベルを推定し、これらをも考慮して音響結合量の瞬時値を算出するか否かを決定する。その結果、エコー成分対雑音成分比が高い送話信号のみを、より正確かつ効率的に選択して音響結合量の瞬時値の算出に用いることができる。
また、第３の本発明では、受話レベル計算手段に受話信号が入力され、当該受話レベル計算手段において、当該受話信号の受話レベルを算出して出力する。また、受話検出手段において、受話レベルと予め設定された固定閾値とを比較し、当該固定閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力する。さらに、ピーク区間検出手段において、受話レベルがピーク区間のものであるか否かを判定し、その判定結果を出力する。また、送話レベル計算手段に送話信号が入力され、当該送話レベル計算手段において、当該送話信号の送話レベルを算出して出力する。そして、少なくとも受話検出手段から受話があった旨の情報が出力され、ピーク区間検出手段から受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、音響結合量更新手段において、音響結合量記憶手段に格納されている最新の音響結合量に受話レベルを乗じた推定エコーレベルと送話レベルとを比較し、当該推定エコーレベルよりも送話レベルのほうが大きい場合に、当該最新の音響結合量よりも大きな値を新たな音響結合量として音響結合量記憶手段のデータを更新し、当該推定エコーレベルよりも送話レベルのほうが小さい場合に、当該最新の音響結合量よりも小さな値を新たな音響結合量として音響結合量記憶手段のデータを更新する。

ここで、第３の本発明では、音響結合量記憶手段に格納されている最新の音響結合量に受話レベルを乗じた推定エコーレベルと送話レベルとを比較することにより、音響結合量記憶手段に格納されている音響結合量の妥当性を判断し、その判断結果に伴い音響結合量記憶手段に格納されている音響結合量を更新することとした。この場合、音響結合量の算出に割り算が不要になる。その結果、割り算器を持たないプロセッサに対しても、少ない演算量で本発明の各手順を実装することが可能となる。
また、第４の本発明では、受話レベル計算手段に受話信号が入力され、当該受話レベル計算手段において、当該受話信号の受話レベルを算出して出力する。また、受話ノイズレベル推定手段において、受話レベルから受話信号の受話ノイズレベルを算出して出力する。さらに、受話検出手段において、受話ノイズレベルの定数倍の閾値及び予め設定された固定閾値と、受話レベルとを比較し、これら両方の閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力する。また、ピーク区間検出手段において、受話レベルがピーク区間のものであるか否かを判定し、その判定結果を出力する。さらに、送話レベル計算手段に送話信号が入力され、当該送話レベル計算手段において、当該送話信号の送話レベルを算出して出力する。また、送話ノイズレベル推定手段において、送話レベルから送話信号の送話ノイズレベルを算出して出力する。そして、少なくとも受話検出手段から受話があった旨の情報が出力され、ピーク区間検出手段から受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、音響結合量更新手段において、受話レベルから受話ノイズレベルを減じた値に音響結合量記憶手段に格納されている最新の音響結合量を乗じた推定エコーレベルと、送話レベルから前記送話ノイズレベルを減じた値とを比較し、当該推定エコーレベルよりも送話レベルから前記送話ノイズレベルを減じた値のほうが大きい場合に、当該最新の音響結合量よりも大きな値を新たな音響結合量として音響結合量記憶手段のデータを更新し、当該推定エコーレベルよりも送話レベルから前記送話ノイズレベルを減じた値のほうが小さい場合に、当該最新の音響結合量よりも小さな値を新たな音響結合量として音響結合量記憶手段のデータを更新する。

また、第１から第４の何れかの本発明において好ましくは、さらに、受話周波数領域変換手段において、時間領域の受話信号を時間周波数領域の受話信号に変換して出力し、送話周波数領域変換手段において、時間領域の送話信号を時間周波数領域の送話信号に変換して出力する。ここで、前述の受話レベル計算手段に入力される受話信号が、受話周波数領域変換手段から出力された時間周波数領域の受話信号であり、送話レベル計算手段に入力される送話信号が、送話周波数領域変換手段から出力された時間周波数領域の送話信号である。そして、第１から第４の何れかの本発明の各処理を周波数毎に実行する。

これにより、エコー成分対雑音成分比が高い送話信号を周波数ごとに選択し、周波数ごとに最適な音響結合量を算出することが可能になる。その結果、より正確かつ効率的に音響結合量を算出することが可能となる。
また、本発明において、好ましくは、送話検出手段において、少なくとも送話レベルが、最新の音響結合量と受話レベルとを用いて算出された推定エコーレベルの定数（１より大きな定数）倍を超えたことを条件に、送話が行われている旨の情報を出力し、送話検出手段から送話が行われている旨の情報が出力された場合、音響結合量計算手段は、推定エコーレベルの定数倍を超えた送話レベルに対応する新たな音響結合量の瞬時値の算出を行わない。

ここで、ダブルトークによって送話が行われていた場合、送話信号にはスピーカから出力された受話のみではなく、この送話も送話信号に含まれてしまう。このような場合、音響結合量を正確に算出することが困難となる。そのため、送話検出手段から送話が行われている旨の情報が出力された場合、音響結合量計算手段が、推定エコーレベルの定数倍を超えた送話レベルに対応する新たな音響結合量の瞬時値の算出を行わないこととすることにより、このような不正確な音響結合量が算出されることを防止できる。
また、本発明において、好ましくは、送話検出手段において、少なくとも送話レベルが、推定エコーレベルの定数（１より大きな定数）倍を超えたことを条件に、送話が行われている旨の情報を出力し、送話検出手段から送話が行われている旨の情報が出力された場合、音響結合量更新手段は、音響結合量記憶手段に格納されているデータの更新を行わないか、更新前の音響結合量と新たな音響結合量との差を小さくして音響結合量記憶手段に格納されているデータの更新を行う。

これにより、送話信号に送話が混合することによる音響結合量の推定誤差を低減させることができる。

以上のように、本発明では、エコー成分対雑音成分比が高い送話信号を効率的に選択し、音響結合量を算出することができるため、音響結合量を精度よく高速に推定することが可能となる。

以下、本発明の実施の形態を図面を参照して説明する。
〔第１の実施の形態〕
まず、本発明における第１の実施の形態について説明する。

＜構成＞
図１は、第１の実施の形態における音響結合量推定装置１０の構成を例示したブロック図である。なお、図１における矢印は情報の流れを示しているが、制御部１８に入出力される情報の流れは省略してある。
この図に例示するように、本形態の音響結合量推定装置１０は、受話レベル計算部１１と、受話検出部１２と、ピーク区間検出部１３と、音響結合量計算部１４と、時間平滑部１５と、送話レベル計算部１６と、メモリ１７と、制御部１８とを有している。そして、音響結合量推定装置１０は、制御部１８の制御のもと、増幅器２及びスピーカ１を通じて出力される受話信号ｘ（ｔ）と、マイクロホン３から入力され増幅器４で増幅された送話信号ｙ（ｔ）とを用い、音響結合量の推定を行う。
ここで、受話レベル計算部１１、受話検出部１２、ピーク区間検出部１３、音響結合量計算部１４、時間平滑部１５、送話レベル計算部１６及び制御部１８は、例えば公知のＣＰＵ（Central Processing Unit）やＭＰＵ（Micro Processing Unit）に所定のプログラムが読み込まれ、これが実行されることによって構成されるものである。また、メモリ１７としては、例えば、ＥＥＰ−ＲＯＭ（Electronically Erasable and Programmable-Read Only Memory）、ＲＡＭ（Random Access Memory）等の書き換え可能な半導体メモリを例示できるが、その他磁気記録装置、光ディスク装置或いは光磁気記録装置等を用いることとしてもよい。また、メモリ１７は物理的に一体のものに限らず、複数の記録媒体によって構成されていてもよい。

＜処理＞
本形態では、固定的な閾値を用いて行う受話検出部１２による判定処理に加え、受話信号がピーク区間のものであるか否かを検出するピーク区間検出部１３による判定処理を併用する。これにより、受話レベルの高い区間のみを検出し、送話信号におけるエコー成分対雑音成分比が大きくなる区間でのみ、音響結合量の推定を行う。その結果、送話信号のノイズが大きい場合でも、精度の高い音響結合量の推定が可能となる。さらに、ピーク区間は、受話信号があればその受話レベルの大小に関わらず必ず検出されるものである。そのため、受話信号の受話レベルの大小に関わらず同一の判定基準を適用でき、精度の高い音響結合量の推定を、十分な推定速度で実現することができる。

以下に、本形態の処理の詳細を述べる。
図２は、本形態の音響結合量推定処理を説明するためのフローチャートである。以下、この図に沿って、本形態の音響結合量推定処理の詳細を説明していく。
まず、図２に示す処理の前提として、メモリ１７のデータをクリアし、さらに領域１７ａ，１７ｄ，１７ｉ，１７ｋに所定の初期値（例えば、各領域に格納される値の平均的な値）を格納する。その後、以下の処理を実行する。
まず、受話レベル計算部１１に受話信号ｘ（ｔ）（ｔは離散時間）が入力され、受話レベル計算部１１は、受話信号ｘ（ｔ）の受話レベルＲ（ｔ）を算出して出力する（ステップＳ１）。ここで、受話レベルＲ（ｔ）の算出は、例えば以下のように行われる。

［受話レベルＲ（ｔ）の算出例１］
受話レベル計算部１１において、メモリ１７の領域１７ａから受話レベルＲ（ｔ‐１）（存在しない場合には所定の初期値）を読み込み、式（４）の演算を行う。
R(t)=a・R(t‐1)+(1‐a)・|x(t)| …(4)
ただし、ａは予め設定された平滑化係数であり、０＜ａ＜１の範囲をとる。ここで、ａが１に近いほど、時間変化に伴う受話レベルＲ（ｔ）の変化が緩やかになる。
［受話レベルＲ（ｔ）の算出例２］
また、スピーカ、マイクロホン間の応答の残響時間を模擬するため、受話レベル上昇時の平滑化係数を小さくし、下降時の平滑化係数を大きくする方法を用いてもよい。すなわち、受話レベル計算部１１において、メモリ１７の領域１７ａから受話レベルＲ（ｔ‐１）を読み込み、式（５ａ）（５ｂ）の演算を行うこととしてもよい。

R(t)=d・R(t‐1)+(1‐d)・|x(t)| for R(t‐1)>|x(t)| …(5a)
R(t)=e・R(t‐1)+(1‐c)・|x(t)| for R(t‐1)<|x(t)| …(5b)
ただし、ｄはレベル増加時の平滑化係数であり、ｅはレベル減少時の平滑化係数であり、それぞれ予め設定された０＜ｅ，ｄ＜１の範囲の値である。ここで、ｄ＜ｅとなるように設定すれば、受話レベルの減少が上昇に比べ緩やかとなり、残響を含んだレベルを模擬的に求めることができる（受話レベルＲ（ｔ）の算出例の説明終わり）。
以上のように受話レベル計算部１１において算出されて出力された受話レベルＲ（ｔ）は、メモリ１７の領域１７ｂに格納される。次に、受話検出部１２において、メモリ１７の領域１７ｂから受話レベルＲ（ｔ）を読み込み、この受話レベルＲ（ｔ）と予め設定された固定閾値ＴＲとを比較する（ステップＳ２）。

ここで、Ｒ（ｔ）＞ＴＲであると判断された場合、受話検出部１２は、受話があったと判定し、その旨の情報（受話検出情報）を出力し、これをメモリ１７の領域１７ｃに格納する。一方、Ｒ（ｔ）＞ＴＲでないと判断された場合、受話検出部１２は、受話検出情報のメモリ１７の領域１７ｃへの格納を行わない。そして、制御部１８は、メモリ１７の領域１７ｃを参照し、そこに受話検出情報が格納されていない場合には、メモリ１７の領域１７ｉに格納されている音響結合量ＡＣ（ｔ‐１）（ＡＣ（ｔ‐１）がまだ算出されていない場合には、所定の初期値）を離散時間ｔにおける新たな音響結合量ＡＣ（ｔ）としてメモリ１７の領域１７ｊに格納し（ステップＳ７）、ステップＳ８（後述）以降の処理を実行させる。一方、メモリ１７の領域１７ｃに受話検出情報が格納されている場合には、制御部１８は、以下のステップＳ３以降の処理を実行させる。

ステップＳ３では、ピーク区間検出部１３において、受話レベルＲ（ｔ）がピーク区間のものであるか否かを判定し、その判定結果を出力する。ここで「ピーク区間」とは、受話レベルＲ（ｔ）がピーク値をとる時間を含むある幅をもった時間区間を意味するが、ステップＳ３での判定は、例えば以下のように行う。
この例では、以下の式（６ａ）〜（６ｃ）で示される閾値ＴＨ（ｔ）を設定する。
TH(t)=TR for g・R(t)≦TR …(6a)
TH(t)=g・R(t) for g・R(t)>TR and R(t)>R(t‐1) …(6b)
TH(t)=f・TH(t‐1)+(1‐f)・g・R(t) for g・R(t)>TR and R(t)≦R(t‐1) …(6c)
ここで、ｇは予め設定された０＜ｇ＜１の定数である。また、ｆは予め設定された閾値下降時の平滑化係数であり０＜ｆ＜１の範囲をとる。そして、受話レベルＲ（ｔ）がこの閾値Ｈ（ｔ）を超えるという条件ＴＨ（ｔ）＜Ｒ（ｔ）と、受話レベルＲ（ｔ）が下降するという条件Ｒ（ｔ）≦Ｒ（ｔ‐１）の両方を満たしたときに、受話レベルＲ（ｔ）がピーク区間のものであると判定する。

具体的には、例えば、まずピーク区間検出部１３において、メモリ１７の領域１７ａ，１７ｂ，１７ｄから、受話レベルＲ（ｔ），Ｒ（ｔ−１）及び閾値ＴＨ（ｔ−１）（存在しない場合には所定の初期値）を読み出し、式（６ａ）〜（６ｃ）で示される閾値ＴＨ（ｔ）を算出してメモリ１７の領域１７ｅに格納する。そして、次にピーク区間検出部１３は、メモリ１７の領域１７ａ，１７ｂ，１７ｅから、受話レベルＲ（ｔ），Ｒ（ｔ−１）及び閾値ＴＨ（ｔ）を読み出し、ＴＨ（ｔ）＜Ｒ（ｔ）とＲ（ｔ）≦Ｒ（ｔ‐１）の両方の条件を満たすか否かを判定する。ここで、ＴＨ（ｔ）＜Ｒ（ｔ）とＲ（ｔ）≦Ｒ（ｔ‐１）の両方の条件を満たすと判断された場合、ピーク区間検出部１３は、その旨を示すピーク区間検出情報を出力し、メモリ１７の領域１７ｆに格納する。一方、ＴＨ（ｔ）＜Ｒ（ｔ）とＲ（ｔ）≦Ｒ（ｔ‐１）の何れかの条件を満たさないと判断された場合には、ピーク区間検出部１３は、ピーク区間検出情報をメモリ１７の領域１７ｆに格納しない。そして、制御部１８は、メモリ１７の領域１７ｆを参照し、そこにピーク区間検出情報が格納されていない場合には、前述のステップＳ７及びステップＳ８（後述）以降の処理を実行させる。一方、メモリ１７の領域１７ｆにピーク区間検出情報が格納されている場合には、制御部１８は、以下のステップＳ４以降の処理を実行させる。なお、このような手法をとることにより、単純に各離散時間に対応する受話レベルを逐一メモリ１７記録しておき、その時間変動から受話レベルＲ（ｔ）がピーク区間であるか否かを判断する手法に比べ、メモリ１７に要求される記憶容量を大幅に削減することができる。

ステップＳ４では、送話レベル計算部１６に送話信号ｙ（ｔ）が入力され、当該送話レベル計算部１６において、当該送話信号ｙ（ｔ）の送話レベルＳ（ｔ）を算出し、これをメモリ１７の領域１７ｍに格納する。なお、この送話レベルＳ（ｔ）の算出は、送話レベル計算部１６において、メモリ１７の領域１７ｋ，ｍから送話レベルＳ（ｔ−１）（存在しない場合には所定の初期値）を読み込み、ステップＳ１で例示したのと同様な手順（例えばS(t)=a・S(t‐1)+(1‐a)・|y(t)| （０＜ａ＜１））によって行われる。また、送話信号ｙ（ｔ）は、ステップＳ４の処理を行う時点で送話レベル計算部１６に入力される送話信号を意味する。すなわち、厳密には送話信号ｙ（ｔ）は離散時刻ｔにおける送話信号ではなく、離散時刻ｔから遅延した離散時刻ｔ＋Δｔにおける送話信号である。なお、この遅延時間Δｔを補正することとしてもよい。

ステップＳ４の処理の後、音響結合量計算部１４において、メモリ１７の領域１７ｂ，１７ｍから受話レベルＲ（ｔ）と送話レベルＳ（ｔ）とを読み込み、これらの受話レベルＲ（ｔ）と送話レベルＳ（ｔ）との比から音響結合量の瞬時値ＡＣ’（ｔ）を算出して出力する（ステップＳ５）。この演算は式（７）で表される。
AC'(t)=S(t)/R(t) …(7)
このように出力された音響結合量の瞬時値ＡＣ’（ｔ）は、メモリ１７の領域１７ｈに格納され、次にステップＳ６に進む。

ステップＳ６では、時間平滑部１５において、メモリ１７の領域１７ｈから音響結合量の瞬時値ＡＣ’（ｔ）を読み込み、これから音響結合量ＡＣ（ｔ）を算出して出力し、メモリ１７の領域１７ｊに格納する（ステップＳ６）。なお、時間平滑部１５は、例えば、以下のように音響結合量ＡＣ（ｔ）を算出する。
［音響結合量ＡＣ（ｔ）の算出例１］
この例の時間平滑部１５は、推定音響結合量の瞬時値ＡＣ’（ｔ）を時間平滑化して、より正確な推定音響結合量ＡＣ（ｔ）を求める。具体的には、例えば、AC(t)=α・AC(t‐1)十(1‐α)・AC'(t)により推定音響結合量ＡＣ（ｔ）を求める。ただし、αは予め設定された平滑化係数である。

［音響結合量ＡＣ（ｔ）の算出例２］
また、送話音声と受話音声が混在するダブルトーク時においては送話信号に送話音声が混合しているので、推定音響結合量の瞬時値ＡＣ’（ｔ）は、真の値よりも大きな値となってしまう。この影響を少なくするため、時間平滑部１５において、ディップホールドを用いた時間平滑化を行うこととしてもよい。このディップホールドを用いた平滑化は、例えば式（８ａ）（８ｂ）により実現される。
AC(t)=b・AC(t‐1)+(1‐b)・AC'(t) for AC(t‐1)>AC'(t) …(8a)
AC(t)=c・AC(t‐1)+(1‐c)・AC'(t) for AC(t‐1)<AC'(t) …(8b)
ただし、ｂは推定音響結合量増加時の平滑化係数であり、ｃは推定音響結合量減少時の平滑化係数であり、それぞれ０＜ｂ，０＜ｃ＜１の範囲の予め設定された値である。なおｂ＞＞ｃ（ｂがｃに対して十分大きい）となるように設定すれば、音響結合量ＡＣ（ｔ）の増加が非常に緩やかとなり、ディップホールドの効果が得られる（音響結合量ＡＣ（ｔ）の算出例の説明終わり）。

その後、制御部１８において、ｔ＋１を新たなｔとして、メモリ１７の領域１７ｂのデータを領域１７ａに移し、領域１７ｅのデータを領域１７ｄに移し、領域１７ｊのデータを領域１７ｉに移し、領域１７ｍのデータを領域１７ｋに移し、領域１７ｃ，１７ｆのデータを削除した後（ステップＳ８）、ステップＳ１以降の処理を繰り返す。
＜本形態の特徴＞
以上示した処理により、本形態では、受話レベルＲ（ｔ）が固定閾値ＴＲを超え、さらに受話レベルＲ（ｔ）がピーク区間にある場合にのみ、すなわち、送話信号ｙ（ｔ）のエコー成分対雑音成分比がよい区間でのみ音響結合量ＡＣ（ｔ）を推定することとした。

図３は、この受話レベルＲ（ｔ）が固定閾値ＴＲを超え、さらに受話レベルＲ（ｔ）がピーク区間にあるという状態を説明するためのグラフである。Ａ１，Ａ２は、受話レベルＲ（ｔ）が固定閾値ＴＲを超える区間を意味し、Ｂ１〜Ｂ３はピーク区間を意味する。なお、このグラフにおけるピーク区間Ｂ１〜Ｂ３は、前述の式（６ａ）〜（６ｃ）で示される閾値ＴＨ（ｔ）を用い、条件ＴＨ（ｔ）＜Ｒ（ｔ）と、受話レベルＲ（ｔ）が下降するという条件R(t)≦R(t‐1)の両方を満たしたときに、受話レベルＲ（ｔ）がピーク区間のものであるとした場合の例である。この図に例示するように、受話レベルＲ（ｔ）が固定閾値ＴＲを超え、さらに受話レベルＲ（ｔ）がピーク区間にある場合、受話レベルＲ（ｔ）は十分に大きく、送話信号ｙ（ｔ）のエコー成分対雑音成分比もよくなることが分かる。また、ピーク区間は受話信号が入力されたときに必ず存在するので、受話信号が入力されたときには必ず音響結合量の計算が行われる。これにより、本形態では、音響結合量を精度よく高速に推定することが可能となる。

〔第２の実施の形態〕
次に本発明における第２の実施の形態について説明する。
本形態は、第１の実施の形態の変形例であり、さらに受話ノイズレベルと送話ノイズレベルの推定を行い、これらを用いてより精度よく音響結合量の推定を行うものである。以下では、第１の実施の形態との相違点を中心に説明し、第１の実施の形態と共通する事項については説明を省略する。
＜構成＞
図４は、第２の実施の形態における音響結合量推定装置２０の構成を例示したブロック図である。なお、図４における矢印は情報の流れを示しているが、制御部１８に入出力される情報の流れは省略してある。また、図４において第１の実施の形態と共通する部分については図１と同じ符号を付している。

この図に例示するように、本形態の音響結合量推定装置２０は、受話レベル計算部１１と、ピーク区間検出部１３と、時間平滑部１５と、送話レベル計算部１６と、制御部１８と、受話検出部２２と、音響結合量計算部２４と、受話ノイズレベル推定部２５と、送話ノイズレベル推定部２６と、メモリ２７とを有している。そして、音響結合量推定装置２０は、制御部１８の制御のもと、受話信号ｘ（ｔ）と送話信号ｙ（ｔ）とを用いて音響結合量の推定を行う。
＜処理＞
次に、本形態の音響結合量推定処理を説明する。

図５は、本形態の音響結合量推定処理を説明するためのフローチャートである。以下、この図に沿って、本形態の音響結合量推定処理の詳細を説明していく。
まず、図５に示す処理の前提として、メモリ２７のデータをクリアし、さらに領域１７ａ，１７ｄ，１７ｉ，１７ｋ，２７ｎ，２７ｒに所定の初期値（例えば、各領域に格納される値の平均的な値）を格納する。その後、以下の処理を実行する。
まず、受話レベル計算部１１に受話信号ｘ（ｔ）が入力され、受話レベル計算部１１は、受話信号ｘ（ｔ）の受話レベルＲ（ｔ）を算出して出力し、メモリ２７の領域１７ｂに格納する（ステップＳ１１）。ここで、受話レベルＲ（ｔ）の算出は、例えば第１の実施の形態と同様に行う。

次に、受話ノイズレベル推定部２５において、メモリ２７の領域１７ｂから受話レベルＲ（ｔ）を読み込み、これから受話信号ｘ（ｔ）のノイズレベルの推定値（以下「受話ノイズレベルＮｒ（ｔ）」という）を算出して出力する（ステップＳ１２）。具体的には、例えば、受話ノイズレベル推定部２５は、メモリ２７の領域１７ｂから受話レベルＲ（ｔ）を読み込み、領域２７ｎから受話ノイズレベルＮｒ（ｔ−１）（存在しない場合には所定の初期値）を読み込み、受話レベルＲ（ｔ）を以下の式（９ａ）（９ｂ）を用いてディップホールド処理することで受話ノイズレベルＮｒ（ｔ）を推定する。

Nr(t)=R(t) for Nr(t-1)>R(t) …(9a)
Nr(t)=u・Nr(t‐1)+(1-u)・R(t) for Nr(t-1)<R(t) …(9b)
ここで、ｕは事前に設定された推定ノイズレベルの平滑化係数であり０＜ｕ＜１の値をとる。ここでｕが１に近いと緩やかなノイズレベルの上昇となり、ディップホールドの効果が得られる。このように算出された受話ノイズレベルＮｒ（ｔ）は、メモリ２７の領域２７ｐに格納される。
次に、受話検出部２２において、受話ノイズレベルＮｒ（ｔ）の定数倍（好ましくは１倍以上）の閾値ＴＮ及び予め設定された固定閾値ＴＲと、受話レベルＲ（ｔ）とを比較し、これら両方の閾値ＴＮ，ＴＲよりも当該受話レベルＲ（ｔ）が大きい場合に（R(t)>TR and R(t)>TN）、受話があった旨の情報（受話検出情報）を出力し、メモリ２７の領域１７ｃに格納する（ステップＳ１３）。このように、受話ノイズレベルＮｒ（ｔ）を基準とした閾値ＴＮを導入することにより、受話信号のノイズレベルが高い場合にも、このノイズレベルよりも受話レベルＲ（ｔ）が大きい受話信号ｘ（ｔ）のみを抽出して音響結合量の推定処理にあてることができる。

そして、制御部１８は、メモリ２７の領域１７ｃを参照し、そこに受話検出情報が格納されていない場合には、メモリ２７の領域１７ｉに格納されている音響結合量ＡＣ（ｔ‐１）（存在しない場合には、所定の初期値）を離散時間ｔにおける新たな音響結合量ＡＣ（ｔ）としてメモリ２７の領域１７ｊに格納し（ステップＳ１９）、ステップＳ２０（後述）以降の処理を実行させる。一方、メモリ２７の領域１７ｃに受話検出情報が格納されている場合には、制御部１８は、以下のステップＳ１４以降の処理を実行させる。
ステップＳ１４では、ピーク区間検出部１３において、例えば第１の実施の形態と同様な手法により、受話レベルＲ（ｔ）がピーク区間のものであるか否かを判定する（ステップＳ１４）。そして、ピーク区間検出部１３が、受話レベルＲ（ｔ）がピーク区間のものであると判定した場合、ピーク区間検出部１３は、ピーク区間検出情報を出力し、メモリ２７の領域１７ｆに格納する。一方、受話レベルＲ（ｔ）がピーク区間のものでないと判定された場合には、ピーク区間検出情報は出力されない。そして、制御部１８は、メモリ２７の領域１７ｆを参照し、そこにピーク区間検出情報が格納されていない場合には、前述のステップＳ１９及びステップＳ２０（後述）以降の処理を実行させる。一方、メモリ２７の領域１７ｆにピーク区間検出情報が格納されている場合には、制御部１８は、以下のステップＳ１５以降の処理を実行させる。

ステップＳ１５では、送話レベル計算部１６に送話信号ｙ（ｔ）が入力され、当該送話レベル計算部１６において、当該送話信号ｙ（ｔ）の送話レベルＳ（ｔ）を算出し、これをメモリ２７の領域１７ｍに格納する。なお、この送話レベルＳ（ｔ）の算出は、例えば、第１の実施の形態と同様に行う。
次に、送話ノイズレベル推定部２６において、送話レベルＳ（ｔ）から送話信号のノイズレベルの推定値（以下「送話ノイズレベルＮｓ（ｔ）」という。）を算出して出力し、メモリ２７の領域２７ｓに格納する（ステップＳ１６）。具体的には、例えば、送話ノイズレベル推定部２６は、メモリ２７の領域２７ｒから送話ノイズレベルＮｓ（ｔ−１）を読み込み、領域１７ｍから送話レベルＳ（ｔ）を読み込み、ステップＳ１２と同様な手順（例えば、Ns(t)=S(t)〔for Ns(t-1)>S(t)〕,Ns(t)=u・Ns(t‐1)+(1-u)・S(t)〔for Nr(t-1)<R(t)〕，0<u<1）により送話ノイズレベルＮｓ（ｔ）を算出し、メモリ２７の領域２７ｓに格納する。

ステップＳ１６の処理の後、音響結合量計算部２４は、メモリ２７の領域１７ｂ，１７ｍ，２７ｐ，２７ｓから、それぞれ受話レベルＲ（ｔ），送話レベルＳ（ｔ），受話ノイズレベルＮｒ（ｔ），送話ノイズレベルＮｓ（ｔ）を読み込む。そして、音響結合量計算部２４は、受話レベルＲ（ｔ）から受話ノイズレベルＮｒ（ｔ）を減じた値｛Ｒ（ｔ）−Ｎｒ（ｔ）｝と送話レベルＳ（ｔ）から送話ノイズレベルＮｓ（ｔ）を減じた値｛Ｓ（ｔ）−Ｎｓ（ｔ）｝との比から音響結合量の瞬時値ＡＣ’（ｔ）を算出して出力し、メモリ２７の領域１７ｈに格納する（ステップＳ１７）。具体的には、音響結合量計算部２４は、例えば、式（１０）に従って音響結合量の瞬時値ＡＣ’（ｔ）を算出する。

AC'(t)={S(t)‐Ns(t)}/{R(t)‐Nr(t)} …(10)
このように受話レベルＲ（ｔ）及び送話レベルＳ（ｔ）から推定ノイズレベルを減算し、音響結合量の瞬時値ＡＣ’（ｔ）を算出することにより、第１の実施の形態よりも精度よく音響結合量の計算が可能となる。
次に、時間平滑部１５において、メモリ２７の領域１７ｈから音響結合量の瞬時値ＡＣ’（ｔ）を読み込み、例えば、第１の実施の形態と同様に音響結合量ＡＣ（ｔ）を算出して出力し、メモリ２７の領域１７ｊに格納する（ステップＳ１８）。

その後、制御部１８において、ｔ＋１を新たなｔとして、メモリ２７の領域１７ｂのデータを領域１７ａに移し、領域１７ｅのデータを領域１７ｄに移し、領域１７ｊのデータを領域１７ｉに移し、領域１７ｍのデータを領域１７ｋに移し、領域２７ｐのデータを領域２７ｎに移し、領域２７ｓのデータを領域１７ｒに移し、領域１７ｃ，１７ｆのデータを削除した後（ステップＳ２０）、ステップＳ１１以降の処理を繰り返す。
＜本形態の特徴＞
以上示した処理により、本形態では、受話レベルＲ（ｔ）が閾値ＴＮを超え、さらに受話レベルＲ（ｔ）がピーク区間にある場合にのみ、すなわち、送話信号ｙ（ｔ）のエコー成分対雑音成分比がよい区間でのみ音響結合量ＡＣ（ｔ）を推定することとした。これにより、音響結合量ＡＣ（ｔ）の精度の向上とその推定精度の向上とを実現できる。さらに、本形態ではノイズレベルの推定を行い、それを音響結合量ＡＣ（ｔ）の推定処理に用いることとした。これにより、第１の実施の形態よりも高い精度で音響結合量推定を行うことができる。

〔第３の実施の形態〕
次に、本発明における第３の実施の形態について説明する。
本形態は、第１の実施の形態の変形例であり、割り算を用いることなく音響結合量推定を行うものである。以下では、第１の実施の形態との相違点を中心に説明し、第１の実施の形態と共通する事項については説明を省略する。
＜構成＞
図６は、第３の実施の形態における音響結合量推定装置３０の構成を示したブロック図である。なお、図６における矢印は情報の流れを示しているが、制御部１８に入出力される情報の流れは省略してある。また、図６において第１の実施の形態と共通する部分については図１と同じ符号を付している。

この図に例示するように、本形態の音響結合量推定装置３０は、受話レベル計算部１１と、受話検出部１２と、ピーク区間検出部１３と、送話レベル計算部１６と、制御部１８と、音響結合量記憶部３１と、音響結合量更新部３４と、メモリ３７とを有している。なお、音響結合量更新部３４は、推定エコーレベル算出部３４ａと、比較部３４ｂと、更新部３４ｃとを有している。そして、音響結合量推定装置３０は、制御部１８の制御のもと、受話信号ｘ（ｔ）と送話信号ｙ（ｔ）とを用いて音響結合量の推定を行う。
＜処理＞
次に、本形態の音響結合量推定処理を説明する。

本形態では、第１の実施の形態における音響結合量の計算を以下のような方法に置き換えることで、割り算をなくし、演算量の削減を実現する。即ち、前の音響結合量ＡＣ（ｔ’）に受話レベルＲ（ｔ）を乗じた推定エコーレベルと、送話レベルＳ（ｔ）とを比較し、送話レベルＳ（ｔ）が大きい場合には音響結合量を増加させ、推定エコーレベルが大きい場合には音響結合量を減少させる逐次更新により、音響結合量を推定していく。これにより、割り算を用いない音響結合量推定が可能となる。
図７は、本形態の音響結合量推定処理を説明するためのフローチャートである。以下、この図に沿って、本形態の音響結合量推定処理の詳細を説明していく。

まず、図７に示す処理の前提として、メモリ４７のデータをクリアし、さらに領域１７ａ，１７ｄ，１７ｉ，１７ｋに所定の初期値（例えば、各領域に格納される値の平均的な値）を格納する。また、音響結合量記憶部３１に推定音響結合量の初期値ＡＣ（０）を格納しておく。なお、ＡＣ（０）は推定音響結合量の平均値程度であることが望ましい。このような前処理の後、以下の処理を実行する。
まず、受話レベル計算部１１に受話信号ｘ（ｔ）が入力され、受話レベル計算部１１は、受話信号ｘ（ｔ）の受話レベルＲ（ｔ）を算出して出力し、メモリ３７の領域１７ｂに格納する（ステップＳ３１）。ここで、受話レベルＲ（ｔ）の算出は、例えば第１の実施の形態と同様に行う。

次に、受話検出部１２において、メモリ１７の領域１７ｂから受話レベルＲ（ｔ）を読み込み、この受話レベルＲ（ｔ）と予め設定された固定閾値ＴＲとを比較する（ステップＳ３２）。
ここで、Ｒ（ｔ）＞ＴＲであると判断された場合、受話検出部１２は、受話があったと判定し、その旨の情報（受話検出情報）を出力し、これをメモリ３７の領域１７ｃに格納する。一方、Ｒ（ｔ）＞ＴＲでないと判断された場合、受話検出部１２は、受話検出情報のメモリ３７の領域１７ｃへの格納を行わない。そして、制御部１８は、メモリ３７の領域１７ｃを参照し、そこに受話検出情報が格納されていない場合には、後述するステップＳ３９以降の処理を実行させる。一方、メモリ３７の領域１７ｃに受話検出情報が格納されている場合には、制御部１８は、以下のステップＳ３３以降の処理を実行させる。

ステップＳ３３では、ピーク区間検出部１３において、例えば、第１の実施の形態と同様に、受話レベルＲ（ｔ）がピーク区間のものであるか否かを判定する。そして、ピーク区間検出部１３が、受話レベルＲ（ｔ）がピーク区間のものであると判定した場合、ピーク区間検出部１３は、ピーク区間検出情報を出力し、メモリ３７の領域１７ｆに格納する。一方、受話レベルＲ（ｔ）がピーク区間のものでないと判定された場合には、ピーク区間検出情報は出力されない。そして、制御部１８は、メモリ３７の領域１７ｆを参照し、そこにピーク区間検出情報が格納されていない場合には、後述のステップＳ３９以降の処理を実行させる。一方、メモリ３７の領域１７ｆにピーク区間検出情報が格納されている場合には、制御部１８は、以下のステップＳ３４以降の処理を実行させる。

ステップＳ３４では、送話レベル計算部１６に送話信号ｙ（ｔ）が入力され、当該送話レベル計算部１６において、第１の実施の形態と同様に当該送話信号ｙ（ｔ）の送話レベルＳ（ｔ）を算出し、これをメモリ３７の領域１７ｍに格納する。
次に、音響結合量更新部３４の推定エコーレベル算出部３４ａにおいて、メモリ３７の領域１７ｂから受話信号レベルＲ（ｔ）を読み込み、音響結合量記憶部３１からそこに格納されている最新の音響結合量ＡＣ（ｔ’）を読み込む。そして、推定エコーレベル算出部３４ａは、読み込んだ受話信号レベルＲ（ｔ）と最新の音響結合量ＡＣ（ｔ’）とを乗算して、推定エコーレベルＡＣ（ｔ’）・Ｒ（ｔ）を求め、メモリ３７の領域３７ｍに格納する（ステップＳ３５）。

次に、音響結合量更新部３４の比較部３４ｂにおいて、メモリ３７の領域３７ｍから推定エコーレベルＡＣ（ｔ’）・Ｒ（ｔ）を読み込み、領域１７ｍから送話レベルＳ（ｔ）を読み込む。そして、比較部３４ｂは、読み込んだ推定エコーレベルＡＣ（ｔ’）・Ｒ（ｔ）と送話レベルＳ（ｔ）とを比較する（ステップＳ３６）。ここで、推定エコーレベルＡＣ（ｔ’）・Ｒ（ｔ）よりも送話レベルＳ（ｔ）のほうが小さい場合（AC(t')・R(t)>S(t)）には、音響結合量ＡＣ（ｔ’）が真の結合量よりも大きいと推測されるので、音響結合量更新部３４の更新部３４ｃにおいて、最新の音響結合量音響結合量ＡＣ（ｔ’）よりも小さな値を新たな音響結合量ＡＣ（ｔ）として音響結合量記憶部３１のデータを更新する（ステップＳ３７）。具体的には、例えば、ＡＣ（ｔ’）に１より小さい定数ｐ（０＜ｐ＜１）を乗じ、その結果を新たな音響結合量ＡＣ（ｔ）とする。一方、推定エコーレベルＡＣ（ｔ’）・Ｒ（ｔ）よりも送話レベルＳ（ｔ）のほうが大きい場合（AC(t')・R(t)<S(t)）には、音響結合量ＡＣ（ｔ’）が真の結合量よりも小さいと推測されるので、更新部３４ｃにおいて、最新の音響結合量音響結合量ＡＣ（ｔ’）よりも大きな値を新たな音響結合量ＡＣ（ｔ）として音響結合量記憶部３１のデータを更新する（ステップＳ３８）。具体的には、例えば、ＡＣ（ｔ’）に１より大きい定数ｑ（１＜ｑ）を乗じ、その結果を新たな音響結合量ＡＣ（ｔ）とする。

これらを式で表せば、以下の式（１１ａ）（１１ｂ）のようになる。
AC(t)=p・AC(t') for AC(t')・R(t)>S(t) …(11a)
AC(t)=q・AC(t') for AC(t')・R(t)<S(t) …(11b)
ただし、定数p,qは事前に設定される。また、送話音声と受話音声が同時に存在するダブルトーク時には、送話信号ｙ（ｔ）に送話音声成分が混合される。この場合、送話レベルs(t)は、送話信号ｙ（ｔ）に送話音声成分が混合していない場合の送話レベルに比べ大きくなってしまい、正確な音響結合量の更新が行えなくなってしまう。この影響を少なくするには、定数pを1に近い値に設定することが望ましい。これにより、音響結合量が上昇する場合の更新量を小さくし、ダブルトーク時における誤った音響結合量の更新の幅を小さくできるからである。

一方、ステップＳ３６の判断で、推定エコーレベルＡＣ（ｔ’）・Ｒ（ｔ）と送話レベルＳ（ｔ）とが等しい（AC(t')・R(t)=S(t)）と判断された場合には、音響結合量の更新を行わない。
そして、以上の処理の後、制御部１８において、ｔ＋１を新たなｔとして、メモリ３７の領域１７ｂのデータを領域１７ａに移し、領域１７ｅのデータを領域１７ｄに移し、領域１７ｍのデータを領域１７ｋに移し、領域１７ｃ，１７ｆのデータを削除した後（ステップＳ３９）、ステップＳ３１以降の処理を繰り返す。

＜本形態の特徴＞
以上示した処理により、本形態では、受話レベルＲ（ｔ）が固定閾値ＴＲを超え、さらに受話レベルＲ（ｔ）がピーク区間にある場合にのみ、すなわち、送話信号ｙ（ｔ）のエコー成分対雑音成分比がよい区間でのみ音響結合量ＡＣ（ｔ）の更新を行うこととした。これにより、音響結合量ＡＣ（ｔ）の精度の向上とその推定精度の向上とを実現できる。また、本形態では、割り算を用いることなく音響結合量を推定できるため、割り算器を有しないプロセッサにおいても少ない演算量で実装することができる。

〔第４の実施の形態〕
本形態は、第３の実施の形態の変形例であり、さらに受話ノイズレベルと送話ノイズレベルの推定を行い、これらを用いてより精度よく音響結合量の更新を行うものである。以下では、第３の実施の形態との相違点を中心に説明し、第１，３の実施の形態と共通する事項については説明を省略する。
＜構成＞
図８は、第４の実施の形態における音響結合量推定装置４０の構成を例示したブロック図である。なお、図８における矢印は情報の流れを示しているが、制御部１８に入出力される情報の流れは省略してある。また、図８において第１〜３の実施の形態と共通する部分については図１，図４，図６と同じ符号を付している。

この図に例示するように、本形態の音響結合量推定装置４０は、受話レベル計算部１１と、ピーク区間検出部１３と、送話レベル計算部１６と、制御部１８と、受話検出部２２と、受話ノイズレベル推定部２５と、送話ノイズレベル推定部２６と、音響結合量記憶部３１と、音響結合量更新部４４と、メモリ４７とを有している。また、音響結合量更新部４４は、推定エコーレベル算出部４４ａ，比較部４４ｂ、更新部４４ｃ及び減算部４４ｄを有している。そして、音響結合量推定装置４０は、制御部１８の制御のもと、受話信号ｘ（ｔ）と送話信号ｙ（ｔ）とを用いて音響結合量の推定を行う。

＜処理＞
次に、本形態の音響結合量推定処理を説明する。
図９は、本形態の音響結合量推定処理を説明するためのフローチャートである。以下、この図に沿って、本形態の音響結合量推定処理の詳細を説明していく。
まず、図９に示す処理の前提として、メモリ４７のデータをクリアし、さらに領域１７ａ，１７ｄ，１７ｋ，２７ｎ，２７ｒに所定の初期値（例えば、各領域に格納される値の平均的な値）を格納する。また、音響結合量記憶部３１に推定音響結合量の初期値ＡＣ（０）を格納しておく。なお、ＡＣ（０）は推定音響結合量の平均値程度であることが望ましい。このような前処理の後、以下の処理を実行する。

まず、受話レベル計算部１１に受話信号ｘ（ｔ）が入力され、受話レベル計算部１１は、受話信号ｘ（ｔ）の受話レベルＲ（ｔ）を算出して出力し、メモリ４７の領域１７ｂに格納する（ステップＳ４１）。ここで、受話レベルＲ（ｔ）の算出は、例えば第１の実施の形態と同様に行う。
次に、受話ノイズレベル推定部２５において、メモリ４７の領域１７ｂから受話レベルＲ（ｔ）を読み込み、これから受話信号ｘ（ｔ）の受話ノイズレベルＮｒ（ｔ）を算出して出力し、メモリ４７の領域２７ｐに格納する（ステップＳ４２）。ここで、受話ノイズレベルＮｒ（ｔ）の算出は、例えば第２の実施の形態と同様に行う。

次に、受話検出部２２において、受話ノイズレベルＮｒ（ｔ）の定数倍（好ましくは１倍以上）の閾値ＴＮ及び予め設定された固定閾値ＴＲと、受話レベルＲ（ｔ）とを比較し、これら両方の閾値ＴＮ，ＴＲよりも当該受話レベルＲ（ｔ）が大きい場合に（R(t)>TR and R(t)>TN）、受話があった旨の情報（受話検出情報）を出力し、メモリ４７の領域１７ｃに格納する（ステップＳ４３）。そして、制御部１８は、メモリ４７の領域１７ｃを参照し、そこに受話検出情報が格納されていない場合には、後述するステップＳ５２以降の処理を実行させる。一方、メモリ４７の領域１７ｃに受話検出情報が格納されている場合には、制御部１８は、以下のステップＳ４４以降の処理を実行させる。

ステップＳ４４では、ピーク区間検出部１３において、例えば第１の実施の形態と同様な手法により、受話レベルＲ（ｔ）がピーク区間のものであるか否かを判定する（ステップＳ４４）。そして、ピーク区間検出部１３が、受話レベルＲ（ｔ）がピーク区間のものであると判定した場合、ピーク区間検出部１３は、ピーク区間検出情報を出力し、メモリ４７の領域１７ｆに格納する。一方、受話レベルＲ（ｔ）がピーク区間のものでないと判定された場合には、ピーク区間検出情報は出力されない。そして、制御部１８は、メモリ４７の領域１７ｆを参照し、そこにピーク区間検出情報が格納されていない場合には、後述するステップＳ５２以降の処理を実行させる。一方、メモリ４７の領域１７ｆにピーク区間検出情報が格納されている場合には、制御部１８は、以下のステップＳ４５以降の処理を実行させる。

ステップＳ１５では、送話レベル計算部１６に送話信号ｙ（ｔ）が入力され、当該送話レベル計算部１６において、当該送話信号ｙ（ｔ）の送話レベルＳ（ｔ）を算出し、これをメモリ４７の領域１７ｍに格納する。なお、この送話レベルＳ（ｔ）の算出は、例えば、第１の実施の形態と同様に行う。
次に、送話ノイズレベル推定部２６において、第２の実施の形態と同様に、送話レベルＳ（ｔ）から送話信号の送話ノイズレベルＮｓ（ｔ）を算出して出力し、メモリ４７の領域２７ｓに格納する（ステップＳ４６）。

次に、音響結合量更新部４４の推定エコーレベル算出部４４ａにおいて、メモリ４７の領域１７ｂから受話信号レベルＲ（ｔ）を読み込み、領域２７ｐから受話ノイズレベルＮｒ（ｔ）を読み込み、音響結合量記憶部３１からそこに格納されている最新の音響結合量ＡＣ（ｔ’）を読み込む。そして、推定エコーレベル算出部４４ａは、最新の音響結合量ＡＣ（ｔ’）と、受話信号レベルＲ（ｔ）から受話ノイズレベルＮｒ（ｔ）を減じた値｛Ｒ（ｔ）−Ｎｒ（ｔ）｝とを乗算して、推定エコーレベルＡＣ（ｔ’）・｛Ｒ（ｔ）−Ｎｒ（ｔ）｝を求め、メモリ４７の領域４７ｔに格納する（ステップＳ４７）。

次に、音響結合量更新部４４の減算部４４ｄにおいて、メモリ４７の領域１７ｍから送話信号レベルＳ（ｔ）を読み込み、領域２７ｓから送話ノイズレベルＮｓ（ｔ）を読み込む。そして、減算部４４ｄは、送話信号レベルＳ（ｔ）から送話ノイズレベルＮｓ（ｔ）を減算した値｛Ｓ（ｔ）−Ｎｓ（ｔ）｝を算出し、これをメモリ４７の領域４７ｕに格納する（ステップＳ４８）。
次に、音響結合量更新部３４の比較部４４ｂにおいて、メモリ４７の領域４７ｔから推定エコーレベルＡＣ（ｔ’）・｛Ｒ（ｔ）−Ｎｒ（ｔ）｝を読み込み、領域４７ｕから送話信号レベルＳ（ｔ）から送話ノイズレベルＮｓ（ｔ）を減算した値｛Ｓ（ｔ）−Ｎｓ（ｔ）｝を読み込む。そして、比較部４４ｂは、読み込んだ推定エコーレベルＡＣ（ｔ’）・｛Ｒ（ｔ）−Ｎｒ（ｔ）｝と値｛Ｓ（ｔ）−Ｎｓ（ｔ）｝とを比較する（ステップＳ４９）。

ここで、推定エコーレベルＡＣ（ｔ’）・｛Ｒ（ｔ）−Ｎｒ（ｔ）｝よりも送話信号レベルＳ（ｔ）から送話ノイズレベルＮｓ（ｔ）を減算した値｛Ｓ（ｔ）−Ｎｓ（ｔ）｝のほうが小さい場合（AC(t')・{R(t)-Nr(t)}>{S(t)-Ns(t)}）には、音響結合量ＡＣ（ｔ’）が真の結合量よりも大きいと推測されるので、音響結合量更新部４４の更新部４４ｃにおいて、最新の音響結合量音響結合量ＡＣ（ｔ’）よりも小さな値を新たな音響結合量ＡＣ（ｔ）として音響結合量記憶部３１のデータを更新する（ステップＳ５０）。具体的には、例えば、ＡＣ（ｔ’）に１より小さい定数ｐ（０＜ｐ＜１）を乗じ、その結果を新たな音響結合量ＡＣ（ｔ）とする。推定エコーレベルＡＣ（ｔ’）・｛Ｒ（ｔ）−Ｎｒ（ｔ）｝よりも送話信号レベルＳ（ｔ）から送話ノイズレベルＮｓ（ｔ）を減算した値｛Ｓ（ｔ）−Ｎｓ（ｔ）｝のほうが大きい場合（AC(t')・{R(t)-Nr(t)}<{S(t)-Ns(t)}）には、音響結合量ＡＣ（ｔ’）が真の結合量よりも小さいと推測されるので、更新部４４ｃにおいて、最新の音響結合量音響結合量ＡＣ（ｔ’）よりも大きな値を新たな音響結合量ＡＣ（ｔ）として音響結合量記憶部３１のデータを更新する（ステップＳ５１）。具体的には、例えば、ＡＣ（ｔ’）に１より大きい定数ｑ（１＜ｑ）を乗じ、その結果を新たな音響結合量ＡＣ（ｔ）とする。

これらを式で表せば、以下の式（１２ａ）（１２ｂ）のようになる。
AC(t)=p・AC(t') for AC(t')・{R(t)-Nr(t)}>{S(t)-Ns(t)} …(12a)
AC(t)=q・AC(t') for AC(t')・{R(t)-Nr(t)}<{S(t)-Ns(t)} …(12b)
ただし、定数p,qは事前に設定される。また、送話音声と受話音声が同時に存在するダブルトーク時には、送話信号ｙ（ｔ）に送話音声成分が混合される。この場合、送話レベルs(t)は、送話信号ｙ（ｔ）に送話音声成分が混合していない場合の送話レベルに比べ大きくなってしまい、正確な音響結合量の更新が行えなくなってしまう。この影響を少なくするには、定数pを1に近い値に設定することが望ましい。これにより、音響結合量が上昇する場合の更新量を小さくし、ダブルトーク時における誤った音響結合量の更新の幅を小さくできるからである。

一方、ステップＳ４９の判断で、推定エコーレベルＡＣ（ｔ’）・｛Ｒ（ｔ）−Ｎｒ（ｔ）｝と送話信号レベルＳ（ｔ）から送話ノイズレベルＮｓ（ｔ）を減算した値｛Ｓ（ｔ）−Ｎｓ（ｔ）｝とが等しい（AC(t')・{R(t)-Nr(t)}={S(t)-Ns(t)}）と判断された場合には、音響結合量の更新を行わない。
そして、以上の処理の後、制御部１８において、ｔ＋１を新たなｔとして、メモリ４７の領域１７ｂのデータを領域１７ａに移し、領域１７ｅのデータを領域１７ｄに移し、領域１７ｍのデータを領域１７ｋに移し、領域２７ｐのデータを領域２７ｎに移し、領域２７ｓのデータを領域２７ｒに移し、領域１７ｃ，１７ｆのデータを削除した後（ステップＳ５２）、ステップＳ４１以降の処理を繰り返す。

＜本形態の特徴＞
以上示した処理により、本形態では、受話レベルＲ（ｔ）が閾値ＴＮを超え、さらに受話レベルＲ（ｔ）がピーク区間にある場合にのみ、すなわち、送話信号ｙ（ｔ）のエコー成分対雑音成分比がよい区間でのみ音響結合量ＡＣ（ｔ）の更新を行うこととした。これにより、音響結合量ＡＣ（ｔ）の精度の向上とその推定精度の向上とを実現できる。また、本形態では、割り算を用いることなく音響結合量を推定できるため、割り算器を有しないプロセッサにおいても少ない演算量で実装することができる。さらに、本形態では、第３の実施の形態にノイズレベルの推定処理を追加し、送受話レベルからノイズレベルを減算してから音響結合量の更新を行う。このノイズレベルの減算により、送受話のノイズの影響を軽減することができ、より正確な音響結合量推定が可能となる。

〔第５の実施の形態〕
本形態は、第１の実施の形態の変形例であり、時間領域の受話信号及び送話信号を時間周波数領域の信号に変換し、周波数ごとに音響結合量の推定を行う例である。以下では、第１の実施の形態との相違点を中心に説明し、第１の実施の形態と共通する事項については説明を省略する。
図１０は、第５の実施の形態における音響結合量推定装置５０の構成を例示したブロック図である。なお、図１０における矢印は情報の流れを示しているが、制御部５３に入出力される情報の流れは省略してある。

この図に例示するように、本形態の音響結合量推定装置５０は、受話信号周波数変換部５１と、送話周波数変換部５２と、Ｎ個の音響結合量推定部６０−１〜Ｎと、制御部５３とを有している。そして、音響結合量推定装置５０は、制御部５３の制御のもと、受話信号ｘ（ｔ）と送話信号ｙ（ｔ）とを用い、周波数ごとに音響結合量の推定を行う。
図１１は、図１０における音響結合量推定部６０−１の構成を例示したブロック図である。なお、図１１における矢印は情報の流れを示しているが、制御部１８に入出力される情報の流れは省略してある。

この図に例示するように、この例の音響結合量推定部６０−１の構成は、第１の実施の形態における音響結合量推定装置１０と同様である。すなわち、音響結合量推定部６０−１は、受話レベル計算部１１と、受話検出部１２と、ピーク区間検出部１３と、音響結合量計算部１４と、時間平滑部１５と、送話レベル計算部１６と、メモリ１７と、制御部１８とを有している。ただし、音響結合量推定部６０−１は、時間領域の受話信号ｘ（ｔ）から変換された時間周波数領域の受話信号ｘ（ｆ，ｔ）と、時間領域の送話信号ｙ（ｔ）から変換された時間周波数領域の送話信号ｙ（ｆ，ｔ）とを用い、周波数ｆのみに対する音響結合量の推定を行う。なお、その他の音響結合量推定部６０−２〜Ｎの構成も音響結合量推定部６０−１と同じであるが、それぞれが取り扱う信号の周波数ｆは異なる。

＜処理＞
次に、本形態の音響結合量推定処理を説明する。
まず、受話信号周波数変換部５１において、入力された時間領域の受話信号ｘ（ｔ）をＮ個の時間周波数領域の受話信号ｘ（ｆ，ｔ）に変換し、各受話信号ｘ（ｆ，ｔ）をそれぞれ音響結合量推定部６０−１〜Ｎに出力する。また、送話周波数領域変換部５２において、入力された時間領域の送話信号ｙ（ｔ）をＮ個の時間周波数領域の送話信号ｙ（ｆ，ｔ）に変換し、各ｙ（ｆ，ｔ）をそれぞれ音響結合量推定部６０−１〜Ｎに出力する。なお、受話信号周波数変換部５１及び送話周波数変換部５２は、例えば、短時間フーリエ変換、wavelet変換、DFTフィルタバンク、ポリフェイズフィルタバンクなどを用い、周波数領域の信号を時間周波数領域の信号に変換し、受話信号ｘ（ｔ）と送話信号ｙ（ｔ）とをそれぞれＮ個の周波数帯域の信号に分割する。また、各音響結合量推定部６０−１〜Ｎには、何れかの周波数ｆの受話信号ｘ（ｆ，ｔ）及び送話信号ｙ（ｆ，ｔ）が入力されるが、同一の音響結合量推定部６０−１〜Ｎには、同一の周波数ｆに対応する受話信号ｘ（ｆ，ｔ）及び送話信号ｙ（ｆ，ｔ）が入力される。

その後、各音響結合量推定部６０−１〜Ｎにおいて、それぞれ入力された周波数ｆに対応する受話信号ｘ（ｆ，ｔ）及び送話信号ｙ（ｆ，ｔ）を用い、第１の実施の形態と同様に音響結合量ＡＣ（ｆ，ｔ）を算出し、それぞれのメモリに格納する。
＜本形態の特徴＞
本形態では、周波数帯域ごとの音響結合量を求めることができる。これにより、より正確な音響結合量を得ることができる。なお、本形態では、各音響結合量推定部６０−１〜Ｎを第１の実施の形態における音響結合量推定装置１０と同様な構成としたが、各音響結合量推定部６０−１〜Ｎを第２〜４の実施の形態における音響結合量推定装置２０〜４０と同様な構成とし、第２〜４の実施の形態で説明した方法によって周波数帯域ごとの音響結合量を求めることとしてもよい。

〔第６の実施の形態〕
本形態は、第１の実施の形態の変形例であり、送話検出部において送話が行われているか否かを判定し、送話が行われている場合に音響結合量の計算を停止する例である。以下では、第１の実施の形態との相違点を中心に説明し、第１の実施の形態と共通する事項については説明を省略する。
＜構成＞
図１２は、第６の実施の形態における音響結合量推定装置７０の構成を例示したブロック図である。なお、図１２における矢印は情報の流れを示しているが、制御部１８に入出力される情報の流れは省略してある。

この図に例示するように、本形態の音響結合量推定装置７０は、受話レベル計算部１１と、受話検出部１２と、ピーク区間検出部１３と、音響結合量計算部１４と、時間平滑部１５と、送話レベル計算部１６と、制御部１８と、送話検出部７１と、メモリ７７とを有している。そして、音響結合量推定装置７０は、制御部１８の制御のもと、受話信号ｘ（ｔ）と送話信号ｙ（ｔ）とを用い、音響結合量の推定を行う。
＜処理＞
次に、本形態の音響結合量推定処理を説明する。

図１３は、本形態の音響結合量推定処理を説明するためのフローチャートである。以下、この図に沿って、本形態の音響結合量推定処理の詳細を説明していく。
第１の実施の形態との相違点はステップＳ７５の処理が挿入される点であり、その他の処理については第１の実施の形態と同様である。以下では、第１の実施の形態との相違点を中心に説明を行う。
第１の実施の形態におけるステップＳ１〜Ｓ４と同様に、受話信号ｘ（ｔ）の受話レベルＲ（ｔ）が算出され（ステップＳ７１）、受話レベルＲ（ｔ）＞固定閾値ＴＲであると判断され（ステップＳ７２）、受話レベルＲ（ｔ）がピーク区間のものであると判定され（ステップＳ７３）、送話信号ｙ（ｔ）の送話レベルＳ（ｔ）が算出された場合（ステップＳ７４）、送話検出部７１は、メモリ７７の領域１７ｉから最新の音響結合量ＡＣ（ｔ−１）を、領域１７ｂから受話レベルＲ（ｔ）を、領域１７ｍから送話レベルＳ（ｔ）をそれぞれ読み込む。そして、送話検出部７１は、送話レベルＳ（ｔ）が、予め設定された固定閾値ＴＳを超え（Ｓ（ｔ）＞ＴＳ）、さらに最新の音響結合量ＡＣ（ｔ−１）と受話レベルＲ（ｔ）とを用いて算出された推定エコーレベルの定数（１より大きな定数）倍である閾値ＴＥを超えた（Ｓ（ｔ）＞ＴＥ）か否かを判定する（ステップＳ７５）。なお、閾値ＴＥとしては、例えば、最新の音響結合量ＡＣ（ｔ−１）に受話レベルＲ（ｔ）を乗じた推定エコーレベルの定数β（β＞１）倍（ＴＥ＝β・ＡＣ（ｔ−１）・Ｒ（ｔ））を例示できる。ここで、Ｓ（ｔ）＞ＴＳ及びＳ（ｔ）＞ＴＥの条件を満たした場合にのみ、送話検出部７１は、送話が行われている旨の情報（送話検出情報）を出力し、メモリ７７の領域７７ｎに格納する。そして、制御部１８は、メモリ７７の領域７７ｎを参照し、そこに送話検出情報が格納されていない場合には、ステップＳ７８（第１の実施の形態のステップＳ７と同様）及びＳ７９以降の処理を実行させる。すなわち、この場合には、音響結合量計算部１４は、送話レベルＳ（ｔ）に対応する新たな音響結合量の瞬時値を算出しない。一方、メモリ７７の領域７７ｎに送話検出情報が格納されている場合には、制御部１８は、以下のステップＳ７６以降の処理を実行させる。なお、ステップＳ７６以降の処理は第１の実施の形態におけるステップＳ５，Ｓ６，Ｓ８と同様である。ただし、ステップＳ７９の処理は、領域７７ｎのデータを削除する処理が加わる点でステップＳ８の処理と異なる。

＜本形態の特徴＞
本形態では、送話検出部７１において送話を検出し、送話が検出された場合、新たな音響結合量の瞬時値の算出を行わないこととした。これにより、送話信号ｙ（ｔ）に含まれる送話音声成分による音響結合量推定誤差を軽減し、より正確な音響結合量推定を実現することができる。
〔第７の実施の形態〕
本形態は、第６の実施の形態の思想を第２の実施の形態に適用した例である。以下では、上述の実施の形態との相違点を中心に説明し、これらと共通する事項については説明を省略する。

＜構成＞
図１４は、第７の実施の形態における音響結合量推定装置８０の構成を例示したブロック図である。なお、図１４における矢印は情報の流れを示しているが、制御部１８に入出力される情報の流れは省略してある。また、図１４において第１の実施の形態と共通する部分については図１と同じ符号を付している。
この図に例示するように、本形態の音響結合量推定装置８０は、受話レベル計算部１１と、ピーク区間検出部１３と、時間平滑部１５と、送話レベル計算部１６と、制御部１８と、受話検出部２２と、音響結合量計算部２４と、受話ノイズレベル推定部２５と、送話ノイズレベル推定部２６と、送話検出部８１と、メモリ８７とを有している。そして、音響結合量推定装置８０は、制御部１８の制御のもと、受話信号ｘ（ｔ）と送話信号ｙ（ｔ）とを用いて音響結合量の推定を行う。

＜処理＞
次に、本形態の音響結合量推定処理を説明する。
図１５及び図１６は、本形態の音響結合量推定処理を説明するためのフローチャートである。以下、この図に沿って、本形態の音響結合量推定処理の詳細を説明していく。
第２の実施の形態との相違点はステップＳ９７の処理が挿入される点であり、その他の処理については第２の実施の形態と同様である。以下では、第２の実施の形態との相違点を中心に説明を行う。

第２の実施の形態におけるステップＳ１１〜Ｓ１６と同様に、受話信号ｘ（ｔ）の受話レベルＲ（ｔ）が算出され（ステップＳ９１）、受話ノイズレベルＮｒ（ｔ）が算出され（ステップＳ９２）、受話レベルＲ（ｔ）＞固定閾値ＴＲ及び受話レベルＲ（ｔ）＞閾値ＴＮであると判断され（ステップＳ９３）、受話レベルＲ（ｔ）がピーク区間のものであると判定され（ステップＳ９４）、送話信号ｙ（ｔ）の送話レベルＳ（ｔ）が算出され（ステップＳ９５）、送話ノイズレベルＮｓ（ｔ）が算出された場合（ステップＳ９６）、第２の実施の形態との相違点であるステップＳ９７の処理が実行される。

ステップＳ９７では、送話検出部８１において、メモリ８７の領域１７ｉから最新の音響結合量ＡＣ（ｔ−１）を、領域１７ｂから受話レベルＲ（ｔ）を、領域１７ｍから送話レベルＳ（ｔ）を、領域２７ｓから、送話ノイズレベルＮｓ（ｔ）をそれぞれ読み込む。そして、送話検出部８１は、送話レベルＳ（ｔ）が、予め設定された固定閾値ＴＳを超え（Ｓ（ｔ）＞ＴＳ）、さらに最新の音響結合量ＡＣ（ｔ−１）と受話レベルＲ（ｔ）とを用いて算出された推定エコーレベルの定数（１より大きな定数）倍である閾値ＴＥを超え（Ｓ（ｔ）＞ＴＥ）、なおかつ送話ノイズレベルＮｓ（ｔ）を定数倍した閾値ＴＮ’を超えた（Ｓ（ｔ）＞ＴＮ’）か否かを判定する。ここで、Ｓ（ｔ）＞ＴＳかつＳ（ｔ）＞ＴＥかつＳ（ｔ）＞ＴＮ’の条件を満たした場合にのみ、送話検出部８１は、送話が行われている旨の情報（送話検出情報）を出力し、メモリ８７の領域８７ｎに格納する。そして、制御部１８は、メモリ８７の領域８７ｎを参照し、そこに送話検出情報が格納されていない場合には、ステップＳ１００（第１の実施の形態のステップＳ７と同様）及びＳ１０１以降の処理を実行させる。すなわち、この場合には、音響結合量計算部２４は、送話レベルＳ（ｔ）に対応する新たな音響結合量の瞬時値を算出しない。一方、メモリ８７の領域８７ｎに送話検出情報が格納されている場合には、制御部１８は、以下のステップＳ９８以降の処理を実行させる。なお、ステップＳ９８以降の処理は第２の実施の形態におけるステップＳ１７，Ｓ１８，Ｓ２０と同様である。ただし、ステップＳ１０１の処理は、領域８７ｎのデータを削除する処理が加わる点でステップＳ２０の処理と異なる。

〔第８の実施の形態〕
本形態は、第３の実施の形態の変形例であり、送話検出部において送話が行われているか否かを判定し、送話が行われている場合に音響結合量の更新量（更新前の音響結合量と新たな音響結合量との差）を小さくする例である。以下では、第３の実施の形態との相違点を中心に説明し、第３の実施の形態と共通する事項については説明を省略する。
＜構成＞
図１７は、本形態における音響結合量推定装置９０の構成を示したブロック図である。なお、図１７における矢印は情報の流れを示しているが、制御部１８に入出力される情報の流れは省略してある。また、図６において第１の実施の形態と共通する部分については図１と同じ符号を付している。

この図に例示するように、本形態の音響結合量推定装置９０は、受話レベル計算部１１と、受話検出部１２と、ピーク区間検出部１３と、送話レベル計算部１６と、制御部１８と、音響結合量記憶部３１と、音響結合量更新部３４と、送話検出部９１と、メモリ９７とを有している。なお、音響結合量更新部３４は、推定エコーレベル算出部３４ａと、比較部３４ｂと、更新部３４ｃとを有している。そして、音響結合量推定装置３０は、制御部１８の制御のもと、受話信号ｘ（ｔ）と送話信号ｙ（ｔ）とを用いて音響結合量の推定を行う。

＜処理＞
次に、本形態の音響結合量推定処理を説明する。
図１８は、本形態の音響結合量推定処理を説明するためのフローチャートである。以下、この図に沿って、本形態の音響結合量推定処理の詳細を説明していく。
第３の実施の形態との相違点はステップＳ１１８〜Ｓ１２０の処理であり、その他の処理については第３の実施の形態と同様である。以下では、第３の実施の形態との相違点を中心に説明を行う。

第３の実施の形態におけるステップＳ３１〜Ｓ３６と同様に、受話信号ｘ（ｔ）の受話レベルＲ（ｔ）が算出され（ステップＳ１１１）、受話レベルＲ（ｔ）＞固定閾値ＴＲであると判断され（ステップＳ１１２）、受話レベルＲ（ｔ）がピーク区間のものであると判定され（ステップＳ１１３）、送話信号ｙ（ｔ）の送話レベルＳ（ｔ）が算出され（ステップＳ１１４）、推定エコーレベルＡＣ（ｔ’）・Ｒ（ｔ）が算出され（ステップＳ１１５）、ＡＣ（ｔ’）・Ｒ（ｔ）＜Ｓ（ｔ）であると判定された（ステップＳ１１６）場合、第３の実施の形態との相違点であるステップＳ１１８の処理が実行される。

ステップＳ１１８では、送話検出部９１において、音響結合量記憶部３１から最新の音響結合量ＡＣ（ｔ’）を、メモリ９７の領域１７ｂから受話レベルＲ（ｔ）を、領域１７ｍから送話レベルＳ（ｔ）をそれぞれ読み込む。そして、送話検出部９１は、送話レベルＳ（ｔ）が、予め設定された固定閾値ＴＳを超え（Ｓ（ｔ）＞ＴＳ）、さらに最新の音響結合量ＡＣ（ｔ’）と受話レベルＲ（ｔ）とを用いて算出された推定エコーレベルの定数（１より大きな定数）倍である閾値ＴＥを超えた（Ｓ（ｔ）＞ＴＥ）か否かを判定する。ここで、Ｓ（ｔ）＞ＴＳ及びＳ（ｔ）＞ＴＥの条件を満たした場合にのみ、送話検出部９１は、送話が行われている旨の情報（送話検出情報）を出力し、メモリ９７の領域９７ｎに格納する。そして、制御部１８は、メモリ９７の領域９７ｎを参照し、そこに送話検出情報が格納されている場合、音響結合量更新部３４に指示を与え、音響結合量更新部３４は、式（１３ａ）によって算出された新たな音響結合量ＡＣ（ｔ）によって音響結合量記憶部３１のデータを更新する（ステップＳ１１９）。一方、領域９７ｎに送話検出情報が格納されていない場合、制御部１８は、音響結合量更新部３４に指示を与え、音響結合量更新部３４は、式（１３ｂ）によって算出された新たな音響結合量ＡＣ（ｔ）によって音響結合量記憶部３１のデータを更新する（ステップＳ１２０）。

AC(t)=AC(t’)・q1 …(13a)
AC(t)=AC(t’)・q2 …(13a)
ただし、ｑ１，ｑ２は予め設定された定数であり、１＜ｑ１＜ｑ２を満たすものである。すなわち、送話検出部９１から送話が行われている旨の情報（送話検出情報）が出力された場合、音響結合量更新部３４は、更新前の音響結合量と新たな音響結合量との差を小さくして音響結合量記憶部３１に格納されているデータの更新を行う。その後、第３の実施の形態のステップＳ３９と同様なステップＳ１２１の処理を行う。ただし、ステップＳ１２１の処理は、領域９７ｎのデータを削除する処理が加わる点でステップＳ３９の処理と異なる。

なお、ステップＳ１１９の処理を行わない構成としてもよい。この場合、音響結合量更新部３４は、送話検出部９１から送話が行われている旨の情報（送話検出情報）が出力された際、音響結合量記憶部３１に格納されているデータの更新を行わないこととなる。
〔第９の実施の形態〕
本形態は、第５の実施の形態において、送話検出部において、少なくとも送話レベルが、推定エコーレベルの定数（１より大きな定数）倍を超えたことを条件に、送話が行われている旨の情報を出力し、送話検出部から送話が行われている旨の情報（送話検出情報）が出力された場合、音響結合量更新部は、音響結合量記憶部に格納されているデータの更新を行わないか、更新前の音響結合量と新たな音響結合量との差を小さくして音響結合量記憶部に格納されているデータの更新を行う例である。なお、処理一般については第５の実施の形態と同様であり、送話検出情報が出力された後の処理については第６〜８の実施の形態と同様（周波数ごとの処理となる点を除いては）であるため説明を省略し、送話検出部のみについて詳細に説明する。

図１９は、第９の実施の形態における音響結合量推定装置１００の構成を例示したブロック図である。なお、図１９における矢印は情報の流れを示しているが、制御部５３に入出力される情報の流れは一部を除き省略してある。
この図に例示するように、本形態の音響結合量推定装置１００は、受話信号周波数変換部５１と、送話周波数変換部５２と、Ｎ個の音響結合量推定部６０−１〜Ｎと、制御部５３と、送話検出部１１０とを有している。そして、音響結合量推定装置１００は、制御部５３の制御のもと、受話信号ｘ（ｔ）と送話信号ｙ（ｔ）とを用い、周波数ごとに音響結合量の推定を行う。

図２０は、図１９における送話検出部１１０の構成を例示したブロック図である。なお、図２０における矢印は情報の流れを示している。
この図に例示するように、送話検出部１１０は、受話レベル計算部１１１、レベル計算部１１３、送話ノイズレベル推定部１１４、統合部１１５、時間領域変換部１１６、比較部１１７及びメモリ１１８を有しており、時間領域の受話信号ｘ（ｔ）及び送話信号ｙ（ｔ）と各音響結合量推定部６０−１〜Ｎから出力された時間周波数領域の音響結合量とを用い、送話検出を行う。

＜送話検出部の処理＞
図２１は、送話検出部１１０の処理を説明するためのフローチャートである。以下、この図を用いて送話検出部１１０の処理を説明する。
まず、図２１に示す処理の前提として、メモリ１１８のデータをクリアし、さらに領域１１８ａ，１１８ｃ，１１８ｆ，１１８ｈに所定の初期値（例えば、各領域に格納される値の平均的な値）を格納する。その後、以下の処理を実行する。
まず、統合部１１５において、各音響結合量推定部６０−１〜Ｎのメモリから時間ｔにおける時間周波数領域の音響結合量を読み出し、これらを統合し（ステップＳ１３１）、時間領域変換部１１６において、逆フーリエ変換等により、その統合結果を時間領域に変換して音響結合量ＡＣ（ｔ）を算出する（ステップＳ１３２）。なお、この音響結合量ＡＣ（ｔ）は、メモリ１１８の領域１１８ｅに格納される。

次に、受話レベル計算部１１１に時間領域の受話信号ｘ（ｔ）が入力され、受話レベル計算部１１１は、受話信号ｘ（ｔ）の受話レベルＲ（ｔ）を算出してメモリ１１８の領域１１８ｂに格納する。ここで、受話レベルＲ（ｔ）の算出は、例えば、第１の実施の形態の受話レベル計算部１１と同様に行う（ステップＳ１３３）。
次に、送話レベル計算部１１３に時間領域の送話信号ｙ（ｔ）が入力され、送話レベル計算部１１３は、送話信号ｙ（ｔ）の送話レベルＳ（ｔ）を算出してメモリ１１８の領域１１８ｉに格納する。ここで、送話レベルＳ（ｔ）の算出は、例えば、第１の実施の形態の送話レベル計算部１６と同様に行う（ステップＳ１３４）。

次に、送話ノイズレベル推定部１１４において、メモリ１１８の領域１１８ｆから送話ノイズレベルＮｓ（ｔ−１）を読み込み、領域１１８ｉから送話レベルＳ（ｔ）を読み込み、第２の実施の形態のステップＳ１２と同様な手順（例えば、Ns(t)=S(t)〔for Ns(t-1)>S(t)〕,Ns(t)=u・Ns(t‐1)+(1-u)・S(t)〔for Nr(t-1)<R(t)〕，0<u<1）により送話ノイズレベルＮｓ（ｔ）を算出し、メモリ１１８の領域１１８ｇに格納する（ステップＳ１３５）。
次に、比較部１１７において、メモリ１１８の領域１１８ｅから最新の音響結合量ＡＣ（ｔ−１）を、領域１１８ｂから受話レベルＲ（ｔ）を、領域１１８ｉから送話レベルＳ（ｔ）を、領域１１８ｇから、送話ノイズレベルＮｓ（ｔ）をそれぞれ読み込む。そして、比較部１１７は、送話レベルＳ（ｔ）が、予め設定された固定閾値ＴＳを超え（Ｓ（ｔ）＞ＴＳ）、さらに最新の音響結合量ＡＣ（ｔ−１）と受話レベルＲ（ｔ）とを用いて算出された推定エコーレベルの定数（１より大きな定数）倍である閾値ＴＥを超え（Ｓ（ｔ）＞ＴＥ）、なおかつ送話ノイズレベルＮｓ（ｔ）を定数倍した閾値ＴＮ’を超えた（Ｓ（ｔ）＞ＴＮ’）か否かを判定する。ここで、Ｓ（ｔ）＞ＴＳかつＳ（ｔ）＞ＴＥかつＳ（ｔ）＞ＴＮ’の条件を満たした場合にのみ、比較部１１７は、送話検出信号を制御部５３（図１９）に対して出力する（ステップＳ１３７）。そして、制御部５３は、ｔ＋１を新たなｔとし、メモリ１１８の領域１１８ｂのデータを領域１１８ａに移し、領域１１８ｇのデータを領域１１８ｆに移し、領域１１８ｉのデータを領域１１８ｈに移し、ステップＳ１３１以降の処理を繰り返し実行させる。また、送話検出信号が入力された制御部５３は、各音響結合量推定部６０−１〜Ｎに対し、音響結合量記憶部に格納されているデータの更新を行わないか、更新前の音響結合量と新たな音響結合量との差を小さくして音響結合量記憶部に格納されているデータの更新を行う旨の指示を与える。

なお、本発明は上述の各実施の形態に限定されるものではなく、各形態の思想を組合せる等、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。
また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよいが、具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、ＤＶＤ（Digital Versatile Disc）、ＤＶＤ−ＲＡＭ（Random Access Memory）、ＣＤ−ＲＯＭ（Compact Disc Read Only Memory）、ＣＤ−Ｒ（Recordable）／ＲＷ（ReWritable）等を、光磁気記録媒体として、ＭＯ（Magneto-Optical disc）等を、半導体メモリとしてＥＥＰ−ＲＯＭ（Electronically Erasable and Programmable-Read Only Memory）等を用いることができる。

また、このプログラムの流通は、例えば、そのプログラムを記録したＤＶＤ、ＣＤ−ＲＯＭ等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるＡＳＰ（Application Service Provider）型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの（コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等）を含むものとする。

また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

本発明の適用分野としては、例えば、ＴＶ会議や音声会議などハンズフリー通信システムにおける送話検出やハウリング防止のための音声スイッチを例示できるが、特にこれに限定されるものではない。

図１は、第１の実施の形態における音響結合量推定装置の構成を例示したブロック図である。図２は、第１の実施の形態における音響結合量推定処理を説明するためのフローチャートである。図３は、受話レベルＲ（ｔ）が固定閾値ＴＲを超え、さらに受話レベルＲ（ｔ）がピーク区間にあるという状態を説明するためのグラフである。図４は、第２の実施の形態における音響結合量推定装置の構成を例示したブロック図である。図５は、第２の実施の形態における音響結合量推定処理を説明するためのフローチャートである。図６は、第３の実施の形態における音響結合量推定装置の構成を示したブロック図である。図７は、本形態の音響結合量推定処理を説明するためのフローチャートである。図８は、第４の実施の形態における音響結合量推定装置の構成を例示したブロック図である。図９は、第４の実施の形態における音響結合量推定処理を説明するためのフローチャートである。図１０は、第５の実施の形態における音響結合量推定装置の構成を例示したブロック図である。図１１は、図１０における音響結合量推定部の構成を例示したブロック図である。図１２は、第６の実施の形態における音響結合量推定装置の構成を例示したブロック図である。図１３は、第６の実施の形態における音響結合量推定処理を説明するためのフローチャートである。第７の実施の形態における音響結合量推定装置の構成を例示したブロック図である。図１５は、第７の実施の形態における音響結合量推定処理を説明するためのフローチャートである。図１６は、第７の実施の形態における音響結合量推定処理を説明するためのフローチャートである。図１７は、第８の実施の形態における音響結合量推定装置の構成を示したブロック図である。図１８は、第８の実施の形態における音響結合量推定処理を説明するためのフローチャートである。図１９は、第９の実施の形態における音響結合量推定装置の構成を例示したブロック図である。図２０は、図１９における送話検出部の構成を例示したブロック図である。図２１は、図１９における送話検出部の処理を説明するためのフローチャートである。図２２は、従来の音響結合量推定装置の構成を示す構成図である。

符号の説明

１０〜１００音響結合量推定装置

Claims

音響結合量の推定を行う音響結合量推定方法であって、
受話レベル計算手段に受話信号が入力され、当該受話レベル計算手段において、当該受話信号のパワーレベル（以下「受話レベル」という。）を算出して出力するステップと、
受話検出手段において、前記受話レベルと予め設定された固定閾値とを比較し、当該固定閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力するステップと、
ピーク区間検出手段において、前記受話レベルが前記固定閾値よりも大きい区間であり、受話レベルが増加しなくなった点から、所定の条件を満たす間の区間をピーク区間と判定し、その判定結果を出力するステップと、
送話レベル計算手段に送話信号が入力され、当該送話レベル計算手段において、当該送話信号のパワーレベル（以下「送話レベル」という。）を算出して出力するステップと、
少なくとも前記受話検出手段から受話があった旨の情報が出力され、前記ピーク区間検出手段から前記受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、音響結合量計算手段において、前記受話レベルと前記送話レベルとの比から音響結合量の瞬時値を算出して出力するステップと、
時間平滑手段において、前記音響結合量の瞬時値から音響結合量を算出して出力するステップと、
を有することを特徴とする音響結合量推定方法。
音響結合量の推定を行う音響結合量推定方法であって、
受話レベル計算手段に受話信号が入力され、当該受話レベル計算手段において、当該受話信号のパワーレベル（以下「受話レベル」という。）を算出して出力するステップと、
受話ノイズレベル推定手段において、前記受話レベルから前記受話信号のノイズレベルの推定値（以下「受話ノイズレベル」という）を算出して出力するステップと、
受話検出手段において、前記受話ノイズレベルの定数倍の閾値及び予め設定された固定閾値と、前記受話レベルとを比較し、これら両方の閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力するステップと、
ピーク区間検出手段において、前記受話レベルが前記固定閾値よりも大きい区間であり、受話レベルが増加しなくなった点から、所定の条件を満たす間の区間をピーク区間と判定し、その判定結果を出力するステップと、
送話レベル計算手段に送話信号が入力され、当該送話レベル計算手段において、当該送話信号のパワーレベル（以下「送話レベル」という。）を算出して出力するステップと、
送話ノイズレベル推定手段において、前記送話レベルから前記送話信号のノイズレベルの推定値（以下「送話ノイズレベル」という。）を算出して出力するステップと、
少なくとも前記受話検出手段から受話があった旨の情報が出力され、前記ピーク区間検出手段から前記受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、音響結合量計算手段において、前記受話レベルから前記受話ノイズレベルを減じた値と前記送話レベルから前記送話ノイズレベルを減じた値との比から音響結合量の瞬時値を算出して出力するステップと、
時間平滑手段において、前記音響結合量の瞬時値から音響結合量を算出して出力するステップと、
を有することを特徴とする音響結合量推定方法。
音響結合量の推定を行う音響結合量推定方法であって、
受話レベル計算手段に受話信号が入力され、当該受話レベル計算手段において、当該受話信号のパワーレベル（以下「受話レベル」という。）を算出して出力するステップと、
受話検出手段において、前記受話レベルと予め設定された固定閾値とを比較し、当該固定閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力するステップと、
ピーク区間検出手段において、前記受話レベルが前記固定閾値よりも大きい区間であり、受話レベルが増加しなくなった点から、所定の条件を満たす間の区間をピーク区間と判定し、その判定結果を出力するステップと、
送話レベル計算手段に送話信号が入力され、当該送話レベル計算手段において、当該送話信号のパワーレベル（以下「送話レベル」という。）を算出して出力するステップと、
少なくとも前記受話検出手段から受話があった旨の情報が出力され、前記ピーク区間検出手段から前記受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、音響結合量更新手段において、音響結合量記憶手段に格納されている最新の音響結合量に前記受話レベルを乗じた推定エコーレベルと前記送話レベルとを比較し、当該推定エコーレベルよりも送話レベルのほうが大きい場合に、当該最新の音響結合量よりも大きな値を新たな音響結合量として前記音響結合量記憶手段のデータを更新し、当該推定エコーレベルよりも送話レベルのほうが小さい場合に、当該最新の音響結合量よりも小さな値を新たな音響結合量として前記音響結合量記憶手段のデータを更新するステップと、
を有することを特徴とする音響結合量推定方法。
音響結合量の推定を行う音響結合量推定方法であって、
受話レベル計算手段に受話信号が入力され、当該受話レベル計算手段において、当該受話信号のパワーレベル（以下「受話レベル」という。）を算出して出力するステップと、
受話ノイズレベル推定手段において、前記受話レベルから前記受話信号のノイズレベルの推定値（以下「受話ノイズレベル」という）を算出して出力するステップと、
受話検出手段において、前記受話ノイズレベルの定数倍の閾値及び予め設定された固定閾値と、前記受話レベルとを比較し、これら両方の閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力するステップと、
ピーク区間検出手段において、前記受話レベルが前記固定閾値よりも大きい区間であり、受話レベルが増加しなくなった点から、所定の条件を満たす間の区間をピーク区間と判定し、その判定結果を出力するステップと、
送話レベル計算手段に送話信号が入力され、当該送話レベル計算手段において、当該送話信号のパワーレベル（以下「送話レベル」という。）を算出して出力するステップと、
送話ノイズレベル推定手段において、前記送話レベルから前記送話信号のノイズレベルの推定値（以下「送話ノイズレベル」という。）を算出して出力するステップと、
少なくとも前記受話検出手段から受話があった旨の情報が出力され、前記ピーク区間検出手段から前記受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、音響結合量更新手段において、前記受話レベルから前記受話ノイズレベルを減じた値に音響結合量記憶手段に格納されている最新の音響結合量を乗じた推定エコーレベルと、前記送話レベルから前記送話ノイズレベルを減じた値とを比較し、当該推定エコーレベルよりも前記送話レベルから前記送話ノイズレベルを減じた値のほうが大きい場合に、当該最新の音響結合量よりも大きな値を新たな音響結合量として前記音響結合量記憶手段のデータを更新し、当該推定エコーレベルよりも前記送話レベルから前記送話ノイズレベルを減じた値のほうが小さい場合に、当該最新の音響結合量よりも小さな値を新たな音響結合量として前記音響結合量記憶手段のデータを更新するステップと、
を有することを特徴とする音響結合量推定方法。
請求項１から４の何れかに記載の音響結合量推定方法であって、
受話周波数領域変換手段において、時間領域の受話信号を時間周波数領域の受話信号に変換して出力するステップと、
送話周波数領域変換手段において、時間領域の送話信号を時間周波数領域の送話信号に変換して出力するステップと、をさらに有し、
前記受話レベル計算手段に入力される前記受話信号が、前記受話周波数領域変換手段から出力された時間周波数領域の受話信号であり、
前記送話レベル計算手段に入力される前記送話信号が、前記送話周波数領域変換手段から出力された時間周波数領域の送話信号であり、
請求項１から４の各ステップが周波数毎に実行される、
ことを特徴とする音響結合量推定方法。
請求項１，２或いは５に記載の音響結合量推定方法であって、
送話検出手段において、少なくとも前記送話レベルが、最新の前記音響結合量と前記受話レベルとを用いて算出された推定エコーレベルの定数（１より大きな定数）倍を超えたことを条件に、送話が行われている旨の情報を出力するステップをさらに有し、
前記送話検出手段から送話が行われている旨の情報が出力された場合、前記音響結合量計算手段は、前記推定エコーレベルの定数倍を超えた前記送話レベルに対応する新たな音響結合量の瞬時値の算出を行わない、
ことを特徴とする音響結合量推定方法。
請求項３から５のいずれかに記載の音響結合量推定方法であって、
送話検出手段において、少なくとも前記送話レベルが、前記推定エコーレベルの定数（１より大きな定数）倍を超えたことを条件に、送話が行われている旨の情報を出力するステップをさらに有し、
前記送話検出手段から送話が行われている旨の情報が出力された場合、前記音響結合量更新手段は、前記音響結合量記憶手段に格納されているデータの更新を行わないか、更新前の音響結合量と新たな音響結合量との差を小さくして前記音響結合量記憶手段に格納されているデータの更新を行う、
ことを特徴とする音響結合量推定方法。
音響結合量の推定を行う音響結合量推定装置であって、
受話信号が入力され、当該受話信号のパワーレベル（以下「受話レベル」という。）を算出して出力する受話レベル計算手段と、
前記受話レベルと予め設定された固定閾値とを比較し、当該固定閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力する受話検出手段と、
前記受話レベルが前記固定閾値よりも大きい区間であり、受話レベルが増加しなくなった点から、所定の条件を満たす間の区間をピーク区間と判定し、その判定結果を出力するピーク区間検出手段と、
送話信号のパワーレベル（以下「送話レベル」という。）を算出して出力する送話レベル計算手段と、
少なくとも前記受話検出手段から受話があった旨の情報が出力され、前記ピーク区間検出手段から前記受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、前記受話レベルと前記送話レベルとの比から音響結合量の瞬時値を算出して出力する音響結合量計算手段と、
前記音響結合量の瞬時値から音響結合量を算出して出力する時間平滑手段と、
を有することを特徴とする音響結合量推定装置。
音響結合量の推定を行う音響結合量推定装置であって、
受話信号が入力され、当該受話信号のパワーレベル（以下「受話レベル」という。）を算出して出力する受話レベル計算手段と、
前記受話レベルから前記受話信号のノイズレベルの推定値（以下「受話ノイズレベル」という）を算出して出力する受話ノイズレベル推定手段と、
前記受話ノイズレベルの定数倍の閾値及び予め設定された固定閾値と、前記受話レベルとを比較し、これら両方の閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力する受話検出手段と、
前記受話レベルが前記固定閾値よりも大きい区間であり、受話レベルが増加しなくなった点から、所定の条件を満たす間の区間をピーク区間と判定し、その判定結果を出力するピーク区間検出手段と、
送話レベル計算手段に送話信号が入力され、当該送話信号のパワーレベル（以下「送話レベル」という。）を算出して出力する送話レベル計算手段と、
前記送話レベルから前記送話信号のノイズレベルの推定値（以下「送話ノイズレベル」という。）を算出して出力する送話ノイズレベル推定手段と、
少なくとも前記受話検出手段から受話があった旨の情報が出力され、前記ピーク区間検出手段から前記受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、前記受話レベルから前記受話ノイズレベルを減じた値と前記送話レベルから前記送話ノイズレベルを減じた値との比から音響結合量の瞬時値を算出して出力する音響結合量計算手段と、
前記音響結合量の瞬時値から音響結合量を算出して出力する時間平滑手段と、
を有することを特徴とする音響結合量推定装置。
音響結合量の推定を行う音響結合量推定装置であって、
受話信号が入力され、当該受話信号のパワーレベル（以下「受話レベル」という。）を算出して出力する受話レベル計算手段と、
前記受話レベルと予め設定された固定閾値とを比較し、当該固定閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力する受話検出手段と、
前記受話レベルが前記固定閾値よりも大きい区間であり、受話レベルが増加しなくなった点から、所定の条件を満たす間の区間をピーク区間と判定し、その判定結果を出力するピーク区間検出手段と、
送話レベル計算手段に送話信号が入力され、当該送話信号のパワーレベル（以下「送話レベル」という。）を算出して出力する送話レベル計算手段と、
少なくとも前記受話検出手段から受話があった旨の情報が出力され、前記ピーク区間検出手段から前記受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、音響結合量記憶手段に格納されている最新の音響結合量に前記受話レベルを乗じた推定エコーレベルと前記送話レベルとを比較し、当該推定エコーレベルよりも送話レベルのほうが大きい場合に、当該最新の音響結合量よりも大きな値を新たな音響結合量として前記音響結合量記憶手段のデータを更新し、当該推定エコーレベルよりも送話レベルのほうが小さい場合に、当該最新の音響結合量よりも小さな値を新たな音響結合量として前記音響結合量記憶手段のデータを更新する音響結合量更新手段と、
を有することを特徴とする音響結合量推定装置。
音響結合量の推定を行う音響結合量推定装置であって、
受話信号が入力され、当該受話信号のパワーレベル（以下「受話レベル」という。）を算出して出力する受話レベル計算手段と、
前記受話レベルから前記受話信号のノイズレベルの推定値（以下「受話ノイズレベル」という）を算出して出力する受話ノイズレベル推定手段と、
前記受話ノイズレベルの定数倍の閾値及び予め設定された固定閾値と、前記受話レベルとを比較し、これら両方の閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力する受話検出手段と、
前記受話レベルが前記固定閾値よりも大きい区間であり、受話レベルが増加しなくなった点から、所定の条件を満たす間の区間をピーク区間と判定し、その判定結果を出力するピーク区間検出手段と、
送話レベル計算手段に送話信号が入力され、当該送話信号のパワーレベル（以下「送話レベル」という。）を算出して出力する送話レベル計算手段と、
前記送話レベルから前記送話信号のノイズレベルの推定値（以下「送話ノイズレベル」という。）を算出して出力する送話ノイズレベル推定手段と、
少なくとも前記受話検出手段から受話があった旨の情報が出力され、前記ピーク区間検出手段から前記受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、前記受話レベルから前記受話ノイズレベルを減じた値に音響結合量記憶手段に格納されている最新の音響結合量を乗じた推定エコーレベルと、前記送話レベルから前記送話ノイズレベルを減じた値とを比較し、当該推定エコーレベルよりも前記送話レベルから前記送話ノイズレベルを減じた値のほうが大きい場合に、当該最新の音響結合量よりも大きな値を新たな音響結合量として前記音響結合量記憶手段のデータを更新し、当該推定エコーレベルよりも前記送話レベルから前記送話ノイズレベルを減じた値のほうが小さい場合に、当該最新の音響結合量よりも小さな値を新たな音響結合量として前記音響結合量記憶手段のデータを更新する音響結合量更新手段と、
を有することを特徴とする音響結合量推定装置。
請求項８から１１の何れかに記載の音響結合量推定装置であって、
時間領域の受話信号を時間周波数領域の受話信号に変換して出力する受話周波数領域変換手段と、
時間領域の送話信号を時間周波数領域の送話信号に変換して出力する送話周波数領域変換手段と、をさらに有し、
前記受話レベル計算手段に入力される前記受話信号が、前記受話周波数領域変換手段から出力された時間周波数領域の受話信号であり、
前記送話レベル計算手段に入力される前記送話信号が、前記送話周波数領域変換手段から出力された時間周波数領域の送話信号であり、
請求項８から１１の各手段における処理が周波数毎に実行される、
ことを特徴とする音響結合量推定装置。
請求項８，９或いは１２に記載の音響結合量推定装置であって、
少なくとも前記送話レベルが、最新の前記音響結合量と前記受話レベルとを用いて算出された推定エコーレベルの定数（１より大きな定数）倍を超えたことを条件に、送話が行われている旨の情報を出力する送話検出手段をさらに有し、
前記送話検出手段から送話が行われている旨の情報が出力された場合、前記音響結合量計算手段は、前記推定エコーレベルの定数倍を超えた前記送話レベルに対応する新たな音響結合量の瞬時値の算出を行わない、
ことを特徴とする音響結合量推定装置。
請求項１０から１２のいずれかに記載の音響結合量推定装置であって、
少なくとも前記送話レベルが、前記音響結合量と前記受話レベルとを用いて算出された推定音響エコーレベルの定数（１より大きな定数）倍を超えたことを条件に、送話が行われている旨の情報を出力する送話検出手段をさらに有し、
前記送話検出手段から送話が行われている旨の情報が出力された場合、前記音響結合量更新手段は、前記音響結合量記憶手段に格納されているデータの更新を行わないか、更新前の音響結合量と新たな音響結合量との差を小さくして前記音響結合量記憶手段に格納されているデータの更新を行う、
ことを特徴とする音響結合量推定装置。
請求項１から７のいずれかに記載の音響結合量推定方法をコンピュータに実行させるための音響結合量推定プログラム。
請求項１から７のいずれかに記載の音響結合量推定方法をコンピュータに実行させるための音響結合量推定プログラムを格納したコンピュータ読み取り可能な記録媒体。