JP4559914B2 - 音響結合量推定方法、その装置、そのプログラム及びその記録媒体 - Google Patents

音響結合量推定方法、その装置、そのプログラム及びその記録媒体 Download PDF

Info

Publication number
JP4559914B2
JP4559914B2 JP2005151144A JP2005151144A JP4559914B2 JP 4559914 B2 JP4559914 B2 JP 4559914B2 JP 2005151144 A JP2005151144 A JP 2005151144A JP 2005151144 A JP2005151144 A JP 2005151144A JP 4559914 B2 JP4559914 B2 JP 4559914B2
Authority
JP
Japan
Prior art keywords
level
acoustic coupling
reception
coupling amount
transmission
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005151144A
Other languages
English (en)
Other versions
JP2006332872A (ja
Inventor
和則 小林
陽一 羽田
賢一 古家
章俊 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005151144A priority Critical patent/JP4559914B2/ja
Publication of JP2006332872A publication Critical patent/JP2006332872A/ja
Application granted granted Critical
Publication of JP4559914B2 publication Critical patent/JP4559914B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、音響結合量を推定する技術に関する。
近年、テレビ会議システムや音声会議システム等のハンズフリー通信システムの導入が様々な分野で進められている。このようなハンズフリー通信システムは、従来の電話通話装置の様に送受話器を手に持つことなく、自然な対面通話を実現することができるという利点を有する。
しかし、このようなハンズフリー通信システムを良好に作動させるためには、反響の問題を解決しなければならない。すなわち、このようなシステムの場合、送話者側の端末装置に設置されたマイクロホンから入力された音声の情報は、増幅器、通信路等を通じて受話者側の端末装置に送られ、そこに設置されたスピーカから音声として出力される。この出力された音声の一部は、さらに受話者側の端末装置に設置されたマイクロホンにより受音され、受話信号として、増幅器、通信路等を通じて送話者側の端末装置に送信され、送話者側のスピーカから音声として出力される。ここで、この送話者側のスピーカから出力される音声は、送話者自身が発話した音声である。このように自分の発声した音声が自身のスピーカから再生される反響現象を音響エコーと呼ぶ。この音響エコーは、ハンズフリー通信システムにおいて通話の障害、不快感その他の悪影響を生じさせる。特に、この送話者側のスピーカから再生された発声が、更に送話者側のマイクロホンにより受音された場合、信号の閉ループが形成される。そして、このループゲインが1より大きい場合にはハウリング現象が発生して通話は不能となる。
このような音響エコーに起因する問題を解消するため、近年、音声スイッチ、反響消去装置その他の反響エコーによる悪影響を緩和する装置が利用されている(例えば、特許文献1参照)。この様な音声スイッチ或いは反響消去装置においては、ループゲインを1以下にしてハウリングを防止するための音声スイッチの減衰量の適切な設定や、送受話の状態の判別が大変に重要である。そして、このような減衰量設定や送受話状態判定には音響結合量が用いられる。
以下、従来の音響結合量推定方法について説明する。
図22は、従来の音響結合量推定装置200の構成を示す構成図である。従来の音響結合量推定装置200は、受話レベル計算部201と、受話検出部202と、送話レベル計算部203と、音響結合量計算部204と、時間平滑部205とにより構成される。
受話レベル計算部201は、受話信号(スピーカ出力信号)x(t)を時間平均し、受話レベルR(t)を求める。この計算は、たとえば、以下の式(1)を用いて行われる。
R(t)=a・R(t‐1)+(1‐a)・|x(t)| …(1)
ただし、aは予め設定された0<a<1の平滑化係数である。aが1に近いほど、より緩やかなレベル変化となる。
受話検出部202は、予め設定された固定閾値TRと受話レベルR(t)を比較し、受話レベルR(t)が固定閾値TRよりも大きい場合(R(t)>TR)に受話があったと判定する。送話レベル計算部203は、受話レベル計算部201と同様にして、送話信号(マイクロホン受話信号)y(t)の送話レベルs(t)を求める。そして、音響結合量計算部204は、受話検出部202において受話があったと判定された場合にのみ、受話レベルR(t)と送話レベルS(t)の比から、推定音響結合量の瞬時値AC’(t)を求める。これを式で表せば、式(2)となる。
AC'(t)=S(t)/R(t) …(2)
時間平滑部205は、推定音響結合量の瞬時値AC’(t)を時間平滑化して、より正確な推定音響結合量AC(t)を求める。ただし、ダブルトーク時においては送話信号に送話音声が混合しているので、推定音響結合量の瞬時値AC’(t)は、真の値よりも大きな値となってしまう。この影響を少なくするため、この場合にはディップホールドを用いた時間平滑化が行われる。このディップホールドを用いた平滑化は、例えば式(3a)(3b)により実現される。
AC(t)=b・AC(t・1)+(1‐b)・AC'(t) for AC(t‐1)>AC'(t) …(3a)
AC(t)=c・AC(t‐1)+(1‐c)・AC'(t) for AC(t‐1)<AC'(t) …(3b)
ただし、bは推定音響結合量増加時の平滑化係数であり、cは推定音響結合量減少時の平滑化係数であり、それぞれ0<b,0<c<1の値をあらかじめ設定する。b>>cとなるように設定すれば、推定音響結合量増加時に非常に緩やかな値の上昇となり、ディップホールドの効果が得られる。
以上のように従来技術では音響結合量の推定が行われる。
特開平07−226994号公報
しかし、上述した従来の音響結合量推定方法では、受話があったか否かの判断に使用する固定閾値TRの適切な設定が困難である。すなわち、この固定閾値TRを低く設定しすぎた場合、送話信号のエコー成分対雑音成分比が悪い状態で音響結合量を推定することとなり、推定精度が悪くなってしまう。一方、固定閾値TRを高く設定しすぎた場合には、受話検出部202において受話があったと判定される回数が減少し、推定音響結合量の瞬時値AC’(t)の単位時間当たりの算出回数も減少する。これは推定音響結合量の推定速度の低下につながる。また、受話信号のレベルや、送話信号に含まれるノイズレベルなどは、環境や通話相手によって大きく変化するため、固定的な1つの固定閾値TRで、効果的な受話検出を行うことは難しい。そのため、上述した従来の音響結合量推定方法では、音響結合量を精度よく高速に推定を行うことが困難である。
本発明はこのような点に鑑みてなされたものであり、音響結合量を精度よく効率的に推定することが可能な技術的思想を提供することを目的とする。
本発明では上記課題を解決するために、第1の本発明では、受話レベル計算手段に受話信号が入力され、当該受話レベル計算手段において、当該受話信号のパワーレベル(以下「受話レベル」という。)を算出して出力する。また、受話検出手段において、受話レベルと予め設定された固定閾値とを比較し、当該固定閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力する。そして、ピーク区間検出手段において、受話レベルがピーク区間のものであるか否かを判定し、その判定結果を出力する。ここで「ピーク区間」とは、受話レベルがピーク値をとる時間を含むある幅をもった時間区間を意味する。また、送話レベル計算手段に送話信号が入力され、当該送話レベル計算手段において、当該送話信号のパワーレベル(以下「送話レベル」という。)を算出して出力する。そして、少なくとも受話検出手段から受話があった旨の情報が出力され、ピーク区間検出手段から受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、音響結合量計算手段において、受話レベルと送話レベルとの比から音響結合量の瞬時値を算出して出力する。その後、時間平滑手段において、音響結合量の瞬時値から音響結合量を算出して出力する。
ここで、本発明では、少なくとも受話検出手段から受話があった旨の情報が出力され、ピーク区間検出手段から受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、音響結合量の瞬時値を算出する。すなわち、本発明では、受話レベルが、固定閾値よりも大きく、ピーク区間に属する場合にのみ音響結合量の瞬時値が算出される。一般に送話信号のノイズレベルは、ほぼ一定の値をとる。よって、受話レベルがピーク区間にある場合、通常、その受話信号がスピーカから再生され、マイクロホンによって受音された送話信号のエコー成分対雑音成分比はよい。また、ピーク区間にある受話レベルであってもそのピーク自体が小さな場合は送話信号のエコー成分対雑音成分比が悪化する状況も想定されるが、このような状況は受話レベルが固定閾値を下回る場合を対象としないことで排除できる。また、本発明では、受話信号が必ず持つピークという受話レベル自身の時間変動に基づき、音響結合量の瞬時値を算出するか否かを判断するので、受話信号が入力されたときには必ず音響結合量の算出が行われ、高速な推定が実現される。以上述べたように、本発明では、固定的な閾値のみを用いる場合に比べ、エコー成分対雑音成分比が高い送話信号を効率的に選択し、音響結合量を精度よく高速に算出することができる。
また、第2の本発明では、受話レベル計算手段に受話信号が入力され、当該受話レベル計算手段において、当該受話信号の受話レベルを算出して出力し、受話ノイズレベル推定手段において、受話レベルから受話信号の受話ノイズレベルを算出して出力し、受話検出手段において、受話ノイズレベルの定数倍の閾値及び予め設定された固定閾値と、受話レベルとを比較し、これら両方の閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力する。そして、ピーク区間検出手段において、受話レベルがピーク区間のものであるか否かを判定し、その判定結果を出力し、送話レベル計算手段に送話信号が入力され、当該送話レベル計算手段において、当該送話信号のパワーレベル(以下「送話レベル」という。)を算出して出力する。また、送話ノイズレベル推定手段において、送話レベルから送話信号のノイズレベルの推定値(以下「送話ノイズレベル」という。)を算出して出力する。そして、少なくとも受話検出手段から受話があった旨の情報が出力され、ピーク区間検出手段から受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、音響結合量計算手段において、受話レベルから受話ノイズレベルを減じた値と送話レベルから送話ノイズレベルを減じた値との比から音響結合量の瞬時値を算出して出力する。その後、時間平滑手段において、音響結合量の瞬時値から音響結合量を算出して出力する。
ここで、第2の本発明では、さらに受話ノイズレベル及び送話ノイズレベルを推定し、これらをも考慮して音響結合量の瞬時値を算出するか否かを決定する。その結果、エコー成分対雑音成分比が高い送話信号のみを、より正確かつ効率的に選択して音響結合量の瞬時値の算出に用いることができる。
また、第3の本発明では、受話レベル計算手段に受話信号が入力され、当該受話レベル計算手段において、当該受話信号の受話レベルを算出して出力する。また、受話検出手段において、受話レベルと予め設定された固定閾値とを比較し、当該固定閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力する。さらに、ピーク区間検出手段において、受話レベルがピーク区間のものであるか否かを判定し、その判定結果を出力する。また、送話レベル計算手段に送話信号が入力され、当該送話レベル計算手段において、当該送話信号の送話レベルを算出して出力する。そして、少なくとも受話検出手段から受話があった旨の情報が出力され、ピーク区間検出手段から受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、音響結合量更新手段において、音響結合量記憶手段に格納されている最新の音響結合量に受話レベルを乗じた推定エコーレベルと送話レベルとを比較し、当該推定エコーレベルよりも送話レベルのほうが大きい場合に、当該最新の音響結合量よりも大きな値を新たな音響結合量として音響結合量記憶手段のデータを更新し、当該推定エコーレベルよりも送話レベルのほうが小さい場合に、当該最新の音響結合量よりも小さな値を新たな音響結合量として音響結合量記憶手段のデータを更新する。
ここで、第3の本発明では、音響結合量記憶手段に格納されている最新の音響結合量に受話レベルを乗じた推定エコーレベルと送話レベルとを比較することにより、音響結合量記憶手段に格納されている音響結合量の妥当性を判断し、その判断結果に伴い音響結合量記憶手段に格納されている音響結合量を更新することとした。この場合、音響結合量の算出に割り算が不要になる。その結果、割り算器を持たないプロセッサに対しても、少ない演算量で本発明の各手順を実装することが可能となる。
また、第4の本発明では、受話レベル計算手段に受話信号が入力され、当該受話レベル計算手段において、当該受話信号の受話レベルを算出して出力する。また、受話ノイズレベル推定手段において、受話レベルから受話信号の受話ノイズレベルを算出して出力する。さらに、受話検出手段において、受話ノイズレベルの定数倍の閾値及び予め設定された固定閾値と、受話レベルとを比較し、これら両方の閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力する。また、ピーク区間検出手段において、受話レベルがピーク区間のものであるか否かを判定し、その判定結果を出力する。さらに、送話レベル計算手段に送話信号が入力され、当該送話レベル計算手段において、当該送話信号の送話レベルを算出して出力する。また、送話ノイズレベル推定手段において、送話レベルから送話信号の送話ノイズレベルを算出して出力する。そして、少なくとも受話検出手段から受話があった旨の情報が出力され、ピーク区間検出手段から受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、音響結合量更新手段において、受話レベルから受話ノイズレベルを減じた値に音響結合量記憶手段に格納されている最新の音響結合量を乗じた推定エコーレベルと、送話レベルから前記送話ノイズレベルを減じた値とを比較し、当該推定エコーレベルよりも送話レベルから前記送話ノイズレベルを減じた値のほうが大きい場合に、当該最新の音響結合量よりも大きな値を新たな音響結合量として音響結合量記憶手段のデータを更新し、当該推定エコーレベルよりも送話レベルから前記送話ノイズレベルを減じた値のほうが小さい場合に、当該最新の音響結合量よりも小さな値を新たな音響結合量として音響結合量記憶手段のデータを更新する。
また、第1から第4の何れかの本発明において好ましくは、さらに、受話周波数領域変換手段において、時間領域の受話信号を時間周波数領域の受話信号に変換して出力し、送話周波数領域変換手段において、時間領域の送話信号を時間周波数領域の送話信号に変換して出力する。ここで、前述の受話レベル計算手段に入力される受話信号が、受話周波数領域変換手段から出力された時間周波数領域の受話信号であり、送話レベル計算手段に入力される送話信号が、送話周波数領域変換手段から出力された時間周波数領域の送話信号である。そして、第1から第4の何れかの本発明の各処理を周波数毎に実行する。
これにより、エコー成分対雑音成分比が高い送話信号を周波数ごとに選択し、周波数ごとに最適な音響結合量を算出することが可能になる。その結果、より正確かつ効率的に音響結合量を算出することが可能となる。
また、本発明において、好ましくは、送話検出手段において、少なくとも送話レベルが、最新の音響結合量と受話レベルとを用いて算出された推定エコーレベルの定数(1より大きな定数)倍を超えたことを条件に、送話が行われている旨の情報を出力し、送話検出手段から送話が行われている旨の情報が出力された場合、音響結合量計算手段は、推定エコーレベルの定数倍を超えた送話レベルに対応する新たな音響結合量の瞬時値の算出を行わない。
ここで、ダブルトークによって送話が行われていた場合、送話信号にはスピーカから出力された受話のみではなく、この送話も送話信号に含まれてしまう。このような場合、音響結合量を正確に算出することが困難となる。そのため、送話検出手段から送話が行われている旨の情報が出力された場合、音響結合量計算手段が、推定エコーレベルの定数倍を超えた送話レベルに対応する新たな音響結合量の瞬時値の算出を行わないこととすることにより、このような不正確な音響結合量が算出されることを防止できる。
また、本発明において、好ましくは、送話検出手段において、少なくとも送話レベルが、推定エコーレベルの定数(1より大きな定数)倍を超えたことを条件に、送話が行われている旨の情報を出力し、送話検出手段から送話が行われている旨の情報が出力された場合、音響結合量更新手段は、音響結合量記憶手段に格納されているデータの更新を行わないか、更新前の音響結合量と新たな音響結合量との差を小さくして音響結合量記憶手段に格納されているデータの更新を行う。
これにより、送話信号に送話が混合することによる音響結合量の推定誤差を低減させることができる。
以上のように、本発明では、エコー成分対雑音成分比が高い送話信号を効率的に選択し、音響結合量を算出することができるため、音響結合量を精度よく高速に推定することが可能となる。
以下、本発明の実施の形態を図面を参照して説明する。
〔第1の実施の形態〕
まず、本発明における第1の実施の形態について説明する。
<構成>
図1は、第1の実施の形態における音響結合量推定装置10の構成を例示したブロック図である。なお、図1における矢印は情報の流れを示しているが、制御部18に入出力される情報の流れは省略してある。
この図に例示するように、本形態の音響結合量推定装置10は、受話レベル計算部11と、受話検出部12と、ピーク区間検出部13と、音響結合量計算部14と、時間平滑部15と、送話レベル計算部16と、メモリ17と、制御部18とを有している。そして、音響結合量推定装置10は、制御部18の制御のもと、増幅器2及びスピーカ1を通じて出力される受話信号x(t)と、マイクロホン3から入力され増幅器4で増幅された送話信号y(t)とを用い、音響結合量の推定を行う。
ここで、受話レベル計算部11、受話検出部12、ピーク区間検出部13、音響結合量計算部14、時間平滑部15、送話レベル計算部16及び制御部18は、例えば公知のCPU(Central Processing Unit)やMPU(Micro Processing Unit)に所定のプログラムが読み込まれ、これが実行されることによって構成されるものである。また、メモリ17としては、例えば、EEP−ROM(Electronically Erasable and Programmable-Read Only Memory)、RAM(Random Access Memory)等の書き換え可能な半導体メモリを例示できるが、その他磁気記録装置、光ディスク装置或いは光磁気記録装置等を用いることとしてもよい。また、メモリ17は物理的に一体のものに限らず、複数の記録媒体によって構成されていてもよい。
<処理>
本形態では、固定的な閾値を用いて行う受話検出部12による判定処理に加え、受話信号がピーク区間のものであるか否かを検出するピーク区間検出部13による判定処理を併用する。これにより、受話レベルの高い区間のみを検出し、送話信号におけるエコー成分対雑音成分比が大きくなる区間でのみ、音響結合量の推定を行う。その結果、送話信号のノイズが大きい場合でも、精度の高い音響結合量の推定が可能となる。さらに、ピーク区間は、受話信号があればその受話レベルの大小に関わらず必ず検出されるものである。そのため、受話信号の受話レベルの大小に関わらず同一の判定基準を適用でき、精度の高い音響結合量の推定を、十分な推定速度で実現することができる。
以下に、本形態の処理の詳細を述べる。
図2は、本形態の音響結合量推定処理を説明するためのフローチャートである。以下、この図に沿って、本形態の音響結合量推定処理の詳細を説明していく。
まず、図2に示す処理の前提として、メモリ17のデータをクリアし、さらに領域17a,17d,17i,17kに所定の初期値(例えば、各領域に格納される値の平均的な値)を格納する。その後、以下の処理を実行する。
まず、受話レベル計算部11に受話信号x(t)(tは離散時間)が入力され、受話レベル計算部11は、受話信号x(t)の受話レベルR(t)を算出して出力する(ステップS1)。ここで、受話レベルR(t)の算出は、例えば以下のように行われる。
[受話レベルR(t)の算出例1]
受話レベル計算部11において、メモリ17の領域17aから受話レベルR(t‐1)(存在しない場合には所定の初期値)を読み込み、式(4)の演算を行う。
R(t)=a・R(t‐1)+(1‐a)・|x(t)| …(4)
ただし、aは予め設定された平滑化係数であり、0<a<1の範囲をとる。ここで、aが1に近いほど、時間変化に伴う受話レベルR(t)の変化が緩やかになる。
[受話レベルR(t)の算出例2]
また、スピーカ、マイクロホン間の応答の残響時間を模擬するため、受話レベル上昇時の平滑化係数を小さくし、下降時の平滑化係数を大きくする方法を用いてもよい。すなわち、受話レベル計算部11において、メモリ17の領域17aから受話レベルR(t‐1)を読み込み、式(5a)(5b)の演算を行うこととしてもよい。
R(t)=d・R(t‐1)+(1‐d)・|x(t)| for R(t‐1)>|x(t)| …(5a)
R(t)=e・R(t‐1)+(1‐c)・|x(t)| for R(t‐1)<|x(t)| …(5b)
ただし、dはレベル増加時の平滑化係数であり、eはレベル減少時の平滑化係数であり、それぞれ予め設定された0<e,d<1の範囲の値である。ここで、d<eとなるように設定すれば、受話レベルの減少が上昇に比べ緩やかとなり、残響を含んだレベルを模擬的に求めることができる(受話レベルR(t)の算出例の説明終わり)。
以上のように受話レベル計算部11において算出されて出力された受話レベルR(t)は、メモリ17の領域17bに格納される。次に、受話検出部12において、メモリ17の領域17bから受話レベルR(t)を読み込み、この受話レベルR(t)と予め設定された固定閾値TRとを比較する(ステップS2)。
ここで、R(t)>TRであると判断された場合、受話検出部12は、受話があったと判定し、その旨の情報(受話検出情報)を出力し、これをメモリ17の領域17cに格納する。一方、R(t)>TRでないと判断された場合、受話検出部12は、受話検出情報のメモリ17の領域17cへの格納を行わない。そして、制御部18は、メモリ17の領域17cを参照し、そこに受話検出情報が格納されていない場合には、メモリ17の領域17iに格納されている音響結合量AC(t‐1)(AC(t‐1)がまだ算出されていない場合には、所定の初期値)を離散時間tにおける新たな音響結合量AC(t)としてメモリ17の領域17jに格納し(ステップS7)、ステップS8(後述)以降の処理を実行させる。一方、メモリ17の領域17cに受話検出情報が格納されている場合には、制御部18は、以下のステップS3以降の処理を実行させる。
ステップS3では、ピーク区間検出部13において、受話レベルR(t)がピーク区間のものであるか否かを判定し、その判定結果を出力する。ここで「ピーク区間」とは、受話レベルR(t)がピーク値をとる時間を含むある幅をもった時間区間を意味するが、ステップS3での判定は、例えば以下のように行う。
この例では、以下の式(6a)〜(6c)で示される閾値TH(t)を設定する。
TH(t)=TR for g・R(t)≦TR …(6a)
TH(t)=g・R(t) for g・R(t)>TR and R(t)>R(t‐1) …(6b)
TH(t)=f・TH(t‐1)+(1‐f)・g・R(t) for g・R(t)>TR and R(t)≦R(t‐1) …(6c)
ここで、gは予め設定された0<g<1の定数である。また、fは予め設定された閾値下降時の平滑化係数であり0<f<1の範囲をとる。そして、受話レベルR(t)がこの閾値H(t)を超えるという条件TH(t)<R(t)と、受話レベルR(t)が下降するという条件R(t)≦R(t‐1)の両方を満たしたときに、受話レベルR(t)がピーク区間のものであると判定する。
具体的には、例えば、まずピーク区間検出部13において、メモリ17の領域17a,17b,17dから、受話レベルR(t),R(t−1)及び閾値TH(t−1)(存在しない場合には所定の初期値)を読み出し、式(6a)〜(6c)で示される閾値TH(t)を算出してメモリ17の領域17eに格納する。そして、次にピーク区間検出部13は、メモリ17の領域17a,17b,17eから、受話レベルR(t),R(t−1)及び閾値TH(t)を読み出し、TH(t)<R(t)とR(t)≦R(t‐1)の両方の条件を満たすか否かを判定する。ここで、TH(t)<R(t)とR(t)≦R(t‐1)の両方の条件を満たすと判断された場合、ピーク区間検出部13は、その旨を示すピーク区間検出情報を出力し、メモリ17の領域17fに格納する。一方、TH(t)<R(t)とR(t)≦R(t‐1)の何れかの条件を満たさないと判断された場合には、ピーク区間検出部13は、ピーク区間検出情報をメモリ17の領域17fに格納しない。そして、制御部18は、メモリ17の領域17fを参照し、そこにピーク区間検出情報が格納されていない場合には、前述のステップS7及びステップS8(後述)以降の処理を実行させる。一方、メモリ17の領域17fにピーク区間検出情報が格納されている場合には、制御部18は、以下のステップS4以降の処理を実行させる。なお、このような手法をとることにより、単純に各離散時間に対応する受話レベルを逐一メモリ17記録しておき、その時間変動から受話レベルR(t)がピーク区間であるか否かを判断する手法に比べ、メモリ17に要求される記憶容量を大幅に削減することができる。
ステップS4では、送話レベル計算部16に送話信号y(t)が入力され、当該送話レベル計算部16において、当該送話信号y(t)の送話レベルS(t)を算出し、これをメモリ17の領域17mに格納する。なお、この送話レベルS(t)の算出は、送話レベル計算部16において、メモリ17の領域17k,mから送話レベルS(t−1)(存在しない場合には所定の初期値)を読み込み、ステップS1で例示したのと同様な手順(例えばS(t)=a・S(t‐1)+(1‐a)・|y(t)| (0<a<1))によって行われる。また、送話信号y(t)は、ステップS4の処理を行う時点で送話レベル計算部16に入力される送話信号を意味する。すなわち、厳密には送話信号y(t)は離散時刻tにおける送話信号ではなく、離散時刻tから遅延した離散時刻t+Δtにおける送話信号である。なお、この遅延時間Δtを補正することとしてもよい。
ステップS4の処理の後、音響結合量計算部14において、メモリ17の領域17b,17mから受話レベルR(t)と送話レベルS(t)とを読み込み、これらの受話レベルR(t)と送話レベルS(t)との比から音響結合量の瞬時値AC’(t)を算出して出力する(ステップS5)。この演算は式(7)で表される。
AC'(t)=S(t)/R(t) …(7)
このように出力された音響結合量の瞬時値AC’(t)は、メモリ17の領域17hに格納され、次にステップS6に進む。
ステップS6では、時間平滑部15において、メモリ17の領域17hから音響結合量の瞬時値AC’(t)を読み込み、これから音響結合量AC(t)を算出して出力し、メモリ17の領域17jに格納する(ステップS6)。なお、時間平滑部15は、例えば、以下のように音響結合量AC(t)を算出する。
[音響結合量AC(t)の算出例1]
この例の時間平滑部15は、推定音響結合量の瞬時値AC’(t)を時間平滑化して、より正確な推定音響結合量AC(t)を求める。具体的には、例えば、AC(t)=α・AC(t‐1)十(1‐α)・AC'(t)により推定音響結合量AC(t)を求める。ただし、αは予め設定された平滑化係数である。
[音響結合量AC(t)の算出例2]
また、送話音声と受話音声が混在するダブルトーク時においては送話信号に送話音声が混合しているので、推定音響結合量の瞬時値AC’(t)は、真の値よりも大きな値となってしまう。この影響を少なくするため、時間平滑部15において、ディップホールドを用いた時間平滑化を行うこととしてもよい。このディップホールドを用いた平滑化は、例えば式(8a)(8b)により実現される。
AC(t)=b・AC(t‐1)+(1‐b)・AC'(t) for AC(t‐1)>AC'(t) …(8a)
AC(t)=c・AC(t‐1)+(1‐c)・AC'(t) for AC(t‐1)<AC'(t) …(8b)
ただし、bは推定音響結合量増加時の平滑化係数であり、cは推定音響結合量減少時の平滑化係数であり、それぞれ0<b,0<c<1の範囲の予め設定された値である。なおb>>c(bがcに対して十分大きい)となるように設定すれば、音響結合量AC(t)の増加が非常に緩やかとなり、ディップホールドの効果が得られる(音響結合量AC(t)の算出例の説明終わり)。
その後、制御部18において、t+1を新たなtとして、メモリ17の領域17bのデータを領域17aに移し、領域17eのデータを領域17dに移し、領域17jのデータを領域17iに移し、領域17mのデータを領域17kに移し、領域17c,17fのデータを削除した後(ステップS8)、ステップS1以降の処理を繰り返す。
<本形態の特徴>
以上示した処理により、本形態では、受話レベルR(t)が固定閾値TRを超え、さらに受話レベルR(t)がピーク区間にある場合にのみ、すなわち、送話信号y(t)のエコー成分対雑音成分比がよい区間でのみ音響結合量AC(t)を推定することとした。
図3は、この受話レベルR(t)が固定閾値TRを超え、さらに受話レベルR(t)がピーク区間にあるという状態を説明するためのグラフである。A1,A2は、受話レベルR(t)が固定閾値TRを超える区間を意味し、B1〜B3はピーク区間を意味する。なお、このグラフにおけるピーク区間B1〜B3は、前述の式(6a)〜(6c)で示される閾値TH(t)を用い、条件TH(t)<R(t)と、受話レベルR(t)が下降するという条件R(t)≦R(t‐1)の両方を満たしたときに、受話レベルR(t)がピーク区間のものであるとした場合の例である。この図に例示するように、受話レベルR(t)が固定閾値TRを超え、さらに受話レベルR(t)がピーク区間にある場合、受話レベルR(t)は十分に大きく、送話信号y(t)のエコー成分対雑音成分比もよくなることが分かる。また、ピーク区間は受話信号が入力されたときに必ず存在するので、受話信号が入力されたときには必ず音響結合量の計算が行われる。これにより、本形態では、音響結合量を精度よく高速に推定することが可能となる。
〔第2の実施の形態〕
次に本発明における第2の実施の形態について説明する。
本形態は、第1の実施の形態の変形例であり、さらに受話ノイズレベルと送話ノイズレベルの推定を行い、これらを用いてより精度よく音響結合量の推定を行うものである。以下では、第1の実施の形態との相違点を中心に説明し、第1の実施の形態と共通する事項については説明を省略する。
<構成>
図4は、第2の実施の形態における音響結合量推定装置20の構成を例示したブロック図である。なお、図4における矢印は情報の流れを示しているが、制御部18に入出力される情報の流れは省略してある。また、図4において第1の実施の形態と共通する部分については図1と同じ符号を付している。
この図に例示するように、本形態の音響結合量推定装置20は、受話レベル計算部11と、ピーク区間検出部13と、時間平滑部15と、送話レベル計算部16と、制御部18と、受話検出部22と、音響結合量計算部24と、受話ノイズレベル推定部25と、送話ノイズレベル推定部26と、メモリ27とを有している。そして、音響結合量推定装置20は、制御部18の制御のもと、受話信号x(t)と送話信号y(t)とを用いて音響結合量の推定を行う。
<処理>
次に、本形態の音響結合量推定処理を説明する。
図5は、本形態の音響結合量推定処理を説明するためのフローチャートである。以下、この図に沿って、本形態の音響結合量推定処理の詳細を説明していく。
まず、図5に示す処理の前提として、メモリ27のデータをクリアし、さらに領域17a,17d,17i,17k,27n,27rに所定の初期値(例えば、各領域に格納される値の平均的な値)を格納する。その後、以下の処理を実行する。
まず、受話レベル計算部11に受話信号x(t)が入力され、受話レベル計算部11は、受話信号x(t)の受話レベルR(t)を算出して出力し、メモリ27の領域17bに格納する(ステップS11)。ここで、受話レベルR(t)の算出は、例えば第1の実施の形態と同様に行う。
次に、受話ノイズレベル推定部25において、メモリ27の領域17bから受話レベルR(t)を読み込み、これから受話信号x(t)のノイズレベルの推定値(以下「受話ノイズレベルNr(t)」という)を算出して出力する(ステップS12)。具体的には、例えば、受話ノイズレベル推定部25は、メモリ27の領域17bから受話レベルR(t)を読み込み、領域27nから受話ノイズレベルNr(t−1)(存在しない場合には所定の初期値)を読み込み、受話レベルR(t)を以下の式(9a)(9b)を用いてディップホールド処理することで受話ノイズレベルNr(t)を推定する。
Nr(t)=R(t) for Nr(t-1)>R(t) …(9a)
Nr(t)=u・Nr(t‐1)+(1-u)・R(t) for Nr(t-1)<R(t) …(9b)
ここで、uは事前に設定された推定ノイズレベルの平滑化係数であり0<u<1の値をとる。ここでuが1に近いと緩やかなノイズレベルの上昇となり、ディップホールドの効果が得られる。このように算出された受話ノイズレベルNr(t)は、メモリ27の領域27pに格納される。
次に、受話検出部22において、受話ノイズレベルNr(t)の定数倍(好ましくは1倍以上)の閾値TN及び予め設定された固定閾値TRと、受話レベルR(t)とを比較し、これら両方の閾値TN,TRよりも当該受話レベルR(t)が大きい場合に(R(t)>TR and R(t)>TN)、受話があった旨の情報(受話検出情報)を出力し、メモリ27の領域17cに格納する(ステップS13)。このように、受話ノイズレベルNr(t)を基準とした閾値TNを導入することにより、受話信号のノイズレベルが高い場合にも、このノイズレベルよりも受話レベルR(t)が大きい受話信号x(t)のみを抽出して音響結合量の推定処理にあてることができる。
そして、制御部18は、メモリ27の領域17cを参照し、そこに受話検出情報が格納されていない場合には、メモリ27の領域17iに格納されている音響結合量AC(t‐1)(存在しない場合には、所定の初期値)を離散時間tにおける新たな音響結合量AC(t)としてメモリ27の領域17jに格納し(ステップS19)、ステップS20(後述)以降の処理を実行させる。一方、メモリ27の領域17cに受話検出情報が格納されている場合には、制御部18は、以下のステップS14以降の処理を実行させる。
ステップS14では、ピーク区間検出部13において、例えば第1の実施の形態と同様な手法により、受話レベルR(t)がピーク区間のものであるか否かを判定する(ステップS14)。そして、ピーク区間検出部13が、受話レベルR(t)がピーク区間のものであると判定した場合、ピーク区間検出部13は、ピーク区間検出情報を出力し、メモリ27の領域17fに格納する。一方、受話レベルR(t)がピーク区間のものでないと判定された場合には、ピーク区間検出情報は出力されない。そして、制御部18は、メモリ27の領域17fを参照し、そこにピーク区間検出情報が格納されていない場合には、前述のステップS19及びステップS20(後述)以降の処理を実行させる。一方、メモリ27の領域17fにピーク区間検出情報が格納されている場合には、制御部18は、以下のステップS15以降の処理を実行させる。
ステップS15では、送話レベル計算部16に送話信号y(t)が入力され、当該送話レベル計算部16において、当該送話信号y(t)の送話レベルS(t)を算出し、これをメモリ27の領域17mに格納する。なお、この送話レベルS(t)の算出は、例えば、第1の実施の形態と同様に行う。
次に、送話ノイズレベル推定部26において、送話レベルS(t)から送話信号のノイズレベルの推定値(以下「送話ノイズレベルNs(t)」という。)を算出して出力し、メモリ27の領域27sに格納する(ステップS16)。具体的には、例えば、送話ノイズレベル推定部26は、メモリ27の領域27rから送話ノイズレベルNs(t−1)を読み込み、領域17mから送話レベルS(t)を読み込み、ステップS12と同様な手順(例えば、Ns(t)=S(t)〔for Ns(t-1)>S(t)〕,Ns(t)=u・Ns(t‐1)+(1-u)・S(t)〔for Nr(t-1)<R(t)〕,0<u<1)により送話ノイズレベルNs(t)を算出し、メモリ27の領域27sに格納する。
ステップS16の処理の後、音響結合量計算部24は、メモリ27の領域17b,17m,27p,27sから、それぞれ受話レベルR(t),送話レベルS(t),受話ノイズレベルNr(t),送話ノイズレベルNs(t)を読み込む。そして、音響結合量計算部24は、受話レベルR(t)から受話ノイズレベルNr(t)を減じた値{R(t)−Nr(t)}と送話レベルS(t)から送話ノイズレベルNs(t)を減じた値{S(t)−Ns(t)}との比から音響結合量の瞬時値AC’(t)を算出して出力し、メモリ27の領域17hに格納する(ステップS17)。具体的には、音響結合量計算部24は、例えば、式(10)に従って音響結合量の瞬時値AC’(t)を算出する。
AC'(t)={S(t)‐Ns(t)}/{R(t)‐Nr(t)} …(10)
このように受話レベルR(t)及び送話レベルS(t)から推定ノイズレベルを減算し、音響結合量の瞬時値AC’(t)を算出することにより、第1の実施の形態よりも精度よく音響結合量の計算が可能となる。
次に、時間平滑部15において、メモリ27の領域17hから音響結合量の瞬時値AC’(t)を読み込み、例えば、第1の実施の形態と同様に音響結合量AC(t)を算出して出力し、メモリ27の領域17jに格納する(ステップS18)。
その後、制御部18において、t+1を新たなtとして、メモリ27の領域17bのデータを領域17aに移し、領域17eのデータを領域17dに移し、領域17jのデータを領域17iに移し、領域17mのデータを領域17kに移し、領域27pのデータを領域27nに移し、領域27sのデータを領域17rに移し、領域17c,17fのデータを削除した後(ステップS20)、ステップS11以降の処理を繰り返す。
<本形態の特徴>
以上示した処理により、本形態では、受話レベルR(t)が閾値TNを超え、さらに受話レベルR(t)がピーク区間にある場合にのみ、すなわち、送話信号y(t)のエコー成分対雑音成分比がよい区間でのみ音響結合量AC(t)を推定することとした。これにより、音響結合量AC(t)の精度の向上とその推定精度の向上とを実現できる。さらに、本形態ではノイズレベルの推定を行い、それを音響結合量AC(t)の推定処理に用いることとした。これにより、第1の実施の形態よりも高い精度で音響結合量推定を行うことができる。
〔第3の実施の形態〕
次に、本発明における第3の実施の形態について説明する。
本形態は、第1の実施の形態の変形例であり、割り算を用いることなく音響結合量推定を行うものである。以下では、第1の実施の形態との相違点を中心に説明し、第1の実施の形態と共通する事項については説明を省略する。
<構成>
図6は、第3の実施の形態における音響結合量推定装置30の構成を示したブロック図である。なお、図6における矢印は情報の流れを示しているが、制御部18に入出力される情報の流れは省略してある。また、図6において第1の実施の形態と共通する部分については図1と同じ符号を付している。
この図に例示するように、本形態の音響結合量推定装置30は、受話レベル計算部11と、受話検出部12と、ピーク区間検出部13と、送話レベル計算部16と、制御部18と、音響結合量記憶部31と、音響結合量更新部34と、メモリ37とを有している。なお、音響結合量更新部34は、推定エコーレベル算出部34aと、比較部34bと、更新部34cとを有している。そして、音響結合量推定装置30は、制御部18の制御のもと、受話信号x(t)と送話信号y(t)とを用いて音響結合量の推定を行う。
<処理>
次に、本形態の音響結合量推定処理を説明する。
本形態では、第1の実施の形態における音響結合量の計算を以下のような方法に置き換えることで、割り算をなくし、演算量の削減を実現する。即ち、前の音響結合量AC(t’)に受話レベルR(t)を乗じた推定エコーレベルと、送話レベルS(t)とを比較し、送話レベルS(t)が大きい場合には音響結合量を増加させ、推定エコーレベルが大きい場合には音響結合量を減少させる逐次更新により、音響結合量を推定していく。これにより、割り算を用いない音響結合量推定が可能となる。
図7は、本形態の音響結合量推定処理を説明するためのフローチャートである。以下、この図に沿って、本形態の音響結合量推定処理の詳細を説明していく。
まず、図7に示す処理の前提として、メモリ47のデータをクリアし、さらに領域17a,17d,17i,17kに所定の初期値(例えば、各領域に格納される値の平均的な値)を格納する。また、音響結合量記憶部31に推定音響結合量の初期値AC(0)を格納しておく。なお、AC(0)は推定音響結合量の平均値程度であることが望ましい。このような前処理の後、以下の処理を実行する。
まず、受話レベル計算部11に受話信号x(t)が入力され、受話レベル計算部11は、受話信号x(t)の受話レベルR(t)を算出して出力し、メモリ37の領域17bに格納する(ステップS31)。ここで、受話レベルR(t)の算出は、例えば第1の実施の形態と同様に行う。
次に、受話検出部12において、メモリ17の領域17bから受話レベルR(t)を読み込み、この受話レベルR(t)と予め設定された固定閾値TRとを比較する(ステップS32)。
ここで、R(t)>TRであると判断された場合、受話検出部12は、受話があったと判定し、その旨の情報(受話検出情報)を出力し、これをメモリ37の領域17cに格納する。一方、R(t)>TRでないと判断された場合、受話検出部12は、受話検出情報のメモリ37の領域17cへの格納を行わない。そして、制御部18は、メモリ37の領域17cを参照し、そこに受話検出情報が格納されていない場合には、後述するステップS39以降の処理を実行させる。一方、メモリ37の領域17cに受話検出情報が格納されている場合には、制御部18は、以下のステップS33以降の処理を実行させる。
ステップS33では、ピーク区間検出部13において、例えば、第1の実施の形態と同様に、受話レベルR(t)がピーク区間のものであるか否かを判定する。そして、ピーク区間検出部13が、受話レベルR(t)がピーク区間のものであると判定した場合、ピーク区間検出部13は、ピーク区間検出情報を出力し、メモリ37の領域17fに格納する。一方、受話レベルR(t)がピーク区間のものでないと判定された場合には、ピーク区間検出情報は出力されない。そして、制御部18は、メモリ37の領域17fを参照し、そこにピーク区間検出情報が格納されていない場合には、後述のステップS39以降の処理を実行させる。一方、メモリ37の領域17fにピーク区間検出情報が格納されている場合には、制御部18は、以下のステップS34以降の処理を実行させる。
ステップS34では、送話レベル計算部16に送話信号y(t)が入力され、当該送話レベル計算部16において、第1の実施の形態と同様に当該送話信号y(t)の送話レベルS(t)を算出し、これをメモリ37の領域17mに格納する。
次に、音響結合量更新部34の推定エコーレベル算出部34aにおいて、メモリ37の領域17bから受話信号レベルR(t)を読み込み、音響結合量記憶部31からそこに格納されている最新の音響結合量AC(t’)を読み込む。そして、推定エコーレベル算出部34aは、読み込んだ受話信号レベルR(t)と最新の音響結合量AC(t’)とを乗算して、推定エコーレベルAC(t’)・R(t)を求め、メモリ37の領域37mに格納する(ステップS35)。
次に、音響結合量更新部34の比較部34bにおいて、メモリ37の領域37mから推定エコーレベルAC(t’)・R(t)を読み込み、領域17mから送話レベルS(t)を読み込む。そして、比較部34bは、読み込んだ推定エコーレベルAC(t’)・R(t)と送話レベルS(t)とを比較する(ステップS36)。ここで、推定エコーレベルAC(t’)・R(t)よりも送話レベルS(t)のほうが小さい場合(AC(t')・R(t)>S(t))には、音響結合量AC(t’)が真の結合量よりも大きいと推測されるので、音響結合量更新部34の更新部34cにおいて、最新の音響結合量音響結合量AC(t’)よりも小さな値を新たな音響結合量AC(t)として音響結合量記憶部31のデータを更新する(ステップS37)。具体的には、例えば、AC(t’)に1より小さい定数p(0<p<1)を乗じ、その結果を新たな音響結合量AC(t)とする。一方、推定エコーレベルAC(t’)・R(t)よりも送話レベルS(t)のほうが大きい場合(AC(t')・R(t)<S(t))には、音響結合量AC(t’)が真の結合量よりも小さいと推測されるので、更新部34cにおいて、最新の音響結合量音響結合量AC(t’)よりも大きな値を新たな音響結合量AC(t)として音響結合量記憶部31のデータを更新する(ステップS38)。具体的には、例えば、AC(t’)に1より大きい定数q(1<q)を乗じ、その結果を新たな音響結合量AC(t)とする。
これらを式で表せば、以下の式(11a)(11b)のようになる。
AC(t)=p・AC(t') for AC(t')・R(t)>S(t) …(11a)
AC(t)=q・AC(t') for AC(t')・R(t)<S(t) …(11b)
ただし、定数p,qは事前に設定される。また、送話音声と受話音声が同時に存在するダブルトーク時には、送話信号y(t)に送話音声成分が混合される。この場合、送話レベルs(t)は、送話信号y(t)に送話音声成分が混合していない場合の送話レベルに比べ大きくなってしまい、正確な音響結合量の更新が行えなくなってしまう。この影響を少なくするには、定数pを1に近い値に設定することが望ましい。これにより、音響結合量が上昇する場合の更新量を小さくし、ダブルトーク時における誤った音響結合量の更新の幅を小さくできるからである。
一方、ステップS36の判断で、推定エコーレベルAC(t’)・R(t)と送話レベルS(t)とが等しい(AC(t')・R(t)=S(t))と判断された場合には、音響結合量の更新を行わない。
そして、以上の処理の後、制御部18において、t+1を新たなtとして、メモリ37の領域17bのデータを領域17aに移し、領域17eのデータを領域17dに移し、領域17mのデータを領域17kに移し、領域17c,17fのデータを削除した後(ステップS39)、ステップS31以降の処理を繰り返す。
<本形態の特徴>
以上示した処理により、本形態では、受話レベルR(t)が固定閾値TRを超え、さらに受話レベルR(t)がピーク区間にある場合にのみ、すなわち、送話信号y(t)のエコー成分対雑音成分比がよい区間でのみ音響結合量AC(t)の更新を行うこととした。これにより、音響結合量AC(t)の精度の向上とその推定精度の向上とを実現できる。また、本形態では、割り算を用いることなく音響結合量を推定できるため、割り算器を有しないプロセッサにおいても少ない演算量で実装することができる。
〔第4の実施の形態〕
本形態は、第3の実施の形態の変形例であり、さらに受話ノイズレベルと送話ノイズレベルの推定を行い、これらを用いてより精度よく音響結合量の更新を行うものである。以下では、第3の実施の形態との相違点を中心に説明し、第1,3の実施の形態と共通する事項については説明を省略する。
<構成>
図8は、第4の実施の形態における音響結合量推定装置40の構成を例示したブロック図である。なお、図8における矢印は情報の流れを示しているが、制御部18に入出力される情報の流れは省略してある。また、図8において第1〜3の実施の形態と共通する部分については図1,図4,図6と同じ符号を付している。
この図に例示するように、本形態の音響結合量推定装置40は、受話レベル計算部11と、ピーク区間検出部13と、送話レベル計算部16と、制御部18と、受話検出部22と、受話ノイズレベル推定部25と、送話ノイズレベル推定部26と、音響結合量記憶部31と、音響結合量更新部44と、メモリ47とを有している。また、音響結合量更新部44は、推定エコーレベル算出部44a,比較部44b、更新部44c及び減算部44dを有している。そして、音響結合量推定装置40は、制御部18の制御のもと、受話信号x(t)と送話信号y(t)とを用いて音響結合量の推定を行う。
<処理>
次に、本形態の音響結合量推定処理を説明する。
図9は、本形態の音響結合量推定処理を説明するためのフローチャートである。以下、この図に沿って、本形態の音響結合量推定処理の詳細を説明していく。
まず、図9に示す処理の前提として、メモリ47のデータをクリアし、さらに領域17a,17d,17k,27n,27rに所定の初期値(例えば、各領域に格納される値の平均的な値)を格納する。また、音響結合量記憶部31に推定音響結合量の初期値AC(0)を格納しておく。なお、AC(0)は推定音響結合量の平均値程度であることが望ましい。このような前処理の後、以下の処理を実行する。
まず、受話レベル計算部11に受話信号x(t)が入力され、受話レベル計算部11は、受話信号x(t)の受話レベルR(t)を算出して出力し、メモリ47の領域17bに格納する(ステップS41)。ここで、受話レベルR(t)の算出は、例えば第1の実施の形態と同様に行う。
次に、受話ノイズレベル推定部25において、メモリ47の領域17bから受話レベルR(t)を読み込み、これから受話信号x(t)の受話ノイズレベルNr(t)を算出して出力し、メモリ47の領域27pに格納する(ステップS42)。ここで、受話ノイズレベルNr(t)の算出は、例えば第2の実施の形態と同様に行う。
次に、受話検出部22において、受話ノイズレベルNr(t)の定数倍(好ましくは1倍以上)の閾値TN及び予め設定された固定閾値TRと、受話レベルR(t)とを比較し、これら両方の閾値TN,TRよりも当該受話レベルR(t)が大きい場合に(R(t)>TR and R(t)>TN)、受話があった旨の情報(受話検出情報)を出力し、メモリ47の領域17cに格納する(ステップS43)。そして、制御部18は、メモリ47の領域17cを参照し、そこに受話検出情報が格納されていない場合には、後述するステップS52以降の処理を実行させる。一方、メモリ47の領域17cに受話検出情報が格納されている場合には、制御部18は、以下のステップS44以降の処理を実行させる。
ステップS44では、ピーク区間検出部13において、例えば第1の実施の形態と同様な手法により、受話レベルR(t)がピーク区間のものであるか否かを判定する(ステップS44)。そして、ピーク区間検出部13が、受話レベルR(t)がピーク区間のものであると判定した場合、ピーク区間検出部13は、ピーク区間検出情報を出力し、メモリ47の領域17fに格納する。一方、受話レベルR(t)がピーク区間のものでないと判定された場合には、ピーク区間検出情報は出力されない。そして、制御部18は、メモリ47の領域17fを参照し、そこにピーク区間検出情報が格納されていない場合には、後述するステップS52以降の処理を実行させる。一方、メモリ47の領域17fにピーク区間検出情報が格納されている場合には、制御部18は、以下のステップS45以降の処理を実行させる。
ステップS15では、送話レベル計算部16に送話信号y(t)が入力され、当該送話レベル計算部16において、当該送話信号y(t)の送話レベルS(t)を算出し、これをメモリ47の領域17mに格納する。なお、この送話レベルS(t)の算出は、例えば、第1の実施の形態と同様に行う。
次に、送話ノイズレベル推定部26において、第2の実施の形態と同様に、送話レベルS(t)から送話信号の送話ノイズレベルNs(t)を算出して出力し、メモリ47の領域27sに格納する(ステップS46)。
次に、音響結合量更新部44の推定エコーレベル算出部44aにおいて、メモリ47の領域17bから受話信号レベルR(t)を読み込み、領域27pから受話ノイズレベルNr(t)を読み込み、音響結合量記憶部31からそこに格納されている最新の音響結合量AC(t’)を読み込む。そして、推定エコーレベル算出部44aは、最新の音響結合量AC(t’)と、受話信号レベルR(t)から受話ノイズレベルNr(t)を減じた値{R(t)−Nr(t)}とを乗算して、推定エコーレベルAC(t’)・{R(t)−Nr(t)}を求め、メモリ47の領域47tに格納する(ステップS47)。
次に、音響結合量更新部44の減算部44dにおいて、メモリ47の領域17mから送話信号レベルS(t)を読み込み、領域27sから送話ノイズレベルNs(t)を読み込む。そして、減算部44dは、送話信号レベルS(t)から送話ノイズレベルNs(t)を減算した値{S(t)−Ns(t)}を算出し、これをメモリ47の領域47uに格納する(ステップS48)。
次に、音響結合量更新部34の比較部44bにおいて、メモリ47の領域47tから推定エコーレベルAC(t’)・{R(t)−Nr(t)}を読み込み、領域47uから送話信号レベルS(t)から送話ノイズレベルNs(t)を減算した値{S(t)−Ns(t)}を読み込む。そして、比較部44bは、読み込んだ推定エコーレベルAC(t’)・{R(t)−Nr(t)}と値{S(t)−Ns(t)}とを比較する(ステップS49)。
ここで、推定エコーレベルAC(t’)・{R(t)−Nr(t)}よりも送話信号レベルS(t)から送話ノイズレベルNs(t)を減算した値{S(t)−Ns(t)}のほうが小さい場合(AC(t')・{R(t)-Nr(t)}>{S(t)-Ns(t)})には、音響結合量AC(t’)が真の結合量よりも大きいと推測されるので、音響結合量更新部44の更新部44cにおいて、最新の音響結合量音響結合量AC(t’)よりも小さな値を新たな音響結合量AC(t)として音響結合量記憶部31のデータを更新する(ステップS50)。具体的には、例えば、AC(t’)に1より小さい定数p(0<p<1)を乗じ、その結果を新たな音響結合量AC(t)とする。推定エコーレベルAC(t’)・{R(t)−Nr(t)}よりも送話信号レベルS(t)から送話ノイズレベルNs(t)を減算した値{S(t)−Ns(t)}のほうが大きい場合(AC(t')・{R(t)-Nr(t)}<{S(t)-Ns(t)})には、音響結合量AC(t’)が真の結合量よりも小さいと推測されるので、更新部44cにおいて、最新の音響結合量音響結合量AC(t’)よりも大きな値を新たな音響結合量AC(t)として音響結合量記憶部31のデータを更新する(ステップS51)。具体的には、例えば、AC(t’)に1より大きい定数q(1<q)を乗じ、その結果を新たな音響結合量AC(t)とする。
これらを式で表せば、以下の式(12a)(12b)のようになる。
AC(t)=p・AC(t') for AC(t')・{R(t)-Nr(t)}>{S(t)-Ns(t)} …(12a)
AC(t)=q・AC(t') for AC(t')・{R(t)-Nr(t)}<{S(t)-Ns(t)} …(12b)
ただし、定数p,qは事前に設定される。また、送話音声と受話音声が同時に存在するダブルトーク時には、送話信号y(t)に送話音声成分が混合される。この場合、送話レベルs(t)は、送話信号y(t)に送話音声成分が混合していない場合の送話レベルに比べ大きくなってしまい、正確な音響結合量の更新が行えなくなってしまう。この影響を少なくするには、定数pを1に近い値に設定することが望ましい。これにより、音響結合量が上昇する場合の更新量を小さくし、ダブルトーク時における誤った音響結合量の更新の幅を小さくできるからである。
一方、ステップS49の判断で、推定エコーレベルAC(t’)・{R(t)−Nr(t)}と送話信号レベルS(t)から送話ノイズレベルNs(t)を減算した値{S(t)−Ns(t)}とが等しい(AC(t')・{R(t)-Nr(t)}={S(t)-Ns(t)})と判断された場合には、音響結合量の更新を行わない。
そして、以上の処理の後、制御部18において、t+1を新たなtとして、メモリ47の領域17bのデータを領域17aに移し、領域17eのデータを領域17dに移し、領域17mのデータを領域17kに移し、領域27pのデータを領域27nに移し、領域27sのデータを領域27rに移し、領域17c,17fのデータを削除した後(ステップS52)、ステップS41以降の処理を繰り返す。
<本形態の特徴>
以上示した処理により、本形態では、受話レベルR(t)が閾値TNを超え、さらに受話レベルR(t)がピーク区間にある場合にのみ、すなわち、送話信号y(t)のエコー成分対雑音成分比がよい区間でのみ音響結合量AC(t)の更新を行うこととした。これにより、音響結合量AC(t)の精度の向上とその推定精度の向上とを実現できる。また、本形態では、割り算を用いることなく音響結合量を推定できるため、割り算器を有しないプロセッサにおいても少ない演算量で実装することができる。さらに、本形態では、第3の実施の形態にノイズレベルの推定処理を追加し、送受話レベルからノイズレベルを減算してから音響結合量の更新を行う。このノイズレベルの減算により、送受話のノイズの影響を軽減することができ、より正確な音響結合量推定が可能となる。
〔第5の実施の形態〕
本形態は、第1の実施の形態の変形例であり、時間領域の受話信号及び送話信号を時間周波数領域の信号に変換し、周波数ごとに音響結合量の推定を行う例である。以下では、第1の実施の形態との相違点を中心に説明し、第1の実施の形態と共通する事項については説明を省略する。
図10は、第5の実施の形態における音響結合量推定装置50の構成を例示したブロック図である。なお、図10における矢印は情報の流れを示しているが、制御部53に入出力される情報の流れは省略してある。
この図に例示するように、本形態の音響結合量推定装置50は、受話信号周波数変換部51と、送話周波数変換部52と、N個の音響結合量推定部60−1〜Nと、制御部53とを有している。そして、音響結合量推定装置50は、制御部53の制御のもと、受話信号x(t)と送話信号y(t)とを用い、周波数ごとに音響結合量の推定を行う。
図11は、図10における音響結合量推定部60−1の構成を例示したブロック図である。なお、図11における矢印は情報の流れを示しているが、制御部18に入出力される情報の流れは省略してある。
この図に例示するように、この例の音響結合量推定部60−1の構成は、第1の実施の形態における音響結合量推定装置10と同様である。すなわち、音響結合量推定部60−1は、受話レベル計算部11と、受話検出部12と、ピーク区間検出部13と、音響結合量計算部14と、時間平滑部15と、送話レベル計算部16と、メモリ17と、制御部18とを有している。ただし、音響結合量推定部60−1は、時間領域の受話信号x(t)から変換された時間周波数領域の受話信号x(f,t)と、時間領域の送話信号y(t)から変換された時間周波数領域の送話信号y(f,t)とを用い、周波数fのみに対する音響結合量の推定を行う。なお、その他の音響結合量推定部60−2〜Nの構成も音響結合量推定部60−1と同じであるが、それぞれが取り扱う信号の周波数fは異なる。
<処理>
次に、本形態の音響結合量推定処理を説明する。
まず、受話信号周波数変換部51において、入力された時間領域の受話信号x(t)をN個の時間周波数領域の受話信号x(f,t)に変換し、各受話信号x(f,t)をそれぞれ音響結合量推定部60−1〜Nに出力する。また、送話周波数領域変換部52において、入力された時間領域の送話信号y(t)をN個の時間周波数領域の送話信号y(f,t)に変換し、各y(f,t)をそれぞれ音響結合量推定部60−1〜Nに出力する。なお、受話信号周波数変換部51及び送話周波数変換部52は、例えば、短時間フーリエ変換、wavelet変換、DFTフィルタバンク、ポリフェイズフィルタバンクなどを用い、周波数領域の信号を時間周波数領域の信号に変換し、受話信号x(t)と送話信号y(t)とをそれぞれN個の周波数帯域の信号に分割する。また、各音響結合量推定部60−1〜Nには、何れかの周波数fの受話信号x(f,t)及び送話信号y(f,t)が入力されるが、同一の音響結合量推定部60−1〜Nには、同一の周波数fに対応する受話信号x(f,t)及び送話信号y(f,t)が入力される。
その後、各音響結合量推定部60−1〜Nにおいて、それぞれ入力された周波数fに対応する受話信号x(f,t)及び送話信号y(f,t)を用い、第1の実施の形態と同様に音響結合量AC(f,t)を算出し、それぞれのメモリに格納する。
<本形態の特徴>
本形態では、周波数帯域ごとの音響結合量を求めることができる。これにより、より正確な音響結合量を得ることができる。なお、本形態では、各音響結合量推定部60−1〜Nを第1の実施の形態における音響結合量推定装置10と同様な構成としたが、各音響結合量推定部60−1〜Nを第2〜4の実施の形態における音響結合量推定装置20〜40と同様な構成とし、第2〜4の実施の形態で説明した方法によって周波数帯域ごとの音響結合量を求めることとしてもよい。
〔第6の実施の形態〕
本形態は、第1の実施の形態の変形例であり、送話検出部において送話が行われているか否かを判定し、送話が行われている場合に音響結合量の計算を停止する例である。以下では、第1の実施の形態との相違点を中心に説明し、第1の実施の形態と共通する事項については説明を省略する。
<構成>
図12は、第6の実施の形態における音響結合量推定装置70の構成を例示したブロック図である。なお、図12における矢印は情報の流れを示しているが、制御部18に入出力される情報の流れは省略してある。
この図に例示するように、本形態の音響結合量推定装置70は、受話レベル計算部11と、受話検出部12と、ピーク区間検出部13と、音響結合量計算部14と、時間平滑部15と、送話レベル計算部16と、制御部18と、送話検出部71と、メモリ77とを有している。そして、音響結合量推定装置70は、制御部18の制御のもと、受話信号x(t)と送話信号y(t)とを用い、音響結合量の推定を行う。
<処理>
次に、本形態の音響結合量推定処理を説明する。
図13は、本形態の音響結合量推定処理を説明するためのフローチャートである。以下、この図に沿って、本形態の音響結合量推定処理の詳細を説明していく。
第1の実施の形態との相違点はステップS75の処理が挿入される点であり、その他の処理については第1の実施の形態と同様である。以下では、第1の実施の形態との相違点を中心に説明を行う。
第1の実施の形態におけるステップS1〜S4と同様に、受話信号x(t)の受話レベルR(t)が算出され(ステップS71)、受話レベルR(t)>固定閾値TRであると判断され(ステップS72)、受話レベルR(t)がピーク区間のものであると判定され(ステップS73)、送話信号y(t)の送話レベルS(t)が算出された場合(ステップS74)、送話検出部71は、メモリ77の領域17iから最新の音響結合量AC(t−1)を、領域17bから受話レベルR(t)を、領域17mから送話レベルS(t)をそれぞれ読み込む。そして、送話検出部71は、送話レベルS(t)が、予め設定された固定閾値TSを超え(S(t)>TS)、さらに最新の音響結合量AC(t−1)と受話レベルR(t)とを用いて算出された推定エコーレベルの定数(1より大きな定数)倍である閾値TEを超えた(S(t)>TE)か否かを判定する(ステップS75)。なお、閾値TEとしては、例えば、最新の音響結合量AC(t−1)に受話レベルR(t)を乗じた推定エコーレベルの定数β(β>1)倍(TE=β・AC(t−1)・R(t))を例示できる。ここで、S(t)>TS及びS(t)>TEの条件を満たした場合にのみ、送話検出部71は、送話が行われている旨の情報(送話検出情報)を出力し、メモリ77の領域77nに格納する。そして、制御部18は、メモリ77の領域77nを参照し、そこに送話検出情報が格納されていない場合には、ステップS78(第1の実施の形態のステップS7と同様)及びS79以降の処理を実行させる。すなわち、この場合には、音響結合量計算部14は、送話レベルS(t)に対応する新たな音響結合量の瞬時値を算出しない。一方、メモリ77の領域77nに送話検出情報が格納されている場合には、制御部18は、以下のステップS76以降の処理を実行させる。なお、ステップS76以降の処理は第1の実施の形態におけるステップS5,S6,S8と同様である。ただし、ステップS79の処理は、領域77nのデータを削除する処理が加わる点でステップS8の処理と異なる。
<本形態の特徴>
本形態では、送話検出部71において送話を検出し、送話が検出された場合、新たな音響結合量の瞬時値の算出を行わないこととした。これにより、送話信号y(t)に含まれる送話音声成分による音響結合量推定誤差を軽減し、より正確な音響結合量推定を実現することができる。
〔第7の実施の形態〕
本形態は、第6の実施の形態の思想を第2の実施の形態に適用した例である。以下では、上述の実施の形態との相違点を中心に説明し、これらと共通する事項については説明を省略する。
<構成>
図14は、第7の実施の形態における音響結合量推定装置80の構成を例示したブロック図である。なお、図14における矢印は情報の流れを示しているが、制御部18に入出力される情報の流れは省略してある。また、図14において第1の実施の形態と共通する部分については図1と同じ符号を付している。
この図に例示するように、本形態の音響結合量推定装置80は、受話レベル計算部11と、ピーク区間検出部13と、時間平滑部15と、送話レベル計算部16と、制御部18と、受話検出部22と、音響結合量計算部24と、受話ノイズレベル推定部25と、送話ノイズレベル推定部26と、送話検出部81と、メモリ87とを有している。そして、音響結合量推定装置80は、制御部18の制御のもと、受話信号x(t)と送話信号y(t)とを用いて音響結合量の推定を行う。
<処理>
次に、本形態の音響結合量推定処理を説明する。
図15及び図16は、本形態の音響結合量推定処理を説明するためのフローチャートである。以下、この図に沿って、本形態の音響結合量推定処理の詳細を説明していく。
第2の実施の形態との相違点はステップS97の処理が挿入される点であり、その他の処理については第2の実施の形態と同様である。以下では、第2の実施の形態との相違点を中心に説明を行う。
第2の実施の形態におけるステップS11〜S16と同様に、受話信号x(t)の受話レベルR(t)が算出され(ステップS91)、受話ノイズレベルNr(t)が算出され(ステップS92)、受話レベルR(t)>固定閾値TR及び受話レベルR(t)>閾値TNであると判断され(ステップS93)、受話レベルR(t)がピーク区間のものであると判定され(ステップS94)、送話信号y(t)の送話レベルS(t)が算出され(ステップS95)、送話ノイズレベルNs(t)が算出された場合(ステップS96)、第2の実施の形態との相違点であるステップS97の処理が実行される。
ステップS97では、送話検出部81において、メモリ87の領域17iから最新の音響結合量AC(t−1)を、領域17bから受話レベルR(t)を、領域17mから送話レベルS(t)を、領域27sから、送話ノイズレベルNs(t)をそれぞれ読み込む。そして、送話検出部81は、送話レベルS(t)が、予め設定された固定閾値TSを超え(S(t)>TS)、さらに最新の音響結合量AC(t−1)と受話レベルR(t)とを用いて算出された推定エコーレベルの定数(1より大きな定数)倍である閾値TEを超え(S(t)>TE)、なおかつ送話ノイズレベルNs(t)を定数倍した閾値TN’を超えた(S(t)>TN’)か否かを判定する。ここで、S(t)>TSかつS(t)>TEかつS(t)>TN’の条件を満たした場合にのみ、送話検出部81は、送話が行われている旨の情報(送話検出情報)を出力し、メモリ87の領域87nに格納する。そして、制御部18は、メモリ87の領域87nを参照し、そこに送話検出情報が格納されていない場合には、ステップS100(第1の実施の形態のステップS7と同様)及びS101以降の処理を実行させる。すなわち、この場合には、音響結合量計算部24は、送話レベルS(t)に対応する新たな音響結合量の瞬時値を算出しない。一方、メモリ87の領域87nに送話検出情報が格納されている場合には、制御部18は、以下のステップS98以降の処理を実行させる。なお、ステップS98以降の処理は第2の実施の形態におけるステップS17,S18,S20と同様である。ただし、ステップS101の処理は、領域87nのデータを削除する処理が加わる点でステップS20の処理と異なる。
〔第8の実施の形態〕
本形態は、第3の実施の形態の変形例であり、送話検出部において送話が行われているか否かを判定し、送話が行われている場合に音響結合量の更新量(更新前の音響結合量と新たな音響結合量との差)を小さくする例である。以下では、第3の実施の形態との相違点を中心に説明し、第3の実施の形態と共通する事項については説明を省略する。
<構成>
図17は、本形態における音響結合量推定装置90の構成を示したブロック図である。なお、図17における矢印は情報の流れを示しているが、制御部18に入出力される情報の流れは省略してある。また、図6において第1の実施の形態と共通する部分については図1と同じ符号を付している。
この図に例示するように、本形態の音響結合量推定装置90は、受話レベル計算部11と、受話検出部12と、ピーク区間検出部13と、送話レベル計算部16と、制御部18と、音響結合量記憶部31と、音響結合量更新部34と、送話検出部91と、メモリ97とを有している。なお、音響結合量更新部34は、推定エコーレベル算出部34aと、比較部34bと、更新部34cとを有している。そして、音響結合量推定装置30は、制御部18の制御のもと、受話信号x(t)と送話信号y(t)とを用いて音響結合量の推定を行う。
<処理>
次に、本形態の音響結合量推定処理を説明する。
図18は、本形態の音響結合量推定処理を説明するためのフローチャートである。以下、この図に沿って、本形態の音響結合量推定処理の詳細を説明していく。
第3の実施の形態との相違点はステップS118〜S120の処理であり、その他の処理については第3の実施の形態と同様である。以下では、第3の実施の形態との相違点を中心に説明を行う。
第3の実施の形態におけるステップS31〜S36と同様に、受話信号x(t)の受話レベルR(t)が算出され(ステップS111)、受話レベルR(t)>固定閾値TRであると判断され(ステップS112)、受話レベルR(t)がピーク区間のものであると判定され(ステップS113)、送話信号y(t)の送話レベルS(t)が算出され(ステップS114)、推定エコーレベルAC(t’)・R(t)が算出され(ステップS115)、AC(t’)・R(t)<S(t)であると判定された(ステップS116)場合、第3の実施の形態との相違点であるステップS118の処理が実行される。
ステップS118では、送話検出部91において、音響結合量記憶部31から最新の音響結合量AC(t’)を、メモリ97の領域17bから受話レベルR(t)を、領域17mから送話レベルS(t)をそれぞれ読み込む。そして、送話検出部91は、送話レベルS(t)が、予め設定された固定閾値TSを超え(S(t)>TS)、さらに最新の音響結合量AC(t’)と受話レベルR(t)とを用いて算出された推定エコーレベルの定数(1より大きな定数)倍である閾値TEを超えた(S(t)>TE)か否かを判定する。ここで、S(t)>TS及びS(t)>TEの条件を満たした場合にのみ、送話検出部91は、送話が行われている旨の情報(送話検出情報)を出力し、メモリ97の領域97nに格納する。そして、制御部18は、メモリ97の領域97nを参照し、そこに送話検出情報が格納されている場合、音響結合量更新部34に指示を与え、音響結合量更新部34は、式(13a)によって算出された新たな音響結合量AC(t)によって音響結合量記憶部31のデータを更新する(ステップS119)。一方、領域97nに送話検出情報が格納されていない場合、制御部18は、音響結合量更新部34に指示を与え、音響結合量更新部34は、式(13b)によって算出された新たな音響結合量AC(t)によって音響結合量記憶部31のデータを更新する(ステップS120)。
AC(t)=AC(t’)・q1 …(13a)
AC(t)=AC(t’)・q2 …(13a)
ただし、q1,q2は予め設定された定数であり、1<q1<q2を満たすものである。すなわち、送話検出部91から送話が行われている旨の情報(送話検出情報)が出力された場合、音響結合量更新部34は、更新前の音響結合量と新たな音響結合量との差を小さくして音響結合量記憶部31に格納されているデータの更新を行う。その後、第3の実施の形態のステップS39と同様なステップS121の処理を行う。ただし、ステップS121の処理は、領域97nのデータを削除する処理が加わる点でステップS39の処理と異なる。
なお、ステップS119の処理を行わない構成としてもよい。この場合、音響結合量更新部34は、送話検出部91から送話が行われている旨の情報(送話検出情報)が出力された際、音響結合量記憶部31に格納されているデータの更新を行わないこととなる。
〔第9の実施の形態〕
本形態は、第5の実施の形態において、送話検出部において、少なくとも送話レベルが、推定エコーレベルの定数(1より大きな定数)倍を超えたことを条件に、送話が行われている旨の情報を出力し、送話検出部から送話が行われている旨の情報(送話検出情報)が出力された場合、音響結合量更新部は、音響結合量記憶部に格納されているデータの更新を行わないか、更新前の音響結合量と新たな音響結合量との差を小さくして音響結合量記憶部に格納されているデータの更新を行う例である。なお、処理一般については第5の実施の形態と同様であり、送話検出情報が出力された後の処理については第6〜8の実施の形態と同様(周波数ごとの処理となる点を除いては)であるため説明を省略し、送話検出部のみについて詳細に説明する。
図19は、第9の実施の形態における音響結合量推定装置100の構成を例示したブロック図である。なお、図19における矢印は情報の流れを示しているが、制御部53に入出力される情報の流れは一部を除き省略してある。
この図に例示するように、本形態の音響結合量推定装置100は、受話信号周波数変換部51と、送話周波数変換部52と、N個の音響結合量推定部60−1〜Nと、制御部53と、送話検出部110とを有している。そして、音響結合量推定装置100は、制御部53の制御のもと、受話信号x(t)と送話信号y(t)とを用い、周波数ごとに音響結合量の推定を行う。
図20は、図19における送話検出部110の構成を例示したブロック図である。なお、図20における矢印は情報の流れを示している。
この図に例示するように、送話検出部110は、受話レベル計算部111、レベル計算部113、送話ノイズレベル推定部114、統合部115、時間領域変換部116、比較部117及びメモリ118を有しており、時間領域の受話信号x(t)及び送話信号y(t)と各音響結合量推定部60−1〜Nから出力された時間周波数領域の音響結合量とを用い、送話検出を行う。
<送話検出部の処理>
図21は、送話検出部110の処理を説明するためのフローチャートである。以下、この図を用いて送話検出部110の処理を説明する。
まず、図21に示す処理の前提として、メモリ118のデータをクリアし、さらに領域118a,118c,118f,118hに所定の初期値(例えば、各領域に格納される値の平均的な値)を格納する。その後、以下の処理を実行する。
まず、統合部115において、各音響結合量推定部60−1〜Nのメモリから時間tにおける時間周波数領域の音響結合量を読み出し、これらを統合し(ステップS131)、時間領域変換部116において、逆フーリエ変換等により、その統合結果を時間領域に変換して音響結合量AC(t)を算出する(ステップS132)。なお、この音響結合量AC(t)は、メモリ118の領域118eに格納される。
次に、受話レベル計算部111に時間領域の受話信号x(t)が入力され、受話レベル計算部111は、受話信号x(t)の受話レベルR(t)を算出してメモリ118の領域118bに格納する。ここで、受話レベルR(t)の算出は、例えば、第1の実施の形態の受話レベル計算部11と同様に行う(ステップS133)。
次に、送話レベル計算部113に時間領域の送話信号y(t)が入力され、送話レベル計算部113は、送話信号y(t)の送話レベルS(t)を算出してメモリ118の領域118iに格納する。ここで、送話レベルS(t)の算出は、例えば、第1の実施の形態の送話レベル計算部16と同様に行う(ステップS134)。
次に、送話ノイズレベル推定部114において、メモリ118の領域118fから送話ノイズレベルNs(t−1)を読み込み、領域118iから送話レベルS(t)を読み込み、第2の実施の形態のステップS12と同様な手順(例えば、Ns(t)=S(t)〔for Ns(t-1)>S(t)〕,Ns(t)=u・Ns(t‐1)+(1-u)・S(t)〔for Nr(t-1)<R(t)〕,0<u<1)により送話ノイズレベルNs(t)を算出し、メモリ118の領域118gに格納する(ステップS135)。
次に、比較部117において、メモリ118の領域118eから最新の音響結合量AC(t−1)を、領域118bから受話レベルR(t)を、領域118iから送話レベルS(t)を、領域118gから、送話ノイズレベルNs(t)をそれぞれ読み込む。そして、比較部117は、送話レベルS(t)が、予め設定された固定閾値TSを超え(S(t)>TS)、さらに最新の音響結合量AC(t−1)と受話レベルR(t)とを用いて算出された推定エコーレベルの定数(1より大きな定数)倍である閾値TEを超え(S(t)>TE)、なおかつ送話ノイズレベルNs(t)を定数倍した閾値TN’を超えた(S(t)>TN’)か否かを判定する。ここで、S(t)>TSかつS(t)>TEかつS(t)>TN’の条件を満たした場合にのみ、比較部117は、送話検出信号を制御部53(図19)に対して出力する(ステップS137)。そして、制御部53は、t+1を新たなtとし、メモリ118の領域118bのデータを領域118aに移し、領域118gのデータを領域118fに移し、領域118iのデータを領域118hに移し、ステップS131以降の処理を繰り返し実行させる。また、送話検出信号が入力された制御部53は、各音響結合量推定部60−1〜Nに対し、音響結合量記憶部に格納されているデータの更新を行わないか、更新前の音響結合量と新たな音響結合量との差を小さくして音響結合量記憶部に格納されているデータの更新を行う旨の指示を与える。
なお、本発明は上述の各実施の形態に限定されるものではなく、各形態の思想を組合せる等、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。
また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよいが、具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
本発明の適用分野としては、例えば、TV会議や音声会議などハンズフリー通信システムにおける送話検出やハウリング防止のための音声スイッチを例示できるが、特にこれに限定されるものではない。
図1は、第1の実施の形態における音響結合量推定装置の構成を例示したブロック図である。 図2は、第1の実施の形態における音響結合量推定処理を説明するためのフローチャートである。 図3は、受話レベルR(t)が固定閾値TRを超え、さらに受話レベルR(t)がピーク区間にあるという状態を説明するためのグラフである。 図4は、第2の実施の形態における音響結合量推定装置の構成を例示したブロック図である。 図5は、第2の実施の形態における音響結合量推定処理を説明するためのフローチャートである。 図6は、第3の実施の形態における音響結合量推定装置の構成を示したブロック図である。 図7は、本形態の音響結合量推定処理を説明するためのフローチャートである。 図8は、第4の実施の形態における音響結合量推定装置の構成を例示したブロック図である。 図9は、第4の実施の形態における音響結合量推定処理を説明するためのフローチャートである。 図10は、第5の実施の形態における音響結合量推定装置の構成を例示したブロック図である。 図11は、図10における音響結合量推定部の構成を例示したブロック図である。 図12は、第6の実施の形態における音響結合量推定装置の構成を例示したブロック図である。 図13は、第6の実施の形態における音響結合量推定処理を説明するためのフローチャートである。 第7の実施の形態における音響結合量推定装置の構成を例示したブロック図である。 図15は、第7の実施の形態における音響結合量推定処理を説明するためのフローチャートである。 図16は、第7の実施の形態における音響結合量推定処理を説明するためのフローチャートである。 図17は、第8の実施の形態における音響結合量推定装置の構成を示したブロック図である。 図18は、第8の実施の形態における音響結合量推定処理を説明するためのフローチャートである。 図19は、第9の実施の形態における音響結合量推定装置の構成を例示したブロック図である。 図20は、図19における送話検出部の構成を例示したブロック図である。 図21は、図19における送話検出部の処理を説明するためのフローチャートである。 図22は、従来の音響結合量推定装置の構成を示す構成図である。
符号の説明
10〜100 音響結合量推定装置

Claims (16)

  1. 音響結合量の推定を行う音響結合量推定方法であって、
    受話レベル計算手段に受話信号が入力され、当該受話レベル計算手段において、当該受話信号のパワーレベル(以下「受話レベル」という。)を算出して出力するステップと、
    受話検出手段において、前記受話レベルと予め設定された固定閾値とを比較し、当該固定閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力するステップと、
    ピーク区間検出手段において、前記受話レベルが前記固定閾値よりも大きい区間であり、受話レベルが増加しなくなった点から、所定の条件を満たす間の区間をピーク区間と判定し、その判定結果を出力するステップと、
    送話レベル計算手段に送話信号が入力され、当該送話レベル計算手段において、当該送話信号のパワーレベル(以下「送話レベル」という。)を算出して出力するステップと、
    少なくとも前記受話検出手段から受話があった旨の情報が出力され、前記ピーク区間検出手段から前記受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、音響結合量計算手段において、前記受話レベルと前記送話レベルとの比から音響結合量の瞬時値を算出して出力するステップと、
    時間平滑手段において、前記音響結合量の瞬時値から音響結合量を算出して出力するステップと、
    を有することを特徴とする音響結合量推定方法。
  2. 音響結合量の推定を行う音響結合量推定方法であって、
    受話レベル計算手段に受話信号が入力され、当該受話レベル計算手段において、当該受話信号のパワーレベル(以下「受話レベル」という。)を算出して出力するステップと、
    受話ノイズレベル推定手段において、前記受話レベルから前記受話信号のノイズレベルの推定値(以下「受話ノイズレベル」という)を算出して出力するステップと、
    受話検出手段において、前記受話ノイズレベルの定数倍の閾値及び予め設定された固定閾値と、前記受話レベルとを比較し、これら両方の閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力するステップと、
    ピーク区間検出手段において、前記受話レベルが前記固定閾値よりも大きい区間であり、受話レベルが増加しなくなった点から、所定の条件を満たす間の区間をピーク区間と判定し、その判定結果を出力するステップと、
    送話レベル計算手段に送話信号が入力され、当該送話レベル計算手段において、当該送話信号のパワーレベル(以下「送話レベル」という。)を算出して出力するステップと、
    送話ノイズレベル推定手段において、前記送話レベルから前記送話信号のノイズレベルの推定値(以下「送話ノイズレベル」という。)を算出して出力するステップと、
    少なくとも前記受話検出手段から受話があった旨の情報が出力され、前記ピーク区間検出手段から前記受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、音響結合量計算手段において、前記受話レベルから前記受話ノイズレベルを減じた値と前記送話レベルから前記送話ノイズレベルを減じた値との比から音響結合量の瞬時値を算出して出力するステップと、
    時間平滑手段において、前記音響結合量の瞬時値から音響結合量を算出して出力するステップと、
    を有することを特徴とする音響結合量推定方法。
  3. 音響結合量の推定を行う音響結合量推定方法であって、
    受話レベル計算手段に受話信号が入力され、当該受話レベル計算手段において、当該受話信号のパワーレベル(以下「受話レベル」という。)を算出して出力するステップと、
    受話検出手段において、前記受話レベルと予め設定された固定閾値とを比較し、当該固定閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力するステップと、
    ピーク区間検出手段において、前記受話レベルが前記固定閾値よりも大きい区間であり、受話レベルが増加しなくなった点から、所定の条件を満たす間の区間をピーク区間と判定し、その判定結果を出力するステップと、
    送話レベル計算手段に送話信号が入力され、当該送話レベル計算手段において、当該送話信号のパワーレベル(以下「送話レベル」という。)を算出して出力するステップと、
    少なくとも前記受話検出手段から受話があった旨の情報が出力され、前記ピーク区間検出手段から前記受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、音響結合量更新手段において、音響結合量記憶手段に格納されている最新の音響結合量に前記受話レベルを乗じた推定エコーレベルと前記送話レベルとを比較し、当該推定エコーレベルよりも送話レベルのほうが大きい場合に、当該最新の音響結合量よりも大きな値を新たな音響結合量として前記音響結合量記憶手段のデータを更新し、当該推定エコーレベルよりも送話レベルのほうが小さい場合に、当該最新の音響結合量よりも小さな値を新たな音響結合量として前記音響結合量記憶手段のデータを更新するステップと、
    を有することを特徴とする音響結合量推定方法。
  4. 音響結合量の推定を行う音響結合量推定方法であって、
    受話レベル計算手段に受話信号が入力され、当該受話レベル計算手段において、当該受話信号のパワーレベル(以下「受話レベル」という。)を算出して出力するステップと、
    受話ノイズレベル推定手段において、前記受話レベルから前記受話信号のノイズレベルの推定値(以下「受話ノイズレベル」という)を算出して出力するステップと、
    受話検出手段において、前記受話ノイズレベルの定数倍の閾値及び予め設定された固定閾値と、前記受話レベルとを比較し、これら両方の閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力するステップと、
    ピーク区間検出手段において、前記受話レベルが前記固定閾値よりも大きい区間であり、受話レベルが増加しなくなった点から、所定の条件を満たす間の区間をピーク区間と判定し、その判定結果を出力するステップと、
    送話レベル計算手段に送話信号が入力され、当該送話レベル計算手段において、当該送話信号のパワーレベル(以下「送話レベル」という。)を算出して出力するステップと、
    送話ノイズレベル推定手段において、前記送話レベルから前記送話信号のノイズレベルの推定値(以下「送話ノイズレベル」という。)を算出して出力するステップと、
    少なくとも前記受話検出手段から受話があった旨の情報が出力され、前記ピーク区間検出手段から前記受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、音響結合量更新手段において、前記受話レベルから前記受話ノイズレベルを減じた値に音響結合量記憶手段に格納されている最新の音響結合量を乗じた推定エコーレベルと、前記送話レベルから前記送話ノイズレベルを減じた値とを比較し、当該推定エコーレベルよりも前記送話レベルから前記送話ノイズレベルを減じた値のほうが大きい場合に、当該最新の音響結合量よりも大きな値を新たな音響結合量として前記音響結合量記憶手段のデータを更新し、当該推定エコーレベルよりも前記送話レベルから前記送話ノイズレベルを減じた値のほうが小さい場合に、当該最新の音響結合量よりも小さな値を新たな音響結合量として前記音響結合量記憶手段のデータを更新するステップと、
    を有することを特徴とする音響結合量推定方法。
  5. 請求項1から4の何れかに記載の音響結合量推定方法であって、
    受話周波数領域変換手段において、時間領域の受話信号を時間周波数領域の受話信号に変換して出力するステップと、
    送話周波数領域変換手段において、時間領域の送話信号を時間周波数領域の送話信号に変換して出力するステップと、をさらに有し、
    前記受話レベル計算手段に入力される前記受話信号が、前記受話周波数領域変換手段から出力された時間周波数領域の受話信号であり、
    前記送話レベル計算手段に入力される前記送話信号が、前記送話周波数領域変換手段から出力された時間周波数領域の送話信号であり、
    請求項1から4の各ステップが周波数毎に実行される、
    ことを特徴とする音響結合量推定方法。
  6. 請求項1,2或いは5に記載の音響結合量推定方法であって、
    送話検出手段において、少なくとも前記送話レベルが、最新の前記音響結合量と前記受話レベルとを用いて算出された推定エコーレベルの定数(1より大きな定数)倍を超えたことを条件に、送話が行われている旨の情報を出力するステップをさらに有し、
    前記送話検出手段から送話が行われている旨の情報が出力された場合、前記音響結合量計算手段は、前記推定エコーレベルの定数倍を超えた前記送話レベルに対応する新たな音響結合量の瞬時値の算出を行わない、
    ことを特徴とする音響結合量推定方法。
  7. 請求項3から5のいずれかに記載の音響結合量推定方法であって、
    送話検出手段において、少なくとも前記送話レベルが、前記推定エコーレベルの定数(1より大きな定数)倍を超えたことを条件に、送話が行われている旨の情報を出力するステップをさらに有し、
    前記送話検出手段から送話が行われている旨の情報が出力された場合、前記音響結合量更新手段は、前記音響結合量記憶手段に格納されているデータの更新を行わないか、更新前の音響結合量と新たな音響結合量との差を小さくして前記音響結合量記憶手段に格納されているデータの更新を行う、
    ことを特徴とする音響結合量推定方法。
  8. 音響結合量の推定を行う音響結合量推定装置であって、
    受話信号が入力され、当該受話信号のパワーレベル(以下「受話レベル」という。)を算出して出力する受話レベル計算手段と、
    前記受話レベルと予め設定された固定閾値とを比較し、当該固定閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力する受話検出手段と、
    前記受話レベルが前記固定閾値よりも大きい区間であり、受話レベルが増加しなくなった点から、所定の条件を満たす間の区間をピーク区間と判定し、その判定結果を出力するピーク区間検出手段と、
    送話信号のパワーレベル(以下「送話レベル」という。)を算出して出力する送話レベル計算手段と、
    少なくとも前記受話検出手段から受話があった旨の情報が出力され、前記ピーク区間検出手段から前記受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、前記受話レベルと前記送話レベルとの比から音響結合量の瞬時値を算出して出力する音響結合量計算手段と、
    前記音響結合量の瞬時値から音響結合量を算出して出力する時間平滑手段と、
    を有することを特徴とする音響結合量推定装置。
  9. 音響結合量の推定を行う音響結合量推定装置であって、
    受話信号が入力され、当該受話信号のパワーレベル(以下「受話レベル」という。)を算出して出力する受話レベル計算手段と、
    前記受話レベルから前記受話信号のノイズレベルの推定値(以下「受話ノイズレベル」という)を算出して出力する受話ノイズレベル推定手段と、
    前記受話ノイズレベルの定数倍の閾値及び予め設定された固定閾値と、前記受話レベルとを比較し、これら両方の閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力する受話検出手段と、
    前記受話レベルが前記固定閾値よりも大きい区間であり、受話レベルが増加しなくなった点から、所定の条件を満たす間の区間をピーク区間と判定し、その判定結果を出力するピーク区間検出手段と、
    送話レベル計算手段に送話信号が入力され、当該送話信号のパワーレベル(以下「送話レベル」という。)を算出して出力する送話レベル計算手段と、
    前記送話レベルから前記送話信号のノイズレベルの推定値(以下「送話ノイズレベル」という。)を算出して出力する送話ノイズレベル推定手段と、
    少なくとも前記受話検出手段から受話があった旨の情報が出力され、前記ピーク区間検出手段から前記受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、前記受話レベルから前記受話ノイズレベルを減じた値と前記送話レベルから前記送話ノイズレベルを減じた値との比から音響結合量の瞬時値を算出して出力する音響結合量計算手段と、
    前記音響結合量の瞬時値から音響結合量を算出して出力する時間平滑手段と、
    を有することを特徴とする音響結合量推定装置。
  10. 音響結合量の推定を行う音響結合量推定装置であって、
    受話信号が入力され、当該受話信号のパワーレベル(以下「受話レベル」という。)を算出して出力する受話レベル計算手段と、
    前記受話レベルと予め設定された固定閾値とを比較し、当該固定閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力する受話検出手段と、
    前記受話レベルが前記固定閾値よりも大きい区間であり、受話レベルが増加しなくなった点から、所定の条件を満たす間の区間をピーク区間と判定し、その判定結果を出力するピーク区間検出手段と、
    送話レベル計算手段に送話信号が入力され、当該送話信号のパワーレベル(以下「送話レベル」という。)を算出して出力する送話レベル計算手段と、
    少なくとも前記受話検出手段から受話があった旨の情報が出力され、前記ピーク区間検出手段から前記受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、音響結合量記憶手段に格納されている最新の音響結合量に前記受話レベルを乗じた推定エコーレベルと前記送話レベルとを比較し、当該推定エコーレベルよりも送話レベルのほうが大きい場合に、当該最新の音響結合量よりも大きな値を新たな音響結合量として前記音響結合量記憶手段のデータを更新し、当該推定エコーレベルよりも送話レベルのほうが小さい場合に、当該最新の音響結合量よりも小さな値を新たな音響結合量として前記音響結合量記憶手段のデータを更新する音響結合量更新手段と、
    を有することを特徴とする音響結合量推定装置。
  11. 音響結合量の推定を行う音響結合量推定装置であって、
    受話信号が入力され、当該受話信号のパワーレベル(以下「受話レベル」という。)を算出して出力する受話レベル計算手段と、
    前記受話レベルから前記受話信号のノイズレベルの推定値(以下「受話ノイズレベル」という)を算出して出力する受話ノイズレベル推定手段と、
    前記受話ノイズレベルの定数倍の閾値及び予め設定された固定閾値と、前記受話レベルとを比較し、これら両方の閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力する受話検出手段と、
    前記受話レベルが前記固定閾値よりも大きい区間であり、受話レベルが増加しなくなった点から、所定の条件を満たす間の区間をピーク区間と判定し、その判定結果を出力するピーク区間検出手段と、
    送話レベル計算手段に送話信号が入力され、当該送話信号のパワーレベル(以下「送話レベル」という。)を算出して出力する送話レベル計算手段と、
    前記送話レベルから前記送話信号のノイズレベルの推定値(以下「送話ノイズレベル」という。)を算出して出力する送話ノイズレベル推定手段と、
    少なくとも前記受話検出手段から受話があった旨の情報が出力され、前記ピーク区間検出手段から前記受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、前記受話レベルから前記受話ノイズレベルを減じた値に音響結合量記憶手段に格納されている最新の音響結合量を乗じた推定エコーレベルと、前記送話レベルから前記送話ノイズレベルを減じた値とを比較し、当該推定エコーレベルよりも前記送話レベルから前記送話ノイズレベルを減じた値のほうが大きい場合に、当該最新の音響結合量よりも大きな値を新たな音響結合量として前記音響結合量記憶手段のデータを更新し、当該推定エコーレベルよりも前記送話レベルから前記送話ノイズレベルを減じた値のほうが小さい場合に、当該最新の音響結合量よりも小さな値を新たな音響結合量として前記音響結合量記憶手段のデータを更新する音響結合量更新手段と、
    を有することを特徴とする音響結合量推定装置。
  12. 請求項8から11の何れかに記載の音響結合量推定装置であって、
    時間領域の受話信号を時間周波数領域の受話信号に変換して出力する受話周波数領域変換手段と、
    時間領域の送話信号を時間周波数領域の送話信号に変換して出力する送話周波数領域変換手段と、をさらに有し、
    前記受話レベル計算手段に入力される前記受話信号が、前記受話周波数領域変換手段から出力された時間周波数領域の受話信号であり、
    前記送話レベル計算手段に入力される前記送話信号が、前記送話周波数領域変換手段から出力された時間周波数領域の送話信号であり、
    請求項8から11の各手段における処理が周波数毎に実行される、
    ことを特徴とする音響結合量推定装置。
  13. 請求項8,9或いは12に記載の音響結合量推定装置であって、
    少なくとも前記送話レベルが、最新の前記音響結合量と前記受話レベルとを用いて算出された推定エコーレベルの定数(1より大きな定数)倍を超えたことを条件に、送話が行われている旨の情報を出力する送話検出手段をさらに有し、
    前記送話検出手段から送話が行われている旨の情報が出力された場合、前記音響結合量計算手段は、前記推定エコーレベルの定数倍を超えた前記送話レベルに対応する新たな音響結合量の瞬時値の算出を行わない、
    ことを特徴とする音響結合量推定装置。
  14. 請求項10から12のいずれかに記載の音響結合量推定装置であって、
    少なくとも前記送話レベルが、前記音響結合量と前記受話レベルとを用いて算出された推定音響エコーレベルの定数(1より大きな定数)倍を超えたことを条件に、送話が行われている旨の情報を出力する送話検出手段をさらに有し、
    前記送話検出手段から送話が行われている旨の情報が出力された場合、前記音響結合量更新手段は、前記音響結合量記憶手段に格納されているデータの更新を行わないか、更新前の音響結合量と新たな音響結合量との差を小さくして前記音響結合量記憶手段に格納されているデータの更新を行う、
    ことを特徴とする音響結合量推定装置。
  15. 請求項1から7のいずれかに記載の音響結合量推定方法をコンピュータに実行させるための音響結合量推定プログラム。
  16. 請求項1から7のいずれかに記載の音響結合量推定方法をコンピュータに実行させるための音響結合量推定プログラムを格納したコンピュータ読み取り可能な記録媒体。
JP2005151144A 2005-05-24 2005-05-24 音響結合量推定方法、その装置、そのプログラム及びその記録媒体 Expired - Fee Related JP4559914B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005151144A JP4559914B2 (ja) 2005-05-24 2005-05-24 音響結合量推定方法、その装置、そのプログラム及びその記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005151144A JP4559914B2 (ja) 2005-05-24 2005-05-24 音響結合量推定方法、その装置、そのプログラム及びその記録媒体

Publications (2)

Publication Number Publication Date
JP2006332872A JP2006332872A (ja) 2006-12-07
JP4559914B2 true JP4559914B2 (ja) 2010-10-13

Family

ID=37554113

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005151144A Expired - Fee Related JP4559914B2 (ja) 2005-05-24 2005-05-24 音響結合量推定方法、その装置、そのプログラム及びその記録媒体

Country Status (1)

Country Link
JP (1) JP4559914B2 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07226994A (ja) * 1994-02-14 1995-08-22 Nippon Telegr & Teleph Corp <Ntt> 音響結合量最小位置決定装置
JP2003125070A (ja) * 2001-10-15 2003-04-25 Fujitsu Ltd 通話信号処理装置
JP2003324370A (ja) * 2002-04-26 2003-11-14 Matsushita Electric Works Ltd エコーキャンセラ
JP2004320451A (ja) * 2003-04-16 2004-11-11 Nippon Telegr & Teleph Corp <Ntt> 音声損失制御方法、音声損失制御装置、音声損失制御プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07226994A (ja) * 1994-02-14 1995-08-22 Nippon Telegr & Teleph Corp <Ntt> 音響結合量最小位置決定装置
JP2003125070A (ja) * 2001-10-15 2003-04-25 Fujitsu Ltd 通話信号処理装置
JP2003324370A (ja) * 2002-04-26 2003-11-14 Matsushita Electric Works Ltd エコーキャンセラ
JP2004320451A (ja) * 2003-04-16 2004-11-11 Nippon Telegr & Teleph Corp <Ntt> 音声損失制御方法、音声損失制御装置、音声損失制御プログラム

Also Published As

Publication number Publication date
JP2006332872A (ja) 2006-12-07

Similar Documents

Publication Publication Date Title
US10841431B2 (en) Detection of acoustic echo cancellation
JP6422886B2 (ja) エコー抑圧
US20020169602A1 (en) Echo suppression and speech detection techniques for telephony applications
CN104050971A (zh) 声学回声减轻装置和方法、音频处理装置和语音通信终端
KR101975251B1 (ko) 오디오 신호 처리 시스템 및 이의 에코 신호 제거 방법
US9154874B2 (en) Howling detection device, howling suppressing device and method of detecting howling
JP6422885B2 (ja) エコー抑圧
JP2012155339A (ja) 音声状態モデルを使用したマルチセンサ音声高品質化
JP5087024B2 (ja) エコー消去装置とその方法と、プログラム
US8831210B2 (en) Method and system for detection of onset of near-end signal in an echo cancellation system
US9277059B2 (en) Echo removal
JP2008259032A (ja) 情報処理装置、およびプログラム
CN103814584B (zh) 声音处理装置和声音处理方法
JP4413205B2 (ja) エコー抑圧方法、装置、エコー抑圧プログラム、記録媒体
JP4559914B2 (ja) 音響結合量推定方法、その装置、そのプログラム及びその記録媒体
JP6537997B2 (ja) エコー抑圧装置、その方法、プログラム、及び記録媒体
US11437054B2 (en) Sample-accurate delay identification in a frequency domain
JP4542538B2 (ja) ダブルトーク状態判定方法、その方法を用いた反響消去装置、そのプログラム及びその記録媒体
JP2006352239A (ja) 音響結合量推定方法、音響結合量推定装置、プログラム、記録媒体
JP7235117B2 (ja) エコー消去装置、エコー消去方法、プログラム
JP2006270709A (ja) エコー除去装置、電子会議装置、エコー除去方法、およびエコー除去プログラム
US20030235293A1 (en) Adaptive system control
JP5346350B2 (ja) 反響消去装置とその方法とプログラム
JP5562405B2 (ja) エコー消去方法とその装置とプログラムとその記録媒体
JP6779489B2 (ja) 抽出発生音補正装置、抽出発生音補正方法、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070810

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100420

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100609

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100713

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100723

R150 Certificate of patent or registration of utility model

Ref document number: 4559914

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130730

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees