JP4559914B2 - 音響結合量推定方法、その装置、そのプログラム及びその記録媒体 - Google Patents
音響結合量推定方法、その装置、そのプログラム及びその記録媒体 Download PDFInfo
- Publication number
- JP4559914B2 JP4559914B2 JP2005151144A JP2005151144A JP4559914B2 JP 4559914 B2 JP4559914 B2 JP 4559914B2 JP 2005151144 A JP2005151144 A JP 2005151144A JP 2005151144 A JP2005151144 A JP 2005151144A JP 4559914 B2 JP4559914 B2 JP 4559914B2
- Authority
- JP
- Japan
- Prior art keywords
- level
- acoustic coupling
- reception
- coupling amount
- transmission
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Description
しかし、このようなハンズフリー通信システムを良好に作動させるためには、反響の問題を解決しなければならない。すなわち、このようなシステムの場合、送話者側の端末装置に設置されたマイクロホンから入力された音声の情報は、増幅器、通信路等を通じて受話者側の端末装置に送られ、そこに設置されたスピーカから音声として出力される。この出力された音声の一部は、さらに受話者側の端末装置に設置されたマイクロホンにより受音され、受話信号として、増幅器、通信路等を通じて送話者側の端末装置に送信され、送話者側のスピーカから音声として出力される。ここで、この送話者側のスピーカから出力される音声は、送話者自身が発話した音声である。このように自分の発声した音声が自身のスピーカから再生される反響現象を音響エコーと呼ぶ。この音響エコーは、ハンズフリー通信システムにおいて通話の障害、不快感その他の悪影響を生じさせる。特に、この送話者側のスピーカから再生された発声が、更に送話者側のマイクロホンにより受音された場合、信号の閉ループが形成される。そして、このループゲインが1より大きい場合にはハウリング現象が発生して通話は不能となる。
以下、従来の音響結合量推定方法について説明する。
受話レベル計算部201は、受話信号(スピーカ出力信号)x(t)を時間平均し、受話レベルR(t)を求める。この計算は、たとえば、以下の式(1)を用いて行われる。
R(t)=a・R(t‐1)+(1‐a)・|x(t)| …(1)
ただし、aは予め設定された0<a<1の平滑化係数である。aが1に近いほど、より緩やかなレベル変化となる。
時間平滑部205は、推定音響結合量の瞬時値AC’(t)を時間平滑化して、より正確な推定音響結合量AC(t)を求める。ただし、ダブルトーク時においては送話信号に送話音声が混合しているので、推定音響結合量の瞬時値AC’(t)は、真の値よりも大きな値となってしまう。この影響を少なくするため、この場合にはディップホールドを用いた時間平滑化が行われる。このディップホールドを用いた平滑化は、例えば式(3a)(3b)により実現される。
AC(t)=c・AC(t‐1)+(1‐c)・AC'(t) for AC(t‐1)<AC'(t) …(3b)
ただし、bは推定音響結合量増加時の平滑化係数であり、cは推定音響結合量減少時の平滑化係数であり、それぞれ0<b,0<c<1の値をあらかじめ設定する。b>>cとなるように設定すれば、推定音響結合量増加時に非常に緩やかな値の上昇となり、ディップホールドの効果が得られる。
以上のように従来技術では音響結合量の推定が行われる。
また、第3の本発明では、受話レベル計算手段に受話信号が入力され、当該受話レベル計算手段において、当該受話信号の受話レベルを算出して出力する。また、受話検出手段において、受話レベルと予め設定された固定閾値とを比較し、当該固定閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力する。さらに、ピーク区間検出手段において、受話レベルがピーク区間のものであるか否かを判定し、その判定結果を出力する。また、送話レベル計算手段に送話信号が入力され、当該送話レベル計算手段において、当該送話信号の送話レベルを算出して出力する。そして、少なくとも受話検出手段から受話があった旨の情報が出力され、ピーク区間検出手段から受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、音響結合量更新手段において、音響結合量記憶手段に格納されている最新の音響結合量に受話レベルを乗じた推定エコーレベルと送話レベルとを比較し、当該推定エコーレベルよりも送話レベルのほうが大きい場合に、当該最新の音響結合量よりも大きな値を新たな音響結合量として音響結合量記憶手段のデータを更新し、当該推定エコーレベルよりも送話レベルのほうが小さい場合に、当該最新の音響結合量よりも小さな値を新たな音響結合量として音響結合量記憶手段のデータを更新する。
また、第4の本発明では、受話レベル計算手段に受話信号が入力され、当該受話レベル計算手段において、当該受話信号の受話レベルを算出して出力する。また、受話ノイズレベル推定手段において、受話レベルから受話信号の受話ノイズレベルを算出して出力する。さらに、受話検出手段において、受話ノイズレベルの定数倍の閾値及び予め設定された固定閾値と、受話レベルとを比較し、これら両方の閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力する。また、ピーク区間検出手段において、受話レベルがピーク区間のものであるか否かを判定し、その判定結果を出力する。さらに、送話レベル計算手段に送話信号が入力され、当該送話レベル計算手段において、当該送話信号の送話レベルを算出して出力する。また、送話ノイズレベル推定手段において、送話レベルから送話信号の送話ノイズレベルを算出して出力する。そして、少なくとも受話検出手段から受話があった旨の情報が出力され、ピーク区間検出手段から受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、音響結合量更新手段において、受話レベルから受話ノイズレベルを減じた値に音響結合量記憶手段に格納されている最新の音響結合量を乗じた推定エコーレベルと、送話レベルから前記送話ノイズレベルを減じた値とを比較し、当該推定エコーレベルよりも送話レベルから前記送話ノイズレベルを減じた値のほうが大きい場合に、当該最新の音響結合量よりも大きな値を新たな音響結合量として音響結合量記憶手段のデータを更新し、当該推定エコーレベルよりも送話レベルから前記送話ノイズレベルを減じた値のほうが小さい場合に、当該最新の音響結合量よりも小さな値を新たな音響結合量として音響結合量記憶手段のデータを更新する。
また、本発明において、好ましくは、送話検出手段において、少なくとも送話レベルが、最新の音響結合量と受話レベルとを用いて算出された推定エコーレベルの定数(1より大きな定数)倍を超えたことを条件に、送話が行われている旨の情報を出力し、送話検出手段から送話が行われている旨の情報が出力された場合、音響結合量計算手段は、推定エコーレベルの定数倍を超えた送話レベルに対応する新たな音響結合量の瞬時値の算出を行わない。
また、本発明において、好ましくは、送話検出手段において、少なくとも送話レベルが、推定エコーレベルの定数(1より大きな定数)倍を超えたことを条件に、送話が行われている旨の情報を出力し、送話検出手段から送話が行われている旨の情報が出力された場合、音響結合量更新手段は、音響結合量記憶手段に格納されているデータの更新を行わないか、更新前の音響結合量と新たな音響結合量との差を小さくして音響結合量記憶手段に格納されているデータの更新を行う。
〔第1の実施の形態〕
まず、本発明における第1の実施の形態について説明する。
図1は、第1の実施の形態における音響結合量推定装置10の構成を例示したブロック図である。なお、図1における矢印は情報の流れを示しているが、制御部18に入出力される情報の流れは省略してある。
この図に例示するように、本形態の音響結合量推定装置10は、受話レベル計算部11と、受話検出部12と、ピーク区間検出部13と、音響結合量計算部14と、時間平滑部15と、送話レベル計算部16と、メモリ17と、制御部18とを有している。そして、音響結合量推定装置10は、制御部18の制御のもと、増幅器2及びスピーカ1を通じて出力される受話信号x(t)と、マイクロホン3から入力され増幅器4で増幅された送話信号y(t)とを用い、音響結合量の推定を行う。
ここで、受話レベル計算部11、受話検出部12、ピーク区間検出部13、音響結合量計算部14、時間平滑部15、送話レベル計算部16及び制御部18は、例えば公知のCPU(Central Processing Unit)やMPU(Micro Processing Unit)に所定のプログラムが読み込まれ、これが実行されることによって構成されるものである。また、メモリ17としては、例えば、EEP−ROM(Electronically Erasable and Programmable-Read Only Memory)、RAM(Random Access Memory)等の書き換え可能な半導体メモリを例示できるが、その他磁気記録装置、光ディスク装置或いは光磁気記録装置等を用いることとしてもよい。また、メモリ17は物理的に一体のものに限らず、複数の記録媒体によって構成されていてもよい。
本形態では、固定的な閾値を用いて行う受話検出部12による判定処理に加え、受話信号がピーク区間のものであるか否かを検出するピーク区間検出部13による判定処理を併用する。これにより、受話レベルの高い区間のみを検出し、送話信号におけるエコー成分対雑音成分比が大きくなる区間でのみ、音響結合量の推定を行う。その結果、送話信号のノイズが大きい場合でも、精度の高い音響結合量の推定が可能となる。さらに、ピーク区間は、受話信号があればその受話レベルの大小に関わらず必ず検出されるものである。そのため、受話信号の受話レベルの大小に関わらず同一の判定基準を適用でき、精度の高い音響結合量の推定を、十分な推定速度で実現することができる。
図2は、本形態の音響結合量推定処理を説明するためのフローチャートである。以下、この図に沿って、本形態の音響結合量推定処理の詳細を説明していく。
まず、図2に示す処理の前提として、メモリ17のデータをクリアし、さらに領域17a,17d,17i,17kに所定の初期値(例えば、各領域に格納される値の平均的な値)を格納する。その後、以下の処理を実行する。
まず、受話レベル計算部11に受話信号x(t)(tは離散時間)が入力され、受話レベル計算部11は、受話信号x(t)の受話レベルR(t)を算出して出力する(ステップS1)。ここで、受話レベルR(t)の算出は、例えば以下のように行われる。
受話レベル計算部11において、メモリ17の領域17aから受話レベルR(t‐1)(存在しない場合には所定の初期値)を読み込み、式(4)の演算を行う。
R(t)=a・R(t‐1)+(1‐a)・|x(t)| …(4)
ただし、aは予め設定された平滑化係数であり、0<a<1の範囲をとる。ここで、aが1に近いほど、時間変化に伴う受話レベルR(t)の変化が緩やかになる。
[受話レベルR(t)の算出例2]
また、スピーカ、マイクロホン間の応答の残響時間を模擬するため、受話レベル上昇時の平滑化係数を小さくし、下降時の平滑化係数を大きくする方法を用いてもよい。すなわち、受話レベル計算部11において、メモリ17の領域17aから受話レベルR(t‐1)を読み込み、式(5a)(5b)の演算を行うこととしてもよい。
R(t)=e・R(t‐1)+(1‐c)・|x(t)| for R(t‐1)<|x(t)| …(5b)
ただし、dはレベル増加時の平滑化係数であり、eはレベル減少時の平滑化係数であり、それぞれ予め設定された0<e,d<1の範囲の値である。ここで、d<eとなるように設定すれば、受話レベルの減少が上昇に比べ緩やかとなり、残響を含んだレベルを模擬的に求めることができる(受話レベルR(t)の算出例の説明終わり)。
以上のように受話レベル計算部11において算出されて出力された受話レベルR(t)は、メモリ17の領域17bに格納される。次に、受話検出部12において、メモリ17の領域17bから受話レベルR(t)を読み込み、この受話レベルR(t)と予め設定された固定閾値TRとを比較する(ステップS2)。
この例では、以下の式(6a)〜(6c)で示される閾値TH(t)を設定する。
TH(t)=TR for g・R(t)≦TR …(6a)
TH(t)=g・R(t) for g・R(t)>TR and R(t)>R(t‐1) …(6b)
TH(t)=f・TH(t‐1)+(1‐f)・g・R(t) for g・R(t)>TR and R(t)≦R(t‐1) …(6c)
ここで、gは予め設定された0<g<1の定数である。また、fは予め設定された閾値下降時の平滑化係数であり0<f<1の範囲をとる。そして、受話レベルR(t)がこの閾値H(t)を超えるという条件TH(t)<R(t)と、受話レベルR(t)が下降するという条件R(t)≦R(t‐1)の両方を満たしたときに、受話レベルR(t)がピーク区間のものであると判定する。
AC'(t)=S(t)/R(t) …(7)
このように出力された音響結合量の瞬時値AC’(t)は、メモリ17の領域17hに格納され、次にステップS6に進む。
[音響結合量AC(t)の算出例1]
この例の時間平滑部15は、推定音響結合量の瞬時値AC’(t)を時間平滑化して、より正確な推定音響結合量AC(t)を求める。具体的には、例えば、AC(t)=α・AC(t‐1)十(1‐α)・AC'(t)により推定音響結合量AC(t)を求める。ただし、αは予め設定された平滑化係数である。
また、送話音声と受話音声が混在するダブルトーク時においては送話信号に送話音声が混合しているので、推定音響結合量の瞬時値AC’(t)は、真の値よりも大きな値となってしまう。この影響を少なくするため、時間平滑部15において、ディップホールドを用いた時間平滑化を行うこととしてもよい。このディップホールドを用いた平滑化は、例えば式(8a)(8b)により実現される。
AC(t)=b・AC(t‐1)+(1‐b)・AC'(t) for AC(t‐1)>AC'(t) …(8a)
AC(t)=c・AC(t‐1)+(1‐c)・AC'(t) for AC(t‐1)<AC'(t) …(8b)
ただし、bは推定音響結合量増加時の平滑化係数であり、cは推定音響結合量減少時の平滑化係数であり、それぞれ0<b,0<c<1の範囲の予め設定された値である。なおb>>c(bがcに対して十分大きい)となるように設定すれば、音響結合量AC(t)の増加が非常に緩やかとなり、ディップホールドの効果が得られる(音響結合量AC(t)の算出例の説明終わり)。
<本形態の特徴>
以上示した処理により、本形態では、受話レベルR(t)が固定閾値TRを超え、さらに受話レベルR(t)がピーク区間にある場合にのみ、すなわち、送話信号y(t)のエコー成分対雑音成分比がよい区間でのみ音響結合量AC(t)を推定することとした。
次に本発明における第2の実施の形態について説明する。
本形態は、第1の実施の形態の変形例であり、さらに受話ノイズレベルと送話ノイズレベルの推定を行い、これらを用いてより精度よく音響結合量の推定を行うものである。以下では、第1の実施の形態との相違点を中心に説明し、第1の実施の形態と共通する事項については説明を省略する。
<構成>
図4は、第2の実施の形態における音響結合量推定装置20の構成を例示したブロック図である。なお、図4における矢印は情報の流れを示しているが、制御部18に入出力される情報の流れは省略してある。また、図4において第1の実施の形態と共通する部分については図1と同じ符号を付している。
<処理>
次に、本形態の音響結合量推定処理を説明する。
まず、図5に示す処理の前提として、メモリ27のデータをクリアし、さらに領域17a,17d,17i,17k,27n,27rに所定の初期値(例えば、各領域に格納される値の平均的な値)を格納する。その後、以下の処理を実行する。
まず、受話レベル計算部11に受話信号x(t)が入力され、受話レベル計算部11は、受話信号x(t)の受話レベルR(t)を算出して出力し、メモリ27の領域17bに格納する(ステップS11)。ここで、受話レベルR(t)の算出は、例えば第1の実施の形態と同様に行う。
Nr(t)=u・Nr(t‐1)+(1-u)・R(t) for Nr(t-1)<R(t) …(9b)
ここで、uは事前に設定された推定ノイズレベルの平滑化係数であり0<u<1の値をとる。ここでuが1に近いと緩やかなノイズレベルの上昇となり、ディップホールドの効果が得られる。このように算出された受話ノイズレベルNr(t)は、メモリ27の領域27pに格納される。
次に、受話検出部22において、受話ノイズレベルNr(t)の定数倍(好ましくは1倍以上)の閾値TN及び予め設定された固定閾値TRと、受話レベルR(t)とを比較し、これら両方の閾値TN,TRよりも当該受話レベルR(t)が大きい場合に(R(t)>TR and R(t)>TN)、受話があった旨の情報(受話検出情報)を出力し、メモリ27の領域17cに格納する(ステップS13)。このように、受話ノイズレベルNr(t)を基準とした閾値TNを導入することにより、受話信号のノイズレベルが高い場合にも、このノイズレベルよりも受話レベルR(t)が大きい受話信号x(t)のみを抽出して音響結合量の推定処理にあてることができる。
ステップS14では、ピーク区間検出部13において、例えば第1の実施の形態と同様な手法により、受話レベルR(t)がピーク区間のものであるか否かを判定する(ステップS14)。そして、ピーク区間検出部13が、受話レベルR(t)がピーク区間のものであると判定した場合、ピーク区間検出部13は、ピーク区間検出情報を出力し、メモリ27の領域17fに格納する。一方、受話レベルR(t)がピーク区間のものでないと判定された場合には、ピーク区間検出情報は出力されない。そして、制御部18は、メモリ27の領域17fを参照し、そこにピーク区間検出情報が格納されていない場合には、前述のステップS19及びステップS20(後述)以降の処理を実行させる。一方、メモリ27の領域17fにピーク区間検出情報が格納されている場合には、制御部18は、以下のステップS15以降の処理を実行させる。
次に、送話ノイズレベル推定部26において、送話レベルS(t)から送話信号のノイズレベルの推定値(以下「送話ノイズレベルNs(t)」という。)を算出して出力し、メモリ27の領域27sに格納する(ステップS16)。具体的には、例えば、送話ノイズレベル推定部26は、メモリ27の領域27rから送話ノイズレベルNs(t−1)を読み込み、領域17mから送話レベルS(t)を読み込み、ステップS12と同様な手順(例えば、Ns(t)=S(t)〔for Ns(t-1)>S(t)〕,Ns(t)=u・Ns(t‐1)+(1-u)・S(t)〔for Nr(t-1)<R(t)〕,0<u<1)により送話ノイズレベルNs(t)を算出し、メモリ27の領域27sに格納する。
このように受話レベルR(t)及び送話レベルS(t)から推定ノイズレベルを減算し、音響結合量の瞬時値AC’(t)を算出することにより、第1の実施の形態よりも精度よく音響結合量の計算が可能となる。
次に、時間平滑部15において、メモリ27の領域17hから音響結合量の瞬時値AC’(t)を読み込み、例えば、第1の実施の形態と同様に音響結合量AC(t)を算出して出力し、メモリ27の領域17jに格納する(ステップS18)。
<本形態の特徴>
以上示した処理により、本形態では、受話レベルR(t)が閾値TNを超え、さらに受話レベルR(t)がピーク区間にある場合にのみ、すなわち、送話信号y(t)のエコー成分対雑音成分比がよい区間でのみ音響結合量AC(t)を推定することとした。これにより、音響結合量AC(t)の精度の向上とその推定精度の向上とを実現できる。さらに、本形態ではノイズレベルの推定を行い、それを音響結合量AC(t)の推定処理に用いることとした。これにより、第1の実施の形態よりも高い精度で音響結合量推定を行うことができる。
次に、本発明における第3の実施の形態について説明する。
本形態は、第1の実施の形態の変形例であり、割り算を用いることなく音響結合量推定を行うものである。以下では、第1の実施の形態との相違点を中心に説明し、第1の実施の形態と共通する事項については説明を省略する。
<構成>
図6は、第3の実施の形態における音響結合量推定装置30の構成を示したブロック図である。なお、図6における矢印は情報の流れを示しているが、制御部18に入出力される情報の流れは省略してある。また、図6において第1の実施の形態と共通する部分については図1と同じ符号を付している。
<処理>
次に、本形態の音響結合量推定処理を説明する。
図7は、本形態の音響結合量推定処理を説明するためのフローチャートである。以下、この図に沿って、本形態の音響結合量推定処理の詳細を説明していく。
まず、受話レベル計算部11に受話信号x(t)が入力され、受話レベル計算部11は、受話信号x(t)の受話レベルR(t)を算出して出力し、メモリ37の領域17bに格納する(ステップS31)。ここで、受話レベルR(t)の算出は、例えば第1の実施の形態と同様に行う。
ここで、R(t)>TRであると判断された場合、受話検出部12は、受話があったと判定し、その旨の情報(受話検出情報)を出力し、これをメモリ37の領域17cに格納する。一方、R(t)>TRでないと判断された場合、受話検出部12は、受話検出情報のメモリ37の領域17cへの格納を行わない。そして、制御部18は、メモリ37の領域17cを参照し、そこに受話検出情報が格納されていない場合には、後述するステップS39以降の処理を実行させる。一方、メモリ37の領域17cに受話検出情報が格納されている場合には、制御部18は、以下のステップS33以降の処理を実行させる。
次に、音響結合量更新部34の推定エコーレベル算出部34aにおいて、メモリ37の領域17bから受話信号レベルR(t)を読み込み、音響結合量記憶部31からそこに格納されている最新の音響結合量AC(t’)を読み込む。そして、推定エコーレベル算出部34aは、読み込んだ受話信号レベルR(t)と最新の音響結合量AC(t’)とを乗算して、推定エコーレベルAC(t’)・R(t)を求め、メモリ37の領域37mに格納する(ステップS35)。
AC(t)=p・AC(t') for AC(t')・R(t)>S(t) …(11a)
AC(t)=q・AC(t') for AC(t')・R(t)<S(t) …(11b)
ただし、定数p,qは事前に設定される。また、送話音声と受話音声が同時に存在するダブルトーク時には、送話信号y(t)に送話音声成分が混合される。この場合、送話レベルs(t)は、送話信号y(t)に送話音声成分が混合していない場合の送話レベルに比べ大きくなってしまい、正確な音響結合量の更新が行えなくなってしまう。この影響を少なくするには、定数pを1に近い値に設定することが望ましい。これにより、音響結合量が上昇する場合の更新量を小さくし、ダブルトーク時における誤った音響結合量の更新の幅を小さくできるからである。
そして、以上の処理の後、制御部18において、t+1を新たなtとして、メモリ37の領域17bのデータを領域17aに移し、領域17eのデータを領域17dに移し、領域17mのデータを領域17kに移し、領域17c,17fのデータを削除した後(ステップS39)、ステップS31以降の処理を繰り返す。
以上示した処理により、本形態では、受話レベルR(t)が固定閾値TRを超え、さらに受話レベルR(t)がピーク区間にある場合にのみ、すなわち、送話信号y(t)のエコー成分対雑音成分比がよい区間でのみ音響結合量AC(t)の更新を行うこととした。これにより、音響結合量AC(t)の精度の向上とその推定精度の向上とを実現できる。また、本形態では、割り算を用いることなく音響結合量を推定できるため、割り算器を有しないプロセッサにおいても少ない演算量で実装することができる。
本形態は、第3の実施の形態の変形例であり、さらに受話ノイズレベルと送話ノイズレベルの推定を行い、これらを用いてより精度よく音響結合量の更新を行うものである。以下では、第3の実施の形態との相違点を中心に説明し、第1,3の実施の形態と共通する事項については説明を省略する。
<構成>
図8は、第4の実施の形態における音響結合量推定装置40の構成を例示したブロック図である。なお、図8における矢印は情報の流れを示しているが、制御部18に入出力される情報の流れは省略してある。また、図8において第1〜3の実施の形態と共通する部分については図1,図4,図6と同じ符号を付している。
次に、本形態の音響結合量推定処理を説明する。
図9は、本形態の音響結合量推定処理を説明するためのフローチャートである。以下、この図に沿って、本形態の音響結合量推定処理の詳細を説明していく。
まず、図9に示す処理の前提として、メモリ47のデータをクリアし、さらに領域17a,17d,17k,27n,27rに所定の初期値(例えば、各領域に格納される値の平均的な値)を格納する。また、音響結合量記憶部31に推定音響結合量の初期値AC(0)を格納しておく。なお、AC(0)は推定音響結合量の平均値程度であることが望ましい。このような前処理の後、以下の処理を実行する。
次に、受話ノイズレベル推定部25において、メモリ47の領域17bから受話レベルR(t)を読み込み、これから受話信号x(t)の受話ノイズレベルNr(t)を算出して出力し、メモリ47の領域27pに格納する(ステップS42)。ここで、受話ノイズレベルNr(t)の算出は、例えば第2の実施の形態と同様に行う。
次に、送話ノイズレベル推定部26において、第2の実施の形態と同様に、送話レベルS(t)から送話信号の送話ノイズレベルNs(t)を算出して出力し、メモリ47の領域27sに格納する(ステップS46)。
次に、音響結合量更新部34の比較部44bにおいて、メモリ47の領域47tから推定エコーレベルAC(t’)・{R(t)−Nr(t)}を読み込み、領域47uから送話信号レベルS(t)から送話ノイズレベルNs(t)を減算した値{S(t)−Ns(t)}を読み込む。そして、比較部44bは、読み込んだ推定エコーレベルAC(t’)・{R(t)−Nr(t)}と値{S(t)−Ns(t)}とを比較する(ステップS49)。
AC(t)=p・AC(t') for AC(t')・{R(t)-Nr(t)}>{S(t)-Ns(t)} …(12a)
AC(t)=q・AC(t') for AC(t')・{R(t)-Nr(t)}<{S(t)-Ns(t)} …(12b)
ただし、定数p,qは事前に設定される。また、送話音声と受話音声が同時に存在するダブルトーク時には、送話信号y(t)に送話音声成分が混合される。この場合、送話レベルs(t)は、送話信号y(t)に送話音声成分が混合していない場合の送話レベルに比べ大きくなってしまい、正確な音響結合量の更新が行えなくなってしまう。この影響を少なくするには、定数pを1に近い値に設定することが望ましい。これにより、音響結合量が上昇する場合の更新量を小さくし、ダブルトーク時における誤った音響結合量の更新の幅を小さくできるからである。
そして、以上の処理の後、制御部18において、t+1を新たなtとして、メモリ47の領域17bのデータを領域17aに移し、領域17eのデータを領域17dに移し、領域17mのデータを領域17kに移し、領域27pのデータを領域27nに移し、領域27sのデータを領域27rに移し、領域17c,17fのデータを削除した後(ステップS52)、ステップS41以降の処理を繰り返す。
以上示した処理により、本形態では、受話レベルR(t)が閾値TNを超え、さらに受話レベルR(t)がピーク区間にある場合にのみ、すなわち、送話信号y(t)のエコー成分対雑音成分比がよい区間でのみ音響結合量AC(t)の更新を行うこととした。これにより、音響結合量AC(t)の精度の向上とその推定精度の向上とを実現できる。また、本形態では、割り算を用いることなく音響結合量を推定できるため、割り算器を有しないプロセッサにおいても少ない演算量で実装することができる。さらに、本形態では、第3の実施の形態にノイズレベルの推定処理を追加し、送受話レベルからノイズレベルを減算してから音響結合量の更新を行う。このノイズレベルの減算により、送受話のノイズの影響を軽減することができ、より正確な音響結合量推定が可能となる。
本形態は、第1の実施の形態の変形例であり、時間領域の受話信号及び送話信号を時間周波数領域の信号に変換し、周波数ごとに音響結合量の推定を行う例である。以下では、第1の実施の形態との相違点を中心に説明し、第1の実施の形態と共通する事項については説明を省略する。
図10は、第5の実施の形態における音響結合量推定装置50の構成を例示したブロック図である。なお、図10における矢印は情報の流れを示しているが、制御部53に入出力される情報の流れは省略してある。
図11は、図10における音響結合量推定部60−1の構成を例示したブロック図である。なお、図11における矢印は情報の流れを示しているが、制御部18に入出力される情報の流れは省略してある。
次に、本形態の音響結合量推定処理を説明する。
まず、受話信号周波数変換部51において、入力された時間領域の受話信号x(t)をN個の時間周波数領域の受話信号x(f,t)に変換し、各受話信号x(f,t)をそれぞれ音響結合量推定部60−1〜Nに出力する。また、送話周波数領域変換部52において、入力された時間領域の送話信号y(t)をN個の時間周波数領域の送話信号y(f,t)に変換し、各y(f,t)をそれぞれ音響結合量推定部60−1〜Nに出力する。なお、受話信号周波数変換部51及び送話周波数変換部52は、例えば、短時間フーリエ変換、wavelet変換、DFTフィルタバンク、ポリフェイズフィルタバンクなどを用い、周波数領域の信号を時間周波数領域の信号に変換し、受話信号x(t)と送話信号y(t)とをそれぞれN個の周波数帯域の信号に分割する。また、各音響結合量推定部60−1〜Nには、何れかの周波数fの受話信号x(f,t)及び送話信号y(f,t)が入力されるが、同一の音響結合量推定部60−1〜Nには、同一の周波数fに対応する受話信号x(f,t)及び送話信号y(f,t)が入力される。
<本形態の特徴>
本形態では、周波数帯域ごとの音響結合量を求めることができる。これにより、より正確な音響結合量を得ることができる。なお、本形態では、各音響結合量推定部60−1〜Nを第1の実施の形態における音響結合量推定装置10と同様な構成としたが、各音響結合量推定部60−1〜Nを第2〜4の実施の形態における音響結合量推定装置20〜40と同様な構成とし、第2〜4の実施の形態で説明した方法によって周波数帯域ごとの音響結合量を求めることとしてもよい。
本形態は、第1の実施の形態の変形例であり、送話検出部において送話が行われているか否かを判定し、送話が行われている場合に音響結合量の計算を停止する例である。以下では、第1の実施の形態との相違点を中心に説明し、第1の実施の形態と共通する事項については説明を省略する。
<構成>
図12は、第6の実施の形態における音響結合量推定装置70の構成を例示したブロック図である。なお、図12における矢印は情報の流れを示しているが、制御部18に入出力される情報の流れは省略してある。
<処理>
次に、本形態の音響結合量推定処理を説明する。
第1の実施の形態との相違点はステップS75の処理が挿入される点であり、その他の処理については第1の実施の形態と同様である。以下では、第1の実施の形態との相違点を中心に説明を行う。
第1の実施の形態におけるステップS1〜S4と同様に、受話信号x(t)の受話レベルR(t)が算出され(ステップS71)、受話レベルR(t)>固定閾値TRであると判断され(ステップS72)、受話レベルR(t)がピーク区間のものであると判定され(ステップS73)、送話信号y(t)の送話レベルS(t)が算出された場合(ステップS74)、送話検出部71は、メモリ77の領域17iから最新の音響結合量AC(t−1)を、領域17bから受話レベルR(t)を、領域17mから送話レベルS(t)をそれぞれ読み込む。そして、送話検出部71は、送話レベルS(t)が、予め設定された固定閾値TSを超え(S(t)>TS)、さらに最新の音響結合量AC(t−1)と受話レベルR(t)とを用いて算出された推定エコーレベルの定数(1より大きな定数)倍である閾値TEを超えた(S(t)>TE)か否かを判定する(ステップS75)。なお、閾値TEとしては、例えば、最新の音響結合量AC(t−1)に受話レベルR(t)を乗じた推定エコーレベルの定数β(β>1)倍(TE=β・AC(t−1)・R(t))を例示できる。ここで、S(t)>TS及びS(t)>TEの条件を満たした場合にのみ、送話検出部71は、送話が行われている旨の情報(送話検出情報)を出力し、メモリ77の領域77nに格納する。そして、制御部18は、メモリ77の領域77nを参照し、そこに送話検出情報が格納されていない場合には、ステップS78(第1の実施の形態のステップS7と同様)及びS79以降の処理を実行させる。すなわち、この場合には、音響結合量計算部14は、送話レベルS(t)に対応する新たな音響結合量の瞬時値を算出しない。一方、メモリ77の領域77nに送話検出情報が格納されている場合には、制御部18は、以下のステップS76以降の処理を実行させる。なお、ステップS76以降の処理は第1の実施の形態におけるステップS5,S6,S8と同様である。ただし、ステップS79の処理は、領域77nのデータを削除する処理が加わる点でステップS8の処理と異なる。
本形態では、送話検出部71において送話を検出し、送話が検出された場合、新たな音響結合量の瞬時値の算出を行わないこととした。これにより、送話信号y(t)に含まれる送話音声成分による音響結合量推定誤差を軽減し、より正確な音響結合量推定を実現することができる。
〔第7の実施の形態〕
本形態は、第6の実施の形態の思想を第2の実施の形態に適用した例である。以下では、上述の実施の形態との相違点を中心に説明し、これらと共通する事項については説明を省略する。
図14は、第7の実施の形態における音響結合量推定装置80の構成を例示したブロック図である。なお、図14における矢印は情報の流れを示しているが、制御部18に入出力される情報の流れは省略してある。また、図14において第1の実施の形態と共通する部分については図1と同じ符号を付している。
この図に例示するように、本形態の音響結合量推定装置80は、受話レベル計算部11と、ピーク区間検出部13と、時間平滑部15と、送話レベル計算部16と、制御部18と、受話検出部22と、音響結合量計算部24と、受話ノイズレベル推定部25と、送話ノイズレベル推定部26と、送話検出部81と、メモリ87とを有している。そして、音響結合量推定装置80は、制御部18の制御のもと、受話信号x(t)と送話信号y(t)とを用いて音響結合量の推定を行う。
次に、本形態の音響結合量推定処理を説明する。
図15及び図16は、本形態の音響結合量推定処理を説明するためのフローチャートである。以下、この図に沿って、本形態の音響結合量推定処理の詳細を説明していく。
第2の実施の形態との相違点はステップS97の処理が挿入される点であり、その他の処理については第2の実施の形態と同様である。以下では、第2の実施の形態との相違点を中心に説明を行う。
本形態は、第3の実施の形態の変形例であり、送話検出部において送話が行われているか否かを判定し、送話が行われている場合に音響結合量の更新量(更新前の音響結合量と新たな音響結合量との差)を小さくする例である。以下では、第3の実施の形態との相違点を中心に説明し、第3の実施の形態と共通する事項については説明を省略する。
<構成>
図17は、本形態における音響結合量推定装置90の構成を示したブロック図である。なお、図17における矢印は情報の流れを示しているが、制御部18に入出力される情報の流れは省略してある。また、図6において第1の実施の形態と共通する部分については図1と同じ符号を付している。
次に、本形態の音響結合量推定処理を説明する。
図18は、本形態の音響結合量推定処理を説明するためのフローチャートである。以下、この図に沿って、本形態の音響結合量推定処理の詳細を説明していく。
第3の実施の形態との相違点はステップS118〜S120の処理であり、その他の処理については第3の実施の形態と同様である。以下では、第3の実施の形態との相違点を中心に説明を行う。
AC(t)=AC(t’)・q2 …(13a)
ただし、q1,q2は予め設定された定数であり、1<q1<q2を満たすものである。すなわち、送話検出部91から送話が行われている旨の情報(送話検出情報)が出力された場合、音響結合量更新部34は、更新前の音響結合量と新たな音響結合量との差を小さくして音響結合量記憶部31に格納されているデータの更新を行う。その後、第3の実施の形態のステップS39と同様なステップS121の処理を行う。ただし、ステップS121の処理は、領域97nのデータを削除する処理が加わる点でステップS39の処理と異なる。
〔第9の実施の形態〕
本形態は、第5の実施の形態において、送話検出部において、少なくとも送話レベルが、推定エコーレベルの定数(1より大きな定数)倍を超えたことを条件に、送話が行われている旨の情報を出力し、送話検出部から送話が行われている旨の情報(送話検出情報)が出力された場合、音響結合量更新部は、音響結合量記憶部に格納されているデータの更新を行わないか、更新前の音響結合量と新たな音響結合量との差を小さくして音響結合量記憶部に格納されているデータの更新を行う例である。なお、処理一般については第5の実施の形態と同様であり、送話検出情報が出力された後の処理については第6〜8の実施の形態と同様(周波数ごとの処理となる点を除いては)であるため説明を省略し、送話検出部のみについて詳細に説明する。
この図に例示するように、本形態の音響結合量推定装置100は、受話信号周波数変換部51と、送話周波数変換部52と、N個の音響結合量推定部60−1〜Nと、制御部53と、送話検出部110とを有している。そして、音響結合量推定装置100は、制御部53の制御のもと、受話信号x(t)と送話信号y(t)とを用い、周波数ごとに音響結合量の推定を行う。
この図に例示するように、送話検出部110は、受話レベル計算部111、レベル計算部113、送話ノイズレベル推定部114、統合部115、時間領域変換部116、比較部117及びメモリ118を有しており、時間領域の受話信号x(t)及び送話信号y(t)と各音響結合量推定部60−1〜Nから出力された時間周波数領域の音響結合量とを用い、送話検出を行う。
図21は、送話検出部110の処理を説明するためのフローチャートである。以下、この図を用いて送話検出部110の処理を説明する。
まず、図21に示す処理の前提として、メモリ118のデータをクリアし、さらに領域118a,118c,118f,118hに所定の初期値(例えば、各領域に格納される値の平均的な値)を格納する。その後、以下の処理を実行する。
まず、統合部115において、各音響結合量推定部60−1〜Nのメモリから時間tにおける時間周波数領域の音響結合量を読み出し、これらを統合し(ステップS131)、時間領域変換部116において、逆フーリエ変換等により、その統合結果を時間領域に変換して音響結合量AC(t)を算出する(ステップS132)。なお、この音響結合量AC(t)は、メモリ118の領域118eに格納される。
次に、送話レベル計算部113に時間領域の送話信号y(t)が入力され、送話レベル計算部113は、送話信号y(t)の送話レベルS(t)を算出してメモリ118の領域118iに格納する。ここで、送話レベルS(t)の算出は、例えば、第1の実施の形態の送話レベル計算部16と同様に行う(ステップS134)。
次に、比較部117において、メモリ118の領域118eから最新の音響結合量AC(t−1)を、領域118bから受話レベルR(t)を、領域118iから送話レベルS(t)を、領域118gから、送話ノイズレベルNs(t)をそれぞれ読み込む。そして、比較部117は、送話レベルS(t)が、予め設定された固定閾値TSを超え(S(t)>TS)、さらに最新の音響結合量AC(t−1)と受話レベルR(t)とを用いて算出された推定エコーレベルの定数(1より大きな定数)倍である閾値TEを超え(S(t)>TE)、なおかつ送話ノイズレベルNs(t)を定数倍した閾値TN’を超えた(S(t)>TN’)か否かを判定する。ここで、S(t)>TSかつS(t)>TEかつS(t)>TN’の条件を満たした場合にのみ、比較部117は、送話検出信号を制御部53(図19)に対して出力する(ステップS137)。そして、制御部53は、t+1を新たなtとし、メモリ118の領域118bのデータを領域118aに移し、領域118gのデータを領域118fに移し、領域118iのデータを領域118hに移し、ステップS131以降の処理を繰り返し実行させる。また、送話検出信号が入力された制御部53は、各音響結合量推定部60−1〜Nに対し、音響結合量記憶部に格納されているデータの更新を行わないか、更新前の音響結合量と新たな音響結合量との差を小さくして音響結合量記憶部に格納されているデータの更新を行う旨の指示を与える。
また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよいが、具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
Claims (16)
- 音響結合量の推定を行う音響結合量推定方法であって、
受話レベル計算手段に受話信号が入力され、当該受話レベル計算手段において、当該受話信号のパワーレベル(以下「受話レベル」という。)を算出して出力するステップと、
受話検出手段において、前記受話レベルと予め設定された固定閾値とを比較し、当該固定閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力するステップと、
ピーク区間検出手段において、前記受話レベルが前記固定閾値よりも大きい区間であり、受話レベルが増加しなくなった点から、所定の条件を満たす間の区間をピーク区間と判定し、その判定結果を出力するステップと、
送話レベル計算手段に送話信号が入力され、当該送話レベル計算手段において、当該送話信号のパワーレベル(以下「送話レベル」という。)を算出して出力するステップと、
少なくとも前記受話検出手段から受話があった旨の情報が出力され、前記ピーク区間検出手段から前記受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、音響結合量計算手段において、前記受話レベルと前記送話レベルとの比から音響結合量の瞬時値を算出して出力するステップと、
時間平滑手段において、前記音響結合量の瞬時値から音響結合量を算出して出力するステップと、
を有することを特徴とする音響結合量推定方法。 - 音響結合量の推定を行う音響結合量推定方法であって、
受話レベル計算手段に受話信号が入力され、当該受話レベル計算手段において、当該受話信号のパワーレベル(以下「受話レベル」という。)を算出して出力するステップと、
受話ノイズレベル推定手段において、前記受話レベルから前記受話信号のノイズレベルの推定値(以下「受話ノイズレベル」という)を算出して出力するステップと、
受話検出手段において、前記受話ノイズレベルの定数倍の閾値及び予め設定された固定閾値と、前記受話レベルとを比較し、これら両方の閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力するステップと、
ピーク区間検出手段において、前記受話レベルが前記固定閾値よりも大きい区間であり、受話レベルが増加しなくなった点から、所定の条件を満たす間の区間をピーク区間と判定し、その判定結果を出力するステップと、
送話レベル計算手段に送話信号が入力され、当該送話レベル計算手段において、当該送話信号のパワーレベル(以下「送話レベル」という。)を算出して出力するステップと、
送話ノイズレベル推定手段において、前記送話レベルから前記送話信号のノイズレベルの推定値(以下「送話ノイズレベル」という。)を算出して出力するステップと、
少なくとも前記受話検出手段から受話があった旨の情報が出力され、前記ピーク区間検出手段から前記受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、音響結合量計算手段において、前記受話レベルから前記受話ノイズレベルを減じた値と前記送話レベルから前記送話ノイズレベルを減じた値との比から音響結合量の瞬時値を算出して出力するステップと、
時間平滑手段において、前記音響結合量の瞬時値から音響結合量を算出して出力するステップと、
を有することを特徴とする音響結合量推定方法。 - 音響結合量の推定を行う音響結合量推定方法であって、
受話レベル計算手段に受話信号が入力され、当該受話レベル計算手段において、当該受話信号のパワーレベル(以下「受話レベル」という。)を算出して出力するステップと、
受話検出手段において、前記受話レベルと予め設定された固定閾値とを比較し、当該固定閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力するステップと、
ピーク区間検出手段において、前記受話レベルが前記固定閾値よりも大きい区間であり、受話レベルが増加しなくなった点から、所定の条件を満たす間の区間をピーク区間と判定し、その判定結果を出力するステップと、
送話レベル計算手段に送話信号が入力され、当該送話レベル計算手段において、当該送話信号のパワーレベル(以下「送話レベル」という。)を算出して出力するステップと、
少なくとも前記受話検出手段から受話があった旨の情報が出力され、前記ピーク区間検出手段から前記受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、音響結合量更新手段において、音響結合量記憶手段に格納されている最新の音響結合量に前記受話レベルを乗じた推定エコーレベルと前記送話レベルとを比較し、当該推定エコーレベルよりも送話レベルのほうが大きい場合に、当該最新の音響結合量よりも大きな値を新たな音響結合量として前記音響結合量記憶手段のデータを更新し、当該推定エコーレベルよりも送話レベルのほうが小さい場合に、当該最新の音響結合量よりも小さな値を新たな音響結合量として前記音響結合量記憶手段のデータを更新するステップと、
を有することを特徴とする音響結合量推定方法。 - 音響結合量の推定を行う音響結合量推定方法であって、
受話レベル計算手段に受話信号が入力され、当該受話レベル計算手段において、当該受話信号のパワーレベル(以下「受話レベル」という。)を算出して出力するステップと、
受話ノイズレベル推定手段において、前記受話レベルから前記受話信号のノイズレベルの推定値(以下「受話ノイズレベル」という)を算出して出力するステップと、
受話検出手段において、前記受話ノイズレベルの定数倍の閾値及び予め設定された固定閾値と、前記受話レベルとを比較し、これら両方の閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力するステップと、
ピーク区間検出手段において、前記受話レベルが前記固定閾値よりも大きい区間であり、受話レベルが増加しなくなった点から、所定の条件を満たす間の区間をピーク区間と判定し、その判定結果を出力するステップと、
送話レベル計算手段に送話信号が入力され、当該送話レベル計算手段において、当該送話信号のパワーレベル(以下「送話レベル」という。)を算出して出力するステップと、
送話ノイズレベル推定手段において、前記送話レベルから前記送話信号のノイズレベルの推定値(以下「送話ノイズレベル」という。)を算出して出力するステップと、
少なくとも前記受話検出手段から受話があった旨の情報が出力され、前記ピーク区間検出手段から前記受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、音響結合量更新手段において、前記受話レベルから前記受話ノイズレベルを減じた値に音響結合量記憶手段に格納されている最新の音響結合量を乗じた推定エコーレベルと、前記送話レベルから前記送話ノイズレベルを減じた値とを比較し、当該推定エコーレベルよりも前記送話レベルから前記送話ノイズレベルを減じた値のほうが大きい場合に、当該最新の音響結合量よりも大きな値を新たな音響結合量として前記音響結合量記憶手段のデータを更新し、当該推定エコーレベルよりも前記送話レベルから前記送話ノイズレベルを減じた値のほうが小さい場合に、当該最新の音響結合量よりも小さな値を新たな音響結合量として前記音響結合量記憶手段のデータを更新するステップと、
を有することを特徴とする音響結合量推定方法。 - 請求項1から4の何れかに記載の音響結合量推定方法であって、
受話周波数領域変換手段において、時間領域の受話信号を時間周波数領域の受話信号に変換して出力するステップと、
送話周波数領域変換手段において、時間領域の送話信号を時間周波数領域の送話信号に変換して出力するステップと、をさらに有し、
前記受話レベル計算手段に入力される前記受話信号が、前記受話周波数領域変換手段から出力された時間周波数領域の受話信号であり、
前記送話レベル計算手段に入力される前記送話信号が、前記送話周波数領域変換手段から出力された時間周波数領域の送話信号であり、
請求項1から4の各ステップが周波数毎に実行される、
ことを特徴とする音響結合量推定方法。 - 請求項1,2或いは5に記載の音響結合量推定方法であって、
送話検出手段において、少なくとも前記送話レベルが、最新の前記音響結合量と前記受話レベルとを用いて算出された推定エコーレベルの定数(1より大きな定数)倍を超えたことを条件に、送話が行われている旨の情報を出力するステップをさらに有し、
前記送話検出手段から送話が行われている旨の情報が出力された場合、前記音響結合量計算手段は、前記推定エコーレベルの定数倍を超えた前記送話レベルに対応する新たな音響結合量の瞬時値の算出を行わない、
ことを特徴とする音響結合量推定方法。 - 請求項3から5のいずれかに記載の音響結合量推定方法であって、
送話検出手段において、少なくとも前記送話レベルが、前記推定エコーレベルの定数(1より大きな定数)倍を超えたことを条件に、送話が行われている旨の情報を出力するステップをさらに有し、
前記送話検出手段から送話が行われている旨の情報が出力された場合、前記音響結合量更新手段は、前記音響結合量記憶手段に格納されているデータの更新を行わないか、更新前の音響結合量と新たな音響結合量との差を小さくして前記音響結合量記憶手段に格納されているデータの更新を行う、
ことを特徴とする音響結合量推定方法。 - 音響結合量の推定を行う音響結合量推定装置であって、
受話信号が入力され、当該受話信号のパワーレベル(以下「受話レベル」という。)を算出して出力する受話レベル計算手段と、
前記受話レベルと予め設定された固定閾値とを比較し、当該固定閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力する受話検出手段と、
前記受話レベルが前記固定閾値よりも大きい区間であり、受話レベルが増加しなくなった点から、所定の条件を満たす間の区間をピーク区間と判定し、その判定結果を出力するピーク区間検出手段と、
送話信号のパワーレベル(以下「送話レベル」という。)を算出して出力する送話レベル計算手段と、
少なくとも前記受話検出手段から受話があった旨の情報が出力され、前記ピーク区間検出手段から前記受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、前記受話レベルと前記送話レベルとの比から音響結合量の瞬時値を算出して出力する音響結合量計算手段と、
前記音響結合量の瞬時値から音響結合量を算出して出力する時間平滑手段と、
を有することを特徴とする音響結合量推定装置。 - 音響結合量の推定を行う音響結合量推定装置であって、
受話信号が入力され、当該受話信号のパワーレベル(以下「受話レベル」という。)を算出して出力する受話レベル計算手段と、
前記受話レベルから前記受話信号のノイズレベルの推定値(以下「受話ノイズレベル」という)を算出して出力する受話ノイズレベル推定手段と、
前記受話ノイズレベルの定数倍の閾値及び予め設定された固定閾値と、前記受話レベルとを比較し、これら両方の閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力する受話検出手段と、
前記受話レベルが前記固定閾値よりも大きい区間であり、受話レベルが増加しなくなった点から、所定の条件を満たす間の区間をピーク区間と判定し、その判定結果を出力するピーク区間検出手段と、
送話レベル計算手段に送話信号が入力され、当該送話信号のパワーレベル(以下「送話レベル」という。)を算出して出力する送話レベル計算手段と、
前記送話レベルから前記送話信号のノイズレベルの推定値(以下「送話ノイズレベル」という。)を算出して出力する送話ノイズレベル推定手段と、
少なくとも前記受話検出手段から受話があった旨の情報が出力され、前記ピーク区間検出手段から前記受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、前記受話レベルから前記受話ノイズレベルを減じた値と前記送話レベルから前記送話ノイズレベルを減じた値との比から音響結合量の瞬時値を算出して出力する音響結合量計算手段と、
前記音響結合量の瞬時値から音響結合量を算出して出力する時間平滑手段と、
を有することを特徴とする音響結合量推定装置。 - 音響結合量の推定を行う音響結合量推定装置であって、
受話信号が入力され、当該受話信号のパワーレベル(以下「受話レベル」という。)を算出して出力する受話レベル計算手段と、
前記受話レベルと予め設定された固定閾値とを比較し、当該固定閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力する受話検出手段と、
前記受話レベルが前記固定閾値よりも大きい区間であり、受話レベルが増加しなくなった点から、所定の条件を満たす間の区間をピーク区間と判定し、その判定結果を出力するピーク区間検出手段と、
送話レベル計算手段に送話信号が入力され、当該送話信号のパワーレベル(以下「送話レベル」という。)を算出して出力する送話レベル計算手段と、
少なくとも前記受話検出手段から受話があった旨の情報が出力され、前記ピーク区間検出手段から前記受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、音響結合量記憶手段に格納されている最新の音響結合量に前記受話レベルを乗じた推定エコーレベルと前記送話レベルとを比較し、当該推定エコーレベルよりも送話レベルのほうが大きい場合に、当該最新の音響結合量よりも大きな値を新たな音響結合量として前記音響結合量記憶手段のデータを更新し、当該推定エコーレベルよりも送話レベルのほうが小さい場合に、当該最新の音響結合量よりも小さな値を新たな音響結合量として前記音響結合量記憶手段のデータを更新する音響結合量更新手段と、
を有することを特徴とする音響結合量推定装置。 - 音響結合量の推定を行う音響結合量推定装置であって、
受話信号が入力され、当該受話信号のパワーレベル(以下「受話レベル」という。)を算出して出力する受話レベル計算手段と、
前記受話レベルから前記受話信号のノイズレベルの推定値(以下「受話ノイズレベル」という)を算出して出力する受話ノイズレベル推定手段と、
前記受話ノイズレベルの定数倍の閾値及び予め設定された固定閾値と、前記受話レベルとを比較し、これら両方の閾値よりも当該受話レベルが大きい場合に、受話があった旨の情報を出力する受話検出手段と、
前記受話レベルが前記固定閾値よりも大きい区間であり、受話レベルが増加しなくなった点から、所定の条件を満たす間の区間をピーク区間と判定し、その判定結果を出力するピーク区間検出手段と、
送話レベル計算手段に送話信号が入力され、当該送話信号のパワーレベル(以下「送話レベル」という。)を算出して出力する送話レベル計算手段と、
前記送話レベルから前記送話信号のノイズレベルの推定値(以下「送話ノイズレベル」という。)を算出して出力する送話ノイズレベル推定手段と、
少なくとも前記受話検出手段から受話があった旨の情報が出力され、前記ピーク区間検出手段から前記受話レベルがピーク区間のものである旨の判定結果が出力されたことを条件に、前記受話レベルから前記受話ノイズレベルを減じた値に音響結合量記憶手段に格納されている最新の音響結合量を乗じた推定エコーレベルと、前記送話レベルから前記送話ノイズレベルを減じた値とを比較し、当該推定エコーレベルよりも前記送話レベルから前記送話ノイズレベルを減じた値のほうが大きい場合に、当該最新の音響結合量よりも大きな値を新たな音響結合量として前記音響結合量記憶手段のデータを更新し、当該推定エコーレベルよりも前記送話レベルから前記送話ノイズレベルを減じた値のほうが小さい場合に、当該最新の音響結合量よりも小さな値を新たな音響結合量として前記音響結合量記憶手段のデータを更新する音響結合量更新手段と、
を有することを特徴とする音響結合量推定装置。 - 請求項8から11の何れかに記載の音響結合量推定装置であって、
時間領域の受話信号を時間周波数領域の受話信号に変換して出力する受話周波数領域変換手段と、
時間領域の送話信号を時間周波数領域の送話信号に変換して出力する送話周波数領域変換手段と、をさらに有し、
前記受話レベル計算手段に入力される前記受話信号が、前記受話周波数領域変換手段から出力された時間周波数領域の受話信号であり、
前記送話レベル計算手段に入力される前記送話信号が、前記送話周波数領域変換手段から出力された時間周波数領域の送話信号であり、
請求項8から11の各手段における処理が周波数毎に実行される、
ことを特徴とする音響結合量推定装置。 - 請求項8,9或いは12に記載の音響結合量推定装置であって、
少なくとも前記送話レベルが、最新の前記音響結合量と前記受話レベルとを用いて算出された推定エコーレベルの定数(1より大きな定数)倍を超えたことを条件に、送話が行われている旨の情報を出力する送話検出手段をさらに有し、
前記送話検出手段から送話が行われている旨の情報が出力された場合、前記音響結合量計算手段は、前記推定エコーレベルの定数倍を超えた前記送話レベルに対応する新たな音響結合量の瞬時値の算出を行わない、
ことを特徴とする音響結合量推定装置。 - 請求項10から12のいずれかに記載の音響結合量推定装置であって、
少なくとも前記送話レベルが、前記音響結合量と前記受話レベルとを用いて算出された推定音響エコーレベルの定数(1より大きな定数)倍を超えたことを条件に、送話が行われている旨の情報を出力する送話検出手段をさらに有し、
前記送話検出手段から送話が行われている旨の情報が出力された場合、前記音響結合量更新手段は、前記音響結合量記憶手段に格納されているデータの更新を行わないか、更新前の音響結合量と新たな音響結合量との差を小さくして前記音響結合量記憶手段に格納されているデータの更新を行う、
ことを特徴とする音響結合量推定装置。 - 請求項1から7のいずれかに記載の音響結合量推定方法をコンピュータに実行させるための音響結合量推定プログラム。
- 請求項1から7のいずれかに記載の音響結合量推定方法をコンピュータに実行させるための音響結合量推定プログラムを格納したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005151144A JP4559914B2 (ja) | 2005-05-24 | 2005-05-24 | 音響結合量推定方法、その装置、そのプログラム及びその記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005151144A JP4559914B2 (ja) | 2005-05-24 | 2005-05-24 | 音響結合量推定方法、その装置、そのプログラム及びその記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006332872A JP2006332872A (ja) | 2006-12-07 |
JP4559914B2 true JP4559914B2 (ja) | 2010-10-13 |
Family
ID=37554113
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005151144A Expired - Fee Related JP4559914B2 (ja) | 2005-05-24 | 2005-05-24 | 音響結合量推定方法、その装置、そのプログラム及びその記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4559914B2 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07226994A (ja) * | 1994-02-14 | 1995-08-22 | Nippon Telegr & Teleph Corp <Ntt> | 音響結合量最小位置決定装置 |
JP2003125070A (ja) * | 2001-10-15 | 2003-04-25 | Fujitsu Ltd | 通話信号処理装置 |
JP2003324370A (ja) * | 2002-04-26 | 2003-11-14 | Matsushita Electric Works Ltd | エコーキャンセラ |
JP2004320451A (ja) * | 2003-04-16 | 2004-11-11 | Nippon Telegr & Teleph Corp <Ntt> | 音声損失制御方法、音声損失制御装置、音声損失制御プログラム |
-
2005
- 2005-05-24 JP JP2005151144A patent/JP4559914B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07226994A (ja) * | 1994-02-14 | 1995-08-22 | Nippon Telegr & Teleph Corp <Ntt> | 音響結合量最小位置決定装置 |
JP2003125070A (ja) * | 2001-10-15 | 2003-04-25 | Fujitsu Ltd | 通話信号処理装置 |
JP2003324370A (ja) * | 2002-04-26 | 2003-11-14 | Matsushita Electric Works Ltd | エコーキャンセラ |
JP2004320451A (ja) * | 2003-04-16 | 2004-11-11 | Nippon Telegr & Teleph Corp <Ntt> | 音声損失制御方法、音声損失制御装置、音声損失制御プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2006332872A (ja) | 2006-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10841431B2 (en) | Detection of acoustic echo cancellation | |
JP6422886B2 (ja) | エコー抑圧 | |
US20020169602A1 (en) | Echo suppression and speech detection techniques for telephony applications | |
CN104050971A (zh) | 声学回声减轻装置和方法、音频处理装置和语音通信终端 | |
KR101975251B1 (ko) | 오디오 신호 처리 시스템 및 이의 에코 신호 제거 방법 | |
US9154874B2 (en) | Howling detection device, howling suppressing device and method of detecting howling | |
JP6422885B2 (ja) | エコー抑圧 | |
JP2012155339A (ja) | 音声状態モデルを使用したマルチセンサ音声高品質化 | |
JP5087024B2 (ja) | エコー消去装置とその方法と、プログラム | |
US8831210B2 (en) | Method and system for detection of onset of near-end signal in an echo cancellation system | |
US9277059B2 (en) | Echo removal | |
JP2008259032A (ja) | 情報処理装置、およびプログラム | |
CN103814584B (zh) | 声音处理装置和声音处理方法 | |
JP4413205B2 (ja) | エコー抑圧方法、装置、エコー抑圧プログラム、記録媒体 | |
JP4559914B2 (ja) | 音響結合量推定方法、その装置、そのプログラム及びその記録媒体 | |
JP6537997B2 (ja) | エコー抑圧装置、その方法、プログラム、及び記録媒体 | |
US11437054B2 (en) | Sample-accurate delay identification in a frequency domain | |
JP4542538B2 (ja) | ダブルトーク状態判定方法、その方法を用いた反響消去装置、そのプログラム及びその記録媒体 | |
JP2006352239A (ja) | 音響結合量推定方法、音響結合量推定装置、プログラム、記録媒体 | |
JP7235117B2 (ja) | エコー消去装置、エコー消去方法、プログラム | |
JP2006270709A (ja) | エコー除去装置、電子会議装置、エコー除去方法、およびエコー除去プログラム | |
US20030235293A1 (en) | Adaptive system control | |
JP5346350B2 (ja) | 反響消去装置とその方法とプログラム | |
JP5562405B2 (ja) | エコー消去方法とその装置とプログラムとその記録媒体 | |
JP6779489B2 (ja) | 抽出発生音補正装置、抽出発生音補正方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070810 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100420 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100609 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100713 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100723 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4559914 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130730 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |