JP4594854B2 - 音声スイッチ方法、音声スイッチ装置、音声スイッチプログラム及びそのプログラムを記録した記録媒体 - Google Patents
音声スイッチ方法、音声スイッチ装置、音声スイッチプログラム及びそのプログラムを記録した記録媒体 Download PDFInfo
- Publication number
- JP4594854B2 JP4594854B2 JP2005346241A JP2005346241A JP4594854B2 JP 4594854 B2 JP4594854 B2 JP 4594854B2 JP 2005346241 A JP2005346241 A JP 2005346241A JP 2005346241 A JP2005346241 A JP 2005346241A JP 4594854 B2 JP4594854 B2 JP 4594854B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- spectrum
- reproduction
- sound
- channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Telephone Function (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
Description
このような問題が解決するために、多チャネル拡声通話に対応した音声スイッチ装置が特許文献1に提案されている。受話チャネル数がM(Mは1以上の整数、以下同様)、送信チャネル数が2の場合について、この音声スイッチ装置の構成を図1に示す。
また、音声スイッチ装置5により、受話信号xmもしくは送話信号ynを減衰させる。音声スイッチ装置5の具体的構成例は、送話判定部6、送話音声パワー推定部71、72、受話信号xmを減衰させるか否かにより、減衰させた受話信号xmまたは入力された受話信号xmそのものを出力するための受話側可変減衰部8m、マイクロホン31、32からの収音信号ynを減衰させるか否かにより減衰させた収音信号yn、または入力された収音信号ynそのものを出力するための送話側可変減衰部91、92からなる。なお、送話音声パワー推定部71、72、送話側可変減衰部91、92は音声スイッチ装置5中に、マイクロホン31、32毎に備え付けられており、受話側可変減衰部8mは音声スイッチ装置5中に、スピーカ2m毎に備え付けられており、送話判定部6は音声スイッチ装置5中に、1つ備え付けられている。
)が異なるだけで、同様の動作を行うものであるから、以後は送話音声パワー推定部71について説明する。送話音声パワー推定部71中の収音信号TF変換部72では、時間領域の収音信号y1(k)を前記と同様にLサンプル毎にフレーム長2LサンプルをフレームY1(j)として切り出し、これらフレームを周波数領域に変換して、収音信号スペクトルY1 →(j、f)を求める。
エコー成分比率推定部73の具体的構成例を図3に示す。エコー成分比率推定部73は、Mー1個の受話側相間除去部7312〜731Mで構成される収音側相関除去部群731、Mー1個の再生側相関除去部7322〜732Mで構成される再生側相関除去部群732、M個のコヒーレンス算出部7331〜733Mで構成されるコヒーレンス算出部群733、1個のエコー成分比率算部734により構成される。
再生側相関除去信号スペクトルXm(m―1) →(j、f)と収音側相関除去信号スペクトルY(m−1) →(j、f)がコヒーレンス算出部733mに入力され、コヒーレンス算出部733mで、再生側相関除去信号スペクトルXm(m―1) →(j、f)と収音側相関除去信号スペクトルY(m−1) →(j、f)の周波数成分ごとのコヒーレンスγ2 my(m―1)(j、f)を求める。このようにして、第1〜第mチャネルごとの再生信号スペクトルと収音信号との周波数成分ごとの相関(コヒーレンス)が得られる。
次に、図1の説明に戻って、前記送話音声パワー推定部71中の信号パワー算出部741にエコー成分比率γ1 2(j、f)と前記収音信号スペクトルY1 →(j、f)が入力され、非エコー信号パワー算出部74で、エコー成分比率γ1 2(j、f)と前記収音信号スペクトルY1 →(j、f)から周波数帯域毎に非エコー成分を求め、その総和をとって非エコー信号パワーPy1(j)を求める。
この例では、非エコー信号パワーPy1(j)と非エコー信号パワーPy2(j)が、送話判定部6に入力され、全収音チャネルの比エコー信号パワーの和、この例では、Py1(j)+Py2(j)を求め、その和をあらかじめ設定した閾値Pthと比較し、非エコー信号のパワーの和が閾値Pthより大きいときは、送話有りと判定し、そうでない場合は(閾値Pth以下の場合)は、送話無しと判定する。そして、送話有りと判定された場合は、受話側の可変減衰部81〜8Mにより受話信号のみを減衰させてスピーカからの再生信号とする。送話無しと判定された場合は、送話側の可変減衰部91〜9Nにより送話信号のみを減衰させて送信する。
Y1 →(j)=[X1 b(j)・・・XM b(j)に起因するエコー]
+[X1 b(j−1)・・・XM b(j−1)に起因するエコー]
+[X1 b(j−2)・・・XM b(j−2)に起因するエコー]
・・・のようになる。
従来法のエコー成分比率推定では、フレーム時刻がj−1以前のフレームに起因する2項目以降のエコー成分は誤差要因となる。前記従来法では、フレーム処理による処理遅延を抑えて通話を快適にする目的で、フレーム長をなるべく短く10〜20msに設定するケースが実用上大半である。つまり、残響時間(通常の部屋で300ms程度)と比較して、フレーム長がずっと短く設定されているために、誤差要因となるエコー成分、すなわち2項目以降のエコー成分が増大して、エコー成分比率算出部734がその機能を十分果たさず、送話検出性能が劣化してしまう。本発明の目的は、短いフレーム長でもエコー成分比率算出部734がその機能を十分達成し、送話検出性能の劣化しない音声スイッチ方法、その装置、そのプログラム、そのプログラムを記憶した記憶媒体を提供することである。
を求め、Nチャネルそれぞれについて、現フレームの前記収音信号スペクトルY n → (j)と過去のB個のフレームの前記収音信号スペクトルY n → (j−2b)(1≦b≦B)との周波数成分ごとの和である収音信号拡張スペクトル
を求め、Mチャネルの前記再生信号拡張スペクトル、それぞれから、チャネル間相関成分を除去して再生側相関除去信号スペクトルを求め、前記マイクロホンごとに、前記収音信号拡張スペクトルから各前記再生信号拡張スペクトルとの相関成分を除去して収音側相関除去信号スペクトルを求め、前記マイクロホンごとに、前記再生側相関除去信号スペクトルと再生チャネル及び周波数成分が対応する前記収音側相関除去信号スペクトルとのコヒーレンスを計算し、前記マイクロホンごとに、前記各周波数成分ごとでの各前記再生チャネルごとの前記コヒーレンスを計算する過程での計算結果に基づき、各周波数成分ごとの前記収音信号拡張スペクトル中のエコー成分比率を計算し、前記マイクロホンごとに、前記周波数成分毎に、前記収音信号スペクトルと前記全エコー成分比率とに基づき、前記収音信号スペクトル中の非エコー成分を計算し、これら非エコー成分の総和を計算して、非エコー信号パワーを求め、前記Nチャネル非エコー信号パワーと所定の閾値とを比較して、送話の有り無しの判定をし、前記送話の有り無しの判定をする過程において、送話ありと判定されると、前記全受話信号を減衰させて前記再生信号とし、前記送話の有り無しの判定をする過程において、送話なしと判定されると、前記全収音信号を減衰させることを有することを特徴とする音声スイッチ方法。
本願発明の実施例1を図1に示す。拡声通話系がM(Mは2以上の整数)チャネル再生系と2チャネル収音系から構成される場面について説明する。この発明と、従来技術とは、使用した図1中のエコー成分比率推定部73が異なる。このエコー成分比率推定部73を拡張エコー成分比率推定部103という。実施例1中のその他の構成は従来のものと全て同じである。
再生信号TF変換部711〜71Mで、時間領域の再生信号x1(k)〜xM(k)(kは離散的時刻)を、Lサンプル毎に長さ2Lサンプルの信号ベクトルにフレーム化し、その各信号ベクトルをフーリエ変換(FFT)を使って下記に示す再生信号スペクトルX→ 1(j、f)〜X→ M(j、f)に変換する。これは、時刻k=jL(jは0以上の整数であり、フレーム時刻)の時点で、各信号の直近2Lサンプル分、すなわちjL−2L+1...jLのサンプル分をフレーム化していることである。
X1 →(j、f)=[X1(j、1)・・・X1(j、f)・・・X1(j、2L)]
=FFT[x1(jL−2L+1)・・・x1(jL)]・・・(1)
・・・
XM →(j、f)=[XM(j、1)・・・XM(j、f)・・・XM(j、2L)]
=FFT[xM(jL−2L+1)・・・xM(jL)]・・・(2)
収音信号TF変換部72で、時間領域の収音信号y1(k)、y2(k)を同様に、周波数領域に変換して下記に示す収音信号スペクトルY1 →(j、f)、Y2 →(j、f)を求める。
Y1 →(j、f)=[Y1(j、1)・・・Y1(j、f)・・・Y1(j、2L)]
=FFT[y1(jL−2L+1)・・・y1(jL)]・・・(3)
・・・
Y2 →(j、f)=[Y2(j、1)・・・Y2(j、f)・・・Y2(j、2L)]
=FFT[y2(jL−2L+1)・・・y2(jL)]・・・(4)
次に、拡張エコー成分比率推定部103の具体的構成例を図4に示す。この図4に示す構成は図3に示した構成に対し、収音信号フレーム拡張部1037y1を収音側相関除去部群1032の前段に、再生信号フレーム拡張部1037x1〜1037xMを再生側相関除去部群1031の前段にそれぞれ加えただけで、他の部分は全て同じである。再生信号フレーム拡張部1037x1〜1037xMで過去B個(Bは1以上の整数)の再生信号スペクトルと現時点の再生信号スペクトルから、周波数領域フレーム拡張処理により、再生信号拡張スペクトルU→ 1(j、f)、...、U→ M(j、f)を求める。
U1 →(j、f)=X1 →(j、f)+X1 →(j−2、f)+・・・+X1 →(j−2B、f)・・・(5)
UM →(j、f)=XM →(j、f)+XM →(j−2、f)+・・・+XM →(j−2B、f)・・・(6)
また収音信号フレーム拡張部1037y1で、過去B個の収音信号スペクトルと現時点の収音信号スペクトルから周波数領域フレーム拡張処理により収音信号拡張スペクトルV→ 1(j、f)を求める。
V1 →(j、f)=Y1 →(j、f)+Y1 →(j−2、f)+・・・+Y1 →(j−2B、f)・・・(7)
前記の過去のスペクトル数Bは、主要なエコーが拡張スペクトルに含まれるように3〜15に設定するのが好ましい。
Um(m-1) →(j、f)=Um →(j、f)−Σm−1 i=1Gim →(j、f)Ui(i-1) →(j、f)・・・(8)
Gim →(j、f)=ε[U* i(i-1) →(j、f)Um →(j、f)]/
ε[U* i(i-1) →(j、f)Ui(i-1) →(j、f)]
ただし、U1(0) →(j、f)=U1 →(j、f)とし、U* i(i-1) →(j、f)はUi(i-1) →(j、f)の複素共役とする。
またε[]は時間平均を取ることを意味する。時間平均処理は例えば、
ε[U* i(i-1) →(j、f)Um →(j、f)]=
βε[U* i(i-1) →(j−1、f)Um →(j−1、f)]+
(1−β)ε[U* i(i-1) →(j、f)Um →(j、f)]のように、1フレーム前の処理結果と0〜1の値をとる平滑化定数βを用いる方法がある。
V(m-1) →(j、f)=V1 →(j、f)−Σm−1 i=1Giy →(j、f)Ui(i-1) →(j、f)・・・(9)
Giy →(j、f)=ε[U* i(i-1) →(j、f)Vm →(j、f)]/
ε[U* i(i-1) →(j、f)Ui(i-1) →(j、f)]であり、上述の再生側相関除去部1031mとほぼ同様の処理である。
コヒーレンス算出部1033m(m=2、...、M)では、第mチャネルの再生側相関除去拡張スペクトルU→ m(m-1)(j、f)と第mの収音側相関除去拡張スペクトルV→ (m-1)(j、f)が入力され、以下の式でコヒーレンスγ2 m(m−1)(j、f)を求める。
γ2 m(m−1)(j、f)=
|ε[U* m(m-1) →(j、f)V(m−1) →(j、f)]|2/
ε[U* m(m-1) →(j、f)Um(m-1) →(j、f)]ε[V* (m-1) →(j、f)V(m-1) →(j、f)]・・・(10)
エコー成分比率算出部1034で、前記コヒーレンスγ2 1y(j、f)と前記コヒーレンスγ2 m(m−1)(j、f)の全てを用いて、以下の式にて、収音信号拡張スペクトルV1 →(j、f)に占めるエコー成分の割合γ1 2(f)を求める。
γ1 2(f)=1−(1−γ1y(f))・・・(1−γ2 my・(m−1)(f)) ・・・(11)
マイクロホン32で収音された収音信号y2(k)についても同様の処理を行うことにより収音信号拡張スペクトルV2 →(j、f)に占めるエコー成分の割合γ2 2(f)を求める。
Py1 →(j、f)=Σ2L f=1ε[Y* 1 →(j、f)Y1 →(j、f)]{1−γ1 2(j、f)} ・・・(12)
Py2 →(j、f)=Σ2L f=1ε[Y* 2 →(j、f)Y2 →(j、f)]{1−γ2 2(j、f)} ・・・(13)
なお、収音信号スペクトルY1 →(j、f)、Y2 →(j、f)の代わりに、
収音信号拡張スペクトルV1 →(j、f)、V2 →(j、f)を用いても良い。
送話判定部6の具体例を図5aに示す。この例では、非エコー信号パワーPy1(j、f)、非エコー信号パワーPy2(j、f)が送話判定部6に入力される。非エコー信号パワーPy1(j、f)、非エコー信号パワーPy2(j、f)は合計部61で合計され、非エコー信号パワーの和、Py1(j、f)+Py2(j、f)が求められる。そして、あらかじめ設定、格納されたレジスタ63内の閾値Pth1と合計部61よりの合計値とが合計比較部62で比較される。非エコー信号のパワーの和が閾値Pth1より大きいときは、送話有りと判定し、そうでない場合は、送話なしと判定する。閾値Pth1は例えば、マイクロホン入力定格レベルの−15db等に設定することが考えられる。
なお、送話判定に使用した信号フレームに減衰処理を適用するために、当該フレームで送話有無の判定結果が得られるまでの処理時間に相当する遅延量の遅延器11を、送話側可変減衰部9nの前段に、挿入する構成も考えられる。
まずk=2L−1の時点で、フレーム長2L(k=0〜2L−1)の信号フレームに関して2f0番目(f0=0、...、L−1)の離散フーリエ係数を求めることを考える。この係数は次式で定義される。
演算量の観点から例えば、Lサンプルごとにフーリエ係数が必要な時、前記方法とLサンプルごとに、BL点のFFTを実行する方法と比較すると、前記の方法では、Lサンプルごとに、L点の高速離散フーリエ変換1回で十分なので、ずっと低い演算量で実現可能となっている。
また、ここでは、Mチャネル再生系(Mは2以上の整数)と2チャネル収音系の構成でエコー成分の比率を求める場合を説明したが、収音系3チャネル以上(Nチャネル)の場合でも、送話側音声パワー推定部7をマイクロホンごとに備え付け、同様の処理を行うことで、各収音チャネルごとにエコー成分の比率γん 2(f)(n=1、...、N)を求めることができる。
実施例2
この発明の実施例2を図7に示す。実施例2の実施例1と異なる点のみ説明する。実施例2では、実施例1において、受話側可変減衰器8mを備えず、受話端末11、...、1Mよりの各受話信号が供給される受話判定部12を新たに備える。受話判定部12は例えば、送話判定部で用いた図5aもしくは、図5bのような構成が考えられ、非エコー信号パワーPy1、...、PyNの代わりに、Mチャネルの受話信号パワーが入力される。即ち例えば、図5aと対応するものについて説明する。まず、合計部61において、各再生信号xm(k)(m=1、...M)のフレームごとのパワーPy1、...、PyNが一点鎖線で示すパワー計数部69で計算され、これら全再生信号のパワーPxmの和Px1+Px2・・・PxMが求められる。そして、あらかじめ設定し、格納されたレジスタ63内の閾値Pth4と全再生信号のパワーPxmの和とが合計比較部63で比較される。全再生信号のパワーPxmの和が閾値Pth4より大きいときは、受話有りと判定し、そうでない場合は、受話なしと判定する。
この実施例2の構成により、実施例1とは違い、受話側減衰部8mがないため、ダブルトーク中でも音切れしにくい。また、送話信号の強度のみではなく受話信号の強度も測定しているので、実施例1よりも正確に、エコーを減衰させることができる。
実施例3
この発明の実施例3を図8に示す。実施例3は実施例1で説明した音声スイッチ方法を、適応フィルタによる音響エコー消去方法と組み合わせた構成でありあとの処理は全て同じである。ここでは、Mチャネル再生系、2チャネル収音系の場合を考える。受話側可変減衰部81〜8Mを経た再生信号x1(k)〜xM(k)はスピーカ21〜2Mで再生され、同時に、音響エコー消去部131、132に入力され、予測エコー信号が生成される。スピーカで再生された再生信号x1(k)〜xM(k)は音響エコー経路h1〜hMを経て、マイクロホン31、32に回り込む。以下の説明は、マイクロホン31に収音された収音信号y1(k)について説明する。減算器132によってマイクロホン31からの収音信号y1(k)から予測エコー信号h^1(k)が差し引かれ、その残差信号e1(k)がエコー経路推定部133にフィードバックされると同時に、送話側可変減衰器91を経て、対地へ送信される。送話判定部6では、実施例1と同様に、送話の有無を判定し、受話側可変減衰器8及び送話側可変減衰器9を制御する。なお適応フィルタの更新には、例えば特開2002−223182号公報に挙げられている各種アルゴリズムを使用することができる。なお、収音系がNチャネル(Nは3以上の整数)の場合にも、同様の構成の処理により、音声スイッチ装置と適応フィルタによる音響エコー消去を組み合わせることが可能である。
また、送話音声パワー推定部7と音響エコー消去部13を入れ替えた構成も考えられる。この場合、音響エコー消去部13で生成された残差信号e(k)が収音信号yn(k)として、収音信号TF変換部72に入力されると共に、送話側可変減衰器8nへ供給される。
更に実施例2と実施例3を組み合わせた構成も考えられる。この場合は、より品質の高い拡声通話を行うことができる。
Claims (6)
- 共通の音場に配置され、Mチャネルの再生信号が供給されるM個のスピーカ(Mは2以上の整数)とN個のマイクロホン(Nは1以上の整数)に接続される装置に用いられる音声スイッチ方法において、
あらかじめ決めた2L個のサンプル点(Lは1以上の整数)によるフレームごとに、現フレーム(時刻j)のMチャネルの時間領域の再生信号のそれぞれを周波数領域に変換したMチャネルの再生信号スペクトルX m → (j)(1≦m≦M)を求める過程と、
前記N個のマイクロホンよりの現フレームのNチャネルの時間領域の収音信号のそれぞれを周波数領域に変換したNチャネルの収音信号スペクトルY n → (j)(1≦n≦N)を求める過程と、
Mチャネルそれぞれについて、現フレームの前記再生信号スペクトルX m → (j)と過去のB個のフレームの前記再生信号スペクトルX m → (j−2b)(1≦b≦B)との周波数成分ごとの和である再生信号拡張スペクトル
を求める過程と、
Nチャネルそれぞれについて、現フレームの前記収音信号スペクトルY n → (j)と過去のB個のフレームの前記収音信号スペクトルY n → (j−2b)(1≦b≦B)との周波数成分ごとの和である収音信号拡張スペクトル
を求める過程と、
Mチャネルの前記再生信号拡張スペクトル、それぞれから、チャネル間相関成分を除去して再生側相関除去信号スペクトルを求める過程と、
前記マイクロホンごとに、前記収音信号拡張スペクトルから各前記再生信号拡張スペクトルとの相関成分を除去して収音側相関除去信号スペクトルを求める過程と、
前記マイクロホンごとに、前記再生側相関除去信号スペクトルと再生チャネル及び周波数成分が対応する前記収音側相関除去信号スペクトルとのコヒーレンスを計算する過程と、
前記マイクロホンごとに、前記各周波数成分ごとでの各前記コヒーレンスを計算する過程での計算結果に基づき、各周波数成分ごとの前記収音信号拡張スペクトル中のエコー成分比率を計算する過程と、
前記マイクロホンごとに、前記周波数成分毎に、前記収音信号スペクトル又は前記収音信号拡張スペクトルと前記エコー成分比率とに基づき、前記収音信号スペクトル中の非エコー成分を計算し、これら非エコー成分の総和を計算して、非エコー信号パワーを求める過程と、
前記Nチャネル非エコー信号パワーと所定の閾値とを比較して、送話の有り無しの判定をする過程と、
前記送話の有り無しの判定をする過程において、送話ありと判定されると、前記全受話信号を減衰させて前記再生信号とする過程と、
前記送話の有り無しの判定をする過程において、送話なしと判定されると、前記全収音信号を減衰させる過程と、
を有することを特徴とする音声スイッチ方法。 - 共通の音場に配置され、Mチャネルの再生信号が供給されるM個のスピーカ(Mは2以上の整数)とN個のマイクロホン(Nは1以上の整数)に接続される装置に用いられる音声スイッチ方法において、
あらかじめ決めた2L個のサンプル点(Lは1以上の整数)によるフレームごとに、現フレーム(時刻j)のMチャネルの時間領域の再生信号のそれぞれを周波数領域に変換したMチャネルの再生信号スペクトルX m → (j)(1≦m≦M)を求める過程と、
前記N個のマイクロホンよりの現フレームのNチャネルの時間領域の収音信号のそれぞれを周波数領域に変換したNチャネルの収音信号スペクトルY n → (j)(1≦n≦N)を求める過程と、
Mチャネルそれぞれについて、現フレームの前記再生信号スペクトルX m → (j)と過去のB個のフレームの前記再生信号スペクトルX m → (j−2b)(1≦b≦B)との周波数成分ごとの和である再生信号拡張スペクトル
を求める過程と、
Nチャネルそれぞれについて、現フレームの前記収音信号スペクトルY n → (j)と過去のB個のフレームの前記収音信号スペクトルY n → (j−2b)(1≦b≦B)との周波数成分ごとの和である収音信号拡張スペクトル
を求める過程と、
Mチャネルの前記再生信号拡張スペクトル、それぞれから、チャネル間相関成分を除去して再生側相関除去信号スペクトルを求める過程と、
前記マイクロホンごとに、前記収音信号拡張スペクトルから各前記再生信号拡張スペクトルとの相関成分を除去して収音側相関除去信号スペクトルを求める過程と、
前記マイクロホンごとに、前記再生側相関除去信号スペクトルと再生チャネル及び周波数成分が対応する前記収音側相関除去信号スペクトルとのコヒーレンスを、計算する過程と、
前記マイクロホンごとに、前記各周波数成分ごとでの各前記コヒーレンスを計算する過程での計算結果に基づき、各周波数成分ごとの前記収音信号拡張スペクトル中のエコー成分比率を計算する過程と、
前記マイクロホンごとに、前記周波数成分毎に、前記収音信号スペクトル又は前記収音信号拡張スペクトルと前記エコー成分比率とに基づき、前記収音信号スペクトル中の非エコー成分を計算し、これら非エコー成分の総和を計算して、非エコー信号パワーを求める過程と、
前記Nチャネル非エコー信号パワーと所定の閾値とを比較して、送話の有り無しの判定をする過程と、
前記Mチャネルの現フレーム再生信号のパワーを計算し、そのパワーを所定の閾値と比較して、再生信号の有り無しの判定を行う過程と、
送話の有り無しの判定をする前記過程において送話なしと判定され、かつ、前記再生信号の有り無しの判定を行う前記過程において、再生信号有りと判定されると、全収音信号を減衰させる過程と、
を有することを特徴とする音声スイッチ方法。 - 共通の音場に配置されるM個のスピーカ(Mは2以上の整数)とN個のマイクロホン(Nは1以上の整数)に接続される音声スイッチ装置において、
あらかじめ決めた2L個のサンプル点(Lは1以上の整数)によるフレームごとに、現フレーム(時刻j)のMチャネルの時間領域の再生信号が入力され、これら再生信号のそれぞれを周波数領域に変換したMチャネルの再生信号スペクトルX m → (j)(1≦m≦M)を出力する再生信号TF変換部と、
現フレームのNチャネルの時間領域の収音信号が入力され、これら収音信号のそれぞれを周波数領域に変換したNチャネルの収音信号スペクトルY n → (j)(1≦n≦N)として出力する収音信号TF変換部と、
Mチャネルそれぞれについて、現フレームの前記再生信号スペクトルX m → (j)と過去のB個のフレームの前記再生信号スペクトルX m → (j−2b)(1≦b≦B)とが入力され、これらスペクトルの周波数成分ごとの和である再生信号拡張スペクトル
を計算して出力する再生信号拡張スペクトル算出部と、
Nチャネルそれぞれについて、現フレームの前記収音信号スペクトルY n → (j)と過去のB個のフレームの前記収音信号スペクトルY n → (j−2b)(1≦b≦B)とが入力され、これらスペクトルの周波数成分ごとの和である収音信号拡張スペクトル
を計算して出力する収音信号拡張スペクトル算出部と、
Mチャネルの前記再生信号拡張スペクトルが入力され、それぞれから、チャネル間相関成分を除去して再生側相関除去信号スペクトルとして出力する再生側相関除去部と、
前記マイクロホンごとに、前記収音信号拡張スペクトルと前記各再生拡張スペクトルが入力され、前記収音信号拡張スペクトルから各前記再生信号拡張スペクトルとの相関成分を除去して収音側相関除去信号スペクトルとして出力する収音側相関除去部と、
前記マイクロホンごとに、各前記再生側相関除去信号スペクトルと各前記収音側相関除去信号スペクトルが入力され、これらの対応周波数成分間のコヒーレンスを計算するコヒーレンス算出部と、
前記マイクロホンごとに、前記各周波数成分ごとでの各前記コヒーレンス算出部での計算結果に基づき、各周波数成分ごとの収音信号拡張スペクトル中のエコー成分比率を計算するエコー成分比率算出部と、
前記マイクロホンごとに、前記収音信号スペクトル又は前記収音信号拡張スペクトルと前記周波数成分ごとの収音信号拡張スペクトル中の前記エコー成分比率が入力され、前記周波数成分ごとに、前記収音信号スペクトル又は前記収音信号拡張スペクトルと、前記エコー成分比率とから前記収音信号スペクトルの非エコー成分を計算し、これら非エコー成分の総和を計算して、非エコー信号パワーを計算する非エコー信号パワー算出部と、
前記Nチャネルの前記非エコー信号パワーが入力され、その非エコー信号パワーと所定の閾値とを比較して、送話の有り無しの判定を出力する送話判定部と、
前記送話判定部よりの送話ありの判定信号が入力され、前記全受話信号を減衰させて前記再生信号として出力する受話減衰部と、
前記送話判定部よりの送話なしの判定信号が入力され、前記全収音信号を減衰させる送話減衰部と、
を有することを特徴とする音声スイッチ装置。 - 共通の音場に配置されるM個のスピーカ(Mは2以上の整数)とN個のマイクロホン(Nは1以上の整数)に接続される音声スイッチ装置において、
あらかじめ決めた2L個のサンプル点(Lは1以上の整数)によるフレームごとに、現フレーム(時刻j)のMチャネルの時間領域の再生信号が入力され、これら再生信号のそれぞれを周波数領域に変換したMチャネルの再生信号スペクトルX m → (j)(1≦m≦M)を出力する再生信号TF変換部と、
現フレームのNチャネルの時間領域の収音信号が入力され、これら収音信号のそれぞれを周波数領域に変換したNチャネルの収音信号スペクトルY n → (j)(1≦n≦N)として出力する収音信号TF変換部と、
Mチャネルそれぞれについて、現フレームの前記再生信号スペクトルX m → (j)と過去のB個のフレームの前記再生信号スペクトルX m → (j−2b)(1≦b≦B)とが入力され、これらスペクトルの周波数成分ごとの和である再生信号拡張スペクトル
を計算して出力する再生信号拡張スペクトル算出部と、
Nチャネルそれぞれについて、現フレームの前記収音信号スペクトルY n → (j)と過去のB個のフレームの前記収音信号スペクトルY n → (j−2b)(1≦b≦B)とが入力され、これらスペクトルの周波数成分ごとの和である収音信号拡張スペクトル
を計算して出力する収音信号拡張スペクトル算出部と、
Mチャネルの前記再生信号拡張スペクトルが入力され、それぞれから、チャネル間相関成分を除去して再生側相関除去信号スペクトルとして出力する再生側相関除去部と、
前記マイクロホンごとに、前記収音信号拡張スペクトルと前記各再生拡張スペクトルが入力され、前記収音信号拡張スペクトルから各前記再生信号拡張スペクトルとの相関成分を除去して収音側相関除去信号スペクトルとして出力する収音側相関除去部と、
前記マイクロホンごとに、各前記再生側相関除去信号スペクトルと各前記収音側相関除去信号スペクトルが入力され、これらの対応周波数成分間のコヒーレンスを計算するコヒーレンス算出部と、
前記マイクロホンごとに、前記各周波数成分ごとでの各前記コヒーレンス算出部での計算結果に基づき、各周波数成分ごとの収音信号拡張スペクトル中のエコー成分比率を計算するエコー成分比率算出部と、
前記マイクロホンごとに、前記収音信号スペクトル又は前記収音信号拡張スペクトルと前記周波数成分ごとの収音信号拡張スペクトル中の前記エコー成分比率が入力され、前記周波数成分ごとに、前記収音信号スペクトル又は前記収音信号拡張スペクトルと、前記エコー成分比率とから前記収音信号スペクトルの非エコー成分を計算し、これら非エコー成分の総和を計算して、非エコー信号パワーを計算する非エコー信号パワー算出部と、
前記Nチャネルの前記非エコー信号パワーが入力され、その非エコー信号パワーと所定の閾値とを比較して、送話の有り無しの判定を出力する送話判定部と、
前記Mチャネルの現フレームの前記再生信号が入力され、これら前記再生信号のパワーを計算し、そのパワーを所定の閾値と比較して、前記再生信号の有り無しの判定を行う受話判定部と、
前記送和判定部から送話なしの判定信号が入力され、かつ、前記受話判定部から再生信号有りの判定信号が入力されて全収音信号を減衰させる送話減衰部と、
を有することを特徴とする音声スイッチ装置。 - 請求項1または2に記載の音声スイッチ方法の各過程をコンピュータに実行させるための音声スイッチプログラム。
- 請求項1または2に記載した音声スイッチ方法の各過程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005346241A JP4594854B2 (ja) | 2005-11-30 | 2005-11-30 | 音声スイッチ方法、音声スイッチ装置、音声スイッチプログラム及びそのプログラムを記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005346241A JP4594854B2 (ja) | 2005-11-30 | 2005-11-30 | 音声スイッチ方法、音声スイッチ装置、音声スイッチプログラム及びそのプログラムを記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007151047A JP2007151047A (ja) | 2007-06-14 |
JP4594854B2 true JP4594854B2 (ja) | 2010-12-08 |
Family
ID=38211855
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005346241A Expired - Fee Related JP4594854B2 (ja) | 2005-11-30 | 2005-11-30 | 音声スイッチ方法、音声スイッチ装置、音声スイッチプログラム及びそのプログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4594854B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5022459B2 (ja) * | 2010-03-03 | 2012-09-12 | 日本電信電話株式会社 | 収音装置、収音方法及び収音プログラム |
JP5762479B2 (ja) * | 2013-07-10 | 2015-08-12 | 日本電信電話株式会社 | 音声スイッチ装置、音声スイッチ方法、及びそのプログラム |
JP6690309B2 (ja) * | 2016-03-09 | 2020-04-28 | ヤマハ株式会社 | エコー低減装置、及び音声通信装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003309493A (ja) * | 2002-04-17 | 2003-10-31 | Nippon Telegr & Teleph Corp <Ntt> | 反響低減方法、反響低減装置、反響低減プログラム |
JP2003324787A (ja) * | 2002-05-02 | 2003-11-14 | Nippon Telegr & Teleph Corp <Ntt> | 反響抑圧方法、反響抑圧装置、反響抑圧プログラム |
JP2004147069A (ja) * | 2002-10-24 | 2004-05-20 | Nippon Telegr & Teleph Corp <Ntt> | 音声スイッチ方法、音声スイッチ及び音声スイッチプログラム、そのプログラムを記録した記録媒体 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6167133A (en) * | 1997-04-02 | 2000-12-26 | At&T Corporation | Echo detection, tracking, cancellation and noise fill in real time in a communication system |
-
2005
- 2005-11-30 JP JP2005346241A patent/JP4594854B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003309493A (ja) * | 2002-04-17 | 2003-10-31 | Nippon Telegr & Teleph Corp <Ntt> | 反響低減方法、反響低減装置、反響低減プログラム |
JP2003324787A (ja) * | 2002-05-02 | 2003-11-14 | Nippon Telegr & Teleph Corp <Ntt> | 反響抑圧方法、反響抑圧装置、反響抑圧プログラム |
JP2004147069A (ja) * | 2002-10-24 | 2004-05-20 | Nippon Telegr & Teleph Corp <Ntt> | 音声スイッチ方法、音声スイッチ及び音声スイッチプログラム、そのプログラムを記録した記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP2007151047A (ja) | 2007-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8842851B2 (en) | Audio source localization system and method | |
JP5671147B2 (ja) | 後期残響成分のモデリングを含むエコー抑制 | |
CN103428385B (zh) | 用于处理音频信号的方法及用于处理音频信号的电路布置 | |
JP4955228B2 (ja) | ラウンドロビン正則化を用いたマルチチャネルエコーキャンセレーション | |
JP3727258B2 (ja) | エコー抑制処理システム | |
EP4224833A2 (en) | Method and apparatus utilizing residual echo estimate information to derive secondary echo reduction parameters | |
WO2006017993A1 (fr) | Dispositif et procede d'elimination de bruit de fond pour un terminal de communication orale | |
JP5391103B2 (ja) | 多チャネルエコー消去方法、多チャネルエコー消去装置、多チャネルエコー消去プログラム及びその記録媒体 | |
TW200850040A (en) | Automatic volume and dynamic range adjustment for mobile audio devices | |
CN110956975B (zh) | 回声消除方法及装置 | |
JP3607625B2 (ja) | 多チャネル反響抑圧方法、その装置、そのプログラム及びその記録媒体 | |
JP2009147654A (ja) | 音声処理装置、音声処理システム及び音声処理プログラム | |
US20140133648A1 (en) | Method and apparatus for acoustic echo cancellation in voip terminal | |
JP5662232B2 (ja) | エコー消去装置、その方法及びプログラム | |
JP5469564B2 (ja) | 多チャネルエコー消去方法、多チャネルエコー消去装置及びそのプログラム | |
JP5762479B2 (ja) | 音声スイッチ装置、音声スイッチ方法、及びそのプログラム | |
JP4594854B2 (ja) | 音声スイッチ方法、音声スイッチ装置、音声スイッチプログラム及びそのプログラムを記録した記録媒体 | |
JP3756839B2 (ja) | 反響低減方法、反響低減装置、反響低減プログラム | |
JP3756828B2 (ja) | 反響消去方法、この方法を実施する装置、プログラムおよびその記録媒体 | |
CN103370741A (zh) | 处理音频信号 | |
JP4413205B2 (ja) | エコー抑圧方法、装置、エコー抑圧プログラム、記録媒体 | |
JP3881300B2 (ja) | 音声スイッチ方法、音声スイッチ及び音声スイッチプログラム、そのプログラムを記録した記録媒体 | |
JP3673727B2 (ja) | 反響消去方法、その装置、そのプログラム及びその記録媒体 | |
JP3514714B2 (ja) | 収音方法およびその装置 | |
JP5963077B2 (ja) | 通話装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080128 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100419 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100427 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100628 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100907 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100917 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130924 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |