JP2003273782A - 音声処理装置、コンピュータプログラム、及び記録媒体 - Google Patents

音声処理装置、コンピュータプログラム、及び記録媒体

Info

Publication number
JP2003273782A
JP2003273782A JP2002070869A JP2002070869A JP2003273782A JP 2003273782 A JP2003273782 A JP 2003273782A JP 2002070869 A JP2002070869 A JP 2002070869A JP 2002070869 A JP2002070869 A JP 2002070869A JP 2003273782 A JP2003273782 A JP 2003273782A
Authority
JP
Japan
Prior art keywords
signal
acoustic echo
voice
linear component
echo signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002070869A
Other languages
English (en)
Inventor
Yasuo Nomura
康雄 野村
Yoshinobu Kajikawa
嘉延 梶川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Osaka Industrial Promotion Organization
Original Assignee
Osaka Industrial Promotion Organization
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Osaka Industrial Promotion Organization filed Critical Osaka Industrial Promotion Organization
Priority to JP2002070869A priority Critical patent/JP2003273782A/ja
Publication of JP2003273782A publication Critical patent/JP2003273782A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)

Abstract

(57)【要約】 【課題】 音響エコー信号の非線形成分を速やかに除去
することができる音声処理装置、コンピュータプログラ
ム、及び該コンピュータプログラムが記録されているコ
ンピュータでの読取りが可能な記録媒体の提供。 【解決手段】 通信先からの音声信号が入力される音声
信号入力端子1と、入力された音声信号を音声として出
力する拡声部3と、外部の音声を入力して音声信号を生
成する受音部4と、生成した音声信号を通信先に送信す
る音声信号出力端子2とを備え、音声信号入力端子1か
ら音声信号出力端子2に至る経路にて音響エコー信号の
線形成分及び分割した周波数帯域毎に音響エコー信号の
非線形成分を推定するサブバンド適応フィルタ5を備
え、受音部4にて発生した音響エコー信号から推定した
音響エコー信号の線形成分及び非線形成分を差引くよう
にしている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声の双方向通信で
発生する音響エコー信号を低減するための音声処理装
置、入力された音声信号に基づき音響エコー信号を低減
させる処理を行うコンピュータプログラム、及び該コン
ピュータプログラムが記録されているコンピュータでの
読取りが可能な記録媒体に関する。
【0002】
【従来の技術】拡声機能付き携帯電話機、自動車電話等
の装置にあっては、テレビ会議システム、ハンズフリー
フォン等と同様に、ハンドセットを用いることなく、ス
ピーカとマイクロホンとを利用して通話先の遠端話者と
通話することが可能である。
【0003】拡声機能付き携帯電話機、自動車電話等で
は携帯電話網のような通信回線を通じて音声信号の送受
信を行う。このとき、通話先から送信された音声信号
は、スピーカによって拡声されて話者の耳に届くととも
に、拡声された音声がマイクロホンに回込み、拡声音が
重畳された音声信号が通話先に送信されることになる。
すなわち、通話先の遠端話者がマイクロホンに向かって
発した音声が、その遠端話者の耳に遅れて戻ってくると
いうフィードバック現象が生じることになり、いわゆる
音響エコーが発生する。
【0004】このような音響エコーは自然な通話を妨害
するため、抑制する必要がある。従来、音響エコーを抑
制するために、スピーカからマイクロホンに至るスピー
カ出力の伝搬路(音響エコー経路)における音響エコー
信号を適応フィルタにより推定することによって、疑似
音響エコー信号を生成し、生成した疑似音響エコー信号
を差引くことによって音響エコーを抑制する音響エコー
キャンセラ装置が開発されている。
【0005】前述の適応フィルタには、FIR(finite
impulse response)フィルタに代表される線形適応フ
ィルタを用いることが一般的である。適応フィルタとし
て線形適応フィルタを用いた場合、音響エコー経路に非
線形の要因が存在するときにはその性能が劣化すること
が知られている。ところで、拡声通話で用いられるスピ
ーカは非線形性を有するため、従来の音響エコーキャン
セラ装置では十分に音響エコー信号を低減することがで
きないという問題点を有していた。特に、拡声機能付き
携帯電話機で利用されるスピーカは安価であり、しかも
小型のものであることが多く、非線形性が強くなるため
性能の劣化が著しいという問題点を有していた。
【0006】そこで、前述の問題点を解決するために、
非線形適応フィルタを利用した音響エコーキャンセラ装
置が開発されている。図9は従来の音響エコーキャンセ
ラ装置を説明するブロック図である。音響エコーキャン
セラ装置は、例えば、拡声機能付き携帯電話機、自動車
電話等に内蔵されている。通話相手からデジタル信号に
よって送信された音声信号は、公衆電話回線網、携帯電
話網等の通信回線を通じて音声信号入力端子1に入力さ
れた後、スピーカのような拡声部3によって外部に音声
として出力される。また、話者の音声はマイクロホンの
ような受音部4から入力された後、音声信号出力端子2
から通信回線を通じて通話先に送信される。
【0007】線形適応フィルタ5aは、音声信号入力端
子1から入力された音声信号に基づいて、受音部4に生
じる音響エコー信号の線形成分を推定して、疑似音響エ
コー信号の線形成分を生成するようになっており、非線
形適応フィルタ5aは、同様に、受音部4に生じる音響
エコー信号の非線形成分を推定して、疑似音響エコー信
号の非線形成分を生成するようになっている。生成され
た疑似音響エコー信号の線形成分と非線型成分とは演算
処理部5cによって加算されて出力される。
【0008】そして、線形成分と非線形成分とを加算し
て生成した疑似音響エコー信号は演算処理部7に入力さ
れる。演算処理部7は、受音部4にて発生した音響エコ
ー信号から疑似音響エコー信号を差引く処理を行う。し
たがって、受音部4で発生した音響エコー信号は、演算
処理部7にて消去されることになる。
【0009】
【発明が解決しようとする課題】しかしながら、従来の
音響エコーキャンセラ装置では、Volterraフィルタと呼
ばれる非線形適応フィルタが利用されているが、Volter
raフィルタの収束速度(音響エコー経路の同定速度)は
一般的に遅く、また、達成されるエコー消去量が劣化す
る等の問題点を含んでいるため、実用化の面で克服すべ
き多くの課題が残されていた。とりわけ、拡声機能付き
携帯電話機で利用されるスピーカは安価であり、しかも
小型のものであることが多く、このようなスピーカから
出力される音声は非線形性が強くなるため音響エコー信
号の非線形成分を確実かつ速やかに低減することができ
る音響エコーキャンセラ装置の開発が望まれていた。
【0010】本発明は斯かる事情に鑑みてなされたもの
であり、受信した音声信号に基づき、音響エコー信号の
線形成分を推定する手段と、音響エコー信号の非線形成
分を周波数帯域毎に推定する手段とを備え、推定した音
響エコー信号の線形成分及び各周波数帯域毎の非線形成
分を除去する構成とすることにより、速やかに音響エコ
ー信号の非線形成分を算出することができる音声処理装
置及びコンピュータプログラム、並びに該コンピュータ
プログラムが記録されているコンピュータでの読取りが
可能な記録媒体を提供することを目的とする。
【0011】
【課題を解決するための手段】第1発明に係る音声処理
装置は、通信機器から送信された音声信号を受信する受
信手段と、該受信手段にて受信した音声信号に基づいて
外部に音声を出力する音声出力手段と、外部の音声を受
音部して音声信号を生成する音声入力手段と、該音声入
力手段にて生成された音声信号を前記通信機器へ送信す
る送信手段とを備え、前記音声出力手段から出力された
音声が前記音声入力手段に入力されることにより生じる
音響エコー信号を低減すべくなしてある音声処理装置に
おいて、前記受信手段にて受信した音声信号に基づき、
音響エコー信号の線形成分を推定する手段と、前記音声
信号を予め定められた複数の周波数帯域に分割する手段
と、分割した音声信号に基づき、音響エコー信号の非線
形成分を各周波数帯域毎に推定する手段と、推定した音
響エコー信号の線形成分及び各周波数帯域毎の非線形成
分を前記音声入力手段に生じた音響エコー信号から除去
する手段とを備えることを特徴とする。
【0012】第2発明に係る音声処理装置は、第1発明
に係る音声処理装置において、音響エコー信号の非線形
成分を推定する際、Volterra級数と周波数帯域毎に分割
した音声信号との畳込み演算処理を行うべくなしてある
ことを特徴とする。
【0013】第3発明に係る音声処理装置は、第1発明
又は第2発明に係る音声処理装置において、周波数帯域
毎に分割した音声信号の大きさを算出する手段と、算出
した音声信号の大きさに基づいて前記畳込み演算処理に
用いるVolterra級数のタップ数を算出する手段とを備え
ることを特徴とする。
【0014】第4発明に係るコンピュータプログラム
は、コンピュータに、入力された音声信号に基づいて音
響エコー信号の線形成分を推定させるステップと、コン
ピュータに、入力された音声信号を複数の周波数帯域毎
に分割させるステップと、コンピュータに、分割した音
声信号に基づき音響エコー信号の非線形成分を前記周波
数帯域毎に推定させるステップと、コンピュータに、推
定した音響エコー信号の線形成分及び非線形成分を送信
すべき音声信号から除去させるステップと、コンピュー
タに、音響エコー信号の線形成分及び非線形成分を除去
した音声信号を送信させるステップとを有することを特
徴とする。
【0015】第5発明に係るコンピュータでの読取りが
可能な記録媒体は、コンピュータに、入力された音声信
号に基づいて音響エコー信号の線形成分を推定させるス
テップと、コンピュータに、入力された音声信号を複数
の周波数帯域毎に分割させるステップと、コンピュータ
に、分割した音声信号に基づき音響エコー信号の非線形
成分を前記周波数帯域毎に推定させるステップと、コン
ピュータに、推定した音響エコー信号の線形成分及び非
線形成分を送信すべき音声信号から除去させるステップ
と、コンピュータに、音響エコー信号の線形成分及び非
線形成分を除去した音声信号を送信させるステップとを
有するコンピュータプログラムが記録されていることを
特徴とする。
【0016】第1発明、第4発明、及び第5発明にあっ
ては、受信した音声信号に基づき、音響エコー信号の線
形成分を推定する手段と、音響エコー信号の非線形成分
を周波数帯域毎に推定する手段とを備え、前記音声入力
手段に発生した音響エコー信号から推定した音響エコー
信号の線形成分及び各周波数帯域毎の非線形成分を除去
するようにしている。したがって、例えば、音響エコー
信号の非線形成分を算出する際、Volterraフィルタを用
いることによって、高周波数帯域での演算量を特に削減
することが可能となり、全体として音響エコー信号の非
線形成分を速やかに算出することが可能となる。
【0017】第2発明にあっては、音響エコー信号の非
線形成分を推定する際、Volterra級数と周波数帯域毎に
分割した音声信号との畳込み演算処理を行うようにして
いる。例えば、Volterra級数の2次の項は、その係数が
4点に3点が零値になっているため、畳込み演算処理を
行う際の冗長性を排除することができ、演算量をおよそ
1/4に削減することができるため、音響エコー信号の
非線形成分を速やかに算出することが可能である。
【0018】第3発明にあっては、算出した周波数帯域
毎の音声信号の大きさに基づいてVolterra級数のタップ
数を算出するようにしている。したがって、各周波数帯
域毎に不必要な演算処理を行わずに済むため、演算量を
低減することができ、速やかに音響エコー信号の非線形
成分を算出することが可能である。
【0019】
【発明の実施の形態】以下、本発明の音声処理装置を具
体化した音響エコーキャンセラ装置についてその実施の
形態を示す図面を用いて具体的に説明する。音響エコー
キャンセラ装置は、例えば、拡声機能付き携帯電話機、
自動車電話機等に備えられており、スピーカのような音
声出力手段から出力された音声がマイクロホンのような
音声入力手段に入力されることによって生じる音響エコ
ーを抑制する機能を有する。
【0020】実施の形態1.図1は本実施の形態に係る
音響エコーキャンセラ装置を説明するブロック図であ
る。図中1は、通話相手の遠端話者が持つ電話機、携帯
電話機等の通信端末装置(不図示)から送信される音声
信号を公衆電話回線網、携帯電話網等の通信回線(不図
示)を介して受信するための音声信号入力端子であり、
該音声信号入力端子1に入力された音声信号は拡声部3
から音声として外部に出力される。また、話者から発せ
られる音声は、受音部4から入力された後、音声信号出
力端子2から音声信号として出力され、遠端話者の通信
端末装置に送信される。
【0021】なお、前記通信回線を通じて送受信がされ
る音声信号はデジタル信号であることが望ましい。しか
し、アナログ信号によって音声信号を送受信することも
可能であり、その場合には、音声信号入力端子1に入力
された音声信号をデジタル信号に変換するA/D変換
器、及び音声信号出力端子2から送信する信号をアナロ
グ信号に変換するD/A変換器を備えている必要があ
る。
【0022】拡声部3は、図に示していないD/A変換
器、増幅器、スピーカを備えており、音声信号入力端子
1に入力された音声信号が音声として出力される。受音
部4は、図に示していないマイクロホン、増幅器、A/
D変換器を備えており、外部の音声を受音してデジタル
信号による音声信号を生成する。
【0023】前述したように、拡声部3が有するスピー
カは非線形性が強く、音声信号の入出力関係は次式のよ
うなVolterra級数展開によって表すことが可能である。
【0024】
【数1】
【0025】ここで、x(n)及びy(n)は、それぞ
れ入力信号および出力信号であり、h1 (k1 )は1次
のVolterra核、h2 (k1 ,k2 )は2次のVolterra核
を表している。本実施の形態では、簡易化のために2次
のVolterra核まで採用し、また、Volterra核が有限のタ
ップ数Nを持つとして音声信号の伝達経路における非線
形性を表現する。
【0026】本発明では出力の音声信号を算出する際に
エリアジングが発生することを回避するために2次Volt
erraフィルタの係数を2次元でアップサンプリングして
おく。この場合、2次Volterraフィルタの時間領域の係
数のうちk1 ,k2 が共に偶数である係数以外の係数は
零値で表現され、その2次Volterraフィルタの時間領域
の係数h2 ′(k1 ,k2 )、及び周波数領域の係数H
2 ′(m1 ,m2 )は、以下のように表すことができ
る。
【0027】
【数2】
【0028】
【数3】
【0029】式(3)による場合、入力の音声信号をサ
ンプリング周波数の1/4に帯域制限し、出力信号を4
倍にしたとき、元の2次Volterraフィルタと同様の畳込
み演算の結果を算出できることが分かる。なお、この2
次Volterraフィルタの係数は4点に3点が零値であり、
畳込み演算処理を行う際には、零値の係数のところを計
算する必要がなくなる。そこで、アップサンプリングさ
れた2次VolterraフィルタH2 'における冗長性を排除す
ることができ、演算量が多い2次Volterraフィルタにお
ける演算量をおよそ1/4に削減することが可能であ
る。
【0030】そこで、本発明では音声信号入力端子1に
入力された音声信号を複数の周波数帯域に分割し、夫々
の周波数帯域にてVolterra級数と音声信号との畳込み演
算処理を行うことにより演算量を削減している。
【0031】また、式(1)から理解されるように、Vo
lterra級数の1次の項の演算量は、およそタップ数Nに
比例するのに対し、Volterra級数の2次の項の演算量は
タップ数Nの二乗に比例する。したがって、タップ数N
を適切に定める必要があり、本発明では、音声信号が持
つ信号パワー及びVolterra級数の係数パワーに基づきタ
ップ数Nを算出している。
【0032】これらの演算処理は、図1において音声信
号入力端子1から音声信号出力端子2に至る経路に設け
られたサブバンド適応フィルタ5及びタップ数制御部6
が担っている。
【0033】サブバンド適応フィルタ5では、音声信号
入力端子1に入力された音声信号に基づきVolterra級数
の1次の項を算出して音響エコー信号の線形成分を模擬
した信号を生成すると共に、前記音声信号を複数の周波
数帯域に分割して、各周波数帯域毎にVolterra級数の2
次の項を算出して音響エコー信号の非線形成分を模擬し
た信号を生成する。
【0034】また、タップ数制御部6では、各周波数帯
域の音声信号が持つ信号パワー及びVolterra係数が持つ
係数パワーに基づいてタップ数を算出しており、算出し
た結果がサブバンド適応フィルタ5に出力される。算出
されたタップ数は、サブバンド適応フィルタ5で各周波
数帯域毎にVolterra級数の2次の項を算出する際のタッ
プ数として利用される。
【0035】そして、サブバンド適応フィルタ5にて生
成された疑似音響エコー信号の線形成分及び各周波数帯
域の非線形成分はサブバンド適応フィルタ5の内部で加
算された後、演算処理部7に出力される。演算処理部7
では受音部4に発生した音響エコー信号から疑似音響エ
コー信号を差引くようになっている。したがって、受音
部4に発生した音響エコー信号は演算処理部7で消去さ
れ、音声信号出力端子2から出力される音響エコー信号
を低減している。
【0036】図2は、サブバンド適応フィルタ5の内部
構成を示すブロック図である。図2に示した如く、線形
フィルタ51によりVolterra級数の1次の項と入力され
た音声信号との畳込み演算処理が行われて、音響エコー
信号の線形成分が算出される。また、サブバンド適応フ
ィルタ5に入力された音声信号は、ローパスフィルタ5
2及びハイパスフィルタ53によって、2つの周波数帯
域に分割され、それぞれから出力された音声信号が低域
フィルタ54、低・高域フィルタ55、及び高域フィル
タ56の各帯域フィルタに入力される。そして、各周波
数帯域の音声信号とVolterra級数の2次の項との畳込み
演算処理が行われて、音響エコー信号の非線形成分が算
出される。
【0037】そして、線形フィルタ51及び各帯域フィ
ルタで算出された音響エコー信号の線形成分及び非線形
成分は演算処理部57にて足合わされ、サブバンド適応
フィルタ5の外部に出力される。
【0038】なお、図2においては、入力された音声信
号の周波数帯域をローパスフィルタ52とハイパスフィ
ルタ53とにより2つに分割する構成としたが、分割す
る数は2に限定されるものではなく、複数の帯域フィル
タを設けることによって2以上の周波数帯域に分割する
ことが可能である。
【0039】図3は、各帯域フィルタでの演算量を模式
的に示したグラフである。前述したように本発明にあっ
ては、各周波数帯域の音声信号が持つ信号パワー及びフ
ィルタ係数が持つ係数パワーに基づいてタップ数を算出
している。すなわち、信号パワーの小さい部分、及びVo
lterraフィルタのフィルタ係数が小さい部分を削り取る
ことによって、全体の演算量を削減することができる。
とくに、音響エコー信号を周波数帯域別に着目した場
合、低域より高域の方が早く振幅が減衰することを利用
することができる。
【0040】したがって、図3(a)に示した如く、低
域フィルタ54では2次元でアップサンプリングしたフ
ィルタ係数をすべて利用して畳込み演算処理を行う必要
があるのに対し、低域・高域フィルタ55では、図3
(b)に示した如く、例えば1/3の演算量で済み、高
域フィルタ56では、図3(c)に示した如く、例えば
1/6の演算量で済む。
【0041】図4は、本実施の形態に係る音響エコーキ
ャンセラ装置のエコー消去特性を示すグラフである。横
軸には時間をとり、縦軸にはエコー消去量をとる。ここ
で、エコー消去量は、ある入力信号(例えば、有色雑音
または白色雑音)y0 (k)と、該入力信号y0 (k)
を入力した場合に推定される音響エコー信号y1 (k)
とを用いて、
【0042】
【数4】
【0043】のように表すことができる。
【0044】図4では、本実施の形態の音響エコーキャ
ンセラ装置によるエコー消去特性をグラフ4aに示して
おり、比較の対象として、従来の非線形適応フィルタを
用いた結果(グラフ4b)、Stengerの手法を用いたシ
ュミレーションの結果(グラフ4c)、Sicuranzaの手
法を用いたシュミレーションの結果(グラフ4d)、及
び従来の線形適応フィルタを用いた結果(グラフ4e)
を示している。
【0045】図4に示した如く、本実施の形態の音響エ
コーキャンセラ装置による場合、比較的短時間でエコー
消去量がおよそ35[dB]に達していることが分か
る。従来の非線形適応フィルタを利用した場合(グラフ
4b)、エコー消去量が最終的には35[dB]に達し
ているが、立上がりが緩やかであり、非線形成分の同定
速度が遅いという問題点を有していることがグラフから
読取ることができる。また、Stengerの手法およびSicur
anzaの手法は、いずれも2次Volterraフィルタの係数を
2次元でアップサンプリングした際に、フィルタ係数が
小さい部分を手動により取り除いて演算量を減じた手法
であるため、比較的速く音響エコー信号を消去すること
が可能であるが、本発明のものと比較した場合、それら
のエコー消去量は十分であるとは言えない(グラフ4
c,4d)。また、従来の線形適応フィルタを用いた場
合、伝達経路の非線形性が外乱として影響を及ぼすた
め、非線形適応フィルタを用いた何れの結果と比較して
エコー消去量が著しく劣化していることが分かる(グラ
フ4e)。
【0046】このように、本実施の形態に係る音響エコ
ーキャンセラ装置では、非線形適応フィルタを利用した
従来の音響エコーキャンセラ装置と比較して演算量が大
幅に削減され、エコー消去量の改善が見られる。発明者
らのシュミレーションの結果による場合、従来の非線形
適応フィルタと比較しておよそ1/4の演算量に削減で
きていることが分かった。
【0047】なお、本実施の形態に係る音響エコーキャ
ンセラ装置を携帯電話機のような小型の装置に組込む場
合、タップ数制御部6及びサブバンド適応フィルタ5は
DSP(デジタルシグナルプロセッサ)、専用LSI等
を利用することにより実現することができ、また、タッ
プ数制御部6及びサブバンド適応フィルタ5を一体化し
たDSP又は専用LSIを用いることも可能である。
【0048】また、本実施の形態では、Volterra級数の
2次の項まで用いて音声信号の非線形成分を算出してい
るが、3次以上の高次の項を用いて非線形成分を算出す
ることもできることは、勿論のことである。
【0049】実施の形態2.前述の音響エコーキャンセ
ラ装置は、拡声機能付き携帯電話機、自動車電話機等に
適用されるだけでなく、テレビ会議システム、電話会議
システム等の音声信号の双方向通信が利用されるシステ
ムにも適用することが可能である。本実施の形態では、
テレビ会議システムに適用した実施の形態について説明
する。
【0050】図5は、本実施の形態に係るテレビ会議シ
ステムを説明する模式図である。図中100は、テレビ
会議システムで利用される通信装置であり、該通信装置
100は、公衆電話回線網のような通信ネットワークN
を介して通信先の通信装置100に接続されている。
【0051】各通信装置100は、後述するようにスピ
ーカ及びマイクロホンを備えており、通信ネットワーク
Nを介して音声信号の送受信を行うことが可能であり、
また、CCDカメラ、ビデオカメラのような撮像装置、
液晶ディスプレイのような表示装置を備えており、通信
ネットワークNを介して映像データの送受信を行うこと
が可能である。なお、音声信号及び映像データを送信す
る際、それらを同期して送信することが望ましいが、本
発明にあっては必ずしも必須の要件ではない。
【0052】本実施の形態では、通信ネットワークNを
介して音声信号を受信した場合、受信した音声信号に基
づいてコンピュータプログラムの演算処理により音響エ
コー信号の線形成分を算出する。更に、コンピュータプ
ログラムの演算処理により受信した音声信号を複数の周
波数帯域に分割し、それぞれの周波数帯域で適切なタッ
プ数を算出すると共に、音響エコー信号の非線形成分を
各周波数帯域毎に算出する。そして、スピーカにて発生
した音響エコー信号の線形成分及び非線形成分を除去す
るようにしている。
【0053】図6は、テレビ会議システムで利用される
通信装置100の内部構成を示すブロック図である。通
信装置100は、CPUを有する制御部101を備えて
おり、バス102を介して、ROM103、RAM10
4、操作部105、表示部106、通信部107、拡声
部108、受音部109、撮像部110、及び補助記憶
装置111等の各ハードウェアに接続されている。制御
部101は、ROM103に格納された本発明のプログ
ラム、演算処理プログラム、キー入力処理プログラム等
の各種制御プログラムに従って、それらのハードウェア
を制御する。RAM104はSRAM又はフラッシュメ
モリ等で構成され、ROM103に格納された各種制御
プログラムの実行時に発生するデータ、通信部107に
て送受信する映像データ等を一時的に記憶する。
【0054】操作部105は、通信装置100を操作す
るために必要なテンキー、ファンクションキー等のハー
ドウェアキー又はソフトウェアキーを備えている。表示
部106は、液晶ディスプレイのような表示装置を備え
ており、通信部107にて受信した映像データ等を表示
する。
【0055】通信部107は、モデムのような回線終端
装置を備えており、拡声部108及び受音部109に入
力された音声信号、並びに撮像部110に入力された映
像データ等を通信ネットワークNを通じて送受信する際
の制御を行う。
【0056】拡声部108は、図に示していないD/A
変換器、増幅器、スピーカを備えており、制御部101
により信号処理が施された後、音声信号が音声として出
力される。受音部4は、図に示していないマイクロホ
ン、増幅器、A/D変換器を備えており、外部の音声を
受音してデジタル信号としての音声信号を生成する。
【0057】撮像部110は、CCDカメラ、又はビデ
オカメラのような撮像装置を有しており、話者を撮像し
て映像データを取得して、通信ネットワークNを通じて
通信先の通信装置100に送信する。
【0058】補助記憶部111は、本発明のコンピュー
タプログラム及びデータを記録したCD−ROM等の記
録媒体112からコンピュータプログラム及びデータを
読取るCD−ROMドライブ等からなり、読取られたコ
ンピュータプログラム及びデータは、ROM103に記
憶される。なお、本発明のコンピュータプログラムは、
必ずしも記録媒体112により提供される形態である必
要はなく、ROM103に予め記憶されている形態であ
ってもよい。
【0059】図7は、通信装置100による音声信号の
処理手順を示すフローチャートである。制御部101
は、まず、通信部107にて音声信号を受信したか否か
を判断する(ステップS1)。音声信号を受信していな
い場合(S1:NO)、音声信号を受信するまで待機す
る。
【0060】音声信号を受信した場合(S1:YE
S)、通信部107を通じて入力された音声信号に基づ
いて音響エコー信号の線形成分を算出する(ステップS
2)。音響エコー信号の線形成分を算出する際、Volter
ra級数の1次の項と音声信号との畳込み演算処理を行
う。
【0061】次いで、制御部101は、通信部107を
通じて入力された音声信号を予め定めた各周波数帯域毎
に分割する(ステップS3)。そして、タップ数の更新
処理を行うことにより(ステップS4)、音響エコー信
号の非線形成分を算出する際のタップ数を各周波数帯域
毎に算出する。
【0062】そして、ステップS4で算出したタップ数
を用いて、各周波数帯域毎に音響エコー信号の非線形成
分を算出する(ステップS5)。音響エコー信号の非線
形成分を算出する際、Volterraフィルタの2次の項と各
周波数帯域に分割した音声信号との畳込み演算処理を行
う。
【0063】次いで、制御部101は、通信部107に
て受信した周波数帯域に分割する前の音声信号を拡声部
108から音声として出力する(ステップS6)。そし
て、ステップS2及びステップS5にて算出された音響
エコー信号の線形成分および非線形成分を受音部109
で発生した音響エコー信号から除去する(ステップS
7)。
【0064】そして、音響エコー信号を除去した後、通
信部107を通じて通信先の通信装置100に音声信号
を送信する(ステップS8)。
【0065】図8は、タップ数の更新処理の手順を説明
したフローチャートである。まず、制御部101は初期
値の設定を行い(ステップS11)、2つのカウンタの
値をm=1、p=1に設定する(ステップS12)。設
定すべき初期値は、タップ再分配におけるタップ数R、
サンプル数S、係数パワーを算出する際に取込むフィル
タ係数の数P、分割する周波数帯域の数M等である。こ
れらの初期値の値は、拡声部3の特性、音声信号の伝達
経路の特性を考慮して予め内部的な値としてROM10
3に記憶してあることが望ましい。
【0066】次いで、制御部101は、各周波数帯域に
おける音声信号の信号パワーを算出し(ステップS1
3)、また、フィルタ係数の係数パワーを算出する(ス
テップS14)。各周波数帯域における信号パワー及び
係数パワーは、それぞれ式(5)及び式(6)によって
表現することができる。なお、係数パワーを算出する
際、テイル部分のP個のフィルタ係数を用いて係数パワ
ーを算出する。
【0067】
【数5】
【0068】
【数6】
【0069】ここで、xi,k はk番目の更新回数、i番
目の周波数帯域における入力信号ベクトルであり、c
i,k はk番目の更新回数、i番目の周波数帯域における
係数ベクトルである。
【0070】次いで、ステップS13にて算出した各周
波数帯域での信号パワーに基づき、全周波数帯域での信
号パワーを算出し(ステップS15)、ステップS14
にて算出した各周波数帯域での係数パワーに基づき、全
周波数帯域での係数パワーを算出する(ステップS1
6)。
【0071】次いで、制御部101は、p=mSである
か否かを判断する(ステップS17)。p=mSでない
場合(S17:NO)、カウンタpを1だけ増加させ
(ステップS18)、処理をステップS13へ戻す。
【0072】p=mSである場合(S17:YES)、
各周波数帯域における累積パワーを算出し(ステップS
19)、次いで、全周波数領域での累積パワーを算出す
る(ステップS20)。ここで、累積パワーとは音声信
号の信号パワーとフィルタ係数の係数パワーの積算値で
あり、各周波数帯域における累積パワーは式(7)によ
って表すことができ、また、全周波数帯域での累積パワ
ーは式(8)によって表すことが可能である。
【0073】
【数7】
【0074】
【数8】
【0075】次いで、制御部101は、各周波数帯域で
の累積パワーを全周波数帯域の累積パワーで除算した値
Ψi,mSを算出し(ステップS21)、各周波数帯域のタ
ップ数の更新量を算出する(ステップS22)。タップ
数の更新量は、ステップS21で求めたΨi,mSを用い
て、
【0076】
【数9】
【0077】と表すことができる。そして、各周波数帯
域でのタップ数Ni,mS
【0078】
【数10】
【0079】により算出する(ステップS23)。算出
したタップ数Ni,mSは、おおよそ音声信号の信号パワー
とフィルタ係数の係数パワーとの積算値に比例している
ことが式(10)により分かる。ところが、前述したよ
うに、高周波数帯域では、低周波数帯域と比較して信号
パワーが減衰しているため、タップ数Ni,mSが小さくな
り、Volterra級数の2次の項と音声信号との畳込み演算
処理に要する演算量を削減することが可能となる。
【0080】なお、本実施の形態では、コンピュータプ
ログラムの処理により音響エコー信号の線形成分と非線
形成分とを除去することとしたが、実施の形態1で説明
したようなDSP、専用LSIを用いて実現することも
可能である。
【0081】
【発明の効果】以上、詳述したように、第1発明、第4
発明、及び第5発明による場合は、受信した音声信号に
基づき、音響エコー信号の線形成分を推定する手段と、
音響エコー信号の非線形成分を周波数帯域毎に推定する
手段とを備え、前記音声入力手段に発生した音響エコー
信号から推定した音響エコー信号の線形成分及び各周波
数帯域毎の非線形成分を除去するようにしている。した
がって、例えば、音響エコー信号の非線形成分を算出す
る際、Volterraフィルタを用いることによって、高周波
数帯域での演算量を特に削減することが可能となり、全
体として音響エコー信号の非線形成分を速やかに算出す
ることが可能となる。
【0082】第2発明による場合は、音響エコー信号の
非線形成分を推定する際、Volterra級数と周波数帯域毎
に分割した音声信号との畳込み演算処理を行うようにし
ている。例えば、Volterra級数の2次の項は、その係数
が4点に3点が零値になっているため、畳込み演算処理
を行う際の冗長性を排除することができ、演算量をおよ
そ1/4に削減することができるため、音響エコー信号
の非線形成分を速やかに算出することが可能である。
【0083】第3発明による場合は、算出した周波数帯
域毎の音声信号の大きさに基づいてVolterra級数のタッ
プ数を算出するようにしている。したがって、各周波数
帯域毎に不必要な演算処理を行わずに済むため、演算量
を低減することができ、速やかに音響エコー信号の非線
形成分を算出することが可能である等、本発明は優れた
効果を奏する。
【図面の簡単な説明】
【図1】本実施の形態に係る音響エコーキャンセラ装置
を説明するブロック図である。
【図2】サブバンド適応フィルタの内部構成を示すブロ
ック図である。
【図3】各帯域フィルタの演算量を模式的に示したグラ
フである。
【図4】本実施の形態に係る音響エコーキャンセラ装置
のエコー消去特性を示すグラフである。
【図5】本実施の形態に係るテレビ会議システムを説明
する模式図である。
【図6】テレビ会議システムで利用される通信装置の内
部構成を示すブロック図である。
【図7】通信装置による音声信号の処理手順を示すフロ
ーチャートである。
【図8】タップ数の更新処理の手順を説明したフローチ
ャートである。
【図9】従来の音響エコーキャンセラ装置を説明するブ
ロック図である。
【符号の説明】
1 音声信号入力端子 2 音声信号出力端子 3 拡声部 4 受音部 5 サブバンド適応フィルタ 6 タップ数制御部
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5D020 CC00 5K027 AA11 DD07 DD10 HH03 5K046 BB01 CC29 HH24 HH30 HH54 HH59 HH79 HH80

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 通信機器から送信された音声信号を受信
    する受信手段と、該受信手段にて受信した音声信号に基
    づいて外部に音声を出力する音声出力手段と、外部の音
    声を受音部して音声信号を生成する音声入力手段と、該
    音声入力手段にて生成された音声信号を前記通信機器へ
    送信する送信手段とを備え、前記音声出力手段から出力
    された音声が前記音声入力手段に入力されることにより
    生じる音響エコー信号を低減すべくなしてある音声処理
    装置において、 前記受信手段にて受信した音声信号に基づき、音響エコ
    ー信号の線形成分を推定する手段と、前記音声信号を予
    め定められた複数の周波数帯域に分割する手段と、分割
    した音声信号に基づき、音響エコー信号の非線形成分を
    各周波数帯域毎に推定する手段と、推定した音響エコー
    信号の線形成分及び各周波数帯域毎の非線形成分を前記
    音声入力手段に生じた音響エコー信号から除去する手段
    とを備えることを特徴とする音声処理装置。
  2. 【請求項2】 音響エコー信号の非線形成分を推定する
    際、Volterra級数と周波数帯域毎に分割した音声信号と
    の畳込み演算処理を行うべくなしてあることを特徴とす
    る請求項1に記載の音声処理装置。
  3. 【請求項3】 周波数帯域毎に分割した音声信号の大き
    さを算出する手段と、算出した音声信号の大きさに基づ
    いて前記畳込み演算処理に用いるVolterra級数のタップ
    数を算出する手段とを備えることを特徴とする請求項2
    に記載の音声処理装置。
  4. 【請求項4】 コンピュータに、入力された音声信号に
    基づいて音響エコー信号の線形成分を推定させるステッ
    プと、コンピュータに、入力された音声信号を複数の周
    波数帯域毎に分割させるステップと、コンピュータに、
    分割した音声信号に基づき音響エコー信号の非線形成分
    を前記周波数帯域毎に推定させるステップと、コンピュ
    ータに、推定した音響エコー信号の線形成分及び非線形
    成分を送信すべき音声信号から除去させるステップと、
    コンピュータに、音響エコー信号の線形成分及び非線形
    成分を除去した音声信号を除去させるステップとを有す
    ることを特徴とするコンピュータプログラム。
  5. 【請求項5】 コンピュータに、入力された音声信号に
    基づいて音響エコー信号の線形成分を推定させるステッ
    プと、コンピュータに、入力された音声信号を複数の周
    波数帯域毎に分割させるステップと、コンピュータに、
    分割した音声信号に基づき音響エコー信号の非線形成分
    を前記周波数帯域毎に推定させるステップと、コンピュ
    ータに、推定した音響エコー信号の線形成分及び非線形
    成分を送信すべき音声信号から除去させるステップと、
    コンピュータに、音響エコー信号の線形成分及び非線形
    成分を除去した音声信号を除去させるステップとを有す
    るコンピュータプログラムが記録されていることを特徴
    とするコンピュータでの読取りが可能な記録媒体。
JP2002070869A 2002-03-14 2002-03-14 音声処理装置、コンピュータプログラム、及び記録媒体 Pending JP2003273782A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002070869A JP2003273782A (ja) 2002-03-14 2002-03-14 音声処理装置、コンピュータプログラム、及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002070869A JP2003273782A (ja) 2002-03-14 2002-03-14 音声処理装置、コンピュータプログラム、及び記録媒体

Publications (1)

Publication Number Publication Date
JP2003273782A true JP2003273782A (ja) 2003-09-26

Family

ID=29201319

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002070869A Pending JP2003273782A (ja) 2002-03-14 2002-03-14 音声処理装置、コンピュータプログラム、及び記録媒体

Country Status (1)

Country Link
JP (1) JP2003273782A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008060715A (ja) * 2006-08-29 2008-03-13 Nippon Telegr & Teleph Corp <Ntt> エコー消去装置、その方法、そのプログラム、およびその記録媒体
JP2010268378A (ja) * 2009-05-18 2010-11-25 Hitachi Ltd エコーキャンセラおよび音響エコー消去方法
JP2011160429A (ja) * 2011-02-15 2011-08-18 Nippon Telegr & Teleph Corp <Ntt> エコー消去装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008060715A (ja) * 2006-08-29 2008-03-13 Nippon Telegr & Teleph Corp <Ntt> エコー消去装置、その方法、そのプログラム、およびその記録媒体
JP4709714B2 (ja) * 2006-08-29 2011-06-22 日本電信電話株式会社 エコー消去装置、その方法、そのプログラム、およびその記録媒体
JP2010268378A (ja) * 2009-05-18 2010-11-25 Hitachi Ltd エコーキャンセラおよび音響エコー消去方法
JP2011160429A (ja) * 2011-02-15 2011-08-18 Nippon Telegr & Teleph Corp <Ntt> エコー消去装置

Similar Documents

Publication Publication Date Title
US8311234B2 (en) Echo canceller and communication audio processing apparatus
EP1982509B1 (en) Acoustic echo canceller
JP6311136B2 (ja) 双方向会話補助装置及び双方向会話補助方法
US20070140058A1 (en) Method and system for correcting transducer non-linearities
JP4957810B2 (ja) 音処理装置、音処理方法及び音処理プログラム
US20030031315A1 (en) Echo canceller having nonlinear echo suppressor for harmonics calculations
WO2007049643A1 (ja) エコー抑圧方法及び装置
US20130012275A1 (en) Echo cancelling device, communication device, and echo cancelling method having the error signal generating circuit
JP4765117B2 (ja) エコー防止回路、フィルタ係数設定方法、及びプログラム
JP2007189536A (ja) 音響エコーキャンセラ装置、音響エコーキャンセル方法及び通話装置
JP2003273782A (ja) 音声処理装置、コンピュータプログラム、及び記録媒体
EP3829151B1 (en) Echo suppression device, echo suppression method, and echo suppression program
US8036376B2 (en) Echo prevention circuit having adaptive digital filter
US8934621B2 (en) Echo prevention circuit having signal subtracter feature
US10999444B2 (en) Acoustic echo cancellation device, acoustic echo cancellation method and non-transitory computer readable recording medium recording acoustic echo cancellation program
JP2003274481A (ja) 音声処理装置、コンピュータプログラム、及び記録媒体
JP2023519249A (ja) エコー残留抑制
JP2005198093A (ja) 音声処理装置、音声処理方法および音声処理プログラム
JP4317526B2 (ja) 音響エコー消去方法、装置、プログラム、記録媒体
JP2008263441A (ja) 非線形エコーキャンセラ装置
JP2020171006A (ja) 音響エコーキャンセル装置、音響エコーキャンセル方法及び音響エコーキャンセルプログラム
JP2000353989A (ja) エコーキャンセラ
JPH01314438A (ja) エコーキャンセラ
JP2000165300A (ja) サブバンド適応フィルタを用いた未知システムの同定方法および装置
JP3187715B2 (ja) 反響消去装置