JP2007214976A - エコーキャンセル装置、テレビ電話端末、及びエコーキャンセル方法 - Google Patents
エコーキャンセル装置、テレビ電話端末、及びエコーキャンセル方法 Download PDFInfo
- Publication number
- JP2007214976A JP2007214976A JP2006033740A JP2006033740A JP2007214976A JP 2007214976 A JP2007214976 A JP 2007214976A JP 2006033740 A JP2006033740 A JP 2006033740A JP 2006033740 A JP2006033740 A JP 2006033740A JP 2007214976 A JP2007214976 A JP 2007214976A
- Authority
- JP
- Japan
- Prior art keywords
- audio
- delay time
- input
- echo
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】TV内の音声遅延時間に応じて、エコーキャンセラへ基準入力として与える音声信号の遅延量(遅延時間)を可変にする。
【解決手段】エコーキャンセル装置2は、音声遅延機能を備えたTV1と接続され、TV1が備えるスピーカ12から出力される音声の反響音を収音し該反響音を反響音声信号に変換するマイクロホン206と、マイクロホン206からの反響音声信号を除去するエコーキャンセラ205aとを備える。エコーキャンセル装置2は、入力信号を映像信号と音声信号に復号し、復号した音声信号をTV1とエコーキャンセラ205aへ出力する動画像デコーダ201と、エコーキャンセラ205aへの音声信号の入力をTV1の音声遅延時間に応じて遅延させる遅延回路205cとを備える。エコーキャンセラ205aは、マイクロホン206から入力された反響音声信号から、遅延回路205cでTV1の音声遅延時間だけ遅延させた音声信号を減算する。
【選択図】図1
【解決手段】エコーキャンセル装置2は、音声遅延機能を備えたTV1と接続され、TV1が備えるスピーカ12から出力される音声の反響音を収音し該反響音を反響音声信号に変換するマイクロホン206と、マイクロホン206からの反響音声信号を除去するエコーキャンセラ205aとを備える。エコーキャンセル装置2は、入力信号を映像信号と音声信号に復号し、復号した音声信号をTV1とエコーキャンセラ205aへ出力する動画像デコーダ201と、エコーキャンセラ205aへの音声信号の入力をTV1の音声遅延時間に応じて遅延させる遅延回路205cとを備える。エコーキャンセラ205aは、マイクロホン206から入力された反響音声信号から、遅延回路205cでTV1の音声遅延時間だけ遅延させた音声信号を減算する。
【選択図】図1
Description
本発明は、エコーキャンセル装置、テレビ電話端末、及びエコーキャンセル方法、より詳細には、テレビジョン装置等の音声出力装置内の音声遅延時間に応じて、エコーキャンセラへ基準入力として与える音声信号の遅延量(遅延時間)を可変にしたエコーキャンセル装置、テレビ電話端末、及びエコーキャンセル方法に関する。
通信回線を介して映像と音声を送受信可能なテレビ電話機や、テレビ電話端末を用いたテレビ電話システムにおいては、LCD等の表示装置に通話相手の映像を表示させながら、受話用のスピーカと送話用のマイクロホンにより双方向の通話を行うようになっている。この受話者側において、送話者から送られてくる音声がスピーカから出力され、この送話者の音声が直接、もしくは受話者を含む受話者周辺の物体等に反射してマイクロホンに入力される。マイクロホンに入力された送話者の音声はエコーとなって、送話者側のスピーカから送話者の耳に遅れて戻ってきてしまい、通話品質を劣化させていた。なお、以下ではスピーカから直接、もしくは反射してマイクロホンに入力される音をまとめて反響音と表記する。
従来、このようなエコー障害を抑制するために、エコーキャンセラを備えたテレビ電話端末が知られている(例えば、特許文献1を参照)。この特許文献1に記載のエコーキャンセラ及び該エコーキャンセラを備えたテレビ電話端末は、周囲騒音が存在するときでも、残留エコーを増加させることなく、エコー成分を短時間で抑制できるようにしたものである。
一般に、エコーキャンセラは、受話用のスピーカから出力された通話相手の音声の反響音(エコー)が送話用のマイクロホンで拾われ、通話相手側へ戻ることを防止することを目的とし、自然な会話の実現やハウリングの防止に有効である。
図15は、従来のエコーキャンセラの概略構成を示すブロック図で、図中、101はエコーキャンセラ、102はスピーカ、103はマイクを示す。エコーキャンセラは、マイク入力と基準信号入力の2つの入力と、1つの出力とを備える。マイク入力にはマイク103が接続され、基準信号入力にはスピーカ102から出力される音声に相当する音声信号が入力される。マイク入力の反響音声信号から、環境の音響特性に合わせてゲイン、遅延、周波数特性等が調整された基準信号を減算して、スピーカ102から出力された音声の反響音を取り除くことができる。
従来のエコーキャンセラでは、室内で起こり得る反響音を除去するために、通常、基準信号より50msec程度以下の遅延した音声を取り除くことができるように構成されている。また、上述のようなアルゴリズムのため、基準音声信号を0(無音)に固定すると、マイク103からの入力音声が加工されずそのまま出力されることになる。
一方、最近のテレビジョン装置は、ハイビジョン映像にも対応し、高画質化のために映像信号をデジタル処理(3次元YC分離やIP変換など)するものが一般的になってきたが、このデジタル処理に時間がかかり、映像表示が音声出力よりも遅延してしまうという問題があった。そのため、テレビジョン装置に音声遅延回路を内蔵し、音声を遅延させて映像と音声を同期させるようにしている。
また、デジタル映像処理機能を備えたテレビジョン装置には、高画質,大画面なだけではなく、高音質なスピーカを備えたものが存在する。そこで、一般に普及してきた、このような高画質,高音質なテレビジョン装置を画像表示と音声出力に利用することで、特殊な装置を要しないテレビ電話システムを構築したいという要望がある。
特開2003−264483号公報
しかしながら、映像をデジタル処理するテレビジョン装置で起こり得る音声遅延時間は、約100msec以上になることがあり、通常のエコーキャンセラが想定する音声遅延時間(数十msec程度)を超えている。このため、一般のテレビジョン装置にエコーキャンセラを外部接続し、テレビジョン装置のスピーカを音声出力用に利用すると、エコーキャンセラが正しく動作しないという問題がある。また、遅延時間が通常のエコーキャンセラの想定する音声遅延時間内であったとしても、これは本来残響音を取り除くための時間であるため、テレビジョン装置内部で遅延が増加することにより、除去しきれない残響音が増加して、音声品質が劣化することになる。
エコーキャンセラを正しく動作させるためには、テレビジョン装置内の音声遅延と同じだけ遅延させた音声を基準入力として与える必要がある。このため、テレビジョン装置の音声遅延時間を知る必要があるが、この音声遅延時間を測定する機能は従来のエコーキャンセラでは実現されていない。
また、独立したユニットとして設計されている通常のエコーキャンセラは一般的な音声遅延対応のアルゴリズムが固定されており、この内部アルゴリズムに手を入れて音声遅延時間を変更することは困難である。さらに、この内部アルゴリズムは動的に遅延時間に適応するためのアルゴリズムであり、テレビジョン装置内部で発生するような固定的で大きな音声遅延時間に対応させるのは、演算処理量が非常に大きくなり、非効率である。
本発明は、上述のごとき実情に鑑みてなされたものであり、テレビジョン装置等の音声出力装置内の音声遅延時間に応じて、エコーキャンセラへ基準入力として与える音声信号の遅延量(遅延時間)を可変にしたエコーキャンセル装置、テレビ電話端末、及びエコーキャンセル方法を提供すること、を目的とする。
上記課題を解決するために、本発明の第1の技術手段は、遅延時間を持ち音声を出力する音声出力装置に入力される出力音声信号と、遅延時間を持ち音声を入力するマイクロホンから入力される入力音声信号とを入力とし、前記入力音声信号から前記出力音声信号成分を除去した音声信号をエコーキャンセル出力信号として出力するエコーキャンセラを備えたエコーキャンセル装置において、前記音声出力装置の遅延時間と、前記マイクロホンの遅延時間とを加えた音声遅延時間に応じて前記出力音声信号を遅延させる遅延手段を備え、該遅延手段の出力を前記エコーキャンセラに入力することを特徴としたものである。
第2の技術手段は、第1の技術手段において、前記音声遅延時間を測定する遅延測定手段と、所定の基準音声信号を前記音声出力装置と前記遅延測定手段へ出力する基準音声信号出力手段とを備え、前記遅延測定手段は、前記基準音声信号出力手段からの基準音声信号と前記マイクロホンからの入力音声信号とに基づいて前記音声遅延時間を測定し、該測定した音声遅延時間に応じて遅延時間を前記遅延手段に設定することを特徴としたものである。
第3の技術手段は、第2の技術手段において、前記基準音声信号は、M系列で変調したトーン信号であることを特徴としたものである。
第4の技術手段は、第2の技術手段において、入力映像情報の映像モードを検出する映像モード検出手段を備え、前記遅延測定手段は、前記映像モード検出手段により検出された映像モードが変化したときに、前記音声遅延時間を測定することを特徴としたものである。
第5の技術手段は、第1の技術手段において、入力映像情報の映像モードを検出する映像モード検出手段と、前記音声遅延時間を映像モード毎に記憶した記憶手段とを備え、
前記映像モード検出手段により検出された映像モードに応じた音声遅延時間を前記記憶手段から選択し、該選択した音声遅延時間に応じた遅延時間を前記遅延手段に設定することを特徴としたものである。
前記映像モード検出手段により検出された映像モードに応じた音声遅延時間を前記記憶手段から選択し、該選択した音声遅延時間に応じた遅延時間を前記遅延手段に設定することを特徴としたものである。
第6の技術手段は、第2の技術手段において、前記音声出力装置あるいは前記マイクロホンの少なくとも一方の機種を検出する機種検出手段を備え、前記遅延測定手段は、前記機種検出手段により検出された機種の少なくとも一方が変化したときに、前記音声遅延時間を測定することを特徴としたものである。
第7の技術手段は、第1の技術手段において、前記音声出力装置あるいは前記マイクロホンの少なくとも一方の機種を検出する機種検出手段と、前記音声遅延時間を機種毎に記憶した記憶手段とを備え、前記機種検出手段により検出された機種に応じた音声遅延時間を前記記憶手段から選択し、該選択した音声遅延時間に応じた遅延時間を前記遅延手段に設定することを特徴としたものである。
第8の技術手段は、第2の技術手段において、入力映像情報の映像モードを検出する映像モード検出手段と、前記音声出力装置あるいは前記マイクロホンの少なくとも一方の機種を検出する機種検出手段とを備え、前記遅延測定手段は、前記映像モード検出手段により検出された映像モードあるいは前記機種検出手段により検出された機種の少なくとも一方が変化したときに、前記音声遅延時間を測定することを特徴としたものである。
第9の技術手段は、第1の技術手段において、入力映像情報の映像モードを検出する映像モード検出手段と、前記音声出力装置あるいは前記マイクロホンの少なくとも一方の機種を検出する機種検出手段と、前記音声遅延時間を、映像モード及び機種の組み合わせ毎に記憶した記憶手段とを備え、前記映像モード検出手段により検出された映像モード及び前記機種検出手段により検出された機種の組み合わせに応じた音声遅延時間を前記記憶手段から選択し、該選択した音声遅延時間に応じた遅延時間を前記遅延手段に設定することを特徴としたものである。
第10の技術手段は、第2の技術手段において、前記音声出力装置あるいは前記マイクロホンの少なくとも一方の着脱を検出する接続状態検出手段を備え、前記遅延測定手段は、前記接続状態検出手段により前記音声出力装置と前記マイクロホンとの両方の接続が検出されたときに、前記音声遅延時間を測定することを特徴としたものである。
第11の技術手段は、第1乃至第10のいずれか1の技術手段において、前記エコーキャンセラは、前記マイクロホンから入力された入力音声信号から、前記遅延手段で遅延させた出力音声信号を減算することを特徴としたものである。
第12の技術手段は、遅延時間を持ち音声を出力する音声出力装置に入力される出力音声信号と、遅延時間を持ち音声を入力するマイクロホンから入力される入力音声信号とを入力とし、前記入力音声信号から前記出力音声信号成分を除去した音声信号をエコーキャンセル出力信号として出力するエコーキャンセラを備えたエコーキャンセル装置において、入力音声情報を少なくとも2つの音声信号に復号し、該復号した一方の音声信号を前記音声出力装置へ、他方の音声信号を前記エコーキャンセラへ出力するデコーダと、該デコーダが出力する前記2つの音声信号の出力タイミングを制御する制御手段とを備え、前記制御手段は、前記デコーダを制御して、前記エコーキャンセラに出力する音声信号を、前記音声出力装置の遅延時間と、前記マイクロホンの遅延時間とを加えた音声遅延時間に応じて遅延させることを特徴としたものである。
第13の技術手段は、第12の技術手段において、前記デコーダからの音声信号と前記マイクロホンからの入力音声信号とを入力とするエンコーダを備え、前記制御手段は、前記エンコーダに入力された音声信号と入力音声信号との時間差を求めることにより、音声遅延時間を測定し、該測定された音声遅延時間に応じて音声信号を遅延させることを特徴としたものである。
第14の技術手段は、第13の技術手段において、前記制御手段は、前記音声遅延時間を測定する際に、前記デコーダから出力されて前記エコーキャンセラに入力される音声信号を無音に固定することを特徴としたものである。
第15の技術手段は、第12乃至第14のいずれか1の技術手段において、前記エコーキャンセラは、前記マイクロホンから入力された入力音声信号から、前記デコーダで遅延させた音声信号を減算することを特徴としたものである。
第16の技術手段は、第1乃至第15のいずれか1の技術手段において、前記音声出力装置は、テレビジョン装置であることを特徴としたものである。
第17の技術手段は、第1乃至第16のいずれか1の技術手段におけるエコーキャンセル装置と、ネットワークに接続するためのインタフェース手段と、利用者を撮影して映像信号を入力するための撮像手段と、映像信号を出力する映像出力手段とを備えていることを特徴としたものである。
第18の技術手段は、遅延時間を持ち音声を出力する音声出力装置に入力される出力音声信号と、遅延時間を持ち音声を入力するマイクロホンから入力される入力音声信号とを入力とし、前記入力音声信号から前記出力音声信号成分を除去した音声信号をエコーキャンセル出力信号として出力するエコーキャンセラを備えたエコーキャンセル装置のエコーキャンセル方法において、前記音声出力装置の遅延時間と、前記マイクロホンの遅延時間とを加えた音声遅延時間に応じて前記出力音声信号を遅延させるステップと、該遅延させた音声信号を前記エコーキャンセラに入力するステップとを有することを特徴としたものである。
第19の技術手段は、第18の技術手段において、所定の基準音声信号を前記音声出力装置に出力すると共に、前記音声遅延時間を測定する音声遅延手段へ出力するステップと、該基準音声信号と前記マイクロホンからの入力音声信号とに基づいて前記音声遅延時間を測定するステップと、該測定された音声遅延時間に応じて遅延時間を設定するステップとを有することを特徴としたものである。
第20の技術手段は、第19の技術手段において、前記基準音声信号は、M系列で変調したトーン信号であることを特徴としたものである。
第21の技術手段は、遅延時間を持ち音声を出力する音声出力装置に入力される出力音声信号と、遅延時間を持ち音声を入力するマイクロホンから入力される入力音声信号とを入力とし、前記入力音声信号から前記出力音声信号成分を除去した音声信号をエコーキャンセル出力信号として出力するエコーキャンセラを備えたエコーキャンセル装置のエコーキャンセル方法において、デコーダに入力された入力音声情報を少なくとも2つの音声信号に復号し、該復号した一方の音声信号を前記音声出力装置へ、他方の音声信号を前記エコーキャンセラへ出力する際に、前記2つの音声信号の出力タイミングを制御して、前記エコーキャンセラに出力する音声信号を、前記音声出力装置の遅延時間と、前記マイクロホンの遅延時間とを加えた音声遅延時間に応じて遅延させるステップを有することを特徴としたものである。
第22の技術手段は、第21の技術手段において、前記デコーダからの音声信号と前記マイクロホンからの入力音声信号とを入力するステップと、該入力された音声信号と入力音声信号との時間差を求めることにより、音声遅延時間を測定するステップとを有することを特徴としたものである。
第23の技術手段は、第22の技術手段において、前記音声遅延時間を測定する際に、前記デコーダから出力されて前記エコーキャンセラに入力される音声信号を無音に固定することを特徴としたものである。
第24の技術手段は、第18乃至第23のいずれか1の技術手段において、前記音声出力装置は、テレビジョン装置であることを特徴としたものである。
本発明によれば、テレビジョン装置等の音声出力装置内の音声遅延時間に応じて、エコーキャンセラへ基準入力として与える音声信号の遅延時間を可変にしたため、特殊なエコーキャンセラを使うことなく、一般的なテレビジョン装置を映像表示及び音声出力に利用したテレビ電話システムを構築することができる。
また、一般的なテレビジョン装置を映像表示と音声出力に利用することができるため、大画面,高画質,高音質なテレビ電話システムを容易に実現することができる。
さらには、画像伝送を伴わないようなシステムであっても、音声出力からスピーカ、マイクを経由して音声入力に至る経路上に、例えば無線区間のような遅延を伴う区間があったとしても正しく動作するエコーキャンセル装置を実現できる。
以下、添付図面を参照しながら、本発明に係るエコーキャンセル装置、該装置を備えたテレビ電話端末、及びエコーキャンセル方法の各実施形態について説明する。なお、図1乃至図5において、同じ機能を有する部分については同じ符号を付し、繰り返しの説明は省略する。
(第1の実施形態)
図1は、本発明の第1の実施形態に係るエコーキャンセル装置の要部構成例を示すブロック図で、図中、1は音声出力装置の一例であるテレビジョン装置(以下、TVという)、2はエコーキャンセル装置を示す。なお、図中の破線は制御信号の流れ、実線は映像信号や音声信号の流れを示す。
図1は、本発明の第1の実施形態に係るエコーキャンセル装置の要部構成例を示すブロック図で、図中、1は音声出力装置の一例であるテレビジョン装置(以下、TVという)、2はエコーキャンセル装置を示す。なお、図中の破線は制御信号の流れ、実線は映像信号や音声信号の流れを示す。
TV1は、一般的なテレビであって、映像信号を表示するためのLCD(Liquid Crystal Display:液晶ディスプレイ)などの表示部11と、音声信号を出力するためのスピーカ12と、映像信号に対して3次元YC分離やIP変換などのデジタル処理を行う映像処理回路13と、映像信号に合わせて音声信号を遅延させる処理を行う遅延回路14と、を備えて構成される。
このTV1では、映像処理回路13によるデジタル処理のために、映像に対して約100msec程度の音声遅延が常に発生する。このため、遅延回路14により音声信号を遅延させて映像と音声を同期させている。
エコーキャンセル装置2は、動画像デコーダ201、映像DAC(デジタル・アナログコンバータ)202a、音声DAC202b、動画像エンコーダ203、映像ADC(アナログ・デジタルコンバータ)204a、音声ADC204b、エコーキャンセル手段205、マイクロホン206、制御部207、基準信号発生回路208、及び操作入力部209を備えて構成される。ここでは、エコーキャンセル装置2とTV1との間がアナログで接続される構成を示したが、デジタルによる接続であっても本発明は適応可能である。同様に、エコーキャンセル手段205内に音声を扱うADC、DACが内蔵されているような構成であっても本発明は適応可能である。
また、エコーキャンセル装置2は、TV1と接続するための外部端子P1(映像)、P2(音声)を備え、TV1とケーブル等を介して着脱可能に接続される。なお、上記各部の動作は、マイクロコンピュータ(マイコン)からなる制御部207により制御される。リモコンや本体操作部などの操作入力部209は、エコーキャンセル装置2を操作するための手段であって、操作入力部209からの操作信号が制御部207に入力され、エコーキャンセル装置2の各部が制御される。
ここで、エコーキャンセル装置2をテレビ電話端末に内蔵して利用する場合、動画像デコーダ201及び動画像エンコーダ203には、後述の図5に示すように、ネットワークインタフェース及びネットワークプロトコル処理部が接続される。
このネットワークインタフェースは、図示しない通信ネットワークに接続するための手段であって、通信ネットワークを介して通話相手のテレビ電話端末(図示せず)と映像信号及び音声信号を含む動画像データを送受信する。ネットワークプロトコル処理部は、ネットワークインタフェースと接続され、テレビ電話端末間で接続を確立し、データ通信を可能な状態にする。
テレビ電話システムで利用可能なプロトコルには、例えば、VoIP(Voice-over Internet-Protocol)でも利用されている、SIP(Session-Intiation-Protocol)などがある。また、動画像データのデータ形式は特に限定するものではないが、例えば、MPEG形式などの符号化(圧縮)データを利用することができる。
図1において、エコーキャンセル手段205は、マイクロホン206から入力される反響音声信号を除去するエコーキャンセラ205aと、基準音声信号出力手段である基準信号発生回路208から出力される基準音声信号とマイクロホン206からの反響音声信号に基づいてTV1の音声遅延時間を測定する遅延測定手段に相当する遅延測定回路205bと、エコーキャンセラ205aへの音声信号の入力をTV1の音声遅延時間に応じて遅延させる遅延手段に相当する遅延回路205cと、を備えて構成される。
エコーキャンセラ205aは、マイクロホン206から入力された反響音声信号から、遅延回路205cでTV1の音声遅延時間だけ遅延させた音声信号を減算することにより、反響音声信号を除去する。
遅延回路205cには、TV1の音声遅延時間に応じて、音声遅延時間が可変設定される。TV1の音声遅延時間を測定する場合、操作入力部209からの測定指示に従って、制御部207がスイッチSを基準信号発生回路208側に切り換えて測定モードにし、基準信号発生回路208及び遅延測定回路205bによりTV1の音声遅延時間を測定する。基準音声信号としては、例えば、位相が一致したときにだけ高い相関値を示すM系列のトーン信号などを用いることができる。その測定値は遅延回路205cに設定される。なお、具体的な音声遅延時間の測定・設定方法については後述する。
遅延回路205cに設定された音声遅延時間は、再測定を指示しない限りそのまま保持されるため、以後の通話においてはTV1の音声遅延時間が反映されたエコーキャンセル処理が実行される。なお、エコーキャンセル装置2に別のTVを接続することも想定されるため、電源投入の都度、音声遅延時間を測定するようにしてもよい。
また、予めTV1の音声遅延時間がわかっている場合、ユーザ入力により設定するようにしてもよい。この場合、ユーザが、操作入力部209等からTV1の音声遅延時間を入力指定することで、TV1の音声遅延時間が遅延回路205cに設定される。
このように、エコーキャンセラ205aに対して、基準入力となる音声信号を、TV1の音声遅延時間に合わせて与えることができるため、TV1内で大きな音声遅延があった場合でもエコーキャンセラ205aを正しく動作させることができる。
遅延回路205cにTV1の音声遅延時間を設定する際のエコーキャンセル装置2の動作例について説明する。この場合、まず、ユーザが操作入力部209を操作して、操作入力部209からの測定指示に従って、制御部207がスイッチSを基準信号発生回路208側に切り換えて、測定モードにする。
測定モードにおいて、基準信号発生回路208は、M系列のトーン信号などの基準音声信号をTV1とエコーキャンセル手段205(エコーキャンセラ205a)へ出力する。TV1へ出力された基準音声信号は、遅延回路14で所定時間遅延してスピーカ12から出力される。マイクロホン206は、スピーカ12から出力された基準音声の反響音を収音し、その反響音を反響音声信号に変換する。
遅延測定回路205bは、基準信号発生回路208からの基準音声信号とマイクロホン206からの反響音声信号とを比較することにより、TV1の音声遅延時間を測定する。すなわち、基準音声信号とマイク入力された反響音声信号とのずれを測定することで音声遅延時間を測定する。遅延測定回路205bにより測定された音声遅延時間は、遅延回路205cに設定される。
次に、遅延回路205cにTV1の音声遅延時間が設定された後のエコーキャンセル装置2の動作例について説明する。この場合、操作入力部209からの通話指示に従って、制御部207がスイッチSを音声DAC202b側に切り換えて、通話モードにする。
通話モードにおいて、動画像デコーダ201は、通話相手のテレビ電話端末から送られてくる動画像データを復号(デコード)してデジタル映像信号とデジタル音声信号に分離する。映像DAC202aは、動画像デコーダ201により復号されたデジタル映像信号をアナログ映像信号へ変換する。また、音声DAC202bは、動画像デコーダ201により復号されたデジタル音声信号をアナログ音声信号へ変換する。
映像DAC202aで変換されたアナログ映像信号は外部端子P1からTV1へ出力される。また、音声DAC202bで変換されたアナログ音声信号は外部端子P2からTV1へ出力され、同時に、エコーキャンセル手段205へ出力される。TV1では、映像処理回路13でデジタル処理を施した映像信号を表示部11に表示すると共に、遅延回路14で所定時間遅延させた音声信号をスピーカ12から出力する。
マイクロホン206は、利用者等の音声を変換したアナログ音声信号をエコーキャンセル手段205へ出力する。また、マイクロホン206は、スピーカ12から出力される送話者の音声の反響音を収音し、その反響音を変換した反響音声信号をエコーキャンセル手段205へ出力する。
遅延回路205cは、音声DAC202bからのアナログ音声信号をTV1の音声遅延時間だけ遅延させてエコーキャンセラ205aへ基準入力として与える。エコーキャンセラ205aは、マイクロホン206から入力された反響音声信号から、遅延回路205cにより基準入力として与えられたアナログ音声信号を減算する。
エコーキャンセラ205aは、上記のように、マイクロホン206からの反響音声信号を除去すると共に、利用者等の音声であるアナログ音声信号を音声ADC204bへ出力する。また、図示しない撮像手段(カメラ)から入力されるアナログ映像信号が映像ADC204aへ入力される。
映像ADC204aは、撮像手段からのアナログ映像信号をデジタル映像信号へ変換し、音声ADC204bは、エコーキャンセラ205aからのアナログ音声信号をデジタル音声信号へ変換する。映像ADC204aで変換したデジタル映像信号及び音声ADC204bで変換したデジタル音声信号は、動画像エンコーダ203へ出力される。動画像エンコーダ203は、映像ADC204aからのデジタル映像信号及び音声ADC204bからのデジタル音声信号を符号化(エンコード)し、符号化した動画像データを出力する。
このように、本実施形態によれば、テレビジョン装置内の音声遅延時間の測定回路を備え、エコーキャンセラへの基準入力の遅延時間を可変にしたため、特殊なエコーキャンセラを使うことなく、一般的なテレビジョン装置を画像表示及び音声出力に利用したテレビ電話システムを構築することができる。なお、遅延回路205cに設定する音声遅延時間は遅延測定回路205bで測定した結果よりも5msecから10msec小さく設定することが望ましい。これにより、遅延測定回路205bの測定結果に遅延時間が小さくなるような測定誤差が含まれていたとしても、エコーキャンセラ205aの動的な遅延時間の適応アルゴリズムで吸収することができる。
(第2の実施形態)
TV1の映像処理による音声遅延時間は、映像モード(解像度など)やTV機種によって変化する。そこで、本実施形態のエコーキャンセル装置は、映像信号の映像モード及び/又はTV機種を検出し、映像モード及び/又はTV機種が変化したときに、音声遅延時間を測定するように構成したものである。
TV1の映像処理による音声遅延時間は、映像モード(解像度など)やTV機種によって変化する。そこで、本実施形態のエコーキャンセル装置は、映像信号の映像モード及び/又はTV機種を検出し、映像モード及び/又はTV機種が変化したときに、音声遅延時間を測定するように構成したものである。
図2は、本発明の第2の実施形態に係るエコーキャンセル装置2の要部構成例を示すブロック図で、エコーキャンセル装置2は、第1の実施形態に示した構成に加えて、モード・遅延時間テーブル207a、ケーブル接続状態・TV機種検出回路210を備えて構成される。なお、図中の破線は制御信号の流れ、実線は映像信号や音声信号の流れを示す。
本実施形態のエコーキャンセル装置2は、映像信号の映像モードを検出する映像モード検出手段に相当する動画像デコーダ201を備える。動画像デコーダ201は、動画像データが入力されると、これを映像信号と音声信号に復号する。この際、映像信号の映像モードを検出する。映像モードとは、例えば、525i(iはインターレース),525p(pはプログレッシブ),1125i,750pなどの映像信号の解像度や画面の更新頻度(リフレッシュレート)などである。
動画像デコーダ201で検出された映像モード情報は制御部207へ入力され、制御部207は、この映像モード情報に基づいて映像モードが変化したかどうかを判断する。映像モードが変化したと判断した場合、基準信号発生回路208へ測定指示を行う。以後の測定処理は第1の実施形態と同様に、基準信号発生回路208及び遅延測定回路205bによりTV1の音声遅延時間を測定し、その測定値を遅延回路205cに設定する。なお、映像モードが変化した際に突然、測定用の基準信号が出力されてユーザを驚かせないよう、表示部11に警告メッセージを出力してから測定するよう構成しても良い。
また、一度測定した後は映像モード毎に音声遅延時間を記憶しておき、再測定することなく、音声遅延時間を調整する構成としてもよい。この場合、遅延測定回路205bにより測定された音声遅延時間を映像モード毎に記憶するためのモード・遅延時間テーブル207aが不揮発性メモリ等に格納される。このテーブルデータの例を後述の図3に示す。
制御部207は、動画像デコーダ201からの映像モード情報により映像モードが変化したと判断した場合、モード・遅延時間テーブル207aを参照し、該当する映像モードに応じた音声遅延時間が既に記憶されていれば、その映像モードに応じた音声遅延時間をモード・遅延時間テーブル207aから選択し、選択した音声遅延時間を遅延回路205cに設定する。これにより、再測定することなく、音声遅延時間を再設定することができる。
また、制御部207は、モード・遅延時間テーブル207aを参照し、該当する映像モードに応じた音声遅延時間が記憶されていなければ、基準信号発生回路208へ測定指示を行い、遅延測定回路205bで測定した測定結果をモード・遅延時間テーブル207aに記憶する。
また、他の実施形態として、エコーキャンセル装置2は、エコーキャンセル装置2と接続されたTVの機種を検出する機種検出手段に相当するケーブル接続状態・TV機種検出回路210(以下、TV機種検出回路210)を備えるようにしてもよい。
TV機種検出回路210で検出されたTV機種の情報は制御部207へ入力され、制御部207は、このTV機種情報に基づいてTV機種が変化したかどうかを判断する。TV機種が変化したと判断した場合、基準信号発生回路208へ測定指示を行う。以後の測定処理は第1の実施形態と同様に、基準信号発生回路208及び遅延測定回路205bによりTV1の音声遅延時間を測定し、その測定値を遅延回路205cに設定する。
また、一度測定した後はTV機種毎に音声遅延時間を記憶しておき、再測定することなく、音声遅延時間を調整する構成としてもよい。この場合、遅延測定回路205bにより測定された音声遅延時間をTV機種毎に記憶するためのモード・遅延時間テーブル207aが不揮発性メモリ等に格納される。このテーブルデータの例を後述の図3に示す。
制御部207は、TV機種検出回路210からのTV機種情報によりTV機種が変化したと判断した場合、モード・遅延時間テーブル207aを参照し、該当するTV機種に応じた音声遅延時間が既に記憶されていれば、そのTV機種に応じた音声遅延時間をモード・遅延時間テーブル207aから選択し、選択した音声遅延時間を遅延回路205cに設定する。これにより、再測定することなく、音声遅延時間を再設定することができる。
また、制御部207は、モード・遅延時間テーブル207aを参照し、該当するTV機種に応じた音声遅延時間が記憶されていなければ、基準信号発生回路208へ測定指示を行い、遅延測定回路205bで測定した測定結果をモード・遅延時間テーブル207aに記憶する。
また、さらに、他の実施形態として、エコーキャンセル装置2に、上述した動画像デコーダ201とTV機種検出回路210の両方を備えるようにしてもよい。
動画像デコーダ201で検出された映像モードの情報及びTV機種検出回路210で検出されたTV機種の情報は制御部207へ入力され、制御部207は、この映像モード情報及びTV機種情報に基づいて、映像モードあるいはTV機種が変化したかどうかを判断する。映像モードあるいはTV機種が変化したと判断した場合、基準信号発生回路208へ測定指示を行う。以後の測定処理は第1の実施形態と同様に、基準信号発生回路208及び遅延測定回路205bによりTV1の音声遅延時間を測定し、その測定値を遅延回路205cに設定する。
また、一度測定した後は映像モード及びTV機種の組み合わせ毎に音声遅延時間を記憶しておき、再測定することなく、音声遅延時間を調整する構成としてもよい。この場合、遅延測定回路205bにより測定された音声遅延時間を組み合わせ(映像モード及びTV機種)毎に記憶するためのモード・遅延時間テーブル207aが不揮発性メモリ等に格納される。このテーブルデータの例を後述の図3に示す。
制御部207は、映像モードあるいはTV機種が変化したと判断した場合、モード・遅延時間テーブル207aを参照し、該当する組み合わせに応じた音声遅延時間が既に記憶されていれば、その組み合わせに応じた音声遅延時間をモード・遅延時間テーブル207aから選択し、選択した音声遅延時間を遅延回路205cに設定する。これにより、再測定することなく、音声遅延時間を再設定することができる。
また、制御部207は、モード・遅延時間テーブル207aを参照し、該当する組み合わせに応じた音声遅延時間が記憶されていなければ、基準信号発生回路208へ測定指示を行い、遅延測定回路205bで測定した測定結果をモード・遅延時間テーブル207aに記憶する。
図3は、モード・遅延時間テーブル207aの一例を示す図である。ここでは、TV機種と映像モードの組み合わせに対して、音声遅延時間が登録されている例を示しているが、TV機種と音声遅延時間の対応関係、あるいは、映像モードと音声遅延時間との対応関係を登録するようにしてもよい。なお、映像モードのD1は525iの解像度、D2は525pの解像度、D3は1125iの解像度、D4は750pの解像度、D5は1125pの解像度に対応する。また、TV機種情報は、例えば、TVの型番などである。TV機種情報を扱うための仕組には、例えばVESA(Video Electronics Standards Association)が定める各種規格が利用できる。
エコーキャンセル装置2は、接続したTVのTV機種情報が取得できない場合、当該TVとの接続が解除されとときに、モード・遅延時間テーブル207aから測定結果を消去するようにしてもよい。
また、エコーキャンセル装置2は、TVが接続されているかどうかを検出する接続状態検出手段に相当するケーブル接続状態・TV機種検出回路210(以下、ケーブル接続状態検出回路210)を備えるようにしてもよい。
ケーブル接続状態検出回路210で検出された接続状態の情報は制御部207へ入力され、制御部207は、この接続状態情報に基づいて、TVとの接続ケーブルが装着されたかどうかを判断する。TVとの接続ケーブルが装着されたと判断した場合、基準信号発生回路208へ測定指示を行う。以後の測定処理は第1の実施形態と同様に、基準信号発生回路208及び遅延測定回路205bによりTV1の音声遅延時間を測定し、その測定値を遅延回路205cに設定する。
また、制御部207は、TVとの接続ケーブルが取り外されたと判断した場合、TVが交換された可能性があるため、モード・遅延時間テーブル207aに記憶されている音声遅延時間を消去するようにしてもよい。
このように、本実施形態によれば、映像信号の映像モード及び/又はTV機種を検出し、映像モード及び/又はTV機種が変化したときに、音声遅延時間を測定することができるため、各種の映像モード及び/又はTV機種に応じて、適切な音声遅延時間を設定することができる。
(第3の実施形態)
本実施形態のエコーキャンセル装置は、STB(Set Top Box)モードと通話(コミュニケーション)モードを備え、ステレオの音声入出力回路を利用して、音声遅延測定処理と音声遅延処理をマイコンによるソフトウェア制御で実行するように構成したものである。
本実施形態のエコーキャンセル装置は、STB(Set Top Box)モードと通話(コミュニケーション)モードを備え、ステレオの音声入出力回路を利用して、音声遅延測定処理と音声遅延処理をマイコンによるソフトウェア制御で実行するように構成したものである。
図4は、本発明の第3の実施形態に係るエコーキャンセル装置2の要部構成例を示すブロック図である。TV1は、表示部11と、左右のスピーカ(12L,12R)と、映像処理回路13と、スピーカ12Lに対応する遅延回路14Lと、スピーカ12Rに対応する遅延回路14Rと、を備えて構成される。エコーキャンセル装置2は、TV1と接続するための外部端子P1(映像)、P2(左音声)、P3(右音声)を備え、TV1とケーブル等を介して着脱可能に接続される。
本実施形態においては、エコーキャンセル装置2が備える音声DAC202bと音声ADC204bがステレオ対応となっている。前述の第1の実施形態や第2の実施形態に示したエコーキャンセル装置2の基準信号発生回路208、遅延測定回路205b、及び遅延回路205cを不要とし、音声遅延測定処理と音声遅延処理をマイコンである制御部207によるソフトウェア制御で実行する。上記の音声遅延測定処理と音声遅延処理を実行するための制御プログラムは、制御部207内のメモリに格納される。
STBモードではスイッチSを音声DAC202bの右(R)チャンネル側へ、通話モードではスイッチSを音声DAC202bの左(L)チャンネル側へ切り替えられる。図4に示すスイッチSは、STBモードの位置にある。STBモードでは動画像デコーダ201のステレオ出力がそのままTV1のスピーカ12L及びスピーカ12Rへ入力され、スピーカ12L及びスピーカ12Rからステレオ音声で出力される。
TV1の音声遅延時間を測定する場合、まず、スイッチSを音声DAC202bのLチャンネル側へ切り替えて通話モードにする。動画像デコーダ201は、入力信号を映像信号と2つの音声信号に復号し、復号した一方の音声信号を音声DAC202bのLチャンネルからTV1の遅延回路14L及び遅延回路14Rへ、他方の音声信号を音声DAC202bのRチャンネルからエコーキャンセラ205aへ出力する。
TV1において、スピーカ12Lは、遅延回路14Lで所定時間遅延された音声を出力し、スピーカ12Rは、遅延回路14Rで所定時間遅延された音声を出力する。
マイクロホン206は、スピーカ12L及びスピーカ12Rから出力された音声の反響音を収音し、その反響音を反響音声信号に変換し、エコーキャンセラ205aへ出力する。制御部207は、TV1の音声遅延時間を測定する際に、動画像デコーダ201に入力する音声信号のRチャンネルを0に固定する。その結果、音声DAC202bのRチャンネルから出力され、エコーキャンセラ205aに入力される音声信号が無音に固定される。これにより、エコーキャンセラ205aの動作を一時的に停止させ、マイクロホン206からの反響音声信号がそのまま動画像エンコーダ203へ入力される。
このようにして、動画像デコーダ201(本例では音声DAC202bのLチャンネル)からの音声信号が音声ADC204bのLチャンネルへ、マイクロホン206からの反響音声信号が音声ADC204bのRチャンネルへ入力され、動画像エンコーダ203に取り込まれる。
制御部207は、動画像エンコーダ203に入力された音声信号と反響音声信号との時間差を求めることにより、TV1の音声遅延時間を測定することができる。制御部207は、上記のように測定した音声遅延時間に基づいて、動画像デコーダ201を制御して、エコーキャンセラ205aへの音声信号の入力をTV1の音声遅延時間に応じて遅延させる。
上記のように、マイク入力のチャンネル(本例ではRチャンネル)と異なるチャンネル(本例ではLチャンネル)にスピーカ12L及び12Rへの出力信号と同じ信号をループバックさせるようにすれば、動画像エンコーダ203で録音された音声の左右の時間差を測定するだけで遅延時間を測定することができるようになる。この構成によれば、動画像デコーダ201での再生開始タイミングと動画像エンコーダ203での録音開始タイミングを厳密に一致させなくとも音声遅延時間を厳密に測定することができる。
このように、本実施形態によれば、左右のスピーカから同じ音声(動画像デコーダの左チャンネル)が出力され、動画像デコーダの右チャンネルはエコーキャンセラに入力されている。このため、制御部(マイコン)で動画像デコーダの左右チャンネルからの音声信号の出力タイミングを調整することにより、前述の遅延回路と同等の機能を実現することができ、ハードウェア構成が簡単になる。
図5は、本発明に係るエコーキャンセル装置2を備えたテレビ電話端末の概略構成例を示すブロック図である。図中、3はインターネットやイントラネットなどの通信ネットワーク、20はエコーキャンセル装置2を備えたテレビ電話端末を示す。
テレビ電話端末20は、エコーキャンセル装置2と、通信ネットワーク3に接続するためのネットワークインタフェース211と、ネットワークプロトコル処理部212と、利用者を撮影して映像信号を入力するための撮像手段213と、を備えて構成される。なお、エコーキャンセル装置2は、前述の第1の実施形態〜第3の実施形態に示したいずれかの構成を備えているが、ここでは主要部(動画像デコーダ201、DAC202、動画像エンコーダ203、ADC204、エコーキャンセル手段205、マイクロホン206)のみを記載している。
ネットワークインタフェース211は、通信ネットワーク3に接続するための手段であって、通信ネットワーク3を介して通話相手のテレビ電話端末(図示せず)と映像信号及び音声信号を含む動画像データを送受信する。ネットワークプロトコル処理部212は、ネットワークインタフェース211と接続され、テレビ電話端末間でプロトコルを確立し、データ通信を可能な状態にする。撮像手段213は、CCD(Charge Coupled Device:電荷結合素子)などの撮像素子で構成され、その映像信号はADC204へ入力される。
このように、テレビ電話端末間を通信ネットワークを介して接続することにより、テレビ電話システムが実現され、テレビ電話端末間において映像信号と音声信号を双方向でやり取りすることが可能となる。
第1の実施形態(図1)及び第2の実施形態(図2)に示したエコーキャンセル装置2によるエコーキャンセル方法について説明する。
まず、動画像デコーダ201が、動画像データを映像信号と音声信号に復号し、復号した音声信号をTV1とエコーキャンセル手段205(エコーキャンセラ205a)へ出力する。次に、遅延回路205cが、エコーキャンセラ205aへの音声信号の入力をTV1の音声遅延時間に応じて遅延させる。そして、エコーキャンセラ205aが、マイクロホン206から入力された反響音声信号から、遅延回路205cで遅延させた基準入力となる音声信号を減算する。
まず、動画像デコーダ201が、動画像データを映像信号と音声信号に復号し、復号した音声信号をTV1とエコーキャンセル手段205(エコーキャンセラ205a)へ出力する。次に、遅延回路205cが、エコーキャンセラ205aへの音声信号の入力をTV1の音声遅延時間に応じて遅延させる。そして、エコーキャンセラ205aが、マイクロホン206から入力された反響音声信号から、遅延回路205cで遅延させた基準入力となる音声信号を減算する。
TV1の音声遅延時間を測定する場合、基準信号発生回路208が、M系列で変調したトーン信号などの基準音声信号をTV1とエコーキャンセル手段205(エコーキャンセラ205a)へ出力する。次に、遅延測定回路205bが、エコーキャンセラ205aへの基準音声信号とマイクロホン206からの反響音声信号とに基づいてTV1の音声遅延時間を測定する。そして、遅延測定回路205bで測定した音声遅延時間は遅延回路205cに設定される。
第3の実施形態(図4)に示したエコーキャンセル装置2によるエコーキャンセル方法について説明する。
この場合、動画像デコーダ201が、動画像データを映像信号と少なくとも2つの音声信号に復号し、復号した一方の音声信号をTV1へ、他方の音声信号をエコーキャンセラ205aへ出力する際に、制御部207が、2つの音声信号の出力タイミングを制御し、エコーキャンセラ205aへの音声信号の入力をTV1の音声遅延時間に応じて遅延させる。そして、エコーキャンセラ205aが、マイクロホン206から入力された反響音声信号から、動画像デコーダ201で遅延させた基準入力となる音声信号を減算する。
この場合、動画像デコーダ201が、動画像データを映像信号と少なくとも2つの音声信号に復号し、復号した一方の音声信号をTV1へ、他方の音声信号をエコーキャンセラ205aへ出力する際に、制御部207が、2つの音声信号の出力タイミングを制御し、エコーキャンセラ205aへの音声信号の入力をTV1の音声遅延時間に応じて遅延させる。そして、エコーキャンセラ205aが、マイクロホン206から入力された反響音声信号から、動画像デコーダ201で遅延させた基準入力となる音声信号を減算する。
TV1の音声遅延時間を測定する場合、TV1への音声信号とマイクロホン206からの反響音声信号とが動画像エンコーダ203に入力される。次に、制御部207が、動画像エンコーダ203に入力された音声信号と反響音声信号との時間差を求めることにより、TV1の音声遅延時間を測定する。なお、TV1の音声遅延時間を測定する際には、エコーキャンセラ205aへ入力される音声信号が一時的に無音に固定される。
次に、エコーキャンセル装置2による音声遅延時間の測定方法について説明する。
図6に示すように、基準信号とマイクから入力された反響音声信号とのずれを測定することで音声遅延時間を測定する。
図6に示すように、基準信号とマイクから入力された反響音声信号とのずれを測定することで音声遅延時間を測定する。
よく利用されるインパルスや単純なトーンパルスによる測定では、0から100msec以上の広い範囲での遅延時間の変化に適応させる場合、信頼性が低下する。そこで、31ビット長のM系列で変調した1kHzのトーンを利用することで、雑音の多い環境でも高精度に信頼できる遅延時間を測定することが可能となる。ここで、最小パルス長を10msecとしたため、信号の長さは310msecとなる。なお、M系列は位相が一致したときにだけ高い相関値を示すほかのパターンでも代替できる。
音声遅延時間の測定手順の一例を下記に示す。
(1)マイク入力を1sec録音する。この場合、最大690msecまでの遅延を測定できる(=1sec−310msec)。
(2)基準信号とマイク入力とをそれぞれの包絡線に変換する。ここでは、信号を0.5msecごとに区切り、その範囲のエネルギーを求め包絡線の代わりとした。
(3)マイク入力の最大値が極端に小さい場合(例えば適正レベルの1/10以下)、接続あるいは音量調整を確認するようユーザへの告知を行う。
(4)マイク入力の先頭から0.5msec×n〜0.5msec×n+310msecの信号の包絡線と基準信号の包絡線との相関値を、nの値を0から1380(=(1sec − 310msec)/0.5msec)の範囲について変化させながら求める。相関値が最大となるnをnmaxとする。包絡線に変換することで相関値の演算量を大きく削減することができる。M系列を用いることで、包絡線に変換しても相関値の変化は元の信号の相関値の変化に一致する。
(5)マイク入力の先頭からm/8kHz〜m/8kHz+310msecの信号と基準信号との相関値を、mの値を(nmax−2)×0.5msec×8kHz〜(nmax+2)×0.5msec×8kHzの範囲について変化させながら求める。相関値が最大となるmをmmaxとする。mmax/8kHzを測定結果とする。ここで8kHzはサンプリングレートである。
(6)上記(5)で求めた相関値が基準に満たない場合、例えば0.7以下の場合は測定が失敗したとみなし、ユーザへの告知、あるいは再測定を行う。
(1)マイク入力を1sec録音する。この場合、最大690msecまでの遅延を測定できる(=1sec−310msec)。
(2)基準信号とマイク入力とをそれぞれの包絡線に変換する。ここでは、信号を0.5msecごとに区切り、その範囲のエネルギーを求め包絡線の代わりとした。
(3)マイク入力の最大値が極端に小さい場合(例えば適正レベルの1/10以下)、接続あるいは音量調整を確認するようユーザへの告知を行う。
(4)マイク入力の先頭から0.5msec×n〜0.5msec×n+310msecの信号の包絡線と基準信号の包絡線との相関値を、nの値を0から1380(=(1sec − 310msec)/0.5msec)の範囲について変化させながら求める。相関値が最大となるnをnmaxとする。包絡線に変換することで相関値の演算量を大きく削減することができる。M系列を用いることで、包絡線に変換しても相関値の変化は元の信号の相関値の変化に一致する。
(5)マイク入力の先頭からm/8kHz〜m/8kHz+310msecの信号と基準信号との相関値を、mの値を(nmax−2)×0.5msec×8kHz〜(nmax+2)×0.5msec×8kHzの範囲について変化させながら求める。相関値が最大となるmをmmaxとする。mmax/8kHzを測定結果とする。ここで8kHzはサンプリングレートである。
(6)上記(5)で求めた相関値が基準に満たない場合、例えば0.7以下の場合は測定が失敗したとみなし、ユーザへの告知、あるいは再測定を行う。
以上のような手順で求めた反響音の遅延時間は、もっとも大きな反響成分、すなわち、スピーカからマイクに直接伝わった音の遅延時間に相当し、これは遅延回路14における遅延時間とほぼ一致する。なお、上記各値は説明のための値でこれ以外の値であっても良いが、実験的に良い結果を与えることが確認されている。
図7は、エコーキャンセル装置2による音声遅延時間測定方法の一例を説明するためのフロー図である。まず、エコーキャンセル装置2は、基準信号を生成し(ステップS1)、基準信号の再生(ステップS2)と、マイク入力の録音(ステップS3)を同時に開始する。次に、エコーキャンセル装置2は、録音信号を解析して音声遅延時間を求める。計算時間を短縮するために、解析は粗解析(ステップS4)と解析(ステップS5)の2つの段階に分けて行う。
基準信号は、図8(A)に示すように、トーン信号を31ビット長のM系列で変調した信号である。図8(B)は、図8(A)に示すトーン信号を拡大した図である。
図9は、図7に示したステップS4における粗解析の手順の一例を説明するためのフロー図である。粗解析では基準信号と録音信号をそれぞれエネルギーに変換して処理を行う。
まず、エコーキャンセル装置2は、基準信号をトーン信号の4サイクル程度の間隔(以下、変換区間(step))に区切り、それぞれの区間の実効値を求める(ステップS11)。同様に、録音信号をトーン信号の4サイクル程度の間隔(step)に区切り、それぞれの区間の実効値を求める(ステップS12)。ここで、nは粗解析の結果、基準信号rmsは基準信号の実効値、録音信号rmsは録音信号の実効値、reclenは録音信号のサンプル数、lenは基準信号のサンプル数、rは相関値、rmaxは相関値の最大値とする。相関値rは下記の式(1)により求める。
まず、エコーキャンセル装置2は、基準信号をトーン信号の4サイクル程度の間隔(以下、変換区間(step))に区切り、それぞれの区間の実効値を求める(ステップS11)。同様に、録音信号をトーン信号の4サイクル程度の間隔(step)に区切り、それぞれの区間の実効値を求める(ステップS12)。ここで、nは粗解析の結果、基準信号rmsは基準信号の実効値、録音信号rmsは録音信号の実効値、reclenは録音信号のサンプル数、lenは基準信号のサンプル数、rは相関値、rmaxは相関値の最大値とする。相関値rは下記の式(1)により求める。
図10は、基準信号の実効値への変換例を示す図である。図10(A)は基準信号を示し、図10(B)は図10(A)に示す基準信号の区間毎の実効値を示す。
また、図11は、録音信号の実効値への変換例を示す図である。図11(A)は録音信号を示し、図11(B)は図11(A)に示す録音信号の区間毎の実効値を示す。通常、録音信号は環境により図11(A)のようにひずむ。
また、図11は、録音信号の実効値への変換例を示す図である。図11(A)は録音信号を示し、図11(B)は図11(A)に示す録音信号の区間毎の実効値を示す。通常、録音信号は環境により図11(A)のようにひずむ。
図9において、rmax=0、n=0とし(ステップS13)、i=0,1,・・・,(reclen−len)/step−1とし、ループ開始する(ステップS14)。まず、エコーキャンセル装置2は、図12に示すように、録音信号rmsの区間(i,i+len/step−1)を切り出す(ステップS15)。
次に、エコーキャンセル装置2は、基準信号rmsと切り出した録音信号rmsとの相関値rを式(1)により算出し(ステップS16)、rmax<rであるかどうかを判定する(ステップS17)。rmax<rの場合(YESの場合)、rmax=r、n=iとし(ステップS18)、ループ終了する(ステップS19)。また、ステップS17において、rmax<rでない場合(NOの場合)、ステップS19に移行し、ループ終了する。
相関値が最大となる遅延量を求める処理の演算量は、データ量の自乗に比例するため、このようにデータを間引いて処理することで処理量を大幅に削減することができる。また、M系列で変調したトーン信号を用いることにより、相関値の変化が大きく現れ、ノイズやひずみの大きな環境であっても正確な測定が行える。
図13は、図7に示したステップS5における解析の手順の一例を説明するためのフロー図である。図9に示した粗解析で範囲を絞り込んだ範囲について最終的な解析を行う。ここで、mは最終的な結果であり、m×(サンプリング周期)が求める遅延量である。最大の相関値rmaxは処理の信頼度であり、通常0.8程度以上になる。
まず、rmax=0、m=0とし(ステップS21)、i=(n−2)*step,(n−2)*step+1,・・・,(n+2)*stepとし、ループ開始する(ステップS22)。まず、エコーキャンセル装置2は、録音信号の区間(i,i+len−1)を切り出す(ステップS23)。
次に、エコーキャンセル装置2は、基準信号と切り出した録音信号との相関値rを式(1)により算出し(ステップS24)、rmax<rであるかどうかを判定する(ステップS25)。rmax<rの場合(YESの場合)、rmax=r、m=iとし(ステップS26)、ループ終了する(ステップS27)。また、ステップS25において、rmax<rでない場合(NOの場合)、ステップS27に移行し、ループ終了する。
(第4の実施形態)
図14は、本発明の第4の実施形態に係るエコーキャンセル装置を備えたIP(Internet−Protocol)電話端末の概略構成例を示すブロック図である。以下、前述の図5に示したテレビ電話端末の構成との相違点についてのみ説明する。
図14は、本発明の第4の実施形態に係るエコーキャンセル装置を備えたIP(Internet−Protocol)電話端末の概略構成例を示すブロック図である。以下、前述の図5に示したテレビ電話端末の構成との相違点についてのみ説明する。
IP電話端末21は、エコーキャンセル装置22と、通信ネットワーク3に接続するためのネットワークインタフェース211と、ネットワークプロトコル処理部212と、これらをユーザが操作するための操作入力部209とを備えて構成される。また、エコーキャンセル装置22は、音声情報をデコードする音声デコーダ214と、音声をアナログ信号に変換するDAC215と、音声情報をエンコードする音声エンコーダ216と、音声をデジタル信号に変換するADC217と、エコーキャンセル手段205と、外部に接続された無線伝送装置の接続状態や機種を検出する接続・機種検出回路222とから構成される。
ここで、エコーキャンセル手段205は、前述の第1の実施形態〜第3の実施形態に示したいずれかの構成を備えているが、第2の実施形態の映像モードによる遅延時間の設定変更機能は持たないものとする。ただし、接続・機種検出回路222からの情報に基づきケーブル接続状態や外部に接続された機器の機種判別により遅延時間を設定する機能は同様に備える。なお、2つのケーブルがともに接続されているか、いずれか一方でも取り外されているかという判定が、第2の実施形態におけるケーブルが装着されているか否かの判定に相当する。
本実施形態においては、無線伝送装置218と219、ならびに無線伝送装置220と221はそれぞれ組で音声信号を無線伝送する。一般に無線伝送では所定の遅延時間が発生するため、音声遅延が発生するTV1が接続された場合と同様に本発明の有効性が発揮される。
以上説明したように、本発明によれば、テレビジョン装置等の音声出力装置内の音声遅延時間に応じて、エコーキャンセラへ基準入力として与える音声信号の遅延時間を可変にしたため、特殊なエコーキャンセラを使うことなく、一般的なテレビジョン装置を映像表示及び音声出力に利用したテレビ電話システムを構築することができる。
1…テレビジョン装置(TV)、2,22…エコーキャンセル装置、3…通信ネットワーク、11…表示部、12,12L,12R…スピーカ、13…映像処理回路、20…テレビ電話端末、21…IP電話端末、201…動画像デコーダ(映像モード検出手段)、202,215…DAC、202a…映像DAC、202b…音声DAC、203…動画像エンコーダ、204,217…ADC、204a…映像ADC、204b…音声ADC、205…エコーキャンセル手段、205a…エコーキャンセラ、205b…遅延測定回路、14,14L,14R,205c…遅延回路、206…マイクロホン、207…制御部、207a…モード・遅延時間テーブル、208…基準信号発生回路、209…操作入力部、210…ケーブル接続状態・TV機種検出回路、211…ネットワークインタフェース、212…ネットワークプロトコル処理部、213…撮像手段、214…音声デコーダ、216…音声エンコーダ、218,219,220,221…無線伝送装置、222…接続・機種検出回路。
Claims (24)
- 遅延時間を持ち音声を出力する音声出力装置に入力される出力音声信号と、遅延時間を持ち音声を入力するマイクロホンから入力される入力音声信号とを入力とし、前記入力音声信号から前記出力音声信号成分を除去した音声信号をエコーキャンセル出力信号として出力するエコーキャンセラを備えたエコーキャンセル装置において、
前記音声出力装置の遅延時間と、前記マイクロホンの遅延時間とを加えた音声遅延時間に応じて前記出力音声信号を遅延させる遅延手段を備え、該遅延手段の出力を前記エコーキャンセラに入力することを特徴とするエコーキャンセル装置。 - 請求項1に記載のエコーキャンセル装置において、前記音声遅延時間を測定する遅延測定手段と、所定の基準音声信号を前記音声出力装置と前記遅延測定手段へ出力する基準音声信号出力手段とを備え、
前記遅延測定手段は、前記基準音声信号出力手段からの基準音声信号と前記マイクロホンからの入力音声信号とに基づいて前記音声遅延時間を測定し、該測定した音声遅延時間に応じて遅延時間を前記遅延手段に設定することを特徴とするエコーキャンセル装置。 - 請求項2に記載のエコーキャンセル装置において、前記基準音声信号は、M系列で変調したトーン信号であることを特徴とするエコーキャンセル装置。
- 請求項2に記載のエコーキャンセル装置において、入力映像情報の映像モードを検出する映像モード検出手段を備え、
前記遅延測定手段は、前記映像モード検出手段により検出された映像モードが変化したときに、前記音声遅延時間を測定することを特徴とするエコーキャンセル装置。 - 請求項1に記載のエコーキャンセル装置において、入力映像情報の映像モードを検出する映像モード検出手段と、前記音声遅延時間を映像モード毎に記憶した記憶手段とを備え、
前記映像モード検出手段により検出された映像モードに応じた音声遅延時間を前記記憶手段から選択し、該選択した音声遅延時間に応じた遅延時間を前記遅延手段に設定することを特徴とするエコーキャンセル装置。 - 請求項2に記載のエコーキャンセル装置において、前記音声出力装置あるいは前記マイクロホンの少なくとも一方の機種を検出する機種検出手段を備え、
前記遅延測定手段は、前記機種検出手段により検出された機種の少なくとも一方が変化したときに、前記音声遅延時間を測定することを特徴とするエコーキャンセル装置。 - 請求項1に記載のエコーキャンセル装置において、前記音声出力装置あるいは前記マイクロホンの少なくとも一方の機種を検出する機種検出手段と、前記音声遅延時間を機種毎に記憶した記憶手段とを備え、
前記機種検出手段により検出された機種に応じた音声遅延時間を前記記憶手段から選択し、該選択した音声遅延時間に応じた遅延時間を前記遅延手段に設定することを特徴とするエコーキャンセル装置。 - 請求項2に記載のエコーキャンセル装置において、入力映像情報の映像モードを検出する映像モード検出手段と、前記音声出力装置あるいは前記マイクロホンの少なくとも一方の機種を検出する機種検出手段とを備え、
前記遅延測定手段は、前記映像モード検出手段により検出された映像モードあるいは前記機種検出手段により検出された機種の少なくとも一方が変化したときに、前記音声遅延時間を測定することを特徴とするエコーキャンセル装置。 - 請求項1に記載のエコーキャンセル装置において、入力映像情報の映像モードを検出する映像モード検出手段と、前記音声出力装置あるいは前記マイクロホンの少なくとも一方の機種を検出する機種検出手段と、前記音声遅延時間を、映像モード及び機種の組み合わせ毎に記憶した記憶手段とを備え、
前記映像モード検出手段により検出された映像モード及び前記機種検出手段により検出された機種の組み合わせに応じた音声遅延時間を前記記憶手段から選択し、該選択した音声遅延時間に応じた遅延時間を前記遅延手段に設定することを特徴とするエコーキャンセル装置。 - 請求項2に記載のエコーキャンセル装置において、前記音声出力装置あるいは前記マイクロホンの少なくとも一方の着脱を検出する接続状態検出手段を備え、
前記遅延測定手段は、前記接続状態検出手段により前記音声出力装置と前記マイクロホンとの両方の接続が検出されたときに、前記音声遅延時間を測定することを特徴とするエコーキャンセル装置。 - 請求項1乃至10のいずれか1項に記載のエコーキャンセル装置において、前記エコーキャンセラは、前記マイクロホンから入力された入力音声信号から、前記遅延手段で遅延させた出力音声信号を減算することを特徴とするエコーキャンセル装置。
- 遅延時間を持ち音声を出力する音声出力装置に入力される出力音声信号と、遅延時間を持ち音声を入力するマイクロホンから入力される入力音声信号とを入力とし、前記入力音声信号から前記出力音声信号成分を除去した音声信号をエコーキャンセル出力信号として出力するエコーキャンセラを備えたエコーキャンセル装置において、
入力音声情報を少なくとも2つの音声信号に復号し、該復号した一方の音声信号を前記音声出力装置へ、他方の音声信号を前記エコーキャンセラへ出力するデコーダと、該デコーダが出力する前記2つの音声信号の出力タイミングを制御する制御手段とを備え、
前記制御手段は、前記デコーダを制御して、前記エコーキャンセラに出力する音声信号を、前記音声出力装置の遅延時間と、前記マイクロホンの遅延時間とを加えた音声遅延時間に応じて遅延させることを特徴とするエコーキャンセル装置。 - 請求項12に記載のエコーキャンセル装置において、前記デコーダからの音声信号と前記マイクロホンからの入力音声信号とを入力とするエンコーダを備え、
前記制御手段は、前記エンコーダに入力された音声信号と入力音声信号との時間差を求めることにより、音声遅延時間を測定し、該測定された音声遅延時間に応じて音声信号を遅延させることを特徴とするエコーキャンセル装置。 - 請求項13に記載のエコーキャンセル装置において、前記制御手段は、前記音声遅延時間を測定する際に、前記デコーダから出力されて前記エコーキャンセラに入力される音声信号を無音に固定することを特徴とするエコーキャンセル装置。
- 請求項12乃至14のいずれか1項に記載のエコーキャンセル装置において、前記エコーキャンセラは、前記マイクロホンから入力された入力音声信号から、前記デコーダで遅延させた音声信号を減算することを特徴とするエコーキャンセル装置。
- 請求項1乃至15のいずれか1項に記載のエコーキャンセル装置において、前記音声出力装置は、テレビジョン装置であることを特徴とするエコーキャンセル装置。
- 請求項1乃至16のいずれか1項に記載のエコーキャンセル装置と、ネットワークに接続するためのインタフェース手段と、利用者を撮影して映像信号を入力するための撮像手段と、映像信号を出力する映像出力手段とを備えていることを特徴とするテレビ電話端末。
- 遅延時間を持ち音声を出力する音声出力装置に入力される出力音声信号と、遅延時間を持ち音声を入力するマイクロホンから入力される入力音声信号とを入力とし、前記入力音声信号から前記出力音声信号成分を除去した音声信号をエコーキャンセル出力信号として出力するエコーキャンセラを備えたエコーキャンセル装置のエコーキャンセル方法において、
前記音声出力装置の遅延時間と、前記マイクロホンの遅延時間とを加えた音声遅延時間に応じて前記出力音声信号を遅延させるステップと、該遅延させた音声信号を前記エコーキャンセラに入力するステップとを有することを特徴とするエコーキャンセル方法。 - 請求項18に記載のエコーキャンセル方法において、所定の基準音声信号を前記音声出力装置に出力すると共に、前記音声遅延時間を測定する音声遅延手段へ出力するステップと、前記基準音声信号と前記マイクロホンからの入力音声信号とに基づいて前記音声遅延時間を測定するステップと、該測定された音声遅延時間に応じて遅延時間を設定するステップとを有することを特徴とするエコーキャンセル方法。
- 請求項19に記載のエコーキャンセル方法において、前記基準音声信号は、M系列で変調したトーン信号であることを特徴とするエコーキャンセル方法。
- 遅延時間を持ち音声を出力する音声出力装置に入力される出力音声信号と、遅延時間を持ち音声を入力するマイクロホンから入力される入力音声信号とを入力とし、前記入力音声信号から前記出力音声信号成分を除去した音声信号をエコーキャンセル出力信号として出力するエコーキャンセラを備えたエコーキャンセル装置のエコーキャンセル方法において、
デコーダに入力された入力音声情報を少なくとも2つの音声信号に復号し、該復号した一方の音声信号を前記音声出力装置へ、他方の音声信号を前記エコーキャンセラへ出力する際に、前記2つの音声信号の出力タイミングを制御して、前記エコーキャンセラに出力する音声信号を、前記音声出力装置の遅延時間と、前記マイクロホンの遅延時間とを加えた音声遅延時間に応じて遅延させるステップを有することを特徴とするエコーキャンセル方法。 - 請求項21に記載のエコーキャンセル方法において、前記デコーダからの音声信号と前記マイクロホンからの入力音声信号とを入力するステップと、該入力された音声信号と入力音声信号との時間差を求めることにより、音声遅延時間を測定するステップとを有することを特徴とするエコーキャンセル方法。
- 請求項22に記載のエコーキャンセル方法において、前記音声遅延時間を測定する際に、前記デコーダから出力されて前記エコーキャンセラに入力される音声信号を無音に固定することを特徴とするエコーキャンセル方法。
- 請求項18乃至23のいずれか1項に記載のエコーキャンセル方法において、前記音声出力装置は、テレビジョン装置であることを特徴とするエコーキャンセル方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006033740A JP2007214976A (ja) | 2006-02-10 | 2006-02-10 | エコーキャンセル装置、テレビ電話端末、及びエコーキャンセル方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006033740A JP2007214976A (ja) | 2006-02-10 | 2006-02-10 | エコーキャンセル装置、テレビ電話端末、及びエコーキャンセル方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007214976A true JP2007214976A (ja) | 2007-08-23 |
Family
ID=38493005
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006033740A Pending JP2007214976A (ja) | 2006-02-10 | 2006-02-10 | エコーキャンセル装置、テレビ電話端末、及びエコーキャンセル方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007214976A (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010119636A (ja) * | 2008-11-20 | 2010-06-03 | Universal Entertainment Corp | 遊技機 |
JP2012142910A (ja) * | 2010-12-15 | 2012-07-26 | Panasonic Corp | 通信装置および通信方法 |
JP2013115782A (ja) * | 2011-11-30 | 2013-06-10 | Toshiba Corp | 電子機器及び音声出力方法 |
KR101280964B1 (ko) | 2011-06-17 | 2013-07-02 | 주식회사 디엠티 | 영상통화를 위한 에코제거 기능을 가진 셋톱박스 |
US8861711B2 (en) | 2011-07-11 | 2014-10-14 | Panasonic Corporation | Echo cancellation apparatus, conferencing system using the same, and echo cancellation method |
JPWO2014115290A1 (ja) * | 2013-01-25 | 2017-01-26 | 株式会社日立製作所 | 信号処理装置・音響処理システム |
JP2017123648A (ja) * | 2016-12-20 | 2017-07-13 | ソニー株式会社 | オーディオ機器 |
US9851937B2 (en) | 2014-10-14 | 2017-12-26 | Samsung Electronics Co., Ltd. | Electronic device, method of controlling volume of the electronic device, and method of controlling the electronic device |
CN111613238A (zh) * | 2020-05-21 | 2020-09-01 | 北京百度网讯科技有限公司 | 信号之间延时的确定方法、装置、设备以及存储介质 |
CN113014978A (zh) * | 2021-02-18 | 2021-06-22 | 四川长虹电器股份有限公司 | 提高电视远场语音激活率的方法、计算机设备、存储介质 |
-
2006
- 2006-02-10 JP JP2006033740A patent/JP2007214976A/ja active Pending
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010119636A (ja) * | 2008-11-20 | 2010-06-03 | Universal Entertainment Corp | 遊技機 |
JP2012142910A (ja) * | 2010-12-15 | 2012-07-26 | Panasonic Corp | 通信装置および通信方法 |
KR101280964B1 (ko) | 2011-06-17 | 2013-07-02 | 주식회사 디엠티 | 영상통화를 위한 에코제거 기능을 가진 셋톱박스 |
US8861711B2 (en) | 2011-07-11 | 2014-10-14 | Panasonic Corporation | Echo cancellation apparatus, conferencing system using the same, and echo cancellation method |
JP2013115782A (ja) * | 2011-11-30 | 2013-06-10 | Toshiba Corp | 電子機器及び音声出力方法 |
US8751705B2 (en) | 2011-11-30 | 2014-06-10 | Kabushiki Kaisha Toshiba | Electronic device and audio output method |
US8909828B2 (en) | 2011-11-30 | 2014-12-09 | Kabushiki Kaisha Toshiba | Electronic device and audio output method |
JPWO2014115290A1 (ja) * | 2013-01-25 | 2017-01-26 | 株式会社日立製作所 | 信号処理装置・音響処理システム |
US10310807B2 (en) | 2014-10-14 | 2019-06-04 | Samsung Electronics Co., Ltd. | Electronic device, method of controlling volume of the electronic device, and method of controlling the electronic device |
US9851937B2 (en) | 2014-10-14 | 2017-12-26 | Samsung Electronics Co., Ltd. | Electronic device, method of controlling volume of the electronic device, and method of controlling the electronic device |
JP2017123648A (ja) * | 2016-12-20 | 2017-07-13 | ソニー株式会社 | オーディオ機器 |
CN111613238A (zh) * | 2020-05-21 | 2020-09-01 | 北京百度网讯科技有限公司 | 信号之间延时的确定方法、装置、设备以及存储介质 |
JP2021100261A (ja) * | 2020-05-21 | 2021-07-01 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッドBeijing Baidu Netcom Science Technology Co., Ltd. | 信号間レイテンシの決定方法、装置、機器、及び記憶媒体 |
JP7261250B2 (ja) | 2020-05-21 | 2023-04-19 | 阿波▲羅▼智▲聯▼(北京)科技有限公司 | 信号間レイテンシの決定方法、装置、機器、及び記憶媒体 |
CN111613238B (zh) * | 2020-05-21 | 2023-09-19 | 阿波罗智联(北京)科技有限公司 | 信号之间延时的确定方法、装置、设备以及存储介质 |
CN113014978A (zh) * | 2021-02-18 | 2021-06-22 | 四川长虹电器股份有限公司 | 提高电视远场语音激活率的方法、计算机设备、存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2007214976A (ja) | エコーキャンセル装置、テレビ電話端末、及びエコーキャンセル方法 | |
CN101783828B (zh) | 声音信号调节装置、程序和方法以及电话装置 | |
JP5206234B2 (ja) | 雑音抑圧装置、携帯電話機、雑音抑圧方法及びコンピュータプログラム | |
US20100183163A1 (en) | Sound signal processor and delay time setting method | |
JP5168162B2 (ja) | 音信号調整装置、プログラム及び方法、並びに、電話装置 | |
JP2007325073A (ja) | エコーキャンセル回路、音響装置、ネットワークカメラ、及びエコーキャンセル方法 | |
KR20080009602A (ko) | 골전도 오디오 송수신 장치 및 그 방법 | |
JP2011176638A (ja) | 通信端末及び通信方法 | |
JP3964325B2 (ja) | 通話システムおよび通信機 | |
JP2008311876A (ja) | 電話機能付きテレビジョン装置、テレビジョンシステムおよび雑音信号の除去方法 | |
JP2000115351A (ja) | 音響エコーキャンセラを備えた通信システム | |
JP2011193374A (ja) | 遠隔会議装置及び遠隔会議方法 | |
JP2006211570A (ja) | 撮影装置 | |
JP6165583B2 (ja) | インターホンシステム | |
JP5745475B2 (ja) | エコー消去方法とそのシステムと各装置 | |
JP2009153053A (ja) | 音声推定方法及びそれを用いた携帯端末 | |
JP5189515B2 (ja) | インターホンシステム | |
WO2019159968A1 (ja) | 通信伝送装置及び通信伝送装置の音声品質判定方法 | |
JP2011055103A (ja) | 集合住宅インターホンシステム | |
JP4622657B2 (ja) | 集合住宅用インターホンシステム | |
JP5204378B2 (ja) | 端末装置およびエコーキャンセル方法 | |
JP4561773B2 (ja) | 拡声通話システム | |
JP2010168155A (ja) | エレベータの非常用通話装置 | |
JPH0774680A (ja) | 音響エコーキャンセラ | |
JP2009124386A (ja) | 音声信号処理装置、音声信号処理方法 |