JP2016116036A

JP2016116036A - 音響制御装置、音響装置、通信装置及び音響制御方法

Info

Publication number: JP2016116036A
Application number: JP2014252153A
Authority: JP
Inventors: 嵩大平松; Takahiro Hiramatsu
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 2014-12-12
Filing date: 2014-12-12
Publication date: 2016-06-23

Abstract

【課題】音質が劣化するのを抑制できる音響制御装置を提供する。【解決手段】音響制御装置２００は、スピーカから出力される音及びマイクから入力された音に対して音響処理を施すイコライザ２０４を含む音響処理部と、スピーカから出力されマイクから入力されたテスト音に関する高調波歪率（音響パラメータ）を測定する高調波歪率測定部２１０（測定部）と、該高調波歪率測定部２１０での測定結果に基づいて音響処理部を制御するコントローラ２１２（制御部）と、を備えている。この場合、音質が劣化するのを抑制できる【選択図】図５

Description

本発明は、音響制御装置、音響装置、通信装置及び音響制御方法に係り、更に詳しくは、音響処理を行う音響制御装置、該音響制御装置を備える音響装置、前記音響制御装置を備える通信装置、及び音響処理を行う音響制御方法に関する。

従来、スピーカから出力される音やマイクから入力された音の特性を自動で調整可能な音調整装置が知られている（例えば特許文献１参照）。

しかしながら、特許文献１に開示されている音調整装置では、音質が劣化するのを抑制できなかった。

本発明は、スピーカから出力される音及びマイクから入力された音の少なくとも一方に対して音響処理を施す音響処理部と、前記スピーカから出力され前記マイクから入力されたテスト音に関する音響パラメータを測定する測定部と、前記測定部での測定結果に基づいて前記音響処理部を制御する制御部と、を備える音響制御装置である。

これによれば、音質が劣化するのを抑制できる。

一実施形態に係るテレビ会議装置の内部透視図である。テレビ会議装置の制御の構成を概略的に示すブロック図である。画像入力ユニットの動作を説明するための図（その１）である。画像入力ユニットの動作を説明するための図（その２）である。音響制御装置の概略構成を示すブロック図である。図６（Ａ）及び図６（Ｂ）は、それぞれ高調波歪について説明するための図（その１及びその２）である。図７（Ａ）及び図７（Ｂ）は、それぞれ歪成分を含む音声信号及び歪成分を含まない音声信号の信号レベルの周波数特性を示すグラフである。複数のテレビ会議装置を含む会議システムの概略構成を示す図である。テレビ会議装置を用いるテレビ会議について説明するための図である。音響制御装置のコントローラによる制御を説明するためのフローチャートである。発信信号の周波数の時間特性を示すグラフである。入力音信号の所定周波数帯における高調波歪率の一例を示すグラフである。発信信号の信号レベルの周波数特性を示すグラフである。変形例１の音響制御装置のコントローラによる制御を説明するためのフローチャートである。受信信号の周波数の時間特性を示すグラフである。変形例２の音響制御装置の概略構成を示す図である。変形例２の音響制御装置のコントローラによる制御を説明するためのフローチャートである。変形例３の音響制御装置のコントローラによる制御を説明するためのフローチャートである。変形例４の音響制御装置の概略構成を示す図である。変形例４の音響制御装置のコントローラによる制御を説明するためのフローチャートである。変形例５の音響制御装置のコントローラによる制御を説明するためのフローチャートである。図２２（Ａ）は、変形例６の音響制御装置の概略構成を示す図であり、図２２（Ｂ）は、変形例７の音響制御装置の概略構成を示す図である。

以下、一実施形態を図１〜図１３に基づいて説明する。図１には、一実施形態に係る通信装置としてのテレビ会議装置の不使用状態における上面図（内部透視図）が示されている。テレビ会議装置１０は、不使用状態において、全体として、薄い略直方体形状（略平板状）の外形を有している。図１では、テレビ会議装置１０は、例えば机、テーブルなどの上面（載置面）上に水平面に平行に載置されている。以下、テレビ会議装置１０の長手方向をＸ軸方向、水平面内でＸ軸方向に直交する方向をＹ軸方向、Ｘ軸及びＹ軸方向に直交する方向（鉛直方向）をＺ軸方向として説明する。

テレビ会議装置１０は、一例として、図１及び図２に示されるように、筐体２５、制御装置２４、カメラ１６を含む画像入力ユニット１９、スピーカ１８ａを含む音出力装置１８、マイク２０ａを含む音入力装置２０、ファン２１ｃを含む冷却系２１などを備えている。

筐体２５は、一例として、薄型の箱形中空部材（略直方体形状の部材）から成る。筐体２５は、図１に示されるように、平面視で、例えばほぼＡ４版サイズの矩形の外形を有し、その厚さが、概ね一定（例えば１５ｍｍ〜４５ｍｍ）となっている。

また、一例として、図１に示されるように、筐体２５の上壁の−Ｙ側の端部近傍には、Ｘ軸方向のほぼ全域に亘って延び、Ｘ軸方向を長手方向とする平面視矩形の＋Ｚ側及び−Ｘ側に開口する凹部３１が形成されている。

また、一例として、筐体２５の上壁は、凹部３１の＋Ｙ側に、複数の操作部材が設けられた操作パネル部２５ａを有する。操作パネル部２５ａ及び複数の操作部材については、後述する。

また、一例として、筐体２５の＋Ｙ側の側壁（前壁）のＸ軸方向中間部には、後述するメインボード１２に実装される、例えばＵＳＢフラッシュメモリ等の記録メディアＭや外部機器との間の入出力用の２つのＵＳＢ端子４９、及び通信用のＬＡＮ端子５１が嵌め込まれている（図３参照）。

また、一例として、筐体２５の−Ｙ側の側壁（後壁）には、後述するメインボード１２に実装される画像出力端子、通信用のＬＡＮ端子などが嵌め込まれている。また、筐体２５の−Ｘ側の側壁には、電源ジャック６０が嵌め込まれている（図３参照）。

図１に戻り、操作パネル部２５ａには、そのＸ軸方向中央に、−Ｙ側から＋Ｙ側にかけて、上述した複数の操作部材としての電源ボタン３５、回線ボタン３７及び決定ボタン３９が、この順に、一列に並べて配置されている。

電源ボタン３５は、テレビ会議装置１０に対する電源のＯＮ／ＯＦＦを切り換えるために用いられる操作部材である。

また、操作パネル部２５ａにおける電源ボタン３５に隣接する箇所（電源ボタン３５の−Ｘ側近傍）には、電源のＯＮ／ＯＦＦに応じて点灯／消灯する小型の確認用ランプ４２が取り付けられている。

回線ボタン３７は、インターネットを介して双方向通信中の相手側とのインターネット回線を切断するために用いられる操作部材である。

決定ボタン３９は、例えばプロジェクタＰ（図９参照）によりスクリーンＳ上に表示されるメニュー画面内においてカーソル４０が操作されることにより選択された項目を決定するための操作部材である。カーソル４０は、決定ボタン３９の周囲に配置されている。

また、操作パネル部２５ａにおけるカーソル４０の＋Ｘ側には、操作部材としてのメニューボタン４５が配置されている。メニューボタン４５は、例えばスクリーンＳ上にメニュー画面を呼び出すために用いられる操作部材である。

また、操作パネル部２５ａにおけるカーソル４０の−Ｘ側には、一対のボリュームボタン６２ａ、６２ｂが配置されている。

一対のボリュームボタン６２ａ、６２ｂは、スピーカ１８ａの音量を調整するための操作部材である。一対のボリュームボタン６２ａ、６２ｂのうち、＋Ｘ側のボリュームボタン６２ｂを押圧することで、上記音量を下げることができ、−Ｘ側のボリュームボタン６２ａを押圧することで、上記音量を上げることができる。

また、操作パネル部２５ａにおけるカーソル４０の＋Ｘ側には、マイクミュートボタン６４が配置されている。

マイクミュートボタン６４は、マイク２０ａのＯＮ／ＯＦＦを切り替えるための操作部材である。なお、マイク２０ａがＯＮとは、マイク２０ａにより音声が入力される状態を意味し、マイク２０ａがＯＦＦとは、マイク２０ａにより音声が入力されない状態を意味する。

また、操作パネル部２５ａにおけるマイクミュートボタン６４の＋Ｘ側近傍には、マイク２０ａのＯＮ／ＯＦＦ状態に応じて点灯／消灯が切り替わる小型の確認用ランプ６５が設けられている。

制御装置２４は、音声データ及び画像データにエンコード処理又はデコード処理を施して、通信網（ネットワーク）としてのインターネットを介した音声及び画像の双方向通信を制御する。なお、上述した画像データは、動画または間欠画像（一定時間間隔の静止画像）のデータである。

制御装置２４は、一例として、筐体２５内における操作パネル部２５ａの−Ｚ側に配置され、図２に示されるように、制御用基板としてのメインボード１２、音声処理用及び操作用基板としてのサブボード１３などを含む。

メインボード１２には、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）１０１、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）１０２、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）１０４、フラッシュメモリ１０５、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）１０６、データ入出力Ｉ／Ｆ１０８、ネットワークＩ／Ｆ（Ｉｎｔｅｒｆａｃｅ）１１０、画像入力Ｉ／Ｆ１１２、画像出力Ｉ／Ｆ１１４の各構成要素が、アドレスバス、データバス等のバスライン１１６を介して、双方向通信可能に接続された状態で実装されている。

ＣＰＵ１０１は、所定のプログラム（テレビ会議装置用プログラム）に基づいてテレビ会議装置１０全体の動作を制御する。なお、テレビ会議装置用プログラムに従ったＣＰＵ１０１の命令による、インターネットを介した音声及び画像の双方向通信にかかる一連の動作については後述する。

ＲＯＭ１０２には、ＩＰＬ（ＩｎｉｔｉａｌＰｒｏｇｒａｍＬｏａｄｅｒ）等のＣＰＵ１０１の駆動に用いられるプログラムが記憶されている。

ＲＡＭ１０４は、ＣＰＵ１０１のワークエリアとして使用される。

フラッシュメモリ１０５には、通信相手のテレビ会議装置に発信するときに用いられる発信信号データ、及び通信相手のテレビ会議装置から受信したときに用いられる受信信号データが格納されている。

ＨＤＤ１０６は、上記テレビ会議装置用プログラム、画像データ、音声データ等の各種データが記憶される。なお、ＨＤＤに限らず、例えばＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）等を用いてもよい。上記テレビ会議装置用プログラムは、インストール可能な形式又は実行可能な形式のファイルで、例えば記録メディア等の、コンピュータで読み取り可能な記録媒体に記録して流通させるようにしても良い。また、上記テレビ会議装置用プログラムは、ＨＤＤ１０６ではなく、ＲＯＭ１０２に記憶されるようにしてもよい。ＨＤＤ１０６は、ＣＰＵ１０１の制御にしたがってＨＤＤ１０６に対する各種データの読み出し又は書き込みを制御する。

データ入出力Ｉ／Ｆ１０８は、前述したＵＳＢ端子４９を含み、例えばＵＳＢフラッシュメモリ等の記録メディアＭに対するデータの読み出し又は書き込み（記憶）を制御する。記録メディアＭは、ＵＳＢ端子４９に着脱自在となっている。また、記録メディアＭは、ＣＰＵ１０１の制御にしたがってデータの読み出し又は書き込みを行う不揮発性メモリであれば、フラッシュメモリに限らず、ＥＥＰＲＯＭ（ＥｌｅｃｔｒｉｃａｌｌｙＥｒａｓａｂｌｅａｎｄＰｒｏｇｒａｍｍａｂｌｅＲＯＭ）等を用いてもよい。

ネットワークＩ／Ｆ１１０は、ＬＡＮ端子５１（例えばイーサネット（登録商標）端子）を含み、ネットワーク例えば、インターネットに接続され、該インターネットを介した他のテレビ会議装置との間のデータ（画像データ及び音声データ）の入出力を行う。上記イーサネット端子の規格としては、例えば１０Ｂａｓｅ−Ｔ、１００ＢａｓｅＴＸ、１０００ＢａｓｅＴが挙げられる。

画像入力Ｉ／Ｆ１１２は、被写体を撮影したカメラ１６から出力される画像信号を所定の画像データとして取り込む。

画像出力Ｉ／Ｆ１１４は、前述した画像出力端子を含み、テレビ会議を行う相手方の会議装置の宛先や画質調整、出力信号の選択などの操作用アイコン等のメニュー画面、通信網を介して受信されたデータのうちエンコードされた画像データ、及びカメラ１６により入力された画像データを、画像出力端子に接続される例えばモニタ装置、テレビ、プロジェクタＰ（図９参照）などの画像表示装置が受け入れ可能な所定のアナログまたはデジタルの画像信号に変換して出力するようになっている。なお、エンコードされた画像データを所定のコーデックを用いてデコードするのはＣＰＵ１０１による。この所定の画像信号としては、アナログＲＧＢ信号（ＶＧＡ）、コンポーネントビデオ信号、ＨＤＭＩ（登録商標）（Ｈｉｇｈ―ＤｅｆｉｎｉｔｉｏｎＭｕｌｔｉｍｅｄｉａＩｎｔｅｒｆａｃｅ）信号、ＤＶＩ（ＤｉｇｉｔａｌＶｉｄｅｏＩｎｔｅｒａｃｔｉｖｅ）信号が挙げられる。

サブボード１３には、一例として、複数の操作部材それぞれに個別に対応する複数の操作端子、音入出力Ｉ／Ｆ１２０、音響制御装置２００の各構成要素が実装されている。上記複数の操作端子、音入出力Ｉ／Ｆ１２０、音響制御装置２００は、バスライン１１６を介して、互いに双方向通信可能に接続され、かつメインボード１２に実装された上記各構成要素と双方向通信可能に接続されている。

音響制御装置２００は、音を拾った（入力した）マイク２０ａで変換された音信号を音入出力Ｉ／Ｆ１２０を介して取り込み、音響処理を施し、ネットワークＩ／Ｆ１１０に送信するとともに、ネットワークＩ／Ｆ１１０で受信された他拠点（他のテレビ会議装置）からの音声信号に音響処理を施し、音入出力Ｉ／Ｆ１２０を介してスピーカ１８ａに送信する。このように、音響制御装置２００、スピーカ１８ａ及びマイク２０ａを含んで音響装置が構成されている。

音響制御装置２００は、図５に示されるように、ノイズキャンセラ２０２、イコライザ２０４、エコーキャンセラ２０６、高調波歪率測定部２１０、コントローラ２１２（マイクロコンピュータ）を含む。

ノイズキャンセラ２０２は、ファン２１ｃの作動に伴って発生する音や環境音などのマイク２０ａから入力されたノイズを除去する。

イコライザ２０４は、スピーカ１８ａに送信される音信号の信号レベルの周波数特性を調整する。

エコーキャンセラ２０６は、他のテレビ会議装置との双方向通信時に、スピーカ１８ａから出力された音がマイク２０ａから入力され、該他のテレビ会議装置との間で音波のループを形成して発生するエコーをキャンセル（抑制、除去）する。

高調波歪率測定部２１０、コントローラ２１２については、後述する。

画像入力ユニット１９は、図３及び図４から分かるように、カメラ１６に加えて、カメラ１６が収容されるカメラハウジング６３と、該カメラハウジング６３を二軸のトルクヒンジを介して一端部に保持する細長い扁平の中空部材から成るアーム３４を有している。アーム３４の他端部は、該アーム３４の短手方向（Ｙ軸方向）を軸方向とする一軸のトルクヒンジを介して筐体２５に接続されている。

以上のように構成される画像入力ユニット１９は、筐体２５の−Ｙ側の端部に形成された凹部３１内に収容される収容位置（図１参照）と、凹部３１内から突出する突出位置（図３及び図４参照）との間で筐体２５に対してＹ軸周りに回動可能となっている。なお、一軸のトルクヒンジには、画像入力ユニット１９を収容位置から突出位置に向けて付勢する弾性部材（例えばねじりコイルばね）が設けられている。

ここで、操作パネル部２５ａの−Ｙ側の端部のＸ軸方向中央には、画像入力ユニット１９を筐体２５に係止するための、係止解除ボタン３２ａを含む係止装置が設けられている（図３参照）。

すなわち、画像入力ユニット１９は、収容位置に位置するとき、上記係止装置によって筐体２５に機械的に係止されている。このとき、係止解除ボタン３２ａが押し下げられると、画像入力ユニット１９の筐体２５に対する係止が解除され、上記弾性部材の作用により、画像入力ユニット１９がポップアップする（図３参照）。そこで、画像入力ユニット１９を掴んでＹ軸周りに所望の角度回動させることができる。回動された画像入力ユニット１９から手を離すと、一軸のトルクヒンジの作用により、画像入力ユニット１９は、その位置でホールドされる。

また、画像入力ユニット１９では、カメラハウジング６３は、二軸のトルクヒンジの作用により、アーム３４に対して該アーム３４の長手方向に平行な軸周り及び該軸に直交する軸周りに独立に回動可能となっている。回動されたカメラハウジング６３から手を離すと、二軸のトルクヒンジの作用により、カメラハウジング６３は、その位置でホールドされる。

カメラ１６は、撮影レンズ１６ａを介して被写体としての対象物（例えばユーザ、書画等）の画像を取り込み、取り込まれた画像を画像信号（電気信号）に変換して画像入力Ｉ／Ｆ１１２に出力する（図２参照）。カメラ１６の撮像素子としては、例えばＣＣＤ、ＣＭＯＳなどが用いられている。

撮影レンズ１６ａとしては、一例として、水平方向の視野角が例えば１２０°で、鉛直方向の視野角が例えば１００°の広角レンズが用いられている。なお、撮影レンズ１６ａの視野角は、適宜変更可能である。

冷却系２１は、制御装置２４のメインボード１２に実装された例えばＣＰＵ１０１などの発熱部が発する熱を筐体２５外に放出することにより、該発熱部を冷却する。

冷却系２１は、一例として、図１に示されるように、ヒートパイプ２１ａ、ヒートシンク２１ｂ、横置き式のファン２１ｃなどを含み、筐体２５に収容されている。

ここで、図１に示されるように、筐体２５の＋Ｘ側の側壁の＋Ｙ側の部分には、Ｚ軸方向に延び、Ｙ軸方向に並んだ複数のスリット状の貫通孔から成る排気口５３が形成されている。また、筐体２５の下壁（−Ｚ側の壁）の＋Ｘ側かつ＋Ｙ側の角部には、複数の貫通孔から成る吸気口が形成されている。

ヒートパイプ２１ａは、その一端部が例えばＣＰＵ１００などに接続され、その中間部がＸＹ平面に平行に延び、その他端部がヒートシンク２１ｂに接続されている。ヒートシンク２１ｂは、例えばＹ軸方向に所定間隔で並ぶ複数の金属製のフィンを含む放熱部材から成り、筐体２５内における排気口５３に隣接する位置に配置されている。そこで、例えばＣＰＵ１００などに発生した熱は、ヒートパイプ２１ａ、ヒートシンク２１ｂに順次伝わり、排気口５３を介して筐体２５外に放出される。

ファン２１ｃは、整流機能を有し、筐体２５内における上記吸気口の直上であって、ヒートシンク２１ｂの−Ｘ側近傍に、その吸気方向が概ね＋Ｚ方向となるように、かつその排気方向が概ね＋Ｘ方向となるように配置されている。

そこで、上記吸気口を介してファン２１ｃにより吸引されたエアは、ヒートシンク２１ｂを経由（通過）して、排気口５３から筐体２５外に排出される。これにより、ヒートシンク２１ｂからの熱の放出（拡散）効果がより一層高められる。

音出力装置１８は、図１に示されるように、スピーカ１８ａに加えて、例えば箱形の中空部材から成るスピーカボックス１８ｂなどを含む。

スピーカ１８ａとしては、例えばフルレンジタイプの丸型スピーカが採用されている。スピーカ１８ａは、音入出力Ｉ／Ｆ１２０（図２参照）に結線されており、該音入出力Ｉ／Ｆ１２０から送信される音信号を音に変換して出力する。

スピーカ１８ａは、音出力方向が概ね上向き（＋Ｚ方向）となるように、スピーカボックス１８ｂの天板部に嵌め込まれている。

ここで、図１に示されるように、操作パネル部２５ａの＋Ｘ側の端における凹部３１に隣接する部分には、スピーカ１８ａから出る音を外部に放出するための複数の貫通孔から成る音放出口４３が形成されている。

スピーカボックス１８ｂは、図１に示されるように、筐体２５内における＋Ｘ側の端であって、凹部３１に隣接する箇所に、スピーカ１８ａが音放出口４３の直下に位置するように配置されている。そこで、スピーカ１８ａから出力された音は、音放出口４３を介してスムーズに（こもることなく）筐体２５外に放出される。

スピーカボックス１８ｂは、シリコンゴム、ウレタンゴム等の弾性部材から成る緩衝部材を介して筐体２５に固定されている。

音入力装置２０は、図１に示されるように、マイク２０ａに加えて、マイク２０ａを筐体２５に保持させるための保持部材２０ｂなどを含む。ここでは、保持部材２０ｂの材料として、例えばプラスチックなどの硬質樹脂が用いられているが、これに特に限定されない。

マイク２０ａとしては、例えば無指向性の小型のマイクが採用されている。マイク２０ａは、音入出力Ｉ／Ｆ１２０（図２参照）に結線されており、入力した音を音信号に変換して音入出力Ｉ／Ｆ１２０に送信する。

マイク２０ａは、音入力方向が概ね−Ｙ方向となるように筐体２５の＋Ｙ側の側壁の内壁面の−Ｘ側の端部に設けられている。このように、マイク２０ａの音入力方向とスピーカ１８ａの音出力方向とは概ね直交している。なお、マイク２０ａとして、例えば概ね−Ｙ方向を音入力方向とする単一指向性のマイクを採用しても良い。

筐体２５の＋Ｙ側の側壁におけるマイク２０ａに対応する箇所には、図３に示されるように、Ｘ軸方向に所定間隔で形成された複数（例えば３つ）の貫通孔から成る音取込口７７が形成されている。そこで、筐体２５外で発生する音（特にテレビ会議装置１０の＋Ｙ側に位置する人の音声）が音取込口７７を介してスムーズにマイク２０ａから入力される。

ところで、一般に、本実施形態のテレビ会議装置１０のような同一筐体にスピーカ及びマイクが搭載された通信装置は、エコーやハウリングを抑制、除去するためのエコーキャンセラを装備している。

通常、スピーカにより再生された音声がマイクにより収音されても、エコーキャンセラの機能により、エコーは除去される。

しかしながら、スピーカによる音声再生時に筐体がビビルと、歪成分を含む音声、すなわち本来の音声に高調波成分（歪成分）が乗った音声がマイクにより収音されることになる。また、筐体以外にも、該筐体に設けられた例えばカメラを含む画像入力ユニット、スピーカを含む音出力装置、マイクを含む音入力装置、ファンを含む冷却系、制御装置等がビビルことでも、本来の音声に高調波成分が乗った音声がマイクにより収音されることになる。

このようなビビリが発生すると、スピーカから出力されマイクから入力された音声が非線形となりエコーを除去しきれなくなる。すなわち、スピーカから出力されマイクから入力された歪成分を含む音声のうち歪成分（高調波成分）のエコーを除去できなくなる。結果として、通信相手にエコーが聞こえてしまう。また、スピーカによる音声再生時に筐体等にビビリが生じると、音が歪んで聞こえるなど、エコー以外の弊害もある。

そこで、イコライザの設定により、信号レベルを調整（チューニング）することが考えられる。

しかしながら、チューニングにより信号レベルを徒に調整すると、本来の音声から周波数特性が大きく変化し、音質が劣化してしまう。

このため、信号レベルをチューニングする周波数範囲及び調整量をできるだけ制限することが望ましい。

そこで、音響制御装置２００では、後に詳述するように、スピーカ１８ａから出力されたテスト音（例えば発信音）がマイク２０ａから入力され該マイク２０ａで変換された入力音信号（音信号）の高調波歪率を高調波歪率測定部２１０で測定し、その測定結果に基づいてコントローラ２１２が音質を極力劣化させないようにイコライザ２０４の調整量の設定を行うことにしている。

ここで、高調波歪率（全高調波歪）について説明する。図６（Ａ）及び図６（Ｂ）には、周波数成分を変えながらステップサイン波（音信号）を再生したときに、その再生音がマイクから入力され変換された入力音信号のスペクトルが示されている。図６（Ａ）及び図６（Ｂ）では、横軸が時間［秒］、縦軸が周波数［Ｈｚ］を表す。

入力音信号に歪成分がなければ、該入力音信号のうち再生信号（上記ステップサイン波）だけが濃く表示されることになる。筐体等にビビリなどが生じると、入力音信号において、再生信号に歪成分として高調波が付加される。なお、図６（Ａ）には歪成分が発生していない場合が示され、図６（Ｂ）には歪成分が発生している場合が示されている。すなわち、図６（Ａ）では、入力音信号には、再生信号の他、環境ノイズのみが含まれている。図６（Ｂ）では、入力音信号には、再生信号の他、環境ノイズ、歪成分（図６（Ｂ）の破線内の成分）が含まれている。図６（Ｂ）における歪成分は、再生信号の倍音成分である。

ここで、高調波歪率、すなわち全高調波歪（ＴｏｔａｌＨａｒｍｏｎｉｃＤｉｓｔｏｒｔｉｏｎ、ＴＨＤ）は、高調波による歪成分と元の信号成分との比を表す値である。入力を正弦波とし、元の信号成分の実行電圧をＶ_１、その整数倍の周波数の高調波成分の実行電圧をそれぞれＶ_２、Ｖ_３、…とすると、高調波歪率（ＴＨＤ）は、次の（１）式で表される。

図７（Ａ）及び図７（Ｂ）には、一例として、入力音信号の５０４Ｈｚでの信号レベルの周波数特性が示されている。図７（Ａ）及び図７（Ｂ）では、横軸が周波数［Ｈｚ］、縦軸が信号レベル［ｄＢ］を表している。図７（Ａ）には、入力音信号に、再生信号の５０４Ｈｚでの成分以外にも歪成分が多く含まれている状態が示されている。図７（Ｂ）には、入力音信号に、再生信号の５０４Ｈｚでの成分のみが含まれている状態が示されている。

高調波歪率測定部２１０は、テスト音（例えば発信音）がマイク２０ａから入力され変換された入力音信号における高調波歪率を測定するものであり、具体的には、ＦＦＴ（高速フーリエ変換）アナライザ、スペクトラムアナライザなどの測定器が挙げられる。高調波歪率測定部２１０は、測定した各高調波成分の実効値と元の信号の実効値から上記（１）式を用いて全高調波歪を計算する。

なお、高調波歪率測定部２１０は、上記測定器そのものでなくても良く、例えば該測定器と同様な機能を有するソフトウエアとこれを実行するマイコンとで構成されても良い。また、高調波歪率測定部２１０は、歪率計やオーディオアナライザであっても良い。

音響機器などでは、高調波歪率を１００倍し、パーセントで表した値が一般に用いられるが、高調波歪率をデシベル（ｄＢ）で表す場合もある。

以下に、複数のテレビ会議装置１０を含む会議システム１００について説明する。この会議システム１００は、図８に示されるように、インターネットに接続された末端の複数（例えば２つ）のルータＲ１と、該複数のルータＲ１それぞれに接続された複数（例えば２つ）のルータＲ２とを有する通信網としてのＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）と、複数のルータＲ２それぞれに接続された複数（例えば３つ）のテレビ会議装置１０及び中継装置４と、インターネットに接続された通信管理装置５と、各テレビ会議装置１０に接続されたプロジェクタＰとを含む。

中継装置４は、所定の制御プログラムに従って、各種機能を実現させるコンピュータであり、通信網の品質（伝送速度）を常時モニタし、その伝送速度に適した解像度の画像データを設定するようになっている。すなわち、この中継装置４は、通信網の状態、テレビ会議装置１０の処理状況などの影響により、双方向通信時のテレビ会議装置１０同士において、画像データと音声データとにずれ（遅延）が生じていないかを常時検知し、音声データと画像データとにずれが生じている場合、高解像度の画像データ、中解像度の画像データ、低解像度の画像データの中から、そのずれが生じているテレビ会議装置１０に対し、最も適した解像度を選択し、相手側のテレビ会議装置１０に送信するようになっている。これにより、通信網の品質が悪化した場合でも、途切れずに動画像の通信が可能になっている。

また、この中継装置４は、画像データと音声データとのずれを解消するために、上述した解像度の変更の他、フレームレートの変更、両者のバランスを重視した解像度及びフレームレートの変更が可能になっている。このように中継装置４は、通信網の品質（伝送速度）を常時モニタし、ずれ検知、解像度の指定など、動画像および音声の転送にかかわる管理を行なっている。

通信管理装置５は、所定の制御プログラムに従って、全てのテレビ会議装置１０を管理するコンピュータであり、全てのテレビ会議装置１０の現在の動作状況（双方向通信中、通信待機中、非通電状態など）の把握、テレビ会議装置１０のデバイス認証、デバイス認証されたテレビ会議装置１０への宛先リストの付与、中継装置４の選定、テレビ会議装置１０同士の双方向通信に対する課金など、テレビ会議装置１０と中継装置４とを一元的に管理する。

以上のように構成される会議システム１００を用いるテレビ会議の一例を、以下に説明する。このテレビ会議は、例えば１２拠点間で、各拠点に配置されたテレビ会議装置１０を用いて行われる（図８参照）。各拠点のユーザ（会議参加者）の人数は、例えば３人とされている（図９参照）。

各拠点の３人のユーザは、図９に示されるように、例えば一室内に配置されたテーブルＴの＋Ｘ側、＋Ｙ側、−Ｘ側にそれぞれテーブルＴ側を向いた状態で着座する。テーブルＴの上面における−Ｙ側の端部には、テレビ会議装置１０が、当初画像入力ユニット１９が収容位置に位置した状態で載置されている。また、テーブルＴの−Ｙ側には、短焦点型のプロジェクタＰが設置され、プロジェクタＰの−Ｙ側かつ＋Ｚ側の斜め上方にはスクリーンＳが張設されている。なお、テレビ会議装置１０に対する電気及び通信に関する配線の接続（例えば、ルータＲ２に有線接続される端子とネットワークＩ／Ｆ１１０との結線、プロジェクタＰと画像出力端子との結線、外部電源と電源ジャック６０との結線など）は、予め行われている。

先ず、ユーザは、係止解除ボタン３２ａを押して、画像入力ユニット１９をポップアップさせ、該画像入力ユニット１９を手動でＹ軸周りに例えば９０°回動させるとともに、カメラハウジング６３をアーム３４に対してＺ軸周りに例えば９０°回動させる。この結果、撮影レンズ１６ａの撮影視野内に、着座した３人のユーザが入る（図９参照）。

次いで、ユーザは、電源ボタン３５を押してテレビ会議装置１０を起動させる。

テレビ会議装置１０が起動されると、冷却系２１のファン２１ｃが駆動され、ＣＰＵ１０１などの発熱部が冷却される。

また、テレビ会議装置１０が起動されると、プロジェクタＰによってスクリーンＳにメニュー画面が表示される。このメニュー画面は、各種調整、会議の開始（双方向通信の開始）等の各項目がアイコンと文字情報で表示される。そこで、ユーザは、カーソル４０を操作して、上記メニュー画面上の会議の開始に関する項目を選択し、決定ボタン３９を押して、会議の開始を決定する。

会議の開始が決定されると、一のテレビ会議装置１０（一拠点のテレビ会議装置１０）は、その旨の信号を、通信網（ＬＡＮ、インターネット）を介して、通信管理装置５に送信する。このとき、通信管理装置５は、一のテレビ会議装置１０に対しデバイス認証を行い、その認証後、一のテレビ会議装置１０に、該一のテレビ会議装置１０以外の他のテレビ会議装置１０（通信管理装置５に登録されているテレビ会議装置１０）の現在の動作状況を示した宛先リストを送信する。このとき、一のテレビ会議装置１０は、この宛先リストを、プロジェクタＰを介してスクリーンＳ上に表示させる。この宛先リストは、直感的な操作が可能なアイコン表示と文字情報とからなり、適宜、更新される。

ここで、一拠点のユーザは、一のテレビ会議装置１０のカーソル４０を操作して、上記宛先リストからテレビ会議（双方向通信）を行いたい他のテレビ会議装置１０（他拠点のテレビ会議装置１０）を選択して、決定ボタン３９を押して決定する。

このとき、一のテレビ会議装置１０では、ＣＰＵ１０１が、選択された他のテレビ会議装置１０に対して発信するとともに、その発信信号を音響制御装置２００に送信する。すなわち、一のテレビ会議装置１０では、フラッシュメモリ１０５に格納された発信信号が読み出され、ネットワークＩ／Ｆ１１０を介して、選択された他のテレビ会議装置１０に対して送信されるとともに音響制御装置２００に送信される。

そこで、音響制御装置２００のコントローラ２１２は、イコライザ設定処理（イコライザ２０４の調整量の設定）を開始する。

音響制御装置２００に送信された発信信号は、後に詳述するようにイコライザ設定処理に用いられ、スピーカ１８ａに送信され、該スピーカ１８ａから発信音が出力される。

このようにして、宛先リスト中の非通電状態でない複数の他のテレビ会議装置１０の中から、双方向通信を行ないたい他のテレビ会議装置１０が選択されると、通信管理装置５は、複数の中継装置４の中から最適な中継装置４を選択する。通常は、一のテレビ会議装置１０と物理的に近い中継装置４が選択されるが、その中継装置４に何らかの不具合がある場合、他の中継装置４が選択される。例えば、図８に示されるように、一のテレビ会議装置１０のＩＰアドレスが（１．２．１．５）の場合、ＩＰアドレスが（１．２．１．２）の中継装置４が選択されるが、その中継装置４がダウンしているときは、ＩＰアドレスが（１．２．２．２）の中継装置４が選択される。なお、ＩＰアドレスは、説明の便宜上、個々のテレビ会議装置１０に割り振られた固有のＩＰアドレスである（図８では、ＩＰアドレスが括弧内の４つの数字で表されている。例えば通信管理装置５は（１．１．１．２））。

通信管理装置５により中継装置４が選択されると、即座に、その中継装置４を介して、ＩＰアドレスに基づいて他のテレビ会議装置１０へ双方向通信の要求（一のテレビ会議装置１０からの発信信号）が送信される。すなわち、他のテレビ会議装置１０は、その双方向通信の要求を受信すると、その要求の容認及び拒否それぞれに関する項目を、プロジェクタＰを介してスクリーンＳ上に映し出されたメニュー画面上に表示するとともに、音響制御装置２００を介してスピーカ１８ａに受信信号を送信する。すなわち、他のテレビ会議装置１０では、フラッシュメモリ１０５に格納された受信信号が読み出され、音響制御装置２００に送信される。音響制御装置２００に送信された受信信号は、スピーカ１８ａに送信され、該スピーカ１８ａから受信音が出力される。なお、上述したような宛先リストから他のテレビ会議装置１０を選択して発信を行う方法に代えて、例えば他のテレビ会議装置１０のＩＰアドレスを直接入力するなどの別の方法で発信を行ってもよい。

そこで、他拠点のユーザは、他のテレビ会議装置１０のカーソル４０及び決定ボタン３９を操作することにより、上記容認及び拒否それぞれに関する項目のうちのいずれかを選択、決定する。

このようにして、上記容認に関する項目が選択、決定されると、一及び他のテレビ会議装置１０間で双方向通信が可能となる。

このとき、中継装置４は、上述したように、通信網の品質（伝送速度）を常時モニタしており、通信網の品質が悪化した場合、現在の解像度より一段下げた解像度の画像データに切り替えた中継、または、フレームレートを下げた中継、または、両者を下げた中継を行なう。通信管理装置５は、テレビ会議装置１０同士の双方向通信の開始と共に、そのテレビ会議装置１０同士の特定、通信時間の計測など、会議システム１００の使用に対する課金のための処理が実行される。

一及び他のテレビ会議装置１０間で双方向通信が開始されると、一のテレビ会議装置１０のカメラ１６で取り込まれた一拠点の３人のユーザの画像が画像入力Ｉ／Ｆ１１２、ネットワークＩ／Ｆ１１０、インターネットを介して他のテレビ会議装置１０に送信され、該他のテレビ会議装置１０に接続されたプロジェクタＰによってスクリーンＳに表示される。また、他のテレビ会議装置１０のカメラ１６で取り込まれた他拠点の３人のユーザの画像が画像入力Ｉ／Ｆ１１２、ネットワークＩ／Ｆ１１０、インターネットを介して一のテレビ会議装置１０に送信され、該一のテレビ会議装置１０に接続されたプロジェクタＰによってスクリーンＳに表示される。

また、一のテレビ会議装置１０のマイク２０ａから入力された一拠点のユーザの音声が、音声入出力Ｉ／Ｆ１２０、音響制御装置２００、ネットワークＩ／Ｆ１１０、インターネットを介して他のテレビ会議装置１０に送信され、該他のテレビ会議装置１０のスピーカ１８ａから出力される。また、他のテレビ会議装置１０のマイク２０ａから入力された他拠点のユーザの音声が、音声入出力Ｉ／Ｆ１２０、音響制御装置２００、ネットワークＩ／Ｆ１１０、インターネットを介して一のテレビ会議装置１０に送信され、該一のテレビ会議装置１０のスピーカ１８ａから出力される。

この際、一及び他のテレビ会議装置１０では、音響制御装置２００において、例えばノイズキャンセラ２０２によるノイズの除去、エコーキャンセラ２０６によるエコーの抑制、除去、イコライザによるイコライジング（音声信号の信号レベルの周波数特性の調整）等の音響処理が行われる。

なお、一のテレビ会議装置１０において、スピーカ１８ａから発信音を出力させたときに、エコーキャンセラ２０６に該発信音の音響経路を学習させるようにしても良い。また、他のテレビ会議装置１０において、スピーカ１８ａから受信音を出力させたときに、エコーキャンセラ２０６に該受信音の音響経路を学習させるようにしても良い。

この場合、テレビ会議開始直後からエコーの発生を抑えることができる。すなわち、エコーキャンセラ２０６は音響経路を学習するためにある程度時間を要するため、このように発信音や受信音を利用して予習させることが有効である。

なお、後に詳述するように、一及び他のテレビ会議装置１０間での双方向通信が開始される時点で、イコライザ設定処理が少なくとも１回行われている。

以上のようにして、複数拠点間での画像データ及び音声データの双方向通信（送受信）によるテレビ会議が行われる。

以下に、本実施形態の音響制御装置２００におけるイコライザ設定処理について、図１０を参照して説明する。図１０のフローチャートは、音響制御装置２００のコントローラ２１２によって実行される処理アルゴリズムに基づいている。ここでの制御は、相手先に発信が行われ、音響制御装置２００に発信信号が送信されたときに開始される。なお、発信信号は、相手先との接続が完了するまでの間、相手先及び音響制御装置２００に繰り返し送信される。

最初のステップＳ１では、スピーカ１８ａに発信信号を送信する。このとき、スピーカ１８ａから発信音が出力（再生）されマイク２０ａから入力（収音）され音信号（入力音信号）に変換される。そして、この入力音信号は、高調波歪率測定部２１０、コントローラ２１２に送られる。なお、ここでは、発信信号は、複数の周波数のトーン信号で構成されている（図１１の黒色成分参照）。そこで、高調波歪率測定部２１０は、上記入力音信号の所定周波数帯（例えば１００Ｈｚ〜１００００Ｈｚ）での高調波歪率を測定し、その測定結果をコントローラ２１２に出力する。

ここで、図１１には、上記入力音信号のスペクトルが示されている。図１１では、横軸が時間［ｓ］、縦軸が周波数［Ｈｚ］を表している。図１１から分かるように、入力音信号のうちビビリが生じている周波数では、発信信号のトーン信号（図１１の濃い成分）以外の成分が歪成分として現れている。

そこで、発信信号には、筐体２５等が元来（筐体２５等の構造上）ビビリ易い周波数を含ませておくことが望ましい。例えば１００Ｈｚ〜１００００Ｈｚの周波数帯における所定周波数（例えば５００Ｈｚ）付近がビビリ易い傾向にある場合には、発信信号には、少なくとも該所定周波数（５００Ｈｚ）の成分が含まれていることが望ましい。

次のステップＳ２では、相手先と接続を完了しているか否か（相手先が上記容認に関する項目を選択、決定しているか否か）を判断する。通常、発信後、相手先と接続が完了するまでには、数秒〜数十秒程度要すると考えられる。ステップＳ２での判断が肯定されると、フローは、終了する。一方、ステップＳ２での判断が否定されると、ステップＳ３に移行する。

ステップＳ３では、上記入力音信号の所定周波数帯（例えば１００Ｈｚ〜１００００Ｈｚ）での高調波歪率を取得する。具体的には、高調波歪率測定部２１０での測定結果を取得する。

次のステップＳ４では、上記入力音信号における所定周波数帯（例えば１００Ｈｚ〜１００００Ｈｚ）全域で高調波歪率が閾値未満であるか否かを判断する。ここでの閾値としては、一例として、１００Ｈｚ〜１０００Ｈｚでは５％に設定され、１０００Ｈｚ〜１００００Ｈｚでは３％に設定されている。ここでは、上記所定周波数帯のうち低周波数帯（１００Ｈｚ〜１０００Ｈｚ）では筐体２５等のビビリによる歪が比較的大きくなる傾向にあるため閾値を高めに設定し、高調波数帯（１０００Ｈｚ〜１００００Ｈｚ）では筐体２５等のビビリによる歪が比較的小さくなる傾向にあるため閾値を低めに設定している。ステップＳ４での判断が肯定されると、ステップＳ５に移行する。一方、ステップＳ４での判断が否定されると、ステップＳ７に移行する。

なお、高調波歪率を測定する所定周波数帯及び閾値は、適宜変更可能である。例えば、図１２に示されるように、所定周波数帯を１００Ｈｚ〜１００００Ｈｚとし、閾値を１００Ｈｚ〜１０００Ｈｚで５％、１０００Ｈｚ〜１００００Ｈｚで３％としても良い。なお、図１２には、３００Ｈｚ〜１００００Ｈｚで高調波歪率が閾値未満の場合が示されている。ここでは、閾値を、所定周波数帯に対して２つ設定しているが、１つのみ設定しても良いし、３つ以上設定しても良い。図１２における縦軸のＤｉｓｔｏｒｔｉｏｎ［％］が高いほど再生信号の倍音成分（歪成分）が多く含まれていると判断できる。

ステップＳ５では、上記入力音信号の信号レベルが所定周波数帯全域で目標値（設計時に予め設定された理想値）に達している否かを判断する。ここでは、目標値は、所定周波数帯（例えば１００Ｈｚ〜１００００Ｈｚ）全域で一定の値に設定されている（図１３参照）。図１３において、理想値と現状の設定値とが乖離している分だけ音質の劣化があると考えられる。ステップＳ５での判断が肯定されると、ステップＳ２に戻る。一方、ステップＳ５での判断が否定されると、ステップＳ６に移行する。

ステップＳ６では、上記入力音信号の信号レベルが目標値よりも小さい周波数での信号レベルを上げるようイコライザ２０４を制御する（具体的には、イコライザ２０４による信号レベルの調整量を設定する）。すなわち、信号レベルが目標値よりも小さい周波数では、ビビリが発生するまでのマージンがあると考えられるため、ゲイン（信号レベル）を上げて目標値に近づける（図１３参照）。イコライザ２０４による信号レベルの調整量は、予め設定した一定量としても良いし、当該周波数での高調波歪率と閾値との差に応じた量（例えばこの差が大きいほど調整量を大きくする）としても良い。なお、図１３には、入力音信号の１００Ｈｚ〜１ｋＨｚでの信号レベルを現状の設定値から上げるようイコライザ２０４が設定される例が示されている。ステップＳ６が実行されると、ステップＳ２に戻る。

ステップＳ７では、上記入力音信号における高調波歪率が閾値以上の周波数の信号レベルを下げるようイコライザ２０４を制御する（具体的には、イコライザ２０４の調整量を設定する）。すなわち、高調波歪率が閾値以上の周波数では、音圧が高いためにビビリが生じていると考えられるため、ゲイン（信号レベル）を下げるよう設定する（図１３参照）。イコライザ２０４による信号レベルの調整量は、予め設定した一定量としても良いし、当該周波数での高調波歪率と閾値との差に応じた量（例えばこの差が大きいほど調整量を大きくする）としても良い。なお、図１３では、入力音信号の１ｋＨｚ〜３．５ｋＨｚでの信号レベルを現状の設定値から下げるようイコライザ２０４が設定される例が示されている。ステップＳ７が実行されると、ステップＳ２に戻る。

なお、ステップＳ３、Ｓ４、Ｓ５、Ｓ６の一連の処理又はステップＳ３、Ｓ４、Ｓ７の一連の処理に要する時間、すなわちイコライザ２０４の設定に要する時間は、発信信号の１サイクルの時間よりも短く、ステップＳ２での判断が肯定されるまでに（テレビ会議開始前に）、該一連の処理（イコライザ２０４の設定）を少なくとも１回行うことが可能である。そこで、発信信号の１サイクルの時間をイコライザ２０４の設定に要する時間よりも十分長く設定することで、相手先との接続が完了するまでに、イコライザ２０４の設定を複数回行うことも可能である。この結果、入力音信号の所定周波数帯での信号レベルを歪みが生じない範囲で目標値（理想値）に極力近づくようにイコライザ２０４を設定できる。

このようにして、テレビ会議開始前にイコライザ２０４の設定が行われることで、テレビ会議中、一のテレビ会議装置１０に他のテレビ会議装置１０から送信された音声信号の所定周波数帯での信号レベルがイコライザ２０４により適正な値（歪みが発生せず理想値に近い値）に調整され、スピーカ１８ａに送信されるため、スピーカ１８ａから歪成分のない高品質な音声が出力される。この場合、スピーカ１８ａから出力された歪成分のない音声がマイク２０ａから入力されてもその音声信号は、エコーキャンセラ２０６で確実に除去されるため、他のテレビ会議装置１０にエコー成分が送られることもない。

削除

なお、テレビ会議終了後も、イコライザ２０４の設定（チューニング結果）を保持しておくことで、次回のテレビ会議の開始時に、ある程度イコライザ２０４の設定がなされた状態とすることができ、例えば相手先との接続が直ぐに行われた場合であっても、音声の劣化が抑制された状態でテレビ会議を行うことができる。

以上説明した本実施形態の音響制御装置２００は、スピーカ１８ａから出力される音及びマイク２０ａから入力された音に対して音響処理を施す音響処理部と、スピーカ１８ａから出力されマイク２０ａから入力されたテスト音（例えば発信音）に関する音響パラメータを測定する測定部（高調波歪率測定部２１０）と、該測定部での測定結果に基づいて音響処理部を制御する制御部（コントローラ２１２）と、を備えている。

また、本実施形態の音響制御方法は、スピーカ１８ａから出力されマイク２０ａから入力されたテスト音（例えば発信音）に関する音響パラメータを測定する工程と、該測定する工程での測定結果に基づいて、スピーカ１８ａから出力される音及びマイク２０ａから入力された音に対して音響処理を施す音響処理部を制御する工程と、を含んでいる。

本実施形態の音響制御装置２００及び音響制御方法では、スピーカ１８ａから出力されたテスト音に関する音響情報を考慮して、スピーカ１８ａから出力される音及びマイク２０ａから入力された音に対して音響処理を施すことができる。

この結果、音質が劣化するのを抑制できる。

詳述すると、音響処理部は、スピーカ１８ａに送信される音信号の信号レベルを調整するイコライザ２０４を含み、音響パラメータは、テスト音（例えば発信音）がマイク２０ａで変換されたテスト音信号（入力音信号）の所定周波数帯での高調波歪率を含む。

この場合、テスト音信号の高調波歪率に基づいてイコライザ２０４が制御されるため、スピーカ１８ａに送信される音信号の信号レベルを適正な値（歪みが発生しない値）に調整できる。

詳述すると、イコライザ２０４の作用によりスピーカ１８ａから歪成分が低減された音が出力されるため、その音を直接聞くユーザにとって音質が良好となる。

また、音響制御装置２００は、テレビ会議毎にイコライザ２０４の設定（チューニング）を行うため、筐体２５や該筐体２５に設けられた部品の経時変化（変形、摩耗、がたつき等）によって、ビビリの程度やビビリの発生する周波数が変化しても、音質の劣化を確実に抑制できる。

すなわち、ビビリの程度やビビリの発生する周波数は、筐体や該筐体に設けられた部品間の僅かな隙間寸法によっても変わるため、個体差が存在する。また、テレビ会議装置１０を使用するにつれ、スピーカ１８ａやファン２１ｃからの振動が継続的に加わり、部品間の寸法が変わるなどすることでもビビリの程度やビビリの発生する周波数が変わることがある。

そこで、テレビ会議装置１０が工場から出荷後、音響制御装置２００によってユーザの実使用直前にイコライザ２０４のチューニングが可能であるため、個体ごとの特性差（個体差）をカバーでき、ユーザへの納品後の個体経時変化に対応可能である。

一方、個体差を考慮しないでイコライザをチューニングしても、個体に最適な特性を実現できない。そこで、全ての個体でエコーなどの音声障害が生じないようにチューニングしようとすると、イコライザでレベルを落とす必要のある周波数帯域が広くなり、また調整量も大きくなるため、より音質劣化につながる。一方、音質劣化を抑えるために、イコライザでの調整箇所（周波数）と調整量を限定すると、全ての個体をカバーできなくなり、程度の悪い個体によってはエコーなどが発生する恐れがあるというトレードオフが生じる。よって、バランスのよい妥協点を探ることが必要になるが、それには多くの台数確認を行いバラつき把握することが必要になり、評価工数や費用が膨大になってしまう。さらに、設計時に周波数特性などの各パラメータを固定することになるため、出荷時には最適な特性に合わせ込めたとしても、ユーザへの納入後に個体のビビリ等の状態が変化した場合には最適な特性を実現できず、エコーなどの発生につながる恐れがある。

また、コントローラ２１２は、高調波歪率測定部２１０での測定結果と閾値とを比較し、その比較結果に基づいてイコライザ２０４を制御するため、所定周波数帯中の調整が必要な周波数でのみ歪成分の大きさに応じて信号レベルを調整できる。この結果、音質を極力劣化させることなく、歪成分を除去できる。

また、コントローラ２１２は、所定周波数帯に高調波歪率の測定結果が閾値以上となる周波数がある場合、該周波数でのテスト音信号（入力音信号）の信号レベルが元の信号レベルよりも低くなるようにイコライザ２０４を制御するため、歪成分を確実に除去できる。

また、コントローラ２１２は、所定周波数帯に高調波歪率の測定結果が閾値以上となる周波数がない場合、かつ所定周波数帯にテスト音信号（入力音信号）の信号レベルが目標値に達していない周波数がある場合、該周波数でのテスト音信号の信号レベルが元の信号レベルよりも高くなるようにイコライザ２０４を制御するため、歪成分を除去しつつ入力音信号の信号レベルを目標値に近づけることができる。

また、本実施形態のテレビ会議装置１０は、音響制御装置２００と、マイク２０ａで変換され音響制御装置２００を介した音信号を通信網（例えばインターネット）を介して送信し、該通信網を介して音信号を受信し、受信した音信号を音響制御装置２００を介してスピーカ１８ａに送信するネットワークＩ／Ｆ１１０を含む通信部と、を備えているため、双方向通信における音声品質を向上できる。

また、テレビ会議装置１０は、スピーカ１８ａと、マイク２０ａと、音響制御装置２００、スピーカ１８ａ、マイク２０ａ及び通信部が設けられた筐体２５とを更に備えているため、音声品質の優れたポータブルなテレビ会議装置１０を実現できる。

また、テレビ会議装置１０では、筐体２５等のビビリを抑制でき、スピーカ１８ａから出力される音声の品質劣化を抑制できる。

また、テスト音は、テレビ会議装置１０が通信網を介して発信するときの発信信号がスピーカ１８ａに送信され出力される発信音であるため、テレビ会議が開始される前に、イコライザ設定処理を完了させることができ、テレビ会議開始直後から、高品質な音声によるテレビ会議を行うことができる。

すなわち、テスト音にテレビ会議装置１０で通常使用される発信音を利用しているため、ユーザに音響調整を意識させることもないし、ユーザにテスト音による不快感を与えることもない。

一方、例えば機器の使用前に設定ボタンを押すことで自動音響調整を働かせる方式では、ユーザに調整の手間をかけさせることになる。また音響調整が働いていることをユーザに意識させ、機器使用前に調整時間を要するため、使い勝手を損なう。更に自動調整時に再生されるテスト信号は一般的にノイズやスイープ音、一定周波数の純音であるためユーザに不快感を与える可能性がある。

なお、上記実施形態では、スピーカ１８ａから出力された発信音がマイク２０ａから入力され変換された入力音信号の高調波歪率に基づいてイコライザ２０４を制御しているが、以下に説明する変形例１のように、スピーカ１８ａから出力された受信音がマイク２０ａから入力され変換された入力音信号の高調波歪率に基づいてイコライザ２０４を制御しても良い。変形例１の音響制御装置は、上記実施形態の音響制御装置２００と同様の構成を有している。

以下に、変形例１の音響制御装置におけるイコライザ設定処理について、図１４を参照して説明する。図１４のフローチャートは、音響制御装置２００のコントローラ２１２によって実行される処理アルゴリズムに基づいている。ここでの制御は、相手先から受信し、音響制御装置に受信信号が送信されたときに開始される。なお、受信信号は、相手先との接続が完了するまでの間、音響制御装置２００に繰り返し送信される。

最初のステップＳ１１では、スピーカ１８ａに受信信号を送信する。このとき、スピーカ１８ａから受信音が出力（再生）されマイク２０ａから入力（収音）され音信号（入力音信号）に変換される。そして、この入力音信号は、高調波歪率測定部２１０、コントローラ２１２に送られる。なお、ここでは、受信信号は、複数の周波数のトーン信号で構成されている（図１５の黒色成分参照）。そこで、高調波歪率測定部２１０は、上記入力音信号の所定周波数帯（例えば１００Ｈｚ〜１００００Ｈｚ）での高調波歪率を測定し、その測定結果をコントローラ２１２に出力する。

受信信号には、筐体２５等が元来（筐体２５等の構造上）ビビリ易い周波数を含ませておくことが望ましい。例えば１００Ｈｚ〜１００００Ｈｚの周波数帯における所定周波数（例えば５００Ｈｚ）付近がビビリ易い傾向にある場合には、受信信号には、少なくとも該所定周波数（５００Ｈｚ）の成分が含まれていることが望ましい。

次のステップＳ１２では、相手先と接続を完了しているか否か（上記容認に関する項目を選択、決定しているか否か）を判断する。通常、受信後、相手先と接続が完了するまでには、数秒〜数十秒程度要すると考えられる。ステップＳ１２での判断が肯定されると、フローは、終了する。一方、ステップＳ１２での判断が否定されると、ステップＳ１３に移行する。

ステップＳ１３では、上記入力音信号の所定周波数帯（例えば１００Ｈｚ〜１００００Ｈｚ）での高調波歪率を取得する。具体的には、高調波歪率測定部２１０での測定結果を取得する。

次のステップＳ１４では、上記入力音信号における所定周波数帯（例えば１００Ｈｚ〜１００００Ｈｚ）全域で高調波歪率が閾値未満であるか否かを判断する。ここでの閾値としては、一例として、１００Ｈｚ〜１０００Ｈｚでは５％に設定され、１０００Ｈｚ〜１００００Ｈｚでは３％に設定されている。ステップＳ１４での判断が肯定されると、ステップＳ１５に移行する。一方、ステップＳ１４での判断が否定されると、ステップＳ１７に移行する。

ステップＳ１５では、上記入力音信号の信号レベルが所定周波数帯（例えば１００Ｈｚ〜１００００Ｈｚ）全域で目標値（設計時に予め設定された理想値）に達している否かを判断する。ここでは、目標値は、所定周波数帯全域で一定の値に設定されている。ステップＳ１５での判断が肯定されると、ステップＳ１２に戻る。一方、ステップＳ１５での判断が否定されると、ステップＳ１６に移行する。

ステップＳ１６では、上記入力音信号の信号レベルが目標値よりも小さい周波数での信号レベルを上げるようイコライザ２０４を制御する（イコライザ２０４による信号レベルの調整量を設定する）。すなわち、信号レベルが目標値よりも小さい周波数では、ビビリが発生するまでのマージンがあると考えられるため、ゲイン（信号レベル）を上げて目標値に近づける。イコライザ２０４による信号レベルの調整量は、予め設定した一定量としても良いし、当該周波数での高調波歪率と閾値との差に応じた量（例えばこの差が大きいほど調整量を大きくする）としても良い。ステップＳ１６が実行されると、ステップＳ１２に戻る。

ステップＳ１７では、上記入力音信号における高調波歪率が閾値以上の周波数の信号レベルを下げるようイコライザ２０４を制御する（イコライザ２０４の調整量を設定する）。すなわち、高調波歪率が閾値以上の周波数では、音圧が高いためにビビリが生じていると考えられるため、ゲイン（信号レベル）を下げるよう設定する。イコライザ２０４による信号レベルの調整量は、予め設定した一定量としても良いし、当該周波数での高調波歪率と閾値との差に応じた量（例えばこの差が大きいほど調整量を大きくする）としても良い。ステップＳ１７が実行されると、ステップＳ１２に戻る。

なお、ステップＳ１３、Ｓ１４、Ｓ１５、Ｓ１６の一連の処理又はステップＳ１３、Ｓ１４、Ｓ１７の一連の処理に要する時間、すなわちイコライザ２０４の設定に要する時間は、受信信号の１サイクルの時間よりも短く、ステップＳ１２での判断が肯定されるまでに（テレビ会議開始前に）、該一連の処理（イコライザ２０４の設定）を少なくとも１回行うことが可能である。そこで、受信信号の１サイクルの時間をイコライザ２０４の設定に要する時間よりも十分長く設定することで、相手先との接続が完了するまでに、イコライザ２０４の設定を複数回行うことも可能である。この結果、入力音信号の所定周波数帯での信号レベルを歪みが生じない範囲で目標値（理想値）に極力近づくようにイコライザ２０４を設定できる。

また、上記実施形態及び変形例１では、他拠点のマイク２０ａから入力され自拠点のスピーカ１８ａに送信される音信号の信号レベルの周波数特性を、自拠点で測定した高調波歪率に基づく設定が行われた自拠点のイコライザ２０４で調整することとしているが、これに限られない。例えば、他拠点のマイク２０ａから入力された音信号の信号レベルの周波数特性を、自拠点で測定した高調波歪率に基づく設定が行われた他拠点のイコライザ２０４で調整し、調整後の音信号を自拠点のスピーカ１８ａに送信することとしても良い。この場合も、上記実施形態及び変形例１と同様の効果が得られる。なお、自拠点で測定した高調波歪率に基づいて他拠点のイコライザ２０４の設定を行うには、自拠点で測定した高調波歪率をそのまま他拠点に送り、該高調波歪率に基づいて他拠点のイコライザ２０４の設定を行っても良いし、自拠点で測定した高調波歪率に基づくイコライザ２０４の設定情報を他拠点に送り、該設定情報を用いてイコライザ２０４の設定を行っても良い。

また、上記実施形態及び変形例１では、音響制御装置は、ノイズキャンセラ２０２、エコーキャンセラ２０６を有しているが、これらの少なくとも一方を有していなくても良い。

なお、上記実施形態の音響制御装置２００では、入力音信号の高調波歪率に基づいてイコライザ２０４を制御しているが、以下に説明する変形例２のように、入力音信号の高調波歪率に基づいてエコーキャンセル装置２１５を制御しても良い。

変形例２の音響制御装置３００では、図１６に示されるように、コントローラ３１２は、高調波歪率測定部２１０での測定結果に基づいてエコーキャンセル装置２１５を制御する。

エコーキャンセル装置２１５は、第１及び第２エコーキャンセラ２１５ａ、２１５ｂを含む。第１及び第２エコーキャンセラ２１５ａ、２１５ｂは、択一的に用いられる。

第１エコーキャンセラ２１５ａは、エコーキャンセル度（エコーキャンセルの強さ）が低めに設定され、エコー除去よりも通話を優先する仕様である。すなわち、第１エコーキャンセラ２１５ａでは、ダブルトーク（双方向同時通話）時に音切れや音声の揺らぎが発生しないが、ダブルトーク時のみならずシングルトーク（一方向通話）時であってもエコーが発生しやすい。

第２エコーキャンセラ２１５ｂは、エコーキャンセル度（エコーキャンセルの強さ）が第１エコーキャンセラ２１５ａよりも高めに設定され、通話よりもエコー除去を優先する仕様である。すなわち、第２エコーキャンセラ２１５ｂでは、シングルトーク時のみならずダブルトーク時であってもエコーが発生しないが、ダブルトーク時に音切れや音声の揺らぎが発生しやすい。

なお、各エコーキャンセラのエコーキャンセル度は、例えば、マイクに戻ってくるエコーを予測して取り除く適応フィルタの係数を変えることで調整できる。

コントローラ３１２は、高調波歪率測定部２１０での測定結果に基づいて、エコーキャンセル装置２１５で用いられるエコーキャンセラとして第１及び第２エコーキャンセラ２１５ａ、２１５ｂのいずれかを選択することで、エコーキャンセル装置２１５におけるエコーキャンセル度を設定する。

以下に、変形例２の音響制御装置３００におけるエコーキャンセル度設定処理について、図１７を参照して説明する。図１７のフローチャートは、音響制御装置３００のコントローラ３１２によって実行される処理アルゴリズムに基づいている。ここでの制御は、相手先に発信が行われ、音響制御装置３００に発信信号が送信されたときに開始される。なお、発信信号は、相手先との接続が完了するまでの間、相手先及び音響制御装置３００に繰り返し送信される。

最初のステップＳ２１では、スピーカ１８ａに発信信号を送信する。このとき、スピーカ１８ａから発信音が出力（再生）されマイク２０ａから入力（収音）され音信号（入力音信号）に変換される。そして、この入力音信号は、高調波歪率測定部２１０、コントローラ２１２に送られる。なお、ここでは、発信信号は、複数の周波数のトーン信号で構成されている（図１１参照）。そこで、高調波歪率測定部２１０は、上記入力音信号の所定周波数帯（例えば１００Ｈｚ〜１０ｋＨｚ）での高調波歪率を測定し、その測定結果をコントローラ３１２に出力する。

次のステップＳ２２では、相手先と接続を完了しているか否か（相手先が上記容認に関する項目を選択、決定しているか否か）を判断する。通常、発信後、相手先と接続が完了するまでには、数秒〜数十秒程度要すると考えられる。ステップＳ２２での判断が肯定されると、フローは、終了する。一方、ステップＳ２２での判断が否定されると、ステップＳ２３に移行する。

ステップＳ２３では、上記入力音信号の所定周波数帯（例えば１００Ｈｚ〜１００００Ｈｚ）での高調波歪率を取得する。具体的には、高調波歪率測定部２１０での測定結果を取得する。

次のステップＳ２４では、上記入力音信号における所定周波数帯（例えば１００Ｈｚ〜１００００Ｈｚ）全域で高調波歪率が閾値未満であるか否かを判断する。ここでの閾値としては、一例として、１００Ｈｚ〜１０００Ｈｚでは５％に設定され、１０００Ｈｚ〜１００００Ｈｚでは３％に設定されている。ステップＳ２４での判断が肯定されると、ステップＳ２５に移行する。一方、ステップＳ２４での判断が否定されると、ステップＳ２６に移行する。

ステップＳ２５では、第１エコーキャンセラ２１５ａを選択する（エコーキャンセル度を低めに設定する）。すなわち、入力音信号における高調波歪率が所定周波数帯全域で閾値未満の場合には、歪成分のエコーが相手先に送信されたとしてもほとんど不快感を与えることがない。そこで、エコーキャンセル度が弱めに設定された第１エコーキャンセラ２１５ａを選択し、タブルトークを可能としている。ステップＳ２５が実行されると、ステップＳ２２に戻る。

ステップＳ２６では、第２エコーキャンセラ２１５ｂを選択する（エコーキャンセル度を高めに設定する）。すなわち、入力音信号における高調波歪率が閾値以上の周波数がある場合には、歪成分のエコーが相手先に送信されると不快感を与えてしまう。そこで、エコーキャンセル度が強めに設定された第２エコーキャンセラ２１５ｂを選択し、通話（特にタブルトーク）よりもエコー除去を優先している。ステップＳ２６が実行されると、ステップＳ２２に戻る。

なお、ステップＳ２３、Ｓ２４、Ｓ２５の一連の処理又はステップＳ２３、Ｓ２４、Ｓ２６の一連の処理に要する時間、すなわちエコーキャンセル度の設定に要する時間は、発信信号の１サイクルの時間よりも短く、ステップＳ２２での判断が肯定されるまでに（テレビ会議開始前に）、該一連の処理（エコーキャンセル度の設定）を少なくとも１回行うことが可能である。

以上のようにして、テレビ会議開始前にエコーキャンセル度の設定が行われることで、テレビ会議中、一のテレビ会議装置１０に他のテレビ会議装置１０から送信される音声信号の歪成分が小さい場合には、高品質な音声でシングルトーク及びダブルトークを行うことができ、該歪成分が大きい場合でも、高品質な音声でシングルトークを行うことができる。

また、テレビ会議中、他のテレビ会議装置１０に一のテレビ会議装置１０から送信される音声信号の歪成分が小さい場合には、高品質な音声でシングルトーク及びダブルトークを行うことができ、該歪成分が大きい場合でも、高品質な音声でシングルトークを行うことができる。

なお、上記変形例２では、スピーカ１８ａから出力された発信音がマイク２０ａから入力され変換された入力音信号の高調波歪率に基づいてエコーキャンセル装置２１５を制御しているが、以下に説明する変形例３のように、スピーカ１８ａから出力された受信音がマイク２０ａから入力され変換された入力音信号の高調波歪率に基づいてエコーキャンセル装置２１５を制御しても良い。変形例３の音響制御装置は、上記変形例２の音響制御装置３００と同様の構成を有している。

以下に、変形例３の音響制御装置におけるエコーキャンセル度設定処理について、図１８を参照して説明する。図１８のフローチャートは、音響制御装置のコントローラ３１２によって実行される処理アルゴリズムに基づいている。ここでの制御は、相手先から受信し、音響制御装置に受信信号が送信されたときに開始される。なお、受信信号は、相手先との接続が完了するまでの間、音響制御装置に繰り返し送信される。

最初のステップＳ３１では、スピーカ１８ａに受信信号を送信する。このとき、スピーカ１８ａから受信音が出力（再生）されマイク２０ａから入力（収音）され音信号（入力音信号）に変換される。そして、この入力音信号は、高調波歪率測定部２１０、コントローラ３１２に送られる。なお、ここでは、受信信号は、複数の周波数のトーン信号で構成されている（図１５参照）。そこで、高調波歪率測定部２１０は、上記入力音信号の所定周波数帯（例えば１００Ｈｚ〜１００００Ｈｚ）での高調波歪率を測定し、その測定結果をコントローラ３１２に出力する。

次のステップＳ３２では、相手先と接続を完了しているか否か（上記容認に関する項目を選択、決定しているか否か）を判断する。通常、受信後、相手先と接続が完了するまでには、数秒〜数十秒程度要すると考えられる。ステップＳ３２での判断が肯定されると、フローは、終了する。一方、ステップＳ３２での判断が否定されると、ステップＳ３３に移行する。

ステップＳ３３では、上記入力音信号の所定周波数帯（例えば１００Ｈｚ〜１００００Ｈｚ）での高調波歪率を取得する。具体的には、高調波歪率測定部２１０での測定結果を取得する。

次のステップＳ３４では、上記入力音信号における所定周波数帯（例えば１００Ｈｚ〜１００００Ｈｚ）全域で高調波歪率が閾値未満であるか否かを判断する。ここでの閾値としては、一例として、１００Ｈｚ〜１０００Ｈｚでは５％に設定され、１０００Ｈｚ〜１００００Ｈｚでは３％に設定されている。ステップＳ３４での判断が肯定されると、ステップＳ３５に移行する。一方、ステップＳ３４での判断が否定されると、ステップＳ３６に移行する。

ステップＳ３５では、第１エコーキャンセラ２１５ａを選択する（エコーキャンセル度を低めに設定する）。すなわち、入力音信号における高調波歪率が所定周波数帯全域で閾値未満の場合には、歪成分のエコーが相手先に送信されたとしてもほとんど不快感を与えることがない。そこで、エコーキャンセル度が弱めに設定された第１エコーキャンセラ２１５ａを選択し、タブルトークを可能としている。ステップＳ３５が実行されると、ステップＳ３２に戻る。

ステップＳ３６では、第２エコーキャンセラ２１５ｂを選択する（エコーキャンセル度を高めに設定する）。すなわち、入力音信号における高調波歪率が閾値以上の周波数がある場合には、歪成分のエコーが相手先に送信されると不快感を与えてしまう。そこで、エコーキャンセル度が強めに設定された第２エコーキャンセラ２１５ｂを選択し、通話（特にタブルトーク）よりもエコー除去を優先している。ステップＳ３６が実行されると、ステップＳ３２に戻る。

なお、ステップＳ３３、Ｓ３４、Ｓ３５の一連の処理又はステップＳ３３、Ｓ３４、Ｓ３６の一連の処理に要する時間、すなわちエコーキャンセル度の設定に要する時間は、受信信号の１サイクルの時間よりも短いため、ステップＳ３２での判断が肯定されるまでに（テレビ会議開始前に）、該一連の処理（エコーキャンセル度の設定）を少なくとも１回行うことが可能である。

また、上記変形例２では、スピーカ１８ａから出力された発信音がマイク２０ａから入力され変換された入力音信号の高調波歪率に基づいてエコーキャンセル装置２１５を制御しているが、以下に説明する変形例４のように、スピーカ１８ａから出力された発信音がマイク２０ａから入力されたときのエコーキャンセル装置２１５のエコーキャンセル処理結果（音響パラメータ）に基づいてエコーキャンセル装置２１５を制御しても良い。

変形例４の音響制御装置４００は、図１９に示されるように、スピーカ１８ａから出力された発信音がマイク２０ａから入力され変換された入力音信号に対するエコーキャンセル装置２１５によるエコーキャンセル処理後の残留エコー（エコーキャンセル処理結果）を測定し、その測定結果をコントローラ４１２に送信する残留エコー測定部２２０を高調波歪率測定部２１０に代えて有している。ここでは、エコーキャンセル装置２１５では、当初、第１エコーキャンセラ２１５ａに設定（初期設定）されている。

詳述すると、残留エコー測定部２２０は、スピーカ１８ａから出力された発信音がマイク２０ａから入力され変換された入力音信号に対する第１エコーキャンセラ２１５ａによるエコーキャンセル処理後の残留エコー（第１エコーキャンセラ２１５ａで除去できなかった歪成分のエコー）を測定する。なお、残留エコーに代えて、第１エコーキャンセラ２１５ａにより除去されたエコー、すなわちエコーキャンセル量を測定しても良いし、第１エコーキャンセラ２１５ａを介した入力音信号の信号レベルを測定しても良い。

コントローラ４１２は、残留エコー測定部２２０での測定結果に基づいて第１及び第２エコーキャンセラ２１５ａ、２１５ｂのいずれかを選択することで、エコーキャンセル装置２１５におけるエコーキャンセル度を設定する。

詳述すると、コントローラ４１２は、第１エコーキャンセラ２１５ａで除去できなかった歪成分のエコー（残留エコー）の信号レベルが閾値（例えば−６０ｄＢｏｖ）未満の場合に第１エコーキャンセラ２１５ａを選択し、該歪成分のエコー（残留エコー）の信号レベルが該閾値（例えば−６０ｄＢｏｖ）以上の場合に第２エコーキャンセラ２１５ｂを選択する。ここでの閾値は、歪成分のエコー（残留エコー）が人に不快感を与えるか否かの境界値近傍を基準に設定されている。

以下に、変形例４の音響制御装置４００におけるエコーキャンセル度設定処理について、図２０を参照して説明する。図２０のフローチャートは、音響制御装置４００のコントローラ４１２によって実行される処理アルゴリズムに基づいている。ここでの制御は、相手先に発信が行われ、音響制御装置４００に発信信号が送信されたときに開始される。なお、発信信号は、相手先との接続が完了するまでの間、相手先及び音響制御装置４００に繰り返し送信される。

最初のステップＳ４１では、スピーカ１８ａに発信信号を送信する。このとき、スピーカ１８ａから発信音が出力（再生）されマイク２０ａから入力（収音）され音信号（入力音信号）に変換される。そして、この入力音信号は、第１エコーキャンセラ２１５ａ、コントローラ４１２に送られる。なお、ここでは、発信信号は、複数の周波数のトーン信号で構成されている（図１１参照）。

次のステップＳ４２では、相手先と接続を完了しているか否か（相手先が上記容認に関する項目を選択、決定しているか否か）を判断する。通常、発信後、相手先と接続が完了するまでには、数秒〜数十秒程度要すると考えられる。ステップＳ４２での判断が肯定されると、フローは、終了する。一方、ステップＳ４２での判断が否定されると、ステップＳ４３に移行する。

ステップＳ４３では、第１エコーキャンセラ２１５ａによる入力音信号に対するエコーキャンセル処理後の残留エコーを測定する。

次のステップＳ４４では、残量エコーが閾値未満か否かを判断する。ステップＳ４４での判断が肯定されると、ステップＳ４５に移行する。一方、ステップＳ４４での判断が否定されると、ステップＳ４６に移行する。

ステップＳ４５では、第１エコーキャンセラ２１５ａを選択する（エコーキャンセル度を低めに設定する）。すなわち、残留エコーが閾値未満の場合には、歪成分のエコーが相手先に送信されたとしてもほとんど不快感を与えることがない。そこで、第１エコーキャンセラ２１５ａを選択し、タブルトークを可能にしている。ステップＳ４５が実行されると、ステップＳ４２に戻る。

ステップＳ４６では、第２エコーキャンセラ２１５ｂを選択する（エコーキャンセル度を高めに設定する）。すなわち、残留エコーが閾値以上の場合には、歪成分のエコーが相手先に送信されると不快感を与えてしまう。そこで、エコーキャンセル度が強めに設定された第２エコーキャンセラ２１５ｂを選択し、通話（特にタブルトーク）よりもエコー除去を優先し、残留エコーを低減している。ステップＳ４６が実行されると、ステップＳ４２に戻る。

なお、ステップＳ４３、Ｓ４４、Ｓ４５の一連の処理又はステップＳ４３、Ｓ４４、Ｓ４６の一連の処理に要する時間、すなわちエコーキャンセル度の設定に要する時間は、発信信号の１サイクルの時間よりも短いため、ステップＳ４２での判断が肯定されるまでに（テレビ会議開始前に）、該一連の処理（エコーキャンセル度の設定）を少なくとも１回行うことが可能である。

以上のようにして、テレビ会議開始前にエコーキャンセル度の設定が行われることで、テレビ会議中、第１エコーキャンセラ２１５ａによるエコーキャンセル処理後の残留エコーが小さい場合には、高品質な音声でシングルトーク及びダブルトークを行うことができ、該残留エコーが大きい場合でも、高品質な音声でシングルトークを行うことができる。

なお、第１エコーキャンセラ２１５ａによるエコーキャンセル処理結果として、残留エコーに代えて、エコーキャンセル量を測定する場合には、測定されたエコーキャンセル量が閾値以上の場合に第１エコーキャンセラ２１５ａを選択し、該閾値未満の場合に第２エコーキャンセラ２１５ｂを選択すれば良い。また、残留エコーに代えて、第１エコーキャンセラ２１５ａを介した入力音信号の信号レベルを測定する場合には、測定された信号レベルが閾値（例えば−６０ｄＢｏｖ）以上の場合に、第２エコーキャンセラ２１５ｂを選択し、該閾値未満の場合に第１エコーキャンセラ２１５ａを選択すれば良い。

なお、上記変形例４では、スピーカ１８ａから出力された発信音がマイク２０ａから入力されたときの第１エコーキャンセラ２１５ａによるエコーキャンセル処理後の残留エコーに基づいて、エコーキャンセル装置２１５を制御しているが、以下に説明する変形例５のように、スピーカ１８ａから出力された受信音がマイク２０ａから入力されたときの第１エコーキャンセラ２１５ａによるエコーキャンセル処理後の残留エコーに基づいて、エコーキャンセル装置２１５を制御しても良い。変形例５の音響制御装置は、変形例４の音響制御装置４００と同様の構成を有している。

以下に、変形例５の音響制御装置におけるエコーキャンセル度設定処理について、図２１を参照して説明する。図２１のフローチャートは、音響制御装置のコントローラ４１２によって実行される処理アルゴリズムに基づいている。ここでの制御は、相手先から受信し、音響制御装置に受信信号が送信されたときに開始される。なお、受信信号は、相手先との接続が完了するまでの間、音響制御装置に繰り返し送信される。

最初のステップＳ５１では、スピーカ１８ａに受信信号を送信する。このとき、スピーカ１８ａから受信音が出力（再生）されマイク２０ａから入力（収音）され音信号（入力音信号）に変換される。そして、この入力音信号は、第１エコーキャンセラ２１５ａ、コントローラ４１２に送られる。なお、ここでは、受信信号は、複数の周波数のトーン信号で構成されている（図１５参照）。

次のステップＳ５２では、相手先と接続を完了しているか否か（上記容認に関する項目を選択、決定しているか否か）を判断する。通常、受信後、相手先と接続が完了するまでには、数秒〜数十秒程度要すると考えられる。ステップＳ５２での判断が肯定されると、フローは、終了する。一方、ステップＳ５２での判断が否定されると、ステップＳ５３に移行する。

ステップＳ５３では、第１エコーキャンセラ２１５ａによる入力音信号に対するエコーキャンセル処理後の残留エコーを測定する。

次のステップＳ５４では、残量エコーが閾値未満か否かを判断する。ステップＳ５４での判断が肯定されると、ステップＳ５５に移行する。一方、ステップＳ５４での判断が否定されると、ステップＳ５６に移行する。

ステップＳ５５では、第１エコーキャンセラ２１５ａを選択する（エコーキャンセル度を低めに設定する）。すなわち、残留エコーが閾値未満の場合には、歪成分のエコーが相手先に送信されたとしてもほとんど不快感を与えることがない。そこで、第１エコーキャンセラ２１５ａを選択し、タブルトークを可能にしている。ステップＳ５５が実行されると、ステップＳ５２に戻る。

ステップＳ５６では、第２エコーキャンセラ２１５ｂを選択する（エコーキャンセル度を高めに設定する）。すなわち、残留エコーが閾値以上の場合には、歪成分のエコーが相手先に送信されると不快感を与えてしまう。そこで、エコーキャンセル度が強めに設定された第２エコーキャンセラ２１５ｂを選択し、通話（特にタブルトーク）よりもエコー除去を優先し、残留エコーを低減している。ステップＳ５６が実行されると、ステップＳ５２に戻る。

なお、ステップＳ５３、Ｓ５４、Ｓ５５の一連の処理又はステップＳ５３、Ｓ５４、Ｓ５６の一連の処理に要する時間、すなわちエコーキャンセル度の設定に要する時間は、受信信号の１サイクルの時間よりも短いため、ステップＳ５２での判断が肯定されるまでに（テレビ会議開始前に）、該一連の処理（エコーキャンセル度の設定）を少なくとも１回行うことが可能である。

なお、上記変形例４及び５では、エコーキャンセル処理結果（残留エコー、エコーキャンセル量、エコーキャンセル装置２１５を介した入力音信号）に基づいてエコーキャンセル装置２１５を制御しているが、エコーキャンセル処理結果に基づいてイコライザ２０４を制御しても良い。具体的には、エコーキャンセル処理結果が閾値未満の場合にイコライザ２０４による信号レベルの調整量を小さく（０を含む）設定し、エコーキャンセル処理結果が閾値以上の場合にイコライザ２０４による信号レベルの調整量を大きくしても良い。

また、上記変形例４及び５では、第１エコーキャンセラ２１５ａによるエコーキャンセル処理結果に基づいてエコーキャンセル装置２１５を制御しているが、これに代えて、第２エコーキャンセラ２１５ｂによるエコーキャンセル処理結果に基づいてエコーキャンセル装置２１５を制御しても良い。

また、上記変形例２〜５では、音響制御装置は、ノイズキャンセラ２０２、イコライザ２０４を有しているが、これらの少なくとも一方を有していなくても良い。

なお、上記変形例２〜５では、エコーキャンセル度を設定するために、第１及び第２エコーキャンセラ２１５ａ、２１５ｂのうちいずれかを選択することとしているが、これに代えて、例えば、単一のエコーキャンセラを用い、該エコーキャンセラの適応フィルタの係数を変化させることとしても良い。

また、上記変形例２〜５では、エコーキャンセル装置は、エコーキャンセル度が互いに異なるエコーキャンセラを２つ有しているが、３つ以上有していても良い。例えば、エコーキャンセル度が第１及び第２エコーキャンセラ２１５ａ、２１５ｂのエコーキャンセル度の間の高さであって、ダブルトークをある程度許容する第３エコーキャンセラ２１５ｃを追加しても良い。そして、第１〜第３エコーキャンセラ２１５ａ〜２１５ｃのいずれか（例えば第３エコーキャンセラ２１５ｃ）を初期設定のエコーキャンセラとし、測定された高調波歪率やエコーキャンセル処理結果に基づいて、初期設定のエコーキャンセラから残りの２つのエコーキャンセラのいずれかに変更するようにしても良い。

なお、上記実施形態及び各変形例では、スピーカ１８ａからテスト音（発信音又は受信音）を出力させ、該テスト音をマイク２０ａから入力しているが、これに限られない。例えば、テレビ会議装置１０に外部スピーカを接続し、該外部スピーカからテスト音を出力させ、該テスト音をマイク２０ａから入力しても良い。また、テレビ会議装置１０に外部マイクを接続し、スピーカ１８ａからテスト音を出力させ、該テスト音を外部マイクから入力しても良い。また、テレビ会議装置１０に外部スピーカ及び外部マイクを接続し、外部スピーカからテスト音を出力させ、該テスト音を外部マイクから入力しても良い。また、テレビ会議装置１０に外部マイクスピーカを接続し、該外部マイクスピーカのスピーカからテスト音を出力させ、該テスト音を外部マイクスピーカのマイクから入力しても良い。

また、テレビ会議装置１０は、スピーカ１８ａ及びマイク２０ａを有しているが、これらの少なくとも一方を有していなくても良い。スピーカ１８ａを有していない場合は、その代わりに外部スピーカ又は外部マイクスピーカを用意することが望ましい。マイク２０ａを有していない場合は、その代わりに外部マイク又は外部マイクスピーカを用意することが望ましい。

以上のように、ユーザがどのような外部音響機器（例えば外部スピーカ、外部マイク、外部マイクスピーカ等）をテレビ会議装置１０に接続するかを事前に把握することが難しく、外部音響機器に合わせたチューニングを事前に行うことは困難である。そこで、テレビ会議装置１０は、上記実施形態及び各変形例の音響制御装置を備えているため、外部音響機器が接続された場合にも、上記実施形態及び各変形例と同様の効果を得ることができる。すなわち、本発明は、通信装置や音響装置に接続された外部音響機器の筐体、内蔵部品等に生じ得るビビリに対しても有効である。

また、上記実施形態及び各変形例では、高調波歪率又は残留エコーを測定し、その測定結果に基づいてイコライザ２０４又はエコーキャンセル装置２１５を制御しているが、要は、高調波歪率及びエコーキャンセル処理結果（残留エコー、エコーキャンセル量、エコーキャンセル装置２１５を介した入力音信号）の少なくとも一方を測定し、これらの測定結果に基づいてイコライザ２０４及びエコーキャンセル装置２１５の少なくとも一方を制御しても良い。

また、エコーキャンセラ２０６やエコーキャンセル装置２１５に加えて、エコーサプレッサを設けても良い。エコーサプレッサは、エコーキャンセラの適応フィルタでの消し残しを小さくする処理を行う。

ところで、テスト音（発信音や受信音）の収音時に、周囲環境ノイズや話し声等を収音してしまうと、高調波歪率の測定精度が落ちる。そこで、図２２（Ａ）に示される変形例６の音響制御装置５００のように、スピーカ１８ａから出力されたテスト音がマイクから入力され変換された入力音信号に対して、ノイズキャンセラ２０２によりノイズ除去処理を施した後、高調波歪率を高調波歪率測定部２１０で測定することとしても良い。また、図２２（Ｂ）に示される変形例７の音響制御装置６００のように、スピーカ１８ａから出力されたテスト音がマイクから入力され変換された入力音信号に対して、音抽出部２０３により音抽出処理（音源分離の処理）を施した後、高調波歪率を高調波歪率測定部２１０で測定することとしても良い。結果として、高調波歪率の測定精度を向上できる。

但し、高調波歪（歪成分）は限られるため、周囲環境ノイズや話し声を収音してしまったとしても、高調波すなわち元の成分の整数倍の信号は限られるため、高調波歪率を測定することは可能である。

また、高調波歪率や残留エコー（又はエコーキャンセル量）の測定値は、イコライザ２０４やエコーキャンセル装置２１５の制御に用いるだけでなく、例えばコントローラがユーザに測定値と閾値との比較結果を通知するようにしても良い。例えば、エコーキャンセル量が閾値よりも少なければ、ユーザに対してエコーが発生していることを通知することができる。エコーはシステムに問題がある拠点側ではなく、相手側の正常なシステムにて確認される現象である。問題のある拠点のユーザは、自拠点の端末（テレビ会議装置１０）が原因でエコーが発生していることを認識できないため、エコー発生の通知は有効である。エコーの発生を知ったユーザは、エコーに対する措置、例えばボリュームボタン６２ａ、６２ｂの操作によるスピーカの音量調整やマイクの感度調整（但し、マイクの感度調整機能が必要）を講ずることができる。

なお、ユーザへの通知は、例えばプロジェクタＰ、モニタ装置、パソコン等の画像表示機器に表示させることやスピーカ１８ａから音声を出力させることで行うことができる。

また、コントローラがエコーの発生を他拠点（相手先）に通知することで、他拠点のユーザに端末（テレビ会議装置１０）のスピーカのボリューム調整やマイクの感度調整を促すことができる。なお、他拠点の端末のマイクの感度調整によって、自拠点のスピーカの音量調整と同じ効果が得られる。また、一拠点の端末のマイクの感度調整によって、他拠点の端末のスピーカの音量調整と同じ効果が得られる。

また、コントローラが高調波歪率や残留エコー（又はエコーキャンセル量）の測定値をログデータとして、ネットワーク（例えばインターネット）を介してメーカ（製造元）に送信しても良い。この場合、メーカは送信されたログデータから異常内容や原因を解析でき、通信装置の製造（例えば筐体や内蔵部品の構造設計、材料選択、内蔵部品の取り付け構造等）にフィードバックすることが可能となる。

また、上記実施形態及び各変形例では、高調波歪率やエコーキャンセル処理結果に基づいて、イコライザ２０４やエコーキャンセル装置２１５を制御しているが、これに代えて、マイク２０ａの感度やスピーカ１８ａの音量（ボリューム）を制御（自動で調整）することとしても良い。この場合、歪成分やそのエコーを除去することはできないが、ビビリ音等の不快な音の音量レベルが低減されるため、結果として、音質の劣化を抑制できる。なお、マイク２０ａの感度の周波数特性やスピーカの音圧レベルの周波数特定を調整すれば、音声の歪成分のみを聞こえ難くすることができる。

また、上記実施形態及び各変形例におけるイコライザ２０４に代えて、該イコライザ２０４と同様の機能を有する、入力音信号の信号レベルの周波数特性を機械的に調整可能な構造物を用いても良い。

また、上記実施形態及び変形例では、スピーカから出力させるテスト音として、発信音や受信音を用いているが、これに限らず、例えば、装置の起動音や終了音、挿入音、効果音、警告音等を用いても良い。そして、テスト音の信号データは、予めメモリ等（例えばフラッシュメモリ１０５、ＲＯＭ１０２、ＨＤＤ１０６等）に格納しておき、必要に応じてスピーカに送信できるようにしておくことが好ましい。なお、テスト音は、装置起動後、装置の実使用前にスピーカで再生されマイクで収音されることが好ましいが、装置の実使用中や装置の実使用後にスピーカで再生されマイクで収音されても良い。

また、上記実施形態及び各変形例では、カメラ１６、マイク２０ａ及びスピーカ１８ａ、制御装置２４は、筐体２５に一体的に設けられているが、これらの少なくとも１つは、筐体と別体であっても良い。

また、上記実施形態及び各変形例では、テレビ会議装置１０は、一室内で用いられているが、これに限定されない。テレビ会議装置１０は、上述の如く、携帯性に優れるため、特定の会議室内に据え置かれる必要はなく、自由に持ち運びし、様々な場所で用いられることが期待できる。すなわち、テレビ会議装置１０は、非常にユーティリティーに富む。

また、上記実施形態及び各変形例では、本発明は、いわゆるポータブルタイプ（可搬型）のテレビ会議装置１０に適用されたが、本発明は、いわゆる据え置き型のテレビ会議装置にも適用できる。

また、上記実施形態及び各変形例では、通信装置として、テレビ会議装置１０が採用されているが、これに限られない。例えば、通信網としての電話回線を介して音声の送受信のみを行う電話会議装置が採用されても良い。すなわち、本発明の通信装置は、少なくとも音声の送受信による情報共有に用いられるコミュニケーションツールとして多様な態様で使用可能である。

以上の説明から明らかなように、本発明は、スピーカから出力される音及びマイクから入力された音の少なくとも一方に対して音響処理を行う音響制御装置全般、該音響制御装置と、スピーカ及びマイクの少なくとも一方とを備える音響装置全般、該音響制御装置と、少なくとも音声の送受信が可能な通信部とを備える通信装置全般に適用可能である。

具体的には、本発明の音響装置、通信装置としては、テレビ会議装置１０のようなテレビ会議用の端末に限られない。本発明の音響装置としては、例えばスピーカ及びマイクの少なくとも一方を備えるオーディオ機器、ＰＣ（パーソナルコンピュータ）、スマートフォン、タブレット等であっても良い（但し、スピーカ及びマイクの一方を有しない場合は外部スピーカ、外部マイク又は外部マイクスピーカが必要）。また、本発明の通信装置としては、例えばＰＣ（パーソナルコンピュータ）、スマートフォン、タブレット等であっても良いし、例えば会議アプリ等の通信用のソフトウエアがインストール、ダウンロードされたものであっても良い（但し、スピーカ及びマイクの一方を有しない場合は外部スピーカ、外部マイク又は外部マイクスピーカが必要）。

また、実施形態及び各変形例のテレビ会議装置（通信装置、音響装置ともいう）で実施されるフローを実行するプログラムは、インストール可能な形式又は実行可能な形式のファイルでＣＤ−ＲＯＭ、フレキシブルディスク（ＦＤ）、ＣＤ−Ｒ、ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｋ）等のコンピュータで読み取り可能な記録媒体に記録されて提供される。

また、本実施形態及び各変形例のテレビ会議装置（通信装置、音響装置ともいう）で実施されるフローを実行するプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また、本実施形態のテレビ会議装置（通信装置ともいう）で実施されるフローを実行されるプログラムをインターネット等のネットワーク経由で提供または配布するように構成しても良い。

また、本実施形態のテレビ会議装置（通信装置、音響装置ともいう）で実施されるフローを実行されるプログラムを、フラッシュメモリ、ＲＯＭ等に予め組み込んで提供するように構成しても良い。

１０…テレビ会議装置（音響装置、通信装置）、１８ａ…スピーカ、２０ａ…マイク、２５…筐体、１１０…ネットワークＩ／Ｆ（通信部の一部）、１２０…音声入出力Ｉ／Ｆ（通信部の一部）、２０２…ノイズキャンセラ、２０３…音抽出部、２０４…イコライザ（音響処理部の一部）、２１０…高調波歪率測定部（測定部）、２１５…エコーキャンセル装置（音響処理部の一部）、２２０…残留エコー測定部（測定部）、２１２、３１２、４１２…コントローラ（制御部）。

特願２０１３−２１４７９７号公報

Claims

スピーカから出力される音及びマイクから入力された音の少なくとも一方に対して音響処理を施す音響処理部と、
前記スピーカから出力され前記マイクから入力されたテスト音に関する音響パラメータを測定する測定部と、
前記測定部での測定結果に基づいて前記音響処理部を制御する制御部と、を備える音響制御装置。
前記音響処理部は、前記スピーカに送信される音信号及び前記マイクで変換された音信号の少なくとも一方の信号レベルを調整するイコライザを含み、
前記音響パラメータは、前記テスト音が前記マイクで変換されたテスト音信号の高調波歪率を含むことを特徴とする請求項１に記載の音響制御装置。
前記音響処理部は、前記スピーカから出力された音が前記マイクから入力されることで発生するエコーをキャンセルするエコーキャンセル装置を含み、
前記音響パラメータは、前記テスト音が前記マイクで変換されたテスト音信号の高調波歪率を含むことを特徴とする請求項１に記載の音響制御装置。
前記音響処理部は、前記スピーカから出力された音が前記マイクから入力されることで発生するエコーをキャンセルするエコーキャンセル装置を含み、
前記音響パラメータは、前記テスト音が前記マイクで変換されたテスト音信号に対する前記エコーキャンセル装置によるエコーキャンセル処理結果を含むこと特徴とする請求項１に記載の音響制御装置。
前記音響処理部は、前記スピーカに送信される音信号及び前記マイクで変換された音信号の少なくとも一方の信号レベルを調整するイコライザと、前記スピーカから出力された音が前記マイクから入力されることで発生するエコーをキャンセルするエコーキャンセル装置とを含み、
前記音響パラメータは、前記テスト音が前記マイクで変換されたテスト音信号に対する前記エコーキャンセル装置によるエコーキャンセル処理結果を含むこと特徴とする請求項１に記載の音響制御装置。
前記マイクから入力された音からノイズを除去するノイズキャンセラを更に備え、
前記測定部は、前記ノイズキャンセラによるノイズの除去が行われた前記テスト音信号の高調波歪率を測定することを特徴とする請求項２又は３に記載の音響制御装置。
前記マイクから入力された音からノイズ以外の音を抽出する音抽出部を更に備え、
前記測定部は、前記音抽出部によるノイズ以外の音の抽出が行われた前記テスト音信号の高調波歪率を測定することを特徴とする請求項２又は３に記載の音響制御装置。
前記制御部は、前記エコーキャンセル装置に前記テスト音の音響経路について予め学習させることを特徴とする請求項３〜５のいずれか一項に記載の音響制御装置。
前記制御部は、前記測定結果と閾値とを比較し、その比較結果に基づいて前記音響処理部を制御することを特徴とする請求項１〜８のいずれか一項に記載の音響制御装置。
前記制御部は、前記比較結果を通知可能であることを特徴とする請求項９に記載の音響制御装置。
請求項１〜１０のいずれか一項に記載の音響制御装置と、
前記スピーカ及び前記マイクの少なくとも一方と、を備える音響装置。
前記テスト音は、当該音響装置の起動音又は終了音であることを特徴とする請求項１１に記載の音響装置。
請求項１〜１０のいずれか一項に記載の音響制御装置と、
通信網を介して受信した音信号を前記音響制御装置を介して前記スピーカに送信し、前記マイクで変換され前記音響制御装置を介した音信号を前記通信網を介して送信する通信部と、を備える通信装置。
前記スピーカ及び前記マイクの少なくとも一方と、
前記音響制御装置と、前記通信部と、前記スピーカ及び前記マイクの少なくとも一方とが設けられた筐体と、を更に備えることを特徴とする請求項１３に記載の通信装置。
前記通信部は、前記測定結果をログテータとして当該通信装置のメーカに前記通信網を介して送信可能であることを特徴とする請求項１３又は１４に記載の通信装置。
前記テスト音は、前記通信部が前記通信網を介して発信するときの発信信号が前記スピーカに送信され出力された発信音であることを特徴とする請求項１３〜１５のいずれか一項に記載の通信装置。
前記テスト音は、前記通信部が前記通信網を介して受信したときに前記スピーカに送信され出力された受信音であることを特徴とする請求項１３〜１５のいずれか一項に記載の通信装置。
スピーカから出力されマイクから入力されたテスト音に関する音響パラメータを測定する工程と、
前記測定する工程での測定結果に基づいて、前記スピーカから出力される音及びマイクから入力された音の少なくとも一方に対して音響処理を施す音響処理部を制御する工程と、を含む音響制御方法。