JP2016116036A - 音響制御装置、音響装置、通信装置及び音響制御方法 - Google Patents
音響制御装置、音響装置、通信装置及び音響制御方法 Download PDFInfo
- Publication number
- JP2016116036A JP2016116036A JP2014252153A JP2014252153A JP2016116036A JP 2016116036 A JP2016116036 A JP 2016116036A JP 2014252153 A JP2014252153 A JP 2014252153A JP 2014252153 A JP2014252153 A JP 2014252153A JP 2016116036 A JP2016116036 A JP 2016116036A
- Authority
- JP
- Japan
- Prior art keywords
- sound
- acoustic
- microphone
- speaker
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Telephone Function (AREA)
Abstract
【課題】 音質が劣化するのを抑制できる音響制御装置を提供する。【解決手段】 音響制御装置200は、スピーカから出力される音及びマイクから入力された音に対して音響処理を施すイコライザ204を含む音響処理部と、スピーカから出力されマイクから入力されたテスト音に関する高調波歪率(音響パラメータ)を測定する高調波歪率測定部210(測定部)と、該高調波歪率測定部210での測定結果に基づいて音響処理部を制御するコントローラ212(制御部)と、を備えている。この場合、音質が劣化するのを抑制できる【選択図】図5
Description
本発明は、音響制御装置、音響装置、通信装置及び音響制御方法に係り、更に詳しくは、音響処理を行う音響制御装置、該音響制御装置を備える音響装置、前記音響制御装置を備える通信装置、及び音響処理を行う音響制御方法に関する。
従来、スピーカから出力される音やマイクから入力された音の特性を自動で調整可能な音調整装置が知られている(例えば特許文献1参照)。
しかしながら、特許文献1に開示されている音調整装置では、音質が劣化するのを抑制できなかった。
本発明は、スピーカから出力される音及びマイクから入力された音の少なくとも一方に対して音響処理を施す音響処理部と、前記スピーカから出力され前記マイクから入力されたテスト音に関する音響パラメータを測定する測定部と、前記測定部での測定結果に基づいて前記音響処理部を制御する制御部と、を備える音響制御装置である。
これによれば、音質が劣化するのを抑制できる。
以下、一実施形態を図1〜図13に基づいて説明する。図1には、一実施形態に係る通信装置としてのテレビ会議装置の不使用状態における上面図(内部透視図)が示されている。テレビ会議装置10は、不使用状態において、全体として、薄い略直方体形状(略平板状)の外形を有している。図1では、テレビ会議装置10は、例えば机、テーブルなどの上面(載置面)上に水平面に平行に載置されている。以下、テレビ会議装置10の長手方向をX軸方向、水平面内でX軸方向に直交する方向をY軸方向、X軸及びY軸方向に直交する方向(鉛直方向)をZ軸方向として説明する。
テレビ会議装置10は、一例として、図1及び図2に示されるように、筐体25、制御装置24、カメラ16を含む画像入力ユニット19、スピーカ18aを含む音出力装置18、マイク20aを含む音入力装置20、ファン21cを含む冷却系21などを備えている。
筐体25は、一例として、薄型の箱形中空部材(略直方体形状の部材)から成る。筐体25は、図1に示されるように、平面視で、例えばほぼA4版サイズの矩形の外形を有し、その厚さが、概ね一定(例えば15mm〜45mm)となっている。
また、一例として、図1に示されるように、筐体25の上壁の−Y側の端部近傍には、X軸方向のほぼ全域に亘って延び、X軸方向を長手方向とする平面視矩形の+Z側及び−X側に開口する凹部31が形成されている。
また、一例として、筐体25の上壁は、凹部31の+Y側に、複数の操作部材が設けられた操作パネル部25aを有する。操作パネル部25a及び複数の操作部材については、後述する。
また、一例として、筐体25の+Y側の側壁(前壁)のX軸方向中間部には、後述するメインボード12に実装される、例えばUSBフラッシュメモリ等の記録メディアMや外部機器との間の入出力用の2つのUSB端子49、及び通信用のLAN端子51が嵌め込まれている(図3参照)。
また、一例として、筐体25の−Y側の側壁(後壁)には、後述するメインボード12に実装される画像出力端子、通信用のLAN端子などが嵌め込まれている。また、筐体25の−X側の側壁には、電源ジャック60が嵌め込まれている(図3参照)。
図1に戻り、操作パネル部25aには、そのX軸方向中央に、−Y側から+Y側にかけて、上述した複数の操作部材としての電源ボタン35、回線ボタン37及び決定ボタン39が、この順に、一列に並べて配置されている。
電源ボタン35は、テレビ会議装置10に対する電源のON/OFFを切り換えるために用いられる操作部材である。
また、操作パネル部25aにおける電源ボタン35に隣接する箇所(電源ボタン35の−X側近傍)には、電源のON/OFFに応じて点灯/消灯する小型の確認用ランプ42が取り付けられている。
回線ボタン37は、インターネットを介して双方向通信中の相手側とのインターネット回線を切断するために用いられる操作部材である。
決定ボタン39は、例えばプロジェクタP(図9参照)によりスクリーンS上に表示されるメニュー画面内においてカーソル40が操作されることにより選択された項目を決定するための操作部材である。カーソル40は、決定ボタン39の周囲に配置されている。
また、操作パネル部25aにおけるカーソル40の+X側には、操作部材としてのメニューボタン45が配置されている。メニューボタン45は、例えばスクリーンS上にメニュー画面を呼び出すために用いられる操作部材である。
また、操作パネル部25aにおけるカーソル40の−X側には、一対のボリュームボタン62a、62bが配置されている。
一対のボリュームボタン62a、62bは、スピーカ18aの音量を調整するための操作部材である。一対のボリュームボタン62a、62bのうち、+X側のボリュームボタン62bを押圧することで、上記音量を下げることができ、−X側のボリュームボタン62aを押圧することで、上記音量を上げることができる。
また、操作パネル部25aにおけるカーソル40の+X側には、マイクミュートボタン64が配置されている。
マイクミュートボタン64は、マイク20aのON/OFFを切り替えるための操作部材である。なお、マイク20aがONとは、マイク20aにより音声が入力される状態を意味し、マイク20aがOFFとは、マイク20aにより音声が入力されない状態を意味する。
また、操作パネル部25aにおけるマイクミュートボタン64の+X側近傍には、マイク20aのON/OFF状態に応じて点灯/消灯が切り替わる小型の確認用ランプ65が設けられている。
制御装置24は、音声データ及び画像データにエンコード処理又はデコード処理を施して、通信網(ネットワーク)としてのインターネットを介した音声及び画像の双方向通信を制御する。なお、上述した画像データは、動画または間欠画像(一定時間間隔の静止画像)のデータである。
制御装置24は、一例として、筐体25内における操作パネル部25aの−Z側に配置され、図2に示されるように、制御用基板としてのメインボード12、音声処理用及び操作用基板としてのサブボード13などを含む。
メインボード12には、CPU(Central Processing Unit)101、ROM(Read Only Memory)102、RAM(Random Access Memory)104、フラッシュメモリ105、HDD(Hard Disk Drive)106、データ入出力I/F108、ネットワークI/F(Interface)110、画像入力I/F112、画像出力I/F114の各構成要素が、アドレスバス、データバス等のバスライン116を介して、双方向通信可能に接続された状態で実装されている。
CPU101は、所定のプログラム(テレビ会議装置用プログラム)に基づいてテレビ会議装置10全体の動作を制御する。なお、テレビ会議装置用プログラムに従ったCPU101の命令による、インターネットを介した音声及び画像の双方向通信にかかる一連の動作については後述する。
ROM102には、IPL(Initial Program Loader)等のCPU101の駆動に用いられるプログラムが記憶されている。
RAM104は、CPU101のワークエリアとして使用される。
フラッシュメモリ105には、通信相手のテレビ会議装置に発信するときに用いられる発信信号データ、及び通信相手のテレビ会議装置から受信したときに用いられる受信信号データが格納されている。
HDD106は、上記テレビ会議装置用プログラム、画像データ、音声データ等の各種データが記憶される。なお、HDDに限らず、例えばSSD(Solid State Drive)等を用いてもよい。上記テレビ会議装置用プログラムは、インストール可能な形式又は実行可能な形式のファイルで、例えば記録メディア等の、コンピュータで読み取り可能な記録媒体に記録して流通させるようにしても良い。また、上記テレビ会議装置用プログラムは、HDD106ではなく、ROM102に記憶されるようにしてもよい。HDD106は、CPU101の制御にしたがってHDD106に対する各種データの読み出し又は書き込みを制御する。
データ入出力I/F108は、前述したUSB端子49を含み、例えばUSBフラッシュメモリ等の記録メディアMに対するデータの読み出し又は書き込み(記憶)を制御する。記録メディアMは、USB端子49に着脱自在となっている。また、記録メディアMは、CPU101の制御にしたがってデータの読み出し又は書き込みを行う不揮発性メモリであれば、フラッシュメモリに限らず、EEPROM(Electrically Erasable and Programmable ROM)等を用いてもよい。
ネットワークI/F110は、LAN端子51(例えばイーサネット(登録商標)端子)を含み、ネットワーク例えば、インターネットに接続され、該インターネットを介した他のテレビ会議装置との間のデータ(画像データ及び音声データ)の入出力を行う。上記イーサネット端子の規格としては、例えば10Base−T、100BaseTX、1000BaseTが挙げられる。
画像入力I/F112は、被写体を撮影したカメラ16から出力される画像信号を所定の画像データとして取り込む。
画像出力I/F114は、前述した画像出力端子を含み、テレビ会議を行う相手方の会議装置の宛先や画質調整、出力信号の選択などの操作用アイコン等のメニュー画面、通信網を介して受信されたデータのうちエンコードされた画像データ、及びカメラ16により入力された画像データを、画像出力端子に接続される例えばモニタ装置、テレビ、プロジェクタP(図9参照)などの画像表示装置が受け入れ可能な所定のアナログまたはデジタルの画像信号に変換して出力するようになっている。なお、エンコードされた画像データを所定のコーデックを用いてデコードするのはCPU101による。この所定の画像信号としては、アナログRGB信号(VGA)、コンポーネントビデオ信号、HDMI(登録商標)(High―Definition Multimedia Interface)信号、DVI(Digital Video Interactive)信号が挙げられる。
サブボード13には、一例として、複数の操作部材それぞれに個別に対応する複数の操作端子、音入出力I/F120、音響制御装置200の各構成要素が実装されている。上記複数の操作端子、音入出力I/F120、音響制御装置200は、バスライン116を介して、互いに双方向通信可能に接続され、かつメインボード12に実装された上記各構成要素と双方向通信可能に接続されている。
音響制御装置200は、音を拾った(入力した)マイク20aで変換された音信号を音入出力I/F120を介して取り込み、音響処理を施し、ネットワークI/F110に送信するとともに、ネットワークI/F110で受信された他拠点(他のテレビ会議装置)からの音声信号に音響処理を施し、音入出力I/F120を介してスピーカ18aに送信する。このように、音響制御装置200、スピーカ18a及びマイク20aを含んで音響装置が構成されている。
音響制御装置200は、図5に示されるように、ノイズキャンセラ202、イコライザ204、エコーキャンセラ206、高調波歪率測定部210、コントローラ212(マイクロコンピュータ)を含む。
ノイズキャンセラ202は、ファン21cの作動に伴って発生する音や環境音などのマイク20aから入力されたノイズを除去する。
イコライザ204は、スピーカ18aに送信される音信号の信号レベルの周波数特性を調整する。
エコーキャンセラ206は、他のテレビ会議装置との双方向通信時に、スピーカ18aから出力された音がマイク20aから入力され、該他のテレビ会議装置との間で音波のループを形成して発生するエコーをキャンセル(抑制、除去)する。
高調波歪率測定部210、コントローラ212については、後述する。
画像入力ユニット19は、図3及び図4から分かるように、カメラ16に加えて、カメラ16が収容されるカメラハウジング63と、該カメラハウジング63を二軸のトルクヒンジを介して一端部に保持する細長い扁平の中空部材から成るアーム34を有している。アーム34の他端部は、該アーム34の短手方向(Y軸方向)を軸方向とする一軸のトルクヒンジを介して筐体25に接続されている。
以上のように構成される画像入力ユニット19は、筐体25の−Y側の端部に形成された凹部31内に収容される収容位置(図1参照)と、凹部31内から突出する突出位置(図3及び図4参照)との間で筐体25に対してY軸周りに回動可能となっている。なお、一軸のトルクヒンジには、画像入力ユニット19を収容位置から突出位置に向けて付勢する弾性部材(例えばねじりコイルばね)が設けられている。
ここで、操作パネル部25aの−Y側の端部のX軸方向中央には、画像入力ユニット19を筐体25に係止するための、係止解除ボタン32aを含む係止装置が設けられている(図3参照)。
すなわち、画像入力ユニット19は、収容位置に位置するとき、上記係止装置によって筐体25に機械的に係止されている。このとき、係止解除ボタン32aが押し下げられると、画像入力ユニット19の筐体25に対する係止が解除され、上記弾性部材の作用により、画像入力ユニット19がポップアップする(図3参照)。そこで、画像入力ユニット19を掴んでY軸周りに所望の角度回動させることができる。回動された画像入力ユニット19から手を離すと、一軸のトルクヒンジの作用により、画像入力ユニット19は、その位置でホールドされる。
また、画像入力ユニット19では、カメラハウジング63は、二軸のトルクヒンジの作用により、アーム34に対して該アーム34の長手方向に平行な軸周り及び該軸に直交する軸周りに独立に回動可能となっている。回動されたカメラハウジング63から手を離すと、二軸のトルクヒンジの作用により、カメラハウジング63は、その位置でホールドされる。
カメラ16は、撮影レンズ16aを介して被写体としての対象物(例えばユーザ、書画等)の画像を取り込み、取り込まれた画像を画像信号(電気信号)に変換して画像入力I/F112に出力する(図2参照)。カメラ16の撮像素子としては、例えばCCD、CMOSなどが用いられている。
撮影レンズ16aとしては、一例として、水平方向の視野角が例えば120°で、鉛直方向の視野角が例えば100°の広角レンズが用いられている。なお、撮影レンズ16aの視野角は、適宜変更可能である。
冷却系21は、制御装置24のメインボード12に実装された例えばCPU101などの発熱部が発する熱を筐体25外に放出することにより、該発熱部を冷却する。
冷却系21は、一例として、図1に示されるように、ヒートパイプ21a、ヒートシンク21b、横置き式のファン21cなどを含み、筐体25に収容されている。
ここで、図1に示されるように、筐体25の+X側の側壁の+Y側の部分には、Z軸方向に延び、Y軸方向に並んだ複数のスリット状の貫通孔から成る排気口53が形成されている。また、筐体25の下壁(−Z側の壁)の+X側かつ+Y側の角部には、複数の貫通孔から成る吸気口が形成されている。
ヒートパイプ21aは、その一端部が例えばCPU100などに接続され、その中間部がXY平面に平行に延び、その他端部がヒートシンク21bに接続されている。ヒートシンク21bは、例えばY軸方向に所定間隔で並ぶ複数の金属製のフィンを含む放熱部材から成り、筐体25内における排気口53に隣接する位置に配置されている。そこで、例えばCPU100などに発生した熱は、ヒートパイプ21a、ヒートシンク21bに順次伝わり、排気口53を介して筐体25外に放出される。
ファン21cは、整流機能を有し、筐体25内における上記吸気口の直上であって、ヒートシンク21bの−X側近傍に、その吸気方向が概ね+Z方向となるように、かつその排気方向が概ね+X方向となるように配置されている。
そこで、上記吸気口を介してファン21cにより吸引されたエアは、ヒートシンク21bを経由(通過)して、排気口53から筐体25外に排出される。これにより、ヒートシンク21bからの熱の放出(拡散)効果がより一層高められる。
音出力装置18は、図1に示されるように、スピーカ18aに加えて、例えば箱形の中空部材から成るスピーカボックス18bなどを含む。
スピーカ18aとしては、例えばフルレンジタイプの丸型スピーカが採用されている。スピーカ18aは、音入出力I/F120(図2参照)に結線されており、該音入出力I/F120から送信される音信号を音に変換して出力する。
スピーカ18aは、音出力方向が概ね上向き(+Z方向)となるように、スピーカボックス18bの天板部に嵌め込まれている。
ここで、図1に示されるように、操作パネル部25aの+X側の端における凹部31に隣接する部分には、スピーカ18aから出る音を外部に放出するための複数の貫通孔から成る音放出口43が形成されている。
スピーカボックス18bは、図1に示されるように、筐体25内における+X側の端であって、凹部31に隣接する箇所に、スピーカ18aが音放出口43の直下に位置するように配置されている。そこで、スピーカ18aから出力された音は、音放出口43を介してスムーズに(こもることなく)筐体25外に放出される。
スピーカボックス18bは、シリコンゴム、ウレタンゴム等の弾性部材から成る緩衝部材を介して筐体25に固定されている。
音入力装置20は、図1に示されるように、マイク20aに加えて、マイク20aを筐体25に保持させるための保持部材20bなどを含む。ここでは、保持部材20bの材料として、例えばプラスチックなどの硬質樹脂が用いられているが、これに特に限定されない。
マイク20aとしては、例えば無指向性の小型のマイクが採用されている。マイク20aは、音入出力I/F120(図2参照)に結線されており、入力した音を音信号に変換して音入出力I/F120に送信する。
マイク20aは、音入力方向が概ね−Y方向となるように筐体25の+Y側の側壁の内壁面の−X側の端部に設けられている。このように、マイク20aの音入力方向とスピーカ18aの音出力方向とは概ね直交している。なお、マイク20aとして、例えば概ね−Y方向を音入力方向とする単一指向性のマイクを採用しても良い。
筐体25の+Y側の側壁におけるマイク20aに対応する箇所には、図3に示されるように、X軸方向に所定間隔で形成された複数(例えば3つ)の貫通孔から成る音取込口77が形成されている。そこで、筐体25外で発生する音(特にテレビ会議装置10の+Y側に位置する人の音声)が音取込口77を介してスムーズにマイク20aから入力される。
ところで、一般に、本実施形態のテレビ会議装置10のような同一筐体にスピーカ及びマイクが搭載された通信装置は、エコーやハウリングを抑制、除去するためのエコーキャンセラを装備している。
通常、スピーカにより再生された音声がマイクにより収音されても、エコーキャンセラの機能により、エコーは除去される。
しかしながら、スピーカによる音声再生時に筐体がビビルと、歪成分を含む音声、すなわち本来の音声に高調波成分(歪成分)が乗った音声がマイクにより収音されることになる。また、筐体以外にも、該筐体に設けられた例えばカメラを含む画像入力ユニット、スピーカを含む音出力装置、マイクを含む音入力装置、ファンを含む冷却系、制御装置等がビビルことでも、本来の音声に高調波成分が乗った音声がマイクにより収音されることになる。
このようなビビリが発生すると、スピーカから出力されマイクから入力された音声が非線形となりエコーを除去しきれなくなる。すなわち、スピーカから出力されマイクから入力された歪成分を含む音声のうち歪成分(高調波成分)のエコーを除去できなくなる。結果として、通信相手にエコーが聞こえてしまう。また、スピーカによる音声再生時に筐体等にビビリが生じると、音が歪んで聞こえるなど、エコー以外の弊害もある。
そこで、イコライザの設定により、信号レベルを調整(チューニング)することが考えられる。
しかしながら、チューニングにより信号レベルを徒に調整すると、本来の音声から周波数特性が大きく変化し、音質が劣化してしまう。
このため、信号レベルをチューニングする周波数範囲及び調整量をできるだけ制限することが望ましい。
そこで、音響制御装置200では、後に詳述するように、スピーカ18aから出力されたテスト音(例えば発信音)がマイク20aから入力され該マイク20aで変換された入力音信号(音信号)の高調波歪率を高調波歪率測定部210で測定し、その測定結果に基づいてコントローラ212が音質を極力劣化させないようにイコライザ204の調整量の設定を行うことにしている。
ここで、高調波歪率(全高調波歪)について説明する。図6(A)及び図6(B)には、周波数成分を変えながらステップサイン波(音信号)を再生したときに、その再生音がマイクから入力され変換された入力音信号のスペクトルが示されている。図6(A)及び図6(B)では、横軸が時間[秒]、縦軸が周波数[Hz]を表す。
入力音信号に歪成分がなければ、該入力音信号のうち再生信号(上記ステップサイン波)だけが濃く表示されることになる。筐体等にビビリなどが生じると、入力音信号において、再生信号に歪成分として高調波が付加される。なお、図6(A)には歪成分が発生していない場合が示され、図6(B)には歪成分が発生している場合が示されている。すなわち、図6(A)では、入力音信号には、再生信号の他、環境ノイズのみが含まれている。図6(B)では、入力音信号には、再生信号の他、環境ノイズ、歪成分(図6(B)の破線内の成分)が含まれている。図6(B)における歪成分は、再生信号の倍音成分である。
ここで、高調波歪率、すなわち全高調波歪(Total Harmonic Distortion、THD)は、高調波による歪成分と元の信号成分との比を表す値である。入力を正弦波とし、元の信号成分の実行電圧をV1、その整数倍の周波数の高調波成分の実行電圧をそれぞれV2、V3、…とすると、高調波歪率(THD)は、次の(1)式で表される。
図7(A)及び図7(B)には、一例として、入力音信号の504Hzでの信号レベルの周波数特性が示されている。図7(A)及び図7(B)では、横軸が周波数[Hz]、縦軸が信号レベル[dB]を表している。図7(A)には、入力音信号に、再生信号の504Hzでの成分以外にも歪成分が多く含まれている状態が示されている。図7(B)には、入力音信号に、再生信号の504Hzでの成分のみが含まれている状態が示されている。
高調波歪率測定部210は、テスト音(例えば発信音)がマイク20aから入力され変換された入力音信号における高調波歪率を測定するものであり、具体的には、FFT(高速フーリエ変換)アナライザ、スペクトラムアナライザなどの測定器が挙げられる。高調波歪率測定部210は、測定した各高調波成分の実効値と元の信号の実効値から上記(1)式を用いて全高調波歪を計算する。
なお、高調波歪率測定部210は、上記測定器そのものでなくても良く、例えば該測定器と同様な機能を有するソフトウエアとこれを実行するマイコンとで構成されても良い。また、高調波歪率測定部210は、歪率計やオーディオアナライザであっても良い。
音響機器などでは、高調波歪率を100倍し、パーセントで表した値が一般に用いられるが、高調波歪率をデシベル(dB)で表す場合もある。
以下に、複数のテレビ会議装置10を含む会議システム100について説明する。この会議システム100は、図8に示されるように、インターネットに接続された末端の複数(例えば2つ)のルータR1と、該複数のルータR1それぞれに接続された複数(例えば2つ)のルータR2とを有する通信網としてのLAN(Local Area Network)と、複数のルータR2それぞれに接続された複数(例えば3つ)のテレビ会議装置10及び中継装置4と、インターネットに接続された通信管理装置5と、各テレビ会議装置10に接続されたプロジェクタPとを含む。
中継装置4は、所定の制御プログラムに従って、各種機能を実現させるコンピュータであり、通信網の品質(伝送速度)を常時モニタし、その伝送速度に適した解像度の画像データを設定するようになっている。すなわち、この中継装置4は、通信網の状態、テレビ会議装置10の処理状況などの影響により、双方向通信時のテレビ会議装置10同士において、画像データと音声データとにずれ(遅延)が生じていないかを常時検知し、音声データと画像データとにずれが生じている場合、高解像度の画像データ、中解像度の画像データ、低解像度の画像データの中から、そのずれが生じているテレビ会議装置10に対し、最も適した解像度を選択し、相手側のテレビ会議装置10に送信するようになっている。これにより、通信網の品質が悪化した場合でも、途切れずに動画像の通信が可能になっている。
また、この中継装置4は、画像データと音声データとのずれを解消するために、上述した解像度の変更の他、フレームレートの変更、両者のバランスを重視した解像度及びフレームレートの変更が可能になっている。このように中継装置4は、通信網の品質(伝送速度)を常時モニタし、ずれ検知、解像度の指定など、動画像および音声の転送にかかわる管理を行なっている。
通信管理装置5は、所定の制御プログラムに従って、全てのテレビ会議装置10を管理するコンピュータであり、全てのテレビ会議装置10の現在の動作状況(双方向通信中、通信待機中、非通電状態など)の把握、テレビ会議装置10のデバイス認証、デバイス認証されたテレビ会議装置10への宛先リストの付与、中継装置4の選定、テレビ会議装置10同士の双方向通信に対する課金など、テレビ会議装置10と中継装置4とを一元的に管理する。
以上のように構成される会議システム100を用いるテレビ会議の一例を、以下に説明する。このテレビ会議は、例えば12拠点間で、各拠点に配置されたテレビ会議装置10を用いて行われる(図8参照)。各拠点のユーザ(会議参加者)の人数は、例えば3人とされている(図9参照)。
各拠点の3人のユーザは、図9に示されるように、例えば一室内に配置されたテーブルTの+X側、+Y側、−X側にそれぞれテーブルT側を向いた状態で着座する。テーブルTの上面における−Y側の端部には、テレビ会議装置10が、当初画像入力ユニット19が収容位置に位置した状態で載置されている。また、テーブルTの−Y側には、短焦点型のプロジェクタPが設置され、プロジェクタPの−Y側かつ+Z側の斜め上方にはスクリーンSが張設されている。なお、テレビ会議装置10に対する電気及び通信に関する配線の接続(例えば、ルータR2に有線接続される端子とネットワークI/F110との結線、プロジェクタPと画像出力端子との結線、外部電源と電源ジャック60との結線など)は、予め行われている。
先ず、ユーザは、係止解除ボタン32aを押して、画像入力ユニット19をポップアップさせ、該画像入力ユニット19を手動でY軸周りに例えば90°回動させるとともに、カメラハウジング63をアーム34に対してZ軸周りに例えば90°回動させる。この結果、撮影レンズ16aの撮影視野内に、着座した3人のユーザが入る(図9参照)。
次いで、ユーザは、電源ボタン35を押してテレビ会議装置10を起動させる。
テレビ会議装置10が起動されると、冷却系21のファン21cが駆動され、CPU101などの発熱部が冷却される。
また、テレビ会議装置10が起動されると、プロジェクタPによってスクリーンSにメニュー画面が表示される。このメニュー画面は、各種調整、会議の開始(双方向通信の開始)等の各項目がアイコンと文字情報で表示される。そこで、ユーザは、カーソル40を操作して、上記メニュー画面上の会議の開始に関する項目を選択し、決定ボタン39を押して、会議の開始を決定する。
会議の開始が決定されると、一のテレビ会議装置10(一拠点のテレビ会議装置10)は、その旨の信号を、通信網(LAN、インターネット)を介して、通信管理装置5に送信する。このとき、通信管理装置5は、一のテレビ会議装置10に対しデバイス認証を行い、その認証後、一のテレビ会議装置10に、該一のテレビ会議装置10以外の他のテレビ会議装置10(通信管理装置5に登録されているテレビ会議装置10)の現在の動作状況を示した宛先リストを送信する。このとき、一のテレビ会議装置10は、この宛先リストを、プロジェクタPを介してスクリーンS上に表示させる。この宛先リストは、直感的な操作が可能なアイコン表示と文字情報とからなり、適宜、更新される。
ここで、一拠点のユーザは、一のテレビ会議装置10のカーソル40を操作して、上記宛先リストからテレビ会議(双方向通信)を行いたい他のテレビ会議装置10(他拠点のテレビ会議装置10)を選択して、決定ボタン39を押して決定する。
このとき、一のテレビ会議装置10では、CPU101が、選択された他のテレビ会議装置10に対して発信するとともに、その発信信号を音響制御装置200に送信する。すなわち、一のテレビ会議装置10では、フラッシュメモリ105に格納された発信信号が読み出され、ネットワークI/F110を介して、選択された他のテレビ会議装置10に対して送信されるとともに音響制御装置200に送信される。
そこで、音響制御装置200のコントローラ212は、イコライザ設定処理(イコライザ204の調整量の設定)を開始する。
音響制御装置200に送信された発信信号は、後に詳述するようにイコライザ設定処理に用いられ、スピーカ18aに送信され、該スピーカ18aから発信音が出力される。
このようにして、宛先リスト中の非通電状態でない複数の他のテレビ会議装置10の中から、双方向通信を行ないたい他のテレビ会議装置10が選択されると、通信管理装置5は、複数の中継装置4の中から最適な中継装置4を選択する。通常は、一のテレビ会議装置10と物理的に近い中継装置4が選択されるが、その中継装置4に何らかの不具合がある場合、他の中継装置4が選択される。例えば、図8に示されるように、一のテレビ会議装置10のIPアドレスが(1.2.1.5)の場合、IPアドレスが(1.2.1.2)の中継装置4が選択されるが、その中継装置4がダウンしているときは、IPアドレスが(1.2.2.2)の中継装置4が選択される。なお、IPアドレスは、説明の便宜上、個々のテレビ会議装置10に割り振られた固有のIPアドレスである(図8では、IPアドレスが括弧内の4つの数字で表されている。例えば通信管理装置5は(1.1.1.2))。
通信管理装置5により中継装置4が選択されると、即座に、その中継装置4を介して、IPアドレスに基づいて他のテレビ会議装置10へ双方向通信の要求(一のテレビ会議装置10からの発信信号)が送信される。すなわち、他のテレビ会議装置10は、その双方向通信の要求を受信すると、その要求の容認及び拒否それぞれに関する項目を、プロジェクタPを介してスクリーンS上に映し出されたメニュー画面上に表示するとともに、音響制御装置200を介してスピーカ18aに受信信号を送信する。すなわち、他のテレビ会議装置10では、フラッシュメモリ105に格納された受信信号が読み出され、音響制御装置200に送信される。音響制御装置200に送信された受信信号は、スピーカ18aに送信され、該スピーカ18aから受信音が出力される。なお、上述したような宛先リストから他のテレビ会議装置10を選択して発信を行う方法に代えて、例えば他のテレビ会議装置10のIPアドレスを直接入力するなどの別の方法で発信を行ってもよい。
そこで、他拠点のユーザは、他のテレビ会議装置10のカーソル40及び決定ボタン39を操作することにより、上記容認及び拒否それぞれに関する項目のうちのいずれかを選択、決定する。
このようにして、上記容認に関する項目が選択、決定されると、一及び他のテレビ会議装置10間で双方向通信が可能となる。
このとき、中継装置4は、上述したように、通信網の品質(伝送速度)を常時モニタしており、通信網の品質が悪化した場合、現在の解像度より一段下げた解像度の画像データに切り替えた中継、または、フレームレートを下げた中継、または、両者を下げた中継を行なう。通信管理装置5は、テレビ会議装置10同士の双方向通信の開始と共に、そのテレビ会議装置10同士の特定、通信時間の計測など、会議システム100の使用に対する課金のための処理が実行される。
一及び他のテレビ会議装置10間で双方向通信が開始されると、一のテレビ会議装置10のカメラ16で取り込まれた一拠点の3人のユーザの画像が画像入力I/F112、ネットワークI/F110、インターネットを介して他のテレビ会議装置10に送信され、該他のテレビ会議装置10に接続されたプロジェクタPによってスクリーンSに表示される。また、他のテレビ会議装置10のカメラ16で取り込まれた他拠点の3人のユーザの画像が画像入力I/F112、ネットワークI/F110、インターネットを介して一のテレビ会議装置10に送信され、該一のテレビ会議装置10に接続されたプロジェクタPによってスクリーンSに表示される。
また、一のテレビ会議装置10のマイク20aから入力された一拠点のユーザの音声が、音声入出力I/F120、音響制御装置200、ネットワークI/F110、インターネットを介して他のテレビ会議装置10に送信され、該他のテレビ会議装置10のスピーカ18aから出力される。また、他のテレビ会議装置10のマイク20aから入力された他拠点のユーザの音声が、音声入出力I/F120、音響制御装置200、ネットワークI/F110、インターネットを介して一のテレビ会議装置10に送信され、該一のテレビ会議装置10のスピーカ18aから出力される。
この際、一及び他のテレビ会議装置10では、音響制御装置200において、例えばノイズキャンセラ202によるノイズの除去、エコーキャンセラ206によるエコーの抑制、除去、イコライザによるイコライジング(音声信号の信号レベルの周波数特性の調整)等の音響処理が行われる。
なお、一のテレビ会議装置10において、スピーカ18aから発信音を出力させたときに、エコーキャンセラ206に該発信音の音響経路を学習させるようにしても良い。また、他のテレビ会議装置10において、スピーカ18aから受信音を出力させたときに、エコーキャンセラ206に該受信音の音響経路を学習させるようにしても良い。
この場合、テレビ会議開始直後からエコーの発生を抑えることができる。すなわち、エコーキャンセラ206は音響経路を学習するためにある程度時間を要するため、このように発信音や受信音を利用して予習させることが有効である。
なお、後に詳述するように、一及び他のテレビ会議装置10間での双方向通信が開始される時点で、イコライザ設定処理が少なくとも1回行われている。
以上のようにして、複数拠点間での画像データ及び音声データの双方向通信(送受信)によるテレビ会議が行われる。
以下に、本実施形態の音響制御装置200におけるイコライザ設定処理について、図10を参照して説明する。図10のフローチャートは、音響制御装置200のコントローラ212によって実行される処理アルゴリズムに基づいている。ここでの制御は、相手先に発信が行われ、音響制御装置200に発信信号が送信されたときに開始される。なお、発信信号は、相手先との接続が完了するまでの間、相手先及び音響制御装置200に繰り返し送信される。
最初のステップS1では、スピーカ18aに発信信号を送信する。このとき、スピーカ18aから発信音が出力(再生)されマイク20aから入力(収音)され音信号(入力音信号)に変換される。そして、この入力音信号は、高調波歪率測定部210、コントローラ212に送られる。なお、ここでは、発信信号は、複数の周波数のトーン信号で構成されている(図11の黒色成分参照)。そこで、高調波歪率測定部210は、上記入力音信号の所定周波数帯(例えば100Hz〜10000Hz)での高調波歪率を測定し、その測定結果をコントローラ212に出力する。
ここで、図11には、上記入力音信号のスペクトルが示されている。図11では、横軸が時間[s]、縦軸が周波数[Hz]を表している。図11から分かるように、入力音信号のうちビビリが生じている周波数では、発信信号のトーン信号(図11の濃い成分)以外の成分が歪成分として現れている。
そこで、発信信号には、筐体25等が元来(筐体25等の構造上)ビビリ易い周波数を含ませておくことが望ましい。例えば100Hz〜10000Hzの周波数帯における所定周波数(例えば500Hz)付近がビビリ易い傾向にある場合には、発信信号には、少なくとも該所定周波数(500Hz)の成分が含まれていることが望ましい。
次のステップS2では、相手先と接続を完了しているか否か(相手先が上記容認に関する項目を選択、決定しているか否か)を判断する。通常、発信後、相手先と接続が完了するまでには、数秒〜数十秒程度要すると考えられる。ステップS2での判断が肯定されると、フローは、終了する。一方、ステップS2での判断が否定されると、ステップS3に移行する。
ステップS3では、上記入力音信号の所定周波数帯(例えば100Hz〜10000Hz)での高調波歪率を取得する。具体的には、高調波歪率測定部210での測定結果を取得する。
次のステップS4では、上記入力音信号における所定周波数帯(例えば100Hz〜10000Hz)全域で高調波歪率が閾値未満であるか否かを判断する。ここでの閾値としては、一例として、100Hz〜1000Hzでは5%に設定され、1000Hz〜10000Hzでは3%に設定されている。ここでは、上記所定周波数帯のうち低周波数帯(100Hz〜1000Hz)では筐体25等のビビリによる歪が比較的大きくなる傾向にあるため閾値を高めに設定し、高調波数帯(1000Hz〜10000Hz)では筐体25等のビビリによる歪が比較的小さくなる傾向にあるため閾値を低めに設定している。ステップS4での判断が肯定されると、ステップS5に移行する。一方、ステップS4での判断が否定されると、ステップS7に移行する。
なお、高調波歪率を測定する所定周波数帯及び閾値は、適宜変更可能である。例えば、図12に示されるように、所定周波数帯を100Hz〜10000Hzとし、閾値を100Hz〜1000Hzで5%、1000Hz〜10000Hzで3%としても良い。なお、図12には、300Hz〜10000Hzで高調波歪率が閾値未満の場合が示されている。ここでは、閾値を、所定周波数帯に対して2つ設定しているが、1つのみ設定しても良いし、3つ以上設定しても良い。図12における縦軸のDistortion[%]が高いほど再生信号の倍音成分(歪成分)が多く含まれていると判断できる。
ステップS5では、上記入力音信号の信号レベルが所定周波数帯全域で目標値(設計時に予め設定された理想値)に達している否かを判断する。ここでは、目標値は、所定周波数帯(例えば100Hz〜10000Hz)全域で一定の値に設定されている(図13参照)。図13において、理想値と現状の設定値とが乖離している分だけ音質の劣化があると考えられる。ステップS5での判断が肯定されると、ステップS2に戻る。一方、ステップS5での判断が否定されると、ステップS6に移行する。
ステップS6では、上記入力音信号の信号レベルが目標値よりも小さい周波数での信号レベルを上げるようイコライザ204を制御する(具体的には、イコライザ204による信号レベルの調整量を設定する)。すなわち、信号レベルが目標値よりも小さい周波数では、ビビリが発生するまでのマージンがあると考えられるため、ゲイン(信号レベル)を上げて目標値に近づける(図13参照)。イコライザ204による信号レベルの調整量は、予め設定した一定量としても良いし、当該周波数での高調波歪率と閾値との差に応じた量(例えばこの差が大きいほど調整量を大きくする)としても良い。なお、図13には、入力音信号の100Hz〜1kHzでの信号レベルを現状の設定値から上げるようイコライザ204が設定される例が示されている。ステップS6が実行されると、ステップS2に戻る。
ステップS7では、上記入力音信号における高調波歪率が閾値以上の周波数の信号レベルを下げるようイコライザ204を制御する(具体的には、イコライザ204の調整量を設定する)。すなわち、高調波歪率が閾値以上の周波数では、音圧が高いためにビビリが生じていると考えられるため、ゲイン(信号レベル)を下げるよう設定する(図13参照)。イコライザ204による信号レベルの調整量は、予め設定した一定量としても良いし、当該周波数での高調波歪率と閾値との差に応じた量(例えばこの差が大きいほど調整量を大きくする)としても良い。なお、図13では、入力音信号の1kHz〜3.5kHzでの信号レベルを現状の設定値から下げるようイコライザ204が設定される例が示されている。ステップS7が実行されると、ステップS2に戻る。
なお、ステップS3、S4、S5、S6の一連の処理又はステップS3、S4、S7の一連の処理に要する時間、すなわちイコライザ204の設定に要する時間は、発信信号の1サイクルの時間よりも短く、ステップS2での判断が肯定されるまでに(テレビ会議開始前に)、該一連の処理(イコライザ204の設定)を少なくとも1回行うことが可能である。そこで、発信信号の1サイクルの時間をイコライザ204の設定に要する時間よりも十分長く設定することで、相手先との接続が完了するまでに、イコライザ204の設定を複数回行うことも可能である。この結果、入力音信号の所定周波数帯での信号レベルを歪みが生じない範囲で目標値(理想値)に極力近づくようにイコライザ204を設定できる。
このようにして、テレビ会議開始前にイコライザ204の設定が行われることで、テレビ会議中、一のテレビ会議装置10に他のテレビ会議装置10から送信された音声信号の所定周波数帯での信号レベルがイコライザ204により適正な値(歪みが発生せず理想値に近い値)に調整され、スピーカ18aに送信されるため、スピーカ18aから歪成分のない高品質な音声が出力される。この場合、スピーカ18aから出力された歪成分のない音声がマイク20aから入力されてもその音声信号は、エコーキャンセラ206で確実に除去されるため、他のテレビ会議装置10にエコー成分が送られることもない。
削除
なお、テレビ会議終了後も、イコライザ204の設定(チューニング結果)を保持しておくことで、次回のテレビ会議の開始時に、ある程度イコライザ204の設定がなされた状態とすることができ、例えば相手先との接続が直ぐに行われた場合であっても、音声の劣化が抑制された状態でテレビ会議を行うことができる。
以上説明した本実施形態の音響制御装置200は、スピーカ18aから出力される音及びマイク20aから入力された音に対して音響処理を施す音響処理部と、スピーカ18aから出力されマイク20aから入力されたテスト音(例えば発信音)に関する音響パラメータを測定する測定部(高調波歪率測定部210)と、該測定部での測定結果に基づいて音響処理部を制御する制御部(コントローラ212)と、を備えている。
また、本実施形態の音響制御方法は、スピーカ18aから出力されマイク20aから入力されたテスト音(例えば発信音)に関する音響パラメータを測定する工程と、該測定する工程での測定結果に基づいて、スピーカ18aから出力される音及びマイク20aから入力された音に対して音響処理を施す音響処理部を制御する工程と、を含んでいる。
本実施形態の音響制御装置200及び音響制御方法では、スピーカ18aから出力されたテスト音に関する音響情報を考慮して、スピーカ18aから出力される音及びマイク20aから入力された音に対して音響処理を施すことができる。
この結果、音質が劣化するのを抑制できる。
詳述すると、音響処理部は、スピーカ18aに送信される音信号の信号レベルを調整するイコライザ204を含み、音響パラメータは、テスト音(例えば発信音)がマイク20aで変換されたテスト音信号(入力音信号)の所定周波数帯での高調波歪率を含む。
この場合、テスト音信号の高調波歪率に基づいてイコライザ204が制御されるため、スピーカ18aに送信される音信号の信号レベルを適正な値(歪みが発生しない値)に調整できる。
詳述すると、イコライザ204の作用によりスピーカ18aから歪成分が低減された音が出力されるため、その音を直接聞くユーザにとって音質が良好となる。
また、音響制御装置200は、テレビ会議毎にイコライザ204の設定(チューニング)を行うため、筐体25や該筐体25に設けられた部品の経時変化(変形、摩耗、がたつき等)によって、ビビリの程度やビビリの発生する周波数が変化しても、音質の劣化を確実に抑制できる。
すなわち、ビビリの程度やビビリの発生する周波数は、筐体や該筐体に設けられた部品間の僅かな隙間寸法によっても変わるため、個体差が存在する。また、テレビ会議装置10を使用するにつれ、スピーカ18aやファン21cからの振動が継続的に加わり、部品間の寸法が変わるなどすることでもビビリの程度やビビリの発生する周波数が変わることがある。
そこで、テレビ会議装置10が工場から出荷後、音響制御装置200によってユーザの実使用直前にイコライザ204のチューニングが可能であるため、個体ごとの特性差(個体差)をカバーでき、ユーザへの納品後の個体経時変化に対応可能である。
一方、個体差を考慮しないでイコライザをチューニングしても、個体に最適な特性を実現できない。そこで、全ての個体でエコーなどの音声障害が生じないようにチューニングしようとすると、イコライザでレベルを落とす必要のある周波数帯域が広くなり、また調整量も大きくなるため、より音質劣化につながる。一方、音質劣化を抑えるために、イコライザでの調整箇所(周波数)と調整量を限定すると、全ての個体をカバーできなくなり、程度の悪い個体によってはエコーなどが発生する恐れがあるというトレードオフが生じる。よって、バランスのよい妥協点を探ることが必要になるが、それには多くの台数確認を行いバラつき把握することが必要になり、評価工数や費用が膨大になってしまう。さらに、設計時に周波数特性などの各パラメータを固定することになるため、出荷時には最適な特性に合わせ込めたとしても、ユーザへの納入後に個体のビビリ等の状態が変化した場合には最適な特性を実現できず、エコーなどの発生につながる恐れがある。
また、コントローラ212は、高調波歪率測定部210での測定結果と閾値とを比較し、その比較結果に基づいてイコライザ204を制御するため、所定周波数帯中の調整が必要な周波数でのみ歪成分の大きさに応じて信号レベルを調整できる。この結果、音質を極力劣化させることなく、歪成分を除去できる。
また、コントローラ212は、所定周波数帯に高調波歪率の測定結果が閾値以上となる周波数がある場合、該周波数でのテスト音信号(入力音信号)の信号レベルが元の信号レベルよりも低くなるようにイコライザ204を制御するため、歪成分を確実に除去できる。
また、コントローラ212は、所定周波数帯に高調波歪率の測定結果が閾値以上となる周波数がない場合、かつ所定周波数帯にテスト音信号(入力音信号)の信号レベルが目標値に達していない周波数がある場合、該周波数でのテスト音信号の信号レベルが元の信号レベルよりも高くなるようにイコライザ204を制御するため、歪成分を除去しつつ入力音信号の信号レベルを目標値に近づけることができる。
また、本実施形態のテレビ会議装置10は、音響制御装置200と、マイク20aで変換され音響制御装置200を介した音信号を通信網(例えばインターネット)を介して送信し、該通信網を介して音信号を受信し、受信した音信号を音響制御装置200を介してスピーカ18aに送信するネットワークI/F110を含む通信部と、を備えているため、双方向通信における音声品質を向上できる。
また、テレビ会議装置10は、スピーカ18aと、マイク20aと、音響制御装置200、スピーカ18a、マイク20a及び通信部が設けられた筐体25とを更に備えているため、音声品質の優れたポータブルなテレビ会議装置10を実現できる。
また、テレビ会議装置10では、筐体25等のビビリを抑制でき、スピーカ18aから出力される音声の品質劣化を抑制できる。
また、テスト音は、テレビ会議装置10が通信網を介して発信するときの発信信号がスピーカ18aに送信され出力される発信音であるため、テレビ会議が開始される前に、イコライザ設定処理を完了させることができ、テレビ会議開始直後から、高品質な音声によるテレビ会議を行うことができる。
すなわち、テスト音にテレビ会議装置10で通常使用される発信音を利用しているため、ユーザに音響調整を意識させることもないし、ユーザにテスト音による不快感を与えることもない。
一方、例えば機器の使用前に設定ボタンを押すことで自動音響調整を働かせる方式では、ユーザに調整の手間をかけさせることになる。また音響調整が働いていることをユーザに意識させ、機器使用前に調整時間を要するため、使い勝手を損なう。更に自動調整時に再生されるテスト信号は一般的にノイズやスイープ音、一定周波数の純音であるためユーザに不快感を与える可能性がある。
なお、上記実施形態では、スピーカ18aから出力された発信音がマイク20aから入力され変換された入力音信号の高調波歪率に基づいてイコライザ204を制御しているが、以下に説明する変形例1のように、スピーカ18aから出力された受信音がマイク20aから入力され変換された入力音信号の高調波歪率に基づいてイコライザ204を制御しても良い。変形例1の音響制御装置は、上記実施形態の音響制御装置200と同様の構成を有している。
以下に、変形例1の音響制御装置におけるイコライザ設定処理について、図14を参照して説明する。図14のフローチャートは、音響制御装置200のコントローラ212によって実行される処理アルゴリズムに基づいている。ここでの制御は、相手先から受信し、音響制御装置に受信信号が送信されたときに開始される。なお、受信信号は、相手先との接続が完了するまでの間、音響制御装置200に繰り返し送信される。
最初のステップS11では、スピーカ18aに受信信号を送信する。このとき、スピーカ18aから受信音が出力(再生)されマイク20aから入力(収音)され音信号(入力音信号)に変換される。そして、この入力音信号は、高調波歪率測定部210、コントローラ212に送られる。なお、ここでは、受信信号は、複数の周波数のトーン信号で構成されている(図15の黒色成分参照)。そこで、高調波歪率測定部210は、上記入力音信号の所定周波数帯(例えば100Hz〜10000Hz)での高調波歪率を測定し、その測定結果をコントローラ212に出力する。
受信信号には、筐体25等が元来(筐体25等の構造上)ビビリ易い周波数を含ませておくことが望ましい。例えば100Hz〜10000Hzの周波数帯における所定周波数(例えば500Hz)付近がビビリ易い傾向にある場合には、受信信号には、少なくとも該所定周波数(500Hz)の成分が含まれていることが望ましい。
次のステップS12では、相手先と接続を完了しているか否か(上記容認に関する項目を選択、決定しているか否か)を判断する。通常、受信後、相手先と接続が完了するまでには、数秒〜数十秒程度要すると考えられる。ステップS12での判断が肯定されると、フローは、終了する。一方、ステップS12での判断が否定されると、ステップS13に移行する。
ステップS13では、上記入力音信号の所定周波数帯(例えば100Hz〜10000Hz)での高調波歪率を取得する。具体的には、高調波歪率測定部210での測定結果を取得する。
次のステップS14では、上記入力音信号における所定周波数帯(例えば100Hz〜10000Hz)全域で高調波歪率が閾値未満であるか否かを判断する。ここでの閾値としては、一例として、100Hz〜1000Hzでは5%に設定され、1000Hz〜10000Hzでは3%に設定されている。ステップS14での判断が肯定されると、ステップS15に移行する。一方、ステップS14での判断が否定されると、ステップS17に移行する。
ステップS15では、上記入力音信号の信号レベルが所定周波数帯(例えば100Hz〜10000Hz)全域で目標値(設計時に予め設定された理想値)に達している否かを判断する。ここでは、目標値は、所定周波数帯全域で一定の値に設定されている。ステップS15での判断が肯定されると、ステップS12に戻る。一方、ステップS15での判断が否定されると、ステップS16に移行する。
ステップS16では、上記入力音信号の信号レベルが目標値よりも小さい周波数での信号レベルを上げるようイコライザ204を制御する(イコライザ204による信号レベルの調整量を設定する)。すなわち、信号レベルが目標値よりも小さい周波数では、ビビリが発生するまでのマージンがあると考えられるため、ゲイン(信号レベル)を上げて目標値に近づける。イコライザ204による信号レベルの調整量は、予め設定した一定量としても良いし、当該周波数での高調波歪率と閾値との差に応じた量(例えばこの差が大きいほど調整量を大きくする)としても良い。ステップS16が実行されると、ステップS12に戻る。
ステップS17では、上記入力音信号における高調波歪率が閾値以上の周波数の信号レベルを下げるようイコライザ204を制御する(イコライザ204の調整量を設定する)。すなわち、高調波歪率が閾値以上の周波数では、音圧が高いためにビビリが生じていると考えられるため、ゲイン(信号レベル)を下げるよう設定する。イコライザ204による信号レベルの調整量は、予め設定した一定量としても良いし、当該周波数での高調波歪率と閾値との差に応じた量(例えばこの差が大きいほど調整量を大きくする)としても良い。ステップS17が実行されると、ステップS12に戻る。
なお、ステップS13、S14、S15、S16の一連の処理又はステップS13、S14、S17の一連の処理に要する時間、すなわちイコライザ204の設定に要する時間は、受信信号の1サイクルの時間よりも短く、ステップS12での判断が肯定されるまでに(テレビ会議開始前に)、該一連の処理(イコライザ204の設定)を少なくとも1回行うことが可能である。そこで、受信信号の1サイクルの時間をイコライザ204の設定に要する時間よりも十分長く設定することで、相手先との接続が完了するまでに、イコライザ204の設定を複数回行うことも可能である。この結果、入力音信号の所定周波数帯での信号レベルを歪みが生じない範囲で目標値(理想値)に極力近づくようにイコライザ204を設定できる。
また、上記実施形態及び変形例1では、他拠点のマイク20aから入力され自拠点のスピーカ18aに送信される音信号の信号レベルの周波数特性を、自拠点で測定した高調波歪率に基づく設定が行われた自拠点のイコライザ204で調整することとしているが、これに限られない。例えば、他拠点のマイク20aから入力された音信号の信号レベルの周波数特性を、自拠点で測定した高調波歪率に基づく設定が行われた他拠点のイコライザ204で調整し、調整後の音信号を自拠点のスピーカ18aに送信することとしても良い。この場合も、上記実施形態及び変形例1と同様の効果が得られる。なお、自拠点で測定した高調波歪率に基づいて他拠点のイコライザ204の設定を行うには、自拠点で測定した高調波歪率をそのまま他拠点に送り、該高調波歪率に基づいて他拠点のイコライザ204の設定を行っても良いし、自拠点で測定した高調波歪率に基づくイコライザ204の設定情報を他拠点に送り、該設定情報を用いてイコライザ204の設定を行っても良い。
また、上記実施形態及び変形例1では、音響制御装置は、ノイズキャンセラ202、エコーキャンセラ206を有しているが、これらの少なくとも一方を有していなくても良い。
なお、上記実施形態の音響制御装置200では、入力音信号の高調波歪率に基づいてイコライザ204を制御しているが、以下に説明する変形例2のように、入力音信号の高調波歪率に基づいてエコーキャンセル装置215を制御しても良い。
変形例2の音響制御装置300では、図16に示されるように、コントローラ312は、高調波歪率測定部210での測定結果に基づいてエコーキャンセル装置215を制御する。
エコーキャンセル装置215は、第1及び第2エコーキャンセラ215a、215bを含む。第1及び第2エコーキャンセラ215a、215bは、択一的に用いられる。
第1エコーキャンセラ215aは、エコーキャンセル度(エコーキャンセルの強さ)が低めに設定され、エコー除去よりも通話を優先する仕様である。すなわち、第1エコーキャンセラ215aでは、ダブルトーク(双方向同時通話)時に音切れや音声の揺らぎが発生しないが、ダブルトーク時のみならずシングルトーク(一方向通話)時であってもエコーが発生しやすい。
第2エコーキャンセラ215bは、エコーキャンセル度(エコーキャンセルの強さ)が第1エコーキャンセラ215aよりも高めに設定され、通話よりもエコー除去を優先する仕様である。すなわち、第2エコーキャンセラ215bでは、シングルトーク時のみならずダブルトーク時であってもエコーが発生しないが、ダブルトーク時に音切れや音声の揺らぎが発生しやすい。
なお、各エコーキャンセラのエコーキャンセル度は、例えば、マイクに戻ってくるエコーを予測して取り除く適応フィルタの係数を変えることで調整できる。
コントローラ312は、高調波歪率測定部210での測定結果に基づいて、エコーキャンセル装置215で用いられるエコーキャンセラとして第1及び第2エコーキャンセラ215a、215bのいずれかを選択することで、エコーキャンセル装置215におけるエコーキャンセル度を設定する。
以下に、変形例2の音響制御装置300におけるエコーキャンセル度設定処理について、図17を参照して説明する。図17のフローチャートは、音響制御装置300のコントローラ312によって実行される処理アルゴリズムに基づいている。ここでの制御は、相手先に発信が行われ、音響制御装置300に発信信号が送信されたときに開始される。なお、発信信号は、相手先との接続が完了するまでの間、相手先及び音響制御装置300に繰り返し送信される。
最初のステップS21では、スピーカ18aに発信信号を送信する。このとき、スピーカ18aから発信音が出力(再生)されマイク20aから入力(収音)され音信号(入力音信号)に変換される。そして、この入力音信号は、高調波歪率測定部210、コントローラ212に送られる。なお、ここでは、発信信号は、複数の周波数のトーン信号で構成されている(図11参照)。そこで、高調波歪率測定部210は、上記入力音信号の所定周波数帯(例えば100Hz〜10kHz)での高調波歪率を測定し、その測定結果をコントローラ312に出力する。
次のステップS22では、相手先と接続を完了しているか否か(相手先が上記容認に関する項目を選択、決定しているか否か)を判断する。通常、発信後、相手先と接続が完了するまでには、数秒〜数十秒程度要すると考えられる。ステップS22での判断が肯定されると、フローは、終了する。一方、ステップS22での判断が否定されると、ステップS23に移行する。
ステップS23では、上記入力音信号の所定周波数帯(例えば100Hz〜10000Hz)での高調波歪率を取得する。具体的には、高調波歪率測定部210での測定結果を取得する。
次のステップS24では、上記入力音信号における所定周波数帯(例えば100Hz〜10000Hz)全域で高調波歪率が閾値未満であるか否かを判断する。ここでの閾値としては、一例として、100Hz〜1000Hzでは5%に設定され、1000Hz〜10000Hzでは3%に設定されている。ステップS24での判断が肯定されると、ステップS25に移行する。一方、ステップS24での判断が否定されると、ステップS26に移行する。
ステップS25では、第1エコーキャンセラ215aを選択する(エコーキャンセル度を低めに設定する)。すなわち、入力音信号における高調波歪率が所定周波数帯全域で閾値未満の場合には、歪成分のエコーが相手先に送信されたとしてもほとんど不快感を与えることがない。そこで、エコーキャンセル度が弱めに設定された第1エコーキャンセラ215aを選択し、タブルトークを可能としている。ステップS25が実行されると、ステップS22に戻る。
ステップS26では、第2エコーキャンセラ215bを選択する(エコーキャンセル度を高めに設定する)。すなわち、入力音信号における高調波歪率が閾値以上の周波数がある場合には、歪成分のエコーが相手先に送信されると不快感を与えてしまう。そこで、エコーキャンセル度が強めに設定された第2エコーキャンセラ215bを選択し、通話(特にタブルトーク)よりもエコー除去を優先している。ステップS26が実行されると、ステップS22に戻る。
なお、ステップS23、S24、S25の一連の処理又はステップS23、S24、S26の一連の処理に要する時間、すなわちエコーキャンセル度の設定に要する時間は、発信信号の1サイクルの時間よりも短く、ステップS22での判断が肯定されるまでに(テレビ会議開始前に)、該一連の処理(エコーキャンセル度の設定)を少なくとも1回行うことが可能である。
以上のようにして、テレビ会議開始前にエコーキャンセル度の設定が行われることで、テレビ会議中、一のテレビ会議装置10に他のテレビ会議装置10から送信される音声信号の歪成分が小さい場合には、高品質な音声でシングルトーク及びダブルトークを行うことができ、該歪成分が大きい場合でも、高品質な音声でシングルトークを行うことができる。
また、テレビ会議中、他のテレビ会議装置10に一のテレビ会議装置10から送信される音声信号の歪成分が小さい場合には、高品質な音声でシングルトーク及びダブルトークを行うことができ、該歪成分が大きい場合でも、高品質な音声でシングルトークを行うことができる。
なお、上記変形例2では、スピーカ18aから出力された発信音がマイク20aから入力され変換された入力音信号の高調波歪率に基づいてエコーキャンセル装置215を制御しているが、以下に説明する変形例3のように、スピーカ18aから出力された受信音がマイク20aから入力され変換された入力音信号の高調波歪率に基づいてエコーキャンセル装置215を制御しても良い。変形例3の音響制御装置は、上記変形例2の音響制御装置300と同様の構成を有している。
以下に、変形例3の音響制御装置におけるエコーキャンセル度設定処理について、図18を参照して説明する。図18のフローチャートは、音響制御装置のコントローラ312によって実行される処理アルゴリズムに基づいている。ここでの制御は、相手先から受信し、音響制御装置に受信信号が送信されたときに開始される。なお、受信信号は、相手先との接続が完了するまでの間、音響制御装置に繰り返し送信される。
最初のステップS31では、スピーカ18aに受信信号を送信する。このとき、スピーカ18aから受信音が出力(再生)されマイク20aから入力(収音)され音信号(入力音信号)に変換される。そして、この入力音信号は、高調波歪率測定部210、コントローラ312に送られる。なお、ここでは、受信信号は、複数の周波数のトーン信号で構成されている(図15参照)。そこで、高調波歪率測定部210は、上記入力音信号の所定周波数帯(例えば100Hz〜10000Hz)での高調波歪率を測定し、その測定結果をコントローラ312に出力する。
次のステップS32では、相手先と接続を完了しているか否か(上記容認に関する項目を選択、決定しているか否か)を判断する。通常、受信後、相手先と接続が完了するまでには、数秒〜数十秒程度要すると考えられる。ステップS32での判断が肯定されると、フローは、終了する。一方、ステップS32での判断が否定されると、ステップS33に移行する。
ステップS33では、上記入力音信号の所定周波数帯(例えば100Hz〜10000Hz)での高調波歪率を取得する。具体的には、高調波歪率測定部210での測定結果を取得する。
次のステップS34では、上記入力音信号における所定周波数帯(例えば100Hz〜10000Hz)全域で高調波歪率が閾値未満であるか否かを判断する。ここでの閾値としては、一例として、100Hz〜1000Hzでは5%に設定され、1000Hz〜10000Hzでは3%に設定されている。ステップS34での判断が肯定されると、ステップS35に移行する。一方、ステップS34での判断が否定されると、ステップS36に移行する。
ステップS35では、第1エコーキャンセラ215aを選択する(エコーキャンセル度を低めに設定する)。すなわち、入力音信号における高調波歪率が所定周波数帯全域で閾値未満の場合には、歪成分のエコーが相手先に送信されたとしてもほとんど不快感を与えることがない。そこで、エコーキャンセル度が弱めに設定された第1エコーキャンセラ215aを選択し、タブルトークを可能としている。ステップS35が実行されると、ステップS32に戻る。
ステップS36では、第2エコーキャンセラ215bを選択する(エコーキャンセル度を高めに設定する)。すなわち、入力音信号における高調波歪率が閾値以上の周波数がある場合には、歪成分のエコーが相手先に送信されると不快感を与えてしまう。そこで、エコーキャンセル度が強めに設定された第2エコーキャンセラ215bを選択し、通話(特にタブルトーク)よりもエコー除去を優先している。ステップS36が実行されると、ステップS32に戻る。
なお、ステップS33、S34、S35の一連の処理又はステップS33、S34、S36の一連の処理に要する時間、すなわちエコーキャンセル度の設定に要する時間は、受信信号の1サイクルの時間よりも短いため、ステップS32での判断が肯定されるまでに(テレビ会議開始前に)、該一連の処理(エコーキャンセル度の設定)を少なくとも1回行うことが可能である。
また、上記変形例2では、スピーカ18aから出力された発信音がマイク20aから入力され変換された入力音信号の高調波歪率に基づいてエコーキャンセル装置215を制御しているが、以下に説明する変形例4のように、スピーカ18aから出力された発信音がマイク20aから入力されたときのエコーキャンセル装置215のエコーキャンセル処理結果(音響パラメータ)に基づいてエコーキャンセル装置215を制御しても良い。
変形例4の音響制御装置400は、図19に示されるように、スピーカ18aから出力された発信音がマイク20aから入力され変換された入力音信号に対するエコーキャンセル装置215によるエコーキャンセル処理後の残留エコー(エコーキャンセル処理結果)を測定し、その測定結果をコントローラ412に送信する残留エコー測定部220を高調波歪率測定部210に代えて有している。ここでは、エコーキャンセル装置215では、当初、第1エコーキャンセラ215aに設定(初期設定)されている。
詳述すると、残留エコー測定部220は、スピーカ18aから出力された発信音がマイク20aから入力され変換された入力音信号に対する第1エコーキャンセラ215aによるエコーキャンセル処理後の残留エコー(第1エコーキャンセラ215aで除去できなかった歪成分のエコー)を測定する。なお、残留エコーに代えて、第1エコーキャンセラ215aにより除去されたエコー、すなわちエコーキャンセル量を測定しても良いし、第1エコーキャンセラ215aを介した入力音信号の信号レベルを測定しても良い。
コントローラ412は、残留エコー測定部220での測定結果に基づいて第1及び第2エコーキャンセラ215a、215bのいずれかを選択することで、エコーキャンセル装置215におけるエコーキャンセル度を設定する。
詳述すると、コントローラ412は、第1エコーキャンセラ215aで除去できなかった歪成分のエコー(残留エコー)の信号レベルが閾値(例えば−60dBov)未満の場合に第1エコーキャンセラ215aを選択し、該歪成分のエコー(残留エコー)の信号レベルが該閾値(例えば−60dBov)以上の場合に第2エコーキャンセラ215bを選択する。ここでの閾値は、歪成分のエコー(残留エコー)が人に不快感を与えるか否かの境界値近傍を基準に設定されている。
以下に、変形例4の音響制御装置400におけるエコーキャンセル度設定処理について、図20を参照して説明する。図20のフローチャートは、音響制御装置400のコントローラ412によって実行される処理アルゴリズムに基づいている。ここでの制御は、相手先に発信が行われ、音響制御装置400に発信信号が送信されたときに開始される。なお、発信信号は、相手先との接続が完了するまでの間、相手先及び音響制御装置400に繰り返し送信される。
最初のステップS41では、スピーカ18aに発信信号を送信する。このとき、スピーカ18aから発信音が出力(再生)されマイク20aから入力(収音)され音信号(入力音信号)に変換される。そして、この入力音信号は、第1エコーキャンセラ215a、コントローラ412に送られる。なお、ここでは、発信信号は、複数の周波数のトーン信号で構成されている(図11参照)。
次のステップS42では、相手先と接続を完了しているか否か(相手先が上記容認に関する項目を選択、決定しているか否か)を判断する。通常、発信後、相手先と接続が完了するまでには、数秒〜数十秒程度要すると考えられる。ステップS42での判断が肯定されると、フローは、終了する。一方、ステップS42での判断が否定されると、ステップS43に移行する。
ステップS43では、第1エコーキャンセラ215aによる入力音信号に対するエコーキャンセル処理後の残留エコーを測定する。
次のステップS44では、残量エコーが閾値未満か否かを判断する。ステップS44での判断が肯定されると、ステップS45に移行する。一方、ステップS44での判断が否定されると、ステップS46に移行する。
ステップS45では、第1エコーキャンセラ215aを選択する(エコーキャンセル度を低めに設定する)。すなわち、残留エコーが閾値未満の場合には、歪成分のエコーが相手先に送信されたとしてもほとんど不快感を与えることがない。そこで、第1エコーキャンセラ215aを選択し、タブルトークを可能にしている。ステップS45が実行されると、ステップS42に戻る。
ステップS46では、第2エコーキャンセラ215bを選択する(エコーキャンセル度を高めに設定する)。すなわち、残留エコーが閾値以上の場合には、歪成分のエコーが相手先に送信されると不快感を与えてしまう。そこで、エコーキャンセル度が強めに設定された第2エコーキャンセラ215bを選択し、通話(特にタブルトーク)よりもエコー除去を優先し、残留エコーを低減している。ステップS46が実行されると、ステップS42に戻る。
なお、ステップS43、S44、S45の一連の処理又はステップS43、S44、S46の一連の処理に要する時間、すなわちエコーキャンセル度の設定に要する時間は、発信信号の1サイクルの時間よりも短いため、ステップS42での判断が肯定されるまでに(テレビ会議開始前に)、該一連の処理(エコーキャンセル度の設定)を少なくとも1回行うことが可能である。
以上のようにして、テレビ会議開始前にエコーキャンセル度の設定が行われることで、テレビ会議中、第1エコーキャンセラ215aによるエコーキャンセル処理後の残留エコーが小さい場合には、高品質な音声でシングルトーク及びダブルトークを行うことができ、該残留エコーが大きい場合でも、高品質な音声でシングルトークを行うことができる。
なお、第1エコーキャンセラ215aによるエコーキャンセル処理結果として、残留エコーに代えて、エコーキャンセル量を測定する場合には、測定されたエコーキャンセル量が閾値以上の場合に第1エコーキャンセラ215aを選択し、該閾値未満の場合に第2エコーキャンセラ215bを選択すれば良い。また、残留エコーに代えて、第1エコーキャンセラ215aを介した入力音信号の信号レベルを測定する場合には、測定された信号レベルが閾値(例えば−60dBov)以上の場合に、第2エコーキャンセラ215bを選択し、該閾値未満の場合に第1エコーキャンセラ215aを選択すれば良い。
なお、上記変形例4では、スピーカ18aから出力された発信音がマイク20aから入力されたときの第1エコーキャンセラ215aによるエコーキャンセル処理後の残留エコーに基づいて、エコーキャンセル装置215を制御しているが、以下に説明する変形例5のように、スピーカ18aから出力された受信音がマイク20aから入力されたときの第1エコーキャンセラ215aによるエコーキャンセル処理後の残留エコーに基づいて、エコーキャンセル装置215を制御しても良い。変形例5の音響制御装置は、変形例4の音響制御装置400と同様の構成を有している。
以下に、変形例5の音響制御装置におけるエコーキャンセル度設定処理について、図21を参照して説明する。図21のフローチャートは、音響制御装置のコントローラ412によって実行される処理アルゴリズムに基づいている。ここでの制御は、相手先から受信し、音響制御装置に受信信号が送信されたときに開始される。なお、受信信号は、相手先との接続が完了するまでの間、音響制御装置に繰り返し送信される。
最初のステップS51では、スピーカ18aに受信信号を送信する。このとき、スピーカ18aから受信音が出力(再生)されマイク20aから入力(収音)され音信号(入力音信号)に変換される。そして、この入力音信号は、第1エコーキャンセラ215a、コントローラ412に送られる。なお、ここでは、受信信号は、複数の周波数のトーン信号で構成されている(図15参照)。
次のステップS52では、相手先と接続を完了しているか否か(上記容認に関する項目を選択、決定しているか否か)を判断する。通常、受信後、相手先と接続が完了するまでには、数秒〜数十秒程度要すると考えられる。ステップS52での判断が肯定されると、フローは、終了する。一方、ステップS52での判断が否定されると、ステップS53に移行する。
ステップS53では、第1エコーキャンセラ215aによる入力音信号に対するエコーキャンセル処理後の残留エコーを測定する。
次のステップS54では、残量エコーが閾値未満か否かを判断する。ステップS54での判断が肯定されると、ステップS55に移行する。一方、ステップS54での判断が否定されると、ステップS56に移行する。
ステップS55では、第1エコーキャンセラ215aを選択する(エコーキャンセル度を低めに設定する)。すなわち、残留エコーが閾値未満の場合には、歪成分のエコーが相手先に送信されたとしてもほとんど不快感を与えることがない。そこで、第1エコーキャンセラ215aを選択し、タブルトークを可能にしている。ステップS55が実行されると、ステップS52に戻る。
ステップS56では、第2エコーキャンセラ215bを選択する(エコーキャンセル度を高めに設定する)。すなわち、残留エコーが閾値以上の場合には、歪成分のエコーが相手先に送信されると不快感を与えてしまう。そこで、エコーキャンセル度が強めに設定された第2エコーキャンセラ215bを選択し、通話(特にタブルトーク)よりもエコー除去を優先し、残留エコーを低減している。ステップS56が実行されると、ステップS52に戻る。
なお、ステップS53、S54、S55の一連の処理又はステップS53、S54、S56の一連の処理に要する時間、すなわちエコーキャンセル度の設定に要する時間は、受信信号の1サイクルの時間よりも短いため、ステップS52での判断が肯定されるまでに(テレビ会議開始前に)、該一連の処理(エコーキャンセル度の設定)を少なくとも1回行うことが可能である。
なお、第1エコーキャンセラ215aによるエコーキャンセル処理結果として、残留エコーに代えて、エコーキャンセル量を測定する場合には、測定されたエコーキャンセル量が閾値以上の場合に第1エコーキャンセラ215aを選択し、該閾値未満の場合に第2エコーキャンセラ215bを選択すれば良い。また、残留エコーに代えて、第1エコーキャンセラ215aを介した入力音信号の信号レベルを測定する場合には、測定された信号レベルが閾値(例えば−60dBov)以上の場合に、第2エコーキャンセラ215bを選択し、該閾値未満の場合に第1エコーキャンセラ215aを選択すれば良い。
なお、上記変形例4及び5では、エコーキャンセル処理結果(残留エコー、エコーキャンセル量、エコーキャンセル装置215を介した入力音信号)に基づいてエコーキャンセル装置215を制御しているが、エコーキャンセル処理結果に基づいてイコライザ204を制御しても良い。具体的には、エコーキャンセル処理結果が閾値未満の場合にイコライザ204による信号レベルの調整量を小さく(0を含む)設定し、エコーキャンセル処理結果が閾値以上の場合にイコライザ204による信号レベルの調整量を大きくしても良い。
また、上記変形例4及び5では、第1エコーキャンセラ215aによるエコーキャンセル処理結果に基づいてエコーキャンセル装置215を制御しているが、これに代えて、第2エコーキャンセラ215bによるエコーキャンセル処理結果に基づいてエコーキャンセル装置215を制御しても良い。
また、上記変形例2〜5では、音響制御装置は、ノイズキャンセラ202、イコライザ204を有しているが、これらの少なくとも一方を有していなくても良い。
なお、上記変形例2〜5では、エコーキャンセル度を設定するために、第1及び第2エコーキャンセラ215a、215bのうちいずれかを選択することとしているが、これに代えて、例えば、単一のエコーキャンセラを用い、該エコーキャンセラの適応フィルタの係数を変化させることとしても良い。
また、上記変形例2〜5では、エコーキャンセル装置は、エコーキャンセル度が互いに異なるエコーキャンセラを2つ有しているが、3つ以上有していても良い。例えば、エコーキャンセル度が第1及び第2エコーキャンセラ215a、215bのエコーキャンセル度の間の高さであって、ダブルトークをある程度許容する第3エコーキャンセラ215cを追加しても良い。そして、第1〜第3エコーキャンセラ215a〜215cのいずれか(例えば第3エコーキャンセラ215c)を初期設定のエコーキャンセラとし、測定された高調波歪率やエコーキャンセル処理結果に基づいて、初期設定のエコーキャンセラから残りの2つのエコーキャンセラのいずれかに変更するようにしても良い。
なお、上記実施形態及び各変形例では、スピーカ18aからテスト音(発信音又は受信音)を出力させ、該テスト音をマイク20aから入力しているが、これに限られない。例えば、テレビ会議装置10に外部スピーカを接続し、該外部スピーカからテスト音を出力させ、該テスト音をマイク20aから入力しても良い。また、テレビ会議装置10に外部マイクを接続し、スピーカ18aからテスト音を出力させ、該テスト音を外部マイクから入力しても良い。また、テレビ会議装置10に外部スピーカ及び外部マイクを接続し、外部スピーカからテスト音を出力させ、該テスト音を外部マイクから入力しても良い。また、テレビ会議装置10に外部マイクスピーカを接続し、該外部マイクスピーカのスピーカからテスト音を出力させ、該テスト音を外部マイクスピーカのマイクから入力しても良い。
また、テレビ会議装置10は、スピーカ18a及びマイク20aを有しているが、これらの少なくとも一方を有していなくても良い。スピーカ18aを有していない場合は、その代わりに外部スピーカ又は外部マイクスピーカを用意することが望ましい。マイク20aを有していない場合は、その代わりに外部マイク又は外部マイクスピーカを用意することが望ましい。
以上のように、ユーザがどのような外部音響機器(例えば外部スピーカ、外部マイク、外部マイクスピーカ等)をテレビ会議装置10に接続するかを事前に把握することが難しく、外部音響機器に合わせたチューニングを事前に行うことは困難である。そこで、テレビ会議装置10は、上記実施形態及び各変形例の音響制御装置を備えているため、外部音響機器が接続された場合にも、上記実施形態及び各変形例と同様の効果を得ることができる。すなわち、本発明は、通信装置や音響装置に接続された外部音響機器の筐体、内蔵部品等に生じ得るビビリに対しても有効である。
また、上記実施形態及び各変形例では、高調波歪率又は残留エコーを測定し、その測定結果に基づいてイコライザ204又はエコーキャンセル装置215を制御しているが、要は、高調波歪率及びエコーキャンセル処理結果(残留エコー、エコーキャンセル量、エコーキャンセル装置215を介した入力音信号)の少なくとも一方を測定し、これらの測定結果に基づいてイコライザ204及びエコーキャンセル装置215の少なくとも一方を制御しても良い。
また、エコーキャンセラ206やエコーキャンセル装置215に加えて、エコーサプレッサを設けても良い。エコーサプレッサは、エコーキャンセラの適応フィルタでの消し残しを小さくする処理を行う。
ところで、テスト音(発信音や受信音)の収音時に、周囲環境ノイズや話し声等を収音してしまうと、高調波歪率の測定精度が落ちる。そこで、図22(A)に示される変形例6の音響制御装置500のように、スピーカ18aから出力されたテスト音がマイクから入力され変換された入力音信号に対して、ノイズキャンセラ202によりノイズ除去処理を施した後、高調波歪率を高調波歪率測定部210で測定することとしても良い。また、図22(B)に示される変形例7の音響制御装置600のように、スピーカ18aから出力されたテスト音がマイクから入力され変換された入力音信号に対して、音抽出部203により音抽出処理(音源分離の処理)を施した後、高調波歪率を高調波歪率測定部210で測定することとしても良い。結果として、高調波歪率の測定精度を向上できる。
但し、高調波歪(歪成分)は限られるため、周囲環境ノイズや話し声を収音してしまったとしても、高調波すなわち元の成分の整数倍の信号は限られるため、高調波歪率を測定することは可能である。
また、高調波歪率や残留エコー(又はエコーキャンセル量)の測定値は、イコライザ204やエコーキャンセル装置215の制御に用いるだけでなく、例えばコントローラがユーザに測定値と閾値との比較結果を通知するようにしても良い。例えば、エコーキャンセル量が閾値よりも少なければ、ユーザに対してエコーが発生していることを通知することができる。エコーはシステムに問題がある拠点側ではなく、相手側の正常なシステムにて確認される現象である。問題のある拠点のユーザは、自拠点の端末(テレビ会議装置10)が原因でエコーが発生していることを認識できないため、エコー発生の通知は有効である。エコーの発生を知ったユーザは、エコーに対する措置、例えばボリュームボタン62a、62bの操作によるスピーカの音量調整やマイクの感度調整(但し、マイクの感度調整機能が必要)を講ずることができる。
なお、ユーザへの通知は、例えばプロジェクタP、モニタ装置、パソコン等の画像表示機器に表示させることやスピーカ18aから音声を出力させることで行うことができる。
また、コントローラがエコーの発生を他拠点(相手先)に通知することで、他拠点のユーザに端末(テレビ会議装置10)のスピーカのボリューム調整やマイクの感度調整を促すことができる。なお、他拠点の端末のマイクの感度調整によって、自拠点のスピーカの音量調整と同じ効果が得られる。また、一拠点の端末のマイクの感度調整によって、他拠点の端末のスピーカの音量調整と同じ効果が得られる。
また、コントローラが高調波歪率や残留エコー(又はエコーキャンセル量)の測定値をログデータとして、ネットワーク(例えばインターネット)を介してメーカ(製造元)に送信しても良い。この場合、メーカは送信されたログデータから異常内容や原因を解析でき、通信装置の製造(例えば筐体や内蔵部品の構造設計、材料選択、内蔵部品の取り付け構造等)にフィードバックすることが可能となる。
また、上記実施形態及び各変形例では、高調波歪率やエコーキャンセル処理結果に基づいて、イコライザ204やエコーキャンセル装置215を制御しているが、これに代えて、マイク20aの感度やスピーカ18aの音量(ボリューム)を制御(自動で調整)することとしても良い。この場合、歪成分やそのエコーを除去することはできないが、ビビリ音等の不快な音の音量レベルが低減されるため、結果として、音質の劣化を抑制できる。なお、マイク20aの感度の周波数特性やスピーカの音圧レベルの周波数特定を調整すれば、音声の歪成分のみを聞こえ難くすることができる。
また、上記実施形態及び各変形例におけるイコライザ204に代えて、該イコライザ204と同様の機能を有する、入力音信号の信号レベルの周波数特性を機械的に調整可能な構造物を用いても良い。
また、上記実施形態及び変形例では、スピーカから出力させるテスト音として、発信音や受信音を用いているが、これに限らず、例えば、装置の起動音や終了音、挿入音、効果音、警告音等を用いても良い。そして、テスト音の信号データは、予めメモリ等(例えばフラッシュメモリ105、ROM102、HDD106等)に格納しておき、必要に応じてスピーカに送信できるようにしておくことが好ましい。なお、テスト音は、装置起動後、装置の実使用前にスピーカで再生されマイクで収音されることが好ましいが、装置の実使用中や装置の実使用後にスピーカで再生されマイクで収音されても良い。
また、上記実施形態及び各変形例では、カメラ16、マイク20a及びスピーカ18a、制御装置24は、筐体25に一体的に設けられているが、これらの少なくとも1つは、筐体と別体であっても良い。
また、上記実施形態及び各変形例では、テレビ会議装置10は、一室内で用いられているが、これに限定されない。テレビ会議装置10は、上述の如く、携帯性に優れるため、特定の会議室内に据え置かれる必要はなく、自由に持ち運びし、様々な場所で用いられることが期待できる。すなわち、テレビ会議装置10は、非常にユーティリティーに富む。
また、上記実施形態及び各変形例では、本発明は、いわゆるポータブルタイプ(可搬型)のテレビ会議装置10に適用されたが、本発明は、いわゆる据え置き型のテレビ会議装置にも適用できる。
また、上記実施形態及び各変形例では、通信装置として、テレビ会議装置10が採用されているが、これに限られない。例えば、通信網としての電話回線を介して音声の送受信のみを行う電話会議装置が採用されても良い。すなわち、本発明の通信装置は、少なくとも音声の送受信による情報共有に用いられるコミュニケーションツールとして多様な態様で使用可能である。
以上の説明から明らかなように、本発明は、スピーカから出力される音及びマイクから入力された音の少なくとも一方に対して音響処理を行う音響制御装置全般、該音響制御装置と、スピーカ及びマイクの少なくとも一方とを備える音響装置全般、該音響制御装置と、少なくとも音声の送受信が可能な通信部とを備える通信装置全般に適用可能である。
具体的には、本発明の音響装置、通信装置としては、テレビ会議装置10のようなテレビ会議用の端末に限られない。本発明の音響装置としては、例えばスピーカ及びマイクの少なくとも一方を備えるオーディオ機器、PC(パーソナルコンピュータ)、スマートフォン、タブレット等であっても良い(但し、スピーカ及びマイクの一方を有しない場合は外部スピーカ、外部マイク又は外部マイクスピーカが必要)。また、本発明の通信装置としては、例えばPC(パーソナルコンピュータ)、スマートフォン、タブレット等であっても良いし、例えば会議アプリ等の通信用のソフトウエアがインストール、ダウンロードされたものであっても良い(但し、スピーカ及びマイクの一方を有しない場合は外部スピーカ、外部マイク又は外部マイクスピーカが必要)。
また、実施形態及び各変形例のテレビ会議装置(通信装置、音響装置ともいう)で実施されるフローを実行するプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供される。
また、本実施形態及び各変形例のテレビ会議装置(通信装置、音響装置ともいう)で実施されるフローを実行するプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また、本実施形態のテレビ会議装置(通信装置ともいう)で実施されるフローを実行されるプログラムをインターネット等のネットワーク経由で提供または配布するように構成しても良い。
また、本実施形態のテレビ会議装置(通信装置、音響装置ともいう)で実施されるフローを実行されるプログラムを、フラッシュメモリ、ROM等に予め組み込んで提供するように構成しても良い。
10…テレビ会議装置(音響装置、通信装置)、18a…スピーカ、20a…マイク、25…筐体、110…ネットワークI/F(通信部の一部)、120…音声入出力I/F(通信部の一部)、202…ノイズキャンセラ、203…音抽出部、204…イコライザ(音響処理部の一部)、210…高調波歪率測定部(測定部)、215…エコーキャンセル装置(音響処理部の一部)、220…残留エコー測定部(測定部)、212、312、412…コントローラ(制御部)。
Claims (18)
- スピーカから出力される音及びマイクから入力された音の少なくとも一方に対して音響処理を施す音響処理部と、
前記スピーカから出力され前記マイクから入力されたテスト音に関する音響パラメータを測定する測定部と、
前記測定部での測定結果に基づいて前記音響処理部を制御する制御部と、を備える音響制御装置。 - 前記音響処理部は、前記スピーカに送信される音信号及び前記マイクで変換された音信号の少なくとも一方の信号レベルを調整するイコライザを含み、
前記音響パラメータは、前記テスト音が前記マイクで変換されたテスト音信号の高調波歪率を含むことを特徴とする請求項1に記載の音響制御装置。 - 前記音響処理部は、前記スピーカから出力された音が前記マイクから入力されることで発生するエコーをキャンセルするエコーキャンセル装置を含み、
前記音響パラメータは、前記テスト音が前記マイクで変換されたテスト音信号の高調波歪率を含むことを特徴とする請求項1に記載の音響制御装置。 - 前記音響処理部は、前記スピーカから出力された音が前記マイクから入力されることで発生するエコーをキャンセルするエコーキャンセル装置を含み、
前記音響パラメータは、前記テスト音が前記マイクで変換されたテスト音信号に対する前記エコーキャンセル装置によるエコーキャンセル処理結果を含むこと特徴とする請求項1に記載の音響制御装置。 - 前記音響処理部は、前記スピーカに送信される音信号及び前記マイクで変換された音信号の少なくとも一方の信号レベルを調整するイコライザと、前記スピーカから出力された音が前記マイクから入力されることで発生するエコーをキャンセルするエコーキャンセル装置とを含み、
前記音響パラメータは、前記テスト音が前記マイクで変換されたテスト音信号に対する前記エコーキャンセル装置によるエコーキャンセル処理結果を含むこと特徴とする請求項1に記載の音響制御装置。 - 前記マイクから入力された音からノイズを除去するノイズキャンセラを更に備え、
前記測定部は、前記ノイズキャンセラによるノイズの除去が行われた前記テスト音信号の高調波歪率を測定することを特徴とする請求項2又は3に記載の音響制御装置。 - 前記マイクから入力された音からノイズ以外の音を抽出する音抽出部を更に備え、
前記測定部は、前記音抽出部によるノイズ以外の音の抽出が行われた前記テスト音信号の高調波歪率を測定することを特徴とする請求項2又は3に記載の音響制御装置。 - 前記制御部は、前記エコーキャンセル装置に前記テスト音の音響経路について予め学習させることを特徴とする請求項3〜5のいずれか一項に記載の音響制御装置。
- 前記制御部は、前記測定結果と閾値とを比較し、その比較結果に基づいて前記音響処理部を制御することを特徴とする請求項1〜8のいずれか一項に記載の音響制御装置。
- 前記制御部は、前記比較結果を通知可能であることを特徴とする請求項9に記載の音響制御装置。
- 請求項1〜10のいずれか一項に記載の音響制御装置と、
前記スピーカ及び前記マイクの少なくとも一方と、を備える音響装置。 - 前記テスト音は、当該音響装置の起動音又は終了音であることを特徴とする請求項11に記載の音響装置。
- 請求項1〜10のいずれか一項に記載の音響制御装置と、
通信網を介して受信した音信号を前記音響制御装置を介して前記スピーカに送信し、前記マイクで変換され前記音響制御装置を介した音信号を前記通信網を介して送信する通信部と、を備える通信装置。 - 前記スピーカ及び前記マイクの少なくとも一方と、
前記音響制御装置と、前記通信部と、前記スピーカ及び前記マイクの少なくとも一方とが設けられた筐体と、を更に備えることを特徴とする請求項13に記載の通信装置。 - 前記通信部は、前記測定結果をログテータとして当該通信装置のメーカに前記通信網を介して送信可能であることを特徴とする請求項13又は14に記載の通信装置。
- 前記テスト音は、前記通信部が前記通信網を介して発信するときの発信信号が前記スピーカに送信され出力された発信音であることを特徴とする請求項13〜15のいずれか一項に記載の通信装置。
- 前記テスト音は、前記通信部が前記通信網を介して受信したときに前記スピーカに送信され出力された受信音であることを特徴とする請求項13〜15のいずれか一項に記載の通信装置。
- スピーカから出力されマイクから入力されたテスト音に関する音響パラメータを測定する工程と、
前記測定する工程での測定結果に基づいて、前記スピーカから出力される音及びマイクから入力された音の少なくとも一方に対して音響処理を施す音響処理部を制御する工程と、を含む音響制御方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014252153A JP2016116036A (ja) | 2014-12-12 | 2014-12-12 | 音響制御装置、音響装置、通信装置及び音響制御方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014252153A JP2016116036A (ja) | 2014-12-12 | 2014-12-12 | 音響制御装置、音響装置、通信装置及び音響制御方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016116036A true JP2016116036A (ja) | 2016-06-23 |
Family
ID=56142385
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014252153A Pending JP2016116036A (ja) | 2014-12-12 | 2014-12-12 | 音響制御装置、音響装置、通信装置及び音響制御方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2016116036A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019106914A1 (ja) * | 2017-11-30 | 2019-06-06 | ソニー株式会社 | 信号処理装置、信号処理方法およびプログラム |
CN111083583A (zh) * | 2019-12-18 | 2020-04-28 | 公安部第三研究所 | 一种应用于桌面鹅颈话筒式对讲终端的测试装置 |
JP2020088764A (ja) * | 2018-11-29 | 2020-06-04 | 株式会社リコー | 通信端末、通信システム、通信方法およびプログラム |
US11418870B2 (en) | 2020-02-10 | 2022-08-16 | Yamaha Corporation | Volume adjustment device and volume adjustment method |
-
2014
- 2014-12-12 JP JP2014252153A patent/JP2016116036A/ja active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019106914A1 (ja) * | 2017-11-30 | 2019-06-06 | ソニー株式会社 | 信号処理装置、信号処理方法およびプログラム |
US11270718B2 (en) | 2017-11-30 | 2022-03-08 | Sony Corporation | Signal processing apparatus and signal processing method |
JP2020088764A (ja) * | 2018-11-29 | 2020-06-04 | 株式会社リコー | 通信端末、通信システム、通信方法およびプログラム |
JP7196573B2 (ja) | 2018-11-29 | 2022-12-27 | 株式会社リコー | 通信端末、通信システム、通信方法およびプログラム |
CN111083583A (zh) * | 2019-12-18 | 2020-04-28 | 公安部第三研究所 | 一种应用于桌面鹅颈话筒式对讲终端的测试装置 |
US11418870B2 (en) | 2020-02-10 | 2022-08-16 | Yamaha Corporation | Volume adjustment device and volume adjustment method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5228932B2 (ja) | 音信号調整装置、プログラム及び方法、並びに、電話装置 | |
JP5776313B2 (ja) | 会議装置 | |
JP5175948B2 (ja) | 映像表示装置、ノイズ除去方法および映像表示システム | |
US8571226B2 (en) | Automatic polarity adaptation for ambient noise cancellation | |
JP5168162B2 (ja) | 音信号調整装置、プログラム及び方法、並びに、電話装置 | |
JP5877351B2 (ja) | 通信装置および通信方法 | |
JP2016116036A (ja) | 音響制御装置、音響装置、通信装置及び音響制御方法 | |
CN104052917A (zh) | 通知控制设备、通知控制方法和存储介质 | |
JP6268510B2 (ja) | 通信装置、通信方法及びプログラム | |
CA2939515A1 (en) | Microphone holding structure and electronic device | |
US20120287283A1 (en) | Electronic device with voice prompt function and voice prompt method | |
CN108845787A (zh) | 音频调节的方法、装置、终端及存储介质 | |
JP2014173709A (ja) | 吸盤及び電子機器 | |
CN114040285B (zh) | 耳机的前馈滤波器参数生成方法、设备、耳机及存储介质 | |
JP5556719B2 (ja) | 遠隔会議装置 | |
JP2014176042A (ja) | 通信装置、及び音声入出力ユニットの制御方法 | |
JP6071054B2 (ja) | 通信装置、及び音声入出力ユニットの制御方法 | |
US8848885B2 (en) | Device information communication method, video display device, and video display system | |
CN114413437B (zh) | 一种空调压缩机参数调节方法、装置及存储介质 | |
JP2013110629A (ja) | 撮像装置、音声収音方法 | |
US11388281B2 (en) | Adaptive method and apparatus for intelligent terminal, and terminal | |
WO2018090343A1 (zh) | 麦克风、音频处理的方法及装置 | |
JP2016082449A (ja) | 通信装置 | |
JP2018074220A (ja) | 音声処理装置 | |
JP5983993B2 (ja) | 会議装置 |