JP6268510B2

JP6268510B2 - 通信装置、通信方法及びプログラム

Info

Publication number: JP6268510B2
Application number: JP2013122481A
Authority: JP
Inventors: 智幸後藤
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 2013-06-11
Filing date: 2013-06-11
Publication date: 2018-01-31
Anticipated expiration: 2033-06-11
Also published as: JP2014241468A; US9288437B2; US20140362168A1

Description

本発明は、通信装置、通信方法及びプログラムに係り、更に詳しくは、少なくとも３つの拠点間での通信網を介した画像及び音声の送受信による情報共有に用いられる通信装置、通信方法及び前記通信装置で使用されるプログラムに関する。

従来、少なくとも３つの拠点間での通信網を介した画像及び音声の送受信によるテレビ会議（情報共有）を行うために任意の一拠点で用いられるテレビ会議端末装置が知られている（例えば特許文献１参照）。

このテレビ会議端末装置では、発話者がいない少なくとも１つの他拠点から送られてくる画像を所定サイズでディスプレイに表示し、発話者がいる１つの他拠点から送られてくる画像を前記所定サイズよりも大きい拡大サイズでディスプレイに表示する。

しかしながら、特許文献１に開示されているテレビ会議端末装置では、複数の他拠点に発話者がいるとき、該発話者を容易に認識することができなかった。

本発明は、少なくとも３つの拠点間での通信網を介した画像及び音声の送受信による情報共有を行うために任意の一拠点で用いられる通信装置であって、前記一拠点と異なる少なくとも２つの他拠点から前記通信網を介して個別に送られてくる少なくとも２つの音声に関する情報に基づいて、前記他拠点における発話者の有無を判定する判定手段と、前記判定手段で発話者がいないと判定された他拠点から前記通信網を介して送られてくる画像を所定サイズで表示面に表示し、前記判定手段で発話者がいると判定された他拠点から前記通信網を介して送られてくる画像を前記所定サイズよりも大きい拡大サイズで前記表示面に表示する表示手段と、を備え、前記判定手段は、前記少なくとも２つの他拠点それぞれでの音量レベルが閾値以上である状態が所定時間継続していると見做されるとき、該他拠点に発話者がいると判定し、前記表示手段は、前記判定手段で複数の他拠点に発話者がいると判定されたとき、前記複数の他拠点から前記通信網を介して個別に送られてくる複数の画像を前記拡大サイズで前記表示面に一緒に表示し、発話者がいると判定された前記複数の他拠点からの画像のうち、現に発話している発話者がいる他拠点からの画像を前記所定サイズよりも大きい第１の拡大サイズで表示し、発話を中断中の発話者がいる他拠点からの画像を前記第１の拡大サイズよりも小さく前記所定サイズよりも大きい第２の拡大サイズで表示する通信装置である。

これによれば、複数の他拠点に発話者がいるとき、該発話者を容易に認識することができる。

一実施形態に係る会議システムの構成を示す図である。図２（Ａ）及び図２（Ｂ）は、それぞれテレビ会議装置の基準形態における斜視図（その１及びその２）である。テレビ会議装置の基準形態における上面図である。テレビ会議装置の制御の構成を示すブロック図である。テレビ会議装置の基準形態における側面図（その１）である。テレビ会議装置の基準形態における側面図（その２）である。テレビ会議装置の基準状態における下面図である。テレビ会議装置の開き形態における側面図である。テレビ会議装置の最大開き形態における斜視図である。各拠点においてテレビ会議装置を用いて行われるテレビ会議の態様を示す図である。他拠点からの画像をテレビ会議装置のディスプレイに表示する際に実行される一連の処理を説明するためのフローチャートである。テレビ会議装置のディスプレイに、１つの他拠点からの画像が拡大サイズで表示され、残りの他拠点からの画像が縮小サイズで表示されている状態を示す図である。テレビ会議装置のディスプレイに、２つの他拠点からの画像が拡大サイズで表示され、残りの他拠点からの画像が縮小サイズで表示されている状態を示す図である。テレビ会議装置のディスプレイに、３つの他拠点からの画像が拡大サイズで表示され、残りの他拠点からの画像が縮小サイズで表示されている状態を示す図である。テレビ会議装置のディスプレイに、全て（９つ）の他拠点からの画像が縮小サイズで表示されている状態を示す図である。図１６（Ａ）及び図１６（Ｂ）は、それぞれ比較例のテレビ会議装置のディスプレイに１つの他拠点からの画像が拡大サイズで表示され、かつ残りの他拠点からの画像が縮小サイズで表示されている状態を示す図（その１及びその２）である。テレビ会議装置のディスプレイに、拡大サイズで表示されている１つの他拠点からの画像が拡大され、拡大サイズで表示されている別の１つの他拠点からの画像が縮小され、残りの他拠点からの画像が縮小サイズで表示されている状態を示す図である。テレビ会議装置のディスプレイに、拡大サイズで表示されている１つの他拠点からの画像が拡大され、拡大サイズで表示されている別の３つの他拠点からの画像が縮小され、残りの他拠点からの画像が縮小サイズで表示されている状態を示す図である。図１９（Ａ）〜図１９（Ｃ）は、それぞれテレビ会議装置のディスプレイに、２つの他拠点からの画像が同じ大きさの拡大サイズで表示され、該２つの他拠点を識別するための処理がなされ、残りの他拠点からの画像が縮小サイズで表示されている状態を示す図である。

以下、一実施形態を図１〜図１５に基づいて説明する。図１には、一実施形態に係る通信システムの一例としての会議システム１０００が概略的に示されている。この会議システム１０００は、少なくとも３つの拠点（例えば１０拠点）間でのネットワーク（通信網）、例えばインターネットを介したテレビ会議（情報共有）に用いられる。ここで、テレビ会議とは、動画像と音声を利用して情報共有を図るシステムである。

会議システム１０００は、図１に示されるように、一例として、複数（例えば１０個）の通信装置としてのテレビ会議装置１００を含んで構成されている。

１０個のテレビ会議装置１００は、一例として、実質的に同一の構成及び機能を有しており、インターネットを介して双方向で通信可能に接続される。

図２（Ａ）及び図２（Ｂ）には、テレビ会議装置１００の一形態（以下では、基準形態と称する）を異なる方向から見た外観が斜視図にて示されている。

テレビ会議装置１００は、図２（Ａ）及び図２（Ｂ）に示されるように、基準形態では、全体として、例えばＡ４版サイズの略矩形平板状の外形（例えば厚さが２０ｍｍ〜４０ｍｍ）を有している。

このように、テレビ会議装置１００は、基準形態において、薄型コンパクトになるように設計されている。また、テレビ会議装置１００は、後に詳述するように、基準形態と、例えば机、テーブル等の上面（載置面）上に載置された状態での使用に適した開き形態との間で形態を移行させることができる。

図３には、基準形態のテレビ会議装置１００が、水平な載置面上に載置された状態が示されている。以下、テレビ会議装置１００の長手方向をＸ軸方向、水平面内でＸ軸方向に直交する方向をＹ軸方向、Ｘ軸方向及びＹ軸方向のいずれにも直交する方向（鉛直方向）をＺ軸方向として説明する。また、テレビ会議装置１００は、特に断りがない限り、基準形態になっているものとする。

テレビ会議装置１００は、図２（Ａ）〜図３に示されるように、第１筐体１０、第２筐体１２、ディスプレイ１４、電子カメラ１６、スピーカ１８、マイク２０、制御装置２４（図４参照）などを備えている。

第１筐体１０は、一例として、図２（Ａ）及び図２（Ｂ）に示されるように、制御装置２４が収容されている制御装置収容部１０ａと、複数の操作部材が設けられている操作パネル部１０ｂとを有している。

制御装置２４は、画像データ及び音声データをエンコード処理またはデコード処理をして、インターネットを介した画像及び音声の送受信を制御する。

この制御装置２４は、図４に示されるように、制御用基板としてのメインボード６２、音声処理用及び操作用基板としてのサブボード６３などを含む。

メインボード６２には、一例として、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）１０１、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）１０２、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）１０４、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）１０６（もしくはストレージまたは記録デバイス）、データ入出力Ｉ／Ｆ（Ｉｎｔｅｒｆａｃｅ）１０８、ネットワークＩ／Ｆ１１０、画像入力Ｉ／Ｆ１１２、音量レベル判断部１６０、表示処理部１４０及び画像出力Ｉ／Ｆ１１４の各構成要素が実装されている。ＣＰＵ１０１、ＲＯＭ１０２、ＲＡＭ１０４、ＨＤＤ１０６、データ入出力Ｉ／Ｆ１０８、ネットワークＩ／Ｆ１１０、画像入力Ｉ／Ｆ１１２及び音量レベル判断部１６０は、アドレスバス、データバス等のバスライン１１６を介して、双方向通信可能に接続されている。なお、上述した画像データは、動画または間欠画像（一定時間間隔の静止画像）のデータである。

ＣＰＵ１０１は、所定のプログラム（テレビ会議装置用プログラム）に基づいてテレビ会議装置１００全体の動作を制御する。なお、テレビ会議装置用プログラムに従ったＣＰＵ１０１の命令による、ネットワーク（例えばインターネット）を介した音声及び画像の双方向通信にかかる一連の動作は後述する。

ＲＯＭ１０２は、ＩＰＬ(ＩｎｉｔｉａｌＰｒｏｇｒａｍＬｏａｄｅｒ)等のＣＰＵ１０１の駆動に用いられるプログラムが記憶されている。ＲＡＭ１０４は、ＣＰＵ１０１のワークエリアとして使用される。

ＨＤＤ１０６は、上記テレビ会議装置用プログラム、画像データ、音声データ等の各種データが記憶される。なお、ＨＤＤ１０６に限らず、例えばＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）等を用いてもよい。上記テレビ会議装置用プログラムは、インストール可能な形式又は実行可能な形式のファイルで、例えば記録メディア等の、コンピュータで読み取り可能な記録媒体に記録して流通させるようにしてもよい。また、上記テレビ会議装置用プログラムは、ＨＤＤ１０６ではなく、ＲＯＭ１０２に記憶されるようにしてもよい。ＨＤＤ１０６は、ＣＰＵ１０１の制御にしたがってＨＤＤ１０６に対する各種データの読み出し又は書き込みを制御する。

データ入出力Ｉ／Ｆ１０８は、後述する複数のＵＳＢ端子に接続された例えばフラッシュメモリ等の記録メディアＭに対するデータの読み出し又は書き込み（記憶）を制御するとともに、ＵＳＢ端子に接続された例えばＰＣ（パーソナルコンピュータ）からのデータの他拠点のテレビ会議装置への送信を制御する。

記録メディアＭは、複数のＵＳＢ端子のうちの一のＵＳＢ端子に着脱自在となっている。なお、例えば記録メディアＭがＳＤメモリ、コンパクトフラッシュ（登録商標）などＵＳＢ端子に直接に着脱できないものであれば、ＵＳＢ端子にメモリ読書ドライブを着脱させるように構成しても良いし、別途に、テレビ会議装置１００に予めメモリ読書ドライブを設けていても良い。また、記録メディアＭとしては、ＣＰＵ１０１の制御にしたがってデータの読み出し又は書き込みを行う不揮発性メモリであれば、フラッシュメモリに限らず、ＥＥＰＲＯＭ（ＥｌｅｃｔｒｉｃａｌｌｙＥｒａｓａｂｌｅａｎｄＰｒｏｇｒａｍｍａｂｌｅＲＯＭ）等を用いてもよい。

ネットワークＩ／Ｆ１１０は、後述するＬＡＮ端子３８（例えばイーサネット（登録商標）端子）を含み、インターネットを介したデータ（画像データ及び音声データ）の入出力（送受信）を行う。なお、ネットワークＩ／Ｆ１１０としては、有線のＬＡＮ端子に接続可能なように設けても良いし、また、無線のＬＡＮに接続できる無線ＬＡＮのネットワークＩ／Ｆであっても良い。

画像入力Ｉ／Ｆ１１２は、後述する電子カメラ１６から出力される被写体の画像信号を所定の画像データとして取り込む。

音量レベル判断部１６０は、ネットワークＩ／Ｆ１１０を介して取り込まれた通信相手（他拠点）からの音声データの音量レベルが所定の閾値以上であるか否かを判断し、その判断結果を、表示処理部１４０に送る。

表示処理部１４０は、後に詳述するように、音量レベル判断部１６０での判断結果に基づいて、ネットワークＩ／Ｆ１１０を介して取り込まれた他拠点からの画像データを画像としてディスプレイ１４の表示面に表示すべきサイズ及び位置を設定し、該画像データを画像出力Ｉ／Ｆ１１４に送る。なお、本実施形態では、後に詳述するように、表示処理部１４０とＣＰＵ１０１とを含んで構成される表示手段によって、発話者がいない他拠点からの画像がディスプレイ１４の表示面に縮小サイズ（所定サイズ）で表示され、発話者がいる他拠点からの画像が該縮小サイズよりも大きい拡大サイズで表示される。

画像出力Ｉ／Ｆ１１４は、表示処理部１４０からの画像データをディスプレイ１４で表示可能な画像信号に変換してディスプレイ１４に出力する。この結果、ディスプレイ１４の表示面には、該画像データに対応する画像が表示される。

なお、上記画像信号としては、アナログＲＧＢ信号（ＶＧＡ）、コンポーネントビデオ信号、ＨＤＭＩ（登録商標）（Ｈｉｇｈ―ＤｅｆｉｎｉｔｉｏｎＭｕｌｔｉｍｅｄｉａＩｎｔｅｒｆａｃｅ）信号、ＤＶＩ（ＤｉｇｉｔａｌＶｉｄｅｏＩｎｔｅｒａｃｔｉｖｅ）信号が挙げられる。

サブボード６３には、前述した複数の操作ボタンに対応する複数の操作端子１１８、音声入出力Ｉ／Ｆ１２０及び音声制御部１２２の各構成要素が実装されている。複数の操作端子１１８、音声制御部１２２は、バスライン１１６を介して、互いに双方向通信可能に接続され、かつメインボード６２に実装されバスライン１１６を介して接続された上記各構成要素と双方向通信可能に接続されている。

音声入出力Ｉ／Ｆ１２０は、マイク２０により入力された音声信号を所定の音声データとして取り込んで、該音声データを音声制御部１２２に送るとともに、ネットワークＩ／Ｆ１１０、音声制御部１２２を介して受信された他拠点からの音声データをスピーカ１８で再生可能な音声信号に変換する。

音声制御部１２２は、後述する一対のボリュームボタン６２ａ、６２ｂが操作されるのに伴いスピーカ１８から出力される音の音量を調整し、後述するマイクミュートボタン６４が押し下げられる（ＯＮ／ＯＦＦされる）のに伴いマイク２０による音の入力／非入力を切り替える。

また、音声制御部１２２は、他拠点のテレビ会議装置１００との双方向通信時に、スピーカ１８から出力された音がマイク２０により入力され、該他拠点のテレビ会議装置１００との間で音波のループを形成して発生するエコー、ハウリングを抑制するエコーキャンセル処理機能を有するとともに、例えば室内の空調の作動音などのマイク２０で入力された音を低減させるノイズキャンセル処理機能を有する。

制御装置収容部１０ａは、図５及び図６を総合すると分かるように、一例として、Ｘ軸方向を長手方向とする略矩形平板状の外形を有する箱形部分から成る。

また、図５に示されるように、制御装置収容部１０ａの＋Ｘ側の側壁には、４つの開口が形成されており、該４つの開口には、それぞれメインボード６２に実装されている通信用のＬＡＮ端子３８、ＨＤＭＩ（登録商標）用の画像出力端子４０、ＶＧＡの画像出力端子４２、電源端子４４（電源ジャック）が嵌め込まれている。画像出力端子４０、４２に代えて又は加えて、ＤＶＩ―Ｉ端子、コンポーネント端子、Ｄ端子、Ｓ端子、コンポジット端子が設けられていても良い。

図６に示されるように、制御装置収容部１０ａの−Ｙ側の側壁の−Ｘ側の端部には、一例として、２つの開口が形成されており、該２つの開口には、それぞれメインボード６２に実装されているＵＳＢ端子２８、３０が嵌め込まれている。また、制御装置収容部１０ａの−Ｙ側の側壁の＋Ｘ側の端部には、一例として、３つの開口が形成されており、該３つの開口には、それぞれメインボード６２に実装されているヘッドフォン接続用端子３２、マイク接続用端子３４、ＵＳＢ端子３６が嵌め込まれている。

また、図７に示されるように、一例として、制御装置収容部１０ａの−Ｚ側の壁（底壁）の４隅には、４つの開口が形成されており、該４つの開口には、外付け用のバッテリを接続するための、メインボード６２に実装された４つのコネクタ４６が嵌め込まれている。

操作パネル部１０ｂは、図３、図５及び図６を総合すると分かるように、Ｘ軸方向を長手方向とする細長い略矩形平板状の外形を有する箱形部分から成り、制御装置収容部１０ａの−Ｙ側の端部の＋Ｚ側の端に連続している。

操作パネル部１０ｂの＋Ｚ側の壁の−Ｘ側の領域には、図３に示されるように、一例として、５つの開口がＸ軸方向に並べて形成されており、該５つの開口には、５つの操作部材が個別に嵌め込まれている。これら５つの操作部材は、一例として、−Ｘ側から＋Ｘ側にかけて順に、電源ボタン４８、メニューボタン５０、カーソル５２、決定ボタン５４、通信相手とのインターネット回線を切断するための切断ボタン５６となっている。

電源ボタン４８は、テレビ会議装置１００に対する電源のＯＮ／ＯＦＦを行うための操作部材である。操作パネル部１０ｂにおける電源ボタン４８の近傍には、電源ＯＮ時に点灯する電源ランプ４９が設けられている。

メニューボタン５０は、ディスプレイ１４にメニュー画面を呼び出すための操作部材である。

カーソル５２は、ディスプレイ１４に表示されるメニュー画面内に表示された項目を選択するための操作部材である。すなわち、カーソル５２を操作することで、メニュー画面内の項目を選択できるようになっている。

決定ボタン５４は、メニュー画面内において選択された項目を決定するための操作部材である。メニュー画面内において選択及び決定される項目としては、例えば、他の拠点のテレビ会議装置１００の宛先などが挙げられる。

切断ボタン５６は、通信相手のテレビ会議装置１００とのインターネット回線を切断するための操作部材である。

操作パネル部１０ｂの＋Ｚ側の壁の＋Ｘ側の領域には、一例として、５つの開口がＸ軸方向に並べて形成されており、該５つの開口には、５つの操作部材が個別に嵌め込まれている。これら５つの操作部材は、一例として、−Ｘ側から＋Ｘ側にかけて順に、ビュー切換ボタン５８、明度調整ボタン６０、一対のボリュームボタン６２ａ、６２ｂ、マイクミュートボタン６４となっている。

ビュー切換ボタン５８は、電子カメラ１６によって取り込まれた画像のうち、他の拠点に送信する画像を切り換えるための操作部材である。すなわち、例えばある拠点に複数のユーザ（会議参加者）がいる場合に、ビュー切換ボタン５８を押すことで、複数のユーザの少なくとも１人が選択的に表示された複数の画像のうちいずれかを他の拠点に送信することができる。

明度調整ボタン６０は、ディスプレイ１４に表示される画像の明度を調整するための操作部材である。テレビ会議装置１００の周囲の明るさに応じて明度調整ボタン６０を適宜押圧することで、ディスプレイ１４の画面の明るさを視認性の良い適切な明るさに調整することができる。ここでは、一例として、明度調整ボタン６０で調整される明度がＮ段階（Ｎは、自然数）に設定されており、明度調整ボタン６０が押圧される度に、明度が段階的に高く又は低くなり、明度調整ボタン６０がＮ回押圧されると、元の明度に戻るようになっている。

一対のボリュームボタン６２ａ、６２ｂは、スピーカ１８から出力される音の音量を調整するための操作部材である。一対のボリュームボタン６２ａ、６２ｂのうち、−Ｘ側のボリュームボタン６２ａを押圧することで、上記音量を下げることができ、＋Ｘ側のボリュームボタン６２ｂを押圧することで、上記音量を上げることができる。

マイクミュートボタン６４は、マイク２０のＯＮ／ＯＦＦを切り替えるための操作部材である。なお、マイク２０がＯＮとは、マイク２０を介して音声が入力される状態を意味し、マイク２０がＯＦＦとは、マイク２０を介して音声が入力されない状態を意味する。

第２筐体１２は、図２（Ａ）及び図２（Ｂ）に示されるように、ディスプレイ１４、電子カメラ１６の一部、スピーカ１８の一部、マイク２０の一部が収容されている第１収容部１２ａと、電子カメラ１６の残部（撮影レンズ１６ａを除く）、スピーカ１８の残部、マイク２０の残部が収容されている第２収容部１２ｂとを有している。

第１収容部１２ａは、図３、図５及び図６を総合すると分かるように、Ｘ軸方向を長手方向とする略矩形平板状の外形を有する箱形部分から成り、制御装置収容部１０ａの＋Ｚ側であって、操作パネル部１０ｂの＋Ｙ側に位置している。ここでは、一例として、テレビ会議装置１００が基準形態のとき、第１収容部１２ａの−Ｚ側の面は、制御装置収容部１０ａの＋Ｚ側の面に当接している。

第１収容部１２ａ内のほぼ中央には、ディスプレイ１４がＸＹ平面に平行な状態で収容されている。

ディスプレイ１４は、一例として、画像が表示される表示面を有する液晶パネルと、該液晶パネルを挟む位置に配置された２つの電極と、該２つの電極を挟む位置に配置された２つの偏光板とを含む液晶構造体、及び該液晶構造体の一側に配置されたバックライトを含み、全体として、平板状の外形を有している。すなわち、ディスプレイ１４は、いわゆる液晶ディスプレイである。

第１収容部１２ａの＋Ｚ側の面には、一例として、ディスプレイ１４よりも一回り以上大きな矩形開口が形成されており、該矩形開口には、強化プラスチックからなるカバーパネル２６が嵌め込まれている。すなわち、ディスプレイ１４は、カバーパネル２６によって＋Ｚ側から覆われている。カバーパネル２６は、ディスプレイ１４に対応（対向）する部分が透明となっており、該部分を取り囲む部分が例えば黒色となっている。以下では、カバーパネル２６の透明部分をクリアパネル部ＣＰと称し、カバーパネル２６の黒色部分をブラックパネル部ＢＰと称する。この場合、ディスプレイ１４の液晶パネルは、＋Ｚ側からクリアパネル部ＣＰを介して視認可能となっている。

第２収容部１２ｂは、図５及び図６を総合すると分かるように、Ｘ軸方向を長手方向とする略矩形平板状の箱形部分から成り、第１収容部１２ａの＋Ｙ側の端部の−Ｚ側の端に連続している。すなわち、第２収容部１２ｂは、第１収容部１２ａの−Ｚ側の端よりも−Ｚ側に突出している。

図３、図５及び図６を総合すると分かるように、第１収容部１２ａの＋Ｙ側の端部と第２収容部１２ｂとで形成される空間のＸ軸方向の中央部には、電子カメラ１６の撮影レンズ１６ａを除く部分が収容されており、撮影レンズ１６ａはブラックパネル部ＢＰに形成された開口から第２筐体１２の外部に突出している。

撮影レンズ１６ａとしては、一例として、Ｘ軸方向の視野角が１７０°で、Ｙ軸方向の視野角が１３５°の略半球形状の広角レンズが用いられている。

図３、図５及び図６に示されるように、ブラックパネル部ＢＰにおける撮影レンズ１６ａの＋Ｙ側近傍及び−Ｙ側近傍には、撮影レンズ１６ａを保護するための一対のレンズ保護用突起６６ａ、６６ｂが突設されている。各レンズ保護用突起の外側の面は、湾曲面で構成されており、手指などが触れても、怪我をしないようになっている。

電子カメラ１６は、撮影レンズ１６ａを介して被写体（例えばユーザ、書画等）の画像を取り込み、取り込まれた画像を画像信号（電気信号）に変換して画像入力Ｉ／Ｆ１１２に出力する（図４参照）。電子カメラ１６の撮像素子としては、一例として、ＣＣＤ、ＣＭＯＳなどが用いられている。

また、図３に示されるように、第１収容部１２ａの＋Ｙ側の端部と第２収容部１２ｂとで形成される空間の−Ｘ側の端部には、スピーカ１８が、音声出力方向が概ね＋Ｚ方向となるように配置されている。

ここでは、スピーカ１８として、例えばフルレンジタイプの丸型のものが採用されているが、その他のものでも良い。スピーカ１８は、音声入出力Ｉ／Ｆ１２０に結線されており、該音声入出力Ｉ／Ｆ１２０から送信される音声信号を音声として出力する（図４参照）。

ブラックパネル部ＢＰにおけるスピーカ１８に対応する部分には、スピーカ１８から出力された音声を外部に放出するための、複数の小さな貫通孔を含んで構成される音声放出口６８が形成されている（図３参照）。

また、第１収容部１２ａの＋Ｙ側の端部と第２収容部１２ｂとで形成される空間における電子カメラ１６の＋Ｘ側の領域には、マイク２０が、音声入力方向が概ね−Ｚ方向となるように配置されている。

ここでは、マイク２０として、例えば小型の無指向性のものが採用されているが、指向性を有するものを用いても良い。マイク２０は、音声入出力Ｉ／Ｆ１２０に結線されており、入力した音声を音声信号として音声入出力Ｉ／Ｆ１２０に送信する（図４参照）。

ブラックパネル部ＢＰのマイク２０に対応する部分には、マイク２０を介して入力される音声を取り込むための、少なくとも１つの小さな貫通孔を含んで構成される音声取込口７０が形成されている。

また、ブラックパネル部ＢＰの−Ｘ側かつ−Ｙ側の角部には、外付け用バッテリの充電量の残量を表示する残量ランプ７２、インターネット回線の接続状況を表示する回線ランプ７４が設けられている。

以下では、図８に示されるように、Ｘ軸に直交し、かつカバーパネル２６に平行な軸をα軸、Ｘ軸及びα軸に直交する軸をβ軸と称して説明する。そこで、テレビ会議装置１００が基準形態のとき、α軸は、Ｙ軸に一致し、β軸は、Ｚ軸に一致する。

ここで、第１収容部１２ａの−Ｙ側の端部、すなわち−α側の端部は、Ｘ軸方向を軸方向とするトルクヒンジ（不図示）を介して第１筐体１０に接続されている。そして、ディスプレイ１４の液晶パネルは、＋β側から視認可能であり、撮影レンズ１６ａは＋β側に露出し、スピーカ１８の音声出力方向は、概ね＋β側となり、マイクの音声入力方向は、概ね−β側となる。

すなわち、第２筐体１２は、上記トルクヒンジの作用により、Ｘ軸周りに関して、第１筐体１０に当接する当接位置（図５及び図６参照）と第１筐体１０から離間する離間位置（図８参照）との間をＸ軸周りに相対回動可能となっている。そこで、以下では、第２筐体１２が離間位置に位置するときのテレビ会議装置１００の形態を、開き形態とも称する。

第２筐体１２の第１筐体１０に対するＸ軸周りの回動角度θは、テレビ会議装置１００が基準形態のとき、すなわち第２筐体１２が当接位置に位置するときをθ＝０°とすると、例えば０°≦θ≦９０°に設定されている。図９では、θ＝９０°であり、テレビ会議装置１００は、最大開き形態になっている。そして、上記トルクヒンジの作用により、第２筐体１２を第１筐体１０に対してＸ軸周りの回動角度θの位置でホールドできるようになっている。なお、第２筐体１２が当接位置に位置するときのテレビ会議装置１００の形態が基準形態である。そこで、以下では、基準形態を、閉じ形態とも称する。

以上のように構成される会議システム１０００を用いるテレビ会議の一例を、以下に説明する。ここでは、テレビ会議は、例えば１０拠点間で、各拠点に配置されたテレビ会議装置１００を用いて行われる（図１参照）。各拠点のユーザ（会議参加者）の人数は、例えば１人とされている。

各拠点のユーザは、図１０に示されるように、例えば一室に配置されたテーブルＴの−Ｙ側にテーブルＴ側を向いた状態で着座する。

ユーザは、テレビ会議装置１００を、操作パネル部１０ｂが手前側（−Ｙ側）に位置するようにテーブルＴの上面に例えば基準形態のまま載置し、第１筐体１０に対して第２筐体１２をＸ軸周りに角度φ（例えば６０°≦φ≦９０°）だけ回動させる。この結果、ディスプレイ１４は、第１筐体１０を台座として概ね−Ｙ側を向いて起立した状態、すなわち表示面が−Ｙ側から視認可能な状態となる。また、この状態では、撮影レンズ１６ａ、スピーカ１８及びマイク２０が着座したユーザの顔の高さと概ね同じ高さに位置する。さらに、この状態では、撮影レンズ１６ａは概ね−Ｙ側に向き、スピーカ１８の音声出力方向は概ね−Ｙ側となり、マイクの音声入力方向は概ね＋Ｙ側となる。

また、ユーザは、テレビ会議装置１００のテーブルＴ上への載置に併せて、テレビ会議装置１００に対する電気及び通信に関する配線の接続（例えば、ＬＡＮ端子３８とインターネットに接続される端子との結線、電源端子４４と外部電源との結線等）を行う。

次いで、ユーザは、電源ボタン４８を押してテレビ会議装置１００を起動させる。このとき、ディスプレイ１４にメニュー画面が表示される。このメニュー画面は、各種調整、会議の開始（双方向通信の開始）等の各項目がアイコンと文字情報で表示される。そこで、ユーザは、カーソル５２を操作して、上記メニュー画面上の会議の開始に関する項目を選択し、決定ボタン５４を押して、会議の開始を決定する。

会議の開始が決定されると、任意の一拠点のテレビ会議装置１００のディスプレイ１４のメニュー画面に９つの他拠点の宛先リストが表示され、一拠点のユーザは、カーソル５２を操作して、上記宛先リストからテレビ会議（双方向通信）を行いたい他拠点を選択して、決定ボタン５４を押して決定する。ここでは、９つの他拠点が選択され、決定される。この結果、一拠点のテレビ会議装置１００から９つの他拠点のテレビ会議装置１００へ双方向通信の要求が送信される。

各他拠点のテレビ会議装置１００では、その双方向通信の要求が着信すると、その要求の容認及び拒否それぞれに関する項目を、ディスプレイ１４に表示されたメニュー画面上に表示する。

そこで、各他拠点のユーザは、該他拠点のテレビ会議装置１００のカーソル５２及び決定ボタン５４を操作することにより、上記容認及び拒否それぞれに関する項目のうちのいずれかを選択、決定する。ここでは、容認に関する項目が選択、決定され、この結果、１０個のテレビ会議装置１００は、インターネットを介して互いに双方向通信可能に接続される。

１０個のテレビ会議装置１００間で双方向通信が開始されると、任意の一拠点のテレビ会議装置１００の電子カメラ１６で取り込まれた該一拠点のユーザの画像がインターネットを介して９つの他拠点のテレビ会議装置１００に送信され、該テレビ会議装置１００のディスプレイ１４に表示される。

また、任意の一拠点のテレビ会議装置１００のマイク２０で取り込まれた該一拠点のユーザの音声が、インターネットを介して９つの他拠点のテレビ会議装置１００に送信され、該テレビ会議装置１００のスピーカ１８から出力される。

このようにして、１０拠点間での画像及び音声の双方向通信によるテレビ会議が行われる。

ところで、一般に、テレビ会議装置では、複数の他拠点からの画像を表示装置（例えばモニタ）の画面に同時に視認可能に表示させる必要があり、拠点数が多くなるほど、モニタの画面に表示する各他拠点からの画像の大きさを小さくする必要がある。この場合、該画像を視認し難く、発話者がいる他拠点を音声のみによって認識することは必ずしも容易でないため、該画像を視認し易くすることが望まれる。また、複数の他拠点それぞれに発話者がいる場合、すなわち複数の他拠点同士が会話状態にある場合、いずれの他拠点同士が会話状態にあるかを視認し易くすることも望まれる。さらに、テレビ会議が会議記録として媒体に録画録音され、例えばテレビ会議に参加しなかった者等が該媒体を再生して視聴する際に、場の雰囲気をつかみ易くするため、発話者がいる拠点を視認し易くすることが望まれる。

そこで、テレビ会議装置１００では、図１１に示される制御（一連の処理）が行われる。図１１のフローチャートは、ＣＰＵ１０１の処理アルゴリズムに対応している。この制御について、以下に詳細に説明する。

最初のステップＳ１では、少なくとも１つの他拠点からの画像データ及び音声データを受信しているか否かが判断される。ネットワークＩ／Ｆ１１０で少なくとも１つの他拠点からの画像データ及び音声データが受信されていれば、ステップＳ１での判断は肯定され、ステップＳ３に移行する。一方、ネットワークＩ／Ｆ１１０で他拠点からの画像データ及び音声データが受信されていなければ、ステップＳ１での判断が否定され、フローは終了する。なお、ＣＰＵ１０１は、ネットワークＩ／Ｆ１１０での画像データ及び音声データの受信状況を常時監視している。

ステップＳ３では、音量レベル判断部１６０での判断結果に基づいて、音量レベルが所定の閾値以上の他拠点があるか否か、すなわち少なくとも１つの他拠点からの音声データの音量レベルが該閾値以上であるか否かが判断される。この閾値は、各拠点における発言者の有無を判定するための指標（基準）となる値である。ステップＳ３での判断が肯定されると、ステップＳ５に移行する。一方、ステップＳ３での判断が否定されると、ステップＳ１７に移行する。

ステップＳ５では、所定時間（例えば数秒〜数十秒）が経過したか否かが判断される。ステップＳ５での判断が肯定されると、ステップＳ７に移行する。一方、ステップＳ５での判断が否定されると、同じ判断が繰り返される。なお、ここでの計時は、例えば制御装置２４が有するタイマを用いて行われる。

ステップＳ７では、音量レベル判断部１６０での判断結果に基づいて、音量レベルが上記閾値以上の他拠点があるか否か、すなわち少なくとも１つの他拠点からの音声データの音量レベルが該閾値以上であるか否かが判断される。ステップＳ７での判断が肯定されると、ステップＳ８に移行する。一方、ステップＳ７での判断が否定されると、ステップＳ１７に移行する。

ステップＳ８では、ステップＳ７の判断時点で音量レベルが上記閾値以上の他拠点のうち少なくとも１つの他拠点の音量レベルが上記所定時間継続して該閾値以上であるか否か、すなわちステップＳ７の判断時点で音量レベルが該閾値以上の他拠点の音量レベルがステップＳ３の判断時点でも該閾値以上であったか否かが判断される。ステップＳ８での判断が肯定されると、ステップＳ９に移行する。一方、ステップＳ８での判断が否定されると、ステップＳ５に戻る。

音量レベルが上記所定時間継続して上記閾値以上の他拠点には、発話者がいると推定されるため、以下では、該他拠点を「発話者がいる他拠点」とも称する。この場合、例えば相槌、咳払い、くしゃみ等による非常に短い音声は、音量レベルが該閾値以上であっても発話に該当しないことを意味する。なお、実際には、発話の途中に（上記所定時間内に）音量レベルが上記閾値未満になることも想定されるが、ステップＳ３及びステップＳ７のいずれの判断時点でも音量レベルが閾値以上であれば、音量レベルが上記所定時間継続して上記閾値以上であると見做しても、すなわち発話が上記所定時間継続していると見做しても差し支えない。

ステップＳ９では、音量レベルが上記所定時間継続して上記閾値以上の他拠点（発話者がいる他拠点）の数が取得される。

次のステップＳ１１では、音量レベルが上記所定時間継続して上記閾値以上の他拠点の数に応じて、拡大サイズの大きさ及び拡大サイズで表示する画像の位置が設定される。

一例として、図１２に示されるように９つの他拠点のうち発話者がいる他拠点の数が１である場合には、拡大サイズは、１つの他拠点（例えば他拠点Ｄ）からの画像全体が表示面に表示可能な大きさに設定され、拡大サイズの画像が表示される位置は、任意の位置（例えば表示面の左側部分）に設定される。

また、一例として、図１３に示されるように９つの他拠点のうち発話者がいる他拠点の数が２である場合には、拡大サイズの大きさ及び該拡大サイズの画像が表示される位置は、２つの他拠点（例えば他拠点Ｄ、Ｆ）それぞれからの画像全体が異なる位置（例えば表示面の左側部分、右側部分）に例えば同じ大きさで一緒に表示されるように設定される。

また、一例として、図１４に示されるように９つの他拠点のうち発話者がいる他拠点の数が３である場合には、拡大サイズの大きさ及び該拡大サイズの画像が表示される位置は、３つの他拠点（例えば他拠点Ｂ、Ｅ、Ｈ）それぞれからの画像全体が異なる位置（例えば上側部分、左下側部分、右下側部分）に例えば同じ大きさで一緒に表示されるように設定される。

次のステップＳ１３では、音量レベルが継続して上記閾値以上の他拠点からの画像が、設定された拡大サイズで設定された位置に表示される（図１２〜図１４参照）。

次のステップＳ１５では、音量レベル判断部１６０での判断結果に基づいて、ステップＳ７の判断時点での音量レベルが上記閾値未満の他拠点があるか否か、すなわちステップＳ７の判断時点で少なくとも１つの他拠点からの音声データの音量レベルが該閾値未満であるか否かが判断される。ステップＳ７の判断時点で音量レベルが上記閾値未満の他拠点には、発話者がいないと推定できるため、以下では、該他拠点を「発話者がいない他拠点」とも称する。そこで、音量レベル判断部１６０とＣＰＵ１０１とを含んで、他拠点における発話者の有無を判定する判定手段が構成されている。ステップＳ１５での判断が肯定されると、ステップＳ１７に移行する。一方、ステップＳ１５での判断が否定されると、ステップＳ１に戻る。すなわち、発話者がいる他拠点及び該他拠点の数、及び発話者がいない他拠点及び該他拠点の数が随時検出され、その検出結果に応じて、発話者がいる他拠点が拡大サイズで、発話者がいない他拠点が縮小サイズでディスプレイ１４の表示面に表示される。このように、自拠点（一拠点）では、発話者の有無に応じて、表示面に表示される画像のサイズが拡大サイズと縮小サイズとの間で切り換えられることになる。

ステップＳ１７では、音量レベルが上記閾値未満の他拠点の数が取得される。

次のステップＳ１９では、音量レベルが上記閾値未満の他拠点の数に応じて、縮小サイズの大きさ及び縮小サイズで表示する画像の位置が設定される。

一例として、図１５に示されるように９つの他拠点のうち発話者がいない他拠点の数が９である場合には、縮小サイズの大きさ及び縮小サイズで表示する画像の位置は、９つの他拠点（例えば他拠点Ａ〜Ｉ）からの９つの画像が表示面の異なる位置に位置するように設定される。図１５では、９つの他拠点からの９つの画像は、一例として、表示面上で３×３のマトリクス状に配列されている。

また、一例として、図１２に示されるように９つの他拠点のうち発話者がいない他拠点の数が８である場合には、縮小サイズの大きさ及び縮小サイズで表示する画像の位置は、８つの他拠点（例えば他拠点Ａ、Ｂ、Ｃ、Ｅ、Ｆ、Ｇ、Ｈ、Ｉ）からの８つの画像それぞれが表示面の異なる位置に位置するように設定される。図１２では、他拠点Ａ、Ｅ、Ｇそれぞれからの画像の一部は、他拠点Ｄからの画像の影に隠れている。

また、一例として、図１３に示されるように９つの他拠点のうち発話者がいない他拠点の数が７である場合には、縮小サイズの大きさ及び縮小サイズで表示する画像の位置は、７つの他拠点（例えば他拠点Ａ、Ｂ、Ｃ、Ｅ、Ｇ、Ｈ、Ｉ）からの７つの画像それぞれが表示面の異なる位置に位置するように設定される。図１３では、他拠点Ａ、Ｂ、Ｃ、Ｅ、Ｇ、Ｈ、Ｉそれぞれからの画像の一部は、他拠点Ｄ又はＦからの画像の影に隠れている。

また、一例として、図１４に示されるように９つの他拠点のうち発話者がいない他拠点の数が６である場合には、縮小サイズの大きさ及び縮小サイズで表示する画像の位置は、６つの他拠点（例えば他拠点Ａ、Ｃ、Ｄ、Ｆ、Ｇ、Ｉ）からの６つの画像それぞれが表示面の異なる位置に位置するように設定される。図１４では、他拠点Ａ、Ｃ、Ｄ、Ｆ、Ｇ、Ｉそれぞれからの画像の一部は、他拠点Ｂ、Ｅ及びＨの少なくとも１つからの画像の影に隠れている。

次のステップＳ２１では、音量レベルが閾値未満の他拠点からの画像が、設定された縮小サイズで設定された位置に表示される（図１２〜図１５参照）。ステップＳ２１が実行された後、フローは、ステップＳ１に戻る。

以上説明したように本実施形態のテレビ会議装置１００は、少なくとも３つの拠点（例えば１０拠点）間でのインターネット（通信網）を介した画像及び音声の送受信によるテレビ会議（情報共有）を行うために任意の一拠点で用いられる通信装置であって、前記一拠点と異なる少なくとも２つの他拠点（例えば９つの他拠点）からインターネットを介して個別に送られてくる少なくとも２つ（例えば９つ）の音声データ（音声に関する情報）に基づいて、該他拠点における発話者の有無を判定する、音量レベル判断部１６０を含む判定手段と、該判定手段で発話者がいないと判定された他拠点からインターネットを介して送られてくる画像を縮小サイズ（所定サイズ）で表示面に表示し、前記判定手段で発話者がいると判定された他拠点からインターネット介して送られてくる画像を前記縮小サイズよりも大きい拡大サイズで前記表示面に表示する、表示処理部１４０を含む表示手段と、を備えている。そして、表示手段は、複数の他拠点それぞれに発話者がいるとき、前記複数の他拠点から個別に送られてくる複数の画像を前記拡大サイズで前記表示面に一緒に表示する。

この場合、複数の他拠点それぞれに発話者がいるとき、該複数の他拠点からの複数の画像が表示面に拡大サイズで一緒に表示される。

この結果、複数の他拠点に発話者がいるとき、該発話者を容易に認識（把握）することができる。すなわち、複数の他拠点同士が会話状態にあるとき、会話状態にある複数の他拠点を容易に認識（把握）することができる。

また、前記判定手段は、少なくとも２つの他拠点それぞれでの音量レベルが閾値以上である状態が所定時間継続していると見做されるとき該他拠点に発話者がいると判定するため、該判定の信頼性が高い。これに対し、仮に一の時点で音量レベルが閾値以上である他拠点を一律に発話者がいる拠点と判定すると、例えば相槌等を行っている実質的に発話者ではない会議参加者も発話者と見做されるため、実情にそぐわず、該判定の信頼性が低い。

また、前記表示手段は、前記判定手段で発話者がいると判定された他拠点の数に応じて、前記拡大サイズの大きさを設定するため、該他拠点の数によらず、該他拠点からの画像を視認し易くすることができる。

一方、図１６（Ａ）及び図１６（Ｂ）に示される比較例では、複数の他拠点のうち音量レベルが最も大きい他拠点を発話者がいる他拠点（例えば他拠点Ａ´又は他拠点Ｂ´）とし、該他拠点のみを拡大サイズで表示し、残りの他拠点を縮小サイズで表示する。この場合、複数の他拠点に発話者がいるとき、拡大サイズで表示される画像が頻繁に切り替わるため、現に発話者がいる複数の他拠点を認識（把握）することは困難であった。また、会話状態にある複数の他拠点がいずれの他拠点であるかを認識（把握）することも困難であった。また、テレビ会議が媒体に録音録画され、該媒体を再生して視聴するとき、会話状態にある複数の他拠点がいずれの他拠点であるかを認識（把握）することが困難であった。

また、上記実施形態では、発話者がいる複数の他拠点からの画像の拡大サイズが同じ大きさに設定されているが、これに限らず、例えば、図１７に示されるように、互いに異ならせても良い。具体的には、発話者が現に発話中の他拠点（例えば他拠点Ｄ）からの画像を大きい拡大サイズで表示し、発話者が発話を中断中の他拠点（例えば他拠点Ｆ）からの画像を小さい拡大サイズで表示することとしても良い。また、発話者がいる他拠点での発話時間を計測し、発話時間が長い他拠点ほど大きい拡大サイズで表示することとしても良い。この場合、発話者がいる他拠点からの画像の拡大サイズの大きさを発話時間に応じて徐々に又は段階的に変えても良い。この場合、発話時間が長い他拠点ほど拡大サイズを大きくすることが好ましい。逆に言うと、発話時間が短い他拠点ほど拡大サイズを小さくすることが好ましい。

また、上記実施形態では、発話者がいる複数の他拠点からの画像を拡大サイズで表示面の異なる位置に表示しているが、これに限らず、例えば、図１８に示されるように、互いに少なくとも一部が重なるように表示しても良い。具体的には、現に発話中の他拠点（例えば他拠点Ｅ）からの画像を大きい拡大サイズで最前面に表示し、発話を中断中の３つの他拠点（例えば他拠点Ｆ、Ｈ、Ｉ）からの画像を小さい拡大サイズで背面に表示することとしても良い。すなわち、複数の拡大サイズの画像を少なくとも一部が重なるように表示することとしても良い。また、この場合、発話者がいる複数の他拠点での発話時間を計測し、発話時間が長い他拠点ほど大きい拡大サイズで前面に表示することとしても良い。この場合、発話者がいる他拠点からの画像の拡大サイズの大きさを発話時間に応じて徐々に又は段階的に変えても良い。この場合、発話時間が長い他拠点ほど拡大サイズを大きくすることが好ましい。逆に言うと、発話時間が短い他拠点ほど拡大サイズを小さくすることが好ましい。

また、実際には、発話の途中に（例えば発話の間等に）音量レベルが上記閾値未満になることが想定される。すなわち、ある他拠点に発話者がいる場合であっても、ステップＳ３の判断時点で音量レベルが該閾値以上であり、かつステップＳ７の判断時点で音量レベルが閾値未満になることが想定される。そこで、ステップＳ３とステップＳ５との間や、ステップＳ７とステップＳ８との間に例えばステップＳ５及びステップＳ７から成る一連のステップと同様の一連のステップを少なくとも１回行っても良い。

また、実際には、複数の他拠点それぞれに現に発話者がいる場合、該発話者同士が会話をしていることが多く、発話の時間帯は、発話者毎に異なることが想定される。そこで、図１９（Ａ）〜図１９（Ｃ）に示されるように、例えば、発話者がいる複数の他拠点からの複数の画像を同じ大きさの拡大サイズで表示する場合に、該複数の他拠点のうち発話者が現に発話中の他拠点の画像を別の他拠点の画像と識別するための処理を施すこととしても良い。この場合、例えば、発話者がいる複数の他拠点のうちステップＳ７の判断時点で音量レベルが最も大きい他拠点を発話者が現に発話中の他拠点と見做しても良い。この結果、発話者が現に発話中の他拠点を容易に視認することができる。

具体的には、発話者が現に発話中の他拠点からの画像の枠と別の他拠点からの画像の枠とを異ならせても良い。例えば、図１９（Ａ）に示されるように、発話者が現に発話中の他拠点Ｆからの画像の枠を別の他拠点Ｄからの画像の枠よりも太く表示しても良い。また、例えば、発話者が現に発話中の他拠点からの画像の枠の線と別の他拠点からの画像の枠の線とを異ならせても良い。具体的には、発話者が現に発話中の他拠点からの画像の枠を例えば実線等にし、別の他拠点からの画像の枠を例えば破線等にしても良い。また、発話者が現に発話中の他拠点からの画像の枠のみを例えば二重線等にしても良い。また、例えば、発話者が現に発話中の他拠点からの画像の枠の色と別の他拠点からの画像の枠の色とを異ならせても良い。

また、例えば、図１９（Ｂ）に示されるように、発話者が現に発話中の他拠点Ｆからの画像の解像度よりも別の他拠点Ｄからの画像の解像度を低くしても良い。また、例えば、発話者が現に発話中の他拠点からの画像の明度よりも別の他拠点からの画像の明度を低くしても良い。また、発話者が現に発話中の他拠点からの画像のフレームレートよりも別の他拠点からの画像のフレームレートを低くしても良い。この場合、一拠点でのテレビ会議装置１００のＣＰＵ１０１の負荷を低減することができ、ひいては消費電力の低減を図ることができる。

また、例えば図１９（Ｃ）に示されるように、発話者が現に発話中の他拠点Ｆからの画像に、図形、記号、文字、数字、模様、及びこれらの組み合わせ等（例えば漢字の発を図形の円で囲んだもの）を付加する処理を施しても良い。

また、上記実施形態では、一拠点において、各他拠点からの音声データの音量レベルが異なる２つの時点で（実質的に所定時間継続して）閾値以上であるか否かを判断しているが、これに限られない。例えば、他拠点において、該他拠点の音声データの音量レベルが実質的に所定時間継続して閾値以上であるか否かを判断して、該判断結果を、インターネットを介して一拠点に送信することとしても良い。この場合、一拠点のテレビ会議装置には、該他拠点における発話者の有無の判断結果が送られるため、発話者の有無を判定する判定手段が必要なく、構成及び制御を簡略化することができる。

また、上記実施形態では、テレビ会議は、１０拠点間で行われているが、これに限らず、要は、少なくとも３つの拠点間で行われれば良い。この場合も、各拠点にテレビ会議装置１００を配置することが好ましい。

また、上記実施形態では、表示手段が画像を表示する表示面は、ディスプレイ１４の表示面とされているが、これに限られない。例えば、スクリーンの表面（例えばテレビ会議装置にプロジェクタを接続した場合）、外部モニタの画面、テレビの画面、パソコンの画面等であっても良い。この場合、ディスプレイ１４は、必須ではない。また、表示面の大きさも特に限定されない。

また、上記実施形態では、ディスプレイとして、いわゆる液晶ディスプレイが採用されているが、これに限らず、例えばプラズマディスプレイ、有機ＥＬ（エレクトロルミネッセンス）ディスプレイなどの、他のディスプレイを採用しても良い。

また、上記実施形態では、電子カメラ、マイク及びスピーカは、筐体に一体に設けられているが、これらの少なくとも１つは、筐体と別体であっても良い。

また、上記実施形態では、テレビ会議装置１００は、一室内で用いられているが、これに限定されない。テレビ会議装置１００は、上述の如く、携帯性に優れるため、特定の会議室内に据え置かれる必要はなく、自由に持ち運びし、様々な場所で用いられることが期待できる。

また、上記実施形態では、本発明は、いわゆるポータブルタイプ（可搬型）のテレビ会議装置１００に適用されたが、いわゆる据え置き型のテレビ会議装置にも適用できる。

また、上記実施形態では、各拠点のユーザの数は、１人とされているが、これに限らず、複数人であっても良い。この場合、例えば、各拠点の全ユーザが表示された画像を他の拠点に送っても良いし、ビュー切換ボタン５８を操作して、該拠点の一部のユーザが表示された画像を他の拠点に送っても良い。

また、上記実施形態のテレビ会議装置（通信装置ともいう）で使用される、例えば図１１に示される一連の処理を実行するプログラムは、インストール可能な形式又は実行可能な形式のファイルでＣＤ−ＲＯＭ、フレキシブルディスク（ＦＤ）、ＣＤ−Ｒ、ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｋ）等のコンピュータで読み取り可能な記録媒体に記録されて提供される。

また、上記実施形態のテレビ会議装置（通信装置ともいう）で使用される、例えば図１１に示される一連の処理を実行するプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また、上記実施形態のテレビ会議装置（通信装置ともいう）で実施されるフローを実行されるプログラムをインターネット等のネットワーク経由で提供または配布するように構成しても良い。

また、上記実施形態のテレビ会議装置（通信装置ともいう）で使用される、例えば図１１に示される一連の処理を実行するプログラムを、ＲＯＭ等に予め組み込んで提供するように構成してもよい。

なお、上記実施形態では、本発明をテレビ会議の専用装置に適用した例を挙げて説明したが、パーソナルコンピュータ、スマートフォンなどのカメラと音声入力の機能を備えた装置であればいずれにも適用することができる。

また、上記実施形態では、テレビ会議に用いられるテレビ会議装置１００を通信装置の一例として説明したが、これに限られない。すなわち、本発明の通信装置は、少なくとも３つの拠点間での画像及び音声の送受信による情報共有に用いられるコミュニケーションツールとして多様な態様で使用可能である。

１４…ディスプレイ（表示手段の一部）、１００…テレビ会議装置（通信装置）、１１４…画像出力Ｉ／Ｆ（表示手段の一部）、１４０…表示処理部（表示手段の一部）、１６０…音量レベル判断部（判定手段の一部）、１０００…会議システム。

特開平９−２６１６０８号公報

Claims

少なくとも３つの拠点間での通信網を介した画像及び音声の送受信による情報共有を行うために任意の一拠点で用いられる通信装置であって、
前記一拠点と異なる少なくとも２つの他拠点から前記通信網を介して個別に送られてくる少なくとも２つの音声に関する情報に基づいて、前記他拠点における発話者の有無を判定する判定手段と、
前記判定手段で発話者がいないと判定された他拠点から前記通信網を介して送られてくる画像を所定サイズで表示面に表示し、前記判定手段で発話者がいると判定された他拠点から前記通信網を介して送られてくる画像を前記所定サイズよりも大きい拡大サイズで前記表示面に表示する表示手段と、を備え、
前記判定手段は、前記少なくとも２つの他拠点それぞれでの音量レベルが閾値以上である状態が所定時間継続していると見做されるとき、該他拠点に発話者がいると判定し、
前記表示手段は、
前記判定手段で複数の他拠点に発話者がいると判定されたとき、前記複数の他拠点から前記通信網を介して個別に送られてくる複数の画像を前記拡大サイズで前記表示面に一緒に表示し、
発話者がいると判定された前記複数の他拠点からの画像のうち、現に発話している発話者がいる他拠点からの画像を前記所定サイズよりも大きい第１の拡大サイズで表示し、発話を中断中の発話者がいる他拠点からの画像を前記第１の拡大サイズよりも小さく前記所定サイズよりも大きい第２の拡大サイズで表示する通信装置。
前記表示手段は、前記判定手段で発話者がいると判定された他拠点の数に応じて、前記拡大サイズの大きさを設定することを特徴とする請求項１に記載の通信装置。
前記表示手段は、前記所定サイズで表示されている他拠点からの画像を前記拡大サイズで表示するとき、該画像を徐々に大きくすることを特徴とする請求項１又は２に記載の通信装置。
前記表示手段は、前記拡大サイズで表示されている他拠点からの画像を前記所定サイズで表示するとき、該画像を徐々に小さくすることを特徴とする請求項１〜３のいずれか一項に記載の通信装置。
前記表示手段は、前記判定手段で前記複数の他拠点に発話者がいると判定されたとき、前記複数の他拠点からの複数の画像の前記拡大サイズを同じ大きさに設定し、かつ前記複数の画像のうち発話者が現に発話中の他拠点からの画像を別の他拠点からの画像と視覚的に識別するための処理を施すことを特徴とする請求項１〜４のいずれか一項に記載の通信装置。
少なくとも３つの拠点間での通信網を介した画像及び音声の送受信による情報共有を行うために任意の一拠点で用いられる通信方法であって、
前記一拠点と異なる少なくとも２つの他拠点から前記通信網を介して個別に送られてくる少なくとも２つの音声に関する情報に基づいて、該他拠点における発話者の有無を判定する工程と、
前記判定する工程で発話者がいないと判定された他拠点から前記通信網を介して送られてくる画像を所定サイズで表示面に表示し、前記判定する工程で発話者がいると判定された他拠点から前記通信網を介して送られてくる画像を前記所定サイズよりも大きい拡大サイズで前記表示面に一緒に表示する工程と、を含み、
前記判定する工程では、前記少なくとも２つの他拠点それぞれでの音量レベルが閾値以上である状態が所定時間継続していると見做されるとき、該他拠点に発話者がいると判定し、
前記表示する工程では、
前記判定する工程で複数の他拠点に発話者がいると判定されたとき、前記複数の他拠点から前記通信網を介して個別に送られてくる複数の画像を前記拡大サイズで前記表示面に一緒に表示し、
発話者がいると判定された前記複数の他拠点からの画像のうち、現に発話している発話者がいる他拠点からの画像を前記所定サイズよりも大きい第１の拡大サイズで表示し、発話を中断中の発話者がいる他拠点からの画像を前記第１の拡大サイズよりも小さく前記所定サイズよりも大きい第２の拡大サイズで表示する通信方法。
前記判定する工程では、発話者がいると判定された他拠点の数に応じて、前記拡大サイズの大きさを設定することを特徴とする請求項６に記載の通信方法。
少なくとも３つの拠点間での通信網を介した画像及び音声の送受信による情報共有を行うために任意の一拠点で用いられる通信装置で使用されるプログラムであって、
前記一拠点と異なる少なくとも２つの他拠点から個別に送られてくる少なくとも２つの音声に関する情報に基づいて、該他拠点における発話者の有無を判定する手順と、
前記判定する手順で発話者がいないと判定された他拠点から前記通信網を介して送られてくる画像を所定サイズで表示面に表示し、前記判定する手順で発話者がいると判定された他拠点から前記通信網を介して送られてくる画像を前記所定サイズよりも大きい拡大サイズで前記表示面に表示する手順と、を含み、
前記判定する手順では、前記少なくとも２つの他拠点それぞれでの音量レベルが閾値以上である状態が所定時間継続していると見做されるとき、該他拠点に発話者がいると判定し、
前記表示する手順では、
前記判定する手順で複数の他拠点に発話者がいると判定されたとき、前記複数の他拠点から個別に送られてくる複数の画像を前記拡大サイズで前記表示面に一緒に表示し、
発話者がいると判定された前記複数の他拠点からの画像のうち、現に発話している発話者がいる他拠点からの画像を前記所定サイズよりも大きい第１の拡大サイズで表示し、発話を中断中の発話者がいる他拠点からの画像を前記第１の拡大サイズよりも小さく前記所定サイズよりも大きい第２の拡大サイズで表示するプログラム。