JP2005094509A - Tv会議システム及びtv会議の実行方法 - Google Patents

Tv会議システム及びtv会議の実行方法 Download PDF

Info

Publication number
JP2005094509A
JP2005094509A JP2003326787A JP2003326787A JP2005094509A JP 2005094509 A JP2005094509 A JP 2005094509A JP 2003326787 A JP2003326787 A JP 2003326787A JP 2003326787 A JP2003326787 A JP 2003326787A JP 2005094509 A JP2005094509 A JP 2005094509A
Authority
JP
Japan
Prior art keywords
data
server
image data
valid
client
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003326787A
Other languages
English (en)
Inventor
Masaru Hasuda
大 蓮田
Yoshinari Aoshima
芳成 青嶋
Eriko Terada
絵里子 寺田
Junji Tanaka
淳史 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Maxell Holdings Ltd
Original Assignee
Hitachi Maxell Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Maxell Ltd filed Critical Hitachi Maxell Ltd
Priority to JP2003326787A priority Critical patent/JP2005094509A/ja
Publication of JP2005094509A publication Critical patent/JP2005094509A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

【課題】
安価にTV会議システムを導入することができるTV会議システム及びTV会議の実行方法を提供することを目的とする。
【解決手段】
本発明にかかるTV会議システムは、A基地2内のサーバーA、クライアントA121〜124と、B基地3内のサーバーB21、クライアントB221〜224とを有するTV会議システム1であり、サーバーA11は、クライアントA121〜124から取得した音声・画像データから有効なデータを選択して編集し、サーバーB21は、クライアントB221〜224から取得した音声・画像データから有効なデータを選択して編集する。そして、サーバーA11は、A基地2内の有効なデータと、サーバーB21から広域通信網4を介して取得したB基地3内の有効なデータとに基づいて、さらに、クライアントA121〜124に対して出力可能となるように有効なデータを選択して編集する。
【選択図】 図1

Description

本発明は、マルチ通信形態におけるTV会議システム及びTV会議の実行方法に関し、特に、複数の基地間において音声や画像等の情報を相互に通信してTV会議を実行するTV会議システム及びTV会議の実行方法に関する。
通常、複数の基地間を相互通信してTV会議を実行するためのTV会議システムは、専用の高機能な端末、カメラ、マイク等を用いて行われ、基地局内全体を撮影した画像、または発言者の声がする方向を、音声レベル等を認推してカメラレンズを向けるといった方法によって撮影した発言者の画像を、他基地局に対して送信する方法などで行われている。この専用の高機能な端末等を用いるTV会議システムの一例が、特許文献1に開示されている。このようなTV会議システムを導入する場合、専用の高機能なシステムを導入する必要があるため、膨大なコストが必要である。さらに、TV会議システムが専用のシステムであるため、会議・会話を行う場所も限定的にならざるを得なかった。
特開2001−078163号公報
このように、従来のTV会議システムでは、高価で高機能なシステムを必要とするため、安価にTV会議システムを導入することができないという問題点があった。
本発明は、このような問題点を解決するためになされたもので、安価にTV会議システムを導入することができるTV会議システム及びTV会議の実行方法を提供することを目的とする。
本発明にかかるTV会議システムは、第1の基地内に設けられた第1のサーバーと、当該第1のサーバーに対して、前記第1の基地内の通信網を介して第1の音声データ及び画像データを送信する第1のクライアントと、第2の基地内に設けられ、前記第1のサーバーと広域通信網を介して通信する第2のサーバーと、当該第2のサーバーに対して、前記第2の基地内の通信網を介して第2の音声データ及び画像データを送信する第2のクライアントとを有するTV会議システムであって、当該第1のサーバーは、前記第1のクライアントから取得した第1の音声データから有効な第1の音声データを選択するとともに、当該選択された有効な第1の音声データに基づいて、有効な第1の画像データを選択する第1のデータ選択手段と、当該第1のデータ選択手段によって選択された有効な第1の音声データ及び画像データを編集する第1のデータ編集手段とを備え、当該第2のサーバーは、前記第2のクライアントから取得した第2の音声データから有効な第2の音声データを選択するとともに、当該選択された有効な第2の音声データに基づいて、有効な第2の画像データを選択する第2のデータ選択手段と、当該第2のデータ選択手段によって選択された有効な第2の音声データ及び画像データを編集する第2の編集手段と、当該第2のデータ編集手段によって編集された第2の音声データ及び画像データを、前記広域通信網を介して前記第1のサーバーに送信する送信手段とを備え、当該第1のデータ選択手段は、前記有効な第1の音声データ及び画像データと、前記第2のサーバーから前記広域通信網を介して取得した前記有効な第2の音声データ及び画像データとに基づいて、さらに有効な第3の音声データ及び画像データを選択し、前記第1のデータ編集手段は、当該第1のデータ選択手段によって選択された有効な第3の音声データ及び画像データを、前記第1のクライアントで出力可能となるように編集するものである。
このような構成において、第1のサーバーは、第1のデータ選択手段によって第1のクライアントが出力するのに有効な音声データ及び画像データを選択し、第1のデータ編集手段によって第1のクライアントで出力できるように編集する。この選択・編集された有効な音声データ及び画像データは、第1の基地内のクライアントから音声データ及び画像データのみならず、第2の基地内のクライアントを組み込んだデータである。したがって、第1のサーバーにおいて、TV会議において必要な音声データ及び画像データを生成することができるので、安価にTV会議システムを導入することができる。
さらに、前記第1のサーバーは、前記第1のデータ編集手段によって編集された第1の音声データ及び画像データを、前記広域通信網を介して前記第2のサーバーに送信する送信手段を備え、当該第2のデータ選択手段は、前記有効な第2の音声データ及び画像データと、前記第1のサーバーから前記広域通信網を介して取得した前記有効な第1の音声データ及び画像データとに基づいて、前記有効な第3の音声データ及び画像データを選択し、前記第2のデータ編集手段は、当該第2のデータ選択手段によって選択された有効な第3の音声データ及び画像データを、前記第2のクライアントで出力可能となるように編集する。
このような構成により、第2のサーバーは第1のサーバーと同様に処理を行うことができるので、第1のサーバーとともに安価なTV会議システムを実現することができる。
好適には、前記第1のサーバーは、携帯可能なコンピュータによって構成され、前記第1のクライアントは、前記第1のサーバーと前記第1の基地内の通信網を介して通信可能な小型端末によって構成される。これにより、TV会議のために必要な専用機材を導入することなく、ノート型PC、携帯電話やPDA等の小型端末を用いて、安価なTV会議システムを実現することができる。
さらに、前記第1のデータ選択手段は、音量が所定の値よりも大きな前記第1の音声データを前記有効な第1の音声データとして選択し、当該選択された有効な第1の音声データに対応した前記第1の画像データを前記有効な第1の画像データとして選択する。
このような場合、第1のクライアントは、第1の基地内で所定の値よりも大きな声で話をしている人を発言者として選択することができ、この発言者を中心として画像データを編集することができる。
さらにまた、前記第1のサーバーは、前記第1のクライアントから取得した第1の音声データを認識可能な音声認識手段を備え、当該音声認識手段は、前記第1の音声データをファイルとしてドキュメント化するとともに、前記第1音声データに基づいて、前記第1の画像データをファイルとしてドキュメント化する。
このような構成においては、第1のクライアントから取得する音声データに基づいて、この音声データやこれに対応した画像データを直接ドキュメント化することができる。したがって、第1のサーバーは、取得した音声データ及び画像データの送信元となるクライアントを把握することができるので、ドキュメント化された音声ファイル、画像ファイルがどの参加者のものであるかを容易に把握することができる。
また、前記第1及び第2の基地内の通信網は、近距離型の無線通信網とすることができる。これにより、基地内でサーバーとクライアントとの間を繋ぐ通信ケーブルを設ける必要がなく、より安価にTV会議システムを導入することができる。また、会議の場所を限定することのない使い勝手のよいTV会議システムを構築することが可能となる。
本発明にかかるTV会議の実行方法は、第1の基地内に設けられた第1のサーバーと、当該第1のサーバーに対して、前記第1の基地内の通信網を介して第1の音声データ及び画像データを送信する第1のクライアントと、第2の基地内に設けられ、前記第1のサーバーと広域通信網を介して通信する第2のサーバーと、当該第2のサーバーに対して、前記第2の基地内の通信網を介して第2の音声データ及び画像データを送信する第2のクライアントとの間で、音声データ及び画像データを通信してTV会議を実行する方法であって、前記第1のサーバーが、前記第1のクライアントから取得した第1の音声データから有効な第1の音声データを選択する第1の音声データ選択ステップと、前記第1のサーバーが、当該第1の音声データ選択ステップにおいて選択された有効な第1の音声データに基づいて、有効な第1の画像データを選択する第1の画像データ選択ステップと、前記第1のサーバーが、当該第1の音声及び画像データ選択ステップにおいて選択された有効な第1の音声データ及び画像データを編集する第1のデータ編集ステップと、前記第2のサーバーが、前記第2のクライアントから取得した第2の音声データから有効な第2の音声データを選択する第2の音声データ選択ステップと、前記第2のサーバーが、当該第2の音声データ選択ステップにおいて選択された有効な第2の音声データに基づいて、有効な第2の画像データを選択する第2の画像データ選択ステップと、前記第2のサーバーが、当該第2の音声及び画像データ選択ステップにおいて選択された有効な第2の音声データ及び画像データを編集する第2のデータ編集ステップと、前記第2のサーバーが、当該第2のデータ編集ステップにおいて編集された第2の音声データ及び画像データを、前記広域通信網を介して前記第1のサーバーに送信する第2の送信ステップと、前記第1のサーバーが、前記有効な第1の音声データ及び画像データと、前記第2のサーバーから前記広域通信網を介して取得した前記有効な第2の音声データ及び画像データとに基づいて、さらに有効な第3のデータを選択する第3のデータ選択ステップと、前記第1のサーバーが、当該第3のデータ選択ステップにおいて選択された有効な第3のデータを、前記第1のクライアントで出力可能となるように編集するステップとを備えたものである。
このような構成において、第1のサーバーは、第1のデータ選択手段によって第1のクライアントが出力するのに有効な音声データ及び画像データを選択し、第1のデータ編集手段によって第1のクライアントで出力できるように編集する。この選択・編集された有効な音声データ及び画像データは、第1の基地内のクライアントから音声データ及び画像データのみならず、第2の基地内のクライアントを組み込んだデータである。したがって、第1のサーバーにおいて、TV会議において必要な音声データ及び画像データを生成することができるので、安価にTV会議システムを導入することができる。
さらに、本発明にかかるTV会議の実行方法は、前記第1のサーバーが、当該第1のデータ編集ステップにおいて編集された第1の音声データ及び画像データを、前記広域通信網を介して前記第2のサーバーに送信する第1の送信ステップと、前記第2のサーバーが、前記有効な第2の音声データ及び画像データと、前記第1のサーバーから前記広域通信網を介して取得した前記有効な第1の音声データ及び画像データとに基づいて、前記有効な第3のデータを選択する第4のデータ選択ステップと、前記第2のサーバーが、当該第4のデータ選択ステップにおいて選択された有効な第3のデータを、前記第2のクライアントで出力可能となるように編集するステップとを備えたものである。
このような構成により、第2のサーバーは第1のサーバーと同様に処理を行うことができるので、第1のサーバーとともに安価なTV会議を実行する方法を実現することができる。
また、前記第1の音声データ選択ステップにおいては、音量が所定の値よりも大きな前記第1の音声データを前記有効な第1の音声データとして選択し、前記第1の画像データ選択ステップにおいては、当該選択された有効な第1の音声データに対応した前記第1の画像データを前記有効な第1の画像データとして選択する。
このような場合、第1のクライアントは、第1の基地内で所定の値よりも大きな声で話をしている人を発言者として選択することができ、この発言者を中心として画像データを編集することができる。
さらに、前記第1のクライアントから取得した第1の音声データを音声認識する音声認識ステップと、当該音声認識ステップにおいて音声認識された第1の音声データをファイルとしてドキュメント化する第1のドキュメント化ステップと、前記音声認識ステップにおいて音声認識された第1の音声データに基づいて、前記第1の画像データをファイルとしてドキュメント化する第2のドキュメント化ステップとを備えている。
このような構成においては、第1のクライアントから取得する音声データに基づいて、この音声データやこれに対応した画像データを直接ドキュメント化することができる。したがって、第1のサーバーは、取得した音声データ及び画像データの送信元となるクライアントを把握することができるので、ドキュメント化された音声ファイル、画像ファイルがどの参加者のものであるかを容易に把握することができる。
本発明によれば、安価にTV会議システムを導入することができるTV会議システム及びTV会議の実行方法を提供することができる。
まず、図1を用いて、本発明にかかるTV(テレビジョン)会議システムの全体的な構成について概略的に説明する。図1は、このTV会議システムの一構成を示す模式図である。図1において、符号1によって、このTV会議システムが示されている。また、2はA基地、3はB基地、4は広域通信網である。ここで、TV会議システム1は、A基地2、B基地3の2基地間においてTV会議を実行するシステムであるが、特に2基地に限らず、2基地以上の基地間でTV会議を実行するシステムであってもよい。
図1に示すように、TV会議システム1は、A基地2内にサーバーA11、クライアントA121〜124、B基地3内にサーバーB21、クライアントB221〜224を備えている。
サーバー11,21は、ワークステーション、携帯可能なノート型PC、PDA、携帯電話等の広域通信可能な装置である。クライアント121〜124,221〜224は、カメラ付き携帯電話やPDA、デジタルビデオカメラ等のような小型端末である。なお、図1においては、複数のクライアント121〜124,221〜224が存在する構成で説明しているが、各基地2,3に1つの場合であっても、特に問題なく動作を行うことができる。
サーバー11,21は、インターネット等の広域通信網4に接続され、広域通信網4においては端末として機能している。これにより、A基地2とB基地3とは広域通信可能となっている。加えて、サーバー11,21は、無線通信機能を有し、基地2,3内の無線通信網131〜134,231〜234においてサーバーとして機能している。これにより、サーバーA11とクライアントA121〜124、サーバーB21とクライアントB211〜214とは、各基地2,3内で無線通信可能となっている。
A基地2、B基地3の各基地において、サーバー11,21は、後述するように、複数の各クライアント121〜124,221〜224から取得したデータから、必要であれば有効なデータを選択したり、さらには編集したりする。基地2,3は相互に、サーバー11,21によって、広域通信網4を利用して選択・編集したデータの送受信を行う。各基地2,3において、サーバー11,21は、無線通信網131〜134,231〜234を利用して、編集等を行った後のデータを複数の各クライアント121〜124,221〜224に対して送信することにより、会議参加者は相互に別基地のデータを主として各クライアント121〜124,221〜224を通して取得することができる。
続いて、図2を用いて、サーバー11,12の構成について詳細に説明する。図2は、このサーバー11,12の一構成例を示す模式図である。ここで、A基地2内のサーバーA11を用いて説明するが、B基地3内のサーバーB21も同様な構成を有し、ここではその説明を省略する。
図2に示すように、サーバーA11は、広域通信手段31、無線通信手段32、データ選択手段33、データ編集手段34、データ記憶手段35、音声認識手段36、操作手段37、制御手段38を備えている。
広域通信手段31は、通信モジュールであり、広域通信網4において、電話回線を利用したADSL、光ファイバ、高速通信可能な携帯電話等によって通信を行う。無線通信手段32は、無線モジュールであり、アンテナ321を介して、BIuetoothや無線LAN、UWB(Ultra−Wideband)等によって各クライアントA121〜124と無線通信を行う。
データ選択手段33は、各クライアントA121〜124から取得する画像データ、音声データ、参加者IDのようなユーザ情報等のデータから、音声の有無、音圧レベル等に応じてB基地3に送信するための有効データを選択する。データ編集手段34は、各クライアントA121〜124から取得した音声のミキシング、マルチ表示するために行うクライアントA121〜124から取得した画像データとB基地3から取得した画像データとの合成等、データ編集を行う。
また、ここではデータ選択手段33によって選択されたデータを有効データとするのに対し、データ編集手段34が編集した画像や音声を有効データとすることもできる。
データ記憶手段35は、メモリ、ハードディスク等のストレージ・デバイスから構成され、各クライアントA121〜124から取得した音声・画像データ、選択された有効データ、編集された編集後データ等を記憶する。音声認識手段36は、各クライアントA121〜124から取得したデジタル化された音声データ、データ記憶手段35に記憶された音声データをダイレクトに音声認識し、文書化等のイベント処理を行う。操作手段37は、サーバーA11を操作するためのキーボード、マウス、タッチパネル等から構成されている。制御手段38は、CPU、MPU等から構成され、上記各手段を制御してサーバーA11を動作させる。
さらに続いて、図3を用いて、クライアント121〜124,221〜224の構成について詳細に説明する。図3は、このクライアント121〜124,221〜224の一構成例を示す模式図である。ここで、A基地2内のクライアントA121を用いて説明するが、B基地3内のクライアントB221〜224も同様な構成を有し、ここではその説明を省略する。
図3に示すように、クライアントA121は、無線通信手段41、音声入力手段42、音声出力手段43、データ記憶手段44、画像入力手段45、画像出力手段46、操作手段47、制御手段48を備えている。
無線通信手段41は、サーバーA11の無線通信手段32と同仕様の無線通信手段であり、アンテナ411を介して無線通信を行う。音声入力手段42は、端末付属のマイク、もしくはヘッドセットの様に端末に接続して使用するマイク等からである。音声出力手段43は、端末付属のスピーカー、もしくはヘッドセットのようにクライアントA121に接続して使用するスピーカー等から構成される。
データ記憶手段44は、メモリ、ハードディスク等のストレージ・デバイスから構成され、音声データ、動画や静止画の画像データ、参加者IDやプロフィール等を記憶する。また、このデータ記憶手段35は、クライアントA121に対応する参加者の参加者IDを常に記憶し、必要に応じて読み出すようにすることもできる。この場合には、データ記憶手段35には、クライアントA121に対応付けられて記憶された参加者IDを読み出すアプリケーション・プログラムが記憶される。
画像入力手段45は、静止画、動画を撮影可能なCCDカメラやCMOSカメラ等から構成される。画像出力手段46は、液晶ディスプレイや有機ELディスプレイ等から構成される。また、音声出力手段43や画像出力手段46については、サーバーA11に接続する形態であってもよい。操作手段47は、キーやボタン、スイッチ、タッチパネル、リモコンなど端末を操作する手段である。制御手段48は、CPU、MPU等から構成され、上記各手段を制御してクライアントA121を動作させる。
クライアント121〜124,221〜224においては、音声入力手段42において入力された音声、画像入力手段45において入力された画像、データ記憶手段44に保存されている参加者IDのようなユーザ情報等は、これらクライアント121〜124,221〜224を使用しているユーザ情報を意味する。そのため、さらには画像の視認性を高めたり、音声の認識性を高めたりする意味でも、通常各個人とペアで使用することが想定される形態であるが、複数の会議参加者で共有して使用する形態であっても何ら問題はない。
また、発言者を断定するため生体(バイオメトリクス)情報を測定するための手段などがあってもよく、この構成は適宜変更して構わない。
次に、本発明にかかるTV会議システム1の動作処理について説明する。
まず、図4を用いて、このTV会議システム1の全体動作について説明する。図4は、TV会議システムの処理フローの一例を示すシーケンス図である。この説明に際して、TV会議システム1における通信データの一例を示す図5を適宜参照しながら説明する。
図4に示すように、まず、A基地2内において、サーバーA11は、無線通信網A131〜134を介して、各クライアントA121〜124に対して、音声データ、画像データ等の送信を要求する(S101)。このサーバーA11からの送信要求を示すデータ構成が、図5(a)に示されている。具体的には、サーバーA11から各クライアントA121〜124に対して、各クライアントA121〜124のクライアントアドレス61を宛先、サーバーA11のサーバーアドレス62を送信元として、音声データ、画像データ等の送信要求コマンド63が送信される。
各クライアントA121〜124は、この送信要求コマンドを受信すると、宛先をサーバーA11のサーバーアドレス62、送信元を各クライアントA121〜124のクライアントアドレス61として、無線通信網A131〜134を介してクライアントデータ64を送信する(S102)。このクライアントデータ64は、図5(b)に示すように、音声入力手段42によって取得された音声データ641、画像入力手段45によって取得された画像データ642、各クライアントA121〜124を操作する会議参加者を示す参加者ID643から構成されている。
このようなサーバーA11、クライアントA121〜124の間で行われるデータの送信要求、データ送信は、各クライアントA121〜124について順次行われる。また、サーバーA11は、各クライアントA121〜124から周期的にデータを取得し、例えば、このデータ取得の周期は、1.25msec〜3.75msecとすることができる。
サーバーA11は、A基地2の全てのクライアントA121〜124からクライアントデータ64を取得すると、これらのクライアントデータ64から有効なデータを選択する。この選択されたクライアントデータ64は、広域通信網4を介して、サーバーA11からB基地3のサーバーB21に対して送信される(S103)。このデータ構成が、図5(c)に示され、A基地2のクライアントデータ64は、宛先をB基地3のサーバーB21のサーバーアドレス65、送信元をA基地2のサーバーA11のサーバーアドレス62として送信される。ここで、サーバーA11からサーバーB21に対して、有効なデータを送信しているが、サーバーA11によって編集された編集後のデータを送信するようにしてもよい。また、有効なデータは、サーバーA11からサーバーB21に送信されるときにサーバーA11によって通信するためのデータに編集される。この通信するために編集された有効なデータを編集後データとすることができる。
また、サーバーA11は、データ記憶手段42にクライアントアドレス61、参加者ID643を対応させて記憶し、この対応を示すテーブルを参照してサーバーB21にクライアントデータ64を送信するようにしてもよい。
また、A基地2において、サーバーA11、各クライアントA121〜124の間において、音声データ・画像データの送受信が行われたのと同様に、B基地3においても、サーバーB21は、無線通信網B231〜234を介して、各クライアントB221〜224に対してデータの送信要求を行い(S104)、音声データ、画像データ、参加者IDを取得する(S105)。ここにおけるサーバーA11からのデータ送信要求、クライアントA121〜124からの送信データの構成は、図5(a)及び(b)と同様である。
サーバーB21は、この取得したB基地3におけるクライアントデータ66から有効なデータを選択した後、広域通信網4を介して、この有効データをA基地2のサーバーA11に送信する(S106)。この送信されるクライアントデータ66は、図5(d)に示すように、A基地2のサーバーA11のサーバーアドレス62を宛先、B基地3のサーバーB21のサーバーアドレス65として送信される。また、クライアントデータ66は、各クライアントB221〜224の音声データ661、画像データ662、B基地3の参加者ID663から構成されている。
A基地2のサーバーA11は、B基地3のサーバーB21からB基地3のクライアントB221〜224のクライアントデータ66を受信すると、後述するように、A基地2のクライアントA121〜124のクライアントデータ64と合わせて選択・編集する。サーバーA11は、無線通信網A131〜134を介して、この編集されたデータを各クライアントA121〜124に対して送信する(S107)。この送信データの構成は、図5(e)に示すように、宛先である各クライアントA121〜124のクライアントアドレス61、送信元であるサーバーA11のサーバーアドレス62、編集後データ67から構成される。
B基地3のサーバーB21もまた、A基地2のサーバーA11と同様に、A基地2のサーバーA11から送信されたクライアントデータ64とB基地3におけるクライアントデータ66とを選択・編集し、無線通信網B231〜234を介して、この編集後データを各クライアントB221〜224に送信する(S108)。
続いて、図6を用いて、TV会議システム1におけるサーバーの動作について説明する。図6はサーバーにおけるフロー制御の一例を示すフローチャートである。ここで、A基地2内のサーバーA11を用いて説明するが、B基地3内のサーバーB21も同様に動作を行い、ここではその説明を省略する。
サーバーA11は、まず、無線通信により接続された全てのクライアントA121〜124から、音声データ、画像データ、参加者ID等のユーザ情報をクライアントデータ64としての取得を行う(Sl21)。サーバーA11は、全てのクライアントA121〜124からクライアントデータ64を取得完了するまで、各クライアントA121〜124に対してデータ送信要求を繰り返し送信する(S122)。ここで、例えば、モニターするだけの会議参加者のような予め取得する必要が無いクライアントデータ64が分かっている場合には、全てのクライアントA121〜124からデータを取得しなくてもよく、全てのクライアントA121〜124というように必ずしも取得先となるクライアントA121〜124を限定するものではない。
サーバーA11は、クライアントデータ64を取得完了すると(S123)、各クライアントA121〜124から取得したクライアントデータ64から有効データを選択するデータ選択処理、この選択した有効データに基づいて音声データ、画像データを編集するデータ編集処理を実行する(S124)。具体的には、データ選択処理は、音声の有無や音圧、優先情報等から有効となるクライアントデータ64を選択して決定する処理である。データ編集処理は、A基地2の全クライアントA121〜124から取得した画像データ642、データ記憶手段35に記憶されている画像データと、B基地3から得られた画像データとの合成などを行って編集後データを生成する処理である。
このデータ編集処理は、各クライアントA121〜124から取得した全ての音声データをミキシングしたり、音量が所定の閾値を超えた音声データのみをミキシングしたりする。画像データは、音声データとリンクし、所定の閾値を超えた音声データに対応する画像データが有効なデータとなる。また、音声データに他の会議参加者の音声が混ざる場合、発声する会議参加者の近くにマイクを寄せるマイクセットを用いたり、音量が最大となる一つの音声データに限定したりしてもよい。あるいはまた、他の会議参加者の音声が混合した状態でサーバーA11に送信し、サーバーA11側で同じ音声データについてキャンセルするようにしてもよい。
サーバーA11は、データ選択処理によって有効データを決定すると(S125)、この有効データをB基地3に対して、広域通信網4を介して送信する(S126)。サーバーA11は、広域通信網4を介してB基地3から送信された有効データの有無をチェックする(S127)。B基地3から受信した有効データがあった場合には(S128)、B基地3からの有効データとともに(S128)、A基地2で取得したクライアントデータ64から選択した有効データも考慮して有効なデータを選択したり、合成するための編集を行ったりする(S129)。具体的には、サーバーA11は、A基地2の全クライアント121〜124の有効な音声データと、B基地3のサーバーB21から取得したクライアント221〜224の有効な音声データとをミキシングする。それとともに、サーバーA11は、A基地2の全クライアントA121〜124から取得した画像データ642と、B基地3から得られた画像データとを合成して編集後データを生成する。
サーバーA11は、基地2,3における全クライアント121〜124,221〜224から編集された編集後データ67を生成すると(S130)、この編集後データは、無線通信網A131〜134を介して、サーバーA11から各クライアントA121〜124に対して送信される(S131)。また、サーバー11,21において選択された有効なデータは、クライアント121〜124,221〜224に無線通信網131〜134、231〜234を介して送信するときに最終的に編集後データとなっていればよい。図6のS125においては、B基地21から有効データを受信していない場合(S127)にS131でサーバーA11がクライアントA121〜124に編集後データを送信するという意味で、S130においては、B基地21からの有効データを受信した場合(S127)にS131でクライアントA121〜124に編集後データを送信するという意味で編集後データと記載している。
また、B基地3から有効データを受信していない場合には(S128)、S124において選択・編集された編集後データが、サーバーA11から各クライアントA121〜124に対して送信される(S131)。このようなS121〜S131のデータ処理は、会議終了まで行われる(S132)。
各クライアントA121〜124は、編集後データを受信すると、この編集後データに基づいて画像出力手段46に画像を表示する。この表示画面の一例が、図7に示され、図7(a)に示す表示画面は、クライアントA122上で表示された表示画面の一例である。図7(a)に示す表示画面においては、A基地2のクライアントA121を操作する会議参加者A71と、B基地3のクライアントB222を操作する会議参加者B72とが発言している。この場合、発言者である会議参加者71,72は、それぞれ表示画面73左半分の左側画面731、右半分の右側画面732に並列に表示されている。このとき、A基地2の会議参加者71の音声、B基地3の会議参加者72の音声は、サーバーA11によってミキシングされ、クライアントA122において同時に出力される。また、S124においてサーバーA11がA基地2の各クライアント121〜124から取得した音声データから有効なデータを選択し、この有効データに基づいて画像データを編集する。
図7(b)に、表示画面の他の一例が示されている。図7(b)において、符号74によって表示画面の全体が示されている。この表示画面74は、基地2,3全体で発言者が一人のときの表示画面である。この場合には、その発言者のみが表示画面74に表示されている。例えば、A基地2のクライアントA122を操作する会議参加者A75のみが発言する場合には、図7(b)に示すように、この会議参加者A75のみが全面に表示された表示画面74が、全クライアント121〜124,221〜224上に表示される。
以上のように、本発明にかかるTV会議システム1は、サーバー11,21として広域通信機能とBluotoothや無線LANのような無線機能とが付いた携帯ノートPC程度の端末を用いるとともに、クライアント121〜124,221〜224としてサーバー11,21と同様の無線機能の付いたカメラ付き携帯端末やPDA程度の端末を用いることによって実現可能となる。そのため、専用の高機能な機材を必要とせず、導入コストも抑えることができ、安価で且つ、モビリティ性の高いTV会議システムを実現することができる。さらに、本発明にかかるTV会議システム1によれば、電話回線を利用したADSL、光ファイバ、高速通信対応の携帯電話などの広域通信が可能な場所であれば、何処でもTV会議を実行することができる。
さらにまた、会議参加者とクライアント121〜124,221〜224は1対1で対応するので、画像データや音声データの有効性も高くなり、音声データ、画像データを送信したクライアント121〜124,221〜224から発言する会議参加者を特定することができる。さらには、サーバー11,21とクライアント121〜124,221〜224とがデジタル無線通信するので、デジタルデータをダイレクトに汎用的な音声ファイルや画像ファイルとして、スムーズにドキュメント化することができ、このドキュメントがどの会議参加者のものかを容易に特定することができる。
なお、本実施の形態においてはTV画像を見ながら会議するTV会議システムについて説明したが、これに限らず、TV画像を見ながら会話するTV会話システムであってもよい。またなお、本発明は、TV画像を見ながら会議・会話するシステムであるが、これに限らず、音声のみで会議・会話するシステムとして用いることも可能である。
本発明にかかるTV会議システムの一構成例を示す模式図である。 本発明にかかるTV会議システムにおけるサーバーの一構成例を示すブロック図である。 本発明におけるTV会議システムにおけるクライアントの一構成例を示すブロック図である。 本発明におけるTV会議システムの処理フローの一例を示すシーケンス図である。 本発明におけるTV会議システムにおける通信データの一例を示す図である。 本発明におけるTV会議システムにおけるサーバーの処理フローの一例を示すフローチャートである。 本発明におけるTV会議システムにおけるクライアントの表示画面の一例を示す図である。
符号の説明
1 TV会議システム、2 A基地、3 B基地、4 広域通信網、11 サーバーA、21 サーバーB、121〜124 クライアントA、221〜224 クライアントB、131〜134 無線通信網A、231〜234 無線通信網B
31 広域通信手段、32 無線通信手段、321 アンテナ、33 データ選択手段、34 データ編集手段、35 データ記憶手段、36 音声認識手段、37 操作手段、38 制御手段、
41 無線通信手段、411 アンテナ、42 音声入力手段、43 音声出力手段、44 データ記憶手段、45 画像入力手段、46 画像出力手段、47 操作手段、48 制御手段

Claims (10)

  1. 第1の基地内に設けられた第1のサーバーと、当該第1のサーバーに対して、前記第1の基地内の通信網を介して第1の音声データ及び画像データを送信する第1のクライアントと、
    第2の基地内に設けられ、前記第1のサーバーと広域通信網を介して通信する第2のサーバーと、当該第2のサーバーに対して、前記第2の基地内の通信網を介して第2の音声データ及び画像データを送信する第2のクライアントとを有するTV会議システムであって、
    当該第1のサーバーは、前記第1のクライアントから取得した第1の音声データから有効な第1の音声データを選択するとともに、当該選択された有効な第1の音声データに基づいて、有効な第1の画像データを選択する第1のデータ選択手段と、
    当該第1のデータ選択手段によって選択された有効な第1の音声データ及び画像データを編集する第1のデータ編集手段とを備え、
    当該第2のサーバーは、前記第2のクライアントから取得した第2の音声データから有効な第2の音声データを選択するとともに、当該選択された有効な第2の音声データに基づいて、有効な第2の画像データを選択する第2のデータ選択手段と、
    当該第2のデータ選択手段によって選択された有効な第2の音声データ及び画像データを編集する第2の編集手段と、
    当該第2のデータ編集手段によって編集された第2の音声データ及び画像データを、前記広域通信網を介して前記第1のサーバーに送信する送信手段とを備え、
    当該第1のデータ選択手段は、前記有効な第1の音声データ及び画像データと、前記第2のサーバーから前記広域通信網を介して取得した前記有効な第2の音声データ及び画像データとに基づいて、さらに有効な第3の音声データ及び画像データを選択し、
    前記第1のデータ編集手段は、当該第1のデータ選択手段によって選択された有効な第3の音声データ及び画像データを、前記第1のクライアントで出力可能となるように編集するTV会議システム。
  2. 前記第1のサーバーは、前記第1のデータ編集手段によって編集された第1の音声データ及び画像データを、前記広域通信網を介して前記第2のサーバーに送信する送信手段を、さらに備え、
    当該第2のデータ選択手段は、前記有効な第2の音声データ及び画像データと、前記第1のサーバーから前記広域通信網を介して取得した前記有効な第1の音声データ及び画像データとに基づいて、前記有効な第3の音声データ及び画像データを選択し、
    前記第2のデータ編集手段は、当該第2のデータ選択手段によって選択された有効な第3の音声データ及び画像データを、前記第2のクライアントで出力可能となるように編集することを特徴とする請求項1記載のTV会議システム。
  3. 前記第1のサーバーは、携帯可能なコンピュータによって構成され、
    前記第1のクライアントは、前記第1のサーバーと前記第1の基地内の通信網を介して通信可能な小型端末によって構成されることを特徴とする請求項1又は2記載のTV会議システム。
  4. 前記第1のデータ選択手段は、音量が所定の値よりも大きな前記第1の音声データを前記有効な第1の音声データとして選択し、当該選択された有効な第1の音声データに対応した前記第1の画像データを前記有効な第1の画像データとして選択することを特徴とする請求項1乃至3のいずれかに記載のTV会議システム。
  5. 前記第1のサーバーは、さらに、前記第1のクライアントから取得した第1の音声データを認識可能な音声認識手段を備え、
    当該音声認識手段は、前記第1の音声データをファイルとしてドキュメント化するとともに、前記第1音声データに基づいて、前記第1の画像データをファイルとしてドキュメント化することを特徴とする請求項1乃至4のいずれかに記載のTV会議システム。
  6. 前記第1及び第2の基地内の通信網は、近距離型の無線通信網であることを特徴とする請求項1乃至5のいずれかに記載のTV会議システム。
  7. 第1の基地内に設けられた第1のサーバーと、当該第1のサーバーに対して、前記第1の基地内の通信網を介して第1の音声データ及び画像データを送信する第1のクライアントと、
    第2の基地内に設けられ、前記第1のサーバーと広域通信網を介して通信する第2のサーバーと、当該第2のサーバーに対して、前記第2の基地内の通信網を介して第2の音声データ及び画像データを送信する第2のクライアントとの間で、音声データ及び画像データを通信してTV会議を実行する方法であって、
    前記第1のサーバーが、前記第1のクライアントから取得した第1の音声データから有効な第1の音声データを選択する第1の音声データ選択ステップと、
    前記第1のサーバーが、当該第1の音声データ選択ステップにおいて選択された有効な第1の音声データに基づいて、有効な第1の画像データを選択する第1の画像データ選択ステップと、
    前記第1のサーバーが、当該第1の音声及び画像データ選択ステップにおいて選択された有効な第1の音声データ及び画像データを編集する第1のデータ編集ステップと、
    前記第2のサーバーが、前記第2のクライアントから取得した第2の音声データから有効な第2の音声データを選択する第2の音声データ選択ステップと、
    前記第2のサーバーが、当該第2の音声データ選択ステップにおいて選択された有効な第2の音声データに基づいて、有効な第2の画像データを選択する第2の画像データ選択ステップと、
    前記第2のサーバーが、当該第2の音声及び画像データ選択ステップにおいて選択された有効な第2の音声データ及び画像データを編集する第2のデータ編集ステップと、
    前記第2のサーバーが、当該第2のデータ編集ステップにおいて編集された第2の音声データ及び画像データを、前記広域通信網を介して前記第1のサーバーに送信する第2の送信ステップと、
    前記第1のサーバーが、前記有効な第1の音声データ及び画像データと、前記第2のサーバーから前記広域通信網を介して取得した前記有効な第2の音声データ及び画像データとに基づいて、さらに有効な第3のデータを選択する第3のデータ選択ステップと、
    前記第1のサーバーが、当該第3のデータ選択ステップにおいて選択された有効な第3のデータを、前記第1のクライアントで出力可能となるように編集するステップとを備えたTV会議の実行方法。
  8. 前記第1のサーバーが、当該第1のデータ編集ステップにおいて編集された第1の音声データ及び画像データを、前記広域通信網を介して前記第2のサーバーに送信する第1の送信ステップと、
    前記第2のサーバーが、前記有効な第2の音声データ及び画像データと、前記第1のサーバーから前記広域通信網を介して取得した前記有効な第1の音声データ及び画像データとに基づいて、前記有効な第3のデータを選択する第4のデータ選択ステップと、
    前記第2のサーバーが、当該第4のデータ選択ステップにおいて選択された有効な第3のデータを、前記第2のクライアントで出力可能となるように編集するステップとを、さらに備えたことを特徴とする請求項7記載のTV会議の実行方法。
  9. 前記第1の音声データ選択ステップにおいては、音量が所定の値よりも大きな前記第1の音声データを前記有効な第1の音声データとして選択し、
    前記第1の画像データ選択ステップにおいては、当該選択された有効な第1の音声データに対応した前記第1の画像データを前記有効な第1の画像データとして選択することを特徴とする請求項7又は8記載のTV会議の実行方法。
  10. 前記第1のクライアントから取得した第1の音声データを音声認識する音声認識ステップと、
    当該音声認識ステップにおいて音声認識された第1の音声データをファイルとしてドキュメント化する第1のドキュメント化ステップと、
    前記音声認識ステップにおいて音声認識された第1の音声データに基づいて、前記第1の画像データをファイルとしてドキュメント化する第2のドキュメント化ステップとを、さらに備えたことを特徴とする請求項7乃至9のいずれかに記載のTV会議の実行方法。
JP2003326787A 2003-09-18 2003-09-18 Tv会議システム及びtv会議の実行方法 Withdrawn JP2005094509A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003326787A JP2005094509A (ja) 2003-09-18 2003-09-18 Tv会議システム及びtv会議の実行方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003326787A JP2005094509A (ja) 2003-09-18 2003-09-18 Tv会議システム及びtv会議の実行方法

Publications (1)

Publication Number Publication Date
JP2005094509A true JP2005094509A (ja) 2005-04-07

Family

ID=34456862

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003326787A Withdrawn JP2005094509A (ja) 2003-09-18 2003-09-18 Tv会議システム及びtv会議の実行方法

Country Status (1)

Country Link
JP (1) JP2005094509A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010526506A (ja) * 2007-05-08 2010-07-29 ラドヴィジョン リミテッド マルチポイントビデオ会議ユニット機能を提供するデバイス、方法及び媒体
JP2019501584A (ja) * 2015-12-04 2019-01-17 スリング メディア,インク. 遠隔制御されるメディアスタジオ

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010526506A (ja) * 2007-05-08 2010-07-29 ラドヴィジョン リミテッド マルチポイントビデオ会議ユニット機能を提供するデバイス、方法及び媒体
JP2019501584A (ja) * 2015-12-04 2019-01-17 スリング メディア,インク. 遠隔制御されるメディアスタジオ
US10715838B2 (en) 2015-12-04 2020-07-14 Sling Media L.L.C. Remote-controlled media studio
US11153613B2 (en) 2015-12-04 2021-10-19 Sling Media L.L.C. Remote-controlled media studio

Similar Documents

Publication Publication Date Title
US8817061B2 (en) Recognition of human gestures by a mobile phone
CN101073050B (zh) 在多个显示屏上显示信息的手持无线通信装置、操作该装置的方法和操作该装置的计算机程序产品
JP4855408B2 (ja) 複数の表示画面に情報を表示する携帯無線通信装置、その携帯無線通信装置の動作方法、及び、その携帯無線通信装置を動作させるためのコンピュータプログラム
JP6179834B1 (ja) テレビ会議装置
US20140189149A1 (en) Routing of data including multimedia between electronic devices
CN112911197B (zh) 影像信息处理系统、移动通信终端和影像信息处理方法
US8754922B2 (en) Supporting multiple videoconferencing streams in a videoconference
CN102859480A (zh) 屏幕共享
US11647157B2 (en) Multi-device teleconferences
US20170279898A1 (en) Method for Accessing Virtual Desktop and Mobile Terminal
WO2011050682A1 (zh) 一种实现可视电话的方法和装置
JP2019149661A (ja) テレビ会議装置
US20100066806A1 (en) Internet video image producing method
KR101339944B1 (ko) 키보드를 이용하여 문자 대화가 가능한 화상회의 시스템
US20070120949A1 (en) Video, sound, and voice over IP integration system
JP2009253625A (ja) 情報収集・テレビ会議実施制御装置、情報収集・テレビ会議実施制御方法、情報収集・テレビ会議実施制御プログラムおよびテレビ会議システム
JP2005094509A (ja) Tv会議システム及びtv会議の実行方法
KR100678104B1 (ko) 휴대단말기에서 외부장치의 리소스 제어방법
JP2005151073A (ja) Tv電話機能付き携帯端末装置
JP6610103B2 (ja) 通信端末、通信システム、通信制御方法、及びプログラム
JP6500366B2 (ja) 管理装置、端末装置、伝送システム、伝送方法およびプログラム
JP6781318B2 (ja) 情報処理システム及び無線端末
JP2003339034A (ja) ネットワーク会議システム、ネットワーク会議方法およびネットワーク会議プログラム
KR102231666B1 (ko) 쌍방향 회의 어플리케이션을 이용한 회의 시스템
KR102201324B1 (ko) 스마트 단말기를 이용한 회의 운영 방법

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20061205