JP2005318463A - データ伝送装置およびデータ伝送方法 - Google Patents

データ伝送装置およびデータ伝送方法 Download PDF

Info

Publication number
JP2005318463A
JP2005318463A JP2004136587A JP2004136587A JP2005318463A JP 2005318463 A JP2005318463 A JP 2005318463A JP 2004136587 A JP2004136587 A JP 2004136587A JP 2004136587 A JP2004136587 A JP 2004136587A JP 2005318463 A JP2005318463 A JP 2005318463A
Authority
JP
Japan
Prior art keywords
user terminal
moving image
user
data
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004136587A
Other languages
English (en)
Other versions
JP4331049B2 (ja
Inventor
Masaki Nose
正毅 野瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2004136587A priority Critical patent/JP4331049B2/ja
Priority to US11/112,046 priority patent/US7508413B2/en
Publication of JP2005318463A publication Critical patent/JP2005318463A/ja
Application granted granted Critical
Publication of JP4331049B2 publication Critical patent/JP4331049B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • H04L65/403Arrangements for multi-party communication, e.g. for conferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/1066Session management
    • H04L65/1083In-session procedures
    • H04L65/1094Inter-user-equipment sessions transfer or sharing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/1066Session management
    • H04L65/1101Session protocols
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/414Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
    • H04N21/41407Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance embedded in a portable device, e.g. video client on a mobile phone, PDA, laptop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/426Internal components of the client ; Characteristics thereof
    • H04N21/42684Client identification by a unique number or address, e.g. serial number, MAC address, socket ID
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/147Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • H04N7/152Multipoint control units therefor

Abstract

【課題】移動端末のようなユーザ端末にも十分に視認性の高い会議用の画像を表示できるようにする。
【解決手段】多地点接続装置11は、第1および第2の2種類の配信用ストリーミングデータを配信する。第1の配信用ストリーミングデータは、すべてのユーザ端末21〜25それぞれからの動画像から構成されている。第2の配信用ストリーミングデータは、ユーザ端末21〜25の中で現在の発言者に対応するユーザ端末からの動画像のみを含む。第1の配信用ストリーミングデータは、パーソナルコンピュータまたは専用のビデオ会議端末から構成されるユーザ端末向けの配信用情報として使用され、第2の配信用ストリーミングデータは、携帯電話、PDAのような移動端末から構成されるユーザ端末向けの配信用情報として使用される。
【選択図】 図1

Description

本発明は、ビデオ会議を実現するために複数のユーザ端末の各々とのデータ伝送を実行するデータ伝送装置およびデータ伝送方法に関する。
近年、ネットワーク技術および情報処理技術の進展により、ビデオ会議システム(TV会議システムとも云う)が利用され始めている。ビデオ会議システムは、複数のユーザ端末同士を接続し、それらユーザ端末間で画像情報および音声情報を送受信するためのシステムである。
このようなビデオ会議システムとしては、全ての会議参加者それぞれから受信した画像を、各参加者に再配信するシステムが知られている(例えば、特許文献1参照。)。
上記特許文献1のシステムでは、各端末のディスプレイには、N人の会議参加者それぞれの画像(動画または静止画)を含む画面が表示される。また転送データ量を下げるために、発言者のみが動画像によって表示され、他の各会議参加者は静止画によって表示される。
特開平10−126757号公報
ところで、最近では、携帯電話、PDA(Personal Digital Assistants)のような移動端末の普及により、外出先からもビデオ会議に参加することが可能なシステムの実現が望まれている。
しかし、一般に、携帯電話、PDAのような移動端末の表示画面サイズ(表示解像度)は、パーソナルコンピュータや専用のビデオ会議端末に比べ、非常に小さい。このため、もし会議参加者全員の画像を移動端末の表示画面上に表示すると、どの会議参加者の画像についてもその視認性が著しく低下されてしまうことになる。
本発明は上記事情を考慮してなされたものであり、移動端末のようなユーザ端末にも十分に視認性の高い会議用の画像を表示することが可能なデータ伝送装置およびデータ伝送方法を提供することを目的とする。
上述の課題を解決するため、本発明は、第1のユーザ端末、第2のユーザ端末、および第3のユーザ端末の各々とのデータ伝送を実行するデータ伝送装置において、前記第1のユーザ端末および前記第2のユーザ端末の各々から送信される音声データおよび動画像データを受信する受信手段と、前記受信手段によって受信された前記第1のユーザ端末および前記第2のユーザ端末それぞれからの音声データに基づいて、前記第1のユーザ端末および前記第2のユーザ端末の中から現在の発言者に対応するユーザ端末を特定するユーザ端末特定手段と、前記受信手段によって受信された前記第1のユーザ端末および前記第2のユーザ端末それぞれからの動画像データの中から、前記ユーザ端末特定手段によって特定されたユーザ端末に対応する動画像データを選択する動画像データ選択手段と、前記動画像データ選択手段によって選択された動画像データから構成される画像情報を前記第3のユーザ端末に送信する送信手段とを具備することを特徴とする。
また、本発明は、移動端末を含む複数のユーザ端末の各々とのデータ伝送を実行するデータ伝送装置において、前記複数のユーザ端末の各々から送信される音声データおよび動画像データを受信する受信手段と、前記受信手段によって受信された前記複数のユーザ端末それぞれからの音声データに基づいて、前記複数のユーザ端末の中から現在の発言者に対応するユーザ端末を特定するユーザ端末特定手段と、前記受信手段によって受信された前記複数のユーザ端末それぞれからの音声データを多重化する音声多重化手段と、前記受信手段によって受信された前記複数のユーザ端末それぞれからの動画像データの中から、前記ユーザ端末特定手段によって特定されたユーザ端末に対応する動画像データを選択する動画像データ選択手段と、前記動画像データ選択手段によって選択された動画像データと前記音声多重化手段によって多重化された音声データとから構成される第1の配信用情報を生成する第1の配信用情報生成手段と、前記受信手段によって受信された前記複数のユーザ端末それぞれからの動画像データと前記音声多重化手段によって多重化された音声データとから構成される第2の配信用情報を生成する第2の配信用情報生成手段と、前記第1の配信用情報生成手段によって生成された前記第1の配信用情報を前記移動端末に送信する手段と、前記第2の配信用情報生成手段によって生成された前記第2の配信用情報を、前記複数のユーザ端末の中の前記移動端末以外の他の各ユーザ端末に送信する手段とを具備することを特徴とする。
本発明によれば、移動端末のようなユーザ端末にも十分に視認性の高い会議用の画像を表示することが可能となる。
以下、図面を参照して本発明の実施形態を説明する。
図1には、本発明の一実施形態に係るビデオ会議システムの構成例が示されている。このビデオ会議システムは、多地点接続装置(MCU:Multipoint Control Unit)11を用いることによって、複数のユーザ端末間でビデオ会議を行うためのシステムである。多地点接続装置11は、ネットワークを介して複数のユーザ端末それぞれと接続されている。図1においては、ユーザ端末(A)21はLANを介して多地点接続装置11に接続されており、ユーザ端末(B)22およびユーザ端末(C)23はインターネット1を介して多地点接続装置11に接続されている。また、ユーザ端末(D)24は公衆回線網2およびインターネット1を経由して多地点接続装置11に接続され、ユーザ端末(E)25は公衆回線網3を介して多地点接続装置11に接続されている。ユーザ端末(A)21、ユーザ端末(B)22、およびユーザ端末(C)23は、それぞれパーソナルコンピュータまたは専用のビデオ会議端末によって実現されている。またユーザ端末(D)24は例えばPDAのような移動端末によって実現され、ユーザ端末(E)25は例えば携帯電話のような移動端末によって実現されている。
ユーザ端末21〜25の各々は、ユーザを撮影するためのカメラとユーザの音声を入力するためのマイクロフォンとを有している。ユーザ端末21〜25の各々は、カメラから入力される動画像データおよびマイクロフォンから入力される音声データをそれぞれ圧縮符号化して動画像データ(ビデオデータ)および音声データ(オーディオデータ)を生成する。そして、ユーザ端末21〜25の各々は、動画像データと音声データとが多重化されたストリーミングデータを、多地点接続装置11に送信する。
いま、ユーザA、ユーザB、ユーザC、ユーザD、ユーザEが、ユーザ端末(A)21、ユーザ端末(B)22、ユーザ端末(C)23、ユーザ端末(D)24、ユーザ端末(E)25を使用していると想定する。この場合、ユーザA〜Eの各々の動画像および音声を含むストリーミングデータが、ユーザ端末21〜25の各々から多地点接続装置11に送信される。
多地点接続装置11は、ユーザ端末21〜25それぞれとの間で、ビデオ会議のための画像情報および音声情報を送受信するデータ伝送装置である。この多地点接続装置11は、ユーザ端末21〜25それぞれから受信した動画像および音声を用いて、ビデオ会議用の画像情報および音声情報を生成する。そして、多地点接続装置11は、生成したビデオ会議用の画像情報および音声情報を、ユーザ端末21〜25の各々に配信する。
本実施形態においては、ユーザ端末21〜25に配信されるべき配信用情報として、第1および第2の2種類の配信用ストリーミングデータが用いられる。第1の配信用ストリーミングデータは、すべての会議参加者(ユーザA−E)それぞれの動画像とすべての会議参加者(ユーザA−E)それぞれの音声とから構成されている。第2の配信用ストリーミングデータは、ユーザA−Eそれぞれの動画像の中で現在の発言者のみに対応する動画像と、ユーザA−Eそれぞれの音声とから構成されている。第1の配信用ストリーミングデータは、パーソナルコンピュータまたは専用のビデオ会議端末から構成されるユーザ端末向けの配信用情報として使用され、第2の配信用ストリーミングデータは、移動端末から構成されるユーザ端末向けの配信用情報として使用される。このため、ユーザ端末24,25には、現在の発言者の動画像のみがビデオ会議用の画像情報として配信されることになる。ユーザ端末24,25の各々の表示画面には、すべての会議参加者の画像ではなく、現在の発言者の動画像のみが表示される。
多地点接続装置11は、図示のように、CPU31、IP(Internet Protocol)接続部32、モデム33、ストレージデバイス34、デマルチプレクサ(Demux)部35、動画デコード部36、動画エンコード部37、音声デコード部38、音声多重化部39、音声エンコード部40、マルチプレクサ部(Mux)41、およびメモリ42を含む。これらコンポーネントは、バス30を介して相互接続されている。
CPU31は多地点接続装置11の動作を制御するプロセッサであり、メモリ42に格納されたプログラムを実行する。CPU31は、ユーザ端末21〜25それぞれから受信した音声データに基づいて、ユーザ端末21〜25の中から現在の発言者に対応するユーザ端末を特定する機能を実行する。この場合、CPU31は、ユーザ端末21〜25それぞれからの音声データのゲインを測定し、その測定結果に基づいて、現在の主要な発言者を1名特定する。
IP接続部32は、IPを用いて通信を実行する通信デバイスであり、LANを介してインターネット1に接続されている。モデム33は公衆回線網3に接続されている。ユーザ端末21〜24の各々から送信されるストリーミングデータはIP接続部32によって受信され、またユーザ端末25から送信されるストリーミングデータはモデム33によって受信される。
ストレージデバイス34は、例えばハードディスクドライブから構成されており、ここには会議参加者それぞれに関する情報がユーザ情報データベースとして予め保存されている。このユーザ情報データベースにおいては、図2に示すように、各ユーザ毎に、[ユーザ名]フィールド、[パスワード]フィールド、[発言者フラグ]フィールド、[IPアドレス]フィールド、および[端末タイプ]フィールド、等の情報が管理されている。[端末タイプ]がパーソナルコンピュータ(PC)である各ユーザに対しては上述の第1の配信用ストリーミングデータが配信される。一方、[端末タイプ]がPDAまたは携帯電話の各ユーザに対しては、上述の第2の配信用ストリーミングデータが配信される。
[発言者フラグ]フィールドにセットされる発言者フラグは現在の発言者を識別するためのフラグである。発言者フラグは、現在の発言者のユーザ端末に対応する[発言者フラグ]フィールドにセットされる。
デマルチプレクサ(Demux)部35は、ユーザ端末21〜25の各々から受信したストリーミングデータを動画像データストリームと音声データストリームに分離する。動画デコード部36は、動画像データストリームをデコードする。動画エンコード部37は、配信用の所定のビットレートを有する動画像データストリームを生成するために、動画デコード部36によってデコードされた動画像データを再び圧縮符号化する。音声デコード部38は、音声データストリームをデコードする。CPU31は、音声デコード部38によってデコードされたユーザ端末21〜25それぞれからの音声データを解析することにより、現在の発言者を特定する。音声多重化部39は、音声デコード部38によってデコードされたユーザ端末21〜25それぞれからの音声データを多重化する。音声エンコード部40は、配信用の所定のビットレートを有する音声データを生成するために、音声多重化部39によって多重化されたユーザ端末21〜25それぞれからの音声データを圧縮符号化する。マルチプレクサ部41は、音声エンコード部40によって生成された音声データに、動画像データを多重化することによって、配信用ストリーミングデータを生成する。
なお、動画デコード部36、動画エンコード部37、音声デコード部38、音声多重化部39、音声エンコード部40、およびマルチプレクサ部(Mux)41は、それぞれソフトウェアによって実現することもできる。
次に、図3を参照して、多地点接続装置11の論理的な機能構成について説明する。
多地点接続装置11は、その機能モジュールとして、ストリーム受信部101、発言者検出部102、第1の配信用ストリーム生成部103、第2の配信用ストリーム生成部104、および配信用ストリーム送信部105を備えている。
ストリーム受信部101は、ユーザ端末21〜25の各々からの動画データストリームおよび音声データストリームを受信する。発言者検出部102は、ユーザ端末21〜25それぞれからの音声データのゲイン(音声レベル)を比較することにより、ユーザ端末21〜25のユーザA〜Eの中から、現在の発言者を特定する。最も音声レベルの大きい音声データに対応するユーザが現在の発言者として特定される。
第1の配信用ストリーム生成部103は、第1の配信用ストリーリングデータを生成する。第1の配信用ストリーリングデータは、上述したように、会議参加者全員の音声を多重化したデータ(音声多重化データ)と、会議参加者全員の動画データとから構成される。第2の配信用ストリーム生成部104は、ユーザ端末21〜25それぞれからの動画データストリームの中から、発言者検出部102によって検出された現在の発言者に対応するユーザ端末からの動画像データストリームを選択して、第2の配信用ストリーリングデータを生成する。この第2の配信用ストリーリングデータは、上述したように、会議参加者全員の音声を多重化したデータ(音声多重化データ)と、現在の発言者の動画データとから構成される。
配信用ストリーム送信部105は、第1の配信用ストリーリングデータをユーザ端末21〜23の各々に配信するとともに、第2の配信用ストリーリングデータをユーザ端末24,25の各々に配信する。
図4には、ユーザ端末21〜25間でビデオ会議が実行されている様子が示されている。ユーザA,B,Cはパーソナルコンピュータから構成されるユーザ端末21,22,23をそれぞれ用いてビデオ会議に参加している。ユーザDはPDAから構成されたユーザ端末24を用いてビデオ会議に参加し、またユーザEは携帯電話から構成されたユーザ端末25を用いてビデオ会議に参加している。ユーザA,B,Cそれぞれに対応するユーザ端末21,22,23の各々には、すべての会議参加者(ユーザA,B,C,D,E)それぞれの動画が表示される。一方、ユーザD,Eそれぞれに対応するユーザ端末24,25の各々には、現在の発言者の動画データのみが表示される。いま、ユーザBが現在の発言者である場合、ユーザ端末24,25の各々には、ユーザBの動画データのみが表示される。
次に、各ユーザ端末の表示画面の例を説明する。
図5は、ユーザ端末21,22,23の各々に表示される会議画面の例を示している。会議画面201には、すべての会議参加者(ユーザA,B,C,D,E)それぞれに対応する動画像表示エリア202,203,204,205,206が配置されている。これら動画像表示エリア202,203,204,205,206には、それぞれユーザA,B,C,D,Eの動画像が表示される。また、動画像表示エリア202,203,204,205,206の下部には、ユーザA,B,C,D,Eのユーザ名が表示される。さらに、現在の発言者を識別するための情報も表示される。例えば、現在の発言者がユーザCである場合、ユーザCに対応する動画像表示エリア204の周りに、図示のような太線の枠207が発言者識別マークとして表示される。
ユーザA,B,C,D,Eそれぞれの動画像は、多地点接続装置11からユーザ端末21,22,23の各々に配信される第1の配信用ストリーミングデータに含まれている。第1の配信用ストリーミングデータには、さらに、ユーザA,B,C,D,Eそれぞれのユーザ名と、現在の発言者を識別するための情報も含まれている。
なお、ユーザ端末21,22,23の各々は、当該ユーザ端末のユーザの動画像についてはその端末に設けられたカメラによって撮影された動画像を表示するようにしてもよい。この場合、例えばユーザAに配信すべき第1の配信用ストリーミングデータは、必ずしもユーザAの動画像を含む必要はない。同様に、ユーザBに配信すべき第1の配信用ストリーミングデータは、必ずしもユーザBの動画像を含む必要はない。
図6は、ユーザ端末24,25の各々に表示される会議画面の例を示している。ユーザ端末24,25の各々に表示される会議画面301は、現在の発言者に対応する1つの動画像表示エリア302のみから構成される。例えば、現在の発言者がユーザCである場合、ユーザCの動画像が動画像表示エリア302にフルスクリーン表示される。また、動画像表示エリア302の下部には、現在の発言者のユーザ名が表示される。
このように、表示画面サイズが小さいユーザ端末24,25には、現在の発言者の動画像のみが会議画面上に表示されるので、会議参加者全員の画像を表示する場合に比べ、その視認性を十分に高めることができる。よって、口元の動きなどの発言者の顔の表情を確認することが可能となる。
次に、図7のフローチャートを参照して、多地点接続装置11によって実行される配信処理の手順について説明する。
多地点接続装置11は、各ユーザ端末から送信される、音声と動画とを含むストリーミングデータの受信を開始する(ステップS101)。多地点接続装置11は、多地点接続装置11に設けられた発言者確認用タイマーの値をリードして(ステップS102)、発言者を確認すべき時間であるかどうかを判別する(ステップS103)。
発言者を確認すべき時間が到来したならば(ステップS103のYES)、多地点接続装置11は、各ユーザ端末から受信した音声データのゲインを測定し(ステップS104)、その測定結果に基づいて現在の発言者を1名特定する(ステップS105)。多地点接続装置11は、ステップS105で特定された現在の発言者が、これまでの発言者と異なるかどうかを判別する(ステップS106)。現在の発言者がこれまでの発言者と異なるならば(ステップS106のYES)、多地点接続装置11は、ユーザ情報データベース内の現在の発言者のユーザ端末に対応する[発言者フラグ]フィールドに対して発言者フラグをセットするとともに、ユーザ情報データベース内の以前の発言者のユーザ端末に対応する[発言者フラグ]フィールドに対してセットされていた発言者フラグをリセットする(ステップS107)。
次に、多地点接続装置11は、ユーザ情報データベースの[端末タイプ]フィールドを参照して、会議参加者の中に移動端末(携帯電話、PDA)を使用しているユーザが含まれているかどうかを判別する(ステップS108)。会議参加者の中に移動端末(携帯電話、PDA)を使用しているユーザがいない場合、つまり会議参加者全員が表示画面サイズの大きいユーザ端末(パーソナルコンピュータ、ビデオ会議専用端末)を使用しているならば(ステップS108のNO)、多地点接続装置11は、第1の配信用ストリーミングデータを生成し(ステップS109)、その第1の配信用ストリーミングデータを会議参加者全員に配信する(ステップS110)。
会議参加者の中に移動端末(携帯電話、PDA)を使用しているユーザがいるならば(ステップS108のYES)、多地点接続装置11は、まず、第1の配信用ストリーミングデータを生成し(ステップS111)、その第1の配信用ストリーミングデータを、表示画面サイズの大きいユーザ端末(パーソナルコンピュータ、ビデオ会議専用端末)を使用している各ユーザに配信する(ステップS112)。次いで、多地点接続装置11は、すべてのユーザ端末それぞれから受信した動画像データストリームの中から、発言者フラグがセットされている動画像データストリームを選択することにより、第2の配信用ストリーミングデータを生成し(ステップS113)、その第2の配信用ストリーミングデータを、表示画面サイズの小さい移動端末を使用している各ユーザに配信する(ステップS114)。なお、ステップS113では、ストリーミングデータのビットレートを下げる処理も必要に応じて実行される。
以上のように、本実施形態においては、発言中のユーザにフォーカスした表示が可能となり、携帯電話、PDAのような移動端末からでも、ビデオ会議の画像情報を有効に利用することができる。
特に、ユーザ端末の種類に応じて、会議参加者全員の動画像を含む第1の配信用ストリーミングデータと、発言者の動画像のみを含む第2の配信用ストリーミングデータの一方を選択的に送信することにより、各ユーザ端末の種類に適したビデオ会議用画像情報を各ユーザ端末に提供することが可能となる。
なお、表示画面サイズの大きいユーザ端末(パーソナルコンピュータ、ビデオ会議専用端末)に対しても、第2の配信用ストリーミングデータを配信してもよい。
図8には、多地点接続装置11によって管理されるユーザ情報データベースの他の例が示されている。このユーザ情報データベースにおいては、図2のユーザ情報データベースに比し、[表示モード]フィールドが追加されている。[表示モード]フィールドは、配信されるべきストリーミングデータの種類を指定する表示モード情報を保存するフィールドである。モード1は、第1の配信用ストリーミングデータの配信を指定する。モード2は、第2の配信用ストリーミングデータの配信を指定する。表示画面サイズの大きいユーザ端末(パーソナルコンピュータ、ビデオ会議専用端末)のユーザは、モード1およびモード2のどちらでも選択することができる。
図9には、表示画面サイズの大きいユーザ端末の構成例が示されている。このユーザ端末は、図示のように、マイクロフォン401、カメラ402、オーディオ入力部403、ビデオ入力部404、ストリーミングデータ送信部405、ストリーミングデータ受信部406、ビデオ出力部407、オーディオ出力部408、ディスプレイ409、スピーカ410、ユーザ情報送信部411、およびモード入力部412を備えている。
ユーザの音声はマイクロフォン401およびオーディオ入力部403を介してストリーミングデータ送信部405に送られる。カメラ402によって撮影されたユーザの動画像はビデオ入力部404を介してストリーミングデータ送信部405に送られる。ストリーミングデータ送信部405は、ユーザの音声データおよび動画像データをそれぞれ圧縮符号化し、圧縮符号化された音声データと圧縮符号化された動画像データとを含むストリーミングデータを多地点接続装置11に送信する。多地点接続装置11から送信される配信用ストリーミングデータはストリーミングデータ受信部406によって受信される。ストリーミングデータ受信部406では、配信用ストリーミングデータから動画像データストリームと音声データストリームが分離され、そして動画像データストリームおよび音声データストリームがそれぞれデコードされる。デコードされた動画像データはビデオ出力部407に送られ、またデコードされた音声データはオーディオ出力部408に送られる。ビデオ出力部407は、ストリーミングデータ受信部406からの動画像データとビデオ入力部404からの動画像データとを合成して、ディスプレイ409に表示する。オーディオ出力部408は、ストリーミングデータ受信部406からの音声データを再生するために、その音声データをスピーカ10に送信する。
モード入力部412は、モード1およびモード2の一方を指示する表示モード指定情報を入力するための入力装置である。モード入力部412によって入力された表示モード指定情報は、ユーザ情報送信部411によって、多地点接続装置11に送信される。ユーザ端末から送信される表示モード指定情報は、多地点接続装置11のユーザ情報データベースに登録される。
次に、図10のフローチャートを参照して、多地点接続装置11によって実行される配信処理の第2の手順について説明する。この手順においては、図7のステップS108〜S114の代わりに、図10のステップS201〜S207が実行される。図7のステップS101〜S107の処理が実行された後、図10のステップS201が実行される。
ステップS201において、多地点接続装置11は、ユーザ情報データベースの[端末タイプ]フィールドおよび[表示モード]フィールドを参照して、会議参加者の中に移動端末(携帯電話、PDA)を使用しているユーザ、またはモード2を指定しているユーザが含まれているかどうかを判別する。
会議参加者の中に移動端末(携帯電話、PDA)を使用しているユーザおよびモード2を指定しているユーザのどちらも存在しないならば(ステップS201のNO)、多地点接続装置11は、第1の配信用ストリーミングデータを生成し(ステップS202)、その第1の配信用ストリーミングデータを会議参加者全員に配信する(ステップS203)。
会議参加者の中に移動端末(携帯電話、PDA)を使用しているユーザ、またはモード2を指定しているユーザが存在するならば(ステップS201のYES)、多地点接続装置11は、第1の配信用ストリーミングデータを生成し(ステップS204)、その第1の配信用ストリーミングデータを、モード1を指定している各ユーザに配信する(ステップS205)。次いで、多地点接続装置11は、第2の配信用ストリーミングデータを生成し(ステップS206)、その第2の配信用ストリーミングデータを、移動端末を使用している各ユーザ、およびモード2を指定している各ユーザに配信する(ステップS207)。
以上の処理によれば、パーソナルコンピュータ、ビデオ会議専用端末のようなユーザ端末を使用しているユーザに対しても、必要に応じて発言者のみの動画像データを配信する事が出来る。
なお、本発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
本発明の一実施形態に係るデータ伝送装置を含むビデオ会議システムの構成を示すブロック図。 同実施形態のデータ伝送装置によって管理されるユーザ情報データベースの例を示す図。 同実施形態のデータ伝送装置の機能構成を示すブロック図。 同実施形態のデータ伝送装置を用いて複数のユーザ端末間で実行されるビデオ会議の様子を示す図。 同実施形態のデータ伝送装置によってユーザ端末に提供される第1の会議画面の例を示す図。 同実施形態のデータ伝送装置によってユーザ端末に提供される第2の会議画面の例を示す図。 同実施形態のデータ伝送装置によって実行されるデータ配信処理の手順を示すフローチャート。 同実施形態のデータ伝送装置によって管理されるユーザ情報データベースの他の例を示す図。 図1のビデオ会議システムで用いられるユーザ端末の構成例を示すブロック図。 同実施形態のデータ伝送装置によって実行されるデータ配信処理の他の手順を示すフローチャート。
符号の説明
11…多地点接続装置、21〜25…ユーザ端末、31…CPU、32…IP接続部、33…モデム、34…ストレージデバイス、35…デマルチプレクサ部、36…動画デコード部、37…動画エンコード部、38…音声デコード部、39…音声多重化部、40…音声エンコード部、41…マルチプレクサ部。

Claims (10)

  1. 第1のユーザ端末、第2のユーザ端末、および第3のユーザ端末の各々とのデータ伝送を実行するデータ伝送装置において、
    前記第1のユーザ端末および前記第2のユーザ端末の各々から送信される音声データおよび動画像データを受信する受信手段と、
    前記受信手段によって受信された前記第1のユーザ端末および前記第2のユーザ端末それぞれからの音声データに基づいて、前記第1のユーザ端末および前記第2のユーザ端末の中から現在の発言者に対応するユーザ端末を特定するユーザ端末特定手段と、
    前記受信手段によって受信された前記第1のユーザ端末および前記第2のユーザ端末それぞれからの動画像データの中から、前記ユーザ端末特定手段によって特定されたユーザ端末に対応する動画像データを選択する動画像データ選択手段と、
    前記動画像データ選択手段によって選択された動画像データから構成される画像情報を前記第3のユーザ端末に送信する送信手段とを具備することを特徴とするデータ伝送装置。
  2. 前記受信手段によって受信された前記第1のユーザ端末および前記第2のユーザ端末それぞれからの音声データを多重化する音声多重化手段をさらに具備し、
    前記送信手段は、前記画像情報および前記音声多重化手段によって多重化された音声データを前記第3のユーザ端末に送信する手段を含むことを特徴とする請求項1記載のデータ伝送装置。
  3. 前記第3のユーザ端末は移動端末を含むことを特徴とする請求項1記載のデータ伝送装置。
  4. 移動端末を含む複数のユーザ端末の各々とのデータ伝送を実行するデータ伝送装置において、
    前記複数のユーザ端末の各々から送信される音声データおよび動画像データを受信する受信手段と、
    前記受信手段によって受信された前記複数のユーザ端末それぞれからの音声データに基づいて、前記複数のユーザ端末の中から現在の発言者に対応するユーザ端末を特定するユーザ端末特定手段と、
    前記受信手段によって受信された前記複数のユーザ端末それぞれからの音声データを多重化する音声多重化手段と、
    前記受信手段によって受信された前記複数のユーザ端末それぞれからの動画像データの中から、前記ユーザ端末特定手段によって特定されたユーザ端末に対応する動画像データを選択する動画像データ選択手段と、
    前記動画像データ選択手段によって選択された動画像データと前記音声多重化手段によって多重化された音声データとから構成される第1の配信用情報を生成する第1の配信用情報生成手段と、
    前記受信手段によって受信された前記複数のユーザ端末それぞれからの動画像データと前記音声多重化手段によって多重化された音声データとから構成される第2の配信用情報を生成する第2の配信用情報生成手段と、
    前記第1の配信用情報生成手段によって生成された前記第1の配信用情報を前記移動端末に送信する手段と、
    前記第2の配信用情報生成手段によって生成された前記第2の配信用情報を、前記複数のユーザ端末の中の前記移動端末以外の他の各ユーザ端末に送信する手段とを具備することを特徴とするデータ伝送装置。
  5. 前記第1の配信用情報を要求するモード指定情報を前記移動端末以外の他のユーザ端末から受信した場合、前記第2の配信用情報の代わりに前記第1の配信用情報を、前記モード指定情報を送信した端末に送信する手段をさらに具備することを特徴とする請求項4記載のデータ伝送装置。
  6. 第1のユーザ端末、第2のユーザ端末、および第3のユーザ端末の各々とのデータ伝送を実行するデータ伝送方法において、
    前記第1のユーザ端末および前記第2のユーザ端末の各々から送信される音声データおよび動画像データを受信する受信ステップと、
    前記受信ステップによって受信された前記第1のユーザ端末および前記第2のユーザ端末それぞれからの音声データに基づいて、前記第1のユーザ端末および前記第2のユーザ端末の中から現在の発言者に対応するユーザ端末を特定するユーザ端末特定ステップと、
    前記受信ステップによって受信された前記第1のユーザ端末および前記第2のユーザ端末それぞれからの動画像データの中から、前記ユーザ端末特定ステップによって特定されたユーザ端末に対応する動画像データを選択する動画像データ選択ステップと、
    前記動画像データ選択ステップによって選択された動画像データから構成される画像情報を前記第3のユーザ端末に送信する送信ステップとを具備することを特徴とするデータ伝送方法。
  7. 前記受信ステップによって受信された前記第1のユーザ端末および前記第2のユーザ端末それぞれからの音声データを多重化する音声多重化ステップをさらに具備し、
    前記送信ステップは、前記画像情報および前記音声多重化ステップによって多重化された音声データを前記第3のユーザ端末に送信するステップを含むことを特徴とする請求項6記載のデータ伝送方法。
  8. 前記第3のユーザ端末は移動端末を含むことを特徴とする請求項6記載のデータ伝送方法。
  9. 移動端末を含む複数のユーザ端末の各々とのデータ伝送を実行するデータ伝送方法において、
    前記複数のユーザ端末の各々から送信される音声データおよび動画像データを受信する受信ステップと、
    前記受信ステップによって受信された前記複数のユーザ端末それぞれからの音声データに基づいて、前記複数のユーザ端末の中から現在の発言者に対応するユーザ端末を特定するユーザ端末特定ステップと、
    前記受信ステップによって受信された前記複数のユーザ端末それぞれからの音声データを多重化する音声多重化ステップと、
    前記受信ステップによって受信された前記複数のユーザ端末それぞれからの動画像データの中から、前記ユーザ端末特定ステップによって特定されたユーザ端末に対応する動画像データを選択する動画像データ選択ステップと、
    前記動画像データ選択ステップによって選択された動画像データと前記音声多重化ステップによって多重化された音声データとから構成される第1の配信用情報を生成する第1の配信用情報生成ステップと、
    前記受信ステップによって受信された前記複数のユーザ端末それぞれからの動画像データと前記音声多重化ステップによって多重化された音声データとから構成される第2の配信用情報を生成する第2の配信用情報生成ステップと、
    前記第1の配信用情報生成ステップによって生成された前記第1の配信用情報を前記移動端末に送信するステップと、
    前記第2の配信用情報生成ステップによって生成された前記第2の配信用情報を、前記複数のユーザ端末の中の前記移動端末以外の他の各ユーザ端末に送信するステップとを具備することを特徴とするデータ伝送方法。
  10. 前記第1の配信用情報を要求するモード指定情報を前記移動端末以外の他のユーザ端末から受信した場合、前記第2の配信用情報の代わりに前記第1の配信用情報を、前記モード指定情報を送信した端末に送信するステップをさらに具備することを特徴とする請求項9記載のデータ伝送方法。
JP2004136587A 2004-04-30 2004-04-30 データ伝送装置およびデータ伝送方法 Expired - Fee Related JP4331049B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004136587A JP4331049B2 (ja) 2004-04-30 2004-04-30 データ伝送装置およびデータ伝送方法
US11/112,046 US7508413B2 (en) 2004-04-30 2005-04-22 Video conference data transmission device and data transmission method adapted for small display of mobile terminals

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004136587A JP4331049B2 (ja) 2004-04-30 2004-04-30 データ伝送装置およびデータ伝送方法

Publications (2)

Publication Number Publication Date
JP2005318463A true JP2005318463A (ja) 2005-11-10
JP4331049B2 JP4331049B2 (ja) 2009-09-16

Family

ID=35187015

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004136587A Expired - Fee Related JP4331049B2 (ja) 2004-04-30 2004-04-30 データ伝送装置およびデータ伝送方法

Country Status (2)

Country Link
US (1) US7508413B2 (ja)
JP (1) JP4331049B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007267125A (ja) * 2006-03-29 2007-10-11 Kyocera Corp 携帯通信端末装置、その制御方法、および多地点通信システム
WO2014087555A1 (en) * 2012-12-06 2014-06-12 Nec Corporation Communication system
US9432420B2 (en) 2012-12-27 2016-08-30 Brother Kogyo Kabushiki Kaisha Communication system, non-transitory computer-readable medium storing communication program and communication device

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7640301B2 (en) * 2006-04-06 2009-12-29 Att Knowledge Ventures, L.P. System and method for distributing video conference data over an internet protocol television system
US20080255840A1 (en) * 2007-04-16 2008-10-16 Microsoft Corporation Video Nametags
US8179821B2 (en) * 2007-06-25 2012-05-15 Comverse, Ltd. Identifying participants of an audio conference call
US8526632B2 (en) * 2007-06-28 2013-09-03 Microsoft Corporation Microphone array for a camera speakerphone
US8330787B2 (en) * 2007-06-29 2012-12-11 Microsoft Corporation Capture device movement compensation for speaker indexing
US8165416B2 (en) * 2007-06-29 2012-04-24 Microsoft Corporation Automatic gain and exposure control using region of interest detection
KR101405933B1 (ko) * 2007-07-12 2014-06-12 엘지전자 주식회사 휴대 단말기 및 휴대 단말기의 위치 정보 표시 방법
US9203883B2 (en) * 2009-12-08 2015-12-01 Citrix Systems, Inc. Systems and methods for a client-side remote presentation of a multimedia stream
US20110216153A1 (en) * 2010-03-03 2011-09-08 Michael Edric Tasker Digital conferencing for mobile devices
JP2012222642A (ja) * 2011-04-11 2012-11-12 Sony Corp データ配信装置、データ配信方法、及びプログラム
US9866731B2 (en) * 2011-04-12 2018-01-09 Smule, Inc. Coordinating and mixing audiovisual content captured from geographically distributed performers
CN102325246B (zh) * 2011-10-18 2014-05-07 Tcl集团股份有限公司 一种视频会议系统、视频会议服务器及移动通信终端
TWI477120B (zh) * 2012-11-13 2015-03-11 Askey Computer Corp 訊號擴充選擇裝置
CN104243528B (zh) * 2013-06-20 2018-06-05 腾讯科技(深圳)有限公司 一种在多个终端设备间同步复制内容的方法和系统
CN108596114A (zh) * 2018-04-27 2018-09-28 佛山市日日圣科技有限公司 一种表情生成方法及装置
US10951859B2 (en) 2018-05-30 2021-03-16 Microsoft Technology Licensing, Llc Videoconferencing device and method

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10126757A (ja) 1996-10-23 1998-05-15 Nec Corp ビデオ会議システム
JP2751923B1 (ja) * 1997-02-05 1998-05-18 日本電気株式会社 多地点テレビ会議システムおよび多地点テレビ会議装置
JPH1165950A (ja) 1997-08-15 1999-03-09 Sony Corp 情報通信方法、情報通信システム、携帯無線通信端末およびサーバ装置
JPH11112955A (ja) * 1997-09-30 1999-04-23 Canon Inc 遠隔会議システム及び端末装置
US6317776B1 (en) * 1998-12-17 2001-11-13 International Business Machines Corporation Method and apparatus for automatic chat room source selection based on filtered audio input amplitude of associated data streams
JP4738628B2 (ja) 2001-04-25 2011-08-03 株式会社リコー データ会議システム及びデータ会議端末並びにデータ会議プログラムを記録した記録媒体
EP1470491A4 (en) * 2002-01-30 2006-06-21 Larry E Roher AUDIOVISUAL MULTIPORT CONFERENCE SYSTEM
JP2004136587A (ja) 2002-10-18 2004-05-13 Seiko Epson Corp プリンタおよびフラッシング方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007267125A (ja) * 2006-03-29 2007-10-11 Kyocera Corp 携帯通信端末装置、その制御方法、および多地点通信システム
WO2014087555A1 (en) * 2012-12-06 2014-06-12 Nec Corporation Communication system
US9432420B2 (en) 2012-12-27 2016-08-30 Brother Kogyo Kabushiki Kaisha Communication system, non-transitory computer-readable medium storing communication program and communication device

Also Published As

Publication number Publication date
US20050243810A1 (en) 2005-11-03
US7508413B2 (en) 2009-03-24
JP4331049B2 (ja) 2009-09-16

Similar Documents

Publication Publication Date Title
US7508413B2 (en) Video conference data transmission device and data transmission method adapted for small display of mobile terminals
JP3305037B2 (ja) 多地点制御装置、テレビ会議端末装置及び多地点テレビ会議システム
US7425979B2 (en) Communication system
WO2009009966A1 (fr) Procédé, dispositif et système pour afficher un locuteur dans une vidéoconférence
TW200935906A (en) A method and system for processing a composite video image
JP2008147877A (ja) 会議システム
JP2006262484A (ja) 画像通信中の画像合成方法及び装置
JP6179179B2 (ja) 情報処理装置、情報処理方法およびプログラム
JP2007150921A (ja) 通信端末および通信システム、並びに通信端末の表示方法
JP2007513537A (ja) 改良されたマルチメディア機能を用いたテレビ会議
JP2016174282A (ja) テレビ会議用通信装置
JP6152961B1 (ja) テレビ会議装置
US20100066806A1 (en) Internet video image producing method
JP2008288974A (ja) ビデオ会議システム及びビデオ会議装置
JP2010157906A (ja) 映像表示装置
WO2016147538A1 (ja) テレビ会議用通信装置
US20140362166A1 (en) Incoming call display method, electronic device, and incoming call display system
JP2016192610A (ja) 遠隔会議プログラム、制御装置及び遠隔会議方法
CN101252670A (zh) 会议电视的处理方法和装置
US20080043962A1 (en) Methods, systems, and computer program products for implementing enhanced conferencing services
JP2005269498A (ja) ビデオ会議システム、ビデオ会議端末装置、およびその制御方法ならびにそのためのビデオ会議端末装置制御用プログラム
JP2007041718A (ja) 情報配信システム、情報配信装置、情報受信装置、および、プログラム
JP3732850B2 (ja) 多地点制御装置
JP2003163906A (ja) テレビ会議システム及びテレビ会議方法
JP3697423B2 (ja) 多地点制御装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060523

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090526

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090617

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120626

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120626

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130626

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees