JP2005303736A - ビデオ会議システムにおける映像表示方法、ビデオ会議システムに用いられる利用者端末、及びビデオ会議システムに用いられる利用者端末用プログラム - Google Patents

ビデオ会議システムにおける映像表示方法、ビデオ会議システムに用いられる利用者端末、及びビデオ会議システムに用いられる利用者端末用プログラム Download PDF

Info

Publication number
JP2005303736A
JP2005303736A JP2004118217A JP2004118217A JP2005303736A JP 2005303736 A JP2005303736 A JP 2005303736A JP 2004118217 A JP2004118217 A JP 2004118217A JP 2004118217 A JP2004118217 A JP 2004118217A JP 2005303736 A JP2005303736 A JP 2005303736A
Authority
JP
Japan
Prior art keywords
user
video
information
user terminal
audio information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004118217A
Other languages
English (en)
Inventor
Satoshi Sakuma
聡 佐久間
Tomoaki Komuro
智昭 小室
Yoshio Nagashima
美雄 永嶋
Kenichi Asasaka
健一 浅坂
Machiko Suzuki
麻知子 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Communications Corp
Original Assignee
NTT Communications Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Communications Corp filed Critical NTT Communications Corp
Priority to JP2004118217A priority Critical patent/JP2005303736A/ja
Publication of JP2005303736A publication Critical patent/JP2005303736A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

【課題】 参加者が増加してもビデオ会議を円滑に進行させることができる。
【解決手段】 利用者端末3iが利用者の映像データおよび音声データを取得すると、音声データ(映像データ)から発言(動き)があるかを判定し、発言(動き)があるときは、映像データのビットレートを高く、画像サイズを大きく符号化パラメータを設定し、発言(動き)がないときは、映像データのビットレートを低く、画像サイズを小さく符号化パラメータを設定して、サーバコンピュータ2に送信するとともに、サーバコンピュータ2から各利用者の符号化データを受信してディスプレイ上に表示する。
【選択図】 図2

Description

本発明は、通信ネットワークを介したビデオ会議システムに関し、特にビデオ会議システムの映像表示技術に関するものである。
現在、実用化されている映像付きWeb会議システムの表示画面は、図7(a)に示すように、主に共有データ画面d10、参加者リスト画面d20、チャット画面d30、映像画面d40などから構成されている。これらのWeb会議システムにおいては、映像画面d40は参加者ごとに振り分けられるため、参加者が増えるに伴ってディスプレイ上の映像画面d40の占有率が増加する。その場合、Web会議システムで最も重要な共有データ画面d10が小さくなり、Web会議システムをスムーズに行うことはできなくなる。
これを解決する方法としては、非特許文献1に示すように、予め、共有データ画面d10を主に使用する場合は映像画面d40を背面に隠す方法(図7(b)参照)や、非特許文献2および3に示すように、ディスプレイ上での表示する参加者の映像画面数を制限する方法(図7(c)参照)がある。
NTTIT株式会社、"MeetingPlaza電網会議室サービス"、[Online]、[平成16年3月1日検索]、インターネット<URL: http://www.meetingplaza.com/> WebEx Communications Inc.、"Video Conferencing,Web Conferencing&Online Meetings"、[Online]、[平成16年3月1日検索]、インターネット<URL: http://www.webex.com/> 日本電気株式会社、"コミュニケーションドア"、[Online]、[平成16年3月1日検索]、インターネット<URL: http://www.communicationdoor.com/>
しかしながら、上述した映像画面d40を背面に隠す方法や、ディスプレイ上での表示する参加者の映像画面数を制限する方法においては、映像付きWeb会議システムのメリットである「相手の表情を確認しながらの会議」が実現できないという問題がある。また、発言者の映像がない場合には、参加者リスト上で明示しない限り誰が発言したかわからないので、参加者リスト画面d20も常に表示しておかなければならないという問題もある。
本発明は、上記の事情を鑑みてなされたものであり、参加者が増加してもビデオ会議を円滑に進行させることができるビデオ会議システムにおける映像表示方法、ビデオ会議システムに用いられる利用者端末、及びビデオ会議システムに用いられる利用者端末用プログラムを提供することを目的とする。
上記目的を達成するため、請求項1記載の本発明は、通信ネットワークを介して複数の利用者端末が接続され、各利用者端末が取得した利用者の映像情報および音声情報を相互に送受信し、ビデオ会議を行うビデオ会議システムにおける映像表示方法であって、前記各利用者端末が、前記利用者の映像情報および音声情報を取得し、取得した映像情報及び音声情報のうち少なくともいずれか一方の情報の内容に基づいて前記利用者の行動パターンを判断し、該行動パターンに応じて符号化パラメータを決定し、決定された符号化パラメータに従って符号化された映像情報及び音声情報を他の利用者端末に送信し、他の利用者端末それぞれから、他の利用者の符号化された映像情報及び音声情報を受信し、各利用者ごとの符号化された映像情報を表示することを特徴とする。
請求項2記載の本発明は、通信ネットワークを介して複数の利用者端末が接続され、各利用者端末が取得した利用者の映像情報および音声情報を相互に送受信し、ビデオ会議を行うビデオ会議システムにおける映像表示方法であって、前記各利用者端末が、他の利用者端末それぞれから、他の利用者の映像情報および音声情報を受信し、各利用者ごとに、受信した映像情報及び音声情報のうち少なくともいずれか一方の情報の内容に基づいて利用者の行動パターンを判断し、該行動パターンに応じて符号化パラメータを決定し、各利用者ごとに、決定された符号化パラメータに従って符号化された映像情報を表示することを特徴とする。
請求項3記載の本発明は、通信ネットワークを介して複数の利用者端末が接続され、各利用者端末が取得した利用者の映像情報および音声情報を相互に送受信し、ビデオ会議を行うビデオ会議システムに用いられる前記利用者端末であって、前記利用者の映像情報および音声情報を取得する手段と、取得した映像情報及び音声情報のうち少なくともいずれか一方の情報の内容に基づいて前記利用者の行動パターンを判断し、該行動パターンに応じて符号化パラメータを決定する手段と、決定された符号化パラメータに従って符号化された映像情報及び音声情報を他の利用者端末に送信する手段と、他の利用者端末それぞれから、他の利用者の符号化された映像情報及び音声情報を受信する手段と、各利用者ごとの符号化された映像情報を表示する手段と、を有することを特徴とする。
請求項4記載の本発明は、通信ネットワークを介して複数の利用者端末が接続され、各利用者端末が取得した利用者の映像情報および音声情報を相互に送受信し、ビデオ会議を行うビデオ会議システムに用いられる前記利用者端末であって、他の利用者端末それぞれから、他の利用者の映像情報および音声情報を受信する手段と、各利用者ごとに、受信した映像情報及び音声情報のうち少なくともいずれか一方の情報の内容に基づいて利用者の行動パターンを判断し、該行動パターンに応じて符号化パラメータを決定する手段と、各利用者ごとに、決定された符号化パラメータに従って符号化された映像情報を表示する手段と、を有することを特徴とする。
請求項5記載の本発明は、通信ネットワークを介して複数の利用者端末が接続され、各利用者端末が取得した利用者の映像情報および音声情報を相互に送受信し、ビデオ会議を行うビデオ会議システムに用いられる利用者端末用プログラムであって、前記利用者の映像情報および音声情報を取得するステップと、取得した映像情報及び音声情報のうち少なくともいずれか一方の情報の内容に基づいて前記利用者の行動パターンを判断し、該行動パターンに応じて符号化パラメータを決定するステップと、決定された符号化パラメータに従って符号化された映像情報及び音声情報を他の利用者端末に送信するステップと、他の利用者端末それぞれから、他の利用者の符号化された映像情報及び音声情報を受信するステップと、各利用者ごとの符号化された映像情報を表示するステップと、を前記利用者端末に実行させることを特徴とする。
請求項6記載の本発明は、通信ネットワークを介して複数の利用者端末が接続され、各利用者端末が取得した利用者の映像情報および音声情報を相互に送受信し、ビデオ会議を行うビデオ会議システムに用いられる利用者端末用プログラムであって、他の利用者端末それぞれから、他の利用者の映像情報および音声情報を受信するステップと、各利用者ごとに、受信した映像情報及び音声情報のうち少なくともいずれか一方の情報の内容に基づいて利用者の行動パターンを判断し、該行動パターンに応じて符号化パラメータを決定するステップと、各利用者ごとに、決定された符号化パラメータに従って符号化された映像情報を表示するステップと、を前記利用者端末に実行させることを特徴とする。
請求項7記載の本発明は、請求項5記載の発明において、前記符号化パラメータは、ビットレート及び画像サイズのうち少なくともいずれか一方であることを特徴とする。
請求項8記載の本発明は、請求項6記載の発明において、前記符号化パラメータは、フレームレート及び画像サイズのうち少なくともいずれか一方であることを特徴とする。
請求項9記載の本発明は、請求項5乃至8のいずれか1項に記載の発明において、前記音声情報の内容に基づいて符号化パラメータを決定する場合には、2つの画質高低の符号化パラメータの値を用意し、前記音声情報のゲイン値が予め定められた第1の閾値以上のときには、画質が高い値の符号化パラメータを割り当て、前記音声情報のゲイン値が予め定められた第1の閾値未満のときには、画質が低い値の符号化パラメータを割り当てることを特徴とする。
請求項10記載の本発明は、請求項5乃至8のいずれか1項に記載の発明において、前記映像情報の内容に基づいて符号化パラメータを決定する場合には、2つの画質高低の符号化パラメータの値を用意し、前記映像情報の画像フレーム間の差分情報が予め定められた第2の閾値以上のときには、画質の高い値の符号化パラメータを割り当て、前記映像情報の画像フレーム間の差分情報が予め定められた第2の閾値未満のときには、画質の低い値の符号化パラメータを割り当てることを特徴とする。
請求項11記載の本発明は、請求項5乃至8のいずれか1項に記載の発明において、前記符号化パラメータは、前記音声情報のゲイン値又は前記映像情報の画像フレーム間の差分情報が大きいほど画質が高くなるようなパラメータ値を割り当てられることを特徴とする。
請求項12記載の本発明は、請求項5乃至11のいずれか1項に記載の発明において、前記決定した符号化パラメータは、利用者単位に変更可能であることを特徴とする。
請求項13記載の本発明は、請求項5乃至12のいずれか1項に記載の発明において、前記映像情報の符号化パラメータを決定するステップは、前記行動パターンに応じて映像情報の透過率を決定することを特徴とする。
請求項14記載の本発明は、請求項5乃至13のいずれか1項に記載の発明において、前記各利用者の映像情報および音声情報は、サーバコンピュータを介して送受信されることを特徴とする。
本発明によれば、各利用者の映像情報及び音声情報のうち少なくともいずれか一方の情報の内容に基づいて各利用者の行動パターンを判断し、該行動パターンに応じて映像情報の符号化パラメータを決定し、決定した符号化パラメータで各利用者の映像情報を表示することができる。
この結果、発言又は動きのある利用者を視覚的に強調して示すことができるとともに、映像画面の領域がビデオ会議に必要な他の表示領域を圧迫することがないので、利用者が増加しても、ビデオ会議を円滑に進行させることができる。
以下、本発明の実施の形態を図面を用いて説明する。
<第1の実施の形態>
図1は、本発明の第1の実施の形態に係るビデオ会議システム100の概略構成図である。図1に示すビデオ会議システム100は、サーバコンピュータ2、ビデオ会議に参加する各利用者が備える利用者端末3i(i=a,b,…,n)、サーバコンピュータ2と利用者端末3iを相互に通信可能とするインターネット網などの通信ネットワーク4を有するシステム構成となっている。
サーバコンピュータ2は、各利用者端末3iと通信を行う通信部21を具備し、各利用者端末3iから送信された映像データおよび音声データを受信すると複製して他の利用者端末3iに送信するデータ中継機能を有している。
利用者端末3iは、カメラおよびマイクを備えて利用者を撮影し、取得した利用者の映像データおよび音声データをサーバコンピュータ2に送信するようになっている。利用者端末3iは、詳しくは、サーバコンピュータ2と通信を行う通信部31、取得した利用者の映像データおよび音声データの内容から行動パターンを決定し、決定された行動パターンに応じたパラメータで符号化された映像データおよび音声データをサーバコンピュータ2に送信するように制御するとともに、サーバコンピュータ2から送信された他の利用者の符号化された映像データおよび音声データを出力するように制御するデータ制御部32、映像データおよび音声データ、並びにビデオ会議に必要なデータなどを入力するデータ入力部33(具体的には、上述したカメラ、マイクの他、キーボード、マウスなどが該当する)、映像データおよび音声データ、並びにビデオ会議に必要なデータなどを出力するデータ出力部34(具体的にはディスプレイ、スピーカなどが該当する)、及びビデオ会議に必要なデータを記憶するデータ記憶部35を具備する構成となっている。
尚、上述したサーバコンピュータ2及び利用者端末3iは、少なくとも演算機能および制御機能を備えた中央演算装置(CPU)、プログラムやデータを格納する機能を有するRAM等からなる主記憶装置(メモリ)を有する電子的な装置から構成されているものである。また、サーバコンピュータ2及び利用者端末3iは、主記憶装置の他、ハードディスクなどの補助記憶装置を具備していてもよい。
また、本実施の形態に係る各種処理を実行するプログラムは、前述した主記憶装置またはハードディスクに格納されているものである。そして、このプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVD−ROMなどのコンピュータ読み取り可能な記録媒体に記録することも、通信ネットワークを介して配信することも可能である。
次に、本実施の形態に係るビデオ会議システム100の動作を図2を用いて説明する。ここで、図2(a)は、各利用者端末3iが取得した利用者の映像データおよび音声データをサーバコンピュータ2に送信するまでの動作を説明するフローチャート図であり、図2(b)は、サーバコンピュータ2が各利用者端末3iに各利用者の映像データおよび音声データを送信した後の利用者端末3iの動作を説明するフローチャート図である。
始めに、各利用者端末3iが取得した利用者の映像データおよび音声データをサーバコンピュータ2に送信するまでの動作について説明する。まず、利用者端末3iが利用者の映像データおよび音声データを取得する(ステップS10)。尚、利用者端末3iに取得される映像データは、カメラからの非圧縮の映像であり、例えば、画像サイズをCIFサイズ(Common Intermediate Format;352×288pixel)とする。
次に、取得したデータから各利用者の行動パターンを検知する。ここでは、一具体例として各利用者の発言により検知する場合と、各利用者の動きにより検知する場合の2つについて説明する。
利用者の発言により検知する場合には、取得した音声データのゲイン値が予め設定した閾値以上であれば、この利用者に発言があったもの(行動パターンAとする)と判定する(ステップS20)。これに対して、取得した音声データのゲイン値が予め設定した閾値未満であれば、この利用者には発言がなかったもの(行動パターンBとする)と判定する(ステップS20)。
利用者の動きにより検知する場合には、取得した映像データの連続するフレーム間で局所領域ごとに動きベクトルを求め、その動きベクトルのスカラー量の平均が予め設定した閾値以上であれば、この利用者に動きがあったもの(行動パターンAとする)と判定する(ステップS20)。これに対して、取得した映像データの動きベクトルのスカラー量の平均が予め設定した閾値未満であれば、この利用者には動きがなかったもの(行動パターンBとする)と判定する(ステップS20)。
次に、上述した行動パターンに基づいて利用者の映像データ及び音声データの符号化パラメータを決定する。尚、本実施の形態においては、一例として、MPEG(Moving Picture Expert Group)4コーデックを用いることとする。具体的には、行動パターンA(発言又は動きがあった)の利用者の映像データに対しては、例えば、CIFサイズの画像を384kbpsのビットレートで符号化する(これをパラメータαとする)(ステップS30)。一方、行動パターンBの利用者の映像データに対しては、CIFサイズの画像を縮小して、例えば、SQCIF(Sub Quarter Common Intermediate Format;128×96pixel)サイズに変換した後、48kbpsのビットレートで符号化する(これをパラメータβとする)(ステップS40)。
次に、利用者端末3iは、決定されたパラメータで符号化された映像データおよび音声データ(以下、符号化データという。尚、決定された符号化パラメータ値は符号化データのヘッダ情報に記憶されている)をサーバコンピュータ2に送信する(ステップS50)。
次に、サーバコンピュータ2が各利用者端末3iに各利用者の符号化データを送信した後の利用者端末3iの動作について説明する。まず、利用者端末3iがサーバコンピュータ2から各利用者の符号化データを受信する(ステップS60)。
次に、利用者端末3iは、各利用者の映像データを符号化パラメータに従ってデコードし、映像画面d40をディスプレイ上にそれぞれ表示する(ステップS70)。図3は、発言により行動パターンを検知する場合のディスプレイ上の表示例を示すものであるが、図3(a)は利用者の1人に発言があった場合、図3(b)は利用者全員に発言がなかった場合の映像画面d40を示している。尚、ここでは、共有データ画面d10及びチャット画面d30で画面全体を使用し、映像画面d40はこれら画面の上に表示するものとする(参加者リスト画面d20は表示されない)。
図3(b)に示すように利用者の誰からも発言がない場合には、映像画面d40のビットレート及び画像サイズは小さく設定されるので、細部は確認できないが参加者の特定は可能であるとともに、映像画面d40に邪魔されることなく背景の共有データ画面d10及びチャット画面d30を確認することができる。一方、発言がある場合には、発言者の映像画面d40のビットレート及び画像サイズは大きく設定されるので、発言者の映像画面d40が大きく表示されるとともに、細部まで明確に確認することができる。このように、各映像画面d40のビットレート及び画像サイズを変更して共有データ画面d10及びチャット画面d30上に重ねて表示することにより、限定された表示領域を有効に利用することができる。
また、図4は、動きにより行動パターンを検知する場合のディスプレイ上の表示例を示すものであるが、図4(a)は利用者の1人に動きがあった場合、図4(b)は利用者全員に動きがなかった場合の映像画面d40を示している。尚、ここでは、共有データ画面d10及びチャット画面d30で画面全体を使用し、映像画面d40はこれら画面の上に表示するものとする(参加者リスト画面d20は表示されない)。
図4(b)に示すように利用者の誰にも動きがない場合には、映像画面d40のビットレート及び画像サイズは小さく設定されるので、細部は確認できないが参加者の特定は可能であるとともに、映像画面d40に邪魔されることなく背景の共有データ画面d10及びチャット画面d30を確認することができる。一方、動きがある場合には、動きのある映像画面d40のビットレート及び画像サイズは大きく設定されるので、動いた者の映像画面d40が大きく表示されるとともに、細部まで明確に確認することができる。このように、各映像画面d40のビットレート及び画像サイズを変更して共有データ画面d10及びチャット画面d30上に重ねて表示することにより、限定された表示領域を有効に利用することができる。
以上、本実施の形態に係るビデオ会議システム100によれば、各利用者の映像データ又は音声データの情報の内容に基づいて、各利用者の行動パターンを判断し、該行動パターンに応じて符号化パラメータを決定し、決定した符号化パラメータで各利用者の映像データを表示するので、利用者が増加しても、ビデオ会議を円滑に進行させることができる。
即ち、共有データ画面などビデオ会議に必要な他の表示画面を小さくすることなく、すべての利用者の映像画面d40をディスプレイ上に表示することができる。また、発言又は動きがあった利用者に対しては、ビットレートを高くして、画像サイズを大きくするように符号化パラメータを設定するので、発言又は動きがあった利用者を視覚的に強調して示すことができる。これにより、従来のビデオ会議システムにおいては常に表示が必要であった参加者リスト画面d20を非表示にすることができる。
また、本実施の形態においては、サーバコンピュータ2に映像データ及び音声データを送信する前に、利用者端末3iが、利用者の行動パターンを判断し、発言や動きがない場合には低いビットレート及び小さい画像サイズで符号化し、情報量を減らして送信するので、利用者が増加しても、利用者数に比例したネットワーク帯域は必要でなく、通信ネットワーク4上のトラフィックを減らすことができる。
尚、本実施の形態においては、行動パターンを二分し、それぞれの行動パターンに対して符号化パラメータを決定したが、本発明はこれに限定されるものではなく、さらに行動パターンを細分化して、それぞれの符号化パラメータを決定してもよい。
また、符号化パラメータの決定に際しては、上述したアルゴリズムに加えて、各利用者の意思を反映できるようにしてもよい。例えば、特定の利用者(例えば、ビデオ会議における中心的な人物)の符号化パラメータを行動パターンに関係なく、常に一定となるように設定してもよいものである(例えば、大きい画像サイズに符号化パラメータを設定)。
また、本実施の形態においては、ビットレート及び画像サイズ(解像度)の双方を符号化パラメータとして設定していたが、該符号化パラメータのうち、いずれか一方だけを設定するようにしてもよいものである。
さらに、上述した符号化パラメータに加えて、映像データの透過率に関するパラメータ値を設定してもよい。例えば、行動パターンA(発言又は動きがあった)の利用者の映像データに対しては、透過率はa(例えば、a=10〜20%程度;小さい透過率を設定する)、行動パターンBの利用者の映像データに対しては、透過率はb(例えば、b=60〜80%程度;大きい透過率を設定する)として、映像画面を半透明化してもよいものである。尚、透過率は値が大きいほど、透明度が高く、背景が透けて見えるようになっている。これにより、利用者端末3iにおいては、発言又は動きがあった利用者をより視覚的に強調して示すことができる。
<第2の実施の形態>
図5は、本発明の第2の実施の形態に係るビデオ会議システム200の概略構成図である。図5に示すビデオ会議システム200は、サーバコンピュータ2、ビデオ会議に参加する各利用者が備える利用者端末5i(i=a,b,…,n)、サーバコンピュータ2と利用者端末5iを相互に通信可能とするインターネット網などの通信ネットワーク4を有するシステム構成となっている。尚、本実施の形態においては、第1の実施の形態と異なる構成及び機能のみ説明し、その他の構成及び機能に関しては同一部分には同一符号を付して説明を省略する。
利用者端末5iは、カメラおよびマイクを備えて利用者を撮影し、取得した利用者の映像データおよび音声データをサーバコンピュータ2に送信するようになっている。利用者端末5iは、詳しくは、サーバコンピュータ2と通信を行う通信部31、取得した利用者の映像データおよび音声データをサーバコンピュータ2に送信するとともに、サーバコンピュータ2から送信された他の利用者の映像データおよび音声データの内容から各利用者の行動パターンを決定し、決定された行動パターンに応じたパラメータで符号化された映像データを画面に表示するように制御するデータ制御部52、映像データおよび音声データ、並びにビデオ会議に必要なデータなどを入力するデータ入力部33(具体的には、上述したカメラ、マイクの他、キーボード、マウスなどが該当する)、映像データおよび音声データ、並びにビデオ会議に必要なデータなどを出力するデータ出力部34(具体的にはディスプレイ、スピーカなどが該当する)、及びビデオ会議に必要なデータを記憶するデータ記憶部35を具備する構成となっている。
尚、上述した利用者端末5iは、少なくとも演算機能および制御機能を備えた中央演算装置(CPU)、プログラムやデータを格納する機能を有するRAM等からなる主記憶装置(メモリ)を有する電子的な装置から構成されているものである。また、利用者端末5iは、主記憶装置の他、ハードディスクなどの補助記憶装置を具備していてもよい。
また、利用者端末5iの各種処理を実行するプログラムは、前述した主記憶装置またはハードディスクに格納されているものである。そして、このプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVD−ROMなどのコンピュータ読み取り可能な記録媒体に記録することも、通信ネットワークを介して配信することも可能である。
次に、本実施の形態に係るビデオ会議システム200の動作を図6を用いて説明する。ここで、図6は、サーバコンピュータ2が各利用者端末5iに各利用者の映像データおよび音声データを送信した後の利用者端末5iの動作を説明するフローチャート図である。
まず、利用者端末5iがサーバコンピュータ2から各利用者の映像データおよび音声データを受信する(ステップS110)。尚、受信する映像データがMotionJPEG(Joint Photographic Coding Experts Group)、MPEG2、MPEG4等により圧縮されたデータである場合には、各デコーダを用いてデコードする。また、受信したデータは、例えば、画像サイズがCIFサイズ、フレームレートは15fpsであるとする。
次に、受信したデータから各利用者の行動パターンを検知する。尚、本実施の形態においても、第1の実施の形態と同様に、一具体例として利用者の発言により検知する場合と、利用者の動きにより検知する場合の2つについて説明する。
各利用者の発言により検知する場合には、受信した音声データのゲイン値が予め設定した閾値以上であれば、音声データの送信元IPアドレスから利用者端末5i(利用者)を特定し、この利用者に発言があったもの(行動パターンAとする)と判定する(ステップS120)。これに対して、受信した音声データのゲイン値が予め設定した閾値未満であれば、この利用者には発言がなかったもの(行動パターンBとする)と判定する(ステップS120)。
各利用者の動きにより検知する場合には、受信した映像データ、例えば、MPEG2やMPEG4の符号化パラメータの1つである動きベクトルのスカラー量の平均が予め設定した閾値以上であれば、映像データの送信元IPアドレスから利用者端末5i(利用者)を特定し、この利用者に動きがあったもの(行動パターンAとする)と判定する(ステップS120)。これに対して、受信した映像データの動きベクトルのスカラー量の平均が予め設定した閾値未満であれば、この利用者には動きがなかったもの(行動パターンBとする)と判定する(ステップS120)。尚、MotionJPEGのように画像間の差分情報を求めないデータ形式の場合には、画像間で局所領域毎に動きベクトルを求め、これにより判定するものとする。
次に、上述した行動パターンに基づいて各利用者の映像データ及び音声データの符号化パラメータを変更する。具体的には、行動パターンに応じてフレームレート及び画像サイズを変更するものであるが、例えば、行動パターンA(発言又は動きがあった)の利用者の映像データに対しては、何も変更を加えないが、行動パターンBの利用者の映像データに対しては、画像の縮小処理によりSQCIFサイズに変換し、また、間引き処理によりフレームレートを1fpsとする(ステップS130)。
次に、符号化パラメータに従って各利用者の映像画面d40をディスプレイ上にそれぞれ表示する(ステップS140)。
以上、本実施の形態に係るビデオ会議システム200によれば、利用者端末5iがサーバコンピュータ2から各利用者の映像データ及び音声データを受信した後、各利用者の映像データ又は音声データの情報の内容に基づいて、各利用者の行動パターンを判断し、該行動パターンに応じて符号化パラメータを決定し、決定した符号化パラメータで各利用者の映像データを表示するので、利用者が増加しても、ビデオ会議を円滑に進行させることができる。
即ち、共有データ画面などビデオ会議に必要な他の表示画面を小さくすることなく、すべての利用者の映像画面d40をディスプレイ上に表示することができる。また、発言又は動きがあった利用者に対しては、フレームレートを高くして、画像サイズを大きくするように符号化パラメータを設定するので、発言又は動きがあった利用者を視覚的に強調して示すことができる。これにより、従来のビデオ会議システムにおいては常に表示が必要であった参加者リスト画面d20を非表示にすることができる。
尚、本実施の形態においては、行動パターンを二分し、それぞれの行動パターンに対して符号化パラメータを決定したが、本発明はこれに限定されるものではなく、さらに行動パターンを細分化して、それぞれの符号化パラメータを決定してもよい。
また、符号化パラメータの決定に際しては、上述したアルゴリズムに加えて、各利用者の意思を反映できるようにしてもよい。例えば、特定の利用者(例えば、ビデオ会議における中心的な人物)の映像データの符号化パラメータを行動パターンに関係なく、常に一定となるように設定してもよいものである(例えば、高いフレームレート、大きい画像サイズに符号化パラメータを設定)。
また、本実施の形態においては、フレームレート及び画像サイズ(解像度)の双方を符号化パラメータとして設定していたが、該符号化パラメータのうち、いずれか一方だけを設定するようにしてもよいものである。
さらに、上述した符号化パラメータに加えて、映像データの透過率に関するパラメータ値を設定してもよい。例えば、行動パターンA(発言又は動きがあった)の利用者の映像データに対しては、透過率はa(例えば、a=10〜20%程度;小さい透過率を設定する)、行動パターンBの利用者の映像データに対しては、透過率はb(例えば、b=60〜80%程度;大きい透過率を設定する)として、映像画面を半透明化してもよいものである。尚、透過率は値が大きいほど、透明度が高く、背景が透けて見えるようになっている。これにより、利用者端末5iにおいては、発言又は動きがあった利用者をより視覚的に強調して示すことができる。
以上、本発明の実施の形態について説明してきたが、本発明の要旨を逸脱しない範囲において、本発明の実施の形態に対して種々の変形や変更を施すことができる。例えば、第1及び第2の実施の形態に係るビデオ会議システムの利用者端末は、サーバコンピュータを介して映像データおよび音声データを送受信していたが、本発明はこのシステム構成に限定されるものではなく、サーバコンピュータを介さずP2P(Peer to Peer)のシステム構成としてもよいものである。
本発明の第1の実施の形態に係るビデオ会議システムの概略構成図である。 本発明の第1の実施の形態に係るビデオ会議システムの動作を説明するフローチャート図である。 本発明の第1の実施の形態に係るビデオ会議システムにおける映像画面の一例である。 本発明の第1の実施の形態に係るビデオ会議システムにおける映像画面の一例である。 本発明の第2の実施の形態に係るビデオ会議システムの概略構成図である。 本発明の第2の実施の形態に係るビデオ会議システムの動作を説明するフローチャート図である。 従来のビデオ会議システムの表示画面を説明する図である。
符号の説明
2 サーバ
3i,5i 利用者端末
4 通信ネットワーク
21,31 通信部
32,52 データ制御部
33 データ入力部
34 データ出力部
35 データ記憶部
100,200 ビデオ会議システム
d10 共有データ画面
d20 参加者リスト画面
d30 チャット画面
d40 映像画面

Claims (14)

  1. 通信ネットワークを介して複数の利用者端末が接続され、各利用者端末が取得した利用者の映像情報および音声情報を相互に送受信し、ビデオ会議を行うビデオ会議システムにおける映像表示方法であって、
    前記各利用者端末が、
    前記利用者の映像情報および音声情報を取得し、
    取得した映像情報及び音声情報のうち少なくともいずれか一方の情報の内容に基づいて前記利用者の行動パターンを判断し、該行動パターンに応じて符号化パラメータを決定し、
    決定された符号化パラメータに従って符号化された映像情報及び音声情報を他の利用者端末に送信し、
    他の利用者端末それぞれから、他の利用者の符号化された映像情報及び音声情報を受信し、
    各利用者ごとの符号化された映像情報を表示することを特徴とするビデオ会議システムにおける映像表示方法。
  2. 通信ネットワークを介して複数の利用者端末が接続され、各利用者端末が取得した利用者の映像情報および音声情報を相互に送受信し、ビデオ会議を行うビデオ会議システムにおける映像表示方法であって、
    前記各利用者端末が、
    他の利用者端末それぞれから、他の利用者の映像情報および音声情報を受信し、
    各利用者ごとに、受信した映像情報及び音声情報のうち少なくともいずれか一方の情報の内容に基づいて利用者の行動パターンを判断し、該行動パターンに応じて符号化パラメータを決定し、
    各利用者ごとに、決定された符号化パラメータに従って符号化された映像情報を表示することを特徴とするビデオ会議システムにおける映像表示方法。
  3. 通信ネットワークを介して複数の利用者端末が接続され、各利用者端末が取得した利用者の映像情報および音声情報を相互に送受信し、ビデオ会議を行うビデオ会議システムに用いられる前記利用者端末であって、
    前記利用者の映像情報および音声情報を取得する手段と、
    取得した映像情報及び音声情報のうち少なくともいずれか一方の情報の内容に基づいて前記利用者の行動パターンを判断し、該行動パターンに応じて符号化パラメータを決定する手段と、
    決定された符号化パラメータに従って符号化された映像情報及び音声情報を他の利用者端末に送信する手段と、
    他の利用者端末それぞれから、他の利用者の符号化された映像情報及び音声情報を受信する手段と、
    各利用者ごとの符号化された映像情報を表示する手段と、
    を有することを特徴とするビデオ会議システムに用いられる利用者端末。
  4. 通信ネットワークを介して複数の利用者端末が接続され、各利用者端末が取得した利用者の映像情報および音声情報を相互に送受信し、ビデオ会議を行うビデオ会議システムに用いられる前記利用者端末であって、
    他の利用者端末それぞれから、他の利用者の映像情報および音声情報を受信する手段と、
    各利用者ごとに、受信した映像情報及び音声情報のうち少なくともいずれか一方の情報の内容に基づいて利用者の行動パターンを判断し、該行動パターンに応じて符号化パラメータを決定する手段と、
    各利用者ごとに、決定された符号化パラメータに従って符号化された映像情報を表示する手段と、
    を有することを特徴とするビデオ会議システムに用いられる利用者端末。
  5. 通信ネットワークを介して複数の利用者端末が接続され、各利用者端末が取得した利用者の映像情報および音声情報を相互に送受信し、ビデオ会議を行うビデオ会議システムに用いられる利用者端末用プログラムであって、
    前記利用者の映像情報および音声情報を取得するステップと、
    取得した映像情報及び音声情報のうち少なくともいずれか一方の情報の内容に基づいて前記利用者の行動パターンを判断し、該行動パターンに応じて符号化パラメータを決定するステップと、
    決定された符号化パラメータに従って符号化された映像情報及び音声情報を他の利用者端末に送信するステップと、
    他の利用者端末それぞれから、他の利用者の符号化された映像情報及び音声情報を受信するステップと、
    各利用者ごとの符号化された映像情報を表示するステップと、
    を前記利用者端末に実行させることを特徴とするビデオ会議システムに用いられる利用者端末用プログラム。
  6. 通信ネットワークを介して複数の利用者端末が接続され、各利用者端末が取得した利用者の映像情報および音声情報を相互に送受信し、ビデオ会議を行うビデオ会議システムに用いられる利用者端末用プログラムであって、
    他の利用者端末それぞれから、他の利用者の映像情報および音声情報を受信するステップと、
    各利用者ごとに、受信した映像情報及び音声情報のうち少なくともいずれか一方の情報の内容に基づいて利用者の行動パターンを判断し、該行動パターンに応じて符号化パラメータを決定するステップと、
    各利用者ごとに、決定された符号化パラメータに従って符号化された映像情報を表示するステップと、
    を前記利用者端末に実行させることを特徴とするビデオ会議システムに用いられる利用者端末用プログラム。
  7. 前記符号化パラメータは、ビットレート及び画像サイズのうち少なくともいずれか一方であることを特徴とする請求項5記載のビデオ会議システムに用いられる利用者端末用プログラム。
  8. 前記符号化パラメータは、フレームレート及び画像サイズのうち少なくともいずれか一方であることを特徴とする請求項6記載のビデオ会議システムに用いられる利用者端末用プログラム。
  9. 前記音声情報の内容に基づいて符号化パラメータを決定する場合には、2つの画質高低の符号化パラメータの値を用意し、前記音声情報のゲイン値が予め定められた第1の閾値以上のときには、画質が高い値の符号化パラメータを割り当て、前記音声情報のゲイン値が予め定められた第1の閾値未満のときには、画質が低い値の符号化パラメータを割り当てることを特徴とする請求項5乃至8のいずれか1項に記載のビデオ会議システムに用いられる利用者端末用プログラム。
  10. 前記映像情報の内容に基づいて符号化パラメータを決定する場合には、2つの画質高低の符号化パラメータの値を用意し、前記映像情報の画像フレーム間の差分情報が予め定められた第2の閾値以上のときには、画質の高い値の符号化パラメータを割り当て、前記映像情報の画像フレーム間の差分情報が予め定められた第2の閾値未満のときには、画質の低い値の符号化パラメータを割り当てることを特徴とする請求項5乃至8のいずれか1項に記載のビデオ会議システムに用いられる利用者端末用プログラム。
  11. 前記符号化パラメータは、前記音声情報のゲイン値又は前記映像情報の画像フレーム間の差分情報が大きいほど画質が高くなるようなパラメータ値を割り当てられることを特徴とする請求項5乃至8のいずれか1項に記載のビデオ会議システムに用いられる利用者端末用プログラム。
  12. 前記決定した符号化パラメータは、利用者単位に変更可能であることを特徴とする請求項5乃至11のいずれか1項に記載のビデオ会議システムに用いられる利用者端末用プログラム。
  13. 前記映像情報の符号化パラメータを決定するステップは、前記行動パターンに応じて映像情報の透過率を決定することを特徴とする請求項5乃至12のいずれか1項に記載のビデオ会議システムに用いられる利用者端末用プログラム。
  14. 前記各利用者の映像情報および音声情報は、サーバコンピュータを介して送受信されることを特徴とする請求項5乃至13のいずれか1項に記載のビデオ会議システムに用いられる利用者端末用プログラム。
JP2004118217A 2004-04-13 2004-04-13 ビデオ会議システムにおける映像表示方法、ビデオ会議システムに用いられる利用者端末、及びビデオ会議システムに用いられる利用者端末用プログラム Pending JP2005303736A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004118217A JP2005303736A (ja) 2004-04-13 2004-04-13 ビデオ会議システムにおける映像表示方法、ビデオ会議システムに用いられる利用者端末、及びビデオ会議システムに用いられる利用者端末用プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004118217A JP2005303736A (ja) 2004-04-13 2004-04-13 ビデオ会議システムにおける映像表示方法、ビデオ会議システムに用いられる利用者端末、及びビデオ会議システムに用いられる利用者端末用プログラム

Publications (1)

Publication Number Publication Date
JP2005303736A true JP2005303736A (ja) 2005-10-27

Family

ID=35334734

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004118217A Pending JP2005303736A (ja) 2004-04-13 2004-04-13 ビデオ会議システムにおける映像表示方法、ビデオ会議システムに用いられる利用者端末、及びビデオ会議システムに用いられる利用者端末用プログラム

Country Status (1)

Country Link
JP (1) JP2005303736A (ja)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007063922A1 (ja) * 2005-11-29 2007-06-07 Kyocera Corporation 通信端末および通信システム、並びに通信端末の表示方法
JP2007150877A (ja) * 2005-11-29 2007-06-14 Kyocera Corp 通信端末およびその表示方法
JP2007150918A (ja) * 2005-11-29 2007-06-14 Kyocera Corp 通信端末およびその表示方法
JP2007150919A (ja) * 2005-11-29 2007-06-14 Kyocera Corp 通信端末およびその表示方法
JP2007150920A (ja) * 2005-11-29 2007-06-14 Kyocera Corp 通信端末およびその表示方法
JP2007150917A (ja) * 2005-11-29 2007-06-14 Kyocera Corp 通信端末およびその表示方法
JP2007150921A (ja) * 2005-11-29 2007-06-14 Kyocera Corp 通信端末および通信システム、並びに通信端末の表示方法
JP2007251501A (ja) * 2006-03-15 2007-09-27 Nec Corp テレビ会議システム及びテレビ会議方法
JP2010004573A (ja) * 2009-10-05 2010-01-07 Kyocera Corp 通信端末およびその表示方法
JP2011520387A (ja) * 2008-05-06 2011-07-14 マイクロソフト コーポレーション マルチメディア会議イベントのメディアコンテンツを管理する技術
JP2013126103A (ja) * 2011-12-14 2013-06-24 Fujitsu Ltd 通信装置および通信制御方法
WO2014103131A1 (ja) * 2012-12-26 2014-07-03 パナソニック株式会社 画像監視システム
JP2017034456A (ja) * 2015-07-31 2017-02-09 キヤノン株式会社 コミュニケーションシステム、その制御方法及びプログラム
JP2017135478A (ja) * 2016-01-25 2017-08-03 ブラザー工業株式会社 遠隔会議方法及び通信プログラム
JP2018078628A (ja) * 2017-12-26 2018-05-17 株式会社リコー 情報処理端末、会議システム、映像データ送信方法及びプログラム
WO2024121994A1 (ja) * 2022-12-07 2024-06-13 日本電信電話株式会社 情報処理装置、情報処理方法及び情報処理プログラム

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8487956B2 (en) 2005-11-29 2013-07-16 Kyocera Corporation Communication terminal, system and display method to adaptively update a displayed image
JP2007150877A (ja) * 2005-11-29 2007-06-14 Kyocera Corp 通信端末およびその表示方法
JP2007150918A (ja) * 2005-11-29 2007-06-14 Kyocera Corp 通信端末およびその表示方法
JP2007150919A (ja) * 2005-11-29 2007-06-14 Kyocera Corp 通信端末およびその表示方法
JP2007150920A (ja) * 2005-11-29 2007-06-14 Kyocera Corp 通信端末およびその表示方法
JP2007150917A (ja) * 2005-11-29 2007-06-14 Kyocera Corp 通信端末およびその表示方法
JP2007150921A (ja) * 2005-11-29 2007-06-14 Kyocera Corp 通信端末および通信システム、並びに通信端末の表示方法
WO2007063922A1 (ja) * 2005-11-29 2007-06-07 Kyocera Corporation 通信端末および通信システム、並びに通信端末の表示方法
JP2007251501A (ja) * 2006-03-15 2007-09-27 Nec Corp テレビ会議システム及びテレビ会議方法
JP2011520387A (ja) * 2008-05-06 2011-07-14 マイクロソフト コーポレーション マルチメディア会議イベントのメディアコンテンツを管理する技術
JP2010004573A (ja) * 2009-10-05 2010-01-07 Kyocera Corp 通信端末およびその表示方法
JP2013126103A (ja) * 2011-12-14 2013-06-24 Fujitsu Ltd 通信装置および通信制御方法
WO2014103131A1 (ja) * 2012-12-26 2014-07-03 パナソニック株式会社 画像監視システム
JP2017034456A (ja) * 2015-07-31 2017-02-09 キヤノン株式会社 コミュニケーションシステム、その制御方法及びプログラム
JP2017135478A (ja) * 2016-01-25 2017-08-03 ブラザー工業株式会社 遠隔会議方法及び通信プログラム
JP2018078628A (ja) * 2017-12-26 2018-05-17 株式会社リコー 情報処理端末、会議システム、映像データ送信方法及びプログラム
WO2024121994A1 (ja) * 2022-12-07 2024-06-13 日本電信電話株式会社 情報処理装置、情報処理方法及び情報処理プログラム

Similar Documents

Publication Publication Date Title
JP6022618B2 (ja) ビデオテレフォニーに関する関心領域抽出
JP5781441B2 (ja) マルチビットレートストリームを使用するビデオ会議のサブスクリプション
JP5450574B2 (ja) ビデオテレフォニーに関する関心領域処理
EP2359596B1 (en) Video conference rate matching
US7508413B2 (en) Video conference data transmission device and data transmission method adapted for small display of mobile terminals
JP2005303736A (ja) ビデオ会議システムにおける映像表示方法、ビデオ会議システムに用いられる利用者端末、及びビデオ会議システムに用いられる利用者端末用プログラム
JP4994646B2 (ja) 通信端末および通信システム、並びに通信端末の表示方法
TW201246942A (en) Object of interest based image processing
JP2014522538A (ja) 改善されたインタラクティブコンテンツをビデオ通信システムで共有するためのシステムおよび方法
CN104012086A (zh) 用于视频会议环境中景深导向图像滤波的系统和方法
JP2017523632A (ja) 映像でのプレゼンテーションのための方法、装置、およびシステム
JP6179179B2 (ja) 情報処理装置、情報処理方法およびプログラム
US20040001091A1 (en) Method and apparatus for video conferencing system with 360 degree view
US9306987B2 (en) Content message for video conferencing
US8279259B2 (en) Mimicking human visual system in detecting blockiness artifacts in compressed video streams
JP7334470B2 (ja) 映像処理装置、ビデオ会議システム、映像処理方法、およびプログラム
JP4054775B2 (ja) ビデオ会議システムにおける映像表示方法及び映像表示制御方法、ビデオ会議システムに用いられる利用者端末及びサーバコンピュータ、並びにビデオ会議システムに用いられる利用者端末用プログラム及びサーバコンピュータ用プログラム
JP2011082867A (ja) 通信装置及び通信会議システム
US20150035940A1 (en) Systems and Methods for Integrating Audio and Video Communication Systems with Gaming Systems
CN112752058A (zh) 调整视频流的属性的方法和装置
US11877084B2 (en) Video conference user interface layout based on face detection
US20220303555A1 (en) Combining high-quality foreground with enhanced low-quality background
JP2005341347A (ja) 多地点接続装置および方法
CN113160342A (zh) 基于反馈的编码方法及装置、存储介质、电子设备
JP2007013801A (ja) 画像伝送方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060330

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080911

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080916

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090203