JP2016039600A - 制御装置、制御方法、プログラム、表示装置、撮像装置および映像会議システム - Google Patents

制御装置、制御方法、プログラム、表示装置、撮像装置および映像会議システム Download PDF

Info

Publication number
JP2016039600A
JP2016039600A JP2014163684A JP2014163684A JP2016039600A JP 2016039600 A JP2016039600 A JP 2016039600A JP 2014163684 A JP2014163684 A JP 2014163684A JP 2014163684 A JP2014163684 A JP 2014163684A JP 2016039600 A JP2016039600 A JP 2016039600A
Authority
JP
Japan
Prior art keywords
display
video
speaker
configuration
display devices
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014163684A
Other languages
English (en)
Other versions
JP6435701B2 (ja
Inventor
▲徳▼郎 山口
Tokuro Yamaguchi
▲徳▼郎 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2014163684A priority Critical patent/JP6435701B2/ja
Publication of JP2016039600A publication Critical patent/JP2016039600A/ja
Application granted granted Critical
Publication of JP6435701B2 publication Critical patent/JP6435701B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】話者関係性の把握を支援する映像会議システムを提供する。【解決手段】複数の表示装置それぞれが有するセンサによって検出されたセンサデータに基づいて、前記複数の表示装置それぞれを利用する会議参加者が話者であるか否かを判定する判定部と、前記複数の表示装置それぞれが有する会議参加者が話者であるか否かに基づいて、前記複数の表示装置それぞれによって表示される表示映像の構成を決定する構成決定部と、を備える、制御装置が提供される。【選択図】図1

Description

本発明は、制御装置、制御方法、プログラム、表示装置、撮像装置および映像会議システムに関するものである。
複数の拠点を結び、映像や音声を用いた多人数対応のTV会議システムが広く用いられている。このとき、ある拠点に配信されているもう一方の拠点側の映像は、例えば、別拠点の話者の切り替えに応じて適切に切り替えられることで、当該拠点にいる人の話者関係の把握を助けることはよく知られている。しかしながら、こういった映像の手動による切り替えは面倒で煩雑な操作を伴うことも多く、有効に用いられていない。結果として別拠点全体の映像視点のみを選択してしまい、各会議参加者の映像は小さくなり、表情の向きやジェスチャの方向といった非言語コミュニケーションが阻害される要因となっている。このため、複数の拠点において、誰と誰がしゃべっているのかといった話者関係の把握やその時点の話者以外の会議参加者(以下、「第3者」とも言う。)の動向などの把握が難しくなっている。
これらを解決するために、特許文献1では、会議参加者に対してマイクを1つずつ設置して話者の音声を収集し、またズームアップ用カメラを用いて話者を撮影するテレビ会議システムが開示されている。特許文献2には、対象者らに対して複数のマイクとカメラ、磁気センサなどの各種センサをそれぞれ設置し、視線の方向やうなずきのタイミングなどの非言語情報を収集し、その場にいない第3者に対して映像を切り替えて表示する映像切り替え装置を開示している。特許文献3では、会議拠点に会議参加者に向けたディスプレイを設置し、複数のカメラ、マイクから話者の映像・音声を収集し、一方の拠点において別拠点の会話者を表示するテレビ会議装置を開示している。また、会議参加者の人数分ディスプレイを分割し、各会議参加者の正面映像を個別表示する映像会議システムも存在する。
特開平2−202275号公報 特開2004−248125号公報 特許第5227899号
しかしながら、特許文献1では、一方の拠点(拠点A)の話者に対してズーム表示することに限定しており、そのとき拠点Aまたは他方の拠点(拠点B)の誰に対しての会話なのかを拠点B側の会議参加者が把握するのは難しい。特許文献2では、一方の拠点(拠点A)での話者関係の把握のために、他方の拠点(拠点B)での表示映像を切り替えることに限定しており、複数の拠点にまたがる話者関係性を把握することや、拠点A側から拠点B側の第3者の動向を把握することなどは難しくなっている。同様に、特許文献3では、拠点Aと拠点Bの話者関係をそれぞれの話者へ映像として提示することに限定しており、各々の話者にとって複数の拠点間の話者関係性の把握はなされているが、拠点Aおよび拠点B双方の第3者からはそれは困難である。また、各々の話者にとっても、双方の拠点の第3者の動向を把握することは難しい。また、会議参加者の人数分ディスプレイを分割し、各会議参加者を個別表示する映像会議システムにおいても、各会議参加者の正面映像しか表示されないため、同様に各々の話者にとっては複数拠点間の話者関係性は把握されているが、それ以外の第3者からは把握が困難である。
そこで、本発明は、上記問題に鑑みてなされたものであり、複数の拠点の第3者を含めた話者関係性の把握を支援する映像会議システムである。各会議参加者が保持するディスプレイ装置と拠点内を撮像する環境カメラを設置し、会議参加者の座席位置や立ち位置関係に応じた表示映像の切り替え方法と配信方法を提供する。これにより、参加者に対して、複数の拠点間の話者だけでなく、第3者も含めた話者周囲の関係性の把握を支援することができる。
上記問題を解決するために、本発明のある観点によれば、複数の表示装置それぞれが有するセンサによって検出されたセンサデータに基づいて、前記複数の表示装置それぞれを利用する会議参加者が話者であるか否かを判定する判定部と、前記複数の表示装置それぞれが有する会議参加者が話者であるか否かに基づいて、前記複数の表示装置それぞれによって表示される表示映像の構成を決定する構成決定部と、を備える、制御装置が提供される。
前記判定部は、話者の表示装置同士が別拠点に属するか否かを判定し、前記構成決定部は、話者の表示装置同士が別拠点に属するか否かに基づいて、前記複数の表示装置それぞれによって表示される前記表示映像の構成を決定してもよい。
前記構成決定部は、話者の表示装置同士が別拠点に属すると判定された場合、1の拠点における話者の表示装置によって表示される表示映像の構成を、他の拠点における話者を正面から映した映像が前記表示映像に含まれるように決定してもよい。
前記構成決定部は、話者の表示装置同士が別拠点に属すると判定された場合、1の拠点における非話者の表示装置によって表示される表示映像の構成を、前記1の拠点における話者を側面から映した映像および他の拠点における話者を側面から映した映像が、話者同士が向き合うようにして前記表示映像に含まれるように決定してもよい。
前記制御装置は、撮像装置から取得された取得映像のうち話者に関連付けられた設定領域を解析することにより話者の顔向きを判定する映像解析部を備え、前記構成決定部は、前記1の拠点における話者の顔向きと前記1の拠点における話者および非話者の位置関係とにさらに基づいて、前記1の拠点における話者の映像における向きを決定してもよい。
前記映像解析部は、前記取得映像における前記設定領域を示すレイアウト情報を取得してもよい。
前記構成決定部は、他の拠点における話者を側面から映した映像のサイズを調整してもよい。
前記構成決定部は、話者の表示装置同士が別拠点に属すると判定された場合、1の拠点における非話者の表示装置によって表示される表示映像の構成を、前記1の拠点における非話者と前記1の拠点における話者との距離が閾値を下回る場合、前記1の拠点における話者を側面から映した映像が前記表示映像に含まれないように決定してもよい。
前記構成決定部は、話者の表示装置同士が同一拠点に属すると判定された場合、1の拠点における話者の表示装置によって表示される表示映像の構成を、他の拠点を映した映像が前記表示映像に含まれるように決定してもよい。
前記構成決定部は、話者の表示装置同士が同一拠点に属すると判定された場合、1の拠点における話者のセンサと異なる拠点における非話者の表示装置によって表示される表示映像の構成を、同一拠点に属する話者それぞれを側面から映した映像が、前記話者同士が向き合うようにして前記表示映像に含まれるように決定してもよい。
前記構成決定部は、話者の表示装置同士が同一拠点に属すると判定された場合、1の拠点における話者のセンサと同一の拠点における非話者の表示装置によって表示される表示映像の構成を、他の拠点を映した映像が前記表示映像に含まれるように決定してもよい。
前記制御装置は、前記表示映像の構成に従って、前記表示映像を生成する表示制御部を備えてもよい。
前記判定部は、前記複数の表示装置それぞれが有する音声センサによって検出された音声データに基づいて、前記複数の表示装置それぞれの会議参加者が話者であるか否かを判定してもよい。
前記構成決定部は、前記表示装置の向きの変化に応じて前記表示装置によって表示される表示映像の構成を更新してもよい。
また、本発明の他の観点によれば、複数の表示装置それぞれが有するセンサによって検出されたセンサデータに基づいて、前記複数の表示装置それぞれを利用する会議参加者が話者であるか否かを判定するステップと、前記複数の表示装置それぞれが有する会議参加者が話者であるか否かに基づいて、前記複数の表示装置それぞれによって表示される表示映像の構成を決定するステップと、を含む、制御方法が提供される。
また、本発明の他の観点によれば、コンピュータを、複数の表示装置それぞれが有するセンサによって検出されたセンサデータに基づいて、前記複数の表示装置それぞれを利用する会議参加者が話者であるか否かを判定する判定部と、前記複数の表示装置それぞれが有する会議参加者が話者であるか否かに基づいて、前記複数の表示装置それぞれによって表示される表示映像の構成を決定する構成決定部と、を備える、制御装置として機能させるためのプログラムが提供される。
また、本発明の他の観点によれば、表示装置において、前記表示装置を利用する会議参加者が話者であるか否かに基づいて前記表示装置によって表示される表示映像の構成を決定する制御装置から、前記表示映像の構成を示す構成情報を取得する通信制御部と、前記構成情報に従って、前記表示映像を生成する表示制御部と、を備える、表示装置が提供される。
また、本発明の他の観点によれば、表示装置によって表示される表示映像の生成に利用される映像を取得する映像取得部と、前記表示装置を利用する会議参加者が話者であるか否かに基づいて前記表示映像の構成を決定する制御装置に対して、取得した前記映像を提供する通信制御部と、を備える、撮像装置が提供される。
また、本発明の他の観点によれば、複数の表示装置を有し、前記複数の表示装置それぞれが有するセンサによって検出されたセンサデータに基づいて、前記複数の表示装置それぞれを利用する会議参加者が話者であるか否かを判定する判定部と、前記複数の表示装置それぞれが有する会議参加者が話者であるか否かに基づいて、前記複数の表示装置それぞれによって表示される表示映像の構成を決定する構成決定部と、を備える、制御装置、を有する、映像会議システムが提供される。
以上説明したように本発明によれば、話者関係性の把握を支援する映像会議システムが提供される。
本発明の実施形態に係る映像会議システムの構成を示した説明図である。 ある地点にて3名の会議参加者がそれぞれ表示装置を利用して映像会議システム10を利用している様子を示した図である。 撮像装置の機能構成例を示したブロック図である。 撮像装置が取得する取得映像の例を示す図である。 制御装置の機能構成例を示したブロック図である。 表示装置の機能構成例を示したブロック図である。 撮像装置による人物認識の処理の流れを示す図である。 制御装置による処理の流れを示す流れ図である。 人物位置を判定する手法の例を説明するための図である。 各会議参加者の位置関係の模式図である。 参加者情報の構成例を示す図である。 表示装置におけるセンサデータ送信の処理の流れを示す流れ図である。 表示装置における会議映像生成の処理の流れを示す流れ図である。 表示装置における会議映像生成の処理の流れを示す流れ図である。 会議映像の決定例を示した図である。 会議映像の決定例を示した図である。 会議映像の決定例を示した図である。
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書および図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
また、本明細書および図面において、実質的に同一の機能構成を有する複数の構成要素を、同一の符号の後に異なるアルファベットまたは数字を付して区別する場合もある。ただし、実質的に同一の機能構成を有する複数の構成要素の各々を特に区別する必要がない場合、同一符号のみを付する。
(1.映像会議システムの構成)
図1および図2を参照しながら、本発明の実施形態に係る映像会議システム10の基本構について説明する。図1は、本発明の実施形態に係る映像会議システム10の構成を示した説明図である。図1に示したように、本発明の実施形態に係る映像会議システム10は、複数の表示装置100と、制御装置200と、複数の撮像装置500と、無線LAN(Local Area Network)アクセスポイント300と、通信網400とを備える。このような映像会議システム10は、オフィス会議室、公共施設内多目的室、病院および金融機関の相談・面談室などの多様な場所に設置され得る。
表示装置100は、例えば、会議参加者が保持する携帯電話、スマートフォン、ゲーム機、タブレットコンピュータ、パーソナルコンピュータなどであってよい。
無線LANアクセスポイント300は、無線通信機能により無線LANを形成し、無線LANに属する通信装置による通信を制御および中継する。図1に示した例では、無線LANアクセスポイント300Aが形成する無線LAN310Aに、表示装置100A−1、100A−2、100A−3および撮像装置500A−1、500A−2および500A−3が属し、無線LANアクセスポイント300Aは、表示装置100A−1、100A−2、100A−3および撮像装置500A−1、500A−2および500A−3による通信を制御および中継する。
同様に、無線LANアクセスポイント300Bが形成する無線LAN310Aに、表示装置100B−1、100B−2、100B−3および撮像装置500B−1、500B−2および500B−3が属し、無線LANアクセスポイント300Bは、表示装置100B−1、100B−2、100B−3および撮像装置500B−1、500B−2および500B−3による通信を制御および中継する。
本発明の実施形態においては、撮像装置500は、無線LANアクセスポイント300に無線で接続されているが、有線で接続されていてもよい。
通信網400は、通信網400に接続されている装置から送信される情報の有線または無線の伝送路である。例えば、通信網400は、インターネット、電話回線網、衛星通信網などの公衆回線網や、Ethernet(登録商標)を含む各種のLAN(Local Area Network)、WAN(Wide Area Network)などを含んでもよい。また、通信網400は、IP−VPN(Internet Protocol−Virtual Private Network)などの専用回線網を含んでもよい。本実施形態においては、通信網400および無線LANアクセスポイント300を介して、制御装置200と拠点Aおよび拠点Bそれぞれの装置(各表示装置100および各撮像装置500)とが接続される。
図2は、ある地点(拠点A)にて3名の会議参加者(600A−1、600A−2、600−3)がそれぞれ表示装置100A−1、100A−2、100A−3を利用して映像会議システム10を利用している様子を示している。例えば、表示装置100A−1、100A−2、100A−3は、会議参加者に向かって設置され、会議参加者によって自由に位置および向きを変更させることが可能である。
撮像装置500B−1、500B−2および500B−3は、例えば、会議室の壁や天井など、会議参加者を1人ないし複数捉えるように設置されている。本実施形態においては、拠点Aのこれら表示装置100と撮像装置500の組み合わせと、別拠点(拠点B)に配置された表示装置100と撮像装置500の組み合わせを用いて映像会議システム10を構成する。
図2には示していないが、表示装置100に表示される表示映像(以下、「会議映像」とも言う。)は、会議参加者ごとに、拠点Aの撮像装置500によって取得された取得映像や拠点Bの撮像装置500によって取得された取得映像を組み合わせて実現される。取得映像の組み合わせにより実現される会議映像の具体例としては、例えば、会議参加者600A−1が別拠点の人物と会話をしている場合、表示装置100A−1には別拠点の人物の正面のショットを中心とした会議映像が表示される一方で、会議参加者600A−3が保持する表示装置100A−3には別拠点の人物の左向きからのショットを中心とした会議映像が表示される。会議参加者600A−3の左側に会議参加者600A−1が在席しており、表示装置100A−3に左向きショットの別拠点の人物が表示されることによって、会議参加者600−3は両者が会話していることを把握することができる。
このように、本発明の実施形態においては、会議参加者の位置関係に応じて表示装置に表示する会議映像を切り替えることによって、会議参加者が第3者も含めた話者周囲の関係性を把握することを支援する。
本発明の実施形態に係る映像会議システム10は、拠点Aに属する表示装置100A−1〜100A−3と撮像装置500A−1〜500A−3と、拠点Bに属する表示装置100B−1〜100B−3と撮像装置500B−1〜500B−3とによって、各拠点の会議参加者への会議映像を提供する。このとき、制御装置200は、各拠点の表示装置100および撮像装置500の情報をそれぞれ取得し、各会議参加者の表示装置100へ配信する会議映像を制御する。以下、表示装置100、撮像装置500および制御装置200それぞれの各機能構成を説明する。
(1−1.撮像装置の機能構成)
図3は、撮像装置500の機能構成例を示したブロック図である。図3に示したように、撮像装置500は、制御部510、記憶部520、通信部530および検出部540を備える。
制御部510は、撮像装置500の動作全体を制御する機能を有し、専用のハードウェアによって構成されてもよいし、撮像装置500に内蔵されたCPUがROMに記憶されたプログラムをRAMに展開して実行することにより実現されてもよい。かかるプログラムが提供され得る他、かかるプログラムを記憶させた記憶媒体も提供され得る。制御部510は、映像取得部511、通信制御部512および画角制御部513を備える。
記憶部520は、制御部510を動作させるためのプログラムやデータを記憶することができる。また、記憶部520は、制御部510の動作の過程で必要となる各種データを一時的に記憶することもできる。本発明の実施形態では、記憶部520は、レイアウト情報522を記憶している。
通信部530は、通信網400を介して制御装置200との間において各種情報を送受信するための通信インタフェースである。
検出部540は、当該装置に内蔵される映像センサなどからなり、当該装置が撮像する取得映像を取得する。取得された取得映像は、映像取得部511によって取得され、通信制御部512によって通信部530を介して制御装置200に送信される。図4に、撮像装置500が取得する取得映像Z40を図示する。図4においては、会議参加者600A−1、600A−2および600A−3が座席に座っている様子が捉えられている。画角制御部513は、当該装置の画角を制御する機構を想定している。本実施形態では、会議参加者のリクエストにより、当該装置の画角を制御することが可能である。
レイアウト情報522は、当該装置が撮像している会議卓上の座席レイアウトを表現している。例えば、図4に示された設定領域Z41、Z42およびZ43のようにレイアウト情報は表現される。レイアウト情報は、座席する各会議参加者が映る可能性のある矩形領域が左上座標および右下座標によって2次元で表現されてよい。このとき、当該領域内にて人物認識がなされた場合にはその座席に会議参加者が座っていると判定してよい。
各座席には、例えば、一意の座席番号が割り当てられており、複数の撮像装置500によって異なる画角から同じ座席を撮像している場合でも、同じ座席には同じ座席番号が割り当てられているものとする。また、座席番号と会議参加者とが一意に対応している場合には、座席番号の代わりに会議参加者の人物名が用いられてもよい。なお、各座席に会議参加者が座っていることを検出する手法は、かかる手法に限定されない。例えば、各座席または各座席近辺に受信器が取り付けてあり、会議参加者に付された送信器の送信データが受信器によって受信されたことにより、その座席に会議参加者が着席したことが検出されてもよい。
このように、本実施形態に係る映像会議システム10の構成によれば、制御装置200において、複数の表示装置100と複数の撮像装置500とから得られる情報に基づいて、複数拠点会議の状態判定を行い、その判定結果に基づいて各表示装置100に表示される会議映像の構成情報を決定する。また、決定した構成情報に基づいて表示装置100において、表示すべき会議映像を生成および表示することで、複数の拠点間の話者だけではなく、第3者も含めた話者周囲の関係性の把握を支援する映像会議システム10を提供できる。
(1−2.制御装置の機能構成)
図5は、制御装置200の機能構成例を示したブロック図である。図5に示したように、制御装置200は、制御部210、記憶部220および通信部230を備える。
制御部210は、制御装置200の動作全体を制御する機能を有し、専用のハードウェアによって構成されてもよいし、制御装置200に内蔵されたCPUがROMに記憶されたプログラムをRAMに展開して実行することにより実現されてもよい。かかるプログラムが提供され得る他、かかるプログラムを記憶させた記憶媒体も提供され得る。制御部210は、映像取得部211、映像解析部212、判定部213および構成決定部214を備える。
記憶部520は、記憶部520は、制御部510を動作させるためのプログラムやデータを記憶することができる。また、記憶部520は、制御部510の動作の過程で必要となる各種データを一時的に記憶することもできる。本発明の実施形態では、記憶部520は、レイアウト情報522を記憶している。
通信部230は、通信網400を介して表示装置100および撮像装置500との間で各種情報を送受信するための通信インタフェースである。通信部230による通信としては、図1に示したように、各拠点に配置される表示装置100および撮像装置500との各種情報の送受信を想定している。
映像取得部211は、表示装置100および撮像装置500から受信される取得映像を取得する。このとき、各装置にはそれぞれ固有ナンバなどが割り当てられ、取得映像にも提供側の装置の固有ナンバが付されており、取得された取得映像と取得映像の提供側の装置とは一意に対応付けられるように取得される。また、撮像装置500から通知されるレイアウト情報も映像取得部211によって取得される。
映像解析部212は、映像取得部211によって取得された取得映像を解析して、解析結果情報を出力する。本実施形態では、映像解析結果は、撮像装置500が保持するレイアウト情報に基づいて、取得映像における各設定領域に対して人物認識処理を施した結果を含んでよい。認識された人物は会議参加者として扱われ得る。人物認識処理としては公知技術が用いられてよい。また、映像解析結果は、取得映像内の会議参加者の顔向き(例えば、正面、左右向きの何れであるかの情報)を含んでよい。顔向き検出技術としても、公知の顔認識技術が用いられてよい。
判定部213は、会議状況を複数の状態に大別して判定する。このとき、会議状況は、映像解析部212によって出力された映像解析結果と表示装置100から受信されたセンサデータとに基づいて判定される。例えば、判定される会議状況には「拠点間会話」「拠点内会話」「待機」の3種類が挙げられる。
「拠点間会話」状況は、複数の拠点に跨って複数の会議参加者が発話状態である状況とする。ここで、会議参加者の発話状態であるか否かは、表示装置100に内蔵される検出部130によって検出されたセンサデータに基づいて判定され得る。例えば、検出部130が音声センサを含む場合、音声センサによって閾値を超える音声が所定の時間を超えて検出されたときに、会議参加者が発話状態であると判定され得る。
「拠点内会話」状況は、「拠点間会話」状況には該当しないが、同一の拠点で複数の会議参加者が発話状態である状況とする。会議参加者が発話状態であることを判定する手法は「拠点間会話」状況と同様である。さらに、拠点内で会話がなされる場合には、話者は話し相手を見ながら会話をすると考えられるため、例えば、音声センサによって検出されたセンサデータの代わりに、または追加的に会議参加者の顔向きに基づいて、会議状況が拠点内会話であるか否かが判定されてもよい。
「待機」状況は、何れの拠点においても発話状態の会議参加者が検出されていない状態である。詳しい会議状況の判定の処理フローについては、後述する。
構成決定部214は、会議状況と取得映像とに基づいて、各会議参加者の表示装置100に表示される会議映像の構成を決定する。例えば、構成決定部214は、会議参加者が、「拠点間会話」の状況においては、話者なのか、第3者なのかといった情報から会議映像の構成を決定する。また、例えば、構成決定部214は、「拠点内会話」の状況においては、追加的に話者同士が同一拠点なのか、別拠点なのかといった情報から会議映像の構成を決定する。また、例えば、構成決定部214は、会議参加者が第3者である場合に、会議参加者自身の座席位置と話者との位置関係に基づいて、会議映像を決定してもよい。
このとき、会議映像を表現する構成情報としては、例えば、会議映像に含める取得映像の番号と取得映像における表示対象となる設定領域を示す情報が想定される。構成決定部214は、各会議参加者の構成情報を、通信部230を介して表示装置100に通知する。詳しい構成情報決定の処理フローについては、後述する。
(1−3.表示装置の機能構成)
図6は、表示装置100の機能構成例を示したブロック図である。図6に示したように、表示装置100は、制御部110、入力部120、検出部130、通信部140および表示部150を備える。
制御部110は、表示装置100の動作全体を制御する機能を有し、専用のハードウェアによって構成されてもよいし、表示装置100に内蔵されたCPUがROMに記憶されたプログラムをRAMに展開して実行することにより実現されてもよい。かかるプログラムが提供され得る他、かかるプログラムを記憶させた記憶媒体も提供され得る。制御部110は、センサデータ取得部111、通信制御部112、映像生成部113および表示制御部114を備える。
通信部140は、通信網400を介して制御装置200との間で各種情報を送受信するための通信インタフェースである。
検出部130は、当該装置に内蔵されるセンサなどからなる。検出部130としては、映像センサ(カメラ)、音声センサ(マイク)、加速度センサ、地軸センサなどが想定される。
表示部150は、表示装置100に内蔵される液晶ディスプレイおよびスピーカなどを含む。例えば、表示部150は、制御装置200によって決定された構成情報に従って会議映像および音声を生成して再生する。
入力部120は、表示部150の液晶ディスプレイに具備されるタッチパネルなどが想定される。本実施形態においては、入力部120への会議参加者の自由なタッチ操作により表示部150によって表示される会議映像の画角等の変更操作が可能である。
センサデータ取得部111は、表示装置100が内蔵する検出部130によって検出されたセンサデータを取得する。取得されたセンサデータは、通信制御部112によって、通信部140を介して制御装置200に通知される。特に、映像センサによって取得される取得映像は、制御装置200に送信される。
通信制御部112は、制御装置200から通信部140を介して構成情報を取得する。そして、映像生成部113は、制御装置200によって決定された構成情報に従って、制御装置200から配信される取得映像群から必要な部分を切り抜き、または複数の切り抜き映像を合成することによって、当該表示装置100に必要な会議映像を生成する。表示制御部114は、生成された会議映像を、表示部150に出力させる。
(2.映像会議システムの動作)
(2−1.撮像装置から制御装置への情報集約)
次に、撮像装置500から制御装置200へ情報を集約する処理を説明する。図7は、撮像装置500による処理の流れを示す流れ図である。撮像装置500の通信部530は、レイアウト情報を制御装置200に送信する(S101)。ここで、レイアウト情報は、上記したように、各撮像装置500の設置位置や画角に対応した人物認識の対象となる設定領域を表現している。
続いて、映像取得部211は、映像の取得を試みる(S102)。Yesの場合は、S103へと進む。Noの場合は、再度映像取得の処理を行う。次に、撮像装置500の通信部530は、取得した取得映像を制御装置200に送信する(S103)。このとき、取得映像には、各撮像装置500を一意に決定できる、例えば、番号が付与されているものとし、取得映像がその番号と一緒に送信されるものとする。
図8は、制御装置200による人物認識の処理の流れを示す図である。制御装置200の通信部230は、各撮像装置500A−1〜500A−3などからレイアウト情報および取得映像を受信する(S201、S202)。このとき、制御装置200には、図示はしないが、各撮像装置500を一意に示す番号と取得映像、先に送信済みであるレイアウト情報の一式が蓄積される。後述する処理では、各撮像装置500の番号をもとに取得映像およびレイアウト情報にアクセスできるものとする。
次に、映像解析部212は、レイアウト情報に基づき、取得映像の設定領域に対して人物認識処理を行う(S203)。この人物認識処理としては、公知の人物認識技術を用いることが可能である。各設定領域のサイズにより検出する人物のサイズをある程度限定できることで、検出精度を上げることが可能である。映像解析部212は、人物が認識された場合には(S204でYes)、人物位置を判定して(S205)、人物位置によって参加者情報を更新する(S206)。参加者情報については後に説明する。一方、映像解析部212は、何れの設定領域においても人物が認識されなかった場合には(S204でNo)、処理フローを終了する。
人物位置を判定する手法の例について説明する。図9は、人物位置を判定する手法の例を説明するための図である。図9に示すように、会議参加者600A−1が座席に着席している。また、撮像装置500A−1および撮像装置500A−2それぞれが設置されており、撮像装置500A−1の位置P1および撮像装置500A−2の位置P2があらかじめ登録されている。
例えば、映像解析部212は、撮像装置500A−1の位置P1を基準とした撮像装置500A−1による会議参加者600A−1の撮像方向D1と、撮像装置500A−2の位置P2を基準とした撮像装置500A−2による会議参加者600A−1の撮像方向D2との交点座標により会議参加者600A−1の位置P0を算出することが可能である。しかし、人物位置を判定する手法は、かかる例に限定されないため、360度撮像できる魚眼カメラ装置などを利用して会議参加者600A−1の位置P0が算出されてもよい。また、他の会議参加者の位置も同様な手法により算出され得る。
図10に、各会議参加者の位置関係の模式図を示す。図10を参照すると、拠点Aには、3名の会議参加者が着席し、拠点Bには、5名の会議参加者が着席している。図9に示したように、映像解析部212によって各参加者の人物位置が判定されることによって、各会議参加者の位置関係が把握される。図11は、参加者情報の構成例を示す図である。図10に示したように、参加者情報は、撮像装置500を一意に決定するための装置番号と、撮像装置500によって取得された取得映像における設定領域と、人物位置と、人物の顔向きとが対応付けられて構成され得る。
(2−2.表示装置から制御装置への情報集約)
次に、表示装置100から制御装置200へ情報を集約する処理を説明する。図12は、表示装置100におけるセンサデータ送信の処理の流れを示す流れ図である。表示装置100のセンサデータ取得部111は、センサデータの取得を試みる(S301)。センサデータ取得部111は、Yesの場合には、S302に進み、Noの場合には、再度センサデータの取得を試みる。
想定されるセンサとしては、映像センサ、音声センサ、地軸センサ、加速度センサなどが挙げられる。例えば、映像センサが用いられた場合には、センサデータは映像データとなり、音声センサが用いられた場合には、センサデータは音声データとなり、地軸センサ、加速度センサが用いられた場合には、センサデータは実測データ列となる。
続いて、通信制御部112は、センサデータ取得部111によって取得されたセンサデータを、通信部140を介して制御装置200に送信する(S302)。このとき、センサデータには、各表示装置100を一意に決定するための、例えば、番号が付与されているものとし、センサデータは、その番号と一緒に送信されるものとする。
図13は、制御装置200における構成情報生成の処理の流れを示す流れ図である。制御装置200の通信部230は、各表示装置100A−1〜100A−3などからセンサデータを受信し(S401)、映像取得部211は、各センサデータを取得する。続いて、判定部213は、各センサデータに基づいて話者判定を行う(S402)。このとき、話者判定がなされた表示装置100を保持する会議参加者を話者状態として判別する(センサを発話状態として判別する)。話者状態の判定には、公知の話者認識技術が用いられてよい。例えば、判定部213は、閾値を超えた音量を観測したときや、閾値を超えた音量が所定時間連続して観測されたときに、会議参加者が話者状態であると判定してよい。
判定部213は、ある表示装置100からの音声データから会議参加者が話者状態であると判定した場合には(S403)、その話者の顔向きを判定する(S404)。顔向きの判定に関しても、公知の顔認識技術を用いることができる。例えば、目と鼻の位置関係から映像センサに対して左右のどちら側を向いているかが判定され得る。また、顔全体の大きさの推移から、会議参加者が表示装置100からどのくらい離れているかなども同時に判定され得る。一方、判定部213は、会議参加者が話者であると判定されなかった場合には、会議参加者を第3者状態として判定する。
続いて、判定部213は、話者の顔向きを参加者情報に登録する(S405)。なお、各会議参加者の状態(「話者」であるか、「第3者」であるか)も参加者情報に登録されてよいが、顔向きが登録されているか否かにより判定され得る。話者状態と判定される会議参加者は同時に複数いる場合もあり得る。そして、判定部213は、各会議参加者の話者および第3者の状態判定結果から、「拠点間会話」「拠点内会話」「待機」の3種類の何れかの状況推定の結果を導く。例えば、判定部213は、複数の拠点にて、話者状態の会議参加者が複数判定された場合は、会議の状況が拠点間会話状況と判定する。このとき、判定部213は、前述した顔向き検知などから、例えば、表示装置100の方を向かってしゃべっているのか、または同一拠点の別の誰かに向かってしゃべっているのか等を加味し、統合的に判定してもよい。
一方、判定部213は、拠点間会話状況には該当しないが、同一拠点内にて、話者状態の会議参加者が一人ないしは複数判定された場合には、会議の状況が拠点内会話状況と判定する。このとき、例えば、資料などを説明する一人の会議参加者が話者状態である場合も、拠点内会話状態として判定される。一方、判定部213は、どの拠点のどの会議参加者も話者状態と判定しない場合は、会議の状況が待機状況と判定する。
続いて、制御装置200において、各表示装置100に対してS406およびS407の処理を行う。まず、構成決定部214は、前述の状況推定の結果に基づいて、表示装置100それぞれに表示すべき取得映像を選択する。このとき選択される取得映像は複数ある場合もある。続けて、選択された取得映像のうち、どの箇所を表示するかを決定する(S406)。例えば、同一人物を表示する場合においても、クローズドショット(顔を中心にしたショット)、ミドルショット(バストアップのショット)、フルショット(体全体を映したショット)など様々ある。この中から、最適なショットを選択し、構成情報として決定する。
最後に、構成決定部214は、通信部230を介して各表示装置100に対して、取得映像を表示装置100に対して送信するとともに、取得映像における表示すべき箇所を構成情報として表示装置100に対して送信する(S407)。
次に、表示装置100における会議映像生成の処理を説明する。図14は、表示装置100における会議映像生成の処理の流れを示す流れ図である。表示装置100の通信部140は、取得映像および構成情報を受信する(S501)。続いて、映像生成部113は、構成情報に基づいて、取得映像を加工、編集し、表示すべき会議映像を生成し(S502)、表示制御部114は、会議映像を表示部150に表示させる(S503)。
一方、表示制御部114は、入力部120によって会議参加者からのタッチ操作を現在表示されている会議映像の画角調整、拡大縮小などの操作であると認識し、タッチ操作が検出された場合には、タッチ入力値を保持する。そして、保持されたタッチ入力値に基づいて、会議映像を再生成し(S505)、再生成した会議映像を表示させる(S506)。例えば、表示制御部114は、ダブルタップの操作を拡大操作と位置付け、表示すべき設定領域を狭く再生成してもよい。
続いて、図9に示される各会議参加者が利用する映像会議システム10の動作を中心に、制御装置200によって推定された会議の状況および各表示装置100に対応する会議参加者が話者か否かにより場合分けして、ステップS406に示した構成情報の決定手順の例について詳細に説明する。
(拠点間会話状況における話者の表示装置に表示される会議映像)
拠点間会話状況として、会議参加者600A−3と会議参加者600B−3とが話者である場合を考える。このとき、会議参加者600A−3の表示装置100A−3の会議映像としては、別拠点の会議参加者600B−3の正面映像が構成決定部214によって選択されていることが望ましく、その逆もまた然りである。話者にとって別拠点の話者を確認しながら会話することが重要であるためである。そのため、各々の話者に対応する表示装置100に内蔵される映像センサより取得される取得映像や、話者を正面から捉えている撮像装置500からの取得映像が選択される。
さらに、選択された取得映像のうち表示される箇所については、話者を正面に捉えるように構成決定部214によって決定されるとよい。このとき、例えば、話者と表示装置100との距離関係に応じて、クローズドショットやミドルショットのどちらかを表現するように決定してもよい。図15に、この場合の会議映像の決定例を図示する。話者600A−3の表示装置100A−3には別拠点の話者600B−3が表示されており、一方、話者600B−3の表示装置100B−2には、別拠点の話者600A−3を中心に据えながら、横に座る第3者600−2を映す取得映像が選択された様子が示されている。
(拠点間会話状況における第3者の表示装置に表示される会議映像)
拠点間会話状況として、会議参加者600A−2と会議参加者600B−1とが第3者である場合を考える。このとき、会議参加者600A−2の表示装置100A−2には、同一拠点の話者である会議参加者600A−3と会議参加者600A−2との位置関係から、別拠点の会議参加者600B−3の左向きショットが選択されることが望ましい。それは、会議参加者600A−2の左側に同一拠点の話者である600A−3が座っていることが前段の処理で判明しており、会議参加者600A−2から見たとき、拠点間の話者関係が把握しやすくなるからである。そのため、話者600B−3の左側から撮影している撮像装置500の取得映像が選択される。
表示される取得映像の箇所については、会議参加者600A−2から見たとき、同一拠点の会議参加者600A−3の見た目の大きさと同程度になるように調整されてから表示装置100A−2に表示させるのがよい。そのため、構成決定部214は、表示される取得映像の箇所を会議参加者600A−3の見た目の大きさに合わせた倍率を表現する構成情報を決定するのがよい。このとき、会議参加者600A−3の見た目の大きさに合わせた倍率の決定には、例えば、事前のレイアウト情報に設定されている設定領域のサイズを距離換算して求める手法を採用することも可能である。
一方、会議参加者600B−1の表示装置100B−1には、同一拠点の話者である600B−3との位置関係が閾値よりも離れているため、両拠点の話者をそれぞれ等分して表示することが望ましい。それは、双方の話者の様子を把握しながら会話を理解することが重要であるためである。そのため、会議参加者600A−3の右向きショットと会議参加者600B−3の左向きショットとが構成決定部214によって選択される。さらに、表示される取得映像の箇所については、選択された左向きショットと右向きショットとが対面するように表現する構成情報が構成決定部214によって決定される。
(拠点内会話状況における話者の表示装置100に表示される会議映像)
拠点Aの会議参加者600A−2と会議参加者600A−3とが話者である場合を考える。このとき、各話者はそれぞれお互いの方向を見て会話をしていることが多く、各表示装置100には、別拠点の映像がランダムに選択されることが望ましい。それは、話者が同一拠点の第3者に目を配ることは容易であるが、別拠点の映像を選択することが難しいからである。そのため、構成決定部214によって別拠点(この場合は拠点B)の取得映像が所定間隔ごとに変更して選択されるとよい。さらに表示される取得映像の箇所については、特に制限はないが、例えば、会議参加者の権限の高低をあらかじめレイアウト情報に加味しておくことで、権限の高い会議参加者に幾分偏った映像選択をすることも可能である。
(拠点内会話状況における同一拠点の第3者の表示装置100に表示される会議映像)
同様に、拠点Aの会議参加者600A−2と会議参加者600A−3とが話者である場合を考える。このとき、同一拠点の第3者(この場合では会議参加者600A−1)は、同一拠点の話者同士の様子を観察できるため、表示装置100A−1には、先ほどと同様に、別拠点の映像がランダムに選択されることが望ましい。
(拠点内会話状況における別拠点の第3者の表示装置100に表示される会議映像)
同様に、拠点Aの会議参加者600A−2と会議参加者600A−3とが話者である場合を考える。このとき、別拠点の第3者(この場合では会議参加者600B−1)の表示装置100B−1には、拠点Aの会話者が選択的に表示されることが望ましい。図16に示すように、会議参加者600A−2の左向きショットと会議参加者600A−3の右向きショットとが構成決定部214によって選択される。さらに、表示される取得映像の箇所については、選択された左向きショットと右向きショットとが対面するように表現する構成情報が構成決定部214によって決定される。
また、拠点Aの会議参加者600A−2がスライド(あるいは、ホワイトボードやスクリーン)を使って説明している場合を考える。このとき、図17に示すように、別拠点の第3者(この場合では会議参加者600B−3)の表示装置100B−3に表示される取得映像としては、拠点Aの会議参加者600A−2とスクリーンZ1000が同時に映るような取得映像が選択される。さらに、表示される取得映像の箇所については、画角が閾値より狭い場合には、会議参加者600A−2のミドルショットとスライドが選択され、画角が閾値より広い場合には、会議参加者600A−2のフルショットとスライドが選択されるといったように、取得映像の画角に応じて決定されてもよい。
このとき、表示される取得映像の箇所に備品(スライド、ホワイトボード、スクリーンなど)を組み込むための手法は特に限定されない。例えば、会議室にあらかじめ備え付けてある備品もレイアウト情報の設定領域に組み入れることで、表示される取得映像の箇所に備品を組み込んでもよいし、会議参加者の顔向きを考慮した形で(例えば、会議参加者600A−2が右を向いているため、会議参加者600A−2よりも右側も映した形で)会議映像を生成するなどしてもよい。
(待機状態における会話映像の場合)
待機状態は、会議の序盤などにおいて会議参加者が話し始める前や、会議が煮詰まったときなどに発生する。このとき、各表示装置100には、別拠点や同一拠点の取得映像がランダムに選択されるようにしてもよい。また、会議全体を通して、各会議参加者の発言率や発言回数などから、まだ発言の少ない会議参加者に偏った映像選択がなされてもよい。このようにすることで、会議への会議参加者全体の帰属感などが醸成できる可能性もある。
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
本実施形態の変形例として、制御装置200は、表示装置100と同一の装置として構成されてもよいし、複数の異なるコンピュータに分割されて構成されてもよい。前者の場合は、複数の表示装置100のうち、少なくとも一つがその役割を担えばよい。また、映像配信や映像合成など多大な処理性能が要求される場合には、後者の場合である複数の表示装置100で制御装置200の処理を分散することなども想定される。
さらに別の変形例として、会議映像を合成する処理を、制御装置200にて一括にやることなどが想定される。この場合には、各表示装置100で合成される取得映像すべてを配信しなくてもよいことになるため、通信量の削減などが図られる一方で、会議参加者のタッチ入力のような会議映像の変更が多く発生する場合には、逆に通信量が増える可能性もあり、双方はトレードオフの関係にある。
また別の変形例として、会議参加者からのタッチ入力によって、取得映像の画角を調整することを可能にするために、画角制御部513を有する。現在配信されている取得映像ではとらえられない箇所を映すために画角制御を許すが、このとき配信されている取得映像が変更されてしまう。このため、画角制御値に合わせて、各表示装置100に送信される構成情報を変更することで対応する。このように、画角制御のような会議参加者の細かな要求に対応できる映像会議システム10を提供することも可能である。
さらに別の変形例として、表示装置100に内蔵される検出部130の一つである地軸センサや加速度センサを利用して、会議卓上においてどちらの方向に表示装置100を向けているかを検知し、その表示装置100の位置姿勢方向において別の会議参加者との位置関係を考慮した会議映像を生成してもよい。例えば、同一拠点に複数の話者がいる場合、ある話者に表示装置100を向けたことを検知し、その話者に対して正対するように別の拠点からの選択されるべき取得映像を変化させてもよい。
表示装置100に内蔵される検出部130および撮像装置500の一つである映像センサは、会議参加者の人数分あることが望ましいが、広画角で撮影できる映像センサや360度撮像できる魚眼カメラ装置などを利用して、映像センサなどの装置数を削減することも可能である。また、図4に示したような取得映像と事前に送信されるレイアウト情報から、図9に示したような位置関係情報を生成するが、人物の位置姿勢などから必ずしも毎フレーム正しく人物検知できるわけではない。そのため、所定時間検知がなされなかったときに、人物不在とするような工夫を組み入れてもよい。
また、同様に、制御装置200における話者特定の処理においても、人物が移動しながらしゃべるといった場合もあり得る。このとき、人物検知の処理と話者を特定する音声センサを保持する表示装置100とを変更することで対応することも想定される。このとき、ホワイトボードやスクリーンなどといった会議室にあらかじめ備え付けられている備品もレイアウト情報の設定領域に組み入れることで、人物検知領域や人物の想定移動経路に沿った検知領域の動的対応などの工夫を組み入れてもよい。
10 映像会議システム
100 表示装置
110 制御部
111 センサデータ取得部
112 通信制御部
113 映像生成部
114 表示制御部
120 入力部
130 検出部
140 通信部
150 表示部
200 制御装置
210 制御部
211 映像取得部
212 映像解析部
213 判定部
214 構成決定部
220 記憶部
230 通信部
300 無線LANアクセスポイント
400 通信網
500 撮像装置
510 制御部
511 映像取得部
512 通信制御部
513 画角制御部
520 記憶部
522 レイアウト情報
530 通信部
540 検出部
600 会議参加者


Claims (19)

  1. 複数の表示装置それぞれが有するセンサによって検出されたセンサデータに基づいて、前記複数の表示装置それぞれを利用する会議参加者が話者であるか否かを判定する判定部と、
    前記複数の表示装置それぞれが有する会議参加者が話者であるか否かに基づいて、前記複数の表示装置それぞれによって表示される表示映像の構成を決定する構成決定部と、
    を備える、制御装置。
  2. 前記判定部は、話者の表示装置同士が別拠点に属するか否かを判定し、
    前記構成決定部は、話者の表示装置同士が別拠点に属するか否かに基づいて、前記複数の表示装置それぞれによって表示される前記表示映像の構成を決定する、
    請求項1に記載の制御装置。
  3. 前記構成決定部は、話者の表示装置同士が別拠点に属すると判定された場合、1の拠点における話者の表示装置によって表示される表示映像の構成を、他の拠点における話者を正面から映した映像が前記表示映像に含まれるように決定する、
    請求項2に記載の制御装置。
  4. 前記構成決定部は、話者の表示装置同士が別拠点に属すると判定された場合、1の拠点における非話者の表示装置によって表示される表示映像の構成を、前記1の拠点における話者を側面から映した映像および他の拠点における話者を側面から映した映像が、話者同士が向き合うようにして前記表示映像に含まれるように決定する、
    請求項2に記載の制御装置。
  5. 前記制御装置は、
    撮像装置から取得された取得映像のうち話者に関連付けられた設定領域を解析することにより話者の顔向きを判定する映像解析部を備え、
    前記構成決定部は、前記1の拠点における話者の顔向きと前記1の拠点における話者および非話者の位置関係とにさらに基づいて、前記1の拠点における話者の映像における向きを決定する、
    請求項4に記載の制御装置。
  6. 前記映像解析部は、前記取得映像における前記設定領域を示すレイアウト情報を取得する、
    請求項5に記載の制御装置。
  7. 前記構成決定部は、他の拠点における話者を側面から映した映像のサイズを調整する、
    請求項4に記載の制御装置。
  8. 前記構成決定部は、話者の表示装置同士が別拠点に属すると判定された場合、1の拠点における非話者の表示装置によって表示される表示映像の構成を、前記1の拠点における非話者と前記1の拠点における話者との距離が閾値を下回る場合、前記1の拠点における話者を側面から映した映像が前記表示映像に含まれないように決定する、
    請求項4に記載の制御装置。
  9. 前記構成決定部は、話者の表示装置同士が同一拠点に属すると判定された場合、1の拠点における話者の表示装置によって表示される表示映像の構成を、他の拠点を映した映像が前記表示映像に含まれるように決定する、
    請求項2に記載の制御装置。
  10. 前記構成決定部は、話者の表示装置同士が同一拠点に属すると判定された場合、1の拠点における話者のセンサと異なる拠点における非話者の表示装置によって表示される表示映像の構成を、同一拠点に属する話者それぞれを側面から映した映像が、前記話者同士が向き合うようにして前記表示映像に含まれるように決定する、
    請求項2に記載の制御装置。
  11. 前記構成決定部は、話者の表示装置同士が同一拠点に属すると判定された場合、1の拠点における話者のセンサと同一の拠点における非話者の表示装置によって表示される表示映像の構成を、他の拠点を映した映像が前記表示映像に含まれるように決定する、
    請求項2に記載の制御装置。
  12. 前記制御装置は、
    前記表示映像の構成に従って、前記表示映像を生成する表示制御部を備える、
    請求項1に記載の制御装置。
  13. 前記判定部は、前記複数の表示装置それぞれが有する音声センサによって検出された音声データに基づいて、前記複数の表示装置それぞれの会議参加者が話者であるか否かを判定する、
    請求項1に記載の制御装置。
  14. 前記構成決定部は、前記表示装置の向きの変化に応じて前記表示装置によって表示される表示映像の構成を更新する、
    請求項1に記載の制御装置。
  15. 複数の表示装置それぞれが有するセンサによって検出されたセンサデータに基づいて、前記複数の表示装置それぞれを利用する会議参加者が話者であるか否かを判定するステップと、
    前記複数の表示装置それぞれが有する会議参加者が話者であるか否かに基づいて、前記複数の表示装置それぞれによって表示される表示映像の構成を決定するステップと、
    を含む、制御方法。
  16. コンピュータを、
    複数の表示装置それぞれが有するセンサによって検出されたセンサデータに基づいて、前記複数の表示装置それぞれを利用する会議参加者が話者であるか否かを判定する判定部と、
    前記複数の表示装置それぞれが有する会議参加者が話者であるか否かに基づいて、前記複数の表示装置それぞれによって表示される表示映像の構成を決定する構成決定部と、
    を備える、制御装置として機能させるためのプログラム。
  17. 表示装置において、
    前記表示装置を利用する会議参加者が話者であるか否かに基づいて前記表示装置によって表示される表示映像の構成を決定する制御装置から、前記表示映像の構成を示す構成情報を取得する通信制御部と、
    前記構成情報に従って、前記表示映像を生成する表示制御部と、
    を備える、表示装置。
  18. 表示装置によって表示される表示映像の生成に利用される映像を取得する映像取得部と、
    前記表示装置を利用する会議参加者が話者であるか否かに基づいて前記表示映像の構成を決定する制御装置に対して、取得した前記映像を提供する通信制御部と、
    を備える、撮像装置。
  19. 複数の表示装置を有し、
    前記複数の表示装置それぞれが有するセンサによって検出されたセンサデータに基づいて、前記複数の表示装置それぞれを利用する会議参加者が話者であるか否かを判定する判定部と、
    前記複数の表示装置それぞれが有する会議参加者が話者であるか否かに基づいて、前記複数の表示装置それぞれによって表示される表示映像の構成を決定する構成決定部と、
    を備える、制御装置、
    を有する、映像会議システム。
JP2014163684A 2014-08-11 2014-08-11 制御装置 Active JP6435701B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014163684A JP6435701B2 (ja) 2014-08-11 2014-08-11 制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014163684A JP6435701B2 (ja) 2014-08-11 2014-08-11 制御装置

Publications (2)

Publication Number Publication Date
JP2016039600A true JP2016039600A (ja) 2016-03-22
JP6435701B2 JP6435701B2 (ja) 2018-12-12

Family

ID=55530328

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014163684A Active JP6435701B2 (ja) 2014-08-11 2014-08-11 制御装置

Country Status (1)

Country Link
JP (1) JP6435701B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017022600A (ja) * 2015-07-13 2017-01-26 国立大学法人静岡大学 画像通信装置
JP2019524213A (ja) * 2016-06-29 2019-09-05 ジュン,サンムン モバイル・リアルタイム・シミュレーションゲームにおけるタッチ操作方式
CN112489661A (zh) * 2019-08-23 2021-03-12 上海汽车集团股份有限公司 一种车载多屏幕的通话方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005110045A (ja) * 2003-09-30 2005-04-21 Toshiba Corp 情報処理装置及びその方法
JP2011030063A (ja) * 2009-07-28 2011-02-10 Ricoh Co Ltd ビデオ会議システム,サーバ装置,及びビデオ会議プログラム
JP2011097447A (ja) * 2009-10-30 2011-05-12 Sharp Corp コミュニケーションシステム
JP2011244454A (ja) * 2010-05-18 2011-12-01 Polycom Inc 複数の音声追跡カメラを有するビデオ会議端末
JP2015043507A (ja) * 2013-08-26 2015-03-05 株式会社リコー 情報処理装置、通信システムおよびプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005110045A (ja) * 2003-09-30 2005-04-21 Toshiba Corp 情報処理装置及びその方法
JP2011030063A (ja) * 2009-07-28 2011-02-10 Ricoh Co Ltd ビデオ会議システム,サーバ装置,及びビデオ会議プログラム
JP2011097447A (ja) * 2009-10-30 2011-05-12 Sharp Corp コミュニケーションシステム
JP2011244454A (ja) * 2010-05-18 2011-12-01 Polycom Inc 複数の音声追跡カメラを有するビデオ会議端末
JP2015043507A (ja) * 2013-08-26 2015-03-05 株式会社リコー 情報処理装置、通信システムおよびプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017022600A (ja) * 2015-07-13 2017-01-26 国立大学法人静岡大学 画像通信装置
JP2019524213A (ja) * 2016-06-29 2019-09-05 ジュン,サンムン モバイル・リアルタイム・シミュレーションゲームにおけるタッチ操作方式
JP2021098023A (ja) * 2016-06-29 2021-07-01 ジュン,サンムン モバイル・リアルタイム・シミュレーションゲームにおけるタッチ操作方式
CN112489661A (zh) * 2019-08-23 2021-03-12 上海汽车集团股份有限公司 一种车载多屏幕的通话方法及装置
CN112489661B (zh) * 2019-08-23 2024-04-12 上海汽车集团股份有限公司 一种车载多屏幕的通话方法及装置

Also Published As

Publication number Publication date
JP6435701B2 (ja) 2018-12-12

Similar Documents

Publication Publication Date Title
US9860486B2 (en) Communication apparatus, communication method, and communication system
US20210144337A1 (en) Multiple simultaneous framing alternatives using speaker tracking
JP6171263B2 (ja) 遠隔会議システム及び遠隔会議端末
US9179098B2 (en) Video conferencing
JP5857674B2 (ja) 画像処理装置、及び画像処理システム
US20130314543A1 (en) Method and system for controlling an imaging system
US20110216153A1 (en) Digital conferencing for mobile devices
US20160134838A1 (en) Automatic Switching Between Dynamic and Preset Camera Views in a Video Conference Endpoint
WO2015085949A1 (zh) 视频会议方法、装置及系统
US10951859B2 (en) Videoconferencing device and method
EP2816801B1 (en) Video conference processing method and device
JP6435701B2 (ja) 制御装置
JP6149433B2 (ja) テレビ会議装置、テレビ会議装置の制御方法、及びプログラム
KR101680524B1 (ko) 화자 표시 시스템 및 그 제어 방법
JP2006339869A (ja) 映像信号と音響信号の統合装置
JP2012165170A (ja) 会議装置、会議方法および会議プログラム
JP2017163466A (ja) 情報処理装置および会議システム
WO2016110047A1 (zh) 远程会议系统和进行远程会议的方法
JP5529617B2 (ja) 遠隔会議装置、遠隔会議方法、および遠隔会議プログラム
JP2017168903A (ja) 情報処理装置、会議システムおよび情報処理装置の制御方法
JP2016119620A (ja) 指向性制御システム及び指向性制御方法
EP2575362A1 (en) Multimodal mobile video telephony
US11825200B2 (en) Framing an image of a user requesting to speak in a network-based communication session
JP2011166613A (ja) 遠隔会議システム、及び遠隔制御方法
JP2010028299A (ja) 会議撮影画像処理方法及び会議装置等

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170515

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180313

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180509

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20180619

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180912

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20180921

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181016

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181029

R150 Certificate of patent or registration of utility model

Ref document number: 6435701

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150