JP6544209B2 - 情報処理装置、会議システム、情報処理方法およびプログラム - Google Patents

情報処理装置、会議システム、情報処理方法およびプログラム Download PDF

Info

Publication number
JP6544209B2
JP6544209B2 JP2015219495A JP2015219495A JP6544209B2 JP 6544209 B2 JP6544209 B2 JP 6544209B2 JP 2015219495 A JP2015219495 A JP 2015219495A JP 2015219495 A JP2015219495 A JP 2015219495A JP 6544209 B2 JP6544209 B2 JP 6544209B2
Authority
JP
Japan
Prior art keywords
user
unit
information
role
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015219495A
Other languages
English (en)
Other versions
JP2017092675A (ja
Inventor
和紀 北澤
和紀 北澤
清人 五十嵐
清人 五十嵐
耕司 桑田
耕司 桑田
高橋 仁人
仁人 高橋
智幸 後藤
智幸 後藤
宣正 銀川
宣正 銀川
未来 袴谷
未来 袴谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2015219495A priority Critical patent/JP6544209B2/ja
Publication of JP2017092675A publication Critical patent/JP2017092675A/ja
Application granted granted Critical
Publication of JP6544209B2 publication Critical patent/JP6544209B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)

Description

本発明は、情報処理装置、会議システム、情報処理方法およびプログラムに関する。
遠隔地との間で、インターネット等の通信ネットワークを介して遠隔会議を行うビデオ会議システムが普及している。このビデオ会議システムにおいては、遠隔会議(ビデオ会議)を行う参加者等の当事者の一方がいる会議室において、ビデオ会議システムの端末装置を用いて会議室の参加者等の画像(映像)を撮像し、かつ、発話による音声を入力し、映像データおよび音声データを相手方の端末装置に送信する。そして、相手方の会議室のディスプレイに表示し、かつ、スピーカにより音声出力して、実際の会議に近い状態で遠隔地間の会議を実現している。
また、ビデオ会議システムでは、会議の参加者の音声を取得するためにマイクを、映像を取得するためにカメラを使用している。ただし、カメラには画角があるため、カメラの画角外にいる参加者の映像は撮影することができない。この問題を解決するために、360度全方向を撮影することができるパノラマカメラを用いる方法が知られている。一方、マイクは、通常、無指向性のため、参加者の発話以外の周囲の音も集音してしまう。この問題を解決するため、マイクアレイを使用してマイクの集音範囲に指向性をもたせることにより、周囲の音の集音を抑え、参加者の発話を効率よく集音する方法が知られている。
このような、ビデオ会議システムとして、会議時における参加者の配置パターンを予め記憶しておき、会議開始時に端末装置に予め記憶されている配置パターンから、参加者の配置パターンに合致したものを選択し、会議端末は、選択された配置パターンに基づいてマイクアレイの集音方向を設定する技術が開示されている(特許文献1)。
しかしながら、特許文献1に記載された技術では、例えば、複数の参加者が同時に発話している場合等、それぞれの参加者のいずれの者の映像(画像)をクローズアップ(映像の切り出し)すればよいのかシステム上判別できず、意図通りに映像が切り替わらないという問題点がある。
本発明は、上記に鑑みてなされたものであって、会議に参加している利用者について、意図通りに利用者の映像をクローズアップすることができる情報処理装置、会議システム、情報処理方法およびプログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明は、情報処理装置であって、映像を撮像する撮像部と、音声を入力する入力部と、前記撮像部により撮像された前記映像から利用者を認識する認識部と、前記撮像部により撮像された前記映像において、前記認識部により認識された利用者が前記情報処理装置に対してどの方向に配置されているかを示す配置パターンを特定する特定部と、少なくとも利用者を示す情報と、該利用者を示す情報に関連付けられた利用者の役割と、を含む第1情報を取得する取得部と、前記認識部により認識された利用者に対応する前記第1情報の役割と、役割と優先度とを予め関連付けた第2情報と、に基づいて、該利用者に対して、該利用者の役割に対応する優先度を設定する設定部と、前記入力部により複数の方向から音声が入力されている場合、前記複数の方向の中で前記配置パターンで特定される利用者の方向のうち、優先度が高い役割を有する利用者の方向を優先して、該方向に対応する該利用者を含む映像領域を前記映像から切り出す切出部と、前記切出部により切り出された前記映像領域を送信する送信部と、を備えたことを特徴とする。
本発明によれば、会議に参加している利用者について、意図通りに利用者の映像をクローズアップすることができる。
図1は、実施の形態に係る会議システムの全体構成の一例を示す図である。 図2は、実施の形態に係る情報処理装置のハードウェア構成の一例を示す図である。 図3は、実施の形態に係る情報処理装置の複数のマイクの配置およびパノラマカメラの配置の一例を示す図である。 図4は、実施の形態の会議情報テーブルの構成の一例を示す図である。 図5は、実施の形態の優先度設定テーブルの構成の一例を示す図である。 図6は、実施の形態の顔認識特徴情報テーブルの構成の一例を示す図である。 図7は、実施の形態に係る情報処理装置の機能ブロック構成の一例を示す図である。 図8は、会議に参加する利用者の配置例を示す図である。 図9は、実施の形態に係る情報処理装置の優先度設定処理の一例を示すフローチャートである。 図10は、実施の形態に係る情報処理装置の集音動作および映像切り出し動作の流れの一例を示すフローチャートである。
以下に、図1〜10を参照しながら、本発明に係る情報処理装置、会議システム、情報処理方法およびプログラムの実施の形態を詳細に説明する。また、以下の実施の形態によって本発明が限定されるものではなく、以下の実施の形態における構成要素には、当業者が容易に想到できるもの、実質的に同一のもの、およびいわゆる均等の範囲のものが含まれる。さらに、以下の実施の形態の要旨を逸脱しない範囲で構成要素の種々の省略、置換、変更および組み合わせを行うことができる。
(会議システムの構成)
図1は、実施の形態に係る会議システムの全体構成の一例を示す図である。図1を参照しながら、本実施の形態に係る会議システム1の構成について説明する。
図1に示すように、本実施の形態に係る会議システム1は、2以上の情報処理装置(情報処理装置10a、10b、・・・)と、会議サーバ20と、予約サーバ30と、を含む。情報処理装置10a、10bは、それぞれインターネット等のネットワーク2を介して、会議サーバ20および予約サーバ30と通信可能となっている。
情報処理装置10a、10bは、他の情報処理装置との間で、会議サーバ20の制御に基づいて、セッションを確立し、確立したセッションを介して、音声データおよび映像データを送受信する会議端末装置である。これにより、会議システム1において、複数の情報処理装置(10a、10b、・・・)間のビデオ会議(以下、単に「会議」という場合がある)が実現される。なお、図1に示す1以上の情報処理装置(10a、10b、・・・)について、任意の情報処理装置を示す場合、または総称する場合、単に「情報処理装置10」と称するものとする。
会議サーバ20は、各情報処理装置10が会議サーバ20と接続しているか否かのモニタリング、会議開始時に各情報処理装置10の呼び出し制御、および会議時の情報処理の制御を行うサーバ装置である。
予約サーバ30は、会議を主催する利用者等が、事前に、会議情報(開催日時、開催場所、参加する利用者、役割、使用する情報処理装置等)を登録(予約)しておくサーバ装置である。会議情報については、後述する図4で説明する。また、予約サーバ30は、後述する図5および6にそれぞれ示す優先度設定テーブル1002および顔認識特徴情報テーブル1003を記憶している。各テーブルの詳細については後述する。なお、予約サーバ30は、例えば、管理PC(Personal Computer)等がネットワーク2を介して接続されており、上述の会議情報の登録、および優先度設定テーブル1002および顔認識特徴情報テーブル1003の追加および更新等の設定ができるものとしてもよい。
なお、図1に示す会議システム1の構成は一例であり、例えば、会議サーバ20および予約サーバ30は別々のサーバ装置としているが、これに限定されるものではなく、1つのサーバ装置で構成されるものとしてもよい。
(情報処理装置のハードウェア構成)
図2は、実施の形態に係る情報処理装置のハードウェア構成の一例を示す図である。図3は、実施の形態に係る情報処理装置の複数のマイクの配置およびパノラマカメラの配置の一例を示す図である。図2および3を参照しながら、本実施の形態に係る情報処理装置10のハードウェア構成の詳細について説明する。
図2に示すように、本実施の形態に係る情報処理装置10は、CPU(Central Processing Unit)201と、ROM(Read Only Memory)202と、RAM(Random Access Memory)203と、補助記憶装置204と、メディアドライブ205と、操作ボタン206と、電源スイッチ207と、ネットワークI/F208と、撮像素子I/F209と、パノラマカメラ210と、音声I/F211と、マイクアレイ212と、スピーカ213と、出力I/F214と、外部機器I/F216と、を備えている。
CPU201は、情報処理装置10全体の動作を制御する集積回路である。ROM202は、情報処理装置10用のファームウェア等のプログラムを記憶している不揮発性の記憶装置である。RAM203は、CPU201のワークエリアとして使用される揮発性の記憶装置である。
補助記憶装置204は、情報処理装置10の動作を実現する各種プログラム、ならびに映像データおよび音声データ等の各種データを記憶する不揮発性の記憶装置である。補助記憶装置204は、例えば、HDD(Hard Disk Drive)またはSSD(Solid State Drive)等である。
メディアドライブ205は、フラッシュメモリ等である記録メディア205aに対するデータの読み出しおよび書き込みを制御する装置である。
操作ボタン206は、情報処理装置10に対する設定操作等を行うためのボタンである。電源スイッチ207は、情報処理装置10の電源のON/OFFを切り替えるスイッチである。
ネットワークI/F208は、ネットワーク2を利用してデータを通信するためのインターフェースである。ネットワークI/F208は、例えば、NIC(Network Interface Card)等である。撮像素子I/F209は、CPU201の制御に従って被写体を撮像して映像データを得るパノラマカメラ210との間で映像データを伝送するためのインターフェースである。
パノラマカメラ210は、レンズ、および光を電荷に変換して被写体の画像(映像)をデジタルデータ化する固体撮像素子を含む撮像装置である。パノラマカメラ210は、周囲360度の映像データを取得する。このように、360度の映像データを取得することにより、情報処理装置10の周囲にいる会議に参加する利用者を全て撮像することが可能となる。パノラマカメラ210は、撮像素子I/F209に接続される。固体撮像素子としては、CMOS(Complementary Metal Oxide Semiconductor)またはCCD(Charge Coupled Device)等が用いられる。また、パノラマカメラ210は、例えば、図3に示すように、情報処理装置10の上面の中央部等に設置される。
音声I/F211は、CPU201の制御に従って、音声を入力するマイクアレイ212および音声を出力するスピーカ213との間で音声信号の入出力を処理するインターフェースである。マイクアレイ212は、会議に参加している利用者の音声を入力する集音装置である。マイクアレイ212は、複数のマイクを有し、CPU201の制御に従って、集音方向を任意に設定する指向性制御を実現することができる。スピーカ213は、CPU201の制御に従って、音声を出力する装置である。マイクアレイ212およびスピーカ213は、それぞれ音声I/F211に接続される。また、マイクアレイ212は、例えば、図3に示すように、6つのマイク(212a〜212f)を有する。マイク212a〜212fは、例えば、図3に示すように、情報処理装置10の筐体の上面に分散して配置される。これらのマイク212a〜212fは、CPU201の制御に従って、入力動作の有効または無効の切り替え、または、それぞれが入力した音声を増幅するゲイン等を切り替えることによって、周囲360度の任意の方向または範囲の音声を集音することができる。なお、マイクアレイ212は、図3に示すように6つのマイクで構成されることに限定されるものではなく、複数のマイクを有するものとすればよい。また、マイクアレイ212の各マイクは、図3に示すように、情報処理装置10の筐体に分散して配置されるものとしているが、これに限定されるものではなく、マイク212a〜212fを有するマイクアレイ212のユニットが、情報処理装置10の筐体とは別体として構成されているものとしてもよい。
出力I/F214は、CPU201の制御に従って、外付けの表示装置215に映像データを伝送するためのインターフェースである。外部機器接続I/F216は、USB(Universal Serial Bus)ケーブル等によって、外付けカメラ、外付けマイクおよび外付けスピーカ等の外部機器がそれぞれ電気的に接続可能なインターフェースである。
表示装置215は、会議に参加している他拠点の利用者の映像を表示する表示装置である。表示装置215は、例えば、CRT(Cathode Ray Tube)ディスプレイ、LCD(Liquid Crystal Display:液晶ディスプレイ)、または有機EL(Organic Electro−Luminescence)ディスプレイ等である。表示装置215は、ケーブル215aによって出力I/F214に接続される。ケーブル215aは、アナログRGB(VGA)信号用のケーブルであってもよく、コンポーネントビデオ用のケーブルであってもよく、HDMI(登録商標)(High−Definition Multimedia Interface)またはDVI(Digital Video Interactive)信号用のケーブルであってもよい。
上述のCPU201、ROM202、RAM203、補助記憶装置204、メディアドライブ205、操作ボタン206、電源スイッチ207、ネットワークI/F208、撮像素子I/F209、音声I/F211、出力I/F214、および外部機器I/F216は、アドレスバスおよびデータバス等のバス217によって互いに通信可能に接続されている。
なお、情報処理装置10のハードウェア構成は、図2に示す構成に限定されるものではない。例えば、メディアドライブ205は備えていなくてもよい。
(各種情報テーブル)
図4は、実施の形態の会議情報テーブルの構成の一例を示す図である。図4を参照しながら、予約サーバ30が記憶する会議情報テーブル1001について説明する。
図1に示す予約サーバ30は、上述のように、登録された会議情報を管理するため会議情報テーブル1001を記憶している。図4に示すように、会議情報テーブル1001では、例えば、会議情報を識別する会議識別情報毎に、開催日時、開催場所、利用者を識別する利用者識別情報、役割、およびその会議で使用される使用端末(情報処理装置10)が、それぞれ関連付けられて管理されている。ここで、役割とは、会議に参加する利用者に割り当てられるその会議における役割である。例えば、役割として、議長、議事録(議事録をとる利用者)、板書(板書する利用者)、ならびに、議長、議事録および板書以外の通常の参加者等が挙げられる。また、使用端末とは、例えば、その会議室で使用される会議端末(情報処理装置10)に一意に識別する識別情報である。
例えば、図4に示す会議情報テーブル1001では、会議識別情報が「002」である会議情報としては、開催日時が「2015/11/14 09:30」、開催場所が「会議室2−F」、利用者識別情報が「10507,20311」、役割が「議長,参加者」、使用端末が「VD5011」であることが示されている。
なお、図4に示す会議情報テーブル1001は、テーブル形式の情報としているが、これに限定されるものではなく、テーブルの各フィールドの値が互いに関連付けて管理することができれば、どのような形式の情報であってもよい。
図5は、実施の形態の優先度設定テーブルの構成の一例を示す図である。図5を参照しながら、予約サーバ30が記憶する優先度設定テーブル1002について説明する。
図1に示す予約サーバ30は、役割に対する優先度を管理する優先度設定テーブル1002(第2情報の一例)を記憶している。図5に示すように、優先度設定テーブル1002では、会議の役割毎に優先度が関連付けられて管理されている。ここで、優先度とは、会議中にパノラマカメラ210によって撮像された映像データにおいて、それぞれの役割が割り当てられた利用者の映像の切り出しをするための優先順位を決める値である。
例えば、図5に示す優先度設定テーブル1002では、役割である「議長」、「議事録」、「参加者」、「ホワイトボード」および「その他」は、それぞれ、優先度として「3」、「2」、「1」、「4」および「0」が割り当てられている。図5の例では、優先度の値が大きいほど、優先度が高いことを示す。すなわち、図5に示す優先度設定テーブル1002では、役割「ホワイトボード」の優先度が「4」で最も高く、役割「その他」の優先度が「0」で最も小さいことを示す。
なお、図5に示す優先度設定テーブル1002は、テーブル形式の情報としているが、これに限定されるものではなく、役割と優先度とが互いに関連付けて管理することができれば、どのような形式の情報であってもよい。
図6は、実施の形態の顔認識特徴情報テーブルの構成の一例を示す図である。図6を参照しながら、予約サーバ30が記憶する顔認識特徴情報テーブル1003について説明する。
図1に示す予約サーバ30は、利用者に対応する顔画像の特徴情報を管理する顔認識特徴情報テーブル1003を記憶している。図6に示すように、顔認識特徴情報テーブル1003では、利用者を識別する利用者識別情報毎に、その利用者の顔画像の特徴情報が関連付けられて管理されている。ここで、利用者の顔画像の特徴情報とは、例えば、利用者の顔の輪郭、目、鼻、あご、およびほお骨等の各パーツの形状および相対位置等を含む情報であり、パノラマカメラ210により撮像された画像から利用者の顔を認識するための情報である。
例えば、図6に示す顔認識特徴情報テーブル1003では、利用者識別情報「20391」に対して、特徴情報「{72,123,−3,・・・,−110、56,219}」が関連付けられている。
(情報処理装置の機能ブロック構成)
図7は、実施の形態に係る情報処理装置の機能ブロック構成の一例を示す図である。図8は、会議に参加する利用者の配置例を示す図である。図7および8を参照しながら、本実施の形態に係る情報処理装置10の機能ブロック構成の詳細について説明する。
図7に示すように、本実施の形態に係る情報処理装置10は、取得部101と、認識部102と、特定部103と、切出部104と、切替部105と、設定部106と、送信部107と、受信部108と、撮像制御部109と、表示制御部110と、音声出力制御部111と、入力部112と、記憶部113と、操作部114と、通信部115と、撮像部116と、表示部117と、音声出力部118と、を有する。
取得部101は、通信部115およびネットワーク2を介して、予約サーバ30から会議情報(第1情報)を取得する機能部である。具体的には、取得部101は、例えば、会議情報を取得するための取得要求、ならびに、会議の開催日時、開催場所および使用端末の情報を、通信部115およびネットワーク2を介して予約サーバ30に送信する。そして、予約サーバ30は、取得要求を受信すると、図4に示す会議情報テーブル1001を参照し、受信した開催日時、開催場所および使用端末に対応する利用者識別情報および役割を、ネットワーク2および通信部115を介して、取得部101に送信する。取得部101は、例えば、図2に示すCPU201がプログラムを実行することによって実現される。
認識部102は、撮像部116により撮像された画像に含まれる1以上の利用者の顔画像から利用者を認識(以下、「顔認識」という場合がある)する機能部である。具体的には、認識部102は、例えば、まず、撮像部116により撮像された画像に含まれる1以上の利用者の顔画像から、顔の輪郭、目、鼻、あご、およびほお骨等の各パーツの形状および相対位置等を含む特徴情報を抽出する。次に、認識部102は、抽出した1以上の利用者分の特徴情報を、通信部115およびネットワーク2を介して予約サーバ30に送信する。そして、予約サーバ30は、認識部102より抽出された特徴情報を受信すると、図6に示す顔認識特徴情報テーブル1003を参照し、受信した特徴情報と一致する特徴情報に対応する利用者識別情報を、ネットワーク2および通信部115を介して、認識部102に送信する。認識部102は、利用者識別情報を受信することによって、会議に参加する利用者を認識する。すなわち、認識部102が受信した利用者識別情報が示す利用者が、実際に会議に参加する利用者ということになる。ここで、認識部102により抽出された特徴情報と、顔認識特徴情報テーブル1003に含まれる特徴情報とが一致するとは、2つの特徴情報が完全に一致した場合だけではなく、2つの特徴情報が実質的に同じ利用者を示す特徴情報と判断できる場合も含まれ得る。認識部102は、例えば、図2に示すCPU201がプログラムを実行することによって実現される。
特定部103は、撮像部116によって撮像された画像において、認識部102により認識された利用者の位置を特定し、会議に参加する利用者の会議室における利用者の配置パターンを特定する機能部である。例えば、図8(a)に示す状況で、机40の上に載置された情報処理装置10の撮像部116により撮像された360度全方向の画像(以下、「パノラマ画像」という場合がある)において、特定部103は、認識部102によって認識された利用者60a〜60eについて、利用者60aが領域P1に、利用者60bが領域P2に、利用者60cが領域P3に、利用者60dが領域P5に、利用者60eが領域P6に、そして、ホワイトボード50が領域P7に位置することを示す配置パターンを特定する。また、図8(b)に示す状況で、撮像部116により撮像されたパノラマ画像において、特定部103は、認識部102によって認識された利用者61a〜61dについて、利用者61aが領域P2に、利用者61bが領域P3に、利用者61cが領域P4に、利用者61dが領域P5に、そして、ホワイトボード50が領域P7に位置することを示す配置パターンを特定する。すなわち、配置パターンを特定するということは、情報処理装置10に対してどの方向にどの利用者またはホワイトボードが配置されているかを特定することになる。特定部103は、例えば、図2に示すCPU201がプログラムを実行することによって実現される。なお、配置パターンで情報処理装置10に対して配置された方向が特定される利用者およびホワイトボード等を「利用者等」という場合がある。
なお、ホワイトボード50の位置を特定するには、情報処理装置10を机40に設置した状態で、情報処理装置10とホワイトボード50との位置関係を予め記憶部113に記憶させておくものとしてもよい。または、認識部102が、利用者の顔のみではなく、ホワイトボード50の基準画像に基づくテンプレートマッチング等の公知の方法により、パノラマ画像においてホワイトボード50を認識するものとしてもよい。
また、撮像部116により撮像された画像を「パノラマ画像」という場合があるものとしたが、撮像部116により撮像する客体として映像を示す場合、「パノラマ映像」という場合があるものとする。ただし、映像は、画像を含む概念であるものとする。
切出部104は、利用者に割り当てられた役割に対応する優先度に基づいて、パノラマ映像から特定の利用者等(図8の例では、例えば、複数の利用者およびホワイトボード50のうちいずれか)の映像領域を切り出す機能部である。切出部104は、例えば、図2に示すCPU201がプログラムを実行することによって実現される。
切替部105は、利用者に割り当てられた役割に対応する優先度に基づいて、入力部112の集音方向を特定の利用者等(図8の例では、例えば、複数の利用者およびホワイトボード50のうちいずれか)が位置する方向となるように切り替える機能部である。切替部105は、例えば、図2に示すCPU201がプログラムを実行することによって実現される。
設定部106は、利用者の操作入力を受け付けた操作部114からの操作情報に基づいて、または、取得部101により取得された会議情報に基づいて、認識部102により認識された利用者に対して、優先度を設定する機能部である。設定部106は、例えば、図2に示すCPU201がプログラムを実行することによって実現される。
送信部107は、切出部104により切り出された映像領域に対応する映像データ、および、入力部112により入力された音声データを、通信部115およびネットワーク2を介して、他拠点の情報処理装置10に送信する機能部である。具体的には、送信部107は、例えば、映像データおよび音声データをエンコードして、他拠点の情報処理装置10に送信する。ここで、エンコードの方法としては、公知の方法を用いればよい。例えば、H.264/AVC、またはH.264/SVC等の圧縮符号化技術を用いればよい。送信部107は、例えば、図2に示すCPU201がプログラムを実行することによって実現される。
受信部108は、ネットワーク2および通信部115を介して、他拠点の情報処理装置10から受信した映像データおよび音声データを受信する機能部である。具体的には、受信部108は、例えば、受信した映像データおよび音声データをデコードし、デコードした映像データを表示制御部110に送り、デコードした音声データを音声出力制御部111に送る。ここで、デコードの方法としては、公知の方法を用いればよい。受信部108は、例えば、図2に示すCPU201がプログラムを実行することによって実現される。
撮像制御部109は、撮像部116の動作を制御する機能部である。具体的には、撮像制御部109は、例えば、撮像部116による撮像の開始および停止の動作等を制御し、撮像部116により撮像されたパノラマ画像を取得する。撮像制御部109は、例えば、図2に示すCPU201がプログラムを実行することによって実現される。
表示制御部110は、表示部117に各種画像を表示させる制御を行う機能部である。表示制御部110は、例えば、図2に示すCPU201がプログラムを実行することによって実現される。
音声出力制御部111は、音声出力部118に各種音声を出力させる制御を行う機能部である。音声出力制御部111は、例えば、図2に示すCPU201がプログラムを実行することによって実現される。
入力部112は、音声を入力する機能部である。入力部112は、切替部105の制御に従って、特定の集音方向の音声を入力する。入力部112は、例えば、図2に示すマイクアレイ212によって実現される。
記憶部113は、情報処理装置10の動作を実現する各種プログラム、映像データ、音声データ、および特定部103によって特定された配置パターン等の情報を記憶する機能部である。記憶部113は、例えば、図2に示すRAM203および補助記憶装置204によって実現される。
操作部114は、利用者(例えば、会議の参加者)の各種操作入力を受け付ける機能部である。操作部114は、例えば、図2に示す操作ボタン206および電源スイッチ207等によって実現される。なお、操作部114は、図2に示す操作ボタン206および電源スイッチ207に限定されるものではなく、マウス、キーボード、またはタッチパネル等によって実現されるものとしてもよい。
通信部115は、ネットワーク2を介して、他の情報処理装置10、会議サーバ20および予約サーバ30とデータ通信をする機能部である。通信部115は、例えば、図2に示すネットワークI/F208によって実現される。
撮像部116は、360度全方向のパノラマ画像またはパノラマ映像を撮像する機能部である。撮像部116は、例えば、図2に示すパノラマカメラ210によって実現される。
表示部117は、表示制御部110の制御に従って、各種画像を表示する機能部である。表示部117は、例えば、図2に示す表示装置215によって実現される。
音声出力部118は、音声出力制御部111の制御に従って、各種音声を出力する機能部である。音声出力部118は、例えば、図2に示すスピーカ213によって実現される。
なお、図7に示す情報処理装置10の取得部101、認識部102、特定部103、切出部104、切替部105、設定部106、送信部107、受信部108、撮像制御部109、表示制御部110、音声出力制御部111、入力部112、記憶部113、操作部114、通信部115、撮像部116、表示部117および音声出力部118は、機能を概念的に示したものであって、このような構成に限定されるものではない。例えば、図7に示す情報処理装置10で独立した機能部として図示した複数の機能部を、1つの機能部として構成してもよい。一方、図7に示す情報処理装置10で1つの機能部が有する機能を複数に分割し、複数の機能部として構成するものとしてもよい。
また、情報処理装置10の取得部101、認識部102、特定部103、切出部104、切替部105、設定部106、送信部107、受信部108、撮像制御部109、表示制御部110および音声出力制御部111の一部または全部は、ソフトウェアであるプログラムではなく、FPGA(Field−Programmable Gate Array)またはASIC(Application Specific Integrated Circuit)等のハードウェア回路によって実現されてもよい。
(優先度設定処理)
図9は、実施の形態に係る情報処理装置の優先度設定処理の一例を示すフローチャートである。図9を参照しながら、本実施の形態に係る情報処理装置10の優先度設定処理の流れについて説明する。
<ステップS11>
まず、会議に参加しようとする利用者は、情報処理装置10の操作部114を操作して、情報処理装置10の電源をON状態にし、撮像部116によって周囲の画像(パノラマ画像)を撮像するための操作入力を行う。撮像制御部109は、操作部114からパノラマ画像を撮像するための操作情報を受け取ると、撮像部116にパノラマ画像を撮像させる。そして、ステップS12へ移行する。
<ステップS12>
認識部102は、撮像部116により撮像されたパノラマ画像に含まれる1以上の利用者の顔画像から、顔の輪郭、目、鼻、あご、およびほお骨等の各パーツの形状および相対位置等を含む特徴情報を抽出する。次に、認識部102は、抽出した1以上の利用者分の特徴情報を、通信部115およびネットワーク2を介して予約サーバ30に送信する。そして、予約サーバ30は、認識部102より抽出された特徴情報を受信すると、図6に示す顔認識特徴情報テーブル1003を参照し、受信した特徴情報と一致する特徴情報に対応する利用者識別情報を、ネットワーク2および通信部115を介して、認識部102に送信する。認識部102は、利用者識別情報を取得することによって、会議に参加する利用者を認識(顔認識)する。
そして、特定部103は、撮像部116によって撮像されたパノラマ画像において、認識部102により認識された利用者の位置を特定し、会議に参加する利用者の会議室における利用者の配置パターンを特定する。特定部103は、特定した配置パターンの情報を、記憶部113に記憶させる。そして、ステップS13へ移行する。
<ステップS13>
取得部101は、通信部115およびネットワーク2を介して、予約サーバ30から会議情報を取得する。具体的には、取得部101は、会議情報を取得するための取得要求、ならびに、会議の開催日時、開催場所および使用端末の情報を、通信部115およびネットワーク2を介して予約サーバ30に送信する。予約サーバ30は、取得要求を受信すると、図4に示す会議情報テーブル1001を参照し、受信した開催日時、開催場所および使用端末に対応する利用者識別情報および役割を、ネットワーク2および通信部115を介して、取得部101に送信する。そして、取得部101は、これから開催される会議の会議情報として、会議に参加する利用者の利用者識別情報および役割を取得する。これから開催される会議の会議情報が取得部101によって取得できた場合(ステップS13:Yes)、ステップS14へ移行し、取得できなかった場合(ステップS13:No)、ステップS15へ移行する。
<ステップS14>
設定部106は、取得部101により取得された会議情報のうちの役割に対応する優先度を取得するための取得要求、およびその役割の情報を、通信部115およびネットワーク2を介して予約サーバ30に送信する。予約サーバ30は、取得要求を受信すると、図5に示す優先度設定テーブル1002を参照し、受信した役割に対応する優先度を、ネットワーク2および通信部115を介して、設定部106に送信する。また、設定部106は、取得部101により取得された会議情報のうちの利用者識別情報と、認識部102による顔認識により取得された利用者識別情報(実際に会議に参加する利用者の利用者識別情報)とが一致する利用者に対応する役割に基づいて、その利用者に対して、受信した優先度を設定する。そして、ステップS18へ移行する。
なお、取得部101により取得された会議情報のうちの利用者識別情報の中に、認識部102による顔認識により取得された利用者識別情報がない場合、すなわち、会議情報に登録されていない利用者が、実際の会議室に存在する場合、設定部106は、デフォルトの役割(例えば、「参加者」)を設定するものとすればよい。または、設定部106は、会議情報に登録されていない利用者は実際の会議に参加しないものと判断し、役割を「その他」に設定するものとしてもよい。または、会議情報に登録されていない利用者が、実際の会議室に存在する場合、利用者は、操作部114を介して、その登録されていない利用者に対して手動で役割の設定操作を行うものとしてもよい。
<ステップS15>
これから開催される会議の会議情報が取得部101によって取得できなかった場合に、利用者が、認識部102により顔認識された利用者に対して、操作部114から手動で役割を設定する操作入力を行った場合(ステップS15:Yes)、ステップS16へ移行する。一方、利用者が、認識部102により顔認識された利用者に対して、操作部114から手動で役割を設定する操作入力を行わなかった場合(ステップS15:No)、ステップS17へ移行する。
<ステップS16>
設定部106は、利用者により操作部114から入力された役割の設定操作に基づいて、認識部102により顔認識された利用者に対して役割を設定し、その役割に対応する優先度を取得するための取得要求、およびその役割の情報を、通信部115およびネットワーク2を介して予約サーバ30に送信する。予約サーバ30は、取得要求を受信すると、図5に示す優先度設定テーブル1002を参照し、受信した役割に対応する優先度を、ネットワーク2および通信部115を介して、設定部106に送信する。また、設定部106は、認識部102により顔認識された利用者に対応する役割に基づいて、その利用者に対して、受信した優先度を設定する。そして、ステップS18へ移行する。
<ステップS17>
設定部106は、デフォルトの役割設定に基づいて、認識部102により顔認識された利用者に対して役割を設定し、その役割に対応する優先度を取得するための取得要求、およびその役割の情報を、通信部115およびネットワーク2を介して予約サーバ30に送信する。予約サーバ30は、取得要求を受信すると、図5に示す優先度設定テーブル1002を参照し、受信した役割に対応する優先度を、ネットワーク2および通信部115を介して、設定部106に送信する。また、設定部106は、認識部102により顔認識された利用者に対応する役割に基づいて、その利用者に対して、受信した優先度を設定する。ここで、デフォルトの役割設定とは、例えば、図8に示す領域P1に存在する利用者に対して優先的に役割を「議長」に設定し、領域P2に存在する利用者に対して優先的に役割を「議事録」に設定し、領域P6に存在する利用者に対して優先的に役割を「板書」に設定し、その他の利用者の役割を「参加者」に設定する、というような予め定められた役割の設定である。そして、ステップS18へ移行する。
<ステップS18>
情報処理装置10は、設定部106によって、顔認識がされた利用者に対して役割および優先度が設定された後、ビデオ会議を開始する。具体的には、情報処理装置10は、後述する図10に示す集音動作および映像切り出し動作の処理に移行する。
以上のステップS11〜S18の動作によって、情報処理装置10により優先度設定処理が実行される。
なお、図9に示す優先度設定処理においては、会議情報に基づいて役割および優先度を設定するか、利用者による役割設定操作に基づいて役割および優先度を設定するかについては、予約サーバ30の会議情報テーブル1001に、該当する会議情報の有無によって判定するものとしているが、これに限定されるものではない。例えば、情報処理装置10で手動モードおよび自動モードのいずれかを設定できるようにし、手動モードの場合は、予約サーバ30の会議情報テーブル1001を参照せず、利用者の役割設定操作により設定し、自動モードの場合は、予約サーバ30の会議情報テーブル1001を参照して設定するものとしてもよい。
また、図9に示す優先度設定処理のうち、ステップS11〜S17の処理は、会議中においても、所定時間ごとに、または、所定の条件を充足した場合に再実行するものとしてもよい。所定の条件を充足した場合とは、例えば、撮像部116により撮像されているパノラマ映像において、認識部102が顔認識した利用者の位置が移動した場合、前回に認識部102により顔認識した利用者がいなくなった場合、または、前回に認識部102により顔認識した利用者以外の利用者が顔認識された場合等が挙げられる。
(集音動作および映像切り出し動作)
図10は、実施の形態に係る情報処理装置の集音動作および映像切り出し動作の流れの一例を示すフローチャートである。図10を参照しながら、本実施の形態に係る情報処理装置10の集音動作および映像切り出し動作の流れについて説明する。
<ステップS31>
まず、切替部105は、入力部112の集音方向を360度全方向になるように切り替える。そして、ステップS32へ移行する。
<ステップS32>
切出部104は、特定部103により特定された配置パターンで配置方向が定まった利用者等のうち、優先度が最も高い役割を有する利用者等の映像領域を、撮像部116により撮像されているパノラマ映像から切り出す。例えば、優先度設定テーブル1002が図5に示す内容に設定されている場合、役割「ホワイトボード」の優先度が「4」で最も高いので、切出部104は、配置パターンで配置方向が定まっているホワイトボードを含む映像領域をパノラマ映像から切り出す。そして、ステップ33へ移行する。
なお、このステップS32で、切出部104は、優先度が最も高い役割を有する利用者等の映像領域を切り出すものとしているが、これに限定されるものではない。例えば、どの利用者等を切り出しの対象とするかについての設定を、優先度とは別個独立に設定するものとしてもよい。
<ステップS33>
送信部107は、切出部104により切り出された映像領域に対応する映像データをエンコードし、通信部115およびネットワーク2を介して、他拠点の情報処理装置10に送信する。そして、ステップS34へ移行する。
<ステップS34>
入力部112は、音声の入力の受け付けを開始する。そして、ステップS35へ移行する。
<ステップS35>
情報処理装置10は、ビデオ会議が終了したか否かを判定する。例えば、情報処理装置10は、利用者が操作部114から会議終了のための操作を行ったか否かを判定する。ビデオ会議が終了した場合(ステップS35:Yes)、集音動作および映像切り出し動作を終了し、ビデオ会議が終了していない場合(ステップS35:No)、ステップS36へ移行する。
<ステップS36>
入力部112により音声が入力された場合(ステップS36:Yes)、ステップS37へ移行し、入力部112により音声が入力されない場合(ステップS36:No)、ステップS31へ戻る。
<ステップS37>
入力部112は、入力した音声が複数の方向からの音声か否かを判定する。入力部112により複数の方向からの音声が入力された場合(ステップS37:Yes)、ステップS38へ移行し、入力部112により1の方向からの音声が入力された場合(ステップS37:No)、ステップS40へ移行する。
<ステップS38>
入力部112により複数の方向からの音声が入力されている場合、切替部105は、特定部103により特定された利用者等の配置パターンから、複数の方向に対応する利用者を特定し、特定した利用者のうち最も優先度の高い役割を有する利用者の方向に、入力部112の集音方向を切り替える。
ここで、例えば、切替部105によって、特定の利用者の方向に入力部112の集音方向が切り替えられた後、入力部112により新たな方向から音声が入力された場合、切替部105は、現在の入力部112の集音方向に対応する利用者の役割の優先度と、新たな方向に対応する利用者の役割の優先度とを比較し、優先度が高い役割を有する利用者の方向に、入力部112の集音方向を切り替えるものとすればよい。これは、後述する、ステップS40でも同様である。
なお、切替部105は、特定した利用者のうち最も優先度の高い役割を有する利用者の方向に、入力部112の集音方向を切り替えるものとしたが、これに限定されるものではない。すなわち、切替部105は、特定した利用者のうち、他の利用者の役割の優先度よりも高い優先度の役割を有する利用者の方向を優先して、入力部112の集音方向を切り替えるものとしてもよい。
また、切替部105は、配置パターンから特定した、複数の方向に対応する利用者がそれぞれ有する役割の優先度が等しい場合、例えば、等しい優先度の役割を有する利用者のうち、ランダムに決定した利用者の方向に、入力部112の集音方向を切り替えるものとすればよい。または、切替部105は、等しい優先度の役割を有する利用者のうち、先に入力部112により音声が入力された利用者の方向を優先して、入力部112の集音方向を切り替えるものとしてもよい。
入力部112は、切替部105により切り替えられた集音方向からの音声を入力する。そして、ステップS39へ移行する。
<ステップS39>
切出部104は、撮像部116により撮像されているパノラマ映像から、切替部105により切り替えられた集音方向に対応する利用者を含む映像領域を切り出す。そして、ステップS42へ移行する。
<ステップS40>
入力部112により1の方向からの音声が入力されている場合、切替部105は、特定部103により特定された利用者等の配置パターンから、1の方向に対応する利用者を特定し、特定した利用者の方向に、入力部112の集音方向を切り替える。入力部112は、切替部105により切り替えられた集音方向からの音声を入力する。そして、ステップS41へ移行する。
なお、切替部105は、配置パターンにより特定した1の方向に対応する利用者の役割およびその優先度が、例えば、図5に示す優先度設定テーブル1002のように、それぞれ「その他」および「0」となっている場合は、その利用者は会議に参加しないと判定し、その利用者の方向に集音方向を切り替えない、すなわち、その利用者が発話する音声を集音させないものとしてもよい。この場合、後述のステップS41でも、切出部104は、その利用者を含む映像領域をパノラマ映像から切り出さないものとすればよい。
<ステップS41>
切出部104は、撮像部116により撮像されているパノラマ映像から、切替部105により切り替えられた集音方向に対応する利用者を含む映像領域を切り出す。そして、ステップS42へ移行する。
<ステップS42>
送信部107は、切出部104により切り出された映像領域に対応する映像データ、および、入力部112により入力された音声データをエンコードし、通信部115およびネットワーク2を介して、他拠点の情報処理装置10に送信する。そして、ステップS35へ戻り、動作が繰り返される。
以上のステップS31〜S42の動作によって、情報処理装置10により集音動作および映像切り出し動作が実行される。
以上のように、本実施の形態に係る情報処理装置10では、ビデオ会議に参加する利用者等に対して、予め役割および優先度を設定し、複数の利用者が発話した場合には、優先度が高い役割を有する利用者の方向に、入力部112の集音方向を切り替え、パノラマ画像から集音方向に対応する利用者を含む映像領域を切り出すものとしている。そして、送信部107は、切出部104により切り出された映像領域に対応する映像データ、および、入力部112により入力された音声データをエンコードし、他拠点の情報処理装置10に送信するものとしている。これによって、会議中に複数の利用者が同時に発話している場合でも、優先度の高い利用者の音声を集音し、その利用者を含む画像を切り出して、他拠点の情報処理装置10に送信するので、会議に参加している利用者について、意図通りに利用者の映像をクローズアップすることができる。
また、予約サーバ30に予め会議情報を登録しておくので、会議に参加する利用者の役割を改めて設定する必要がなく、手間を省くことができ、会議をスムーズに開始することができる。
また、会議の開始前に、撮像部116がパノラマ画像を撮像し、認識部102が会議に参加する利用者を認識し、特定部103が利用者の配置パターンを特定しておくので、会議中に毎回、顔認識および配置パターンの特定等の動作を行う必要がなく、CPU201の負荷を軽減することができる。
なお、撮像部116は、パノラマカメラ210によって実現されるものとし、パノラマ画像またはパノラマ映像を撮像するものとしたが、必ずしもこれに限定されるものではない。すなわち、撮像する範囲が360度全方向である必要がない等の場合、パノラマカメラを利用する必要はなく、例えば、必要な撮像範囲を網羅する画角を有する撮像装置(カメラ)であってもよい。この場合、撮像装置が撮像可能な画角の範囲で、映像の切り出し、および集音方向の設定を行うものとすればよい。
また、上述の実施の形態において、情報処理装置10の各機能部の少なくともいずれかがプログラムの実行によって実現される場合、そのプログラムは、ROM等に予め組み込まれて提供される。また、上述の実施の形態に係る情報処理装置10で実行されるプログラムは、インストール可能な形式または実行可能な形式のファイルでCD−ROM(Compact Disc Read Only Memory)、フレキシブルディスク(FD)、CD−R(Compact Disk−Recordable)、またはDVD(Digital Versatile Disc)等のコンピュータで読み取り可能な記憶媒体に記憶して提供するように構成してもよい。また、上述の実施の形態の情報処理装置10で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、上述の実施の形態の情報処理装置10で実行されるプログラムを、インターネット等のネットワーク経由で提供または配布するように構成してもよい。また、上述の実施の形態の情報処理装置10で実行されるプログラムは、上述した各機能部のうち少なくともいずれかを含むモジュール構成となっており、実際のハードウェアとしてはCPU201が上述の記憶装置(例えば、ROM202および補助記憶装置204等)からプログラムを読み出して実行することにより、上述の各機能部が主記憶装置(例えば、RAM203)上にロードされて生成されるようになっている。
1 会議システム
2 ネットワーク
10、10a、10b 情報処理装置
20 会議サーバ
30 予約サーバ
40 机
50 ホワイトボード
60a〜60e 利用者
61a〜61d 利用者
101 取得部
102 認識部
103 特定部
104 切出部
105 切替部
106 設定部
107 送信部
108 受信部
109 撮像制御部
110 表示制御部
111 音声出力制御部
112 入力部
113 記憶部
114 操作部
115 通信部
116 撮像部
117 表示部
118 音声出力部
201 CPU
202 ROM
203 RAM
204 補助記憶装置
205 メディアドライブ
205a 記録メディア
206 操作ボタン
207 電源スイッチ
208 ネットワークI/F
209 撮像素子I/F
210 パノラマカメラ
211 音声I/F
212 マイクアレイ
212a〜212f マイク
213 スピーカ
214 出力I/F
215 表示装置
215a ケーブル
216 外部機器I/F
217 バス
1001 会議情報テーブル
1002 優先度設定テーブル
1003 顔認識特徴情報テーブル
P1〜P7 領域
特開2007−274463号公報

Claims (12)

  1. 情報処理装置であって、
    映像を撮像する撮像部と、
    音声を入力する入力部と、
    前記撮像部により撮像された前記映像から利用者を認識する認識部と、
    前記撮像部により撮像された前記映像において、前記認識部により認識された利用者が前記情報処理装置に対してどの方向に配置されているかを示す配置パターンを特定する特定部と、
    少なくとも利用者を示す情報と、該利用者を示す情報に関連付けられた利用者の役割と、を含む第1情報を取得する取得部と、
    前記認識部により認識された利用者に対応する前記第1情報の役割と、役割と優先度とを予め関連付けた第2情報と、に基づいて、該利用者に対して、該利用者の役割に対応する優先度を設定する設定部と、
    前記入力部により複数の方向から音声が入力されている場合、前記複数の方向の中で前記配置パターンで特定される利用者の方向のうち、優先度が高い役割を有する利用者の方向を優先して、該方向に対応する該利用者を含む映像領域を前記映像から切り出す切出部と、
    前記切出部により切り出された前記映像領域を送信する送信部と、
    を備えた情報処理装置。
  2. 前記入力部は、音声の集音方向の切り替えが可能であり、
    前記入力部により複数の方向から音声が入力されている場合、前記配置パターンから特定される該複数の方向の利用者のうち、最も優先度が高い役割を有する利用者の方向に、前記入力部の集音方向を切り替える切替部を、さらに備えた請求項1に記載の情報処理装置。
  3. 前記切替部は、前記入力部によって、一の方向に集音方向に切り替えられている状態で、前記一の方向とは異なる方向から音声が入力された場合に、前記異なる方向に対応する利用者が有する役割の優先度が、前記一の方向に対応する利用者が有する役割の優先度よりも高い場合、前記入力部の集音方向を前記異なる方向に切り替え、
    前記切出部は、前記異なる方向に対応する利用者を含む映像領域を前記映像から切り出す請求項2に記載の情報処理装置。
  4. 前記切出部は、前記入力部により音声が入力されていない場合、特定の方向に対応する映像領域を前記映像から切り出す請求項1〜3のいずれか一項に記載の情報処理装置。
  5. 前記切出部は、前記入力部により音声が入力されていない場合、前記特定の方向として前記第2情報での最も優先度が高い役割の方向に対応する映像領域を前記映像から切り出す請求項4に記載の情報処理装置。
  6. 前記切替部は、前記入力部により複数の方向から音声が入力されている場合、かつ、前記配置パターンから特定される該複数の方向の利用者が有する役割の優先度がそれぞれ等しい場合、該複数の方向からの音声のうち、早く前記入力部に入力した音声を優先して、該音声に対応する利用者の方向に前記入力部の集音方向を切り替え、
    前記切出部は、該集音方向に対応する利用者を含む映像領域を前記映像から切り出す請求項2に記載の情報処理装置。
  7. 前記切替部は、前記入力部により入力された音声に対応する利用者が有する役割の優先度が、前記第2情報で最も低い場合、前記入力部の集音方向を該利用者の方向に切り替えず、
    前記切出部は、該利用者を含む映像領域を前記映像から切り出さない請求項2に記載の情報処理装置。
  8. 所定時間ごとに、
    前記認識部は、前記撮像部により撮像された前記映像から利用者を認識し、
    前記特定部は、前記配置パターンを特定し、
    前記設定部は、前記認識部により認識された利用者に対応する前記第1情報の役割と、前記第2情報と、に基づいて、該利用者に対して、該利用者の役割に対応する優先度を設定する請求項1〜7のいずれか一項に記載の情報処理装置。
  9. 前記撮像部は、全方位を撮像して、全方位の前記映像を得る請求項1〜8のいずれか一項に記載の情報処理装置。
  10. 請求項1〜9のいずれか一項に記載の情報処理装置と、
    前記第1情報と、前記第2情報とを有するサーバ装置と、
    を有する会議システム。
  11. 情報処理装置での情報処理方法であって、
    映像を撮像する撮像ステップと、
    音声を入力する入力ステップと、
    撮像した前記映像から利用者を認識する認識ステップと、
    撮像した前記映像において、認識した利用者が前記情報処理装置に対してどの方向に配置されているかを示す配置パターンを特定する特定ステップと、
    少なくとも利用者を示す情報と、該利用者を示す情報に関連付けられた利用者の役割と、を含む第1情報を取得する取得ステップと、
    認識した利用者に対応する前記第1情報の役割と、役割と優先度とを予め関連付けた第2情報と、に基づいて、該利用者に対して、該利用者の役割に対応する優先度を設定する設定ステップと、
    複数の方向から音声を入力している場合、前記複数の方向の中で前記配置パターンで特定される利用者の方向のうち、優先度が高い役割を有する利用者の方向を優先して、該方向に対応する該利用者を含む映像領域を前記映像から切り出す切出ステップと、
    切り出した前記映像領域を送信する送信ステップと、
    を有する情報処理方法。
  12. 映像を撮像する撮像部と、音声を入力する入力部と、を備えたコンピュータに、
    前記撮像部により撮像された前記映像から利用者を認識する認識ステップと、
    前記撮像部により撮像された前記映像において、認識した利用者が報処理装置に対してどの方向に配置されているかを示す配置パターンを特定する特定ステップと、
    少なくとも利用者を示す情報と、該利用者を示す情報に関連付けられた利用者の役割と、を含む第1情報を取得する取得ステップと、
    前記認識ステップで認識された利用者に対応する前記第1情報の役割と、役割と優先度とを予め関連付けた第2情報と、に基づいて、該利用者に対して、該利用者の役割に対応する優先度を設定する設定ステップと、
    前記入力部により複数の方向から音声が入力されている場合、前記複数の方向の中で前記配置パターンで特定される利用者の方向のうち、優先度が高い役割を有する利用者の方向を優先して、該方向に対応する該利用者を含む映像領域を前記映像から切り出す切出ステップと、
    切り出した前記映像領域を送信する送信ステップと、
    を実行させるためのプログラム。
JP2015219495A 2015-11-09 2015-11-09 情報処理装置、会議システム、情報処理方法およびプログラム Active JP6544209B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015219495A JP6544209B2 (ja) 2015-11-09 2015-11-09 情報処理装置、会議システム、情報処理方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015219495A JP6544209B2 (ja) 2015-11-09 2015-11-09 情報処理装置、会議システム、情報処理方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2017092675A JP2017092675A (ja) 2017-05-25
JP6544209B2 true JP6544209B2 (ja) 2019-07-17

Family

ID=58770943

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015219495A Active JP6544209B2 (ja) 2015-11-09 2015-11-09 情報処理装置、会議システム、情報処理方法およびプログラム

Country Status (1)

Country Link
JP (1) JP6544209B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6967735B1 (ja) * 2021-01-13 2021-11-17 パナソニックIpマネジメント株式会社 信号処理装置及び信号処理システム
CN116567350B (zh) * 2023-05-19 2024-04-19 上海国威互娱文化科技有限公司 全景视频数据处理方法及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05111020A (ja) * 1991-10-17 1993-04-30 Matsushita Electric Ind Co Ltd テレビ会議用画面切替制御装置
JP2004118314A (ja) * 2002-09-24 2004-04-15 Advanced Telecommunication Research Institute International 発話者検出システムおよびそれを用いたテレビ会議システム
JP2007067972A (ja) * 2005-08-31 2007-03-15 Canon Inc 会議システム及び会議システムの制御方法
JP2007274463A (ja) * 2006-03-31 2007-10-18 Yamaha Corp 遠隔会議装置
JP5316248B2 (ja) * 2009-06-16 2013-10-16 株式会社リコー テレビ会議装置、テレビ会議方法、そのプログラム
US9723260B2 (en) * 2010-05-18 2017-08-01 Polycom, Inc. Voice tracking camera with speaker identification

Also Published As

Publication number Publication date
JP2017092675A (ja) 2017-05-25

Similar Documents

Publication Publication Date Title
US9860486B2 (en) Communication apparatus, communication method, and communication system
JP2024014888A (ja) 情報処理装置、情報処理プログラム、情報処理システム、情報処理方法
US10142578B2 (en) Method and system for communication
CN111937376B (zh) 电子设备及其控制方法、可读记录介质
US10079996B2 (en) Communication system, communication device, and communication method
JP6528574B2 (ja) 情報処理装置、情報処理方法、および情報処理プログラム
JP2009521186A (ja) 顔面認識に基づきユーザプロファイリングを提供する方法および装置
US10044782B2 (en) Terminal device, data transmission method, and computer-readable recording medium
US10468029B2 (en) Communication terminal, communication method, and computer program product
JP6544209B2 (ja) 情報処理装置、会議システム、情報処理方法およびプログラム
JP6149433B2 (ja) テレビ会議装置、テレビ会議装置の制御方法、及びプログラム
US9615059B2 (en) Imaging apparatus, medium, and method for imaging
JP2017034312A (ja) 通信装置、通信システム、およびプログラム
JP2017103641A (ja) 情報処理装置、会議システム、情報処理方法およびプログラム
JP6590152B2 (ja) 情報処理装置、会議システムおよび情報処理装置の制御方法
US20140253670A1 (en) Information processing device, display control system, and computer program product
JP6550951B2 (ja) 端末、ビデオ会議システム、及びプログラム
JP2010004480A (ja) 撮像装置、その制御方法及びプログラム
JP2017092950A (ja) 情報処理装置、会議システム、情報処理方法およびプログラム
JP2019176386A (ja) 通信端末及び会議システム
JP6500366B2 (ja) 管理装置、端末装置、伝送システム、伝送方法およびプログラム
JP2017168903A (ja) 情報処理装置、会議システムおよび情報処理装置の制御方法
JP2018046379A (ja) ビデオ会議装置、情報処理方法およびプログラム
KR20240002919A (ko) 촬상장치, 그 제어방법, 및 기억매체
JP2023123119A (ja) 通信端末、及び通信システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181009

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190306

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190312

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190426

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190521

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190603

R151 Written notification of patent or utility model registration

Ref document number: 6544209

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151