JP2010028715A - 会議画像生成方法、会議システム、サーバ装置及び会議装置等 - Google Patents

会議画像生成方法、会議システム、サーバ装置及び会議装置等 Download PDF

Info

Publication number
JP2010028715A
JP2010028715A JP2008190751A JP2008190751A JP2010028715A JP 2010028715 A JP2010028715 A JP 2010028715A JP 2008190751 A JP2008190751 A JP 2008190751A JP 2008190751 A JP2008190751 A JP 2008190751A JP 2010028715 A JP2010028715 A JP 2010028715A
Authority
JP
Japan
Prior art keywords
participant
information
image
conference
identification information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008190751A
Other languages
English (en)
Inventor
Hirotaka Asakura
弘崇 朝倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP2008190751A priority Critical patent/JP2010028715A/ja
Priority to PCT/JP2009/055416 priority patent/WO2010010736A1/ja
Publication of JP2010028715A publication Critical patent/JP2010028715A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems

Abstract

【課題】たとえ初対面の相手であってもその名前等の参加者に関する情報を知ることができる会議画像生成方法、会議システム、サーバ装置及び会議装置等を提供する。
【解決手段】撮影画像に基づいて、撮影された参加者を画像上で特定するための識別情報を生成し、会議装置が備える入力手段を用いて入力された参加者情報を取得し、参加者情報が取得された参加者に対して所定動作をするよう指示する指示情報を当該参加者に対して提示し、所定動作を行った参加者を撮影画像上で特定し、所定動作を行ったとして特定された参加者の識別情報と参加者情報とを対応付けて記憶手段に記憶させ、識別情報が記憶された参加者の画像を当該識別情報に基づいて撮影画像上で特定し、特定された参加者の識別情報に対応する参加者情報が撮影画像上において参加者の画像に対応して位置する参加者情報付撮影画像を生成し、他の会議装置に送信する。
【選択図】図2

Description

本発明は、複数の会議装置を含んで構成され、会議装置により撮影された会議の参加者の撮影画像を通信手段を介して他の会議装置に送信し表示させる会議システム等の技術分野に関する。
従来より、遠隔地にいる会議参加者をそれぞれの拠点にあるカメラで撮影し、参加者達の映像を相手方の拠点にあるディスプレイ上に表示させて、互いの顔映像等を見ながら会議をするテレビ会議システムが知られている。このようなテレビ会議システムにおいて、会議の参加者は、ディスプレイ上に映像が表示されている相手の名前などでその相手を呼びかけることによって、自分が話そうとする相手を特定することが一般的に行われている。
なお、本願発明が属する技術分野において、撮影された画像から会議参加者の顔画像を抽出し、顔画像中の唇部分の動きを捕捉して前駆動作を検出することにより、発話を開始しようとする参加者を発話者として特定し、この発話者の画像を他の参加者の画像よりも大きく表示する技術が提案されている(特許文献1)。
特開2004−118314号公報
しかしながら、従来においては、会議の相手が初対面である場合には、たとえその相手の顔は分かっていても、名前が分からなければ呼びかけることができない。こうしたことから、会議の効率が下がってしまう場合があった。また、参加者同士で自己紹介を行う際に、相手の名前やプロフィールなどをメモに取るなどの作業は非率的である。
そこで、本発明は、以上の点に鑑みてなされたものであり、たとえ初対面の相手であってもその名前等の参加者に関する情報を知ることができる会議画像生成方法、会議システム、サーバ装置及び会議装置等を提供すること等を課題とする。
上記課題を解決するために、請求項1に記載の発明は、複数の会議装置を含み、前記会議装置により撮影された会議の参加者の撮影画像を通信手段を介して他の前記会議装置に送信し表示させる会議システムにおいて、前記参加者本人を特定するための参加者情報を含む前記撮影画像である参加者情報付撮影画像を生成する会議画像生成方法であって、前記撮影画像に基づいて、撮影された前記参加者を画像上で特定するための識別情報を生成する識別情報生成工程と、前記会議装置が備える入力手段を用いて入力された前記参加者情報を取得する参加者情報取得工程と、前記参加者情報が取得された前記参加者に対して所定動作をするよう指示する指示情報を当該参加者に対して提示する指示情報提示工程と、前記所定動作を行った前記参加者を前記撮影画像上で特定する所定動作者特定工程と、前記所定動作を行ったとして特定された前記参加者の前記識別情報と前記参加者情報とを対応付けて記憶手段に記憶させる記憶工程と、前記記憶された識別情報に基づいて、前記参加者の画像を前記撮影画像上で特定する参加者特定工程と、前記参加者特定工程において特定された前記参加者の前記識別情報に対応する前記参加者情報が前記撮影画像上において前記参加者の画像に対応して位置する前記参加者情報付撮影画像を生成する画像生成工程と、前記生成された参加者情報付撮影画像を前記他の会議装置に送信する送信工程と、を備えることを特徴とする。
この発明によれば、画像解析の結果等に基づいて識別情報が生成され、入力手段から参加者情報が取得される。次いで、指示情報の提示に応じて参加者が所定動作を行うと、その動作を行った参加者が画像解析等によって特定され、この参加者の識別情報と参加者情報とが対応付けて記憶される。そして、会議が行われているときに、識別情報が記憶された参加者の画像が撮影画像上で特定され、この参加者の識別情報に対応する参加者情報が撮影画像上において当該参加者の画像に対応して位置するよう参加者情報付撮影画像が生成され、他の会議装置に送信される。
従って、相手側の会議装置の画面に、撮影画像上の参加者それぞれについてその撮影画像上の位置に対応した位置で参加者本人を特定する情報が表示されるので、相手側の参加者は、画面に表示された参加者がたとえ初対面であってもその名前等の参加者に関する情報を知ることができる。
請求項2に記載の発明は、請求項1に記載の会議画像生成方法において、前記撮影画像から前記参加者の画像を抽出する抽出工程と、前記識別情報生成工程において生成された前記識別情報と一致しまたは類似する前記識別情報が、前記参加者情報に対応付けて前記記憶手段に記憶されているか否かを判定する判定工程を更に備え、前記識別情報生成工程においては、抽出された前記参加者の画像に基づいて前記識別情報を生成し、前記判定工程において前記識別情報が記憶されていないと判定された前記参加者について、前記参加者情報取得工程、前記指示情報提示工程、前記所定動作者特定工程及び前記記憶工程を実行することを特徴とする。
この発明によれば、撮影画像から参加者の画像が抽出されて識別情報が生成され、この識別情報と一致しまたは類似する識別情報が記憶手段に記憶されていない参加者について、入力手段から参加者情報取得され、指示情報が提示され、所定動作を行った参加者が特定され、この参加者の識別情報と参加者情報とが対応付けて記憶される。
従って、記憶手段に識別情報がまだ記憶されていない参加者のみの参加者情報を入力すれば良いので、一度参加者情報を入力した参加者については、会議の度に参加者情報を入力する必要がない。
請求項3に記載の発明は、請求項1または請求項2に記載の会議画像生成方法において、前記指示情報提示工程においては、予め定められた語を前記参加者に言わせる前記指示情報を提示し、前記所定動作者特定工程においては、前記撮影画像に基づいて、前記参加者の口の動きを検出し、前記会議装置が備える音声入力手段を用いて入力された前記参加者の音声に基づいて、前記参加者が発した語が前記予め定められた語であるか否かを判定し、前記参加者が発した語が前記予め定められた語である場合に、口を動かした前記参加者を、前記所定動作を行った参加者として特定することを特徴とする。
この発明によれば、入力された音声が示す語が予め定められた語であり、且つ、口を動かした参加者がいた場合に、その参加者が所定動作を行ったものとされるので、所定動作を行った参加者を適確に特定することができる。
請求項4に記載の発明は、請求項3に記載の会議画像生成方法において、前記所定動作者特定工程においては、前記参加者が口を動かしたタイミングと、前記音声が入力されたタイミングと、の時間差が所定時間以下である場合に、口を動かした前記参加者が前記予め定められた語を発したと判定することを特徴とする。
この発明によれば、たとえ撮影画像上の参加者以外の誰かが予め定められた語を発したとしても、その音声が入力されたタイミングと参加者が口を動かしたタイミングとが合わなければ、参加者が所定動作を行ったとはされないので、所定動作を行った参加者を正確に特定することができる。
請求項5に記載の発明は、請求項1乃至4の何れか1項に記載の会議画像生成方法において、前記識別情報生成工程においては、前記撮影画像に基づいて、撮影された前記参加者の顔の特徴を示す前記識別情報を生成することを特徴とする。
この発明によれば、参加者の顔の特徴に基づいて撮影画像上における参加者の画像が特定されるので、参加者を容易に識別することができる。
請求項6に記載の発明は、請求項1乃至5の何れか1項に記載の会議画像生成方法において、前記入力手段は、前記参加者本人を特定する情報が印刷された印刷物及び当該情報が記録された記録媒体の少なくとも何れか一方から当該情報を前記参加者情報として読み取ることを特徴とする。
この発明によれば、例えば、名刺や社員証などの印刷物の画像をイメージスキャナーにより読み取らせたり、参加者本人を特定する情報が記録されたICカード(Integrated Circuit)などの記録媒体からカードリーダーで情報を読み取らせることなどにより、参加者情報を簡単に入力することができる。
請求項7に記載の発明は、請求項1乃至6の何れか1項に記載の会議画像生成方法において、前記指示情報提示工程においては、前記会議装置が、前記所定動作の指示を音声として出力し、または、当該指示を示す情報を表示することを特徴とする。
請求項8に記載の発明は、複数の会議装置を含み、前記会議装置により撮影された会議の参加者の撮影画像を通信手段を介して他の前記会議装置に送信し表示させる会議システムであって、前記撮影画像に基づいて、撮影された前記参加者を画像上で特定するための識別情報を生成する識別情報生成手段と、前記参加者本人を特定するための参加者情報を入力するために用いられる入力手段と、前記参加者情報が入力された前記参加者に対して所定動作をするよう指示する指示情報を当該参加者に対して提示する指示情報提示手段と、前記所定動作を行った前記参加者を前記撮影画像上で特定する所定動作者特定手段と、前記所定動作を行ったとして特定された前記参加者の前記識別情報と前記参加者情報とを対応付けて記憶手段に記憶させる記憶制御手段と、前記記憶された識別情報に基づいて、前記参加者の画像を前記撮影画像上で特定する参加者特定手段と、前記参加者特定手段により特定された前記参加者の前記識別情報に対応する前記参加者情報が前記撮影画像上において前記参加者の画像に対応して位置する前記撮影画像である参加者情報付撮影画像を生成する画像生成手段と、前記生成された参加者情報付撮影画像を前記他の会議装置に送信する送信手段と、を備えることを特徴とする。
請求項9に記載の発明は、複数の会議装置を含み、前記会議装置により撮影された会議の参加者の撮影画像を通信手段を介して他の前記会議装置に送信し表示させる会議システムにおいて、前記会議装置が前記通信手段を介して接続可能なサーバ装置であって、前記会議装置から送信された前記撮影画像を受信する撮影画像受信手段と、前記受信された撮影画像に基づいて、撮影された前記参加者を画像上で特定するための識別情報を生成する識別情報生成手段と、前記会議装置が備える入力手段を用いて入力された、前記参加者本人を特定するための参加者情報を当該会議装置から受信する参加者情報受信手段と、前記受信された参加者情報が入力された前記参加者に対して所定動作をするよう指示する要求を前記会議装置に送信する動作指示要求送信手段と、前記所定動作を行った前記参加者を前記撮影画像上で特定する所定動作者特定手段と、前記所定動作を行ったとして特定された前記参加者の前記識別情報と前記参加者情報とを対応付けて記憶手段に記憶させる記憶制御手段と、前記記憶された識別情報に基づいて、前記参加者の画像を前記撮影画像上で特定する参加者特定手段と、前記参加者特定手段により特定された前記参加者の前記識別情報に対応する前記参加者情報が前記撮影画像上において前記参加者の画像に対応して位置する前記撮影画像である参加者情報付撮影画像を生成する画像生成手段と、前記生成された参加者情報付撮影画像を前記他の会議装置に送信する送信手段と、を備えることを特徴とする。
請求項10に記載の発明は、複数の会議装置を含み、前記会議装置により撮影された会議の参加者の撮影画像を通信手段を介して他の前記会議装置に送信し表示させる会議システムにおいて、前記撮影画像を中継するサーバ装置と前記通信手段を介して接続可能な会議装置であって、前記参加者を撮影する撮影手段と、前記撮影手段による前記撮影画像に基づいて、撮影された前記参加者を画像上で特定するための識別情報を生成する識別情報生成手段と、前記参加者本人を特定するための参加者情報を入力するために用いられる入力手段と、前記参加者情報が入力された前記参加者に対して所定動作をするよう指示する指示情報を当該参加者に対して提示する指示情報提示手段と、前記所定動作を行った前記参加者を前記撮影手段による撮影画像上で特定する所定動作者特定手段と、前記所定動作を行ったとして特定された前記参加者の前記識別情報と前記参加者情報とを対応付けて前記サーバ装置に記憶させるよう、当該識別情報と当該参加者情報とを前記サーバ装置に送信する第1送信手段と、前記記憶された識別情報に基づいて、前記参加者の画像を前記撮影画像上で特定する参加者特定手段と、前記参加者特定手段により特定された前記参加者の前記識別情報に対応する前記参加者情報を前記撮影手段による前記撮影画像上において当該参加者の画像に対応して位置させた前記撮影画像である参加者情報付撮影画像を前記サーバ装置に生成させるよう、当該撮影画像と当該識別情報とを前記サーバ装置に送信する第2送信手段と、他の会議装置により撮影された前記撮影画像に基づいて生成された前記参加者情報付撮影画像を、前記サーバ装置から受信する撮影画像受信手段と、前記受信された参加者情報付撮影画像を表示する表示手段と、を備えることを特徴とする。
請求項11に記載の発明は、コンピュータを、請求項9に記載のサーバ装置として機能させることを特徴とする。
請求項12に記載の発明は、コンピュータを、請求項10に記載の会議装置として機能させることを特徴とする。
本発明によれば、相手側の会議装置の画面に、撮像画像上の参加者それぞれについてその撮像画像上の位置に対応した位置で参加者本人を特定する情報が表示されるので、相手側の参加者は、画面に表示された参加者がたとえ初対面であってもその名前等の参加者に関する情報を知ることができる。
以下、本発明の最良の実施形態を図面に基づいて説明する。なお、以下に説明する実施の形態は、会議システムに本発明を適用した場合の実施形態である。
[1.会議システムの構成等]
始めに、本実施形態に係る会議システムSの概要構成等について、図1及び図2を用いて説明する。
図1は、本実施形態に係る会議システムの概要構成の一例を示すブロック図である。また、図2は、会議の参加者が撮影された撮像画像にプロフィール情報を合成した画像の画面表示例である。図3(a)乃至(d)は、それそれ、撮影されている参加者のうちの1人が特定の動作を行った際の撮像画像の例である。
図1に示すように、会議システムSは、サーバ装置1と、会議装置の一例としての複数の会議端末装置2(2A、2B、2C)と、を含んで構成されている。なお、特定の会議端末装置2を示す場合には、会議端末装置2A、会議端末装置2Bまたは会議端末装置2Cというものとする。
サーバ装置1と各会議端末装置2とは、通信手段の一例としてのネットワークNWを介して、例えば、通信プロトコルにTCP/IP(Transmission Control Protocol/Internet Protocol)等を用いて相互にデータの送受信が可能である。なお、ネットワークNWは、例えば、インターネットで合っても良いし、専用のネットワークであっても良い。
各会議端末装置2は、互いに離れた場所に設置されている。例えば、会議端末装置2AはA社の事業所に設置され、会議端末装置2BはB社の事業所に設置され、会議端末装置2CはC社の事業所に設置されている。なお、各会議端末装置2は、同一の建物内に設置されても良い。
このような構成の会議システムSにおいて、サーバ装置1は、会議端末装置2からの要求等に応じて、テレビ会議を設定する。そしてサーバ装置1は、会議端末装置2において撮影された会議の参加者の画像(以下、「撮像画像」(撮影画像の一例)とも称する。)と、入力された参加者の音声とを受信し、テレビ会議の相手方の会議端末装置2に送信する。つまり、サーバ装置1は、会議の参加者の撮像画像及び音声を中継するのである。
各会議端末装置2は、カメラによって参加者を撮影するとともに、参加者の音声をマイクロフォンから入力させて、参加者の撮像画像と音声とをリアルタイムにサーバ装置1に送信する。また、各会議端末装置2は、サーバ装置1から送信されたテレビ会議の相手方の撮像画像と音声とを受信し、この画像を画面に表示するとともに、この音声をスピーカにより出力する。
更にサーバ装置1は、参加者の画像を中継する際に、この画像と、画像上に表示されている各参加者のプロフィール情報とを合成する。そして合成された画像は、図2に示すように、会議端末装置2により画面に表示される。図2は、会議端末装置2Cにおいて撮影された参加者の画像100を、会議端末装置2Aまたは2Bの画面に表示させた例であり、この画面には、C社製造部に所属する3人の参加者とそれぞれのプロフィール情報が表示されている。
プロフィール情報とは、それぞれの参加者本人を特定するための情報であり、例えば、氏名、所属する会社や組織の名称、所属するセクションの名称、役職名、住所、電話番号、FAX番号、電子メールアドレス等を含む情報である。このようなプロフィール情報が、例えば、画面に表示されている相手方の参加者の頭上に101A、B及びCとして表示されている。
このプロフィール情報は、例えば、参加者の名刺や社員証等(印刷物の一例)の画像をイメージスキャナーで読み取ったものであったり、参加者が所有するICカード等の記録媒体に記録された参加者の社員情報であったり、あるいは、当該ICカード等に記録されたアクセスナンバー等の情報に基づいてデータベースから検索された社員情報等である。また、参加者自身がキーボード等で入力した情報であっても良い。
本システムは、画像上のどの参加者に対応させてどのプロフィール情報を表示させるかを、画像解析によって判断する。具体的に会議端末装置2が、会議が開始される前などに、会議端末装置2によって撮影された画像から参加者の顔認識を行う。そして、サーバ装置1が、認識された参加者の顔の特徴を示す情報を識別情報として、その参加者のプロフィール情報と関連付けて登録する。なお、以下の説明においては、この識別情報を、「顔マスク」とも称する。
この関連付けを行うために、会議端末装置2は、プロフィール情報に含まれる氏名等で関連付けさせたい参加者を指定して特定の動作(所定動作の一例)を行わせるための指示を、画面表示や音声出力によって行う。そして、会議端末装置2は、当該指示に応じて所定の動作を行った参加者を、撮影された画像の解析を行うことにより特定する。
図3は(a)乃至(d)は、それぞれ画像上の3人の参加者A、B及びCのうち、真ん中にいる参加者Bが、特定の動作を行った際の画像200の例である。ここで、図3(a)は、参加者Bが挙手した例であり、図3(b)は、参加者Bが起立した例である。また、図3(c)は、参加者Bが首を縦に振った例であり、図3(d)は、参加者Bが「はい」(予め定められた語の一例)と返事をした例である。なお、特定の動作の例はこれらに限られるものではない。
以上説明した方法により、識別情報とプロフィール情報の関連付けが行われる。なお、この関連付けは、参加者毎にそれぞれ一度ずつ行えば良く、一旦関連付けが行われた後は、会議毎に関連付けをする必要はない。
[2.サーバ装置の構成等]
次に、サーバ装置1の構成等について、図4を用いて説明する。
図4は、本実施形態に係るサーバ装置1の概要構成の一例を示すブロック図である。
図4に示すように、サーバ装置1は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等を備える制御部11と、各種データ及びプログラムを記憶する記憶手段の一例としての記憶部12(例えば、ハードディスクドライブ等)と、ネットワークNWに接続して、会議端末装置2等との通信状態を制御する通信部13と、制御部11と表示部15及び操作部16との間におけるデータの入出力制御を行う入出力部14と、文字や画像等の情報を表示する表示部15(例えば、液晶ディスプレイ等)と、オペレータ等からの操作指示を受け付け、その指示内容を指示信号として入出力部14に出力する操作部16(例えば、キーボード、マウス等)と、を含んで構成されており、制御部11と各部とはシステムバス17を介して接続されている。
記憶部12には、プロフィールデータベースが構築されている。このプロフィールデータベースには、表1に示すように、テレビ会議に参加したことがある(プロフィール情報を入力した)ユーザ毎に、その識別番号と、識別情報と、プロフィール情報とが関連付けて登録されている。
Figure 2010028715
識別番号は、本システム側で割り当てた番号である。
また、識別情報としては、ユーザの顔マスクが登録される。この顔マスクは、ユーザの顔の特徴を示す情報である。具体的に顔マスクには、例えば、ユーザの顔の輪郭形状を示すデータ、ユーザの眉、目、鼻、唇等が顔のどの部分に位置するかを示す座標データ、及びそれらの形状を示すデータ等が含まれている。
また、プロフィール情報としては、例えば、名刺や社員証などの画像データ、ICカードに記録された社員情報へのアクセスナンバー等が登録される。
制御部11は、本実施形態において、撮像画像受信手段、参加者情報受信手段、動作指示要求送信手段、記憶制御手段、参加者特定手段、画像生成手段及び送信手段等の一例を構成する。そして、制御部11は、CPUが、ROMや記憶部12に記憶された各種プログラムを読み出し実行することによりサーバ装置1の各部を統括制御するとともに、撮像画像受信手段、参加者情報受信手段、動作指示要求送信手段、記憶制御手段、参加者特定手段、画像生成手段及び送信手段等として機能する。
なお、各種プログラム等は、例えば、ネットワークNWを介して他のサーバ装置等から取得されるようにしても良いし、CD(Compact Disc)−ROM等の記録媒体に記録されてドライブ装置等から読み込まれるようにしても良い。
[3.会議端末装置の構成等]
次に、会議端末装置2の構成等について、図5を用いて説明する。
図5は、本実施形態に係る会議端末装置2の概要構成の一例を示すブロック図である。
図5に示すように、会議端末装置2は、CPU、ROM、RAM等を備える制御部21と、各種データ及びプログラムを記憶する記憶部22(例えば、ハードディスクドライブ等)と、ネットワークNWに接続して、サーバ装置1等との通信状態を制御する通信部23と、制御部21と表示部25、カメラ26、マイクロフォン27、スピーカ28、操作部29及びプロフィール情報入力部30との間におけるデータの入出力制御を行う入出力部24と、会議の相手側の撮像画像を動画として表示する表示手段の一例としての表示部25(例えば、液晶ディスプレイ、プロジェクター等)と、会議の参加者等を動画撮影する撮影手段の一例としてのカメラ26と、会議の参加者等の発話音声を入力し、音声信号として入出力部24に出力する音声入力手段の一例としてのマイクロフォン27と、会議の相手側の参加者の発話音声などの音声を出力するスピーカ28と、会議の参加者等からの操作指示を受け付け、その指示内容を指示信号として入出力部24に出力する操作部29(例えば、キーボード、マウス、リモートポインティングデバイス等)と、プロフィール情報を入力するための入力手段の一例としてのプロフィール情報入力部30と、を含んで構成されており、制御部21と各部とはシステムバス31を介して接続されている。
プロフィール情報入力部30は、例えば、イメージスキャナー、接触型や非接触型などのICカードリーダー等により構成されている。
制御部21は、本実施形態において、識別情報生成手段、指示情報提示手段、所定動作者特定手段、第1送信手段、第2送信手段、撮影画像受信手段等の一例を構成する。そして、制御部21は、CPUが、ROMや記憶部22に記憶された各種プログラムを読み出し実行することにより会議端末装置2の各部を統括制御するとともに、識別情報生成手段、指示情報提示手段、所定動作者特定手段、第1送信手段、第2送信手段、撮影画像受信手段等として機能する。
なお、各種プログラム等は、例えば、ネットワークNWを介してサーバ装置1等から取得されるようにしても良いし、CD−ROM等の記録媒体に記録されてドライブ装置等から読み込まれるようにしても良い。
[4.会議システムの動作]
[4.1 参加者登録処理]
次に、会議システムSの動作について説明するが、先ず、参加者の識別情報とプロフィール情報を関連付けて登録する参加者登録処理について、図6を用いて説明する。
図6は、本実施形態に係る会議システムSの参加者登録処理における処理例を示すフローチャートである。なお、以下に説明する参加者登録処理は、イメージスキャナーを用いてプロフィール情報を読み取る場合の処理例である。
本処理は、例えば、テレビ会議の開始前やテレビ会議を始める際などに実行される処理である。先ず、会議の参加者が、会議端末装置2の操作部29を操作することによって、会議端末装置2の制御部21からサーバ装置1に対して会議システムSへのログインが要求される。ログイン処理により、サーバ装置1の制御部11がテレビ会議に用いられる端末として会議端末装置2を認識すると、図6に示すように、会議端末装置2の制御部21は、カメラ26を制御して参加者の撮影を開始させる(ステップS1)。
次いで、制御部21は、カメラ26から供給された撮像画像から、当該撮像画像に映されている参加者全員の顔認識を行い、その認識結果に基づいて、その参加者全員についての識別情報(顔マスク)をそれぞれ生成する(ステップS2)。
顔認識を行って識別情報を生成する方法としては、例えば、特開平11−175718号公報や文献(小鶴俊幸、他2名、“監視カメラ向け実時間顔検出・認識システムの開発”、OMRON TECHNICS、2003年、第43巻、第1号、p.32-36)などに記載の技術を用いることができる。例えば、予め用意された顔の形状を示すテンプレートを撮像画像上で移動させながら、前記テンプレートと、前記テンプレートが位置する画像領域との相関値を求める。そして、最も高い相関値をもつ画像領域を顔領域とする。次いで、検出された顔領域から、目、鼻、口等の位置を検出し、これらの位置から、顔領域を一定の大きさ、形状に切り出し、その濃淡情報を特徴ベクトルとする。そして、特徴ベクトルの相関行列を求め、K−L展開(Karhunen-lovee expansion )による正規直交ベクトルを求めることにより部分空間を計算し、この部分空間を識別情報とする。
次いで、制御部21は、生成した識別情報をサーバ装置1に送信する(ステップS3)。
識別情報を受信したサーバ装置1の制御部11は(ステップS21)、各識別情報がそれぞれプロフィールデータベースに既に登録されているか否かを検索する(ステップS22)。具体的に制御部11は、受信した識別情報とプロフィールデータベースに登録されている各識別情報とを比較して両者の間における類似度を算出する。この類似度は、例えば、識別情報としての顔マスクが示す顔の輪郭の形状の一致度、眉、目、鼻、唇の位置の差、及びそれらの形状の一致度等に基づいて算出される。そして、制御部11は、プロフィールデータベースに登録されている識別情報のうち、類似度が所定値以上であり、且つ、最大の類似度となる識別情報が対応する参加者と、受信した識別情報が対応する参加者とが同一であると認定し、この受信した識別情報はプロフィールデータベースに登録されていると判定する。一方、制御部11は、プロフィールデータベースに登録されている識別情報のうち類似度が所定値以上となる識別情報が存在しない場合には、受信した識別情報は新規の識別情報であると判定する。
次いで、制御部11は、受信した識別情報のうち、新規の識別情報が存在するか否かを判定する(ステップS23)。このとき、制御部11は、新規の識別情報が存在する場合には(ステップS23:YES)、関連付けリクエストを会議端末装置2に送信する。
会議端末装置2の制御部21は、識別情報を送信してから所定時間の間に、サーバ装置1から関連付けリクエストを受信したか否かを判定し(ステップS4)、関連付けリクエストを受信した場合には(ステップS4:YES)、プロフィール情報入力部30が有するイメージスキャナーを制御して、名刺等の画像を読み取らせ、この画像データをプロフィール情報として取得する(ステップS5)。このとき、制御部21は、名刺等をイメージスキャナーで読み取らせるよう指示する旨のメッセージを、表示部25に表示させたりスピーカ28により出力させたりする。なお、識別情報及びプロフィール情報を新規に登録する参加者(本システムにおけるテレビ会議に初めて参加するユーザ)のみの名刺等を読み取れば良い。ここで、プロフィール情報が登録されていない参加者の画像を強調表示などさせた撮像画像を表示部25に表示させるなどして、プロフィール情報を入力すべき参加者を明確に示すことが望ましい。
次いで、制御部21は、後述する関連付け処理を実行する(ステップS6)。この関連付け処理では、入力されたプロフィール情報と生成された識別情報との関連付けが行われる。
次いで、制御部21は、プロフィール情報として入力さえた名刺等全てについて関連付け処理を実行したか否かを判定する(ステップS7)。このとき、制御部21は、一つ以上の名刺等について関連付け処理が未だ実行されていない場合には(ステップS7:NO)、ステップS6に以降して、残りの名刺等についての関連付け処理を実行する。
そして、制御部21は、名刺等全てについて関連付け処理を実行すると(ステップS7:YES)、カメラ26による撮影を終了させる(ステップS8)。
一方、サーバ装置1の制御部11は、関連付けリクエストを送信した後、識別情報と関連付けされたプロフィール情報を受信したか否かを判定して(ステップS25)、プロフィール情報が受信されない間は(ステップS25:NO)、その受信待ちを行う(ステップS25)。
そして、制御部11は、会議端末装置2における関連付け処理によって識別情報と関連付けされたプロフィール情報を受信すると(ステップS25:YES)、このプロフィール情報と識別情報とを関連付けてプロフィールデータベースに登録する。
次いで、制御部11は、新規の識別情報全てについて登録を行ったか否かを判定する(ステップS27)。このとき、制御部11は、新規の識別情報のうち少なくとも一つの識別情報について登録を行っていない場合には(ステップS27:NO)、ステップS25に移行して、残りの識別情報についての登録を行う。
一方、制御部11は、新規の識別情報全てについて登録を行った場合には(ステップS27:YES)、参加者登録処理を終了させる。
また、制御部11は、受信した識別情報のうち、新規の識別情報が存在しない場合には(ステップS23:NO)、プロフィール情報と識別情報との登録を行うことなく、そのまま参加者登録処理を終了させる。このとき、会議端末装置2の制御部21は、サーバ装置1から関連付けリクエストを受信しないので(ステップS4:NO)、関連付け処理を行うことなく、そのまま処理を終了させる。
なお、上記説明においては、会議端末装置2側で識別情報を生成していたが、サーバ装置1側で生成しても良い。具体的には、例えば、撮像画像を会議端末装置2からサーバ装置1に送信し、この撮像画像に基づいてサーバ装置が識別情報を生成すれば良い。
[4.2 関連付け処理]
次に、図6のステップS6において示した関連付け処理について、説明する。なお、特定の動作として参加者に返事をさせない場合(図3(a)乃至(c)を参照)と、参加者に返事をさせる場合(図3(d)を参照)との間で処理が一部異なるので、分節して説明する。
[4.2.1 参加者に返事をさせない場合]
始めに、参加者に返事をさせない場合における関連付け処理について、図7を用いて説明する。
図7は、本実施形態に係る会議端末装置2の制御部21の関連付け処理における第1の処理例を示すフローチャートである。
図7に示すように、会議端末装置2の制御部21は、関連付け処理を開始すると、入力されたプロフィール情報としての名刺画像データ等から、文字認識により、参加者の氏名等のプロフィールを抽出する(ステップS41)。
次いで、制御部21は、抽出したプロフィールの人物に対して、特定の動作をするよう指示する(ステップS42)。具体的に、制御部21は、特定の動作をするよう指示する旨のメッセージを表示部25に表示させたり、その音声をスピーカ28により出力させたりする。このメッセージの内容としては、例えば、「C社製造部部長の××さん。手を上げてください。」(図7(a)の場合)、「C社製造部部長の××さん。うなずいてください」(図7(b)の場合)、「C社製造部部長の××さん。起立してください」(図7(c)の場合)等である。
次いで、制御部21は、撮像画像上で1人だけ特定の動作をしたか否かを画像解析によって判定する(ステップS43)。具体的に制御部21は、例えば、フレーム間差分法を用いて、撮像画像上の参加者のうち何らかの動作をした参加者を特定する。そして、制御部21は、参加者に挙手するよう指示した場合には(図7(a)の場合)、例えば、認識した顔画像の左右の何れかの部分の画像が変化したか否かを判定することによって、挙手したか否かを判断する。また、制御部21は、参加者に起立するよう指示した場合には(図7(b)の場合)、例えば、参加者の顔の座標が上方に移動したか否かを判定することによって、起立したか否かを判断する。また、制御部21は、参加者に首を縦に振るよう指示した場合には(図7(c)の場合)、例えば、参加者が首を下げることによってその参加者の顔を認識することができなくなったか否かを判定するによって、首を縦に振る振ったか否かを判断する。
このようにして、制御部21は、1人だけ特定の動作をした場合には(ステップS43:YES)、その動作をした参加者の識別情報とプロフィール情報とを関連付けて(ステップS44)、これらをサーバ装置に送信する(ステップS45)。制御部21は、この処理を終えると、関連付け処理を終了させる。
一方、制御部21は、誰も特定の動作をしなかった場合、または、2人以上の参加者が特定の動作をした場合には(ステップS43:NO)、関連付けを行うことなく、そのまま関連付け処理を終了させる。
[4.2.2 参加者に返事をさせる場合]
次に、参加者に返事をさせる場合における関連付け処理について、図8を用いて説明する。
図8は、本実施形態に係る会議端末装置2の制御部21の関連付け処理における第2の処理例を示すフローチャートであり、同図において、図7と同様の要素については同様の符号を付してある。
図8に示すように、会議端末装置2の制御部21は、名刺画像データ等から参加者のプロフィールを抽出すると(ステップS41)、抽出したプロフィールの人物を音声で呼び出す(ステップS51)。具体的に、制御部21は、例えば、「C社製造部部長の××さん。“はい”と返事をしてください。」というメッセージ音声をスピーカ28により出力させる。
次いで、制御部21は、撮像画像上で1人だけ口の形状が変化したか否かを画像解析によって判定する(ステップS52)。
口の形状の変化を検出する方法としては、例えば、特開平9−171559号公報や文献(大槻恭士、他2名、“オプティカルフローとHMMを用いた駅名発話画像認識の検討”、情報処理学会東北支部、2001年度第5回研究会、資料番号01-5-13)などに記載の技術を用いることができる。例えば、顔認識によって検出された顔領域の縦方向における中心線を計算する。次いで、中心線上で所定の範囲に等間隔で初期位置を決定し、それぞれの前記初期位置の周辺画素をテンプレートとして切り出す。その後、各フレームについて顔領域及び中心線を求め、前記テンプレートとのマッチングを行う。次いで、各フレームについて前記テンプレートと適合した位置と前記初期位置との距離の差を求める。そして、前記距離の差の合計値が所定値以上となった場合は、口の形状が上下に変化したと認定する。
このとき、制御部21は、撮像画像上で1人だけ口の形状が変化した場合には(ステップS52:YES)、次いで、指定した音声を検出したか否かを判定する(ステップS53)。具体的に、制御部21は、音声入力手段の一例としてのマイクロフォン27から入力された音声に対応する音声データを取得し、この音声データに「はい」の音声に相当する成分が含まれているか否かを判定する。このとき、制御部21は、音声データから参加者達の発話音声の特徴ベクトルを抽出し、「はい」の音声の特徴をモデル化した音響モデルと抽出した特徴ベクトルとの間における類似度を算出し、この類似度が所定値以上であるか否かを判定することによって、「はい」の音声に相当する成分が含まれているか否かを判定する。
そして、制御部21は、指定した音声を検出した場合には(ステップS53:YES)、参加者の口の形状が変化し始めたタイミングから、指定した音声の最初の音素が入力されたタイミングまでに経過した時間を算出する(ステップS54)。
次いで、制御部21は、算出した経過時間が所定値以下であるか否かを判定する(ステップS55)。このとき、制御部21は、算出した経過時間が所定値以下である場合には(ステップS55:YES)、口の形状が変化した参加者が、指定した語を発した参加者であると判断し、その参加者の識別情報とプロフィール情報とを関連付けて(ステップS44)、これらをサーバ装置に送信する(ステップS45)。制御部21は、この処理を終えると、関連付け処理を終了させる。
一方、制御部21は、誰も口の形状が変化しなかった場合、2人以上の参加者の口の形状が変化した場合(ステップS52:NO)、指定した音声を検出しなかった場合(ステップS53:NO)、または、算出した経過時間が所定値を超えている場合には(ステップS55:NO)、関連付けを行うことなく、そのまま関連付け処理を終了させる。
なお、上記説明においては、参加者が特定の動作をしたか否かを会議端末装置2側で判断するとともに、識別情報とプロフィール情報との関連付けも会議端末装置2側で行っていたが、これらのうち何れか一方、または、双方をサーバ装置1側で行っても良い。例えば、会議端末装置2が、特定の動作をするよう参加者に指示した後、カメラ26からの撮像画像をサーバ装置1に送信し、この撮像画像に基づいてサーバ装置が、参加者が特定の動作をしたか否かを判定して関連付けを行い、識別情報とプロフィール情報とをプロフィールデータベースに登録すれば良い。
[4.3 会議中の処理]
次に、参加者の識別情報とプロフィール情報を関連付けて登録する参加者登録処理について、図9を用いて説明する。
図9は、本実施形態に係る会議システムSの会議中における処理例を示すフローチャートである。
本処理は、例えば、上述した参加者登録処理等の後、テレビ会議の開始と同時に開始され、当該テレビ会議の終了と同時に終了される処理である。
なお、以下の説明においては、A社とC社との間でテレビ会議を行うものとする。また、各会議端末装置2において撮影された画像は、それぞれ相手方の会議端末装置2に送信されるが、以下では、会議端末装置2Cにおいて撮影された画像を会議端末装置2Aに送信する場合のみについて説明し、会議端末装置2Aにおいて撮影された画像を会議端末装置2Cに送信する場合については、説明を省略する。
図9に示すように、会議端末装置2Cの制御部21は、カメラ26を制御してA社側の参加者を撮影する(ステップS101)。
次いで、会議端末装置2Cの制御部21は、カメラ26から供給された撮像画像から、当該撮像画像に映されている参加者全員の顔認識を行い、その参加者全員についての識別情報をそれぞれ生成する(ステップS102)。
次いで、会議端末装置2Cの制御部21は、撮像画像、生成した識別情報及び認識した参加者の顔の撮像画像上における座標をサーバ装置1に送信する(ステップS103)。このとき、識別情報と参加者の顔の座標とは、参加者毎に関連付けされて送信される。
次いで、会議端末装置2Cの制御部21は、カメラ26による撮影を停止させるか否かを判定する(ステップS104)。具体的に、会議端末装置2Cの制御部21は、参加者が会議端末装置2Cの操作部29を操作してテレビ会議の終了を指示した場合や、会議端末装置2Aから会議を終了する旨のリクエストを受信した場合などには、撮影を停止させると判定する。
このとき、会議端末装置2Cの制御部21は、撮影を停止させない場合には(ステップS104:NO)、ステップS101に移行する。つまり、会議端末装置2Cの制御部21は、テレビ会議が継続している間、ステップS101乃至S104の処理を繰り返すのである。
そして、会議端末装置2Cの制御部21は、撮影を停止させる場合には(ステップS104:YES)、カメラ26を停止させて、処理を終了させる。
サーバ装置1の制御部11は、会議端末装置2Cから撮像画像、識別情報及び参加者の顔の座標を受信すると(ステップS121)、番号Nとして1を設定する(ステップS122)。
次いで、制御部11は、受信した識別情報のうちN番目の識別情報でプロフィール情報を検索する(ステップS123)。このときの検索方法は、図6のステップS22において説明した方法と基本的に同様である。
次いで、制御部11は、プロフィール情報が検索されたか否かを判定する(ステップ124)。このとき、制御部11は、プロフィール情報が検索された場合には(ステップS124:YES)、このプロフィール情報が、N番目の参加者の顔の座標が示す撮像画像上の位置よりも上方に表示されるよう、撮像画像にプロフィール情報を重ね合わせることによって画像を合成する(ステップS125)。制御部11は、この処理を終えると、ステップS126に移行する。
一方、制御部11は、プロフィール情報が検索されなかった場合には(ステップS124:NO)、画像の合成を行うことなくステップS126に移行する。
そして、制御部11は、撮像画像上の全参加者に対してプロフィール情報の検索等を実行したか否かを判定する(ステップS126)。このとき、制御部11は、1人以上の参加者について未だ検索等を実行していない場合には(ステップS126:NO)、番号Nに1を加算して(ステップS127)、ステップS123に移行する。
一方、制御部11は、全参加者に対してプロフィール情報の検索等を実行した場合には(ステップS126:YES)、プロフィール情報との合成によって生成された撮像画像(プロフィール情報が1人分も検索されなかった場合には、会議端末装置2Cから受信した撮像画像そのもの)を会議端末装置2Aに送信して(ステップS128)、処理を終了させる。
なお、テレビ会議が行われている間は、会議端末装置2Cから撮像画像、識別情報及び参加者の顔の座標を受信し続けるので、テレビ会議が終了するまでは、ステップS121乃至S128の処理が繰り返し実行される。
会議端末装置2Aの制御部21は、テレビ会議が開始されると、サーバ装置1から撮像画像を受信したか否かを判定する(ステップS141)。このとき、会議端末装置2Aの制御部21は、撮像画像を受信した場合には(ステップS141:YES)、図2に示すように、この撮像画像を表示部25に表示させて(ステップS142)、ステップS143に移行する。
一方、会議端末装置2Aの制御部21は、撮像画像を受信しなかった場合には(ステップS141:NO)、ステップS143に移行する。
そして、会議端末装置2Aの制御部21は、表示部25による撮像画像の画面表示を停止させるか否かを判定する(ステップS143)。具体的に、会議端末装置2Aの制御部21は、参加者が会議端末装置2Aの操作部29を操作してテレビ会議の終了を指示した場合や、会議端末装置2Cから会議を終了する旨のリクエストを受信した場合などには、画面表示を停止させると判定する。
このとき、会議端末装置2Aの制御部21は、画面表示を停止させない場合には(ステップS143:NO)、ステップS141に移行する。つまり、会議端末装置2Aの制御部21は、テレビ会議が継続している間、ステップS141乃至S143の処理を繰り返すのである。
そして、会議端末装置2Aの制御部21は、画面表示を停止させる場合には(ステップS104:YES)、表示部25を停止させて、処理を終了させる。
なお、上記説明においては、会議端末装置2側で識別情報の生成としていたが、サーバ装置1側で生成しても良い。また、上記説明においては、サーバ装置1側において、識別情報でプロフィール情報を検索することにより、撮像画像上の参加者がどの参加者であるかを特定していたが、会議端末装置2側で特定しても良い。この場合には、会議端末装置2が、当該会議端末装置2を用いる可能性のあるユーザ全員について識別情報をサーバ装置1から取得しておくことが必要である。そして、会議端末装置2は、生成した識別情報と取得した識別情報とを比較し、取得した識別情報のうち、類似度が所定値以上であって且つ当該類似度が最大となる識別情報を特定する。そして、会議端末装置2は、特定した識別情報をサーバ装置1に送信し、サーバ装置1が、この識別情報に対応するプロフィール情報をプロフィールデータベースから読み出す。
また、上記説明においては、2台の会議端末装置2を用いてテレビ会議を行う場合について説明したが、3台以上の会議端末装置2を用いてテレビ会議を行う場合においても、上記処理が適用可能であることは無論である。このとき、会議端末装置2においては、表示部25の画面を複数の表示エリアに分割し、各エリア毎に相手方の会議端末装置2からの撮像画像を図2に示すように表示させれば良い。
以上説明したように、本実施形態によれば、会議端末装置2の制御部21が、自己のカメラ26で撮影した会議参加者を画像上で特定するための識別情報を生成してサーバ装置1に送信し、プロフィール情報がプロフィール情報入力部30から入力された参加者に対して特定の動作をするよう画面表示や音声出力により指示し、特定の動作を行った参加者を識別情報に基づいて撮像画面上で特定して、この識別情報と入力されたプロフィール情報とをサーバ装置1に送信し、サーバ装置1の制御部11が、受信した識別情報とプロフィール情報とを関連付けてプロフィールデータベースに登録する。そして、会議がおこなわれているときには、会議端末装置2の制御部21が、自己のカメラ26で撮影した参加者の識別情報を生成して、撮像画像と生成した識別情報とをサーバ装置1に送信し、サーバ装置1の制御部11が、受信した識別情報でプロフィール情報を検索し、検索されたプロフィール情報がこれに対応する参加者の頭上で表示されるよう、撮像画像とプロフィール情報とを重ね合わせ合成し、合成された撮像画像を相手方の会議端末装置2に送信する。
従って、相手側の会議端末装置2の画面に、撮像画像上の参加者それぞれについてその撮像画像上の位置に対応した位置で参加者本人を特定するプロフィール情報が表示されるので、相手側の参加者は、画面に表示された参加者がたとえ初対面であってもその名前等の参加者に関する情報を知ることができる。
しかも、従来であれば、1台のカメラで複数の参加者を撮影する場合には、IPアドレスなどの会議端末に割り当てられた情報からでは、この複数の参加者を個別に特定することができないので、プロフィール情報を参加者毎に表示させることは困難であったが、本実施形態であれば、それを実現することができる。
また、会議端末装置2の制御部21が、撮像画像から各参加者の顔の画像を抽出することによって識別情報としての顔マスクを生成し、サーバ装置1の制御部11が、この識別情報に類似する識別情報が登録されていない新規の識別情報である場合に関連付けリクエストを会議端末装置2に送信し、会議端末装置2の制御部21が、新規の識別情報に対応する参加者について関連付け処理を行い、この処理の結果に基づいて会議端末装置2の制御部21が、識別情報とプロフィール情報とを関連付けて登録する。
従って、プロフィールデータベースに識別情報がまだ登録されていない参加者のみのプロフィール情報を入力すれば良いので、一度プロフィールを入力した参加者については、会議の度にプロフィールを入力する必要がない。
また、参加者の顔の特徴に基づいて撮像画像上における参加者の画像が特定されるので、参加者を容易に識別することができる。
また、会議端末装置2の制御部21が、特定の動作として参加者に「はい」と返事するよう指示し、撮像画像上で口を動かした参加者を特定するとともに、マイクロフォン27から入力された音声に基づいて、「はい」という音声が検出されたと判定した場合には、口を動かした参加者が「はい」と言ったと判定するので、特定の動作を行った参加者を適確に特定することができる。
また、会議端末装置2の制御部21が、参加者が口の形状が変化し始めたタイミングから、「はい」という音声の最初の音素が入力されたタイミングまでに経過した時間が所定値以下である場合に、口を動かした参加者が「はい」と言ったと判定するので、たとえ撮像画像上の参加者以外の誰かが「はい」と言ったとしても、その音声が入力されたタイミングと参加者が口を動かしたタイミングとが合わなければ、参加者が「はい」と言ったとは判定しないので、特定の動作を行った参加者を正確に特定することができる。
また、会議端末装置2の制御部21が、名刺や社員証などの画像をイメージスキャナーにより読み取らせたり、参加者本人を特定する情報が記録されたICカードなどからカードリーダーで情報を読み取らせるので、プロフィール情報を簡単に入力することができる。
なお、上記実施形態においては、テレビ会議の開始時からその参加者が全員揃っている場合について説明していたが、例えば、一部の参加者が会議の途中で参加する場合においても、この参加者のプロフィール情報を表示させることは可能である。例えば、会議中の処理において、会議端末装置2の顔認識により認識された参加者が増えた場合には、追加された参加者のみについて、参加者登録処理を行えば良い。ここで、途中で参加した人物のプロフィール情報が既に登録されていれば、このプロフィール情報が相手側の会議端末装置2の画面に表示され、プロフィール情報が未だ登録されていなかった場合には、プロフィール情報入力部30からプロフィール情報を入力することによって、このプロフィール情報が識別情報と関連付けて登録される。
また、上記実施形態においては、場所毎(拠点毎、部屋毎など)に、1台の会議端末装置2を設置した場合について説明したが、会議の参加者それぞれに1台ずつ会議端末装置2を割り当てた場合に対しても適用可能である。この場合においては、参加者各自がログイン操作を行わなくても、プロフィール情報を自己の画像とともに他の参加者が使用する会議端末装置2の画面に表示させることができる。また、たとえ使用する会議端末装置2を会議の度に変えたとしても、プロフィール情報を他の参加者が使用する会議端末装置2の画面に表示させることができる。
一実施形態に係る会議システムの概要構成の一例を示すブロック図である。 会議の参加者が撮影された撮像画像にプロフィール情報を合成した画像の画面表示例である。 撮影されている参加者のうちの1人が特定の動作を行った際の撮像画像の例であり、(a)は、参加者Bが挙手した例であり、(b)は、参加者Bが起立した例であり、(c)は、参加者Bが首を縦に振った例であり、(d)は、参加者Bが返事をした例である。 一実施形態に係るサーバ装置1の概要構成の一例を示すブロック図である。 一実施形態に係る会議端末装置2の概要構成の一例を示すブロック図である。 一実施形態に係る会議システムSの参加者登録処理における処理例を示すフローチャートである。 一実施形態に係る会議端末装置2の制御部21の関連付け処理における第1の処理例を示すフローチャートである。 一実施形態に係る会議端末装置2の制御部21の関連付け処理における第2の処理例を示すフローチャートである。 一実施形態に係る会議システムSの会議中における処理例を示すフローチャートである。
符号の説明
1 サーバ装置
2、2A、2B、2C 会議端末装置
11 制御部
12 記憶部
13 通信部
14 入出力部
15 表示部
16 操作部
17 システムバス
21 制御部
22 記憶部
23 通信部
24 入出力部
25 表示部
26 カメラ
27 マイクロフォン
28 スピーカ
29 操作部
30 プロフィール情報入力部
31 システムバス
NW ネットワーク
S 会議システム

Claims (12)

  1. 複数の会議装置を含み、前記会議装置により撮影された会議の参加者の撮影画像を通信手段を介して他の前記会議装置に送信し表示させる会議システムにおいて、前記参加者本人を特定するための参加者情報を含む前記撮影画像である参加者情報付撮影画像を生成する会議画像生成方法であって、
    前記撮影画像に基づいて、撮影された前記参加者を画像上で特定するための識別情報を生成する識別情報生成工程と、
    前記会議装置が備える入力手段を用いて入力された前記参加者情報を取得する参加者情報取得工程と、
    前記参加者情報が取得された前記参加者に対して所定動作をするよう指示する指示情報を当該参加者に対して提示する指示情報提示工程と、
    前記所定動作を行った前記参加者を前記撮影画像上で特定する所定動作者特定工程と、
    前記所定動作を行ったとして特定された前記参加者の前記識別情報と前記参加者情報とを対応付けて記憶手段に記憶させる記憶工程と、
    前記識別情報が記憶された前記参加者の画像を当該識別情報に基づいて前記撮影画像上で特定する参加者特定工程と、
    前記参加者特定工程において特定された前記参加者の前記識別情報に対応する前記参加者情報が前記撮影画像上において前記参加者の画像に対応して位置する前記参加者情報付撮影画像を生成する画像生成工程と、
    前記生成された参加者情報付撮影画像を前記他の会議装置に送信する送信工程と、
    を備えることを特徴とする会議画像生成方法。
  2. 請求項1に記載の会議画像生成方法において、
    前記撮影画像から前記参加者の画像を抽出する抽出工程と、
    前記識別情報生成工程において生成された前記識別情報と一致しまたは類似する前記識別情報が、前記参加者情報に対応付けて前記記憶手段に記憶されているか否かを判定する判定工程を更に備え、
    前記識別情報生成工程においては、抽出された前記参加者の画像に基づいて前記識別情報を生成し、
    前記判定工程において前記識別情報が記憶されていないと判定された前記参加者について、前記参加者情報取得工程、前記指示情報提示工程、前記所定動作者特定工程及び前記記憶工程を実行することを特徴とする会議画像生成方法。
  3. 請求項1または請求項2に記載の会議画像生成方法において、
    前記指示情報提示工程においては、予め定められた語を前記参加者に言わせる前記指示情報を提示し、
    前記所定動作者特定工程においては、
    前記撮影画像に基づいて、前記参加者の口の動きを検出し、
    前記会議装置が備える音声入力手段を用いて入力された前記参加者の音声に基づいて、前記参加者が発した語が前記予め定められた語であるか否かを判定し、
    前記参加者が発した語が前記予め定められた語である場合に、口を動かした前記参加者を、前記所定動作を行った参加者として特定することを特徴とする会議画像生成方法。
  4. 請求項3に記載の会議画像生成方法において、
    前記所定動作者特定工程においては、前記参加者が口を動かしたタイミングと、前記音声が入力されたタイミングと、の時間差が所定時間以下である場合に、口を動かした前記参加者が前記予め定められた語を発したと判定することを特徴とする会議画像生成方法。
  5. 請求項1乃至4の何れか1項に記載の会議画像生成方法において、
    前記識別情報生成工程においては、前記撮影画像に基づいて、撮影された前記参加者の顔の特徴を示す前記識別情報を生成することを特徴とする会議画像生成方法。
  6. 請求項1乃至5の何れか1項に記載の会議画像生成方法において、
    前記入力手段は、前記参加者本人を特定する情報が印刷された印刷物及び当該情報が記録された記録媒体の少なくとも何れか一方から当該情報を前記参加者情報として読み取ることを特徴とする会議画像生成方法。
  7. 請求項1乃至6の何れか1項に記載の会議画像生成方法において、
    前記指示情報提示工程においては、前記会議装置が、前記所定動作の指示を音声として出力し、または、当該指示を示す情報を表示することを特徴とする会議画像生成方法。
  8. 複数の会議装置を含み、前記会議装置により撮影された会議の参加者の撮影画像を通信手段を介して他の前記会議装置に送信し表示させる会議システムであって、
    前記撮影画像に基づいて、撮影された前記参加者を画像上で特定するための識別情報を生成する識別情報生成手段と、
    前記参加者本人を特定するための参加者情報を入力するために用いられる入力手段と、
    前記参加者情報が入力された前記参加者に対して所定動作をするよう指示する指示情報を当該参加者に対して提示する指示情報提示手段と、
    前記所定動作を行った前記参加者を前記撮影画像上で特定する所定動作者特定手段と、
    前記所定動作を行ったとして特定された前記参加者の前記識別情報と前記参加者情報とを対応付けて記憶手段に記憶させる記憶制御手段と、
    前記識別情報が記憶された前記参加者の画像を当該識別情報に基づいて前記撮影画像上で特定する参加者特定手段と、
    前記記憶された識別情報に基づいて、前記参加者の画像を前記撮影画像上で特定する参加者特定手段と、
    前記参加者特定手段により特定された前記参加者の前記識別情報に対応する前記参加者情報が前記撮影画像上において前記参加者の画像に対応して位置する前記撮影画像である参加者情報付撮影画像を生成する画像生成手段と、
    前記生成された参加者情報付撮影画像を前記他の会議装置に送信する送信手段と、
    を備えることを特徴とする会議システム。
  9. 複数の会議装置を含み、前記会議装置により撮影された会議の参加者の撮影画像を通信手段を介して他の前記会議装置に送信し表示させる会議システムにおいて、前記会議装置が前記通信手段を介して接続可能なサーバ装置であって、
    前記会議装置から送信された前記撮影画像を受信する撮影画像受信手段と、
    前記受信された撮影画像に基づいて、撮影された前記参加者を画像上で特定するための識別情報を生成する識別情報生成手段と、
    前記会議装置が備える入力手段を用いて入力された、前記参加者本人を特定するための参加者情報を当該会議装置から受信する参加者情報受信手段と、
    前記受信された参加者情報が入力された前記参加者に対して所定動作をするよう指示する要求を前記会議装置に送信する動作指示要求送信手段と、
    前記所定動作を行った前記参加者を前記撮影画像上で特定する所定動作者特定手段と、
    前記所定動作を行ったとして特定された前記参加者の前記識別情報と前記参加者情報とを対応付けて記憶手段に記憶させる記憶制御手段と、
    前記識別情報が記憶された前記参加者の画像を当該識別情報に基づいて前記撮影画像上で特定する参加者特定手段と、
    前記参加者特定手段により特定された前記参加者の前記識別情報に対応する前記参加者情報が前記撮影画像上において前記参加者の画像に対応して位置する前記撮影画像である参加者情報付撮影画像を生成する画像生成手段と、
    前記生成された参加者情報付撮影画像を前記他の会議装置に送信する送信手段と、
    を備えることを特徴とするサーバ装置。
  10. 複数の会議装置を含み、前記会議装置により撮影された会議の参加者の撮影画像を通信手段を介して他の前記会議装置に送信し表示させる会議システムにおいて、前記撮影画像を中継するサーバ装置と前記通信手段を介して接続可能な会議装置であって、
    前記参加者を撮影する撮影手段と、
    前記撮影手段による前記撮影画像に基づいて、撮影された前記参加者を画像上で特定するための識別情報を生成する識別情報生成手段と、
    前記参加者本人を特定するための参加者情報を入力するために用いられる入力手段と、
    前記参加者情報が入力された前記参加者に対して所定動作をするよう指示する指示情報を当該参加者に対して提示する指示情報提示手段と、
    前記所定動作を行った前記参加者を前記撮影手段による撮影画像上で特定する所定動作者特定手段と、
    前記所定動作を行ったとして特定された前記参加者の前記識別情報と前記参加者情報とを対応付けて前記サーバ装置に記憶させるよう、当該識別情報と当該参加者情報とを前記サーバ装置に送信する第1送信手段と、
    前記記憶された識別情報に基づいて、前記参加者の画像を前記撮影画像上で特定する参加者特定手段と、
    前記参加者特定手段により特定された前記参加者の前記識別情報に対応する前記参加者情報を前記撮影手段による前記撮影画像上において当該参加者の画像に対応して位置させた前記撮影画像である参加者情報付撮影画像を前記サーバ装置に生成させるよう、当該撮影画像と当該識別情報とを前記サーバ装置に送信する第2送信手段と、
    他の会議装置により撮影された前記撮影画像に基づいて生成された前記参加者情報付撮影画像を、前記サーバ装置から受信する撮影画像受信手段と、
    前記受信された参加者情報付撮影画像を表示する表示手段と、
    を備えることを特徴とする会議装置。
  11. コンピュータを、
    請求項9に記載のサーバ装置として機能させることを特徴とするサーバ装置処理プログラム。
  12. コンピュータを、
    請求項10に記載の会議装置として機能させることを特徴とする会議装置処理プログラム。
JP2008190751A 2008-07-24 2008-07-24 会議画像生成方法、会議システム、サーバ装置及び会議装置等 Pending JP2010028715A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008190751A JP2010028715A (ja) 2008-07-24 2008-07-24 会議画像生成方法、会議システム、サーバ装置及び会議装置等
PCT/JP2009/055416 WO2010010736A1 (ja) 2008-07-24 2009-03-19 会議画像生成方法、会議システム、サーバ装置及び会議装置等

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008190751A JP2010028715A (ja) 2008-07-24 2008-07-24 会議画像生成方法、会議システム、サーバ装置及び会議装置等

Publications (1)

Publication Number Publication Date
JP2010028715A true JP2010028715A (ja) 2010-02-04

Family

ID=41570204

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008190751A Pending JP2010028715A (ja) 2008-07-24 2008-07-24 会議画像生成方法、会議システム、サーバ装置及び会議装置等

Country Status (2)

Country Link
JP (1) JP2010028715A (ja)
WO (1) WO2010010736A1 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012023595A (ja) * 2010-07-15 2012-02-02 Konica Minolta Business Technologies Inc 会議システム
JP2013533526A (ja) * 2010-04-30 2013-08-22 アメリカン テレカンファレンシング サービシーズ リミテッド 会議ユーザインターフェースを提供するためのシステム、方法、及びコンピュータプログラム
KR20130116860A (ko) * 2010-10-07 2013-10-24 소니 주식회사 정보 처리 장치 및 정보 처리 방법
JP2014060551A (ja) * 2012-09-14 2014-04-03 Ricoh Co Ltd 伝送システム、伝送管理システムおよびプログラム
JP2016046636A (ja) * 2014-08-21 2016-04-04 日本電気株式会社 動作制御装置、動作制御方法、および動作制御プログラム
JP2020088489A (ja) * 2018-11-19 2020-06-04 株式会社リコー 通信システム、プログラム、端末装置
JP6929429B1 (ja) * 2020-11-04 2021-09-01 株式会社ブイキューブ 会議管理装置、会議管理方法及びプログラム

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6565409B2 (ja) * 2015-07-17 2019-08-28 沖電気工業株式会社 コミュニケーション支援装置、コミュニケーション支援方法およびプログラム
JP2022140997A (ja) 2021-03-15 2022-09-29 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム
CN114040145B (zh) * 2021-11-20 2022-10-21 深圳市音络科技有限公司 一种视频会议人像显示方法、系统、终端及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06121310A (ja) * 1992-10-05 1994-04-28 Ricoh Co Ltd テレビ会議装置
JP2004129071A (ja) * 2002-10-04 2004-04-22 Sony Corp 双方向コミュニケーションシステム
JP2006217183A (ja) * 2005-02-02 2006-08-17 Yamaha Corp マルチメディアデータを生成するためのデータ処理装置およびプログラム
JP2007087316A (ja) * 2005-09-26 2007-04-05 Oki Electric Ind Co Ltd 自動取引装置及び自動取引システム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0267889A (ja) * 1988-09-02 1990-03-07 Nippon Telegr & Teleph Corp <Ntt> 表示者同定通信会議システム
JPH09271006A (ja) * 1996-04-01 1997-10-14 Ricoh Co Ltd 多地点テレビ会議装置
JP4212274B2 (ja) * 2001-12-20 2009-01-21 シャープ株式会社 発言者識別装置及び該発言者識別装置を備えたテレビ会議システム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06121310A (ja) * 1992-10-05 1994-04-28 Ricoh Co Ltd テレビ会議装置
JP2004129071A (ja) * 2002-10-04 2004-04-22 Sony Corp 双方向コミュニケーションシステム
JP2006217183A (ja) * 2005-02-02 2006-08-17 Yamaha Corp マルチメディアデータを生成するためのデータ処理装置およびプログラム
JP2007087316A (ja) * 2005-09-26 2007-04-05 Oki Electric Ind Co Ltd 自動取引装置及び自動取引システム

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013533526A (ja) * 2010-04-30 2013-08-22 アメリカン テレカンファレンシング サービシーズ リミテッド 会議ユーザインターフェースを提供するためのシステム、方法、及びコンピュータプログラム
JP2012023595A (ja) * 2010-07-15 2012-02-02 Konica Minolta Business Technologies Inc 会議システム
KR20130116860A (ko) * 2010-10-07 2013-10-24 소니 주식회사 정보 처리 장치 및 정보 처리 방법
KR20190010733A (ko) * 2010-10-07 2019-01-30 소니 주식회사 정보 처리 장치 및 정보 처리 방법
KR102056031B1 (ko) 2010-10-07 2019-12-13 소니 주식회사 정보 처리 장치 및 정보 처리 방법
KR102091885B1 (ko) 2010-10-07 2020-03-20 소니 주식회사 정보 처리 장치 및 정보 처리 방법
JP2014060551A (ja) * 2012-09-14 2014-04-03 Ricoh Co Ltd 伝送システム、伝送管理システムおよびプログラム
JP2016046636A (ja) * 2014-08-21 2016-04-04 日本電気株式会社 動作制御装置、動作制御方法、および動作制御プログラム
JP2020088489A (ja) * 2018-11-19 2020-06-04 株式会社リコー 通信システム、プログラム、端末装置
JP6929429B1 (ja) * 2020-11-04 2021-09-01 株式会社ブイキューブ 会議管理装置、会議管理方法及びプログラム
WO2022097350A1 (ja) * 2020-11-04 2022-05-12 株式会社ブイキューブ 会議管理装置、会議管理方法及びプログラム
JP2022074344A (ja) * 2020-11-04 2022-05-18 株式会社ブイキューブ 会議管理装置、会議管理方法及びプログラム

Also Published As

Publication number Publication date
WO2010010736A1 (ja) 2010-01-28

Similar Documents

Publication Publication Date Title
WO2010010736A1 (ja) 会議画像生成方法、会議システム、サーバ装置及び会議装置等
JP5201050B2 (ja) 会議支援装置、会議支援方法、会議システム、会議支援プログラム
JP4474013B2 (ja) 情報処理装置
JP2002342759A (ja) 情報提供システム、情報提供方法、およびそのプログラム
CN109819400B (zh) 用户位置的查找方法、装置、设备及介质
JP5316248B2 (ja) テレビ会議装置、テレビ会議方法、そのプログラム
US20210105437A1 (en) Information processing device, information processing method, and storage medium
JP2019220848A (ja) データ処理装置、データ処理方法及びプログラム
JP2004129071A (ja) 双方向コミュニケーションシステム
EP2503545A1 (en) Arrangement and method relating to audio recognition
JP2018041231A (ja) 接客支援プログラム、接客支援方法、接客支援システムおよび情報処理装置
JP2007067972A (ja) 会議システム及び会議システムの制御方法
JP2007241130A (ja) 声紋認識を利用するシステムと装置
JPH07234694A (ja) 自動受付装置
JP2010109898A (ja) 撮影制御装置、撮影制御方法及びプログラム
JP7400886B2 (ja) ビデオ会議システム、ビデオ会議方法、およびプログラム
JP5217877B2 (ja) 会議支援装置
JP2018081662A (ja) 画像プリントシステム
JP2018041230A (ja) 受付支援プログラム、受付支援方法、受付支援システムおよび情報処理装置
US11184184B2 (en) Computer system, method for assisting in web conference speech, and program
JP6870274B2 (ja) 画像プリントシステム
JP7098561B2 (ja) 配信システム、配信システムの制御方法、プログラム
JP7110669B2 (ja) ビデオ会議システム、ビデオ会議方法、およびプログラム
JP2020115609A (ja) 音声録音装置及びその制御方法、並びにプログラム
JP7247466B2 (ja) 情報処理システムおよびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110310

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121218

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130409