JP2009089324A - テレビ会議システムおよびプログラム、記録媒体 - Google Patents

テレビ会議システムおよびプログラム、記録媒体 Download PDF

Info

Publication number
JP2009089324A
JP2009089324A JP2007259912A JP2007259912A JP2009089324A JP 2009089324 A JP2009089324 A JP 2009089324A JP 2007259912 A JP2007259912 A JP 2007259912A JP 2007259912 A JP2007259912 A JP 2007259912A JP 2009089324 A JP2009089324 A JP 2009089324A
Authority
JP
Japan
Prior art keywords
participant
conference room
video
conference
correspondence table
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007259912A
Other languages
English (en)
Inventor
Ushio Shibusawa
潮 渋沢
Hiroto Inagaki
博人 稲垣
Tomonari Fujita
智成 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2007259912A priority Critical patent/JP2009089324A/ja
Publication of JP2009089324A publication Critical patent/JP2009089324A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】遠隔地の参加者と会議室の参加者との顔向きを互いに一致させることができ、1対多人数のテレビ会議を円滑に進めることが可能なテレビ会議システムおよびプログラム、記録媒体を提供する。
【解決手段】画像と音声の情報の入出力を制御するための端末制御部10と、会議室参加者を撮影した映像から会議室に設置の映像表示装置に向いた会議室参加者の角度を特定して会議室参加者情報を作成するための会議室参加者情報作成部2と、撮影した映像における遠隔参加者が向いている相手の会議室参加者を特定して遠隔参加者情報を作成するための遠隔参加者情報作成部3と、遠隔参加者が向いている相手の会議室参加者の方向の角度と一致するように遠隔参加者の画像を画像変換するための遠隔参加者画像変換部4と、会議室参加者情報作成部2と、遠隔参加者情報作成部3と、遠隔参加者画像変換部4と、がそれぞれ作成した情報を記憶するための記憶装置5を備える。
【選択図】図1

Description

本発明は、遠隔地との間で映像と音声を伝達して会議を行うテレビ会議システムおよびプログラム、記録媒体に関する。
会議の参加者が遠隔地にいて、同じ会議室に集まることができない状況において、会議を行うことを可能にするテレビ会議システムが利用されている。テレビ会議システムは、相手の姿を映すモニタ、自分の姿を撮影するカメラ、音声を入力するマイク、音声を出力するスピーカおよびヘッドホン、映像および音声を遠隔地に伝達するための通信装置から構成されている。
テレビ会議システムの中には、これらの構成をすべて備えたものもあれば、構成の一部に外部機器を想定しているものもある。例えば、モニタを備えていないテレビ会議システムは、参加者が別に用意したモニタを接続して使うことを想定している。
近年では、専用のテレビ会議システム以外の機器でテレビ会議を行うことも可能になっている。ひとつには、遠隔地に離れた者同士が映像コミュニケーションを行うための、個人向けテレビ電話装置を用いることがある。また、PCにWebカメラ、マイク、ヘッドホンを接続して、テレビ会議ソフトウェアを用いてテレビ会議を行うことも可能である。個人向けテレビ電話装置やPCは、専用のテレビ会議システムよりも安価で供給されており、テレビ会議を経済的に行うことが可能となっている。
以上の背景から、テレビ会議の各拠点が、すべて同じ機器構成のテレビ会議システムを用いることは少なくなっており、各拠点が異なった機器を用いる形態が一般的になっている。
図14は、テレビ会議装置を利用して行う、1人対多人数のテレビ会議の様子の一例を示す図である。
この図14において、遠隔地と会議室の双方にテレビ会議装置が設置されている。遠隔側のテレビ会議装置TVCONF(1)において、撮像装置CAM(1)は遠隔参加者M(0)を撮影する。撮像装置によって撮影された遠隔側の映像はテレビ会議装置TVCONF(1)からネットワークを経由して、会議室参加者側のテレビ会議装置TVCONF(2)に送信される。
テレビ会議装置TVCONF(2)は受信した映像を映像表示装置MON(2)に表示する。また、会議室参加者側のテレビ電話装置TVCONF(2)において、撮像装置CAM(2)は会議室参加者M(1)、M(2)、M(3)の様子を撮影する。撮像装置CAM(2)によって撮影された会議室の映像は、テレビ会議装置TVCONF(2)からネットワークを経由して、遠隔参加者側のテレビ会議装置TVCONF(1)に送信される。遠隔参加者側のテレビ会議装置は受信した映像信号を表示ディスプレイMON(1)に表示する。以上の処理により、遠隔参加者M(0)と会議室参加者M(1)、M(2)、M(3)はお互いの様子を目視しながらコミュニケーションをとることができる。
ところで、上述のようなテレビ会議において、遠隔参加者と会議室参加者のうちの一人が会話をするとき、会議室参加者は、表示ディスプレイMON(2)に映し出された遠隔参加者を注視する。一方で、遠隔参加者は、表示ディスプレイMON(1)に表示された会議室参加者の中から、議論の相手である特定の1名を注視する。このとき、会議室参加者の姿は、表示ディスプレイMON(1)の画面サイズによって縮尺が変わるため、表示ディスプレイMON(1)に実寸で表示されることはまれである。このため、遠隔参加者が、会議室参加者を注視する顔の向きは、会議室におけるテレビ会議装置TVCONF(1)の位置から、実際に会議室参加者を見る場合の向きとずれてしまう。表示ディスプレイMON(2)には、会議室参加者の本来の向きとずれた方向を向いた遠隔参加者の顔画像が表示されるため、議論の相手となっている会議室参加者にとっては、遠隔参加者が自身を向いていないことに違和感が生まれ、会話が円滑に進められないという問題がある。
上記の問題点を解決するため、1対多のテレビ会議において、参加者同士の顔の向きを一致させる方法として、遠隔参加者の周囲を、会議室参加者の人数分の台数の撮像カメラと、撮像カメラと同数の表示スクリーンで取り囲む構成を採用している装置がある。この装置では表示スクリーン1枚につき1人の会議室参加者を表示し、また、表示スクリーンに対応して撮像カメラを配置している。これにより、遠隔参加者がどの会議室参加者に注視したときにも、遠隔参加者を正面から撮像した映像を会議室参加者に提供することができる(特許文献1参照)。
特開2005−328461
しかしながら、このような既存の装置では、遠隔参加者を取り囲む表示スクリーンを設置する空間を必要とするため現実的でない。また、多数の撮像カメラと表示スクリーンを必要とするため、不経済である。
本発明の目的は、遠隔地の参加者と会議室の参加者との顔向きを互いに一致させることができ、1対多人数のテレビ会議を円滑に進めることが可能なテレビ会議システムおよびプログラム、記録媒体を提供することにある。
上記課題を解決するために、本願発明のテレビ会議システムは、遠隔地に居る遠隔参加者と会議室に居る会議室参加者が画像と音声を情報通信網を介して会議を行うためのテレビ会議システムにおいて、前記画像と前記音声を入出力するための、入力装置と、撮像装置と、映像表示装置と、送受信装置と、が接続されて前記画像と前記音声の情報の入出力を制御するための端末制御部と、前記会議室参加者を撮影した映像から前記会議室に設置の前記映像表示装置に向いた前記会議室参加者の角度を特定して会議室参加者情報を作成するための会議室参加者情報作成部と、撮影した映像における前記遠隔参加者が向いている相手の前記会議室参加者を特定して遠隔参加者情報を作成するための遠隔参加者情報作成部と、前記遠隔参加者が向いている相手の前記会議室参加者の方向の角度と一致するように前記遠隔参加者の画像を画像変換するための遠隔参加者画像変換部と、前記会議室参加者情報作成部と、前記遠隔参加者情報作成部と、前記遠隔参加者画像変換部と、がそれぞれ作成した情報を記憶するための記憶装置と、を備える。
また、本願発明のテレビ会議システムの会議室参加者情報作成部は、前記撮像装置によって撮影された入力映像の1フレーム分の静止画像から前記会議室参加者のそれぞれに対応する画像領域を抽出するための発言対象領域抽出部と、会議室参加者・画像領域対応表に基づいて会議室参加者それぞれに対する前記撮像装置の焦点距離を求めるための発言対象焦点距離測定部と、前記会議室参加者・画像領域対応表に基づいて前記映像表示装置に対する前記会議室参加者ごとの方向の角度を発言対象角度として算出するための発言対象角度算出部と、を備える。
また、本願発明のテレビ会議システムの遠隔参加者情報作成部は、会議室参加者・画像領域対応表から正規化された画像領域を取得し、前記会議室側参加者を示す画像領域を作成して注視指示点を作成するための注視指示点作成部と、静止画像から顔特徴点を抽出するための顔特徴点抽出部と、参加者IDと、この参加者IDに対応する顔特徴点と、から顔特徴点・発言対象対応表を作成するための顔特徴点・発言対象対応表作成部と、正面顔特徴点に基づいて発言対象・目標顔特徴点対応表を作成するための目標顔特徴点作成部と、を備える。
また、本願発明のテレビ会議システムの遠隔参加者画像変換部は、入力された静止画像から目および口を顔特徴点として検出して顔特徴点・発言対象対応表を作成し出力するための顔特徴点抽出部と、前記顔特徴点・発言対象対応表から対象特徴点を取得して、入力顔特徴点と対象特徴点との類似度を比較し、もっとも類似度が高い前記対象特徴点をもつ発言対象を発言対象として特定するための発言対象特定部と、発言対象・目標顔特徴点対応表を取得して、発言対象の参加者IDに対応する目標顔特徴点を画像変換パラメタとして取得するための画像変換パラメタ作成部と、入力映像に対して平面射影変換行列を適用して得た出力映像を送信装置に出力するための画像変換部と、を備える。
また、本願発明のテレビ会議システムの記憶装置は、前記会議室参加者・角度対応表を記憶するための会議室参加者・角度対応表記憶部と、前記焦点距離・画角対応表を記憶するための焦点距離・画角対応表記憶部と、前記会議室参加者・画像領域対応表を記憶するための会議室参加者・画像領域対応表記憶部と、前記発言対象・目標顔特徴点対応表を記憶するための発言対象・目標顔特徴点対応表記憶部と、前記顔特徴点・発言対象対応表を記憶するための顔特徴点・発言対象対応表記憶部と、を備える。
また、本願発明のテレビ会議プログラムは、遠隔地に居る遠隔参加者と会議室に居る会議室参加者が画像と音声を情報通信網を介して会議を行うためにコンピュータにインストールして実行可能なテレビ会議プログラムであって、端末制御部において前記画像と前記音声を入出力するための、入力装置と、撮像装置と、映像表示装置と、送受信装置と、が接続されて前記画像と前記音声の情報の入出力を制御するステップと、会議室参加者情報作成部において前記会議室参加者を撮影した映像から前記会議室に設置の前記映像表示装置に向いた前記会議室参加者の角度を特定して会議室参加者情報を作成するステップと、遠隔参加者情報作成部において撮影した映像における前記遠隔参加者が向いている相手の前記会議室参加者を特定して遠隔参加者情報を作成するステップと、遠隔参加者画像変換部において前記遠隔参加者が向いている相手の前記会議室参加者の方向の角度と一致するように前記遠隔参加者の画像を画像変換するステップと、前記記憶装置において前記会議室参加者情報作成部と、前記遠隔参加者情報作成部と、前記遠隔参加者画像変換部と、がそれぞれ作成した情報を記憶するステップと、して前記コンピュータにおいて実行する。
また、本願発明のテレビ会議プログラムを記録した記録媒体は、請求項6に記載のテレビ会議プログラムを記録した記録媒体である。
本発明は、遠隔地の参加者と会議室の参加者との顔向きを互いに一致させることができ、1対多人数のテレビ会議を円滑に進めることが可能なテレビ会議システムおよびプログラム、記録媒体を提供することができる。
本発明では、遠隔参加者を撮影した映像から、遠隔参加者が発言の対象としている会議室参加者を特定する。そして、対象とする会議室参加者の本来の方向を向いているように、遠隔参加者の映像を変換し、会議室側のテレビ会議装置に表示する。画像認識と画像変換によって参加者の顔向きを一致させるため、大きな空間や大規模な設備を必要とせず、経済的に顔向きの一致を実現することができる。
本発明のテレビ会議装置を用いたテレビ会議の全体の流れについて説明する。まず、参加者は、自身が遠隔参加者か会議室参加者かを、テレビ会議装置に伝える。テレビ会議装置は、参加者の種類に応じて、顔向き一致を実現するために必要な準備を行う。そして、準備がすべて完了した後、テレビ会議を開始する。テレビ会議の最中は、遠隔参加者の映像に、画像認識と画像変換を行い、会議室参加者との顔向きを一致させる。
図1に本発明のテレビ会議システムの実施の形態に係る構成図を示す。この図1には、テレビ会議システムを構成するために、中央制御処理装置1と、記憶装置5と、中央制御処理装置1に接続された入力装置11と、撮像装置12と、映像表示装置13と、送受信装置14と、が示されている。
中央制御装置1は、端末制御部10と、会議室参加者情報作成部2と、遠隔参加者情報作成部3と、遠隔参加者画像変換部4と、から構成されている。会議室参加者情報作成部2は、発言対象領域抽出部21と、発言対象焦点距離測定部22と、発言対象角度算出部23と、から構成されている。また、遠隔参加者情報作成部3は、注視指示点作成部31と、顔特徴点抽出部32と、顔特徴点・発言対象対応表作成部33と、目標顔特徴点作成部34と、から構成されている。そして、遠隔参加者情報変換部4は、顔特徴点抽出部32と、発言対象特定部41と、画像変換パラメタ作成部42と、画像変換部43と、から構成されている。
記憶装置5は、会議室参加者・角度対応表記憶部51と、焦点距離・画角対応表記憶部52と、会議室参加者・画像領域対応表記憶部53と、発言対象・目標顔特徴点対応表記憶部54と、顔特徴点・発言対象対応表記憶部55と、から構成されている。
次に図1に示したテレビ会議システムの構成の各機能について、最初に記したテレビ会議の流れに沿って説明し、会議室参加者による会議室側のテレビ会議システムの設定手順と各機能部の処理内容も説明する。また、図1に示した構成について図11にその設定手順を示す。
図11において、ユーザが、入力装置11を用いて、自身が会議室参加者であることを伝える。入力装置11は、ユーザが会議室参加者であることを表す制御信号を、端末制御部10に出力する。
端末制御部10は、入力装置11から制御信号を受けて、テレビ会議装置の状態を「会議室・準備中」に更新する。端末制御部10は、端末の状態が「会議室・準備中」である間、会議室参加者情報作成部2が、端末制御部10を経由して、入力装置11、撮像装置12、映像表示装置13、送受信装置と情報をやりとりする。
以下、会議室参加者情報作成部2の処理を説明する。
会議室参加者情報作成部2は、撮像装置12によって撮影(S1)された入力映像を入力とし、入力映像の1フレーム分の静止画像を、発言対象領域抽出部21に出力する。
撮影に当たっては、会議室の状況が実際のテレビ会議中の状況になるべく近いことが望ましい。すなわち、参加者が着席しており、テレビ会議装置を注目している状態である。
入力映像は、複数のフレームによって構成される動画であり、各フレームは複数のピクセルによって構成される静止画像である。以降の処理は、1フレーム分の静止画像を想定している。
以下、発言対象領域抽出部21の処理を説明する。
発言対象領域抽出部21は、静止画像を入力として、会議室参加者・画像領域対応表を出力する(S3)。発言対象領域抽出部21は、静止画像中から、会議室参加者の画像領域r1、r2、r3を抽出する(S2)。画像領域は、左上座標(ltx、lty)と右下座標(rbx、rby)から構成される。
ここで、画像領域は、静止画像中から抽出した各会議室参加者の顔領域とする。静止画像から顔領域を抽出する方法には、空間周波数フィルタリングとサポートベクターマシンによる方法を用いる(例えば特開2006−293720参照)。入力される静止画像と画像領域の模式図を図2に示す。
画像領域は、顔領域に限らず、各会議室参加者を明確に区別できる構成であればよい。例えば、参加者が着席する以前の状態を背景画像として保持しておき、会議室参加者が各自の席に着いて静止した状態の映像との差分を求める。背景差分の画像から画像領域を抽出するという方法が考えられる。
以上によって、抽出された3人の画像領域の情報を、会議室参加者・画像領域対応表に記録する。会議室参加者・画像領域対応表の一例を図3に示す。
会議室参加者・画像領域対応表は、参加者ID、画像領域r、画像領域を静止画像の解像度で正規化した正規化画像領域r_reg、の3つの要素から構成される。参加者IDは、会議室参加者を区別するための識別番号である。本実施例では、画像領域のltxが小さい順に、01、02、03とする。以降、参加者IDにしたがって、会議室参加者を参加者01、参加者02、参加者03と呼ぶ。
そして、会議室参加者・画像領域対応表を会議室参加者・画像領域対応表記憶部53に記録し、発言対象焦点距離測定部22に出力する。
発言対象焦点距離測定部22は、会議室参加者・画像領域対応表を入力とし、会議室参加者・画像領域対応表と各画像領域に対する焦点距離を出力する。発言対象焦点距離測定部22は、会議室参加者・画像領域対応表をもとに、会議室参加者それぞれに対する、撮像装置12の焦点距離を求める(S4)。焦点距離の求め方には、画像のコントラスト値を用いた方法を用いる。具体的には、画像領域r、焦点距離fにおけるコントラスト値をC(r、f)とするとき、fの値を変化させて、コントラスト値C(r、f)が最大になるときのfを、画像領域rに対する焦点距離fp_rとみなす。この方式は、「山登り方式」と呼称される。
これを、画像領域r1、r2、r3それぞれについて行い、焦点距離fp_r1、fp_r2、fp_r3を得る。そして、それぞれの焦点距離と、会議室参加者・画像領域対応表を、発言対象角度算出部23に出力する。
以下、発言対象角度算出部23の処理を説明する。
発言対象角度算出部23は、焦点距離と、会議室参加者・画像領域対応表とを入力とし、会議室参加者・角度対応表を出力する。発言対象角度算出部23は、テレビ会議装置に対する会議室参加者ごとの方向の角度を算出する。この角度を発言対象角度と呼ぶ。本実施例では、x軸方向の角度のみを算出し、後述の画像変換に利用する。もちろん、y軸方向の角度を算出することもできるが、本実施例ではy軸方向の角度は画像変換に利用しない。
以下、参加者01について、発言対象角度を算出する例について説明する。まず、焦点距離・画角対応表記憶部52に記憶された焦点距離・画角対応表から、焦点距離fp_r1に対応する撮像装置12の画角を取得する。焦点距離・画角対応表の例を図4に示す。
このとき、テレビ会議装置70と、参加者01の位置関係の模式図を図5に示す。
図5において、αは撮像装置12の画角である。xc_01は画像領域r1のx軸中心であり、
Figure 2009089324
で求める。Xは入力画像のx軸方向の解像度である。θ_01はテレビ会議装置に対する参加者01の発言対象角度である。
このとき、テレビ会議装置と発言対象の間に、図6に示すような直角三角形SABとSACの存在を仮定して、発言対象角度を求める(S5)。
以下に、図6に沿って、発言対象角度θを求める手順を説明する。
図6における斜辺SBの長さLを求める。正弦定理より、Lは
Figure 2009089324
と表される。次に、図6における対辺SAの長さMを求める。Mは三平方の定理より、
Figure 2009089324
と表される。そして、対辺SAと対辺ACより、発言対象角度θ_01を求める。
対辺ACの長さNは、
Figure 2009089324
であるから、発言対象角度θ_01は、
Figure 2009089324
と、算出される。ここで、会議室参加者がテレビ会議装置から見て、左側に位置するとき、θの代わりに−θを対応表に記録する。具体的には、
Figure 2009089324
のとき、θ=−θとする。
以降、同様に、参加者02、参加者03についても発言対象角度θ_02、θ_03を算出する(S6)。
以上より算出された、発言対象角度を、会議室参加者・角度対応表に記録する(S7)。発言対象・角度対応表の例を図7に示す。
最後に、会議室参加者・角度対応表は、会議室参加者・角度対応表記憶部51に記録し、会議室参加者情報の作成が完了したことを通知する制御信号を、端末制御部10に出力する。
端末制御部10は、発言対象角度作成部からの制御信号を入力とし、会議室側テレビ会議装置の状態を「会議室・準備完了」に更新する。
このとき、会議室参加者・画像領域対応表と、会議室参加者・角度対応表を送信装置に出力する。そして、送信装置は、会議室参加者・画像領域対応表と、会議室参加者・角度対応表を、遠隔側テレビ会議装置の受信装置に送信する。
以後、撮像装置12は、撮影した入力映像を送信装置に出力する。
送信装置は、入力映像を遠隔側テレビ会議装置の受信装置に送信する(S8)。
受信装置は、遠隔側テレビ会議装置の送信装置から出力された映像信号を受信し、映像表示装置13に出力する。
以下、遠隔参加者による遠隔側テレビ会議装置の設定手順と各機能部の処理内容を説明する。図12に遠隔側テレビ会議の設定手順を示す。
ユーザが、入力装置11を用いて、自身が遠隔参加者であることを伝えると、入力装置11は端末制御部10にユーザが遠隔参加者であることを表す制御信号を出力する。
端末制御部10は、入力装置11から制御信号を受けて、テレビ会議装置の状態を「遠隔・準備中」に更新する。端末制御部10は、端末の状態が「遠隔・準備中」である間、遠隔参加者情報作成部3に制御を移す。すなわち、遠隔参加者情報作成部3は、端末制御部10を経由して入力装置11、撮像装置12、映像表示装置13、送受信装置と情報をやりとりする。
このとき、受信装置は、会議室側テレビ会議装置から送信される、会議室参加者・画像領域対応表と、会議室参加者・角度対応表を入力とし、会議室参加者・画像領域対応表記憶部53と、会議室参加者・角度対応表記憶部51にそれぞれ記録する。
以降、受信装置は、会議室側テレビ会議装置から送信された、映像信号を入力とし、端末制御部10に映像信号を出力する。
以下、遠隔参加者情報作成部3の処理を説明する。
まず、遠隔作成者情報作成部は、撮影された遠隔参加者の映像から、発言対象となる会議室参加者を特定するための、顔特徴点・発言対象対応表を作成する。
以下、顔特徴点・発言対象対応表を作成する処理を説明する。
端末制御部10は、受信装置から出力された会議室側テレビ会議装置の映像信号を、映像表示装置13に出力する。
注視指示点作成部31は、会議室参加者・画像領域対応表記憶部53から、会議室参加者・画像領域対応表を取得する(S16)。そして、会議室参加者・画像領域対応表から、正規化された画像領域r_reg01を取得する。遠隔側テレビ会議装置の映像表示装置13の解像度をr_reg01に乗算することで、遠隔側テレビ会議装置の映像表示装置13にあわせて、参加者01を示す画像領域を作成することができる。そして、参加者01の注視指示点01を作成し、映像表示装置13に出力する(S17)。注視指示点は、画像領域の中心であってもいいし、画像領域の枠であってもいい。このとき、映像表示装置13には、会議室参加者を撮影した映像と、注視指示点が重畳されて表示される。
遠隔参加者は、注視指示点01に対して注視する(S18)。端末制御部10は、注視指示点01を注視しているときの遠隔参加者を、撮像装置12で撮影し、静止画像を抽出する(S19)。静止画像を抽出するタイミングは、セルフタイマーのように、テレビ会議装置が自動で取得してもよいし、遠隔参加者が入力装置11を用いてテレビ会議装置に撮影を指示してもよい。
以降、参加者02、参加者03についても同様に、画像領域r_reg02、r_reg03から算出した注視指示点02、注視指示点03を表示し、遠隔参加者を撮影する。そして、各注視指示点が対応する参加者IDと、そのときの遠隔参加者の静止画像とを、顔特徴点抽出部32に出力する(S20)。
顔特徴点抽出部32は、静止画像と、参加者IDを入力とし、顔特徴点・発言対象対応表を出力する(S21)。
顔特徴点抽出部32は、静止画像から顔特徴点を抽出する。顔特徴点抽出部32は、左目、右目、口を、矩形領域として抽出する。顔を撮影した静止画像から、目および口を検出する手法としては、テンプレートマッチングを用いる。
顔特徴点は、左目、右目、口それぞれを検出した矩形領域の左上座標と右下座標から構成される。左目の矩形領域は、左上座標le_lt(ltx_le、lty_le)、右下座標le_rb(rbx_le、rby_le)からなる。右目の矩形領域は左上座標re_lt(ltx_re、lty_re)と右下座標re_rb(rbx_re、rby_re)からなる。口の矩形領域は左上座標m_lt(ltx_m、lty_m)と右下座標m_rb(rbx_m、rby_m)からなる。これらをすべてまとめて顔特徴点と呼ぶ。
以降、それぞれの参加者IDに対応する顔特徴点を対象特徴点と呼ぶ。対象特徴点は、発言対象ごとに対象特徴点01、対象特徴点02、対象特徴点03と呼ぶ。
顔特徴点抽出部32は、参加者IDと、IDに対応する顔特徴点を、顔特徴点・発言対象対応表作成部33に出力する。
顔特徴点・発言対象対応表作成部33は、参加者IDと、IDに対応する顔特徴点を入力とし、顔特徴点・発言対象対応表を作成する。図8に顔特徴点・発言対象対応表の一例を示す。
最後に、顔特徴点・発言対象対応表を顔特徴点・発言対象対応表記憶部55に記録し、顔特徴点・発言対象対応表の作成を完了したことを示す制御信号を、端末制御部10に出力する。
次に、遠隔作成者情報作成部は、遠隔参加者の画像を変換するための、発言対象・目標顔特徴点対応表を作成する。
以下、発言対象・目標顔特徴点対応表を作成する処理を説明する。
端末制御部10は、撮像装置12によって、遠隔参加者を撮影した映像信号を、映像表示装置13に出力する。
遠隔作成者情報作成部は、目標顔特徴点を作成することを示す制御信号を、注視指示点作成部31に出力する。
注視指示点作成部31は、制御信号を入力とし、映像表示装置13の正面を注視するための注視指示点を作成する。作成された注視指示点を、映像表示装置13に出力する。このとき、映像表示装置13には、遠隔参加者を撮影した映像と、注視指示点が重畳されて表示される。
遠隔参加者は、映像表示装置13の中央に表示された注視指示点を注視する(S10)。端末制御部10は、注視指示点を注視しているときの遠隔参加者の映像を、撮像装置12から取得し(S11)、静止画像を抽出する。端末制御部10は、このときの静止画像を、顔特徴点抽出部32に出力する。
顔特徴点抽出部32は、静止画像を入力とし、顔特徴点を抽出し、目標顔特徴点作成部34に出力する(S12)。このときの顔特徴点を、以降、正面顔特徴点と呼ぶ。
目標顔特徴点作成部34は、正面顔特徴点を入力とし、発言対象・目標顔特徴点対応表を作成する。正面顔特徴点をsとする。会議室参加者・角度対応表(S13)から、参加者01の発言対象角度θ_01を取得する。
正面顔特徴点を3次元の同次座標に変換する。このとき、zはすべての特徴点で同じ値を持つ。具体的には、入力画像のx軸解像度をXとしたとき、z=−Xとする。例えば、左目の左上座標le_ltは(ltx_le、lty_le、−X、1)と表される。同様に、残りの特徴点を、3次元の同次座標に変換する。このときの正面顔特徴点をs’とする。次に、各特徴点に、以下の行列R_yを乗算する。これは、3次元空間の特徴点をy軸方向にθ_01回転させることを表す。
Figure 2009089324
そして回転行列Ryを適用した乗算後の特徴点s’からx座標とy座標のみを取り出し、目標特徴点d_01とする。図9に、正面顔特徴点sと目標顔特徴点d_01と発言対象角度θ_01の関係を表す模式図を示す。
以降、参加者02、参加者03についても同様に、正面顔特徴点sと発言対象角度θ_02、θ_03から、目標顔特徴点d_02、d_03を算出する(S14)。
以上より、参加者IDと目標顔特徴点から、発言対象・目標顔特徴点対応表を作成する(S15)。図10に発言対象・目標顔特徴点対応表の例を示す。
発言対象・目標顔特徴点対応表を、発言対象・目標顔特徴点対応表記憶部54に記録し、遠隔参加者情報の作成が完了したことを通知する制御信号を、端末制御部10に出力する。
端末制御部10は、制御信号を入力とし、遠隔側テレビ会議装置の状態を「遠隔側・準備完了」に更新する。
以降、端末制御部10は、撮像装置12で遠隔参加者を撮影した入力映像を、遠隔参加者画像変換部4に出力する。遠隔参加者画像変換部4は、入力映像に画像変換を行い、変換後の映像を送信装置に出力する。送信装置は、変換後映像を入力とし、遠隔側テレビ会議装置の受信装置に送信する。受信装置は、会議室側テレビ会議装置の送信装置から出力された映像信号を受信し、映像表示装置13に出力する。
以下、テレビ会議中に動作する、遠隔参加者画像変換部4の処理内容を説明する。図13にテレビ会議中の遠隔側テレビ会議装置の処理の流れを示す。
遠隔参加者画像変換部4は、入力映像を入力とし、顔特徴点抽出部32と、画像変換部43に、入力映像を出力する(S30)。
顔特徴点抽出部32は、入力映像を入力とし、入力映像から顔特徴点を抽出する(S31)。以降、このときの顔特徴点を、入力顔特徴点と呼ぶ。顔特徴点抽出部32は、入力顔特徴点を発言対象特徴部に出力する。
発言対象特定部41は、入力顔特徴点を入力とし、顔特徴点・発言対象対応表から発言対象を特定し、入力顔特徴点と発言対象を表す参加者IDを、画像変換パラメタ作成部42に出力する。
以下、発言対象を特定する方法を説明する。
発言対象特定部41は、顔特徴点・発言対象対応表記憶部55から、対象特徴点を取得する。発言対象特徴部は、入力顔特徴点と、各対象特徴点との類似度を比較し、もっとも類似度が高い対象特徴点をもつ発言対象を、遠隔参加者の現在の発言対象とみなす(S32)。
以下、類似度の算出方法を説明する。まず、入力顔特徴点の左目、右目、口の左上座標、右上座標をすべて連結して、1次元ベクトルv_inputに変換する。同様に、それぞれの対象特徴点を1次元ベクトルv_t01、v_t02、v_t03に変換する。v_inputとv_t01、v_t02とv_t03について、コサイン類似度cos(v_input、v_t01)、cos(v_input、v_t02)、cos(v_input、v_t03)を算出する。そして、コサイン類似度がもっとも高い発言対象を選択する。
画像変換パラメタ作成部42は、入力顔特徴点と参加者IDを入力とし、入力画像を射影変換する射影変換行列を画像変換部43に出力する。
画像変換パラメタ作成部42は、発言対象・目標顔特徴点対応表記憶部54から発言対象・目標顔特徴点対応表を取得する。そして、発言対象の参加者IDに対応する目標顔特徴点dを取得する(S33)。入力顔特徴点sと、目標顔特徴点dは、それぞれ6つの2次元座標点から構成されており、その上、各点同士の対応がわかっていることから、公知の幾何学処理を用いて、入力映像を変換する平面射影変換行列を算出できる。そして、平面射影変換行列を画像変換部43に出力する(S34、S35)。
画像変換部43は、入力映像と平面射影変換行列を入力とし、入力映像に対して平面射影変換行列を適用し、出力映像を得る。そして、出力映像を送信装置に出力する(S36)。
以上より、遠隔参加者画像変換部4は、遠隔参加者を撮影した入力映像から、会議室側の発言対象を特定し、入力映像を変換し、会議室側テレビ会議装置に送信する。
以上説明した本発明のテレビ会議システムの実施の形態に開示された構成は、それぞれの各構成の動作および作用について、これをコンピュータ上で実行されるコンピュータプログラムに置き換えることもできる。各構成をそれぞれ情報処理のステップとしてコンピュータ上にて実行し、その結果としてテレビ会議システムを実現することができる。
さらに、コンピュータプログラムとすることにより、これらの構成を一元にまとめることなく、たとえば相互にネットワークで接続された複数のサーバに各構成を実現するためのコンピュータプログラムをインストールして、ネットワークで結ばれたサーバ同士の連係動作によりテレビ会議システムを実現することもできる。
また、テレビ会議システムを実現するためのコンピュータプログラムを光磁気ディスクや記憶素子などの記録媒体、あるいはネットワーク上のサーバが備える記録媒体に記録させ、流通させることもできる。この流通形態としては、物理的な光磁気ディスクや記憶素子などに記録した形で流通させてもよく、あるいはサーバからネットワークを介してダウンロードさせてもよい。
以上説明した実施の形態によれば、遠隔地の参加者と会議室の参加者との顔向きを互いに一致させることができ、1対多人数のテレビ会議を円滑に進めることが可能なテレビ会議システムおよびプログラム、記録媒体を提供することができる。
本発明のテレビ会議システムの実施の形態の構成図を示す。 実施の形態に係る、静止画像と画像領域の模式図を示す。 実施の形態に係る、会議室参加者・画像領域対応表の一例を示す。 実施の形態に係る、焦点距離・画角対応表の一例を示す。 テレビ会議装置と参加者の位置関係の模式図を示す。 実施の形態に係る、発言対象角度を求めるための直角三角形SABとSACの存在の仮想図を示す。 実施の形態に係る、発言対象・角度対応表の一例を示す。 実施の形態に係る、顔特徴点・発言対象対応表の一例を示す。 正面顔特徴点sと目標顔特徴点d_01と発言対象角度θ_01の関係を表す模式図を示す。 実施の形態に係る、発言対象・目標顔特徴点対応表の一例を示す。 会議室参加者による会議室側のテレビ会議システムの設定手順を説明するためのフロー図を示す。 遠隔参加者による遠隔側テレビ会議装置の設定手順を説明するためのフロー図を示す。 テレビ会議中の遠隔側テレビ会議装置の処理を説明するためのフロー図を示す。 従来技術における、テレビ会議装置を利用した1人対多人数のテレビ会議の一例を示す。
符号の説明
1…中央制御処理装置
2…会議室参加者情報作成部
3…遠隔参加者情報作成部
4…遠隔参加者画像変換部
5…記憶装置
10…端末制御部
11…入力装置
12…撮像装置
13…映像表示装置
14…送受信装置
21…発言対象領域抽出部
22…発言対象焦点距離測定部
23…発言対象角度算出部
31…注視指示点作成部
32…顔特徴点抽出部
33…顔特徴点・発言対象対応表作成部
34…目標顔特徴点作成部
41…発言対象特定部
42…画像変換パラメタ作成部
43…画像変換部
51…会議室参加者・角度対応表記憶部
52…焦点距離・画角対応表記憶部
53…会議室参加者・画像領域対応表記憶部
54…発言対象・目標顔特徴点対応表記憶部
55…顔特徴点・発言対象対応表記憶部

Claims (7)

  1. 遠隔地に居る遠隔参加者と会議室に居る会議室参加者が画像と音声を情報通信網を介して会議を行うためのテレビ会議システムにおいて、
    前記画像と前記音声を入出力するための、入力装置と、撮像装置と、映像表示装置と、送受信装置と、が接続されて前記画像と前記音声の情報の入出力を制御するための端末制御部と、
    前記会議室参加者を撮影した映像から前記会議室に設置の前記映像表示装置に向いた前記会議室参加者の角度を特定して会議室参加者情報を作成するための会議室参加者情報作成部と、
    撮影した映像における前記遠隔参加者が向いている相手の前記会議室参加者を特定して遠隔参加者情報を作成するための遠隔参加者情報作成部と、
    前記遠隔参加者が向いている相手の前記会議室参加者の方向の角度と一致するように前記遠隔参加者の画像を画像変換するための遠隔参加者画像変換部と、
    前記会議室参加者情報作成部と、前記遠隔参加者情報作成部と、前記遠隔参加者画像変換部と、がそれぞれ作成した情報を記憶するための記憶装置と、
    を備えることを特徴とするテレビ会議システム。
  2. 前記会議室参加者情報作成部は、
    前記撮像装置によって撮影された入力映像の1フレーム分の静止画像から前記会議室参加者のそれぞれに対応する画像領域を抽出するための発言対象領域抽出部と、
    会議室参加者・画像領域対応表に基づいて会議室参加者それぞれに対する前記撮像装置の焦点距離を求めるための発言対象焦点距離測定部と、
    前記会議室参加者・画像領域対応表に基づいて前記映像表示装置に対する前記会議室参加者ごとの方向の角度を発言対象角度として算出するための発言対象角度算出部と、
    を備えることを特徴とする請求項1に記載のテレビ会議システム。
  3. 前記遠隔参加者情報作成部は、
    会議室参加者・画像領域対応表から正規化された画像領域を取得し、前記会議室側参加者を示す画像領域を作成して注視指示点を作成するための注視指示点作成部と、
    静止画像から顔特徴点を抽出するための顔特徴点抽出部と、
    参加者IDと、この参加者IDに対応する顔特徴点と、から顔特徴点・発言対象対応表を作成するための顔特徴点・発言対象対応表作成部と、
    正面顔特徴点に基づいて発言対象・目標顔特徴点対応表を作成するための目標顔特徴点作成部と、
    を備えることを特徴とする請求項1または2に記載のテレビ会議システム。
  4. 前記遠隔参加者画像変換部は、
    入力された静止画像から目および口を顔特徴点として検出して顔特徴点・発言対象対応表を作成し出力するための顔特徴点抽出部と、
    前記顔特徴点・発言対象対応表から対象特徴点を取得して、入力顔特徴点と対象特徴点との類似度を比較し、もっとも類似度が高い前記対象特徴点をもつ発言対象を発言対象として特定するための発言対象特定部と、
    発言対象・目標顔特徴点対応表を取得して、発言対象の参加者IDに対応する目標顔特徴点を画像変換パラメタとして取得するための画像変換パラメタ作成部と、
    入力映像に対して平面射影変換行列を適用して得た出力映像を送信装置に出力するための画像変換部と、
    を備えることを特徴とする請求項1〜3のいずれかに記載のテレビ会議システム。
  5. 前記記憶装置は、
    前記会議室参加者・角度対応表を記憶するための会議室参加者・角度対応表記憶部と、
    前記焦点距離・画角対応表を記憶するための焦点距離・画角対応表記憶部と、
    前記会議室参加者・画像領域対応表を記憶するための会議室参加者・画像領域対応表記憶部と、
    前記発言対象・目標顔特徴点対応表を記憶するための発言対象・目標顔特徴点対応表記憶部と、
    前記顔特徴点・発言対象対応表を記憶するための顔特徴点・発言対象対応表記憶部と、
    を備えることを特徴とする請求項1〜4のいずれかに記載のテレビ会議システム。
  6. 遠隔地に居る遠隔参加者と会議室に居る会議室参加者が画像と音声を情報通信網を介して会議を行うためにコンピュータにインストールして実行可能なテレビ会議プログラムであって、
    端末制御部において前記画像と前記音声を入出力するための、入力装置と、撮像装置と、映像表示装置と、送受信装置と、が接続されて前記画像と前記音声の情報の入出力を制御するステップと、
    会議室参加者情報作成部において前記会議室参加者を撮影した映像から前記会議室に設置の前記映像表示装置に向いた前記会議室参加者の角度を特定して会議室参加者情報を作成するステップと、
    遠隔参加者情報作成部において撮影した映像における前記遠隔参加者が向いている相手の前記会議室参加者を特定して遠隔参加者情報を作成するステップと、
    遠隔参加者画像変換部において前記遠隔参加者が向いている相手の前記会議室参加者の方向の角度と一致するように前記遠隔参加者の画像を画像変換するステップと、
    前記記憶装置において前記会議室参加者情報作成部と、前記遠隔参加者情報作成部と、前記遠隔参加者画像変換部と、がそれぞれ作成した情報を記憶するステップと、
    して前記コンピュータにおいて実行することを特徴とするテレビ会議プログラム。
  7. 請求項6に記載のテレビ会議プログラムを記録した記録媒体。
JP2007259912A 2007-10-03 2007-10-03 テレビ会議システムおよびプログラム、記録媒体 Pending JP2009089324A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007259912A JP2009089324A (ja) 2007-10-03 2007-10-03 テレビ会議システムおよびプログラム、記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007259912A JP2009089324A (ja) 2007-10-03 2007-10-03 テレビ会議システムおよびプログラム、記録媒体

Publications (1)

Publication Number Publication Date
JP2009089324A true JP2009089324A (ja) 2009-04-23

Family

ID=40662059

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007259912A Pending JP2009089324A (ja) 2007-10-03 2007-10-03 テレビ会議システムおよびプログラム、記録媒体

Country Status (1)

Country Link
JP (1) JP2009089324A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011242458A (ja) * 2010-05-14 2011-12-01 Nippon Telegr & Teleph Corp <Ntt> 表示装置および表示方法
WO2013014872A1 (ja) * 2011-07-25 2013-01-31 パナソニック株式会社 画像変換装置、カメラ、映像システム、画像変換方法およびプログラムを記録した記録媒体
CN104767963A (zh) * 2015-03-27 2015-07-08 华为技术有限公司 视频会议中的与会人信息呈现方法和装置
US9131109B2 (en) 2013-03-11 2015-09-08 Ricoh Company, Limited Information processing device, display control system, and computer program product
US9445052B2 (en) 2011-08-31 2016-09-13 Hewlett-Packard Development Company, L.P. Defining a layout for displaying images
JP2017130046A (ja) * 2016-01-20 2017-07-27 日本電信電話株式会社 視線一致顔画像合成方法、テレビ会議システム、及びプログラム
CN107592492A (zh) * 2017-09-06 2018-01-16 维沃移动通信有限公司 一种视频流显示方法及移动终端
JP2018046464A (ja) * 2016-09-15 2018-03-22 日本電信電話株式会社 視線一致顔画像合成方法、テレビ会議システム、及びプログラム
JP2018046463A (ja) * 2016-09-15 2018-03-22 日本電信電話株式会社 視線一致顔画像合成方法、テレビ会議システム、及びプログラム

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011242458A (ja) * 2010-05-14 2011-12-01 Nippon Telegr & Teleph Corp <Ntt> 表示装置および表示方法
WO2013014872A1 (ja) * 2011-07-25 2013-01-31 パナソニック株式会社 画像変換装置、カメラ、映像システム、画像変換方法およびプログラムを記録した記録媒体
US20140168375A1 (en) * 2011-07-25 2014-06-19 Panasonic Corporation Image conversion device, camera, video system, image conversion method and recording medium recording a program
JPWO2013014872A1 (ja) * 2011-07-25 2015-02-23 パナソニック株式会社 画像変換装置、カメラ、映像システム、画像変換方法およびプログラムを記録した記録媒体
US9445052B2 (en) 2011-08-31 2016-09-13 Hewlett-Packard Development Company, L.P. Defining a layout for displaying images
US9131109B2 (en) 2013-03-11 2015-09-08 Ricoh Company, Limited Information processing device, display control system, and computer program product
CN104767963A (zh) * 2015-03-27 2015-07-08 华为技术有限公司 视频会议中的与会人信息呈现方法和装置
CN104767963B (zh) * 2015-03-27 2018-10-09 华为技术有限公司 视频会议中的与会人信息呈现方法和装置
JP2017130046A (ja) * 2016-01-20 2017-07-27 日本電信電話株式会社 視線一致顔画像合成方法、テレビ会議システム、及びプログラム
JP2018046464A (ja) * 2016-09-15 2018-03-22 日本電信電話株式会社 視線一致顔画像合成方法、テレビ会議システム、及びプログラム
JP2018046463A (ja) * 2016-09-15 2018-03-22 日本電信電話株式会社 視線一致顔画像合成方法、テレビ会議システム、及びプログラム
CN107592492A (zh) * 2017-09-06 2018-01-16 维沃移动通信有限公司 一种视频流显示方法及移动终端

Similar Documents

Publication Publication Date Title
JP2009089324A (ja) テレビ会議システムおよびプログラム、記録媒体
US11089266B2 (en) Communication processing method, terminal, and storage medium
EP3358835B1 (en) Improved method and system for video conferences with hmds
US8749607B2 (en) Face equalization in video conferencing
JP4144492B2 (ja) 画像表示装置
US11076127B1 (en) System and method for automatically framing conversations in a meeting or a video conference
JPWO2015186519A1 (ja) 画像処理装置及び画像表示装置
JP2014165565A (ja) テレビ会議装置およびシステムおよび方法
JP5963006B2 (ja) 画像変換装置、カメラ、映像システム、画像変換方法およびプログラムを記録した記録媒体
US10979666B2 (en) Asymmetric video conferencing system and method
WO2017141584A1 (ja) 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム
EP3465631B1 (en) Capturing and rendering information involving a virtual environment
TWI615808B (zh) 全景即時影像處理方法
US7986336B2 (en) Image capture apparatus with indicator
WO2015089944A1 (zh) 一种处理视频会议画面的方法、装置及会议终端
JP2022054192A (ja) リモート会議システム、サーバ、写真撮影装置、音声出力方法、及びプログラム
JP2005142765A (ja) 撮像装置及び方法
JP2010004480A (ja) 撮像装置、その制御方法及びプログラム
WO2014208169A1 (ja) 情報処理装置、制御方法、プログラム、および記憶媒体
JP2005328461A (ja) テレビ会議装置及び多地点テレビ会議システム
JP2002262138A (ja) 撮像システム、テレビ会議システム、監視システムおよび撮像機能を有した情報端末機器
US20230306618A1 (en) Tracking with Multiple Cameras
JP2017092815A (ja) 画像表示システム、画像表示方法、および画像表示プログラム
JP2022092747A (ja) 表示画像処理システム及び表示画像処理装置
JP2024033276A (ja) 通信システム、情報処理システム、動画作成方法、プログラム