JP2022092747A - 表示画像処理システム及び表示画像処理装置 - Google Patents

表示画像処理システム及び表示画像処理装置 Download PDF

Info

Publication number
JP2022092747A
JP2022092747A JP2020205631A JP2020205631A JP2022092747A JP 2022092747 A JP2022092747 A JP 2022092747A JP 2020205631 A JP2020205631 A JP 2020205631A JP 2020205631 A JP2020205631 A JP 2020205631A JP 2022092747 A JP2022092747 A JP 2022092747A
Authority
JP
Japan
Prior art keywords
image
display
display screen
user
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020205631A
Other languages
English (en)
Inventor
知樹 坂
Tomoki Saka
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kanazawa Institute of Technology (KIT)
Original Assignee
Kanazawa Institute of Technology (KIT)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kanazawa Institute of Technology (KIT) filed Critical Kanazawa Institute of Technology (KIT)
Priority to JP2020205631A priority Critical patent/JP2022092747A/ja
Publication of JP2022092747A publication Critical patent/JP2022092747A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)

Abstract

【課題】Web会議システム等を利用するユーザ同士が容易に視線を合わせてコミュニケーション可能な表示画像処理システム及び表示画像処理装置の提供を目的とする。【解決手段】表示画面を視るユーザを複数のカメラから撮影して複数の撮影画像を取得する撮影画像取得手段と、前記複数の撮影画像から前記ユーザの立体情報を取得する立体情報取得手段と、前記立体情報から前記表示画面を視るユーザの正面画像を作成する画像作成手段と、前記正面画像を表示画面に表示するように制御する表示制御手段と、を備えることを特徴とする。【選択図】 図1

Description

本発明は、表示画像処理システム及び表示画像処理装置に関する。
近年、ネットワークを介して互いに音声や画像を送受信することにより対話ができるWeb会議システムが、会議や面接、飲み会等の様々な場面で利用されている。
例えば、特許文献1のような画像入力装置付きラップトップ型コンピュータを使用した場合には、表示画面(平面ディスプレイ)の上部の略中央部に配設したカメラ(小型カメラ)から被写体であるユーザの画像を撮影できる。
また、特許文献2のように携帯端末を用いてWeb会議システムを利用する場合には、表示画面(表示器)の上部等にあらかじめ搭載されているカメラを用いて画像を撮影できる。
上記のようにカメラで撮影した画像は、カメラから視たユーザの画像として相手ユーザの表示画面に表示される。
すなわち、ユーザがカメラを視ながら話をすれば、表示画面に表示されるユーザの目は相手ユーザを直視しているような画像となり、まるで対面で会話しているような自然な感じに映る。
しかしながら、カメラを視ることで表示画面から視線が外れ、表示画面に表示される相手ユーザの顔などを確認できないために、多くのユーザは自然と表示画面を視ながら話をし、カメラから視線をずらしてしまう。
これにより、表示画面に表示されるユーザの目は下などを向いてしまう。
このように、ユーザ同士が視線を合わせて対話することが難しいため、Web会議等において相手ユーザとの良好なコミュニケーションは取りづらいものとなっている。
また、表示画面の中央付近にカメラを設置することで表示画面を視るユーザを正面から
撮影できるが、この場合にはカメラが表示画面を遮蔽してしまう問題がある。
特開平5-66855号公報 特開2015-82207号公報
本発明は、Web会議システム等を利用するユーザ同士が容易に視線を合わせてコミュニケーション可能な表示画像処理システム及び表示画像処理装置の提供を目的とする。
本発明に係る表示画像処理システムは、表示画面を視るユーザを複数のカメラから撮影して複数の撮影画像を取得する撮影画像取得手段と、前記複数の撮影画像から前記ユーザの立体情報を取得する立体情報取得手段と、前記立体情報から前記表示画面を視るユーザの正面画像を作成する画像作成手段と、前記正面画像を表示画面に表示するように制御する表示制御手段と、を備えることを特徴とする。
複数のカメラから撮影して得られる複数の撮影画像は、いずれも2次元の画像データである。
この2次元の画像データから3次元の情報である立体情報を得ることで、立体情報の中からユーザの正面画像を作成するのに必要なデータを得ることができる。
これにより、ユーザが実際にカメラを視ていなくても、まるで表示画面内に設けたカメラから撮影したような表示画面を視るユーザの正面画像を仮想的に作成できる。
本発明において、前記表示画面は前記複数のカメラの間に介在し、前記撮影画像取得手段は、前記表示画面を視るユーザの顔領域を特定可能であることが好ましい。
複数のカメラは、例えば、表示画面の両脇(上下方向又は左右方向等)に表示画面を挟むように設置されていても、設置可能であってもよい。
また、本発明において、前記立体情報取得手段は、ステレオマッチングにより立体情報を取得してもよい。
本発明において、前記画像作成手段は、表示画面内に仮想カメラを設けて撮影したような該仮想カメラを視るユーザの正面画像を作成することが好ましい。
仮想カメラは、表示画面内であれば特にその位置は限定されない。
また、前記画像作成手段は、仮想カメラ位置における前記ユーザの特徴点の透視投影像を作成してもよい。
本発明に係る表示画像処理装置は、上記に記載の表示画像処理システムを備えた表示画像処理装置であって、複数のカメラと、該複数のカメラの間に介在する表示画面とを有することを特徴とする。
本発明によれば、ユーザがカメラではなく表示画面を視たままの状態で、まるで表示画面内に設けたカメラを視ているような画像を仮想的に作成できるため、Web会議システム等を利用するユーザ同士の視線を合わせた対話を容易に可能とする。
本発明に係る表示画像処理システムの構成例をブロック図で示す。 表示画像処理システムによる処理の流れをフローチャートで示す。 (a)、(b)は本発明に係る表示画像処理装置の構成例の一部を模式図で示し、(c)はその表示画面に表示される画像の一例を示す。 本発明に係る技術思想を説明するための模式図を示す。 (a)、(b)は従来装置の構成例の一部を模式図で示し、(c)はその表示画面に表示される画像の一例を示す。
本発明に係る表示画像処置システム及び表示画像処理装置について、以下、図に基づいて説明する。
図1に本発明に係る表示画像処理システムの構成例をブロック図で示し、図2にその処理の流れをフローチャートで示す。
また、図3に本発明に係る表示画像処理装置の構成例の一部を模式図で示し、図4に本発明に係る技術思想を説明するための模式図を、図5に従来装置20の構成例の一部を模式図で示す。
従来装置20は、プロセッサ、メモリ、ストレージ、通信インタフェース等の他に、表示画面11とカメラ12を備えるパーソナルコンピュータなどであり、ネットワークを介して会議サーバへアクセスできる。
例えば、プロセッサにWeb会議の開始指示が入力されることで、特定のコンピュータプログラムを実行し、会議サーバへアクセスする。
会議サーバは、従来装置20等を使用するユーザ間での会議を実現するためのサーバである。
従来装置20を用いてWeb会議をする場合、例えば図5(a)に示すように表示画面11の上側に配置したカメラ12を用いてユーザ1を撮影することで、図5(c)に示す表示画面11内のグラフィカルユーザインタフェースである表示部11aにユーザ1が表示される。
このとき、ユーザ1がカメラ12ではなく表示画面11を視ることで、カメラ12にはカメラ12よりも下側の表示画面11を視るユーザ1が撮影され、カメラ12が出力した撮影画像はそのまま表示部11aに表示される。
これにより、表示部11aにはユーザ1の視線が下側を向いた状態、すなわち目2の下側に黒目2aが位置する画像として表示される。
また、図5(b)に示すように表示画面11の右側に配置したカメラ12を用いてユーザ3を撮影することで、図5(c)に示すように表示画面11内の表示部11bにユーザ3が表示される。
このとき、ユーザ3がカメラ12ではなく表示画面11を視ることで、表示部11bにはユーザ3の視線が左側を向いた状態、すなわち目4の左側に黒目4aが位置する画像として表示される。
そのため、従来装置20を用いたWeb会議では、表示画面11に表示されるユーザ1,3(相手ユーザ及び/又はユーザである自分)と、表示画面11を視るユーザ3,1とが、視線を合わせて対話することが困難であった。
そこで、本発明に係る表示画像処理装置10は、表示画面11を挟むように複数のカメラ12,13を配置し、会議サーバへアクセスするとプロセッサ等が表示画像処理装置システム100を機能させるものとした。
図4に示すように、例えばユーザ1が図3(a)に示す表示画像処理装置10の表示画面11を視ると、表示画面11の左側に配置したカメラ12からは撮影画像12aが撮影され、表示画面11の右側に配置したカメラ13からは撮影画像13aが撮影される。
このとき、撮影画像12aに表示されるユーザ1の目2は、黒目2aが右側に位置し、撮影画像13aでは黒目2aが左側に位置することになる。
そこで、本発明においては、例えばカメラ12,13のおよそ中央位置に仮想カメラ14があると仮想的に設定し、仮想カメラ14から視たユーザ1の正面画像(仮想画像14a)を作成することで、これを表示画面11に表示する。
これにより、ユーザ1がカメラ12、13ではなく表示画面11を視ながら話をしても、表示画面11内に仮想カメラ14を設けて撮影したようなユーザ1の正面画像、具体的には、図3(c)に示すようにユーザ1の目2のおよそ中央に黒目2aが位置するような画像として表示部11aに表示可能となる。
以下、本発明に係る表示画像処置システム100及び表示画像処理装置10について、より詳細に説明する。
表示画像処理装置10は、例えばネットワーク通信機能を備えるパーソナルコンピュータ、タブレット端末、携帯端末などであり、ネットワークを介して会議サーバとデータ通信が可能である。
会議サーバは、表示画像処理装置10等を使用するユーザ間での会議を実現するためのサーバであり、表示画像処理装置10が会議サーバへアクセスすることで、Web会議システムの利用が可能となる。
表示画像処理装置10は、プロセッサ、メモリ、ストレージ、通信インタフェース等の他に、少なくとも図3に示すような表示画面11と、複数のカメラ12、13を備える。
表示画面11は、例えば音声を出力するスピーカを内蔵した液晶ディスプレイなどであり、プロセッサにより制御されて各種情報を表示する。
複数のカメラ12、13は、少なくとも2台以上のカメラであり、表示画面11を挟むように表示画面11の両脇(上下方向、左右方向又は対角方向等)に配置され、表示画面11を視るユーザを撮影する。
例えば図3(a)に示すように、カメラ12、13を表示画面11の左右方向両脇に配置した横長の表示画像処理装置10は、90度回転することで図3(b)に示すような縦長の表示画像処理装置10として使用してもよい。
また、表示画像処理装置10は、表示画面11の両脇にカメラ12、13を設置した状態で市場に流通するものであってもよく、カメラ12、13等を表示画面11に対して後から備え付け可能なものであってもよい。
カメラ12,13は、例えばマイクロフォンが内蔵されており、マイクロフォンにより集音された音声成分を含む撮影画像を撮影でき、カメラ12、13が出力した撮影画像はプロセッサに入力される。
表示画像処理装置10は、プロセッサ等に予め表示画像処理システム100を備えているものであってもよいし、後から表示画像処理システム100を備え付けられるものであってもよい。
以下、図3に示す表示画像処理装置10に備えた表示画像処理システム100を実施例にして、詳細に説明する。
表示画像処理システム100は、図1に示すように撮影画像取得手段110と、立体情報取得手段120と、画像作成手段130と、表示制御手段140を備える。
図2に、この表示画像処理システム100による処理の流れをフローチャートで示す。
撮影画像取得手段110は、表示画面11を視るユーザ1を複数のカメラ12,13から撮影して複数の撮影画像を取得する。
撮影画像取得手段110による処理の流れとしては、図2に示すようなカメラ起動S111,カメラキャリブレーションS112、顔認識ニューラルネットワーク読み込みS113、仮想カメラ初期位置設定S114を含んでもよい。
カメラ起動S111は、表示画面11を視るユーザ1を撮影するためのカメラ12、13を起動させる。
カメラキャリブレーションS112は、カメラレンズ焦点距離などの内部パラメータ、カメラ12,13の位置・姿勢を表す外部パラメータ、カメラレンズの歪収差係数を求め、カメラ12、13で撮影した撮影画像を補正処理する。
カメラキャリブレーションS112は、例えばZhangの手法を用いてもよい。
顔認識ニューラルネットワーク読み込みS113は、ニューラルネットワークによりユーザ1の顔領域を特定する。
顔認識ニューラルネットワーク読み込みS113は、ディープランニング等によりユーザ1の目2(黒目2a)の動きを追うことが好ましい。
仮想カメラ初期位置設定S114は、表示画面11内に仮想カメラ14の位置を仮想的に設定する。
仮想カメラ14の位置は、カメラ12,13の位置等を計算することで、表示画面11内に自由に設定できる。
立体情報取得手段120は、上記により撮影した撮影画像からユーザ1の立体情報を取得する。
立体情報取得手段120としては、ステレオマッチングS121、特徴点の3D座標計算S122、顔領域検出S123を含むことが好ましい。
ステレオマッチングS121は、複数のカメラ12,13で撮影した撮影画像である2次元の画像データを基に、3次元の情報であるユーザ1の立体情報を推定する。
特徴点の3D座標計算S122は、上記ステレオマッチングS121より推定された立体情報から、具体的にユーザ1の特徴点、例えば顔領域の目、鼻、口などの各パーツの立体座標を計算する。
顔領域検出S123は、上記特徴点の3D座標計算により求めたユーザ1の顔領域の座標数値を検出する。
画像作成手段130は、仮想カメラ14を視るユーザ1の正面画像を作成する。
画像作成手段130による処理の流れとしては、仮想カメラ位置更新S131,仮想カメラ位置における特徴点の透視投影像作成S132を含む。
仮想カメラ位置更新S131は、顔認識ニューラルネットワーク読み込みS113によりユーザ1の目の動きを追うことで、表示画面11を視るユーザ1の視点の先に仮想カメラ14の位置を再設定する。
仮想カメラ位置における特徴点の透視投影像作成S132は、顔領域検出S123により検出した特徴点の3D座標数値から、表示画面11内の仮想カメラ14を視るユーザ1の正面画像、具体的には黒目2aの位置が目2のおよそ中央になる透視投影像を作成する。
表示制御手段140は、上記透視投影像を表示画面11に表示するように制御する。
仮想カメラ透視投影像の表示S141は、仮想カメラ位置における特徴点の透視投影像作成S132により作成した透視投影像を、表示画面11内の表示部11a等に表示するように制御する。
本発明に係る画像表示処理システム100は、撮影画像取得手段110、立体情報取得手段120、画像作成手段130、表示制御手段140をWeb会議又はカメラ撮影を終了するまで繰り返し実施する。
具体的には、顔認識ニューラルネットワーク解放S151を経て、カメラ停止S152を実施することで、Web会議を終了する又はカメラ12,13での撮影を終了することになる。
本実施例においては、表示画面11を1人のユーザが視る場合で説明したが、表示画面11を2人以上のユーザで視る場合にも適応できる。
具体的には、例えば装置画像処理装置10の表示画面11をユーザ1,3の2人で視る場合には、図3(c)に示すように表示画面11内に表示部11a、11bを別々に設けることで、表示部11a、11bに目2,4のおよそ中央に黒目2a、4aが位置する各ユーザ1,3の画像を表示することも可能である。
表示画像処理システム100は、さらに補完手段を有していてもよい。
補完手段により、画像作成手段130や表示制御手段140等を補完することで、透視投影像をより綺麗な画像に表示することができ、実際のカメラで撮影した画像により近づけることができる。
本発明により、Web会議システム等を利用するユーザ同士の視線を合わせた対話が容易に可能となるが、本発明に係る技術思想を証明写真機に応用することもできる。
証明写真機に応用することで、撮影者はカメラを視ないで表示画面を視たまま、鏡を視るように証明写真を撮影することができる。
1 ユーザ
10 表示画像処理装置
11 表示画面
12 カメラ
13 カメラ
14 仮想カメラ
100 表示画像処理システム
110 撮影画像取得手段
120 立体情報取得手段
130 画像作成手段
140 表示制御手段

Claims (6)

  1. 表示画面を視るユーザを複数のカメラから撮影して複数の撮影画像を取得する撮影画像取得手段と、
    前記複数の撮影画像から前記ユーザの立体情報を取得する立体情報取得手段と、
    前記立体情報から前記表示画面を視るユーザの正面画像を作成する画像作成手段と、
    前記正面画像を表示画面に表示するように制御する表示制御手段と、
    を備えることを特徴とする表示画像処理システム。
  2. 前記表示画面は前記複数のカメラの間に介在し、
    前記撮影画像取得手段は、前記表示画面を視るユーザの顔領域を特定可能であることを特徴とする請求項1に記載の表示画像処理システム。
  3. 前記立体情報取得手段は、ステレオマッチングにより立体情報を取得することを特徴とする請求項1又は2に記載の表示画像処理システム。
  4. 前記画像作成手段は、表示画面内に仮想カメラを設けて撮影したような該仮想カメラを視るユーザの正面画像を作成することを特徴とする請求項1~3のいずれかに記載の表示画像処理システム。
  5. 前記画像作成手段は、仮想カメラ位置における前記ユーザの特徴点の透視投影像を作成することを特徴とする請求項4に記載の表示画像処理システム。
  6. 請求項1~5のいずれかに記載の表示画像処理システムを備えた表示画像処理装置であって、
    複数のカメラと、該複数のカメラの間に介在する表示画面とを有することを特徴とする表示画像処理装置。
JP2020205631A 2020-12-11 2020-12-11 表示画像処理システム及び表示画像処理装置 Pending JP2022092747A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020205631A JP2022092747A (ja) 2020-12-11 2020-12-11 表示画像処理システム及び表示画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020205631A JP2022092747A (ja) 2020-12-11 2020-12-11 表示画像処理システム及び表示画像処理装置

Publications (1)

Publication Number Publication Date
JP2022092747A true JP2022092747A (ja) 2022-06-23

Family

ID=82069480

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020205631A Pending JP2022092747A (ja) 2020-12-11 2020-12-11 表示画像処理システム及び表示画像処理装置

Country Status (1)

Country Link
JP (1) JP2022092747A (ja)

Similar Documents

Publication Publication Date Title
CN109952759B (zh) 用于具有hmd的视频会议的改进的方法和系统
US11636653B2 (en) Method and apparatus for synthesizing virtual and real objects
US9948863B2 (en) Self-timer preview image presentation method and apparatus, and terminal
US8203595B2 (en) Method and apparatus for enabling improved eye contact in video teleconferencing applications
KR101350996B1 (ko) 아이콘텍이 가능한 3차원 원격회의 장치 및 이를 이용한 방법
CN105247881B (zh) 信息处理设备、显示控制方法以及程序
JP4144492B2 (ja) 画像表示装置
CN109997175B (zh) 确定虚拟对象的大小
EP3076660B1 (en) Method and apparatus for displaying framing information
US10389976B2 (en) Information processing apparatus, information processing system, and information processing method
JP6157077B2 (ja) カメラ付き表示装置
JP2009089324A (ja) テレビ会議システムおよびプログラム、記録媒体
CN109218709B (zh) 全息内容的调整方法及装置和计算机可读存储介质
US20230231983A1 (en) System and method for determining directionality of imagery using head tracking
CN114007057A (zh) 终端、拍摄方法、拍摄装置及计算机可读存储介质
JP2022092747A (ja) 表示画像処理システム及び表示画像処理装置
US20190349561A1 (en) Multi-camera scene representation including stereo video for vr display
JP2005142765A (ja) 撮像装置及び方法
WO2017163649A1 (ja) 画像処理装置
JP5485102B2 (ja) コミュニケーション装置、コミュニケーション方法、及びプログラム
JP2010283550A (ja) コミュニケーションシステム、コミュニケーション装置
JP6916896B2 (ja) 情報処理装置および画像生成方法
US20210051310A1 (en) The 3d wieving and recording method for smartphones
CN116737030A (zh) 基于虚拟现实的业务线上处理方法、装置、系统及设备
CN115914530A (zh) 一种视频会议控制方法、管理设备和存储介质