JP2020160538A - 画像処理装置、画像処理方法及びプログラム - Google Patents

画像処理装置、画像処理方法及びプログラム Download PDF

Info

Publication number
JP2020160538A
JP2020160538A JP2019056381A JP2019056381A JP2020160538A JP 2020160538 A JP2020160538 A JP 2020160538A JP 2019056381 A JP2019056381 A JP 2019056381A JP 2019056381 A JP2019056381 A JP 2019056381A JP 2020160538 A JP2020160538 A JP 2020160538A
Authority
JP
Japan
Prior art keywords
image
unit
person
image processing
persons
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019056381A
Other languages
English (en)
Inventor
剛 横溝
Takeshi Yokomizo
剛 横溝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2019056381A priority Critical patent/JP2020160538A/ja
Publication of JP2020160538A publication Critical patent/JP2020160538A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Closed-Circuit Television Systems (AREA)

Abstract

【課題】会議に参加している人がわかりやすく映るように、適切な画像分割処理及び歪補正処理を行う画像処理装置を提供する。【解決手段】画像処理装置は、会議参加者の顔情報を取得する。魚眼レンズを用いて撮像された撮像画像から人物を検知し、会議参加者の顔情報を用いて検知した人物を特定する。人物の数に従って、撮像画像から部分画像を切り取る。人物の数に従って、部分画像に対して歪みを補正する。補正された部分画像を出力する。【選択図】図12

Description

本発明は、画像処理装置、画像処理方法及びプログラムに関する。
従来、複数拠点の間でネットワークを構築し、音声と映像とを送受信することによって、遠隔地同士での会議を行うWeb会議システムが知られている。
また、人物の顔画像を入力し、その特徴量を計測して認証を行う人物認証の技術が公開されている(特許文献1)。予め会議に参加する人物の顔、又は名称の情報を登録しておき、Web会議システムで配信する映像に対して人物認証を行うことで、会議に参加している人物を特定し、表示映像に対して特定した人物の名称を重畳する機能等が存在する。
また、Web会議システムで使用するカメラの種別の1つとして、魚眼レンズを搭載した魚眼カメラが存在する。魚眼カメラには、全方位画像をそのまま出力するだけではなく、複数の種類の切り取り処理及び歪補正処理を行った画像を出力可能なものがある。このようなカメラでは複数の種類の切り取り処理及び歪み補正処理を行った映像を出力することで、カメラの周囲にいる会議参加者を撮像することができる。魚眼カメラの中には、魚眼画像における特定被写体の位置に基づいて、歪み補正処理をすることで、被写体の歪みを低減するもの(特許文献2)、全方位画像から得られる注目領域の数及び位置に基づいて切り取り処理、又は歪み補正処理を行うものがある(特許文献3)。
特開平6−119433号公報 特開2016−39539号公報 特願2017−248013号公報
しかしながら、特許文献2及び特許文献3のように、被写体、又は注目領域の数及び位置に基づいて、切り取り処理、又は歪み補正処理を行うだけでは、予め登録されている人物が表示されず、会議に参加していない人物、又は予め人物登録されていない人物が中心に表示されてしまう可能性がある。
本発明の画像処理装置は、会議参加者の顔情報を取得する取得手段と、魚眼レンズを用いて撮像された撮像画像から人物を検知し、前記会議参加者の顔情報を用いて検知した人物を特定する特定手段と、前記人物の数に従って、前記撮像画像から部分画像を切り取る切り取り手段と、前記人物の数に従って、前記部分画像に対して歪みを補正する補正手段と、前記補正手段により補正された部分画像を出力する出力手段と、を有する。
本発明によれば、会議に参加している人がわかりやすく映るように、適切な画像分割処理及び歪補正処理を行った画像を提供することができる。
Web会議システムのシステム構成の一例を示す図である。 サーバ装置の内部構成の一例を示す図である。 会議端末装置のハードウェア構成の一例を示す図である。 パーソナルコンピュータのPC本体部の内部構成を示した図である。 実施形態1のカメラの構成を示す図である。 撮像部の詳細な構成を示した図である。 2つの領域に対して画像分割及び歪補正処理を行う前の画像を示す図である。 図7の画像に対して画像分割及び歪補正処理後に出力される画像を示す図である。 4つの領域に対して画像分割及び歪補正処理を行う前の画像を示す図である。 図9の画像に対して画像分割及び歪補正処理後に出力される画像を示す図(その1)である。 図9の画像に対して画像分割及び歪補正処理後に出力される画像を示す図(その2)である。 実施形態1の情報処理の一例を示すフローチャートである。 変形例1の情報処理の一例を示すフローチャートである。 優先度を示すテーブルの一例を示す図である。 変形例2の情報処理の一例を示すフローチャートである。 実施形態2のカメラの構成を示す図である。
<実施形態1>
図1は、Web会議システムのシステム構成の一例を示す図である。
Web会議端末装置101、104は、その内部に通信機能を有しインターネット等に代表されるネットワーク108に接続される会議端末装置102、105、及び撮像装置103、106を有する。撮像装置103、106は、画像処理装置の一例である。
会議端末装置102、105はパーソナルコンピュータ(PC)によって構成され、Web会議システム端末装置用プログラムによって動作する。
会議端末装置は3台以上、Web会議システムに接続されてもよい。サーバ装置107は、その内部に通信機能を有し、ネットワーク108に接続されている。サーバ装置107はサーバ用コンピュータによって構成され、Web会議システムサーバ装置用プログラムによって動作する。
図2は、サーバ装置107の内部構成の一例を示す図である。
サーバ装置107は、上述したようにサーバ用コンピュータによって構成され、Web会議システムサーバ装置用プログラムデータによって動作する。
より具体的に、サーバ装置107は、CPU(Central Processing Unit)201、ROM(Read Only Memory)202、RAM(Random Access Memory)203を有する。更に、サーバ装置107は、ハードウェア構成として、内部記憶装置204、外部記憶装置205、ネットワークI/F206、入力機器I/F207、ディスプレイI/F208、キーボード209、マウス210、ディスプレイ211、システムバス212を有する。これらはネットワーク108に接続されている。
CPU201は、サーバ用コンピュータ全体の制御に加えてWeb会議システムサーバ装置用プログラムデータが指示する処理を行う。
ROM202は、読出し専用メモリである。ROM202は、使用者が電気的にプログラムを書き込むことができるPROM(Programmable ROM)と製造するときに内容を書き込むマスクROMとがある。実施形態1においては、何れのROMであってもよい。
RAM203は、自由書き込み及び自由読み出しができるメモリである。RAM203は、CPU201がWeb会議システムサーバ装置用プログラムに基づき処理を行う際に一時的にデータを蓄える等の機能を有する。
内部記憶装置204は、情報をサーバ装置内で記憶するための装置である。内部記憶装置204の例としては、ハードディスク等がある。内部記憶装置204にはWeb会議システムサーバ装置用プログラムが格納されると共に、Web会議システムサーバ装置用プログラムデータの動作に必要なデータ、端末データベース情報、会議予約情報、顔認識を行うための顔情報が格納されたデータベース情報等が格納される。予めユーザは、カメラ103、106、又はその他のカメラ等を用いて会議に参加する人物の顔の映像データをサーバ装置107に送り、顔識別に使用する顔情報を内部記憶装置204に格納しておく。顔情報は、会議参加者の顔情報の一例である。
外部記憶装置205は、ホストサーバ装置とは別個のメディアについて情報の読書きを行う。外部記憶装置205には、例えば、CD−RW、DVD−RWドライブ等がある。
ネットワークI/F206は、ネットワーク108に接続するための通信制御を処理する。
入力機器I/F207は、サーバ装置107が具備するキーボード209、マウス210等からの入力を処理するものであり、サーバ装置の操作に用いられるものであるが、なくてもWeb会議システムの動作に支障はない。
ディスプレイI/F208及びディスプレイ211は表示部であり、CRT又は液晶ディスプレイ及びその制御回路によって構成される。サーバ装置の動作状況はこのCRT又は液晶ディスプレイ上の一部に表示されるものであるが、なくてもWeb会議システムの動作に支障はない。
システムバス212は、サーバ装置内の各ブロック間の各種データのやりとり及び電力の供給をするものである。システムバス212は、アドレス線、データ線、制御線、電源・グラウンド線等からなる。
CPU201が、ROM202又は内部記憶装置204に記憶されているWeb会議システムサーバ装置用プログラムに基づき処理を実行することによって、サーバ装置107の機能が実現される。
図3は、会議端末装置102、105のハードウェア構成の一例を示す図である。
会議端末装置の主な構成機器としては、パーソナルコンピュータ301である。
また、ディスプレイ304、キーボード303、マウス302、スピーカ306、マイク307等はそれぞれパーソナルコンピュータ301に備わっている各機器に対応する入出力端子に接続される。
図4は、Web会議端末装置102として利用するパーソナルコンピュータのパーソナルコンピュータ301の内部構成を示した図である。
PC本体部301は、Web会議システム端末装置用プログラムによって動作する。より具体的に、PC本体部301は、CPU401、ROM402、RAM403、内部記憶装置404、外部記憶装置405、ネットワークI/F406、入力機器I/F407、ディスプレイI/F408、音声入出力I/F410を有する。更に、PC本体部301は、キーボード303、マウス302、ディスプレイ304、マイク307、スピーカ306、システムバス413を有する。これらはネットワーク108に接続されている。
CPU401は、パーソナルコンピュータ全体の制御に加えてWeb会議システム端末装置用プログラムデータが指示する処理を行う。
ROM402は、読出し専用メモリである。ROM402は、使用者が電気的にプログラムを書き込むことができるPROMと製造するときに内容を書き込むマスクROMとがあるが、実施形態1においては何れのROMであってもよい。
RAM403は、自由書き込み及び自由読み出しができるメモリである。RAM403は、CPU401がWeb会議システム端末装置用プログラムに基づき処理を行う際に一時的にデータを蓄える等の機能を有する。
内部記憶装置404は、情報を端末装置内で記憶するための装置である。内部記憶装置404の例としては、ハードディスク等がある。内部記憶装置404はWeb会議システム端末装置用プログラムデータが格納されると共に、Web会議システム端末装置用プログラムデータの動作に必要なデータの格納を行う。
外部記憶装置405は、端末装置とは別個のメディアについて情報の読書きを行う。外部記憶装置405には、例えば、CD−RWドライブ、DVD−RWドライブ等がある。
ネットワークI/F406は、インターネット又はイントラネット等のネットワークに接続するための通信制御を処理するが、ユーザの環境に応じてさまざまな通信インターフェースが適用される。
入力機器I/F407は会議端末装置102が具備するキーボード303、マウス302等からの入力を処理するものであり、端末装置の操作に用いられるものである。
ディスプレイI/F408及びディスプレイ304は表示部である。CRT、液晶ディスプレイ、プラズマディスプレイ、フロントプロジェクタ又はリアプロジェクションテレビ及びその制御回路によって構成される。端末装置の動作状況はこの表示装置上の一部に表示されるものである。
音声入出力機器I/F410は、端末装置が具備するマイク307、スピーカ306からの入出力を処理するものであり、端末装置において音声通話を行う際に用いられるものである。
システムバス413は、端末装置内の各ブロック間の各種データのやりとり及び電力の供給をするものである。システムバス413は、アドレス線、データ線、制御線、電源・グラウンド線等からなる。
以下では、撮像装置としてカメラを用いる場合について説明する。
図5は、カメラ103及び106の構成を示す図である。カメラは、撮像部501と、画像生成部502と、通信部509と、顔認識処理部503と、画像分割設定部504と、画像分割部506と、歪補正処理部507と、出力部508と、を有する。
撮像部501は、被写体像を撮像する。画像生成部502は、撮像部501の信号から画像信号を生成する。通信部509は、サーバ装置107から顔情報等を受け取る。顔認識処理部503は、撮像画像及び顔情報から人物の位置を判定する。画像分割設定部504は、複数の画像分割パターンから撮像画像に適用する分割方法と撮像画像の分割位置を設定する。画像分割部506は、画像分割設定部504で設定された分割方法及び分割位置で画像を分割する。歪補正処理部507は、画像分割部506で分割された画像に対応する歪補正を行う。出力部508は、歪補正処理部507で歪補正された画像信号を出力する。
ここで、図6は、撮像部501の詳細な構成を示した図である。撮像部501は、数枚のレンズ群からなるレンズ601、CCD、又はCMOS等の撮像素子602を備える。撮像部501は、雑音軽減を行う相関二重サンプリング(Correlated Double Sampling:CDS)603を備える。撮像部501は、カメラの利得制御を自動で行うゲインコントロール(Automatic Gain Control:AGC)604を備える。撮像部501は、アナログ信号をデジタル信号へと変換を行うA/D変換605を備える。
上述した各構成要素の動作について詳しく説明を行う。
まず、撮像装置について、図5及び図6を用いて詳しく説明を行う。
撮像素子602は、撮像光学系としてのレンズ601を介して結像された被写体像を電気信号に変換する。レンズ601は歪みが多く画角が広い広角レンズ、又は魚眼レンズでもよい。実施形態1では、魚眼レンズの場合に関して説明する。
CDS603は、撮像素子602から出力された電気信号に対して相関二重サンプリング処理等を実施する。
AGC604は、CDS603から出力された電気信号に対して増幅処理等を行う。
A/D変換605は、AGC604により増幅処理されたアナログ信号をデジタル信号へと変換する。
画像生成部502は、撮像部501から得られた輝度信号及び色信号からRGB画像、YUV画像等の画像信号を生成する。
顔認識処理部503は、画像生成部502で生成された画像及び通信部509経由でサーバ装置107から受け取った顔情報を基に、人物認識及び顔認識処理を行う。ここで、サーバ装置107に登録された人物の識別を行うことができる。
画像分割設定部504は、予め用意されている分割方法を設定する。分割方法の種類としては、図8の2分割(ダブルパノラマ)、又は図10の4分割(クアッドパノラマ)等があるが分割数は限定しないものとする。また、撮像装置は、図11のように、切り出した画像をそれぞれ別の映像として配信することもできる。画像分割設定部504は、顔認識処理部503で判定された画像内の人物の数、位置、分布に応じて画像の分割する位置を算出し設定する。
画像分割部506は、画像分割設定部504で設定された画像分割パターン及び画像分割位置を用いて画像生成部502で生成された画像を分割する。歪補正処理部507は、画像分割部506で分割された画像に対して、種々の幾何学的変換等の歪補正処理を行う。
ここで、図7及び図8を用いて画像分割部506及び歪補正処理部507でそれぞれ画像分割処理と歪補正処理される画像の例を説明する。図7の70は屋内の机等に設置された魚眼レンズを備えたカメラで、天井に対して垂直な方向を撮像した場合の画像の例である。図8は、図7の画像70の破線で区切られた領域700の部分を除外して、同じく破線で区切られた領域701、領域702をそれぞれ切り出して歪補正処理部507で歪補正処理を行い、領域702を180度回転させて繋げた画像の例である。以降、図8に示す映像をダブルパノラマ映像と呼ぶ。ダブルパノラマ映像は、撮像画像の全体を2分割した映像の一例である。
さらに、別の画像分割及び歪補正処理の例として、カメラは、図9の領域900〜903を図10の領域900〜903のように部分的に切り出して、4つの部分画像を繋げて1つの画像として出力してもよい。以降、図10に示す映像をクアッドパノラマ映像と呼ぶ。カメラは、4つ以上の場合も同様に出力する画像の大きさに合わせて拡大縮小した後に各切り出し画像を繋げて出力してもよい。クアッドパノラマ映像は、複数の切り出し画像を結合した映像の一例である。
図11は、カメラが図9の領域900〜903を切り出して、それぞれを別の映像として生成した一例を示す図である。以降、図11に示す映像を切り出し映像と呼ぶ。
出力部508は、歪補正処理部507で歪補正処理された画像信号に対して圧縮処理等を施した後、出力する。画像信号は、通信部509を介して、ネットワーク108の先に配信される。なお、カメラは、一つの映像に対して、複数の種類の映像を生成することも可能である。この場合、画像分割設定部504は、複数の分割パターンを設定する。そして、画像分割部506及び歪補正処理部507では、その分割パターンに応じて画像分割及び歪み補正処理を実行する。そして、出力部508は、複数の種類の映像を同時に配信する。
また、画像分割設定部504で分割パターンが設定されなかった場合、画像分割部506は、画像分割を行わない。同様に、歪補正処理部507でも歪み補正処理を行わない。そのため、魚眼映像がそのまま出力される。
以下、図12を参照して、配信する映像種別を決定する情報処理について説明する。
図12は、配信する映像種別を決定する情報処理の一例を示すフローチャートである。情報処理は、Web会議開始時や、一定の間隔(例えば1秒)ごとに実行されるものとする。
S1201において、カメラ103及び106は、撮像部501及び画像生成部502によって魚眼画像を取得する。
S1202において、顔認識処理部503は、通信部509を介してサーバ装置107から登録された顔情報を取得する。そして、顔認識処理部503は、画像生成部502から取得した画像を用いて人物の位置を検知し、顔情報を用いて登録されている人物の顔を識別する。
S1203において、顔認識処理部503は、検知した人物の中に、登録されていない人物が存在するかどうかを判定する。顔認識処理部503は、登録されていない人物が存在する場合、S1204に進み、登録されていない人物が存在しない場合、S1209に進む。
S1204において、顔認識処理部503は、登録されていない人物と特定された人物とをあわせた数が、切り出し映像の配信性能以下かどうかを判定する。配信性能としては、画像分割部506による切り出しの数の上限、又は出力部508における通信帯域による制約等がある。顔認識処理部503は、人物の数が切り出し映像の配信性能以下の場合、S1205に進み、切り出し映像の配信性能以下でない場合、S1206に進む。
S1205において、画像分割設定部504は、人物の位置を検知し、切り出し映像のための切り出し位置を設定する。画像分割部506は、画像分割設定部504が設定した切り出し位置に従って、画像生成部502から取得した魚眼映像を分割する。そして、歪補正処理部507は、画像分割部506で分割された画像に対して、歪補正処理を行う。そして、出力部508は、切り出し映像を、通信部509を介してネットワーク108に配信する。全員が特定されない人物であった場合、出力部508は、切り出し映像と共に、全員特定されていない旨の通知をネットワーク108に配信してもよい。また、全員が特定されない人物であった場合、画像分割設定部504は、全体を表示するためのダブルパノラマ映像のための切り出し位置を設定することで、切り出し映像の代わりにダブルパノラマ映像が出力されるようにしてもよい。
S1206において、顔認識処理部503は、特定した人物の人数が、切り出し映像の配信性能以下かどうかを判定する。顔認識処理部503は、特定した人物の人数が、切り出し映像の配信性能以下の場合、S1207に進み、特定した人物の人数が、切り出し映像の配信性能以下でない場合、S1208に進む。
S1207において、画像分割設定部504は、特定した人物の位置を特定し、切り出し映像のための切り出し位置を設定する。また、画像分割設定部504は、全体を表示するためのダブルパノラマ映像のための切り出し位置も設定する。ダブルパノラマ映像生成のために領域701と領域702とに分割する際に、画像分割設定部504は、人物が切れないように切り出し位置を設定する。そして、画像分割部506は、画像分割設定部504が設定した切り出し位置に従って、画像生成部502から取得した魚眼映像を分割する。そして、歪補正処理部507は、画像分割部506で分割された画像に対して、歪補正処理を行う。出力部508は、切り出し映像及びダブルパノラマ映像を、通信部509を介してネットワーク108に配信する。
S1208において、画像分割設定部504は、全体を表示するためのダブルパノラマ映像のための切り出し位置を設定する。ダブルパノラマ映像生成のために領域701と領域702とに分割する際に、画像分割設定部504は、人物が切れないように切り出し位置を設定する。そして、画像分割部506は、画像分割設定部504が設定した切り出し位置に従って、画像生成部502から取得した魚眼映像を分割する。そして、歪補正処理部507は、画像分割部506で分割された画像に対して、歪補正処理を行う。出力部508は、ダブルパノラマ映像を、通信部509を介してネットワーク108に配信する。
S1209において、顔認識処理部503は、特定した人物の人数が、切り出し映像の配信性能以下かどうかを判定する。顔認識処理部503は、特定した人物の人数が、切り出し映像の配信性能以下の場合、S1210に進み、特定した人物の人数が、切り出し映像の配信性能以下でない場合、S1211に進む。
S1210において、画像分割設定部504は、特定した人物の位置を特定し、切り出し映像のための切り出し位置を設定する。そして、画像分割部506は、画像分割設定部504が設定した切り出し位置に従って、画像生成部502から取得した魚眼映像を分割する。そして、歪補正処理部507は、画像分割部506で分割された画像に対して、歪補正処理を行う。出力部508は、切り出し映像を、通信部509を介してネットワーク108に配信する。
S1211において、画像分割設定部504は、全体を表示するためのダブルパノラマ映像のための切り出し位置を設定する。画像分割設定部504は、ダブルパノラマ映像生成のために領域701と領域702とに分割する際に、人物が切れないように切り出し位置を設定する。そして、画像分割部506は、画像分割設定部504が設定した切り出し位置に従って、画像生成部502から取得した魚眼映像を分割する。そして、歪補正処理部507は、画像分割部506で分割された画像に対して、歪補正処理を行う。出力部508は、ダブルパノラマ映像を、通信部509を介してネットワーク108に配信する。
以上、説明したように、実施形態1のカメラは、会議に登録された人物をできる限り個別の映像である切り出し映像として、それ以外の人物についてもダブルパノラマ映像として配信する。このことで、会議に参加している人がわかりやすく映るように表示することができる。
実施形態1では、定期的に図12に示す情報処理が実行されるため、会議の途中で人が増減した場合、映像種別が切り替わることになる。しかし、頻繁に映像種別が切り替わるとかえって表示がみづらくなる可能性がある。したがって、カメラは、切り出し映像のみ配信するパターンからダブルパノラマ映像を配信するパターンへの変更は即時実行するが、逆は一定時間(例えば10分等)行わないようにしてもよい。
また、S1207において、カメラは、特定した人物を表示するための切り出し映像と、全員を表示するためのダブルパノラマ映像との2つの映像を配信するが、ユーザにダブルパノラマ映像を表示するかどうかを選択させてもよい。
(変形例1)
実施形態1では、カメラは、会議に登録された人物をできる限り個別の映像である切り出し映像として、それ以外の人物についてもダブルパノラマ映像として配信した。しかし、登録された人物全員を同列に扱っているため、会議に必須ではない人物が大勢登録されると、会議に重要な人物を切り出し映像として表示できない場合がある。そこで変形例1では、登録された人物に優先度を設けることで、できる限り会議に重要な人物を切り出し映像として表示できるようにする。
以下、図13、図14を参照して、変形例1の配信する映像種別を決定する情報処理について説明する。
図13は、配信する映像種別を決定する情報処理の一例を示すフローチャートである。図14は、内部記憶装置404に格納されている登録人物の優先度を示すテーブルの一例を示す図である。
S1301において、カメラ103及び106は、撮像部501及び画像生成部502によって魚眼画像を取得する。
S1302において、顔認識処理部503は、通信部509を介してサーバ装置107から登録された顔情報及び各人物の優先度を示すテーブル1400を取得する。そして、顔認識処理部503は、画像生成部502から取得した画像を用いて人物の位置を検知し、顔情報を用いて登録されている人物の顔を識別する。
S1303からS1307までの処理は、図12のS1203からS1207までの処理と同様であるため、説明を省略する。
S1308において、顔認識処理部503は、テーブル1400から会議に必須な人数を算出する。ここで、テーブル1400について説明する。ID1401は、サーバ装置107に登録されている顔情報に紐付けられたIDである。優先度1402は、各人物の優先度を示している。優先度は、各人物の名称1403を登録する際にユーザが設定する。会議端末装置は、キーボード303、マウス302等を介したユーザ操作に基づき、各人物の役割(議長、タイムキーパー、書記、リーダー、傍聴者等)を設定し、それぞれについて対応する優先度を割り当てるようにしてもよい。テーブル1400の場合、会議に必須な人数は4人ということになる。顔認識処理部503は、会議に必須な人物の人数が切り出し映像の配信性能以下かどうかを判定する。顔認識処理部503は、会議に必須な人物の人数が切り出し映像の配信性能以下だった場合、S1309に進み、会議に必須な人物の人数が切り出し映像の配信性能以下でなかった場合、S1310に進む。
S1309において、画像分割設定部504は、会議に必須な人物の位置を特定し、切り出し映像のための切り出し位置を設定する。また、画像分割設定部504は、全体を表示するためのダブルパノラマ映像のための切り出し位置も設定する。ダブルパノラマ映像生成のために領域701と領域702とに分割する際に、画像分割設定部504は、人物が切れないように切り出し位置を設定する。そして、画像分割部506は、画像分割設定部504が設定した切り出し位置に従って、画像生成部502から取得した魚眼映像を分割する。そして、歪補正処理部507は、画像分割部506で分割された画像に対して、歪補正処理を行う。出力部508は、切り出し映像及びダブルパノラマ映像を、通信部509を介してネットワーク108に配信する。
S1310において、画像分割設定部504は、全体を表示するためのダブルパノラマ映像のための切り出し位置を設定する。ダブルパノラマ映像生成のために領域701と領域702とに分割する際に、画像分割設定部504は、人物が切れないように切り出し位置を設定する。そして、画像分割部506は、画像分割設定部504が設定した切り出し位置に従って、画像生成部502から取得した魚眼映像を分割する。そして、歪補正処理部507は、画像分割部506で分割された画像に対して、歪補正処理を行う。出力部508は、ダブルパノラマ映像を、通信部509を介してネットワーク108に配信する。
S1311及びS1312の処理は、図12のS1209及びS1210の処理と同様であるため、説明を省略する。
S1313において、顔認識処理部503は、テーブル1400から会議に必須な人数を算出し、会議に必須な人物の人数が切り出し映像の配信性能以下かどうかを判定する。顔認識処理部503は、画像分割設定部504は、会議に必須な人物の人数が切り出し映像の配信性能以下だった場合、S1314に進み、会議に必須な人物の人数が切り出し映像の配信性能以下出なかった場合、S1315に進む。
S1314において、画像分割設定部504は、会議に必須な人物の位置を特定し、切り出し映像のための切り出し位置を設定する。また、画像分割設定部504は、全体を表示するためのダブルパノラマ映像のための切り出し位置も設定する。ダブルパノラマ映像生成のために領域701と領域702とに分割する際に、画像分割設定部504は、人物が切れないように切り出し位置を設定する。そして、画像分割部506は、画像分割設定部504が設定した切り出し位置に従って、画像生成部502から取得した魚眼映像を分割する。そして、歪補正処理部507は、画像分割部506で分割された画像に対して、歪補正処理を行う。出力部508は、切り出し映像及びダブルパノラマ映像を、通信部509を介してネットワーク108に配信する。
S1315において、画像分割設定部504は、全体を表示するためのダブルパノラマ映像のための切り出し位置を設定する。ダブルパノラマ映像生成のために領域701と領域702とに分割する際に、画像分割設定部504は、人物が切れないように切り出し位置を設定する。そして、画像分割部506は、画像分割設定部504が設定した切り出し位置に従って、画像生成部502から取得した魚眼映像を分割する。そして、歪補正処理部507は、画像分割部506で分割された画像に対して、歪補正処理を行う。そして、出力部508は、ダブルパノラマ映像を、通信部509を介してネットワーク108に配信する。
以上、説明したように、変形例1のカメラは、会議に登録された人物、特に会議に必須な人物を優先的に個別の映像である切り出し映像として、それ以外の人物についてもダブルパノラマ映像として配信する。このことで、会議に参加している人がわかりやすく映るように表示することができる。
変形例1は、優先度の項目として「必須」と「任意」のみを用いたが、さらに細かく分類してもよい。画像分割設定部504は、ダブルパノラマ映像のための切り出し位置を設定する際に、必須な人物を優先的に切れないようにしてもよい。
(変形例2)
実施形態1及び変形例1では、会議に登録された人物をできる限り個別の映像である切り出し映像として配信した。しかし、図10のような部分画像を繋げて1つの画像とした映像の方が通信帯域を削減でき、ユーザとしても見やすい場合がある。そこで変形例2のカメラは、図10のようなクアッドパノラマで表示可能な場合は、この形式の映像を配信する。
以下、図15を参照して、変形例2の配信する映像種別を決定する情報処理について説明する。
図15は、配信する映像種別を決定する情報処理の一例を示すフローチャートである。
S1501からS1503までの処理は、S1201からS1203までの処理と同様であるため、説明を省略する。
S1503で、顔認識処理部503は、登録されていない人物が存在する場合、S1504に進み、登録されていない人物が存在しない場合、S1513に進む。
S1504において、顔認識処理部503は、登録されていない人物と特定された人物をあわせた数が、クアッドパノラマ映像の切り出し画像の数である4人であるかどうかを判定する。顔認識処理部503は、人物の数が4人であった場合、S1505に進み、人物の数が4人でなかった場合、S1508に進む。
S1505において、画像分割設定部504は、人物の位置を検知し、切り出し映像のための切り出し位置を設定する。そして、画像分割部506は、画像分割設定部504が設定した切り出し位置に従って、画像生成部502から取得した魚眼映像を分割する。そして、歪補正処理部507は、画像分割部506で分割された画像に対して、歪補正処理を行う。出力部508は、歪補正処理を行った各分割映像を繋げることでクアッドパノラマ映像を生成する。出力部508は、クアッドパノラマ映像を、通信部509を介してネットワーク108に配信する。
S1506において、顔認識処理部503は、特定された人物の数が、クアッドパノラマ映像の切り出し画像の数である4人であるかどうかを判定する。顔認識処理部503は、特定された人物の数が4人である場合、S1507に進み、特定された人物の数が4人でない場合、S1508に進む。
S1507において、画像分割設定部504は、人物の位置を検知し、切り出し映像のための切り出し位置を設定する。また、画像分割設定部504は、全体を表示するためのダブルパノラマ映像のための切り出し位置も設定する。ダブルパノラマ映像生成のために領域701と領域702とに分割する際に、画像分割設定部504は、人物が切れないように切り出し位置を設定する。そして、画像分割部506は、画像分割設定部504が設定した切り出し位置に従って、画像生成部502から取得した魚眼映像を分割する。そして、歪補正処理部507は、画像分割部506で分割された画像に対して、歪補正処理を行う。出力部508は、歪補正処理を行った各分割映像を繋げることでクアッドパノラマ映像を生成する。出力部508で、クアッドパノラマ映像及びダブルパノラマ映像を、通信部509を介してネットワーク108に配信する。
S1508、S1509、S1510、S1511及びS1512の処理は、それぞれ、S1204、S1205、S1206、S1207及びS1208の処理と同様であるため、説明を省略する。
S1513において、顔認識処理部503は、特定された人物の数が、クアッドパノラマ映像の切り出し画像の数である4人であるかどうかを判定する。顔認識処理部503は、特定された人物の数が4人である場合、S1514に進み、特定された人物の数が4人でない場合、S1515に進む。
S1514において、画像分割設定部504は、特定された人物の位置を検知し、切り出し映像のための切り出し位置を設定する。そして、画像分割部506は、画像分割設定部504が設定した切り出し位置に従って、画像生成部502から取得した魚眼映像を分割する。そして、歪補正処理部507は、画像分割部506で分割された画像に対して、歪補正処理を行う。出力部508は、歪補正処理を行った各分割映像を繋げることでクアッドパノラマ映像を生成する。そして、出力部508は、クアッドパノラマ映像を、通信部509を介してネットワーク108に配信する。
S1515、S1516及びS1517の処理は、S1209、S1210及びS1211の処理と同様である。
以上、説明したように、変形例2のカメラは、クアッドパノラマで表示可能な場合は、この形式の映像を配信することで、会議に参加している人がわかりやすく映るように表示することができる。
変形例2のカメラは、S1504、S1506及びS1513では、人物の数が4人の場合のみクアッドパノラマ映像を出力するように判定したが、人物の数が4人以下の場合はすべてクアッドパノラマで出力するように判定してもよい。
また、変形例2のカメラでは部分画像を繋げて1つの画像とする映像の形式として4つの画像を繋げるクアッドパノラマ映像を用いたが、4つの画像である必要はない。その場合、カメラは、S1504及びS1506、S1513で判定する人数も部分画像の数に合わせて変更する。
<実施形態2>
実施形態1の図5は、カメラ103及び106の各構成をハードウェアで実装した場合を例に説明を行った。しかし、図5に示した構成の一部をソフトウェアとしてカメラに実装するようにしてもよい。
図16は、カメラ103及び106のハードウェア構成の一例を示す図である。
図16に示されるように、カメラは、撮像部501と、CPU1601と、メモリ1602と、入力部1603と、表示部1604と、通信部509と、を有する。
撮像部501及び通信部509は、実施形態1のそれらと同様である。
CPU1601は、カメラ全体を制御する。メモリ1602は、プログラム及びCPU1601がプログラムに基づき処理を実行する際に使用するデータ等を記憶する。入力部1603は、ボタン等を介したユーザ操作に関する上オフをCPU1061に入力する。表示部1604は、CPU1061の処理の結果を表示する。
CPU1061がメモリ1602に記憶されたプログラムに基づき処理を実行することによって、実施形態1の画像生成部502〜出力部508が、実施形態2ではソフトウェア構成として実現される。また、CPU1061がメモリ1602に記憶されたプログラムに基づき処理を実行することによって、上述した図12、図13及び図15のフローチャートの処理が実現される。
実施形態2によっても、会議に参加している人がわかりやすく映るように、適切な画像分割処理及び歪補正処理を行った画像を提供することができる。
<その他の実施形態>
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給する。そして、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読み出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
以上、本発明の実施形態の一例について詳述したが、本発明は係る特定の実施形態に限定されるものではない。例えば、ダブルパノラマ映像を、分割した領域701と領域702を図8のように上下に並べた映像としたが、領域701及び領域702を横に並べた映像としてもよい。また、フローチャートの処理を、会議端末装置が実行するようにしてもよい。
103、106 撮像装置
1601 CPU

Claims (13)

  1. 会議参加者の顔情報を取得する取得手段と、
    魚眼レンズを用いて撮像された撮像画像から人物を検知し、前記会議参加者の顔情報を用いて検知した人物を特定する特定手段と、
    前記人物の数に従って、前記撮像画像から部分画像を切り取る切り取り手段と、
    前記人物の数に従って、前記部分画像に対して歪みを補正する補正手段と、
    前記補正手段により補正された部分画像を出力する出力手段と、
    を有する画像処理装置。
  2. 前記切り取り手段は、前記特定手段により特定された人物の数に従って、特定された人物を切り取るよう前記撮像画像から部分画像を切り取る請求項1に記載の画像処理装置。
  3. 前記切り取り手段は、前記特定手段により特定された人物の数に従って、全体を2分割した映像を生成するために前記撮像画像から部分画像を切り取る請求項1に記載の画像処理装置。
  4. 前記切り取り手段は、前記特定手段により特定された人物の数に従って、複数の切り出し画像を結合した映像を生成するために前記撮像画像から部分画像を切り取る請求項1に記載の画像処理装置。
  5. 前記切り取り手段は、前記特定手段により特定された人物の数に従って、切り出し映像を生成するために前記撮像画像から部分画像を切り取る請求項1に記載の画像処理装置。
  6. 前記切り取り手段は、前記撮像画像から部分画像を切り取る際は、人物が切れないように前記撮像画像から部分画像を切り取る請求項1乃至5の何れか1項に記載の画像処理装置。
  7. 前記補正手段は、前記特定手段により特定された人物の数に従って、前記部分画像に対して歪みを補正する請求項1乃至6の何れか1項に記載の画像処理装置。
  8. 前記切り取り手段は、前記特定手段により特定された人物の数と、会議における会議参加者ごとの優先度と、に従って、前記撮像画像から部分画像を切り取る請求項1に記載の画像処理装置。
  9. 前記補正手段は、前記特定手段により特定された人物の数と、会議における会議参加者ごとの優先度と、に従って、前記部分画像に対して歪みを補正する請求項1又は8に記載の画像処理装置。
  10. 前記出力手段は、前記人物の数に従って、出力する部分画像を変更する請求項1乃至9の何れか1項に記載の画像処理装置。
  11. 前記画像処理装置は、撮像装置である請求項1乃至10の何れか1項に記載の画像処理装置。
  12. 会議参加者の顔情報を取得する取得工程と、
    魚眼レンズを用いて撮像された撮像画像から人物を検知し、前記会議参加者の顔情報を用いて検知した人物を特定する特定工程と、
    前記人物の数に従って前記撮像画像から部分画像を切り取る切り取り工程と、
    前記人物の数に従って前記部分画像に対して歪みを補正する補正工程と、
    前記補正工程により補正された部分画像を出力する出力工程と、
    を含む画像処理方法。
  13. コンピュータを、請求項1乃至11の何れか1項に記載の画像処理装置の各手段として機能させるためのプログラム。
JP2019056381A 2019-03-25 2019-03-25 画像処理装置、画像処理方法及びプログラム Pending JP2020160538A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019056381A JP2020160538A (ja) 2019-03-25 2019-03-25 画像処理装置、画像処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019056381A JP2020160538A (ja) 2019-03-25 2019-03-25 画像処理装置、画像処理方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2020160538A true JP2020160538A (ja) 2020-10-01

Family

ID=72643330

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019056381A Pending JP2020160538A (ja) 2019-03-25 2019-03-25 画像処理装置、画像処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2020160538A (ja)

Similar Documents

Publication Publication Date Title
JP6547496B2 (ja) 通信装置、通信方法、プログラムおよび通信システム
US10880519B2 (en) Panoramic streaming of video with user selected audio
US9894320B2 (en) Information processing apparatus and image processing system
US11736801B2 (en) Merging webcam signals from multiple cameras
JP6171263B2 (ja) 遠隔会議システム及び遠隔会議端末
KR100986228B1 (ko) 카메라 장치 및 화상 기록 재생 방법
JP6551155B2 (ja) 通信システム、通信装置、通信方法およびプログラム
US10237495B2 (en) Image processing apparatus, image processing method and storage medium
US20060164552A1 (en) Embedding a panoramic image in a video stream
CA2874715A1 (en) Dynamic video and sound adjustment in a video conference
JP6582874B2 (ja) 通信システム、通信装置、通信方法およびプログラム
JP2004129071A (ja) 双方向コミュニケーションシステム
CN113905204B (zh) 图像显示方法、装置、设备及存储介质
JP2003111041A (ja) 画像処理装置、画像処理システム、画像処理方法、記憶媒体、及びプログラム
CN114531564A (zh) 处理方法及电子设备
US20170034481A1 (en) Imaging apparatus, medium, and method for imaging
JP2004239968A (ja) プロジェクタ
US11622175B2 (en) Electronic apparatus and control method thereof
JP2020160538A (ja) 画像処理装置、画像処理方法及びプログラム
US20220400244A1 (en) Multi-camera automatic framing
JP2006180022A (ja) 画像処理システム
US20200366837A1 (en) Electronic apparatus, control method of electronic apparatus, and non-transitory computer readable medium
JP2013232830A (ja) 画像処理システム、画像処理装置、画像処理方法および画像処理プログラム
JP2017092675A (ja) 情報処理装置、会議システム、情報処理方法およびプログラム
JP2011066745A (ja) 端末装置、通信方法および通信システム