JP2020021211A - 画像処理装置、画像処理方法及びプログラム - Google Patents

画像処理装置、画像処理方法及びプログラム Download PDF

Info

Publication number
JP2020021211A
JP2020021211A JP2018143508A JP2018143508A JP2020021211A JP 2020021211 A JP2020021211 A JP 2020021211A JP 2018143508 A JP2018143508 A JP 2018143508A JP 2018143508 A JP2018143508 A JP 2018143508A JP 2020021211 A JP2020021211 A JP 2020021211A
Authority
JP
Japan
Prior art keywords
image
handwriting
angle
view
imaging device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018143508A
Other languages
English (en)
Inventor
茂雄 福岡
Shigeo Fukuoka
茂雄 福岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2018143508A priority Critical patent/JP2020021211A/ja
Publication of JP2020021211A publication Critical patent/JP2020021211A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Facsimile Scanning Arrangements (AREA)
  • Studio Devices (AREA)

Abstract

【課題】遠隔地において視認性の高い表示を得る画像処理装置、画像処理方法及びプログラムを提供する。【解決手段】撮影画角を制御できる撮影装置で撮影された映像から手書き行為を検出し、手書き行為が行われている紙に対応する画像データベースに蓄積されている画像データを特定し、手書き行為が行われている紙に対応する手書き位置を検出し、手書き位置を用いて撮影装置の画角を制御し、撮影装置が撮影した映像を送信し、手書き位置、撮影装置の画角から、画像データに手書き行為の映像を重畳表示するためのパラメータを決定する。【選択図】図2

Description

本発明は、ネットワークで接続した遠隔地でデータを表示させる技術に関するものである。
デザイン画のような複数の紙を対象としてコンペやレビューを行う場合において、レビュー責任者となる人物がコメントや指示を手書きで書き込むことがある。このようなデザイン画のレビューは、すべての対象となる紙とレビューの作成者を1ヵ所に集めて行われるのが通常であるが、人員の移動コストなどを考慮し作成者は複数の拠点にいる状態でネットワークを介してレビューを行うシステムが求められている。
ネットワークで接続された遠隔地とビデオ会議を行うシステムが存在する。通常のビデオ会議システムでは、カメラによって撮影されているライブ映像やコンピュータの画面、マイクからの音声を双方向に通信し、共有することによって会議が行われる。このようなシステムを使うことによって、遠隔地ではライブ映像と音声によってレビューの状況を共有することができる。
特許文献1では、映像中から動きのある被写体を検知して、一定の大きさで撮影できるように撮影装置のパン・チルト・ズームを制御して撮影を行っている。このような技術をビデオ会議システムに適用することによって、被写体(人物、紙)などを自動で追尾し一定の大きさで撮影を続けるシステムが構築できる。
特許文献2では、ビデオ会議システムにおいて、映像を手書き可能なスクリーンに投影し、片方で手書きされた情報を他方へ送信して合成画像を表示することが行われている。
合成画像を生成する場合において、特許文献3では、重なりあう領域を持つ2枚の画像に共通して存在する特徴点をマッチングすることによって位置ずれのない合成画像の生成が行われている。
特開2013−243640号公報 特開2011−217350号公報 特開2005−328497号公報
ビデオ会議システムを使い、撮影装置によって手書きされた紙全体を撮影して遠隔地で表示する。撮影装置と紙の位置関係により映像には3次元的な歪みがあり、長方形の紙は台形のような形状に撮影される。カメラから遠い位置にある情報は少ない画素で構成されるため、手書き部分が不鮮明となり読みづらくなる場合がある。
逆に、映像中の手を被写体として認識し、その周辺をズームアップするように撮影装置のパン・チルト・ズームを制御して撮影を行うと、手書き部分は視認しやすくなるが、紙全体が見えないため、どの部分を指しているのかを理解することが難しくなる。
本発明は上記の課題に鑑みてなされたものであり、遠隔地において視認性の高い表示を得る画像処理装置を提供することを目的とする。また、その方法、及びプログラムを提供することを目的とする。
本発明に係る画像処理装置は以下の構成を備える。即ち、撮影画角を制御できる撮影装置で撮影された映像から手書き行為を検出する行為検出手段と、前記手書き行為が行われている対象に対応する画像データベースに蓄積されている画像データを特定する特定手段と、前記手書き行為が行われている対象に対応する手書き位置を検出する位置検出手段と、前記手書き位置を用いて前記撮影装置の画角を制御する画角制御手段と、前記撮影装置が撮影した映像を送信する手段と、前記手書き位置、撮影装置の画角から、前記画像データに手書き行為の映像を重畳表示するためのパラメータを決定する決定手段。
本発明によれば、遠隔地において視認性の高い表示を得ることができる。
画像処理システムの構成例 レビュー地映像処理のフローチャート 遠隔地映像処理のフローチャート 紙面検出例 レビュー対象紙検出例 ズームアップ撮影画角例 ズームアップ撮影重畳映像例
[実施形態1]
レビュー地と遠隔地をネットワークで接続して行われるレビューにおいて、レビュー地にレビュー対象となる紙が全て集められており、レビュー責任者などのコメントや指示が手書きされる。レビュー対象の紙は、スキャンするか、電子データからレンダリングすることによって画像データベースにあらかじめ蓄積されているものとする。遠隔地においては、レビュー地にあるカメラによって撮影された映像がライブで投影することや、画像データベースに蓄積されている画像を投影できるものとする。
図1は実施形態1の画像処理システムの構成を示すブロック図である。
撮影装置101は、映像の撮影装置である。ネットワーク104に繋がることで、映像データを画像処理サーバ106や遠隔地側の表示装置107へ送信することができる。
マイク102は、レビュー地に存在するマイクである。このマイクから入力されたサウンドデータは遠隔地のスピーカー109に出力される。
スピーカー103は、レビュー地に存在するスピーカーである。このスピーカーからは遠隔地のマイク108から入力されたサウンドデータが出力される。
ネットワーク104は、レビュー地に存在する装置、遠隔地に存在する装置、画像処理サーバなどを繋ぐネットワークである。LANで接続されても良いし、公衆回線を経由して接続されても良い。
画像データベース105は、レビュー対象となる紙をスキャンすることや、電子データをレンダリングすることで生成した画像データを保存するデータベースである。本システムでは、レビュー対象となる全ての紙の画像は、あらかじめ生成されて画像データベース105に蓄積されているものとする。本実施形態では、紙を対象として手書き行為を行う例について説明するが、対象は電子データでも良い。
画像処理サーバ106は、画像データベース105に接続されており、画像データベースから得られた画像データや撮影装置101で撮影された映像データに対して各種画像処理を実行する画像処理装置である。画像処理装置はCPUを備え、CPUはプログラムを実行することで各種の手段として機能しても良い。また、CPUと画像処理装置の動作を制御する制御回路との協調によってこれらの手段が実現されてもよい。また、CPUは単一のものである必要はなく、複数であってもよい。この場合、複数のCPUは分散して処理を実行することが可能である。また、複数のCPUは単一のコンピュータに配置されていてもよいし、物理的に異なる複数のコンピュータに配置されていてもよい。なお、CPUがプログラムを実行することで実現する手段が専用の回路によって実現されてもよい。
図1では、画像処理サーバ106は、1つの装置としてネットワークを介して接続されるように描いているが、撮影装置101と直接繋がる位置や表示装置107と直接繋がる位置に別の画像処理サーバとして存在し、複数台から構成されても良い。
表示装置107は、撮影装置101からの映像データや画像処理サーバ106で処理された画像データや映像データを遠隔地において表示するための表示装置である。複数人で見ることが想定されるため、大画面のディスプレイ装置やプロジェクタが表示装置となる。
マイク108は、遠隔地に存在するマイクである。このマイクから入力されたサウンドデータはレビュー地のスピーカー103に出力される。
スピーカー109は、遠隔地に存在するスピーカーである。このスピーカーからはレビュー地のマイク102から入力されたサウンドデータが出力される。
図1に示した構成のシステムで、レビュー地で行われた手書き部分を、手書き中や手書き行為の終了後に関わらず、遠隔地において視認性の高い表示を得る手段を説明する。
図2は実施形態1の撮影デバイスからサーバの処理を示すフローチャートである。以下、フローチャートは、CPUが制御プログラムを実行することにより実現されるものとする。
まず、ステップS201は、終了指示があるかどうかを判定するステップである。終了の指示があるまで、S202以降の処理を繰り返すことになる。
ステップS202は、初期撮影画角を設定するステップである。撮影装置101にパン・チルト・ズームの設定をすることで初期撮影画角を設定する。初期状態においては、複数の紙面が撮影できるように広角になるようにズームを調整するものとする。
ステップS203は、撮影装置101から得られた映像から撮影画角内に存在する複数の紙面を検出するステップである。図4に示すように、撮影装置101から得られる映像には、複数の紙が3次元的な歪みをもって映っている。紙面検出は、映像から得られる1フレームの画像を使い、直線となるエッジを検出し、それらが4角形を構成する組み合わせを選ぶことで行うことができる。
ステップS204は、ステップS203の紙面検出処理によって紙面が検出できているかどうかを判定するステップである。検出できていればステップS205へ進み、検出できていなければ、ステップS203の紙面検出処理に戻る。
ステップS205は、撮影装置101から得られた映像内にある複数の紙面からレビュー対象となっている紙面を特定するステップである。ある紙のレビューが開始されると、書き込みや指差し行為のために映像中に手が映り込むため図5のような映像が取得できる。映像から得られる1フレームの画像を使い、手の検出処理を行う。手が検出できた場合において、検出されている複数の紙面の中からどの紙面に重なっているかを判断することによってレビュー対象の紙面を特定する。手の検出処理においては、右手・左手の区別や手の方向・姿勢も取得する。これらは機械学習で行う場合は学習データを区別して作成することによって検出が可能となる。手を検出し、手書き行為検出を行う。同時に複数の手が検出された場合は、例えば手の姿勢がペンを持つような姿勢であるか、指差しする姿勢であるかなどによって判断する。また紙を押さえるような姿勢であるものは除外することによって対象となる手の数を絞り込むこともできる。この時に袖の色情報などを取得しておくことで、次回以降の検出処理において対象を絞り込んでも良い。
ステップS206は、ステップS205の対象紙面特定処理によってレビュー対象の紙面が特定できているかどうかを判定するステップである。特定できていればステップS207へ進み、特定できていなければ、ステップS205の対象紙面特定処理に戻る。
ステップS207は、画像データベース105にあるレビュー対象の画像を特定するステップである。この処理では、撮影装置101から得られた画像からレビュー対象の紙面の領域を切り出して特徴点を抽出する。画像データベース105に保存されている全ての画像を対象にして同様に特徴点を抽出し、RANSACなどの手法を使って特徴点のマッチングを行うことでレビュー対象の画像を特定することができる。
ステップS208は、ステップS207のDB画像特定処理が特定できたかどうかを判定するステップである。DB画像が特定できていれば、ステップS209へ進み、特定できていなければ、ステップS207のDB画像特定処理へ戻り、別のフレーム画像を使って再度特定処理を行う。
ステップS209は、遠隔地のシステムに対して、ステップS207で特定されたDB画像を通知するステップである。
ステップS210は、遠隔地に手書きやジェスチャーをズームアップで撮影し、高精細映像を送信するための撮影画角を決定するステップである。この処理においては、図6に示す画像が得られており、ステップS205で得られたレビュー対象紙面と手の位置から画像の中での手の進む方向を決定し、画角を決定する。例えば横書きで書き込むことを前提とするならば、手の検出位置から手の移動方向右側と下側を広く撮影する。また、レビュー責任者の使用する使用言語やレビュー対象紙面に書き込まれている言語やその文字の並び(日本語の縦書き)の情報があれば、手の動く筆記方向を推定しても良い。手書き行為が行われている紙に対応する手書き位置検出を行って、撮影画角を決定している。
ステップS211は、遠隔地において、ズームアップ撮影された高精細映像をDB画像に重畳表示するためのパラメータを決定するステップである。撮影装置101から得られる映像は3次元的な歪みを持つため、DB画像を重畳するときに歪みを補正し、位置を合わせるための画像変換のパラメータである。
ステップS212は、ステップS211で決定したパラメータを遠隔地のシステムへ送信するステップである。遠隔地のシステムは、このパラメータに従って撮影装置101から送信される映像を補正し、DB画像に位置合わせして重畳する。
ステップS213は、ステップS210で決定したズームアップ撮影の画角にしたがって撮影装置101のパン・チルト・ズームを設定する画角制御のステップである。以降は、遠隔地へはこの設定の映像が送信される。
ステップS214は、撮影装置101から得られる映像からズームアップ撮影を継続するかどうかを判定するステップである。例えば、単純な動き検出によって動きが検出できていれば継続と判定する。また、手の検出処理を行って検出されていれば継続と判定する。
ステップS215は、ステップS214のズームアップ撮影継続判定処理によって撮影を継続するかを切り替えるステップである。継続しない場合はステップステップ215へ進み、継続する場合はステップS214のズームアップ撮影継続判定処理に戻り、別のフレーム画像を使って再度判定処理を行う。継続しないと判定する条件を、ステップS214の結果が過去N回などあらかじめ決めた回数分継続しないと判定された場合としても良い。
ステップS216は、レビュー対象紙面に書き込まれた手書き部分をライブ映像以外でも見ることができるように永続データ化する処理を行うステップである。手書き部分は、文字だけではなく、手書きのイラストや図を含むものとする。永続化したデータを重畳した画像を生成する。
ステップS217は、遠隔地のシステムにズームアップ映像の重畳表示の終了を通知するステップである。この通知以降は、遠隔地においてはステップS216で得られた手書き部分の永続化が行われた画像が表示される。
次に遠隔地側の動作について図3を用いて説明する。
ステップS301は、遠隔地側の映像表示を撮影装置101の映像となるように指示するステップである。このステップ以降、遠隔地側では撮影装置101の映像が表示される。
ステップS302は、サーバからレビュー対象に対応するDB画像の通知を受信するステップである。通常は画像を一意に決定することができるIDを受信する。
ステップS303は、ステップS302においてDB画像のIDが受信したかどうかを判定するステップである。受信できていればステップS304に進み、受信できていなければステップS313に進む。
ステップS304は、DB画像と既に生成された手書き部分の永続化データを取得するステップである。
ステップS305は、DB画像と手書き部分の永続化データを静止画として表示することを指示するステップである。このステップ以降、遠隔地側ではステップS304で取得したDB画像と永続化データが表示されることになる。
ステップS306は、撮影装置101から送られてくる手書き部分のズームアップ撮影のライブ映像をステップS304で得たDB画像に対して重畳表示するためのパラメータを受信するステップである。
ステップS307は、ステップS306でパラメータを受信したかどうかを判定するステップである。受信した場合は、ステップS307に進み、受信していない場合は、ステップS306に戻り、パラメータ受信を行う。
ステップS308は、S304で得たDB画像と手書き部分の永続化データに対してステップS306で受信したパラメータに従って撮影装置101から送られてくる映像を変換して重畳表示するステップである。例えば、撮影装置101から送られてくる映像が図7(A)に示すものであった場合に、表示装置107に表示される映像は、図7(B)に示すものとなる。
ステップS309は、サーバからズームアップ映像表示の終了通知を受信するステップである。
ステップS310は、ステップS309で終了通知を受信できたかどうかを判定するステップである。受信できている場合は、ステップS311に進み、受信できていない場合は、ステップS308に進むことによって、重畳表示処理を続ける。
ステップS311は、サーバ側のステップS216で生成された手書き部分の永続化データを受信するステップである。
ステップS312は、ズームアップ映像の重畳表示を終了し、DB画像と手書き部分の永続化データを遠隔地の表示することを指示するステップである。このステップ以降は、遠隔地側ではステップS304で取得したDB画像と永続化データに加え、ステップS311で受信した新たな永続化データが表示されることになる。このステップの後ステップS302に戻ることで、次のDB画像通知が受信できるまで、S312で指示した表示が継続されることになる。
ステップS313は、現在の表示対象となっているものを継続して表示するステップである。
ステップS314は、システムの終了指示があるかどうかを判定するステップである。終了指示が無ければステップS302に戻ることで、次のDB画像通知が受信できるまで、現在の表示が継続されることになる。終了指示があれば本フローを終了し、遠隔地側のシステムを停止する。
以上の図2、図3で説明したフローによって、レビュー地において手書き行為が行われている間は、遠隔地において手書き部分をズームアップ撮影した映像が、DB画像に位置を合わせて重畳表示される。レビュー地において手書き行為が終了すると、手書き部分の永続化データをDB画像に位置合わせして重畳表示できる。よって、レビュー地で行われた手書き部分は、手書き中や手書き行為の終了後に関わらず、遠隔地において視認性の高い表示を得ることができる。
[実施形態2]
実施形態1において、遠隔地での手書き部のズームアップ撮影のライブ映像がそのままDB画像に重畳表示しているが、この場合は、手が映り込むことによって隠れてしまう情報が存在する。このような場合において、ズームアップ映像を蓄積しておき、現在のフレームで手が存在する領域に対し、過去のフレームで手が重なっていないフレームを探索し、存在する場合は現在のフレームと合成することにより手を消したフレームを生成することができる。
この処理により、遠隔地では手書き部分のズームアップ映像が重畳表示されている場合において、手の隠れの少なく手書き部が多く視認できる映像を得ることができる。
以上、実施形態を詳述したが、本発明は上述の実施形態に限定されるのではなく、本発明の趣旨を逸脱しない限りにおいて適宜変更が可能である。
本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能である。具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
101 撮影装置
102 レビュー地のマイク
103 レビュー地のスピーカー
104 ネットワーク
105 画像データベース
106 画像処理サーバ
107 表示装置
108 遠隔地のマイク
109 遠隔地のスピーカー

Claims (5)

  1. 撮影画角を制御できる撮影装置で撮影された映像から手書き行為を検出する行為検出手段と、
    前記手書き行為が行われている対象に対応する画像データベースに蓄積されている画像データを特定する特定手段と、
    前記手書き行為が行われている対象に対応する手書き位置を検出する位置検出手段と、
    前記手書き位置を用いて前記撮影装置の画角を制御する画角制御手段と、
    前記撮影装置が撮影した映像を送信する手段と、
    前記手書き位置、撮影装置の画角から、前記画像データに手書き行為の映像を重畳表示するためのパラメータを決定する決定手段と、
    を備えることを特徴とする画像処理装置。
  2. 映像中の手の向き、前記手書き行為をする人物の使用言語、紙の横書きまたは縦書きの情報を元に筆記方向を推定する手段と、
    前記手書き位置に筆記方向を加えて撮影装置の撮影画角を決定する手段を持つことを特徴とする請求項1記載の画像処理装置。
  3. 前記手書き行為が検出されなくなった場合に、
    手書き部分を永続データ化する手段と、
    紙の画像データに手書き部分を永続化したデータを重畳した画像を生成する生成手段と、
    前記生成手段で得られた画像を表示する表示手段を有することを特徴とする請求項1記載の画像処理装置。
  4. 撮影画角を制御できる撮影装置で撮影された映像から手書き行為を検出する行為検出工程と、
    前記手書き行為が行われている紙に対応する画像データベースに蓄積されている画像データを特定する特定工程と、
    前記手書き行為が行われている紙に対応する手書き位置を検出する位置検出工程と、
    前記手書き位置を用いて前記撮影装置の画角を制御する画角制御工程と、
    前記撮影装置が撮影した映像を送信する送信工程と、
    前記手書き位置、撮影装置の画角から、前記画像データに手書き行為の映像を重畳表示するためのパラメータを決定する決定工程と、
    を備えることを特徴とする画像処理方法。
  5. コンピュータを、
    撮影画角を制御できる撮影装置で撮影された映像から手書き行為を検出する行為検出手段と、
    前記手書き行為が行われている紙に対応する画像データベースに蓄積されている画像データを特定する特定手段と、
    前記手書き行為が行われている紙に対応する手書き位置を検出する位置検出手段と、
    前記手書き位置を用いて前記撮影装置の画角を制御する画角制御手段と、
    前記撮影装置が撮影した映像を送信する手段と、
    前記手書き位置、撮影装置の画角から、前記画像データに手書き行為の映像を重畳表示するためのパラメータを決定する決定手段と、として機能させるためのプログラム。
JP2018143508A 2018-07-31 2018-07-31 画像処理装置、画像処理方法及びプログラム Pending JP2020021211A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018143508A JP2020021211A (ja) 2018-07-31 2018-07-31 画像処理装置、画像処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018143508A JP2020021211A (ja) 2018-07-31 2018-07-31 画像処理装置、画像処理方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2020021211A true JP2020021211A (ja) 2020-02-06

Family

ID=69587533

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018143508A Pending JP2020021211A (ja) 2018-07-31 2018-07-31 画像処理装置、画像処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2020021211A (ja)

Similar Documents

Publication Publication Date Title
JP6786378B2 (ja) 情報処理装置、情報処理方法及びプログラム
US8472667B2 (en) Editing apparatus and method
CN108965656B (zh) 显示控制设备、显示控制方法和存储介质
JP2004318823A (ja) 情報表示システム、情報処理装置、ポインティング装置および情報表示システムにおけるポインタマーク表示方法
JP2006197505A (ja) カメラ制御装置、カメラシステム、電子会議システムおよびカメラ制御方法
JP6622650B2 (ja) 情報処理装置及びその制御方法、撮影システム
JP2016127571A (ja) カメラシステム、表示制御装置、表示制御方法、及びプログラム
JP2006245648A (ja) 情報処理システム、情報処理装置および情報処理方法、プログラム、並びに記録媒体
US9848168B2 (en) Method, synthesizing device, and system for implementing video conference
KR20160094655A (ko) 복수의 고해상도 카메라들을 이용한 파노라마 영상 감시 시스템 및 그 방법
JP2007158680A (ja) 追尾撮像装置およびこれを利用した追尾撮像システム
EP3062506B1 (en) Image switching method and apparatus
JP6073474B2 (ja) 位置検出装置
KR101613438B1 (ko) 증강현실 컨텐츠의 생성 및 재생 시스템과, 이를 이용한 방법
JP6483661B2 (ja) 撮像制御装置、撮像制御方法およびプログラム
KR101518696B1 (ko) 증강현실 컨텐츠의 생성 및 재생 시스템과, 이를 이용한 방법
CN110636204B (zh) 一种面部抓拍系统
CN110708502A (zh) 自动检测数字流并将其插入360度视频的系统、方法和介质
JP2020021211A (ja) 画像処理装置、画像処理方法及びプログラム
JP2012124767A (ja) 撮像機器
JP2020101897A (ja) 情報処理装置、情報処理方法及びプログラム
JP2004007283A (ja) 映像配信システム、プログラム及び記録媒体
JP5162855B2 (ja) 画像処理装置、遠隔画像処理システム及び画像処理方法
KR101619953B1 (ko) 감시카메라용 자동 다중 추적 영상처리방법
CN112672057A (zh) 拍摄方法及装置