JP2017182672A - 情報処理方法および情報処理装置、プログラム - Google Patents

情報処理方法および情報処理装置、プログラム Download PDF

Info

Publication number
JP2017182672A
JP2017182672A JP2016072595A JP2016072595A JP2017182672A JP 2017182672 A JP2017182672 A JP 2017182672A JP 2016072595 A JP2016072595 A JP 2016072595A JP 2016072595 A JP2016072595 A JP 2016072595A JP 2017182672 A JP2017182672 A JP 2017182672A
Authority
JP
Japan
Prior art keywords
imaging
region
light
captured
difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016072595A
Other languages
English (en)
Inventor
泰輔 石黒
Taisuke Ishiguro
泰輔 石黒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2016072595A priority Critical patent/JP2017182672A/ja
Publication of JP2017182672A publication Critical patent/JP2017182672A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Input (AREA)
  • Facsimile Scanning Arrangements (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Studio Devices (AREA)
  • Image Analysis (AREA)

Abstract

【課題】 紙面と紙面が置かれた領域が類似色の場合にも精度良く紙面領域検出を行う。【解決手段】 第1の物体と当該第1の物体の平面領域内にある第2の物体とに光を投影し、前記第1の物体と前記第2の物体とに前記光が投影されている状態を撮像し、前記撮像手段が撮像した撮像画像における前記第1の物体の領域の画素と前記第2の物体があると予め定められている領域の画素との輝度値の差を、異なる色の光を前記投影手段が投影した状態をそれぞれ前記撮像手段が撮像した複数の撮像画像において取得し、前記輝度値の差に基づいて、前記複数の撮像画像の少なくとも1つから前記第1の物体と前記第2の物体との領域の境界を検出する。【選択図】 図1

Description

本発明は、物体の領域を検出する情報処理方法および情報処理装置、プログラムに関するものである。
カメラを用いて現実世界に存在する紙物体の位置と大きさを検出する技術(以降、「紙面検出技術」、「紙面領域検出技術」とも記載する)が知られている(特許文献1)。特許文献1においては、カメラを使った紙面検出技術として、紙面を配置した状態を撮影し、撮影画像からエッジを抽出することで、紙面に相当する領域を検出している。
特開2008−78949
しかしながら、上記の手法では、撮影画像から紙面に相当する領域のエッジを正確に抽出できない可能性がある。エッジ抽出の方法としては、画像内の画素間の輝度差を見て、輝度差が所定の閾値を超えた場合に、該画素間のエッジとして抽出する方法が知られているが、本手法では輝度差が閾値を超えない場合、エッジを抽出することができない。カメラを使って紙面を撮影する場合、紙面領域の画素と紙面が置かれた机面領域の画素とで輝度差がない可能性があるため、紙面領域のエッジを抽出できない可能性が生じる。輝度差の閾値を下げると、実際にはエッジではない箇所をエッジとして抽出してしまう可能性が生じる。結果として、紙面領域ではない領域を検出してしまうことが生じうる。
本発明は上記の課題に鑑みてなされたものであり、物体の領域の検出精度を向上させる情報処理装置を提供することを目的とする。また、その方法、及びプログラムを提供することを目的とする。
本発明に係る情報処理装置は以下の構成を備える。即ち、第1の物体と当該第1の物体の平面領域内にある第2の物体とに光を投影する投影手段と、前記第1の物体と前記第2の物体とに前記光が投影されている状態を撮像する撮像手段と、前記撮像手段が撮像した撮像画像における前記第1の物体の領域の画素と前記第2の物体があると予め定められている領域の画素との輝度値の差を、異なる色の光を前記投影手段が投影した状態をそれぞれ前記撮像手段が撮像した複数の撮像画像において取得する取得手段と、前記輝度値の差に基づいて、前記複数の撮像画像の少なくとも1つから前記第1の物体と前記第2の物体との領域の境界を検出する検出手段。
本発明によれば、物体の領域の検出精度を向上させることが可能になる。
実施形態における情報処理装置を使用したときの外観である。 実施形態におけるハードウェア構成の一例を示すブロック図である。 実施形態における情報処理装置の構成を示すブロック図である。 実施形態における処理の全体の流れを示すフローチャートである。 実施形態における投影光のパラメータを保持するテーブルの一例である。 実施形態における紙面領域検出処理の流れを示すフローチャートである。 実施形態における結果評価処理の流れを示すフローチャートである。 実施形態における処理の全体の流れを示すフローチャートである。 実施形態における評価対象決定処理の流れを示すフローチャートである。 実施形態における情報処理装置の構成を示すブロック図である。 実施形態における処理の全体の流れを示すフローチャートである。 実施形態における評価対象決定処理の流れを示すフローチャートである。 実施形態における投影光のパラメータを保持するテーブルの一例である。
以下、添付の図面を参照して詳細に説明する。
<実施形態1>
はじめに、図1(a)(b)(c)(d)を用いて本実施形態における情報処理装置の外観を示し処理概要を説明する。本実施形態では、プロジェクタ、被写体のRGB情報を撮像するRGBカメラを備える情報処理装置101を用いる。情報処理装置101は、該装置が備えるRGBカメラを用いて、机102(第1の物体)の平面領域内に置かれた紙文書103(第2の物体)の位置と大きさを取得する。人間の目で確認すると、紙文書のエッジは明瞭だが、情報処理装置がRGBカメラによる撮像画像を画像処理すると、紙文書のエッジを正確に検出することは難しい。エッジとは、紙文書と机との境界であり、紙文書の端を指す。
紙文書の位置と大きさを取得する際に、情報処理装置101が備えるプロジェクタにより、三原色の光を合成して、異なる色を複数投影し、それぞれの色毎にRGBカメラによる撮影を行う。図1(b)は投影した場合の一例であり、投影光104が投影されている。図1(c)は投影光毎の撮影結果の一例である。赤色光のみを投影した場合の撮影結果、緑色光のみを投影した場合の撮影結果、青色光のみを投影した場合の撮影結果が示されている。投影光により、撮影結果には違いが生じる。これは、机102と紙文書103が持つ光の分光反射率特性が異なるためである。光の反射率は、物質毎に異なるという性質がある。本例では、赤色光と青色光において、机102と紙文書103の反射率が類似しており、緑色光では机102と紙文書103の反射率が異なる場合の例を示している。机102と紙文書103とで反射率が類似する赤色光と青色光では、机102からの反射光と紙文書103からの反射光が類似することとなり、カメラで撮影した結果、紙端と机が区別しにくい状態になる。一方、机102と紙文書103とで反射率が異なる緑色光の場合は、机102からの反射光と紙文書103からの反射光に違いが生じるため、RGBカメラの撮影画像では紙端と机の境界が明確になっている。本装置では、机からの反射光と紙からの反射光の違いが明確な撮影画像を使って紙面領域検出処理を行うことにより、紙面領域検出の精度を向上させる。図1(d)は紙面領域検出結果の一例である。
机の分光反射率特性は固定であり、予め得ることが容易である。机の上には様々な種類の分光反射率特性を持つ紙が重ねて置かれる。机と紙との分光反射率特性は何れかの波長帯で異なっていると考えられる。机と紙とで分光反射率が異なる波長光を紙と机とに投射した状態を撮像すれば、その撮像画像から得られた机と紙との境界(紙文書のエッジ)は、高い精度で得られると考えられる。尚、様々な紙の分光反射率特性を全て予め得ることは現実的ではなく、どのような投影光を机と紙とに投射するのが、エッジを精度良く検出するために効率的かは予め得られていない。
手(第1の物体)で紙(第2の物体)を持っている状態を撮影して、紙の領域を検出することにも本実施形態は適用できる。
以降、図2〜図7を用いて詳細に説明する。
図2は、実施形態における情報処理装置に含まれる各ハードウェア構成の一例である。図1にて説明した情報処理装置101は以下に説明するハードウェア構成を備えている。
CPU(Central Processing Unit)202は、各種処理のための演算や論理判断などを行い、バス201に接続された各種要素を制御する。
本情報処理システムは、プログラムメモリとデータメモリを含むメモリが搭載されている。プログラムメモリには、フローチャートにより後述する各種処理手順を含むCPUによる制御のためのプログラムを格納する。このメモリはROM(Read−Only Memory)203であっても良いし、外部記憶装置などからプログラムがロードされるRAM(Random Access Memory)204であっても良い。あるいは、これらの組合せで実現しても構わない。
記憶装置205は本実施形態に係るデータやプログラムを記憶しておくためのハードディスクなどの装置である。また、本実施形態では、投影用のデータや撮影結果を保持しておくためにも利用される。なお、投影用データや撮影結果の保持装置としては、外部接続やネットワーク接続された不図示のデータ保持装置を用いても良い。ここで、外部記憶装置206は、たとえば、メディア(記録媒体)と、当該メディアへのアクセスを実現するための外部記憶ドライブとで実現することができる。このようなメディアとしては、たとえば、フレキシブルディスク(FD)、CD−ROM、DVD、USBメモリ、MO、フラッシュメモリ等が知られている。
入力装置207は現実世界の情報をデジタルデータとして取り込むための装置である。本実施形態では、RGBカメラおよびキーボード、マウスにより構成される。
出力装置208は処理結果等を表示出力する表示手段としての装置である。出力装置208は、プロジェクタにより実現されており、投影用データやUIボタン等を投影表示する。
インタフェース209は、情報の仲介を行う装置であり、このインタフェース209を介して外部装置とのデータのやり取りを行う。例えば、ネットワークインタフェースである。
図3は、実施形態における情報処理装置101の構成を示すブロック図である。情報処理装置101は、撮影処理部301、投影処理部302、紙面領域検出部303、評価取得部304から構成される。前述のように本装置は図2にて説明したハードウェアを備える。
撮影処理部301は、現実世界の紙文書を撮影するRGBカメラである。ユーザの撮影指示に基づき、後述する投影処理部302により所定の光が投影された状態の撮影を行う。ユーザは、撮影のきっかけを指示する。尚、ユーザが撮影指示をせず、自動的に撮影を開始しても良い。
投影処理部302は、現実世界に対してプロジェクタを用いて撮影のための所定光および操作のためのUI情報を投影する。
紙面検出部303は、撮影処理部301の撮影画像に対して紙面領域検出処理を実施する。紙面と机面との領域の境界を検出する。
評価取得部304は、撮影処理部302の撮影結果に対して評価を行い、紙面領域検出処理を行う画像を決定する。
ブロック図が示す各処理は、図2のCPU202によって制御されている。各処理の詳細は後述する。
図4は、本実施形態において、情報処理装置が行う処理の全体の流れをフローチャートにより説明するものである。以下、フローチャートは、CPUが制御プログラムを実行することにより実現されるものとする。
ステップS4000は撮影回数取得処理である。ユーザによる撮影指示を受け付けると当該処理が実施される。ユーザによる撮影指示は、図2における入力装置207により入力される。たとえば、撮影指示のためのボタンがUIとして机上に投影されている。該ボタンに対してマウスにより指示を行うことができる。撮影回数取得処理では、図5に示す投影光のパラメータを保持するテーブルを参照し、データが格納されている行数をカウントすることで取得する。図5の例の場合、投影回数が4回になるので、それに対応して、撮影回数は4として取得される。また、投影回数をカウントするカウンタ値を0と設定する。
ステップS4005は投影回数確認処理である。投影回数確認処理では、現在の投影回数をカウントするカウンタ値とステップS4000にて取得した撮影回数を比較する。比較の結果、投影回数をカウントするカウンタ値がステップS4000にて取得した撮影回数に達しない場合、ステップS4010へ移行する。投影回数をカウントするカウンタ値がステップS4000にて取得した撮影回数に達している場合は、ステップS4040に移行する。
ステップS4010は色投影処理である。色投影処理では、現在のカウンタ値と図5に示すテーブルを参照して、投影する光の色を決定する。投影色を決定した後、当該色で構成される映像信号をプロジェクタに入力する。プロジェクタは、当該映像信号に従い投影を行う。投影後、投影回数をカウントするカウンタ値に1を加算し、ステップS4020へ移行する。
当該処理の具体例を示す。一度も投影していない場合は、ステップS4000にてカウンタ値は0として設定されている。この場合、図5のテーブルのカウンタ値501が0に対応する投影パラメータ502を参照し、(R,G,B)=(255,0,0)であることが分かる。また、投影を4回実施している場合は、カウンタ値は4と設定されていることになる。この場合、カウンタ値に対応するテーブルが定義されていないため、撮影回数がステップS4000にて取得した回数に達していると判断する。
ステップS4020は撮影処理である。撮影処理では、ステップS4010にて投影された状態に対して撮影処理を実施する。撮影処理は、RGBカメラを用いる。
本実施形態では、静止画の撮影が可能なRGBカメラを使用するが、異なるカメラを用いても良い。たとえば、動画を撮影可能なRGBカメラを用いて、撮影された動画の1フレームを静止画として切り出しても良い。
また、プロジェクタのリフレッシュレートに基づきカメラのシャッタースピードを変更しても良い。プロジェクタの方式により、R(赤)とG(緑)とB(青)の光をリフレッシュレートに定められるタイミング毎に切り替えて投影する場合がある。この場合、シャッタースピードが速すぎると、ある特定の色を投影しているタイミングのみで撮影してしまう可能性が生じ、所望の色を投影した状態での撮影に失敗してしまう。リフレッシュレート毎にカメラのシャッタースピードを定義しておくことで当該問題を解消することができるようになる。
ステップS4030は評価処理である。評価処理では、ステップS4020にて撮影された画像に対して後述のような評価を行い、紙面と机面とのエッジ検出を精度良く行えそうな画像を決定する。評価処理の詳細は図7を用いて後述する。S4010で投影された投影色ごとにS4020で撮影し、撮像画像に対してそれぞれ評価処理を行う。
ステップS4040は紙面検出処理である。紙面検出処理では、ステップS4030にて決定した画像を解析し、紙面と思われる領域の位置と大きさを算出する。紙面領域検出処理は既存の技術を用いることができる。紙面領域検出処理の一例については、図6を用いて後述する。
本実施形態では、エッジ検出の精度を上げることにより、紙面領域検出の精度を上げようとしている。ただし、エッジ検出の精度が向上しても、図6のS6010以降の処理によっては紙面領域の検出の精度が向上しないことがある。
続いて、図4におけるステップS4040の紙面領域検出処理について、図6を用いて処理フローを詳細に説明する。紙面検出部303が行う処理である。
ステップS6000はエッジ検出処理である。エッジ検出処理では紙面領域検出の対象となる画像からエッジを検出する。エッジ検出は既存の技術を用いることができる。たとえば、エッジ検出の手法としてCanny Edgeと呼ばれる手法が知られている。なお、単純にCanny Edgeを適用するのではなく、エッジ検出結果に対して、ノイズ除去等の処理を加えても良い。ノイズ除去を行うことで、机や紙面にまだら模様のような細かいエッジが検出される場合に、後段処理で処理対象となるエッジを削減することができ、処理負荷を低減させることが可能になる。
ステップS6010は直線検出処理である。直線検出処理では、ステップS6000にて検出したエッジ画素に対してハフ変換を実施することで直線成分を検出する。
ステップS6020は線分検出処理である。線分検出処理では、ステップS6010において検出した直線に対して、直線の近傍にあるエッジ画素を端点探索し、線分として抽出する。
ステップS6030は四辺候補選択処理である。四辺候補選択処理では、ステップS6020で線分化された直線群から四辺を成す組を決定する。
ステップS6040は四辺選択処理である。四辺選択処理では、ステップS6030にて選択した四辺候補から紙面領域検出結果として採用する四辺を選択する。選択処理は、規定の指標を用いてスコアを計算し、スコアが高いものを結果として選択する。指標としては、たとえば、四辺を成す組の面積に対する画像全体の割合や四辺の辺の比率が挙げられる。
続いて、図4におけるステップS4030の評価処理について、図7を用いて処理フローを詳細に説明する。評価取得部304が行う処理である。
ステップS7000は評価対象決定処理である。評価対象決定処理では、画像から、評価対象とする画素を決定する。分光反射率特性を調べる対象画素を特定している。評価対象の画素の座標値は予め規定しておき、規定値を参照することで、評価対象画素を特定する。たとえば、撮影画像の中心座標を規定した場合、評価対象は撮影画像の中心座標に位置する画素となる。
ステップS7010は輝度評価取得処理である。輝度評価取得処理では、紙が置かれていない状態の机の投影光に対応する輝度値とステップS7000で決定した評価対象画素の輝度値を比較する。紙が置かれていない状態の机における投影光に対応する輝度値は、予め取得され不図示のDBに格納されている。たとえば、赤色光を投影した場合の机のみの撮影画像を予め解析し、輝度値を算出しておく。該輝度値と、紙を置いた状態で赤色光を投影した場合の撮影画像の対象画素の輝度値を比較する処理を実施する。紙を置いた状態で投影し、予め紙が置かれないことが分かっている机の領域への投影光に対応する輝度値を用いて輝度評価取得処理を行っても良い。
ステップS7020は結果選択処理である。結果選択処理では、ステップS7010にて評価した輝度値の差に基づいて、紙面領域検出対象として適する撮影画像を選択する。具体的には、輝度値の差が閾値より大きくなる撮影画像が紙面領域検出対象として適切であると判断し、紙面領域検出処理の対象と決定する。輝度値の差が閾値より大きい撮影画像が得られれば、その時点でステップS4030の評価処理を終了し、その撮影画像に対して、ステップS4040の紙面領域検出処理を行っても良い。なお、輝度値の差が大きくなる撮影画像は、机と紙の分光反射率特性が大きく異なる場合に生じる。たとえば、机の分光反射率特性が赤10%、緑10%、青90%、紙の分光反射率特性が赤90%、緑10%、青10%の場合、赤色光を投影すると、輝度値の差が大きくなる。
図6を用いて前述したように紙面領域検出ではエッジ検出処理を実施している。エッジ検出処理では、輝度値の勾配(差)に基づく処理を実施しているため、輝度値の差が生じないとエッジ検出がうまくいかない。本実施形態のように、輝度値の差が生じている画像を用いることで、エッジ検出の精度が向上し、結果として紙面領域検出の精度が向上することが期待できる。
また、本実施形態では、輝度値の比較により評価を行ったが、異なる情報を用いても良い。たとえば、図5に示すテーブルで規定される光を投影し、反射率の測定装置を用いて、机に紙を置いていない状態の反射率と紙を置いた場合の反射率を取得する。この反射率を比較し、反射率の差が大きい光を投影した状態を撮影した画像に対して、図6の紙面領域検出処理を行っても良い。図5に示すテーブルで規定される光を4パターン全て投影しなくても、ある投影光(何れかの波長帯)による机と紙との反射率の差が閾値を超えていれば、その投影光を投影した状態を撮影した画像を紙面領域検出処理の対象として採用しても良い。反射率と輝度の関係は、数式(1)のように示すことが可能である。照度が一定の場合、反射率と輝度は比例する関係になるため、反射率の差を用いる場合と輝度の差を用いる場合で同様の効果が得られることが期待できる。
輝度 = 反射率×照度 (1)
また、本実施形態では、輝度値の比較対象を1画素として規定したが、複数の評価対象座標を規定しておいても良い。中心座標に加え紙面領域検出の対象となる画像4隅の座標を登録しておき、各座標に対応する画素の輝度値を比較することもできる。紙が中心を含む領域に置かれた場合は、中心座標での比較で十分だが、小さな紙の場合中心を含む領域に置かれないことも考えられる。中心以外の座標も評価対象として含めることで、当該問題を解消できる効果がある。
以上、詳細に説明したように、机と紙の分光反射率特性が大きく異なる投影光を投影した状態を撮影した画像を用いれば、エッジ検出精度が向上し、紙面領域検出の精度を向上させることが可能になる。
<実施形態2>
実施形態1では、紙面領域検出結果の評価処理において、ステップS7000において規定の評価対象を決定し、輝度の比較を実施した。本実施形態では、評価対象を動的に決定する処理について説明する。
具体的には、投影した状態での撮影と紙面領域検出を実施する前に、投影していない状態で紙面領域検出処理を実施する。該紙面領域検出の結果を用いて、投影した状態の紙面領域検出結果の評価対象を決定する。詳細な処理は、図8および図9を用いて説明する。図2および図3に示す構成は実施形態1と同様である。
図8は、本実施形態において、情報処理装置が行う処理の全体の流れをフローチャートにより説明するものである。
ステップS8000は紙面領域検出処理である。本紙面領域検出処理では、投影しない状態で紙面領域検出を実施する。本処理の結果は、後述するステップS8050の結果評価処理で使用するため、不図示のDBに格納される。
ステップS8010は撮影回数取得処理である。撮影回数取得処理は、図4におけるステップS4000の処理と同様である。
ステップS8020は色投影処理である。色投影処理では、現在のカウンタ値と図5に示すテーブルを参照して、投影する光の色を決定する。投影色を決定した後、プロジェクタを用いて投影を行う。実際に投影した回数がステップS8010において取得した回数に達していた場合、ステップS8050に移行し、達していない場合はステップS8030に移行する。処理の詳細は、図4におけるステップS4005,S4010と同様である。
ステップS8030は撮影処理である。撮影処理は、図4におけるステップS4020と同様である。
ステップS8040は評価処理である。評価処理では、ステップS8030にて撮影された画像を用いて後述のような評価を行い、エッジの検出の精度が高いと思われる結果を決定する。評価処理の詳細は、図7におけるステップS7000評価対象決定処理を除き、図7にて説明した処理と同様である。図7におけるステップS7000評価対象決定処理に相当する処理の詳細は図9を用いて説明する。
ステップS8050は紙面領域検出処理である。紙面領域検出処理は、図4におけるステップS4040と同様である。
図9は、図7におけるステップS7000評価対象決定処理に相当する処理をフローチャートにより説明するものである。
ステップS9000は紙面領域検出結果取得処理である。紙面領域検出結果取得処理では、図8のステップS8000にて実施した紙面領域検出結果を取得する。
ステップS9010は領域端近傍決定処理である。領域端近傍決定処理では、ステップS8000にて取得した紙面領域検出結果から、領域端候補となる座標を決定する。決定方法は、領域の4頂点の座標としても良いし、右上、左下など所定の1頂点の座標としても良い。また、頂点から所定のマージンを設けた座標を評価対象としても良い。
以上、詳細に説明したように、ステップS9010にて決定された座標を評価対象として図7ステップS7010輝度評価処理以降の処理を実施することで、評価対象を動的に決定することが可能となる。
紙面の端に写真などのコンテンツが存在すると、コンテンツの印刷に使用されるトナーなどの物質の影響により、コンテンツが存在しない部分の紙面とコンテンツが存在する部分の光の反射率が変わる可能性がある。したがって、コンテンツが存在しない部分の紙面と机の反射率もしくは撮影画像の輝度値には差が生じるが、コンテンツが存在する部分の紙面と机の反射率もしくは撮影画像の輝度値には差が生じない場合が生じる。結果として、紙面端にコンテンツが存在する場合、エッジ検出の精度が高い撮影画像を選び損ねてしまう。本問題に対して、本実施形態の手法を用いることで、紙面端に近い点を評価対象として、輝度値の差が大きくでるステップS8030による撮影画像の信頼度を向上させることが可能となり、実際の紙面端を検出できる精度を向上させることができる。
また、本実施形態では、投影していない状態の紙面領域検出後に必ず投影を用いた紙面領域検出処理を実施していたが、投影していない状態の紙面領域検出結果が良好な場合、投影を用いた紙面領域検出処理を実施しなくても良い。図8におけるステップS8000紙面領域検出を実施した後、該処理の結果をユーザに提示し、再度の紙面領域検出処理を実施するか判断させ、ユーザが所望した場合にのみステップS8010以降の処理を実施することもできる。
<実施形態3>
実施形態2では、投影をしない状態の紙面領域検出結果を用いて、投影を用いた紙面領域検出結果の評価対象を動的に決定した。本実施形態では、異なる方法を用いて投影を用いた紙面領域検出結果の評価対象の決定方法について図10〜図12を用いて説明する。
図10は本実施形態における情報処理装置の構成を示すブロック図である。情報処理装置は、撮影処理部1001、投影処理部1002、紙面領域検出部1003、物体検知部1004、評価取得部1005から構成される。
撮影処理部1001は、赤外撮影部1006とRGB撮影部1007から構成される。赤外撮影部1006は赤外カメラを用いて撮影処理を行う。赤外カメラによる撮影結果は物体検知部1004で実施される物体検知処理に用いられる。RGB撮影部1007は、図3の撮影処理部301と同様である。なお、本実施形態では赤外カメラの撮影結果を物体検知処理に用いるが、異なる処理へ適用しても良い。具体的には、赤外画像を使ったユーザによるジェスチャー操作の認識へ適用可能である。
投影処理部1002は、図3の投影処理部302と同様である。
紙面検出部1003は、図3の紙面領域検出部303と同様である。
物体検知部1004は、赤外撮影部1006の撮影画像を用いて物体検知処理を実施する。物体検知処理は既存の技術を用いることができる。物体検知処理の一例は、図11を用いて後述する。
評価取得部1005は、図3の評価取得部304と同様である。
ブロック図が示す各処理は、図2のCPU202によって制御されている。
図11は、本実施形態において、情報処理装置が行う処理の全体の流れをフローチャートにより説明するものである。
ステップS11000は物体検知処理である。物体検知処理では、赤外カメラによる撮影画像を用いて、物体が机上に置かれたことを検知し、物体が置かれた領域の位置と大きさを特定する。物体検知処理は、既存の技術を用いることができる。物体検知処理の一例としては、背景差分を用いた手法が知られている。背景差分を用いる手法では、予め何も置かれていない机の状態を赤外カメラで撮影しておき、該撮影結果と現状の撮影結果を比較し、差が生じた場合に物体が存在していると判断する。差が生じている領域を物体が置かれた領域として位置と大きさを特定する。
ステップS11010は撮影回数取得処理である。撮影回数取得処理は、図4におけるステップS4000の処理と同様である。
ステップS11020は色投影処理である。色投影処理では、現在のカウンタ値と図5に示すテーブルを参照して、投影する光の色を決定する。投影色を決定した後、プロジェクタを用いて投影を行う。実際に投影した回数がステップS11010において取得した回数に達していた場合、ステップS11050へ移行し、達していない場合はステップS11030に移行する。処理の詳細は、図4におけるステップS4005,S4010と同様である。
ステップS11030は撮影処理である。撮影処理は、図4におけるステップS4020と同様である。
ステップS11040は評価処理である。評価処理では、ステップS11030にて撮影された画像を用いて後述のような評価を行い、エッジ検出の精度が高いと思われる結果を決定する。評価処理の詳細は、図7におけるステップS7000評価対象決定処理を除き、図7にて説明した処理と同様である。図7におけるステップS7000評価対象決定処理に相当する処理の詳細は図12を用いて説明する。
ステップS11050は紙面領域検出処理である。紙面領域検出処理は、図4におけるステップS4040と同様である。
図12は、図7におけるステップS7000評価対象決定処理に相当する処理をフローチャートにより説明するものである。
ステップS12000は物体検知結果取得処理である。物体検知結果取得処理では、図11のステップS11000にて実施した物体検知結果を取得する。
ステップS12010は領域端近傍決定処理である。領域端近傍決定処理では、ステップS11000にて取得した物体検知結果から、領域端となる座標を決定する。物体検知結果も領域で表現されるため、処理は図9のステップS9010と同様である。
以上、詳細に説明したように、ステップS12010にて決定された座標を評価対象として図7ステップS7010輝度評価処理以降の処理を実施することで、評価対象を動的に決定することが可能となる。
赤外カメラによる撮影画像は、RGBカメラに対して解像度が低いことがあり、赤外カメラの画像だけでは紙面領域検出処理の精度が悪くなる。本実施形態の手法のように、物体検知結果を用いて、大まかな評価対象を動的に決定することで、エッジ検出の精度が高い撮影画像を選び易くすることが可能になる。
<実施形態4>
実施形態1では、予め規定した図5のテーブルを用いた処理を実施した。本実施形態では、予め規定したテーブルでは十分な精度が期待できない場合の処理について説明する。机と紙との分光反射率特性がRGBの各波長帯でほぼ同じときに起こる。
図4のステップS4000からS4030までは、同様の処理を行う。
図4のステップS4030の評価処理の結果が規定の閾値を超えているか判定する。具体的には、結果として取得された画像の輝度と机の投影光に対する輝度を比較し、輝度値が閾値を超えているか判定する。たとえば、エッジ検出処理が有効にはたらく輝度値の差を閾値として設定しておくことができる。輝度差が閾値を超えている場合、ステップS4040の紙面検出処理を行う。
輝度値が閾値を超えていない場合、新たに投影する光の色を決定する。具体的には、図5に例示されるテーブルから投影済みの投影色を取得する。次に、取得した各投影色の中間色を決定する。中間色の決定は、テーブルで隣接する2つの投影色におけるRGB値を加算し、平均をとることで行う。たとえば、RGB:255、0、0とRGB:0,255,0の場合、決定される中間色は127、127、0となる。決定された投影色は、図5に例示されるテーブルに反映される。テーブルに投影色を反映する際、以前の投影光データは削除され、新たなテーブルとして作成される。たとえば、図5に例示されるテーブルを用いて決定された投影色を反映した新たなテーブルは、図13に示すものになる。テーブルを更新した後、投影処理、撮影処理を行い、S4030評価処理の結果が規定の閾値を超えているか判定する。閾値を超えていれば、S4040の紙面領域検出処理を行う。
以上、詳細に説明したように、予め規定した投影光では十分な紙面領域検出の精度が得られない場合、投影光を動的に決定し、再度投影と撮影を行う。すると、机と紙とで、ある波長帯で反射率が異なる投影光を用いることができるため、エッジ検出精度を向上させることが可能になる。
<その他の実施形態>
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
301 撮影処理部
302 投影処理部
303 紙面領域検出部
304 評価取得部

Claims (10)

  1. 第1の物体と当該第1の物体の平面領域内にある第2の物体とに光を投影する投影手段と、
    前記第1の物体と前記第2の物体とに前記光が投影されている状態を撮像する撮像手段と、
    前記撮像手段が撮像した撮像画像における前記第1の物体の領域の画素と前記第2の物体があると予め定められている領域の画素との輝度値の差を、異なる色の光を前記投影手段が投影した状態をそれぞれ前記撮像手段が撮像した複数の撮像画像において取得する取得手段と、
    前記輝度値の差に基づいて、前記複数の撮像画像の少なくとも1つから前記第1の物体と前記第2の物体との領域の境界を検出する検出手段と、
    を備えることを特徴とする情報処理装置。
  2. 前記投影手段が前記第1の物体と前記第2の物体とで反射率特性が異なる光を投影したときに前記撮像手段が撮影した撮像画像のうち前記輝度値の差が閾値を超える撮像画像から、前記検出手段は、前記第1の物体と前記第2の物体との領域の境界を検出することを特徴とする請求項1記載の情報処理装置。
  3. 前記投影手段は、前記第2の物体が前記第1の物体の平面領域内に無いときに前記第1の物体に光を投影し、前記撮像手段がその状態を撮像した撮像画像における前記第1の物体の領域の画素を用いて、前記取得手段は、前記輝度値の差を取得することを特徴とする請求項1または2に記載の情報処理装置。
  4. 前記撮像手段は、前記投影手段のリフレッシュレートに基づいたシャッタースピードで撮像することを特徴とする請求項1乃至3何れか1項に記載の情報処理装置。
  5. 前記第2の物体があると予め定められている領域の画素は、前記第1の物体の平面領域の中心座標に位置する画素であることを特徴とする請求項1乃至4何れか1項に記載の情報処理装置。
  6. 第1の物体と当該第1の物体の平面領域内にある第2の物体とに光を投影する投影手段と、
    前記第1の物体と前記第2の物体とに前記光が投影されている状態を撮像する撮像手段と、
    前記撮像手段が撮像した撮像画像における前記第1の物体の領域の反射率と前記第2の物体があると予め定められている領域の反射率との差を、異なる色の光を前記投影手段で投影した状態をそれぞれ前記撮像手段が撮像した複数の撮像画像において取得する取得手段と、
    前記反射率の差に基づいて、前記複数の撮像画像の何れかから前記第1の物体と前記第2の物体との領域の境界を検出する検出手段と、
    を備えることを特徴とする情報処理装置。
  7. 第1の物体と当該第1の物体の平面領域内にある第2の物体とに光を投影する投影工程と、
    前記第1の物体と前記第2の物体とに前記光が投影されている状態を撮像する撮像工程と、
    前記撮像工程で撮像した撮像画像における前記第1の物体の領域の画素と前記第2の物体があると予め定められている領域の画素との輝度値の差を、異なる色の光を前記投影工程で投影した状態をそれぞれ前記撮像工程で撮像した複数の撮像画像において取得する取得工程と、
    前記輝度値の差に基づいて、前記複数の撮像画像の少なくとも1つから前記第1の物体と前記第2の物体との領域の境界を検出する検出工程と、
    を備えることを特徴とする情報処理方法。
  8. 第1の物体と当該第1の物体の平面領域内にある第2の物体とに光を投影する投影工程と、
    前記第1の物体と前記第2の物体とに前記光が投影されている状態を撮像する撮像工程と、
    前記撮像工程で撮像した撮像画像における前記第1の物体の領域の反射率と前記第2の物体があると予め定められている領域の反射率との差を、異なる色の光を前記投影工程で投影した状態をそれぞれ前記撮像工程で撮像した複数の撮像画像において取得する取得工程と、
    前記反射率の差に基づいて、前記複数の撮像画像の何れかから前記第1の物体と前記第2の物体との領域の境界を検出する検出工程と、
    を備えることを特徴とする情報処理方法。
  9. 第1の物体と当該第1の物体の平面領域内にある第2の物体とに光を投影する投影工程と、
    前記第1の物体と前記第2の物体とに前記光が投影されている状態を撮像する撮像工程と、
    前記撮像工程で撮像した撮像画像における前記第1の物体の領域の画素と前記第2の物体があると予め定められている領域の画素との輝度値の差を、異なる色の光を前記投影工程で投影した状態をそれぞれ前記撮像工程で撮像した複数の撮像画像において取得する取得工程と、
    前記輝度値の差に基づいて、前記複数の撮像画像の少なくとも1つから前記第1の物体と前記第2の物体との領域の境界を検出する検出工程と、
    をコンピュータに実行させるためのプログラム。
  10. 第1の物体と当該第1の物体の平面領域内にある第2の物体とに光を投影する投影工程と、
    前記第1の物体と前記第2の物体とに前記光が投影されている状態を撮像する撮像工程と、
    前記撮像工程で撮像した撮像画像における前記第1の物体の領域の反射率と前記第2の物体があると予め定められている領域の反射率との差を、異なる色の光を前記投影工程で投影した状態をそれぞれ前記撮像工程で撮像した複数の撮像画像において取得する取得工程と、
    前記反射率の差に基づいて、前記複数の撮像画像の何れかから前記第1の物体と前記第2の物体との領域の境界を検出する検出工程と、
    をコンピュータに実行させるためのプログラム。
JP2016072595A 2016-03-31 2016-03-31 情報処理方法および情報処理装置、プログラム Pending JP2017182672A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016072595A JP2017182672A (ja) 2016-03-31 2016-03-31 情報処理方法および情報処理装置、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016072595A JP2017182672A (ja) 2016-03-31 2016-03-31 情報処理方法および情報処理装置、プログラム

Publications (1)

Publication Number Publication Date
JP2017182672A true JP2017182672A (ja) 2017-10-05

Family

ID=60008550

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016072595A Pending JP2017182672A (ja) 2016-03-31 2016-03-31 情報処理方法および情報処理装置、プログラム

Country Status (1)

Country Link
JP (1) JP2017182672A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115083066A (zh) * 2022-07-20 2022-09-20 恒银金融科技股份有限公司 基于数字图像检测纸币新旧的方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115083066A (zh) * 2022-07-20 2022-09-20 恒银金融科技股份有限公司 基于数字图像检测纸币新旧的方法和装置
CN115083066B (zh) * 2022-07-20 2022-12-06 恒银金融科技股份有限公司 基于数字图像检测纸币新旧的方法和装置

Similar Documents

Publication Publication Date Title
US10304164B2 (en) Image processing apparatus, image processing method, and storage medium for performing lighting processing for image data
US9208550B2 (en) Smart document capture based on estimated scanned-image quality
US11283987B2 (en) Focus region display method and apparatus, and storage medium
JP6984724B2 (ja) なりすまし検知装置、なりすまし検知方法、及びプログラム
JP5779089B2 (ja) エッジ検出装置、エッジ検出プログラム、およびエッジ検出方法
US20190191078A1 (en) Information processing apparatus, a non-transitory computer readable storage medium and information processing method
US8923610B2 (en) Image processing apparatus, image processing method, and computer readable medium
US10694098B2 (en) Apparatus displaying guide for imaging document, storage medium, and information processing method
JP5975281B2 (ja) 画像処理装置及びプログラム
JP2005353010A (ja) 画像処理装置および撮像装置
US9392263B2 (en) 3D scanner, 3D scan method, computer program, and storage medium
WO2021195873A1 (zh) 识别sfr测试卡图像中感兴趣区域的方法及装置、介质
US10346953B2 (en) Flash and non-flash images in flash artifact removal
JP6098784B2 (ja) 画像処理装置及びプログラム
JP2009164951A (ja) 撮像システム、画像処理装置、画像処理方法、およびプログラム
TW201947494A (zh) 服飾試穿方法及其顯示系統與電腦可讀取記錄媒體
JP2008250482A (ja) プロジェクタ投影映像のマウス代替操作方法およびそのマウス代替操作システム
US20170026546A1 (en) Image processing apparatus, image processing method, and storage medium
JP2015212897A5 (ja)
US10373329B2 (en) Information processing apparatus, information processing method and storage medium for determining an image to be subjected to a character recognition processing
JP6229554B2 (ja) 検出装置および検出方法
JP2017182672A (ja) 情報処理方法および情報処理装置、プログラム
JP6390163B2 (ja) 情報処理装置、情報処理方法およびプログラム
US20210281742A1 (en) Document detections from video images
JP2016122367A5 (ja)