JP2017033389A - 画像処理装置、画像読取方法、コンピュータプログラム、及び記憶媒体 - Google Patents
画像処理装置、画像読取方法、コンピュータプログラム、及び記憶媒体 Download PDFInfo
- Publication number
- JP2017033389A JP2017033389A JP2015154205A JP2015154205A JP2017033389A JP 2017033389 A JP2017033389 A JP 2017033389A JP 2015154205 A JP2015154205 A JP 2015154205A JP 2015154205 A JP2015154205 A JP 2015154205A JP 2017033389 A JP2017033389 A JP 2017033389A
- Authority
- JP
- Japan
- Prior art keywords
- image
- partial
- processing apparatus
- image processing
- photographing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
- H04N1/3876—Recombination of partial images to recreate the original image
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00002—Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
- H04N1/00007—Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for relating to particular apparatus or devices
- H04N1/00013—Reading apparatus
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00002—Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
- H04N1/00026—Methods therefor
- H04N1/00034—Measuring, i.e. determining a quantity by comparison with a standard
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00002—Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
- H04N1/00026—Methods therefor
- H04N1/00037—Detecting, i.e. determining the occurrence of a predetermined state
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00002—Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
- H04N1/00026—Methods therefor
- H04N1/00058—Methods therefor using a separate apparatus
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00519—Constructional details not otherwise provided for, e.g. housings, covers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/04—Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa
- H04N1/10—Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa using flat picture-bearing surfaces
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/0077—Types of the still picture apparatus
- H04N2201/0081—Image reader
Abstract
【課題】撮影対象物の画像を、歪み部分を適切に抑制しながら読み取る画像処理装置を提供する。
【解決手段】画像処理装置100は、カメラ205及び距離画像センサ206に接続される。画像処理装置100は、カメラ205から、操作台301上に載置される撮影対象物の画像を受け付ける。画像処理装置100は、距離画像センサ206から距離画像を取得し、これにより、手による撮影対象物の歪みを抑制する操作を検出する。手による撮影対象物への歪みを抑制する操作を検出する場合、画像処理装置100は、操作物の位置に応じて、撮影対象物の一部分の部分画像を取得する。この処理を繰り返して取得した複数の部分画像を使って、撮影対象物を表す画像を生成する。
【選択図】図1
【解決手段】画像処理装置100は、カメラ205及び距離画像センサ206に接続される。画像処理装置100は、カメラ205から、操作台301上に載置される撮影対象物の画像を受け付ける。画像処理装置100は、距離画像センサ206から距離画像を取得し、これにより、手による撮影対象物の歪みを抑制する操作を検出する。手による撮影対象物への歪みを抑制する操作を検出する場合、画像処理装置100は、操作物の位置に応じて、撮影対象物の一部分の部分画像を取得する。この処理を繰り返して取得した複数の部分画像を使って、撮影対象物を表す画像を生成する。
【選択図】図1
Description
本発明は、紙のドキュメントや書籍等の撮影対象物の画像を適切に読み取るための画像処理装置に関する。
紙のドキュメントや書籍等の撮影対象物を画像データやテキストデータに電子化する技術が広まっている。電子化には、例えば、撮影対象物を圧板で挟んで読み取るスキャナや、手軽に撮影対象物の画像を取得する書画カメラ等が用いられる。書画カメラは、撮影対象物が載置される台と、台を上方から撮影するカメラ等の撮影部とを備える。台上に載置される撮影対象物がカール等の歪みのあるドキュメントや書籍の場合、歪みをできるだけ抑制して撮影することが重要である。特許文献1、2は、ユーザが手で原稿を押さえることで歪みを抑制して撮影し、撮影後の画像から手の画像を消去して電子化する装置を開示する。
手で撮影対象物を押さえて撮影する場合、撮影領域に手ができるだけ入らないようにするために、通常、手は、撮影対象物の端部を押さえることになる。そのために、手で押さえた周辺以外の歪みを十分に抑制できない可能性がある。例えば、ドキュメントの中央付近に折り目が残っている場合、ドキュメントの両脇を押さえるだけでは、折り目付近の歪みを十分に抑制できない。この場合、読み取ったドキュメントの文字等が歪む。そのために、撮影した画像を手書き文字認識、画像認識、或いは帳票認識する場合、画像の歪みによって認識精度が劣化する。従って、撮影対象物の各歪み部分で撮影対象物を押さえて、歪みを抑制しつつ撮影する必要がある。
本発明は、上記の問題を解決するために、撮影対象物の画像を、歪み部分を適切に抑制しながら読み取る画像処理装置を提供することを主たる課題とする。
本発明の画像処理装置は、操作面上に載置された撮影対象物の画像を受け付ける画像入力手段と、所定の操作物による前記撮影対象物の歪みを抑制する操作を検出する操作検出手段と、前記操作検出手段が前記操作を検出する場合、前記操作物の位置に応じて、前記撮影対象物の一部に相当する部分画像を取得する部分画像取得手段と、前記部分画像取得手段が取得した複数の前記部分画像を使って、前記撮影対象物を表す画像を生成する生成手段と、を備えることを特徴とする。
本発明によれば、撮影対象物の画像を、歪み部分を適切に抑制しながら読み取る画像処理装置を提供できる。
以下、図面を参照して実施形態を詳細に説明する。ただし、本実施形態に記載されている構成要素はあくまでも例示であり、本発明の範囲をそれらのみに限定するものではない。
[第1実施形態]
(構成)
図1は、本実施形態の画像処理装置を備える画像読取システムの構成図である。画像読取システムは、画像処理装置100、撮影対象物が載置される操作面を有する操作台301、カメラ205、距離画像センサ206、及びプロジェクタ207を備える。画像処理装置100は、カメラ205、距離画像センサ206、及びプロジェクタ207に接続され、各装置の制御装置として機能するパーソナルコンピュータ等の情報処理装置である。
図1は、本実施形態の画像処理装置を備える画像読取システムの構成図である。画像読取システムは、画像処理装置100、撮影対象物が載置される操作面を有する操作台301、カメラ205、距離画像センサ206、及びプロジェクタ207を備える。画像処理装置100は、カメラ205、距離画像センサ206、及びプロジェクタ207に接続され、各装置の制御装置として機能するパーソナルコンピュータ等の情報処理装置である。
カメラ205は、操作台301の操作面の可視画像を撮影するように設けられる撮影装置である。カメラ205は、操作台301の操作面上に載置された紙のドキュメントや書籍等の撮影対象物を撮影する。カメラ205は、撮影することで取得した画像データを画像処理装置100へ送信する。
距離画像センサ206は、操作台301の操作面の距離画像を取得するように設けられる。距離画像センサ206は取得した距離画像を表す距離画像データを画像処理装置100へ送信する。距離画像は、操作面上を移動する物体の検出に用いられる画像であり、距離画像センサ206から操作面の全体を画角に含む各画素までの距離を表す。距離画像センサ206は、赤外光等の光を照射してその反射時間によって距離を測定するものや、パターン光を照射してその形状から距離を計測するもの、あるいはステレオカメラ等により実現される。また、距離画像センサ206は、カメラ205と機能を兼ね備えていてもよい。なお、操作面上の物体の移動を検出可能な移動検出装置であれば、距離画像センサ206に代えてモーションセンサを用いることも可能である。
プロジェクタ207は、画像処理装置100の制御により、操作台301の操作面上に画像を投影する表示装置である。操作面には、UI(User Interface)部品や情報を表す画像が表示される。カメラ205、距離画像センサ206、及びプロジェクタ207は、画像処理装置100のユーザインタフェースとして用いることができる。例えばユーザが操作面に投影されたUI部品をタッチ操作する場合、タッチする位置やジェスチャが、距離画像センサ206もしくはカメラ205により撮像される画像に基づいて検出される。検出結果は画像処理装置100へ送信される。画像処理装置100は、距離画像センサ206もしくはカメラ205の検出結果により、ユーザのタッチ操作を判定して、タッチ操作に応じた処理を行うことができる。なお、操作面をディスプレイにより構成して、プロジェクタ207を用いずに操作面に画像を表示する構成であってもよい。
図2は、画像処理装置100のハードウェア構成図である。画像処理装置100は、CPU(Central Processing Unit)201、ROM(Read Only Memory)202、RAM(Random Access Memory)203、及び記憶部204を備える。画像処理装置100は、I/Oインタフェース208を介してカメラ205、距離画像センサ206、及びプロジェクタ207に接続される。CPU201、ROM202、RAM203、記憶部204、及びI/Oインタフェース208は、バスを介して通信可能に接続される。
CPU201は、ROM202からコンピュータプログラムを読み込み、RAM203を作業領域に用いて実行することで画像読取システム全体の動作を制御する。CPU201の制御により、カメラ205は撮影を行い、距離画像センサ206は距離画像を取得し、プロジェクタ207は画像を表示する。記憶部204は、ハードディスク等の大容量記憶装置であり、カメラ205から取得する画像データを格納する。
図3は、画像処理装置100の機能ブロック図である。画像処理装置100の各機能は、CPU201がコンピュータプログラムを実行することで実現される。画像処理装置100は、画像入力部101、領域検出部102、操作検出部103、部分画像取得部104、生成部105、出力部106、及び制御部107として機能する。
画像入力部101は、カメラ205から入力される画像データを受け付ける。領域検出部102は、画像入力部101で受け付けた画像データに基づいて、操作面上の撮影対象物の領域を検出する。操作検出部103は、撮影対象物の歪みを抑制する操作を検出する。本実施形態では、ユーザが、手やペン、撮影対象物502を押さえる専用器具等(以下、「操作物」という。)により、撮影対象物の歪みを抑制する。操作検出部103は、操作物の動きを距離画像センサ206から取得する距離画像に基づいて検出する。
部分画像取得部104は、操作検出部103で検出された操作に応じて、画像入力部101で受け付けた画像データから、撮影対象物の部分画像を取得する。例えば、部分画像取得部104は、手が撮影対象物を押さえながら移動するときに、直前まで手が押さえていた領域の撮影対象物の画像を部分画像として取得する。生成部105は、部分画像取得部104で取得した複数の部分画像を合成して、歪みを抑制した撮影対象物の合成画像を生成する。生成部105は、生成した合成画像を、撮影対象物を電子化したデータとして記憶部204に格納する。出力部106は、UI部品、情報、生成部105で生成した合成画像等をプロジェクタ207により表示させる。制御部107は、画像処理装置100の各機能を制御することで、画像読取システム全体の動作を制御する。
(読取処理)
図4は、このような画像読取システムにより撮影対象物の画像を読み取る処理を表すフローチャートである。図5は、画像を読み取る際の状態説明図である。ユーザは、操作台301の操作面上に撮影対象物を載置して、画像処理装置100により撮影対象物の読取を指示する。読取指示は、例えばプロジェクタ207により表示されるUI部品の操作により行われる。画像処理装置100の制御部107は、ユーザの指示に応じて、画像処理装置100、カメラ205、距離画像センサ206、及びプロジェクタ207の動作を制御する。
図4は、このような画像読取システムにより撮影対象物の画像を読み取る処理を表すフローチャートである。図5は、画像を読み取る際の状態説明図である。ユーザは、操作台301の操作面上に撮影対象物を載置して、画像処理装置100により撮影対象物の読取を指示する。読取指示は、例えばプロジェクタ207により表示されるUI部品の操作により行われる。画像処理装置100の制御部107は、ユーザの指示に応じて、画像処理装置100、カメラ205、距離画像センサ206、及びプロジェクタ207の動作を制御する。
カメラ205は、制御部107の制御により操作面を撮影し、画像処理装置100に撮影により生成した画像データを送信する。画像入力部101は、カメラ205から画像データを受け付ける(S401)。画像入力部101が受け付ける画像データには、カメラ205が撮影したそのままの画像の他に、カメラ設置条件に基づいて操作台301を真上から見下ろす視点に相当するように射影変換した画像を用いることができる。図5(a)は、画像入力部101が受け付ける画像データが表す画像の一例である。画像入力部101は、所定の時間間隔で時系列に画像を取得する。画像には、操作台301及び操作面に載置されるドキュメント等の撮影対象物502の画像が含まれる。
領域検出部102は、画像入力部101で受け付けた画像データから、ドキュメント等の撮影対象物502を含む撮影対象領域を検出する(S402)。撮影対象領域の検出は、背景差分や矩形検出等により行うことができる。
撮影対象物502は、操作台301に載置されており、紙の保存状態によって折れ目やカール等の歪みが生じている。ユーザは、撮影対象物502の歪みを減らす操作として、撮影対象物502を押さえてなでるように操作物を移動させる。操作検出部103は、このような操作物の位置や動きを検出する(S403)。図5(b)〜図5(f)はユーザが撮影対象物502を、操作物である右手で押さえながら、図中で左から右になでる様子を表す図である。本実施形態では。操作検出部103は、このユーザの手を操作物として、その位置や動きを検出する。操作検出部103は、検出した手の位置や動きから、操作が撮影対象物502の歪みを抑制する操作であるか否かを判定する(S404)。操作が撮影対象物502の歪みを抑制する操作ではない場合(S404:N)、画像処理装置100は、S401以降の処理を繰り返し行う。
操作検出部103は、図5(b)で撮影対象領域に手が触れたことや、撮影対象物502を手で押さえることにより撮影対象領域が変形することに基づいて、撮影対象物502の歪みを抑制する操作を検出する。ここで撮影対象領域が変形する場合とは、例えば、紙が浮いていた部分が押さえられたことで凹む、あるいは操作台301上面に沿うように平たくなるなど、主に高さ方向に変化する場合である。操作検出部103は、一枚の静止画像から操作を検出してもよいし、複数の画像から検出される動きから検出してもよい。また、操作検出部103は、図5(f)の段階で、図5(b)〜図5(f)まで手が撮影対象領域を通り抜ける動きに基づいて、操作を検出してもよい。この場合、後述する部分画像取得のために図5(b)〜図5(f)までの画像をバッファリングする必要がある。
操作検出部103による操作物の動きの検出は、カメラ205から得られる画像に基づいて行ってもよいが、本実施形態では距離画像センサ206から得られる距離画像に基づいて行う。図6は、距離画像の説明図である。図6(a)は距離画像の例示図である。距離画像は、画像中の各座標(x,y)に対する距離Dを含む。なお、操作面がXY平面である。距離画像センサ206は、TOF(Time-of-Flight)方式やパターン照射方式等によって各画素との距離を計測する。操作検出部103は、距離画像に基づいて操作物を検出する。検出方式は背景差分、パターンマッチング、統計モデル等の手法を用いることができる。ここで操作物として検出した手先や各指、重心等の座標とその距離値(x,y,D)を実世界座標系(X,Y,Z)に変換する。図6(b)は実世界座標系の例示図である。距離画像系(x,y,D)と実世界座標系(X,Y,Z)との変換式は以下の式で表される。
なお、r00〜r22、t0〜t2、fx、fy、cx、cyは距離画像センサ206の設置時にキャリブレーションによって予め求めるパラメータである。各パラメータは、実世界座標(X,Y、Z)と画像座標(x,y)の対応関係が取れた既知の点がパラメータ数以上あれば、最小二乗法等で予め算出される。
操作検出部103は、操作物の位置を実世界座標系(X,Y,Z)に変換し、その座標により撮影対象領域に操作物が触れているか否かを判定する。ここで、カメラ205で取得した画像についても画像中の位置と実世界座標中の位置との対応関係を取る。操作検出部103が撮影対象物の歪みを抑制する操作か否かを判定する際には、操作物のZ座標が撮影対象領域のZ座標と近接しており、操作物の座標が撮影対象領域のX、Y座標系の範囲に含まれるか否かで判定して行う。さらに操作物が手であれば、手が開いているときだけ撮影対象物の歪みを抑制する操作であるとの判定を加えてもよい。
操作が撮影対象物502の歪みを抑制する操作である場合(S404:Y)、部分画像取得部104は、操作する手の位置に応じて撮影対象領域の部分画像を取得する(S405)。図5(c)では、部分画像取得部104が撮影対象物502の一部分の部分画像503を取得する。部分画像取得部104は、操作検出部103が検出した操作物の位置と領域検出部102が検出した撮影対象領域に基づいて、手が通った直後の範囲と撮影対象領域とで決まる範囲を、部分画像503として取得する。部分画像503の範囲は、これ以外に、例えば操作物の領域に基づいて設定してもよい。
ユーザが左手で撮影対象物502を動かないよう押さえ、右手で撮影対象物502を押さえながらなでるように手を移動させると、右手で押さえた直後の領域が、撮影対象物502の歪みの少ない領域となる。なお歪みの少ない領域は、手の通過後に高さが低下した、あるいは低いまま維持されている領域として計測により検出することもできる。部分画像取得部104は、この右手で押さえてなでられた範囲を部分画像503として取得する。部分画像取得部104は、図5(d)〜図5(f)でも同様に、部分画像を取得する。なお、図5(c)において、撮影対象物502を押さえる左手が部分画像503に含まれる場合がある。この場合、操作検出部103が検出した手領域に基づいて、画像中の撮影対象領域から手領域を除去するようにしてもよい。
操作検出部103は、撮影対象物502の歪みを抑制する操作が完了したか否かを判定する(S406)。操作検出部103は、撮影対象物502の歪みを抑制する操作の完了を、例えば、図5(f)に示すように、ユーザの手が撮影対象領域の外に出たことで検出する。また、操作検出部103は、ユーザがUIボタンを操作することで、歪みを抑制する操作の完了を検出してもよい。操作が完了していない場合(S406:N)、画像処理装置100は、S401以降の処理を繰り返し行う。S401以降の処理を繰り返し行うことで、画像処理装置100は、図5(c)〜図5(f)に示す部分画像を順次取得する。
操作が完了した場合(S406:Y)、部分画像取得部104は、撮影対象領域のすべての領域分の部分画像を取得したか否かを確認する(S407)。
すべての領域分の部分画像を取得した場合(S407:Y)、生成部105は、部分画像取得部104で取得した部分画像を合成して合成画像を生成する(S408)。図5(g)は、合成画像の説明図である。生成部105は、撮影対象物502の歪みを抑制する操作の間に部分画像取得部104が時系列に取得した部分画像列504から、撮影対象物502の合成画像505を生成する。合成画像505は、各部分画像503の画像中の位置に基づく重ね合わせや、部分画像間で共通する特徴点に基づく合成により生成される。特徴点に基づいて合成する場合、例えば、生成部105は、各部分画像から特徴的に表れるキーポイントを検出し、SIFT特徴量に基づいてRANSACアルゴリズムで部分画像間の特徴点の対応付けを行って合成する。合成方法はこれに限られるものではない。
出力部106は、生成部105で生成された撮影対象物502の合成画像505をプロジェクタ207により出力する(S409)。なお、画像処理装置100は、合成画像505を入力として文字認識等の解析処理を行ってもよい。以上のように撮影対象物502を手等の操作物で押さえてなでた直後の部分の画像を取得して合成することで、歪みの少ない撮影対象物の画像が取得可能となる。
撮影対象領域の少なくとも一部の部分画像を取得していない場合(S407:N)、出力部106は、未取得領域があることをユーザに報知する(S410)。図7は、未取得領域の説明図である。図7(a)、図7(b)では、撮影対象物の歪みを抑制する操作が行われ、部分画像取得部104がその部分画像を取得する。図7(c)に示すように、ユーザが撮影対象物の歪みを抑制する操作を中止して、手を撮影対象物上から離す場合、部分画像取得部104は、撮影対象領域内で取得していない部分画像があると判定する。出力部106は、図7(d)に示すように、撮影対象領域中に未取得領域701を示す図により、ユーザに未取得領域701があることを報知する。本実施形態では、表示装置にプロジェクタ207を用いるために、撮影対象物に重畳して未取得領域701を表示することが可能である。
図8は、未取得領域の別の説明図である。図8では、ユーザは、撮影対象物を手でなぞる方向に対して直交する方向に二回に分けて、歪みを抑制する操作を行う。図8(a)では、部分画像取得部104は、図5、図7とは異なり、撮影対象領域から手(操作物)の大きさに応じた領域の画像を部分画像801として取得する。手の大きさは、操作検出部103により、手のモデルマッチングや太さが極小となる手首の検出に基づいて検出される。図8(a)、図8(b)のように部分画像を取得する場合、撮影対象物を複数回押さえてなでるために、複数回の操作で取得した部分画像の間に隙間が生じることがある。図8(c)は、二回の操作によって取得した部分画像の隙間802を例示する。図7(d)と同様に、出力部106は、プロジェクタ207によって撮影対象物に隙間802を表す画像を重畳表示して、ユーザに未取得領域があることを報知する。
ユーザが報知された領域を手で押さえながらなでることで、部分画像取得部104は未取得領域の部分画像を取得することができる。これにより、生成部105は、撮影対象物の全体を表す合成画像を生成することができる。なお、複数回に分けて取得した部分画像を合成する際に部分画像が重なる場合、生成部105は、時間的に後に取得した部分画像を使用して合成画像を生成する。或いは、生成部105は、操作する手(操作物)の重心が近い方の部分領域をより歪みが少ないと仮定して合成画像を生成する。
以上のように、撮影対象物の歪みを抑制する操作として撮影対象物を押さえてなでる操作を検出し、押さえた直後の部分画像を順次取得して撮影対象物の合成画像を生成することで、歪みの少ない撮影対象物の画像を取得することが可能となる。また、画像処理装置100は、部分画像に漏れがある場合は未取得領域の存在を報知し、ユーザに歪みを抑制する操作を促すことで、全体に歪みが抑制された撮影対象物の画像を取得することが可能となる。
図9は、画像を読み取る際の別の状態説明図である。図5は、撮影対象物を一方の手で押さえながら、他方の手で撮影対象物を一方向になでる操作を表すが、図9は、両手で撮影対象物をそれぞれ異なる方向になでる操作を表す。部分画像を両手の動きに合わせて取得する点を除き、画像取得システムの処理自体は、片手で撮影対象物をなでる場合と同様である。
図9(a)では、ユーザは撮影対象物の中央付近を両手で押さえる。操作検出部103は、撮影対象物の歪みを抑制する操作として、図9(a)の状態を検出する(S404)。図9(b)〜図9(d)に示すようにユーザが両手をそれぞれ異なる方向に撮影対象物を押さえながら移動させると、部分画像取得部104は、手が押さえた直後の領域を部分画像503として順次取得する(S405)。
操作検出部103は、図9(d)に示すように両手が撮影対象物と一致する高さZを保ったまま撮影対象領域外に出たことを検出すると、操作が完了したと判定する(S406:Y)。これにより生成部105は、取得した部分画像を合成して合成画像を生成する(S408)。
操作検出部103は、撮影対象物上に手が一つ置かれるか、二つ置かれるかより、片手で操作が行われるか、両手で操作が行われるかをS404の処理で検出する。ここで検出した操作が継続している間、部分画像取得部104は部分画像を取得する。
図10は、画像を読み取る際の別の状態説明図である。図10ではユーザが手や専用器具で撮影対象物を押さえる領域に応じて、部分画像が取得される。
図10(a)では、ユーザが手で部分画像を表す矩形を形作って、撮影対象物を、歪みを抑制するように押さえる。図10(b)では、ユーザが手で部分画像を表す矩形の頂点を指示して、撮影対象物を、歪みを抑制するように押さえる。図10(a)、図10(b)では、部分画像取得部104は、手の動きに合わせて時系列に連続して部分画像を取得するのではなく、操作検出部103が図10(a)、図10(b)の操作を検出する度に部分画像を取得する。
図10(c)は、棒状の操作物を用いる例を表す。部分画像取得部104は、棒状の操作物で押さえられた直後の操作対象領域を、順次部分画像として取得する。図10(d)は、矩形の窓枠状の操作物を用いる例を表す。部分画像取得部104は、操作物の開口部1001から見える撮影対象領域を部分画像として取得する。
このように、撮影対象物の歪みを抑制する操作を検出して部分画像を取得し、合成画像を生成可能であれば、撮影対象物の押さえ方や押さえる器具はどのようなものであってもよい。
また、画像処理装置100は、部分画像により、撮影対象物の少なくとも一部分の画像を生成するようにしてもよい。この場合、図4のS407及びS410の処理が不要になる。図11は、この場合の画像を読み取る際の状態説明図である。
図11(a)に示すように、ユーザが撮影対象物の一部を手で押さえることで、操作検出部103は、撮影対象物の歪みを抑制する操作を検出する(S404)。ユーザが図11(b)、図11(c)に示すように、ユーザが手で撮影対象物の一部を押さえながらなでることで、部分画像取得部104は、手で押さえられた直後の領域の部分画像を取得する(S405)。ユーザが図11(d)に示すように撮影対象物を押さえる手を抜くことで、操作検出部103は、撮影対象物502の歪みを抑制する操作が完了したと判定する(S406:Y)。生成部105は、部分画像取得部104が取得した部分画像を合成して撮影対象物の一部分の画像を生成する。図11(e)は、生成部105が生成する撮影対象物の一部分の画像の例示図である。破線が撮影対象物の全体の領域を示し、実線1101が撮影対象物を手で押さえてなでた領域である撮影対象物の一部分の画像である。このような処理により、ユーザは、撮影対象物の所望する一部分の画像を、手で当該部分を押さえてなでるというハンディスキャナに似た直感的な操作を行うことで、電子化することができる。
なお、画像読取システムは、手等の操作物が撮影対象物を押さえる位置やなでる方向をプロジェクタ207の表示によりガイドしてもよい。図12は、ガイド表示の説明図である。画像処理装置100の出力部106は、プロジェクタ207により撮影対象物上にガイドを表示する。ユーザがガイドに会わせて手で撮影対象物を押さえると、操作検出部103がこれを検出する。画像処理装置100は、なでる方向をガイドする。ユーザがガイドに従って撮影対象物を押さえながらなでることで、画像処理装置100は、部分画像を順次取得して、撮影対象物の合成画像を取得することができる。
ガイドの表示により、画像処理装置100は、ユーザが手を置く位置を想定可能である。操作検出部103は、手の位置とガイドの表示位置との関係から、S404の処理で、撮影対象物の歪みを抑制する操作の判定を行う。例えば、操作検出部103は、距離画像を用いずに、手の位置とガイド表示の位置とが画像中若しくは操作面上で一致しているか否かにより、撮影対象物の歪みを抑制する操作の判定を行うことができる。
[第2実施形態]
部分画像を合成して撮影対象物の電子化を行う他に、撮影対象物の全体画像を最初に取得しておき、歪みの大きい部分の部分画像を後に取得して、全体画像に部分画像を合成することで、歪みのない撮影対象物の画像を取得することも可能である。第2実施形態の画像処理装置100は、第1実施形態とは機能ブロックが異なり、他の構成については同様である。同様の構成については説明を省略する。
図13は、第2実施形態の画像処理装置100の機能ブロック図である。この画像処理装置100は、図3の第1実施形態の画像処理装置100の機能ブロックに、歪み検出部1301が追加された構成である。歪み検出部1301は、撮影対象物の全体の画像から歪みが発生した歪み領域を検出する。歪み検出部1301は、例えば、撮影対象領域に含まれる撮影対象物の輪郭等の直線の歪みや、撮影対象物に文書が含まれていれば文書の行の歪み、文字の歪みにより、歪み領域を検出する。また、歪み検出部1301は、距離画像センサ206で取得する距離画像から、撮影対象物の高さの平坦さに基づいて歪み領域を検出してもよい。
図14は、このような画像読取システムにより撮影対象物の画像を読み取る処理を表すフローチャートである。図15は、画像を読み取る際の状態説明図である。図14のS1401、S1402の処理は、図4のS401、S402の処理と同様である。
S1402の処理で撮影対象領域を検出した画像処理装置100は、領域検出部102により、撮影対象物の全体画像である撮影対象領域の全体画像を取得する(S1403)。図15(a)は、画像入力部101が受け付ける画像データが表す画像の一例である。画像には、操作台301及び操作面に載置されるドキュメント等の撮影対象物502の画像が含まれる。図15(b)は、撮影対象領域の全体画像を表す。領域検出部102は、図15(b)の全体画像を取得する。
歪み検出部1301は、撮影領域の全体画像から、歪み領域を検出する(S1404)。出力部106は、歪み検出部1301が検出した歪み領域を出力する(S1405)。出力部106は、プロジェクタ207により、撮影対象物上に歪み領域を表す画像を投影する。図15(c)は、歪み領域の画像を撮影対象物に投影した状態を表す。図中、左上及び右下部分が歪み領域である。なお、操作台301がディスプレイの場合、出力部106は、撮影対象物の外の歪み領域近傍に、歪み領域の画像を表示するようにしてもよい。また、出力部106は、撮影対象物の載置位置とは別の位置に、撮影対象領域の画像と歪み領域の画像とを重畳して表示してもよい。
S1406〜S1408の処理は、図4のS403〜S405の処理と同様である。この際、ユーザは、図15(d)に示すように、歪み領域を手で囲むように押さえる。部分画像取得部104は、図中、破線で囲まれた領域を部分画像として取得する。生成部105は、部分画像取得部104で取得した部分画像と、撮影対象領域の全体画像とを合成した合成画像を生成する(S1409)。図15(e)は、合成画像の例示図である。破線の領域が全体画像に対して重畳された部分画像である。出力部106は、生成部105で生成された合成画像を出力する(S1410)。これにより、左上の歪み領域(図15(c)参照)の歪みが抑制される。
右下の歪み領域については抑制されていないため、画像処理装置100は、S1401以降の処理を繰り返し行う(S1411:N)。歪み検出部1301は、図15(f)に示す歪み領域を検出する。ユーザは、図15(g)に示すように、歪み領域を手で囲むように押さえる。画像処理装置100は、これにより図15(h)に示すような合成画像を生成する。図15(i)は、出力される合成画像の例示図。この合成画像の画像データが、撮影対象物を電子化したデータとして記憶部204に記憶される。以上のようにして、撮影対象物が電子化される処理が終了する(S1411:Y)。
以上のように、撮影対象の全体画像に対して歪み領域を検出して表示し、ユーザの押さえる操作を検出して部分画像を全体画像に順次合成していく事で、歪みの少ない画像を取得することができる。
第1実施形態及び第2実施形態では、水平に操作面が設けられる操作台301に対して、距離画像センサ206が上方から距離画像を撮影してユーザの操作を検出する構成である。操作台301を壁等に設置することで操作面が鉛直に設けられる場合、距離画像センサ206は、水平方向から距離画像を撮影することになる。この場合、撮影対象は、磁石等により操作面に固定される。磁石は、撮影対象物の歪みが効率よく抑制される位置に設けられることが望ましい。また、撮影対象物には、紙等のドキュメントや書籍の他に、衣服の生地、ビニール等の形状が変化して歪みが発生するものであってもよい。
[その他の実施形態]
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPU、MPU等)がプログラムを読み出して実行する処理である。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPU、MPU等)がプログラムを読み出して実行する処理である。
Claims (19)
- 操作面上に載置された撮影対象物の画像を受け付ける画像入力手段と、
所定の操作物による前記撮影対象物の歪みを抑制する操作を検出する操作検出手段と、
前記操作検出手段が前記操作を検出する場合、前記操作物の位置に応じて、前記撮影対象物の一部に相当する部分画像を取得する部分画像取得手段と、
前記部分画像取得手段が取得した複数の前記部分画像を使って、前記撮影対象物を表す画像を生成する生成手段と、を備えることを特徴とする、
画像処理装置。 - 前記部分画像取得手段は、前記操作物の前記操作により移動した位置に応じて、前記部分画像を順次取得することを特徴とする、
請求項1記載の画像処理装置。 - 前記部分画像取得手段は、前記操作物が前記操作した範囲に応じて、前記部分画像を順次取得することを特徴とする、
請求項1又は2記載の画像処理装置。 - 前記画像入力手段で受け付けた前記画像から、前記操作面上の前記撮影対象物の領域を検出する領域検出手段を備えており、
前記部分画像取得手段は、前記操作物の位置と前記領域とで決まる範囲を、前記部分画像として取得することを特徴とする、
請求項1〜3のいずれか1項記載の画像処理装置。 - 前記操作検出手段は、前記撮影対象物及び前記操作物を含む距離画像を取得し、取得した距離画像に応じて前記操作物による前記操作を検出することを特徴とする、
請求項1〜4のいずれか1項記載の画像処理装置。 - 前記操作検出手段は、前記操作物が前記撮影対象物を押さえる操作を検出し、
前記部分画像取得手段は、押さえる位置に応じて前記部分画像を取得することを特徴とする、
請求項1〜5のいずれか1項記載の画像処理装置。 - 前記操作検出手段は、前記操作物が前記撮影対象物を押さえてなでる操作を検出し、
前記部分画像取得手段は、押さえてなでられた範囲を、前記部分画像として取得することを特徴とする、
請求項6記載の画像処理装置。 - 前記操作検出手段は、前記操作物が前記撮影対象物の所定の範囲を囲う操作を検出し、
前記部分画像取得手段は、前記撮影対象物の前記操作物で囲われた範囲を、前記部分画像として取得することを特徴とする、
請求項5記載の画像処理装置。 - 前記生成手段は、複数の前記部分画像を合成して、前記撮影対象物の少なくとも一部を表す合成画像を生成することを特徴とする、
請求項1〜8のいずれか1項記載の画像処理装置。 - 前記生成手段は、前記画像入力手段で受け付けた前記画像と前記部分画像取得手段で取得した前記部分画像と合成して、前記撮影対象物を表す合成画像を生成することを特徴とする、
請求項1〜9のいずれか1項記載の画像処理装置。 - 前記生成手段で生成した前記画像を所定の表示装置により前記操作面上に表示させる出力手段を備えることを特徴とする、
請求項1〜10のいずれか1項記載の画像処理装置。 - 前記出力手段は、前記撮影対象物に重畳して、前記生成手段で生成した前記画像を表示させることを特徴とする、
請求項11記載の画像処理装置。 - 前記出力手段は、前記操作が完了したときに、前記部分画像取得手段が前記操作面上の前記撮影対象物の領域の少なくとも一部の前記部分画像を取得していない場合に、前記表示装置により未取得領域があることを報知することを特徴とする、
請求項11又は12記載の画像処理装置。 - 前記出力手段は、前記表示装置に、前記操作物により操作する位置を表すガイドを表示させることを特徴とする、
請求項11〜13のいずれか1項記載の画像処理装置。 - 前記画像入力手段で受け付けた前記画像から前記撮影対象物の歪み領域を検出する歪み検出手段を備えており、
前記出力手段は、前記表示装置に、前記歪み領域を表す画像を表示させることを特徴とする、
請求項11〜14のいずれか1項記載の画像処理装置。 - 前記撮影対象物は、形状が変化して歪みが発生するものであることを特徴とする、
請求項1〜15のいずれか1項記載の画像処理装置。 - 操作面上に載置された撮影対象物の画像を撮影する撮影装置、前記操作面上の所定の操作物の移動を検出する移動検出装置、及び画像処理装置を備えるシステムにより実行される方法であって、
前記画像処理装置が、
前記撮影装置が撮影した前記画像を受け付ける工程と、
前記移動検出装置で検出した前記操作物の移動により、前記操作物による前記撮影対象物の歪みを抑制する操作を検出して、前記操作物の位置に応じて、前記撮影対象物の一部に相当する部分画像を取得する工程と、
取得した複数の前記部分画像を使って、前記撮影対象物を表す画像を生成する工程と、を含むことを特徴とする、
画像読取方法。 - 操作面上に載置される撮影対象物の画像を撮影する撮影装置及び前記操作面上の所定の操作物の移動を検出する移動検出装置が接続されるコンピュータを、
前記撮影装置が撮影した前記画像を受け付ける画像入力手段、
前記移動検出装置で検出した前記操作物の移動により、前記操作物による前記撮影対象物の歪みを抑制する操作を検出する操作検出手段、
前記操作検出手段が前記操作を検出する場合、前記操作物の位置に応じて、前記撮影対象物の一部に相当する部分画像を取得する部分画像取得手段、
前記部分画像取得手段が取得した複数の前記部分画像を使って、前記撮影対象物を表す画像を生成する生成手段、
として機能させるコンピュータプログラム。 - 請求項18記載のコンピュータプログラムを記憶するコンピュータにより読み取り可能な記憶媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015154205A JP2017033389A (ja) | 2015-08-04 | 2015-08-04 | 画像処理装置、画像読取方法、コンピュータプログラム、及び記憶媒体 |
US15/213,837 US10044904B2 (en) | 2015-08-04 | 2016-07-19 | Apparatus, image reading method, and storage medium for reading an image of a target object |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015154205A JP2017033389A (ja) | 2015-08-04 | 2015-08-04 | 画像処理装置、画像読取方法、コンピュータプログラム、及び記憶媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2017033389A true JP2017033389A (ja) | 2017-02-09 |
Family
ID=57988246
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015154205A Pending JP2017033389A (ja) | 2015-08-04 | 2015-08-04 | 画像処理装置、画像読取方法、コンピュータプログラム、及び記憶媒体 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10044904B2 (ja) |
JP (1) | JP2017033389A (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107430250B (zh) * | 2014-12-16 | 2019-10-18 | 伊瓦·阿尔布佐夫 | 用于光学设备的模块化相机附件 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10136194A (ja) | 1996-10-30 | 1998-05-22 | Minolta Co Ltd | 画像読取り装置 |
US7164518B2 (en) * | 2003-10-10 | 2007-01-16 | Yuping Yang | Fast scanner with rotatable mirror and image processing system |
JP2008236456A (ja) * | 2007-03-22 | 2008-10-02 | Brother Ind Ltd | プリンタ複合機、プリントシステム、及び、静止画像印刷プログラム |
US20080317306A1 (en) * | 2007-06-19 | 2008-12-25 | Robin Hamilton | Methods of and apparatus for forming a biometric image |
JP5407381B2 (ja) * | 2009-02-04 | 2014-02-05 | セイコーエプソン株式会社 | 画像入力装置、画像表示装置、及び画像表示システム |
JP2013247531A (ja) | 2012-05-25 | 2013-12-09 | Panasonic Corp | 画像処理装置およびこれを備えた原稿読取システム |
-
2015
- 2015-08-04 JP JP2015154205A patent/JP2017033389A/ja active Pending
-
2016
- 2016-07-19 US US15/213,837 patent/US10044904B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20170041500A1 (en) | 2017-02-09 |
US10044904B2 (en) | 2018-08-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6089722B2 (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
JP6248533B2 (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
JP6327931B2 (ja) | 画像処理装置、情報処理方法及びプログラム | |
JP6723814B2 (ja) | 情報処理装置、その制御方法、プログラム、及び記憶媒体 | |
JP5201096B2 (ja) | 対話操作装置 | |
US9836130B2 (en) | Operation input device, operation input method, and program | |
CN108027656B (zh) | 输入设备、输入方法和程序 | |
JP2016162162A (ja) | 接触検出装置、プロジェクタ装置、電子黒板装置、デジタルサイネージ装置、プロジェクタシステム及び接触検出方法 | |
JP2014186715A (ja) | 情報処理装置、情報処理方法 | |
US20160170564A1 (en) | Input operation detection device, projection apparatus, interactive whiteboard, digital signage, and projection system | |
JP5623138B2 (ja) | 情報処理装置およびその動作方法 | |
JPWO2018154634A1 (ja) | 投写型表示装置、投写型表示装置の制御方法、及びプログラム | |
JP2016103137A (ja) | ユーザインタフェース装置、画像処理装置及び制御用プログラム | |
JP2017117373A (ja) | 操作装置とその制御方法、及びプログラム | |
JP2017219942A (ja) | 接触検出装置、プロジェクタ装置、電子黒板装置、デジタルサイネージ装置、プロジェクタシステム、接触検出方法、プログラム及び記憶媒体。 | |
JP6127465B2 (ja) | 情報処理装置、情報処理システム及びプログラム | |
JP6399840B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2005267257A (ja) | 手書き情報入力システム | |
JP6746419B2 (ja) | 情報処理装置、及びその制御方法ならびにコンピュータプログラム | |
JP2013114467A (ja) | 表示システム、表示方法およびプログラム | |
JP2015198406A (ja) | 画像読取装置、方法およびプログラム | |
JP2017033389A (ja) | 画像処理装置、画像読取方法、コンピュータプログラム、及び記憶媒体 | |
KR101496761B1 (ko) | 다면 스크린 프로젝션 기반 휴대용 3차원 모델 제어 시스템 및 그 방법 | |
JP6643825B2 (ja) | 装置及び方法 | |
JP6632298B2 (ja) | 情報処理装置、情報処理方法及びプログラム |