以下、図面を参照して本発明の実施形態を説明する。ただし、本発明の実施形態は以下の実施形態に限定されるものではない。
図1(a)は、本発明に係る画像処理装置の一例を示すブロック図である。図1(b)は、本発明に係る画像処理装置の具体的な構成例を示すブロック図である。図1(a)に示すように、画像処理装置100は、撮像部101、UI(ユーザーインタフェース)部102、制御部103、記憶部104、及び通信部105を備える。また、制御部103は、第1の取得部110、判断部111、第2の取得部112、補完部113、補完モード切替部114、及び通知部115を備える。
撮像部101は、机や専用シートなどの読み取り台に置かれた原稿を撮像(撮影)して画像データを生成する。また、撮像部101は、複数枚綴りの原稿のうち対象ページの画像を撮像する。例えば、図1(b)に示すように、撮像部101は、デジタルカメラやビデオカメラなどのカメラ120により構成される。
UI部102は、読み取り作業を行うユーザーから画像処理装置100への指示を受け付け、画像処理装置100からユーザーへの情報提供を行う。例えば、図1(b)に示すように、UI部102は、指示受付手段としてボタンやセンサや音声入出力装置などの入出力装置121、及び情報提供手段としてプロジェクタ(投影部)やディスプレイなどの表示装置122により構成される。センサは、ユーザーのジェスチャーによる指示を受け付けるためのジェスチャー検知センサなどである。また、音声入出力装置は、ユーザーの音声による指示を受け付けたり、音声による情報を出力したりする。
制御部103は、画像処理装置100を制御する。例えば、図1(b)に示すように、制御部103は、CPUやGPUなどの処理装置123により構成され、コンピュータープログラムに従って処理を実行する。
第1の取得部110は、対象ページの画像を第1の画像として取得する。判断部111は、第1の画像に欠損部がある場合に、欠損部に対応する補完画像の取得が必要であるか否かを判断する。第2の取得部112は、補完画像の取得が必要であると判断された場合に、撮像部101により対象ページが再撮像された第2の画像から補完画像を取得する。補完部113は、欠損部に補完画像を補完することにより対象ページの出力画像を生成する。
補完モード切替部114は、補完画像の取得が必要であると判断された場合に、欠損部に補完画像を補完する補完モードに切り替える。通知部115は、対象ページ、第1の画像、第2の画像、及び出力画像の少なくとも1つにおける欠損部及び補完画像の少なくとも1つの位置を通知する。
記憶部104は、画像処理装置100の各手段として機能させるコンピュータープログラム、一時データ、及び画像データ(例えば、対象ページの画像データ、対象ページの出力画像データ、欠損部の画像データ、及び補完画像の画像データ)などを保持する。例えば、図1(b)に示すように、記憶部104は、RAMなどのメモリやHDDなどの記憶装置124により構成される。通信部105は、画像処理装置100に接続されるコンピューターやサーバーなどと通信を行う。
図2は、本発明に係る画像処理装置の外観及び使用態様の一例を示す図である。図2に示すように、画像処理装置200は、図1の撮像部101に相当するデジタルカメラ201、図1のUI部102の指示受付手段に相当するジェスチャー検知センサ202、及びUI部102の情報提示手段に相当するプロジェクタ203を備える。
画像処理装置200は、机や専用シートなどの読み取り面(又は、読み取り台)210に設置される。デジタルカメラ201は、読み取り面210に置かれた原稿220を撮像(撮影)する。デジタルカメラ201は、原稿220の上側から原稿220の対象ページを撮像する。
図2では、原稿220は紙面の左上がステープラで綴じられた複数枚綴りの原稿であり、原稿220の1枚目(1葉目)221が紙面の左上方向にめくられて、2枚目(2葉目)222の表面が対象ページとして撮像される使用態様が示されている。画像処理装置200は、複数枚綴りの原稿220をユーザーがめくりながら1ページずつ撮像し、全ページに対応する出力画像を電子文書として生成する。
情報提供手段であるプロジェクタ203は、読み取り面210に作業開始/終了のボタンや撮像ボタンなどの指示UI(指示マーク)を指示受付手段として投影してもよい。この場合、ユーザーが指示UIに所定の時間接触していることなどを、デジタルカメラ201及びジェスチャー検知センサ202の少なくとも1つが検知し、指示UIに対応する指示を出力する。
図2の画像処理装置200には図1の各構成が一体化されているが、本発明に係る画像処理装置はこれに限定されず、複数の装置によって構成されてもよい。例えば、ボタン付リモコンやマウスなどの指示受付手段及び液晶ディスプレイなどの情報提供手段が、画像処理装置200に外付けされて、UI部102を構成してもよい。
また、画像処理装置200は、コンピューターに接続され、制御部103、記憶部104、及び通信部105は、当該コンピューターに備えられてもよい。また、記憶部104のうち、原稿220の読み取り結果を記憶する記憶部がイントラネットやインターネット上のサーバーに備えられ、通信部105を介した有線や無線通信によって、画像処理装置200はサーバーの記憶部のデータを読み書きしてもよい。また、同様に制御部103の一部又は全てのコンピュータープログラムがイントラネットやインターネット上のサーバーで動作してもよい。
図3は、画像処理装置200の動作の一例を示すフローチャートである。本例では、M枚(2≦M)がステープラで綴じられた原稿220を読み取り原稿とし、ユーザーが原稿220を読み取り面210に置いて、1枚1枚めくりながら各ページを撮像する読み取り作業を想定する。つまり、ステープラなどで綴じられた複数枚綴りの原稿220を、各葉に分離することなくユーザーが手でめくりながらデジタルカメラ(撮像部)201が対象ページの画像を撮像し、画像処理装置200が各ページを連続で読み取る。
図3には、画像処理装置200が原稿220の各ページを撮像して画像データを取得する動作、及び取得した画像データから各ページの出力画像データを生成し、読み取り結果である出力画像を電子文書として出力する動作の例が示されている。
図3に示すように、本発明に係る画像処理方法は、複数枚綴りの原稿のうち対象ページの画像を撮像する撮像工程(ステップS302又はS305)と、対象ページの画像を第1の画像として取得する第1の取得工程(ステップS303又はS306)を備える。また、本発明に係る画像処理方法は、第1の画像に欠損部がある場合に、欠損部に対応する補完画像の取得が必要であるか否かを判断する判断工程(ステップS307)を備える。
また、本発明に係る画像処理方法は、補完画像の取得が必要であると判断された場合に、対象ページが再撮像された第2の画像から補完画像を取得する第2の取得工程(ステップS309)を備える。また、本発明に係る画像処理方法は、欠損部に補完画像を補完することにより対象ページの出力画像を生成する補完工程(ステップS310−S312)を備える。
また、本発明に係るコンピュータープログラム(ソフトウェア)が、以下の処理を画像処理装置200の各手段として機能させてもよい。この場合、コンピュータープログラムは、ネットワーク又は各種記憶装置を介してシステムあるいは装置に供給され、そのシステムあるいはコンピューター(CPUやMPUなど)により読みだされて実行される。
ステップS301では、ユーザーが原稿220を読み取り面210に置き、UI部102を介して画像処理装置200に読み取り作業の開始を指示する。本例では、プロジェクタ203が読み取り面210に指示受付手段として投影した作業開始ボタンをユーザーがタッチすることで、読み取り開始の指示が出力される。例えば、ジェスチャー検知センサ202が距離センサを備え、作業開始ボタンの投影範囲内における移動部(ユーザーの指など)と読み取り面210との距離が所定の閾値以下になった場合、ユーザーが作業開始ボタンにタッチしたことを距離センサが検知する。
これは一例であり、他の方法によりユーザーの作業に関する指示が検知及び出力されてもよい。ジェスチャー検知以外の方法、例えば、画像処理装置200、読み取り面210、及びリモコンなどに設置されたボタンやマウス操作や音声入力によって作業開始の指示が検知及び出力されてもよい。また、重量や赤外線反射率の変化などにより読み取り面210上の物体を検知するセンサを画像処理装置200が備え、原稿220が読み取り面210に置かれたことをセンサが検知し、読み取り作業の開始指示が出力されてもよい。
ステップS302では、画像処理装置200のデジタルカメラ201が、原稿220の1枚目の表面(1ページ目)を撮像する。この場合、画像処理装置200は、撮像ページのカウンタNを“N=1”とする。ステップS302における撮像は、UI部102を介したユーザーからの指示に基づいて行われてもよい。例えば、プロジェクタ203が読み取り面210に指示受付手段として投影した撮像ボタンを、ユーザーがタッチしたことを前述の方法で検知してもよいし、他の方法により撮像指示が検知及び出力されてもよい。
また、ジェスチャー検知センサ202が距離センサを備え、作業開始ボタンの投影範囲内における移動部(例えば、ユーザーの指)と読み取り面210との距離が所定の閾値以上になった場合、ユーザーが原稿220から手を離したことを距離センサが検知する。そして、手を離したことを検知してから所定時間経過した後に撮像指示が出力されてもよい。撮像された画像データは画像処理装置200の記憶部104に保持される。
ステップS303では、画像処理装置200が、ステップS302で取得した画像データから出力電子文書の1ページ目に対応する出力画像データを生成する。ステップS302の処理には、デジタルカメラ201の撮像画像から原稿220の読み取り対象である対象ページの範囲を特定する処理(対象ページ範囲特定処理)及び撮像された画像の形状や向きを判別して補正する処理(補正処理)が含まれる。これらの処理の他に、撮像時のムラやぼけを補正する画像処理が必要に応じて追加されてもよい。
対象ページ範囲特定処理及び補正処理により撮像画像より生成される対象ページの画像をページ画像(第1の画像)と呼ぶ。第1の取得部110が、対象ページの画像をページ画像(第1の画像)として取得する。1ページ目が原稿220の1枚目の表面である場合は欠損部がないものと想定されるので、1ページ目については、ページ画像(第1の画像)が1ページ目に対応する出力画像データとなる。ただし、1枚目の表面であっても欠損部がある場合は、補完部113が欠損部に補完画像を補完してもよい。
次に、対象ページ範囲特定処理及び補正処理について具体的に説明する。
(対象ページ範囲特定処理)
デジタルカメラ201の撮像可能範囲は、読み取り面210上で原稿220が占める範囲よりも広く設定されている。これは、原稿220の位置がずれた場合であっても原稿全体を撮像できるため、所定の位置に原稿220を厳密に置く必要がなくなり、ユーザーの負担が軽減されるからである。
一方、撮像範囲が広くなるため、撮像画像から読み取り対象である対象ページの範囲を特定する対象ページ範囲特定処理が必要になる。対象ページ範囲特定処理は、公知の技術(例えば、特許文献1に開示される方法)により行うことができる。具体的には、ハフ変換などで撮像画像から検出した直線エッジ群から、ページの4辺に相当する枠を選別することにより、対象ページの範囲が特定される。
(補正処理)
図2に示すように、デジタルカメラ201が原稿220の真上にない場合、撮像画像中の対象ページの形状は長方形ではなく、不等辺四角形状に歪んでいる。この歪み補正は、デジタルカメラ201と読み取り面210の位置関係から定まる固定値の行列式により各画素を座標変換し再配置することにより行われる。
例えば、画像処理装置200は、プロジェクタ203から読み取り面210に4点を投影し、この4点を含む撮像画像に基づいてデジタルカメラ201と読み取り面210の位置関係を算出し、固定値を取得及び更新し、固定値の行列式を得る機能を備えてもよい。また、画像処理装置200は、特許文献1に開示される逆透視変換演算により、撮像画像中から得られるページの4頂点の座標に基づいて撮像画像ごとに座標変換の行列パラメータを求める機能を備えてもよい。
更に、デジタルカメラ201の撮像画像の上下左右方向(撮像方向)は予め設定されているが、原稿220の紙面方向はデジタルカメラ201の撮像方向と一致せずに置かれる場合がある。この場合、撮像画像において紙面方向が撮像方向に対して回転(例えば、90度単位で回転)している。
画像処理装置200は、撮像方向に対する紙面方向の回転を公知の技術により判定し、必要に応じて撮像画像を逆回転(例えば、90度単位で逆方向に回転)することにより、正置の対象ページの画像に補正する機能を備えてもよい。撮像方向に対する紙面方向の回転の判定は、公知の文字認識技術を用いて実現できる。具体的には、対象ページ内に記載された文字部分の画像を0度、90度、180度、及び270度のそれぞれの向きに回転し、各画像の文字認識結果から最も文字らしい出力が得られた向きが正置の向きと判定される。
図3に戻り、ステップS304では、原稿220の読み取り作業の最終ページまで撮像が完了している否かが判断される。原稿220の読み取り作業の最終ページまで撮像が完了している場合(例えば、原稿220の綴り枚数のM枚目まで撮像が完了している場合)、ステップS314に進む。原稿220の読み取り作業の最終ページまで撮像が完了していない場合、ステップS305に進む。なお、原稿220の最終ページは任意のページであってもよい。
撮像されたページが最終ページか否かの判定は、様々な方法により実現可能である。例えば、プロジェクタ203が読み取り面210に指示受付手段として投影した作業終了ボタンをユーザーがタッチすることで読み取り終了の指示が出力され、撮像されたページが最終ページであると判定される。
また、原稿220の綴り枚数Mが既知である場合、撮像ページのカウンタNと原稿220の綴り枚数Mとを比較することにより、撮像されたページが最終ページであると判定されてもよい。また、最終ページに特殊なマークや色が施され、それらを検出することにより撮像されたページが最終ページであると判定されてもよい。また、読み取り面210上の物体を検知するセンサを画像処理装置200が備え、原稿220が読み取り面210から取り除かれたことをセンサが検知することにより、撮像されたページが最終ページであると判定されてもよい。
ステップS305では、原稿220のm枚目(m葉目)が紙面の左上方向にめくられて、“m+1”枚目(“m+1”葉目)の表面(nページ目)が対象ページとしてデジタルカメラ201により撮像される。
例えば、図2の原稿220の1枚目(1葉目)221が紙面の左上方向にめくられて、2枚目(2葉目)222の表面(2ページ目)が対象ページとしてデジタルカメラ201により撮像される。このとき、撮像ページ数のカウンタNがインクリメント(+1)される。インクリメントした後のカウンタNは“N=n”となる。これは、原稿220の1ページからnページまでの対象ページが撮像済みであることを意味する。
図4は、原稿をめくった状態における対象ページ以前のページと対象ページとの位置関係を示す図である。図4の対象ページ401は、ステープラで綴じられた複数枚綴りの原稿220のnページ(2≦n)で、“N=n−1”以前のページがめくられている状態である。ステープラによる原稿綴じ位置402は、紙面の左上である。図4では、“N=n−1”以前のページが含まれる原稿220のm枚目のめくり方が2つ示されており、原稿220のm枚目の第1のめくり位置410及び第2のめくり位置420が破線で示されている。
第1のめくり位置410は、原稿220のm枚目が紙面の左上方向にめくられた状態である。なお、第1のめくり位置410は模式的に示したものであり、原稿220のm枚目が紙面の45度左上方向にめくられた状態を示しているが、紙面の任意の角度でめくられてもよい。第2のめくり位置420は、原稿220のm枚目が紙面の上方向にめくられた状態である。
ステップS305における撮像は、ステップS302における撮像と同様に、撮像ボタンなどのUI部102を用いたユーザーの撮像指示により行われればよい。また、ステップS305における撮像は、ユーザーのめくり動作の完了をジェスチャー検知センサが検知し、めくり動作が完了した状態で所定の時間が経過した後に行われてもよい。
なお、原稿の紙質などの原稿220の状態によっては、対象ページを読み取り面210で平面に保って良好な撮像画像を取得するために、原稿220のm枚目をめくった状態で指などにより保持する場合がある。そのため、原稿220から指などを離した状態ではなく、指などで原稿220を押さえた状態(静止状態)で所定の時間が経過したことにより、ジェスチャー検知センサがユーザーのめくり動作の完了を検知するのが好ましい。
ステップS306では、第1の取得部110が、対象ページの画像をnページ目のページ画像(第1の画像)として取得する。このとき、ステップS303で説明した対象ページ範囲特定処理及び補正処理が行われる。ただし、ステップS303とは異なり、撮像画像中には、対象ページ(nページ目)だけではなく、ユーザーがめくった原稿220のm枚目のページが含まれている。
図5は、ステップS306における対象ページ範囲特定処理の処理中に得られる線分(直線エッジ)の例である。図5Aは、図4の第1のめくり位置410に対応するめくり方をした場合の撮像画像から検出される直線エッジの例である。なお、図5Aは補正処理前の段階なので、ページの形状が不等辺四角形状に歪んでいる。直線エッジ501〜504は、対象ページ(nページ目)の上下左右の4辺に対応する直線エッジである。直線エッジ505〜508は、ユーザーがめくった原稿220のm枚目の裏面の4辺に対応する直線エッジである。
なお、めくられた紙面が紙の弾性により湾曲して辺が曲線になり、直線エッジ505〜508が検出されない場合もあるが、対象ページ(nページ目)の上下左右の4辺に対応する直線エッジ501〜504が特定されればよいので、特に問題にならない。
直線エッジ509は、原稿220をめくった状態における対象ページ以外のページ(原稿220のm枚目の裏面)と対象ページ(nページ目)との重複部分550の直線エッジである。例えば、直線エッジ509は、nページと“n−1”ページ以前のページの境界から検出される直線エッジである。
図5Bは、図4の第2のめくり位置420に対応するめくり方をした場合の撮像画像から検出される直線エッジの例である。なお、図5Bは補正処理前の段階なので、ページの形状の形状が不等辺四角形状に歪んでいる。直線エッジ521,522は、nページ目の紙面の右辺及び下辺に対応する直線エッジである。直線エッジ524,525は、原稿220のm枚目の裏面の上辺及び右辺に対応する直線エッジである。直線エッジ523は、nページ目の左辺と原稿220のm枚目の裏面の左辺とが繋がった状態で検出された直線エッジである。
直線エッジ526は、原稿220をめくった状態における対象ページ以外のページ(原稿220のm枚目の裏面)と対象ページ(nページ目)との重複部分551の直線エッジである。例えば、直線エッジ526は、nページと“n−1”ページ以前のページの境界から検出される直線エッジであり、実際の両ページの辺ではない。このとき、nページ目の上辺と“n−1”ページ以前のページの下辺は、直線エッジとして検出されない。
ステップS306の対象ページ範囲特定処理では、第1の取得部110が、図5のような直線エッジ群から、読み取り対象である対象ページ(nページ目)のページ範囲を示す4辺に相当する直線エッジを選出する処理が含まれる。具体的には、各直線エッジを延長してできる四辺形の組み合わせを全て生成し、その中から対象ページ(nページ目)の4辺に最も近いものが選出される。
例えば、歪み補正処理を施した四辺形の形状及び面積が紙面の形状及び面積に最も近い場合(例えば、四辺形の頂点における内角が90度に最も近い場合、四辺形のアスペクト比が紙面のアスペクト比に最も近い場合、及び四辺形の面積が紙面の面積に最も近い場合など)、四辺形が対象ページ(nページ目)のページ範囲に相当すると判断される。
図5Aでは、頂点510は、直線エッジ501,502,503,504の組合せによる四辺形の頂点である。また、頂点511は、直線エッジ501,502,503,509の組合せによる四辺形の頂点である。ここで紙面の頂点の内角を90度とすると、頂点510の内角は頂点511の内角よりも90度に近い。この場合、直線エッジ501,502,503,504の組合せによる四辺形は、直線エッジ501,502,503,509の組合せによる四辺形よりも対象ページ(nページ目)のページ範囲に近いと判断される。
同様に、直線エッジ505〜508の組合せによる四辺形が、原稿220をめくった状態における対象ページ以外のページ(原稿220のm枚目の裏面)のページ範囲に相当すると判断される。この場合、各直線エッジを延長してできる四辺形の組み合わせから、所定の条件に基づいて原稿220のm枚目の裏面の4辺に最も近いものが選出される。
例えば、原稿220のm枚目を紙面の左上方向にめくる場合、紙面の右下方向にある四辺形が対象ページのページ範囲に相当すると判断され、紙面の左上方向にある四辺形が原稿220のm枚目の裏面に相当すると判断されてもよい。
また、選出された四辺形内の直線エッジ数又は直線エッジ長さに基づいて、対象ページ及び原稿220のm枚目の裏面の位置が判断され、それぞれのページ範囲が特定されてもよい。例えば、原稿220の裏面が白紙である場合、選出された四辺形内の直線エッジ数又は直線エッジ長さを合計する。そして、直線エッジ数が多い又は直線エッジが長い四辺形が対象ページに相当し、直線エッジ数が少ない又は直線エッジが短い四辺形が原稿220のm枚目の裏面に相当すると判断されてもよい。
また、対象ページの位置が設定されている場合は、対象ページからの方向に基づいて、対象ページ及び原稿220のm枚目の裏面の位置が判断され、それぞれのページ範囲が特定されてもよい。
例えば、ステップS303における1ページ目の画像取得位置、ステップS306における“n−1”ページ目の画像取得位置、及び1ページ目から“n−1”ページ目までの画像取得位置の平均の少なくとも1つに基づいて、対象ページ(nページ目)の位置が設定され、対象ページからの方向に基づいて、原稿220のm枚目の裏面の位置が判断され、ページ範囲が特定されてもよい。
このように、対象ページ範囲特定処理では、第1の取得部110が、ハフ変換などで撮像画像から検出された直線エッジ群からページの4辺に相当する枠を選別することにより、対象ページ(nページ目)の範囲を特定する。そして、補正処理が施される。
なお、歪み補正処理に必要な座標変換のパラメータが既知である場合は、歪み補正処理が対象ページ範囲特定処理の前に施されてもよい。歪み補正処理後の撮像画像では、対象ページ及び対象ページ以外のページ(原稿220のm枚目の裏面)は原稿220の形状(例えば、長方形)であるので、直線エッジ群からページの4辺に相当する枠を選別することが容易になる。
図5Bに示すように、図4の第2のめくり位置420で撮像された場合、対象ページ(nページ目)の上辺に相当する直線エッジが検出されないため、対象ページの4辺の全てを直線エッジ群から選別することは困難となる。この場合、第1の取得部110は、歪み補正処理後の撮像画像の直線エッジから対象ページの3辺を検出し、残りの1辺を“n−1”ページ目以前のページ画像から算出されるアスペクト比を用いることにより決定する。
図5Cは、図4の第2のめくり位置420に対応するめくり方をした場合に歪み処理補正を施した後の撮像画像から検出される直線エッジの例である。図5Cの直線エッジ531〜536は、図5Bの521〜526にそれぞれ対応している。即ち、直線エッジ531,532はnページ目の右辺及び下辺に対応し、直線エッジ534,535は原稿220のm枚目の裏面の上辺及び右辺に対応する。
直線エッジ533は、nページ目の左辺と原稿220のm枚目の裏面の左辺とが繋がった状態で検出された直線エッジである。直線エッジ536は、原稿220をめくった状態における対象ページ以外のページ(原稿220のm枚目の裏面)と対象ページ(nページ目)との重複部分552の直線エッジである。
このとき、直線エッジ531,532,533が対象ページ(nページ目)を構成する3辺となる。そして、“n−1”ページ目以前のページ画像から算出されるアスペクト比を用いて残る1辺に対応する直線537の位置が決定される。直線エッジ531,532,533及び直線537の4辺から構成される長方形が対象ページのページ範囲であると特定される。
ステップS307では、判断部111が、対象ページのページ画像(第1の画像)に欠損部がある場合に、欠損部に対応する補完画像の取得が必要であるか否かを判断する。例えば、判断部111は、ステップS306で生成したnページ目のページ画像に原稿綴じによる欠損部(綴じ隠れ部分)が発生し、欠損部を補完する追加の補完撮像が必要であるか否かを判断する。補完画像の取得(補完撮像)が必要であると判断された場合は、ステップS308に進む。補完画像の取得(補完撮像)が不要であると判断された場合は、ステップS314に進む。
補完撮像が必要であると判断される例について図4を用いて説明する。対象ページ401には、記載内容である文字列403,404が記載されている。原稿綴じ位置402が紙面の左上にある場合、第1のめくり位置410では、文字列403の一部が対象ページ以外のページ(原稿220のm枚目の裏面)と対象ページ(nページ目)との重複部分450により隠れてしまう。一方、第2のめくり位置420では、文字列404の全てが重複部分451により隠れてしまう。
ここで、ステップS307における工程の詳細を図6のフローチャートを用いて説明する。図6のステップS601では、判断部111が、ステップS306で取得した対象ページのページ画像(第1の画像)から重複部分を検出する。対象ページに対する重複部分の面積比が所定の閾値x%以上であればステップS602に進み、所定の閾値x%未満であればステップS605に進む。ステップS605に進んだ場合は、補完画像の取得(補完撮像)が不要であると判断され、図6の処理が終了する。
図7は、重複部分を検出する処理の一例を示す図である。前述のように、図7の対象ページのページ画像700の4辺(上辺701,右辺702,下辺703,左辺704)は、図4の第1のめくり位置410における対象ページの撮像画像の直線エッジから選別される。直線エッジ709は、原稿220をめくった状態における対象ページ以外のページ(原稿220のm枚目の裏面)と対象ページ(nページ目)との重複部分の直線エッジであり、nページと“n−1”ページ以前のページの境界から検出される直線エッジである。
直線エッジ709の延長線と対象ページの上辺701及び左辺704により囲まれる三角形が重複部分として検出される。そして、重複部分の面積を対象ページの面積で割った面積比を所定の閾値x%と比較することにより、判断部111は、重複部分を補完する追加の補完撮像が必要であるか否かを判断する。
なお、前述の重複部分検出方法は一例であって、他の方法により重複部分が検出されてもよい。撮像画像から抽出される紙面のテクスチャ、直線エッジの数や長さの合計、紙面上の識別マーク、及び紙面の高さの少なくとも1つから、判断部111が原稿220の表裏面を識別できる場合は、判断部111は対象ページ(表面)と原稿220のm枚目の裏面(裏面)の重複部分を検出することができる。
例えば、画像処理装置200が距離センサを備えており、距離センサが読み取り面210上の物体の高さを検出する。読み取り作業の際に対象ページの紙面は読み取り面210上に沿って置かれているので、読み取り面210からの対象ページの紙面の高さは所定の閾値未満となる。一方、めくられた紙面は原稿綴じ部から湾曲して浮き上がるので、めくられた紙面の高さは所定の閾値以上となる。したがって、判断部111は、対象ページの紙面(表面)とめくられた紙面の裏面(裏面)を識別でき、表面と裏面の重複部分を検出することができる。
また、重複部分は紙面をめくることにより生じ、めくられた紙面の高さは所定の閾値以上となるので、判断部111は、距離センサを用いて、対象ページのページ範囲内において所定の閾値以上の高さが検出された部分を重複部分として検出することもできる。
距離センサの代わりに、プロジェクタ203が所定の間隔のストライプを紙面に投影し、撮像部201が撮像したストライプの間隔や形状に基づいて、判断部111が紙面の高さを算出してもよい。読み取り面210からの紙面の高さが高くなるほどストライプの間隔が短くなり、紙面をめくることにより紙面の湾曲が生じたときはストライプの形状が歪むので、ストライプの間隔や形状に基づいて判断部111が紙面の高さを算出することができる。
図6に戻り、ステップS602では、判断部111が、ステップS601で検出した重複部分の近傍にある文字列を抽出し、その文字列における欠損文字の有無及び欠損文字の数の少なくとも1つに基づいて欠損部(綴じ隠れ部分)を判定する。欠損文字がある場合又は欠損文字の数が所定の閾値以上である場合はステップS606に進み、欠損文字がない場合又は欠損文字の数が所定の閾値未満である場合はステップS603に進む。ステップS606に進んだ場合は、補完画像の取得(補完撮像)が必要であると判断され、図6の処理が終了する。
文字列における欠損文字を検出する処理の一例について図4を用いて説明する。図4の第1のめくり位置410における対象ページを撮像する場合、文字列403の1文字目は完全に重複部分に隠れ、2文字目は一部が重複部分に隠れている。
例えば、公知のOCR技術により、判断部111は、文字列403の2文字目の隠れを文字パターンの欠損部として判定することができる。OCR技術は、予め登録された文字パターン辞書と入力文字パターンとを比較することにより文字を認識する。欠損がある文字パターンは文字パターン辞書との照合度が低下する。判断部111は、照合度に反比例する値を信頼度とし、信頼度が閾値未満である場合に、文字パターンに欠損部があると判断することができる。
この判断方法は一例であり、他の方法により欠損文字の有無が検出されてもよい。例えば、入力文字パターンの認識技術を複数用いて、特徴量や照合方式などによる認識技術の認識結果を比較し、判断部111は、共通の認識結果が得られない場合に、文字パターンに欠損部があると判断し、欠損文字を検出することができる。
また、判断部111は、文字パターンの欠損部の代わりに、対象ページの文字列や単語の解読度に基づいて文字列や単語に欠損文字があると判断してもよい。例えば、対象ページで用いられる単語や一般用語を記憶部104内の辞書に登録しておき、判断部111は、入力文字パターンの認識結果が辞書に登録された文字列や単語に一致しない場合に、文字列や単語に欠損文字があると判断してもよい。
ステップS603では、判断部111がステップS601で検出した重複部分による欠損項目の有無及び欠損項目の数の少なくとも1つに基づいて欠損部(綴じ隠れ部分)を判定する。欠損項目がある場合又は欠損項目の数が所定の閾値以上である場合はステップS606に進み、欠損項目がない場合又は欠損項目の数が所定の閾値未満である場合はステップS604に進む。ステップS606に進んだ場合は、補完画像の取得(補完撮像)が必要であると判断され、図6の処理が終了する。
例えば、対象ページに記載されているにもかかわらず、対象ページのページ画像から抽出できない項目(欠損項目)があるか否かを判断部111が判断し、抽出できない項目がある場合は欠損項目があると判断する。また、判断部111は、欠損項目が何であるかを特定する。判断部111は、対象ページに応じて予め設定された項目と対象ページのページ画像(第1の画像)から抽出された項目とを比較することにより欠損項目を抽出する。つまり、対象ページの項目が予め設定されていることが前提となる。
例えば、対象ページにおける項目の配置(レイアウト)及び項目の記載内容を予め設定したテンプレートが、画像処理装置200内の記憶部104又は画像処理装置200が参照可能な外部記憶装置に保持される。判断部111は、公知のOCR技術により対象ページのページ画像(第1の画像)から抽出した項目の配置及び項目の記載内容をテンプレートと比較することで、抽出できない項目がある場合は欠損項目があると判断する。
テンプレートは、対象ページにおける項目の配置に厳密に一致するものであっても、そうでなくてもよい。例えば、項目の配置が厳密に一致しなくてもよい例として、テンプレートには帳票種別と帳票種別に応じた項目の種類が定義され、項目の配置は任意である場合がある。原稿220の各ページが帳票の形式である場合、判断部111は、対象ページのページ画像(第1のページ画像)から抽出した文字列の認識結果により対象ページの帳票種別を判別する。そして、判断部111は、帳票種別に応じた項目が定義されたテンプレートを参照し、抽出できていない項目があるか否かを判定する。
ステップS604では、判断部111がユーザーから入力された指示に基づいて欠損部(綴じ隠れ部分)を判定する。補完画像の取得(補完撮像)が必要であるとの指示がユーザーから入力された場合はステップS606に進み、図6の処理が終了する。補完画像の取得(補完撮像)が不要であるとの指示がユーザーから入力された場合はステップS605に進み、図6の処理が終了する。この場合、UI部102の情報提示手段が、補完画像の取得(補完撮像)が必要であるか否かをユーザーに確認する情報を提示してもよい。
このように、判断部111は、原稿220をめくった状態における対象ページ以外のページと対象ページとの重複部分の面積(ステップS601)、重複部分による欠損文字の有無(ステップS602)、重複部分による欠損項目の有無(ステップS603)、及び入力された指示(ステップS604)の少なくとも1つに基づいて、補完画像の取得が必要であるか否かを判断する。
また、判断部111は、重複部分の有無、重複部分の数、重複部分の位置、欠損文字の数、欠損文字の位置、欠損項目の数、及び欠損項目の位置の少なくとも1つに基づいて、補完画像の取得が必要であるか否かを判断してもよい。したがって、図6のフローチャートは処理の一例であり、ステップS601〜S604の処理の全てが含まれなくても、ステップS601〜S604の処理が異なる順序で施されてもよい。
また、ステップS604と同様の指示が、ステップS601〜S603の処理毎に入力され、ステップS601〜S603における判断部111の検出や判定や判断の正誤をユーザーが確認できるようにしてもよい。また、画像処理装置200は、ステップS601〜S603の処理毎に判断部111の検出や判定や判断の信頼度に関するスコアを算出し、スコアが所定の閾値未満である場合にユーザーからの指示が入力されるようにしてもよい。
図3に戻り、ステップS308では、補完画像の取得が必要であると判断された場合に、補完モード切替部114が、欠損部に補完画像を補完する補完モードに切り替え、画像処理装置200は、補完モードを開始する。
ステップS308の補完モードの開始からステップS311の補完モードの終了まで、画像処理装置200の通知部115が補完モードであることをユーザーに通知してもよい。例えば、通知部115は、プロジェクタ203により補完モードであることを示す情報(色や文字)を原稿220やその周辺に投影して通知してもよい。また、通知部115は、入出力装置121や表示装置122により補完モードであることを示す音声や色や文字などで通知してもよい。
また、ステップS308では、ステップS307で特定された欠損部(綴じ隠れ部分)の位置に基づいて、プロジェクタ203が、欠損部を強調する重畳投影を対象ページに行ってもよい。例えば、プロジェクタ203が、図4の重複部分450に対して強調色などを重畳投影してもよい。また、プロジェクタ203が、重複部分に隠れた図4の文字列403又は文字列403の2文字目に対して強調色などを重畳投影してもよい。
このように、プロジェクタ(投影部)203が、欠損部に対応する画像を対象ページに投影することにより、対象ページにおける欠損部の位置を通知してもよい。また、表示装置122により、通知部115は、対象ページ及びページ画像(第1の画像)の少なくとも1つにおける欠損部の位置をユーザーに通知してもよい。
ステップS309では、第2の取得部112が、撮像部101(デジタルカメラ201)により対象ページが再撮像された第2の画像から補完画像を取得する。例えば、デジタルカメラ201が、図4の第2のめくり位置420に対応するめくり方をした場合の対象ページ(nページ目)を再撮像する。第2の取得部112は、再撮像された対象ページ(nページ目)のページ画像(第2の画像)から補完画像を取得する。再撮像する回数は1回に限らず複数回になることもあることから、再撮像をk回(1≦k)行った場合のi回目のページ画像(第2の画像)をページ画像(第2の画像)ni(1≦i≦k)とする。
ステップS310では、補完部113が、欠損部に補完画像を補完する。そして、判断部111が、欠損部に対応する補完画像の再取得の要否に基づいて、欠損部の補完が完了したか否かを判断する。補完が完了した場合はステップS311に進む。補完が完了していない場合(即ち、更なる再撮像が必要な場合)はステップS309に戻り、第2の取得部112は、ページ画像(第2の画像)ni+1を取得する。このように、第2の取得部112は、補完モードの間にデジタルカメラ(撮像部)201により撮像された対象ページの画像を第2の画像として取得する。
ステップS310では、補完画像の再取得の要否を判断する場合、ページ画像(第2の画像)niまでの補完画像により欠損部(綴じ隠れ部分)を補完したページ画像から、ステップS307における補完画像の取得の要否と同様の判断が用いられる。
判断部111が、原稿220をめくった状態における対象ページ以外のページ(原稿220のm枚目の裏面)と対象ページ(nページ目)との重複部分から補完部分を除いた後の重複部分の有無、重複部分の面積、重複部分の位置、重複部分による欠損文字の有無、欠損文字の数、欠損文字の位置、重複部分による欠損項目の有無、欠損項目の数、欠損項目の位置、及び入力された指示の少なくとも1つに基づいて、補完画像の再取得が必要であるか否かを判断すればよい。
例えば、1回目からi回目までの再撮像によるページ画像n1〜niの補完画像により欠損部を補完した後、補完部分を除いた重複部分の面積比がゼロ又は所定の閾値未満である場合、判断部111は、補完が完了したと判断する。
また、対象ページから重複部分を除いた範囲を非重複部分とし、ページ画像n1〜niにおける非重複部分の和集合が対象ページのページ画像(第1の画像)に対する面積比が所定の閾値以上である場合、判断部111は、補完が完了したと判断してもよい。また、距離センサや所定の間隔のストライプにより算出された紙面の高さ基づいて非重複部分を検出し、非重複部分の和集合が対象ページのページ画像(第1の画像)に対する面積比が所定の閾値以上である場合に、補完が完了したと判断されてもよい。
また、欠損文字により補完完了の判定を行う場合、非重複部分の文字が補完画像により欠損なく文字認識できたときに、判断部111は、補完が完了したと判断してもよい。また、欠損項目により補完完了の判定を行う場合、テンプレートの項目の全てを抽出できたときに、判断部111は、補完が完了したと判断してもよい。また、UI部102の情報提示手段が、補完画像の再取得(再撮像)が必要であるか否かをユーザーに確認する情報を提示してもよい。なお、これらの判断方法は一例であり、ステップS307における判断方法と異なる方法が用いられてもよい。
このように、判断部111は、補完後における欠損部に対する補完画像の面積比、補完後における欠損文字の有無、補完後における欠損文字の数、補完後における欠損文字の位置、補完後における欠損項目の有無、補完後における欠損項目の数、補完後における欠損項目の位置、及び入力された指示の少なくとも1つに基づいて、補完画像の再取得が不要であると判断する。
また、プロジェクタ203が、欠損部又は補完画像の位置を強調する重畳投影を対象ページに行ってもよい。このように、プロジェクタ(投影部)203が、欠損部及び補完画像の少なくとも1つに対応する画像を対象ページに投影することにより、対象ページにおける欠損部及び補完画像の少なくとも1つの位置を通知してもよい。また、表示装置122により、通知部115が、対象ページ、第1の画像、及び第2の画像の少なくとも1つにおける欠損部及び補完画像の少なくとも1つの位置をユーザーに通知してもよい。
また、再撮像1回目からi回目までのページ画像n1〜niの補完画像により、欠損部が順次補完されるので、補完毎に欠損部の範囲がその都度更新される。プロジェクタ203は、更新された欠損部を強調する重畳投影を対象ページに行ってもよい。
ステップS311では、判断部111により補完画像の再取得が不要であると判断された場合、補完モード切替部114は補完モードを終了する。この場合、最終的な再撮像によるページ画像(第2の画像)は、ページ画像nkとなる。また、ステップS308と同様に、画像処理装置200の通知部115が、入出力装置121や表示装置122により補完モードの終了をユーザーに通知してもよい。
ステップS312では、補完部113が、ページ画像n1〜nkの補完画像を欠損部に補完することにより対象ページの出力画像を生成する。
出力画像の一例について図8を用いて説明する。図8に示す出力画像805は、対象ページのページ画像(第1の画像)801の欠損部の画素を、再撮像によるページ画像(第2の画像)802から取得された補完画像804の画素で上書きして出力された画像である。
図8のページ画像801は、図4の第1のめくり位置410における対象ページ401を撮像した画像から生成されたページ画像(第1の画像)である。ページ画像802は、図4の第2のめくり位置420における対象ページ401を撮像した画像から生成されたページ画像(第2の画像)である。重複部分803は、図6のステップS601で検出された重複部分に対応する。
重複部分803に対応するページ画像(第2の画像)802の補完画像804の画素が抽出され、補完画像804の画素がページ画像(第1の画像)801の重複部分に上書きされることで、補完部113が、欠損部に補完画像804を補完する。このように、補完部113が、欠損部の画像データと補完画像804の画像データとを入れ替えることにより、出力画像805を生成する。
ページ画像(第1の画像)801とページ画像(第2の画像)802の左上頂点を原点とする画素座標により、重複部分803に対応する補完画像804の画素を抽出する。また、ページ画像に記載されている文字などの記載内容に関する画素を画素座標の規準にして、公知の画像重ね合せ技術によりページ画像801,802の位置合わせを行い、重複部分803に対応する補完画像804の画素を抽出してもよい。
また、補完部113は、ページ画像(第1の画像)801の欠損部の画像データにページ画像(第2の画像)802の補完画像804の画像データを重畳させることにより、対象ページの出力画像805を生成してもよい。この場合、ページ画像(第1の画像)801及び補完画像804の画像データは、層構造で保存される。
そして、出力画像805の表示や印刷の際には、ページ画像(第1の画像)801と補完画像804とを重ね合わせた1枚のページデータ(画像データ)が出力画像805として出力される。このように、2つ以上の画像データの層構造により対象ページを出力することができる電子文書形式としては、PDF、XPS、及びSVGなどがある。
また、表示装置122により、通知部115が、出力画像805における欠損部及び補完画像804の少なくとも1つの位置をユーザーに通知してもよい。
また、補完画像804は、等倍又は縮小されたうえで、電子文書形式のページデータに関連付けられて保存されてもよい。そして、電子文書表示アプリケーションがページデータを表示し、補完画像804の位置がユーザーにより指定されたときに、関連付けられた補完画像804が表示されてもよい。これにより、出力画像805がどのような補完画像により補完されたのかを容易に確認することができる。この場合、記憶部104が、補完画像804及びページ画像(第2の画像)802の少なくとも1つを出力画像805に関連付けて記憶してもよい。
ステップS313では、画像処理装置200が出力画像を出力する。ステップS307で補完画像の取得が不要であると判断された場合は、ステップS306で生成されたページ画像(第1の画像)が出力画像として出力される。また、ステップS307で補完画像の取得が必要であると判断された場合は、ステップS312で生成された出力画像が出力される。そして、ステップS304に戻り、“n+1”ページ以降の処理を繰り返す。
ステップS314では、原稿220の読み取り作業が完了した場合に、画像処理装置200は、原稿220の読み取り作業の1ページから最終ページまでの対象ページの出力画像を電子文書化して、電子文書データを生成し、本処理の出力とする。生成された電子文書データは、記憶部104に保持されてもよいし、通信部105を介して外部記憶装置に保持されてもよい。
図9は、電子文書データの一例を示す図である。図9の記述900は、2ページ分のページ画像を有する電子文書データの記述例である。記述900は、SVG形式を模したものであり、実際のデータとは異なる。また、実際に表示可能な電子文書を構成する際には、記述900から参照される画像データの実体が必要となる。図9では、記述900を解釈するアプリケーションは、識別子を伴うリンク先から画像データの実体を取得することができるものとし、画像データの実体の記載は省略している
図9の記述901は、電子文書の1ページ目に関する記述であり、リンク先にある1ページ目のページ画像の画像データ“p1.jpg”をページ範囲いっぱいに描画して表示する記述となっている。
記述902は、2ページ目に関する記述であり、2ページ目のページ画像の画像データ“p2.jpg”をページ範囲いっぱいに描画して表示する記述となっている。また、記述902は、紙面の左上頂点から618画素×609画素の範囲で、2ページ目のページ画像に補完画像の画素データ“p2s1.png”を重畳して、2ページ目を表示する記述となっている。更に、記述902は、2ページ目を表示中に、紙面の左上頂点から618画素×609画素の範囲をマウスなどの指示デバイスでクリックすると、指定のスクリプトを実行する記述を含んでいる。
ここでは、記述903にて定義されるスクリプト“click_p2s1”が実行される。スクリプト“click_p2s1”が実行されると、2ページ目の補完画像の画像データ“p2s1_orig.jpg”が、別途開かれた表示ウィンドウ領域に表示される。
以上説明したように、本実施形態に係る画像処理装置では、原稿をめくった状態における対象ページ以外のページと対象ページとの重複部分により、対象ページに欠損部(綴じ隠れ部分)が発生していることを検知する。そして、画像処理装置は、欠損部に対応する補完画像の取得が必要であると判断された場合、補完モードを開始し、補完モードの開始をユーザーに通知する。補完モード中、欠損部を撮像するために原稿のめくり位置を変えた状態で、撮像部が対象ページの再撮像を行う。画像処理装置は、対象ページが再撮像された第2の画像から補完画像を取得する。
画像処理装置は、対象ページの画像データと補完画像の画像データとを組み合わせることにより、欠損部が補完されたか否かを判断し、欠損部が補完されていれば補完モードを終了する。このとき、対象ページの第1の画像における欠損部が補完画像で補完されるように組み合わされた1ページ分のデータとして、対象ページの出力画像が得られる。
この結果、ユーザーは、現在の撮像している画像が対象ページの第1の画像であるのか、補完画像であるのかを画像処理装置に指示する必要がなくなり、原稿を連続して撮像及び再撮像しながら読み取り作業を行うことができる。そして、再撮像の有無にかかわらず、読み取り作業の各ページがそれぞれ1ページ分の出力画像として利用することが可能な電子文書を取得することができる。
即ち、本発明に係る画像処理装置によれば、ステープラなどで綴じられた複数枚綴りの原稿を、各葉に分離することなくユーザーが手でめくりながら撮像部が対象ページの画像を撮像し、画像処理装置が各ページを連続で読み取ることができる。このとき、対象ページに欠損部(綴じ隠れ部分)がある場合に、欠損部を補完するためにめくり位置を変えて再撮影することにより対象ページの全記載内容を読み取る。
そして、再撮像を必要とする場合であっても、隠れた記載内容を補完した状態で対象ページの出力画像を生成することによりページ単位で参照することができる。この結果、読み取り作業の各ページがそれぞれ1ページ分の出力画像として利用することが可能な電子文書を取得することができる。また、画像処理装置が自動的に補完モードの開始/終了を行うので、ユーザーは、対象ページの画像と補完画像との関連付けを意識しながら読み取り作業を行う必要がなくなり、補完モードの終了後直ちに次の対象ページの撮像を開始することができる。
(その他の実施形態)
図10Aは、本発明の他の実施形態に係る画像処理装置の一例を示すブロック図である。図10Bは、本発明のその他の実施形態に係る画像処理装置の動作の一例を示すフローチャートである。図10では、本発明の実施の形態に係る画像処理装置100,200と異なる部分及び機能について主に説明し、その他の部分及び機能については前述の実施形態と共通しているため説明を省略する。例えば、画像処理装置300は、図2の画像処理装置200の構成を用いる。
図10Aに示すように、画像処理装置300は、画像判定部116を更に備える。画像判定部116は、対象ページのページ画像(第1の画像)の後に撮像された画像と対象ページのページ画像(第1の画像)との一致度を算出する。そして、画像判定部116は、一致度が所定の閾値以上である場合に、対象ページのページ画像(第1の画像)の後に撮像された画像を、対象ページの再撮像によるページ画像(第2の画像)と判定する。
次に、画像処理装置300の動作について説明する。図10BのステップS1001では、ユーザーが原稿220を読み取り面210に置き、UI部102を介して画像処理装置200に読み取り作業の開始を指示する。また、ステップS1001では、撮像ページのカウンタN及び撮像回数のカウンタJを初期化(N=1,J=1)する。
ステップS1002では、画像処理装置200のデジタルカメラ201が、原稿220の1ページ目に対して1回目の撮像を行う。ステップS1003では、第1の取得部110は、原稿220の1ページ目のページ画像を1回目の撮像画像から取得する。ページ画像を取得する処理は、図3のステップS303の処理と同様である。
ステップS1004では、撮像回数のカウンタがインクリメント(+1)される。ステップS1005では、原稿220のj回目(J=j)の撮像を行う。
ステップS1006では、ステップS1005で撮像されたj回目の撮像画像が、既に撮像されたnページ目(1<n)の再撮像による画像(第2の画像)であるか、あるいはnページ目以外のページ(“n+1”ページ目)のページ画像であるかを判定する。即ち、nページ目のページ画像(第1の画像)の欠損部を補完するために対象ページが再撮像されたか、あるいは補完画像が不要であるとしてnページ目以外のページが撮像されたかを、画像判定部116がj回目の撮像画像から判定する。
j回目の撮像画像がnページ目(1<n)の再撮像による画像であると判定された場合は、ステップS1007に進む。j回目の撮像画像がnページ目以外のページの撮像による画像であると判定された場合は、ステップS1008に進む。
1ページ目(N=1)が原稿220の1枚目の表面である場合は欠損部がないものと想定されるので、1ページ目については、ページ画像(第1の画像)が1ページ目に対応する出力画像データとなる。ただし、1枚目の表面であっても欠損部がある場合は、補完部113が欠損部に補完画像を補完してもよい。この場合も、ステップS1004〜S1006を経由してステップS1007かステップS1008に進む。
ステップS1006における判定処理の一例について説明する。nページ目のページ画像(第1の画像)に欠損部があるか否かが判断される。具体的には、図3のステップS307と同様の処理が施され、欠損部に対応する補完画像の取得が必要であるか否かが判断される。なお、ステップS1007では、ステップS307における判断部111の検出や判定や判断の信頼度よりも低い信頼度により、nページ目のページ画像(第1の画像)に欠損部があるか否かが判断されてもよい。
次に、j回目の撮像画像から対象ページのページ画像Pjが取得される。第1の画像を取得する処理は、図3のステップS306と同様の処理が施される。画像判定部116は、既に撮像されたnページ目のページ画像(第1の画像)とページ画像Pjとを比較する。これらの画像が一致する部分のページ全体に対する割合が所定の閾値a%以上であり、かつこれらの画像が一致しない部分のページ全体に対する割合が所定の閾値b%以上である場合、j回目の撮像画像がnページ目の再撮像による画像であると判定される。
nページ目のページ画像(第1の画像)とページ画像Pjとの一致/不一致は、これらの画像の大きさを統一し、画素単位あるいは所定の画素範囲単位で、これらの画像の画素値から算出される差分量に基づいて判定されてもよい。また、公知のOCR技術により、nページ目のページ画像(第1の画像)とページ画像Pjの画像に文字パターン抽出処理及び認識処理が施され、それぞれの記載内容及び位置に基づいて一致/不一致が判定されてもよい。
なお、原稿によってはnページ目のページ画像とnページ目以外のページ画像とが同一の記載内容及び位置である場合がある。このような場合は、他の判定処理が追加されてもよい。例えば、厚みのある原稿220では、めくられたページを読み取り面210上に平坦に押さえることができず、図4の原稿綴じ位置402付近がデジタルカメラ201の死角になる場合がある。このような場合は、ユーザーは原稿220の向きを変えて、原稿綴じ位置402付近がデジタルカメラ201の死角にならないようにして再撮像を行う。
したがって、補正処理を施す前のj回目の撮影画像の位置や向きが、nページ目のページ画像と比べて所定の閾値以上に変化している場合は、j回目の撮像画像がnページ目の再撮像による画像であると判定されてもよい。一方、j回目の撮影画像の位置や向きが所定の閾値以上に変化していない場合は、nページ目のページ画像(第1の画像)とページ画像Pjとの一致度が高くても、j回目の撮像画像がnページ目の再撮像による画像ではないと判定されてもよい。
また、原稿220を押さえている状態の指などを撮像画から検知し、指などの数や位置の変化に基づいて、j回目の撮像画像がnページ目の再撮像による画像であるか、あるいはnページ目以外のページが撮像されたかが判定されてもよい。
そして、欠損部があるか否かの判断部111による判断とj回目の撮像がnページ目の再撮像であるか否かの画像判定部116による判定とを組み合わせて、欠損部に対応する補完画像の再取得の要否が判断部111により総合的に判断される。なお、欠損部があるか否かの判断又はj回目の撮像がnページ目の再撮像であるか否かの判定の信頼度が所定の閾値未満である場合は、UI部102の情報提示手段が、補完画像の取得(補完撮像)が必要であるか否かをユーザーに確認する情報を提示してもよい。
図10に戻り、ステップS1006で補完撮像が必要であると判断された場合は、ステップS1007に進み、補完部113は、nページ目のページ画像(第1の画像)の欠損部に、j回目のページ画像(第2の画像)から取得された補完画像を補完する。欠損部に補完画像を補完する処理は、図3のステップS312の処理と同様である。そして、ステップS1004に戻って以降の同様の処理を繰り返す。
一方、ステップS1006で補完撮像が不要であると判断された場合は、ステップS1008に進み、撮像ページのカウンタNをインクリメント(+1)する。
ステップS1009では、第1の取得部110が、ステップS1005で撮像されたj回目の撮像画像からnページ目のページ画像を生成する。ステップS1009の処理は、図3のステップS306の処理と同様である。
ステップS1010では、原稿220の読み取り作業の最終ページまで撮像が完了している否かが判断される。原稿220の読み取り作業の最終ページまで撮像が完了している場合(例えば、原稿220の綴り枚数のM枚目まで撮像が完了している場合)、ステップS1011に進む。原稿220の読み取り作業の最終ページまで撮像が完了していない場合、ステップS1004に戻って以降の処理を繰り返す。
なお、最終ページの撮像が完了しているか否かは、ユーザーからの読み取り完了の指示により判断されてもよい。例えば、プロジェクタ203が指示受付手段として投影した読み取り完了ボタンをユーザーがタッチすることで、読み取り完了の指示が出力される。この場合、ユーザーが読み取り完了ボタンにタッチしたことを、ジェスチャー検知センサ202が検知する。
また、画像処理装置200、読み取り面210、及びリモコンなどに設置されたボタンやマウス操作や音声入力によって読み取り完了の指示が検知及び出力されてもよい。また、デジタルカメラ201による撮像が所定の時間行われなかったことを検知して、読み取り完了の指示が出力されてもよい。また、重量や赤外線反射率の変化などにより読み取り面210上の物体を検知するセンサを画像処理装置200が備え、原稿220が読み取り面210から取り除かれたことをセンサが検知し、読み取り完了の指示が出力されてもよい。
ステップS1011では、画像処理装置200が、原稿220の読み取り作業の1ページから最終ページまでの対象ページの出力画像を電子文書化して、電子文書データを生成し、本処理の出力とする。生成された電子文書データは、記憶部104に保持されてもよいし、通信部105を介して外部記憶装置に保持されてもよい。なお、欠損部が補完画像で補完された場合も、ステップS1011では1ページ分のデータとして対象ページの出力画像が得られる。
以上説明したように、本実施形態に係る画像処理装置では、撮像部101の撮像が対象ページ(nページ目)の再撮像であるか否かを、画像判定部116が判定する。そして、撮像部101の撮像が対象ページ(nページ目)の再撮像であると判定された場合は、再撮像の画像ページから取得された補完画像を欠損部に補完する。
この結果、ユーザーは、現在の撮像が対象ページ(nページ目)の再撮像であるか否かを判断して画像処理装置に指示する必要がなくなり、対象ページの撮像及び再撮像を連続して行いながら読み取り作業をすることができる。そして、欠損部を補完したか否かにかかわらず、読み取り作業の1ページから最終ページまでの対象ページがそれぞれ連続したページとして電子文書化された電子文書データを得ることができる。
即ち、本発明に係る画像処理装置によれば、ステープラなどで綴じられた複数枚綴りの原稿を、各葉に分離することなくユーザーが手でめくりながら撮像部が対象ページの画像を撮像し、画像処理装置が各ページを連続で読み取ることができる。このとき、対象ページに欠損部(綴じ隠れ部分)がある場合に、欠損部を補完するためにめくり位置を変えて再撮影することにより対象ページの全記載内容を読み取る。
そして、再撮像を必要とする場合であっても、隠れた記載内容を補完した状態で対象ページの出力画像を生成することによりページ単位で参照することができる。この結果、読み取り作業の各ページがそれぞれ1ページ分の出力画像として利用することが可能な電子文書を取得することができる。また、画像処理装置が自動的に補完モードの開始/終了を行うので、ユーザーは、対象ページの画像と補完画像との関連付けを意識しながら読み取り作業を行う必要がなくなり、補完モードの終了後直ちに次の対象ページの撮像を開始することができる。