JP2019040617A - 画像処理装置および画像処理方法 - Google Patents

画像処理装置および画像処理方法 Download PDF

Info

Publication number
JP2019040617A
JP2019040617A JP2018201092A JP2018201092A JP2019040617A JP 2019040617 A JP2019040617 A JP 2019040617A JP 2018201092 A JP2018201092 A JP 2018201092A JP 2018201092 A JP2018201092 A JP 2018201092A JP 2019040617 A JP2019040617 A JP 2019040617A
Authority
JP
Japan
Prior art keywords
image
unit
display
imaging
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018201092A
Other languages
English (en)
Inventor
祐司 石田
Yuji Ishida
祐司 石田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of JP2019040617A publication Critical patent/JP2019040617A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Studio Devices (AREA)

Abstract

【課題】対象物が撮像範囲内でどのような位置にあるかを容易に確認したうえで画像データを記憶部に取り込むことが可能な撮像装置及び画像処理方法を提供する。【解決手段】撮像装置としての携帯端末装置において、撮像範囲判定部は、撮像部により撮像された画像において、線分状に連なるエッジ画素群を検出する幾何学的配置検出部111と、表示部により表示された撮像画像において、幾何学的配置検出部111により検出されたエッジ画素群の上に、矩形の撮像対象物の輪郭を示す輪郭線を重ねて表示させる表示処理部112とを備える。表示処理部112は、撮像画像のうち輪郭線で囲まれる領域を所定の矩形状に幾何学補正する。【選択図】図3

Description

本発明は、撮像装置にて撮像した画像を画像出力装置により出力する撮像画像処理システムに関する。
インターネット技術の進展と伴に携帯電話など携帯端末装置を利用して撮像した画像を保存する機会が増えてきている。また、単純に風景や、人物などを被写体とするだけではなく、各種ショーなどで展示されている説明図や説明文、あるいは学会等でのスライドを撮影する機会も増大してきている。このような携帯端末装置で撮影された画像を保存する際には、撮影日などの情報を元に自動的に付加されるファイル名を用いるか、自分でファイル名を作成し、保存するのが一般的である。
また、特許文献1には、撮像により記憶部に取り込まれた画像データから画像の輪郭を求め、求めた輪郭から撮像対象物の形状を求める技術が開示されている。そして、求められた撮像対象物の形状と実際の撮影対象物との射影パラメータを求め、この射影パラメータを用いて画像変換を行う。
特開2005−122320号公報(2005年5月12日公開)
しかしながら、上記特許文献1に示す技術は、撮像により記憶部に取り込まれた画像データから撮像対象物の形状を求めるものであり、所望の形状が抽出できなかった場合は再度撮像を行う必要がある。また、所望の形状が抽出できたとしても、撮像範囲外に撮像対象物の一部が存在する場合、対象物の一部が撮像できていない事になる。
本発明は、上記課題を解決するためになされたものであり、対象物が撮像範囲内でどのような位置にあるかを容易に確認したうえで画像データを記憶部に取り込むことが可能な撮像装置、撮像画像処理システム、プログラムおよび記録媒体を提供することを目的とする。
上記の課題を解決するために、本発明の画像処理装置は、対象物を撮像した撮像画像を表示する表示手段を備え、上記対象物が矩形であり、上記対象物が撮像範囲内に収まっている場合に、上記撮像画像と、上記撮像画像の上記対象物の範囲を所定の矩形状に幾何学補正した補正処理後画像とを上記表示手段に表示させる表示処理部を備えることを特徴とする。
上記の構成によれば、対象物が撮像範囲内に収まっている場合に、補正処理後画像を表示手段に表示させる。このため、撮像画像に対して幾何学補正を行ったときの補正処理後画像を表示(プレビュー表示)させることができる。
さらに、本発明の画像処理装置において、上記表示処理部は、上記撮像画像と上記補正処理後画像とを同一画面内に表示させることが好ましい。
上記の構成によれば、撮像画像と、補正処理後画像とを表示手段の同一画面内に表示させる。このため、撮像画像に対して幾何学補正を行ったときの補正処理後画像を表示(プレビュー表示)させることができる。
さらに、本発明の画像処理装置において、上記撮像画像において、線分状に連なるエッジ画素群を検出する検出部をさらに備え、上記表示処理部が、上記検出部により検出された上記エッジ画素群の上に、上記検出部により検出された4つのエッジ画素群で示される4つの線分の各々に対応する直線で囲まれる上記対象物の輪郭を示す四角形の輪郭線を、上記撮像画像に重ねて表示させることが好ましい。
上記の構成によれば、検出部により検出されたエッジ画素群の上に、対象物の輪郭を示す輪郭線を重ねて表示される。ここで、検出部により検出されたエッジ画素群は、線分状に連なるものであり、矩形の対象物と背景との境界を示す確率が非常に高いものである。そのため、エッジ画素群の上に、対象物の輪郭を示す輪郭線が重ねて表示されることにより、ユーザは、撮像画像において対象物がどのような位置にあるのかを容易に確認することができる。その結果、ユーザは、対象物が撮像範囲内でどのような位置にあるかを容易に確認したうえで画像データを記憶部に取り込むことが可能となる。
さらに、本発明の画像処理装置において、上記表示処理部が、上記輪郭線の頂点の座標を編集する指示を受け付け、編集された頂点の座標を結ぶ上記輪郭線で囲まれる領域の画像を基に上記補正処理後画像を生成することが好ましい。
上記の構成によれば、ユーザは、所望の輪郭線で囲まれる領域に基づいた上記補正処理後画像を出力させることができる。
さらに、本発明の画像処理装置は、上記表示処理部による輪郭線の表示機能を有効にするか無効にするかを切り替える切替部を備えていることが好ましい。
上記の構成によれば、ユーザは、対象物が原稿のような矩形である場合に輪郭線の表示機能を有効に切り替え、輪郭線を表示させる必要が無い対象物の場合に輪郭線の表示機能を無効に切り替えることができる。
さらに、本発明の画像処理装置において、上記表示処理部は、上記切替部が上記輪郭線の表示機能を有効に設定している場合、幾何学補正された上記補正処理後画像を上記表示手段に表示させることが好ましい。
上記の構成によれば、切替部を操作することで、撮像画像に対して幾何学補正を行ったときの補正処理後画像を表示させることができる。
また、本発明の画像処理方法は、対象物を撮像した撮像画像を表示する表示手段を備え、上記対象物が矩形状である画像処理装置の画像処理方法であって、(a)上記対象物が撮像範囲内に収まっている場合に、上記撮像画像と、上記撮像画像の上記対象物の範囲を所定の矩形状に幾何学補正した補正処理後画像とを上記表示手段に表示させるステップを有する。
上記の方法によれば、対象物が撮像範囲内に収まっている場合に、補正処理後画像を表示手段に表示させる。このため、撮像画像に対して幾何学補正を行ったときの補正処理後画像を表示(プレビュー表示)させることができる。
さらに、本発明の画像処理方法において、上記ステップ(a)で、上記撮像画像と上記補正処理後画像とを同一画面内に表示させる。
上記の方法によれば、撮像画像と、補正処理後画像とを表示手段の同一画面内に表示させる。このため、撮像画像に対して幾何学補正を行ったときの補正処理後画像を表示(プレビュー表示)させることができる。
さらに、本発明の画像処理方法において、上記撮像画像において、線分状に連なるエッジ画素群を検出するステップ(b)をさらに有し、上記ステップ(a)で、上記ステップ(b)で検出された上記エッジ画素群の上に、上記ステップ(b)で検出された4つのエッジ画素群で示される4つの線分の各々に対応する直線で囲まれる上記対象物の輪郭を示す四角形の輪郭線を、上記撮像画像に重ねて表示させる。
上記の方法によれば、エッジ画素群の上に、対象物の輪郭を示す輪郭線が重ねて表示されることにより、ユーザは、撮像画像において対象物がどのような位置にあるのかを容易に確認することができる。その結果、ユーザは、対象物が撮像範囲内でどのような位置にあるかを容易に確認したうえで画像データを記憶部に取り込むことが可能となる。
さらに、本発明の画像処理方法において、上記ステップ(a)で、上記輪郭線の頂点の座標を編集する指示を受け付け、編集された頂点の座標を結ぶ上記輪郭線で囲まれる領域の画像を基に上記補正処理後画像を生成する。
上記の方法によれば、ユーザは、所望の輪郭線で囲まれる領域に基づいた補正処理後画像を出力させることができる。
さらに、本発明の画像処理方法において、上記ステップ(a)における上記輪郭線の表示機能を有効にするか無効にするかを切り替えるステップ(c)をさらに有する。
上記の方法によれば、ユーザは、対象物が原稿のような矩形である場合に輪郭線の表示機能を有効に切り替え、輪郭線を表示させる必要が無い対象物の場合に輪郭線の表示機能を無効に切り替えることができる。
さらに、本発明の画像処理方法において、上記ステップ(a)で、上記ステップ(c)で上記輪郭線の表示機能を有効に設定している場合、幾何学補正された上記補正処理後画像を上記表示手段に表示させる。
上記の方法によれば、輪郭線の表示機能を切り替えることで、撮像画像に対して幾何学補正を行ったときの補正処理後画像を表示させることができる。
本発明は、対象物が撮像範囲内でどのような位置にあるかをユーザが容易に確認したうえで画像データを記憶部に取り込むことが可能な撮像装置を実現することができるという効果を奏する。
本発明の一実施形態に係る撮像画像処理システムの全体構成を示す図である。 本発明の一実施形態に係る携帯端末装置の構成を示すブロック図である。 携帯端末装置が備える撮像範囲判定部の構成を示すブロック図である。 撮像範囲判定部の処理の一例を示すフローチャートである。 エッジ画像の生成例を示す図である。 連結エッジ領域のラベリングの方法を示す図である。 撮像対象物と背景との境界となる連結エッジ領域の候補である特徴領域の抽出処理の一例を示すフローチャートである。 多数の連結エッジ領域を含むエッジ画像から特徴領域を抽出する様子を示す図である。 矩形の撮像対象物と背景との境界の上辺となるエッジ画素群の近似直線を特定する直線抽出処理の一例を示すフローチャートである。 矩形の撮像対象物と背景との境界の左辺となるエッジ画素群の近似直線を特定する直線抽出処理の一例を示すフローチャートである。 特徴領域の中から、矩形の撮像対象物と背景との境界となる四角形の上辺、左辺、右辺、下辺を構成する、線分状に連なるエッジ画素群を抽出する例を示す図である。 エッジ画素群の近似直線の交点を求める例を示す図である。 表示処理部の処理例を示すフローチャートである。 撮像対象物が撮像範囲内であることを示す情報が表示された画面例を示す図である。 第1欠落情報が表示された画面例を示す図である。 第2欠落情報が表示された画面例を示す図である。 幾何学的配置検出部による画像の幾何学的歪みの検出例を示す図である。 画像における撮像対象物のエッジ検出処理例を示す図である。 画像のラスター方向のエッジ検出例を示す図である。 本発明の一実施形態に係る画像形成装置の構成を示すブロック図である。 画像形成装置が有する画像処理部の構成を示すブロック図である。 画像のカラーバランス調整時に作成するルックアップテーブルの一例を示す図である。 画像のレンズ歪みの補正例を示す図である。 画像の幾何学的歪みおよび傾きの補正例を示す図である。 高解像度補正の処理の一例を示すフローチャートである。 高解像度画像データにおける基準画素と補間画素とを示している。 1次微分フィルタ例を示す図である。 補間画素の画素値の決定方法を示す図である。 画像形成装置の処理の流れの全体を示すフローチャートである。 第1欠落情報の表示例を示す図である。 第2欠落情報の表示例を示す図である。 オートシャッタ機能が有効である場合の画面例を示す図である。 変形形態に係る携帯端末装置の構成を示すブロック図である。 画像の傾き検出例を示す図である。 図34の傾き検出例における傾き角度θとその正接値を示す図である。 画像の再構成画素値の決定例を示す図である。 特徴領域抽出処理(S3)の変形例を示すフローチャートである。 図37に示す特徴領域抽出処理によって撮像画像から特徴領域が抽出される様子を示す図である。 撮像画像に対して適用する検出方法の決定処理を示すフローチャートである。 図39のフローチャートにより検出方法を決定する例を示す図である。 図13に示すS611において行われる処理例を示すフローチャートである。 図13のS612においてNo、S614においてNo、またはS615においてNoの場合に行われる処理例を示すフローチャートである。 図41および図42の処理に従って表示処理部が動作したときの表示部の画面例を示す図である。 撮像範囲判定部の変形例を示すブロック図である。 ドキュメント補正モードのオン/オフ切り替え用のチェックボックスを含む画面例を示す図である。 補正処理後画像が表示された画面例を示す。
以下、本発明の実施の形態について、詳細に説明する。
(1)撮像画像処理システムの全体構成
図1は、本発明に係る撮像画像処理システムの全体構成を示す図である。図1に示されるように、撮像画像処理システムは、カメラ付き携帯電話、デジタルスチルカメラなど、撮像手段を備えた携帯端末装置(撮像装置)100、複合機、プリンタなどの画像形成装置(画像出力装置)200、および、インフォメーションディスプレイや電子黒板などの画像表示装置(画像出力装置)300を備える。
携帯端末装置100は、ユーザによって携帯されるものである。ユーザは、様々な場面で携帯端末装置100により対象物を撮像することができる。
本実施形態において、携帯端末装置100は、文書画像が印刷された用紙やポスター、文書画像が表示されている表示画面(例えば、ディスプレイ画面やプロジェクターにより投影された画面)のような矩形状の撮像対象物を撮像し、当該撮像により得られた画像を画像形成装置200または画像表示装置300から出力するための文書撮像モードの機能を有している。すなわち、携帯端末装置100は、文書撮像モードでの撮像により得られ、画像形成装置200または画像表示装置300にて出力する対象となる画像データ(以下、出力対象画像データという)を画像形成装置200または画像表示装置300に送信する。
そして、画像形成装置200は、受信した出力対象画像データに対して所定の画像処理を施し、画像処理後の出力対象画像データ(以下、補正済画像データという)、もしくは、補正済画像データで示される画像を出力する。また、画像表示装置300は、出力対象画像データの表示処理を行う。
ここで、ユーザは、矩形状の撮像対象物である、文書画像が印刷された用紙やポスター、文書画像が表示されている表示画面などに対して、常に正面から撮像できるとは限らない。すなわち、ユーザは、撮像対象物における、文書画像が形成された平面の法線方向と、撮像手段の撮像方向とが一致しない状態で、斜め方向から撮像対象物を撮像する場合がある。この場合、撮像手段による撮像範囲から撮像対象物の一部がはみ出した状態、つまり、撮像対象物の一部が欠けた状態で撮像してしまうことがある。このような場合、ユーザが所望する情報の一部が欠けた状態で撮像されることとなる。本実施形態では、上記文書撮像モードが選択された場合、このような撮像対象物の一部が撮像範囲からはみ出した状態で撮像されることを防止する機能を携帯端末装置100が有している。
なお、画像形成装置200で実行される出力処理としては、補正済画像データで示される画像を印刷して出力する印刷処理、サーバやUSBメモリなどの記憶装置へ出力対象画像データを格納するファイリング処理、電子メールに補正済画像データを添付して送信するメール送信処理などがある。画像表示装置300で実行される出力処理は、出力対象画像データの表示処理である。
携帯端末装置100と画像形成装置200とは通信可能であり、携帯端末装置100は、上述したように、出力対象画像データを画像形成装置200に送信する。携帯端末装置100と画像形成装置200との通信方式としては、図1において符号AまたはBで示されるような方式がある。符号Aで示される方式は、IrSimpleなどの赤外線通信規格のいずれかに基づく無線通信方式である。符号Bで示される方式は、Felica(登録商標)のような非接触無線通信により、携帯端末装置100から画像表示装置300に一旦出力対象画像データを送り、その後、例えばBluetooth(登録商標)のような無線通信を用いて、当該画像表示装置300から画像形成装置200へ当該データを転送する方式である。本実施形態では、ユーザは、画像形成装置200の前にきてから携帯端末装置100を操作し、赤外線通信のような近距離無線通信方式を用いて、携帯端末装置100から画像形成装置200へデータ送信するものとする。
ここで、画像表示装置300は、例えば、液晶ディスプレイ、プラズマディスプレイ、有機エレクトロルミネッセンスディスプレイ等よりなるインフォメーションディスプレイや電子黒板等である。このような画像表示装置300は、出力対象画像データで示される画像を表示させる表示処理を行う。この表示処理は、出力対象画像データの出力処理の1つである。すなわち、画像表示装置300は、出力対象画像データの出力処理を行う画像出力装置であるといえる。画像表示装置300で表示を行った後、画像形成装置200で印刷を行う、あるいは、他のアドレスにe−mail送信を行う、あるいは、コンピュータやネットワークで接続されているサーバ等に格納するようにすることもできる。
なお、携帯端末装置100と画像形成装置200および画像表示装置300との間の通信方式については、これらに限定されることなく、公知の通信方法を用いたものを適用することができる。たとえば、電子メールに出力対象画像データを添付して画像形成装置200や画像表示装置300に送信してもよい。
(2)携帯端末装置の構成
まず、図2に基づいて、本実施形態に係る携帯端末装置100について説明する。図2は、携帯端末装置100の構成を示すブロック図である。図2に示されるように、携帯端末装置100は、撮像部101、撮像範囲判定部110、画像処理部103、通信部(送信部)104、表示部105、入力部106、記録媒体アクセス部107、記憶部108、制御部109を備えている。
撮像部101は、CCDセンサ、CMOSセンサを用いて、撮像対象物の撮像を行い、撮像により得られた撮像画像を表示部105に表示させる。なお、撮像部101は、予め設定された解像度で撮像対象物の撮像を行う。なお、撮像部101により撮像される範囲(以下、撮像範囲という)は、予め設定された拡大縮小率に従って決定される。ここでは、撮像範囲は、幅がXmax、高さがYmaxの矩形であるとする。
撮像範囲判定部110は、ユーザにより文書撮像モードが選択された場合に、撮像部101により撮像され表示部105に表示されている撮像画像を基に、矩形状の撮像対象物が撮像範囲内に収まっているか否かを判定するものである。また、撮像範囲判定部110は、指定されたタイミングで表示部105に表示されている撮像画像を示す画像データを出力対象画像データとして記憶部108に格納する。撮像範囲判定部110の詳細については後述する。
画像処理部103は、撮像部101により記憶部108に格納された出力対象画像データに対して、少なくともA/D変換処理を行うものである。
通信部104は、USB(Universal Serial Bus)1.1またはUSB2.0の規格に基づく、シリアル転送/パラレル転送、無線データ通信機能を有するものである。通信部104は、ユーザが入力した送信指示に従って出力対象画像データを画像形成装置200または画像表示装置300に送信する。
表示部105は、例えば液晶ディスプレイなどにより構成されるものである。また,入力部106は、複数のボタンを有しており、ユーザがデータの入力等を行うためのものである。
記録媒体アクセス部107は、携帯端末装置100の各処理を行うためのプログラムが記録された記録媒体から、プログラムを読み出すものである。
また、記憶部108は、携帯端末装置100の各処理を行うためのプログラム、携帯端末装置100の機種情報、ユーザ情報や処理を行う際に必要なデータを格納するものである。なお、ユーザ情報とは、携帯端末装置100のユーザを識別する情報であり、例えば、ユーザIDおよびパスワードなどである。また、記憶部108は、文書撮像モードで撮像することにより得られた出力対象画像データおよびその付属情報(後述する出力処理情報、ファイルネームなど)を記憶する。
制御部109は、携帯端末装置100の各部の制御を行うものである。制御部109は、入力部106に文書撮像モードを選択する旨の指示が入力された場合、画像形成装置200での出力処理の種類(印刷処理、ファイリング処理、メール送信処理など)の選択指示、ならびに、選択した出力処理を実行するための設定条件(印刷枚数などの印刷条件、ファイリング先のサーバのアドレス、メールの送信先アドレスなど)の入力を促す画面を表示部105に表示する。そして、制御部109は、入力部106から、出力処理の種類および出力処理の設定条件を示す出力処理情報を取得する。
制御部109は、記憶部108に格納された出力対象画像データに、ファイルネームおよび出力処理情報を付加する。
また、制御部109は、入力部106へ送信指示が入力されると、記憶部108に格納されている出力対象画像データを画像形成装置200または画像表示装置300に送信する送信処理を通信部104に実行させる。このとき、通信部104は、出力対象画像データとともに、当該出力対象画像データに対応付けられた、ファイルネームおよび出力処理情報と、記憶部108に格納されている機種情報およびユーザ情報とを合わせて画像形成装置200または画像表示装置300に送信する。
(3)撮像範囲判定部について
(3−1)撮像範囲判定部の構成
次に、携帯端末装置100の撮像範囲判定部110の詳細な構成について説明する。図3は、撮像範囲判定部110の内部構成を示すブロック図である。図3に示されるように、撮像範囲判定部110は、幾何学的配置検出部111と、表示処理部112と、出力対象画像決定部113とを備えている。
幾何学的配置検出部111は、撮像対象物が矩形状であると仮定して、当該撮像対象物と背景との境界となるエッジ画素群を抽出することにより、撮像対象物の幾何学的配置(幾何学的歪み)を検出するものである。
表示処理部112は、表示部105に表示された撮像画像において、幾何学的配置検出部111により検出されたエッジ画素群の上に、撮像対象物の輪郭を示す輪郭線を重ねて表示させるものである。これにより、ユーザは、輪郭線を確認することで、撮像対象物が撮像範囲内に収まっているか否かを容易に確認することができる。
また、表示処理部112は、撮像対象物の幾何学的配置に基づいて、撮像範囲に撮像対象物が収まっているか否かを判定し、その判定結果を表示部105に表示する。これにより、ユーザは、判定結果を確認することにより、撮像対象物が撮像範囲に収まっているか否かをより一層容易に確認することができる。そして、収まっていない場合には、ユーザは、携帯端末装置100の向きや位置を変更することにより、撮像対象物を撮像範囲に収めることができる。
出力対象画像決定部113は、指定されたタイミングで表示部105に表示されている撮像画像を示す画像データを出力対象画像データとして決定し、当該出力対象画像データを記憶部108に格納するものである。
(3−2)撮像範囲判定部の処理
次に、撮像範囲判定部110の具体的な処理の一例について説明する。図4は、撮像範囲判定部110の処理の一例を示すフローチャートである。
(ステップ1(S1))
まず、幾何学的配置検出部111は、撮像部101により撮像され、表示部105に表示されている撮像画像の中から、エッジ画素の抽出を行う。そして、幾何学的配置検出部111は、エッジ画素を「1」とし、非エッジ画素を「0」とするエッジ画像を生成する。
エッジ画素の抽出には、例えば、撮像部101による撮像された輝度画像に対しCannyフィルタを適用して抽出する。Cannyフィルタとは、ガウシアンフィルタとソーベルフィルタを用いて、細線化されたエッジを検出するフィルタである。なお、この時、処理高速化のために、画像サイズを縮小しても良い。また、エッジ画素の検出精度を高めるために、例えば、フィルタ処理を行う前に、平滑化や、フィルタ処理後に、膨張収縮などのモルフォロジー変換を行っても良い。
図5は、輝度画像から抽出されたエッジ画像を示す図である。図5において上段が輝度画像を示し、下段が抽出されたエッジ画像を示す。
(ステップ2(S2))
次に、幾何学的配置検出部111は、連結したエッジ画素の領域(連結エッジ領域)ごとに異なるラベルを付すラベリング処理を行う。
幾何学的配置検出部111は、例えば、図6で示されるように以下の方法を用いてラベリングを行う。
(I)注目画素がエッジ画素の場合、注目画素の上隣の画素がエッジ画素で、すでにラベルがつけられていれば、注目画素にも同じラベルをつける(図6(a))。
(II)左隣の画素もエッジ画素で、上隣の画素とは異なるラベルがつけられている場合は、上隣と同じラベルをつける(図6(b))。
(III)上隣の画素が非エッジ画素で左隣がエッジ画素の場合、注目画素に左隣と同じラベルをつける(図6(c))。
(IV)上隣も左隣も非エッジ画素の場合、注目画素に新しいラベルをつける(図6(d))。
(V) 全てのエッジ画素に対しラベル付けを行う。
(VI)複数のラベルがつけられている場合、上記の規則に基づいてラベルを統一する。
(ステップ3(S3))
次に、幾何学的配置検出部111は、ラベル付けがされた連結エッジ領域の中から、撮像対象物と背景との境界を含む領域の候補(以下、特徴領域という)を抽出する(S3)。
撮像対象物は、その中心を撮像範囲の中心付近とし、撮像範囲の中の大部分を占めるようにして撮像されるのが通常である。そのため、撮像対象物と背景との境界は、その中心が撮像範囲の中心付近に位置し、かつ、撮像範囲の横方向(幅方向)の長さおよび縦方向(高さ方向)の長さが長くなる。そこで、幾何学的配置検出部111は、以下の条件Aを満たす連結エッジ領域を特徴候補として抽出する。
条件A:撮像範囲において左上角を原点とし、右方向(幅方向)をx軸、下方向(高さ方向)をy軸とし、撮像範囲の右端のx座標をXmax、撮像範囲の下端のy座標をYmaxとする。このとき、連結エッジ領域の幅方向の長さが撮像範囲の幅(つまりXmax)の1/4以上、かつ、高さ方向の長さが撮像範囲の高さ(つまりYmax)の1/4以上であり、かつ、連結エッジ領域の中心x座標が、Xmax/4以上かつ3×Xmax/4以下で、領域の中心y座標が、Ymax/4以上かつ3×Ymax/4以下である。
図7は、特徴領域抽出処理(S3)の詳細な処理例を示すフローチャートである。図7に示されるように、まず、幾何学的配置検出部111は、S2でラベル付けされた連結エッジ領域の1つを選択する(S301)。そして、幾何学的配置検出部111は、選択した連結エッジ領域について、幅方向の長さ、高さ方向の長さ、中心x座標、中心y座標を特定する。具体的には、連結エッジ領域を構成するエッジ画素のうち、最大のx座標から最小のx座標を引くことにより幅方向の長さを求め、最大のy座標から最小のy座標を引くことにより高さ方向の長さを求め、最大のx座標と最小のx座標との平均値を中心x座標として求め、最大のy座標と最小のy座標との平均値を中心y座標として求める。
次に、幾何学的配置検出部111は、中心x座標がXmax/4以上かつ3×Xmax/4以下であるか判定する(S302)。
S302でYesの場合、幾何学的配置検出部111は、中心y座標がYmax/4以上かつ3×Ymax/4以下であるか判定する(S303)。
S303でYesの場合、幾何学的配置検出部111は、連結エッジ領域の幅方向の長さがXmax/4以上であるか判定する(S304)。
S304でYesの場合、幾何学的配置検出部111は、連結エッジ領域の高さ方向の長さがYmax/4以上であるか判定する(S305)。
S305でYesの場合、選択した連結エッジ領域を特徴領域として抽出する(S306)。その後、幾何学的配置検出部111は、未選択の連結エッジ領域があるか確認し、ある場合には、未選択の一つの連結エッジ領域を選択する(S308)。
一方、S302〜S305のいずれかにおいてNoである場合には、選択した連結エッジ領域を特徴領域として抽出せずに、S308の処理に移行する。
その後、S308にて選択した連結エッジ領域について、S302以降の処理を実行する。これにより、上記の条件Aを満たす連結エッジ領域を特徴領域として抽出することができる。そして、幾何学的配置検出部111は、抽出された特徴領域に属する画素のみをエッジ画素とし、残りの画素を非エッジ画素とした特徴領域画像データを生成する。
図8は、多数の連結エッジ領域を含むエッジ画像から特徴領域を抽出する様子を示す図である。図8において、左列はエッジ画像である。また、中列は、S302およびS303の処理により、中心座標が撮像範囲の端部側に位置する連結エッジ領域が除かれた状態を示す画像である。右列は、中列からさらにS304およびS305の処理により、幅方向の長さまたは高さ方向の長さが短い連結エッジ領域が除かれ、抽出された特徴領域のみを示す画像である。すなわち、右列は、特徴領域画像データで示される画像である。
図8に示すように、S3の処理により、矩形の撮像対象物と背景との境界となるエッジ画素の候補である特徴領域が抽出される。ただし、図8の下段で示されるように、画像によっては、撮像対象物と背景との境界以外のエッジ画素が特徴領域として抽出される場合もある。
(ステップ4(S4))
そこで、幾何学的配置検出部111は、特徴領域の中から、矩形の撮像対象物と背景との境界となる四角形の上辺、左辺、右辺、下辺を構成する、線分状に連なるエッジ画素群を抽出し、当該エッジ画素群の近似直線を特定する処理(直線抽出処理)を行う(S4)。
ここで、上辺は、撮像画像の中の上半分(つまり、y座標が0からYmax/2の範囲)に位置し、撮像範囲の幅方向に平行である確率が高い。また、左辺は、撮像画像の左半分(つまり、x座標が0からXmax/2の範囲)に位置し、撮像範囲の高さ方向に平行である確率が高い。右辺は、撮像画像の右半分(つまり、x座標がXmax/2からXmaxの範囲)に位置し、撮像範囲の高さ方向に平行である確率が高い。下辺は、撮像画像の下半分(つまり、y座標がYmax/2からYmaxの範囲)に位置し、撮像範囲の幅方向に平行である確率が高い。
そこで、存在する確率の高い範囲において、特徴領域画像データの中から特定の方向に連なるエッジ画素の数が最大であり、所定長さ以上の線分状のエッジ画素群を、矩形の撮像対象物と背景との境界となる線分状に連なるエッジ画素群として抽出する。そして、抽出したエッジ画素群の近似直線を特定する。
図9は、図4に示すS4の処理のうち、上辺を構成するエッジ画素群の近似直線を特定する処理の流れを示すフローチャートである。
まず、幾何学的配置検出部111は、変数x=0、変数count=0、変数pre_y=−1を設定する(S401)。次に、幾何学的配置検出部111は、変数y=0を設定する(S402)。
そして、幾何学的配置検出部111は、特徴領域画像データにおいて、座標(x、y)で示される画素がエッジ画素であるか確認する(S403)。S403でNoである場合、変数yをy+1に変更する(S404)。続いて、変更後の変数yが撮像範囲の高さ(つまりYmax)の1/2より大きいか確認する(S405)。S405でNoの場合、S403の処理に戻る。
S403〜S405の処理を繰り返すことにより、特徴領域画像データにおいて、(0,0)座標から撮像範囲の高さの1/2の座標まで、y軸下方向に探索していき、最初にエッジ画素が見つかった時点で、S403でYesとなる。S403でYesとなると、幾何学的配置検出部111は、
pre_y−1≦y≦pre_y+1
を満たすか確認する(S407)。
S407を満たさない場合、幾何学的配置検出部111は、変数countの値を前回設定した座標群に格納する(S408)。その後、幾何学的配置検出部111は、新たな座標群[x]を設定するとともに、変数countを0に設定する(S409)。一方、S407を満たす場合、幾何学的配置検出部111は、変数countを1だけ加算し(S410)、最も新しく設定された座標群に座標(x、y)を格納する(S411)。そして、S409またはS411の後、幾何学的配置検出部111は、変数pre_yをyに設定する(S412)。
一方、y軸下方向に探索していき、エッジ画素が見つからなかったとき(S405でNo)、幾何学的配置検出部111は、変数count=0、変数pre_y=−1を設定する(S406)。
S406またはS412の後、幾何学的配置検出部111は、変数xに1を加算する(S413)。続いて、変更後の変数xが撮像範囲の幅(つまりXmax)より大きいか確認する(S414)。S414でNoの場合、S402の処理に戻る。
例えば、x=0において、y軸下方向に探索していき、最初に見つかったエッジ画素の座標(0,y0)を記録する。次に、(1,0)座標からy軸下方向に探索していき、最初にエッジ画素が見つかった時点の座標(1,y1)を記録する。この時、y0−1≦y1≦y0+1ならば、この2点は特定方向に沿って連なっていると判断し、S409において変数countを1増やすとともに、座標(1、y1)を座標群[0]に格納する。y0−1≦y1≦y0+1を満たすということは、撮像範囲の幅方向から所定角度の範囲内の特定方向で2点が連続していることとなる。
このようにして、座標(k、yk)まで座標群[0]に格納した後、(k+1,0)座標からy軸下方向に探索して最初に見つかったエッジ画素の座標(k+1,y(k+1))が、yk−1≦y(k+1)≦yk+1を満たさないとする。この場合、S408において、変数countの値kが座標群[0]に格納される。また、S409において新たな座標群[k+1]が設定され、変数countが0にリセットされる。
上記の処理を、xが撮像範囲の幅(つまりXmax)になるまで繰り返す。その後、幾何学的配置検出部111は、最も座標数の大きい座標群、すなわち、最もcountの値が大きい座標群を選択する(S415)。そして、幾何学的配置検出部111は、選択した座標群に含まれる座標数(つまりcount値)がXmax/4以上であるか確認する(S416)。S416でNoの場合、撮像対象物と背景との境界線となる上辺としては短いため、幾何学的配置検出部111は、上辺を構成する直線を抽出できなかった旨の情報(抽出不可情報)を生成する(S417)。
一方、S416でYesの場合、幾何学的配置検出部111は、選択した座標群に含まれる複数の座標を基に、最小二乗法を用いて、近似直線の式を求める(S418)。S416でYesの場合、最も座標数の大きい座標群は、撮像範囲の幅方向から予め定められた角度範囲内の方向に、Xmax/4以上の長さの線分状に連なるエッジ画素群である。そのため、当該エッジ画素群は、撮像対象物と背景との境界の上辺を示す確率が非常に高くなる。
例えば、座標数の最も大きい座標群に(6,120)、(7,120)、(8,121)、(9,122)、(10,121)が格納されているなら、幾何学的配置検出部111は、最小二乗法によりy=0.4x+117.6 という式を求める事ができる。
同様の処理を下辺、右辺、左辺にも行うことで、四辺の直線を抽出する。
なお、下辺の場合には、図9のS402において変数y=Ymaxを設定する。また、S404において変数yから1だけ減算し、S405において、変更後の変数yが撮像範囲の高さ(つまりYmax)の1/2より小さいか確認する。
また、左辺の場合には、図10の処理を行えばよい。図10は、図9においてxとyとを入れ替えた処理となる。これは、左辺が、撮像範囲の左半分に位置し、撮像範囲の高さ方向に平行である確率が高いことに起因している。図10によれば、S418では、撮像範囲の高さ方向から予め定められた角度範囲内の方向に、Ymax/4以上の長さの線分状に連なるエッジ画素群を基に、直線の式を求める。当該エッジ画素群は、撮像対象物と背景との境界の左辺を示す確率が非常に高くなる。
また、右辺の場合には、図10のS402’において変数x=Xmaxを設定する。また、S404’において変数xから1だけ減算し、S405’において、変更後の変数xが撮像範囲の幅(つまりXmax)の1/2より小さいか確認する。
図11は、特徴領域の中から、矩形の撮像対象物と背景との境界となる四角形の上辺、左辺、右辺、下辺を構成する、線分状に連なるエッジ画素群を抽出(検出)する例を示す図である。図11の(a)は、全ての特徴領域を示す画像である。(b)は、矩形の撮像対象物と背景との境界となる四角形の上辺として抽出されたエッジ画素群を実線で示す。(c)は、矩形の撮像対象物と背景との境界となる四角形の左辺として抽出されたエッジ画素群を実線で示す。(d)は、矩形の撮像対象物と背景との境界となる四角形の下辺として抽出されたエッジ画素群を実線で示す。(e)は、矩形の撮像対象物と背景との境界となる四角形の右辺として抽出されたエッジ画素群を実線で示す。
このようにして、幾何学的配置検出部111は、上辺として抽出されたエッジ画素群の近似直線を上辺直線、左辺として抽出されたエッジ画素群の近似直線を左辺直線、右辺として抽出されたエッジ画素群の近似直線を右辺直線、下辺として抽出されたエッジ画素群の近似直線を下辺直線とし、各直線の式を生成する。
(ステップ5(S5))
S4による四辺の直線抽出処理が終了すると、幾何学的配置検出部111は、S4で求めた直線の式に基づいて、交点座標を求める(S5)。
S4において四辺に対応する直線の式が求められた場合、幾何学的配置検出部111は、2直線の交点座標は容易に求める事ができる。すなわち、幾何学的配置検出部111は、左辺直線と上辺直線の交点座標を左上頂点座標、上辺直線と右辺直線の交点座標を右上頂点座標、右辺直線と下辺直線の交点座標を右下頂点座標、下辺直線と左辺直線の交点座標を左下頂点座標として求める。そして、幾何学的配置検出部111は、これら4つの頂点座標を含む抽出結果情報を表示処理部112に出力する。
図12は、4つの頂点座標を求める例を示す図である。図12では、左上頂点座標(X1,Y1)、右上頂点座標(X2,Y2)、右下頂点座標(X3,Y3)、左下頂点座標(X4,Y4)が求められている。
また、S4において三辺のみに対応する直線の式が求められた場合、幾何学的配置検出部111は、残りの一辺に対応する直線を撮像範囲端の直線として、当該直線の式を求める。つまり、左辺が抽出できない場合にはx=0、右辺が抽出できない場合にはx=Xmax、上辺が抽出できない場合にはy=0、下辺が抽出できない場合にはy=Ymaxを残りの一辺に対応する直線の式とする。そして、幾何学的配置検出部111は、その直線式を用いて4つの頂点座標を求める。
ただし、撮像範囲端の直線との交点について仮頂点座標として求める。例えば、右辺が抽出できなかった場合、右上頂点座標および右下頂点座標は仮頂点座標として求められる。
そして、幾何学的配置検出部111は、4つの頂点座標と、三辺のみが抽出できたことを示す情報と、抽出できなかった辺を示す抽出不可情報とを含む抽出結果情報を生成し、表示処理部112に出力する。なお、仮頂点座標については、仮頂点座標であることを示す情報が付けられている。
また、S4において、三辺または四辺に対応する直線の式が求められなかった場合、幾何学的配置検出部111は、撮像対象物と背景との境界を適切に抽出できなかった旨を示す抽出結果情報を生成し、表示処理部112に出力する。
(ステップ6(S6))
続いて、表示処理部112は、抽出結果情報に基づいた表示処理を行う。具体的には、以下のとおりである。
表示処理部112は、抽出結果情報で示される4つの頂点座標を結ぶ四角形の線を撮像対象物の輪郭線として撮像画像に重ねて表示する。
また、抽出結果情報が4つの頂点座標を含み、抽出不可情報を含まない場合、表示処理部112は、4つの頂点座標が撮像範囲内であるか否かを判断する。全ての頂点座標が撮像範囲内であれば、表示処理部112は、撮像対象物が撮像範囲内であることを示す情報(例えば、「OK」)を表示部105に表示させる。
また、3つの頂点座標が撮像範囲内であり、1つの頂点座標が撮像範囲外である場合、表示処理部112は、撮像対象物の一部(一角)が撮像できないことを示す第1欠落情報を表示部105に表示させる。
さらに、抽出結果情報が4つの頂点座標を含み、抽出不可情報を含む場合、表示処理部112は、4つの頂点座標が撮像範囲内であるか否かを判断する。全ての頂点座標が撮像範囲内であれば、表示処理部112は、撮像対象物の一部(一辺)が撮像できないことを示す第2欠落情報を表示部105に表示させる。
上記以外の場合には、表示処理部112は、表示部105の画面をそのままにしておいてもよいし、撮像部101の向きの変更を促す情報(例えば、「撮像対象物が撮像範囲内に収まるようにカメラの向きを調整してください」等)を表示部105に表示させてもよい。
図13は、S6の処理の詳細を示すフローチャートである。
まず、表示処理部112は、矩形の撮像対象物と背景との境界となる四辺全てが抽出されたか判断する(S601)。ここでは、表示処理部112は、抽出結果情報が4つの頂点座標を含み、抽出不可情報を含まない場合に、四辺全てが抽出されたと判断する。
四辺全てが抽出された場合(S601でYes)、表示処理部112は、抽出結果情報で示される左上頂点座標(X1,Y1)が撮像範囲内であるか否かを判断する(S602)。具体的には、表示処理部112は、0≦X1≦Xmax、および、0≦Y1≦Ymax の両方を満たすか否かを判断し、両方ともを満たす場合に左上頂点座標が撮像範囲内であると判断する。
左上頂点座標が撮像範囲内である場合、表示処理部112は、左上頂点座標(X1,Y1)が撮像範囲内であることを示すフラグを生成し、記憶する(S603)。一方、左上頂点座標が撮像範囲外である場合、次の処理に移行する。
表示処理部112は、S602およびS603と同様の処理を、右上頂点座標(X2、Y2)、右下頂点座標(X3,Y3)、左下頂点座標(X4,Y4)についても行う(S604〜S609)。
そして、表示処理部112は、全ての頂点座標に対してフラグを記憶しているか確認する(S610)。全ての頂点座標に対してフラグを記憶している場合(S610でYes)、表示処理部112は、撮像対象物が欠落することなく撮像範囲内に収まっていると判断する。そして、表示処理部112は、抽出結果情報で示される4つの頂点座標を結ぶ四角形の線を撮像対象物の輪郭線として撮像画像に重ねて表示する。ここで、頂点座標は、幾何学的配置検出部111により検出された線分状のエッジ画素群に対する近似直線の交点である。そのため、エッジ画素群の上に輪郭線が重ねて表示されることとなる。また、表示処理部112は、撮像対象物が撮像範囲内であることを示す情報(例えば、「OK」)を表示部105に表示させる(S611)。また、このとき、表示処理部112は、出力対象画像を決定するためのシャッタボタンも合わせて表示部105に表示させる。
図14は、S611において表示部105に表示される画面の一例を示す図である。図14に示されるように、頂点座標を結ぶ四角形の線である輪郭線Lは、矩形の撮像対象物と背景との境界上に表示されることとなる。そのため、ユーザは、撮像対象物が撮像範囲内であることを容易に確認することができる。
なお、図14において、符号10は、シャッタボタンであり、符号20は、オートフォーカス設定ボタンであり、符号30は、露出調整バーであり、符号40は、画像読み込みボタンであり、符号50は、条件設定ボタンである。シャッタボタン10は、表示部105に表示されている撮像画像を出力対象画像として決定するためのボタンである。オートフォーカスボタン20は、自動的に焦点をあわせるためのボタンである。露出調整バー40は、光の露出を調整するためのバーである。画像読み込みボタン40は、事前に保存しておいた画像を、撮像された画像として処理するためのものである。画像読み込みボタン40が押下されると、保存された画像一覧画面が表示され、その中の一つがユーザにより選択されると、それを撮像部101で撮像した画像として、次の処理(シャッターが押された後の処理)が行われる。条件設定ボタン50は、各種の撮像条件を設定するためのボタンである。
一方、全ての頂点座標に対してフラグを記憶していない場合(S610でNo)、表示処理部112は、3つの頂点座標に対してフラグを記憶しているか確認する(S612)。
S612でNoの場合、つまり、2以下の頂点座標のみが撮像範囲内である場合には、表示処理部112は、撮像対象物が撮像範囲内であることを示す情報(例えば、「OK」)を表示部105に表示しない。そのため、ユーザは、撮像対象物が撮像範囲内にないことを認識して、撮像部101の向きを変更させる。撮像部101の向きが変更された後(S617)、再度S1の処理に戻る。すなわち、撮像部101の向きが変更された後の画像データに基づいて、再度S1以降の処理が実施される。
S612でYesの場合、つまり、3つの頂点座標が撮像範囲内である場合には、表示処理部112は、4つの頂点座標を結ぶ四角形の線を撮像対象物の輪郭線として撮像画像に重ねて表示する。さらに、表示処理部112は、撮像対象物の一部(一角)が撮像できないことを示す第1欠落情報を表示部105に表示させる(S613)。
図15の(a)(b)は、S613において表示部105に表示される画面の一例を示す図である。図15に示されるように、頂点座標を結ぶ四角形の線である輪郭線Lは、矩形の撮像対象物と背景との境界上に表示されることとなる。そのため、ユーザは、撮像対象物が撮像範囲内であることを容易に確認することができる。
また、第1欠落情報として、撮像範囲外に位置する頂点座標の付近に、角が欠落していることを示す第1アイコンBが表示されている。ここでは、表示処理部112は、撮像範囲外の頂点座標を基に、撮像範囲の中から当該頂点座標に最も近い点を特定し、特定した点から予め定められた距離の範囲内に第1アイコンBを表示する。このとき、表示処理部112は、第1アイコンBと輪郭線Lとが重ならないように表示する。これにより、第1アイコンBを確認したユーザは、当該第1アイコンBの近くの角が撮像範囲から外れていることを容易に認識することができる。そして、ユーザは、撮像対象物が撮像範囲に収まるように、撮像部101の向きを容易に変更することができる。撮像部101の向きが変更された後(S617)、再度S1の処理に戻る。すなわち、撮像部101の向きが変更された後の画像データに基づいて、再度S1以降の処理が実施される。
また、S601でNoの場合、表示処理部112は、矩形の撮像対象物と背景との境界となる四辺のうちの三辺のみが抽出されたか判断する(S614)。ここでは、表示処理部112は、抽出結果情報が4つの頂点座標を含み、抽出不可情報を含む場合に、三辺のみが抽出されたと判断する。
S614でYesの場合、表示処理部112は、抽出結果情報で示される、仮頂点座標を除く2つの頂点座標が撮像範囲内であるか判断する(S615)。ここで、仮頂点座標を除く2つの頂点座標とは、抽出された三辺が上辺、左辺、右辺の場合には、上辺および左辺の交点である左上頂点座標と、上辺および右辺の交点である右上頂点座標である。また、抽出された三辺が上辺、左辺、下辺の場合には、上辺および左辺の交点である左上頂点座標と、左辺および下辺の交点である左下頂点座標である。また、抽出された三辺が左辺、下辺、右辺の場合には、下辺および左辺の交点である左下頂点座標と、下辺および右辺の交点である右下頂点座標である。また、抽出された三辺が上辺、右辺、下辺の場合には、上辺および右辺の交点である右上頂点座標と、下辺および右辺の交点である右下頂点座標である。S615の処理は、S602〜S609と同様の処理となる。
S614またはS615でNoの場合、表示処理部112は、撮像対象物が撮像範囲内であることを示す情報(例えば、「OK」)を表示部105に表示しない。そのため、ユーザは、撮像対象物が撮像範囲内にないことを認識して、撮像部101の向きを変更させる。撮像部101の向きが変更された後(S617)、再度S1の処理に戻る。
一方、S615でYesの場合、表示処理部112は、4つの頂点座標を結ぶ四角形の線のうち2つの仮頂点座標間の辺を除く線を撮像対象物の輪郭線として撮像画像に重ねて表示する。そして、表示処理部112は、撮像対象物の一部(一辺)が撮像できないことを示す第2欠落情報を表示部105に表示させる(S616)。
図16は、S616において表示部105に表示される画面の一例を示す図である。図16に示されるように、輪郭線Lは、矩形の撮像対象物と背景との境界上に表示されることとなる。そのため、ユーザは、撮像対象物が撮像範囲内であることを容易に確認することができる。
また、第2欠落情報として、撮像範囲外に位置する辺の付近に、撮像対象物の外枠の一辺が欠落していることを示す第2アイコンCが表示されている。なお、表示処理部112は、抽出不可情報で示される辺に対応する撮像範囲の枠の辺から予め定められた範囲内に第2アイコンCを表示する。例えば、抽出不可情報が右辺である場合には、撮像範囲の外枠の右辺(つまり、x=Xmaxで示される線)の付近に第2アイコンCを表示する。これにより、第2アイコンCを確認したユーザは、第2アイコンCの近くの辺が撮像範囲から外れていることを容易に認識することができる。これにより、ユーザは、撮像対象物が撮像範囲に収まるように、撮像部101の向きを容易に変更することができる。そして、撮像部101の向きが変更された後(S617)、再度S1の処理に戻る。すなわち、撮像部101の向きが変更された後の画像データに基づいて、再度S1以降の処理が実施される。
なお、表示処理部112は、輪郭線Lとは異なる色の第1欠落情報および第2欠落情報を表示することが好ましい。これにより、ユーザは、第1欠落情報および第2欠落情報の確認が容易となる。
(ステップ7(S7))
最後に、出力対象画像決定部113は、出力処理の対象となる画像データである出力対象画像データを決定する。具体的には、出力対象画像決定部113は、図14に示されるように、撮像対象物が撮像範囲内であることを示す情報(例えば、「OK」)と、シャッタボタン10とが表示部105に表示されている状態において、シャッタボタン10が操作されたタイミングを検知する。そして、出力対象画像決定部113は、シャッタボタン10が操作されたタイミングを指定されたタイミングとして、当該タイミングで表示部105に表示されている撮像画像を示す画像データを出力対象画像データとして決定する。
なお、出力対象画像決定部113は、撮像対象物が撮像範囲内であることを示す情報が表示されているときのみ、シャッタボタン10の操作を受け付け可能としている。
(3−3)幾何学的配置検出部の別の処理例(その1)
幾何学的配置検出部111は、上記のS2の処理を省略し、上記のS3において図37に示すような処理を行うことで、撮像対象物と背景との境界を含む領域の候補(特徴領域)を抽出してもよい。なお、図37は、本変形例における特徴領域抽出処理(S3)を示すフローチャートである。また、図38は、本変形例における特徴領域抽出処理によって特徴領域が抽出される様子を示す図である。
まず、幾何学的配置検出部111は、図38で示されるように、(1)の撮像画像からS1で抽出した(2)のエッジ画像を取得する。そして、幾何学的配置検出部111は、抽出されたエッジ画像に対して、一段階の膨張処理を行う(S311)。一段階の膨張処理とは、注目画素がエッジの場合、注目画素の周辺4近傍(注目画素の上、左、下、右に位置する画素)の画素をエッジにする処理である。図38の(3)は、膨張処理後のエッジ画像を示しており、エッジ部分が膨張していることがわかる。
次に、幾何学的配置検出部111は、エッジ画像を反転させる(S312)。すなわち、エッジ画像においてエッジ画素を非エッジ画素に、非エッジ画素をエッジ画素に置換する。図38の(4)は、反転処理後のエッジ画像を示している。図38の(3)(4)に示されるように、膨張してエッジ領域同士の接続数を増加させた後に反転処理した画像において、画像端(撮像範囲端)に接している領域は背景であるとみなすことができる。
続いて、幾何学的配置検出部111は、反転処理後のエッジ画像に対して、連結したエッジ画素の領域(連結領域)ごとに異なるラベルを付すラベリング処理を行う(S313)。当該ラベリング処理は、上記のS2と同様を処理を行えばよい。
幾何学的配置検出部111は、S313でラベル付けされた連結領域の1つを選択し、中心x座標、中心y座標を特定する(S314)。具体的には、最大のx座標と最小のx座標との平均値を中心x座標として求め、最大のy座標と最小のy座標との平均値を中心y座標として求める。
次に、幾何学的配置検出部111は、中心x座標がXmax/4以上かつ3×Xmax/4以下であるか判定する(S315)。
S315でYesの場合、幾何学的配置検出部111は、中心y座標がYmax/4以上かつ3×Ymax/4以下であるか判定する(S316)。
S316でYesの場合、幾何学的配置検出部111は、連結領域が画像端から離れているかどうかを判定する(S317)。具体的には、選択した連結領域の最大のx座標が画像右端のx座標(画像幅−1)に一致するか、最小のx座標が画像左端のx座標(0)に一致するか、最大のy座標が画像下端のy座標(画像高さ−1)に一致するか、最小のy座標が画像上端のy座標(0)に一致するかを判定する。そして、一つでもYesであるなら、連結領域が画像端に接している(画像端から離れていない)と判定し、全てがNoであれば、画像端から離れていると判定する。
S317でYesの場合、幾何学的配置検出部111は、選択した連結領域を特徴領域として抽出する(S318)。その後、未選択の連結領域があるか確認する(S319)。一方、S315,S316,S317の何れかにおいてNoである場合には、選択した連結領域を特徴領域として抽出せずに、未選択の連結領域があるか確認する(S319)。
その後、幾何学的配置検出部111は、未選択の連結領域がある場合には、未選択の一つの連結領域を選択する(S320)。一方、未選択の連結領域がない場合には、幾何学的配置検出部111は、特徴領域抽出処理を終了して図4のS4の処理を行い、撮像対象物と背景との境界を示す確率の高い、線分状に連なるエッジ画素群を検出する。
図38の(5)は、S315またはS316でNoと判定された連結領域を示している。図38の(5)で示される連結領域は、中心座標が画像端に近い領域であり、矩形状の撮像対象物以外の背景部分、または、撮像対象物の端部に描かれた小さい領域である可能性が高い。そのため、図38の(5)で示される連結領域は特徴領域として抽出されない。
また、図38の(6)は、S317でNoの判定された連結領域を示している。図38の(6)で示される連結領域は、画像端に接している領域であり、撮像対象物以外の背景部分である可能性が高い。そのため、図38の(6)で示される連結領域は特徴領域として抽出されない。
図38の(7)は、(4)で示される画像から(5)および(6)の領域を除いた領域であり、特徴領域として抽出された領域を示す。図示されるように、撮像対象物と背景との境界を含む領域が特徴領域として抽出されていることがわかる。
(3−4)幾何学的配置検出部の別の処理例(その2)
幾何学的配置検出部111は、S2〜S4の処理とは別に、以下のような処理を行うことで、撮像対象物と背景との境界となる線分状に連なるエッジ画素群に対応する直線の式を求めても良い。
つまり、幾何学的配置検出部111は、撮像画像データの中から、線分状に連なるエッジ画素の群を検出し(直線認識を行い)、検出したエッジ画素の群を、撮像対象物と背景との境界と見なす。
まず、幾何学的配置検出部111は、撮像部101により撮像され、表示部105に表示されている画像データについて、ラスター走査を行う。ここで、図17に示されるように、ラスター走査の順方向をX方向、X方向に垂直な方向をY方向とする。また、撮像画像において左上隅を原点とする。
1ライン分走査を行い、エッジが存在しなければ、幾何学的配置検出部111は、Y方向に所定量だけずらした次のラインについて走査する。なお、ライン間の間隔は一定であればよく、1画素である必要はない。
そして、幾何学的配置検出部111は、ラスター走査において、最初にエッジを検出したラインをL1(1ライン目)とし、図18に示すように、順方向で最初のエッジと判定された点の座標を第1群(第1エッジ画素群)に格納し、同じライン上で2つ目のエッジと判定された点の座標を第2群(第2エッジ画素群)に分類する。引き続き次のラインの走査を行い、エッジ検知する。そして、それぞれのラインLiについて、順方向で1番目に撮像対象物のエッジと判定された点と、2番目に撮像対象物のエッジと判定された点とのX座標値の差分(X座標の距離di)を求め下記のように判定を行う。
なお、ラインLiにおける最初のエッジのX座標をXi1(第1群に分類されているX座標)、2つ目のエッジのX座標をXi2(第2群に分類されているX座標)とする。検出方法は以下のようである。
(a)1ライン(L1)目の座標X11およびX12については変更しない。
(b)2ライン目以降のiライン目については、座標間の距離di1(=Xi1−X(i−1)1)およびdi2(同様)を算出する。以下、di1に関して述べるため添え字の1を省略するが、di2も同様である。
(c)3ライン目以降のiライン目は、ddi=abs{(di)−di−1}を算出する。ddi≦th1(≒0に近い小さな数値)であれば、座標Xiは同じ群に分類する。そうでない場合(ddi>th1)は、別の群(第3群(第3エッジ画素群)または第4群(第4エッジ画素群))に分類する。
(d)初期処理としてi=4のときのみ、X2の群を確定させるための処理を行う。以下のようにする。
i)dd3≦th1 かつ dd4≦th1 → X2:同群
ii)dd3>th1 かつ dd4≦th1 → X2:別群
iii)dd3≦th1 かつ dd4>th1 → X2:同群
iv)dd3>th1 かつ dd4>th1 → X2:同群
一度、別群(第3群または第4群)に遷移した場合は、増減の確認をする必要はない。
このような処理を画像全体に行って、各群に属するエッジ画素を抽出する。そして、エッジ画素群ごとに、当該エッジ画素群に属するエッジ画素の座標を最小2乗法などで直線近似し、当該エッジ画素群に属するエッジ画素に近似した直線を求める。ここで、幾何学的配置検出部111は、各エッジ画素群について求めた近似直線と当該エッジ画素群に含まれるエッジ画素との距離の二乗和の平均が所定閾値以下である場合に、エッジ画素群が線分状に配列しているものと判断し、以下の処理を続行することができる。これにより、幾何学的配置検出部111は、撮像対象物と背景との境界として推定される、線分状に連なるエッジ画素群を検出することができる。そして、幾何学的配置検出部111は、検出された各エッジ画素群について求めた近似直線を、撮像対象物と背景との境界となる四辺に対応する直線とすればよい。
図19は、上記のような処理によって、ラスター走査によってエッジ点を抽出し、4つのエッジ画素群に分類したときの図である。図において、丸印が第1群に属するエッジ画素、四角印が第2群に属するエッジ画素、三角印が第3群に属するエッジ画素、星印が第4群に属するエッジ画素を示し、最小2乗法により求められた、各エッジ画素群に属するエッジ画素の近似直線を点線で示す。
さらに、上記の分類処理を90度回転させた画像に対して行っても良い。こうすることで、理想的に画像内の水平方向・垂直方向に平行に配置されたような原稿のエッジ画素群も抽出することが可能となる。すなわち、ラスター走査することで、回転前の画像では、垂直方向のエッジが検出できる。一方、回転後の画像では、回転前に水平方向であったエッジ画素群(回転後には垂直方向であるエッジ)を検出することができる。これにより、垂直方向・水平方向に平行なエッジも抽出することができる。回転前で十分な情報量(各群で例えば3点以上の交点)があれば、回転前の情報のみを用いればよいし、いずれかの群の交点が1点未満の場合、当然直線の式は求められないため、回転後の交点を用いればよい。
あるいは、求まった交点座標のみを再度座標変換して元に戻し、それぞれの群の分布する領域から、対応する群を求めて、交点情報を統合し、直線の式を求めても良い。すなわち、回転前の画像から求められた交点座標と、回転後の画像から求められた交点を逆回転して得られた交点座標とから、同一の群に属する好転座標を統合して直線の方程式を求めればよい。
なお、エッジ画素の抽出方法としては、少なくとも1以上の画素幅の小ウィンド内での画素値をそのまま比較(2以上の幅の場合は和・平均値を比較)していき、隣接する値の差分が一定以上の場合、エッジ画素であると判定すればよい。なお、背景や撮像対象物内のテキストのエッジなどを誤って検出することを防止するために、所定長さ以上のエッジ画素群のみを撮像対象物のエッジとして検出してもよい。この場合、所定長さとは、例えば、撮像範囲の外枠辺の長さの80%程度の長さを設定すればよい。このような検出方法としては、例えば、日本国公開特許公報「特開2006−237757」に記載の技術を用いることができる。もしくは、それぞれの座標群の評価を行ったり、線分検知のための処理(ハフ変換など)を行ったりすることでも防止できる。さらに、縮小画像を用いた処理をプレ処理として行うことで、テキストや細かなテクスチャのエッジを誤って検出することを防止することができる。
(3−5)幾何学的配置検出部の別の処理例(その3)
上記の(3−2)(3−3)(3−4)で示した、撮像対象物と背景との境界を示す確率の高い線分状に連続したエッジ画素群の検出方法にはそれぞれ特徴がある。例えば、(3−2)に示す検出方法では、幾何学的配置検出部111は、撮像対象物として文字原稿だけでなくイラスト原稿や写真などを検出することが可能であるが、撮像対象物の周辺に模様や物体がある撮像画像(Cannyフィルタによって、撮像対象物と背景のエッジが繋がってしまう撮像画像)に対しては、正確に撮像対象物と背景との境界を示すエッジ画素群を検出することが困難である。また、(3−3)に示す検出方法では、幾何学的配置検出部111は、撮像対象物の周辺に模様や物体がある撮像画像であっても、原稿を検出する事が可能であるが、イラスト原稿や写真のような撮像画像(Cannyフィルタでエッジが途切れてしまう撮像画像)に対しては、撮像対象物と背景との境界を示すエッジ画素群を検出できないことがある。
そこで、上記の(3−2)(3−3)(3−4)の抽出方法によりこのような特徴の差異があることから、一つの撮像画像に対して幾何学的配置検出部111が複数の検出方法を適用してもよい。例えば、一つの撮像画像に対して、(3−2)、(3−3)、(3−4)の順に処理を実行し、最初に撮像対象物と背景との境界となる三辺または四辺を抽出できた処理において生成された抽出結果情報を採用する。
また、撮像対象物と携帯端末装置100とがそれぞれ静止状態であるなら、撮像部101により連続して撮像された撮像画像(プレビュー用のフレーム)にはほとんど差異がない。そのため、幾何学的配置検出部111は、(3−2)(3−3)(3−4)の複数の検出方法から選択した1つを、連続して撮像される撮像画像の各々に対し適用してもよい。
図39は、撮像画像に対して適用する検出方法の決定処理を示すフローチャートである。複数の検出方法には、選択順を示す選択番号が予め付されている。まず、幾何学的配置検出部111は、選択番号が1番目の検出方法を選択し、選択した検出方法を用いて抽出結果情報を生成する(S390)。例えば、(3−2)で示す検出方法を選択する。
次に、幾何学的配置検出部111は、現在の撮像画像(フレーム)に対する抽出結果情報を確認し、撮像対象物と背景との境界の検出に成功したか否かを判断する(S391)。幾何学的配置検出部111は、抽出結果情報が撮像対象物と背景との境界を適切に抽出できなかった旨を示している場合に検出が失敗であると判断し、そうでない場合に検出が成功したと判断すればよい。
検出に成功した場合(S391でYes)、幾何学的配置検出部111は、前回検出成功フラグをオンにする(S392)。その後、S398の処理に移行する。
一方、検出に失敗した場合(S391でNo)、幾何学的配置検出部111は、前回検出成功フラグがオンであるか否かを確認する(S393)。前回検出成功フラグがオンである場合(S393でYes)、幾何学的配置検出部111は、前回検出成功フラグをオフに変更する(S394)。一方、前回検出成功フラグがオフである場合(S393でNo)、幾何学的配置検出部111は、選択番号が次の検出方法が存在するか確認する(S395)。次の検出方法が存在する場合(S395でYes)、当該検出方法を選択し(S396)、次の検出方法が存在しない場合(S395でNo)、1番目の検出方法を選択する(S397)。その後、S398の処理に移行する。
次に、S398において、幾何学的配置検出部111は、撮像画像の表示続行が必要か確認する。例えば、文書撮像モードの終了指示などが入力されていない場合、撮像画像の表示続行が必要であると判断すればよい。
S398でYesの場合、幾何学的配置検出部111は、次の撮像画像(フレーム)に対して、選択した検出方法により検出処理を行う(S399)。その後、S391の処理に戻る。
図40は、図39のフローチャートにより検出方法を決定する例を示す図である。図示されるように、最初の撮像画像(第1フレーム)に対して、幾何学的配置検出部111は、選択番号が1番目の検出方法を用いて抽出結果情報を生成する。なお、前回検出成功フラグは、文書撮像モードを開始したタイミングでオフになるように設定されているものとする。そのため、検出失敗した場合、S396により次の撮像画像(第2フレーム)に対して用いる検出方法として2番目の検出方法が選択される。
そして、幾何学的配置検出部111は、2番目の撮像画像(第2フレーム)に対して2番目の検出方法を用いて抽出結果情報を生成する。ここで、検出成功すると、S392により前回検出成功フラグがオンに設定される。
その後、3番目の撮像画像(第3フレーム)に対して2番目の検出方法を用いて検出成功した場合、検出成功であるため2番目の検出方法が選択されたままとなり、4番目の撮像画像(第4フレーム)に対しても2番目の検出方法を用いて検出処理が実行される。4番目の撮像画像に対して検出失敗したとしても、前回検出成功フラグがオンであるために(S393でYes)、検出方法の変更が行われない。そのため、5番目の撮像画像(第5フレーム)に対しても2番目の検出方法を用いて検出処理が実行される。ただし、検出失敗のため、前回検出成功フラグがオフに切り替えられる。
その後、5番目の撮像画像に対して検出失敗すると、前回検出成功フラグがオフであるために、S396により次の撮像画像(第6フレーム)に対して用いる検出方法として次の検出方法(つまり3番目の検出方法)が選択される。
このように、第1フレームに対して1番目の検出方法による抽出が失敗した場合、次の第2フレームに対して2番目の検出方法による検出処理が実行される。また、第5フレームに対して2番目の検出方法による検出が失敗した場合、次の第6フレームに対して3番目の検出方法による検出処理が実行される。すなわち、処理対象の撮像画像の前の撮像画像に対する検出処理が失敗である場合、当該前の撮像画像に対して用いた検出方法とは異なる検出方法を用いて処理対象の撮像画像について検出処理を行う。これにより、撮像画像のタイプに応じた最適な検出方法を選択することができる。
ただし、図39,40で示されるように、一度検出成功した場合、1回だけ検出失敗したとしても検出方法が変更されず、連続して2回検出失敗した場合に検出方法が変更される。これにより、手ぶれ等の何らかの理由でたまたま検出失敗した場合でも検出方法が変更されることがない。
(3−6)表示処理部の別の処理例
上記の(3−2)のS6では、表示処理部112は、撮像画像ごとに、当該撮像画像から生成された抽出結果情報で示される4つの頂点座標を結ぶ四角形の線を撮像対象物の輪郭線として当該撮像画像に重ねて表示するものとした。
ただし、連続して撮像された撮像画像ごとに撮像対象物の輪郭線を表示した場合、撮像対象物と背景との配置やコントラスト、照明状態、手ぶれなどの要因により、抽出結果情報で示される4つの頂点座標が撮像画像ごとに大きく変わる可能性がある。この場合、輪郭線が大きくちらついてしまうため、表示処理部112は、以下のような処理を行ってもよい。
表示処理部112は、表示用4頂点座標を記憶する機能、および、前回の撮像画像(フレーム)について4つの頂点座標の検出が成功したか否かを示すフレームスキップフラグを設定する機能を有している。なお、文書撮像モードが起動したタイミングでは、表示処理部112は、フレームスキップフラグをオフに設定する。また、文書撮像モードが終了したタイミングで、表示処理部112は、表示用4頂点座標を消去するものとする。そのため、文書撮像モードを起動したときには、表示処理部112は、オフに設定されたフレームスキップフラグを記憶し、表示用4頂点座標を記憶していない。
図13に示すS611において、表示処理部112は、図41に示す輪郭線表示処理を行ってもよい。図41は、本変形例においてS611で行われる輪郭線表示処理例を示すフローチャートである。なお、S611は、4つの頂点座標が全て撮像範囲内である場合(全ての頂点座標のフラグが立っている場合(図13のS610においてYesの場合))に実施される処理である。
まず、表示処理部112は、表示用4頂点座標を記憶しているか否か確認する(S621)。表示用4頂点座標を記憶していない場合(S621でNo)、表示処理部112は、抽出結果情報で示される4つの頂点座標を表示用4頂点座標として決定する(S622)。一方、表示用4頂点座標を記憶している場合(S621でYes)、表示処理部112は、左上、右上、左下、右下の各頂点について、記憶している表示用4頂点座標と抽出結果情報で示される各頂点座標との中点座標を求め、当該4つの中点座標を新たな表示用4頂点座標として決定する(S623)。
その後、表示処理部112は、決定した新たな表示用4頂点座標を記憶(保存)し(S624)、フレームスキップフラグをオンに設定する(S625)。そして、表示処理部112は、S624で記憶した表示用4頂点座標を基づいて、撮像対象物の輪郭線を表示する(S626)。
図41に示す処理によれば、前回のフレームの撮像画像に対して生成された抽出結果情報を基に生成された表示用4頂点座標を記憶しておく。そして、今回のフレームの撮像画像にたいして生成された抽出結果情報で示される4頂点座標と当該表示4頂点座標との中点座標を新たな表示用4頂点座標として更新し、これをもとに輪郭線を表示する。そのため、連続して表示される複数の撮像画像(フレーム)において、何らかの要因により抽出結果情報で示される4つの頂点座標が撮像画像ごとに大きく変わったとしても、輪郭線のちらつきを防止することができる。
また、図13のS612においてNo、S614においてNo、またはS615においてNoの場合(抽出結果情報で示される4頂点座標が画像範囲内にない場合)、表示処理部112は、図42に示す処理を行う。
まず、表示処理部112は、フレームスキップフラグがオンであるか確認する(S631)。フレームスキップフラグがオンである場合(S631でYes)、表示処理部112は、表示用4頂点座標を記憶しているか確認する(S632)。表示用4頂点座標を記憶している場合(S632でYes)、表示処理部112は、表示用4頂点座標をそのまま維持して(S633)、S635に移行する。一方、表示用4頂点座標を記憶していない場合(S632でNo)、S635に移行する。そして、S635において、フレームスキップフラグをオフに設定する。
一方、フレームスキップフラグがオフである場合(S631でNo)、表示処理部112は、記憶している表示用4頂点座標を消去する(S634)。
その後、S636において、表示処理部112は、表示用4頂点座標に基づいて輪郭線を表示させる。ただし、表示用4頂点座標を記憶していない場合には輪郭線を表示しない。そして、図13のS617の処理に戻る。
図43は、図41および図42の処理に従って表示処理部112が動作したときの表示部105の画面例を示す図である。S1からS6の処理は、連続して撮像される各撮像画像(フレーム)に対して実行される。図43は、1フレーム目(第1フレーム)から6フレーム目(第6フレーム)までの撮像画像の表示例を示している。
図43の例では、文書撮像モードを起動した直後の第1フレームに対する抽出結果情報で示される4つの頂点座標が撮像範囲内であるため、図41のS622に従い、当該4つの頂点座標が表示用4頂点座標として記憶される。そのため、当該4つの頂点座標を用いた輪郭線が表示される。
また、第2フレームに対する抽出結果情報で示される4つの頂点座標も撮像範囲内であるため、図41のS623に従い、第1フレームの際に記憶していた表示用4頂点座標と当該4つの頂点座標との中点を新たな表示用4頂点座標として記憶する。そして、当該中点を用いた輪郭線が表示される。
次に、第3フレームに対する抽出結果情報において正常に4つの各頂点座標を抽出できなかったことが示されているとする。この場合、図42の処理を実行することとなる。ここで、第2フレームにおいてフレームスキップフラグがオンに設定されており、表示用4頂点座標が保存されている。そのため、S636により当該表示用4頂点座標に基づき輪郭線が表示される。このとき、フレームスキップフラグがオフに変更される。
このように、連続して表示されている撮像画像の途中の1フレームで4頂点座標の抽出処理に失敗したとしても、画面上には前回のフレームと同じ輪郭線が表示されるため、見た目のちらつきを抑えることができる。
撮像画像は、連続して撮像される画像なので、通常撮像対象物の位置が大きくは変わらない。しかし、照明状態により、あるフレームの撮像画像だけエッジがうまく繋がらず、結果として4頂点座標とも撮像範囲内にないと判断される、あるいは、手振れ等により位置がずれて4頂点座標とも撮像範囲内にないと判断される場合がある。このような場合であっても、一つ前のフレームの撮像画像で表示していた表示用4頂点座標をそのまま表示(1フレームのみの抽出失敗を無視)することで、ちらつきを軽減する事ができる。
次に、第4フレームに対する抽出結果情報で示される4つの頂点座標が撮像範囲内であると、図41のフローに移り、S623により第2フレームの際に記憶していた表示用4頂点座標と当該4つの頂点座標との中点を新たな表示用4頂点座標として記憶する。そして、当該中点を用いた輪郭線が表示される。このとき、フレームスキップフラグがオンに変更される。
次に、第5フレームに対する抽出結果情報において正常に4つの各頂点座標を抽出できなかったことが示されているとする。この場合、第3フレームと同様の表示処理が実行される。
次に、第6フレームに対する抽出結果情報においても正常に4つの各頂点座標を抽出できなかったことが示されているとする。この場合、図42の処理を実行することとなり、第5フレームにおいてフレームスキップフラグがオフに変更されているため、S634により保存されている表示用4頂点座標が消去される。そのため、表示処理部112は、輪郭線の表示を行わない。このように、輪郭線が表示されている状態(第4フレームの段階)から、2フレーム以上連続して4頂点座標の抽出処理に失敗した場合、輪郭線が表示されなくなるため、撮像対象物が認識できないことを把握することができる。
なお、図42および図43に示す例では、1フレームの撮像画像に対する4頂点座標の抽出失敗を無視するようにしているが、カウンタを設けて失敗したフレーム数をカウントし、複数のフレームの抽出失敗を無視するようにしてもよい。
(4)出力対象画像データの画像形成装置への転送について
ユーザは、携帯端末装置100を持って画像形成装置200または画像表示装置300の近くにきて、携帯端末装置100を操作し、赤外線通信のような近距離無線通信方式を用いて出力対象画像データを画像形成装置200または画像表示装置300に送信させる。具体的には、ユーザは、携帯端末装置100の入力部106に、出力対象画像データの送信指示を入力する。
出力対象画像データの送信指示が入力されると、制御部109は、記憶部108に格納された出力対象画像データを特定する。そして、制御部109は、出力対象画像データを画像形成装置200または画像表示装置300に送信する送信処理を、通信部104に実行させる。なお、通信部104は、出力対象画像データと、出力対象画像データに対応付けられているファイルネーム、出力処理情報、ならびに、記憶部108に格納されている機種情報およびユーザ情報とを合わせて送信する。
(5)画像形成装置の構成
次に、本実施形態に係る画像形成装置200の構成について説明する。本実施形態において、画像形成装置200は、スキャナ、プリンタ、複写機等の機能を備えた複合機である。
図20は、画像形成装置200の構成を示すブロック図である。画像形成装置200は、画像読取部201、画像処理部202、認証部203、画像形成部204、表示部205、入力部206、第1通信部207、第2通信部208、記録媒体アクセス部209、記憶部210、および制御部212を備えている。
画像読取部201は、原稿を読み取るものであり、CCD(Charge Coupled Device)を備えたスキャナ部を有し、原稿から反射してきた光を、RGBに色分解された電気信号(アナログの画像信号)に変換し、この電気信号を出力するものである。
画像処理部202は、画像データに対して、所定の画像処理を行うものである。本実施形態では、画像処理部202は、携帯端末装置100または画像表示装置300から受信した出力対象画像データに対して所定の画像処理を行い、補正済画像データを生成する。画像処理部202における画像処理の詳細については後述する。
認証部203は、携帯端末装置100または画像表示装置300から受信した出力対象画像データの出力処理を行う際に、ユーザ認証を行うものである。具体的には、認証部203は、携帯端末装置100から受信したユーザ情報と、入力部206に入力されたユーザ情報(ユーザIDおよびパスワード)とを照合してユーザ認証を行う。認証部203は、認証結果を制御部212に送る。
画像形成部204は、例えば電子写真方式やインクジェット方式を用いて、紙などの記録用紙上に画像を形成するものである。すなわち、画像形成部204は、出力処理の一つとして、補正済画像データで示される画像を記録用紙やOHP用紙などの記録紙に印刷する印刷処理を実行するものである。
表示部205は、例えば液晶ディスプレイ等より構成される。また、入力部206は、例えば液晶ディスプレイのタッチパネルやボタンを押すことなどによりデータの入力を行うためのものである。
第1通信部207は、USB1.1またはUSB2.0の規格に基づく、シリアル転送やパラレル転送、無線データ通信機能を有するものである。第1通信部207は、携帯端末装置100または画像表示装置300から、ファイルネーム、携帯端末装置100の機種情報、ユーザ情報および出力処理情報が付加された出力対象画像データを受信する。
第2通信部208は、(a)無線LANの規格である、IEEE802.11a、IEEE802.11bおよびIEEE802.11gのいずれかに基づく無線技術を利用したデータ通信、(b)イーサネット(登録商標)を利用した通信用インターフェースの機能を有し、LANケーブルを介した、ネットワークとのデータ通信、(c)無線通信規格である、IEEE802.15.1(いわゆるBluetooth(登録商標))やIrSimpleなどの赤外線通信規格、Felica(登録商標)などの通信方式のいずれかに基づく無線技術を利用したデータ通信、の機能を有するものである。
第2通信部208は、出力処理として、画像処理部202により所定の画像処理が施された補正済画像データをサーバに格納するファイリング処理、もしくは、当該所定の画像処理が施された補正済画像データを添付したメールを送信するメール送信処理を実行する。
記録媒体アクセス部209は、プログラムが記録された記録媒体から、プログラムを読み出すものである。記憶部210は、上記各部が処理を実行するためのプログラムを記憶するためのものである。
制御部212は、画像形成装置200の各部の制御を行うものである。具体的には、制御部212は、第1通信部207が携帯端末装置100または画像表示装置300から出力対象画像データを受信すると、当該出力対象画像データを画像処理部202に出力し、画像処理を実行させる。また、制御部212は、出力対象画像データに付けられているユーザ情報を認証部203に出力し、認証部203に認証処理を実行させる。制御部212は、認証部203から認証成功の認証結果を受けると、出力対象画像データに付けられていた出力処理情報に従って処理を実行させる。すなわち、出力処理情報が印刷処理を示している場合、制御部212は、画像処理部202により生成される補正済画像データに基づいた印刷を画像形成部204に実行させる。また、出力処理情報がファイリング処理またはメール送信処理を示している場合、制御部212は、画像処理部202により生成される補正済画像データに基づいたファイリング処理またはメール送信処理を第2通信部208に実行させる。
(6)画像処理部における画像処理について
次に、画像処理部202が実行する画像処理の詳細について説明する。なお、画像処理部202は、画像読取部201が読み取った画像データに対しても画像処理を行うが、ここでは、携帯端末装置100または画像表示装置300から受信した出力対象画像データに対する画像処理の内容について説明する。
図21は、画像処理部202の内部構成を示すブロック図である。図12に示されるように、画像処理部202は、画質調整部221、幾何学補正部(写像生成部)222、レンズ歪み補正部223、高解像度補正部225および出力画像処理部224を備えている。以下、各部の具体的な処理内容を順に説明する。
(6−1)画質調整部
画質調整部221は、出力対象画像データのカラーバランス、コントラストの補正を行うものである。画質調整部221は、受信した出力対象画像データについて、各色チャンネルの最大値・最小値を求め、これらを揃えるようなルックアップテーブルを作成し、各色チャンネルに適用する。具体的には、画質調整部221は、ルックアップテーブルとして、図22に示すように、あるチャンネルの最大値がMX、最小値がMNであり、データが8bitのとき、MNから(MX−MN)/255のステップで増加させていくようなテーブルを作成すればよい。そして、画質調整部221は、作成したテーブルに従って、各画素値を変換する。これにより、カラーバランスが補正される。
また、画質調整部221は、コントラストの補正についても同様の方法で実行する。なお、カラーバランスを特に変える必要がなければ、各色チャンネルに適用するルックアップテーブルを同一のものとすればよい。
なお、カラーバランス・コントラストの補正方法についてはその他の公知の技術を適用してもよい。
(6−2)レンズ歪み補正部
レンズ歪み補正部223は、出力対象画像データについて、レンズ歪みの補正を実行するものである。
レンズ歪み補正部223は、出力対象画像データについて、上記の(3−3)に記載した処理と同様にして、撮像画像における撮像対象物のエッジ画素をラスター走査によって順次検出する。そして、レンズ歪み補正部223は、検出されたエッジ画素を曲線近似し、その曲線の式からレンズひずみ補正を行う。
具体的には、レンズ歪み補正部223は、検出した撮像対象物のエッジ画素を検出し、上記の(3−3)に記載した処理と同様に、各エッジ画素を撮像対象物と背景との境界の4辺に対応する4つのエッジ画素群に分類する。そして、図23の実線で示されるように、各群に属するエッジ点に対して2次曲線近似を行う。このようにして4つの群に対して求めた2次曲線は、撮像対象物の4辺に対応する。また、レンズ歪み補正部223は、4つの2次曲線で囲まれる領域の角部に相当する、4つの2次曲線の交点を求める。次に、レンズ歪み補正部223は、各辺に対して求めた2次曲線に外接し、かつ、4つの交点を結んだ四角形(図23において点線で示される)と相似している外接四角形(図23において1点鎖線で示される)を求める。そして、レンズ歪み補正部223は、このようにして求めた外接四角形が補正後の対象物のエッジ画素の位置となるように、撮像画像における撮像対象物の領域内の画素位置を変換する。この変換は、基準点(例えば撮像対象物の領域の重心点)からのベクトルを基に計算すればよい。これにより、携帯端末装置100の撮像部101によるレンズ歪みを補正することができる。
レンズ歪みの補正の方法としては、上記の方法に限定されるものではなく公知の技術を用いることができる。
(6−3)幾何学補正部
幾何学補正部222は、ポスターや原稿用紙のような矩形状の撮像対象物に対して、文書画像が形成された平面の法線方向とは異なる方向から撮像することによる撮像対象物の歪み(つまり、文書画像が形成された矩形状の平面の歪み)を補正するとともに、画像データにおける撮像対象物の傾きを補正するものである。
具体的には、幾何学補正部222は、幾何学的配置検出部111と同様に、出力対象画像データに基づいて、矩形の撮像対象物と背景との境界となる4つのエッジ画素群に対応する直線の式を求める。そして、幾何学補正部222は、当該4つの直線で囲まれる四角形の領域(補正前領域)を特定し、特定した補正前領域を切り出す。
次に、幾何学補正部222は、図24のように、特定した四角形の補正前領域(図24において一点鎖線で示される)を、上下の2辺が水平方向に略平行であり、所定のアスペクト比および大きさを有する、矩形状の標準領域(例えば、ビジネス文書出用いられているA判B判なら7:10であるなど。図24において実線で示される)に変換するための写像を求める。なお、標準領域の上下の2辺は水平方向と完全に平行でなくても良く、水平方向に対して僅かな所定範囲内の角度を有していても良い(略平行であっても良い)。ここで、写像とは、補正前領域の各画素の座標(x1、y1)から標準領域の対応する画素の座標(x2、y2)への写像変換(座標変換処理)するための規則fx、fyのことであり、x2=fx(x1、y1)、y2=fy(x1、y1)で表される。当該写像変換としては公知の技術を用いることができる。なお、幾何学補正部222は、予め記憶部210に記憶されているアスペクト比に合うように変換してもよいし、入力部206に入力されたアスペクト比に合うように変換してもよい。また、標準領域の大きさとしては、入力部206に入力された大きさが設定されてもよいし、補正前領域と同じ面積となるような大きさが設定されてもよい。
次に、幾何学補正部222は、求めた写像に従って、出力対象画像データから切り出した補正前領域に対して座標変換を行う。これにより、幾何学的歪みおよび傾きの補正(以下、幾何学補正という場合がある)することができる。
幾何学補正の方法としては、上記の方法に限定されるものではなく公知の技術を用いることができる。
(6−4)高解像度補正部
高解像度補正部225は、出力対象画像データに対する高解像度補正を行うものである。本実施形態では、高解像度補正部225は、1つの出力対象画像データに基づいて高解像度補正を行う。
1つの画像データからの高解像度画像作成方法に関しては、映像情報メディア学会誌Vol.62、No.2、pp.181〜189(2008)にいくつかの方法が紹介されている。
一般的には、画像パターンのエッジ方向性を検知し、その向きに合わせた補間を行うとともに、補間によるひずみや入力画像に存在したノイズ成分の影響などの除去を目的としたノイズ除去処理を行うことにより、高解像度補正を実行することができる。以下、具体的に説明する。
図25は、本実施形態における高解像度補正の処理の流れを示すフローチャートである。ここでは、横方向・縦方向の各々について2倍の解像度変換を行う例について説明する。2倍の解像度変換を行う場合、補正対象となる出力対象画像データの画素数をn×mとするとき、補正後の高解像度画像データの画素数は2n×2mとなる。このような高解像度補正(2倍の解像度変換)は、出力対象画像データにおける各画素を基準画素とし、当該基準画素間の中央に新たな画素を補間画素として生成し、当該基準画素と補間画素との両方を備える画像データを高解像度画像データとして生成することにより実行される。図26は、基準画素と補間画素との関係を示すものであり、画素aが基準画素を示し、画素bが補間画素を示している。
まず、高解像度補正部225は、出力対象画像データについて、エッジ抽出を行う。例えば、高解像度補正部225は、図27に示されるような1次微分フィルタを用いてエッジ抽出を行い、2値化処理を行い、2値化画像データを生成する(S40)。なお、2値化画像データにおいて画素値が1であればエッジである可能性が高い画素であることを示している。
次に、高解像度補正部225は、S40で生成した2値化画像データに基づいて、撮像画像データにおける着目画素がエッジであるか否かを判定する(S41)。具体的には、高解像度補正部225は、2値化画像データにおける着目画素に対応する画素の値が1であれば、当該着目画素がエッジであると判定する。
なお、着目画素とは、撮像画像データにおける各画素を任意の順に着目していったときに、着目している画素のことをいう。
着目画素がエッジである場合(S41でYes)、高解像度補正部225は、着目画素を含むN×N(N>1)の部分画像を用いてエッジ方向を検出する(S42)。具体的には、N×Nの部分画像に含まれる全ての基準画素について、エッジ画素であるか否かを判定する。そして、着目画素の左上の基準画素と右下の基準画素とがエッジ画素である場合、高解像度補正部225は、部分画像におけるエッジ方向が左上−右下方向であると判定する。同様に、着目画素の左の基準画素と右の基準画素とがエッジ画素である場合、エッジ方向が左−右方向であると判定し、着目画素の上の基準画素と下の基準画素とがエッジ画素である場合、エッジ方向が上−下方向であると判定し、着目画素の右上の基準画素と左下の基準画素とがエッジ画像である場合、エッジ方向が右上−左下方向であると判定する。
図28において、点線は検出したエッジ方向を示している。なお、図28において、画素(1)〜(9)が基準画素であり、このうちの画素(5)が着目画素である。そして、画素A、B、Cは、それぞれ、基準画素(1)と(5)との間の補間画素、基準画素(2)と(5)との間の補間画素、基準画素(4)と(5)との間の補間画素である。
次に、高解像度補正部225は、S42で検出したエッジ方向に応じて、着目画素の左上の補間画素A、着目画素の上の補間画素B、着目画素の左の補間画素Cの画素値を補間により求める。このとき、エッジ方向に沿った基準画素を用いて補間画素の画素値を求める。
エッジ方向が左上−右下方向である場合、図28(a)に示されるように、基準画素(1)、(5)、(9)がエッジ画素であり、これらの画素を結ぶ線がエッジ線となる。そして、エッジ線上の補間画素Aの画素値VA(図中では「V」の表記を省略している。以下同じ)について、補間画素Aに隣施するエッジ線上の基準画素(1)(画素値V(1))および基準画素(5)(画素値V(5))の画素値を用いて、以下の式
VA=(V(1)+V(5))/2
により求める。
一方、エッジ線上ではない補間画素B,Cについては、エッジ線上の基準画素を除く基準画素のうちの、当該補間画素に最も近い基準画素(最近接基準画素)を含み、エッジ方向に平行な線上の基準画素を用いて補間する。例えば、図28(a)では、補間画素Bについては、最近接基準画素である基準画素(2)を含み、エッジ方向に平行な線は、基準画素(2)と(6)とを結ぶ線である。そして、補間画素Bから当該線に垂直に下した点は、基準画素(2)と(6)とを結ぶ線分を内分する。そのため、補間画素Bの画素値VBは、以下の式
VB=(9×V(2)+4×V(6))/13
を用いて求める。
同様に、補間画素Cの画素値VCは、最近接基準画素である基準画素(4)と、当該基準画素(4)を含みエッジ方向に平行な線上の基準画素(8)との画素値を用いて、以下の式
VC=(9×V(4)+4×V(8))/13
により求める。
また、エッジ方向が左−右方向である場合、図28(b)に示されるように、基準画素(4)、(5)、(6)がエッジ画素であり、これらの画素を結ぶ線がエッジ線となる。そして、エッジ線上の補間画素Cの画素値VCについて、補間画素Cに隣施するエッジ線上の基準画素(4)(画素値V(4))および基準画素(5)(画素値V(5))の画素値を用いて、以下の式
VC=(V(4)+V(5))/2
により求める。
一方、エッジ線上ではない補間画素A、Bについては、エッジ線上の基準画素を除く基準画素のうちの、当該補間画素に最も近い基準画素(最近接基準画素)を含み、エッジ方向に平行な線上の基準画素を用いて補間する。例えば、図28(b)では、補間画素Aについては、最近接基準画素である基準画素(1)または(2)を含み、エッジ方向に平行な線は、基準画素(1)と(2)とを結ぶ線である。そして、補間画素Aから当該線に垂直に下した点は、基準画素(1)と(2)との中央に存在する。そのため、補間画素Aの画素値VAは、以下の式
VA=(V(1)+V(2))/2
を用いて求める。
補間画素Bについては、最近接基準画素である基準画素(2)を含み、エッジ方向に平行な線は、基準画素(1)と(2)と(3)とを結ぶ線である。そして、補間画素Bから当該線に垂直に下した点は、基準画素(2)と一致する。そのため、補間画素Bの画素値VBは、基準画素(2)の画素値V(2)と同じ値にする。
また、エッジ方向が右上−左下方向である場合、図28(c)に示されるように、基準画素(3)、(5)、(7)がエッジ画素であり、これらの画素を結ぶ線がエッジ線となる。そして、補間画素A,B,Cは全てエッジ線上に存在しない。
補間画素Aについては、最近接基準画素が基準画素(1)、(2)、(4)となる。ここで、基準画素(2)、(4)は、エッジ方向に平行な同一の線上に位置するが、基準画素(1)は当該線上に位置しない。そこで、補間画素Aの画素値VAについて、最近接基準画素である基準画素(1)、(2)、(4)の画素値を用いて、以下の式
VA=(V(1)+V(2)+V(4))/3
により求める。
一方、補間画素B,Cについては、エッジ線上の基準画素を除く基準画素のうちの、当該補間画素に最も近い基準画素(最近接基準画素)を含み、エッジ方向に平行な線上の基準画素を用いて補間する。例えば、図28(c)では、補間画素Bについては、最近接基準画素である基準画素(2)を含み、エッジ方向に平行な線は、基準画素(2)と(4)とを結ぶ線である。そして、補間画素Bから当該線に垂直に下した点は、基準画素(2)と(4)とを結ぶ線分を内分する。そのため、補間画素Bの画素値VBは、以下の式
VB=(9×V(2)+4×V(4))/13
を用いて求める。
同様に、補間画素Cの画素値VCは、最近接基準画素である基準画素(4)と、当該基準画素(4)を含みエッジ方向に平行な線上の基準画素(2)との画素値を用いて、以下の式
VC=(4×V(2)+9×V(4))/13
により求める。
また、エッジ方向が上−下方向である場合、図28(d)に示されるように、基準画素(2)、(5)、(8)がエッジ画素であり、これらの画素を結ぶ線がエッジ線となる。そして、エッジ線上の補間画素Bの画素値VBについて、補間画素Bに隣施するエッジ線上の基準画素(2)および基準画素(5)の画素値を用いて、以下の式
VC=(V(2)+V(5))/2
により求める。
一方、エッジ線上ではない補間画素A、Cについては、エッジ線上の基準画素を除く基準画素のうちの、当該補間画素に最も近い基準画素(最近接基準画素)を含み、エッジ方向に平行な線上の基準画素を用いて補間する。例えば、図28(d)では、補間画素Aについては、最近接基準画素である基準画素(1)または(4)を含み、エッジ方向に平行な線は、基準画素(1)と(4)とを結ぶ線である。そして、補間画素Aから当該線に垂直に下した点は、基準画素(1)と(4)との中央に存在する。そのため、補間画素Aの画素値VAは、以下の式
VA=(V(1)+V(4))/2
を用いて求める。
補間画素Cについては、最近接基準画素である基準画素(4)を含み、エッジ方向に平行な線は、基準画素(1)と(4)と(7)とを結ぶ線である。そして、補間画素Cから当該線に垂直に下した点は、基準画素(4)と一致する。そのため、補間画素Cの画素値VCは、基準画素(4)の画素値V(4)と同じ値にする。
なお、記憶部210は、エッジ方向と、補間画素A,B,Cの画素値を求めるための演算式とを対応付けた情報を予め記憶している。そして、高解像度補正部225は、S42で検出されたエッジ方向に対応する演算式を記憶部210から読み出し、読み出した演算式に基づいて、補間画素A,B,Cの画素値を求めればよい。
なお、図28では、エッジ方向が直線状である場合のみ示している。しかしながら、エッジは、N×Nの部分画像内において曲がる場合もある。例えば、エッジが基準画素(2)−(5)−(4)のように曲がる場合や、エッジが基準画素(1)−(5)−(7)のように曲がる場合などである。このような場合についても、補間画素A,B,Cの画素値を求めるための演算式とを対応付けた情報を予め記憶している。例えば、エッジが基準画素(2)−(5)−(4)のように曲がる場合、補間画素Aについては図28(c)と同様に、補間画素Bについては図28(b)と同様に、補間画素Cについては図28(d)と同様の演算式を記憶している。また、エッジが基準画素(1)−(5)−(7)のように曲がる場合、補間画素Aについては図28(a)と同様に、補間画素Bについては図28(a)と同様に、補間画素Cについては図28(d)と同様の演算式を記憶している。他のエッジ方向のパターンについても同様に記憶している。
このようにして、高解像度補正部225は、エッジ画素と判定された基準画素の周囲に位置する補間画素の画素値を求める。
一方、着目画素がエッジでない場合(S41でNo)、高解像度補正部225は、当該着目画素の左上に隣接する補間画素A,当該着目画素の上に隣接する補間画素B,当該着目画素の左の補間画素Cの画素値を、一般的な補間演算法(バイリニア・バイキュービックなど)により求める(S43)。
高解像度補正部225は、上記のS41〜S43の処理を、一つの画像データに含まれる全ての基準画素について実行することで、基準画素と補間画素との両方を備える補間画像データを生成する(S44)。
その後、高解像度補正部225は、生成した補間画像データに対して高画質化処理を行う。例えば、高解像度補正部225は、ノイズ除去フィルタや鮮鋭化フィルタなどを補間画像データに適用して、高解像度画像データを生成する。従来からあるアンシャープマスクや図27の中央の係数を5としたものが鮮鋭化フィルタとなる。またノイズ除去としてはメディアンフィルタなどが広く知られている。より高度な手法として、上記エッジ保存性と高画質化を併せ持つ手法としてBilateralフィルタ[Proceedings of the 1998 IEEE International Conference on Computer Vision,]などを用いてもよい。
なお、高解像度補正部225は、上述した方法に限定されず、映像情報メディア学会誌Vol.62、No.2、pp.181〜189(2008) に記載されているような種々の方法を用いて、1つの撮像画像データから高解像度画像データを生成してもよい。
(6−5)出力画像処理部
出力画像処理部224は、出力対象画像データを出力する際の領域分離処理、色補正、黒生成下色除去処理、空間フィルタ処理、中間調処理を実行するものである。なお、これらの処理としては公知の技術を用いることができる。
(7)画像形成装置の処理の流れ
以下、本実施形態に係る画像形成装置200の処理の流れについて説明する。図29は画像形成装置200の処理フローを示している。
画像形成装置200の第1通信部207は、携帯端末装置100から、出力対象画像データ、機種情報、ユーザ情報および出力処理情報を受信する(S30)。
画像処理部202の画質調整部221は、受信した出力対象画像データについて、例えば上記(6−1)に説明したとおり、カラーバランス、コントラストの補正を行う(S31)。続いて、レンズ歪み補正部223は、受信した出力対象画像データに対して、上記(6−2)に説明したようにレンズ歪みの補正を行う。
さらに、幾何学補正部222は、出力対象画像データに対して、幾何学的歪みの補正および傾きの補正を行う(S32)。具体的には、幾何学補正部222は、撮像対象物と背景との境界に対応する四辺の各々に対応する直線で囲まれる四角形の領域(補正前領域)を特定して切り出す。次に、幾何学補正部222は、切り出した四角形の補正前領域を、上下の2辺が水平方向に略平行であり、所定のアスペクト比および大きさを有する、矩形状の標準領域に変換するための座標に関する写像を求める。そして、幾何学補正部222は、当該写像を用いて、切り出した補正前領域の画像データに対して写像変換処理を行う。これにより、幾何学的歪みのない画像を出力することができる。
次に、高解像度補正部225は、S32の処理がされた画像データに対して高解像度補正を行う(S33)。なお、高解像度補正の具体的な方法は(6−4)で説明したとおりである。
次に、出力画像処理部224は、高解像度補正部225における高解像度補正により得られた高解像度画像データに対して、領域分離処理、色補正、黒生成下色除去処理、空間フィルタ処理、中間調処理等の各種の画像処理を実行する。なお、出力画像処理部224は、出力処理情報で示される出力方法の種別に応じて、当該各種の画像処理の内容を適宜切り換える。そして、出力画像処理部224は、補正済みの画像データ(補正済画像データ)を記憶部210に格納する(S34)。なお、このとき、出力画像処理部224は、補正済画像データの元となる出力対象画像データとともに受信したユーザ情報および出力処理情報と対応付けて当該補正済画像データを格納する。
その後、制御部212は、出力対象画像データの出力指示が入力部206に入力されたか否かを判定する(S35)。出力指示の入力がない場合(S35でNO)、出力指示が入力されるまで待機する。
一方、出力指示がある場合(S35でYES)、認証部203は、ユーザ情報(例えばユーザIDおよびパスワード)の入力を促す画面を表示部205に表示させ、ユーザ情報を入力部206から取得する。そして、認証部203は、ユーザ認証を行う(S36)。なお、認証部203は、画像形成装置200に設けられた非接触ICカードのリーダ/ライターを用いて、ユーザが所持する非接触ICカードからユーザ情報を取得してもよい。
ユーザ認証を行う際、認証部203は、入力されたユーザ情報と携帯端末装置100から受信したユーザ情報とを対照して、一致するユーザ情報が存在するか否か判定する(S37)。そして、入力されたユーザ情報と一致するユーザ情報を携帯端末装置100から受信している場合(S37でYES)、制御部212は、S34において記憶部210に格納され、当該ユーザ情報に対応する補正済画像データの出力処理を、携帯端末装置100から受信した出力処理情報に従って実行させる(S38)。
例えば、出力処理情報が印刷処理を示している場合、制御部212は、補正済画像データで示される画像の印刷を画像形成部204に実行させる。また、出力処理情報がファイリング処理またはメール送信処理を示している場合、制御部212は、補正済画像データに基づいたファイリング処理またはメール送信処理を第2通信部208に実行させる。その後、処理を終了する。
一方、入力されたユーザ情報が、携帯端末装置100から受信したユーザ情報と一致していない場合(S37でNO)、認証部203は、認証回数が所定回数以上であるか判定する(S39)。そして、認証回数が所定回数以上でない場合(S39でNO)、S36,S37の処理を繰り返して行う。認証回数が所定回数以上である場合(S39でYES)、出力せずにフローを終了する。
(8)変形例
本発明の撮像画像処理システムは、上記の実施形態に限定されることがなく、様々な変更が可能である。以下、変形形態の具体例について説明する。
(8−1)第1欠落情報の表示について
上記の説明では、表示処理部112は、撮像範囲外の頂点座標を基に、撮像範囲の中から当該頂点座標に最も近い点を特定し、特定した点が予め定められた範囲内に第1欠落情報を表示するものとした。これに限らず、表示処理部112は、撮像範囲外の頂点を付近に第1欠落情報を表示すればよい。
例えば、図30に示されるように、幾何学的配置検出部111により検出された4つの直線により囲まれる四角形の頂点のうち、撮像範囲外である頂点を第1頂点T1、第1頂点T1と隣り合う2つの頂点を第2頂点T2および第3頂点T3、第1頂点T1と対角の位置にある頂点を第4頂点T4とする。また、第1頂点T1と第2頂点T2とを結ぶ線と撮像範囲の枠との交点を第1交点S1、第1頂点T1と第3頂点T3とを結ぶ線と撮像範囲の枠との交点を第2交点S2とする。このとき、表示処理部112は、第1交点S1と第2交点S2とを結ぶ線分から予め定められた範囲内に第1欠落情報を表示させてもよい。
(8−2)第2欠落情報の表示について
上記の説明では、表示処理部112は、抽出結果情報の中の抽出不可情報で示される辺に対応する撮像範囲の枠の辺から予め定められた範囲内に第2欠落情報を表示するものとした。これに限らず、表示処理部112は、撮像範囲外の辺の付近に第2欠落情報を表示すればよい。
例えば、図31に示されるように、幾何学的配置検出部111により検出された3つのエッジ画素群で示される3つの線分の各々に対応する直線を第1直線L1、第2直線L2、第3直線L3とし、第1直線L1と第2直線L2との交点である第1交点T5と、第2直線L2と第3直線L3との交点である第2交点T6とが撮像範囲内であるとし、さらに、第1直線L1と撮像範囲の枠との交点のうち上記第1交点T5から遠い方の交点を第3交点S3、第3直線L3と撮像範囲の枠との交点のうち上記第2交点T6から遠い方の交点を第4交点S4する。このとき、表示処理部112は、第3交点S3と第4交点S4T8とを結ぶ線分から予め定められた範囲内に第2欠落情報を表示させてもよい。
(8−3)出力対象画像データの送信について
(8−3−1)その1
上記の説明では、撮像部101により撮像された画像全体を示す画像データを出力対象画像データとした。このとき、通信部104は、出力対象画像データとともに、幾何学的配置検出部111により検出された4つのエッジ画素群の各々に対応する直線の式を送信してもよい。
この場合、画像形成装置の幾何学補正部は、出力対象画像データに付加された4つの直線の式を用いて、出力対象画像データの中から当該直線で囲まれる領域を切り出す。そして、幾何学補正部は、切り出した画像を、上下の2辺が水平方向に略平行であり、予め定められたアスペクト比および大きさを有する、矩形状の標準領域(例えば、ビジネス文書出用いられているA判B判なら7:10であるなど。図15において実線で示される)に変換するための写像を求める。そして、幾何学補正部は、切り出した画像に対して、求めた写像に従って幾何学補正を行えばよい。
もしくは、通信部104は、出力対象画像データとともに、幾何学的配置検出部111により検出された4つのエッジ画素群の各々に対応する直線で囲まれる四角形の4つの頂点座標を送信してもよい。
この場合でも、画像形成装置200の幾何学補正部222は、出力対象画像データに付加された4つの頂点座標の点を頂点とする四角形の領域を出力対象画像データの中から切り出す。そして、幾何学補正部は、切り出した画像を矩形状の標準領域に変換するための写像を求める。そして、幾何学補正部は、求めた写像に従って幾何学補正を行えばよい。
また、幾何学的配置検出部111により検出された4つのエッジ画素群の各々に対応する直線で囲まれる四角形が矩形である場合には、通信部104は、出力対象画像データとともに、当該四角形の下辺と撮像範囲の枠の下辺とのなす角度(傾き)を送信してもよい。
この場合、画像形成装置の幾何学補正部は、出力対象画像データに付加された4つの頂点座標の点を頂点とする四角形の領域を出力対象画像データの中から切り出す。そして、幾何学補正部は、出力対象画像データに付加された角度だけ切り出した画像を回転させることにより、傾きを補正することができる。
(8−3−2)その2
また、出力対象画像決定部113は、撮像部101により撮像された画像全体の中から、幾何学的配置検出部111により検出された4つのエッジ画素群の各々に対応する直線で囲まれる四角形の領域を切り出し、切り出した画像を示す画像データを出力対象画像データとしてもよい。そして、通信部104は、決定された出力対象画像データを画像形成装置に送信する。
この場合、画像形成装置の幾何学補正部は、出力対象画像データで示される画像を、上下の2辺が水平方向に略平行であり、予め定められたアスペクト比および大きさを有する、矩形状の標準領域(例えば、ビジネス文書出用いられているA判B判なら7:10であるなど。図15において実線で示される)に変換するための写像を求める。そして、幾何学補正部は、求めた写像に従って幾何学補正を行えばよい。
(8−3−3)その3
上記(8−3−2)で記載したように、出力対象画像決定部113は、撮像部101により撮像された画像全体の中から、幾何学的配置検出部111により検出された4つのエッジ画素群の各々に対応する直線で囲まれる四角形の領域を切り出し、切り出した画像を示す画像データを出力対象画像データとする。
そして、通信部104は、決定された出力対象画像データとともに、幾何学的配置検出部111により検出された4つのエッジ画素群の各々に対応する直線の式を送信してもよい。
この場合、画像形成装置の幾何学補正部は、出力対象画像データに付加された4つの直線の式を用いて、当該直線で囲まれる領域を矩形状の標準領域に変換するための写像を求める。そして、幾何学補正部は、出力対象画像データに対して、求めた写像に従って幾何学補正を行えばよい。
もしくは、通信部104は、決定された出力対象画像データとともに、幾何学的配置検出部111により検出された4つのエッジ画素群の各々に対応する直線で囲まれる四角形の4つの頂点座標を送信してもよい。
この場合でも、画像形成装置の幾何学補正部は、出力対象画像データに付加された4つの頂点座標の点を頂点とする四角形の領域を矩形状の標準領域に変換するための写像を求める。そして、幾何学補正部は、出力対象画像データに対して、求めた写像に従って幾何学補正を行えばよい。
また、幾何学的配置検出部111により検出された4つのエッジ画素群の各々に対応する直線で囲まれる四角形が矩形である場合には、通信部104は、出力対象画像データとともに、当該四角形の下辺と撮像範囲の枠の下辺とのなす角度(傾き)を送信してもよい。
この場合、画像形成装置の幾何学補正部は、出力対象画像データに対して、出力対象画像データに付加された角度だけ回転させることにより、傾きを補正することができる。
(8−4)出力対象画像決定部の決定方法について
上記の説明では、出力対象画像決定部113は、表示処理部112により撮像対象物が撮像範囲内に収まっていることを示す情報(例えば「OK」)が表示されているときにシャッタボタン(図14の符号10)が操作されたタイミングで、表示部105に表示されている撮像画像を示す画像データを出力対象画像データと決定した。
しかしながら、出力対象画像決定部113は、シャッタボタン10の操作ではなく自動的に出力対象画像データを決定するオートシャッタ機能を有していてもよい。
すなわち、オートシャッタ機能が有効である場合、出力対象画像決定部113は、撮像部101により連続して撮像された所定数の撮像画像(コマ画像)に対して、表示処理部112により撮像対象物が撮像範囲内に収まっていることを示す情報を表示している場合に、当該所定数の撮像画像の1つ(例えば、最後に撮像された撮像画像)を示す画像データを出力対象画像データとして決定する。
より具体的には、出力対象画像決定部113は、撮像部101により連続して撮像された所定数(例えば30)の撮像画像(コマ画像)に対して、幾何学的配置検出部111から出力された抽出結果情報で示される4つの頂点座標(仮頂点座標を除く)を記憶する。そして、各頂点について、所定数の撮像画像から得られた頂点座標の差の二乗が、予め定められた閾値未満である場合に、出力対象画像決定部113は、表示部105に表示されている撮像画像を示す画像データを出力対象画像データと決定すればよい。
ここで、予め定められた閾値は、例えば、
(撮像範囲の高さYmax×1/16)2+(撮像範囲の幅Xmax×1/16)2
が設定される。
これにより、ユーザがシャッタボタンを操作しなくても出力対象画像データを決定できるので、シャッタボタンを操作することによる撮像対象物のブレや撮像対象物が撮像範囲からはみ出すことを防止できる。
なお、ユーザは、オートシャッタ機能の有効/無効を切り換えることができる。この切換は、図14に示す条件設定ボタン50を操作することにより設定される。なお、オートシャッタ機能が有効であり、オートシャッタ機能により出力対象画像データを決定したとき、出力対象画像決定部113は、図32に示されるように、その旨を示す第3アイコンDを表示部105に表示させる。
(8−5)輪郭線の表示機能のオン/オフ切替
図44は、撮像範囲判定部の変形例を示すブロック図である。図44に示されるように、本変形例に係る撮像範囲判定部110aは、切替部114を備えている点で上記撮像範囲判定部110と異なる。
切替部114は、ユーザ入力に従って、幾何学的配置検出部111および表示処理部112による輪郭線の表示機能(ドキュメント補正モード)のオン/オフを切り替えるものである。
切替部114は、図45に示されるように、ドキュメント補正モードのオン/オフ切り替え用のチェックボックス451を表示部105に表示させる。ドキュメント補正モードをオンに切り替える指示が入力された場合、切替部114は、幾何学的配置検出部111および表示処理部112を動作させ、図4のS1〜S6の処理を実行させる。これにより、撮像対象物の輪郭線が撮像画像に重ねて表示され、撮像対象物が撮像範囲内に収まっているか否かを容易に確認することができる。
一方、ドキュメント補正モードをオフに切り替える指示が入力された場合、切替部114は、幾何学的配置検出部111および表示処理部112を動作させず、撮像画像のみを表示させる。
なお、切替部114は、ドキュメント補正モードのオン/オフの切り替え指示を、撮像開始前に受け付けてもよいし、撮像中に受け付けてもよい。
また、本変形例と(8−4)で記載した変形例とを組合せてもよい。この場合、ドキュメント補正モードがオンに設定されている場合にのみ、オートシャッタ機能を有効に設定することができる。すなわち、図45に示す例では、ユーザは、ドキュメント補正モード用のチェックボックス451にチェックが入力されている場合(ドキュメント補正モードがオンの場合)に限り、オートシャッタ機能用のチェックボックス452にチェックを入力することができる。
(8−6)編集ビュー機能について
携帯端末装置100の表示処理部112は、出力対象画像決定部113により決定された出力対象画像データについて、輪郭線に基づいて、幾何学補正および高画質化補正の画像補正処理を行った後の画像(補正処理後画像)をプレビュー表示させる機能(補正画像プレビュー機能)を有していてもよい。
本変形例では、表示処理部112は、上述した画質調整部221、幾何学補正部222および高解像度補正部225の機能を有している。そして、表示処理部112は、補正画像プレビュー機能の実行指示を受けると、指定された出力対象画像データを読み出す。表示処理部112は、当該出力対象画像データで示される撮像画像に対してS1〜S5の処理(図4)を幾何学的配置検出部111に実行させる。表示処理部112は、S5で算出された4つの頂点座標を結ぶ輪郭線で囲まれた領域の画像に対して、画質調整、幾何学補正および高解像度補正を行うことで補正処理後画像を生成し、表示部105にプレビュー表示させる。
図46は、補正処理後画像が表示された画面例を示す。図46に示されるように、表示処理部112は、出力対象画像データで示される撮像画像に輪郭線を重ねて領域Aに表示し、補正処理後画像を領域Bに表示させる。
なお、表示処理部112は、シャッタボタンが押下される前の状態でも補正処理後画像を表示してもよい。
また、表示処理部112は、画質調整および幾何学補正のみを行い補正処理後画像を生成してもよい。
さらに、表示処理部112は、幾何学的配置検出部111により算出された4つの頂点座標を編集する指示を受け付け、編集後の4つの頂点座標を結ぶ輪郭線で囲まれる領域の画像を基に補正処理後画像を生成してもよい。例えば、図46に示されるように、表示処理部112は、領域Aにおいて4つの頂点の各々に対応する編集アイコン461〜464を表示させる。そして、表示処理部112は、各編集アイコン461〜464の位置変更指示の入力を受け付け、変更後の各編集アイコン461〜464の位置に応じて4つの頂点座標を編集し、輪郭線の位置を決定すればよい。
この場合、通信部104は、(8−3−1)で記載したのと同様に、出力対象画像データとともに、編集後の4つの頂点座標を送信する。これにより、ユーザは、所望の輪郭線で囲まれる領域を画像形成装置200から出力させることができる。
また、表示処理部112は、図46に示されるように、領域Bに補正処理後画像を表示させるか否かを切り替えるためのチェックボックス465を表示部105に表示させてもよい。そして、表示処理部112は、チェックボックス465への入力に応じて、領域Bへの補正処理後画像の表示の有無を切り替える。
さらに、表示処理部112は、図46に示されるように、画質補正の度合いを変更するバー466を表示部105に表示させてもよい。そして、表示処理部112は、バー466への入力に応じて、画質調整(コントラスト補正)の度合いを変更する。例えば、バー466により、画質調整として「なし」「弱」「中」「強」の4段階の何れかに変更することができる。
さらに、表示処理部112は、図46に示されるように、登録ボタン467を表示部105に表示させてもよい。登録ボタン467が押下されると、押下されたタイミングで設定していた出力対象画像データ、4つの頂点座標および画質調整レベルが互いに対応付けて記憶部108に格納する。そして、通信部104は、出力対象画像データを画像形成装置200に送信する際に、当該出力対象画像データに対応付けられている4つの頂点座標および画質調整レベルも合わせて送信する。この場合、画像形成装置200の幾何学補正部222は、出力対象画像データに付加された4つの頂点座標の点を頂点とする四角形の領域を出力対象画像データの中から切り出し、切り出した画像を矩形状の標準領域幾何学補正を行えばよい。また、画像形成装置200の画質調整部221は、出力対象画像データに付加された画質調整レベルに応じて画質調整を行えばよい。これにより、ユーザは、携帯端末装置100の表示部105の画面を見ながら、画像形成装置200から出力される画像の領域や画質を設定することができる。
なお、本変形例と(8−5)で記載した変形例とを組合せてもよい。この場合、ドキュメント補正モードがオンに設定されている場合に、補正画像プレビュー機能が自動的にオンとなる。つまり、図45においてシャッタボタン453の押下またはオートシャッタ機能により出力対象画像データが決定されると、表示処理部112は、自動的に補正画像プレビュー機能の実行指示が入力されたものと認識する。そして、表示処理部112は、補正画像プレビュー機能を実行し、図46のような画面を表示部105に表示してもよい。
(8−7)画像表示装置について
画像表示装置300は、画像形成装置200が備える画像処理部202を備えていても良い。そして、画像表示装置300は、出力対象画像データに対して、幾何学補正や高解像度補正を行った補正済画像データで示される画像を表示させる表示処理を出力処理として行ってもよい。
(8−8)携帯端末装置について
撮像対象物の撮像条件が悪い場合、画像形成装置において画像処理を行ったとしても、画像を確認しにくいことがある。例えば、幾何学的歪みが比較的大きい状態で撮像した場合、幾何学補正を行っても視認しにくい。
そこで、携帯端末装置100において、出力対象画像データが、画像形成装置における画像処理が効果を生じさせる条件で撮像されたか否かを判定し、その判定結果に応じて再撮像をユーザに促してもよい。
図33は、本変形例に係る携帯端末装置100の構成を示すブロック図である。図33に示されるように、本変形例に係る携帯端末装置100は、出力画像判定部111を備える点で図2に示す携帯端末装置と相違する。
出力画像判定部114は、文書撮像モードが選択されている際に、撮像範囲判定部110により決定された出力対象画像データが、画像形成装置における画像処理が効果を生じさせる条件で撮像されたか否かを判定するものである。出力画像判定部114における判定項目としては、以下のものが挙げられる。
(8−8−1)傾きの判定
出力画像判定部114は、出力対象画像データの中から撮像対象物と背景とのエッジ上の2点を選択する。例えば、図34に示されるように、サブ撮像画像データの中心から左右それぞれ横方向にw/2だけ離れた2点11・12を選択する。次に、選択された2点11・12の各々と、撮像画像データの端辺との距離d1,d2を求め、撮像画像における撮像対象物の傾きを求めることができる。図34のような場合、傾き角度をθとすると、 tanθ=(d2−d1)/wとなる。そこで、出力画像判定部114は、(d2−d1)/wの値を算出し、この値に相当する角度θをあらかじめ作成済みのテーブル(図35参照)などから読み取る。
そして、出力画像判定部114は、検出した角度θが所定範囲内(例えば、−30°〜+30°)であるか否かを判定し、その判定結果を制御部109に出力する。ここで、角度θが所定範囲内であることが処理実行条件の一つとなる。
(8−8−2)幾何学的歪みの判定
出力画像判定部114は、幾何学的配置検出部111により検出された4つのエッジ画素群に対応する直線で囲まれる四角形を特定する。そして、出力画像判定部114は、特定した四角形の対辺の長さの比を計算する。なお、対辺は2組あるので、出力画像判定部114は、当該2組の各々について長さの比を求める。
ここで、対辺の長さの比は、矩形状の撮像対象物を正面から撮像した場合には撮像画像の中の撮像対象物も矩形状であるため、1となる。一方、斜め方向から撮像した場合には、撮像画像の中の撮像対象物の形状は歪んだ四角形となるため、1とは異なる値となる。そして、撮像方向と、撮像対象物の文書画像が形成された平面の法線方向とのなす角度が大きくなるほど、当該比の値と1との差が大きくなる。そのため、対辺の長さの比は、幾何学的歪みの度合いを示す特徴量の一つであるといえる。
その後、出力画像判定部114は、求めた二つの比の両方が所定範囲内(例えば、0.5〜2)であるか否かを判定し、その判定結果を制御部109に出力する。ここで、所定範囲は、画像形成装置200において補正可能な範囲として予め定められたものであり、記憶部108に格納されている。
なお、出力画像判定部114は、幾何学的歪みの度合いを示す別の特徴量として、上記のようにして検出された4つの交点を含む2つの直線のなす角度などを用いてもよい。
(8−8−3)その他
出力画像判定部114は、上記の判定項目に加えて、例えば、明るさ、コントラスト、カラーバランス、ブレ(激しい手ぶれ)などを判定してもよい。
明るさについては、例えば露出オーバー(明るすぎる)やアンダー(暗すぎる)の場合に再度の撮像が必要となるケースが考えられる。そこで、出力画像判定部114は、例えば、出力対象画像データの画素値のうち、最大のものと最小のものを求め、最大値がある閾値(例えば8ビットで100など)以下であれば、露出アンダーとし、最小値がある閾値(例えば8ビットで150など)以上であれば、露出オーバーとする判定結果を制御部109に出力する。
コントラストについては、出力画像判定部114は、出力対象画像データの画素値のうちの最大・最小の差分値が所定閾値以下の場合、コントラスト不足と判定する。
なお、明るさ・コントラストの判定において、出力画像判定部114は、各色チャンネルに対して判定を行っても良いし、平均値(R+G+B/3)や明度値(0.299×R+0.587×G+0.114×B:NTSC準拠)を用いても良い。
カラーバランスについては、各色チャンネル(RGB)の平均値や最大・最小値の比較を行うことで、ある一つのチャンネルに過度の偏りが発生していることを把握できる。そこで、出力画像判定部114は、例えば、出力対象画像データ中の最大明度値付近の値(最大明度〜最大明度−5程度)を持つ画素値の各色チャンネルの値の平均値(Ra,Ga,Ba)を求め、その各色チャンネルの最大値と最小値の差分が値に応じた一定値以上[Max(Ra,Ga,Ba)−Min(Ra,Ga,Ba)>0.1×Max(Ra,Ga,Ba)]である場合に、カラーバランス不良であると判定する。
ブレ(激しい手ぶれ:いわゆるモーションブラー)については、発生時にエッジの先鋭性が低下することから、出力画像判定部114は、図27に挙げたようなエッジ抽出フィルタを用いて、エッジ強度画像を作成してヒストグラムを取り、その標準偏差値(前記分散の二乗根)を求める。そして、当該標準偏差値が所定閾値(例えば5)以下の場合、ブレが発生していると判定する。
(8−8−4)ユーザへの通知に関して
出力画像判定部114から判定結果を受けた制御部109は、その判定結果に応じて、再撮像を促すメッセージを表示部105に表示させる。
例えば、出力画像判定部114から傾き角度θが所定範囲内でない旨の判定結果を受けた場合、制御部109は、撮像対象物が傾かないようにして再度撮像することを促すメッセージを表示部105に表示させる。
また、幾何学的歪みの度合いを示す特徴量(ここでは、撮像画像における撮像対象物の対辺の長さの比)が所定範囲内でない旨の判定結果を受けた場合、制御部109は、撮像対象物における文書画像が形成された平面の法線方向から再度撮像することを促すメッセージを表示部105に表示させる。
(8−9)高解像度補正について
上記の説明では、高解像度補正部225は、1つの出力対象画像データを用いて高解像度補正を行うものとした。しかしながら、高解像度補正部は、複数の出力対象画像データを用いて高解像度補正を行ってもよい。この高解像度補正の手法としては、映像情報メディア学会誌Vol.62、No.3、pp.337〜342(2008) に記載されている方法を用いることができる。
この場合、出力対象画像決定部113は、指定されたタイミングにおいて、所定回数(例えば、2〜15)だけ連続して撮像することにより得られた所定数の出力対象画像データをデータセットとして記憶部108に格納する。通常、連続して撮像された画像は、ほぼ同じ画像であるが、手ぶれ等によって微少量だけずれることになる。
また、複数の出力対象画像データを用いて高解像度補正を実行するためには、解像度変換の倍率に応じた所定数の画像データが、所定量だけずれている必要がある。そこで、本変形例では、図33に示す携帯端末装置100の出力画像判定部114は、データセットに含まれる出力対象画像データの中に、画像形成装置200で高解像度補正を実行するために必要な、所定量だけずれた所定数のサブ撮像画像データが含まれるか否かを判定する。
(8−9−1)複数枚の画像のズレ量の判定
文字の判読性を上げるような高解像度補正のために必要なズレとは、対象とする画像データの一画素未満(小数点)のズレを指す。すなわち、小数点以下(1画素未満)の値、例えば、0.3〜0.7などのズレが重要である。整数部分のズレは高解像度補正には考慮されない。例えば、1.3画素、2.3画素などの1画素未満のズレを含むような場合、複数の画像に基づいた高解像度補正を実行することができるが、1画素、2画素などの1画素未満のズレを含まない場合、高解像度補正を実行することができない。
例えば、変換倍率が2倍の場合、高解像度補正に必要な画像データの数は2であり、2つの画像データのずれ量としては画素単位で小数点以下0.3〜0.7であることが好ましい。そのため、記憶部108には、解像度変換の倍率「2倍」と、撮像回数「2」および処理実行条件「必要画像データ数:2、ずれ量:0.3〜0.7」とを対応付けた情報が予め格納されている。
また、変換倍率が4倍である場合、高解像度補正に必要な画像データの数は4であり、その内の一つの画像データを基準画像データとしたとき、当該基準画像データと残りの3つの画像データとのずれ量がそれぞれ画素単位で小数点以下0.2〜0.3、0.4〜0.6、0.7〜0.8であることが好ましい。そのため、記憶部108は、解像度変換の倍率「4倍」と、撮像回数「4」および処理実行条件「必要画像データ数:4、ずれ量:0.2〜0.3、0.4〜0.6、0.7〜0.8」とを対応付けた情報を記憶している。
制御部109は、解像度変換の倍率の選択入力をユーザに促し、入力された倍率に応じた処理実行条件を設定する。そして、出力画像判定部114は、データセットの中に、設定された処理実行条件を満たす出力対象画像データが含まれるか否かを判定する。
なお、以下では、説明を簡略化するため、解像度変換の倍率として2倍が選択された場合について述べる。
まず、出力画像判定部114は、出力対象画像データの任意の一つを選択し、当該出力対象画像データ(以下、第1の撮像画像という)について、ズレ検出用部分領域を選択する。ここで、ズレ検出用部分領域は、第1の撮像画像と残りの出力対象画像データ(以下、第2の撮像画像という)との間のズレ量を求めるために用いるものであるため、当該ズレ検出用部分領域内で画素値の変化が大きいもの(明確なパターンが存在するもの)が好ましい。そこで、出力画像判定部114は、以下のような方法によってズレ検出用部分領域を抽出する。
出力画像判定部114は、撮像対象物の領域の重心位置に存在する画素を特定し、当該画素を注目画素とする。そして、注目画素を含むn×n画素の領域を選定する。選定した領域について、以下の選定要件を満たすか否か判断し、満たす場合には、当該領域をズレ検出用部分領域とする。一方、満たさない場合には、所定のオフセット量に基づいて領域を移動させ、移動後の領域について同じ判断を行う。このようにして、ズレ検出用部分領域を抽出する。
ここで、選定要件としては、例えば、以下二つが挙げられる。
一つとしては、領域内の分散に準じた値を用いるものである。注目画素近傍のn×n画素の領域に対して画素値をP(i)とすると部分領域の分散値Variance(x)は、下記式(1)で表される。この分散値Variance(x)の値が所定閾値以上あることを選定要件とする。また簡易化のために本式の分子のみを考えても良い。
他の一つとしては、注目画素近傍のn×n画素の領域に対して、図27に示す1次微分フィルタのようなエッジ抽出フィルタを掛けて、2値化し、総和を見る。総和がある所定閾値以上(例えば、部分領域画素数の5%以上など)あることを選定要件とすればよい。
次に、このようにして求められた、第1の撮像画像のズレ検出用部分画像a(n×n)に対し、第2の撮像画像の中から、中心がほぼ同じ位置のズレ検出用部分画像b(m×m)(m>n)として切り出す。この切り出し方法は、第1の撮像画像におけるズレ検出用部分画像aの中心画素の座標と、第2の撮像画像におけるズレ検出用部分画像bの中心画素の座標とが一致するように、切り出す。
その後、切り出されたズレ検出用部分画像b中においてズレ検出用部分画像aに最も適合する領域をサブピクセル精度で求める。その手法としては、ズレ検出用部分画像aをテンプレートとした正規化相関パターンマッチングが挙げられる。
正規化相関パターマッチングの例として、既知であるところの正規化相関式を用いて相関を算出する。一般的にN画素からなる2つのパターンInput(I)とTarget(T)の相関式は、下記式(2)と表すことができる。ここで、α、β、γはそれぞれ下記のように表せる。
例えば、n=5、m=7の場合、ズレ検出用部分画像b(m×m)のなかのズレ検出用部分画像aと同サイズの領域(n×n)ごとに上記相関式を演算すると、結果として3×3の相関値Mapが生成される。この相関値Mapを用いて、フィットする2次曲面を求める。2次曲面の求め方としては、例えば、S(x,y)=a*x*x+b*x*y+c*y*y+d*x+e*y+fとして、9点のうち相関値の高い6点を選び、連立方程式を解いて各係数を求める。この関数の極値(=最大値)の座標値(x、yの両方)の小数点以下の値が所定範囲(ここでは、0.3〜0.7)であれば、処理実行条件「必要画像データ数:2、ずれ量:0.3〜0.7」を満たすものと判定する。
なお、極値の求め方は、上記2次式を偏微分し、それぞれが0である点の座標を求めればよい。このとき、実際には各係数(a〜f)を求める必要はないので、直接相関値(S1〜S6)を用いたほうが効率的である。求めるべき式(3)は以下のようになる。ここで、原点は着目するウィンド基準となる。
なお、このようなサブピクセル精度の位置ズレ確認を少なくとも一か所にて行うが、数か所で行うことが望ましい。
そして、出力画像判定部114は、処理実行条件を満たすか否かの判定結果を制御部109に出力する。
(8−9−2)複数枚の出力対象画像データを用いた高解像度補正
次に、画像形成装置200における高解像度補正部225の処理について説明する。高解像度補正部225は、携帯端末装置100から受信したデータセットに含まれる複数の出力対象画像データに基づいて高解像度補正を行う。
複数の画像データからの高解像度画像作成方法に関しては、映像情報メディア学会誌Vol.62、No.3、pp.337〜342(2008)にいくつかの方法が紹介されている。一般的には、高解像度補正は、複数の画像の位置合わせ処理と再構成処理により成立する。本実施形態では、位置合わせ処理の例として、上記(8−9−1)記載の正規化相関パターマッチングの方法を適用する。すなわち、上記S(x,y)が極大値を示すズレ量だけずらすことにより、複数の画像の位置合わせを行うことができる。
次に、高解像度補正部225は、再構成処理を行う。すなわち、高解像度補正部225は、解像度変換後の倍率に応じた画素数を有する再構成画像データを作成する。ただし、画像サイズは、撮像画像のサイズと同一とする。そして、高解像度補正部225は、再構成画像データの各画素の画素値を以下のようにして決定する。すなわち、高解像度補正部225は、再構成画像データにおける各画素(再構成画素)について、当該再構成画素の近傍となる撮像画像の画素(撮像画素)を複数の撮像画像の中から決定し、一般的な補間方法(線形補間やバイキュービック補間など)で補間を行う。
具体的には、図36に示されるように、着目する再構成画素近傍の撮像画素、例えば撮像画素の格子を結ぶ線(図の点線)が最も近距離である2点を横方向・縦方向のそれぞれで選択する。ここでは、横方向での最も近距離である2点は、1つ目の出力対象画像データの撮像画素1−2(画素値:Vi1−2:以下同様)および撮像画素1−4であり、縦方向での最も近距離である2点は、2つ目の出力対象画像データの撮像画素2−1および撮像画素2−2であったとする。なお、再構成画素近傍の撮像画素を選択する際には、上記幾何学的歪みの補正・レンズ歪みの補正が実行された複数の出力対象画像データの中から選択するものとする。これにより、幾何学的歪み・レンズ歪みの補正がされた状態で高解像度補正を行うことができる。
なお、補正後の座標の値を計算する際に、基となる複数の撮像画像の該当する幾何学補正・レンズ歪みの補正を考慮した座標の値を基に求めてもよい。つまり、幾何学補正・レンズ歪みの補正値のみ算出し、再構成処理を行った後に、当該補正値により座標変換を行ってよい。
そして、横方向および縦方向のそれぞれについて選択した2点を結ぶ線分に垂直であり、かつ着目する再構成画素の点を含む直線と当該線分との交点を求める。図36に示されるように、当該交点が2つの線分のそれぞれについてt:1−t、u:1−uで内分している場合、高解像度補正部は、着目する再構成画素の画素値Vsを下記式4に基づいて求めればよい。この場合は、線形補間を行ったことになる。そして、全ての再構成画素について同様にして画素値を求め、高解像度化された再構成画像データを高解像度画像データとして生成することができる。
なお、補間方法として別の手法を用いても良い。また、映像情報メディア学会誌Vol.62、No.3、pp.337〜342(2008)に紹介されている別の方法を用いてもよい。例えば、MAP(Maximum A Posteriori)法のような、先ず推定に基づく事後確率に対応する評価関数を最小化することで求める手法を用いても良い。
(8−9−3)撮像部について
上記の説明では、撮像部101が連続して複数回撮像するときの手ぶれによって、複数の撮像画像にズレが生じることを利用する形態とした。しかしながら、これに限らず、撮像部101は、連続して複数回撮像するときに、撮像素子(CCD・CMOS)またはレンズを微小にずらしてもよい。これにより、複数の撮像画像間においてズレが確実に生じることになる。
(8−10)携帯端末装置から画像形成装置への画像データの送信タイミングについて
上記の説明では、文書撮像モードにより蓄積された出力対象画像データを携帯端末装置100で蓄積しておき、送信指示が入力されたタイミングで、それまでに蓄積された出力対象画像データをまとめて送信するものとした。しかしながら、携帯端末装置100から出力対象画像データを画像形成装置200に送信するタイミングはこれに限定されない。
例えば、文書撮像モードで出力対象画像データを記憶部108に格納するたびに出力対象画像データを画像形成装置200に送信してもよい。この場合、ユーザは、画像形成装置200の近傍にいない場合がほとんどである。そのため、携帯端末装置100の通信部104は、携帯電話網およびインターネット網を介して、出力対象画像データを画像形成装置200に送信すればよい。
(8−11)出力処理情報について
上記の説明では、出力処理情報を携帯端末装置100が取得し、画像形成装置200に送信するものとした。しかしながら、これに限らず、画像形成装置200がユーザ認証のためにユーザ情報を取得する際に、出力処理情報(出力処理の種類、出力処理のための設定条件を示す情報)を取得してもよい。
(8−12)出力処理について
画像形成装置200において、制御部212は、ファイリング処理やメール送信処理を行う前に、画像処理部202によって生成された高解像度画像データを高圧縮PDFに変換してもよい。なお、高圧縮PDFデータとは、画像データの中の背景部分と文字分とを分離し、ぞれぞれの部分に最適な圧縮処理を行ったPDFデータである。これにより、文字判読性が良好で、画像ファイルサイズも低減させることができる。
また、制御部212は、ファイリング処理やメール送信処理を行う前に、画像処理部202によって生成された高解像度画像データに対してOCR処理を実行し、テキストデータを生成してもよい。そして、制御部212は、高解像度画像データをPDFに変換し、生成したテキストデータを透明テキストとして付加してもよい。なお、透明テキストとは、認識された文字をテキスト情報として見掛け上は見えない形で画像データに重ね合わせる(あるいは埋め込む)ためのデータである。例えば、PDFファイルでは、画像データに透明テキストを付加した画像ファイルが一般に使用されている。そして、制御部212は、生成した透明テキスト付きPDFデータを出力させてもよい。これにより、テキスト検索可能なファイルのように活用しやすい電子化文書を出力することができる。
(8−13)画像形成装置が備える画像処理部について
上記の説明では、画像形成装置200が備える画像処理部202が高解像度補正などを行うものとして説明した。しかしながら、画像形成装置200は、高解像度出力用データセットに対する高解像度補正やその他の画像処理(幾何学的歪みの補正、レンズ歪みの補正、コントラスト補正、カラーバランス補正など)を、上記画像処理部202を備えたサーバに実行させてもよい。なお、この場合、当該サーバが、携帯端末装置100から受信した高解像度出力用データセットに対して高解像度補正を行い、補正後の高解像度画像データを出力する画像形成装置であるといえる。
(9)プログラムおよび記録媒体
本発明はコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体に、上記した携帯端末装置100で撮像した画像を画像形成装置200に送信し画像形成装置200より出力する方法を記録するものとすることもできる。
この結果、上記処理を行うプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)を記録した記録媒体を持ち運び自在に提供することができる。
なお、本実施の形態では、この記録媒体としては、マイクロコンピュータで処理が行われるために図示していないメモリ、例えばROMのようなもの、そのものがプログラムメディアであっても良いし、また、図示していないが外部記憶装置としてプログラム読み取り装置が設けられ、そこに記録媒体を挿入することで読み取り可能なプログラムメディアであっても良い。
いずれの場合においても、格納されているプログラムはマイクロプロセッサがアクセスして実行させる構成であっても良いし、あるいは、いずれの場合もプログラムコードを読み出し、読み出されたプログラムコードは、マイクロコンピュータの図示されていないプログラム記憶エリアにダウンロードされて、そのプログラムが実行される方式であってもよい。このダウンロード用のプログラムは予め本体装置に格納されているものとする。
ここで、上記プログラムメディアは、本体と分離可能に構成される一時的でない有形の媒体(non-transitory tangible medium)であり、磁気テープやカセットテープ等のテープ系、フレキシブルディスクやハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVDなどの光ディスクのディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM、EPROM(Erasable Programmable Read Only Memory)、EEPROM(登録商標)(Electrically Erasable Programmable Read Only Memory)、フラッシュROM等による半導体メモリを含めた固定的にプログラムコードを担持する媒体であっても良い。
また、本実施の形態においては、インターネットを含む通信ネットワークを接続可能なシステム構成であることから、通信ネットワークからプログラムコードをダウンロードするように流動的にプログラムコードを担持する媒体であっても良い。なお、このように通信ネットワークからプログラムをダウンロードする場合には、そのダウンロード用のプログラムは予め本体装置に格納しておくか、あるいは別な記録媒体からインストールされるものであっても良い。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
上記記録媒体は、携帯端末装置100や画像形成装置200に備えられるプログラム読み取り装置により読み取られることで上述した画像処理方法が実行される。
本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
本発明は、携帯端末装置と画像形成装置や画像表示装置との間でデータ通信を行う撮像画像処理システムに適用することができる。
10 シャッタボタン
100 携帯端末装置(撮像装置)
101 撮像部
105 表示部
108 記憶部
109 制御部
110 撮像範囲判定部
111 幾何学的配置検出部(検出部)
112 表示処理部
113 出力対象画像決定部
114 切替部
200 画像形成装置(画像出力装置)
300 画像表示装置

Claims (12)

  1. 対象物を撮像した撮像画像を表示する表示手段を備える画像処理装置において、
    上記対象物が矩形であり、
    上記対象物が撮像範囲内に収まっている場合に、上記撮像画像と、上記撮像画像の上記対象物の範囲を所定の矩形状に幾何学補正した補正処理後画像とを上記表示手段に表示させる表示処理部を備えることを特徴とする画像処理装置。
  2. 上記表示処理部は、上記撮像画像と上記補正処理後画像とを同一画面内に表示させる、請求項1に記載の画像処理装置。
  3. 上記撮像画像において、線分状に連なるエッジ画素群を検出する検出部をさらに備え、
    上記表示処理部が、上記検出部により検出された上記エッジ画素群の上に、上記検出部により検出された4つのエッジ画素群で示される4つの線分の各々に対応する直線で囲まれる上記対象物の輪郭を示す四角形の輪郭線を、上記撮像画像に重ねて表示させることを特徴とする請求項1または2に記載の画像処理装置。
  4. 上記表示処理部が、上記輪郭線の頂点の座標を編集する指示を受け付け、編集された頂点の座標を結ぶ上記輪郭線で囲まれる領域の画像を基に上記補正処理後画像を生成することを特徴とする請求項3に記載の画像処理装置。
  5. 上記表示処理部による上記輪郭線の表示機能を有効にするか無効にするかを切り替える切替部を備えていることを特徴とする請求項3または4に記載の画像処理装置。
  6. 上記表示処理部は、上記切替部が上記輪郭線の表示機能を有効に設定している場合、上記補正処理後画像を上記表示手段に表示させることを特徴とする請求項5に記載の画像処理装置。
  7. 対象物を撮像した撮像画像を表示する表示手段を備え、上記対象物が矩形状である画像処理装置の画像処理方法であって、
    (a)上記対象物が撮像範囲内に収まっている場合に、上記撮像画像と、上記撮像画像の上記対象物の範囲を所定の矩形状に幾何学補正した補正処理後画像とを上記表示手段に表示させるステップを有する、画像処理方法。
  8. 上記ステップ(a)で、上記撮像画像と上記補正処理後画像とを同一画面内に表示させる、請求項7に記載の画像処理方法。
  9. 上記撮像画像において、線分状に連なるエッジ画素群を検出するステップ(b)をさらに有し、
    上記ステップ(a)で、上記ステップ(b)で検出された上記エッジ画素群の上に、上記ステップ(b)で検出された4つのエッジ画素群で示される4つの線分の各々に対応する直線で囲まれる上記対象物の輪郭を示す四角形の輪郭線を、上記撮像画像に重ねて表示させる、請求項7または8に記載の画像処理方法。
  10. 上記ステップ(a)で、上記輪郭線の頂点の座標を編集する指示を受け付け、編集された頂点の座標を結ぶ上記輪郭線で囲まれる領域の画像を基に上記補正処理後画像を生成する、請求項9に記載の画像処理方法。
  11. 上記ステップ(a)における上記輪郭線の表示機能を有効にするか無効にするかを切り替えるステップ(c)をさらに有する、請求項9または10に記載の画像処理方法。
  12. 上記ステップ(a)で、上記ステップ(c)で上記輪郭線の表示機能を有効に設定している場合、上記補正処理後画像を上記表示手段に表示させる、請求項11に記載の画像処理方法。
JP2018201092A 2012-01-17 2018-10-25 画像処理装置および画像処理方法 Pending JP2019040617A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2012007558 2012-01-17
JP2012007558 2012-01-17

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2017208375A Division JP6426815B2 (ja) 2012-01-17 2017-10-27 画像処理装置および画像処理方法

Publications (1)

Publication Number Publication Date
JP2019040617A true JP2019040617A (ja) 2019-03-14

Family

ID=56898560

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2016112497A Pending JP2016167311A (ja) 2012-01-17 2016-06-06 画像処理装置および画像処理方法
JP2017208375A Active JP6426815B2 (ja) 2012-01-17 2017-10-27 画像処理装置および画像処理方法
JP2018201092A Pending JP2019040617A (ja) 2012-01-17 2018-10-25 画像処理装置および画像処理方法

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2016112497A Pending JP2016167311A (ja) 2012-01-17 2016-06-06 画像処理装置および画像処理方法
JP2017208375A Active JP6426815B2 (ja) 2012-01-17 2017-10-27 画像処理装置および画像処理方法

Country Status (1)

Country Link
JP (3) JP2016167311A (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6971788B2 (ja) * 2017-11-09 2021-11-24 シャープ株式会社 画面表示制御方法および画面表示制御システム
JP7311832B2 (ja) * 2018-12-27 2023-07-20 ブラザー工業株式会社 画像処理装置、読取装置、および、コンピュータプログラム
JP2020135776A (ja) * 2019-02-26 2020-08-31 プラス株式会社 撮影装置
JP2022126533A (ja) * 2021-02-18 2022-08-30 株式会社アマダ 材料管理システム
WO2023073972A1 (ja) * 2021-10-29 2023-05-04 日本電信電話株式会社 領域検出装置、領域検出方法、及びプログラム
CN117197073B (zh) * 2023-09-07 2024-03-05 石家庄铁道大学 基于机器视觉的矩形物体自动计数方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3800661B2 (ja) * 1996-04-23 2006-07-26 コニカミノルタフォトイメージング株式会社 デジタルカメラ
JPH114353A (ja) * 1997-06-13 1999-01-06 Canon Inc 画像処理方法および装置
JP4363151B2 (ja) * 2003-10-14 2009-11-11 カシオ計算機株式会社 撮影装置、その画像処理方法及びプログラム
JP4232682B2 (ja) * 2004-04-26 2009-03-04 カシオ計算機株式会社 電子カメラおよびプログラム
JP4548144B2 (ja) * 2005-02-23 2010-09-22 カシオ計算機株式会社 デジタルカメラ装置、及びスルー画像表示方法
JP4529837B2 (ja) * 2005-08-04 2010-08-25 カシオ計算機株式会社 撮像装置、画像補正方法及びプログラム
JP4662258B2 (ja) * 2005-08-31 2011-03-30 株式会社リコー 画像処理方法及び装置、デジタルカメラ装置、並びに画像処理プログラムを記録した記録媒体
US8577118B2 (en) * 2008-01-18 2013-11-05 Mitek Systems Systems for mobile image capture and remittance processing
JP4856263B2 (ja) * 2009-08-07 2012-01-18 シャープ株式会社 撮像画像処理システム、画像出力方法、プログラムおよび記録媒体
JP4630936B1 (ja) * 2009-10-28 2011-02-09 シャープ株式会社 画像処理装置、画像処理方法、画像処理プログラム、画像処理プログラムを記録した記録媒体

Also Published As

Publication number Publication date
JP2016167311A (ja) 2016-09-15
JP2018042273A (ja) 2018-03-15
JP6426815B2 (ja) 2018-11-21

Similar Documents

Publication Publication Date Title
JP5951367B2 (ja) 撮像装置、撮像画像処理システム、プログラムおよび記録媒体
JP4856263B2 (ja) 撮像画像処理システム、画像出力方法、プログラムおよび記録媒体
JP5547243B2 (ja) 画像処理装置、プログラムおよび記録媒体
JP6426815B2 (ja) 画像処理装置および画像処理方法
JP4772894B2 (ja) 画像出力装置、携帯端末装置、撮像画像処理システム、画像出力方法、プログラムおよび記録媒体
JP5026484B2 (ja) 携帯端末装置、画像出力装置、撮像画像処理システム、携帯端末装置の制御方法、画像出力方法、プログラム、および記録媒体
JP4772889B2 (ja) 携帯端末装置、撮像画像処理システム、プログラムおよび記録媒体
JP4341629B2 (ja) 撮像装置、画像処理方法及びプログラム
JP4758493B2 (ja) 携帯端末装置、撮像画像処理システム、携帯端末装置の制御方法、プログラムおよび記録媒体
US9525868B2 (en) Mobile terminal apparatus which displays captured images
JP2011146873A (ja) 撮像画像処理システム、撮像画像処理システムの制御方法、プログラムおよび記録媒体
JP2013123119A (ja) 画像処理装置、画像形成装置、画像読取装置、画像処理方法、コンピュータプログラム及び記録媒体
JP6953178B2 (ja) 画像処理装置、画像処理方法、プログラム
JP2005275447A (ja) 画像処理装置、画像処理方法及びプログラム
JP2005260657A (ja) 撮影装置、画像処理方法及びプログラム
JP4600019B2 (ja) 撮影装置、画像処理方法及びプログラム
JP5819378B2 (ja) 画像判定装置、画像処理システム、プログラム及び記録媒体
JP2010273218A (ja) 画像出力装置、撮像画像処理システム、画像出力方法、プログラムおよび記録媒体
JP4591343B2 (ja) 画像処理装置、撮像装置、画像処理方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181025

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190920

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191001

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191115

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200204