以下、本発明の実施の形態について、図面を参照しながら詳細に説明する。
(1)撮像画像処理システムの全体構成
図3は、本発明に係る撮像画像処理システムの全体構成を示す図である。図3に示されるように、撮像画像処理システムは、カメラ付き携帯電話、デジタルスチルカメラなど、撮像手段を備えた携帯端末装置100、および、複合機、プリンタ(画像形成装置)などの画像出力装置200を備える。
携帯端末装置100と画像出力装置200とは通信可能であり、携帯端末装置100は、撮像した画像データ(以下、撮像画像データという)を画像出力装置200に送信することができる。
携帯端末装置100は、ユーザによって携帯されるものである。ユーザは、様々な場面で携帯端末装置100により対象物を撮像することができる。
本実施形態では、携帯端末装置100は、文書画像が印刷された用紙やポスター、文書画像が表示されている表示画面(例えば、ディスプレイ画面やプロジェクターにより投影された画面)のような矩形状の撮像対象物を撮像し、当該撮像により得られた撮像画像を画像出力装置200から出力するための文書撮像モードの機能を有している。
ところで、撮影した画像には、ユーザが所望する撮像対象物以外の周囲の人や物、背景等のドキュメント作成に不必要な部分が含まれている場合も考えられる。本実施形態では、このような場合であっても、所望の撮像対象物のみを撮像画像から容易に抽出することができるものである。
本実施形態において、携帯端末装置100は、文書撮像モードが選択された際に、撮像画像から抽出した一部の領域の画像を画像出力装置200から得ることのできるオブジェクト抽出モードを有している。すなわち、本実施形態では、文書画像が矩形状の面を有する撮像対象物を撮像し、当該撮像により得られた撮像画像の中から、一部の領域の画像だけを出力することを希望する場合に、ユーザは、文書撮像モードを選択するとともにオブジェクト抽出モードを選択するものとする。
なお、本実施形態では、オブジェクト抽出モードとして、(A)抽出すべき領域内の任意の点をユーザが指定することなしに自動的に抽出する領域を決定する自動抽出モード、(B)抽出すべき領域内の任意の点をユーザが指定し、当該指定された点と撮像画像から検出されたエッジ画素群の位置とに基づいて、抽出する領域を決定するエッジ抽出モード、(C)抽出すべき領域内の任意の点をユーザが指定し、当該指定された点の色に基づいて、抽出する領域を決定する色抽出モード(濃度値抽出モード)、の3つのモードを有している。ユーザは、オブジェクト抽出モードを選択する場合、自動抽出モード、エッジ抽出モードおよび色抽出モードのうちの一つを適宜選択することができる。
そして、本実施形態では、携帯端末装置100においてオブジェクト抽出モードが選択された場合、画像出力装置200は、撮像画像の中から、撮像対象物の領域と推定される一部の領域の画像を抽出し、当該抽出画像を出力する。
また、携帯端末装置100で撮像された画像は解像度が低く、当該解像度で画像出力装置200により画像出力(例えば印刷)を行ったとしても細部まで認識できない場合がある。例えば、文書画像(文字など)が印刷された用紙やポスター、文書画像などが表示されている表示画面を撮像する場合において、文字が判別できないことが考えられる。
そこで、本実施形態では、画像出力装置200は、携帯端末装置100から受信した撮像画像データに対して、解像度を高める高解像度補正を行う機能(高解像度化機能)を有している。この高解像度補正の手法としては、映像情報メディア学会誌Vol.62、No.3、pp.337〜342(2008) に記載されている、複数の撮像画像データを用いた方法や、映像情報メディア学会誌Vol.62、No.2、pp.181〜189(2008)に記載されている、一つの撮像画像データを用いた方法などがあり、これらの方法を用いることができる。なお、本実施形態では、同一対象物に対して複数回の連続撮像により得られた出力対象画像データを用いて高解像度補正を行うものとして説明する。ただし、本発明は、画像出力装置200が当該高解像度化機能を有する場合に限定されるものではない。
さらに、ユーザは、矩形状の撮像対象物である、文書画像が印刷された用紙やポスター、文書画像が表示されている表示画面などに対して、常に正面から撮像できるとは限らない。すなわち、ユーザは、撮像対象物における、文書画像が形成された平面の法線方向と、撮像手段の撮像方向とが一致しない状態で、斜め方向から撮像対象物を撮像する場合がある。この場合、撮像された画像において、撮像対象物に歪み(以下、幾何学的歪みという)が生じることになる。本実施形態では、上記文書撮像モードが選択された場合、このような幾何学的歪みも補正された状態で画像出力装置200が画像出力するように構成されている。ただし、本発明は、画像出力装置200が当該幾何学的歪みの補正機能を有する場合に限定されるものではない。
なお、画像出力装置200で実行される出力処理としては、撮像画像データに基づいた画像またはその一部の領域の画像の印刷処理、サーバやUSBメモリなどの記憶装置へ撮像画像データまたはその一部の領域の画像データを格納するファイリング処理、電子メールに撮像画像データまたはその一部の領域の画像データを添付して送信するメール送信処理などがある。
また、携帯端末装置100と画像出力装置200との通信方式としては、図3において符号Aで示されるように、IrSimpleなどの赤外線通信規格のいずれかに基づく無線通信方式や、符号Bで示されるように、Felica(登録商標)のような非接触無線通信により、携帯端末装置100から中継装置300に一旦撮像画像データを送り、その後、例えばBluetooth(登録商標)のような無線通信を用いて、当該中継装置300から画像出力装置200へデータを転送する方式がある。なお、携帯端末装置100と画像出力装置200との間の通信方式については、これらに限定されることなく、公知の通信方法を用いたものを適用することができる。たとえば、電子メールに出力対象画像データを添付して画像出力装置200に送信してもよい。
(2)携帯端末装置の構成
まず、図4〜12に基づいて、本実施形態に係る携帯端末装置100について説明する。
図4は、携帯端末装置100の構成を示すブロック図である。図4に示されるように、携帯端末装置100は、撮像部101、撮像画像判定部102、画像処理部103、通信部(送信部)104、表示部(通知部、選択部、指定領域抽出部)105、入力部106、記憶媒体アクセス部107、記憶部108、制御部(送信部、通知部)109、指定領域抽出部110を備えている。
撮像部101は、CCDセンサ、CMOSセンサを用いて、撮像対象物の撮像を行うものである。撮像部101は、予め設定された解像度で撮像対象物の撮像を行う。また、撮像部101は、ユーザにより文書撮像モードが選択された場合、1回シャッターの押下により撮像対象物について複数回(例えば、2〜15)連続して撮像する。通常、連続して撮像された画像は、ほぼ同じ画像であるが、手ぶれ等によって微少量だけずれることになる。
撮像画像判定部102は、文書撮像モードが選択されている際に、撮像部101で撮像された複数の撮像画像が、画像出力装置200において高解像度補正を実行するための条件を含む処理実行条件を満たしているか否かを判定する判定部が備えられている。撮像画像判定部102は、その判定結果を制御部109に出力する。
また、撮像画像判定部102は、撮像画像から、線分状に連なるエッジ画素の群を検出し、検出したエッジ画素の群の位置を示すエッジ情報を生成する機能も有している。なお、複数のエッジ画素の群が検出された場合、各エッジ画素の群に対応する複数のエッジ情報を生成する。撮像画像判定部102における具体的な処理については後述する。
画像処理部103は、撮像部101で撮像された画像のデータ(撮像画像データ)に対して、少なくともA/D変換処理を行うものである。
通信部104は、USB(Universal Serial Bus)1.1またはUSB2.0の規格に基づく、シリアル転送/パラレル転送、無線データ通信機能を有するものである。通信部104は、撮像部101により撮像され、画像処理部103にてA/D変換処理が施された1枚もしくは複数の撮像画像データを画像出力装置200に送信する。ただし、通信部104は、撮像画像判定部102により処理実行条件を満たしていると判定された撮像画像データのみを送信する。
表示部105は、タッチパネル方式の液晶ディスプレイなどにより構成されるものである。また、ユーザは、液晶ディスプレイに表示される撮像画像をタッチして自由に移動、拡大、縮小させるといった操作や、ユーザが指定した点を中心として、指の動作方向に画像を移動させることが可能である。
入力部106は、複数のボタンを有しており、ユーザがデータの入力を行うためのものである。また、記憶媒体アクセス部107は、携帯端末装置100の各処理を行うためのプログラムが記録された記録媒体から、プログラムを読み出すものである。
また、記憶部108は、携帯端末装置100の各処理を行うためのプログラム、携帯端末装置の機種情報、ユーザ情報や処理を行う際に必要なデータを格納するものである。なお、ユーザ情報とは、携帯端末装置のユーザを識別する情報であり、例えば、ユーザIDおよびパスワードなどである。
指定領域抽出部110は、表示部105に表示された撮像画像において、ユーザが指やタッチペンで指定したポイントの座標情報を抽出するものである。なお、この座標情報は、撮像画像データで示される撮像画像において、所定位置の点(例えば、左上隅の点)を原点とし、横方向をX軸、X軸に垂直な方向をY軸とし、X座標およびY座標で表される。指定領域抽出部110の具体的な処理については後述する。
制御部109は、携帯端末装置100の各部の制御を行うものである。具体的には、制御部109は、入力部106に文書撮像モードを選択する旨の指示が入力された場合、解像度変換の倍率の入力を促す画面を表示部105に表示させる。
そして、制御部109は、入力部106に入力された倍率(例えば、2倍、4倍)に応じて、撮像部101が連続撮像する回数、および、撮像画像判定部102で用いる処理実行条件の一部を決定する。なお、制御部109は、記憶部108に予め格納された、倍率と撮像回数および処理実行条件の一部とを対応付けた情報に基づいて決定する。
また、制御部109は、入力部106に文書撮像モードを選択する旨の指示が入力された場合、画像出力装置200での出力処理の種類(印刷処理、ファイリング処理、メール送信処理など)の選択指示、ならびに、選択した出力処理を実行するための設定条件(印刷枚数などの印刷条件、ファイリング先のサーバのアドレス、メールの送信先アドレスなど)の入力を促す画面を表示部105に表示する。そして、制御部109は、入力部106から、出力処理の種類および出力処理の設定条件を示す出力処理情報を取得する。
さらに、制御部109は、文書撮像モードの撮像により得られた撮像画像データの画像出力装置200への送信指示が入力部106に入力された場合、オブジェクト抽出モードを選択するか否かを示す指示の入力を促す画面を表示部105に表示させる。また、制御部109は、オブジェクト抽出モードが選択された場合、自動抽出モード、エッジ抽出モードおよび色抽出モードのいずれのモードを示す指示の入力を促す画面を表示部105に表示させる。そして、制御部109は、入力された指示、および、撮像画像判定部102により生成されたエッジ情報の数に基づいて、実行するモードを決定する。
そして、制御部109は、撮像画像データと、各モードに応じた関連情報とを画像出力装置200に送信するように通信部104を制御する。
制御部109における、モードの決定処理および関連情報の特定処理の詳細については後述する。
(3)撮像画像判定部の処理について
次に、携帯端末装置100の撮像画像判定部102における具体的な判定処理について説明する。
(3−1)傾きの判定
上述したように、用紙やポスター、表示画面のような矩形状の撮像対象物を撮像し、撮像画像を画像出力装置200から出力させることを希望する場合に、ユーザが文書撮像モードを選択する。
そのため、撮像画像判定部102は、撮像対象物が矩形状であると仮定して、撮像画像データにおいて、撮像対象物のエッジを検出することで撮像画像データにおける撮像対象物の傾きを検出する。
具体的には、撮像画像判定部102は、撮像画像データの中から、線分状に連なるエッジ画素の群を検出する(直線認識を行う)。ここで、エッジ画素とは、濃度の変化が激しい部分を構成する画素である。矩形状の撮像対象物を撮像した場合、当該撮像対象物の輪郭線(つまり、撮像対象物と背景との境界線)は、濃度の変化が激しい部分が線分状に連なる。すなわち、撮像画像における撮像対象物と背景との境界線は、線分状に連なるエッジ画素の群で表される。そこで、上述のように、撮像画像データの中から、線分状に連なるエッジ画素の群を検出することで、撮像対象物と背景との境界線の位置を推定することができる。このように、撮像画像判定部102は、線分状に連なるエッジ画素の群を検出するエッジ検出部としても機能する。
なお、撮像画像データの中から、線分状に連なるエッジ画素の群を検出する手法としては、例えば特開2006−237757に記載されている方法など従来知られている手法を用いることができる。
また、背景の中のエッジを撮像対象物の輪郭線のエッジとして誤判定することを防止するために、所定長さ以上の線分状のエッジ画素の群のみを撮像対象物のエッジとして検出してもよい。この場合、所定長さとは、例えば、撮像画像データで示される画像の端の辺の長さの80%程度の長さなどを適宜設定すればよい。または、このようにして検出されたエッジの中から、撮像対象物のエッジのものをユーザに選択してもらってもよい。このような検出方法としては、例えば、特開2006−237757に記載の技術を用いることができる。
そして、撮像画像判定部102は、検出された撮像対象物のエッジ上の2点を選択する。例えば、図5に示されるように、撮像画像データの中心から左右それぞれ横方向にw/2だけ離れた2点11・12を選択する。次に、選択された2点11・12の各々と、撮像画像データの端辺との距離d1,d2を求め、撮像画像における撮像対象物の傾きを求めることができる。図5のような場合、傾き角度をθとすると、 tanθ=(d2−d1)/wとなる。そこで、撮像画像判定部102は、(d2−d1)/wの値を算出し、この値に相当する角度θをあらかじめ作成済みのテーブル(図6参照)などより読み取る。
そして、撮像画像判定部102は、検出した角度θが所定範囲内(例えば、−30°〜+30°)であるか否かを判定し、その判定結果を制御部109に出力する。ここで、角度θが所定範囲内であることが処理実行条件の一つとなる。
また、撮像画像判定部102は、傾きの判定処理によって検出した線分状に連なるエッジ画素の群の位置を示すエッジ情報を生成し、制御部109に出力する。線分状に連なるエッジ画素の群をn群(例えば、図22に示されるように4群)検出した場合には、各群に対応するエッジ情報をn個出力することになる。なお、本実施形態では、エッジ情報は、線分状に連なるエッジ画素の群の両端に位置するエッジ画素の撮像画像中の座標を示す情報である。ただし、本発明において、エッジ情報は、線分状に連なるエッジ画素の群の位置を示すものであればよく、これに限定されるものではない。例えば、当該群に含まれる全てのエッジ画素の撮像画像上の座標であってもよい。このように、撮像画像判定部102は、線分状に連なるエッジ画素の群の位置を示すエッジ情報を生成するエッジ情報生成部としても機能する。
そして、撮像画像判定部102は、生成したエッジ情報の全てを制御部109に出力する。なお、撮像画像によっては、線分状に連なるエッジ画素の群を検出できない場合もある。その場合、撮像画像判定部102は、エッジ情報が生成できない旨の通知を制御部109に出力する。なお、撮像画像判定部102は、後述する幾何学的歪みの判定の際に検出した線分状に連なるエッジ画素の群の位置を示すエッジ情報を生成し、制御部109に出力する構成であってもよい。
(3−2)幾何学的歪みの判定
幾何学的歪みとは、上述したように、撮像対象物における文書画像が形成された平面の法線方向とは異なる斜め方向から撮像対象物を撮像した場合に、撮像画像の中で撮像対象物が矩形状から歪んだ形状を有することである。例えば、用紙の法線方向に対して用紙の左下方向から斜めに撮像した場合、図7に示されるように、撮像対象物は、歪んだ四角形となる。
本実施形態では、後述するように、画像出力装置200がこのような幾何学的歪みを補正する機能を有している。ただし、幾何学的歪みの度合いが大きい場合、補正したとしても、判読性がそれほど向上しない。そこで、本実施形態では、撮像画像判定部102は、幾何学的歪みの度合いを示す特徴量を検出し、当該特徴量が所定範囲内であるか否かを判定する。
本実施形態では、必ずしも画角の中心付近に撮像対象物の各辺のエッジが存在するとは限らないので、ある一定間隔ですべての辺からのエッジ画素を抽出し、各エッジを表すエッジを求めて、さらにこれらの交点を算出して、撮像対象物の領域とすれば良い。
まず、撮像画像判定部102は、撮像画像データについて、ラスター走査を行う。ここで、図7に示されるように、ラスター走査の順方向をX方向、X方向に垂直な方向をY方向とする。また、撮像画像において左上隅を原点とする。
1ライン分走査を行い、エッジ画素が存在しなければ、撮像画像判定部102は、Y方向に所定量だけずらした次のラインについて走査する。なお、ライン間の間隔は一定であればよく、1画素である必要はない。
そして、撮像画像判定部102は、ラスター走査において、最初にエッジ画素を検出したラインをL1(1ライン目)とし、図8に示すように、順方向で最初のエッジ画素と判定された画素の座標を第1群に格納し、同じライン上で2つ目のエッジ画素と判定された画素の座標を第2群に分類する。引き続き次のラインの走査を行い、エッジ検知する。そして、それぞれのラインLiについて、順方向で1番目に撮像対象物のエッジ画素と判定された点と、2番目に撮像対象物のエッジ画素と判定された点とのX座標値の差分(X座標の距離di)を求め下記のように判定を行う。
なお、ラインLiにおける最初のエッジ画素のX座標をXi1(第1群に分類されているX座標)、2つ目のエッジ画素のX座標をXi2(第2群に分類されているX座標)とする。検出方法は以下のようである。
(a)1ライン(L1)目の座標X11およびX12については変更しない。
(b)2ライン目以降のiライン目については、座標間の距離di1(=Xi1−X(i−1)1)およびdi2(同様)を算出する。以下、di1に関して述べるため添え字の1を省略するが、di2も同様である。
(c)3ライン目以降のiライン目は、ddi=abs{(di)−di−1}を算出する。ddi≦th1(≒0に近い小さな数値)であれば、座標Xiは同じ群に分類する。そうでない場合(ddi>th1)は、別の群(第3群または第4群)に分類する。
(d)初期処理としてi=4のときのみ、X2の群を確定させるための処理を行う。以下のようにする。
i)dd3≦th1 かつ dd4≦th1 → X2:同群
ii)dd3>th1 かつ dd4≦th1 → X2:別群
iii)dd3≦th1 かつ dd4>th1 → X2:同群
iv)dd3>th1 かつ dd4>th1 → X2:同群
一度、別群(第3群または第4群)に遷移した場合は、増減の確認はする必要はない。
このような処理を画像全体に行って、各群に属するエッジ画素を抽出する。そして、群ごとに、当該群に属するエッジ画素の座標を最小2乗法などで直線近似し、当該群に属するエッジ点に近似した直線を求める。ここで、撮像画像判定部102は、各群について求めた近似直線と当該群に含まれるエッジ画素との距離の二乗和の平均が所定閾値以下である場合に、エッジ画素が線分状に配列しているものと判断し、以下の処理を続行することができる。これにより、撮像画像判定部102は、撮像対象物と背景との境界線として推定される、線分状に連なるエッジ画素の群を検出することができる。なお、撮像画像判定部102は、各群について求めた近似直線と当該群に含まれるエッジ画素との距離の二乗和の平均が所定閾値より大きい場合、エッジ画素が線分状に配列していない可能性が高いと判断し、検出されたエッジの中から、撮像対象物のエッジのものをユーザに選択してもらってもよい。
図9は、上記のような処理によって、ラスター走査によってエッジ画素を抽出し、4つの群に分類したときの図である。図において、丸印が第1群に属するエッジ点、四角印が第2群に属するエッジ点、三角印が第3群に属するエッジ点、星印が第4群に属するエッジ点を示し、最小2乗法により求められた、各群に属するエッジ画素の近似直線を点線で示す。
そして、4つの群について求めた直線の交点(図中、交点1〜4としている)を求め、4つの直線で囲まれた領域を撮像対象物の領域として特定することができる。
さらに、上記の分類処理を90度回転させた画像に対して行っても良い。こうすることで、理想的に画像内の水平方向・垂直方向に平行に配置されたような原稿のエッジも抽出することが可能となる。すなわち、ラスター走査することで、回転前の画像では、垂直方向のエッジが検出できる。一方、回転後の画像では、回転前に水平方向であったエッジ(回転後には水平方向であるエッジ)を検出することができる。これにより、垂直方向・水平方向に平行なエッジも抽出することができる。回転前で十分な情報量(各群で例えば3点以上の交点)があれば、回転前の情報のみを用いればよいし、いずれかの群の交点が1点未満の場合、当然直線の式は求められないため、回転後の交点を用いればよい。
あるいは、求まった交点座標のみを再度座標変換して元に戻し、それぞれの群の分布する領域から、対応する群を求めて、交点情報を統合し、直線の式を求めても良い。すなわち、回転前の画像から求められた交点座標と、回転後の画像から求められた交点を逆回転して得られた交点座標とから、同一の群に属する好転座標を統合して直線の方程式を求めればよい。
なお、エッジ画素の抽出方法としては、少なくとも1以上の画素幅の小ウィンド内での、画素値をそのまま比較(2以上の幅の場合は和・平均値を比較)していき、隣接する値の差分が一定以上の場合、エッジ画素であると判定すればよい。ここで、画素値とは、画素における各色成分(例えば、R、G,B)の濃度値のことである。なお、背景や撮像対象物内のテキストのエッジなどを誤って検出することを防止するために、上記のようにして検出された、線分状に連なるエッジ画素の群の両端間の長さが所定長さ以上のエッジのみを撮像対象物のエッジとして検出してもよい。この場合、所定長さとは、例えば、撮像画像データで示される画像の端の辺の長さの80%程度の長さを設定すればよい。または、このようにして検出されたエッジの中から、撮像対象物のエッジのものをユーザに選択してもらってもよい。このような検出方法としては、例えば、特開2006−237757に記載の技術を用いることができる。もしくは、それぞれの座標群の評価を行ったり、エッジ検知のための処理(ハフ変換など)を行ったりすることでも防止できる。さらに、縮小画像を用いた処理をプレ処理として行うことで、テキストや細かなテクスチャのエッジを誤って検出することを防止することができる。
そして、撮像画像判定部102は、以上のようにして、線分状に連なる4つのエッジ画素の群を検出し、各群から求められた4つの近似直線及びそれらの交点を求めると、当該4つの近似直線で形成される四角形の対辺の長さの比を計算する。当該長さの比は、上記交点の座標から容易に求まる。なお、対辺は2組あるので、撮像画像判定部102は、当該2組の各々について長さの比を求める。
ここで、対辺の長さの比は、矩形状の撮像対象物を正面から撮像した場合には撮像画像の中の撮像対象物も矩形状であるため、1となる。一方、斜め方向から撮像した場合には、撮像画像の中の撮像対象物の形状は歪んだ四角形となるため、1とは異なる値となる。そして、撮像方向と、撮像対象物の文書画像が形成された平面の法線方向とのなす角度が大きくなるほど、当該比の値と1との差が大きくなる。そのため、対辺の長さの比は、幾何学的歪みの度合いを示す特徴量の一つであるといえる。
その後、撮像画像判定部102は、求めた二つの比の両方が所定範囲内(例えば、0.5〜2)であるか否かを判定し、その判定結果を制御部109に出力する。ここで、所定範囲は、画像出力装置200において補正可能な範囲として予め定められたものであり、記憶部108に格納されている。また、二つの比の両方が所定範囲内(例えば、0.5〜2)であることが処理実行条件の一つとなる。また、撮像画像判定部102は、幾何学的歪みの度合いを示す別の特徴量として、上記のようにして検出された4つの交点を含む2つの直線のなす角度などを用いてもよい。
なお、撮像画像判定部102は、線分状に連なるエッジ画素の群の検出数が3以下の場合、幾何学的歪みの度合いを示す特徴量を算出することができない。この場合、撮像画像判定部102は、幾何学的歪みの度合いを示す特徴量が所定範囲内である旨の判定結果を制御部109に出力するものとする。
(3−3)複数枚の画像のズレ量の判定
上述したように、画像出力装置200は、同一の撮像対象物の複数の撮像画像データに基づいて、高解像度補正を実行することもできる。当該高解像度補正を実行するためには、解像度変換の倍率に応じた所定数の画像データが、所定量だけずれている必要がある。
そこで、本実施形態では、撮像画像判定部102は、撮像部101による連続撮像により得られた複数の撮像画像データの中に、画像出力装置200で高解像度補正を実行するために必要な、所定量だけずれた所定数の撮像画像データが含まれるか否かを判定する。
なお、文字の判読性を挙げるような高解像度補正のために必要なズレとは、対象とする画像データの一画素未満(小数点)のズレを指す。すなわち、小数点以下(1画素未満)の値、例えば、0.3〜0.7などのズレが重要である。整数部分のズレは高解像度補正には考慮されない。例えば、1.3画素、2.3画素などの1画素未満のズレを含むような場合、複数の画像に基づいた高解像度補正を実行することができるが、1画素、2画素などの1画素未満のズレを含まない場合、高解像度補正を実行することができない。
例えば、変換倍率が2倍の場合、高解像度補正に必要な画像データの数は2であり、2つの画像データのずれ量としては画素単位で小数点以下0.3〜0.7であることが好ましい。そのため、記憶部108には、解像度変換の倍率「2倍」と、撮像回数「2」および処理実行条件「必要画像データ数:2、ずれ量:0.3〜0.7」とを対応付けた情報が予め格納されており、制御部109は、当該情報に基づいて、撮像部101に対して2回連続して撮像させ、撮像画像判定部102に対して、処理実行条件「必要画像データ数:2、ずれ量:0.3〜0.7」に従った判定を実行させるものとする。
また、変換倍率が4倍である場合、高解像度補正に必要な画像データの数は4であり、その内の一つの画像データを基準画像データとしたとき、当該基準画像データと残りの3つの画像データとのずれ量がそれぞれ画素単位で小数点以下0.2〜0.3、0.4〜0.6、0.7〜0.8であることが好ましい。そのため、記憶部108は、解像度変換の倍率「4倍」と、撮像回数「4」および処理実行条件「必要画像データ数:4、ずれ量:0.2〜0.3、0.4〜0.6、0.7〜0.8」とを対応付けた情報を記憶している。
なお、以下では、説明を簡略化するため、解像度変換の倍率として2倍が選択された場合について述べる。
まず、撮像画像判定部102は、撮像画像の任意の一つを選択し、当該撮像画像(以下、第1の撮像画像という)について、上記幾何学的歪みの判定の際に求めた撮像対象物の領域の中からズレ検出用部分領域を選択する。ここで、ズレ検出用部分領域は、第1の撮像画像と残りの撮像画像(以下、第2の撮像画像という)との間のズレ量を求めるために用いるものであるため、当該ズレ検出用部分領域内で画素値の変化が大きいもの(明確なパターンが存在するもの)が好ましい。そこで、撮像画像判定部102は、以下のような方法によってズレ検出用部分領域を抽出する。
撮像画像判定部102は、撮像対象物の領域の重心位置に存在する画素を特定し、当該画素を注目画素とする。そして、注目画素を含むn×n画素の領域を選定する。選定した領域について、以下の選定要件を満たすか否か判断し、満たす場合には、当該領域をズレ検出用部分領域とする。一方、満たさない場合には、所定のオフセット量に基づいて領域を移動させ、移動後の領域について同じ判断を行う。このようにして、ズレ検出用部分領域を抽出する。
ここで、選定要件としては、例えば、以下二つが挙げられる。
一つとしては、領域内の分散に準じた値を用いるものである。注目画素近傍のn×n画素の領域に対して画素値をP(x)とすると部分領域の分散値Variance(x)は、下記式(1)で表される。この分散値Variance(x)の値が所定閾値以上あることを選定要件とする。また簡易化のために本式の分子のみを考えても良い。
また一つとしては、注目画素近傍のn×n画素の領域に対して、1次微分フィルタのようなエッジ抽出フィルタを掛けて、2値化し、総和を見る。図10は1次微分フィルタ例を示し、この場合も、総和がある所定閾値以上(例えば、部分領域画素数の5%以上など)あることを選定要件とすればよい。
次に、このようにして求められた、第1の撮像画像のズレ検出用部分画像A(n×n)に対し、第2の撮像画像の中から、中心がほぼ同じ位置のズレ検出用部分画像B(m×m)(m>n)として切り出す。この切り出し方法は、第1の撮像画像におけるズレ検出用部分画像Aの中心画素の座標と、第2の撮像画像におけるズレ検出用部分画像Bの中心画素の座標とが一致するように、切り出す。
その後、切り出されたズレ検出用部分画像B中においてズレ検出用部分画像Aに最も適合する領域をサブピクセル精度で求める。その手法としては、ズレ検出用部分画像Aをテンプレートとした正規化相関パターンマッチングが挙げられる。
正規化相関パターマッチングの例として、既知であるところの正規化相関式を用いて相関を算出する。一般的にN画素からなる2つのパターンInput(I)とTarget(T)の相関式は、下記式(2)と表すことができる。ここで、α、β、γはそれぞれ下記のように表せる。
例えば、n=5、m=7の場合、ズレ検出用部分画像B(m×m)のなかのズレ検出用部分画像Aと同サイズの領域(n×n)ごとに上記相関式を演算すると、結果として3×3の相関値Mapが生成される。この相関値Mapを用いて、フィットする2次曲面を求める。2次曲面の求め方としては、例えば、S(x,y)=a*x*x+b*x*y+c*y*y+d*x+e*y+fとして、9点のうち相関値の高い6点を選び、連立方程式を解いて各係数を求める。この関数の極値(=最大値)の座標値(x、yの両方)の小数点以下の値が所定範囲(ここでは、0.3〜0.7)であれば、処理実行条件「必要画像データ数:2、ずれ量:0.3〜0.7」を満たすものと判定する。
なお、極値の求め方は、上記2次式を偏微分し、それぞれが0である点の座標を求めればよい。このとき、実際には各係数(a〜f)を求める必要はないので、直接相関値(S1〜S6)を用いたほうが効率的である。求めるべき式(3)は以下のようになる。ここで、原点は着目するウィンド基準となる。
なお、このようなサブピクセル精度の位置ズレ確認を少なくとも一か所にて行うが、数か所で行うことが望ましい。そして、撮像画像判定部102は、処理実行条件を満たすか否かの判定結果を制御部109に出力する。
(3−4)明るさ、コントラスト、カラーバランス、ブレの判定
また、撮像画像判定部102は、撮像画像の明るさ、コントラスト、カラーバランス、ブレ(激しい手ぶれ)の各項目について判定する。
明るさについては、例えば露出オーバー(明るすぎる)やアンダー(暗すぎる)の場合に再度の撮像が必要となるケースが考えられる。そこで、撮像画像判定部102は、例えば、撮像画像データの画素値のうち、最大のものと最小のものを求め、最大値がある閾値(例えば8ビットで100など)以下であれば、露出アンダーとし、最小値がある閾値(例えば8ビットで150など)以上であれば、露出オーバーとする判定結果を制御部109に出力する。
そして、制御部109は、露出アンダーまたは露出オーバーの判定結果を受けると、その旨および再撮像を促す指示を表示部105に表示させる。もしくは、制御部109は、露出アンダーの場合には、撮像部101における露光時間を長くするように設定変更し、露出オーバーの場合には、露光時間を短くするように設定変更する。その後、制御部109は、ユーザに再撮像を促す指示を通知してもよい。
コントラストについては、撮像画像判定部102は、撮像画像データの画素値のうちの最大・最小の差分値が所定閾値以下の場合、コントラスト不足と判定する。そして、制御部109は、コントラスト不足との判定結果を受けると、その旨および再撮像を促す指示を表示部105に表示させる。
なお、明るさ・コントラストの判定において、撮像画像判定部102は、各色チャンネルに対して判定を行っても良いし、平均値(R+G+B/3)や明度値(0.299×R+0.587×G+0.114×B:NTSC準拠)を用いても良い。
カラーバランスについては、各色チャンネル(RGB)の平均値や最大・最小値の比較を行うことで、ある一つのチャンネルに過度の偏りが発生していることを把握できる。そこで、撮像画像判定部102は、例えば、撮像画像中の最大明度値付近の値(最大明度〜最大明度−5程度)を持つ画素値の各色チャンネルの値の平均値(Ra,Ga,Ba)を求め、その各色チャンネルの最大値と最小値の差分が値に応じた一定値以上[Max(Ra,Ga,Ba)−Min(Ra,Ga,Ba)>0.1×Max(Ra,Ga,Ba)]である場合に、カラーバランス不良であると判定する。そして、制御部109は、カラーバランス不良であるとの判定結果を受けると、その旨および再撮像を促す指示を表示部105に表示させる。
ブレ(激しい手ぶれ:いわゆるモーションブラー)については、発生時にエッジの先鋭性が低下することから、撮像画像判定部102は、図10に挙げたようなエッジ抽出フィルタを用いて、エッジ強度画像を作成してヒストグラムを取り、その標準偏差値(前記分散の二乗根)を求める。そして、当該標準偏差値が所定閾値(例えば5)以下の場合、ブレが発生していると判定する。そして、制御部109は、ブレが発生しているとの判定結果を受けると、その旨および再撮像を促す指示を表示部105に表示させる。
(4)ユーザへの通知に関して
撮像画像判定部102から判定結果を受けた制御部109は、その判定結果に応じて、再撮像を促すメッセージを表示部105に表示させる。
例えば、撮像画像判定部102から傾き角度θが所定範囲内でない旨の判定結果を受けた場合、制御部109は、撮像対象物が傾かないようにして再度撮像することを促すメッセージを表示部105に表示させる。
また、幾何学的歪みの度合いを示す特徴量(ここでは、撮像画像における撮像対象物の対辺の長さの比)が所定範囲内でない旨の判定結果を受けた場合、制御部109は、撮像対象物における文書画像が形成された平面の法線方向から再度撮像することを促すメッセージを表示部105に表示させる。
さらに、撮像画像判定部102の傾きの判定もしくは幾何学的歪みの判定によってユーザが所望する撮像対象物のエッジが1組以上検知されない旨の判定を受けた場合、制御部109は、撮像する画像内にユーザが所望する撮像対象物が納まる格好で再度撮影することを促すメッセージを表示部105に表示させる。
また、所定量だけずれた撮像画像が所定数ない旨の判定結果を受けた場合、制御部109は、例えば「この画像は処理できない可能性があります。もう一度撮影し直し下さい。」などの、再度撮像を促すメッセージを表示部105に表示し、新たに画像を得るようにする。その後、新たに撮像した複数の撮像画像について、撮像画像判定部102が再度判定処理を行い、全ての処理実行条件を満たすと判定されたときに、当該撮像画像を後段の処理に用いる。もしくは、前に撮像した撮像画像および再度撮像された撮像画像の組合せに対して、撮像画像判定部102が再度判定処理を行い、全ての処理実行条件を満たす撮像画像を後段の処理に用いてもよい。
(5)指定領域抽出部110の処理について
次に、指定領域抽出部110の処理について説明する。
図11に示すように、指定領域抽出部110は、表示部105のディスプレイ上に表示された撮像画像において、ユーザが出力することを希望する領域内(図11では、撮像対象物の領域)の任意の一つのポイントを指やタッチペンで指定した際に、タッチされたポイントの座標(指定領域の座標)を抽出する。
また、ユーザによって押圧されたポイントは、ある程度の大きさをもった領域になるので、指定領域抽出部110は、指定された領域のx,y座標の範囲もしくは指定された領域の中心座標を抽出するようになっている。
さらに、図12に示すように、隣接するポスターや掲示板も撮像画像に含まれる場合、撮像画像が表示された表示部105上でユーザがポイントを指定することにより所望の撮像対象物のみを選択することができる。指定領域抽出部110で抽出された座標は、ユーザが指定した指定座標として制御部109に出力される。
このように、指定領域抽出部110は、ユーザによって指定された撮像画像上の位置を示す座標情報を生成する位置情報生成部であるといえる。
(6)制御部109における、モードの決定処理および関連情報の特定処理について
次に、制御部109における、モードの決定処理および画像出力装置200に送信する関連情報の特定処理について説明する。
上述したように、制御部109は、撮像画像データの画像出力装置200への送信指示が入力部106に入力された場合、オブジェクト抽出モードを選択するか否かを示す指示の入力を促す画面を表示部105に表示させる。なお、記憶部108に格納されている撮像画像データが複数存在する場合、撮像画像データ毎に当該撮像画像データで示される撮像画像を表示部105に表示し、各撮像画像に対して、オブジェクト抽出モードを選択するか否かを示す指示の入力を促す。例えば、各撮像画像ごとに、オブジェクト抽出モードを選択するためのボタンおよび次処理に進むためのボタンを表示しておく。そして、当該オブジェクト抽出モードを選択するためのボタンが押下された場合、押下されたボタンに対応する撮像画像に対してオブジェクト抽出モードを選択する指示が入力されたと判断する。一方、当該オブジェクト抽出モードを選択するためのボタンが押下されずに、次処理に進むためのボタンが押下された場合、撮像画像に対してオブジェクト抽出モードを選択しないものと判断すればよい。
撮像画像に対してオブジェクト抽出モードを選択しない旨の指示が入力された場合、制御部109は、当該撮像画像の全体を出力する非抽出モードであると決定する。
一方、オブジェクト抽出モードを選択する旨の指示が入力された場合、制御部109は、色抽出モードを選択するか否かを示す指示の入力を促す画面を表示部105に表示させる。具体的には、撮像画像毎にオプションボタンおよび次処理に進むためのボタンを表示しておき、このオプションボタンが押下されたときに、色抽出モードを実行するか否かを選択できるようにしておく。例えば、「色選択」というボタンを表示する。
「色選択」ボタンが押下された場合に、制御部109は、色抽出モードを実行すると決定する。そして、制御部109は、押下されたボタンに対応する撮像画像とともに、抽出すべき領域内の任意の一つのポイントの指定を促す通知を表示部105に表示する。そして、制御部109は、指定領域抽出部110に対して、指定されたポイントの座標情報を抽出させる。
また、「色選択」ボタンが押下されずに次処理に進むためのボタンが押下された場合、制御部109は、撮像画像判定部102により生成されたエッジ情報が一つ以上あるか否か判断する。撮像画像判定部102によりエッジ情報が一つも生成されていない場合、制御部109は、オブジェクト抽出モードの実行が不可能であることをユーザに通知し、撮像画像の全体を出力する非抽出モードであると決定する。
撮像画像判定部102によりエッジ情報が一つ以上生成されている場合、制御部109は、抽出すべき領域内の任意の一つのポイントを指定するか否かの指示の入力を促す画面を表示部105に表示する。当該ポイントを指定する旨の指示が入力された場合、制御部109は、エッジ抽出モードを実行するものと決定し、撮像画像とともに抽出すべき領域内の任意の一つのポイントの指定を促す通知を表示部105に表示する。そして、制御部109は、指定領域抽出部110に対して、指定されたポイントの座標情報を抽出させる。
一方、当該ポイントを指定しない旨の指示が入力された場合、制御部109は、自動抽出モードを実行するものと決定する。
そして、制御部109は、実行するモードに応じて、画像出力装置200に送信する情報(送信情報)を以下のように特定する。
非抽出モードの場合、制御部109は、撮像画像データ、出力処理情報、エッジ検知信号(後述する)、色抽出選択信号(後述する)、記憶部108に格納された携帯端末装置100の機種情報およびユーザ情報を送信情報とする。
自動抽出モードの場合、制御部109は、撮像画像データ、出力処理情報、エッジ検知信号、色抽出選択信号、撮像画像判定部102が生成したエッジ情報、記憶部108に格納された携帯端末装置100の機種情報およびユーザ情報を送信情報とする。
エッジ抽出モードの場合、制御部109は、撮像画像データ、出力処理情報、エッジ検知信号、色抽出選択信号、撮像画像判定部102が生成したエッジ情報、指定領域抽出部110が生成した座標情報、記憶部108に格納された携帯端末装置100の機種情報およびユーザ情報を送信情報とする。
色抽出モードの場合、制御部109は、撮像画像データ、出力処理情報、エッジ検知信号、色抽出選択信号、指定領域抽出部110が生成した座標情報、記憶部108に格納された携帯端末装置100の機種情報およびユーザ情報を送信情報とする。
ここで、エッジ検知信号とは、エッジ検出の有無を示す信号であり、制御部109が撮像画像判定部102により生成されたエッジ情報の個数に従って生成するものである。例えば、撮像画像判定部102によって線分状に連なるエッジ画素の群が検知されない場合、つまり、撮像画像判定部がエッジ情報を生成しない場合に「0」とし、撮像画像判定部102によって線分状に連なるエッジ画素の群が検知された場合、つまり、撮像画像判定部102がエッジ情報を生成した場合に「1」とするエッジ検知信号を生成してもよい。もしくは、撮像画像判定部102により生成されたエッジ情報の個数に応じて、000:「エッジ情報なし」、001:「エッジ情報を1つ検出」、010:「エッジ情報を2つ検出」、011:「エッジ情報を3つ検出」、100:「エッジ情報を4つ検出」とするエッジ検知信号を用いてもよい。以下では、「0」「1」のエッジ検知信号を用いる例について説明する。
ただし、制御部109は、実行するモードが非抽出モードまたは色抽出モードのときには、エッジを用いた抽出を行わないため、撮像画像判定部102により生成されたエッジ情報の個数に拘わらず、「0」のエッジ検知信号を生成するものとする。このように、エッジ検知信号は、エッジを用いた抽出を行うか否かを示す信号ともいえる。
また、色抽出選択信号とは、色抽出モードを実行するか否かを示す信号であり、制御部109により生成される。具体的には、制御部109は、実行するモードが色抽出モードである場合に色抽出選択信号「1」を生成し、これ以外の場合に色抽出選択信号「0」を生成する。
(7)画像出力装置の構成
次に、図13〜24に基づいて、本実施形態に係る画像出力装置200の構成について説明する。本実施形態において、画像出力装置200は、スキャナ、プリンタ、複写機等の機能を備えた複合機である。
図13は、画像出力装置200の構成を示すブロック図である。画像出力装置200は、画像読取部201、画像処理部202、認証部203、画像形成部(出力部)204、表示部205、入力部206、第1通信部(受信部、エッジ情報取得部、指定情報取得部)207、第2通信部(出力部)208、記録媒体アクセス部209、記憶部210、および制御部(出力部、切り換え部)212を備えている。
画像読取部201は、原稿を読み取るものであり、CCD(Charge Coupled Device)を備えたスキャナ部を有し、原稿から反射してきた光を、RGBに色分解された電気信号(アナログの画像信号)に変換し、この電気信号を出力するものである。
画像処理部202は、撮像画像データに対して、所定の画像処理を行うものである。本実施形態では、図14に示すように、画像処理部202は、携帯端末装置から送信された撮像画像データに対して、撮像対象物の抽出を行うオブジェクト抽出部(エッジ抽出処理部、濃度値抽出処理部)305と、撮像画像データの補正処理を行う画質調整部301・幾何学補正部302・レンズ歪み補正部303・超解像化処理部304が備えられている。画像処理部202が撮像画像データに対して行う処理の詳細については後述する。
認証部203は、携帯端末装置100から受信した撮像画像データの出力処理を行う際に、ユーザ認証を行うものである。具体的には、認証部203は、携帯端末装置100から受信したユーザ情報と、入力部206に入力されたユーザ情報(ユーザIDおよびパスワード)とを照合してユーザ認証を行う。認証部203は、認証結果を制御部212に送る。
画像形成部204は、例えば電子写真方式やインクジェット方式を用いて、紙などの記録用紙上に画像を形成するものである。すなわち、画像形成部204は、出力処理の一つでとして、画像処理部202によって所定の処理が実行された撮像画像データに基づいた印刷処理を実行するものである。
表示部205は、例えば液晶ディスプレイ等より構成される。また、入力部206は、例えば液晶ディスプレイのタッチパネルやボタンを押すことなどによりデータの入力を行うためのものである。
第1通信部207は、USB1.1またはUSB2.0の規格に基づく、シリアル転送やパラレル転送、無線データ通信機能を有するものである。第1通信部207は、携帯端末装置100から、ファイルネーム、携帯端末装置100の機種情報、ユーザ情報および出力処理情報等の関連情報が付加された撮像画像データを受信する。すなわち、第1通信部207は、エッジ情報を受信(取得)するエッジ情報取得部、座標情報(指定位置情報)を受信(取得)する指定情報取得部としても機能している。
第2通信部208は、(a)無線LANの規格である、IEEE802.11a、IEEE802.11bおよびIEEE802.11gのいずれかに基づく無線技術を利用したデータ通信、(b)イーサネット(登録商標)を利用した通信用インターフェースの機能を有し、LANケーブルを介した、ネットワークとのデータ通信、(c)無線通信規格である、IEEE802.15.1(いわゆるBluetooth(登録商標))やIrSimpleなどの赤外線通信規格、Felica(登録商標)などの通信方式のいずれかに基づく無線技術を利用したデータ通信、の機能を有するものである。
第2通信部208は、出力処理として、画像処理部202によって所定の処理が実行された撮像画像データをサーバに格納するファイリング処理、もしくは、画像処理部202によって所定の処理が実行された撮像画像データを添付したメールを送信するメール送信処理を実行する。
記録媒体アクセス部209は、プログラムが記録された記録媒体から、プログラムを読み出すものである。記憶部210は、上記各部が処理を実行するためのプログラムを記憶するためのものである。
制御部212は、画像出力装置200の各部の制御を行うものである。具体的には、制御部212は、第1通信部207が携帯端末装置100から撮像画像データを受信した場合、当該画像データを画像処理部202の各画像補正処理部301〜304に出力して画像処理を実行させる。
次に、制御部212は、受信した撮像画像データに座標情報が付けられていないがエッジ検知信号「1」が付けられている場合、画像処理部202のオブジェクト抽出部305に対して、後述する(8−4−1)に記載のオブジェクト抽出処理を実行させる。
また、制御部212は、受信した撮像画像データに座標情報およびエッジ検知信号「1」が付けられている場合、画像処理部202のオブジェクト抽出部305に対して、後述する(8−4−2)に記載のオブジェクト抽出処理を実行させる。
さらに、制御部212は、受信した撮像画像データに色抽出選択信号「1」が付けられている場合、画像処理部202のオブジェクト抽出部305に対して、後述する(8−4−3)に記載のオブジェクト抽出処理を実行させる。
このように、制御部212は、(8−4−1)(8−4−2)(8−4−3)のいずれの抽出処理を実行させるかを切り換える切り換え部としても機能している。
なお、制御部212は、受信した撮像画像データに付けられているエッジ検知信号および色抽出選択信号の両方が「0」である場合、オブジェクト抽出部305に対して処理実行指示を出力しない。
また、制御部212は、撮像画像データに付けられているユーザ情報を認証部203に出力し、認証部203に認証処理を実行させる。制御部212は、認証部203から認証成功の認証結果を受けると、撮像画像データに付けられていた出力処理情報に従って処理を実行させる。
すなわち、出力処理情報が印刷処理を示している場合、制御部212は、画像処理部202によって画像処理が施された撮像画像データに基づいた印刷を画像形成部204に実行させる。また、出力処理情報がファイリング処理またはメール送信処理を示している場合、制御部212は、画像処理部202によって画像処理が施された撮像画像データに基づいたファイリング処理またはメール送信処理を第2通信部208に実行させる。
(8)画像処理部における画像処理について
次に、画像処理部202が実行する画像処理の詳細について説明する。なお、画像処理部202は、画像読取部201が読み取った画像データに対しても画像処理を行うが、ここでは、携帯端末装置100から受信した撮像画像データに対する画像処理の内容について説明する。
本実施形態において、画像処理部202は、携帯端末装置100から送信されてきた撮像画像データに対して、画質調整部301部によるカラーバランス・コントラストの補正、幾何学補正部302による幾何学的歪みの補正、レンズ歪み補正部303によるレンズ歪みの補正、超解像化処理部304による高解像度補正、および、オブジェクト抽出部305によるオブジェクト抽出処理を行う。以下、各補正、抽出の処理について説明する。
(8−1)カラーバランス・コントラストの補正
カラーバランスの補正方法としては、画質調整部301は、受信した撮像画像データについて、各色チャンネルの最大値・最小値を求め、これらを揃えるようなルックアップテーブルを作成し、各色チャンネルに適用すればよい。ルックアップテーブルの一例としては、図15に示すように、あるチャンネルの最大値がMX、最小値がMNである場合、データが8bitのとき、MNから(MX−MN)/255のステップで増加させていくようなテーブルを作成すればよい。
画質調整部301は、コントラストの補正についても同様の方法で実行することができる。なお、カラーバランスを特に変える必要がなければ、各色チャンネルに適用するルックアップテーブルを同一のものとすればよい。
なお、カラーバランス・コントラストの補正方法についてはその他の公知の技術を適用してもよい。
(8−2)幾何学的歪みの補正・レンズ歪みの補正
幾何学補正部302は、撮像画像判定部102における処理と同様にして、撮像画像における撮像対象物のエッジ上の点をラスター走査によって順次検出する。そして、画像処理部202は、検出されたエッジ上の点を曲線近似し、その曲線の式からレンズひずみ補正を行う。
具体的には、図16の実線で示されるように、レンズ歪み補正部303は、検出した撮像対象物のエッジ点を検出し、撮像画像判定部102と同様に、各エッジ点を撮像対象物の4辺に対応する4つの群に分類する。そして、各群に属するエッジ点に対して2次曲線近似を行う。このようにして4つの群に対して求めた2次曲線は、撮像対象物の4辺に対応する。
また、レンズ歪み補正部303は、4つの2次曲線で囲まれる領域の角部に相当する、4つの2次曲線の交点を求める。次に、レンズ歪み補正部303は、各辺に対して求めた2次曲線に外接し、かつ、4つの交点を結んだ四角形(図16において点線で示される)と合同な外接四角形(図16において1点鎖線で示される)を求める。
そして、レンズ歪み補正部303は、このようにして求めた外接四角形が補正後の対象物のエッジ画素の位置となるように、撮像画像における撮像対象物の領域内の画素位置を変換する。この変換は、基準点(例えば撮像対象物の領域の重心点)からのベクトルを基に計算すればよい。これにより、携帯端末装置100の撮像部101によるレンズ歪みを補正することができる。
また、幾何学補正部302は、幾何学的歪みの補正を以下のようにして実行する。幾何学補正部302は、例えば、図17に示すように、上記のようにして求めた外接四角形を対象物のアスペクト比(例えば、ビジネス文書出用いられているA判B判なら7:10であるなど)に合わせ同様に写像変換すればよい。当該写像変換としては公知の技術を用いることができる。なお、画像処理部202は、予め記憶部210に記憶されているアスペクト比に合うように変換してもよいし、入力部206に入力されたアスペクト比に合うように変換してもよい。
なお、幾何学的歪みの補正およびレンズ歪みの補正の方法としては、上記の方法に限定されるものではなく公知の技術を用いることができる。
(8−3)複数の画像データを用いた高解像度補正
上述したように、画像出力装置200は、携帯端末装置100から、同一の撮像対象物に対して撮像された複数の撮像画像データを受信する。そして、超解像化処理部304は、当該複数の撮像画像データに基づいて高解像度補正を行う。
複数の画像データからの高解像度画像作成方法に関しては、映像情報メディア学会誌Vol.62、No.3、pp.337〜342(2008)にいくつかの方法が紹介されている。一般的には、高解像度補正は、複数の画像の位置合わせ処理と再構成処理により成立する。本実施形態では、位置合わせ処理の例として、上記(3−3)記載の正規化相関パターマッチングの方法を適用する。すなわち、上記S(x,y)が極大値を示すズレ量だけずらすことにより、複数の画像の位置合わせを行うことができる。
次に、超解像化処理部304は、再構成処理を行う。すなわち、超解像化処理部304は、解像度変換後の倍率に応じた画素数を有する再構成画像データを作成する。ただし、画像サイズは、撮像画像のサイズと同一とする。そして、超解像化処理部304は、再構成画像データの各画素の画素値を以下のようにして決定する。すなわち、超解像化処理部304は、再構成画像データにおける各画素(再構成画素)について、当該再構成画素の近傍となる撮像画像の画素(撮像画素)を複数の撮像画像の中から決定し、一般的な補間方法(線形補間やバイキュービック補間など)で補間を行う。
具体的には、図18に示されるように、着目する再構成画素近傍の撮像画素、例えば撮像画素の格子を結ぶ線(図の点線)が最も近距離である2点を横方向・縦方向のそれぞれで選択する。ここでは、横方向での最も近距離である2点は、1枚目の撮像画像の撮像画素1−2(画素値:Vi1−2:以下同様)および撮像画素1−4であり、縦方向での最も近距離である2点は、2枚目の撮像画像の撮像画素2−1および撮像画素2−2であったとする。なお、再構成画素近傍の撮像画素を選択する際には、上記幾何学的歪みの補正・レンズ歪みの補正が実行された複数の撮像画像データの中から選択するものとする。これにより、幾何学的歪み・レンズ歪みの補正がされた状態で高解像度補正を行うことができる。もしくは、補正後の座標の値を計算する際に、基となる複数の撮像画像の該当する幾何学補正・レンズ歪みの補正を考慮した座標の値を基に求めてもよい。つまり、幾何学補正・レンズ歪みの補正値のみ算出し、再構成処理を行った後に、当該補正値により座標変換を行ってよい。
そして、横方向および縦方向のそれぞれについて選択した2点を結ぶエッジに垂直であり、かつ着目する再構成画素の点を含む直線と当該エッジとの交点を求める。図18に示されるように、当該交点が2つのエッジのそれぞれについてt:1−t、u:1−uで内分している場合、超解像化処理部304は、着目する再構成画素の画素値Vsを下記式4に基づいて求めればよい。この場合は、線形補間を行ったことになる。そして、全ての再構成画素について同様にして画素値を求め、高解像度化された再構成画像データを生成することができる。
なお、補間方法として別の手法を用いても良い。また、映像情報メディア学会誌Vol.62、No.3、pp.337〜342(2008)に紹介されている別の方法を用いてもよい。例えば、MAP(Maximum A Posteriori)法のような、先ず推定に基づく事後確率に対応する評価関数を最小化することで求める手法を用いても良い。
(8−4)オブジェクト抽出処理
オブジェクト抽出部305は、第1通信部207が受信した撮像画像データ、エッジ情報、座標情報、ならびに、色抽出選択信号等に基づいて、撮像画像データから一部の領域を抽出する処理を行う。なお、オブジェクト抽出部305は、制御部212から入力された情報に応じて、以下の(8−4−1)自動抽出モードによる抽出処理、(8−4−2)エッジ抽出モードによる抽出処理、(8−4−3)色抽出モードによる抽出処理(画素抽出処理)を行う。
なお、上述したように、オブジェクト抽出部305は、(A)エッジ検知信号が「1」であり、携帯端末装置から座標情報を受信していない撮像画像データに対して自動抽出モードによる抽出処理を、(B)エッジ検知信号が「1」であり、携帯端末装置から座標情報を受信している撮像画像データに対してエッジ抽出モードによる抽出処理を、(C)色抽出選択信号が「1」である撮像画像データに対して色抽出モードによる抽出処理を実行する。すなわち、オブジェクト抽出部305は、エッジ情報に基づいて抽出処理を行うエッジ抽出処理部としても機能する(以下の(8−4−1)および(8−4−2))し、色(画素値(濃度値))に基づいて抽出処理を行う濃度値抽出処理部としても機能する(以下の(8−4−3))。
(8−4−1)自動抽出モードによる抽出処理(エッジ情報のみに基づく抽出処理)
オブジェクト抽出部305は、エッジ情報に基づいて、撮像画像の中から一部の領域を抽出する処理を行う。具体的な処理は以下のとおりである。
まず、オブジェクト抽出部305は、各撮像画像について、受信した全てのエッジ情報で示される線分の位置を特定する。そして、各線分の端部の位置が別の線分の端部の位置と一致するか否かを判定する。具体的には、端部同士の座標が同じであれば一致すると判定すればよい。そして、両端のいずれもが別の線分の端部と一致している複数の線分を辺とし、かつ、全ての内角が180°未満である四角形が検出された場合、オブジェクト抽出部305は、当該四角形で囲まれる領域を抽出領域として決定する。
なお、両端のいずれもが別の線分の端部と一致している複数の線分を辺とし、かつ、全ての内角が180°未満である四角形が複数個検出された場合、オブジェクト抽出部305は、最も面積の大きい四角形で囲まれる領域を抽出領域として決定すればよい。もしくは、検出した複数個の四角形を表示部に表示し、ユーザによって選択された四角形で囲まれる領域を抽出領域として決定してもよい。
一方、両端のいずれもが別の線分の端部と一致している複数の線分を辺とし、かつ、全ての内角が180°未満である四角形が検出されない場合(例えば図21に示すような撮像対象物の一部が撮像されていない画像の場合)、オブジェクト抽出部305は、各線分について、別の線分の端部と一致していない端部を非接続端部として特定する。そして、オブジェクト抽出部305は、非接続端部が撮像画像の辺上であるか否かを判断する。ここで、撮像画像の辺とは、矩形状の撮像画像の端部である上辺、下辺、左辺、右辺のことである。もしくは、撮像画像の辺とは、矩形状の撮像画像の外周(枠)を構成する線分である。
次に、オブジェクト抽出部305は、(a)両端のいずれもが別の線分の端部と一致している線分、(b)一方の端部が別の線分の端部と一致しており、かつ、他方の端部が撮像画像の辺上に位置する非接続端部である線分、および、(c)両端のいずれもが撮像画像の辺上に位置する線分、のいずれかに当てはまる線分を候補線分として抽出する。そして、オブジェクト抽出部305は、候補線分と撮像画像の辺上の線分とを辺とし、かつ、全ての内角が180°未満である多角形を検出する。このような多角形が検出された場合、当該多角形で囲まれる領域を抽出領域として決定する。なお、このような多角形が複数検出された場合、オブジェクト抽出部305は、最も面積の大きい多角形で囲まれる領域を抽出領域として決定すればよい。もしくは、検出した複数個の多角形を表示部205に表示し、ユーザによって選択された四角形で囲まれる領域を抽出領域として決定してもよい。
このような多角形が一つも検出されない場合、オブジェクト抽出部305は、エッジ情報のみに基づいて一部の領域を抽出することが不可能であると判定し、撮像画像の全てを出力対象領域として決定する。
そして、オブジェクト抽出部305は、撮像画像の中から決定した抽出領域を切り出し、出力対象画像データを生成する。なお、撮像画像の全てを出力対象領域として決定する場合は、撮像画像データの全てを出力対象画像データとすればよい。
例えば、図22に示される撮像画像では、エッジ情報で示される線分a、b、c、dで囲まれる領域が抽出領域として決定される。
(8−4−2)エッジ抽出モードによる抽出処理(エッジ情報および座標情報に基づく抽出処理)
オブジェクト抽出部305は、エッジ情報および座標情報に基づいて、撮像画像の中から一部の領域を抽出する処理を行う。具体的な処理は以下のとおりである。
まず、オブジェクト抽出部305は、各撮像画像について、受信した全てのエッジ情報で示される線分の位置を特定する。そして、各線分の端部の位置が別の線分の端部の位置と一致するか否かを判定する。具体的には、端部同士の座標が同じであれば一致すると判定すればよい。そして、両端のいずれもが別の線分の端部と一致している複数の線分を辺とし、かつ、全ての内角が180°未満である四角形が検出された場合、オブジェクト抽出部305は、当該四角形で囲まれる領域を抽出領域候補とする。
また、オブジェクト抽出部は、各線分について、別の線分の端部と一致していない端部を非接続端部として特定する。そして、オブジェクト抽出部305は、非接続端部が撮像画像の辺上であるか否かを判断する。
そして、オブジェクト抽出部305は、(a)両端のいずれもが別の線分の端部と一致している線分、(b)一方の端部が別の線分の端部と一致しており、かつ、他方の端部が撮像画像の辺上に位置する非接続端部である線分、および、(c)両端のいずれもが撮像画像の辺上に位置する線分、のいずれかに当てはまる線分を候補線分として抽出する。そして、オブジェクト抽出部305は、候補線分と撮像画像の辺上の線分とを辺とし、かつ、全ての内角が180°未満である多角形を検出する。このような多角形が検出される場合、当該多角形で囲まれる領域を抽出領域候補とする。
オブジェクト抽出部305は、上記のようにして求めた抽出領域候補の中から、内部に座標情報で示される座標が含まれる一つの抽出領域候補を選択し、選択した抽出領域候補を抽出領域として決定する。
なお、内部に座標情報で示される座標が含まれる抽出領域候補が複数存在する場合、面積の最も大きい候補を抽出領域候補として決定すればよい。もしくは、内部に座標情報で示される座標が含まれる抽出領域候補の全てを表示部に表示して、ユーザによって選択された候補を抽出領域として決定してもよい。
なお、上記のような抽出領域候補が一つも存在しない場合、または、内部に座標情報で示される座標が含まれる抽出領域候補が存在しない場合、オブジェクト抽出部305は、一部の領域を抽出することが不可能であると判定し、撮像画像の全てを出力対象領域として決定する。
そして、オブジェクト抽出部305は、撮像画像の中から決定した抽出領域を切り出し、出力対象画像データを生成する。なお、撮像画像の全てを出力対象領域として決定する場合は、撮像画像データの全てを出力対象画像データとすればよい。
(8−4−3)色抽出モードによる抽出処理(座標情報で示される位置の画素値に基づく処理)
オブジェクト抽出部305は、座標情報で示される位置を含む所定範囲(例えば、5mm角)内における代表色を求める。例えば、オブジェクト抽出部305は、所定範囲内に属する複数の画素において最も高い頻度で分布する色(画素値)を代表色として求める。もしくは、オブジェクト抽出部305は、所定範囲内に属する複数の画素において所定閾値以上の頻度で分布する色(画素値)を代表色として求めてもよい。もしくは、オブジェクト抽出部305は、所定範囲内に属する複数の画素の画素値の平均値を代表色として求めても良い。
次に、オブジェクト抽出部305は、撮像画像全体から、代表色の画素値を中心として、例えば、±5の範囲内の画素値を有する画素を抽出する。そして、抽出した複数の画素の水平軸(X軸)座標および垂直軸(Y軸)座標の各々についてヒストグラムを作成し、各ヒストグラムにおいて、所定閾値以上の度数を有する区分が連続して存在している区分群を抽出する。上記所定閾値は、多くの画像サンプルを用いて、対象の画像領域が適切に抽出されるように設定しておく。
次に、オブジェクト抽出部305は、座標情報で示される座標が属する区分を含む区分群を候補区分群として特定する。さらに、候補区分群と当該候補区分群の隣の区分群との間の距離を求め、当該距離が例えば50画素以上であれば、隣の区分群は当該候補区群に含まれないと判断し、当該候補区分群を抽出対象の区分群とする。一方、候補区分群と当該候補区分群の隣の区分群との間の距離が50画素未満であれば、隣の区分群は当該候補区群に含まれると判断し、この二つの区分群のうちの最も小さい座標の区分から最も大きい座標の区分までの区分群を新たな候補区分群とする。
そして、新たな候補区分群と当該候補区分群の隣の区分群との間の距離を求めて、上記と同様の処理を行う。これを繰り返すことで、各ヒストグラムについて抽出対象の区分群を決定する。抽出対象の区分群であるか否かを判定する距離は、読み込まれた画像データの解像度にも依存するので、種々の画像サンプルを用いて、読取解像度ごとに適切な値を定めておけば良い。
そして、オブジェクト抽出部305は、X軸およびY軸の各々の軸について、当該軸に対応するヒストグラムから決定した抽出対象の区分群に含まれる最小値の座標および最大値の座標を求める。ここで、X軸に対して求めた最小値の座標をXmin、最大値の座標をXmaxとし、Y軸に対して求めた最小値の座標をYmin、最大値の座標をYmaxとすると、オウジェクト抽出部305は、(Xmin、Ymin)、(Xmin、Ymax)、(Xmax、Ymin)、(Xmax、Ymax)の4つの点を頂点とする矩形領域を抽出領域として決定する。
上記の処理を言い換えると、オブジェクト抽出部305は、図23に示すように、座標情報で示される一つのポイントを含み、かつ、当該ポイントの代表色に類似する色(つまり、代表色の画素値を含む所定範囲内の画素値)を有する画素の連結成分の領域の外接矩形領域を抽出領域と決定する、と言える。
最後に、オブジェクト抽出部305は、撮像画像の中から決定した抽出領域を切り出し、出力対象画像データを生成する。なお、オブジェクト抽出部305は、上記のようにして求めた矩形領域に対して、10%程度広い領域を抽出領域として決定してもよい。
(9)撮像画像処理システムの画像処理方法
以下、図1、図2に基づいて、撮像画像処理システムの処理の流れについて説明する。なお、図1は携帯端末装置100の処理フローを示し、図2は画像出力装置200の処理フローを示している。
まず、携帯端末装置100は、撮像モードの選択受付を行う。すなわち、携帯端末装置100の制御部109は、文書撮像モードが入力されたかどうかを判定する(S101)。ここで、ユーザは、文書画像を含む用紙や表示画面など矩形状の対象物を撮像し、撮像画像を画像出力装置200から出力することを希望する場合、文書撮像モードを選択する。
制御部109は、ユーザによって文書撮像モードが選択された場合(S101でYES)、高解像度補正を行う際の解像度変換の倍率の入力を促す画面を表示部105に表示し、当該倍率を入力部106から取得する。制御部109は、取得した倍率に応じて、撮像部101における撮像回数、撮像画像判定部102における処理実行条件の一部を決定する。また、制御部109は、出力処理の種類および出力処理のための設定条件の入力を促す画面を表示部105に表示し、入力部106から出力処理情報を取得する。
そして、撮像部101は、制御部109にて設定された撮像回数だけ連続して撮像する(S102)。
撮影終了後、画像処理部103は、撮像した画像のデータに対して少なくともA/D変換処理を行う。その後、制御部109は、撮像画像判定部102に対して、A/D変換処理された複数の撮像画像データが処理実行条件を満たすか否かを判定する処理を実行させる(S103)。なお、詳しい判定方法、判定項目などは、例えば上記(3−1)〜(3−3)で説明したとおりである。
次に、撮像画像判定部102が処理実行条件を満たすと判定した場合(S103でYES)、制御部109は、処理実行条件を満たすと判定された撮像画像データを記憶部108に記憶させる(S105)。そして、S109の処理に移行する。
一方、撮像画像判定部102が処理実行条件を満たさないと判定した場合(S103でNO)、制御部109は、表示部105に再撮像の旨を示すメッセージなどを表示して、ユーザに通知する(S104)。再撮像した画像であっても、上述した判定項目などを満足しない場合、携帯端末装置100はステップS102〜S104を繰り返して行う。
次に、S106において、制御部109は、ユーザによる撮像画像データの画像出力送信への送信指示が入力されたか否かを判定する。送信指示の入力がない場合(S106でNO)、制御部109は、S101の処理にもどる。
一方、送信指示が入力された場合(S106でYES)、制御部109は、ユーザによるオブジェクト抽出モードの選択有無の入力を受け付ける(S107)。
ところで、制御部109は、撮像モードの選択受付時に、ユーザによって文書撮像モードが選択されなかった場合(S101でNO)にも、ユーザによる撮像画像データの送信指示が有るかどうかを判定する(S106)。そして、文書撮像モードが選択されなかった場合でもユーザによる撮像画像データの送信指示が有る場合(S106でYES)、制御部109は、ユーザによるオブジェクト抽出モードの選択有無の入力を受け付ける(S107)。
ここで、ユーザは、撮像画像の中から一部の領域を抽出して、抽出した領域を画像出力することを希望する場合に、オブジェクト抽出モードを選択する指示を携帯端末装置100に入力することができる。一方、撮像画像の全体の出力を希望する場合には、オブジェクト抽出モードを選択しない旨の指示を入力すればよい。
続いて、制御部109は、エッジ検知信号と色抽出選択信号とを「0」に設定することによりエッジ検知信号と色抽出選択信号を初期化する(S108)。
次に、制御部109は、送信指示が入力された撮像画像データに対して撮像画像判定部102がエッジ情報を一つ以上生成したか否かを判定する。すなわち、当該撮像画像データから線分状に連なるエッジ画素の群が一組以上検出されたか否かを判定する(S109)。
エッジ情報が1つ以上生成された場合(S109でYES)、制御部109は、エッジ検知信号を「1」に設定する(S110)。そして、制御部109は、ユーザによりオブジェクト抽出モードが選択されたかどうかを判定する(S111)。
一方、撮像対象物のエッジが検出されていないと判定した場合(S109でNO)、制御部109は、エッジ検知信号を変更せずに、ユーザによりオブジェクト抽出モードが選択されたかどうかを判定する(S111)。
ユーザによりオブジェクト抽出モードが選択された場合(S111でYES)、制御部109は、S112の処理に移行する一方、ユーザによりオブジェクト抽出モードが選択されていなかった場合(S111でNO)、制御部109は、撮像画像全体を出力する非抽出モードを実行するものと判断し、エッジ検知信号が「1」の場合に「0」に変更して(S113)、S112の処理に移行する。
次に、S112において、制御部109は、ユーザにより色抽出モードが選択されたかどうかに基づいて、色抽出モードを実行するか否かを判定する。
具体的には、S109でYESであり、S111でYESであり、かつ、色抽出モードが選択された場合、制御部109は、エッジを用いたオブジェクト抽出モードを優先し、色抽出モードを実行しないものと判断する。このとき、制御部109は、エッジを用いたオブジェクト抽出モードを優先し、色抽出モードを実行しない旨の通知を表示部105に表示する。
なお、制御部109は、S109でYESであり、S111でYESであり、かつ、色抽出モードが選択された場合、エッジを用いたオブジェクト抽出モードを優先するか、あるいは、色抽出モードを実行すべきかどうかの入力を促す画面を表示部105に表示してユーザにどちらのモードを優先するかの選択を促すようにしても良い。そして、色抽出モードを選択する旨が入力されたときに、制御部109は、色抽出モードを実行するものと決定すればよい。
また、S109でYESであり、S111でYESであり、かつ、色抽出モードが選択されていない場合、制御部109は、色抽出モードを実行しないものと判断する。
さらに、S109でNOであり、S111でYESであり、かつ、色抽出モードが選択された場合、制御部109は、色抽出モードを実行するものと判断する。
このようにして色抽出モードを実行するか否かを決定する。そして、色抽出モードを実行すると決定した場合(S112でYES)、制御部109は、色抽出選択信号を「1」に設定する(S114)。その後、S115の処理に移行する。一方、色抽出モードを実行しないと決定した場合(S112でNO)、色抽出選択信号を「0」のままとし、S115の処理に移行する。
なお、S109でNOであり、S111でYESであり、かつ、色抽出モードが選択されていない場合、制御部109は、オブジェクト抽出モードが選択されたが抽出処理が不可能であると判断し、撮像画像全体を出力する非抽出モードを実行するものと決定する。このとき、制御部109は、エッジを用いたオブジェクト抽出モードが実行できない旨を表示部105に表示してもよい。
次に、S115において、制御部109は、撮像画像とともに、抽出すべき領域内の任意の一つのポイントの指定を促す通知を表示部105に表示する。そして、制御部109は、抽出すべき領域内の任意の一つのポイントの指定が入力されたか否かを判断する。
ただし、S114にて色抽出モードを実行するものと判断した場合、制御部109は、抽出すべき領域内の任意の一つのポイントの指定が入力されるまで待機するものとする。色抽出モードを実行するためには、抽出すべき領域内の任意の一つのポイントの指定が必要だからである。すなわち、S114にて色抽出モードを実行するものと判断した場合にはS115においてYESになるまで待機し、抽出すべき領域内の任意の一つのポイントの指定の入力以外の処理を受け付けない。その結果、S114にて色抽出モードを実行するものと判断した場合にはS115の処理の後は必ずS116に移行することとなる。一方、S112でNOであった場合には、制御部109は、抽出すべき領域内の任意の一つのポイントを指定するか否かの指示の入力を促す画面を表示部105に表示し、ポイントを指定する旨の指示が入力されたときに、ポイントの指定を促す通知を表示部105に表示するものとする。そのため、S112でNOであった場合には、S115において、YESおよびNOのいずれの場合も有り得ることとなる。
抽出すべき領域内の任意の一つのポイントの指定が入力された場合(S115でYES)、制御部109は、当該ポイントの座標(x,y)を示す座標情報を生成するように指定領域抽出部110を制御する(S116)。なお、S112でNOであり、かつ、S115でYESであった場合に、制御部109は、エッジ抽出モードを実行するものと決定する。その後、制御部109は、処理実行条件を満たす複数の撮像画像データにファイルネームを付ける(S117)。
一方、抽出すべき領域内の任意の一つのポイントの指定の入力がない場合(S115でNO)、制御部109は、処理実行条件を満たす複数の撮像画像データにファイルネームを付ける(S117)。なお、S112でNOであり、かつ、S115でNOであった場合に、制御部109は、自動抽出モードを実行するものと決定する。
なお、S117の処理では、制御部109は、例えば、撮像日時に従った連続番号など各撮像画像データについて異なるファイルネームを自動的に付けても良いし、入力部106に入力されたファイルネームを付けてもよい。
その後、制御部109は、色抽出選択信号が「1」であるかどうかを判定する(S118)。制御部109が、色抽出選択信号が「1」であると判定した場合(S118でYES)、制御部109は、撮像画像データを、出力処理情報、エッジ検知信号、色抽出選択信号、座標情報、ならびに、記憶部108に格納されている携帯端末装置100の機種情報およびユーザ情報と一緒に通信部104に転送する。そして、通信部104は、これらの情報を画像出力装置200に送信する(S119)。
一方、制御部109が、色抽出選択信号が「0」であると判定した場合(S118でNO)、制御部109は、撮像画像データを、出力処理情報、エッジ情報、エッジ検知信号、色抽出選択信号、座標情報、ならびに、記憶部108に格納されている携帯端末装置100の機種情報およびユーザ情報と一緒に通信部104に転送する。ただし、自動抽出モードを実行すると決定していた場合(S112でNO、かつ、S115でNOの場合)には、座標情報が生成されていないため、座標情報以外の情報を通信部104に出力する。そして、通信部104は、これらの情報を画像出力装置200に送信する(S120)。
なお、1回のシャッター押下による連続撮像により得られた複数の撮像画像データの組を撮像画像データセットとすると、記憶部108に格納され、画像出力装置200に未送信の撮像画像データセットが複数存在する場合、撮像画像データセットごとに、S106〜S120の処理を繰り返し行う。
次に、画像出力装置200の処理について図2を参照しながら説明する。まず、画像出力装置200の第1通信部207は、携帯端末装置100からの複数の撮像画像データ、機種情報、ユーザ情報および出力処理情報等を受信する(S211)。当該受信は、撮像画像データセットごとに行われる。そして、S212移行の処理は、撮像画像データセットごとに実行される。
撮像画像データセットおよびその関連情報を受信後、画像処理部202の画質調整部301は、例えば上述した(8−1)のとおり、カラーバランス・コントラストの補正を行う(S212)。また、画像処理部202の幾何学補正部302およびレンズ歪み補正部303は、例えば上記(8−2)に説明したとおり、幾何学的歪みの補正・レンズ歪みの補正を行う(S213)。ただし、4つのエッジ情報で示される位置の線分を辺とする四角形が検出できない場合、S213の処理を省略する。さらに、画像処理部202の超解像化処理部304は、例えば上記(7−3)に説明したとおり、複数の撮像画像データに基づいて高解像度補正を行う(S214)。
その後、制御部212は、携帯端末装置100から受信したエッジ検知信号が「1」であるかどうかを判定する(S215)。制御部212は、エッジ検知信号が「1」であると判定した場合(S215でYES)、オブジェクト抽出部305に対して処理実行を指示する。具体的には、座標情報を第1通信部207が受信していない場合、制御部212は、第1通信部207で受信された撮像画像データとエッジ情報とをオブジェクト抽出部305に出力して、上述した(8−4−1)の抽出処理を実行させることにより、抽出領域を示す出力対象画像データを生成させる(S216)。また、座標情報を第1通信部207が受信している場合、制御部212は、撮像画像データと座標情報とエッジ情報とをオブジェクト抽出部305に出力して、上述した(8−4−2)の抽出処理を実行させることにより、抽出領域を示す出力対象画像データを生成させる(S216)。なお、S213の処理により撮像画像データが写像変換されている場合、エッジ情報で示される位置および座標情報で示される座標についても同様に写像変換し、変換後の位置および座標を用いてS216の処理を実行すればよい。そして、制御部212は、オブジェクト抽出部305が生成した出力対象画像データにユーザ情報、出力処理情報等の情報を付けて記憶部210に格納する(S219)。
一方、制御部212は、携帯端末装置100から受信したエッジ検知信号が「0」であると判定した場合(S215でNO)、色抽出選択信号が「1」であるかどかを判定する(S217)。制御部212は、色抽出選択信号が「1」であると判定した場合(S217でYES)、撮像画像データと座標情報とをオブジェクト抽出部305に出力して、上述した(8−4−3)の抽出処理を実行させることにより、抽出領域を示す出力対象画像データを生成させる(S218)。そして、制御部212は、オブジェクト抽出部305が生成した出力対象画像データにユーザ情報、出力処理情報等の情報を付けて記憶部210に格納する(S219)。
一方、制御部212は、色抽出選択信号が「0」であると判定した場合(S217でNO)、撮像画像データをオブジェクト抽出部305に出力せずにS212〜S214の補正処理のみが行われた撮像画像データを出力対象画像データとして記憶部210に格納する(S219)。
次に、制御部212は、出力対象画像データの出力指示が入力部206に入力されたか否かを判定する(S220)。出力指示の入力がない場合(S220でNO)、出力指示が入力されるまで待機する。
一方、出力指示がある場合(S220でYES)、認証部203は、ユーザ情報(例えばユーザIDおよびパスワード)の入力を促す画面を表示部205に表示させ、ユーザ情報を入力部206から取得する。そして、認証部203は、ユーザ認証を行う(S221)。なお、認証部203は、画像出力装置200に設けられた非接触ICカードのリーダ/ライターを用いて、ユーザが所持する非接触ICカードからユーザ情報を取得してもよい。
ユーザ認証を行う際、認証部203は、入力されたユーザ情報と携帯端末装置100から受信したユーザ情報とを対照して、一致するユーザ情報が存在するか否か判定する(S222)。そして、入力されたユーザ情報と一致するユーザ情報を携帯端末装置100から受信している場合(S222でYES)、制御部212は、携帯端末装置100から受信したい出力処理情報に従って出力処理を実行させる(S223)。例えば、出力処理情報が印刷処理を示している場合、制御部212は、画像形成部204に対して処理実行指示を出力する。その後、処理を終了する。
一方、入力されたユーザ情報が、携帯端末装置100から受信したユーザ情報と一致していない場合(S222でNO)、認証部203は、認証回数が所定回数以上であるか判定する(S224)。そして、認証回数が所定回数以上でない場合(S224でNO)、S221,S222の処理を繰り返して行う。認証回数が所定回数以上である場合(S224でYES)、出力せずにフローを終了する。
以上のように、本実施形態によれば、画像出力装置200は、携帯端末装置100から、撮像部101の撮像により得られた撮像画像データを受信する第1通信部(受信部)を有する。さらに、画像出力装置200の第1通信部(エッジ情報取得部)は、撮像画像データで示される撮像画像の中から検出された、線分状に連なるエッジ画素の群であるエッジ画素群の撮像画像上の位置を示すエッジ情報を取得する。そして、画像出力装置200のオブジェクト抽出部(エッジ抽出処理部)305は、エッジ情報で示される4つの線分状のエッジ画素群を辺とし、かつ、全ての内角が180°未満の四角形で囲まれた領域である四角形領域、または、エッジ情報で示される少なくとも一つの線分状のエッジ画素群および上記撮像画像の端部(辺)上の少なくとも一つの線分を辺とし、かつ、全ての内角が180°未満の多角形で囲まれた領域である多角形領域を抽出領域として決定し、上記撮像画像データから抽出領域の画像データを出力対象画像データとして切り出す。そして、画像形成部(出力部)204または第2通信部(出力部)208は、出力対象画像データまたは当該出力対象画像データで示される画像を出力する。
制御部109は、入力されたエッジ情報からいくつのエッジが抽出されたかを示す旨のエッジ検知信号を設定して、通信部104に対してエッジが検出された撮像画像データ、エッジ情報、ならびにエッジ検知信号を画像出力装置200へ送信する送信処理を実行させる。
一方、画像出力装置200の制御部212は、通信部207で受信したエッジ検知信号に基づいて、エッジが検知されているかどうかを判定し、エッジが検出された撮像画像データとエッジ情報とを画像処理部202のオブジェクト抽出部305に出力する。オブジェクト抽出部305は、エッジが検出された撮像画像データとエッジ情報とに基づいて、撮像画像データから撮像対象物を選択領域として抽出する。
そして、オブジェクト抽出部305は、抽出した選択領域の撮像画像データを制御部212へ出力し、制御部212は抽出した選択領域の撮像画像データに出力処理情報等を付けて記憶部210に格納する。その後、ユーザによって出力指示がある場合、制御部212は画像形成部204に対して処理実行指示を出力する。
これにより、ユーザは、携帯端末装置100で撮像した撮像画像から所望の撮像対象物を抽出して、抽出した画像を容易に画像出力装置200から得ることができる。
(10)変形例
本発明の撮像画像処理システムは、上記の実施形態に限定されることがなく、様々な変更が可能である。以下、変形形態の一例について説明する。
(10−1)抽出モードについて
上記の説明では、撮像画像処理システムは、オブジェクト抽出モードとして、自動抽出モード、エッジ抽出モード、色抽出モードの3つのモードを有するものとした。
しかしながら、本発明は、これら3つのモードを有しているものに限られない。例えば、自動抽出モード、エッジ抽出モード、色抽出モードの少なくとも一つのモードによる抽出処理のみが実行可能な撮像画像処理システムであってもよい。
(10−1−1)自動抽出モードのみを有している形態
例えば、オブジェクト抽出モードとして自動抽出モードのみを有している撮像画像処理システムであってもよい。図25は、オブジェクト抽出モードとして自動抽出モードのみを有している撮像画像処理システムにおける携帯端末装置100の処理の流れを示すフローチャートである。なお、図25において、S225〜S230の処理は、図1のS101〜S106の処理と同じであるので説明を省略する。図25に示すように、入力部106に送信指示が入力されると、携帯端末装置100において、制御部109は、ユーザによるオブジェクト抽出モードの選択有無の入力を受け付ける(S231)。図25では、ユーザがオブジェクト抽出モードの選択指示を入力したものとした場合(S232)についての処理を示している。続いて、制御部109は、エッジ検知信号と色抽出選択信号とを「0」に設定することによりエッジ検知信号と色抽出選択信号を初期化する(S233)。
その後、制御部109は、送信指示が入力された撮像画像データに対して撮像画像判定部102がエッジ情報を一つ以上生成したか否かを判定する(S234)。エッジ情報が1つ以上生成された場合(S234でYES)、制御部109は、自動抽出モードを実行すると決定し、エッジ検知信号を「1」に設定する(S235)。
一方、撮像対象物のエッジが検出されていないと判定した場合(S234でNO)、制御部109は、オブジェクト抽出モードが選択されているが、抽出処理が不可能であると判断し、撮像画像全体を出力する非抽出モードを実行するものと決定する。そして、エッジ検知信号を変更せずに、S236の処理に移行する。
その後、図1のS117と同様に、撮像画像データにファイルネームを付けて(S236)、撮像画像データと関連情報とを画像出力装置200に送信する(S237)。なお、送信する関連情報は、上記(6)に記載した情報のうち、色抽出選択信号を除く情報である。
なお、図25では、S232のようにオブジェクト抽出モードが選択された場合を示しているが、S231においてオブジェクト抽出モードの選択指示を受け付けなかった場合には、S234およびS235の処理を省略すればよい。
図27は、本撮像画像システムにおける画像出力装置200の処理の流れを示すフローチャートである。図27に示すように、画像出力装置200においては、図2で示した処理のうちS217およびS218を省略した処理を実行する。すなわち、図27のS260〜S265は図2のS211〜S216と同様の処理であり、図2のS219〜S224は図27のS266〜S271と同様の処理である。
本システムでは、画像出力装置200は、エッジ検知信号が「1」であるかどうかを判定するステップ(S264)を行い、抽出処理として、エッジ検知信号が「1」である場合に(S264でYES)、エッジ情報に基づいて撮像画像から一部の領域を抽出する処理(S265)のみが行われる。ただし、本システムでは、自動抽出モードのみを実行するため、S265では、(8−4−1)に記載した処理のみを行う。また、S264でNOの場合、撮像画像データをオブジェクト抽出部305に出力せずにS260〜S263の補正処理のみが行われた撮像画像データを出力対象画像データとして記憶部210に格納すればよい(S266)。
(10−1−2)自動抽出モードおよびエッジ抽出モードのみを有している形態
また、例えば、オブジェクト抽出モードとして自動抽出モードおよびエッジ抽出モードのみを有している撮像画像処理システムであってもよい。図28は、オブジェクト抽出モードとして自動抽出モードおよびエッジ抽出モードのみを有している撮像画像処理システムにおける携帯端末装置100の処理の流れを示すフローチャートである。図28に示されるように、本システムの携帯端末装置100は、図1に示す処理のうちのS112およびS114を省略した処理を実行する。すなわち、図28のS272〜S282・S284は図1のS101〜S111・S113と同様の処理であり、図28のS283・S285〜287は図1のS115〜S120と同様の処理である。
図28に示すように、本システムでは、携帯端末装置100において、制御部109が、撮像対象物のエッジが1組以上検出されたかどうかを判定して(S280)、エッジ検知信号を「1」に変更した後(S281)、オブジェクト抽出モードが選択されたかどうかを判定し(S282)、その後、ユーザが指定した指定座標を抽出する処理(S285)を行わせるようにして、撮像画像データやエッジ情報、指定座標等を画像出力装置200に送信して(S287)、画像出力装置200でエッジ情報と指定座標に基づいて撮像対象物を抽出する処理を行う。なお、送信する関連情報は、上記(6)に記載した情報のうち、色抽出選択信号を除く情報である。
また、本システムにおける画像出力装置200の処理の流れは、図2の処理のうちS217およびS218の処理を省略した処理を実行すればよい。
(10−1−3)色抽出モードのみを有している形態
また、例えば、色抽出モードのみを有している撮像画像処理システムであってもよい。この場合、携帯端末装置100では、エッジ情報を生成することなく、座標情報を生成し、座標情報と撮像画像データとを画像出力装置200に送信すればよい。そして、画像出力装置200のオブジェクト抽出部305は、座標情報に基づいて、上記の(8−4−3)の処理を実行すればよい。
(10−2)処理実行条件について
さらに、上記の説明では、携帯端末装置100は、画像を撮影後、撮像画像データの送信指示の入力を受け付けた後に、オブジェクト抽出モードの選択有無の入力受付を行うものとした。しかしながら、オブジェクト抽出モードの選択有無の入力受付は、このタイミングに限られるものではない。
例えば、文書撮像モードの入力した直後に、オブジェクト抽出モードの選択有無の入力受付を行ってもよい。これにより、オブジェクト抽出モードに応じた抽出処理が実行できない撮像画像データである場合に、再度撮像させるようにユーザに通知することができる。
このような変形形態は、図1、図25、図28に示したいずれの形態に対しても適用することができる。ここでは、図25に適用した例について説明する。
図26は、文書撮像モードの入力した直後に、オブジェクト抽出モードの選択有無の入力受付を行う場合の携帯端末装置100の処理の流れを示すフローチャートである。
図26に示されるように、制御部109は、ユーザによって文書撮像モードが選択された場合(S241でYES)、ユーザによるオブジェクト抽出モードの選択有無の入力を受け付ける(S242)。その後、撮像部101は、シャッター押下に応じて、複数回連続して撮像する(S243)。
次に、制御部109は、オブジェクト抽出モードが選択されたかどうかを判定する(S244)。ユーザによってオブジェクト抽出モードが選択された場合(S244でYES)、制御部109は、エッジを用いたオブジェクト抽出に関する処理実行条件を、撮像画像判定部102が判定する処理実行条件として追加する(S245)。
ここで、エッジを用いたオブジェクト抽出に関する処理条件とは、例えば、下記の条件Aや条件B、条件Cが考えられる。
条件A:撮像画像中に、線分状に連なるエッジ画素の群が一つ以上存在する。
条件B:撮像画像中に、所定長さ以上の線分状に連なるエッジ画素の群が一つ以上存在する。
条件C:撮像画像中に線分状に連なるエッジ画素の群が一つ以上存在し、当該群で示される線分を辺とし、かつ、全ての内角が180°未満である四角形を一つ以上存在するか、もしくは、当該群で示される線分および撮像画像の辺上の線分を辺とし、かつ、全ての内角が180°未満である多角形が一つ以上存在する。
なお、条件Aは、撮像画像判定部102が生成するエッジ情報の数で判定できる。また、条件Bは、撮像画像判定部102が生成するエッジ情報の数、および、当該エッジ情報で示される線分の長さを求めることで判定できる。また、条件Cは、画像出力装置200のオブジェクト抽出部305と同様の処理を行うことにより判定できる。
そして、撮像画像判定部102は、撮像画像データが処理実行条件を満たすか否かを判定する(S246)。そして、処理実行条件を満たしていないを判定された場合(S246でNO)、制御部109は、再度撮像を指示する旨の通知を表示部105に表示する(S247)。例えば、エッジを用いたオブジェクト抽出に関する処理実行条件を満たさないと判定された場合、制御部109は、撮像対象物の輪郭が撮像画面内で明確になるように再度撮像することを促すメッセージを表示部105に表示させる。
これにより、画像出力装置200によりエッジを用いた抽出処理を実行する際のエラーの発生を抑えることができる。
なお、図26において、S248〜S254の処理は、図25のS229・230・S233〜S237の処理と同様である。
なお、本形態を図1に示す形態に適用する場合には、S242の処理において、オブジェクト抽出モードが選択されたときに色抽出モードの選択有無の入力も受け付ける。そして、色抽出モードが選択された場合にはS245の処理を省略してもよい。なぜなら、色抽出モードではエッジを使用しないからである。
(10−3)色抽出モードの処理の変形例
上記の説明では、色抽出モードの抽出処理では、座標情報で示される一つのポイントを含み、かつ、当該ポイントの色に類似する色を有する領域の外接矩形領域を抽出領域と決定した。しかしながら、図24に示されるように、異なる色の領域をまとめた領域を抽出されることをユーザが希望する場合がある。このような場合、上記の色抽出モードでは、抽出を希望する領域全体を1つの代表色で指定することはできないので、当該領域全体を抽出することができない。
そこで、複数のポイントをユーザが指定することが可能であり、各ポイントの代表色に類似する領域の外接矩形領域を抽出領域として決定してもよい。具体的には、各代表色を用いた色抽出処理は、上述した1つの代表色による色抽出処理と同じであり、各代表色で抽出した領域の外接矩形領域を抽出領域として抽出すればよい。
また、上記の説明では、撮像画像中の座標情報で示される位置から代表色を決定するものとした。しかしながら、代表色の決定方法は、これに限定されるものではない。例えば、ユーザが撮像画像とは異なる色マップ画像の中から指定した色(例えば、x-rite(マクベス)カラーチェッカー(http://www.nationalphoto.co.jp/2F/cms_chart.htm)を表示して選択を促し、ユーザにより選択された色)を代表色として決定してもよい。この場合、オブジェクト抽出部305は、代表色に類似する色を有する領域を含む領域(例えば、外接矩形領域)を抽出領域と決定すればよい。
(10−4)座標情報について
上記の説明では、エッジ抽出モードのときに、携帯端末装置100の指定領域抽出部110は、一つのポイントの指定を受け付け、受け付けたポイントの位置を示す座標情報を生成するものとした。
しかしながら、複数のポイントを受け付けてもよい。そして、指定領域抽出部は、各ポイントに対応する座標情報を生成する。また、オブジェクト抽出部は、上記(8−4−2)に記載した処理において、いずれかの座標情報で示される座標が含まれる全ての抽出領域候補を抽出領域とする。そして、オブジェクト抽出部305は、複数の抽出領域を抽出した場合、抽出領域以外の領域を空白領域とした出力対象画像データを生成する。もしくは、オブジェクト抽出部305は、複数の抽出領域を抽出した場合、各抽出領域ごとに、当該抽出領域だけを示す出力対象画像データを生成してもよい。この場合には、複数の出力対象画像データを出力することとなる。
(10−5)エッジ情報、座標情報の生成について
上記の説明では、携帯端末装置100にてエッジ情報を生成するものとした。しかしながら、画像出力装置200が、撮像画像データから線分状に連なるエッジ画素の群を検出し、当該エッジ画素の群の位置を示すエッジ情報を生成するエッジ情報生成部を備え、オブジェクト抽出部305が、このエッジ情報を用いて自動抽出モードによる抽出処理を実行してもよい。この場合、携帯端末装置100は、撮像画像データのみを画像出力装置200に送信するだけでよくなる。
また、上記の説明では、携帯端末装置100が座標情報を生成するものとした。しかしながら、画像出力装置200の表示部205に撮像画像を表示させ、ユーザによって指定された位置に基づいて座標情報を生成する指定情報生成部を画像出力装置200が備えていても良い。そして、オブジェクト抽出部305が、この座標情報を用いてエッジ抽出モードまたは色抽出モードによる抽出処理を実行してもよい。
(10−6)画像出力装置の処理項目について
上記の説明では、画像出力装置200の画像処理部202は、携帯端末装置100から受信した複数の撮像画像データに対して、カラーバランス・コントラスト・明るさの補正、幾何学的歪みの補正、レンズ歪みの補正、高解像度補正を行うものとした。しかしながら、画像処理部202における処理内容はこれに限定されるものではない。例えば、画像処理部202は、上記の補正に加えて、傾き補正を行ってもよい。
すなわち、画像処理部202は、(3−1)で記載された方法により撮像対象物の傾きを検知し、当該傾きが0度になるように撮像画像データの回転処理を施せばよい。もしくは、携帯端末装置100は、撮像画像データとともに、(3−1)で検出された傾き角度を画像出力装置200に送信してもよい。そして、画像処理部202は、携帯端末装置100から受けた傾き角度に基づいて、撮像対象物の傾きが0度になるように撮像画像データの回転処理を施せばよい。
(10−7)撮像部について
上記の説明では、撮像部101が連続して複数回撮像するときの手ぶれによって、複数の撮像画像にズレが生じることを利用する形態とした。しかしながら、これに限らず、撮像部101は、連続して複数回撮像するときに、撮像素子(CCD・CMOS)またはレンズを微小にずらしてもよい。これにより、複数の撮像画像間においてズレが確実に生じることになる。
(10−8)高解像度補正の別の例
上記の説明では、複数の撮像画像データから高解像度の再構成画像データを生成するものとした。しかしながら、複数の画像データではなく、1つの画像データに基づいて高解像度補正を行ってもよい。もしくは、複数の画像データで高解像度化する連写モードと、1つの画像データで高解像度化する通常モードとを有し、ユーザが適宜選択してもよい。
1つの画像データからの高解像度画像作成方法に関しては、映像情報メディア学会誌Vol.62、No.2、pp.181〜189(2008)にいくつかの方法が紹介されている。
一般的には、画像パターンのエッジ方向性を検知し、その向きに合わせた補間を行うとともに、補間によるひずみや入力画像に存在したノイズ成分の影響などの除去を目的としたノイズ除去処理を行うことにより、高解像度補正を実行することができる。以下、具体的に説明する。
図19は、本実施形態における高解像度補正の処理の流れを示すフローチャートである。
ここでは、横方向・縦方向の各々について2倍の解像度変換を行う例について説明する。2倍の解像度変換を行う場合、補正対象となる撮像画像データの画素数をn×mとするとき、補正後の高解像度画像データの画素数は2n×2mとなる。このような高解像度補正(2倍の解像度変換)は、撮像画像データにおける各画素を基準画素とし、当該基準画素間の中央に新たな画素を補間画素として生成し、当該基準画素と補間画素との両方を備える画像データを高解像度画像データとして生成することにより実行される。図20は、基準画素と補間画素との関係を示すものであり、画素aが基準画素を示し、画素bが補間画素を示している。
まず、超解像化処理部304は、第1通信部207が受信した撮像画像データについて、エッジ抽出を行う。例えば、超解像化処理部304は、図10に示されるような1次微分フィルタを用いてエッジ抽出を行い、2値化処理を行い、2値化画像データを生成する(S1)。なお、2値化画像データにおいて画素値が1であればエッジである可能性が高い画素であることを示している。
次に、超解像化処理部304は、S1で生成した2値化画像データに基づいて、撮像画像データにおける着目画素がエッジであるか否かを判定する(S2)。具体的には、超解像化処理部304は、2値化画像データにおける着目画素に対応する画素の値が1であれば、当該着目画素がエッジであると判定する。
なお、着目画素とは、撮像画像データにおける各画素を任意の順に着目していったときに、着目している画素のことをいう。
着目画素がエッジである場合(S2でYes)、超解像化処理部304は、着目画素を含むN×N(N>1)の部分画像を用いてエッジ方向を検出する(S3)。具体的には、N×Nの部分画像に含まれる全ての基準画素について、エッジ画素であるか否かを判定する。
そして、着目画素の左上の基準画素と右下の基準画素とがエッジ画素である場合、超解像化処理部304は、部分画像におけるエッジ方向が左上−右下方向であると判定する。同様に、着目画素の左の基準画素と右の基準画素とがエッジ画素である場合、エッジ方向が左−右方向であると判定し、着目画素の上の基準画素と下の基準画素とがエッジ画素である場合、エッジ方向が上−下方向であると判定し、着目画素の右上の基準画素と左下の基準画素とがエッジ画像である場合、エッジ方向が右上−左下方向であると判定する。
図20において、点線は検出したエッジ方向を示している。なお、図20において、画素(1)〜(9)が基準画素であり、このうちの画素(5)が着目画素である。そして、画素A、B、Cは、それぞれ、基準画素(1)と(5)との間の補間画素、基準画素(2)と(5)との間の補間画素、基準画素(4)と(5)との間の補間画素である。
次に、超解像化処理部304は、S3で検出したエッジ方向に応じて、着目画素の左上の補間画素A、着目画素の上の補間画素B、着目画素の左の補間画素Cの画素値を補間により求める。このとき、エッジ方向に沿った基準画素を用いて補間画素の画素値を求める。
エッジ方向が左上−右下方向である場合、図20(a)に示されるように、基準画素(1)、(5)、(9)がエッジ画素であり、これらの画素を結ぶ線がエッジ線となる。そして、エッジ線上の補間画素Aの画素値VA(図中では「V」の表記を省略している。以下同じ)について、補間画素Aに隣施するエッジ線上の基準画素(1)(画素値V(1))および基準画素(5)(画素値V(5))の画素値を用いて、以下の式
VA=(V(1)+V(5))/2
により求める。
一方、エッジ線上ではない補間画素B,Cについては、エッジ線上の基準画素を除く基準画素のうちの、当該補間画素に最も近い基準画素(最近接基準画素)を含み、エッジ方向に平行な線上の基準画素を用いて補間する。例えば、図20(a)では、補間画素Bについては、最近接基準画素である基準画素(2)を含み、エッジ方向に平行な線は、基準画素(2)と(6)とを結ぶ線である。そして、補間画素Bから当該線に垂直に下した点は、基準画素(2)と(6)とを結ぶエッジを内分する。そのため、補間画素Bの画素値VBは、以下の式
VB=(9×V(2)+4×V(6))/13
を用いて求める。
同様に、補間画素Cの画素値VCは、最近接基準画素である基準画素(4)と、当該基準画素(4)を含みエッジ方向に平行な線上の基準画素(8)との画素値を用いて、以下の式
VC=(9×V(4)+4×V(8))/13
により求める。
また、エッジ方向が左−右方向である場合、図20(b)に示されるように、基準画素(4)、(5)、(6)がエッジ画素であり、これらの画素を結ぶ線がエッジ線となる。そして、エッジ線上の補間画素Cの画素値VCについて、補間画素Cに隣施するエッジ線上の基準画素(4)(画素値V(4))および基準画素(5)(画素値V(5))の画素値を用いて、以下の式
VC=(V(4)+V(5))/2
により求める。
一方、エッジ線上ではない補間画素A、Bについては、エッジ線上の基準画素を除く基準画素のうちの、当該補間画素に最も近い基準画素(最近接基準画素)を含み、エッジ方向に平行な線上の基準画素を用いて補間する。例えば、図20(b)では、補間画素Aについては、最近接基準画素である基準画素(1)または(2)を含み、エッジ方向に平行な線は、基準画素(1)と(2)とを結ぶ線である。そして、補間画素Aから当該線に垂直に下した点は、基準画素(1)と(2)との中央に存在する。そのため、補間画素Aの画素値VAは、以下の式
VA=(V(1)+V(2))/2
を用いて求める。
補間画素Bについては、最近接基準画素である基準画素(2)を含み、エッジ方向に平行な線は、基準画素(1)と(2)と(3)とを結ぶ線である。そして、補間画素Bから当該線に垂直に下した点は、基準画素(2)と一致する。そのため、補間画素Bの画素値VBは、基準画素(2)の画素値V(2)と同じ値にする。
また、エッジ方向が右上−左下方向である場合、図20(c)に示されるように、基準画素(3)、(5)、(7)がエッジ画素であり、これらの画素を結ぶ線がエッジ線となる。そして、補間画素A,B,Cは全てエッジ線上に存在しない。
補間画素Aについては、最近接基準画素が基準画素(1)、(2)、(4)となる。ここで、基準画素(2)、(4)は、エッジ方向に平行な同一の線上に位置するが、基準画素(1)は当該線上に位置しない。そこで、補間画素Aの画素値VAについて、最近接基準画素である基準画素(1)、(2)、(4)の画素値を用いて、以下の式
VA=(V(1)+V(2)+V(4))/3
により求める。
一方、補間画素B,Cについては、エッジ線上の基準画素を除く基準画素のうちの、当該補間画素に最も近い基準画素(最近接基準画素)を含み、エッジ方向に平行な線上の基準画素を用いて補間する。例えば、図20(c)では、補間画素Bについては、最近接基準画素である基準画素(2)を含み、エッジ方向に平行な線は、基準画素(2)と(6)とを結ぶ線である。そして、補間画素Bから当該線に垂直に下した点は、基準画素(2)と(4)とを結ぶエッジを内分する。そのため、補間画素Bの画素値VBは、以下の式
VB=(9×V(2)+4×V(4))/13
を用いて求める。
同様に、補間画素Cの画素値VCは、最近接基準画素である基準画素(4)と、当該基準画素(4)を含みエッジ方向に平行な線上の基準画素(2)との画素値を用いて、以下の式
VC=(4×V(2)+9×V(4))/13
により求める。
また、エッジ方向が上−下方向である場合、図20(d)に示されるように、基準画素(2)、(5)、(8)がエッジ画素であり、これらの画素を結ぶ線がエッジ線となる。そして、エッジ線上の補間画素Bの画素値VBについて、補間画素Bに隣施するエッジ線上の基準画素(2)および基準画素(5)の画素値を用いて、以下の式
VC=(V(2)+V(5))/2
により求める。
一方、エッジ線上ではない補間画素A、Cについては、エッジ線上の基準画素を除く基準画素のうちの、当該補間画素に最も近い基準画素(最近接基準画素)を含み、エッジ方向に平行な線上の基準画素を用いて補間する。例えば、図20(d)では、補間画素Aについては、最近接基準画素である基準画素(1)または(4)を含み、エッジ方向に平行な線は、基準画素(1)と(4)とを結ぶ線である。そして、補間画素Aから当該線に垂直に下した点は、基準画素(1)と(4)との中央に存在する。そのため、補間画素Aの画素値VAは、以下の式
VA=(V(1)+V(4))/2
を用いて求める。
補間画素Cについては、最近接基準画素である基準画素(4)を含み、エッジ方向に平行な線は、基準画素(1)と(2)と(3)とを結ぶ線である。そして、補間画素Cから当該線に垂直に下した点は、基準画素(4)と一致する。そのため、補間画素Cの画素値VCは、基準画素(4)の画素値V(4)と同じ値にする。
なお、記憶部210は、エッジ方向と、補間画素A,B,Cの画素値を求めるための演算式とを対応付けた情報を予め記憶している。そして、超解像化処理部304は、S3で検出されたエッジ方向に対応する演算式を記憶部210から読み出し、読み出した演算式に基づいて、補間画素A,B,Cの画素値を求めればよい。
なお、図20では、エッジ方向が直線状である場合のみ示している。しかしながら、エッジは、N×Nの部分画像内において曲がる場合もある。例えば、エッジが基準画素(2)−(5)−(4)のように曲がる場合や、エッジが基準画素(1)−(5)−(7)のように曲がる場合などである。
このような場合についても、補間画素A,B,Cの画素値を求めるための演算式とを対応付けた情報を予め記憶している。例えば、エッジが基準画素(2)−(5)−(4)のように曲がる場合、補間画素Aについては図20(c)と同様に、補間画素Bについては図20(b)と同様に、補間画素Cについては図20(d)と同様の演算式を記憶している。また、エッジが基準画素(1)−(5)−(7)のように曲がる場合、補間画素Aについては図20(a)と同様に、補間画素Bについては図20(a)と同様に、補間画素Cについては図20(d)と同様の演算式を記憶している。他のエッジ方向のパターンについても同様に記憶している。
このようにして、超解像化処理部304は、エッジ画素と判定された基準画素の周囲に位置する補間画素の画素値を求める。
一方、着目画素がエッジでない場合(S2でYes)、超解像化処理部304は、当該着目画素の左上に隣接する補間画素A,当該着目画素の上に隣接する補間画素B,当該着目画素の左の補間画素Cの画素値を、一般的な補間演算法(バイリニア・バイキュービックなど)により求める(S4)。
超解像化処理部304は、上記のS2〜S4の処理を、撮像画像データに含まれる全ての基準画素について実行することで、基準画素と補間画素との両方を備える補間画像データを生成する(S5)。
その後、超解像化処理部304は、生成した補間画像データに対して高画質化処理を行う。例えば、超解像化処理部304は、ノイズ除去フィルタや鮮鋭化フィルタなどを補間画像データに適用して、高解像度画像データを生成する。従来からあるアンシャープマスクや図10の中央の係数を5としたものが鮮鋭化フィルタとなる。またノイズ除去としてはメディアンフィルタなどが広く知られている。より高度な手法として、上記エッジ保存性と高画質化を併せ持つ手法としてBilateralフィルタ[Proceedings of the 1998 IEEE International Conference on Computer Vision,]などを用いてもよい。
なお、超解像化処理部304は、上述した方法に限定されず、映像情報メディア学会誌Vol.62、No.2、pp.181〜189(2008) に記載されているような種々の方法を用いて、1つの撮像画像データから高解像度画像データを生成してもよい。
(10−9)出力処理情報について
上記の説明では、出力処理情報を携帯端末装置100が取得し、画像出力装置200に送信するものとした。しかしながら、これに限らず、画像出力装置200がユーザ認証のためにユーザ情報を取得する際に、出力処理情報(出力処理の種類、出力処理のための設定条件を示す情報)を取得してもよい。
(10−10)出力処理について
画像出力装置200において、制御部212は、ファイリング処理やメール送信処理を行う前に、画像処理部202によって処理された撮像画像データを高圧縮PDFに変換してもよい。なお、高圧縮PDFデータとは、画像データの中の背景部分と文字分とを分離し、ぞれぞれの部分に最適な圧縮処理を行ったPDFデータである。これにより、文字判読性が良好で、画像ファイルサイズも低減させることができる。
また、制御部212は、ファイリング処理やメール送信処理を行う前に、画像処理部202によって処理された撮像画像データに対してOCR処理を実行し、テキストデータを生成してもよい。そして、制御部212は、撮像画像データをPDFに変換し、生成したテキストデータを透明テキストとして付加してもよい。なお、透明テキストとは、認識された文字をテキスト情報として見掛け上は見えない形で画像データに重ね合わせる(あるいは埋め込む)ためのデータである。例えば、PDFファイルでは、画像データに透明テキストを付加した画像ファイルが一般に使用されている。そして、制御部212は、生成した透明テキスト付きPDFデータを出力させてもよい。これにより、テキスト検索可能なファイルのように活用しやすい電子化文書を出力することができる。
(10−11)画像出力装置が備える画像処理部について
上記の説明では、画像出力装置200が備える画像処理部202が高解像度補正などを行うものとして説明した。しかしながら、画像出力装置200は、撮像画像データに対する高解像度補正やその他の画像処理(幾何学的歪みの補正、レンズ歪みの補正、コントラスト補正、カラーバランス補正など)を、上記画像処理部202を備えたサーバに実行させてもよい。なお、この場合、当該サーバが、携帯端末装置100から受信した撮像画像データに対して高解像度補正を行い、補正後の撮像画像データを出力する画像出力装置であるといえる。
(11)プログラムおよび記録媒体
本発明はコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体に、上記した携帯端末装置100で撮像した画像を画像出力装置200に送信し画像出力装置200より出力する方法を記録するものとすることもできる。
この結果、上記処理を行うプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)を記録した記録媒体を持ち運び自在に提供することができる。
なお、本実施の形態では、この記録媒体としては、マイクロコンピュータで処理が行われるために図示していないメモリ、例えばROMのようなもの、そのものがプログラムメディアであっても良いし、また、図示していないが外部記憶装置としてプログラム読み取り装置が設けられ、そこに記録媒体を挿入することで読み取り可能なプログラムメディアであっても良い。
いずれの場合においても、格納されているプログラムはマイクロプロセッサがアクセスして実行させる構成であっても良いし、あるいは、いずれの場合もプログラムコードを読み出し、読み出されたプログラムコードは、マイクロコンピュータの図示されていないプログラム記憶エリアにダウンロードされて、そのプログラムが実行される方式であってもよい。このダウンロード用のプログラムは予め本体装置に格納されているものとする。
ここで、上記プログラムメディアは、本体と分離可能に構成される記録媒体であり、磁気テープやカセットテープ等のテープ系、フレキシブルディスクやハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVDなどの光ディスクのディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM、EPROM(Erasable Programmable Read Only Memory)、EEPROM(Electrically Erasable Programmable Read Only Memory)、フラッシュROM等による半導体メモリを含めた固定的にプログラムコードを担持する媒体であっても良い。
また、本実施の形態においては、インターネットを含む通信ネットワークを接続可能なシステム構成であることから、通信ネットワークからプログラムコードをダウンロードするように流動的にプログラムコードを担持する媒体であっても良い。なお、このように通信ネットワークからプログラムをダウンロードする場合には、そのダウンロード用のプログラムは予め本体装置に格納しておくか、あるいは別な記録媒体からインストールされるものであっても良い。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
上記記録媒体は、携帯端末装置100や画像出力装置200に備えられるプログラム読み取り装置により読み取られることで上述した画像処理方法が実行される。
本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。