JP2010273218A - 画像出力装置、撮像画像処理システム、画像出力方法、プログラムおよび記録媒体 - Google Patents

画像出力装置、撮像画像処理システム、画像出力方法、プログラムおよび記録媒体 Download PDF

Info

Publication number
JP2010273218A
JP2010273218A JP2009124653A JP2009124653A JP2010273218A JP 2010273218 A JP2010273218 A JP 2010273218A JP 2009124653 A JP2009124653 A JP 2009124653A JP 2009124653 A JP2009124653 A JP 2009124653A JP 2010273218 A JP2010273218 A JP 2010273218A
Authority
JP
Japan
Prior art keywords
image data
unit
captured image
image
imaging
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009124653A
Other languages
English (en)
Inventor
Kazuyuki Hamada
和之 濱田
Makoto Hayazaki
真 早崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2009124653A priority Critical patent/JP2010273218A/ja
Publication of JP2010273218A publication Critical patent/JP2010273218A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】携帯端末装置にて撮像した画像を、文字の判読性などの解像度を向上させた状態で画像出力装置が出力可能であり、かつ、同じ対象物について多数回撮像したとしても、ユーザの画像選択の手間を省くことが可能な画像出力装置を提供する。
【解決手段】画像出力装置は、携帯端末装置から受信した複数の撮像画像データについて、類似度が所定閾値以上の撮像画像データが同じグループになるようにグループ分けを行う類似画像判定部224と、グループ分けされた各グループの中から1つの撮像画像データを選択し、選択した撮像画像データに基づいて高解像度の高解像度画像データを生成する高解像度補正部225と、当該高解像度画像データを出力する出力処理を実行する出力部とを備える。
【選択図】図1

Description

本発明は、携帯端末装置にて撮像した画像を画像出力装置により出力する撮像画像処理システムに関する。
インターネット技術の進展と伴に携帯電話など携帯端末装置を利用して撮像した画像を保存する機会が増えてきている。また、単純に風景や、人物などを被写体とするだけではなく、各種ショーなどで展示されている説明図や説明文、あるいは学界等でのスライドを撮影する機会も増大してきている。このような携帯端末装置で撮影された画像を保存する際には、撮影日などの情報を元に自動的に付加されるファイル名を用いるか、自分でファイル名を作成し、保存するのが一般的である。
また、特許文献1には、ユーザが、デジタルカメラや、カメラ付きPDA・携帯パソコン等の携帯端末装置で収集したデジタル画像データを、ネットワークを介してサーバに送信する技術が記載されている。そして、サーバでは、受信したデジタル画像データを、所定のドキュメントフォーマットに編集し、上記ドキュメントフォーマットの所定の領域に、音声コード画像又はテキストイメージとして貼り付け、当該ドキュメントを、特定用途の報告書として記録媒体に保存、あるいは、紙ドキュメントとして印刷したり、ネットワークを介して特定のサイトに送信される。
特開2002−41502号公報(2002年2月8日公開)
しかしながら、携帯電話やデジタルカメラで撮像する際、同じ対象物を何回も撮像することがある。このような同じ対象物を複数回撮像した場合でも、これら複数の撮像画像データは異なる画像データとして取り扱われる。そのため、上記特許文献1の技術では、本来、1個または数個の撮像画像データがあれば良いところが、多数個の撮像画像データが生成され、記録媒体に保存されたり、印刷されたりする。その結果、ユーザが後で見直すときに撮像画像が多すぎて、その整理に手間がかかる。
また、携帯電話やデジタルカメラに用いられているRGBフィルタ、または、補色(CMY)フィルタは、各色に対するフィルタが2次元平面に配列されているため、スキャナ等で読み取られた画像データを比較すると、解像力が1/3〜2/3程度低下した画像となっており、特に、文字の判読性が悪いという問題がある。
具体的には、スキャナ等では、RGBラインセンサを用いているので、画素毎にそれぞれのカラーデータを読み取ることが可能であるが、携帯電話やデジタルカメラにおけるフィルタは、画素に対して、例えば、RGBRGB…、あるいは、ライン毎にRGRGRG…/GBGBGB…と配列されており、各画素でフィルタが設けられていない色成分が存在するため、解像力が低い。
本発明は、上記課題を解決するためになされたものであり、携帯端末装置にて撮像した画像を、文字の判読性などの解像度を向上させた状態で画像出力装置が出力可能であり、かつ、同じ対象物について多数回撮像したとしても、ユーザの画像選択の手間を省くことが可能な、携帯端末装置、画像出力装置、撮像画像処理システム、撮像画像処理方法、プログラムおよび記録媒体を提供することを目的とする。
上記の課題を解決するために、本発明の画像出力装置は、撮像部を備えた携帯端末装置から、上記撮像部の撮像により得られた撮像画像データを受信する受信部と、上記受信部が受信した複数の撮像画像データについて、各撮像画像データで示される画像の特徴を示す特徴量を算出し、対応する特徴量の類似度が所定閾値以上の撮像画像データが同じグループになるようにグループ分けを行う類似画像判定部と、上記類似画像判定部によりグループ分けされた各グループの中から所定数の撮像画像データを選択する選択部と、上記撮像画像データに基づいて、当該撮像画像データの解像度よりも高解像度の高解像度画像データを生成する高解像度補正を行う高解像度補正部と、上記選択部により選択された撮像画像データに対して上記高解像度補正部が高解像度補正を行うことにより得られた高解像度画像データである選択高解像度画像データ、あるいは、当該選択高解像度画像データで示される画像を出力する出力処理を実行する出力部とを備えることを特徴とする。
また、本発明の画像出力方法は、撮像部を備えた携帯端末装置から、上記撮像部の撮像により得られた撮像画像データを受信する受信ステップと、受信した複数の撮像画像データについて、各撮像画像データで示される画像の特徴を示す特徴量を算出し、対応する特徴量の類似度が所定閾値以上の撮像画像データが同じグループになるようにグループ分けを行う類似画像判定ステップと、グループ分けされた各グループの中から所定数の撮像画像データを選択し、選択した撮像画像データに基づいて、当該撮像画像データの解像度よりも高解像度の選択高解像度画像データを生成する高解像度補正を行う補正処理ステップと、生成された選択高解像度画像データ、あるいは、当該選択高解像度画像データで示される画像を出力する出力処理を実行する出力ステップとを含むことを特徴とする。
上記の構成によれば、同じ撮像対象物を複数回撮像し、同じような撮像画像データを多数生成したとしても、これら多数の撮像画像データを画像出力装置に送信すれば、上記類似画像判定部が類似する画像が同じグループになるようにグループ分けを実行する。そのため、ユーザは、同じ撮像対象物を撮像することにより得られた撮像画像データを確認して、自分で分類する必要がなくなる。
また、グループ分けされた各グループの中から選択された所定数の撮像画像データに対して高解像度補正を行い、選択高解像度画像データあるいは当該選択高解像度画像データで示される画像が出力される。その結果、同じような画像データが多数出力されることを防止でき、必要数だけの出力結果をユーザは得ることができる。ここで所定数とは、例えば1個である。
また、出力されるのは高解像度補正された画像データであるため、高品質の画像データを得ることができる。これにより、例えば、文書画像を含む撮像対象物を携帯端末装置で撮像しても、画像出力装置から当該文書画像の文字の判読性を向上させた画像を得ることができる。
さらに、本発明の画像出力装置において、上記撮像部によって撮像される撮像対象物は、文書画像が形成された矩形状の面を有しており、上記矩形状の面の法線方向とは異なる方向から上記撮像部が撮像することによる撮像画像データにおける上記矩形状の面の歪みを補正するとともに、当該撮像画像データにおける上記矩形状の面の傾きを補正する歪み補正部を備え、上記類似画像判定部は、上記歪み補正部によって補正された撮像画像データに基づいてグループ分けを行い、上記高解像度補正部は、上記歪み補正部によって補正された撮像画像データに基づいて高解像度補正を行うことが好ましい。
上記の構成によれば、ユーザは、撮像対象物に対して斜め方向から撮像した場合であっても、歪みを補正した上で画像同士の類似判定を行う。そのため、同じ撮像対象物を真正面から撮像した場合の撮像画像データと斜め方向から撮像した場合の撮像画像データとを同じグループに分類することができる。これにより、ユーザの撮像画像データの整理の手間を省くことができる。また、歪みのない状態で出力されるため、ユーザにとってより見易い画像を得ることができる。
さらに、本発明の画像出力装置において、上記選択部は、上記各グループに属する撮像画像データの中から、上記歪み補正部による補正前の撮像画像データで示される画像における上記矩形状の面の傾きが最も小さい撮像画像データを選択することが好ましい。
もしくは、本発明の画像出力装置において、上記矩形状の面の法線方向とは異なる方向から上記撮像部が撮像することによる撮像画像データにおける上記矩形状の面の歪みの度合いを幾何学的歪み度とするとき、上記選択部は、上記各グループに属する撮像画像データの中から、上記歪み補正部による補正前の撮像画像データで示される画像における幾何学的歪み度が最も小さい撮像画像データを選択することが好ましい。
歪み補正部による補正量は、撮像画像データで示される画像における矩形状の撮像対象物の面の傾きまたは幾何学的歪み度が小さいほど小さい。この補正量が小さいほど、撮像対象物により近い状態となる。上記の構成によれば、歪み補正部による補正前の撮像画像データで示される画像において傾きまたは幾何学的歪み度の最も小さい撮像画像データに対応する高解像度画像データのみが出力される。よって、撮像対象物により近い状態の画像を得ることができる。
さらに、本発明の画像出力装置は、上記類似画像判定部によってグループ分けされた各グループについて、当該グループに属する撮像画像データを表示部に表示し、各撮像画像データの属するグループの変更指示を受け付け可能である制御部を備え、上記制御部が上記変更指示を受け付けた場合、上記類似画像判定部は、当該変更指示に従って、各グループに属する撮像画像データを変更することが好ましい。
類似画像判定部は、特徴量に基づいたグループ分けを行うため、異なる画像であっても類似していると判定する可能性がある。しかしながら、上記の構成によれば、ユーザは、類似画像判定部の結果を確認することができ、必要に応じて変更指示を入力することができる。すなわち、類似画像判定部の判定結果を修正することができる。
なお、上記撮像部は、1回の撮像指示で連続して複数回撮像し、上記受信部は、上記撮像画像データとして、上記撮像部が1回の撮像指示で連続して複数回撮像することにより得られる複数のサブ撮像画像データの組を受信し、上記高解像度補正部は、上記撮像画像データに含まれる複数のサブ撮像画像データに基づいて高解像度画像データを生成してもよい。
もしくは、上記撮像部は、1回の撮像指示で1回だけ撮像し、上記受信部は、上記撮像画像データとして、上記撮像部が1回の撮像指示で1回撮像することにより得られる画像データを受信し、上記高解像度補正部は、1つの撮像画像データに基づいて高解像度画像データを生成してもよい。
また、本発明の撮像画像処理システムは、撮像部と、上記撮像部の撮像により撮像画像データを送信する送信部とを備えた携帯端末装置と、上記の画像出力装置とを備えている。
これにより、携帯端末装置にて撮像した画像を、文字の判読性などの解像度を向上させた状態で画像出力装置が出力可能であり、かつ、同じ対象物について多数回撮像したとしても、ユーザの画像選択の手間を省くことができる。
なお、上記画像出力装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記各部として動作させることにより画像出力装置をコンピュータにて実現させるプログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
本発明によれば、携帯端末装置にて撮像した画像を、文字の判読性などの解像度を向上させた状態で画像出力装置が出力可能であり、かつ、同じ対象物について多数回撮像したとしても、ユーザの画像選択の手間を省くことができる。
図1は、本発明の一実施形態に係る画像出力装置が有する画像処理部の構成を示すブロック図である。 図2は、本発明の一実施形態に係る撮像画像処理システムの全体構成を示す図である。 図3は、本発明の一実施形態に係る携帯端末装置の構成を示すブロック図である。 図4は、画像の傾き検出例を示す図である。 図5は、図4の傾き検出例における傾き角度θとその正接値を示している。 図6は、画像の幾何学的歪みの検出例を示す図である。 図7は、画像の対象物のエッジ検出処理例を示す図である。 図8は、画像のラスター方向のエッジ検出例を示す図である。 図9は、画像のズレ度合い検出例の1次微分フィルタ例を示す図である。 図10は、本発明の一実施形態に係る画像出力装置の構成を示すブロック図である。 図11は、画像のカラーバランス調整時に作成するルックアップテーブルの一例を示す図である。 図12は、画像のレンズ歪みの補正例を示す図である。 図13は、画像の幾何学的歪みおよび傾きの補正例を示す図である。 図14は、画像の再構成画素値の決定例を示す図である。 図15は、携帯端末装置の処理の流れを示すフローチャートである。 図16は、画像出力装置の処理の流れの全体を示すフローチャートである。 図17は、類似画像の判定処理の流れを示すフローチャートである。 図18は、1つの画像データを用いて高解像度補正を行うときの処理の流れを示すフローチャートである。 図19は、高解像度画像データにおける基準画素と補間画素とを示している。 補間画素の画素値の算出方法を示す図であり、(a)はエッジ方向が左上−右下方向である場合、(b)はエッジ方向が左−右方向である場合、(c)はエッジ方向が右上−左下方向である場合、(d)はエッジ方向が上−下方向である場合を示している。
以下、本発明の実施の形態について、詳細に説明する。
(1)撮像画像処理システムの全体構成
図2は、本発明に係る撮像画像処理システムの全体構成を示す図である。図2に示されるように、撮像画像処理システムは、カメラ付き携帯電話、デジタルスチルカメラなど、撮像手段を備えた携帯端末装置100、および、複合機、プリンタ(画像形成装置)などの画像出力装置200を備える。
携帯端末装置100は、ユーザによって携帯されるものである。ユーザは、様々な場面で携帯端末装置100により対象物を撮像することができる。ただし、携帯端末装置100で撮像された画像は上述したように解像度が低く、当該解像度で画像出力装置200により画像出力(例えば印刷)を行ったとしても細部まで認識できない場合がある。例えば、文書画像(文字など)が印刷された用紙やポスター、文書画像などが表示されている表示画面を撮像する場合において、文字が判別できないことが考えられる。本実施形態は、このような場合であっても、携帯端末装置100で撮像された画像の解像度よりも高い解像度を有する画像を得ることができるものである。
本実施形態において、携帯端末装置100は、撮像した画像の解像度よりも高い解像度を有する画像を画像出力装置200から得ることが可能な撮像モードである文書撮像モードの機能を有している。
なお、本実施形態では、文書画像が印刷された用紙やポスター、文書画像が表示されている表示画面(例えば、ディスプレイ画面やプロジェクターにより投影された画面)のような矩形状の撮像対象物を撮像し、撮像画像よりも高い解像度の画像を得ることを希望する場合に、ユーザが文書撮像モードを選択するものとする。
また、ユーザは、矩形状の撮像対象物である、文書画像が印刷された用紙やポスター、文書画像が表示されている表示画面などに対して、常に正面から撮像できるとは限らない。すなわち、ユーザは、撮像対象物における、文書画像が形成された平面の法線方向と、撮像手段の撮像方向とが一致しない状態で、斜め方向から撮像対象物を撮像する場合がある。この場合、撮像された画像において、撮像対象物に歪み(以下、幾何学的歪みという)が生じることになる。本実施形態では、上記文書撮像モードが選択された場合、このような幾何学的歪みも補正された状態で画像出力装置200が画像出力するように構成されている。
携帯端末装置100と画像出力装置200とは通信可能であり、携帯端末装置100は、撮像した画像データ(以下、撮像画像データという)を画像出力装置200に送信する。
画像出力装置200は、携帯端末装置100から受信した撮像画像データの出力処理を行うものである。ただし、ユーザは、同一の撮像対象物について、複数回撮像する場合がある。しかしながら、ユーザは、この中から一つもしくは数枚の画像の出力を希望する場合がある。そのような場合に、同一の撮像対象物に対して撮像された複数の撮像画像データの全てについて同じように出力すると、後でユーザが整理するのに手間がかかるという問題が生じる。そこで、本実施形態の画像出力装置200は、携帯端末装置100から受信した複数の撮像画像データについて、類似している画像同士をグループごとに分類する。そして、画像出力装置200は、各グループにおいて、当該グループに属する複数の撮像画像データの中から選択された撮像画像データを出力する。これにより、ユーザは、同一対象物に対して複数回撮像したとしても、その中から選択された撮像画像データの出力だけを行うことができ、後の整理が容易となる。
また、画像出力装置200は、携帯端末装置100から受信した撮像画像データに基づいて、解像度を高める高解像度補正を行い、高解像度化された画像データ(高解像度画像データ)の出力処理を行うものである。この高解像度補正の手法としては、映像情報メディア学会誌Vol.62、No.3、pp.337〜342(2008) に記載されている、複数の撮像画像データを用いた方法や、映像情報メディア学会誌Vol.62、No.2、pp.181〜189(2008)に記載されている、一つの撮像画像データを用いた方法などがあり、これらの方法を用いることができる。なお、本実施形態では、同一対象物に対して撮像された複数の撮像画像データを用いて高解像度補正を行うものとして説明する。
画像出力装置200で実行される出力処理としては、高解像度化された撮像画像データに基づいた画像の印刷処理、サーバやUSBメモリなどの記憶装置へ高解像度化された撮像画像データを格納するファイリング処理、電子メールに高解像度化された撮像画像データを添付して送信するメール送信処理などがある。
なお、携帯端末装置100と画像出力装置200との通信方式としては、図2において符号Aで示されるように、IrSimpleなどの赤外線通信規格のいずれかに基づく無線通信方式や、符号Bで示されるように、Felica(登録商標)のような非接触無線通信により、携帯端末装置100から中継装置300に一旦撮像画像データを送り、その後、例えばBluetooth(登録商標)のような無線通信を用いて、当該中継装置300から画像出力装置200へデータを転送する方式がある。本実施形態では、ユーザは、画像出力装置200の前にきてから携帯端末装置100を操作し、赤外線通信のような近距離無線通信方式を用いて、携帯端末装置100から画像出力装置200へデータ転送するものとする。なお、携帯端末装置100と画像出力装置200との間の通信方式については、これらに限定されることなく、公知の通信方法を用いたものを適用することができる。
(2)携帯端末装置の構成
まず、図3に基づいて、本実施形態に係る携帯端末装置100について説明する。
図3は、携帯端末装置100の構成を示すブロック図である。図3に示されるように、携帯端末装置100は、撮像部101、撮像画像判定部102、画像処理部103、通信部(送信部)104、表示部(通知部)105、入力部106、記憶媒体アクセス部107、記憶部108、制御部(送信部、通知部)109を備えている。
撮像部101は、CCDセンサ、CMOSセンサを用いて、撮像対象物の撮像を行うものである。撮像部101は、予め設定された解像度で撮像対象物の撮像を行う。また、撮像部101は、ユーザにより文書撮像モードが選択された場合、1回シャッターの押下により、撮像対象物について複数回(例えば、2〜15)連続して撮像する。通常、連続して撮像された画像は、ほぼ同じ画像であるが、手ぶれ等によって微少量だけずれることになる。
撮像画像判定部102は、文書撮像モードが選択されている際に、撮像部101の連続撮像により得られた複数の撮像画像が、画像出力装置200において高解像度補正を実行するための条件を含む処理実行条件を満たしているか否かを判定するものである。撮像画像判定部102は、その判定結果を制御部109に出力する。撮像画像判定部102における具体的な処理については後述する。
なお、以下では、1回のシャッター押下により撮像部が連続撮像することにより得られる複数の撮像画像の各々を示す画像データをサブ撮像画像データという。また、1回のシャッター押下により撮像部が連絡撮像することにより得られる複数のサブ撮像画像データの組を単に撮像画像データという場合がある。または高解像度出力用データセットという。
画像処理部103は、撮像部101で撮像された画像のデータ(サブ撮像画像データ)に対して、少なくともA/D変換処理を行うものである。
通信部104は、USB(Universal Serial Bus)1.1またはUSB2.0の規格に基づく、シリアル転送/パラレル転送、無線データ通信機能を有するものである。通信部104は、撮像部101により撮像され、画像処理部103にてA/D変換処理が施された複数の撮像画像データを画像出力装置200に送信する。ただし、通信部104は、撮像画像判定部102により処理実行条件を満たしていると判定された撮像画像データのみを送信する。また、通信部104は、入力部106への入力に従って、記憶部108に記憶されている、文書撮像モードで撮像された複数の撮像画像データをまとめて画像出力装置200に出力する。
表示部105は、例えば液晶ディスプレイなどにより構成されるものである。また,入力部106は、複数のボタンを有しており、ユーザがデータの入力を行うためのものである。
記憶媒体アクセス部107は、携帯端末装置100の各処理を行うためのプログラムが記録された記録媒体から、プログラムを読み出すものである。
また、記憶部108は、携帯端末装置100の各処理を行うためのプログラム、携帯端末装置の機種情報、ユーザ情報や処理を行う際に必要なデータを格納するものである。なお、ユーザ情報とは、携帯端末装置のユーザを識別する情報であり、例えば、ユーザIDおよびパスワードなどである。また、記憶部108は、文書撮像モードで撮像することにより得られた撮像画像データを記憶する。
制御部109は、携帯端末装置100の各部の制御を行うものである。具体的には、制御部109は、入力部106に文書撮像モードを選択する旨の指示が入力された場合、解像度変換の倍率の入力を促す画面を表示部105に表示させる。そして、制御部109は、入力部106に入力された倍率(例えば、2倍、4倍)に応じて、撮像部101が連続撮像する回数、および、撮像画像判定部102で用いる処理実行条件の一部を決定する。なお、制御部109は、記憶部108に予め格納された、倍率と撮像回数および処理実行条件の一部とを対応付けた情報に基づいて決定する。
また、制御部109は、入力部106に文書撮像モードを選択する旨の指示が入力された場合、画像出力装置200での出力処理の種類(印刷処理、ファイリング処理、メール送信処理など)の選択指示、ならびに、選択した出力処理を実行するための設定条件(印刷枚数などの印刷条件、ファイリング先のサーバのアドレス、メールの送信先アドレスなど)の入力を促す画面を表示部105に表示する。そして、制御部109は、入力部106から、出力処理の種類および出力処理の設定条件を示す出力処理情報を取得する。
そして、制御部109は、撮像画像判定部102により処理実行条件を満たしていると判定された撮像画像データに、ファイルネーム、ならびに、出力処理情報を付け、記憶部108に一時的に格納しておく。その後、制御部109は、入力部106への送信指示の入力に従って、記憶部108に格納されている撮像画像データを、ファイルネームおよび出力処理情報、ならびに、記憶部108に格納されている機種情報およびユーザ情報と合わせて画像出力装置200に送信する送信処理を、通信部104に実行させる。
(3)撮像画像判定部の処理について
次に、携帯端末装置100の撮像画像判定部102における具体的な判定処理について説明する。
(3−1)傾きの判定
上述したように、用紙やポスター、表示画面のような矩形状の撮像対象物を撮像し、高い解像度の画像を得ることを希望する場合に、ユーザが文書撮像モードを選択する。そのため、撮像画像判定部102は、撮像対象物が矩形状であると仮定して、撮像画像データにおいて、撮像対象物のエッジを検出することで撮像画像データにおける撮像対象物の傾きを検出する。なお、撮像画像データの中の矩形状の撮像対象物のエッジ上の画素を検出する手法としては従来知られている手法を用いることができる。また、背景の中のエッジを撮像対象物のエッジとして誤判定することを防止するために、所定長さ以上のエッジのみを撮像対象物のエッジとして検出してもよい。この場合、所定長さとは、例えば、撮像画像データで示される画像の端の辺の長さの80%程度の長さを設定すればよい。または、このようにして検出されたエッジの中から、撮像対象物のエッジのものをユーザに選択してもらってもよい。このような検出方法としては、例えば、特開2006−237757に記載の技術を用いることができる。
そして、撮像画像判定部102は、検出された撮像対象物のエッジ上の2点を選択する。例えば、図4に示されるように、撮像画像データの中心から左右それぞれ横方向にw/2だけ離れた2点11・12を選択する。次に、選択された2点11・12の各々と、撮像画像データの端辺との距離d,dを求め、撮像画像における撮像対象物の傾きを求めることができる。図4のような場合、傾き角度をθとすると、 tanθ=(d−d)/wとなる。そこで、撮像画像判定部102は、(d−d)/wの値を算出し、この値に相当する角度θをあらかじめ作成済みのテーブル(図5参照)などより読み取る。
そして、撮像画像判定部102は、検出した角度θが所定範囲内(例えば、−30°〜+30°)であるか否かを判定し、その判定結果を制御部109に出力する。ここで、角度θが所定範囲内であることが処理実行条件の一つとなる。
なお、上述したように、1回のシャッター押下による撮像部101の複数回の撮像により、複数のサブ撮像画像データが得られる。しかしながら、当該複数のサブ撮像画像データは、手ぶれ程度のズレが生じているにすぎない。そのため、撮像画像判定部102は、当該複数のサブ撮像画像データの中から任意に選択した一つのサブ撮像画像データに対して、傾きの判定を行えばよい。
(3−2)幾何学的歪みの判定
幾何学的歪みとは、上述したように、撮像対象物における文書画像が形成された平面の法線方向とは異なる斜め方向から撮像対象物を撮像した場合に、撮像画像の中で撮像対象物が矩形状から歪んだ形状を有することである。例えば、用紙の法線方向に対して用紙の左下方向から斜めに撮像した場合、図6に示されるように、撮像対象物は、歪んだ四角形となる。
本実施形態では、後述するように、画像出力装置200がこのような幾何学的歪みを補正する機能を有している。ただし、幾何学的歪みの度合いが大きい場合、補正したとしても、判読性がそれほど向上しない。そこで、本実施形態では、撮像画像判定部102は、幾何学的歪みの度合いを示す特徴量を検出し、当該特徴量が所定範囲内であるか否かを判定する。
本実施形態では、必ずしも画角の中心付近に撮像対象物の各辺のエッジが存在するとは限らないので、ある一定間隔ですべての辺からのエッジを抽出し、各エッジを表す線分を求めて、さらにこれらの交点を算出して、撮像対象物の領域とすれば良い。
なお、上述したように、1回のシャッター押下による撮像部101の複数回の撮像により、複数のサブ撮像画像データが得られる。しかしながら、当該複数のサブ撮像画像データは、手ぶれ程度のズレが生じているにすぎない。そのため、撮像画像判定部102は、当該複数のサブ撮像画像データの中から任意に選択した一つのサブ撮像画像データに対して、以下のような幾何学的歪みの判定を行えばよい。
まず、撮像画像判定部102は、サブ撮像画像データについて、ラスター走査を行う。ここで、図6に示されるように、ラスター走査の順方向をX方向、X方向に垂直な方向をY方向とする。また、撮像画像において左上隅を原点とする。
1ライン分走査を行い、エッジが存在しなければ、撮像画像判定部102は、Y方向に所定量だけずらした次のラインについて走査する。なお、ライン間の間隔は一定であればよく、1画素である必要はない。
そして、撮像画像判定部102は、ラスター走査において、最初にエッジを検出したラインをL(1ライン目)とし、図7に示すように、順方向で最初のエッジと判定された点の座標を第1群に格納し、同じライン上で2つ目のエッジと判定された点の座標を第2群に分類する。引き続き次のラインの走査を行い、エッジ検知する。そして、それぞれのラインLについて、順方向で1番目に撮像対象物のエッジと判定された点と、2番目に撮像対象物のエッジと判定された点とのX座標値の差分(X座標の距離d)を求め下記のように判定を行う。
なお、ラインLにおける最初のエッジのX座標をXi1(第1群に分類されているX座標)、2つ目のエッジのX座標をXi2(第2群に分類されているX座標)とする。検出方法は以下のようである。
(a)1ライン(L)目の座標X11およびX12については変更しない。
(b)2ライン目以降のiライン目については、座標間の距離di1(=Xi1−X(i−1)1)およびdi2(同様)を算出する。以下、di1に関して述べるため添え字の1を省略するが、di2も同様である。
(c)3ライン目以降のiライン目は、dd=abs{(d)−di−1}を算出する。dd≦th(≒0に近い小さな数値)であれば、座標Xiは同じ群に分類する。そうでない場合(dd>th)は、別の群(第3群または第4群)に分類する。
(d)初期処理としてi=4のときのみ、Xの群を確定させるための処理を行う。以下のようにする。
i)dd≦th かつ dd≦th → X:同群
ii)dd>th かつ dd≦th → X:別群
iii)dd≦th かつ dd>th → X:同群
iv)dd>th かつ dd>th → X:同群
一度、別群(第3群または第4群)に遷移した場合は、増減の確認はする必要はない。
このような処理を画像全体に行って、各群に属するエッジ点を抽出する。そして、群ごとに、当該群に属するエッジ点の座標を最小2乗法などで直線近似し、当該群に属するエッジ点に近似した直線を求める。当該直線は、撮像対象物の辺に相当することとなる。
図8は、上記のような処理によって、ラスター走査によってエッジ点を抽出し、4つの群に分類したときの図である。図において、丸印が第1群に属するエッジ点、四角印が第2群に属するエッジ点、三角印が第3群に属するエッジ点、星印が第4群に属するエッジ点を示し、最小2乗法により求められた、各群に属するエッジ点の近似直線を点線で示す。
そして、4つの群について求めた直線の交点(図中、交点1〜4としている)を求め、4つの直線で囲まれた領域を撮像対象物の領域として特定することができる。
さらに、上記の分類処理を90度回転させた画像に対して行っても良い。こうすることで、理想的に画像内の水平方向・垂直方向に平行に配置されたような原稿のエッジも抽出することが可能となる。すなわち、ラスター走査することで、回転前の画像では、垂直方向のエッジが検出できる。一方、回転後の画像では、回転前に水平方向であったエッジ(回転後には水平方向であるエッジ)を検出することができる。これにより、垂直方向・水平方向に平行なエッジも抽出することができる。回転前で十分な情報量(各群で例えば3点以上の交点)があれば、回転前の情報のみを用いればよいし、いずれかの群の交点が1点未満の場合、当然直線の式は求められないため、回転後の交点を用いればよい。
あるいは、求まった交点座標のみを再度座標変換して元に戻し、それぞれの群の分布する領域から、対応する群を求めて、交点情報を統合し、直線の式を求めても良い。すなわち、回転前の画像から求められた交点座標と、回転後の画像から求められた交点を逆回転して得られた交点座標とから、同一の群に属する交点座標を統合して直線の方程式を求めればよい。
なお、エッジ点の抽出方法としては、少なくとも1以上の画素幅の小ウィンド内での、画素値をそのまま比較(2以上の幅の場合は和・平均値を比較)していき、隣接する値の差分が一定以上の場合、エッジ点であると判定すればよい。なお、背景や撮像対象物内のテキストのエッジなどを誤って検出することを防止するために、所定長さ以上のエッジのみを撮像対象物のエッジとして検出してもよい。この場合、所定長さとは、例えば、サブ撮像画像データで示される画像の端の辺の長さの80%程度の長さを設定すればよい。または、このようにして検出されたエッジの中から、撮像対象物のエッジをユーザに選択してもらってもよい。このような検出方法としては、例えば、特開2006−237757に記載の技術を用いることができる。もしくは、それぞれの座標群の評価を行ったり、線分検知のための処理(ハフ変換など)を行ったりすることでも防止できる。さらに、縮小画像を用いた処理をプレ処理として行うことで、テキストや細かなテクスチャのエッジを誤って検出することを防止することができる。
そして、撮像画像判定部102は、以上のようにして4つの直線及びそれらの交点を求めると、当該4つの直線で形成される四角形の対辺の長さの比を計算する。当該長さの比は、上記交点の座標から容易に求まる。なお、対辺は2組あるので、撮像画像判定部102は、当該2組の各々について長さの比を求める。
ここで、対辺の長さの比は、矩形状の撮像対象物を正面から撮像した場合には撮像画像の中の撮像対象物も矩形状であるため、1となる。一方、斜め方向から撮像した場合には、撮像画像の中の撮像対象物の形状は歪んだ四角形となるため、1とは異なる値となる。そして、撮像方向と、撮像対象物の文書画像が形成された平面の法線方向とのなす角度が大きくなるほど、当該比の値と1との差が大きくなる。そのため、対辺の長さの比は、幾何学的歪みの度合いを示す特徴量の一つであるといえる。
その後、撮像画像判定部102は、求めた二つの比の両方が所定範囲内(例えば、0.5〜2)であるか否かを判定し、その判定結果を制御部109に出力する。ここで、所定範囲は、画像出力装置200において補正可能な範囲として予め定められたものであり、記憶部108に格納されている。また、二つの比の両方が所定範囲内(例えば、0.5〜2)であることが処理実行条件の一つとなる。
なお、撮像画像判定部102は、幾何学的歪みの度合いを示す別の特徴量として、上記のようにして検出された4つの交点を含む2つの直線のなす角度などを用いてもよい。
(3−3)複数枚の画像のズレ量の判定
上述したように、画像出力装置200は、同一の撮像対象物の複数のサブ撮像画像データに基づいて、高解像度補正を実行する。当該高解像度補正を実行するためには、解像度変換の倍率に応じた所定数の画像データが、所定量だけずれている必要がある。そこで、本実施形態では、撮像画像判定部102は、撮像部101が撮像した複数のサブ撮像画像データの中に、画像出力装置200で高解像度補正を実行するために必要な、所定量だけずれた所定数のサブ撮像画像データが含まれるか否かを判定する。ここで、所定量だけずれた所定数のサブ撮像画像データの組を高解像度出力用データセットという。
なお、文字の判読性を上げるような高解像度補正のために必要なズレとは、対象とする画像データの一画素未満(小数点)のズレを指す。すなわち、小数点以下(1画素未満)の値、例えば、0.3〜0.7などのズレが重要である。整数部分のズレは高解像度補正には考慮されない。例えば、1.3画素、2.3画素などの1画素未満のズレを含むような場合、複数の画像に基づいた高解像度補正を実行することができるが、1画素、2画素などの1画素未満のズレを含まない場合、高解像度補正を実行することができない。
例えば、変換倍率が2倍の場合、高解像度補正に必要な画像データの数は2であり、2つの画像データのずれ量としては画素単位で小数点以下0.3〜0.7であることが好ましい。そのため、記憶部108には、解像度変換の倍率「2倍」と、撮像回数「2」および処理実行条件「必要画像データ数:2、ずれ量:0.3〜0.7」とを対応付けた情報が予め格納されており、制御部109は、当該情報に基づいて、撮像部101に対して2回連続して撮像させ、撮像画像判定部102に対して、処理実行条件「必要画像データ数:2、ずれ量:0.3〜0.7」に従った判定を実行させるものとする。
また、変換倍率が4倍である場合、高解像度補正に必要な画像データの数は4であり、その内の一つの画像データを基準画像データとしたとき、当該基準画像データと残りの3つの画像データとのずれ量がそれぞれ画素単位で小数点以下0.2〜0.3、0.4〜0.6、0.7〜0.8であることが好ましい。そのため、記憶部108は、解像度変換の倍率「4倍」と、撮像回数「4」および処理実行条件「必要画像データ数:4、ずれ量:0.2〜0.3、0.4〜0.6、0.7〜0.8」とを対応付けた情報を記憶している。
なお、以下では、説明を簡略化するため、解像度変換の倍率として2倍が選択された場合について述べる。
まず、撮像画像判定部102は、撮像画像の任意の一つを選択し、当該撮像画像(以下、第1の撮像画像という)について、上記幾何学的歪みの判定の際に求めた撮像対象物の領域の中からズレ検出用部分領域を選択する。ここで、ズレ検出用部分領域は、第1の撮像画像と残りの撮像画像(以下、第2の撮像画像という)との間のズレ量を求めるために用いるものであるため、当該ズレ検出用部分領域内で画素値の変化が大きいもの(明確なパターンが存在するもの)が好ましい。そこで、撮像画像判定部102は、以下のような方法によってズレ検出用部分領域を抽出する。
撮像画像判定部102は、撮像対象物の領域の重心位置に存在する画素を特定し、当該画素を注目画素とする。そして、注目画素を含むn×n画素の領域を選定する。選定した領域について、以下の選定要件を満たすか否か判断し、満たす場合には、当該領域をズレ検出用部分領域とする。一方、満たさない場合には、所定のオフセット量に基づいて領域を移動させ、移動後の領域について同じ判断を行う。このようにして、ズレ検出用部分領域を抽出する。
ここで、選定要件としては、例えば、以下二つが挙げられる。
一つとしては、領域内の分散に準じた値を用いるものである。注目画素近傍のn×n画素の領域に対して画素値をP(x)とすると部分領域の分散値Variance(x)は、下記式(1)で表される。この分散値Variance(x)の値が所定閾値以上あることを選定要件とする。また簡易化のために本式の分子のみを考えても良い。
Figure 2010273218
また一つとしては、注目画素近傍のn×n画素の領域に対して、1次微分フィルタのようなエッジ抽出フィルタを掛けて、2値化し、総和を見る。図9は1次微分フィルタ例を示し、この場合も、総和がある所定閾値以上(例えば、部分領域画素数の5%以上など)あることを選定要件とすればよい。
次に、このようにして求められた、第1の撮像画像のズレ検出用部分画像A(n×n)に対し、第2の撮像画像の中から、中心がほぼ同じ位置のズレ検出用部分画像B(m×m)(m>n)として切り出す。この切り出し方法は、第1の撮像画像におけるズレ検出用部分画像Aの中心画素の座標と、第2の撮像画像におけるズレ検出用部分画像Bの中心画素の座標とが一致するように、切り出す。
その後、切り出されたズレ検出用部分画像B中においてズレ検出用部分画像Aに最も適合する領域をサブピクセル精度で求める。その手法としては、ズレ検出用部分画像Aをテンプレートとした正規化相関パターンマッチングが挙げられる。
正規化相関パターマッチングの例として、既知であるところの正規化相関式を用いて相関を算出する。一般的にN画素からなる2つのパターンInput(I)とTarget(T)の相関式は、下記式(2)と表すことができる。ここで、α、β、γはそれぞれ下記のように表せる。
Figure 2010273218
Figure 2010273218
例えば、n=5、m=7の場合、ズレ検出用部分画像B(m×m)のなかのズレ検出用部分画像Aと同サイズの領域(n×n)ごとに上記相関式を演算すると、結果として3×3の相関値Mapが生成される。この相関値Mapを用いて、フィットする2次曲面を求める。2次曲面の求め方としては、例えば、S(x,y)=a*x*x+b*x*y+c*y*y+d*x+e*y+fとして、9点のうち相関値の高い6点を選び、連立方程式を解いて各係数を求める。この関数の極値(=最大値)の座標値(x、yの両方)の小数点以下の値が所定範囲(ここでは、0.3〜0.7)であれば、処理実行条件「必要画像データ数:2、ずれ量:0.3〜0.7」を満たすものと判定する。
なお、極値の求め方は、上記2次式を偏微分し、それぞれが0である点の座標を求めればよい。このとき、実際には各係数(a〜f)を求める必要はないので、直接相関値(S〜S)を用いたほうが効率的である。求めるべき式(3)は以下のようになる。ここで、原点は着目するウィンド基準となる。
Figure 2010273218
なお、このようなサブピクセル精度の位置ズレ確認を少なくとも一か所にて行うが、数か所で行うことが望ましい。
そして、撮像画像判定部102は、処理実行条件を満たすか否かの判定結果を制御部109に出力する。
(4)ユーザへの通知に関して
撮像画像判定部102から判定結果を受けた制御部109は、その判定結果に応じて、再撮像を促すメッセージを表示部105に表示させる。
例えば、撮像画像判定部102から傾き角度θが所定範囲内でない旨の判定結果を受けた場合、制御部109は、撮像対象物が傾かないようにして再度撮像することを促すメッセージを表示部105に表示させる。
また、幾何学的歪みの度合いを示す特徴量(ここでは、撮像画像における撮像対象物の対辺の長さの比)が所定範囲内でない旨の判定結果を受けた場合、制御部109は、撮像対象物における文書画像が形成された平面の法線方向から再度撮像することを促すメッセージを表示部105に表示させる。
さらに、所定量だけずれたサブ撮像画像データが所定数ない旨の判定結果を受けた場合、制御部109は、例えば「この画像は処理できない可能性があります。もう一度撮影し直し下さい。」などの、再度撮像を促すメッセージを表示部105に表示し、新たに画像を得るようにする。その後、新たに撮像した複数のサブ撮像画像データの組合せ、もしくは、前に撮像したサブ撮像画像データおよび再度撮像されたサブ撮像画像データの組合せに対して、撮像画像判定部102が再度判定処理を行う。
そして、制御部109は、撮像画像判定部102により全ての処理実行条件を満たすと判定されたときに、当該処理実行条件を満たす所定数のサブ撮像画像データの組を高解像度出力用データセットとし、当該高解像度出力用データセットに対して、ファイルネーム、ならびに、出力処理情報を付け、記憶部108に一時的に格納しておく。
(5)撮像画像データの画像出力装置への転送について
ユーザは、携帯端末装置100を持って画像出力装置200の近くにきて、携帯端末装置100を操作し、赤外線通信のような近距離無線通信方式を用いて撮像画像データを画像出力装置200に送信させる。具体的には、ユーザは、携帯端末装置100の入力部106に、高解像度出力用データセットの送信指示を入力する。
高解像度出力用データセットの送信指示が入力されると、制御部109は、記憶部108に格納されている高解像度出力用データセットの全てを、ファイルネームおよび出力処理情報、ならびに、記憶部108に格納されている機種情報およびユーザ情報と合わせて画像出力装置200に送信する送信処理を、通信部104に実行させる。
なお、制御部109は、高解像度出力用データセットの送信指示が入力されたとき、記憶部108に格納されている高解像度出力用データセットの一覧を表示部105に表示し、送信すべき高解像度出力用データセットの選択入力を促してもよい。そして、制御部109は、ユーザによって選択された高解像度出力用データセットのみを送信させてもよい。
もしくは、制御部109は、前回に高解像度出力用データセットを画像出力装置200に送信した日時を記憶しておき、当該日時以降に撮像されたサブ撮像画像データを含む高解像度出力用データセットのみを送信させてもよい。
(6)画像出力装置の構成
次に、本実施形態に係る画像出力装置200の構成について説明する。本実施形態において、画像出力装置200は、スキャナ、プリンタ、複写機等の機能を備えた複合機である。
図10は、画像出力装置200の構成を示すブロック図である。画像出力装置200は、画像読取部201、画像処理部202、認証部203、画像形成部(出力部)204、表示部205、入力部206、第1通信部(受信部)207、第2通信部(出力部)208、記録媒体アクセス部209、記憶部210、および制御部(出力部)212を備えている。
画像読取部201は、原稿を読み取るものであり、CCD(Charge Coupled Device)を備えたスキャナ部を有し、原稿から反射してきた光を、RGBに色分解された電気信号(アナログの画像信号)に変換し、この電気信号を出力するものである。
画像処理部202は、画像データに対して、所定の画像処理を行うものである。本実施形態では、画像処理部202は、携帯端末装置から送信された高解像度出力用データセットが複数ある場合に、類似している画像を一つのグループとしてグループ分けするとともに、各グループに属する高解像度出力用データセットの中から選択されたデータセットに対して高解像度補正を行い高解像度画像データを生成する処理などを含む画像処理を行うものである。画像処理部202が撮像画像データに対して行う画像処理の詳細については後述する。
認証部203は、携帯端末装置100から受信した高解像度出力用データセットの出力処理を行う際に、ユーザ認証を行うものである。具体的には、認証部203は、携帯端末装置100から受信したユーザ情報と、入力部206に入力されたユーザ情報(ユーザIDおよびパスワード)とを照合してユーザ認証を行う。認証部203は、認証結果を制御部212に送る。
画像形成部204は、例えば電子写真方式やインクジェット方式を用いて、紙などの記録用紙上に画像を形成するものである。すなわち、画像形成部204は、出力処理の一つである印刷処理を実行するものである。
表示部205は、例えば液晶ディスプレイ等より構成される。また、入力部206は、例えば液晶ディスプレイのタッチパネルやボタンを押すことなどによりデータの入力を行うためのものである。
第1通信部207は、USB1.1またはUSB2.0の規格に基づく、シリアル転送やパラレル転送、無線データ通信機能を有するものである。第1通信部207は、携帯端末装置100から、ファイルネーム、携帯端末装置100の機種情報、ユーザ情報および出力処理情報が付加された高解像度出力用データセットを受信する。
第2通信部208は、(a)無線LANの規格である、IEEE802.11a、IEEE802.11bおよびIEEE802.11gのいずれかに基づく無線技術を利用したデータ通信、(b)イーサネット(登録商標)を利用した通信用インターフェースの機能を有し、LANケーブルを介した、ネットワークとのデータ通信、(c)無線通信規格である、IEEE802.15.1(いわゆるBluetooth(登録商標))やIrSimpleなどの赤外線通信規格、Felica(登録商標)などの通信方式のいずれかに基づく無線技術を利用したデータ通信、の機能を有するものである。
第2通信部208は、出力処理として、高解像度補正により得られる高解像度画像データをサーバに格納するファイリング処理、もしくは、高解像度補正により得られる高解像度画像データを添付したメールを送信するメール送信処理を実行する。
記録媒体アクセス部209は、プログラムが記録された記録媒体から、プログラムを読み出すものである。記憶部210は、上記各部が処理を実行するためのプログラムを記憶するためのものである。
制御部212は、画像出力装置200の各部の制御を行うものである。具体的には、制御部212は、第1通信部207が携帯端末装置100から高解像度出力用データセット(1回のシャッタ押下による複数回の連続した撮像により得られる複数のサブ撮像画像データの組)を受信すると、当該高解像度出力用データセットを画像処理部202に出力し、画像処理を実行させる。また、制御部212は、画像データに付けられているユーザ情報を認証部203に出力し、認証部203に認証処理を実行させる。制御部212は、認証部203から認証成功の認証結果を受けると、高解像度出力用データセットに付けられていた出力処理情報に従って処理を実行させる。すなわち、出力処理情報が印刷処理を示している場合、制御部212は、画像処理部202により生成される高解像度画像データに基づいた印刷を画像形成部204に実行させる。また、出力処理情報がファイリング処理またはメール送信処理を示している場合、制御部212は、画像処理部202により生成される高解像度画像データに基づいたファイリング処理またはメール送信処理を第2通信部208に実行させる。
(7)画像処理部における画像処理について
次に、画像処理部202が実行する画像処理の詳細について説明する。なお、画像処理部202は、画像読取部201が読み取った画像データに対しても画像処理を行うが、ここでは、携帯端末装置100から受信した高解像度出力用データセットに対する画像処理の内容について説明する。
図1は、画像処理部202の内部構成を示すブロック図である。図1に示されるように、画像処理部202は、画質調整部221、幾何学補正部(歪み補正部)222、レンズ歪み補正部223、類似画像判定部224、および高解像度補正部225を備えている。以下、各部の具体的な処理内容を順に説明する。
(7−1)画質調整部
画質調整部221は、高解像度出力用データセットに含まれるサブ撮像画像データのカラーバランス、コントラストの補正を行うものである。画質調整部221は、受信したサブ撮像画像データの各々について、各色チャンネルの最大値・最小値を求め、これらを揃えるようなルックアップテーブルを作成し、各色チャンネルに適用する。具体的には、画質調整部221は、ルックアップテーブルとして、図11に示すように、あるチャンネルの最大値がMX、最小値がMNであり、データが8bitのとき、MNから(MX−MN)/255のステップで増加させていくようなテーブルを作成すればよい。そして、画質調整部221は、作成したテーブルに従って、各画素値を変換する。これにより、カラーバランスが補正される。
また、画質調整部221は、コントラストの補正についても同様の方法で実行する。なお、カラーバランスを特に変える必要がなければ、各色チャンネルに適用するルックアップテーブルを同一のものとすればよい。
なお、カラーバランス・コントラストの補正方法についてはその他の公知の技術を適用してもよい。
(7−2)レンズ歪み補正部
レンズ歪み補正部223は、撮像画像判定部102における処理と同様にして、撮像画像における撮像対象物のエッジ上の点をラスター走査によって順次検出する。そして、レンズ歪み補正部223は、検出されたエッジ上の点を曲線近似し、その曲線の式からレンズひずみ補正を行う。
具体的には、レンズ歪み補正部223は、検出した撮像対象物のエッジ点を検出し、撮像画像判定部102と同様に、各エッジ点を撮像対象物の4辺に対応する4つの群に分類する。そして、図12の実線で示されるように、各群に属するエッジ点に対して2次曲線近似を行う。このようにして4つの群に対して求めた2次曲線は、撮像対象物の4辺に対応する。また、レンズ歪み補正部223は、4つの2次曲線で囲まれる領域の角部に相当する、4つの2次曲線の交点を求める。次に、レンズ歪み補正部223は、各辺に対して求めた2次曲線に外接し、かつ、4つの交点を結んだ四角形(図12において点線で示される)と合同な外接四角形(図12において1点鎖線で示される)を求める。そして、レンズ歪み補正部223は、このようにして求めた外接四角形が補正後の対象物のエッジ画素の位置となるように、撮像画像における撮像対象物の領域内の画素位置を変換する。この変換は、基準点(例えば撮像対象物の領域の重心点)からのベクトルを基に計算すればよい。これにより、携帯端末装置100の撮像部101によるレンズ歪みを補正することができる。
レンズ歪みの補正の方法としては、上記の方法に限定されるものではなく公知の技術を用いることができる。
(7−3)幾何学補正部
幾何学補正部222は、幾何学補正部222は、ポスターや原稿用紙のような矩形状の撮像対象物に対して、文書画像が形成された平面の法線方向とは異なる方向から撮像することによるサブ撮像画像データにおける撮像対象物の歪み(つまり、文書画像が形成された矩形状の平面の歪み)を補正するとともに、サブ撮像画像データにおける撮像対象物の傾きを補正するものである。
具体的には、幾何学補正部222は、幾何学的歪みおよび傾きの補正を以下のようにして実行する。幾何学補正部222は、例えば、図13に示すように、上記のようにして求めた外接四角形を対象物のアスペクト比(例えば、ビジネス文書で用いられているA判B判なら7:10であるなど)に合わせ同様に写像変換すればよい。当該写像変換としては公知の技術を用いることができる。なお、画像処理部202は、予め記憶部210に記憶されているアスペクト比に合うように変換してもよいし、入力部206に入力されたアスペクト比に合うように変換してもよい。
なお、幾何学補正部222は、設定されたアスペクト比に変換した後、(3−1)で記載された方法により撮像対象物の傾きを検知し、当該傾きが0度になるようにサブ撮像画像データの回転処理を施す。これにより、図13の実線に示されるように、傾きが0度のサブ撮像画像データが得られる。
幾何学的歪みの補正の方法としては、上記の方法に限定されるものではなく公知の技術を用いることができる。
(7−4)類似画像判定部
類似画像判定部224は、複数の高解像度出力用データセットを受けたときに、各高解像度出力用データセットで示される画像同士が類似しているか否かを判定し、類似している画像ごとにグループ分けを行うものである。類似画像判定部224は、各高解像度出力用データセットに対して、当該高解像度出力用データセットに含まれる複数のサブ撮像画像データの中から選択した一つのサブ撮像画像データであり、かつ、上記画質調整部221、レンズ歪み補正部223および幾何学補正部222により補正が施されたサブ撮像画像データを類似画像判定用データとする。ここでは、類似画像判定部224は、例えば、最初に撮像されたサブ撮像画像データ、つまり、撮像時刻が最も古いサブ撮像画像データに対して補正が施されたデータを類似画像判定用データとして選択するものとする。そして、類似画像判定部224は、各高解像度出力用データセットに対応する類似画像判定用データを用いて、画像が類似しているか否かを判定する。
類似画像判定部224による判定処理としては、例えば、特開2007−172077に記載の方法など公知の技術を用いることができる。以下、本実施形態の類似画像判定部224の具体的な処理方法について説明する。
まず、類似画像判定部224は、各高解像度出力用データセットに対応する類似画像判定用データについて、一定サイズのブロック(例えば、8×8、16×16など)に分割し、例えば、エッジ抽出フィルタを用いてエッジ量の2次元分布(ブロック毎に集計したエッジ量)を求める。なお、エッジ量の代わりに、ブロックの平均色を用いても良い。そして、ブロック毎に集計したエッジ量(または平均色)を第1特徴量とする。
次に、類似画像判定部224は、類似画像判定用データの各々について文字認識を行い、例えば、当該類似画像用判定データに含まれる単語の出現回数を求め、これを第2特徴量とする。なお、類似画像判定部224は、各類似画像判定用データを識別する識別IDと、当該類似画像判定用データについて算出した第1特徴量・第2特徴量とを対応づけて、記憶部210に一時的に格納しておく。
次に、類似画像判定部224は、複数の類似画像判定用データの各々について、以下の処理に従ってグループ分けを行う。
最初に、類似画像判定部224は、複数(N個とする)の類似画像判定用データの各々に対して順番を示す番号k(k=1〜N)を割り振る。なお、番号kの割り振り方法は特に限定されるものではない。例えば、撮像時刻の古い順に番号kを割り振る。
そして、k=1の類似画像判定用データについては第1のグループに属するものとして分類する。
一方、k=2以降の類似画像判定用データについては、k−1番目までの類似画像判定用データの各々(以下、分類済みの類似画像判定用データという)との間で後述する第1スコアおよび第2スコアを算出し、当該第1スコアおよび第2スコアを統合した統合スコアを求める。そして、この統合スコアを所定閾値と比較して、いずれのグループに属するかを決定する。
ここで、第1スコアとは、k番目の類似画像判定用データから算出された上記第1特徴量と、分類済みの類似画像判定用データから算出された上記第1特徴量とのブロック毎の差分の絶対値の和の逆数を定数倍したものである。ここで、定数とは計算値が整数となるように予め設定されている。k番目の類似画像判定用データと分類済みの類似画像判定用データとが類似している場合、第1特徴量のブロック毎の差分は小さくなり、第1スコアはより大きな値をとる。
なお、第1特徴量が平均色である場合、例えば、256色のカラーパレットを用いて当該平均色を数値に置き換えることで、上記のような第1スコアを求めることができる。
また、第2スコアとは、k番目の類似画像判定用データから算出された上記第2特徴量と、分類済みの類似画像判定用データから算出された上記第2特徴量との単語毎の差分の絶対値の和の逆数を定数倍したものである。ここで、定数とは計算値が整数となるように予め設定されている。k番目の類似画像判定用データと分類済みの類似画像判定用データとが類似している場合、第2特徴量の単語毎の差分は小さくなり、第2スコアはより大きな値をとる。
さらに、統合スコアとは、第1スコアと第2スコアとに予め定められた重み係数を乗算し、両スコアを加算したものである。なお、重み係数は、第1スコア・第2スコアを求める際の定数、第1特徴量を求める際のブロック数などによって予め定められる。また、第2特徴量が求められた単語数に応じて重み係数を変更してもよい。
そして、このようにして求めた統合スコアが所定閾値以上である場合、類似画像判定部224は、k番目の類似画像判定用データが当該統合スコアに対応する分類済みの類似画像判定用データと類似していると判断し、当該分類済みの類似画像判定用データと同じグループにk番目の類似画像判定用データを分類する。もし、全ての分類済みの類似画像判定用データとの間で算出された統合スコアが所定閾値未満である場合、k番目の類似画像判定用データは、新たなグループに属するものと判定する。
なお、各類似画像判定用データは、異なる高解像度出力用データセットに含まれているものであり、類似しているとしても完全に同一ではない。そのため、上記のような統合スコアを用いた類似判定を用いる場合、類似画像判定用データAと類似画像判定用データBとが類似し、かつ、類似画像判定用データBと類似画像判定用データCとが類似していたとしても、類似画像判定用データAと類似画像判定用データCとが類似していないことも有り得る。
そこで、あるグループに、分類済みの類似画像判定用データが複数属する場合、これら分類済みの類似画像判定用データのいずれか一つとの間の統合スコアが所定閾値以上であれば、k番目の類似画像判定用データが当該グループに属するものと判定する。
また、あるグループに属する分類済みの類似画像判定用データとの間の統合スコアが所定閾値以上であり、かつ、別のグループに属する分類済みの類似画像判定用データとの間の統合スコアも所定閾値以上である場合、当該二つのグループを統合して一つのグループとする。
類似画像判定部224は、このようにしてグループ分けを行い、各グループと当該グループに属する類似画像判定用データの識別IDとを対応付けたグループ分け情報を記憶部210に格納する。
なお、類似画像判定部224は、ユーザからの変更指示に応じてグループ分け情報を変更してもよい。
このように、類似画像判定部224は、受信した各高解像度出力用データセットから特定した複数の類似画像判定用データについて、各類似画像判定用データで示される画像の特徴を示す特徴量を算出し、対応する特徴量の類似度である統合スコアが所定閾値以上の類似画像判定用データが同じグループになるようにグループ分けを行う。
(7−5)高解像度補正部
高解像度補正部225は、携帯端末装置100から受信した撮像画像データの高解像度補正を行うものである。本実施形態では、高解像度補正部225は、携帯端末装置100から受信した高解像度出力用データセットに含まれる複数のサブ撮像画像データに基づいて高解像度補正を行う。
ただし、高解像度補正部225は、類似画像判定部224によってグループ分けされた各グループの中から一つの類似画像判定用データを選択する選択部としても機能する。そして、高解像度補正部225は、選択した類似画像判定用データに対応する高解像度出力用データセットに基づいて高解像度補正を行う。
ここでは、高解像度補正部225は、各グループの中から、撮像対象物の傾きが最も小さい類似画像判定用データを選択するものとする。具体的には、高解像度補正部225は、(7−2)(7−3)で求めた撮像対象物の4辺に対応する4つの群の各々に属するエッジ点を特定する。そして、高解像度補正部225は、第1群に属するエッジ点の近似直線の傾きが最も小さい類似画像判定用データを選択する。これにより、高解像度補正部225は、各グループにおいて、歪みの最も小さい高解像度出力用データセットに基づいて高解像度補正を行うこととなり、出力される高解像度化された画像データの品質を良くすることができる。
複数の画像データからの高解像度画像作成方法に関しては、映像情報メディア学会誌Vol.62、No.3、pp.337〜342(2008)にいくつかの方法が紹介されている。一般的には、高解像度補正は、複数の画像の位置合わせ処理と再構成処理により成立する。本実施形態では、位置合わせ処理の例として、上記(3−3)記載の正規化相関パターンマッチングの方法を適用する。すなわち、上記S(x,y)が極大値を示すズレ量だけずらすことにより、複数の画像の位置合せを行うことができる。
次に、高解像度補正部225は、再構成処理を行う。すなわち、高解像度補正部225は、解像度変換後の倍率に応じた画素数を有する再構成画像データを作成する。ただし、画像サイズは、撮像画像のサイズと同一とする。そして、高解像度補正部225は、再構成画像データの各画素の画素値を以下のようにして決定する。すなわち、高解像度補正部225は、再構成画像データにおける各画素(再構成画素)について、当該再構成画素の近傍となる撮像画像の画素(撮像画素)を複数の撮像画像の中から決定し、一般的な補間方法(線形補間やバイキュービック補間など)で補間を行う。
具体的には、図14に示されるように、着目する再構成画素近傍の撮像画素、例えば撮像画素の格子を結ぶ線(図の点線)が最も近距離である2点を横方向・縦方向のそれぞれで選択する。ここでは、横方向での最も近距離である2点は、1枚目の撮像画像の撮像画素1−2(画素値:Vi1−2:以下同様)および撮像画素1−4であり、縦方向での最も近距離である2点は、2枚目の撮像画像の撮像画素2−1および撮像画素2−2であったとする。なお、再構成画素近傍の撮像画素を選択する際には、上記幾何学的歪みの補正・レンズ歪みの補正が実行された複数のサブ撮像画像データの中から選択するものとする。これにより、幾何学的歪み・レンズ歪みの補正がされた状態で高解像度補正を行うことができる。
なお、補正後の座標の値を計算する際に、基となる複数の撮像画像の該当する幾何学補正・レンズ歪みの補正を考慮した座標の値を基に求めてもよい。つまり、幾何学補正・レンズ歪みの補正値のみ算出し、再構成処理を行った後に、当該補正値により座標変換を行ってよい。
そして、横方向および縦方向のそれぞれについて選択した2点を結ぶ線分に垂直であり、かつ着目する再構成画素の点を含む直線と当該線分との交点を求める。図14に示されるように、当該交点が2つの線分のそれぞれについてt:1−t、u:1−uで内分している場合、画像処理部202は、着目する再構成画素の画素値Vを下記式4に基づいて求めればよい。この場合は、線形補間を行ったことになる。そして、全ての再構成画素について同様にして画素値を求め、高解像度化された再構成画像データを高解像度画像データとして生成することができる。
Figure 2010273218
なお、補間方法として別の手法を用いても良い。また、映像情報メディア学会誌Vol.62、No.3、pp.337〜342(2008)に紹介されている別の方法を用いてもよい。例えば、MAP(Maximum A Posteriori)法のような、先ず推定に基づく事後確率に対応する評価関数を最小化することで求める手法を用いても良い。
このように高解像度補正部225は、類似画像判定部224によりグループ分けされた各グループの中から1つの類似画像判定用データを選択する選択部としても機能する。なお、2以上の類似画像判定用データを選択してもよい。例えば、各グループの中から、撮像対象物の傾きが最も小さい2つの類似画像判定用データを選択してもよい。
そして、高解像度補正部225は、高解像度出力用データセットに含まれる複数のサブ撮像画像データに基づいて、当該サブ撮像画像データの解像度よりも高解像度の高解像度画像データを生成する高解像度補正を行う。
(8)撮像画像処理システムの画像処理の流れ
以下、本実施形態に係る撮像画像処理システムの処理の流れについて説明する。なお、図15は携帯端末装置100の処理フローを示し、図16は画像出力装置200の処理フローを示している。また、図17は、図16に示す類似画像判定の処理の詳細を示すフローである。
まず、図15を参照しながら携帯端末装置100の処理フローについて説明する。携帯端末装置100では、文書撮像モードでの撮像指示の入力の有無を確認する(S10)。ユーザは、文書画像を含む用紙や表示画面など矩形状の撮像対象物を撮像し、撮像画像を画像出力装置200により高解像度化して出力することを希望する場合、文書撮像モードを選択入力する。
文書撮像モードの選択入力を受け付けた携帯端末装置100では、制御部109は、高解像度補正を行う際の解像度変換の倍率の入力を促す画面を表示部105に表示し、当該倍率を入力部106から取得する。制御部109は、取得した倍率に応じて、撮像部101における撮像回数、撮像画像判定部102における処理実行条件の一部を決定する。また、制御部109は、出力処理の種類および出力処理のための設定条件の入力を促す画面を表示部105に表示し、入力部106から出力処理情報を取得する。なお、制御部109は、デフォルトの解像度変換の倍率を記憶しておき、入力部106に倍率の入力指示が無い場合、当該デフォルトの倍率に設定してもよい。
そして、撮像部101は、シャッターが押下されたことを検知すると、制御部109にて設定された撮像回数だけ連続して撮像する(S11)。
次に、画像処理部103は、撮像した画像のデータに対して少なくともA/D変換処理を行う。その後、A/D変換処理された撮像画像データに対して、撮像画像判定部102は、処理実行条件を満たすか否かを判定する(S12)。なお、詳しい判定方法、判定項目などは、例えば上記(3−1)〜(3−3)で説明したとおりである。
撮像画像判定部102が処理実行条件を満たさないと判定した場合(S12でNO)、制御部109は、表示部105に再撮像の旨を示すメッセージなどを表示して、ユーザに通知する(S13)。再撮像した画像であっても、上述した判定項目などを満足しない場合、携帯端末装置100はステップS11〜S13を繰り返して行う。
一方、撮像画像判定部102が処理実行条件を満たすと判定した場合(S12でYES)、制御部109は、処理実行条件を満たす撮像画像データにファイルネームを付ける(S14)。なお、制御部109は、例えば、撮像日時に従った連続番号など各撮像画像データについて異なるファイルネームを自動的に付けても良いし、入力部106に入力されたファイルネームを付けてもよい。その後、制御部109は、ファイルネームが付けられた、処理実行条件を満たす撮像画像データを一つの高解像度出力用データセットとして、記憶部108に格納する(S15)。
その後、制御部109は、高解像度出力用データセットの送信指示が入力部106に入力されたか否かを判断する(S16)。送信指示が入力されていない場合(S16でNO)、S10の処理に戻る。一方、送信指示が入力された場合(S16でYES)、制御部109は、記憶部108に格納されている全ての高解像度出力用データセットの各々に、機種情報、ユーザ情報、および当該データセットの出力処理情報を付加して画像出力装置200に送信するように、通信部104を制御する(S17)。なお、本実施形態では、携帯端末装置100と画像出力装置200とは近距離無線通信の方式を用いて通信を行う。そのため、ユーザは、携帯端末装置100を持って画像出力装置200の近傍まで来た後に、送信指示を入力する。
次に、図16および図17を参照しながら画像出力装置200の処理フローを説明する。画像出力装置200の第1通信部207は、携帯端末装置100からの高解像度出力用データセット、機種情報、ユーザ情報および各データセットの出力処理情報を受信する(S20)。
画像処理部202の画質調整部221は、受信した高解像度出力用データセットに含まれるサブ撮像画像データの全てについて、例えば上記(7−1)に説明したとおり、カラーバランス、コントラストの補正を行う(S21)。続いて、レンズ歪み補正部223が上記(7−2)に説明したようにレンズ歪みを行うとともに、幾何学補正部222が上記(7−3)に説明したよう幾何学的歪みおよび傾きの補正を行う(S22)。
次に、類似画像判定部224は、類似画像の判定処理を実行する(S23)。この類似画像の判定処理(S23)の詳細について図17を参照しながら説明する。まず、類似画像判定部224は、各高解像度出力用データセットについて、最も撮像時刻の古いサブ撮像画像データを特定し、当該サブ撮像画像データに対してS21、S22の処理が施されたデータを類似画像判定用データとする(S231)。
そして、類似画像判定部224は、各高解像度出力用データセットから選定した類似画像判定用データに対して、上記第1特徴量および第2特徴量を抽出する(S232)。そして、類似画像判定部224は、類似画像判定用データを識別する識別IDと当該類似画像判定用データから抽出した第1特徴量および第2特徴量とを対応づけて記憶部210に格納する(S233)。この処理を全ての類似画像判定用データについて行う(S232−S234)。
次に、類似画像判定部224は、S231において各高解像度出力用データセットから選定した類似画像判定用データの各々に対して順番を示す番号k(k=1〜N)を割り振り、番号kの順に上記(7−4)に記した方法によって、統合スコアを用いて類似している画像同士が同じグループに属するようにグループ分けを行う(S235)。そして、類似画像判定部224は、各グループの識別番号と、当該グループに属する類似画像判定用データの識別IDとを対応付けたグループ分け情報を記憶部210に格納する。
なお、類似画像判定部224は、ユーザ情報ごとに、グループ分けを実行する。すなわち、類似画像判定部224は、ユーザ情報ごとに、当該ユーザ情報が付加された複数の高解像度出力用データセットに対してグループ分けを実行する。
次に、制御部212は、グループ分け情報を参照することで、2以上の類似画像判定用データの識別IDに対応付けられたグループが存在するか否かを確認する(S236)。つまり、類似画像が存在するか確認する。2以上の識別IDに対応付けられたグループが存在する場合(S236でYES)、制御部212は、類似画像が存在している旨を通知する画面を表示部に表示する。さらに、制御部212は、類似画像の確認を行うときには確認指示の入力を促す画面も表示する(S237)。
確認指示が入力された場合(S237でYES)、2以上の類似画像判定用データの識別IDに対応付けられたグループごとに、制御部212は、当該グループに属する類似画像判定用データで示される画像を表示する。そして、制御部212は、いずれかの画像の選択指示(例えば、対象の画像が表示されている領域にタッチする)(変更指示)、および、選択された画像の削除指示(変更指示)が入力部に入力されると、当該指示に従った処理を行う。具体的には、制御部212は、類似画像判定部224に対して、グループ分け情報において、選択された画像を示す類似画像判定用データの識別IDを当該識別IDに対応するグループから削除するように指示する。選択指示および削除指示が入力されなければ、次のグループについて同様の処理を行う。
なお、類似画像判定部224は、削除された識別IDと新たなグループとを対応付けたグループ分け情報を生成し、記憶部に更新してもよい。また、類似画像判定部224は、各グループに属する類似画像判定用データで示される画像を、順次1枚ずつ表示してもよいし、サムネイルで表示してもよい。
このようにして、類似画像判定部224は、制御部212からの指示に応じて、記憶部に格納しているグループ分け情報を更新する(S238)。その後、図16のフローに戻り、S24の処理を行う。
S24では、高解像度補正部225は、グループ分け情報を参照し、各グループの中から、撮像対象物の傾きが最も小さい類似画像判定用データを選択する。この選択方法は上述したとおりである。そして、高解像度補正部225は、各グループについて、選択した類似画像判定用データに対応する高解像度出力用データセットに基づいて高解像度補正を行う。なお、高解像度補正部225は、S21およびS22による各種補正が実行された、高解像度出力用データセットに含まれる複数のサブ撮像画像データを用いて高解像度補正を行う。なお、高解像度補正の具体的な方法は(7−5)で説明したとおりである。
そして、高解像度補正部225は、各グループについて、高解像度補正により得られた高解像度画像データを記憶部210に格納する(S25)。なお、このとき、高解像度補正部225は、高解像度画像データの元となる高解像度出力用データセットとともに受信したユーザ情報および出力処理情報と対応付けて当該高解像度画像データを格納する。
その後、制御部212は、撮像画像データの出力指示が入力部206に入力されたか否かを判定する(S26)。出力指示の入力がない場合(S26でNO)、出力指示が入力されるまで待機する。
一方、出力指示がある場合(S26でYES)、認証部203は、ユーザ情報(例えばユーザIDおよびパスワード)の入力を促す画面を表示部205に表示させ、ユーザ情報を入力部206から取得する。そして、認証部203は、ユーザ認証を行う(S27)。なお、認証部203は、画像出力装置200に設けられた非接触ICカードのリーダ/ライターを用いて、ユーザが所持する非接触ICカードからユーザ情報を取得してもよい。。
ユーザ認証を行う際、認証部203は、入力されたユーザ情報と携帯端末装置100から受信したユーザ情報とを対照して、一致するユーザ情報が存在するか否か判定する(S28)。そして、入力されたユーザ情報と一致するユーザ情報を携帯端末装置100から受信している場合(S28でYES)、制御部212は、S25において記憶部210に格納され、当該ユーザ情報に対応する高解像度画像データの出力処理を、携帯端末装置100から受信した出力処理情報に従って実行させる(S29)。
例えば、出力処理情報が印刷処理を示している場合、制御部212は、高解像度補正部225により選択された類似画像判定用データを含む高解像度出力用データセットに対して、高解像度補正部225が高解像度補正を行うことにより得られた高解像度画像データ(選択高解像度画像データ)で示される画像の印刷を画像形成部204に実行させる。また、出力処理情報がファイリング処理またはメール送信処理を示している場合、制御部212は、高解像度補正部225により選択された類似画像判定用データを含む高解像度出力用データセットに対して、高解像度補正部225が高解像度補正を行うことにより得られた高解像度画像データ(選択高解像度画像データ)に基づいたファイリング処理またはメール送信処理を第2通信部208に実行させる。その後、処理を終了する。
一方、入力されたユーザ情報が、携帯端末装置100から受信したユーザ情報と一致していない場合(S28でNO)、認証部203は、認証回数が所定回数以上であるか判定する(S30)。そして、認証回数が所定回数以上でない場合(S30でNO)、S27,S28の処理を繰り返して行う。認証回数が所定回数以上である場合(S30でYES)、出力せずにフローを終了する。
以上のように、本実施形態によれば、携帯端末装置100で撮像した撮像画像を高解像度補正した状態で画像出力装置200で出力させることができる。その結果、文字の判読性を向上させることができる。そのため、原稿用紙を画像出力装置200まで持っていくことが困難な場合であっても、当該原稿用紙を撮像することで、当該原稿用紙の画像を高解像度で得ることができる。また、プロジェクターなどで表示された映像画面についても携帯端末装置100で撮像することで、後に画像出力装置200から高解像度の画像を得ることができる。
また、本実施形態によれば、同じ撮像対象物を複数回撮像することにより得られる高解像度出力用データセットが複数存在する場合でも、画像出力装置200が類似画像ごとにグループ分けを行い、各グループにおいて選択された一つの高解像度出力用データセットから得られる再構成画像データを出力する。そのため、同じような画像が複数出力されることを防止でき、ユーザの利便性が向上する。
(9)変形例
本発明の撮像画像処理システムは、上記の実施形態に限定されることがなく、様々な変更が可能である。以下、変形形態の具体例について説明する。
(9−1)撮像回数について
上記の説明では、携帯端末装置100において、制御部109は、高解像度補正のために必要な撮像画像の数だけ撮像部101に撮像させるものとした。すなわち、制御部109は、撮像回数と処理実行条件の中のサブ撮像画像データの必要数とを同じ値に設定した。しかしながら、制御部109は、撮像回数として、高解像度補正のための必要数よりも大きな値を設定してもよい。例えば、解像度変換の倍率が2倍である場合、必要数「2」に対して撮像回数「3」を設定してもよい。
このように撮像回数が必要数よりも大きい場合、撮像画像判定部102は、撮像回数分のサブ撮像画像データの中から、処理実行条件を満たすサブ撮像画像データの組合せが存在するか否かを判断すればよい。例えば、必要数「2」に対して撮像回数「3」である場合、3つのサブ撮像画像データの中で、必要数のサブ撮像画像データの組合せが3つある。この場合、撮像画像判定部102は、各組合せについて処理実行条件を満たすか否か順次判定する。そして、処理実行条件を満たす組合せを確認できた時点で撮像画像判定部102は処理を終了し、当該組合せに含まれるサブ撮像画像データを通信部104が画像出力装置200に送信すればよい。もしくは、撮像画像判定部102は、全ての組合せについて処理実行条件を満たすか否か判定してもよい。この場合、複数の組合せが処理実行条件を満たす場合、制御部109は、検出したズレ量が所定範囲の中央値に最も近い組合せを画像出力装置200に送信するものと決定してもよい。例えば、所定範囲が0.3〜0.7である場合、ズレ量が0.5に最も近い組合せを選択すればよい。
(9−2)高解像度補正の別の例
上記の説明では、複数のサブ撮像画像データから高解像度の再構成画像データを生成するものとした。しかしながら、複数の画像データではなく、1つの画像データに基づいて高解像度補正を行ってもよい。
1つの画像データからの高解像度画像作成方法に関しては、映像情報メディア学会誌Vol.62、No.2、pp.181〜189(2008)にいくつかの方法が紹介されている。
一般的には、画像パターンのエッジ方向性を検知し、その向きに合わせた補間を行うとともに、補間によるひずみや入力画像に存在したノイズ成分の影響などの除去を目的としたノイズ除去処理を行うことにより、高解像度補正を実行することができる。以下、具体的に説明する。
図18は、本実施形態における高解像度補正の処理の流れを示すフローチャートである。
ここでは、横方向・縦方向の各々について2倍の解像度変換を行う例について説明する。2倍の解像度変換を行う場合、補正対象となる撮像画像データの画素数をn×mとするとき、補正後の高解像度画像データの画素数は2n×2mとなる。このような高解像度補正(2倍の解像度変換)は、撮像画像データにおける各画素を基準画素とし、当該基準画素間の中央に新たな画素を補間画素として生成し、当該基準画素と補間画素との両方を備える画像データを高解像度画像データとして生成することにより実行される。図19は、基準画素と補間画素との関係を示すものであり、画素aが基準画素を示し、画素bが補間画素を示している。
まず、高解像度補正部225は、第1通信部207が受信した撮像画像データについて、エッジ抽出を行う。例えば、高解像度補正部225は、図9に示されるような1次微分フィルタを用いてエッジ抽出を行い、2値化処理を行い、2値化画像データを生成する(S40)。なお、2値化画像データにおいて画素値が1であればエッジである可能性が高い画素であることを示している。
次に、高解像度補正部225は、S40で生成した2値化画像データに基づいて、撮像画像データにおける着目画素がエッジであるか否かを判定する(S41)。具体的には、高解像度補正部225は、2値化画像データにおける着目画素に対応する画素の値が1であれば、当該着目画素がエッジであると判定する。
なお、着目画素とは、撮像画像データにおける各画素を任意の順に着目していったときに、着目している画素のことをいう。
着目画素がエッジである場合(S41でYes)、高解像度補正部225は、着目画素を含むN×N(N>1)の部分画像を用いてエッジ方向を検出する(S42)。具体的には、N×Nの部分画像に含まれる全ての基準画素について、エッジ画素であるか否かを判定する。そして、着目画素の左上の基準画素と右下の基準画素とがエッジ画素である場合、高解像度補正部225は、部分画像におけるエッジ方向が左上−右下方向であると判定する。同様に、着目画素の左の基準画素と右の基準画素とがエッジ画素である場合、エッジ方向が左−右方向であると判定し、着目画素の上の基準画素と下の基準画素とがエッジ画素である場合、エッジ方向が上−下方向であると判定し、着目画素の右上の基準画素と左下の基準画素とがエッジ画像である場合、エッジ方向が右上−左下方向であると判定する。
図20において、点線は検出したエッジ方向を示している。なお、図20において、画素(1)〜(9)が基準画素であり、このうちの画素(5)が着目画素である。そして、画素A、B、Cは、それぞれ、基準画素(1)と(5)との間の補間画素、基準画素(2)と(5)との間の補間画素、基準画素(4)と(5)との間の補間画素である。
次に、高解像度補正部225は、S42で検出したエッジ方向に応じて、着目画素の左上の補間画素A、着目画素の上の補間画素B、着目画素の左の補間画素Cの画素値を補間により求める。このとき、エッジ方向に沿った基準画素を用いて補間画素の画素値を求める。
エッジ方向が左上−右下方向である場合、図20(a)に示されるように、基準画素(1)、(5)、(9)がエッジ画素であり、これらの画素を結ぶ線がエッジ線となる。そして、エッジ線上の補間画素Aの画素値VA(図中では「V」の表記を省略している。以下同じ)について、補間画素Aに隣接するエッジ線上の基準画素(1)(画素値V(1))および基準画素(5)(画素値V(5))の画素値を用いて、以下の式
VA=(V(1)+V(5))/2
により求める。
一方、エッジ線上ではない補間画素B,Cについては、エッジ線上の基準画素を除く基準画素のうちの、当該補間画素に最も近い基準画素(最近接基準画素)を含み、エッジ方向に平行な線上の基準画素を用いて補間する。例えば、図20(a)では、補間画素Bについては、最近接基準画素である基準画素(2)を含み、エッジ方向に平行な線は、基準画素(2)と(6)とを結ぶ線である。そして、補間画素Bから当該線に垂直に下した点は、基準画素(2)と(6)とを結ぶ線分を内分する。そのため、補間画素Bの画素値VBは、以下の式
VB=(9×V(2)+4×V(6))/13
を用いて求める。
同様に、補間画素Cの画素値VCは、最近接基準画素である基準画素(4)と、当該基準画素(4)を含みエッジ方向に平行な線上の基準画素(8)との画素値を用いて、以下の式
VC=(9×V(4)+4×V(8))/13
により求める。
また、エッジ方向が左−右方向である場合、図20(b)に示されるように、基準画素(4)、(5)、(6)がエッジ画素であり、これらの画素を結ぶ線がエッジ線となる。そして、エッジ線上の補間画素Cの画素値VCについて、補間画素Cに隣接するエッジ線上の基準画素(4)(画素値V(4))および基準画素(5)(画素値V(5))の画素値を用いて、以下の式
VC=(V(4)+V(5))/2
により求める。
一方、エッジ線上ではない補間画素A、Bについては、エッジ線上の基準画素を除く基準画素のうちの、当該補間画素に最も近い基準画素(最近接基準画素)を含み、エッジ方向に平行な線上の基準画素を用いて補間する。例えば、図20(b)では、補間画素Aについては、最近接基準画素である基準画素(1)または(2)を含み、エッジ方向に平行な線は、基準画素(1)と(2)とを結ぶ線である。そして、補間画素Aから当該線に垂直に下した点は、基準画素(1)と(2)との中央に存在する。そのため、補間画素Aの画素値VAは、以下の式
VA=(V(1)+V(2))/2
を用いて求める。
補間画素Bについては、最近接基準画素である基準画素(2)を含み、エッジ方向に平行な線は、基準画素(1)と(2)と(3)とを結ぶ線である。そして、補間画素Bから当該線に垂直に下した点は、基準画素(2)と一致する。そのため、補間画素Bの画素値VBは、基準画素(2)の画素値V(2)と同じ値にする。
また、エッジ方向が右上−左下方向である場合、図20(c)に示されるように、基準画素(3)、(5)、(7)がエッジ画素であり、これらの画素を結ぶ線がエッジ線となる。そして、補間画素A,B,Cは全てエッジ線上に存在しない。
補間画素Aについては、最近接基準画素が基準画素(1)、(2)、(4)となる。ここで、基準画素(2)、(4)は、エッジ方向に平行な同一の線上に位置するが、基準画素(1)は当該線上に位置しない。そこで、補間画素Aの画素値VAについて、最近接基準画素である基準画素(1)、(2)、(4)の画素値を用いて、以下の式
VA=(V(1)+V(2)+V(4))/3
により求める。
一方、補間画素B,Cについては、エッジ線上の基準画素を除く基準画素のうちの、当該補間画素に最も近い基準画素(最近接基準画素)を含み、エッジ方向に平行な線上の基準画素を用いて補間する。例えば、図20(c)では、補間画素Bについては、最近接基準画素である基準画素(2)を含み、エッジ方向に平行な線は、基準画素(2)と(6)とを結ぶ線である。そして、補間画素Bから当該線に垂直に下した点は、基準画素(2)と(4)とを結ぶ線分を内分する。そのため、補間画素Bの画素値VBは、以下の式
VB=(9×V(2)+4×V(4))/13
を用いて求める。
同様に、補間画素Cの画素値VCは、最近接基準画素である基準画素(4)と、当該基準画素(4)を含みエッジ方向に平行な線上の基準画素(2)との画素値を用いて、以下の式
VC=(4×V(2)+9×V(4))/13
により求める。
また、エッジ方向が上−下方向である場合、図20(d)に示されるように、基準画素(2)、(5)、(8)がエッジ画素であり、これらの画素を結ぶ線がエッジ線となる。そして、エッジ線上の補間画素Bの画素値VBについて、補間画素Bに隣接するエッジ線上の基準画素(2)および基準画素(5)の画素値を用いて、以下の式
VC=(V(2)+V(5))/2
により求める。
一方、エッジ線上ではない補間画素A、Cについては、エッジ線上の基準画素を除く基準画素のうちの、当該補間画素に最も近い基準画素(最近接基準画素)を含み、エッジ方向に平行な線上の基準画素を用いて補間する。例えば、図20(d)では、補間画素Aについては、最近接基準画素である基準画素(1)または(4)を含み、エッジ方向に平行な線は、基準画素(1)と(4)とを結ぶ線である。そして、補間画素Aから当該線に垂直に下した点は、基準画素(1)と(4)との中央に存在する。そのため、補間画素Aの画素値VAは、以下の式
VA=(V(1)+V(4))/2
を用いて求める。
補間画素Cについては、最近接基準画素である基準画素(4)を含み、エッジ方向に平行な線は、基準画素(1)と(2)と(3)とを結ぶ線である。そして、補間画素Cから当該線に垂直に下した点は、基準画素(4)と一致する。そのため、補間画素Cの画素値VCは、基準画素(4)の画素値V(4)と同じ値にする。
なお、記憶部210は、エッジ方向と、補間画素A,B,Cの画素値を求めるための演算式とを対応付けた情報を予め記憶している。そして、高解像度補正部225は、S42で検出されたエッジ方向に対応する演算式を記憶部210から読み出し、読み出した演算式に基づいて、補間画素A,B,Cの画素値を求めればよい。
なお、図20では、エッジ方向が直線状である場合のみ示している。しかしながら、エッジは、N×Nの部分画像内において曲がる場合もある。例えば、エッジが基準画素(2)−(5)−(4)のように曲がる場合や、エッジが基準画素(1)−(5)−(7)のように曲がる場合などである。このような場合についても、補間画素A,B,Cの画素値を求めるための演算式とを対応付けた情報を予め記憶している。例えば、エッジが基準画素(2)−(5)−(4)のように曲がる場合、補間画素Aについては図20(c)と同様に、補間画素Bについては図20(b)と同様に、補間画素Cについては図20(d)と同様の演算式を記憶している。また、エッジが基準画素(1)−(5)−(7)のように曲がる場合、補間画素Aについては図20(a)と同様に、補間画素Bについては図20(a)と同様に、補間画素Cについては図20(d)と同様の演算式を記憶している。他のエッジ方向のパターンについても同様に記憶している。
このようにして、高解像度補正部225は、エッジ画素と判定された基準画素の周囲に位置する補間画素の画素値を求める。
一方、着目画素がエッジでない場合(S41でNo)、高解像度補正部225は、当該着目画素の左上に隣接する補間画素A,当該着目画素の上に隣接する補間画素B,当該着目画素の左の補間画素Cの画素値を、一般的な補間演算法(バイリニア・バイキュービックなど)により求める(S43)。
高解像度補正部225は、上記のS41〜S43の処理を、一つの画像データに含まれる全ての基準画素について実行することで、基準画素と補間画素との両方を備える補間画像データを生成する(S44)。
その後、高解像度補正部225は、生成した補間画像データに対して高画質化処理を行う。例えば、高解像度補正部225は、ノイズ除去フィルタや鮮鋭化フィルタなどを補間画像データに適用して、高解像度画像データを生成する。従来からあるアンシャープマスクや図9の中央の係数を5としたものが鮮鋭化フィルタとなる。またノイズ除去としてはメディアンフィルタなどが広く知られている。より高度な手法として、上記エッジ保存性と高画質化を併せ持つ手法としてBilateralフィルタ[Proceedings of the 1998 IEEE International Conference on Computer Vision,]などを用いてもよい。
なお、高解像度補正部225は、上述した方法に限定されず、映像情報メディア学会誌Vol.62、No.2、pp.181〜189(2008) に記載されているような種々の方法を用いて、1つの撮像画像データから高解像度画像データを生成してもよい。
また、このように1つの画像データから高解像度画像データを生成する場合、携帯端末装置100の撮像部101は、文書撮像モードにおいて、1回のシャッター押下で1回だけ撮像すればよい。また、この場合、上記の(3−3)の処理を省略することができる。そして、携帯端末装置100は、上記高解像度出力用データセットとして、1回のシャッター押下で1回だけの撮像により得られる1つの撮像画像データを含むものを送信すればよい。さらに、高解像度出力用データセットには1つだけの撮像画像データが含まれるので、画像出力装置200の類似画像判定部224は、高解像度出力用データセットの中から類似画像判定用データの選定処理(S231)を省略することができる。
(9−3)撮像画像判定部の判定項目について
上記の説明では、文書撮像モードが選択されたときに、撮像画像判定部102は、撮像画像における撮像対象物の傾き、幾何学的歪み、複数の撮像画像間のズレ量を判定するものとした。しかしながら、撮像画像判定部102における判定項目はこれに限定されるものではない。以下にこの変形例を説明する。
(a)例えば、ユーザは、文書画像を含む用紙や表示画面のような矩形状の撮像対象物に限らず、風景や人物などの撮像画像についても高解像度化された状態で画像出力装置200で出力することを希望することが考えられる。そこで、携帯端末装置100は、文書撮像モードに代えて、もしくは、文書撮像モードとは別に、単に撮像画像を画像出力装置200において高解像度補正して出力する処理を行うための高解像出力モードを備えていてもよい。文書撮像モードとは別に高解像度出力モードを備える場合、携帯端末装置100は、選択されたモードを示す情報を付けて高解像度出力用データセットを出力すればよい。これにより、画像出力装置200はモードに応じた処理を行うことができる。
そして、高解像出力モードが選択された場合、携帯端末装置100では、撮像画像判定部102は、上記の(3−3)に記載されたズレ量の判定のみを行い、(3−1)(3−2)に記載された、撮像対象物の傾き、幾何学的歪みの判定を行わなくてよい。また、(3−3)に記載の判定を行う際、撮像画像の中心付近からズレ検出量部分画像を抽出すればよい。なお、(9−2)に記載の変形例の場合、(3−3)の処理も省略可能である。
そして、高解像度出力モードである旨の通知を受けた画像出力装置200においても、画像処理部202は、(7−4)に記載された類似画像の判定処理と、(7−5)に記載された高解像度補正を行い、(7−1)〜(7−3)に記載された画質調整部221、レンズ歪み補正部223および幾何学補正部222による補正処理を実行しない。そして、この場合、高解像度補正部225は、類似画像判定部224により分類された各グループに属する全ての高解像度出力用データセットで示される画像と、各グループにおいて出力すべき画像の選択指示の入力を促す画面とを表示部205に表示する。なお、高解像度補正部225は、高解像度出力用データセットで示される画像として、当該高解像度出力用データセットに含まれる任意の一つのサブ撮像画像データで示される画像を表示すればよい。そして、高解像度補正部225は、入力部に入力された選択指示で示される画像に対応する高解像度出力用データセットに対して高解像度補正を実行する。
これによっても、類似した複数の画像のうちの1つの画像だけ出力することができ、撮像した画像よりも高解像度の画像を得るという効果を奏することができる。
(b)上記の判定項目に加えて、他の判定項目について判定してもよい。他の判定項目としては、明るさ、コントラスト、カラーバランス、ブレ(激しい手ぶれ)などがある。
明るさについては、例えば露出オーバー(明るすぎる)やアンダー(暗すぎる)の場合に再度の撮像が必要となるケースが考えられる。そこで、撮像画像判定部102は、例えば、サブ撮像画像データの画素値のうち、最大のものと最小のものを求め、最大値がある閾値(例えば8ビットで100など)以下であれば、露出アンダーとし、最小値がある閾値(例えば8ビットで150など)以上であれば、露出オーバーとする判定結果を制御部109に出力する。そして、制御部109は、露出アンダーまたは露出オーバーの判定結果を受けると、その旨および再撮像を促す指示を表示部105に表示させる。もしくは、制御部109は、露出アンダーの場合には、撮像部101における露光時間を長くするように設定変更し、露出オーバーの場合には、露光時間を短くするように設定変更する。その後、制御部109は、ユーザに再撮像を促す指示を通知してもよい。
コントラストについては、撮像画像判定部102は、サブ撮像画像データの画素値のうちの最大・最小の差分値が所定閾値以下の場合、コントラスト不足と判定する。そして、制御部109は、コントラスト不足との判定結果を受けると、その旨および再撮像を促す指示を表示部105に表示させる。
なお、明るさ・コントラストの判定において、撮像画像判定部102は、各色チャンネルに対して判定を行っても良いし、平均値(R+G+B/3)や明度値(0.299×R+0.587×G+0.114×B:NTSC準拠)を用いても良い。
カラーバランスについては、各色チャンネル(RGB)の平均値や最大・最小値の比較を行うことで、ある一つのチャンネルに過度の偏りが発生していることを把握できる。そこで、撮像画像判定部102は、例えば、撮像画像中の最大明度値付近の値(最大明度〜最大明度−5程度)を持つ画素値の各色チャンネルの値の平均値(Ra,Ga,Ba)を求め、その各色チャンネルの最大値と最小値の差分が値に応じた一定値以上[Max(Ra,Ga,Ba)−Min(Ra,Ga,Ba)>0.1×Max(Ra,Ga,Ba)]である場合に、カラーバランス不良であると判定する。そして、制御部109は、カラーバランス不良であるとの判定結果を受けると、その旨および再撮像を促す指示を表示部105に表示させる。
ブレ(激しい手ぶれ:いわゆるモーションブラー)については、発生時にエッジの先鋭性が低下することから、撮像画像判定部102は、図9に挙げたようなエッジ抽出フィルタを用いて、エッジ強度画像を作成してヒストグラムを取り、その標準偏差値(前記分散の二乗根)を求める。そして、当該標準偏差値が所定閾値(例えば5)以下の場合、ブレが発生していると判定する。そして、制御部109は、ブレが発生しているとの判定結果を受けると、その旨および再撮像を促す指示を表示部105に表示させる。
(9−4)出力対象の画像の選択について
上記(7−5)の説明では、高解像度補正部225は、類似画像判定部224によって分類された各グループの中から、撮像対象物の傾きが最も小さい類似画像判定用データを選択し、選択した類似画像判定用データに対応する高解像度出力用データセットに対して高解像度補正を行うものとした。そして、制御部は、高解像度補正部225により高解像度補正された高解像度画像データの出力処理を行うものとした。しかしながら、出力対象の画像はこれに限定されるものではない。
例えば、高解像度補正部225は、幾何学的歪みの度合い(幾何学的歪み度)の最も小さい類似画像判定用データを選択してもよい。幾何学的歪みの度合い(幾何学的歪み度)を示す特徴量としては、(7−2)で求めた外接四角形の対辺の長さの比が挙げられる。この特徴量を用いる場合、幾何学的歪み度が小さいということは、当該特徴量が1に近いことを意味する。そのため、当該特徴量が1に最も近い類似画像判定用データを選択すればよい。もしくは、外接四角形の対辺の長さの比として、(相対的に長い辺/相対的に短い辺)を算出する場合、当該比が最も小さい類似画像判定用データを選択すればよい。
また、高解像度補正部225は、上記のように傾きや幾何学的歪みの度合いの小さい類似画像判定用データを選択するとともに、出力対象の画像の変更指示を受け付けても良い。この場合、高解像度補正部225は、各グループについて、当該グループに属する全ての高解像度出力用データセットで示される画像を表示部205に表示するとともに、選択した類似画像判定用データに対応する画像を出力対象画像であることを表示する。なお、高解像度補正部225は、高解像度出力用データセットで示される画像として、当該高解像度出力用データセットに含まれる任意の一つのサブ撮像画像データで示される画像を表示する。さらに、高解像度補正部225は、出力対象画像の変更指示の入力を受け付ける。変更指示が入力された場合、高解像度補正部225は、指示された画像に対応する高解像度出力用データセットに対して高解像度補正を行う。
もしくは、高解像度補正部225は、上記のような傾きや幾何学的歪みの度合いの小さい類似画像判定用データを選択することなく、出力対象画像の選択指示を受け付けても良い。すなわち、高解像度補正部225は、類似画像判定部224により分類された各グループに属する高解像度出力用データセットで示される画像と、各グループにおいて出力対象画像の選択指示の入力を促す画面とを表示部205に表示する。なお、高解像度補正部225は、高解像度出力用データセットで示される画像として、当該高解像度出力用データセットに含まれる任意の一つのサブ撮像画像データで示される画像を表示する。そして、高解像度補正部225は、入力部に入力された選択指示で示される画像に対応する高解像度出力用データセットに対して高解像度補正を実行する。
このように出力対象画像の変更指示または選択指示を受け付ける場合、高解像度補正部225は、各グループに属する全ての高解像度出力用データセットに対して高解像度補正を実行してもよい。これにより、変更指示や選択指示が入力される前に、高解像度補正部225により高解像度補正を開始することができる。変更指示や選択指示は、ユーザが画面を見てから入力されるものであり、ある程度の時間がかかる。そのため、大抵の場合、変更指示や選択指示が入力される前に、全ての高解像度出力用データセットに対する高解像度補正を完了させることができ、変更指示や選択指示が入力されてから、出力されるまでの時間を短縮することができる。
(9−5)撮像部について
上記の説明では、撮像部101が連続して複数回撮像するときの手ぶれによって、複数の撮像画像にズレが生じることを利用する形態とした。しかしながら、これに限らず、撮像部101は、連続して複数回撮像するときに、撮像素子(CCD・CMOS)またはレンズを微小にずらしてもよい。これにより、複数の撮像画像間においてズレが確実に生じることになる。
(9−6)携帯端末装置から画像出力装置への画像データの送信タイミングについて
上記の説明では、文書撮像モードで撮像された高解像度出力用データセットを携帯端末装置100で蓄積しておき、送信指示が入力されたタイミングで、それまでに蓄積された高解像度出力用データセットをまとめて送信するものとした。しかしながら、携帯端末装置100から高解像度出力用データセットを画像出力装置200に送信するタイミングはこれに限定されない。
例えば、文書撮像モードで撮像部101が撮像するたびに当該撮像により得られた一つの高解像度出力用データセットを画像出力装置200に送信してもよい。この場合、ユーザは、画像出力装置200の近傍にいない場合がほとんどである。そのため、携帯端末装置100の通信部104は、携帯電話網およびインターネット網を介して、高解像度出力用データセットを画像出力装置200に送信すればよい。
このように撮像するたびに一つの高解像度出力用データセットが送信される場合、画像出力装置200は、図16に示したS21〜S25の処理と、S26〜S30の処理とを分割して、それぞれ別々に実行すればよい。具体的には、画像出力装置200は、高解像度出力用データセットを受信するたびに、図16に示したS21〜S25を繰り返し実行し、S26以降の処理に移行しない。
なお、このとき、S23では、以下のように処理を行う。すなわち、類似画像判定部224は、記憶部210にグループ分け情報が存在しない場合、つまり、一つ目の高解像度出力用データセットを受信した場合、類似画像判定部224は、S234、S236〜S238の処理を省略する。そして、S235において、類似画像判定部224は、受信した高解像度出力用データセットから選定した類似画像判定用データを第1のグループに属するものと判定し、このグループ分けを示すグループ分け情報を記憶部210に格納すればよい。また、記憶部210にグループ分け情報が存在する場合、つまり、2つ目以降の高解像度出力用データセットを受信した場合、類似画像判定部224は、S234、S236〜S238の処理を省略する。そして、S235において、類似画像判定部224は、グループ分け情報に示される類似画像判定用データを分類済みの類似画像判定用データとして、受信した受信した高解像度出力用データセットから選定した類似画像判定用データとの統合スコアを求め、当該統合スコアに従ってグループ分けを実行すればよい。そして、その結果に応じて、類似画像判定部224は、記憶部210に格納されたグループ分け情報を更新する。
なお、本変形形態でも、類似画像判定部224は、ユーザ情報ごとに、グループ分けを実行する。すなわち、類似画像判定部224は、ユーザ情報ごとに、当該ユーザ情報が付加された複数の高解像度出力用データセットに対してグループ分けを実行する。
その後、ユーザが画像出力装置まで来て、出力指示を入力することを受けて、図16に示すS26〜S30の処理を実行すればよい。なお、図17に示したS236〜S238の処理については、図16に示したユーザ認証処理(S27)の後に実行してもよい。
(9−7)ユーザ情報について
上記の説明では、画像出力装置200の入力部206に入力されたユーザ情報に基づいたユーザ認証に成功した後(図16のS28でYES)、当該ユーザ情報に対応付けられた高解像度画像データの出力処理を行うものとした。ここで、ユーザ情報はユーザ毎にユニークに割り振られたものであってもよいし、ある組織に所属する複数のユーザに対して同じユーザ情報が割り振られていても良い。複数のユーザが同じユーザ情報を有している場合、他の人が撮像した画像も合わせてグループ分けされ、各グループから選択された画像のみが出力される。
もしくは、画像出力装置200が特定の組織に所属するユーザのみが使用できる環境であり、かつ、あるユーザが撮像した画像を別のユーザも確認したい場合、S17において高解像度出力用データセットにユーザ情報を付加せずに送信し、S27およびS28のユーザ情報によるユーザ認証の処理を省略してもよい。これによっても、他の人が撮像した画像も合わせてグループ分けされ、各グループから選択された画像のみが出力される。その結果、他のユーザが撮像した画像も容易に確認することができる。
例えば、複数のユーザが同じ展示会場に行き、様々な展示物を各ユーザが撮像するケースが考えられる。このようなケースでは、複数のユーザが別の時間あるいは別の日に同じ展示物を複数回撮像することが考えられる。このような状況であっても、本変形形態であれば、複数のユーザが撮像した画像をまとめて類似画像ごとにグループ分けし、各グループから選択された画像のみを出力することができる。その結果、同じような画像を複数出力することを防止できるという効果を奏する。
(9−8)統合スコアについて
上記の説明の統合スコアに限らず、様々な方法で統合スコアを算出することができる。以下、統合スコアの別の算出方法について説明する。
記憶部210に格納されている各類似画像判定用データGi(i=1,2,3,...,n)の各種の特徴量Fj(j=1,2,3,...,m) を用いた類似度スコアをSij(a)とする。特徴量Fjは、上記したエッジ量分布などの画像特徴量、単語の出現回数に基づくテキスト特徴量などである。次に、各スコアSij(a)を特徴量の種類jごとに標準化した偏差値Zij(a)を算出する。
Figure 2010273218
そして、k番目の類似画像判定用データaに対する分類済みの類似画像判定用データGi(k−1番目までのデータの何れか)の統合スコアをSi(a)とし、次式により求める。
Figure 2010273218
ここで、fは各特徴量Fjについての偏差値Zij(a) から統合スコアを求めるための関数であり、例えば、変数各項の中の最大値を採る関数を用いる。
(9−9)類似画像の判定対象について
上記の説明では、S231において、各高解像度出力用データセットについて、一つの類似画像判定用データを選定するものとした。しかしながら、各高解像度出力用データセットに含まれる全てのサブ撮像画像データを類似画像判定用データとして選択してもよい。
例えば、動きのあるものや動画のスライドなどを撮像する場合、1回のシャッター押下による連続撮像の間に撮像対象物が変化することが考えられる。そこで、携帯端末装置100は、文書撮像モードのオプションとして、経時的に変化する撮像対象物を撮像する動対象撮像モードを有していても良い。そして、動対象撮像モードが選択された場合、類似画像判定部224は、当該高解像度出力用データセットに含まれる全てのサブ撮像画像データを類似画像判定用データとして選択する。
なお、動対象撮像モードが選択された場合、高解像度出力用データセットに含まれる複数のサブ撮像画像データの各々において、撮像対象物の位置が変化している可能性が高い。そのため、動対象撮像モードが選択されている場合、高解像度補正部225は、高解像度出力用データセットに含まれる複数のサブ撮像画像データを用いた高解像度補正を実行しない。もしくは、高解像度補正部225は、(9−2)で説明したように、サブ撮像画像データの一つに基づいて高解像度補正を実行してもよい。
あるいは、撮像対象物の動きの速度に応じて、高解像度補正部225は、高解像度出力用データセットに含まれる複数のサブ撮像画像データを用いた高解像度補正を実行するか否かを判断してもよい。すなわち、撮像対象物の動きがシャッタースピードよりもかなり速い場合には、高解像度出力用データセットに含まれる複数のサブ撮像画像データの各々における撮像対象物の位置が異なるため、当該複数のサブ撮像画像データを用いた高解像度処理が困難となる。一方、撮像対象物の動きがシャッタースピードに比べてそれほど速くない場合には、高解像度出力用データセットに含まれる複数のサブ撮像画像データを用いて高解像度処理が実行できる。そこで、高解像度出力用データセットに含まれる複数のサブ撮像画像データの中から同一の撮像対象物を示す領域を特定し、当該領域の動きベクトルを検出する。そして、動きベクトルの大きさが所定閾値よりも大きい場合に、高解像度出力用データセットに含まれる複数のサブ撮像画像データを用いた高解像度補正を実行しないと判断し、動きベクトルの大きさが所定閾値以下の場合に、高解像度出力用データセットに含まれる複数のサブ撮像画像データを用いた高解像度補正を実行すると判断すればよい。
(9−10)出力処理情報について
上記の説明では、出力処理情報を携帯端末装置100が取得し、画像出力装置200に送信するものとした。しかしながら、これに限らず、画像出力装置200がユーザ認証のためにユーザ情報を取得する際に、出力処理情報(出力処理の種類、出力処理のための設定条件を示す情報)を取得してもよい。
(9−11)出力処理について
画像出力装置200において、制御部212は、ファイリング処理やメール送信処理を行う前に、画像処理部202によって生成された高解像度画像データを高圧縮PDFに変換してもよい。なお、高圧縮PDFデータとは、画像データの中の背景部分と文字部分とを分離し、ぞれぞれの部分に最適な圧縮処理を行ったPDFデータである。これにより、文字判読性が良好で、画像ファイルサイズも低減させることができる。
また、制御部212は、ファイリング処理やメール送信処理を行う前に、画像処理部202によって生成された高解像度画像データに対してOCR処理を実行し、テキストデータを生成してもよい。そして、制御部212は、高解像度画像データをPDFに変換し、生成したテキストデータを透明テキストとして付加してもよい。なお、透明テキストとは、認識された文字をテキスト情報として見掛け上は見えない形で画像データに重ね合わせる(あるいは埋め込む)ためのデータである。例えば、PDFファイルでは、画像データに透明テキストを付加した画像ファイルが一般に使用されている。そして、制御部212は、生成した透明テキスト付きPDFデータを出力させてもよい。これにより、テキスト検索可能なファイルのように活用しやすい電子化文書を出力することができる。
(9−12)画像出力装置が備える画像処理部について
上記の説明では、画像出力装置200が備える画像処理部202が高解像度補正などを行うものとして説明した。しかしながら、画像出力装置200は、高解像度出力用データセットに対する高解像度補正やその他の画像処理(幾何学的歪みの補正、レンズ歪みの補正、コントラスト補正、カラーバランス補正など)を、上記画像処理部202を備えたサーバに実行させてもよい。なお、この場合、当該サーバが、携帯端末装置100から受信した高解像度出力用データセットに対して高解像度補正を行い、補正後の高解像度画像データを出力する画像出力装置であるといえる。
(10)プログラムおよび記録媒体
本発明はコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体に、上記した携帯端末装置100で撮像した画像を画像出力装置200に送信し画像出力装置200より出力する方法を記録するものとすることもできる。
この結果、上記処理を行うプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)を記録した記録媒体を持ち運び自在に提供することができる。
なお、本実施の形態では、この記録媒体としては、マイクロコンピュータで処理が行われるために図示していないメモリ、例えばROMのようなもの、そのものがプログラムメディアであっても良いし、また、図示していないが外部記憶装置としてプログラム読み取り装置が設けられ、そこに記録媒体を挿入することで読み取り可能なプログラムメディアであっても良い。
いずれの場合においても、格納されているプログラムはマイクロプロセッサがアクセスして実行させる構成であっても良いし、あるいは、いずれの場合もプログラムコードを読み出し、読み出されたプログラムコードは、マイクロコンピュータの図示されていないプログラム記憶エリアにダウンロードされて、そのプログラムが実行される方式であってもよい。このダウンロード用のプログラムは予め本体装置に格納されているものとする。
ここで、上記プログラムメディアは、本体と分離可能に構成される記録媒体であり、磁気テープやカセットテープ等のテープ系、フレキシブルディスクやハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVDなどの光ディスクのディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM、EPROM(Erasable Programmable Read Only Memory)、EEPROM(Electrically Erasable Programmable Read Only Memory)、フラッシュROM等による半導体メモリを含めた固定的にプログラムコードを担持する媒体であっても良い。
また、本実施の形態においては、インターネットを含む通信ネットワークを接続可能なシステム構成であることから、通信ネットワークからプログラムコードをダウンロードするように流動的にプログラムコードを担持する媒体であっても良い。なお、このように通信ネットワークからプログラムをダウンロードする場合には、そのダウンロード用のプログラムは予め本体装置に格納しておくか、あるいは別な記録媒体からインストールされるものであっても良い。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
上記記録媒体は、携帯端末装置100や画像出力装置200に備えられるプログラム読み取り装置により読み取られることで上述した画像処理方法が実行される。
本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
本発明は、携帯端末装置と画像出力装置との間でデータ通信を行う撮像画像処理システムに適用することができる。
100 携帯端末装置
200 画像出力装置
101 撮像部
102 撮像画像判定部
103 画像処理部
104 通信部(送信部)
105 表示部(通知部)
106 入力部
109 制御部(送信部、通知部)
202 画像処理部
204 画像形成部(出力部)
205 表示部
206 入力部
207 第1通信部(受信部)
208 第2通信部(出力部)
212 制御部(出力部)
221 画質調整部
222 幾何学補正部(歪み補正部)
223 レンズ歪み補正部
224 類似画像判定部
225 高解像度補正部(選択部)

Claims (11)

  1. 撮像部を備えた携帯端末装置から、上記撮像部の撮像により得られた撮像画像データを受信する受信部と、
    上記受信部が受信した複数の撮像画像データについて、各撮像画像データで示される画像の特徴を示す特徴量を算出し、対応する特徴量の類似度が所定閾値以上の撮像画像データが同じグループになるようにグループ分けを行う類似画像判定部と、
    上記類似画像判定部によりグループ分けされた各グループの中から所定数の撮像画像データを選択する選択部と、
    上記撮像画像データに基づいて、当該撮像画像データの解像度よりも高解像度の高解像度画像データを生成する高解像度補正を行う高解像度補正部と、
    上記選択部により選択された撮像画像データに対して上記高解像度補正部が高解像度補正を行うことにより得られた高解像度画像データである選択高解像度画像データ、あるいは、当該選択高解像度画像データで示される画像を出力する出力処理を実行する出力部とを備えることを特徴とする画像出力装置。
  2. 上記撮像部によって撮像される撮像対象物は、文書画像が形成された矩形状の面を有しており、
    上記矩形状の面の法線方向とは異なる方向から上記撮像部が撮像することによる撮像画像データにおける上記矩形状の面の歪みを補正するとともに、当該撮像画像データにおける上記矩形状の面の傾きを補正する歪み補正部を備え、
    上記類似画像判定部は、上記歪み補正部によって補正された撮像画像データに基づいてグループ分けを行い、
    上記高解像度補正部は、上記歪み補正部によって補正された撮像画像データに基づいて高解像度補正を行うことを特徴とする請求項1に記載の画像出力装置。
  3. 上記選択部は、上記各グループに属する撮像画像データの中から、上記歪み補正部による補正前の撮像画像データで示される画像における上記矩形状の面の傾きが最も小さい撮像画像データを選択することを特徴とする請求項2に記載の画像出力装置。
  4. 上記矩形状の面の法線方向とは異なる方向から上記撮像部が撮像することによる撮像画像データにおける上記矩形状の面の歪みの度合いを幾何学的歪み度とするとき、
    上記選択部は、上記各グループに属する撮像画像データの中から、上記歪み補正部による補正前の撮像画像データで示される画像における幾何学的歪み度が最も小さい撮像画像データを選択することを特徴とする請求項2に記載の画像出力装置。
  5. 上記類似画像判定部によってグループ分けされた各グループについて、当該グループに属する撮像画像データを表示部に表示し、各撮像画像データの属するグループの変更指示を受け付け可能である制御部を備え、
    上記制御部が上記変更指示を受け付けた場合、上記類似画像判定部は、当該変更指示に従って、各グループに属する撮像画像データを変更することを特徴とする請求項1から4の何れか1項に記載の画像出力装置。
  6. 上記撮像部は、1回の撮像指示で連続して複数回撮像し、
    上記受信部は、上記撮像画像データとして、上記撮像部が1回の撮像指示で連続して複数回撮像することにより得られる複数のサブ撮像画像データの組を受信し、
    上記高解像度補正部は、上記撮像画像データに含まれる複数のサブ撮像画像データに基づいて高解像度画像データを生成することを特徴とする請求項1から5の何れか1項に記載の画像出力装置。
  7. 上記撮像部は、1回の撮像指示で1回だけ撮像し、
    上記受信部は、上記撮像画像データとして、上記撮像部が1回の撮像指示で1回撮像することにより得られる画像データを受信し、
    上記高解像度補正部は、1つの撮像画像データに基づいて高解像度画像データを生成することを特徴とする請求項1から5の何れか1項に記載の画像出力装置。
  8. 撮像部と、上記撮像部の撮像により撮像画像データを送信する送信部とを備えた携帯端末装置と、
    請求項1から7の何れか1項に記載の画像出力装置とを備えた撮像画像処理システム。
  9. 撮像部を備えた携帯端末装置から、上記撮像部の撮像により得られた撮像画像データを受信する受信ステップと、
    受信した複数の撮像画像データについて、各撮像画像データで示される画像の特徴を示す特徴量を算出し、対応する特徴量の類似度が所定閾値以上の撮像画像データが同じグループになるようにグループ分けを行う類似画像判定ステップと、
    グループ分けされた各グループの中から所定数の撮像画像データを選択し、選択した撮像画像データに基づいて、当該撮像画像データの解像度よりも高解像度の選択高解像度画像データを生成する高解像度補正を行う補正処理ステップと、
    生成された選択高解像度画像データ、あるいは、当該選択高解像度画像データで示される画像を出力する出力処理を実行する出力ステップとを含むことを特徴とする画像出力方法。
  10. 請求項1から7のいずれか1項に記載の画像出力装置を動作させるプログラムであって、コンピュータを上記各部として機能させるためのプログラム。
  11. 請求項10に記載のプログラムを記録したコンピュータ読取り可能な記録媒体。
JP2009124653A 2009-05-22 2009-05-22 画像出力装置、撮像画像処理システム、画像出力方法、プログラムおよび記録媒体 Pending JP2010273218A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009124653A JP2010273218A (ja) 2009-05-22 2009-05-22 画像出力装置、撮像画像処理システム、画像出力方法、プログラムおよび記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009124653A JP2010273218A (ja) 2009-05-22 2009-05-22 画像出力装置、撮像画像処理システム、画像出力方法、プログラムおよび記録媒体

Publications (1)

Publication Number Publication Date
JP2010273218A true JP2010273218A (ja) 2010-12-02

Family

ID=43420869

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009124653A Pending JP2010273218A (ja) 2009-05-22 2009-05-22 画像出力装置、撮像画像処理システム、画像出力方法、プログラムおよび記録媒体

Country Status (1)

Country Link
JP (1) JP2010273218A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015106742A (ja) * 2013-11-28 2015-06-08 シャープ株式会社 判定装置、携帯端末装置、プログラム、及び記録媒体
US10628713B2 (en) 2015-12-25 2020-04-21 Pfu Limited Mobile terminal, image processing method, and computer-readable recording medium

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015106742A (ja) * 2013-11-28 2015-06-08 シャープ株式会社 判定装置、携帯端末装置、プログラム、及び記録媒体
US10628713B2 (en) 2015-12-25 2020-04-21 Pfu Limited Mobile terminal, image processing method, and computer-readable recording medium

Similar Documents

Publication Publication Date Title
JP4856263B2 (ja) 撮像画像処理システム、画像出力方法、プログラムおよび記録媒体
JP5026484B2 (ja) 携帯端末装置、画像出力装置、撮像画像処理システム、携帯端末装置の制御方法、画像出力方法、プログラム、および記録媒体
US10484610B2 (en) Image-capturing apparatus, captured image processing system, program, and recording medium
JP4772894B2 (ja) 画像出力装置、携帯端末装置、撮像画像処理システム、画像出力方法、プログラムおよび記録媒体
JP4772889B2 (ja) 携帯端末装置、撮像画像処理システム、プログラムおよび記録媒体
JP4758493B2 (ja) 携帯端末装置、撮像画像処理システム、携帯端末装置の制御方法、プログラムおよび記録媒体
JP5547243B2 (ja) 画像処理装置、プログラムおよび記録媒体
JP4991887B2 (ja) 撮像画像処理システム、撮像画像処理システムの制御方法、プログラムおよび記録媒体
JP5886265B2 (ja) 携帯端末装置、プログラム、及び記録媒体
JP2011101338A (ja) 撮像画像処理システム、画像出力方法、プログラムおよび記録媒体
JP5834879B2 (ja) 画像印刷装置、方法、プログラム、画像処理装置、方法及びプログラム
JP2019040617A (ja) 画像処理装置および画像処理方法
JP2018107593A (ja) 画像処理装置、画像処理方法およびプログラム
JP5819378B2 (ja) 画像判定装置、画像処理システム、プログラム及び記録媒体
JP2010273218A (ja) 画像出力装置、撮像画像処理システム、画像出力方法、プログラムおよび記録媒体
JP6262102B2 (ja) 画像処理装置、画像処理システム、コンピュータプログラム及び記録媒体
JP2010130634A (ja) 画像処理装置、画像データ出力処理装置、画像処理方法、プログラムおよびその記録媒体
JP2010157878A (ja) 画像処理装置、画像データ出力処理装置、画像処理方法、プログラムおよびその記録媒体