JP5231667B2 - 撮像装置、撮像装置における表示方法、撮像装置における画像処理方法、プログラムおよび記録媒体 - Google Patents

撮像装置、撮像装置における表示方法、撮像装置における画像処理方法、プログラムおよび記録媒体 Download PDF

Info

Publication number
JP5231667B2
JP5231667B2 JP2012070181A JP2012070181A JP5231667B2 JP 5231667 B2 JP5231667 B2 JP 5231667B2 JP 2012070181 A JP2012070181 A JP 2012070181A JP 2012070181 A JP2012070181 A JP 2012070181A JP 5231667 B2 JP5231667 B2 JP 5231667B2
Authority
JP
Japan
Prior art keywords
area
unit
image
imaging
captured image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012070181A
Other languages
English (en)
Other versions
JP2012217159A (ja
Inventor
シャオ−シェン チェン ローレンス
ジョン キャンベル リチャード
マフィット ファーマン アーメット
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US13/078,070 external-priority patent/US8947453B2/en
Priority claimed from US13/078,052 external-priority patent/US9094617B2/en
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of JP2012217159A publication Critical patent/JP2012217159A/ja
Application granted granted Critical
Publication of JP5231667B2 publication Critical patent/JP5231667B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、画像取得の領域に関するものであり、特に、画像取得を助けるためのリアルタイムでの撮像キューを供給する方法およびシステムに関する。
デジタルカメラおよびカメラを備えた携帯端末の普及により、文書の画像あるいは文書を含む表示物(例えば、標識、ホワイトボード、黒板、ポスター、投影されたスライド、あるいはその他の文書を表示する物)を撮像する機会が増加している。このような文書が撮像された文書画像データは、従来の文書処理ワークフロー(例えば、印刷、文字認識処理(OCR;optical character recognition)、圧縮、保存、あるいはその他の文書処
理ワークフロープロセス)に供給される。しかしながら、スキャナを用いて得られた文書画像データと違って、カメラ等の撮像手段により撮像された文書画像データは、撮像条件におけるネガティブな影響のために、限定された有用性を有する。ネガティブな影響とは、例えば、低光量、文書に対するカメラのセンサ面の過度の傾斜、カメラと文書との距離などである。画像取得時におけるアーチファクト(欠陥)の多くがその後の画像処理によって補正されるが、極端に低い品質の撮像画像については、画像処理だけでは、有用な情報に回復させることが困難である。そこで、有用で、より良い品質の画像を取得するために、ユーザによる画像取得を助けるためのリアルタイムの撮像キューをする提供する方法、システムおよび装置が望まれている。
特許文献1には、撮像装置の姿勢を検知し、その検知結果に基づいて補正を行うことを示すアイコンや文字をプレビュー表示の妨げにならないように表示する技術が開示されている。
特開2010−252239号公報(2010年11月4日公開)
しかしながら、画像を撮像する際に注意すべき項目(撮像要素)としては、撮像装置の姿勢だけに限定されるものではない。例えば、露出(露光)や、撮像画像における撮像対象物の大きさ、コントラスト、ぼやけなども撮像要素となりうる。このような複数の撮像要素について特許文献1に記載の技術を適用すれば、撮像要素ごとに撮像条件を満たしているか否かの表示がされ、プレビュー画像を確認し難いという問題がある。
本発明は、上記課題を解決するためになされたものであり、複数の撮像要素の確認とともに、プレビュー画像の確認を行い易い撮像装置、撮像装置における表示方法、プログラムおよび記録媒体を提供することを目的とする。
本発明の撮像装置は、対象物を撮像する撮像手段と、上記撮像手段により撮像された画像であるプレビュー画像を表示する表示手段と、指定されたタイミングで上記表示手段に表示されているプレビュー画像を取込画像として取り込む取込画像決定部とを備える撮像装置において、上記対象物が矩形であり、上記プレビュー画像において、上記対象物と背景との四角形の境界線を検出する境界検出部と、画像の品質を示す複数の撮像要素の各々について、上記プレビュー画像から、当該撮像要素に対応する特徴量を抽出する撮像要素
抽出部と、撮像要素ごとに、当該撮像要素に対応する特徴量が当該撮像要素に対応する撮像条件を満たすか否かを判定する判定部と、上記表示手段において、上記プレビュー画像の上に上記境界線を重ねて表示させるとともに、上記判定部により撮像条件を満たしていないと判定された撮像要素について、上記判定部による判定結果を示すアイコンおよび文字列の少なくとも一方を上記プレビュー画像の上に重ねて表示させ、上記判定部により撮像条件を満たしていると判定された撮像要素については、上記判定部による判定結果を表示させない表示制御部とを備えることを特徴とする。
また、本発明の表示方法は、対象物を撮像する撮像手段と、上記撮像手段により撮像された画像であるプレビュー画像を表示する表示手段と、指定されたタイミングで上記表示手段に表示されているプレビュー画像を取込画像として取り込む取込画像決定部とを備える撮像装置における表示方法であって、上記対象物が矩形であり、上記プレビュー画像において、上記対象物と背景との四角形の境界線を検出する境界検出ステップと、画像の品質を示す複数の撮像要素の各々について、上記プレビュー画像から、当該撮像要素に対応する特徴量を抽出する撮像要素抽出ステップと、撮像要素ごとに、当該撮像要素に対応する特徴量が当該撮像要素に対応する撮像条件を満たすか否かを判定する判定ステップと、上記表示手段において、上記プレビュー画像の上に上記境界線を重ねて表示させるとともに、撮像条件を満たしていないと判定された撮像要素について、上記判定ステップの判定結果を示すアイコンおよび文字列の少なくとも一方を上記プレビュー画像の上に重ねて表示させ、撮像条件を満たしていると判定された撮像要素については、上記判定ステップの判定結果を表示させない表示制御ステップとを含むことを特徴とする。
上記の構成によれば、複数の撮像要素について、判定結果を示すアイコンおよび文字列の少なくとも一方が表示される。そのため、複数の撮像要素についてユーザは判定結果を確認しながら撮像を行うことができる。また、撮像条件を満たさない撮像要素のみに対応する判定結果が表示される。そのため、プレビュー画像に重ねて表示されるアイコンや文字列の数が通常少なくて済み、プレビュー画像における対象物を確認しやすくなる。
また、本発明の撮像装置において、上記取込画像決定部は、上記複数の撮像要素の全てについて撮像条件を満たすと上記判定部により判定された場合を上記指定されたタイミングであると判断することが好ましい。
上記の構成によれば、取込画像決定部は、自動的に取込画像を決定することができる。そのため、ユーザがシャッタボタンを操作しなくても取込画像を決定できるので、シャッタボタンを操作することによる対象物のブレや対象物が撮像範囲からはみ出すことを防止できる。
また、本発明の撮像装置において、上記表示制御部は、上記判定結果の表示形態として、アイコンのみ、文字列のみ、アイコンおよび文字列、の何れかの選択指示を受け付け、受け付けた表示形態で上記判定結果を表示させることが好ましい。
上記の構成によれば、撮像装置の操作に慣れないときには、アイコンと文字列との両方を表示させ、操作に慣れてきた段階で、アイコンのみを表示させることができる。これにより、ユーザのレベルに合わせた表示を行うことができる。また、アイコンおよび文字列の一方のみを選択した場合には、プレビュー画像に重ねて表示される判定結果の領域が狭くなるため、ユーザがプレビュー画像を確認しやすくなる。
また、本発明の撮像装置において、上記表示制御部は、上記四角形の境界線の外側に上記判定結果を表示させることが好ましい。上記の構成によれば、ユーザは、プレビュー画像における対象物を確認しやすくなる。
また、本発明の撮像装置において、上記表示制御部は、複数の撮像要素の各々について、判定結果の表示のオンおよびオフの切替指示を受け付け、オンの指示を受けた撮像要素についてのみ上記判定結果を表示させることが好ましい。
上記の構成によれば、撮像条件を満たすことが難しいと思われる撮像要素についてだけ判定結果を表示させることができる。これにより、プレビュー画像をみながら、効率よく適切な画像を撮像することができる。
また、本発明の撮像装置は、上記取込画像における対象物の領域を特定する領域特定部と、上記領域特定部により特定された対象物の領域の位置に対する修正指示を受け付けたときに当該修正指示に従って対象物の領域の修正する領域修正部と、上記領域修正部による対象物の領域が修正されていない場合、上記取込画像と、上記領域特定部により特定された対象物の領域の位置を示す領域位置情報と、対象物の領域が修正されていないことを示す識別子とをクラウド・コンピュータに送信し、上記領域修正部による対象物の領域が修正された場合、上記取込画像と、上記領域修正部により修正された対象物の領域の位置を示す領域位置情報と、対象物の領域が修正されたことを示す識別子とをクラウド・コンピュータに送信する送信部と、上記クラウド・コンピュータにより画像処理が実行された取込画像を受信する受信部とを備えることが好ましい。
上記の構成によれば、撮像装置に高機能を付加することなく、良好な品質の画像データを得ることができる。
また、本発明の撮像装置において、上記送信部は、クラウド・コンピュータで実行される画像処理の内容を示す情報と、上記取込画像を取り込む際に撮像要素抽出部により抽出された特徴量とを、上記取込画像とともにクラウド・コンピュータに送信することが好ましい。
上記の構成によれば、クラウド・コンピュータで実行される画像処理の内容を撮像装置で特定することができる。また、クラウド・コンピュータが撮像要素の特徴量を利用することにより、クラウド・コンピュータの処理の負荷を低減できる。
なお、上記撮像装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記各部として動作させることにより撮像装置をコンピュータにて実現させるプログラム、およびそれを記録したコンピュータ読取り可能な記録媒体も、本発明の範疇に入る。
本発明によれば、撮像手段により撮像された画像における輝度を背景の状況に応じて適切に補正することができるという効果を奏する。
図1は、本発明の実施形態1に係る処理の一例を示すフローチャートである。 図2は、例えば露光量、サイズ、傾斜量など撮像要素の特徴量の抽出処理の一例を示すフローチャートである。 図3は、消滅点と傾斜角度との関係を示す図である。 図4は、撮像キューを含むプレビュー画面の表示例を示す図である。 図5は、本発明の実施形態1の変形例に係る処理の一例を示すフローチャートである。 図6は、本発明の実施形態1に係る携帯端末装置の構成を示すブロック図である。 図7は、本発明の実施形態2に係る携帯端末装置およびクラウド・コンピュータの構成を示すブロック図である。 図8は、実施形態2に係る携帯端末装置の処理の流れを示すフローチャートである。 図9は、修正された文書領域を含む取込画像を示す図である。 図10は、実施形態2の変形例に係る携帯端末装置の処理の流れを示すフローチャートである。 図11は、実施形態2の別の変形例に係る携帯端末装置の処理の流れを示すフローチャートである。 図12は、実施形態2のさらに別の変形例に係る携帯端末装置の処理の流れを示すフローチャートである。 図13は、実施形態2に係るクラウド・コンピュータの処理の流れを示すフローチャートである。 図14は、実施形態2の変形例に係るクラウド・コンピュータの処理の流れを示すフローチャートである。 図15は、文書領域特定部の概要を示す説明図である。
本発明の実施形態は、撮像処理においてリアルタイムでフィードバックによるキューを提供する方法およびシステムに関するものである。本発明の一実施形態によれば、撮像条件に関連したキューを含むプレビュー画像が表示される。また、撮像要素に対応する特徴量が撮像条件の範囲内であるか否かを示すキューが表示されてもよい。もしくは、プレビュー画像から画像の特徴量が抽出され、当該特徴量により撮像要素に対応する特徴量が決定され、撮像条件の範囲内であるかが決定されてもよい。
本発明の前述および他の目的、特徴、効果は、図面とともに以下の説明を考慮することで容易に理解されるであろう。
本発明の一実施形態は、図面を参照することによってより理解されるであろう。図面では、類似する部材には、類似する番号が付けられている。上述した図面は、詳細な説明の一部として特別に援用される。
図面において図示され、説明されるように、本発明の実施形態は、異なる構成の幅広い変形例で変更または設定されてもよいことが十分に理解されるであろう。このように、本発明の方法およびシステムに係る実施形態の以下の詳細な説明は、本発明の目的を限定するものではなく、単に、本発明の好ましい一実施形態を代表するものにすぎない。
本発明の実施形態の構成は、ハードウェアによって実現されてもよいし、コンピュータシステムをプログラムするために使用され、各種の命令が格納されたコンピュータ読取可能な記録媒体を含む、ファームウェアおよび/またはコンピュータプログラムの製品によって実現されてもよい。ここで述べる実施形態は単にこれらの形態の一例にすぎず、当業者であれば、本発明の目的の範囲内で、様々な形態の構成を導き出してもよい。
デジタルカメラおよびカメラを備えた携帯端末の普及により、文書の画像あるいは文書を含む表示物(例えば、標識、ホワイトボード、黒板、ポスター、投影されたスライド、あるいはその他の文書を表示する物)を撮像する機会が増加している。このような文書が撮像された文書画像データは、従来の文書処理ワークフロー(例えば、印刷、文字認識処理(OCR;optical character recognition)、圧縮、保存、あるいはその他の文書処
理ワークフロープロセス)に供給される。しかしながら、スキャナを用いて得られた文書画像データと違って、カメラ等の撮像手段により撮像された文書画像データは、撮像条件におけるネガティブな影響のために、限定された有用性を有する。ネガティブな影響とは、例えば、低光量、文書に対するカメラのセンサ面の過度の傾斜、カメラと文書との距離などである。画像取得時におけるアーチファクト(欠陥)の多くがその後の画像処理によって補正されるが、極端に低い品質の撮像画像については、画像処理だけでは、有用な情報に回復させることが困難である。そこで、有用で、より良い品質の画像を取得するために、ユーザによる画像取得を助けるためのリアルタイムの撮像キューをする提供する方法、システムおよび装置が望まれている。
<実施形態1>
本発明の一実施形態について説明する。本実施形態では、プレビュー画像である1以上の画像フレームが処理され、矩形である撮像対象物と背景との境界を構成する境界エッジや、撮像要素(例えば、露光量など)が抽出される。また、抽出された撮像要素から、ユーザの撮像を助けるためのキュー(撮像キューという)が決定され、リアルタイムでユーザにフィードバックするように、当該キューがカメラの画面に表示される。キューは、例えば、露出、原稿サイズ、カメラの傾きなどの撮像要素に関連している。
(携帯端末装置の構成)
図6は、本実施形態に係る、撮像機能を備えた携帯端末装置(撮像装置)の構成を示すブロック図である。図6に示されるように、携帯端末装置6は、撮像部(撮像手段)61と、表示部62と、入力部63と、記憶部64と、境界検出部65と、撮像要素抽出部66と、撮像品質判定部67と、表示制御部68と、取込画像決定部69とを備えている。
本実施形態の携帯端末装置6は、文書あるいは文書を含む表示物(例えば、ホワイトボード、黒板、ポスター、投影されたスライド、あるいはその他の文書を表示する物)を撮像対象物として撮像する文書撮像モードを有している。ユーザは、文書撮像モードの有効/無効のいずれかに設定することができる。なお、このような撮像対象物は、文書が記載された面の法線方向からみたとき矩形である。
境界検出部65、撮像要素抽出部66、撮像品質判定部67および表示制御部68は、文書撮像モードが有効に設定されている場合に動作するブロックである。
撮像部61は、CCDセンサ、CMOSセンサを用いて、撮像対象物の撮像を行い、撮像により得られた画像(プレビュー画像)を表示部62に表示させる。これにより、ユーザは、プレビュー画像を見ながら、記憶部64に画像データとして格納すべき取込画像を取り込むタイミングを決定することができる。
表示部62は、例えば液晶ディスプレイなどにより構成されるものである。また,入力部63は、複数のボタンを有しており、ユーザがデータの入力や撮像装置の操作等を行うためのものである。入力部63は、画像データとして取り込む取込画像を決定するためのシャッタボタンを有している。記憶部64は、取込画像を示す取込画像データなどの各種データを記憶するものである。
取込画像決定部69は、入力部63のシャッタボタンが押下されたタイミングで撮像部61が撮像した画像を示す画像データを、取込画像データとして記憶部64に保存する。
境界検出部65は、撮像部61により撮像され、表示部62に表示されているプレビュー画像を示す画像データ(プレビュー画像データ)に基づいて、矩形の撮像対象物と背景との境界線を検出するものである。撮像対象物と背景との境界は濃度が急峻に変化するエ
ッジ画素で構成される。そこで、境界検出部65は、エッジ画素に基づいて、境界線を検出する。なお、矩形の撮像対象物を撮像しているため、撮像対象物と背景との境界線は、四角形となり、当該四角形の上辺、左辺、右辺、下辺の各々を構成する上境界線、左境界線、右境界線、下境界線からなる。境界検出部65は、これら4つの境界線を検出する。この検出方法の詳細については後述する。
撮像要素抽出部66は、プレビュー画像データに基づいて、プレビュー画像の品質を示す複数の撮像要素の各々について、当該撮像要素の度合いを示す特徴量を抽出するものである。複数の撮像要素としては、例えば、露出、撮像対象物のサイズ(以下、原稿サイズという)、撮像対象物に対する撮像部61の傾きによる幾何学的歪み、コントラスト、撮像部61の動きによるぼやけ、などがある。なお、撮像要素に対応する特徴量の抽出例については後述する。
撮像品質判定部67は、撮像要素ごとに、撮像要素抽出部66により抽出された特徴量が予め定められた撮像条件を満たすか否かを判定し、その判定結果を表示制御部68に出力するものである。
表示制御部68は、プレビュー画像が表示されている表示部62の画面を制御するものである。具体的には、表示制御部68は、境界検出部65により検出された境界線をプレビュー画像の上に重ねて表示するとともに、撮像要素ごとに撮像品質判定部67の判断結果を示す判定結果情報(撮像キュー)を表示する。判定結果情報は、ユーザが品質の良い状態の画像を取り込みやすいように表示される情報である。
(携帯端末装置の処理の流れ)
本実施形態の処理の流れについて図1を参照しながら説明する。まず、撮像部61は、撮像した画像であり、表示部62に表示させるプレビュー画像(プレビューフレーム画像)を示すプレビュー画像データを生成する(100)。そして、境界検出部65が境界線を検出するとともに、撮像要素抽出部66が撮像要素に対応する特徴量を抽出する(102)。撮像品質判定部67は、この抽出処理の結果に基づいて撮像要素ごとに撮像条件を満たすか否かを判定する(104)。表示制御部68は、その判定結果を用いて、判定結果情報(撮像キューなど)を決定する。そして、表示制御部68は、プレビュー画像の上に、決定された1以上の判定結果情報を重ねて表示する(106)。その後、100の処理に戻り、再度100〜106の処理が繰り返される。このようにして、携帯端末装置6の表示部62の画面に、判定結果情報(撮像キュー)を含むプレビュー画像が表示される。
(撮像要素の値の抽出処理)
次に、図2を参照して撮像要素(画像特徴)の度合いを示す特徴量の抽出処理について説明する。まず、撮像要素抽出部66は、プレビュー画像データをダウンサンプリングして、低解像度の画像データに変換する(200)。例えば、Android(登録商標)のオペレーティングシステムで動作するGoogle(登録商標)G1スマートフォンの場合、480×320画素の解像度のプレビュー画像データを生成している。この場合、撮像要素抽出部66は、ダウンサンプリングにより240×160画素の画像データを生成する。また、ダウンサンプリングされた画像データを、グレースケールの輝度データに変換してもよい(202)。そして、撮像要素抽出部66は、撮像要素である露出に対応する特徴量として、輝度データから露光量Sを以下の式に従って算出する(204)。なお、I(x,y)は、画素位置(x、y)におけるグレースケールの画像の値(輝度値)を示している。
Figure 0005231667
また、露光量は、露出オーバーと露出アンダーとを検知するためのヒストグラム分析により決定されてもよい。
次に、撮像要素抽出部66は、グレースケールの画像データを2値化する(206)。2値化データA(x、y)は、以下の式で示される。
Figure 0005231667
ここで、tは閾値であり、A(x、y)が1である画素は、撮像対象物である文書の領域であることを示している。本実施形態では、t=100が設定される。文書などの撮像対象物は、用紙などの白地の物に文字が記載されていることが一般的である。そのため、撮像対象物を撮像した場合、撮像対象物の領域の輝度は高く、背景の領域の輝度は低くなる。よって、上記のように輝度により2値化することで、文書などの撮像対象物の領域と背景の領域とを概ね分離することができる。
次に、境界検出部65は、x方向の画像勾配とy方向の画像勾配とを2値化データA(x、y)から算出する(208)。画像勾配は、以下のように、3×3のSobelフィルタを2値化データに適用することで算出される。ここで、Gは垂直方向の勾配画像データを示し、Gは水平方向の勾配画像データを示し、Aは2値化データA(x、y)に対応する行列を示している。
Figure 0005231667
次に、境界検出部65は、垂直方向のエッジと水平方向のエッジとのラベル付けを行う(210)。本実施形態では、境界検出部65は、各画素について、当該画素位置に対応する勾配画像データGの値が、当該画素位置に対応する勾配画像データGの値よりも大きい場合(Gx(x、y)>Gy(x、y))、当該画素に対して垂直エッジのラベルを付ける。一方、Gx(x、y)<Gy(x、y)である場合、当該画素には水平エッジのラベルを付ける。そして、境界検出部65は、画素ごとにエッジのラベル(つまり、水平エッジまたは垂直エッジの何れかであるかを示すエッジ情報)が付けられたラベル画像データを生成し、格納する。
次に、境界検出部65は、上境界、下境界、左境界、右境界のポイントセットを形成する(212)。本実施形態では、境界検出部65は、ラベル画像データにおいて、水平ラインごとに、当該水平ラインにそって左から右に検索する。そして、境界検出部65は、水平ラインごとに、最初に垂直エッジのラベルが付けられた画素座標に左境界ポイントセットを付け、最後に垂直エッジのラベルが付けられた画素座標に右境界ポイントセットを付ける。また、境界検出部65は、ラベル画像データにおいて、垂直ラインごとに、当該垂直ラインにそって上から下に検索する。そして、境界検出部65は、垂直ラインごとに、最初に水平エッジのラベルが付けられた画素座標に上境界ポイントセットを付け、最後に水平エッジのラベルが付けられた画素座標に下境界ポイントセットを付ける。
次に、境界検出部65は、それぞれの境界ポイントセットに対して境界線のフィッティングを行う(214)。これにより、左境界線、右境界線、上境界線、下境界線が特定される。つまり、境界検出部65は、左境界ポイントセットが付けられた画素群に近似する直線を左境界線、右境界ポイントセットが付けられた画素群に近似する直線を右境界線、上境界ポイントセットが付けられた画素群に近似する直線を上境界線、下境界ポイントセットが付けられた画素群に近似する直線を下境界線として特定する。なお、境界線のフィッティングは、最小二乗法を用いて行えばよい。
次に、撮像要素抽出部66は、境界検出部65が検出した境界線を基に、撮像要素の1つである、撮像対象物に対する撮像部61の傾きによる幾何学的歪みに対する特徴量を求める。具体的には、撮像要素抽出部66は、水平方向の消滅点と垂直方向の消滅点とを求める(216)。ここで、水平方向の消滅点とは、上境界線と下境界線との交点である。また、垂直方向の消滅点とは、左境界線と右境界線との交点である。そして、撮像要素抽出部66は、幾何学的歪み(撮像部61の傾き)に対する特徴量として、水平方向の消滅点と画像の中心との距離、および、垂直方向の消滅点と画像の中心との距離を算出する(218)。
次に、撮像要素抽出部66は、撮像要素の1つである原稿サイズ(撮像対象物のサイズ)に対応する特徴量を求める(220)。本実施形態では、撮像要素抽出部66は、2値化画像データA(x,y)において画素値「1」を有する画素数をカウントし、全画素数で割った値を、原稿サイズの特徴量として求める。当該原稿サイズの特徴量は、画像全体に対する文書の占める割合(パーセンテイジ)で示される。
なお、プレビュー画像データは、グレースケール変換の前にダウンサンプリングされなくてもよい。
また、撮像装置により撮像された生データがグレースケール画像である場合には、ダウンサンプリングされたプレビュー画像は、グレースケール変換されなくてもよい。
また、プレビュー画像は、ダウンサンプリング処理、または、グレースケール変換されなくてもよい。
また、撮像要素抽出部66は、撮像要素の1つであるコントラストに対応する特徴量を算出してもよい。コントラストに対応する特徴量は、ヒストグラム分析により決定される。
また、撮像要素抽出部66は、撮像要素の1つである撮像部61(カメラ)の動きに対応する特徴量を求めても良い。カメラの動きに対応する特徴量は、センサ情報(例えば、加速度センサなど)により求めることができる。
また、撮像要素抽出部66は、撮像要素の1つであるぼやけに対応する特徴量を算出してもよい。ぼやけに対応する特徴量は、公知のぼやけ測定技術に従ってプレビュー画像データから直接算出することができる。もしくは、撮像要素抽出部66は、ぼやけに対応する特徴量を、撮像部61の動きから算出してもよい。
(撮像品質の決定処理)
上記のようにしてプレビュー画像データから抽出された撮像要素に対応する特徴量を用いて、画像の品質が決定される。
撮像品質判定部67は、撮像要素抽出部66により抽出された露光量Sを用いて、撮像要素である露出が適切であるか否かを決定する。撮像品質判定部67は、図2に示されるようにして算出された露光量Sと、予め設定された露光閾値とを比較し、露光量Sが適切か否かを判定する。予め定められた露光閾値は、例えば、1500000であり、撮像品質判定部67は、露光量Sが露光閾値よりも大きい場合に、露出が適切であると判定する。また、露光閾値は、状況に応じて変更されてもよい。例えば、露光閾値は、検知に用いる画像サイズや撮像デバイスのゲイン設定などの環境・条件に従って適応的に変化させてもよい。具体的には、検知に用いる画素数を1/2にした場合、露光閾値を750000に変更すればよい。
また、撮像品質判定部67は、撮像要素抽出部66により抽出された原稿サイズに対応する特徴量を用いて、撮像画像全体に対する撮像対象物のサイズ(原稿サイズ)が適切であるか否かを決定する。撮像品質判定部67は、原稿サイズの特徴量と、サイズ閾値とを比較し、原稿サイズが適切である否かを判定する。例えば、撮像品質判定部67は、原稿サイズの特徴量が50%以上であれば、原稿サイズが適切であると判定する。
また、撮像品質判定部67は、撮像要素抽出部66により抽出された、消滅点と画像の中心との距離を用いて、撮像対象物に対する撮像部61の傾きが適切であるか否かを決定する。撮像部61(カメラ)のセンサ面が撮像対象物である文書の面と平行である場合、撮像部61の光軸と、文書表面に対する法線とのなす角度が0となる。この場合、撮像画像において、撮像対象物と背景との四角形の境界線のうち互いに対向する2辺は略平行となる。一方、撮像部61の光軸と文書表面に対する法線とのなす角度が大きくなると、当該対向する2辺は、徐々に平行からずれてきて、当該対向する2辺の交点(消滅点)が徐々に画像中心に近づく。図3は、この現象を示している。
図3の左側は、第1のカメラ位置からみたときの矩形の撮像対象物の遠近投影図を示す。上境界線302、下境界線304、左境界線306、および右境界線308によって囲まれた領域が撮像対象物を示す第1の領域300となっている。左境界線306と右境界線308との交点を第1消滅点310としている。図3の右側は、第2のカメラ位置からみたときの同じ撮像対象物の遠近投影図を示している。第2のカメラ位置は、第1のカメラ位置よりも撮像部61の傾き(撮像部61の光軸に対する撮像対象物の文書の法線の傾き)が大きい位置である。上境界線352、下境界線354、左境界線356、および右境界線358によって囲まれた領域が撮像対象物を示す第2の領域350となっている。左境界線356と右境界線358との交点を第2消滅点360としている。第1の領域300の左境界線306および右境界線308は、第2の領域350の左境界線356および右境界線358よりも、より平行になっている。また、第1消滅点310と画像中心との距離は、第2消滅点360と画像中心との距離よりも長くなっている。このように、消滅点の位置は、撮像部61の傾きの大きさと相関している。
そこで、撮像部61の傾きの限界値に対応する消滅点の位置が決定される。撮像部61の傾きの限界値(傾き限界値)は、例えば、水平方向および垂直方向の各々について、+
30°〜−30°である。傾き限界値に対応する消滅点の位置は、コンピュータにより算出される。もしくは、傾き限界値に対応する消滅点の位置は、経験的に決定されてもよい。傾き限界値に対応する消滅点と画像中心との距離は、撮像部61の傾きが適切か否かを決定するための距離閾値として用いられる。水平方向の消滅点と画像中心との距離に対する水平方向の距離閾値は、例えば500画素に設定され、垂直方向の消滅点と画像中心との距離に対する垂直方向の距離閾値は、例えば600画素に設定される。水平方向の消滅点VanHと画像中心centerとの距離をd(VanH,center)、水平方向の傾き限界値に対応す
る距離閾値をTV、垂直方向の消滅点VanVと画像中心centerとの距離をd(VanV,center)、垂直方向の傾き限界値に対応する距離閾値をTV、とするとき、d(VanH,center)>TVであり、かつ、d(VanV,center)>TVであれば、撮像品質判定部67は
、撮像部61の傾きが適正であると判定する。
(判定結果情報の表示処理)
次に、表示制御部68の処理について説明する。図1に示されるように、表示制御部68は、撮像品質判定部67による判定結果を示す判定結果情報(撮像キュー)を含むプレビュー画像を表示する。また、表示制御部68は、上、下、左、右の境界線をプレビュー画像に重ねて表示する。
表示制御部68は、撮像要素に対応する特徴量が撮像条件を満たすか否かを示すアイコンをプレビュー画像の上に表示させる。例えば、表示制御部68は、撮像要素に対応する特徴量が撮像条件の範囲内である撮像要素のラベルの近傍に、緑色の星形状のアイコンを表示させる。一方、表示制御部68は、撮像要素に対応する特徴量が撮像条件の範囲外である撮像要素のラベルの近傍に、オレンジ色の星形状のアイコンを表示させる。もしくは、撮像要素に対応する特徴量が撮像条件を満たすか否かを示す文字列をプレビュー画像の上に表示させてもよい。例えば、表示制御部68は、撮像要素に対応する特徴量が撮像条件の範囲内である撮像要素のラベルの近傍に、「GOOD」を表示させ、撮像要素に対応する特徴量が撮像条件の範囲外である撮像要素のラベルの近傍に、「NO GOOD」を表示させる。当該文字列は、撮像要素に対応する特徴量が撮像条件を満たすか否かをより示すために色の属性を有していても良い。例えば、「GOOD」を緑色で表示し、「NO
GOOD」を赤色で表示してもよい。また、表示制御部68は、撮像要素に対応する特徴量が撮像条件を満たすか否かを示すアイコンおよび文字列をプレビュー画像の上に表示してもよい。
図4は、表示部62に表示されるプレビュー画像の一例を示す図である。表示制御部68は、境界検出部65により検知された、網目状の模様(クロスハッチ)で示される撮像対象物領域402と背景との四角形の境界線である境界線404,406,408,410を、プレビュー画像の上に重ねて表示する。さらに、表示制御部68は、撮像要素ごとに、判定結果情報(撮像キュー)をプレビュー画像の上に表示する。ここでは、3つの撮像要素、つまり、「EXPOSURE(露出)」「SIZE(原稿サイズ)」「TILT(撮像部61の傾き)」に対する判定を表示する例を示している。どの撮影要素に対する判定かをラベル412、414、416で表示し、各ラベル412、414、416の近傍には、各撮像要素に対応する特徴量が撮像条件を満たすか否かを示すアイコン418、420、422、および、文字列424、426、428が表示される。図では、撮像要素「EXPOSURE(露出)」が撮像条件の範囲外であるため、範囲外を示す色のアイコン418と、範囲外を示す「NO GOOD」の文字列424とが表示され、当該アイコン418および文字列424を確認することで、ユーザは、撮像要素「EXPOSURE(露出)」が撮像条件の範囲外であることを認識できる。また、撮像要素「SIZE(サイズ)」が撮像条件の範囲内であるため、範囲内を示す色のアイコン420と、範囲内を示す「GOOD」の文字列426とが表示され、当該アイコン420および文字列426を確認することで、ユーザは、撮像要素「SIZE(原稿サイズ)」が撮像条件を満た
していることを認識できる。また、撮像要素「TILT(撮像部61の傾き)」が撮像条件の範囲内であるため、範囲内を示す色のアイコン422と、範囲内を示す「GOOD」の文字列428とが表示され、当該アイコン422および文字列428を確認することで、ユーザは、撮像要素「TILT(傾き)」が撮像条件を満たしていることを認識できる。図4に示される例では、ラベル412は撮像要素「EXPOSURE(露出)」を表すラベルであり、アイコン418および文字列424が撮像要素「EXPOSURE(露出)」に対する判定結果情報となる。あるいは、アイコン418および文字列424にラベル412を含めて判定結果情報とするようにしてもよい。
上記では、ある撮像要素についてのみ説明したが、例えば、コントラスト、撮像部61の動き、ぼやけなどの他の撮像要素についても同様である。
(変形例1−1)
上記の説明では、図4に示されるように、撮像条件を満たす撮像要素「SIZE(サイズ)」および「TILT(撮像部61の傾き)」についても、撮像条件を満たすか否かを示すアイコンおよび文字列を表示させるものとした。
しかしながら、表示制御部68は、撮像条件を満たす撮像要素については、当該撮像要素に対する判定結果情報(つまり、当該撮像要素のラベル、撮像条件を満たすことを示すアイコンおよび文字列)を表示させないようにしてもよい。もしくは、表示制御部68は、撮像条件を満たす撮像要素については、当該撮像要素に対する判定結果情報(つまり、当該撮像要素のラベル(撮像キュー)、撮像条件を満たすことを示すアイコンおよび文字列)を、予め定められた時間(例えば2秒)だけ表示させてもよい。
この場合、複数の撮像要素のうち、撮像条件を満たさない撮像要素についてのみ、当該撮像要素のラベルと、撮像条件を満たさないことを示すアイコンまたは文字列とが表示されることとなる。その結果、プレビュー画像の上に表示する判定結果情報(ラベル、アイコンまたは文字列)の数を減らすことができ、プレビュー画像における撮像対象物と判定結果とが重なる領域が小さくなり、撮像対象物を確認しやすくなる。
なお、撮像部61は、プレビュー画像を所定のフレーム間隔で撮像している。そのため、プレビュー画像のフレームが変更されるたびに、撮像要素ごとに撮像条件を満たすか否かが判定され、撮像条件を満たさない撮像要素が存在する場合に当該撮像要素に対応する判定結果情報が表示されることとなる。
(変形例1−2)
表示制御部68は、複数の撮像要素の各々について、判定結果情報の表示のオン/オフの切替指示を受け付けてもよい。表示制御部68は、文書撮像モードによる撮像を開始する前に、撮像要素ごとに判定結果情報の表示のオン/オフを設定するための設定画面を表示し、ユーザから切替指示を受け付ける。そして、表示制御部68は、判定結果情報の表示がオンに設定された撮像要素についてのみ、当該撮像要素を示すラベルと、撮像要素抽出部66により抽出された当該撮像要素の特徴量が撮像条件を満たすか否かを示すアイコンおよび/または文字列とを表示させる。
また、表示部62がタッチパネルである場合、表示制御部68は、プレビュー画像上に表示されている判定結果情報の位置にタッチされたことを検出すると、当該位置に表示されている判定結果情報の表示をオンからオフに切り替えても良い。
本変形例によれば、撮像条件を満たすことが難しいと思われる撮像要素についてだけ判定結果情報を表示させることができる。これにより、プレビュー画像をみながら、効率よ
く適切な画像を撮像することができる。
(変形例1−3)
表示制御部68は、ユーザからの入力指示に従って、判定結果情報の表示形態を変更してもよい。この場合、表示制御部68は、撮像条件を満たすか否かを示す情報として、(1)アイコンのみ、(2)文字列のみ、(3)アイコンおよび文字列、のいずれかの選択指示を受け付け、受け付けた選択指示に従って、アイコンおよび/または文字列を表示させる。
本変形例によれば、携帯端末装置6の操作に慣れないときには、アイコンと文字列との両方を表示させ、操作に慣れてきた段階で、アイコンのみを表示させることができる。これにより、ユーザのレベルに合わせた表示を行うことができる。また、アイコンおよび文字列の一方のみを選択した場合には、判定結果情報の領域が狭くなるため、ユーザがプレビュー画像を確認しやすくなる。
(変形例1−4)
表示制御部68は、境界検出部65により検出された4つの境界線で囲まれる領域以外の領域に、判定結果情報を表示することが好ましい。これにより、ユーザは、プレビュー画像において撮像対象物を確認しやすくなる。また、判定結果情報を表示する撮像要素の数が多い場合には、判定結果情報の一部を境界線と重ねて表示してもよい。撮像対象物の境界線を表示しているので、撮像対象物が見え難くなるのを抑制することができる。
(変形例1−5)
上記の説明では、取込画像決定部69は、入力部のシャッタボタンが押下されたタイミングで撮像部61が撮像した画像を示す画像データを取込画像データとして記憶部64に保存するものとした。
しかしながら、取込画像決定部69は、文書撮像モードが有効に設定されている場合、シャッタボタンの押下ではなく自動的に取込画像データを決定してもよい。すなわち、取込画像決定部69は、撮像品質判定部67により全ての撮像要素が対応する撮像条件を満たすと判定されたプレビュー画像データを、自動的に取込画像データとして記憶部64に保存してもよい。
図5は、全ての撮像要素が対応する撮像条件の範囲内に収まっているときに自動的に取込画像データを記憶部64に保存するように設定されているときの処理の流れを示すフローチャートである。まず、撮像部61は、撮像した画像であり、表示部62に表示させるプレビュー画像を示すプレビュー画像データを生成する(500)。そして、境界検出部65が境界線を検出するとともに、撮像要素抽出部66が撮像要素の特徴量を抽出する(502)。撮像品質判定部67は、この抽出処理の結果に基づいて撮像要素ごとに撮像条件を満たすか否かを判定する。表示制御部68は、その判定結果を用いて、判定結果情報(撮像キュー)を決定する(504)。そして、取込画像決定部69は、判定結果に基づいて、全ての撮像要素の特徴量が撮像条件の範囲内であるか否かを確認する(506)。全ての撮像要素に対応する特徴量が撮像条件の範囲内である場合(508)、取込画像決定部69は、プレビュー画像データを取込画像データとして記憶部64に格納する(510)。一方、1以上の撮像要素の特徴量が撮像条件の範囲外である場合(512)、表示制御部68は、オリジナルのプレビュー画像の上に1以上の判定結果情報を重ねて表示する(514)。その後、500の処理に戻り、処理ループ516が繰り返される。このような自動撮像により、撮像するためにユーザがシャッタを押下する動作や装置への入力動作の際の手ぶれの影響を軽減できる。
<実施形態2>
ユーザによっては、上記のようにして取り込まれた取込画像データに対して露出補正や幾何学的歪み補正などを行い、高品質の画像データを生成することを望む場合がある。しかしながら、小型化されている携帯端末装置にこのような高機能を付加することが一般的に難しい。そこで、携帯端末装置は、上記のようにして取り込まれた取込画像データに対する画像処理をクラウド・コンピュータに実行させてもよい。本変形例は、携帯端末装置がクラウド・コンピュータを利用して画像処理された取込画像データを取得する形態に関するものである。
クラウド・コンピュータは、共用のリソースやソフトウェア、情報がコンピュータ装置にインターネットを介してオンデマンドで供給されるコンピュータシステム(クラウドと称される)に適用されるコンピュータである。モバイル・クラウド・コンピュータは、携帯端末装置がクラウドにアクセスするための通信能力を利用する。軽量プログラム形式のアプリケーション、例えば、小型機器や他の安価なプログラムが携帯端末装置で動作し、クラウドへのデータ転送やデータ収集のための端末として働く。クラウドの多くが、主な処理やデータを記憶する記憶部64を有する。
近年、iPhone(登録商標)、Android(登録商標)フォンなどのスマートフォンが急速に発展している。多くの場合、スマートフォンにおける処理能力やグラフィック性能は、数年前から小型コンピュータの性能に匹敵している。スマートフォンは、携帯性やユビキタスの点で利点がある。また、タッチ画面や加速度メータのようなセンサを介して直接的および相互作用的に、スマートフォンの画面上のコンテンツと情報伝達することが容易となっている。さらに、スマートフォンは、1以上のカメラを備えており、撮像装置でもある。WiFi(登録商標)や携帯ネットワークを介した接続により、スマートフォンは、様々な種類の手段(例えば、SSL、電子メールなどの直接通信)を通してクラウドと通信することができる。
文書処理システムでは、例えば、ScanR(登録商標)のようなクラウドで処理がもっぱら実行される。このシステムでは、ユーザは画像を取得し、処理のために当該画像をオンラインサービスに送る。クラウドによる文書処理システムのデメリットとしては、携帯端末装置に処理結果が返信されるまで、ユーザが処理結果を確認できない点である。
携帯端末装置で処理がもっぱら実施される文書処理システム(例えば、IPhone(登録商標)やAndroid(登録商標)端末で動作するアプリケーションである、DocScannerやScannerProアプリケーション)がある。これらの携帯端末装置での文書処理システムの機能は、利用できる携帯端末装置のコンピュータリソース(例えば、CPU、メモリなどのリソース)によって限定される。この限定されたリソースは、フル解像度の画像(例えば、5メガ画素クラスの画像)を処理するのに十分ではない。
(システム構成)
これらの点を背景として、本実施形態について説明する。図7は、本実施形態に係るシステムの構成を示すブロック図である。図7に示されるように、本実施形態に係るシステムは、携帯端末装置7と、クラウド・コンピュータ700とを備える。携帯端末装置7とクラウド・コンピュータ700とは、各種の通信ネットワークにより無線通信が可能である。
図7に示されるように、携帯端末装置7は、実施形態1の携帯端末装置6と比較して、文書領域特定部71と、文書領域修正部72と、送信部73と、受信部74とを備えている点で異なる。なお、文書領域特定部71と、文書領域修正部72と、送信部73と、受
信部74とは、文書撮像モードが有効に設定されているときに動作するブロックである。
文書領域特定部71は、取込画像決定部69により記憶部64に格納された取込画像データで示される画像において、矩形の文書あるいは文書を含む表示物である撮像対象物の領域(文書領域)を特定するものである。例えば、文書領域特定部71は、境界検出部65と同様に、4つの境界線を求め、当該4つの境界線で囲まれる領域を文書領域として特定する。そして、文書領域特定部71は、特定した文書領域の位置を示す文書領域位置情報を生成し、文書領域修正部72に出力する。文書領域位置情報は、例えば、四角形の文書領域における4つの頂点座標である。
文書領域修正部72は、取込画像データで示される画像の上に、文書領域特定部71により特定された文書領域の枠線を重ねて表示部62に表示させ、文書領域の修正指示または確認指示の受け付けを開始する。ユーザからの指示の受け付けを開始したタイミングにおいて、文書領域修正部72は、取込画像データに対する修正フラグを初期値である0に設定する。
ユーザから文書領域の修正指示を受けた場合、文書領域修正部72は、当該修正指示に従って、特定した文書領域の位置を修正する。なお、文書領域修正部72は、1つの取込画像データに対して、文書領域の修正指示を複数回繰り返して受け付けてもよく、修正指示を受け付けるごとに文書領域の位置を修正する。そして、文書領域修正部72は、修正した文書領域に基づいて、文書領域特定部71から受けた文書領域位置情報を更新するとともに、取込画像データに対する修正フラグを0から1に変更する。
また、文書領域修正部72は、文書領域の確認指示を受け付けると、最新の文書領域位置情報とともに、取込画像データに対する修正フラグに応じた識別子を送信部73に出力する。ここで、修正フラグに応じた識別子とは、修正フラグが0のときには、文書領域の修正を行っていないことを示す識別子であり、修正フラグが1のときには、文書領域の修正を行ったことを示す識別子となる。修正フラグが0である場合、文書領域の修正を行っていないことになるため、文書領域修正部72は、文書領域特定部71から受けた文書領域位置情報とともに、文書領域の修正を行っていないことを示す識別子を送信部73に出力することとなる。一方、修正フラグが1である場合、少なくとも1回文書領域の修正が行われているため、文書領域修正部72は、最新に生成した文書領域位置情報とともに、文書領域の修正を行ったことを示す識別子を送信部73に出力することとなる。
送信部73は、取込画像データとともに、文書領域修正部72から受けた文書領域位置情報と、文書領域がユーザによって修正されたか否かを示す識別子とをクラウド・コンピュータ700に送信するものである。
受信部74は、クラウド・コンピュータ700から、取込画像データに対する画像処理の結果(処理結果)を受信するものである。受信部74は、処理結果を受信すると、当該処理結果を他の装置(例えば、予め設定されたアドレスを有する装置)に送信してもよい。また、受信部74は、処理結果で示される画像処理後の取込画像データで示される画像を表示部62に表示してもよい。このとき、受信部74は、画像処理後の取込画像データをダウンサンプリングして低解像度化してから表示部62に表示してもよい。
クラウド・コンピュータ700は、図7に示されるように、画像データ受信部703と、画像処理部702と、画像データ送信部701とを備えている。
画像データ受信部703は、携帯端末装置7から、取込画像データと、文書領域位置情報と、文書領域がユーザによって修正されたか否かを示す識別子とを受信するものである
画像処理部702は、画像データ受信部703が受信した取込画像データに対して所定の画像処理を実行するものである。
画像処理部702は、画像処理を行う際に、取込画像データに基づいて、矩形の文書あるいは文書を含む表示物である撮像対象物の領域(文書領域)を特定する。この特定方法は、文書領域特定部71と同じ方法を用いればよい。もしくは、画像処理部702は、画像データ受信部703が受信した文書領域位置情報に基づいて文書領域を特定してもよい。なお、画像処理部702は、画像データ受信部703が受信した識別子がユーザによって修正されたことを示す場合には必ず、画像データ受信部703が受信した文書領域位置情報に基づいて文書領域を特定する。
画像処理部702が行う画像処理としては、例えば、露出補正、幾何学的歪み補正、階調補正、先鋭化処理、ノイズ除去、ぼやけ除去、解像度変換処理などがある。これらの画像処理の方法としては、特開2011−55467に記載の公知の方法をもちいればよい。例えば、画像処理部702は、特定した文書領域が所定サイズの矩形状になるように写像変換することにより幾何学的歪み補正を行う。
画像データ送信部701は、画像処理部702により画像処理が施された取込画像データを携帯端末装置7に送信するものである。
(携帯端末装置の処理の流れ)
次に、図8を参照しながら本実施形態の処理の流れを説明する。本実施形態の処理は、2つの構成に分割される。つまり、携帯端末装置側の処理と、クラウド側の処理とに分けられる。上述したように、本実施形態では、携帯端末装置7は、例えば、スチールカメラなどの撮像部61と表示部62と搭載された処理性能とを備えている。
まずは、図1に示す100、104、106と同じ処理が実行される(800、802、804)。なお、図8では図1の102の処理の図示を省略しているが、図8でも800と802との間で図1の102の処理が実行されている。その後、携帯端末装置7では、シャッタボタンが押下されたことを受けて(もしくは、実施形態1の変形例5の場合は全ての撮像要素が撮像条件を満たすことを受けて)、取込画像決定部69が取込画像データを記憶部64に格納する(806)。次に、文書領域特定部71は、取込画像データで示される画像において、矩形の文書あるいは文書を含む表示物である撮像対象物の領域である文書領域を特定し、当該文書領域の位置を示す文書領域位置情報を生成する(808)。文書領域特定部71は、取込画像データで示される取込画像を表示部62に表示させるとともに、特定した文書領域の位置を取込画像の上に表示させる(810)。文書領域の位置は、境界線、コーナー点、マスク画像、および/または文書着目領域の識別情報によって示される。
次に、図8に示されるように、文書領域修正部72は、ユーザから入力指示が、文書領域の修正指示であるか、確認指示であるかを確認する(812)。文書領域の修正指示(816)を受け付けた場合、文書領域修正部72は、表示部62上での文書領域を示す四角形の操作点に対するユーザのドラッグ操作に応じて、文書領域を新たな位置に修正し、文書領域位置情報を更新する。文書領域修正部72は、修正された文書領域の位置を携帯端末装置7の表示部62に表示させる(810)。そして、ユーザが文書領域の確認指示を入力する(814)、もしくは、文書領域の修正指示をさらに入力する(816)まで待機する(812)。
図9は、修正された文書領域を含む取込画像を示す図である。図9は、携帯端末装置7の表示部62の画面を示す。網目状にハッチングされた、修正された文書領域902は、文書領域の位置を変更するために当該文書領域の角をドラッグするための4つの操作点904,906,908,910とともに表示される。
図9に示されるように、文書領域の確認指示が入力された後(816)、文書領域修正部72は、文書領域位置情報と、ユーザが文書領域を修正したか否かを示す識別子とを送信部73に送る。つまり、修正指示816を1回でも受け付けた場合、文書領域修正部72は、最新に生成した文書領域位置情報とともに、文書領域の修正を行ったことを示す識別子を送信部73に出力する。一方、修正指示816を一回も受け付けることなく確認指示を受け付けた場合、文書領域修正部72は、文書領域特定部71から受けた文書領域位置情報とともに、文書領域の修正を行っていないことを示す識別子を送信部73に出力する。そして、送信部73は、フル解像度の取込画像を示す取込画像データとともに、文書領域修正部72から受けた文書領域位置情報、および、文書領域に関する編集タグであり、ユーザが文書領域を修正したか否かを示す識別子を、クラウド・コンピュータ700に送信する(820)。
携帯端末装置7の受信部74は、クラウド・コンピュータ700から順にクラウド側の処理結果を受信する(822)。
(変形例2−1)
図10に示されるように、携帯端末装置7では、受信部74がクラウド・コンピュータ700からクラウド側の処理結果を受けた後(822)、当該処理結果を別の場所に転送してもよい(1000)。別の場所とは、例えば、別の装置、電子メールのアカウント、携帯端末装置7の記憶装置、携帯端末装置7と離れた記憶装置などである。
(変形例2−2)
また、図11に示されるような処理が実行されてもよい。すなわち、携帯端末装置7の送信部73が、フル解像度の取込画像を示す取込画像データとともに、文書領域修正部72から受けた文書領域位置情報、および、ユーザが文書領域を修正したか否かを示す識別子を、クラウド・コンピュータ700に送信する(820)。そして、クラウド・コンピュータ700では、画像処理部702が取込画像データに対して所定の画像処理を行い、画像データ送信部701が画像処理後の取込画像データを含む処理結果を携帯端末装置7に送信する。この画像処理の例としては、階調補正、露出補正(明るさ補正)、幾何学的補正、遠近法による歪みの補正、先鋭化処理、ノイズ除去、ぼやけ除去、高解像度化、画像強調、画像修復など、端末の観察者にとって有効な画像を生成するような処理である。そして、携帯端末装置7の受信部74は、クラウド・コンピュータ700から順にクラウド側の処理結果を受信する(1100)。さらに、クラウド側の処理結果のプレビュー画像を生成するために、携帯端末装置7において、受信部74は、処理結果に含まれる画像処理済の取込画像データに対して低解像度化し、低解像度画像データを生成する(1102)。その後、携帯端末装置7において、受信部74は、クラウド側の処理結果のプレビュー画像を表示部62に表示させる(1104)。
(変形例2−3)
また、図12に示されるような処理が実行されてもよい。すなわち、携帯端末装置7の送信部73が、フル解像度の取込画像を示す取込画像データとともに、文書領域修正部72から受けた文書領域位置情報、および、ユーザが文書領域を修正したか否かを示す識別子を、クラウド・コンピュータ700に送信する(820)。そして、クラウド・コンピュータ700では、画像処理部702が取込画像データに対して所定の画像処理を行い、画像データ送信部701が画像処理後の取込画像データを含む処理結果を携帯端末装置7
に送信する。この画像処理の例としては、階調補正、露出補正(明るさ補正)、幾何学的補正、遠近法による歪みの補正、先鋭化処理、ノイズ除去、ぼやけ除去、高解像度化、画像強調、画像修復など、端末の観察者により有効な画像を生成するような処理である。そして、携帯端末装置7の受信部74は、クラウド・コンピュータ700から順にクラウド側の処理結果を受信する(1100)。さらに、クラウド側の処理結果のプレビュー画像を生成するために、携帯端末装置7において、受信部74は、処理結果に含まれる画像処理済の取込画像データに対して低解像度化し、低解像度画像データを生成する(1102)。その後、携帯端末装置7において、受信部74は、クラウド側の処理結果のプレビュー画像を表示部62に表示させる(1104)。その後、携帯端末装置7の受信部74は、クラウド側の処理結果を別の場所に転送する(1200)。別の場所とは、例えば、別の装置、電子メールのアカウント、携帯端末装置7の記憶装置、携帯端末装置7と離れた記憶装置などである。
(変形例2−4)
また、携帯端末装置7の送信部73は、ユーザが文書領域を修正したか否かを示す識別子に加えて、クラウドへ追加識別子を送信してもよい。追加識別子は、例えば、クラウド・コンピュータ700の画像処理部702で実行される処理の内容を示す情報(処理内容情報)や、取込画像データの撮像時の各種パラメータ、追加ルーティング情報などを含む。
クラウド・コンピュータ700の画像処理部702で実行される処理の内容を示す処理内容情報としては、例えば、画像処理部702で実行させる処理の種類(露出補正、幾何学的補正など)を識別する情報である。送信部73は、ユーザから入力を受け付け、当該入力に従って、処理内容情報を生成し、取込画像データに付加して送信する。クラウド・コンピュータ700の画像処理部702は、取込画像データに付加された処理内容情報で示される処理のみを実行する。
また、取込画像データの撮像時の各種パラメータは、例えば、撮像要素抽出部66により抽出された各種撮像要素の値である。露光量や原稿サイズ、消滅点と画像中心との距離、コントラスト、ぼやけについては、画像処理部702における画像処理において利用されることがある。取込画像データが画像処理部702により再度算出することも可能であるが、携帯端末装置7から受けた各種パラメータを利用することにより、画像処理部702の負荷を軽減させることができる。
追加ルーティング情報とは、画像処理部702による処理結果の転送先を指定する情報である。この追加ルーティング情報を付加することにより、クラウド・コンピュータ700の画像データ送信部701は、携帯端末装置7だけでなく、追加ルーティング情報で示される転送先に処理結果を送ることができる。
(クラウド・コンピュータの処理の流れ)
次に、図13を用いて、クラウド側の処理の流れを説明する。図13に示されるように、クラウド・コンピュータ700の画像データ受信部703は、携帯端末装置7によって撮像された取込画像データ、文書領域位置情報、およびユーザが文書領域を修正したか否かを示す識別子を受信する(1300)。次に、画像処理部702は、受信した取込画像データに対して画像処理を実行する(1302)。この画像処理の例としては、階調補正、露出補正(明るさ補正)、幾何学的歪み補正、遠近法による歪みの補正、先鋭化処理、ノイズ除去、ぼやけ除去、高解像度化、画像強調、画像修復など、端末の観察者にとって有効な処理結果を生成するような処理である。この処理は、文書領域に特有の処理である。画像処理部702は、文書領域の特定処理を実行する。ただし、文書領域がユーザにより修正されたことを携帯端末装置7から供給された識別子が示している場合、画像処理部
702は、携帯端末装置7から供給された文書領域位置情報で示される文書領域を、画像処理部702が特定した文書領域よりも優先する。もしくは、画像処理部702は、携帯端末装置7から受けた文書領域位置情報で示される位置の領域を、文書領域の初期値として使用してもよい。その後、画像データ送信部701は、画像処理部702の処理結果を携帯端末装置7に送信する(1304)。
また、図14に示されるように、画像データ送信部701は、画像処理部702の処理結果を携帯端末装置7に送信する(1304)。そして、画像データ送信部701は、画像処理部702の処理結果を、別の場所にも伝送してもよい(1400)。別の場所とは、例えば、別の装置、電子メールのアカウントなどである。別の場所は予め定められている。もしくは、上記の変形例2−4で記載したように、別の場所の識別情報を示す追加ルーティング情報が取込画像データに付加されて、携帯端末装置7からクラウド・コンピュータ700に送信されてもよい。
(その他の変形例)
文書領域特定部71による文書領域の特定方法は、US特許出願番号13/034,594(発明の名称「画像における注目の原稿領域を決定するための方法およびシステム」、2011年2月24日出願、発明者:Ahmet Mufit Ferman, Lawrence Shao-hsien Chen)に記載されたような方法、システムまたは装置により実現されてもよい。US特許出願
番号13/034,594は、その全体を参照することによって援用される。具体的に説明すれば以下のとおりである。
図15は、文書領域特定部71の概要を示す説明図である。文書領域特定部71は、プレビュー画像データから輝度成分のみを抽出した入力輝度画像データLを生成する。
入力輝度画像データLは、前景除去部1504、エッジ検出部1506、およびテキスト特徴算出部1508に入力される。前景除去部1504では、入力輝度画像データLに対して前景除去処理が施される。エッジ検出部1506では、入力輝度画像データLに対してエッジ検出処理が施される。テキスト特徴算出部1508では、入力輝度画像データLに基づいてテキスト(文字)の特徴点が算出される。
前景除去部1504は、文書画像に対応する入力輝度画像データLから前景成分を除去し、エッジデータをほとんど含まない均一に近い背景領域を得る。
前景除去部1504は、入力輝度画像データLをダウンサンプリングして、低解像画像データLにダウンサンプリングする。そして、低解像画像データLに対して流し込み法(flood-filling operation)を適用することにより、前景除去画像データ1510(
画像データISF)を生成する。流し込み法では、テキスト画素の低グレースケールレベルの値を周囲の明るい色の背景画素のグレースケールレベルに置換する(テキスト画素を周囲の明るい色の背景画素のグレースケールレベルで塗り潰す)。これにより、不要成分(高周波成分)を除去した略均一なグレースケールレベルを有する文書領域が生成される。なお、前景除去処理の方法はこれに限るものではなく、例えば、前景除去部1504が、拡大、中央値フィルタ処理、あるいはその他の画像処理技術を用いて前景除去処理を行うようにしてもよい。
図15に示したように、前景除去部1504からの出力画像データISF(前景除去画像データ1510)は、不均一性低減部1512に入力される。
不均一性低減部1512は、前景除去画像データ1510における不均一性(輝度ムラ)を低減し、前景除去画像データ1510におけるグレア効果を除去する。例えば、不均
一性低減部1512は、前景除去画像データ1510の中央領域(前景除去画像の中心を含む領域)におけるピークを拡大あるいは伸長するために、前景除去画像データ1510に対してモフォロジー処理(拡大縮小処理)による再構成処理を行う。典型的な実施例では、前景除去画像データ1510(画像データISF)からマーカー画像(種画像)Iを抽出し、抽出したマーカー画像Iを用いてモフォロジー処理による再構成処理を行う。モフォロジー処理による再構成処理において、マーカー画像Iをマスク画像の特性に基づいて処理するようにしてもよい。上記マスク画像として、例えば、上記の前景除去画像データ1510(画像データISF)を用いてもよい。上記マーカー画像の選択方法は特に限定されるものではなく、例えば、マーカー画像Iの中心付近における所定サイズの領域である第1領域に属する各画素の画素値を当該画素に対応する前景除去画像データ1510(画像データISF)の画素の画素値に応じた値に設定し、マーカー画像Iにおける第1領域を除く領域である第2領域に属する各画素の画素値をゼロに設定してもよい。これにより、マーカー画像Iにおける全画素の画素値は、マスク画像における対応する画素の画素値以下になる。モフォロジー処理による再構成処理は、概念的には、マーカー画像におけるマスク画像にマスクされる位置を連続的に拡大する処理として理解できる。この拡大処理は、前回の拡大によって再構成された画像と今回の拡大によって再構成された画像との間に変化が生じなかった場合に終了する。モフォロジー処理による再構成処理を実行する方法として多様な方法を採用可能であることは当業者にとって自明であろう。不均一性低減部1512は、モフォロジー処理による再構成処理が施された最終的な再構成画像データ1514(画像データI)を2値化処理部1516に出力する。
不均一性低減部1512が、背景色と文字色および前景色との関係を検出するようにしてもよい。この場合、マーカー画像におけるゼロ以外の画素値を有する画素の平均グレー値μIMを算出し、前景除去画像データ1510(画像データISF)における残りの画素の平均グレー値μICMと比較する。そして、μIM>μICM、かつμIM>TBGであれば、上記画像における文書部分は前景画像に暗い色のテキストを含む明るい色の背景になり、処理が継続される。なお、上記TBGは、背景の輝度値と白に対応する輝度値との差に応じた閾値である。μIM>μICM、かつμIM>TBGでなければ、文書着目領域の決定処理を終了するようにしてもよい。あるいは、μIM>μICM、かつμIM>TBGでなければ、2値化処理部1516によって決定される第1文書着目領域候補マスクを反転させて文書着目領域の決定処理を継続するようにしてもよい。上記TBGの典型的な値は100である。
再構成画像データ1514は、第1文書着目領域候補マスク(第1文書ROI候補マスク)1518を生成する2値化処理部(閾値処理部)1516に出力される。2値化処理部1516は、文書着目領域と非文書着目領域とを分離するための閾値を選択して2値化処理(閾値処理)を行う。閾値の選択方法は特に限定されず、多様な方法を用いることができる。例えば、「Nobuyuki Otsu著、“A threshold selection method from gray-level histograms”、IEEE Transactions on Systems、Man and Cybernetics、volume 9、62-66頁、1979年」に開示されている方法を用いてもよい。
図15に示したように、エッジ検出部1506は、上記の輝度のみからなる入力輝度画像データLからエッジマスク1522を抽出し、第1文書着目領域候補マスク1518から不要成分を除去するために用いる。エッジ検出部1506が、低解像画像データLに基づいてエッジマスク1522を抽出するようにしてもよく、フル解像度の画像データに基づいてエッジマスク1522を抽出するようにしてもよい。エッジ検出部1506におけるエッジ検出方法は特に限定されるものではなく、従来からの公知の種々の方法を用いることができる。例えば、勾配に基づく方法、ゼロ公差法、あるいはその他の方法を用いることができる。エッジ検出部1506によって抽出されたエッジマスク1522は、結合部1524において下記式(1)に基づいて第1文書着目領域候補マスク1518と結
合される。
Figure 0005231667
なお、第2文書着目領域候補マスクにおける各要素内の孔(holes)を除去するために、
第2文書着目領域候補マスクに対して塗り潰しアルゴリズム(image filling algorithm
)による処理を適用してもよい。あるいは、塗り潰し処理を行わなくてもよい。
着目領域補正部(ROI補正部)1528は、上記の第2文書着目領域候補マスク1526を補正(精製)する。具体的には、着目領域補正部1528は、第2文書着目領域候補マスク1526における連結要素(隣接する画素同士の画素値が同じである画素からなる集合)を識別し、それら各連結要素が文書着目領域の一部であるか否かを分析する。
着目領域補正部1528は、第2文書着目領域候補マスク1526における連結要素cによってカバーされたテキスト状の内容の量を決定する。具体的には、着目領域補正部1528は、入力輝度画像データLから検出されたコーナーの特徴点(複数のエッジの交点。テキストの特徴点。)1532をテキスト特徴算出部1508から受け取る。テキスト特徴算出部1508は、例えば「C.Harris、M.Stephens著、“A combined corner and edge detector”、Proceedings of the 4th Alvey Vision Conference、147-151頁、1988年」に開示されているハリス法を用いて入力輝度画像データLからコーナーの特徴点1532を検出する。
着目領域補正部1528は、第2文書着目領域候補マスク1526における連結要素cによって規定されるテキスト範囲として、コーナーの特徴点の総数に対する上記連結要素cに含まれるコーナーの特徴点の数の割合rを算出する。上記割合rの値が所定の閾値Tを超えている場合には最終文書着目領域マスク1534(MROI)に連結要素cを加え、そうでない場合には連結要素cを廃棄する。これにより、テキストの特徴点が密集している領域が最終文書着目領域マスク1534に含まれ、その他の領域は最終文書着目領域マスク1534から除外される。本実施形態では閾値Tを2.5%に設定している。ただし、閾値Tの値はこれに限るものではない。そして、着目領域補正部1528により生成された最終文書着目領域マスク1534で示される領域を文書着目領域として設定される。
また、上述した各処理の実行順序は、図面中に示した順序に限定されるものではなく、適宜変更してもよい。また、図面中に連続して実行されるように示されている各処理の一部を、並行処理するようにしてもよく、処理期間の一部が重複するようにしてもよい。また、上記の携帯の様々な論理回路上の機能をソフトウェア、ハードウェアおよび/またはファームウェアを用いて実現できることは当業者であれば容易に理解できる。
また、上記実施形態において、携帯端末装置6・7またはクラウド・コンピュータ70
0に備えられる各部(各ブロック)を、CPU等のプロセッサを用いてソフトウェアによって実現してもよい。この場合、携帯端末装置6・7またはクラウド・コンピュータ700は、各機能を実現する制御プログラムの命令を実行するCPU(central processing unit)、上記プログラムを格納したROM(read only memory)、上記プログラムを展開
するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである携帯端末装置6・7またはクラウド・コンピュータ700の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、携帯端末装置6・7またはクラウド・コンピュータ700に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによって達成される。
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などを用いることができる。
また、携帯端末装置またはクラウド・コンピュータを通信ネットワークと接続可能に構成し、通信ネットワークを介して上記プログラムコードを供給してもよい。この通信ネットワークの構成は特に限定されるものではなく、例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。
また、通信ネットワークを構成する伝送媒体についても特に限定されず、例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
また、携帯端末装置6・7またはクラウド・コンピュータ700の各ブロックは、ソフトウェアを用いて実現されるものに限らず、ハードウェアロジックによって構成されるものであってもよい。また、携帯端末装置6・7またはクラウド・コンピュータ700の各ブロックは、処理の一部を行うハードウェアと当該ハードウェアの制御や残余の処理を行うソフトウェアを実行する演算手段とを組み合わせたものであってもよい。
なお、本発明は、以下のようにも表現できる。
すなわち、本発明は、画像の撮像方法であって、プレビューフレーム画像を取得するステップと、上記プレビューフレーム画像から第1画像特徴を抽出するステップと、第1撮像要素に関して上記第1画像特徴を判断するステップと、上記第1撮像要素に対応する第1キューを上記プレビューフレーム画像の上に重ねたオーバーレイ・プレビューフレーム画像を表示するステップとを含む。
また、本発明の方法において、上記第1撮像要素は、露出、サイズ、傾き、コントラスト、カメラの動き、ぼやけの中から選択された一つであることが好ましい。
また、本発明の方法において、上記プレビューフレーム画像から第2画像特徴を抽出するステップと、第2撮像要素に関して上記第2画像特徴を判断するステップと、上記第2撮像要素に対応する第2キューを、上記プレビューフレーム画像の上にさらに重ねて表示
するステップとを含むことが好ましい。
また、本発明の方法において、上記第2撮像要素は、露出、サイズ、傾き、コントラスト、カメラの動き、ぼやけの中から選択された一つであり、上記第1撮像要素と異なることが好ましい。
また、本発明の方法において、上記プレビューフレーム画像から第3画像特徴を抽出するステップと、第3撮像要素に関して上記第3画像特徴を判断するステップと、上記第3撮像要素に対応する第3キューを、上記プレビューフレーム画像の上にさらに重ねて表示するステップとを含むことが好ましい。
また、本発明の方法において、上記第3撮像要素は、露出、サイズ、傾き、コントラスト、カメラの動き、ぼやけの中から選択された一つであり、上記第1撮像要素および第2撮像要素と異なることが好ましい。
上記第1画像特徴を抽出するステップは、露光量を算出するステップを含むことが好ましい。
ここで、上記第1撮像要素に関して上記第1画像特徴を判断するステップは、前記露光量と露光閾値とを比較するステップを含み、当該比較結果が第1基準を満たす場合に、露光量が適正であることを示す第1キューを表示し、当該比較結果が第1基準を満たさない場合に、露光量が不適切であることを示す第1キューを表示する。
また、上記第1画像特徴を抽出するステップは、サイズを算出するステップを含むことが好ましい。
上記サイズを算出するステップは、上記プレビューフレーム画像をダウンサンプリングするステップと、ダウンサンプリングされたプレビューフレーム画像をグレースケール画像に変換するステップと、上記グレースケール画像を2値化するステップと、上記2値化された画像において、撮像対象物の領域に対応する画素の数である第1値を決定するステップと、上記第1値を上記2値化された画像の全画素数で割るステップとを含むことが好ましい。
ここで、上記第1撮像要素に関して上記第1画像特徴を判断するステップは、上記サイズをサイズ閾値と比較するステップを含み、当該比較結果が第1基準を満たす場合に、サイズが適正であることを示す第1キューを表示し、当該比較結果が第1基準を満たさない場合に、サイズが不適切であることを示す第1キューを表示する。
また、上記プレビューフレーム画像から第1画像特徴を抽出するステップは、文書領域の上境界線を決定するステップと、文書領域の下境界線を決定するステップと、文書領域の左境界線を決定するステップと、文書領域の右境界線を決定するステップと、水平方向の消滅点を決定するステップと、垂直方向の消滅点を決定するステップと、水平方向の消滅点と上記プレビューフレーム画像の中心点との距離である第1距離を決定するステップと、垂直方向の消滅点と上記プレビューフレーム画像の中心点との距離である第2距離を決定するステップとを含むことが好ましい。
そして、上記第1撮像要素に関して上記第1画像特徴を判断するステップは、上記第1距離と水平方向の距離閾値とを比較するステップと、上記第2距離と垂直方向の距離閾値とを比較するステップとを含み、上記第1距離と水平方向の距離閾値との比較結果が第1基準を満たし、かつ、上記第2距離と垂直方向の距離閾値との比較結果が第2基準を満た
す場合に、傾きが適正であることを示す第1キューを表示し、上記第1距離と水平方向の距離閾値との比較結果が第1基準を満たさない、あるいは、上記第2距離と垂直方向の距離閾値との比較結果が第2基準を満たさない場合に、傾きが不適正であることを示す第1キューを表示する。
さらに、本発明の方法は、上記プレビューフレーム画像をダウンサンプリングするステップと、ダウンサンプリングされたプレビューフレーム画像をグレースケール画像に変換するステップと、上記グレースケール画像を2値化するステップと、上記2値化された画像から水平方向の勾配画像を算出するステップと、上記2値化された画像から垂直方向の勾配画像を算出するステップと、上記水平方向の勾配画像および垂直方向の勾配画像に基づいて、垂直方向のエッジに垂直方向のエッジである旨のラベル付けするステップと、上記水平方向の勾配画像および垂直方向の勾配画像に基づいて、水平方向のエッジに水平方向のエッジである旨のラベル付けするステップと、上記ラベル付けされたエッジから上境界ポイントセットを形成するステップと、上記ラベル付けされたエッジから下境界ポイントセットを形成するステップと、上記ラベル付けされたエッジから左境界ポイントセットを形成するステップと、上記ラベル付けされたエッジから右境界ポイントセットを形成するステップと、上記上境界ポイントセットをフィーティングすることで上記上境界線を求めるステップと、上記下境界ポイントセットをフィーティングすることで上記下境界線を求めるステップと、上記左境界ポイントセットをフィーティングすることで上記左境界線を求めるステップと、上記右境界ポイントセットをフィーティングすることで上記右境界線を求めるステップと、を含むことが好ましい。
さらに、水平方向の消滅点を決定するステップは、上記上境界線と下境界線との交点を求めるステップを含み、垂直方向の消滅点を決定するステップは、上記左境界線と右境界線との交点を求めるステップを含む。
また、上記オーバーレイ・プレビューフレーム画像の上に、上記の上境界線、下境界線、左境界線および右境界線を重ねて表示することが好ましい。
また、上記第1キューはアイコンであることが好ましい。
そして、上記アイコンは、第1キューが適正であることを示す場合に第1色を有し、第1キューが不適正であることを示す場合に第1色と異なる第2色を有することが好ましい。
また、上記第1キューは文字列であることが好ましい。
そして、上記文字列は、第1キューが適正であることを示す場合に第1色を有し、第1キューが不適正であることを示す場合に第1色と異なる第2色を有することが好ましい。
また、上記第1キューはアイコンおよび文字列であることが好ましい。
さらに、本発明の方法は、上記第1撮像要素に対応する値が適正である場合に第1画像を取り込むステップを含むことが好ましい。
さらに、本発明の方法は、上記プレビュー画像に対応するオーバーレイ・プレビューフレーム画像を撮像装置において表示するステップを含むことが好ましい。
また、本発明の方法は、画像の撮像方法であって、プレビューフレーム画像を取得するステップと、上記プレビューフレーム画像から複数の画像特徴を抽出するステップと、複
数の撮像要素に関して上記複数の画像特徴を判断し、各撮像要素に対する値を決定するステップと、各撮像要素について、当該撮像要素に対する上記値が適正か否かを判定するステップと、全ての撮像要素に対する値が適正である場合に、第1画像を取り込むステップと、少なくとも1つの撮像要素に対する値が不適正である場合に、当該撮像用度に対応する複数のキューを上記プレビューフレーム画像の上に重ねたオーバーレイ・プレビューフレーム画像を表示するステップとを含む。
さらに、本発明の方法は、上記プレビュー画像に対応するオーバーレイ・プレビューフレーム画像を撮像装置において表示するステップを含むことが好ましい。
本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
6・7 携帯端末装置(撮像装置)
61 撮像部(撮像手段)
62 表示部(表示手段)
65 境界検出部
66 撮像要素抽出部
67 撮像品質判定部(判定部)
68 表示制御部
69 取込画像決定部
71 文書領域特定部
72 文書領域修正部
73 送信部
74 受信部
302、304,306,308 境界線
310 第1消滅点
352,354,356,358 境界線
404,406,408,410 境界線
418、420,422 アイコン
424、426,428 文字列
700 クラウド・コンピュータ

Claims (11)

  1. 対象物を撮像する撮像手段と、
    上記撮像手段により撮像された画像であるプレビュー画像を表示する表示手段と、
    指定されたタイミングで上記表示手段に表示されているプレビュー画像を取込画像として取り込む取込画像決定部とを備える撮像装置において、
    上記対象物が矩形であり、
    上記プレビュー画像において、上記対象物と背景との四角形の境界線を検出する境界検出部と、
    画像の品質を示す複数の撮像要素の各々について、上記プレビュー画像から、当該撮像要素に対応する特徴量を抽出する撮像要素抽出部と、
    撮像要素ごとに、当該撮像要素に対応する特徴量が当該撮像要素に対応する撮像条件を満たすか否かを判定する判定部と、
    上記表示手段において、上記プレビュー画像の上に上記境界線を重ねて表示させるとともに、上記判定部により撮像条件を満たしていないと判定された撮像要素について、上記判定部による判定結果を示すアイコンおよび文字列の少なくとも一方を上記プレビュー画像の上に重ねて表示させ、上記判定部により撮像条件を満たしていると判定された撮像要素については、上記判定部による判定結果を表示させない表示制御部と
    上記取込画像における対象物の領域を特定する領域特定部と、
    上記領域特定部により特定された対象物の領域の位置に対する修正指示を受け付けたときに当該修正指示に従って対象物の領域の修正する領域修正部と、
    上記領域修正部による対象物の領域が修正されていない場合、上記取込画像と、上記領域特定部により特定された対象物の領域の位置を示す領域位置情報と、対象物の領域が修正されていないことを示す識別子とをクラウド・コンピュータに送信し、上記領域修正部による対象物の領域が修正された場合、上記取込画像と、上記領域修正部により修正された対象物の領域の位置を示す領域位置情報と、対象物の領域が修正されたことを示す識別子とをクラウド・コンピュータに送信する送信部と、
    上記クラウド・コンピュータにより画像処理が実行された取込画像を受信する受信部とを備えることを特徴とする撮像装置。
  2. 上記取込画像決定部は、上記複数の撮像要素の全てについて撮像条件を満たすと上記判定部により判定された場合を上記指定されたタイミングであると判断することを特徴とする請求項1に記載の撮像装置。
  3. 上記表示制御部は、上記判定結果の表示形態として、アイコンのみ、文字列のみ、アイコンおよび文字列、の何れかの選択指示を受け付け、受け付けた表示形態で上記判定結果を表示させることを特徴とする請求項1または2に記載の撮像装置。
  4. 上記表示制御部は、上記四角形の境界線の外側に上記判定結果を表示させることを特徴とする請求項1から3の何れか1項に記載の撮像装置。
  5. 上記表示制御部は、複数の撮像要素の各々について、判定結果の表示のオンおよびオフの切替指示を受け付け、オンの指示を受けた撮像要素についてのみ上記判定結果を表示させることを特徴とする請求項1から4の何れか1項に記載の撮像装置。
  6. 対象物を撮像する撮像手段と、
    上記撮像手段により撮像された画像であるプレビュー画像を表示する表示手段と、
    指定されたタイミングで上記表示手段に表示されているプレビュー画像を取込画像として取り込む取込画像決定部とを備える撮像装置において、
    上記取込画像における対象物の領域を特定する領域特定部と、
    上記領域特定部により特定された対象物の領域の位置に対する修正指示を受け付けたときに当該修正指示に従って対象物の領域の修正する領域修正部と、
    上記領域修正部による対象物の領域が修正されていない場合、上記取込画像と、上記領域特定部により特定された対象物の領域の位置を示す領域位置情報と、対象物の領域が修正されていないことを示す識別子とをクラウド・コンピュータに送信し、上記領域修正部による対象物の領域が修正された場合、上記取込画像と、上記領域修正部により修正された対象物の領域の位置を示す領域位置情報と、対象物の領域が修正されたことを示す識別子とをクラウド・コンピュータに送信する送信部と、
    上記クラウド・コンピュータにより画像処理が実行された取込画像を受信する受信部とを備えることを特徴とす撮像装置。
  7. 上記送信部は、クラウド・コンピュータで実行される画像処理の内容を示す情報と、上記取込画像を取り込む際に撮像要素抽出部により抽出された特徴量とを、上記取込画像とともにクラウド・コンピュータに送信することを特徴とする請求項1から6の何れか1項に記載の撮像装置。
  8. 請求項1から7の何れか1項に記載の撮像装置を動作させるプログラムであって、コンピュータを上記各部として機能させるためのプログラム。
  9. 請求項8に記載のプログラムを記録したコンピュータ読取り可能な記録媒体。
  10. 対象物を撮像する撮像手段と、
    上記撮像手段により撮像された画像であるプレビュー画像を表示する表示手段と、
    指定されたタイミングで上記表示手段に表示されているプレビュー画像を取込画像として取り込む取込画像決定部とを備える撮像装置における表示方法であって、
    上記対象物が矩形であり、
    上記プレビュー画像において、上記対象物と背景との四角形の境界線を検出する境界検出ステップと、
    画像の品質を示す複数の撮像要素の各々について、上記プレビュー画像から、当該撮像要素に対応する特徴量を抽出する撮像要素抽出ステップと、
    撮像要素ごとに、当該撮像要素に対応する特徴量が当該撮像要素に対応する撮像条件を満たすか否かを判定する判定ステップと、
    上記表示手段において、上記プレビュー画像の上に上記境界線を重ねて表示させるとともに、撮像条件を満たしていないと判定された撮像要素について、上記判定ステップの判定結果を示すアイコンおよび文字列の少なくとも一方を上記プレビュー画像の上に重ねて表示させ、撮像条件を満たしていると判定された撮像要素については、上記判定ステップの判定結果を表示させない表示制御ステップと
    上記取込画像における対象物の領域を特定する領域特定ステップと、
    上記領域特定ステップで特定された対象物の領域の位置に対する修正指示を受け付けたときに当該修正指示に従って対象物の領域の修正する領域修正ステップと、
    上記領域修正ステップで対象物の領域が修正されていない場合、上記取込画像と、上記領域特定ステップで特定された対象物の領域の位置を示す領域位置情報と、対象物の領域が修正されていないことを示す識別子とをクラウド・コンピュータに送信し、上記領域修正ステップで対象物の領域が修正された場合、上記取込画像と、上記領域修正ステップで修正された対象物の領域の位置を示す領域位置情報と、対象物の領域が修正されたことを示す識別子とをクラウド・コンピュータに送信する送信ステップと、
    上記クラウド・コンピュータにより画像処理が実行された取込画像を受信する受信ステップとを含むことを特徴とする表示方法。
  11. 対象物を撮像する撮像手段と、
    上記撮像手段により撮像された画像であるプレビュー画像を表示する表示手段と、
    指定されたタイミングで上記表示手段に表示されているプレビュー画像を取込画像として取り込む取込画像決定部とを備える撮像装置における画像処理方法であって、
    上記取込画像における対象物の領域を特定する領域特定ステップと、
    上記領域特定ステップで特定された対象物の領域の位置に対する修正指示を受け付けたときに当該修正指示に従って対象物の領域の修正する領域修正ステップと、
    上記領域修正ステップで対象物の領域が修正されていない場合、上記取込画像と、上記領域特定ステップで特定された対象物の領域の位置を示す領域位置情報と、対象物の領域が修正されていないことを示す識別子とをクラウド・コンピュータに送信し、上記領域修正ステップで対象物の領域が修正された場合、上記取込画像と、上記領域修正ステップで修正された対象物の領域の位置を示す領域位置情報と、対象物の領域が修正されたことを示す識別子とをクラウド・コンピュータに送信する送信ステップと、
    上記クラウド・コンピュータにより画像処理が実行された取込画像を受信する受信ステップとを含むことを特徴とする画像処理方法。
JP2012070181A 2011-04-01 2012-03-26 撮像装置、撮像装置における表示方法、撮像装置における画像処理方法、プログラムおよび記録媒体 Active JP5231667B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US13/078,052 2011-04-01
US13/078,070 US8947453B2 (en) 2011-04-01 2011-04-01 Methods and systems for mobile document acquisition and enhancement
US13/078,070 2011-04-01
US13/078,052 US9094617B2 (en) 2011-04-01 2011-04-01 Methods and systems for real-time image-capture feedback

Publications (2)

Publication Number Publication Date
JP2012217159A JP2012217159A (ja) 2012-11-08
JP5231667B2 true JP5231667B2 (ja) 2013-07-10

Family

ID=47269469

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012070181A Active JP5231667B2 (ja) 2011-04-01 2012-03-26 撮像装置、撮像装置における表示方法、撮像装置における画像処理方法、プログラムおよび記録媒体

Country Status (1)

Country Link
JP (1) JP5231667B2 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9767354B2 (en) 2009-02-10 2017-09-19 Kofax, Inc. Global geographic information retrieval, validation, and normalization
US10146795B2 (en) 2012-01-12 2018-12-04 Kofax, Inc. Systems and methods for mobile image capture and processing
US8989515B2 (en) 2012-01-12 2015-03-24 Kofax, Inc. Systems and methods for mobile image capture and processing
US9007633B2 (en) * 2012-08-15 2015-04-14 Fuji Xerox Co., Ltd. Systems and methods for efficiently capturing high-quality scans of multi-page documents with hand-held devices
US9355312B2 (en) 2013-03-13 2016-05-31 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US9208536B2 (en) 2013-09-27 2015-12-08 Kofax, Inc. Systems and methods for three dimensional geometric reconstruction of captured image data
US20140316841A1 (en) 2013-04-23 2014-10-23 Kofax, Inc. Location-based workflows and services
DE202014011407U1 (de) 2013-05-03 2020-04-20 Kofax, Inc. Systeme zum Erkennen und Klassifizieren von Objekten in durch Mobilgeräte aufgenommenen Videos
JP2016538783A (ja) 2013-11-15 2016-12-08 コファックス, インコーポレイテッド モバイル映像データを用いて長尺文書の合成画像を生成するためのシステムおよび方法
US9760788B2 (en) 2014-10-30 2017-09-12 Kofax, Inc. Mobile document detection and orientation based on reference object characteristics
US10242285B2 (en) 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
JP6478282B2 (ja) * 2015-11-27 2019-03-06 Kddi株式会社 情報端末装置及びプログラム
CN110402454B (zh) * 2017-03-28 2023-06-13 富士胶片株式会社 图像修正装置、图像修正方法及记录介质
US10803350B2 (en) 2017-11-30 2020-10-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach
CN111937082A (zh) * 2018-04-02 2020-11-13 皇家飞利浦有限公司 远程牙科成像的引导方法和系统
JP7414564B2 (ja) 2020-02-04 2024-01-16 キヤノン株式会社 情報処理装置及び方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4155875B2 (ja) * 2003-06-16 2008-09-24 シャープ株式会社 画像撮像装置
JP4341629B2 (ja) * 2006-01-27 2009-10-07 カシオ計算機株式会社 撮像装置、画像処理方法及びプログラム
JP2007240732A (ja) * 2006-03-07 2007-09-20 Pentax Corp 防振機能付きカメラ
JP4757173B2 (ja) * 2006-11-17 2011-08-24 キヤノン株式会社 撮像装置及びその制御方法及びプログラム

Also Published As

Publication number Publication date
JP2012217159A (ja) 2012-11-08

Similar Documents

Publication Publication Date Title
JP5231667B2 (ja) 撮像装置、撮像装置における表示方法、撮像装置における画像処理方法、プログラムおよび記録媒体
US8345106B2 (en) Camera-based scanning
JP5951367B2 (ja) 撮像装置、撮像画像処理システム、プログラムおよび記録媒体
US8947453B2 (en) Methods and systems for mobile document acquisition and enhancement
JP4341629B2 (ja) 撮像装置、画像処理方法及びプログラム
JP5547243B2 (ja) 画像処理装置、プログラムおよび記録媒体
JP5886265B2 (ja) 携帯端末装置、プログラム、及び記録媒体
JP5281446B2 (ja) 撮像装置、その制御方法及びプログラム
JP4772889B2 (ja) 携帯端末装置、撮像画像処理システム、プログラムおよび記録媒体
JP2011097251A (ja) 画像処理装置、画像処理方法、画像処理プログラム、画像処理プログラムを記録した記録媒体
JP2010088105A (ja) 撮像装置および方法、並びにプログラム
JP4758493B2 (ja) 携帯端末装置、撮像画像処理システム、携帯端末装置の制御方法、プログラムおよび記録媒体
JP2007074579A (ja) 画像処理装置、及びプログラム
WO2016074467A1 (zh) 一种图像的处理方法和装置
JP2019040617A (ja) 画像処理装置および画像処理方法
JP2004023158A (ja) 画像撮像装置
JP2018107593A (ja) 画像処理装置、画像処理方法およびプログラム
JP5301694B2 (ja) 画像処理装置、画像処理方法、プログラムおよびその記録媒体
JP2012181838A (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
US20120249837A1 (en) Methods and Systems for Real-Time Image-Capture Feedback
US8086063B2 (en) Image display apparatus and method, and program
JP2005275447A (ja) 画像処理装置、画像処理方法及びプログラム
JP2014132771A (ja) 画像処理装置および方法、並びにプログラム
JP5212451B2 (ja) 領域特定方法、領域特定装置、プログラム、サーバ及びシステム
JP2011028322A (ja) 画像処理装置、画像処理プログラムおよび撮像装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130321

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160329

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5231667

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150