JP2003189170A - 自動的に文書を検出する方法およびシステム - Google Patents

自動的に文書を検出する方法およびシステム

Info

Publication number
JP2003189170A
JP2003189170A JP2002298677A JP2002298677A JP2003189170A JP 2003189170 A JP2003189170 A JP 2003189170A JP 2002298677 A JP2002298677 A JP 2002298677A JP 2002298677 A JP2002298677 A JP 2002298677A JP 2003189170 A JP2003189170 A JP 2003189170A
Authority
JP
Japan
Prior art keywords
document
predetermined
scene
setting
aperture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002298677A
Other languages
English (en)
Inventor
Rin Chen
チェン・リン
Daniel Tretter
ダニエル・トレッター
Jian Fan
チェン・ファン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HP Inc
Original Assignee
Hewlett Packard Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Co filed Critical Hewlett Packard Co
Publication of JP2003189170A publication Critical patent/JP2003189170A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00795Reading arrangements
    • H04N1/00798Circuits or arrangements for the control thereof, e.g. using a programmed control device or according to a measured quantity
    • H04N1/00801Circuits or arrangements for the control thereof, e.g. using a programmed control device or according to a measured quantity according to characteristics of the original
    • H04N1/00806According to type of the original, e.g. colour paper or transparency, or reading a plurality of different types of original
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00795Reading arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00795Reading arrangements
    • H04N1/00798Circuits or arrangements for the control thereof, e.g. using a programmed control device or according to a measured quantity
    • H04N1/00819Self-calibrating reading means
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00281Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a telecommunication apparatus, e.g. a switched network of teleprinters for the distribution of text-based information, a selective call terminal
    • H04N1/00283Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a telecommunication apparatus, e.g. a switched network of teleprinters for the distribution of text-based information, a selective call terminal with a television apparatus
    • H04N1/00286Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a telecommunication apparatus, e.g. a switched network of teleprinters for the distribution of text-based information, a selective call terminal with a television apparatus with studio circuitry, devices or equipment, e.g. television cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0008Connection or combination of a still picture apparatus with another apparatus
    • H04N2201/007Selecting or switching between a still picture apparatus or function and another apparatus or function

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Studio Devices (AREA)
  • Facsimile Scanning Arrangements (AREA)
  • Image Input (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 自動的に文書を検出して分類する。 【解決手段】 取り込むシーンのプレビューを受信する
ステップと、前記取り込むシーンが文書であるかどうか
を前記プレビューに基づいて自動的に判定するステップ
110と、 前記シーンが文書であると判定される場合
には、少なくとも1つのカメラ制御手段を文書取り込み
用にプログラムするステップと、前記プログラムされた
カメラ制御手段を使用して前記シーンを取り込むステッ
プとを含んでなる、デジタルカメラ100で使用するた
めの画像を取り込む方法およびシステムを提供する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、一般にデジタルカ
メラに関し、特に、シーンが文書であることを自動的に
決定し、それに従って画像取り込み法および画像処理法
を適合させる方法およびシステムに関する。
【0002】
【従来の技術】大部分のデジタルカメラは単一の動作モ
ードを有し、それ自体、何ら特別な処理を文書に対して
行うものではない。理解されるように、同じ画像処理技
術と同じ画像取り込みパラメータとが画像のコンテンツ
に関わりなく一様に取り込み画像に適用されるため、こ
のようなデジタルカメラによって取り込まれる文書の質
は非常に悪く判読不能のことが多い。
【0003】米国ニュージャージー州のWest Caldwell
に所在するRicoh Inc.から市販されているRDC−i7
00デジタルカメラ等の文書モードを有するカメラがい
くつかある。このようなカメラを使用すると、ユーザは
文書モードを手動で選択することができる。文書モード
になると、カメラは自然のシーンよりも文書に適したカ
メラ設定を使用しようとする。
【0004】不都合なことに、ユーザはデジタルカメラ
を文書モードへと切り換えなければならない。ユーザ
は、シーンが文書であるかどうかの決定は容易に行える
が、次の写真を撮影するときに標準モードに切り換える
のを忘れてしまうことがある。理解されるように、ユー
ザが標準モードと文書モードとを切り換えることを覚え
ていなければならないことにより、設定が文書モードで
ある場合には自然のシーンについての画質が悪くなるお
それがある。したがって、シーンが自然のシーンか、そ
れとも文書であるかを自動的に検出し、ユーザの介入を
伴うことなく適切なモードに自動的に切り換える機構が
あることが望ましい。
【0005】さらに、文書モードを有するカメラは、許
容することができるものの非常にノイズの多い画像をも
たらす原始的な画像処理法(primitive image processi
ng)を用いている。たとえば、文書は非常に暗く見える
ことが多く、テキストはぼやけて見えることが多い。し
たがって、取り込まれた文書の見た目をよりはっきりと
することができるように、改良された画像処理性能を有
するデジタルカメラがあることが望ましい。
【0006】
【発明が解決しようとする課題】上記に基づいて、ある
機構によってシーンが文書であることを自動的に決定
し、それに従って画像取り込み法と画像処理法とを適合
させ、上記の欠点を克服する方法およびシステムに対す
る要求が残されている。
【0007】
【課題を解決するための手段】本発明の一実施形態によ
れば、自動的に文書を検出する方法が提供される。ま
ず、シーンのプレビュー画像が取り込まれる。次に、シ
ーンが文書であるかどうかについて決定が自動的に行わ
れる。このシーンが文書であると決定される場合には、
少なくとも1つのカメラ制御手段が、文書取り込み用に
適合された値を使用してプログラムされる。そして、こ
のプログラムされたカメラ制御手段を使用してシーンが
取り込まれる。そして、文書用に適合された画像処理
が、取り込まれたシーンに対して実行される。シーンが
文書ではないと決定される場合には、標準カメラ設定が
画像取り込みに使用され、標準画像処理が取り込まれた
画像に対して実行される。
【0008】本発明について、限定ではなく例として、
同様の参照符号が同様の要素を指す添付図面の図におい
て説明する。
【0009】
【発明の実施の形態】シーンが文書であることを自動的
に決定し、文書用に画像取り込みと画像処理とを適合さ
せる方法およびシステムについて述べる。以下の説明で
は、説明の目的として、本発明を完全に理解してもらう
ために、多くの具体的な詳細を記載する。しかし、当業
者は、本発明はこれら具体的な詳細無く実施することが
できることが理解されるであろう。他の場合には、既知
の構造と既知のデバイスとは、本発明を不必要に曖昧に
することを防ぐためにブロック図の形態で示している。
【0010】写真撮影は、制御された状況下でフィルム
または画像センサに光を入射させることを意味する。こ
のプロセスはよく露光と呼ばれる。撮影者がシャッタボ
タンを押下すると、レンズ内側の羽根(絞りとして知ら
れる)がシフトして、絞りと呼ばれる開口を形成する。
理解されるように、あるフレームに露光される光の量
は、シャッタ速度と絞りのサイズとによって決まる。
【0011】上述したように、レンズは、開閉して、フ
ィルムまたは画像センサに露光させる光量を制御する特
定サイズの穴(すなわち、絞り)を形成する絞り羽根を
有する。レンズの絞りリングに見られる絞りの大きさ
は、FナンバーまたはF/ストップと呼ばれる。
【0012】絞りは、カメラに入射する光量を制御する
ことに加えて、被写界深度にも影響し、被写界深度は写
真がどのように見えるかに影響する。対象に焦点を合わ
せると、対象の前後の特定のエリアにも焦点が合わせら
れる。この鮮鋭度の範囲が被写界深度と呼ばれるもので
ある。
【0013】これら異なるパラメータの1つ以上は、図
7を参照してさらに詳細に後述するように、本発明の文
書モードカメラ制御機構134によって制御することが
できる。
【0014】(デジタル画像取り込み装置100)図1
は、本発明の一実施形態による自動文書検出機構(以
下、「ADDM」とよぶ)110と文書画像処理機構12
0とを利用することができるデジタル画像取り込み装置
100を示す。本明細書において使用する「文書」とい
う語は、雑誌のページや、本のページや、コンピュータ
のプリント出力や、ホワイトボードに書かれた情報や、
プロジェクタ(たとえば、LCDプロジェクタ)から投
影されるスライドや、プロジェクタ(たとえば、オーバ
ヘッドプロジェクタ)によって表示されるプレゼンテー
ションでありうるが、これらに限定されない。文書は、
テキストとグラフィックスとイメージとの組み合わせを
含みうる。
【0015】デジタル画像取り込み装置100は、シー
ンが文書であるか、または自然のシーン(すなわち、非
文書画像)であるかを自動的に評価する自動文書検出機
構(ADDM)110を含む。自動文書検出機構110
については、図2と図4と図5とを参照してさらに詳細
に後述する。
【0016】デジタル画像取り込み装置100は、自動
文書検出機構110によって文書と決定されたシーンを
処理する文書処理ブロック130と、自動文書検出機構
110によって文書ではないと決定されたシーンを処理
する自然シーン処理ブロック150とを含む。
【0017】文書処理ブロック130は、文書の取り込
みを最適化するカメラ設定を提供する文書特定カメラ制
御ユニット134を含む。文書処理ブロック130は、
文書を取り込むための取り込みユニット138も含む。
文書処理ブロック130は、文書画像を向上させるよう
に適合されている画像処理アルゴリズムを適用する文書
画像処理ユニット144も含む。
【0018】自然シーン処理ブロック150は、自然の
シーン(すなわち、非文書画像)の取り込みを最適化す
るカメラ設定を提供するための自然シーン特定カメラ制
御ユニット154を含む。自然シーン処理ブロック15
0は、自然のシーンを取り込むための取り込みユニット
158も含む。自然シーン処理ブロック150は、自然
のシーンを向上させるように適合されている画像処理ア
ルゴリズムを適用する画像処理ユニット164も含む。
【0019】取り込みユニット138と取り込みユニッ
ト158とは、図7を参照してさらに詳細に後述するよ
うに、異なる設定を有する単一の画像取り込みユニット
で実施することができることに留意する。同様に、文書
処理ブロック130と自然シーン処理ブロック150と
は、図6を参照してさらに詳細に後述するように、異な
る画像処理プログラムを実行する単一の画像処理ユニッ
トで実施することもできる。さらに、文書特定カメラ制
御ユニット134と自然シーン特定カメラ制御ユニット
154とは、画像取り込みユニットおよび画像処理ユニ
ットを制御する単一の制御ユニットとして実施すること
ができることにも留意する。
【0020】(自動文書検出機構110)図2は、本発
明の好ましい実施形態による自動文書検出機構110を
さらに詳細に示すブロック図である。自動文書検出機構
110は、画像(たとえば、プレビュー画像)を複数の
領域に分割する画像分割器210と、各領域中の輝度エ
ッジを検出するエッジ検出器220(たとえば、輝度エ
ッジ検出器)とを含む。各領域中の輝度エッジの数をカ
ウントするために、エッジピクセルカウンタ230が設
けられる。
【0021】領域決定ユニット240(本明細書におい
て領域カウンタとも呼ばれる)が、輝度エッジ数が所定
のエッジ数よりも大きな領域の数を決定する。領域数が
所定の領域数を越える場合には、分類器250が画像を
文書として分類する。そうではなく、領域数244が所
定の領域数248を越えない場合には、分類器250は
シーンを非文書として分類する。画像が文書と分類され
るか、または非分書と分類されるかを示すために、ブー
ル変数またはフラグ(たとえば、文書フラグ254)を
採用することができる。
【0022】現シーンが文書であるかどうかの検出に
は、デジタルカメラによって取り込まれた画像に対して
動作するように適合される任意の文書画像識別アルゴリ
ズムを利用することができる。次に、好ましい文書画像
識別アルゴリズムについて図4を参照して述べる。図5
を参照して、代替の文書画像識別アルゴリズムについて
述べる。
【0023】図4は、本発明の一実施形態による図2の
自動文書検出機構により実行される処理ステップを示す
フローチャートである。ステップ410において、イメ
ージ内の輝度エッジが検出される。既知のエッジ検出ア
ルゴリズムをステップ410において当業者が利用する
ことができることに留意する。
【0024】次に、例示的なエッジ検出方式について述
べる。各ピクセルロケーションについて、画像輝度Yに
基づいて隣接差のメトリック(metric)(D1)を計算
して、D1を所定の閾値(Th)(たとえば、400)
と比較する。メトリック値(D1)が所定の閾値(T
h)よりも大きい場合には、そのピクセルがエッジピク
セルと分類される。その他の場合には、ピクセルは非エ
ッジピクセルと分類される。
【0025】隣接差のメトリック(D1)は、次のよう
に表すことができる。
【0026】
【数1】
【0027】図8は、図4のステップ410において利
用することのできる垂直方向の差を示す。図9は、図4
のステップ410において利用することのできる水平方
向の差を示す。
【0028】ステップ420において、エッジロケーシ
ョンの分布(たとえば、空間分布)が評価される。42
0の評価ステップは、以下のサブステップを含みうる。
ステップ430において、画像が領域(たとえば、等サ
イズの方形領域)に分割される。ステップ440におい
て、各領域内のエッジピクセルの数がカウントされる。
ステップ450において、所定のエッジカウントよりも
多いエッジカウントを有する領域数(Tw)が決定され
る。たとえば、所定のエッジカウントは、総領域サイズ
の割合(たとえば、50%)として表すことができる。
【0029】決定ブロック454において、領域数(T
w)が所定の領域数を越えるかどうかについて決定が行
われる。所定の領域数は、画像中の総領域数の所定の割
合(たとえば、60%)として表すことができる。ステ
ップ460において、Twが総領域数の所定の割合を越
える場合には、その画像は文書タイプとして分類され
る。その他の場合には、ステップ470において、画像
は非文書タイプ(たとえば、自然のシーン)として分類
される。
【0030】図5は、本発明の代替の実施形態による自
動文書検出の処理ステップを示すフローチャートであ
る。ここで、シーンが自然のものであるか、または文書
であるかを決定する代替の方法について述べる。ステッ
プ510において、あらゆるピクセルが、3つのピクセ
ルクラス、たとえば、テキストピクセルクラスとピクチ
ャピクセルクラスとバックグラウンドピクセルクラスと
に分類される。ステップ520において、テキストピク
セルの数がカウントされる。
【0031】決定ブロック530において、テキストピ
クセルの数が全ピクセルの所定の割合と所定の関係にあ
るかどうかについて決定が行われる(たとえば、テキス
トピクセルの数が全ピクセルの所定の割合よりも大きい
かどうかが決定される)。ステップ530において、所
定の割合は、異なるタイプの文書に対して経験的なテス
ト(empirical test)を行うことによって導出可能であ
ることに留意する。
【0032】テキストピクセルの数が全ピクセルの所定
の割合と所定の関係にある場合には、ステップ540に
おいて、画像が文書として分類される。そうではなく、
テキストピクセルの数が全ピクセルの所定の割合と所定
の関係にない場合には、ステップ550において、画像
が非文書として分類される。
【0033】(文書画像処理機構120)図3は、本発
明の一実施形態による文書画像処理機構144をさらに
詳細に示すブロック図である。文書画像処理機構144
は、エッジピクセルを検出するエッジピクセル検出器3
10と、エッジピクセルを鮮鋭化する鮮鋭化モジュール
320と、エッジピクセルを暗化する暗化モジュール3
30とを含む。輝度補正ユニット340は画像の輝度を
補正する。たとえば、このことは、領域内で検出された
エッジを使用して輝度マップを推定して、入力画像にわ
たってばらつく輝度を補正することを含みうる。
【0034】図6は、本発明の一実施形態による図3の
文書画像処理機構によって実行される処理ステップを示
すフローチャートである。画像のエッジピクセルがまず
識別される。たとえば、エッジピクセルは、図4の処理
または図5の処理によって識別することができる。ステ
ップ610において、図4の処理によって決定されたエ
ッジピクセル、または図5の処理によって決定されたテ
キストピクセルが、鮮鋭化され暗化される。この画像処
理は文書用に適合され、テキストのエッジを鮮鋭化し、
またテキストを暗化することにより、文書のテキストと
グラフィックスと画像とをより判読可能なものとする。
【0035】ステップ620において、画像に対して輝
度補正が行われる。画像取り込みの照明は均一ではない
場合があるため、文書特定画像処理ユニット144は、
背景における非均一性を補正する。たとえば、実際には
文書の背景は白色と想定されるが、テキストが印刷され
た紙を表すことのできるバックグラウンドピクセルは、
非白色である場合もある。この場合には、文書特定画像
処理ユニットは、文書の背景を反映するようにこれらバ
ックグラウンドピクセルを補正する。
【0036】(文書モードカメラ制御機構140)一実
施形態において、オートフラッシュ制御ユニット710
は、画像取り込みを文書に適合させるようにフラッシュ
をディスエーブル(disable)する。フラッシュが利用
され文書に直接に向けられる場合には、文書のコンテン
ツに関わりなく、画像の一部(たとえば、白色エリア)
がウォッシュアウトされる傾向があるように、画像中に
深刻なグレアが生じることに留意したものである。
【0037】さらに、シャッタ速度制御ユニット720
は、画像取り込み中にユーザの手が動くことに起因して
起こりうる手ブレを回避するために、シャッタ速度を所
定のシャッタ速度(たとえば、1/30秒またはこれよ
り高速)に設定する。
【0038】絞り制御ユニット730は、所定のシャッ
タ速度に基づいて適切な絞り設定を決定する。たとえ
ば、絞り制御ユニット730は、最小のFナンバーに対
応して、最大の開口を有する絞りを設定することができ
る。最大の絞りが画像取り込み装置で利用不可能な場合
には、ISO制御ユニット740が、ISOフィルム速
度を変更することにより(たとえば、ISOフィルム速
度を増大することにより)、その場の照明状況に適合す
る。
【0039】図7は、本発明の一実施形態による文書モ
ードカメラ制御機構をさらに詳細に示すブロック図であ
る。文書モードカメラ制御機構は、オートフラッシュ制
御ユニット710と、シャッタ速度制御ユニット720
と、絞り制御ユニット730と、ISO制御ユニット7
40と、ユーザへのメッセージおよび指示を生成するユ
ーザインタフェースユニット750とを含む。
【0040】一実施形態では、デジタルカメラは、オー
トフラッシュと、シャッタ速度制御手段と、絞り制御手
段と、取り込み平面とを含む。取り込む文書は文書平面
に配置される。ここで、図6の文書モードカメラ制御機
構によってプログラムされる設定タイプの第1の例につ
いて述べる。本例では、ユーザが、取り込み平面が文書
平面に対しておおよそ平行である第1の所定の様式にデ
ジタルカメラを配置するように指示される。そして、文
書モードカメラ制御機構134は、オートフラッシュ制
御ユニット710を採用し、オートフラッシュをディス
エーブルする。代わりに、文書モードカメラ制御機構1
34は、ユーザインタフェースユニット750を利用し
て、フラッシュを手動でディスエーブルするように指示
するメッセージを生成することができる。
【0041】シャッタ速度制御ユニット720は、シャ
ッタ速度を所定のシャッタ速度(たとえば、1/30秒
またはこれよりも高速)に設定する。そして、絞り制御
ユニット730が、選択されたシャッタ速度に基づいて
適切な絞り設定を決定する。要求される絞りが利用可能
な絞り設定の範囲を越えている場合には、ISO制御ユ
ニット740が、広範な考えられうる照明状況に適合す
るように、ISOフィルム速度を変更することができ
る。
【0042】第2の例において、ユーザは、文書からの
反射を低減する第2の所定の様式にデジタルカメラを配
置するように指示される。本例では、取り込み平面が文
書平面に対して角度を有し、角度は所定の角度値範囲内
にある値を有することができる。好ましくは、所定の角
度値範囲は、約22度から約45度の角度を含む。文書
モードカメラ制御機構は、十分な被写界深度を確保して
ピンぼけを回避するために、オートフラッシュをイネー
ブル(enable)し、所定の値、たとえばF/5.6以上
のFナンバーを有する小さな絞りを設定する。そして、
文書モードカメラ制御機構は、絞り設定に基づいてシャ
ッタ速度を決定し、それに従ってシャッタ速度を設定す
る。
【0043】上記明細書において、本発明について特定
の実施形態を参照して説明した。しかし、本発明のより
広義の範囲から逸脱せずに各種の変形および変更を行う
ことができることは明らかであろう。したがって、本明
細書および図面は、限定ではなく例示を意味するものと
みなされるべきものである。
【図面の簡単な説明】
【図1】本発明の一実施形態による自動文書検出機構お
よび文書画像処理機構を利用することが可能なデジタル
画像取り込み装置を示す概略図である。
【図2】本発明の好ましい実施形態による自動文書検出
機構をさらに詳細に示すブロック図である。
【図3】本発明の一実施形態による文書画像処理機構を
さらに詳細に示すブロック図である。
【図4】本発明の一実施形態による図2の自動文書検出
機構により実行される処理ステップを示すフローチャー
トである。
【図5】本発明の代替の実施形態による自動文書検出の
処理ステップを示すフローチャートである。
【図6】本発明の一実施形態による図3の文書画像処理
機構によって実行される処理ステップを示すフローチャ
ートである。
【図7】本発明の一実施形態による文書モードカメラ制
御機構をさらに詳細に示すブロック図である。
【図8】図4のステップ410において利用することの
できる垂直方向の差を示す概略図である。
【図9】図4のステップ410において利用することの
できる水平方向の差を示す概略図である。
フロントページの続き (72)発明者 ダニエル・トレッター アメリカ合衆国カリフォルニア州95118, サン・ノゼ,カル・デ・スタルダ 1533 (72)発明者 チェン・ファン アメリカ合衆国カリフォルニア州95014, クパティーノ,パークウッド・ドライブ 10260 #12 Fターム(参考) 5B047 AA01 BA02 BB06 CA17 CB21 5C022 AA13 AB15 AB17 AB19 AB55 5C072 AA01 CA12 DA13 DA23 DA30 EA08 UA20 WA04 5L096 BA17 CA02 FA06 FA44 FA45 GA19 GA28 GA51 JA11

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 取り込むべきシーンのプレビューを受信
    するステップと、 該取り込むべきシーンが文書であるかどうかを前記プレ
    ビューに基づいて自動的に判定するステップと、 前記シーンが文書であると判定される場合には、少なく
    とも1つのカメラ制御手段を文書取り込み用にプログラ
    ムするステップと、 該プログラムされたカメラ制御手段を使用して前記シー
    ンを取り込むステップとを含んでなる、デジタルカメラ
    で使用するための画像を取り込む方法。
  2. 【請求項2】 前記取り込まれたシーンに対して、文書
    用に適合された画像処理を実行するステップをさらに含
    む請求項1に記載の方法。
  3. 【請求項3】 前記プレビューが、前記取り込むべきシ
    ーンの低解像度バージョンである請求項1に記載の方
    法。
  4. 【請求項4】 前記シーンが文書であるかどうかを自動
    的に決定するステップが、 前記プレビューを複数の領域に分割するステップと、 該領域のそれぞれにおいて輝度エッジを検出するステッ
    プと、 該領域それぞれにおいて前記輝度エッジの数をカウント
    するステップと、 該輝度エッジの数が所定のエッジ数よりも大きい領域の
    数を決定するステップと、 前記領域の数が所定の領域の数を越える場合には、前記
    プレビューを文書として分類するステップと、 そうではなく、前記領域の数が前記所定の領域の数を越
    えない場合には、前記シーンを非文書として分類するス
    テップとを含む請求項1に記載の方法。
  5. 【請求項5】 前記シーンが文書であるかどうかを自動
    的に決定するステップが、 テキストピクセルクラスとピクチャピクセルクラスとバ
    ックグラウンドピクセルクラスとを含む3つのピクセル
    クラスにあらゆるピクセルを分類するステップと、 前記テキストピクセルの数をカウントするステップと、 前記テキストピクセルの数が全ピクセルの所定の割合と
    所定の関係にあるかどうかを決定するステップと、 前記テキストピクセルの数が前記全ピクセルの所定の割
    合と所定の関係にある場合には、前記画像を文書として
    分類するステップと、 そうではなく、前記テキストピクセルの数が前記全ピク
    セルの所定の割合と所定の関係にない場合には、前記画
    像を非文書として分類するステップとを含む請求項1に
    記載の方法。
  6. 【請求項6】 前記デジタルカメラは、オートフラッシ
    ュとシャッタ速度制御手段と絞り制御手段と取り込み平
    面とを含んでおり、取り込む文書は文書平面に配置さ
    れ、前記カメラ制御手段を文書取り込み用にプログラム
    するステップは、 前記デジタルカメラを第1の所定の態様に配置するよう
    にユーザに指示するステップであって、前記取り込み平
    面は前記文書平面に対しておおよそ平行であるステップ
    と、 前記オートフラッシュをディスエーブルするステップ
    と、 前記シャッタ速度を所定のシャッタ速度に設定するステ
    ップとを含む請求項1に記載の方法。
  7. 【請求項7】 前記シャッタ速度を所定のシャッタ速度
    に設定するステップは、前記シャッタ速度を1/30秒
    に等しいか、またはこれよりも高速に設定するステップ
    を含む請求項6に記載の方法。
  8. 【請求項8】 前記デジタルカメラはISO設定をさら
    に含み、前記方法が、 前記シャッタ速度設定に基づいて絞り(Fナンバー)を
    決定するステップと、 前記所定の絞り設定を利用することができるかどうかを
    決定するステップと、 前記所定の絞り設定を利用することができる場合には、
    前記絞りを前記所定の絞り設定に設定するステップと、 そうではなく、前記所定の絞り設定を利用することがで
    きない場合には、前記絞りを利用可能な限り最大の絞り
    に設定し、ISO設定を変更するステップとをさらに含
    む請求項6に記載の方法。
  9. 【請求項9】 前記デジタルカメラは取り込み平面を含
    み、取り込む文書は文書平面に配置され、前記カメラ制
    御手段を文書取り込み用に適合するステップが、 前記文書からの反射を低減する第2の所定の態様に前記
    デジタルカメラを配置するように指示するステップであ
    って、前記取り込み平面は前記文書平面に対して角度を
    有し、該角度は所定の角度値範囲内にあるステップと、 前記オートフラッシュをイネーブルするステップと、 所定の値以上のFナンバーを有する小さな絞りを設定す
    るステップとを含む請求項1に記載の方法。
  10. 【請求項10】 前記所定の角度値範囲は、22度から
    45度の角度を含み、 前記Fナンバーを所定の最小Fナンバー以上に設定する
    ステップは、前記FナンバーをF/5.6以上に設定す
    るステップを含む請求項9に記載の方法。
JP2002298677A 2001-10-17 2002-10-11 自動的に文書を検出する方法およびシステム Withdrawn JP2003189170A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/982620 2001-10-17
US09/982,620 US7053939B2 (en) 2001-10-17 2001-10-17 Automatic document detection method and system

Publications (1)

Publication Number Publication Date
JP2003189170A true JP2003189170A (ja) 2003-07-04

Family

ID=25529352

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002298677A Withdrawn JP2003189170A (ja) 2001-10-17 2002-10-11 自動的に文書を検出する方法およびシステム

Country Status (3)

Country Link
US (1) US7053939B2 (ja)
EP (1) EP1304864A3 (ja)
JP (1) JP2003189170A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011045078A (ja) * 2009-08-21 2011-03-03 Konica Minolta Systems Lab Inc カメラベースの文書画像処理のための適応的ボケ除去
KR20140061033A (ko) * 2012-11-13 2014-05-21 삼성전자주식회사 문서 영상 인식 방법, 장치 및 이를 이용한 사진 촬영 방법
JP2014215775A (ja) * 2013-04-24 2014-11-17 キヤノン株式会社 画像処理装置及び画像処理方法

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050097046A1 (en) 2003-10-30 2005-05-05 Singfield Joy S. Wireless electronic check deposit scanning and cashing machine with web-based online account cash management computer application system
JP4639734B2 (ja) * 2004-09-30 2011-02-23 富士ゼロックス株式会社 スライドコンテンツ処理装置およびプログラム
US7873200B1 (en) 2006-10-31 2011-01-18 United Services Automobile Association (Usaa) Systems and methods for remote deposit of checks
US8708227B1 (en) 2006-10-31 2014-04-29 United Services Automobile Association (Usaa) Systems and methods for remote deposit of checks
US10380559B1 (en) 2007-03-15 2019-08-13 United Services Automobile Association (Usaa) Systems and methods for check representment prevention
JP5033724B2 (ja) * 2007-07-12 2012-09-26 株式会社沖データ 文書検索装置及び画像形成装置、文書検索システム
US9058512B1 (en) 2007-09-28 2015-06-16 United Services Automobile Association (Usaa) Systems and methods for digital signature detection
US9159101B1 (en) 2007-10-23 2015-10-13 United Services Automobile Association (Usaa) Image processing
US9892454B1 (en) 2007-10-23 2018-02-13 United Services Automobile Association (Usaa) Systems and methods for obtaining an image of a check to be deposited
US20090180771A1 (en) * 2008-01-14 2009-07-16 Ming-Chang Liu Camera for shooting like a professional
US9842331B2 (en) 2008-01-18 2017-12-12 Mitek Systems, Inc. Systems and methods for mobile image capture and processing of checks
US20130085935A1 (en) 2008-01-18 2013-04-04 Mitek Systems Systems and methods for mobile image capture and remittance processing
US9672510B2 (en) * 2008-01-18 2017-06-06 Mitek Systems, Inc. Systems and methods for automatic image capture and processing of documents on a mobile device
US10380562B1 (en) 2008-02-07 2019-08-13 United Services Automobile Association (Usaa) Systems and methods for mobile deposit of negotiable instruments
US8286068B2 (en) * 2008-04-25 2012-10-09 Microsoft Corporation Linking digital and paper documents
US10504185B1 (en) 2008-09-08 2019-12-10 United Services Automobile Association (Usaa) Systems and methods for live video financial deposit
KR101441307B1 (ko) * 2008-10-10 2014-09-17 삼성전자주식회사 전력 소모 절감을 위한 영상 처리 방법 및 그 장치
US8249343B2 (en) * 2008-10-15 2012-08-21 Xerox Corporation Representing documents with runlength histograms
US8452689B1 (en) 2009-02-18 2013-05-28 United Services Automobile Association (Usaa) Systems and methods of check detection
US10956728B1 (en) 2009-03-04 2021-03-23 United Services Automobile Association (Usaa) Systems and methods of check processing with background removal
US9779392B1 (en) 2009-08-19 2017-10-03 United Services Automobile Association (Usaa) Apparatuses, methods and systems for a publishing and subscribing platform of depositing negotiable instruments
US8977571B1 (en) 2009-08-21 2015-03-10 United Services Automobile Association (Usaa) Systems and methods for image monitoring of check during mobile deposit
US8699779B1 (en) 2009-08-28 2014-04-15 United Services Automobile Association (Usaa) Systems and methods for alignment of check during mobile deposit
US10891475B2 (en) 2010-05-12 2021-01-12 Mitek Systems, Inc. Systems and methods for enrollment and identity management using mobile imaging
US9208393B2 (en) 2010-05-12 2015-12-08 Mitek Systems, Inc. Mobile image quality assurance in mobile document image processing applications
US9129340B1 (en) 2010-06-08 2015-09-08 United Services Automobile Association (Usaa) Apparatuses, methods and systems for remote deposit capture with enhanced image detection
US20120019841A1 (en) * 2010-07-20 2012-01-26 Schaertel David M Document scanner
US20120040717A1 (en) * 2010-08-16 2012-02-16 Veechi Corp Mobile Data Gathering System and Method
JP2013009304A (ja) * 2011-05-20 2013-01-10 Ricoh Co Ltd 画像入力装置、会議装置、画像処理制御プログラム、記録媒体
US10380565B1 (en) 2012-01-05 2019-08-13 United Services Automobile Association (Usaa) System and method for storefront bank deposits
US10210273B2 (en) * 2012-08-31 2019-02-19 Hewlett-Packard Development Company, L.P. Active regions of an image with accessible links
US10552810B1 (en) 2012-12-19 2020-02-04 United Services Automobile Association (Usaa) System and method for remote deposit of financial instruments
US10963535B2 (en) 2013-02-19 2021-03-30 Mitek Systems, Inc. Browser-based mobile image capture
US11138578B1 (en) 2013-09-09 2021-10-05 United Services Automobile Association (Usaa) Systems and methods for remote deposit of currency
US9286514B1 (en) 2013-10-17 2016-03-15 United Services Automobile Association (Usaa) Character count determination for a digital image
WO2015058948A1 (en) 2013-10-21 2015-04-30 Sicpa Holding Sa A security checkpoint
WO2016018419A1 (en) 2014-07-31 2016-02-04 Hewlett-Packard Development Company, L.P. Processing data representing an image
US10402790B1 (en) 2015-05-28 2019-09-03 United Services Automobile Association (Usaa) Composing a focused document image from multiple image captures or portions of multiple image captures
TWI549067B (zh) * 2015-08-13 2016-09-11 宏碁股份有限公司 可攜式電子裝置以及影像擷取方法
US10114447B2 (en) * 2015-12-10 2018-10-30 Samsung Electronics Co., Ltd. Image processing method and apparatus for operating in low-power mode
US10701261B2 (en) 2016-08-01 2020-06-30 International Business Machines Corporation Method, system and computer program product for selective image capture
CN110463177A (zh) * 2017-04-06 2019-11-15 华为技术有限公司 文档图像的校正方法及装置
US11030752B1 (en) 2018-04-27 2021-06-08 United Services Automobile Association (Usaa) System, computing device, and method for document detection
US11900755B1 (en) 2020-11-30 2024-02-13 United Services Automobile Association (Usaa) System, computing device, and method for document detection and deposit processing

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2827259B2 (ja) 1989-03-08 1998-11-25 キヤノン株式会社 固体カメラ
US5596655A (en) 1992-08-18 1997-01-21 Hewlett-Packard Company Method for finding and classifying scanned information
JP3437226B2 (ja) * 1993-10-20 2003-08-18 キヤノン株式会社 画像処理方法及び装置
JPH07284011A (ja) * 1994-04-05 1995-10-27 Ricoh Co Ltd デジタル電子スチルカメラ
JPH07288722A (ja) * 1994-04-15 1995-10-31 Canon Inc 撮像装置
JPH0823473A (ja) * 1994-07-05 1996-01-23 Canon Inc 撮像装置
JPH0946591A (ja) * 1995-07-31 1997-02-14 Canon Inc 画像処理装置及び画像処理システム
JPH09200455A (ja) * 1996-01-19 1997-07-31 Minolta Co Ltd 読取り画像の濃度補正方法及び画像読取り装置
JP3380831B2 (ja) * 1996-03-08 2003-02-24 シャープ株式会社 画像形成装置
JP3631333B2 (ja) * 1996-08-23 2005-03-23 シャープ株式会社 画像処理装置
JPH10262173A (ja) * 1997-03-18 1998-09-29 Minolta Co Ltd ラインセンサカメラ
JPH10262017A (ja) 1997-03-19 1998-09-29 Fujitsu Ltd Sdh多重伝送システム及びその装置
NL1006472C2 (nl) * 1997-07-04 1999-01-05 Oce Tech Bv Kopieerinrichting met instelbare gradatie.
US6366699B1 (en) * 1997-12-04 2002-04-02 Nippon Telegraph And Telephone Corporation Scheme for extractions and recognitions of telop characters from video data
GB9809679D0 (en) * 1998-05-06 1998-07-01 Xerox Corp Portable text capturing method and device therefor
US6741279B1 (en) 1998-07-21 2004-05-25 Hewlett-Packard Development Company, L.P. System and method for capturing document orientation information with a digital camera
US6567559B1 (en) * 1998-09-16 2003-05-20 Texas Instruments Incorporated Hybrid image compression with compression ratio control
US6289122B1 (en) * 1999-04-15 2001-09-11 Electronics For Imaging, Inc. Intelligent detection of text on a page
US6563948B2 (en) * 1999-04-29 2003-05-13 Intel Corporation Using an electronic camera to build a file containing text
EP1061407B1 (en) * 1999-06-15 2006-02-08 Hewlett-Packard Company, A Delaware Corporation Strobe flash photographic illumination
JP2001016447A (ja) * 1999-06-30 2001-01-19 Minolta Co Ltd 画像処理装置および画像処理方法、ならびに画像処理プログラムを記録した記録媒体
GB2353870B (en) * 1999-09-02 2004-01-21 Hewlett Packard Co Document capture stand
US7324139B2 (en) 2000-01-20 2008-01-29 Ricoh Company, Ltd. Digital camera, a method of shooting and transferring text
US6771838B1 (en) * 2000-10-06 2004-08-03 Hewlett-Packard Development Company, L.P. System and method for enhancing document images
US6937272B1 (en) * 2000-11-08 2005-08-30 Xerox Corporation Display device for a camera
US6975352B2 (en) * 2000-12-18 2005-12-13 Xerox Corporation Apparatus and method for capturing a composite digital image with regions of varied focus and magnification
US7068852B2 (en) * 2001-01-23 2006-06-27 Zoran Corporation Edge detection and sharpening process for an image
US6903767B2 (en) * 2001-04-05 2005-06-07 Hewlett-Packard Development Company, L.P. Method and apparatus for initiating data capture in a digital camera by text recognition

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011045078A (ja) * 2009-08-21 2011-03-03 Konica Minolta Systems Lab Inc カメラベースの文書画像処理のための適応的ボケ除去
KR20140061033A (ko) * 2012-11-13 2014-05-21 삼성전자주식회사 문서 영상 인식 방법, 장치 및 이를 이용한 사진 촬영 방법
KR101992153B1 (ko) * 2012-11-13 2019-06-25 삼성전자주식회사 문서 영상 인식 방법, 장치 및 이를 이용한 사진 촬영 방법
JP2014215775A (ja) * 2013-04-24 2014-11-17 キヤノン株式会社 画像処理装置及び画像処理方法
US9973653B2 (en) 2013-04-24 2018-05-15 Canon Kabushiki Kaisha Image processing apparatus and image processing method

Also Published As

Publication number Publication date
EP1304864A2 (en) 2003-04-23
US7053939B2 (en) 2006-05-30
US20030072568A1 (en) 2003-04-17
EP1304864A3 (en) 2004-12-08

Similar Documents

Publication Publication Date Title
JP2003189170A (ja) 自動的に文書を検出する方法およびシステム
KR101431601B1 (ko) 카메라 프로세서에서의 얼굴 추적
US7315630B2 (en) Perfecting of digital image rendering parameters within rendering devices using face detection
US7471846B2 (en) Perfecting the effect of flash within an image acquisition devices using face detection
US7440593B1 (en) Method of improving orientation and color balance of digital images using face detection information
US7362368B2 (en) Perfecting the optics within a digital image acquisition device using face detection
US7616233B2 (en) Perfecting of digital image capture parameters within acquisition devices using face detection
US7634109B2 (en) Digital image processing using face detection information
US7317815B2 (en) Digital image processing composition using face detection information
US8948468B2 (en) Modification of viewing parameters for digital images using face detection information
US8326066B2 (en) Digital image adjustable compression and resolution using face detection information
US8498452B2 (en) Digital image processing using face detection information
US20100054533A1 (en) Digital Image Processing Using Face Detection Information
US20120121129A1 (en) Image processing apparatus
EP3671552A1 (en) Electronic apparatus and image capture apparatus capable of detecting halation, method of controlling electronic apparatus, method of controlling image capture apparatus, and storage medium
JP7278764B2 (ja) 撮像装置、電子機器、撮像装置の制御方法およびプログラム
Wang et al. A novel automatic red-eye detection and removal method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050928

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080418

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080718

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080724

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081017

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081202

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20090311