JP2004504650A - フォーム認識及びデジタル化画像処理のための方法及びシステム - Google Patents

フォーム認識及びデジタル化画像処理のための方法及びシステム Download PDF

Info

Publication number
JP2004504650A
JP2004504650A JP2001552614A JP2001552614A JP2004504650A JP 2004504650 A JP2004504650 A JP 2004504650A JP 2001552614 A JP2001552614 A JP 2001552614A JP 2001552614 A JP2001552614 A JP 2001552614A JP 2004504650 A JP2004504650 A JP 2004504650A
Authority
JP
Japan
Prior art keywords
mark
software
image data
data
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001552614A
Other languages
English (en)
Inventor
バーゲルソン, アラン, ピー.
ヴァンシクル, スコット
グロスバーグ, デイヴィッド
レオン, アルマンド, ジュニア.
リード, スーザン, ビー.
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Workonce Wireless Corp
Original Assignee
Workonce Wireless Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US09/480,914 external-priority patent/US6697056B1/en
Priority claimed from US09/692,272 external-priority patent/US6600482B1/en
Priority claimed from US09/692,291 external-priority patent/US6707466B1/en
Application filed by Workonce Wireless Corp filed Critical Workonce Wireless Corp
Publication of JP2004504650A publication Critical patent/JP2004504650A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • G06V30/1423Image acquisition using hand-held instruments; Constructional details of the instruments the instrument generating sequences of position coordinates corresponding to handwriting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Processing Or Creating Images (AREA)
  • Facsimiles In General (AREA)
  • Character Discrimination (AREA)

Abstract

予め印刷されたフォーム(45)を、該フォーム(45)上に手により印されたマーク(230)の位置に基づいて自動的に識別する方法及びシステムである。該方法は、デジタル化インク画像データを受信するステップ(412)と、マーク(230)の存在及び位置を識別するステップと、上記受信されたインクデータと当該フォームの記憶された画像との間の如何なる位置ズレも決定すると共に、該位置ズレを補正するために上記インクデータをシフトするステップとを有している。上記システムは、デジタイザ(35)と、ユーザが1以上の識別マーク(220、230)を何処に記入すべきかを示す当該フォームに固有の1以上の予め印刷された指示子を有するような予め印刷されたフォーム(45)とを有する。デジタイザ(35)は、データベースに結合されたコンピュータプロセッサ(25)に対し、フォーム上に印されたマークの1以上のデジタル化画像を含む画像データを伝送する。プロセッサ(25)は、ユーザにより印された1以上の識別マークの存在及び位置を識別すると共に、当該フォームを上記の1以上のマークの位置に基づいて識別する。

Description

【0001】
【発明の属する技術分野】
本発明は広くはデジタイザ装置を使用したデータ入力に関し、更に詳細にはデジタイザ上に載置された書式用紙(フォーム:form)を認識すると共にデジタイザパッドに対するデジタル画像のズレを検出し及び補正するシステム及び方法に関する。
【0002】
【従来の技術】
デジタイザ装置上に載置されたフォーム(書式用紙)を自動的に識別するシステムは既知である。(ここで使用される“フォーム”なる用語は、実際の頁というよりは頁上の印刷画像を指す。即ち、2枚の頁が同一の画像で印刷された場合は、これらは同一のフォームであると見なされる。)例えば、米国特許第5,869,789号(Reid−Green)は、用紙がデジタイザシステムに装填された場合に該用紙上に予めコード化された頁番号を検出するような頁認識システムを議論している。該システムは、組み込まれたスキャナを使用して、頁の裏面上の予めコード化された識別子を検出している。米国特許第5,555,101号(Larson他)は、ファクシミリにより受信されたフォーム用の自動化された頁認識システムを議論しており、これも、フォームを識別するために予め印刷されたパターンを使用している。
【0003】
米国特許第5,629,499号(Flickinger他)は、電子クリップボードを開示し、斯かるクリップボード上で使用されるフォームを認識する2つの方法を議論している。第1の方法においては、クリップボード上に表示される種々のフォーム識別子の間を切り換えるためにトグルスイッチが使用され、第2の方法においてはバーコードリーダがフォーム上に予め印刷されたバーコードを読み取る。上記トグル表示は、上記クリップボードがマイクロプロセッサを含むことを要し、該マイクロプロセッサは新たなフォームの群が使用される毎に再プログラムされねばならない。
【0004】
デジタル化ノートパッドが知られており、斯かるデジタル化ノートパッドは該パッド上に載せされた紙フォーム上になされるメモ書きを記録する。例えば、A.T.クロス・カンパニはクロスパッド35(図1参照)、即ち無線伝送を使用してペンの動きをデジタル化及び記録する携帯型デジタルノートパッドを市販している。該クロスパッドは、記録されたペンの動きを、処理及び解析するためにパーソナルコンピュータに送信する。しかしながら、該クロスパッドは、それ自身では事前に印刷されたフォームを識別することはできない。クロスパッドにより記録されコンピュータに送信された情報は、ユーザがフォーム上に書き込むことによって入力されたペンの動き(ストローク)のみを含む。フォーム上に予め印刷された情報は、該クロスパッドによっては検出することはできない。該クロスパッドは、ユーザにより切り換えることができるフォームIDの表示は有さず、バーコードリーダも有していない。
【0005】
上記クロスパッドのような装置はユーザにより書かれた情報しか検出しないので、斯様な装置は事前に印刷された情報に基づいてフォームを識別するようなシステムには通常は使用することができない。Reid−Green特許に開示されたもののようなシステムでさえ、複数のフォームがデジタイザ上に載置された場合にはフォーム識別情報を検出することはできない。例えば、Reid−Greenのシステムは、積み重ねの底にあるフォームしか識別しない。Flickinger他の特許で議論されている装置は、複数の頁を読み取ることができるかも知れないが、斯様な装置はクロスパッド型装置には存在しないような追加の(そして、高価な)フォーム読み取り機構を必要とする。デジタイザにおけるバーコードリーダ又は他のフォーム読み取り機構の使用は、当該デジタイザの価格及び重量を増加させる。
【0006】
上記クロスパッド型装置の他の欠点は、紙フォーム上に書かれたマークの空間的関係が、下側の“デジタルフォーム”上の対応するデジタルマーキングの空間的関係と同一にならない点にある。このズレ(“デジタル的ズレ”)は数ミリメートルにもなり得る。
【0007】
クロスパッド型装置の更なる欠点は、フォームが使用される場合、該フォーム上の予め印刷された情報が、アップロードされるデジタル・インク・ファイルの一部とならない事実から生じる。該デジタル・インク・ファイルがアップロード後に最適に有効であるためには、使用時に上記紙フォーム上に存在する前後関係情報の画像が該デジタル・インク・画像に付加されることを要する。元のフォームの画像を、該フォーム上に書き込まれた情報と共に再生することができるように、これら2つの画像は正しく位置合わせされねばならない。
【0008】
【発明が解決しようとする課題】
従って、上記クロスパッド及び同様の装置上で使用されるフォーム(書式用紙)を、該フォーム上の予め印刷された情報に頼ることなく、認識することができるような自動化されたフォーム識別システムに対する要求が存在する。
【0009】
また、クロスパッド型電子クリップボードに面倒なLCD表示器(プログラム可能なプロセッサを伴う)及びトグルスイッチ又は他の入力装置を組み込む必要のないシステムに対する他の要求も存在する。
【0010】
また、クロスパッド型装置及び他のデジタイザ用のデジタル的ズレを補正する方法及びシステムに対する更なる要求も存在する。更に、フォーム上に手書きされた情報のデジタル・インク・画像を下側のフォームの画像と合成すると共に位置合わせする方法に対する要求も存在する。
【0011】
【課題を解決するための手段】
本発明は、予め印刷されたフォームの自動化識別のための方法であって、予め印刷されたフォーム上に手書きされたマークの存在及び位置を識別するステップと、該予め印刷されたフォームを上記マークの位置とフォーム及び対応する識別マークの位置を掲載するデータベースとを比較することにより識別するステップとを有しているような方法を含む。本発明は、更に、予め印刷されたフォームの識別のためのシステムであって、デジタイザと;ユーザが1以上の識別マークを何処に記入すべきかを示す当該フォームに固有の1以上の予め印刷された指示子を有するような予め印刷されたフォームと;データベースに結合されたコンピュータプロセッサであって、当該フォーム上に記入されたマークの1以上のデジタル化画像を受信し、当該ユーザにより記入された1以上の識別マークの存在及び位置を識別し、当該フォームを前記1以上のマークの位置とフォーム及び対応する識別マークの位置を掲載するデータベースとを比較することにより識別するようなコンピュータプロセッサとを有するようなシステムを含む。また、本発明は、予め印刷されたフォームの自動化識別のためのコンピュータソフトウェアであって、予め印刷されたフォーム上に手書きされたマークの位置を記述するデータを受信及び記憶するソフトウェアと、前記フォームを前記マークの位置とフォーム及び対応する識別マークの位置を掲載するデータベースとを比較することにより識別するソフトウェアとを有するようなコンピュータソフトウェアも含む。
【0012】
本発明は、更に、デジタル的なズレを補正すると共に、デジタルインクファイルをデジタルフォーム上にマッピングする方法を含む。典型的には、デジタル化パッド(例えば、クロスパッド(CrossPad)又は同様の装置)は或る量のデジタル的なズレ、即ち紙フォーム上に書く相対位置と下側のデジタルフォーム上の対応するデジタルマークの相対位置との間の空間的差、を被る。デジタル的ズレの量及び方向は各パッドに関して(及び所与のフォームの何処においても)一定であるが、典型的にはパッド毎に変化する。
【0013】
好ましい実施例のソフトウェアは、デジタル的ズレの量及び方向を、所与のフォーム上の既知の目印を参照することにより決定する。好ましくは、斯様な目印は、以下に説明するようなフォーム識別マークとする。好ましい実施例においては、該フォーム識別子は円とする。デジタル的ズレは、紙フォーム上のフォーム識別円の中心の既知の位置を下側のデジタルフォーム上の対応するデジタルマークの中心と比較し、次いで水平及び垂直方向における違いを決定することにより、決定する。該デジタル的ズレが一旦決定されると、該ズレは当該フォーム上の全てのデジタルマーキングに対して補正係数として適用される。
【0014】
この補正係数は、好ましくは、手書きされたデジタルインク画像と下側のフォームの画像との位置合わせを容易化するために使用される。この位置合わせは、デジタルインクデータが書き込まれたフォームを先ず識別することにより達成される。次いで、識別されたフォームの予めロードされた画像がデータベースから取り出される。上記補正係数が、上記インクデータを上記デジタルフォームと位置合わせするために使用される。上記デジタルフォームと上記デジタルインクとの正しい位置合わせは、当該紙フォームの記入された際に見えたような複製を可能にする。更に、正しい位置合わせは、複合画像が光学マーク認識(OMR)、光学文字認識(OCR)及びデータベースへの画像断片記憶(image snippets storage)により処理されるのを可能にする。
【0015】
本発明は、更に、予め印刷されたフォーム識別マークを有していなかったフォームの識別の可能化を形成する方法及びシステムを含む。本発明の該態様の好ましい実施例においては、金属製又はプラスチック製のガイドであって、該ガイドの種々の選択された位置に配置された3ミリメートル孔を備えるガイドが、デジタイザパッドの一方の側に取り付けられる。好ましくは、該ガイドは顧客に結びつけられる所定の位置に取り付けられる。上記ガイドの当該パッドの所定の位置の側への固定は、ユーザが孔内にマークを印すのを可能にし、該孔の位置は予め印刷されたマークが有しているであろう位置に対応する。即ち、該マークは、予め印刷されたフォームの識別円に記入されたマークが有するであろうものと同一の位置を有する。このことは、フォーム識別マークが印刷されなかった予め印刷されたフォームを有する顧客が、これらフォームを、開示されたシステムの残りのものにおいて使用するのを可能にする。
【0016】
【発明の実施の形態】
好ましい実施例において、本システム及び方法は、クロスパッド(CrossPad)のようなデジタイザ35、予め印刷されたフォーム(書式用紙)45、パーソナルコンピュータ25及び付属のソフトウェアを有する図1に示すデジタイザシステムと共に使用される。説明を容易にするため、ここでは、記載する本発明が適用可能な全てのデジタイザパッドを示すために“クロスパッド”なる用語が使用されている。当業者であれば、本システム及び方法が、フォームをデジタイザ領域に配置することができるような如何なるデジタイザシステムにも適用可能であることを認識することができるであろう。更に、本説明においては“フォーム”なる用語は、用紙上に印刷されたフォームを示すために使用されているが、当業者であれば、開示されるシステム及び方法が他の媒体で具現化されるフォームにも等しく適用可能であることを認識することができるであろう。例えば、ここで開示される発明は、カリフォルニア州、パロアルトのゼロックス社により開発された“Gyricon”なる製品又はマサチューセッツ州、ケンブリッジのEインク社により開発された類似の製品のようなプラスチックラミネート上のフォーム、即ち“電子用紙”に対しても動作する。
【0017】
図1に示すデジタイザシステムの概略動作は次の通りである。即ち、予め印刷されたデータ収集用フォーム45がクロスパッドデジタイザ35上に載置される。ユーザは、該クロスパッド35により必要とされる特別なペンを使用してフォーム45にマークを記入する。フォーム45上に記入された上記マークは、クロスパッド35によりデジタル化された画像として記録される。ユーザは、該クロスパッド35をコンピュータ25に接続し、クロスパッド35は記憶した上記画像をコンピュータ25に送信する。他の実施例においては、当該クロスパッドはクロスパッドデータをインターネット準拠フォーマットに変換するような変換器に接続され、変換されたクロスパッドデータが該変換器によりインターネットを介して遠隔コンピュータに送信される。何れの実施例においても、コンピュータ25上の記憶されたクロスパッドデータは、次いで、コンピュータに記憶されたソフトウェアにより処理される。好ましい実施例において使用されるフォーム及びソフトウェアを以下に説明する。
【0018】
図2は、好ましい実施例において使用される第1のデータ収集用フォーム45を図示している。該フォームの左余白における領域210はフォームの識別のために確保されている。“ここから開始”なる命令225は、フォーム識別子のための指示子230が記入されるべきことをユーザに気付かせる(円が指示子であり、該円に記入されるマークがフォーム識別子となる)。各々の異なるフォームに対して、フォーム識別子指示子230は領域210内の異なるゾーンに配置される。
【0019】
好ましい実施例において使用されるフォームは、これらフォームが1以上のデータ入力システムにおいて使用することができるように印刷されている。例えば、このフォームの右下部及び左上部における十字線像215及び220は、該フォームが光学スキャナにより走査入力される場合に、該フォームの画像を位置合わせするために使用される。
【0020】
図3は、好ましい実施例において使用される第2のデータ収集用フォームを図示している。図3のフォームは、好ましい実施例において使用されるフォームの外観を一層明瞭に示すために参照符号なしで図示されている。図3におけるフォーム上のフォーム識別子指示子が、領域210における図2に示したフォーム上のフォーム識別子指示子230とは異なるゾーンに配置されていることに注意されたい。
【0021】
ユーザは、好ましくは、フォーム上に書き始める毎にフォーム識別子指示子に記入するようにする。しかしながら、誤りを減らすために、第1のユーザはクロスパッドを第2のユーザに手渡す前に複数の指示子に記入するほうをとるかも知れない。例えば、第1のユーザは全てのフォームに対する指示子を有するようなテンプレートを使用することができる。フォーム1、3及び6が使用されるべき場合、該第1のユーザはクロスパッド上に上記テンプレートを載置してフォーム1用の指示子を記入し、該クロスパッド上の次頁釦を押し、フォーム3用の指示子を記入し、次頁釦を再び押し、フォーム6用の指示子を記入する。次いで、該第1のユーザは前頁釦を2回押し、フォーム1、3及び6がクリップ留めされたクロスパッドを第2のユーザに手渡す。この場合、第2のユーザは適切なフォーム識別子指示子に記入することを要さずに、フォーム1、3及び6に記入することができる(もっとも、該第2のユーザは、フォームからフォームへ進む際、依然として次頁及び前頁釦が押される必要はある)。
【0022】
図4は、好ましい実施例に使用されるソフトウェアの動作を示すフローチャートである。フォーム識別子指示子230が当該クロスパッド35のユーザにより書き込まれると、該フォーム識別子の像及び位置が、ユーザにより当該フォーム上に記入された全ての他の情報の像及び位置と共に、該クロスパッドのメモリに記憶される。該クロスパッドは、この情報をIBMの所有権データフォーマットである“インクデータ”として記憶するが、該データを記憶するには如何なる好適なフォーマットも使用することができる。このデータは、ここでは広くインクデータと呼ぶ。
【0023】
ステップ410において、ユーザは、当該クロスパッドをパーソナルコンピュータに接続された直列接続ケーブル(赤外線、イーサネット又は他の接続装置を使用することもできる)にプラグ接続すると共に、該クロスパッド上の釦を押下することにより、上記の収集されたインクデータを上記パーソナルコンピュータにアップロードする。他の実施例においては、上記インクデータは先ず変換器に伝送され、次いで該変換器が当該データを好ましくはインターネットを介して遠隔地のコンピュータに伝送する。該遠隔地のコンピュータはパーソナルコンピュータとすることもできるが、好ましくはサーバ級のコンピュータ(例えば、インターネットサーバ)とする。何故なら、該コンピュータは複数のソースからデータを受信するであろうからである。
【0024】
ステップ412において、当該パーソナルコンピュータに記憶されたインク伝送プログラムが上記の送信されたインクデータを受信し、ステップ415において該データを当該コンピュータのハードドライブにインクデータファイルとして保管する。好ましい実施例においては、当該クロスパッドと共に供給されるIBMのインクマネージャ伝送プログラムが該ステップを実行し、“ノートブック”として知られているファイルを生成する。
【0025】
上記インクデータファイルがアップロードされた後、上記インク伝送プログラムはステップ417においてインク変換器プログラム(TMDInkExecと呼ぶ)を開始する。ステップ420において、TMDInkExecプログラムは上記のアップロードされたインクデータファイルを読み取り、各インク頁を、IBMにより供給されるライブラリに含まれるインク変換モジュール、IBM電気インクSDKを呼び出すことにより非所有権画像ファイル(グループ4TIFFのような、もっとも他のフォーマットを使用することもできる)に変換する。TMDInkExecは適切なインク変換モジュールを、IBM電気インクSDKに含まれる文書に含まれる命令に従って呼び出す。他の実施例においては、ノートブックフォーマットから非所有権画像フォーマットへのステップ420における上記変換は、遠くに配置されたコンピュータによっても生じさせることができる。即ち、上記インクデータは遠隔コンピュータに例えばEメイル又はファイル転送プロトコルにより転送され、次いで該遠隔コンピュータ(又は複数のコンピュータ)は複数の受信行列(例えば、Eメイルボックス)をポーリングすると共に、ステップ420を実行して、受信されたインクデータのバッチを処理する。
【0026】
ステップ420が完了すると、TMDInkExecプログラムはステップ422において第2のプログラム、TMDInkMonitorに上記TIFFデータを更に処理するように通知する。TMDInkMonitorプログラムはステップ424において、ユーザが当該インクデータファイルにおける頁のバッチに対する主題IDをオプション的に割り付けるか又は確認するために(例えば、これら頁が特定の医療患者に関して記入されたフォームである場合、該患者のIDが入力される)、グラフィックインターフェースを表示する。クロスパッドの代わりにスキャナが使用される場合は、主題IDラベルが当該フォームに貼付されると共に認識され、認識された番号を当該システムにより割り付けることができる。主題IDがユーザにより割り付けられない場合(且つ、当該クロスパッドにより記録もされていない場合)、TMDInkMonitorプログラムはデフォルトの主題ID(好ましくは、1だけ増加された前の主題ID)を割り付ける。
【0027】
ステップ426では、バッチアップロードIDが対応するTIFF画像ファイルのバッチに割り当てられ、ステップ428においては、該TIFFデータが上記バッチアップロードID及び主題IDの両者の下でデータベースに書き込まれる。次いで、該データベースから上記TIFF画像ファイルのコピーが取られ、ステップ430において認識エンジンにより処理され、該エンジンは、これら画像をOMR(光学マーク読取、又は光学マーク認識)技術を適用することにより認識データに変える。認識エンジンは、ドキュメント化された一連のサービスを、画像データのコンピュータ読取可能なテキストへの変換(認識)に関連する他のソフトウェアモジュール又はプログラムに提供するソフトウェアである。好ましい実施例においては、カリフォルニア州、ロスガトスのケア(Caere)・コーポレーションにより販売されているケア開発者用キット2000認識エンジンが使用されるが、多数の認識エンジンが市販されており(例えば、カリフォルニア州、サンジエゴのMitekシステムズ・インク及びミネソタ州、ミネアポリスのナショナル・コンピュータ・システムズ・インク等から)、当業者により好ましい実施例に使用することもできる。
【0028】
ステップ432においてTMDInkMonitorはフォームID決定モジュールを呼び出し、該モジュールは上記の認識されたデータに対応するフォームIDを導出する。該フォームID決定モジュールにより実行されるステップは図5及び図6に示されている。
【0029】
フォームID決定モジュールは、OMR認識モジュールとOMR記入(filling)方法とを使用する。認識モジュールは、認識エンジンの仕様に従うと共に、異なる型式の画像データをコンピュータ読取可能なテキストに変換するソフトウェアである。記入方法は、ゾーン内に現れることが予測される画像データの型式を特定する。幾つかの記入方法は固有の認識モジュールに関連され、他のものは2以上のものによりサポートされる。記入方法の幾つかは、複数フォント機械印刷、OMR、手書き(hand−print)、バーコード、ドットマトリクス印刷、OCRA及び点字である。
【0030】
ゾーンは、画像内の全頁サイズまでの領域であって、ユーザにとり重要な特徴を含む領域である。好ましい実施例においては、ゾーンは長方形であるが、当業者であれば異なる形状のゾーンも使用することができることを認識するであろう。ゾーンによりカバーされる画像データは別個に扱われ且つ処理される。一般的なゾーン型式は、グラフィック的(認識しない)、テキスト的、及びバーコード又はOMR等の他のものである。ゾーン領域内の画像データの認識を容易にするために、各ゾーンには当該ゾーンが含むであろう予測情報に基づいて特性(プロパティ)が割り当てられる。基本的ゾーン特性は、x−y座標、サイズ、認識モジュール、フィルタ、言語辞書及びユーザ辞書である。言語辞書は、言語の語彙要素に、これら要素から語を発生するための規則を加えたものを含むファイルである。該ファイルは、認識されるテキストにおける非辞書語に印を付し、又は非辞書語を許容可能な語に変更するために使用することができる。幾つかの認識モジュールは、認識判断をするのを補助するために言語辞書を参考にする。ユーザ辞書は、語、文字列及び文字パターンを規定する規則的な表現のリストを含み、上記言語辞書ファイルの内容を補足する。1以上のユーザ辞書を特定のゾーンに関連付けることができる。ユーザ辞書における規則的な表現は、認識精度を向上させるために、ゾーン内の1以上の文字位置に対して有効な文字分類、範囲又は個々の文字を特定することにより、文字の許容されるパターンを規定する。規則的な表現は、マスク又はパターンとも呼ばれる。規則的な表現は、通常、フォームのような状況において、ゾーンの内容が何とか予測可能である場合に使用される。
【0031】
画像からフォームを識別する場合に、フォーム識別ゾーンテンプレート(又はFIZT)が使用される。ゾーンテンプレートは、後の取り出し及び処理のために、指定され且つディスクファイル又はデータベース記録等の媒体に記憶される一群のゾーン及び頁特性(例えば、認識されるべきフォームに対応する)である。FIZTは、グリッドパターンで配列される一群のゾーンからなる(図7参照)。認識結果を改善するために、ゾーンのレベル又はフォームのレベルの何れかにおいてフィルタを適用することができる。フィルタは、或る分類の文字を可能性のある有効な結果と見なされることから除外するための仕様である。フィルタの例は、十進数のみ、大文字、小文字、及び句読点を含む。
【0032】
本発明はOMR技術を使用するので、以下の好ましい実施例においては、非標準記号(記号
【0033】
【数1】
Figure 2004504650
と同様に、円で囲まれたNのような)がフォーム上の関連情報を示すために使用される。斯様な関連情報の例は次のものを含む。即ち、切り取り/貼り付け領域、訂正されることを要する情報、及び他のデータファイルに対する参照等である。
【0034】
フォーム認識用のゾーンは、図7に陰影が付けられた番号により示されるように左から右及び上から下へと配列されている。各ゾーンは、当該フォームが属する群におけるフォーム番号に対応する。ゾーンは、記入者が円の外側にマークを付すことにより、又はフォームがスキャナ入力される場合の傾きにより生じる誤ったフォーム識別の可能性を最小化するために、各ゾーン間に充分な間隔を設けて配列されている。群内の各フォームには、そのフォーム番号に対応するゾーンが割り当てられ、未記入のドットがフォーム頁上の割り当てられたゾーン内に予め印刷されている(図2及び図3参照)。各ゾーン、従って各ドットには番号が割り当てられる。テーブル(“ドットマップ”)が、フォームの群内のフォーム番号にドット番号をマップする。ドットマッピング用の例としてのテーブルは次のようなものである。
【0035】
【表1】
Figure 2004504650
上記“ドットマップ”は、後の取り出しのために、データベーステーブル又はディスクファイル等の記憶媒体に記憶される。
【0036】
図5を参照すると、ステップ510においてフォームID決定モジュールは、マーク感知ゾーンから認識されたデータを取り込む。ステップ520において、最初に記入されたドット及び対応するゾーンの検索がなされ、ステップ530において、そのドット番号がゾーン定義から決定される。ステップ540において、上記ドット番号に基づいてドットマッピングテーブルから対応するフォームID番号が取り込まれる(例えば、上記テーブルにおいては、ドット番号“1”はフォームID番号“00300001−01”に対応する)。ステップ545において、フォームID番号が決定されていなかったら、ステップ550において当該頁のインクデータに基づく画像がユーザに対して表示され、ステップ555において、ユーザは適切なフォームID番号を入力するよう促される。ステップ560において、ユーザはフォームID番号を入力する。好ましい実施例はフォームを識別するために番号を使用しているが、当業者であれば、英数字又は他の記号も使用することができることを認識するであろう。図5に示した処理は、図14に幾らかより詳細に示されている。
【0037】
図6を参照すると、フォームID番号が当該システムにより決定されるか又はユーザにより入力されるかの何れかの後、ステップ645が実行される。ステップ645において、当該データが更に上記フォームID番号に基づいて認識され(例えば、知的文字認識のために光学文字認識、又は(ICRとしても知られる)ハンドプリント認識を適用して;好ましい認識方法は図12に示されている)、ステップ650において、上記の認識されたデータ及び当該画像が書かれたフォームのID番号がデータベースに未監査ファイルとして記憶される。上記認識されたデータは、当該フォームの分類に従って編成され、オプションとしてユーザの監査スクリーン上に表示される。該データは、監査のために便利な、表のようなフォーマットで表示される。ステップ660において、ユーザは該監査用スクリーン上の各認識データ要素を、任意選択的に監査し、検証し及びもし適切ならば訂正する。好ましい実施例においては、グラフィック・ユーザ・インターフェース(GUI)810(図8参照)が、ユーザが該データを“前後状況的適応”状態で見るのを可能にする。即ち、例えば何らかのデータが認識されなかった場合、ユーザは当該紙フォームの一部の画像を、当該頁のインクデータの画像が該紙フォームの画像上に重ねられるようにして表示されるようにすることができ、これにより、ユーザに記入された紙フォームの一部のオンスクリーン画像を提示することができる。これは、記入されたフォームが無くてもユーザがデータ要素を監査及び検証するのを可能にすると共に、紙フォーム上に書かれた全ての画像を見ることを可能にする。これは、更に、操作者が、当該紙フォームが書き込まれた場所から遠くに位置する場所において監査及び検証をすることを可能にする。更に、当該データが例えば医療報告である場合、フォーム上の手書きの前後状況的に適応されたオンスクリーン視認は、ユーザが該報告が書かれた際の書き手の雰囲気及び患者の個性を再現するのを可能にする。
【0038】
ステップ665において、監査されたデータはデータベースに保管される。
【0039】
図9は、好ましいフォーム位置合わせ処理の概要を示している。ステップ910において、図5及び図6並びに関連説明で示したフォーム識別処理が、実行される。ステップ915において、もしフォーム識別ステップ910が不成功であった場合は、フォーム位置合わせ処理はステップ920において終了し、該フォームは“未知”と印される。
【0040】
フォーム識別ステップ910が成功した場合は、ステップ925において、インクバブル中心突き止め処理(図10及び11、並びに関連説明参照)がインク画像バブルに対して実行される。このステップの結果、該インク画像バブルの座標(XInkCenter、YInkCenter)の計算がなされる。
【0041】
ステップ925に続いて、基準バブルと上記インク画像バブルとの間のオフセット(XOffset、YOffset)が計算される。即ち、XOffset=XInkCenter−XMast;YOffset=YInkCenter−YMastとなる。XMast及びYMastは図10にX0及びY0により各々示されている。
【0042】
ステップ940において、インク位置合わせが実行される。即ち、XOffset値及びYOffset値が当該インク画像に適用され、該画像がそれに応じてシフトされる(ずらされる)。
【0043】
ステップ950においては、該位置合わせされたインク画像が認識される(図12及び関連説明参照)。最後に、ステップ960において、該認識され、位置合わせされたインク画像が前記基準画像(識別されたフォームの記憶画像)と併合される。
【0044】
図10は、好ましいインクバブル中心突き止め処理に使用される座標及びゾーンの定義を示し、図11は該処理のステップを示している。
【0045】
図10を参照して、図示の座標系は下方向に増加するy座標を有している。基準検索ゾーン1020は、前記の識別されたフォーム及びフォーム識別ゾーンテンプレートにより決定される。当該フォームは識別されているので、(XInk、YInk)に中心を持つバブルインク円1030は特定の基準バブルゾーン1010内で発見されている。基準バブルゾーン1010は、基準バブルが基準バブルインクゾーン1010の中心でもある中心(X0、Y0)を有するようなものである。基準検索ゾーン1020は、バブルインクゾーン1010を水平の各方向(左右に)距離Xexpandだけ、及び垂直の各方向(上下に)距離Yexpandだけ拡張することにより定義される。
【0046】
このように、基準検索ゾーン1020は、角部が座標(X1、Y1)(左上角部)、(X2、Y1)(右上角部)、(X2、Y2)(右下角部)及び(X1、Y2)(左下角部)を有するような長方形である。
【0047】
インクバブル中心突き止め処理が図11に示されている。ステップ1105において、変数が初期化される。BubbleZoneLeftはバブルゾーン1010の左側のx座標である。BubbleZoneRightはバブルゾーン1010の右側のx座標である。BubbleZoneTopはバブルゾーン1010の上側のy座標である。BubbleZoneBottomはバブルゾーン1010の下側のy座標である。そして、変数YScanはY1に設定される。
【0048】
変数YTop、YBottom、XLeft及びXRightは、各々、Y2、Y1、X2及びX1に初期設定される。当該インクバブル中心突き止め処理の最後において、変数YTopはバブルインク1030の頂部のy座標の値を含み、YBottomはバブルインク1030の底部のy座標の値を含み、XLeftはバブルインク1030の左側のx座標の値を含み、そして、XRightはバブルインク1030の右側のx座標の値を含むであろう。この処理は、バブルインク1030が完全な円盤でなくても、該処理がバブルインク1030の“中心”を決定するであろうという意味で強靱である。
【0049】
ステップ1110において、変数XScanはX1に設定される。ステップ1115において、黒のピクセルが(Xscan、YScan)(初期には、(X1、Y1)、即ち基準検索ゾーン1020の左上角部にある)に位置しているかがチェックされる。答えがノーの場合、ステップ1160において変数XScanが増加(インクリメント)される。ステップ1165において該値がチェックされる場合に、上記増加がX2より大きな値となっていない場合(即ち、当該走査が基準検索ゾーン1020の右側に到達していない場合)、ステップ1115が繰り返される。ステップ1165において、変数XScanのステップ1160における増加の結果XScanがX2より大きな値を有している場合は、ステップ1170において変数YScanが増加される。ステップ1175においてYScanの値がチェックされる場合に、YScanの値がY2より大きい場合、ステップ1180においてXInkCenter及びYInkCenterが計算される。ステップ1175においてYScanの値がY2より大きくない場合は、ステップ1110が繰り返される。当該ソフトウェアは、基準検索ゾーン1020を介して左から右へ、上から下へと走査する。
【0050】
ステップ1115における答えがイエスの場合、ステップ1120において、変数YScanの現在の値がYTopの現在の値より小さいかがチェックされる。もしイエスなら、ステップ1125においてYTopがYScanに等しく設定される。このようにして、バブルインク1030の頂部が発見され、該頂部のy座標がYScanの現在値として決定される。ステップ1130は、ステップ1120の答えがノーの場合に該ステップ1120に後続し、ステップ1120の答えがイエスの場合は、ステップ1125に後続する。
【0051】
ステップ1130においては、XScanの現在の値がXLeftの現在の値より小さいかがチェックされる。この答えがイエスの場合、ステップ1140においてXLeftがXScanに等しく設定される。ステップ1145は、ステップ1130における答えがイエスの場合にステップ1140に後続し、ステップ1130の答えがノーの場合に該ステップ1130に後続する。
【0052】
ステップ1145において、XScanがXRightより大きいかがチェックされる。この答えがイエスの場合、ステップ1150においてXRightがXScanに等しく設定される。ステップ1155は、ステップ1145における答えがノーの場合に該ステップ1145に後続し、ステップ1145における答えがイエスの場合にステップ1150に後続する。ステップ1155において、YBottomがYScanに等しく設定される。前述したステップ1160がステップ1155に後続する。当該処理が継続するにつれて、YTopの値はバブルインク1030内の最上端のピクセルのy座標の値を反映するまで減少し、YBottomの値はバブルインク1030の最下端のピクセルのy座標の値を反映するまで増加し、XLeftの値はバブルインク1030の最左端のピクセルのx座標の値を反映するまで減少し、XRightの値はバブルインク1030の最右端のピクセルのx座標の値を反映するまで増加する。このように、ステップ1180に最後に到達した場合に、XInkCenter(=(Xleft+XRight)/2)及びYInkCenter(=(YTop+YBottom)/2)の計算は、バブルインク1030が真の円盤を形成する場合には正確にバブルインク1030の中心の位置を決定し、何れの場合にもバブルインク1030の中心を合理的に近似するであろう。バブルインク1030の中心を決定する該方法は好ましい実施例であるというだけであって、添付請求項に記載される本発明の範囲を限定しようとするものではない。当業者であれば、不規則な形状の二次元物体の中心を決定する方法であって、開示された本発明の範囲から逸脱することなく上記方法を置換し得るような種々の既知の方法が存在することを認識することができるであろう。
【0053】
図9に戻り、ステップ930において、インクバブル1030と基準バブル(中心(XMast、YMast)を持つ)との間のオフセットが、XOffset=XInkCenter−XMast及びYOffset=YInkCenter−YMastなる式を用いて計算される。これらXOffset及びYOffsetの値は、次いで、当該インク画像をずらすために適用される。例えば、XOffsetが正で、YOffsetが負の場合、該インク画像は距離|XOffset|だけ左にずらされ、距離|YOffset|だけ下方にずらされる。
【0054】
好ましくは、距離はピクセル数で測定されるようにする。このように、好ましい実施例においては、当該インク画像は|XOffset|ピクセルだけ水平方向に移動され、|YOffset|ピクセルだけ垂直方向に移動される。下記のC++コードはインク画像のシフトを実行する好ましい方法を示す:
Figure 2004504650
Figure 2004504650
Figure 2004504650
Figure 2004504650
インクピクセルは、ロードされたインクをプログラム的に作成された白頁の“零”画像と併合することによりオフセットされる。ピクセル結果を255(白)の最大値に設定するビット毎の加算アルゴリズムが、ピクセルを併合するために使用される。下記のコードが、この演算を実行する:
CombineBitmapPixels(&bmPWhitePage, //作成された“白頁”ピクセルデータ構造(結果の宛先でもある)
Figure 2004504650
インク画像が一旦ずらされたら(位置合わせされたら)、OMR及びOCR処理が生じ、ステップ950において、位置合わせされた画像が認識される。
【0055】
図12は、好ましいインク画像認識処理を示す。ステップ1210において、フォーム用のフィールド定義ファイルがロードされる。ステップ1220において、インク画像がメモリにロードされる。ステップ1230において、上記フィールド定義ファイル及び画像は、認識のために認識エンジンに渡され、ステップ1240において、認識された結果がデータベースに保管される。
【0056】
図9に戻ると、ステップ960において、位置合わせされ、認識されたインク画像は、識別された(空白)フォームの基準画像と位置合わせされる。この処理が図13に示されている。ステップ1310において、上記フォームの基準画像がメモリにロードされる。ステップ1320において、当該インク画像がメモリにロードされる。
【0057】
ステップ1330において、上記インク画像は上記基準画像と併合される。この場合、インクピクセルは基準画像ピクセルと、ピクセルを併合するためのビット毎ORアルゴリズムを用いてプログラム的に併合される。下記のコードが該演算を実行する:
CombineBitmapPixels( &bmpInk, //ロードされたインクピクセルデータ構造(結果の宛先でもある)
Figure 2004504650
最後に、ステップ1340において、併合された画像はディスク又は他の記憶媒体に保管される。
【0058】
図14は、好ましい実施例のフォーム識別処理を示している。この処理の幾つかは図5にも示されている。ステップ1410において、フォーム群フォームIDゾーン定義ファイルがメモリにロードされる。ステップ1420においては、インク画像がメモリにロードされる。ステップ1425において、認識エンジンが呼び出され、上記のロードされたゾーン定義及びインク画像が使用される。ステップ1430においては、変数FormIDが1に等しく設定される。ステップ1435において、該FormIDの認識結果における文字が1に等しいかがチェックされる。もしそうなら、フォームが識別され、当該処理はステップ1450において終了する。もしそうでないなら、ステップ1440が実行され、該ステップにおいてFormIDが増加(インクリメント)される。ステップ1445においては、FormIDが当該フォーム群におけるフォーム数より大きいかがチェックされる。もしそうなら、当該処理はフォームが識別されないままステップ1455で終了する。もしそうでないなら、当該処理はステップ1435に戻る。
【0059】
本発明の他の実施例においては、印刷されたフォーム指示子を持たないような事前印刷されたフォームが使用される。斯様なフォームの使用を可能にするために、好ましくは金属又はプラスチックのテンプレートがデジタイザパッドに取り付けられる。該テンプレートは、型紙(図15参照)として機能する。即ち、ユーザはガイド内の孔に記入し、各孔は異なるフォームに対応する。このようにして、上述したフォーム識別処理は、予め印刷されたフォーム指示子を持たないようなフォームに適用される。
【0060】
好ましい実施例においては、図15に図示するような構造が使用される。該テンプレートは、好ましくは、デジタイザパッド(好ましくはクロスパッド又はその派生物)上の側部用紙ガイド(図16参照、該図は左側に3つの側部用紙ガイド1610を備えるデジタイザパッドを示している)上に嵌るプラスチック製上敷き1510とする。該テンプレート1510は、好ましくは、上記デジタイザパッド上の3つの突出した用紙ガイド上に嵌るのを可能にするような3つのスロット1530を有するものとする。当業者であれば、他の取り付け方法が他の構造のデジタイザパッドに代用されるであろうことを認識することができるであろう。例えば、デジタイザパッド上に単一の突出用紙ガイドしかなく、該ガイドが当該デジタイザパッドの右側にある場合は、テンプレート1510は自身の右側に沿って単一のスロットを有するであろう。
【0061】
図15に示す好ましい実施例に戻ると、3つのスロット1530は約48mm(±2mm)離隔し、1mm幅であり、テンプレート1510の左縁から5mmであり、且つ、約48mm(±1mm)長である。最上端スロット1530の頂部は、好ましくは、テンプレート1510の頂縁から15mmにあり、最下端スロット1530の底部はテンプレート1510の下縁から好ましくは15mmにある。
【0062】
テンプレート1510自体は、約2mm厚であり、273mm長であり、且つ、27mm幅である。各フォーム指示子バブル1520は、好ましくは、直径が2.5mmであり、バブル1520間の最小の好ましい距離は4mmである。
【0063】
以上、図示及び説明した各実施例は本発明の目的を完全に達成することができるが、これら実施例は解説の目的のみで示されてもので、限定を目的として示されたものではないと理解されるべきである。例えば、クロスパッドは、ユーザが昇頁釦及び降頁釦を繰り返し押さねばならないのに代えて、頁から頁へと(例えば、頁14から直接頁3へ)スキップすることができるように、容易に修正することができる。
【図面の簡単な説明】
【図1】
図1は、好ましいデジタイザシステムの好ましい実施例の構成要素を示す。
【図2】
図2は、本発明の好ましい実施例において使用されるデータ収集用フォームを示す。
【図3】
図3も、本発明の好ましい実施例において使用されるデータ収集用フォームを示す。
【図4】
図4は、デジタル化されたデータを処理するソフトウェアの動作を示すフローチャートである。
【図5】
図5は、フォーム認識ソフトウェアの動作を示すフローチャートである。
【図6】
図6も、フォーム認識ソフトウェアの動作を示すフローチャートである。
【図7】
図7は、本発明の好ましい実施例において使用されるゾーンの配置を示す。
【図8】
図8は、本発明の好ましい実施例において使用されるグラフィック・ユーザ・インターフェースを示す。
【図9】
図9は、好ましい実施例において使用される主フォーム位置合わせ処理のステップを示す。
【図10】
図10は、好ましい実施例において使用される座標の定義を示す。
【図11】
図11は、好ましい実施例のインクバブル中心突き止め処理を示す。
【図12】
図12は、好ましい実施例の位置合わせ画像認識処理を示す。
【図13】
好まし実施例の位置合わせインク/基準画像併合処理を示す。
【図14】
図14は、好ましい実施例のフォーム識別処理を示す。
【図15】
図15は、好ましい実施例のフォーム識別子テンプレートを示す。
【図16】
図16は、3つの側部用紙ガイドを備えるデジタイザパッドを示す。
【符号の説明】
25:パーソナルコンピュータ
35:デジタイザ
45:予め印刷されたフォーム
230:フォーム識別子指示子
1010:基準バブルゾーン
1020:基準検索ゾーン
1030:バブルインク
1510:テンプレート
1520:フォーム指示子バブル
1530:スロット
1610:用紙ガイド

Claims (57)

  1. 予め印刷されたフォームの自動化識別のための方法において、
    (a)予め印刷されたフォーム上に手書きされたマークの位置を記述するデータを受信及び記憶するステップと、
    (b)前記マークの位置に基づいて前記フォームを識別するステップと、
    を有していることを特徴とする方法。
  2. 請求項1に記載の方法において、ステップ(a)において受信及び記憶される前記データは、コンピュータにより受信され且つコンピュータ記憶媒体に記憶されるデジタル化画像データであることを特徴とする方法。
  3. 請求項2に記載の方法において、ステップ(b)は、前記マークの前記位置を含むフォーム識別ゾーンを決定するステップと、該フォーム識別ゾーンに対応するフォームを決定するステップとを有していることを特徴とする方法。
  4. 請求項3に記載の方法において、ステップ(b)は、フォーム識別ゾーンをフォームIDと突き合わせるテーブルを記憶するステップを有していることを特徴とする方法。
  5. 請求項4に記載の方法において、ステップ(b)は、
    受信されたデジタル化画像データを、認識エンジンにより処理されるべきフォーマットに再フォーマット化するステップと、
    前記再フォーマット化されたデジタル化画像データを、該再フォーマット化された画像データを前記認識エンジンで処理することにより認識されたデータに変換するステップと、
    1以上のフォーム識別ゾーンに関する認識されたデータを取り込むステップと、
    前記取り込まれた認識されたデータを検索して、前記マークを含むゾーンを見付けるステップと、
    前記ゾーンをフォームIDと突き合わせることにより前記フォームを識別するステップと、
    を更に有していることを特徴とする方法。
  6. 請求項5に記載の方法において、デジタル化画像データをコンピュータモニタ上に表示して、画像が書かれた当該フォームをユーザが手により識別するのを可能にするようなステップを更に有していることを特徴とする方法。
  7. 請求項6に記載の方法において、認識されたデータをユーザのコンピュータモニタ上に監査に便利なフォーマットで表示するステップを更に有していることを特徴とする方法。
  8. 請求項7に記載の方法において、デジタル化画像データを前記識別されたフォームの画像に重畳された形態で表示して、前記フォームと該フォーム上に書かれた画像とのオンスクリーン画像を提示するようなステップを更に有していることを特徴とする方法。
  9. 請求項8に記載の方法において、前記認識されたデータを、該認識されたデータと前記識別されたフォームの画像上に重畳された前記表示されたデジタル化画像データとを比較することにより監査するステップを更に有していることを特徴とする方法。
  10. 予め印刷されたフォームの識別のためのシステムにおいて、
    (a)デジタイザと、
    (b)ユーザが1以上の識別マークを何処に記入すべきかを示す当該フォームに固有の1以上の予め印刷された指示子を有するような予め印刷されたフォームと、
    (c)データベースに結合されたコンピュータプロセッサであって、
    i)当該フォーム上に記入されたマークの1以上のデジタル化画像を受信し、
    ii)当該ユーザにより記入された1以上の識別マークの存在及び位置を識別し、
    iii)当該フォームを前記1以上のマークの位置に基づいて識別する、
    ようなコンピュータプロセッサと、
    を有していることを特徴とするシステム。
  11. 予め印刷されたフォームの自動化識別のためのコンピュータソフトウェアにおいて、
    (a)予め印刷されたフォーム上に手書きされたマークの位置を記述するデータを受信及び記憶するソフトウェアと、
    (b)前記マークの位置に基づいて前記フォームを識別するソフトウェアと、
    を有していることを特徴とするコンピュータソフトウェア。
  12. 請求項11に記載のコンピュータソフトウェアにおいて、フォーム識別ゾーンをフォームIDと突き合わせるテーブルを記憶するためのソフトウェアを更に有していることを特徴とするコンピュータソフトウェア。
  13. 請求項11に記載のコンピュータソフトウェアにおいて、前記受信及び記憶されるデータは、コンピュータ記憶媒体に記憶されるデジタル化画像データであることを特徴とするコンピュータソフトウェア。
  14. 請求項13に記載のコンピュータソフトウェアにおいて、後の参照のために前記デジタル化画像データを管理するソフトウェアを更に有していることを特徴とするコンピュータソフトウェア。
  15. 請求項14に記載のコンピュータソフトウェアにおいて、前記識別するソフトウェアは、前記マークの前記位置を含むフォーム識別ゾーンを決定するソフトウェアと、該フォーム識別ゾーンに対応するフォームを決定するソフトウェアとを有していることを特徴とするコンピュータソフトウェア。
  16. 請求項15に記載のコンピュータソフトウェアにおいて、前記識別するソフトウェアは、
    受信されたデジタル化画像データを、認識エンジンにより処理されるべきフォーマットに再フォーマット化し、
    前記再フォーマット化されたデジタル化画像データを、該再フォーマット化された画像データを前記認識エンジンで処理することにより認識されたデータに変換し、
    1以上のフォーム識別ゾーンに関する認識されたデータを取り込み、
    前記取り込まれた認識されたデータを検索して、前記マークを含むゾーンを見付け、
    前記ゾーンをフォームIDと突き合わせることにより当該フォームを識別する、
    ようなソフトウェアを更に有していることを特徴とするコンピュータソフトウェア。
  17. 請求項16に記載のコンピュータソフトウェアにおいて、デジタル化画像データをコンピュータモニタ上に表示して、当該画像が書かれたフォームをユーザが手により識別するのを可能にするようなソフトウェアを更に有していることを特徴とするコンピュータソフトウェア。
  18. 請求項17に記載のコンピュータソフトウェアにおいて、認識されたデータをユーザのコンピュータモニタ上に監査に便利なフォーマットで表示するソフトウェアを更に有していることを特徴とするコンピュータソフトウェア。
  19. 請求項18に記載のコンピュータソフトウェアにおいて、デジタル化画像データを前記識別されたフォームの画像に重畳された形態で表示して、当該フォームと該フォーム上に書かれた画像とのオンスクリーン画像を提示するようなソフトウェアを更に有していることを特徴とするコンピュータソフトウェア。
  20. 請求項19に記載のコンピュータソフトウェアにおいて、前記認識されたデータを、該認識されたデータと前記識別されたフォームの画像上に重畳された前記表示されたデジタル化画像データとを比較することにより監査するソフトウェアを更に有していることを特徴とするコンピュータソフトウェア。
  21. 請求項20に記載のコンピュータソフトウェアにおいて、フォーム上の関連情報を該フォーム上に書かれた非標準記号に基づいて認識するソフトウェアを更に有していることを特徴とするコンピュータソフトウェア。
  22. デジタル化画像データを処理する方法において、
    (a)デジタル化画像データを受信するステップと、
    (b)前記デジタル化画像データに含まれる第1マークの位置を決定するステップと、
    (c)前記第1マークの位置から基準位置までの距離及び方向を決定するステップと、
    (d)前記距離及び方向に基づいて、前記デジタル化画像データのシフトを実行するステップと、
    を有していることを特徴とする方法。
  23. 請求項22に記載の方法において、前記デジタル化画像データがデジタイザパッド上に載置されたフォーム上に印されたマークに対応することを特徴とする方法。
  24. 請求項23に記載の方法において、前記フォームは、識別マークが印されているゾーンの位置により識別されることを特徴とする方法。
  25. 請求項24に記載の方法において、前記第1マークが前記識別マークであることを特徴とする方法。
  26. 請求項25に記載の方法において、前記識別マークが概ね円形であることを特徴とする方法。
  27. 請求項25に記載の方法において、前記第1マークの前記位置が該第1マークの中心を突き止めることにより決定されることを特徴とする方法。
  28. 請求項26に記載の方法において、前記第1マークの前記位置が該第1マークの中心を突き止めることにより決定されることを特徴とする方法。
  29. デジタル化画像データを処理する方法において、
    (a)デジタル化画像データを受信するステップと、
    (b)前記デジタル化画像データに含まれる第1マークの位置を決定するステップと、
    (c)前記第1マークの位置から基準位置までの距離及び方向を決定するステップと、
    (d)前記距離及び方向に基づいて、前記デジタル化画像データのシフトを実行するステップと、
    (e)前記シフトされたデジタル化画像データを、該デジタル化画像データを認識エンジンを用いて処理することにより、認識された画像データに変換するステップと、
    (f)前記認識された画像データを基準画像と併合するステップと、
    を有していることを特徴とする方法。
  30. 請求項29に記載の方法において、前記デジタル化画像データがデジタイザパッド上に載置されたフォーム上に印されたマークに対応することを特徴とする方法。
  31. 請求項30に記載の方法において、前記基準画像が前記フォームの画像であることを特徴とする方法。
  32. 請求項31に記載の方法において、前記フォームは、識別マークが印されているゾーンの位置により識別されることを特徴とする方法。
  33. 請求項32に記載の方法において、前記第1マークが前記識別マークであることを特徴とする方法。
  34. 請求項33に記載の方法において、前記識別マークが概ね円形であることを特徴とする方法。
  35. 請求項33に記載の方法において、前記第1マークの前記位置が該第1マークの中心を突き止めることにより決定されることを特徴とする方法。
  36. 請求項34に記載の方法において、前記第1マークの前記位置が該第1マークの中心を突き止めることにより決定されることを特徴とする方法。
  37. 予め印刷されたフォームの自動化識別のための方法において、
    (a)予め印刷されたフォーム上に手書きされたマークの位置を記述するデータを受信及び記憶するステップであって、該マークがデジタイザパッドに取り付けられたテンプレートの孔に記入することにより印されるようなステップと、
    (b)前記マークの位置に基づいて前記フォームを識別するステップと、
    を有していることを特徴とする方法。
  38. 請求項37に記載の方法において、ステップ(a)において受信及び記憶される前記データは、コンピュータにより受信され且つコンピュータ記憶媒体に記憶されるデジタル化画像データであることを特徴とする方法。
  39. 請求項38に記載の方法において、ステップ(b)は、前記マークの前記位置を含むフォーム識別ゾーンを決定するステップと、該フォーム識別ゾーンに対応するフォームを決定するステップとを有していることを特徴とする方法。
  40. 請求項39に記載の方法において、ステップ(b)は、フォーム識別ゾーンをフォームIDと突き合わせるテーブルを記憶するステップを有していることを特徴とする方法。
  41. 請求項40に記載の方法において、ステップ(b)は、
    受信されたデジタル化画像データを、認識エンジンにより処理されるべきフォーマットに再フォーマット化するステップと、
    前記再フォーマット化されたデジタル化画像データを、該再フォーマット化された画像データを前記認識エンジンで処理することにより認識されたデータに変換するステップと、
    1以上のフォーム識別ゾーンに関する認識されたデータを取り込むステップと、
    前記取り込まれた認識されたデータを検索して、前記マークを含むゾーンを見付けるステップと、
    前記ゾーンをフォームIDと突き合わせることにより当該フォームを識別するステップと、
    を更に有していることを特徴とする方法。
  42. 請求項41に記載の方法において、デジタル化画像データをコンピュータモニタ上に表示して、画像が書かれたフォームをユーザが手により識別するのを可能にするようなステップを更に有していることを特徴とする方法。
  43. 請求項42に記載の方法において、認識されたデータをユーザのコンピュータモニタ上に監査に便利なフォーマットで表示するステップを更に有していることを特徴とする方法。
  44. 請求項43に記載の方法において、デジタル化画像データを前記識別されたフォームの画像に重畳された形態で表示して、前記フォームと該フォーム上に書かれた画像とのオンスクリーン画像を提示するようなステップを更に有していることを特徴とする方法。
  45. 請求項44に記載の方法において、前記認識されたデータを、該認識されたデータと前記識別されたフォームの画像上に重畳された前記表示されたデジタル化画像データとを比較することにより監査するステップを更に有していることを特徴とする方法。
  46. 予め印刷されたフォームの識別のためのシステムにおいて、
    (a)デジタイザと、
    (b)予め印刷されたフォームと、
    (c)前記デジタイザに取り付けられるテンプレートであって、前記フォームを識別するためにユーザが1以上の識別マークを記入すべき1以上の孔を有するようなテンプレートと、
    (d)データベースに結合されたコンピュータプロセッサであって、
    i)当該フォーム上に記入されたマークの1以上のデジタル化画像を受信し、
    ii)当該ユーザにより記入された1以上の識別マークの存在及び位置を識別し、
    iii)当該フォームを前記1以上のマークの位置に基づいて識別する、
    ようなコンピュータプロセッサと、
    を有していることを特徴とするシステム。
  47. 予め印刷されたフォームの自動化識別のためのコンピュータソフトウェアにおいて、
    (a)テンプレートの1以上の孔に記入することにより予め印刷されたフォーム上に手書きされたマークの位置を記述するようなデータを受信及び記憶するソフトウェアと、
    (b)前記マークの位置に基づいて前記フォームを識別するソフトウェアと、
    を有していることを特徴とするコンピュータソフトウェア。
  48. 請求項47に記載のコンピュータソフトウェアにおいて、フォーム識別ゾーンをフォームIDと突き合わせるテーブルを記憶するためのソフトウェアを更に有していることを特徴とするコンピュータソフトウェア。
  49. 請求項47に記載のコンピュータソフトウェアにおいて、前記受信及び記憶されるデータは、コンピュータ記憶媒体に記憶されるデジタル化画像データであることを特徴とするコンピュータソフトウェア。
  50. 請求項49に記載のコンピュータソフトウェアにおいて、後の参照のために前記デジタル化画像データを管理するソフトウェアを更に有していることを特徴とするコンピュータソフトウェア。
  51. 請求項50に記載のコンピュータソフトウェアにおいて、前記識別するソフトウェアは、前記マークの前記位置を含むフォーム識別ゾーンを決定するソフトウェアと、該フォーム識別ゾーンに対応するフォームを決定するソフトウェアとを有していることを特徴とするコンピュータソフトウェア。
  52. 請求項51に記載のコンピュータソフトウェアにおいて、前記識別するソフトウェアは、
    受信されたデジタル化画像データを、認識エンジンにより処理されるべきフォーマットに再フォーマット化し、
    前記再フォーマット化されたデジタル化画像データを、該再フォーマット化された画像データを前記認識エンジンで処理することにより認識されたデータに変換し、
    1以上のフォーム識別ゾーンに関する認識されたデータを取り込み、
    前記取り込まれた認識されたデータを検索して、前記マークを含むゾーンを見付け、
    前記ゾーンをフォームIDと突き合わせることにより当該フォームを識別する、
    ようなソフトウェアを更に有していることを特徴とするコンピュータソフトウェア。
  53. 請求項52に記載のコンピュータソフトウェアにおいて、デジタル化画像データをコンピュータモニタ上に表示して、当該画像が書かれたフォームをユーザが手により識別するのを可能にするようなソフトウェアを更に有していることを特徴とするコンピュータソフトウェア。
  54. 請求項53に記載のコンピュータソフトウェアにおいて、認識されたデータをユーザのコンピュータモニタ上に監査に便利なフォーマットで表示するソフトウェアを更に有していることを特徴とするコンピュータソフトウェア。
  55. 請求項54に記載のコンピュータソフトウェアにおいて、デジタル化画像データを前記識別されたフォームの画像に重畳された形態で表示して、当該フォームと該フォーム上に書かれた画像とのオンスクリーン画像を提示するようなソフトウェアを更に有していることを特徴とするコンピュータソフトウェア。
  56. 請求項55に記載のコンピュータソフトウェアにおいて、前記認識されたデータを、該認識されたデータと前記識別されたフォームの画像上に重畳された前記表示されたデジタル化画像データとを比較することにより監査するソフトウェアを更に有していることを特徴とするコンピュータソフトウェア。
  57. 請求項56に記載のコンピュータソフトウェアにおいて、フォーム上の関連情報を該フォーム上に書かれた非標準記号に基づいて認識するソフトウェアを更に有していることを特徴とするコンピュータソフトウェア。
JP2001552614A 2000-01-11 2001-01-09 フォーム認識及びデジタル化画像処理のための方法及びシステム Withdrawn JP2004504650A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US09/480,914 US6697056B1 (en) 2000-01-11 2000-01-11 Method and system for form recognition
US69228900A 2000-10-19 2000-10-19
US09/692,272 US6600482B1 (en) 2000-01-11 2000-10-19 Method and system for form recognition and digitized image processing
US09/692,291 US6707466B1 (en) 2000-01-11 2000-10-19 Method and system for form recognition and digitized image processing
PCT/US2001/000619 WO2001052519A1 (en) 2000-01-11 2001-01-09 A method and system for form recognition and digitized image processing

Publications (1)

Publication Number Publication Date
JP2004504650A true JP2004504650A (ja) 2004-02-12

Family

ID=27504249

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001552614A Withdrawn JP2004504650A (ja) 2000-01-11 2001-01-09 フォーム認識及びデジタル化画像処理のための方法及びシステム

Country Status (6)

Country Link
JP (1) JP2004504650A (ja)
CN (1) CN1429450A (ja)
AU (1) AU2001226366A1 (ja)
BR (1) BR0107575A (ja)
CA (1) CA2397151A1 (ja)
WO (1) WO2001052519A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007094686A (ja) * 2005-09-28 2007-04-12 Tatsuya Okino ケア情報管理システム
JP2014191662A (ja) * 2013-03-27 2014-10-06 Brother Ind Ltd 補正装置
JP2014211754A (ja) * 2013-04-18 2014-11-13 ブラザー工業株式会社 入力装置

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8150156B2 (en) * 2006-01-04 2012-04-03 International Business Machines Corporation Automated processing of paper forms using remotely-stored templates
JP4772888B2 (ja) * 2009-03-27 2011-09-14 シャープ株式会社 画像処理装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
JP6856220B2 (ja) * 2017-08-09 2021-04-07 株式会社DSi 計量システム、電子秤及び電子秤用マーカー
US10650072B2 (en) * 2017-10-30 2020-05-12 Facebook, Inc. System and method for determination of a digital destination based on a multi-part identifier
CN111753817B (zh) * 2020-06-28 2024-01-26 国网数字科技控股有限公司 信息处理的方法及装置、电子设备及计算机可读存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5213373A (en) * 1990-08-06 1993-05-25 Severino Ramos Mark position independent form and tallying method
US5555101A (en) * 1991-07-22 1996-09-10 Cardiff Software, Inc. Forms creation and interpretation system
US5317646A (en) * 1992-03-24 1994-05-31 Xerox Corporation Automated method for creating templates in a forms recognition and processing system
US5869789A (en) * 1997-01-27 1999-02-09 Educational Testing Service Image digitizer with page number detector and recorder

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007094686A (ja) * 2005-09-28 2007-04-12 Tatsuya Okino ケア情報管理システム
JP2014191662A (ja) * 2013-03-27 2014-10-06 Brother Ind Ltd 補正装置
JP2014211754A (ja) * 2013-04-18 2014-11-13 ブラザー工業株式会社 入力装置

Also Published As

Publication number Publication date
AU2001226366A1 (en) 2001-07-24
WO2001052519A1 (en) 2001-07-19
CN1429450A (zh) 2003-07-09
CA2397151A1 (en) 2001-07-19
BR0107575A (pt) 2005-01-11

Similar Documents

Publication Publication Date Title
US6707466B1 (en) Method and system for form recognition and digitized image processing
US6697056B1 (en) Method and system for form recognition
US6600482B1 (en) Method and system for form recognition and digitized image processing
US7639876B2 (en) System and method for associating handwritten information with one or more objects
US7236653B2 (en) System and method for locating document areas using markup symbols
US8732570B2 (en) Non-symbolic data system for the automated completion of forms
JP3962891B2 (ja) 文書画像処理装置、文書画像処理方法、及び記憶媒体
US20020107885A1 (en) System, computer program product, and method for capturing and processing form data
US8675260B2 (en) Image processing method and apparatus, and document management server, performing character recognition on a difference image
JP2010211466A (ja) 画像処理装置および画像処理方法及びプログラム
US7764923B2 (en) Material processing apparatus and method for grading material
EP1654610B1 (en) Method and system for identifying multiple questionnaire pages
JP2004258706A (ja) 帳票定義データ作成方法および帳票処理装置
JP5300534B2 (ja) 画像処理装置および画像処理方法及びプログラム
JP2003018393A (ja) 画像処理システム
US20220189186A1 (en) Image processing apparatus, image processing method, and non-transitory storage medium
US20060290999A1 (en) Image processing apparatus and network system
JP2004504650A (ja) フォーム認識及びデジタル化画像処理のための方法及びシステム
JP5878004B2 (ja) 複数文書認識システム及び複数文書認識方法
JP4309881B2 (ja) 身分証認識装置及び身分証認識方法
JP5906608B2 (ja) 情報処理装置及びプログラム
JP4741363B2 (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
KR20030011271A (ko) 폼 인식 및 디지털 이미지 처리 방법 및 시스템
JP6743401B2 (ja) 帳票設計・読取設定支援装置、帳票設計・読取設定支援方法、及び、光学文字認識システム
JP6435636B2 (ja) 情報処理装置及び情報処理プログラム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080401