JP3558493B2 - 用紙位置合わせ装置、用紙位置合わせ方法及び用紙位置合わせプログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents
用紙位置合わせ装置、用紙位置合わせ方法及び用紙位置合わせプログラムを記録したコンピュータ読み取り可能な記録媒体 Download PDFInfo
- Publication number
- JP3558493B2 JP3558493B2 JP15255797A JP15255797A JP3558493B2 JP 3558493 B2 JP3558493 B2 JP 3558493B2 JP 15255797 A JP15255797 A JP 15255797A JP 15255797 A JP15255797 A JP 15255797A JP 3558493 B2 JP3558493 B2 JP 3558493B2
- Authority
- JP
- Japan
- Prior art keywords
- small
- image
- small area
- comparison
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Description
【発明の属する技術分野】
本発明は、用紙の位置合わせ技術に関し、特に固定の情報とそれ以外の追加の情報の領域を含む帳票等の用紙上の情報をイメージ・スキャナ等でディジタル情報に変換し、光学式文字読取装置(OCR)等により文字コードに変換する場合や、固定の情報を含む帳票等に、新たに追加の情報を印字する場合の、用紙の位置合わせ装置、用紙位置合わせ方法及び用紙位置合わせプログラムを記録したコンピュータ読み取り可能な記録媒体に関する。
【0002】
一般に、会合の出欠調査等のように、固定の情報とそれ以外の追加の情報とを含む複数枚の用紙を多数の人に配付して必要箇所に必要情報を書き込んで貰い、回収後にOCRなどにより上記追加の情報を読み取ることが必要となることがある。この場合に、回収した用紙が熱等により伸縮していたり、イメージ・スキャナのオート・ドキュメント・フィーダ(ADF)を介して用紙を供給する際に斜めに供給されたり、用紙をイメージ・スキャナの用紙読み取り位置に配置しても蓋をした際にその読み取り位置から用紙がずれてしまう等のように、用紙が正確にイメージ・スキャナの用紙読み取り位置に配置されない場合がある。この場合に、上記追加の情報の用紙上の領域をOCRが正確に認識していないと、上記追加の情報を正確に読み取ることができない。このため、OCRが読み取った用紙のイメージの中から上記追加の情報の領域を見つけ出す、所謂「用紙位置合わせ」が必要である。
【0003】
【従来の技術】
従来の用紙位置合わせには、大きく分けて以下の3通りの方法がある。
第1の方法は、図28に示されるように、用紙上の情報をイメージ・スキャナによりディジタル・イメージ化する段階で背景を黒とすることにより、用紙端を検出し、上下または左右の用紙端の間隔や用紙端の傾き具合に基づいて用紙の伸縮や傾斜を推定し、用紙端からの距離によって追加情報領域の位置を特定する方法である。
【0004】
第2の方法は、用紙中に目印となる専用のマークを数カ所印刷し, OCRにより読み取ったイメージ中からその専用マークを検出することで用紙の伸縮と傾斜を推定し、同時に追加情報領域の位置を特定する方法である。
第3の方法は、罫線等の抽出し易い情報に着目して用紙中の図柄の中から、罫線などの情報を抽出し、抽出した罫線などの情報を追加情報領域に対応付けることにより追加情報領域の位置を特定する方法である。
【0005】
【発明が解決しようとする課題】
上記第1の方法によれば、黒背景機能を持つ普及型の廉価なOCRは少ないことに加え、用紙を斜めにコピーした場合に、紙端からの追加情報領域の位置がずれるとその位置を特定できないという問題がある。
上記第2の方法によれば、用紙に専用マークを印刷する必要が生じるのでその分だけ用紙の作成に手間がかかり、価格が高くなるという問題がある。
【0006】
上記第3の方法によれば、現状では安定して抽出できるのは罫線のみの場合が多いため, 罫線のない用紙は処理ができないという問題がある。
上記の問題点に鑑み, 本発明の目的は、上述の第2および第3の方法のそれぞれの問題点を補うかたち、即ち、用紙中の図柄の一部をそのまま、一種のマークとして取り扱うことにより、黒背景機能を持たないOCRでも用紙位置合わせを可能にし、且つ、専用マークを不要とし, さらに用紙中の罫線の有無に左右されずに用紙の位置合わせを可能にする、用紙位置合わせ装置、用紙位置合わせ方法及び用紙位置合わせ用記録媒体を提供することを目的とする。
【0007】
【課題を解決するための手段】
上記の目的を達成するために、本発明により提供されるものは、学習用紙上の固定情報を読み取って得られた画像から所定数の照合用小領域を選択し、選択された照合用小領域内の情報をメモリに格納し、固定情報と同一の情報を含む入力用紙上の情報を読み取って得られた画像と、メモリに格納されている照合用小領域内の情報とを照合することにより、照合用小領域内の情報と同一の情報を含む入力用紙上の小領域を検索し、検索された入力用紙上の小領域と照合用小領域との対応関係に基づいて、学習用紙の任意の位置に対応する入力用紙画像上の位置を決定し、選択されてメモリに格納された照合用小領域のうち、3つを頂点とする第1の三角形と、3つの小領域の図柄と一致する図柄を持つとして検索された入力用紙画像上の3つの小領域を頂点とする第2の三角形とのいずれか一方を基準三角形とし、該基準三角形に合同になるように他方の三角形を変形して第3の三角形を形成し、該第3の三角形の内部の図柄と基準三角形の内部の図柄が所定の評価値により一致と判定された場合にのみ、該小領域領域は正しく検索されたと判定するようにした、用紙位置合わせ装置、用紙位置合わせ方法および用紙位置合わせプログラムを記録したコンピュータ読み取り可能な記録媒体である。
【0008】
好ましくは、光電変換装置により読み取られた学習用紙上の画像からエッジ画像を抽出し、そのエッジ画像に基づいて照合用小領域として最適な小領域を選択する。
本発明により、用紙中の図柄の一部をそのまま、照合用マークとして取り扱うことにより、黒背景機能を持たないOCRでも用紙位置合わせが可能になり、且つ、専用マークが不要になり, さらに用紙中の罫線の有無に左右されずに用紙の位置合わせが可能になる。
【0009】
【発明の実施の形態】
図1(a)は本発明による用紙位置合わせの処理の概要を示す説明図である。同図に示されるように、本発明においては、まず、図の上段(辞書作成の段)に示されるように、未記入の学習用紙上の固定情報を光電変換装置により読み取って得られたデジタル画像から所定数の照合用領域を選択して辞書メモリに格納する。
【0010】
次に、図の下段(位置合わせの段)に示されるように、上記学習用紙と同一の情報を含み、且つ追加の情報用の領域に追加の情報を記入済の入力用紙上の情報を光電変換装置により読み取って得られたデジタル画像から辞書メモリに格納されている照合用小領域の画像と一致する画像を検索して、その検索された画像の位置と辞書メモリ内の照合用小領域の画像の位置との対応点リストを得る。
【0011】
そして図1(b)は、この対応点リストを用いて学習用紙画像上の任意の点に対応する入力用紙画像上の位置を推定する方法の例の説明図である。図の上段に示されるように、上記対応点リストは、学習用紙の画像中の位置(例えば、▲1▼(50、100)、▲2▼(50、230)、▲3▼(140、50))とそれに対応する入力用紙の画像中の位置(▲1▼′(60、90)、▲2▼′(40、220)、▲3▼′(150、60))との対応関係を表している。この対応関係により、図の下段に示されるように、学習用紙の画像上の任意の箇所(例えば▲4▼)は、例えば▲1▼→▲2▼のベクトルの定数倍と▲1▼→▲3▼のベクトルの定数倍を足したものにより表現できる。ここで用いた各定数を、入力用紙の画像上の各ベクトル(▲1▼′→▲2▼′および▲1▼′→▲3▼′)に適用すれば、学習画像上の▲4▼に対応する入力画像上の▲4▼′の位置を推定できる。これにより、例えば追加の情報用の領域に手書きで書き込まれた文字の認識など用紙中の任意の場所を読み取ろうとする用紙処理に必要な位置合わせが行える。
【0012】
図2は本発明による用紙位置合わせ装置の概略システム構成図である。同図において、1はイメージ・スキャナ、2はOCRソフトウエアを搭載するホストコンピュータ、3はディスプレイ、4は用紙の一例としての帳票である。
帳票4上の情報はイメージスキャナ1によりディジタル画像に変換され、そのディジタル画像はホストコンピュータ2に送られる。ホストコンピュータ2は入力されたディジタル画像を文字コードに変換する。この文字コードへの変換に際して、本発明によるOCRソフトウエアは、入力用紙の位置合わせを上記のように、又以下により詳細に説明するようにして行うことにより、入力帳票がイメージ・スキャナ1に対して斜めに入力されたり、入力帳票が伸縮したりしていても入力帳票上の書き込み領域を正確に判定するので、手書き文字を正確に認識することができる。
【0013】
図3は図2におけるホストコンピュータ2の構成例を示すブロック図である。図3に示すように、ホストコンピュータ2は、CPU5と、メモリ6と、ハードディスク7と、CD−ROMなどの外部記憶装置8とからなっている。本発明によるOCRソフトウエアは、ハードディスク7に格納してもよいし、外部記憶装置8に記憶させて必要に応じてメモリ6に読み込ませても、またモデム9を介して回線先のデータベースから必要に応じてメモリ6に読み込ませてもよい。
【0014】
図4は本発明による用紙位置合わせ装置の概略を示すブロック図である。このブロック図は図2の概略システム構成図を機能ブロック化したものである。図4において、41は固定情報と追加の書き込み領域とを含む学習用紙、42は図1のイメージ・スキャナ1及びホストコンピュータ2を含む文字読取システムである。文字読取システム42は、学習用紙41または、学習用紙41上の固定情報と同一の情報を含み、且つ追加の情報を有する入力用紙46上の情報を光学的に読み取ってディジタル画像を得る光学変換装置43と、学習用紙41から光学変換装置43により得られたディジタル画像から所定数の照合用小領域を選択する選択手段44と、選択手段44により選択された照合用小領域内の情報を格納する辞書メモリ45と、入力用紙46から光学変換装置43により得られた画像と、辞書メモリ45に格納されている照合用小領域内の情報とを照合することにより、照合用小領域内の情報と実質的に同一の情報を含む入力用紙上の小領域を検索する検索手段47と、検索手段47により検索された入力用紙46上の小領域と照合用小領域との対応関係に基づいて、追加の情報を識別してその中の文字を認識する文字認識手段48とを備えている。
【0015】
さらに、光電変換装置43により得られた画像から手書き入力領域等の読取領域を選択する読取領域選択部49と、その読取領域の座標を格納する読取領域辞書50も備えている。そして、選択手段44は読取領域辞書50に格納された読取領域の座標を考慮して照合用小領域を選択する。
図5は図4の装置による辞書メモリ作成方法の概略を示すフローチャートである。先ずステップ51で学習用帳票をイメージ・スキャナ1(図2)に入力する。次いでステップ52でイメージ・スキャナ1は入力された学習用帳票上の情報をスキャンすることにより光電変換してディジタル画像の学習用帳票イメージを得る。次にステップ53で、読取領域選択部により上記学習用帳票イメージ上で読取箇所の位置情報を設定し、読取領域辞書50に格納する。読取箇所とは、例えば、固定情報以外の情報が手書きで書き込まれる箇所である。次いでステップ54で、照合用小領域としては不適切な領域に関する情報を獲得する。この不適切な領域としては、後に詳述するように、例えば、網掛けの領域や上記の読取箇所等がある。次にステップ55にて照合用小領域の候補を自動的に選択するか、ステップ56にて照合用小領域の候補を手動にて選択する。次にステップ57にて、こうして選択された小領域の候補が入力帳票のスキューや伸縮に耐えるものかどうかを、選択された照合用小領域を変形させて変形前の照合用小領域に基づいて上記変形された照合用小領域を探索するシミュレーション(後に詳述する)を行うことにより、不適切な照合用小領域は棄却して一層最適な照合用小領域のみを残す。そして、ステップ58で、残された照合用小領域の位置及びその中の図柄情報を辞書メモリに保存する。
【0016】
図6は図4の装置による基準位置の対応リストの作成方法の概略を示すフローチャートである。まずステップ61で入力帳票をイメージ・スキャナ1に入力する。次いでステップ62でイメージ・スキャナ1は入力された入力用帳票上の情報をスキャンすることにより光電変換してディジタル画像の入力用帳票イメージを得る。次に、ステップ63で辞書メモリ45(図4)を参照して、ステップ64で辞書メモリ45に格納されている小領域の画像と一致する画像を入力用帳票イメージがら探索する。ついでステップ65にて、探索結果の正誤を後に詳述する手法でチェックし、ステップ67で正しいと判定された入力帳票イメージ内の小領域と照合用小領域との対応関係のリストを作成する。
【0017】
以下に、具体例を用いて本発明による用紙位置合わせ方法を説明する。
位置合わせ方法の概略
図7は、学習用紙の一例である。この学習用紙上には「吉尾さんを歓迎する会」の案内のための固定情報が記載されている。この学習用紙のコピーが親睦会の会員に配布されるか回覧される。この用紙の下方の「氏名」「出欠」「リクエスト」の欄は網掛けとなっている。この網掛けの欄の下の空欄に親睦会のメンバーが手書き等により必要事項を記入するようになっている。この学習用紙上の固定情報が記入されている適当な複数の場所を辞書メモリ45(図4)に格納するための照合用小領域として以下に記載する方法で選択する。
【0018】
まず、図7の学習用紙のディジタル画像を高速処理のために間引く。ここでは一例として間引き率を1/4として、図8に示すディジタル画像を得る。なお、図8は辞書作成のためのスムージングなど各種前処理を施してある。図8の学習用紙イメージを1/4に間引いた画像において、その用紙の図柄の中から予め複数個の照合用小領域81〜94を定める。本実施例では1つの照合用小領域は32ドット×32ドットである。これらの小領域の座標とその中の画像を辞書メモリ45に格納する。
【0019】
間引きは一種の特徴抽出であり, 用紙イメージの傾斜・伸縮の吸収および処理の高速化が目的である。
図9は図7に示した学習用紙のコピーの空欄に手書きで書き込まれた用紙を示す図である。この手書きで書き込まれた用紙イメージをやはり1/4に間引いた画像を図10に示す。
【0020】
図10の中の画像中から図8にある各照合用小領域をイメージマッチングにより探索する。探索された各小領域画像を図10に点線で示す。図8に示した学習用紙上の照合用小領域の各々の例えば左上隅の座標(辞書メモリ45に格納されている)と、図10に示した入力用紙上の検索された小領域の各々の左上隅の座標との対応を付けて、図11に示す様な表を得る。図11においては、全部で14個の小領域について、辞書メモリ側の座標と検索された小領域の座標との対応関係が示されている。例えば、破線111で囲まれた番号2の横に列記された破線113で囲まれた数字640、788、600、800は、小領域の、辞書メモリ側の座標は(640、788)で、検索された小領域の座標は(600、800)であることを示している。破線111で囲まれた番号1の横に記された破線112で囲まれた数字14は小領域が14個存在することを示している。この表における対応点を基に、学習用紙のイメージ中の任意座標に対応する、入力用紙のイメージ中の座標を求めることが可能になる。
辞書作成処理アルゴリズム
次に、図5のステップ54および55の詳細である辞書作成処理アルゴリズムを図12に示すフローチャートにより説明する。
【0021】
(1)網掛領域とベタ領域の検出(ステップ121)
ステップ121の網掛領域の検出では、図7の学習用紙のイメージにおける小区間ごとのドットの有無の頻度や量などを検出することにより、網掛領域を検出する。図7から検出した網掛領域の例を図13に示す。同様の手法で、ベタ領域(全部黒の領域)も検出する。これらの、網掛領域およびベタ領域は、辞書メモリ45に格納すべき照合用小領域としては不適切な領域である。
【0022】
(2)画像前処理(ステップ122)
ステップ122の画像前処理では、図7の学習用紙のイメージに対してゴミ取りとスムージングの処理を行い、1/4に間引きを行う。図7のイメージに対し本処理を施したものが図8である。
本処理は小領域選択の為に必須なものであり、処理を施すと図8に示すような状態になるが、実際に辞書に格納されるマッチング用画像としては、本処理を施したものでも、1/4間引きだけが行われたものでもどちらでも構わないが、辞書画像と同様の画像処理が入力画像に対しても行われることが必要である。
【0023】
本実施例では、高速化のため入力画像には1/4間引きだけを施すようにしており、従って辞書に格納する画像も1/4間引き処理だけを施されたものを使用しているため、図8と図10では若干絵の雰囲気が異なっている。
ここでの間引き率は, 位置合わせ時に使用する間引き率と同じ1/4を使用している。
【0024】
(3)エッジ画像の生成(ステップ123)
ステップ122による処理後の画像について、学習用紙上の図柄の縦エッジと横エッジを抽出する。その際、1ドットサイズで周囲から例えば3ドット以上離れたものはゴミとして除いておく。例として、図8の画像の縦エッジ画像を図14に示し、横エッジ画像を図15に示す。
【0025】
(4)8×8単位にエッジ特徴量を計測(ステップ124)
特徴小領域の選択は24ドット×24ドットで行うが、各特徴量の計算を高速化するため, いったん8ドット×8ドット単位で計算し、その後この結果を使用する。
即ち、ステップ123で生成したエッジ画像を、図16に示すように8ドット×8ドット単位のメッシュに分割し、各単位ごとにエッジなどの特徴量をカウントする。
【0026】
エッジなどの特徴量とは、主にエッジ特徴画像におけるドット数であり、例として以下のものがある。
nt(総エッジ量…エッジの黒画素数)
nh(横エッジ量…横方向エッジの黒画素数)
nv(縦エッジ量…縦方向エッジの黒画素数)
nc(黒画素量…黒画素数)
hh(横投影断面)
vv(縦投影断面)
ng(不適量=網掛量)
図17は, 図16中のメッシュの中の一つの照合用小領域を拡大した場合で説明用に図柄を簡単化した想定イメージ図である。この図形を例として、各特徴量の求め方を説明する。
【0027】
図17に示される画像のエッジ画像を図18に示し、縦エッジのみの画像を図19に示し、横エッジのみの画像を図20に示す。図18は、図19と図20の論理和画像である。従って、上記(3)で求めた縦エッジ画像と横エッジ画像を論理和することで得られる。
図18のエッジ図形の総黒画素数8が、総エッジ量ntである。
【0028】
図19の縦エッジ図形の総黒画素数6が、縦エッジ量nvである。
図20の横エッジ図形の総黒画素数6が、横エッジ量nhである。
図17の総黒画素数9が, 黒画素量ncである。
図17の図形の縦投影の断面情報(00011100)が、縦投影断面vvである。
図17の図形の横投影の断面情報(00111000)が, 横投影断面hhである。
【0029】
上記(1)で生成した網掛マップを参照して、対象領域内での網掛に該当する領域のドット数を不適量ngとしてカウントする( 図17の例ではngは0である)。
上記(1)では、間引いていない画像を元に網掛領域とベタ領域の検出しているので、その分を考慮して間引いた状態に換算する。
【0030】
(5)24ドット×24ドット単位に特徴量をまとめる(ステップ125)
ステップ124で生成した8ドット×8ドット単位のマップを24ドット×24ドット単位にまとめて得点を付ける。
この得点の付与に際して、位置合わせに使用する各小領域のサイズは32ドット×32ドットであるが、イメージマッチングにおいては、この小領域内の周辺部は傾斜や伸縮などの影響を受けやすいため、周辺部の図柄は得点に加えない。
【0031】
具体的には、ステップ124で生成した8ドット×8ドット単位のエッジ特徴量マップを1単位として、図21のように縦5単位(8×5=40ドット)、横5単位(8×5=40ドット)の領域を考える。図21の各メッシュ(8ドット×8ドット)には、ステップ124の処理により各種の特徴量が求められている。これら5×5=25単位の領域を内側領域の9単位( 図22中のA1〜A9の領域) と外側領域の16単位(図22中のBの領域) とに分けて考え、A1〜A9領域とB領域それぞれについて、ステップ124で求めた各特徴量を、以下のように単純に加算して和を求める。
【0032】
A領域について:
総エッジ量A Σnt=nt[A1] + nt[A2] + ..... + nt[A9]
横エッジ量A Σnh, 縦エッジ量A Σnv, 黒画素数A Σnc, 不適量A Σng
も同様にして求める。
縦投影断面A Σvv ={ (vv[A1] OR vv[A2] OR vv[A3]) << 16 } OR { (vv[A4] OR vv[A5] OR vv[A6]) << 8 } OR (vv[A7] OR vv[A8] OR vv[A9]
ここで << 16は16ビットシフトを示し、 << 8 は8ビットシフトを示す。
横投影断面A Σhhも同様にして求める。
例えば、 hh[A1] 〜 hh[A9] がそれぞれ次の値を持つとする。
hh[A1]=(00000001) hh[A2]=(00001000) hh[A3]=(10000000)
hh[A4]=(00000010) hh[A5]=(00010000) hh[A6]=(01000000)
hh[A7]=(00000100) hh[A8]=(00100000) hh[A9]=(00100000)
すると、 A Σ hh は
A Σ hh= { (hh[A1] OR hh[A4] OR hh[A7])<<16 } OR { (hh[A2] OR hh[A5] OR hh[A8])<<8 } OR hh[A3] OR hh[A6] OR hh[A9] = { (00000111)<<16 } OR { (00111000)<<8 } OR 11100000 = 000001110011100011100000
となる。実際の計算では
となる。
【0033】
A領域と同様にしてB領域についても、各特徴量(BΣnt,BΣnh,BΣnv,BΣnc,BΣng) を求める。
一方、照合用小領域の図柄の構成物のサイズが大きい方が、イメージマッチングにおいて入力用紙がスキャナに対して傾斜して入力されたり入力用紙が伸縮したりしても、より確実に照合ができると考えられる。この考えを反映させるため、縦方向および横方向のエッジ量に対し下限を設ける。即ち、BIT(A Σvv) およびBIT(A Σhh) が予め定めた一定値以下の場合は、この領域は無効とする。ここでBIT( n )は、nという0/1の列中の1の個数を表すものとする。これにより、例えば縦方向のみあるいは横方向のみにエッジがある図柄は照合用小領域の候補から排除される。
【0034】
照合用小領域の図柄の構成物のサイズを計測するもう一つの尺度としてランレングスを利用する。
即ち、当該A領域内の各単位について, 縦方向ランレグス情報 v_run(0) ...v_run(i)と横方向ランレングス情報 h_run(0) ..... h_run(j)を求めたら、
WV = root( Σ v_run × v_run ) , WH = root( Σ h_run × h_run )
を求め、図形幅特徴とする。この図形幅特徴を得点に反映させることにより、図柄として太い線のもの程得点が高くなる。
【0035】
前述のように実際に使用する各照合用小領域の大きさは32ドット×32ドットであるが、その照合用小領域の得点はその中央部の24ドット×24ドットについて算出する。
照合用小領域内の周辺部は、前述のように入力用紙が傾斜や伸縮した場合に照合が不正確になりやすいので、照合用小領域の周辺部は何も特徴が無い方が望ましい。したがってその考えを反映させるため、周辺部Bの総エッジ量の密度が中央部Aの総エッジ量の密度より大きい場合( A Σnt < BΣnt × 9/16 の場合)は、この領域は照合用小領域として採用しないことにする。
【0036】
(6)小領域単位に得点を付け、重複チェックをする(ステップ126)
ステップ125までの処理により、用紙イメージをメッシュに分割し、各領域毎に各種の特徴量を求めた。
このステップ126では、各照合用小領域ごとに特徴量に基づいて得点化し、序列を作る。
【0037】
即ち、ステップ125で求めた各特徴情報に以下のようにそれぞれ重みを付けて加算してそれぞれの指標を得、それらを以下のように加減算することにより総合的な得点とする。
NC = (400 −|400 − A Σnc|) * 0.7
NV = A Σnv× 1.5
NH = A Σnh× 1.5
VV = WV× 1.0
HH = WH× 1.0
NG = (AΣng× 2.0 + BΣng) ×20.0
RN = (AΣnc× 10.0) / AΣnt
得点 PT = NC + NV + NH + VV + HH + RN − NG
なお、上記の重みは一例であり、経験的に適宜最適な重みを付ければよい。
【0038】
こうして、各照合用小領域には得点が与えられ、その得点が大きい程照合用小領域として適しており、入力用紙の傾斜や伸縮、ノイズといった入力イメージの変動があっても、より確実に照合ができる。
上記の得点中、RNは中央部Aについて黒画素量の和に重み付けしたものを総エッジ量の和で割り算した値であり、画像の線の太さを表す指標となっている。この指標RNが大きい程、画像の線は太い。指標RNが予め定めたしきい値を下回る場合は図柄としての特徴が少ないので、この領域は照合用小領域として採用しないことにする。
【0039】
一方、イメージマッチングにおいては、図形としては入力用紙の傾斜や伸縮、ノイズといった入力イメージの変動があっても確実に照合ができるが、入力用紙上で類似図形が近傍にあるとどの小領域と照合用小領域とが一致したかの区別がつかない。この問題に対処するために、当該24ドット×24ドットのイメージによって近傍を探索し、類似図形がある場合( 判定はマッチング結果の第一候補と第二候補の距離差が一定以下) は、ペナルティとして得点を大きく下げる。
【0040】
これにより、入力用紙の傾斜や伸縮、ノイズといった入力イメージの変動に対して確実に照合ができる場合でも、類似図形が近くにあると得点は下がる。
(7)個数の絞り込み(ステップ127)
ステップ126までの処理により, 学習用紙のイメージ中に24ドット×24ドット単位で得点を付けた。この中から必要数の特徴箇所をピックアップする。照合用小領域の得点は高い方が良いが、照合用小領域は用紙上にまんべんなく分布することも必要であるため、以下の方法で選別を行う。
【0041】
即ち、得点の低い順に、周囲に自身より高得点の小領域があるか否かを見て、ある場合には自身を削除し、ない場合は自身を残す。これにより照合用小領域が密集する地域では高得点のものだけが残るし、照合用小領域が過疎な地域では、低得点でも残る。
ただし、得点には絶対的なしきい値を設けておき、それを下回れば無条件に除外する。
【0042】
例えば以下のように、一次元上に分布する照合用小領域A 〜J を考える。ただし( ) 内は得点を示す。
A(300) B(400) C(250) D(600) E(100) F(200) G(600) H(500) I(400) J(500)
上記の照合用小領域のうち、隣りあうものを比較して、上記のアルゴリズムで選別を行うと、照合用小領域B,D,G,J が残る。
【0043】
もし得点順に上位4個を選ぶとD,G,H,J となるが、これは分布が考慮されていないため、偏る可能性がある。
(8)ずらしによる位置の微調整(ステップ128)
ここまでの処理により, 位置合わせのためのイメージマッチングに適した安定した特徴的な箇所が照合用小領域として残っているはずである。
【0044】
ステップ126では、小領域の周辺部に特徴が少ないことを条件として比較を行った。したがって、この段階で残っているものは、それらの条件に合致したものばかりであるが、残っている照合用小領域の各々のごく近傍に関しては更に最適な箇所があるかもしれない。
つまりステップ126での比較は初期の8ドット×8ドット単位なので、8ドット以内の近傍に、より最適なものがあるかもしれない。
【0045】
そこで24ドット×24ドットの中央部を周辺部に対してずらしながら、周辺部のみの特徴量を求め, 周辺部の特徴量が最も少ない時の32ドット×32ドットの領域を照合用小領域として選択することにする。
以上の処理を行うことにより、図7の学習用紙のイメージから、図8に示したような照合用小領域が自動的に選択される。これらの照合用小領域は、入力用紙の位置合わせのために使用される特徴的な場所であり、入力用紙がスキャナに対して斜めに挿入されたり、入力用紙が伸縮していても、イメージマッチングを安定に行うために有効な照合用領域である。
読取箇所情報などの設定(図5のステップ53)
2値イメージのイメージマッチングにおいては、手書き文字などは完全にノイズと同じで、学習用紙上の画像に対する変形に等しく、このようなノイズがあると誤マッチの原因となる。従って文字等が記入される領域は予め照合用小領域として選択されるべきではない。
【0046】
文字認識装置などでは, 用紙上の読取りたい領域を予め座標等で記録しておく辞書(図4の読取領域辞書50)が存在する。
この読取領域辞書50を参照することにより、用紙中の読取領域情報が得られるので、網掛けの場合と同様にマッピングと換算により、読取領域マップを作り、特徴量の計算においても、網掛け同様の方式で、不適特徴量ngとしてカウントする。これにより網掛け同様に、照合用小領域の候補として読取( 記入) 領域が選ばれにくくし、それにより位置合わせ時にイメージマッチングの精度を向上させる。
小領域探索のシミュレーション(図5のステップ57)
イメージマッチングにおいては、スキューや伸縮等による画像の変形は誤マッチの原因となる。スキュー・伸縮の影響の度合いは、その図柄によって大きく左右される。例えば極端な場合だが、図23はスキューに強い図形で、右側は左側を90度回転した画像だが、形状に変化がないのでイメージマッチングに悪影響はない。一方、図24も同様に右側は左側を90度回転したものだが、両者を重ねても重なる部分はごく一部しかないのでイメージマッチングとしてスキューに弱い図形である。
【0047】
学習用紙上で採用される照合用小領域の画像は、もっと複雑な図形になるため、マルや線のように単純に分けられない。
照合用小領域の選択の元となった学習用紙の画像から、許容すべきスキューや伸縮の限界値の組合せパターンで変形した幾つかの画像を生成し、それらの画像上から照合用小領域の候補(図5のステップ55で選択されたもの)をイメージマッチングマッチングにより探索し、各小領域候補について、組合せパターン数のうち所定数以上のイメージマッチングが正しいと判断された場合にその照合用小領域候補を実際の照合用小領域として採用することにする。
【0048】
具体的には、小領域自体は、学習用紙の画像から選択しているため、その座標を変形に使用したスキュー・伸縮パラメータで変換すれば、変形画像上での対応座標が求められる。従ってこの座標と探索結果の座標との距離によって、元の画像と変形画像とがイメージマッチングをしたかどうか(イメージマッチングの正解・不正解)が判断できる。
【0049】
このイメージマッチングの正誤の度合いを、その小領域候補のスキュー・伸縮に対する耐久度と見なし、耐久度の低いものは照合用小領域としては無効とすることで、位置合わせ時においては、スキュー・伸縮を含む画像に対しても安定した精度を保てる小領域のみが辞書メモリ45に格納される。
実施例として、スキュー5度、縦伸縮 90%〜 110% 、横伸縮 90% 〜110%の変化までは、許容範囲として用紙イメージを処理したい場合は、辞書メモリ作成時において小領域候補が選ばれたら、以下の8パターンのパラメータで、学習画像を変形し8枚の画像を生成する。
【0050】
スキュー(左5 度)、縦伸縮(110%)、横伸縮(110%)
スキュー(右5 度)、縦伸縮(110%)、横伸縮(110%)
スキュー(左5 度)、縦伸縮( 90%)、横伸縮(110%)
スキュー(右5 度)、縦伸縮( 90%)、横伸縮(110%)
スキュー(左5 度)、縦伸縮(110%)、横伸縮( 90%)
スキュー(右5 度)、縦伸縮(110%)、横伸縮( 90%)
スキュー(左5 度)、縦伸縮( 90%)、横伸縮( 90%)
スキュー(右5 度)、縦伸縮( 90%)、横伸縮( 90%)
次に、各小領域候補の座標( 学習用紙上の座標) を、それぞれ上記8パターンのパラメータで変換すると、各変形画像上での対応位置が求められる。これが正解座標となる。
【0051】
そして実際に、各変形画像上で、それぞれの小領域候補についてイメージマッチングを行い、探索結果と正解座標との距離を求め、しきい値により正誤に分ける。
その結果を各小領域ごとにまとめ、正解率が一定以上( 例えば8パターン中6パターン以上正解など) であればその小領域を合格とし、そうでなければ、許容すべきスキュー・伸縮に耐えられない図柄と見なし棄却する。
照合用小領域の手動選択(図5のステップ56)
以上に述べた方法により, 学習用紙のイメージ中から自動的に選択した小領域は、イメージマッチングに適したものであるということが一応は言える。しかし用紙の図柄のバリエーションは無限であり、全ての図柄に対してイメージマッチングに適した小領域が選択されるとは限らない。もし、イメージマッチングに不適切な小領域が辞書メモリ45に格納された場合は、それを取り除く必要がある。
【0052】
また, 逆に辞書メモリ45に格納すべき小領域としては選ばれていないが、照合用小領域として適切な場所をユーザが発見する可能性もある。この場合は, この場所を照合用小領域として辞書メモリ45に追加する必要が生じる。
この目的のために、辞書メモリ45の持つ学習イメージを表示し、グラフィカル・ユーザ・インターフェース(GUI)環境により、任意の箇所に、位置合わせに使用する照合用小領域を設定できるようにすれば、追加や削除といった編集が行え、本発明による用紙位置合わせ装置がより柔軟なものとなる。場合によっては, 新規作成としてユーザが照合用小領域を全て手動により選択することも可能である。
探索した小領域のチェック(図6のステップ65)
照合用小領域の図柄と入力用紙上の図柄とのイメージマッチングにおいては、入力用紙の傾斜や伸縮やノイズといった変動に加え、類似図形などと間違える場合がある。ここでは、イメージマッチングによる間違いを補正する方式を説明する。この方式を上記した用紙位置合わせ方法に組み込むことにより、用紙位置合わせの精度が向上する。
【0053】
具体的には、探索により、辞書メモリ45中の特徴的箇所である照合用小領域の3つとイメージマッチングする入力用紙上の3つの小領域が探索されたら、まず辞書メモリ側の上記3つの照合用小領域の各々の例えば左上隅の座標をそれぞれA1,A2,A3として3点A1,A2,A3を頂点とする三角形△Aと、それに対応する探索した入力用紙上の3点B1,B2,B3を頂点とする三角形△Bとを考える。
【0054】
これらの三角形の例を図25と図26に示す. 図25は三角形△Aの例で, 学習用の未記入用紙のイメージの3点( 各点は、上記の辞書メモリ作成方法により得られた照合用小領域の1点に相当する) を頂点とする三角形で切り出したものである。図26は三角形△Bの例で, 入力された用紙イメージの中から既述の3点に対応する領域をイメージマッチングにより探し出し、それらの点を頂点とする三角形で切り出したものである。
【0055】
三角形△A内の任意の点Cは
C = m× Vec(A1,A2) + n ×Vec(A1,A3)により表せる。
ただし、上記式中のmおよびnは任意の定数、Vec(N1,N2)は、点N1から点N2へのベクトルを表す。
三角形△Aを三角形△Bに写像すると、△A上の点Cは、△B上の点Dとして以下のように表せる。
【0056】
D = m× Vec(B1,B2) + n ×Vec(B1,B3)
こうして三角形△A(図25)を変形して、三角形△B(図26)と合同の三角形△E(図27)を形成する。この変形により、三角形△Aの内部の図柄も三角形△Eに写像される。
次いで、三角形△Eの内部の図柄と三角形△Bの内部の図柄についてイメージマッチングを行う。上記3つの頂点を含む小領域の探索が全て正しい場合は, この三角形内部の図柄も一致するはずであり、上記3つの頂点を含む小領域の探索が間違っていれば、三角形内部の図柄は一致しないはずである。これにより, 小領域箇所のイメージマッチング探索結果が正しかったか否かを判定できる。
【0057】
なお本実施例では、△Aを△Bに写像しているが、これは黒画素の少ない方が変形の為の計算量が少なくなる処理方式を使用しているため、高速化を考慮してのことである。従って、△Bを△Aに写像して△Cを生成しても、小領域探索結果のチェックという目的には何ら支障はない。
以上の実施の形態では、文字読取装置(OCR)により読み取られる帳票上の手書き文字の位置を認識する場合について説明したが、本発明はこれに限られず、例えば固定情報が印刷されている用紙の書き込み位置にプリンタにより印字する場合にも、その書き込み位置を認識する場合にも適用可能であることは当業者に明らかである。
【0058】
【発明の効果】
以上の説明から明らかなように、本発明によれば、用紙中の図柄の一部をそのまま、一種のマークとして取り扱うことにより、黒背景機能を持たないOCRでも用紙位置合わせを可能にし、且つ、専用マークを不要とし, さらに用紙中の罫線の有無に左右されずに用紙の位置合わせを可能にする、用紙位置合わせ装置、用紙位置合わせ方法及び用紙位置合わせ用記録媒体が提供される。
【図面の簡単な説明】
【図1】本発明による用紙位置合わせの処理の概要を示す説明図である。
【図2】本発明による用紙位置合わせ装置の概略システム構成図である。
【図3】図2におけるホストコンピュータ2の構成例を示すブロック図である。
【図4】本発明による用紙位置合わせ装置の概略を示すブロック図である。
【図5】図4の装置による辞書メモリ作成方法の概略を示すフローチャートである。
【図6】図4の装置による基準位置の対応リストの作成方法の概略を示すフローチャートである。
【図7】学習用紙の画像の一例を示す図である。
【図8】図7の学習用紙の画像を間引いた画像を示す図である。
【図9】入力用紙の画像の一例を示す図である。
【図10】図9に入力用紙の画像を間引いた画像を示す図である。
【図11】照合用小領域と入力用紙の小領域との対応点を示す表図である。
【図12】図5のステップ54および55の詳細である辞書作成処理アルゴリズムを示すフローチャートである。
【図13】図7から検出した網掛領域の例を示す図である。
【図14】図8の画像の縦エッジ画像を示す図である。
【図15】図8の画像の横エッジ画像を示す図である。
【図16】図12のステップ123で生成したエッジ画像を、8ドット×8ドット単位のメッシュに分割した図である。
【図17】メッシュの中の一つの照合用小領域を拡大した図である。
【図18】図17に示される画像のエッジ画像を示す図である。
【図19】図17に示される画像の縦エッジ画像を示す図である。
【図20】図17に示される画像の横エッジ画像を示す図である。
【図21】8ドット×8ドット単位のエッジ特徴量マップを1単位として、縦5単位(8×5=40ドット)、横5単位(8×5=40ドット)の領域を示す図である。
【図22】図21の領域を内側領域と外側領域に分けた図である。
【図23】スキューに強い図形を示す図である。
【図24】スキューに弱い図形を示す図である。
【図25】3つの照合用小領域を頂点とする三角形△Aを示す図である。
【図26】探索した入力用紙上の3つの小領域を頂点とする三角形△Bを示す図である。
【図27】図25の三角形△Aを変形して、図26の三角形△Bと合同にした三角形△Eを示す図である。
【図28】従来の用紙位置合わせの説明図である。
【符号の説明】
41…学習用紙
42…文字読取システム
43…光電変換装置
44…選択手段
45…辞書メモリ
46…入力用紙
47…検索手段
48…文字認識手段
49…読取領域選択部
50…読取領域辞書
Claims (17)
- 学習用紙上の固定情報を読み取って得られた画像から所定数の照合用小領域を選択する選択手段と、
前記選択手段により選択された前記照合用小領域内の情報を格納するメモリと、
前記固定情報と同一の情報を含む入力用紙上の情報を読み取って得られた画像と、前記メモリに格納されている前記照合用小領域内の情報とを照合することにより、前記照合用小領域内の情報と同一の情報を含む入力用紙上の小領域を検索する検索手段と、
前記検索手段により検索された前記入力用紙上の小領域と前記照合用小領域との対応関係に基づいて、前記学習用紙の任意の位置に対応する前記入力用紙画像上の位置を決定する決定手段とを備え、
前記選択されて前記メモリに格納された照合用小領域のうち、3つを頂点とする第1の三角形と、前記3つの小領域の図柄と一致する図柄を持つとして検索された入力用紙画像上の3つの小領域を頂点とする第2の三角形とのいずれか一方を基準三角形とし、該基準三角形に合同になるように他方の三角形を変形して第3の三角形を形成し、該第3の三角形の内部の図柄と前記基準三角形の内部の図柄が所定の評価値により一致と判定された場合にのみ、該小領域領域は正しく検索されたと判定するようにした、用紙位置合わせ装置。 - 前記選択手段は、読み取られた前記学習用紙上の画像からエッジ画像を抽出するエッジ画像抽出手段と、前記エッジ画像に基づいて前記照合用小領域として最適な小領域を選択する最適小領域選択手段とを備えることを特徴とする請求項1に記載の用紙位置合わせ装置。
- 前記最適小領域選択手段は、前記照合用小領域を複数の小サブ領域に分割する小サブ領域分割手段と、前記エッジ画像に基づいて照合用の図柄として適している度合いを表す特徴量を前記小サブ領域毎に算出する特徴量算出手段と、所定数の前記小サブ領域毎にまとめて複数の大サブ領域を構成する大サブ領域構成手段と、前記大サブ領域の各々について前記特徴量に基づいて照合用の図柄として適している度合いを表す得点を算出する大サブ領域得点算出手段とを備え、前記得点の高い大サブ領域から順に前記照合用小領域を選択するようにしたことを特徴とする請求項2に記載の用紙位置合わせ装置。
- 前記特徴量算出手段は、前記小サブ領域内のエッジの黒画素数と、前記小サブ領域内の総黒画素数とに基づき前記照合用小領域を選択するための適切特徴量を算出するようにしたことを特徴とする請求項3に記載の用紙位置合わせ装置。
- 前記特徴量算出手段は、前記小サブ領域内の網掛け部分の画素数に基づき前記照合用小領域として不適切な不適切特徴量を算出するようにしたことを特徴とする請求項4に記載の用紙位置合わせ装置。
- 前記特徴量算出手段は、前記小サブ領域内の読取対象部分の画素数に基づき前記照合用小領域として不適切な不適切特徴量を算出するようにしたことを特徴とする請求項4記載の用紙位置合わせ装置。
- 前記学習用紙の画像に対し、スキュー及び伸縮の複数組みの限界値を適用して、複数の変形学習用紙画像を生成し、これらを入力画像と見立てて前記さらに最適な位置合わせ用小領域の検索を行い、その検索結果の正誤を所定の値をもって行い、誤検索が所定数以上存在する小領域は棄却するようにした、請求項1に記載の用紙位置合わせ装置。
- 前記文字読取装置の使用者が前記学習用紙上の任意の小領域を前記照合用小領域として選択するようにした、請求項1に記載の用紙位置合わせ装置。
- 学習用紙上の固定情報を読み取って得られた画像から所定数の照合用小領域を選択し、
選択された前記照合用小領域内の情報をメモリに格納し、
固定情報と同一の情報を含む入力用紙上の情報を読み取って得られた画像と、前記メモリに格納されている前記照合用小領域内の情報とを照合することにより、前記照合用小領域内の情報と同一の情報を含む入力用紙上の小領域を検索し、
前記検索された前記入力用紙上の小領域と前記照合用小領域との対応関係に基づいて、前記学習用紙の任意の位置に対応する前記入力用紙画像上の位置を決定するというステップを備え、
前記選択されて前記メモリに格納された照合用小領域のうち、3つを頂点とする第1の三角形と、前記3つの小領域の図柄と一致する図柄を持つとして検索された入力用紙画像上の3つの小領域を頂点とする第2の三角形とのいずれか一方を基準三角形とし、該基準三角形に合同になるように他方の三角形を変形して第3の三角形を形成し、該第3の三角形の内部の図柄と前記基準三角形の内部の図柄が所定の評価値により一致と判定された場合にのみ、該小領域領域は正しく検索されたと判定するようにすることを特徴とする用紙位置合わせ方法。 - 前記選択するステップは、読み取られた前記学習用紙上の画像からエッジ画像を抽出し、前記エッジ画像に基づいて前記照合用小領域として最適な小領域を選択する、というステップを備えることを特徴とする請求項9に記載の用紙位置合わせ方法。
- 前記最適な小領域を選択するステップは、前記照合用小領域を複数の小サブ領域に分割し、前記エッジ画像に基づいて、照合用の図柄として適している度合いを表す特徴量を前記小サブ領域毎に算出し、所定数の前記小サブ領域毎にまとめて複数の大サブ領域を構成し、前記大サブ領域の各々について前記特徴量に基づいて照合用の図柄として適している度合いを表す得点を算出し、前記得点の高い大サブ領域から順に前記照合用小領域を選択する、というステップを備えることを特徴とする請求項10に記載の用紙位置合わせ方法。
- 前記特徴量を算出するステップは、前記小サブ領域内のエッジの黒画素数と、前記小サブ領域内の総黒画素数とに基づき前記照合用小領域を選択するための適切特徴量を算出する、というステップを備えることを特徴とする請求項11に記載の用紙位置合わせ方法。
- 前記特徴量を算出するステップは、前記小サブ領域の各々の網掛け部分の画素数に基づき前記照合用小領域として不適切な不適切特徴量を算出する、というステップを備える、請求項12に記載の用紙位置合わせ方法。
- 前記特徴量を算出するステップは、前記小サブ領域内の読取対象部分の画素数に基づき前記照合用小領域として不適切な不適切特徴量を算出する、というステップを備える、請求項12に記載の用紙位置合わせ方法。
- 前記学習用紙の画像に対し、スキュー及び伸縮の複数組みの限界値を適用して、複数の変形学習用紙画像を生成し、これらを入力画像と見立てて前記さらに最適な位置合わせ用小領域の検索を行い、その検索結果の正誤を所定の値をもって行い、誤検索が所定数以上存在する小領域は棄却するようにした、請求項9に記載の用紙位置合わせ方法。
- 前記文字読取装置の使用者が前記学習用紙上の任意の小領域を前記照合用小領域として選択するようにする、請求項9に記載の用紙位置合わせ方法。
- 固定情報を含む学習用紙を読み取って得られた画像から所定数の照合用小領域を選択させる選択手段と、
選択された前記照合用小領域内の情報をメモリに格納させる格納手段と、
前記固定情報と同一の情報を含む入力用紙から読み取られた画像と、前記メモリに格納されている前記照合用小領域内の情報とを照合することにより、前記照合用小領域内の情報と同一の情報を含む入力用紙上の小領域を検索させる検索手段と、
前記検索された前記入力用紙上の小領域と前記照合用小領域との対応関係に基づいて、前記学習用紙の任意の位置に対応する前記入力用紙画像上の位置を決定させる決定手段とを備え、前記選択されて前記メモリに格納された照合用小領域のうち、3つを頂点とする第1の三角形と、前記3つの小領域の図柄と一致する図柄を持つとして検索された入力用紙画像上の3つの小領域を頂点とする第2の三角形とのいずれか一方を基準三角形とし、 該基準三角形に合同になるように他方の三角形を変形して第3の三角形を形成し、該第3の三角形の内部の図柄と前記基準三角形の内部の図柄が所定の評価値により一致と判定された場合にのみ、該小領域領域は正しく検索されたと判定するようにすることを特徴とする用紙位置合わせプログラムを記憶したコンピュータ読み取り可能な記録媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15255797A JP3558493B2 (ja) | 1997-06-10 | 1997-06-10 | 用紙位置合わせ装置、用紙位置合わせ方法及び用紙位置合わせプログラムを記録したコンピュータ読み取り可能な記録媒体 |
US09/006,200 US6351560B1 (en) | 1997-06-10 | 1998-01-13 | Apparatus, method, and program for locating an objective on a form and a recording medium for recording the program for locating the objective on the form |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15255797A JP3558493B2 (ja) | 1997-06-10 | 1997-06-10 | 用紙位置合わせ装置、用紙位置合わせ方法及び用紙位置合わせプログラムを記録したコンピュータ読み取り可能な記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH113431A JPH113431A (ja) | 1999-01-06 |
JP3558493B2 true JP3558493B2 (ja) | 2004-08-25 |
Family
ID=15543085
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP15255797A Expired - Lifetime JP3558493B2 (ja) | 1997-06-10 | 1997-06-10 | 用紙位置合わせ装置、用紙位置合わせ方法及び用紙位置合わせプログラムを記録したコンピュータ読み取り可能な記録媒体 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6351560B1 (ja) |
JP (1) | JP3558493B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100752253B1 (ko) * | 1999-09-17 | 2007-08-29 | 실버브룩 리서치 피티와이 리미티드 | 컴퓨터의 명령을 위한 방법 및 시스템 |
JP2002112025A (ja) * | 2000-10-03 | 2002-04-12 | Fujitsu Ltd | 画像補正装置および補正方法 |
US20040083229A1 (en) * | 2001-09-04 | 2004-04-29 | Porter Robert Austin | Apparatus and method for automatically grading and inputting grades to electronic gradebooks |
CA2375355A1 (en) * | 2002-03-11 | 2003-09-11 | Neo Systems Inc. | Character recognition system and method |
JP2012181855A (ja) * | 2005-08-08 | 2012-09-20 | Toshiba Corp | 辞書作成方法及び識別用辞書を記憶する記憶媒体 |
US8606046B2 (en) * | 2010-06-21 | 2013-12-10 | Palo Alto Research Center Incorporated | System and method for clean document reconstruction from annotated document images |
JP7379051B2 (ja) * | 2019-09-30 | 2023-11-14 | キヤノン株式会社 | 情報処理装置、情報処理装置の制御方法及びそのプログラム |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5887652A (ja) * | 1981-11-19 | 1983-05-25 | Ricoh Co Ltd | 画像処理装置 |
JPS58103266A (ja) * | 1981-12-15 | 1983-06-20 | Toshiba Corp | 文字画像処理装置 |
US4558461A (en) * | 1983-06-17 | 1985-12-10 | Litton Systems, Inc. | Text line bounding system |
JPH0682403B2 (ja) * | 1986-03-24 | 1994-10-19 | 沖電気工業株式会社 | 光学式文字読取装置 |
JPS63268081A (ja) * | 1987-04-17 | 1988-11-04 | インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション | 文書の文字を認識する方法及び装置 |
US4985930A (en) * | 1987-09-24 | 1991-01-15 | Hitachi, Ltd. | Image data filing system and image data correcting method |
JPS6482286A (en) * | 1987-09-25 | 1989-03-28 | Toshiba Corp | Image inclination detector |
US5101448A (en) * | 1988-08-24 | 1992-03-31 | Hitachi, Ltd. | Method and apparatus for processing a document by utilizing an image |
US5140650A (en) * | 1989-02-02 | 1992-08-18 | International Business Machines Corporation | Computer-implemented method for automatic extraction of data from printed forms |
IL91220A (en) * | 1989-08-04 | 1995-03-30 | Ibm Israel | Compression of information |
US5119433A (en) * | 1990-03-12 | 1992-06-02 | International Business Machines Corporation | Method and system for locating the amount field on a document |
JP3320759B2 (ja) * | 1991-12-26 | 2002-09-03 | 株式会社東芝 | 文書画像傾き検出装置およびその方法 |
US5535119A (en) * | 1992-06-11 | 1996-07-09 | Hitachi, Ltd. | Character inputting method allowing input of a plurality of different types of character species, and information processing equipment adopting the same |
JPH0744682A (ja) | 1993-07-28 | 1995-02-14 | Konica Corp | 画像読取装置 |
JPH07256214A (ja) * | 1994-03-22 | 1995-10-09 | Toshiba Corp | 郵便物の宛名読取装置および郵便物の宛名領域判別装置および郵便物の宛名印刷装置 |
US5852676A (en) * | 1995-04-11 | 1998-12-22 | Teraform Inc. | Method and apparatus for locating and identifying fields within a document |
DE69624034D1 (de) * | 1995-04-21 | 2002-11-07 | Canon Kk | Verfahren und Gerät zur Bilddrehung |
-
1997
- 1997-06-10 JP JP15255797A patent/JP3558493B2/ja not_active Expired - Lifetime
-
1998
- 1998-01-13 US US09/006,200 patent/US6351560B1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH113431A (ja) | 1999-01-06 |
US6351560B1 (en) | 2002-02-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111507251B (zh) | 试题图像中作答区域的定位方法、装置、电子设备及计算机存储介质 | |
US6778703B1 (en) | Form recognition using reference areas | |
JP3576570B2 (ja) | 比較方法 | |
US5410611A (en) | Method for identifying word bounding boxes in text | |
JP3445394B2 (ja) | 少なくとも二つのイメージセクションの比較方法 | |
JP3345224B2 (ja) | パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置 | |
EP2091004A2 (en) | Correcting for geometrical perspective distortion | |
JP6900164B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
EP0738987A2 (en) | Processing machine readable forms | |
JP3294995B2 (ja) | 帳票読取装置 | |
JPS61267177A (ja) | 文書画像追加情報の蓄積方法 | |
JPH11219407A (ja) | 文書画像認識装置および文書画像認識プログラムの記憶媒体 | |
JP2002133426A (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
CN115457565A (zh) | 一种ocr文字识别方法、电子设备及存储介质 | |
US6947596B2 (en) | Character recognition method, program and recording medium | |
CN113158895A (zh) | 票据识别方法、装置、电子设备及存储介质 | |
JP4594952B2 (ja) | 文字認識装置及び文字認識方法 | |
JP3558493B2 (ja) | 用紙位置合わせ装置、用紙位置合わせ方法及び用紙位置合わせプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
WO2023065397A1 (zh) | 一种手写汉字图像的笔顺识别方法及系统 | |
JP4140221B2 (ja) | 画像照合装置および画像照合プログラム | |
JP3186246B2 (ja) | 文書読取装置 | |
JP2000187705A (ja) | 文書読取装置および方法および記憶媒体 | |
JP4221960B2 (ja) | 帳票識別装置及びその識別方法 | |
JP3186712B2 (ja) | 文書読取装置 | |
JPH0728935A (ja) | 文書画像処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20031201 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040304 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040420 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040518 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080528 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090528 Year of fee payment: 5 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090528 Year of fee payment: 5 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100528 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130528 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140528 Year of fee payment: 10 |
|
EXPY | Cancellation because of completion of term |