JPH07141463A - 2値画像内の機械印刷された金額の検出方法 - Google Patents

2値画像内の機械印刷された金額の検出方法

Info

Publication number
JPH07141463A
JPH07141463A JP6130144A JP13014494A JPH07141463A JP H07141463 A JPH07141463 A JP H07141463A JP 6130144 A JP6130144 A JP 6130144A JP 13014494 A JP13014494 A JP 13014494A JP H07141463 A JPH07141463 A JP H07141463A
Authority
JP
Japan
Prior art keywords
character
window
binary
amount
money
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6130144A
Other languages
English (en)
Inventor
Stewart B Kelland
ビー.ケランド スチュワート
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NCR International Inc
NCR Voyix Corp
Original Assignee
AT&T Global Information Solutions Co
AT&T Global Information Solutions International Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AT&T Global Information Solutions Co, AT&T Global Information Solutions International Inc filed Critical AT&T Global Information Solutions Co
Publication of JPH07141463A publication Critical patent/JPH07141463A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 本発明は、2値画像内のドル表示金額などの
機械印刷された金額の検出を提供するものである。 【構成】 バイナリ1が黒の画素を示しバイナリ0が白
の画素を示す2値画像による金額の位置検出方法。対象
を連続した黒の画素として定義し、2値画像の一定箇所
に審査用ウィンドウを位置付け、対象リストを作成す
る。対象は既定の基準により部分クラスに分類され、こ
の部分クラスは金額を示す一定の並びとの一致を判断す
るため審査される。例えば、米国通貨の場合、$2.4
6を示す「文字、ドット、文字、文字」とする並びがあ
る。次の段階では、部分クラスが金額を示す一定の幾何
学的基準に合致しているか判断するために部分クラスの
審査が行われる。このときウィンドウ内の部分クラスか
ら金額の有無が明らかになるが、この後に文字認識動作
を行って、個々の文字が示す内容を判断する必要があ
る。上記ウィンドウはデータの次の箇所に移動し、同様
の処理が繰り返される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、デジタル画像処理に関
し、これをさらに詳細に述べると、例えば、2値画像内
のドル表示金額などの機械印刷された金額の検出に関す
る。
【0002】
【従来の技術】ここ数年、文書自体を用いるのではな
く、文書の画像を利用して文書上の情報やデータを処理
する方向へ次第に努力が向けられる傾向にある。この画
像は、大抵、走査対象となる文書と走査線上に複数のピ
クチャエレメントすなわち画素を生成するスキャナとの
間の相対的な動作を通じて作成される。このような画素
から成る連続した走査線により、画像形成される領域に
対して画素による一定の配列ができる。この画素は通常
しきい値化され、例えば、各画素がバイナリ1によりデ
ータが有ることを示しバイナリ0によりデータが無いこ
とを示すような、バイナリ1またはバイナリ0による2
進データを生成する。このような配列を、バイナリビッ
トマップイメージと呼んでいる。
【0003】例えば、事務書類などの画像は、機械印刷
による金額を入れた領域を含んでいることが多い。この
ような領域は他と分離した状態、すなわち、金額リスト
や金額欄の一部を形成していることがある。ビットマッ
プイメージ内の各金額の位置が定かでないこのような状
況において、通常、各金額の検出が困難である。
【0004】
【発明が解決しようとする課題】本発明は、バイナリビ
ットマップイメージ内の金額の位置を検出する簡単かつ
経済的な方法およびシステムを提供することを目的とす
る。
【0005】本発明のさらに目的とするところは、特定
文字の認識に依存せずに金額の位置を検出することにあ
る。
【0006】
【課題を解決するための手段】本発明の第一の態様によ
る文書の2値画像内の金額の位置を機械によって検出す
る方法は、(a)バイナリ1すなわち黒の画素がデータ
有りを示し、バイナリ0すなわち白の画素がデータ無し
を示す2値画像のある一定の箇所に既定サイズのウィン
ドウを位置づける段階と、(b)対象を連続した黒の画
素と定義し、前記ウィンドウ内の対象リストを作成する
段階と、(c)分類された部分を作成し、前記分類部分
について文字認識を行わずに金額を示すパターンとの一
致を判断するために、予め定められた基準に従って前記
対象を処理する段階と、(d)金額を示す前記パターン
を用いて、一致が検出されたときに、該分類部分が一定
の幾何学的基準を満たしている場合には、ウィンドウ内
に金額が有ることを示す段階とから成ることを特徴とす
る。
【0007】本発明の第二の態様による文書の2値画像
内にある金額の位置を機械によって検出する方法は、
(a)バイナリ1すなわち黒の画素がデータ有りを示
し、バイナリ0すなわち白の画素がデータ無しを示す2
値画像のある一定の箇所に既定サイズのウィンドウを位
置づける段階と、(b)対象を連続した黒の画素と定義
し、前記ウィンドウ内の対象リストを作成する段階と、
(c)既定の基準により前記対象を部分クラスに分類す
る段階と、(d)前記部分クラスが金額を示す一定の並
びと一致しているか判断するためにこれを審査する段階
と、(e)段階(d)で前記一定の並びが検出された場
合、前記部分クラスのサイズが金額を示す既定のパラメ
タの範囲内にあるか判断するために前記部分クラスを審
査する段階とから成ることを特徴とする。
【0008】本発明による方法は、画像に金額が含まれ
ていない場合には、文書の画像内に「金額」を検出する
ことはまれであるという点において選択能力がある。
【0009】この方法によれば、機械印刷された金額の
周囲にある該当金額とは無関係の項目に対してあまり反
応することはない。
【0010】また、この方法は、金額の画像が低品質
で、かつ文字が途切れて断片化している場合でも有効で
ある。
【0011】さらにこの方法は、コンマおよび小数点の
有無に関わらず機械印刷された金額を検出する。
【0012】前述の利益ならびにそれ以外の点は、以後
の明細書とクレームおよび図面に照らし合わせることに
よって、より容易に理解できるであろう。
【0013】
【実施例】上記のように、本発明は、バイナリビットマ
ップイメージにより機械印刷されたドル金額を検出する
方法に関する。図1は、文書14などの項目を、従来の
ように画像生成がスキャナ18によって行われる走査線
16へ移送する項目移送機構12を具備する装置すなわ
ちシステム10の略図である。スキャナ18がピクセル
データすなわち画素から成る連続した走査行または走査
列を生成する一方、文書14は画素間の関係の読取り処
理に移送される。前記スキャナ18は、例えば、読取り
を行う際に静止した書類上を移動させるハンドヘルドス
キャナでもかまわない。スキャナ18から、さらに画素
データから成る連続した列の処理を行って、画素に関す
るノイズを最小限にし、かつ画素を、例えば、データが
有ることを示すバイナリ「1」やデータが無いことを示
すバイナリ「0」のしきい値にする。この処理は、処理
回路20のみによって示される従来の回路により実行さ
れる。
【0014】処理回路20の出力は、該当する文書14
の画像に対応する(圧縮されていない)2進データすな
わち画素から成るマトリックス22である。本発明の実
行に当たっては、当然、他の不図示のシステムから出力
された2進データによるマトリックス22により開始し
てもかまわない。例えば、幅が約8.5インチの文書を
例に採ると、2進データによるマトリックス22には、
1インチにつき約200画素から成る解像度の場合、1
列につき約1700個の画素が含まれている。データか
ら成るマトリックス22の全体のサイズは各自の用途に
よって当然異なるが、本発明の理解もしくはその操作に
とって個々のサイズは重要ではない。スキャナ18およ
び項目移送機構12は、例えば、独立した制御装置24
によって制御されるか、あるいはデータすなわち画素か
ら成るマトリックス22の処理に用いられる制御装置2
6によって制御される。
【0015】制御装置26(図1)は、本発明によるデ
ータマトリックス22の処理に用いられる従来の制御装
置である。前記制御装置26は、読出し専用メモリ(R
OM28)、ランダムアクセスメモリ(RAM30)、
キーボード(KB32)、ディスプレイ34、インタフ
ェース36および38、図示されたすべての構成部品を
従来のやり方で相互接続する際に用いられるインタフェ
ースおよび制御論理回路40を具備している。図示され
ている制御装置26の形は、制御装置26の動作説明を
簡略化するために用いられたものであり、実際の形は、
図示したものとは異なっている。
【0016】本発明に関する説明を続ける前に、本出願
に用いられる一定の用語を定義しておく。
【0017】「画素」はピクチャエレメント(画像を形
成している最小単位の画像)であり、ある特定の位置に
ある画面すなわち画像の状態を示している。
【0018】「2値画素」は、黒または白の二つの状態
のうちいずれかを示すものである。
【0019】「2値画像」は、2値画素から成る二次元
的配列である。
【0020】「対象」は、連続した黒の画素を指す。こ
の場合、相互の連続形態は、8個の画素に隣接した個々
の画素を基本にしている。図2について説明すると、本
実施例における黒い部分すなわちバイナリ1となってい
る中央の画素40と白いバイナリ0となっている周囲の
8つの画素が示されている。前記中央の画素40は、本
実施例の「対象」とみなされる。すなわち、該バイナリ
1の画素40に対し、前記画素40との連続性を持たせ
るためには、周囲の8つの画素のうち一つだけがバイナ
リ1であればよい。その結果、この二つの黒い画素が
「対象」の構成要素となる。
【0021】「部分」は、対象の集合である。最小単位
の「対象」には、単一の黒の画素も含まれる。前記黒の
画素は「前景」とみなされ、前記白の画素は「背景」と
みなされる。
【0022】「ウィンドウ」は、2値画像の矩形部であ
る。図3は、金額246.00を囲むウィンドウ42を
示している。本発明が機械印刷文字の処理に関すること
から前記文字のおおよそのサイズがすでに判明している
ため、本実施例において、ウィンドウ42はドル金額を
一つ以上含まないようなサイズになっている。
【0023】図3は、複数の数字が書き込まれた加算器
テープの画像である。印刷サイズがすでに判明している
ことから、ウィンドウ42のサイズは、記述データの一
行分を完全に取り囲む大きさが選択される。
【0024】本発明による方法の第一段階は、ウィンド
ウ42内への対象リスト43(図6)の作成である。前
記リスト43は、前記ウィンドウ内の各対象に対して上
下左右に画像座標を有している。ただし、本発明におけ
る対象とは、連続した黒の画素を指すことに注意する。
通常、対象は「部分」に分類された後、後述するように
部分から成るリスト43を形成する。
【0025】本発明による方法の第二段階は、各部分か
ら成る一定の並びを検出することを目的とした「部分」
リスト43の探索である。「ドル」のように(左から右
へ)読まれる金額の処理に関する本実施例において、前
記部分クラスの並び順序は次の通りである。
【0026】文字、ドット、文字、文字 文字、ギャップ、文字、文字 好ましくは、この並び順序が、ドル一桁の後に小数点ま
たはギャップが続き、その後にセント二桁が続く$8.
28のような順序に対応していること。探索が上記二通
りの並びのいずれも検出できない場合、本方法は否定的
結果を伴って終了する。前記探索により上記の並びが検
出された場合、探索は成功とみなされ、右端の文字が予
想される金額の右端の文字となる。「右端の文字」の右
側に位置する他の文字部分は破棄され、「右端の文字」
の左側に位置する他のすべての文字は、前記金額内の文
字とみなされる。
【0027】本発明による方法の第三段階は、前記金額
内の文字部分が一定の幾何学的基準を満たしている点に
ついて判断することを目的とした、前記文字部分の縦方
向の規則性に関する検査である。通常、前記文字部分の
縦方向の長さが審査され、審査対象となっている機械印
刷文字に対して前記長さが基準となるパラメタの範囲内
にあるかどうか判断する。前記条件に合わなかった場
合、前記方法は、ウィンドウ42の「文字部分」に対し
て否定的結果を出して終了する。前記検査が肯定的結果
により終了したときは、機械印刷によるドル金額が検出
されたことを意味している。その場合、前記機械印刷に
よるドル金額を囲んでいる最小の矩形枠の上下左右の各
座標がリスト43上に記録される。このとき、文字部分
は金額に対して正しい順序に配置されている点に注意す
ること。ただし、前記文字が示す内容については識別さ
れていない。この後の矩形枠内の文字部分に対する文字
認識動作により、実際の金額が確認される。
【0028】前述したように、ウィンドウ内の対象リス
ト43は、次の5つの部分クラスに分類される。ただ
し、ここで言う「部分」とは、対象の集合である。前記
クラスは次のように構成される。
【0029】 P−1 文字 1文字に対するほぼ正確なサイズ。
【0030】 P−2 ドット 小数点に対するほぼ正確なサイズ。
【0031】 P−3 コンマ コンマに対するほぼ正確なサイズ。
【0032】P−4 ギャップ 対象を一切含まない
が、部分間の水平方向の空白を示す。
【0033】P−5 断片 上記のいずれにも当て
はまらないもの。
【0034】上記の通り、画像データの対象はリスト4
3内にあり、リスト43は、図1の制御装置26のRA
M30に記憶される。前記対象は、リスト43に並んで
いる順に(P−1〜P−5に)分類される。最後に作成
された部分が現部分であり、最初の段階では現部分に相
当する箇所はない。次の例により、この指定方法が一層
明確になるであろう。
【0035】図4は、図3に示すウィンドウ42の拡大
図であり、各対象が前記ウィンドウ内の画像データとし
て表示されている。この方法の第一段階では、対象を前
述のP−1〜P−5の各部分クラスに分類する。前記分
類の実行に当たり、ここで一般的な段階C−1〜C−1
8によって示される分類プログラムを説明しておく。前
記分類プログラムは、擬似コードで書かれている。
【0036】分類プログラム C−1 if xがウィンドウ42の最上部また
は底部に接する場合、 C−2 then リスト43からxを取り除く。
【0037】C−3 else if xが現部分
と水平方向に重複する場合、 C−4 then 現部分にxを追加し、部分を分
類し直す。
【0038】C−5 else if xの上下方
向の長さがコンマよりも長い場合、 C−6 then C−9 { C−10 if xと現部分の間の水平方向のギャッ
プが充分な大きさであれば、 C−11 then 活字ギャップによる新規部分を
作成する。
【0039】C−12 活字文字による新
規部分を作成する。
【0040】C−13 } C−14 else if xがドットに対して正し
いサイズであれば、 C−15 then 活字ドットによる新規部分を作
成する。
【0041】C−16 else if xがコンマ
に対して正しいサイズであれば、 C−17 then 活字コンマによる新規部分を作
成する。
【0042】C−18 else 活字片による新規
部分を作成する。
【0043】ウィンドウ42内の対象の集合は図4の対
象44から審査されるものとする。分類プログラムの第
一段階(C−1)(以後C1 Prとする)は、xがウ
ィンドウ42の最上部または底部に接するときは、xを
リスト43から取り除くことを示している。この場合、
xは対象44に相当し、したがって、対象44がウィン
ドウ42の最上部に接していることから、完全な一文字
に当たる可能性はないと考えられるため、前記対象がリ
スト43から取り除かれる。その後、本実施例において
対象46に当たるリスト43内の次の対象に対し、審査
が続行される。対象46も、ウィンドウ42の最上部に
接していることから、リスト43から取り除かれる。同
様の処理が繰り返されて、対象48、50、52、5
4、および56も、ウィンドウ42の最上部に接すると
の理由により、リスト43から取り除かれる。
【0044】部分クラスに対する分類審査の次の対象
は、図4の数字58によって示される対象「2」であ
る。本実施例において、48や56などの対象はすべて
前記の理由によりリスト43から除外されていることか
ら、今のところ「現部分」に該当する箇所はない。対象
「2」は、ウィンドウ42の最上部に接していないこと
から、C1 Prは段階C−3に進む。段階C−3で
は、(現時点では現部分がないことから)xは現部分と
水平方向に重複しないため、C1 Prは段階C−4に
進む。段階C−4においてxが現部分に加えられること
から、対象「2」が現部分として分類し直される。段階
C−5において、対象「2」がコンマよりも大きいこと
から、引き続き段階C−9〜C−13に進む。前記部分
に対し、段階C−12では、新規部分(P−1)すなわ
ち文字が作成される。残りの段階C−14〜C−18
は、対象「2」に適用されない。
【0045】図4のウィンドウ42で審査される次の対
象は、数字「4」を表す対象60である。対象60がウ
ィンドウ42の最上部または底部に接していないことか
ら、段階C−1〜C−2は適用されない。段階C−3に
おいて、xすなわち対象60が審査され、本実施例の現
部分すなわち対象58と重複しているか判断する。前記
重複は、リスト43内の各種対象に関する座標によって
判断する。対象60が現部分58と重複していないこと
から、対象60は、段階C−4において「現」部分とし
て分類し直される。分類の一環として、段階C−5にお
いて、対象の縦方向のサイズがコンマよりも大きいかど
うか判断するためにその高さについて評価が行われる。
C1 Prでは、本実施例の機械印刷文字の既定サイズ
を知ることにより、対象60のサイズがコンマよりも大
きいかどうか判断する。コンマよりも大きい場合は、さ
らに段階C−9〜C−13に進む。C−12において、
対象60は、一文字分のほぼ正しいサイズを有する新規
部分(P−1)として分類される。段階C−9および段
階C−13の符号は、「処理中は、両符号間の段階をす
べて実行すること」という意味である。
【0046】引き続き本実施例を実施する場合、次の対
象は、文字「6」を構成している相互に分離した対象6
2および64である。対象62は、文字「6」の左部分
を形成し、対象64は文字の右部分を形成している。本
実施例において前記審査は左から右へ進行していること
から、次の審査対象は対象62になる。対象62は、ウ
ィンドウ42の最上部または底部に接していないことか
ら、審査はさらに段階C−3へ進む。対象62は現部分
(対象60)と重複していないことから、対象62すな
わち「6」の左部分が現部分となる。段階C−5によ
り、対象62はコンマよりも大きいことから、C1 P
rは段階C−9〜C−13へ進む。活字文字の新規部分
(P−1)は、段階C−12で作成される。このとき、
C1 Prは対象62を単一の文字部分として解釈する
が、文字「6」の一部である対象64に関する次処理の
段階C−3で出される重複の有無に関する問いによって
記正される。
【0047】C1 Prに関する処理が、同様に次の対
象64に対して繰り返される。各段階は、図6のウィン
ドウ42内の「6」の左部分に関する対象62とほぼ同
じであるが、対象64が現部分と「重複」している点に
関して違いがある。段階C−3において、対象64すな
わち文字「6」の右半分に当たるxは、現部分(対象6
2)と水平方向に重複している。ここで、リスト43上
の各対象の画像位置座標が、対象の重複を判断するため
に再び利用されている。段階C−4から、x(対象6
4)が現部分(対象62)に加えられ、ウィンドウ42
の次の対象66に対し、現部分として分類し直される。
つまり、一文字としてすでに分類されている対象62が
対象64と結合され、今度はこの二つの対象が一文字と
して分類される。対象62がサイズの小さい対象である
ことから、例えば、コンマすなわちP−3として分類さ
れる可能性も考えられる。しかし、これが段階C−3に
関連のある重複検査であることから、対象62と対象6
4を組み合わせたものは、P−1すなわち一文字分のほ
ぼ正しいサイズとして分類されると考えられる。個々の
部分が小さくても、前述した「重複」手法により集積さ
せることによって、一文字分の大きさの部分を形成でき
る。ただし、コンマおよびドットは、小型の独立した対
象の一つにすぎない。
【0048】対象66がC1 Prによって処理される
とき、結合対象62および64(図4)は、前記処理に
対して現部分として扱われる。前記繰返し処理により、
対象66は正しいサイズを有していると判断され、段階
C−14およびC−15に示すドット(P−2)として
分類される。場合によっては、例えば、印刷状態が悪い
等の理由により、対象66が充分な大きさを持たず、ド
ットとして解釈されないことも考えられる。このような
場合、段階C−18において非常に小さいドットが(P
−5)として分類されるが、これは金額を含む画像デー
タの位置検出に役立つクラスに相当しないことを示して
いる。このような事態が生じた場合、本実施例の数字
「6」は引き続き現部分となる。対象68は、前記と同
様に処理される。対象68はコンマよりも大きい(C−
5)ことから、C1 Prは段階C−9〜C−13へ進
む。段階C−10において、x(対象68)と現部分
(結合対象62および64)の間のギャップは「充分な
大きさ」が採られていることから、小数点が検出される
空間であることがわかる。同様に、x(対象66)と現
部分(結合対象62および64)の間の水平距離は、段
階C−10においてギャップ(P−4)として分類され
る。「コンマ」の識別手順は、段階C−16でコンマの
物理的サイズが判断され、段階C−17で新規部分のコ
ンマ(P−3)の分類が行われること以外は、ドットの
処理に用いられたものと同じである。
【0049】図4のウィンドウ42内の対象に関する処
理を再度検討すると、対象68および70が、すでに説
明した手法によって文字(P−1)として分類される。
対象72は、加算器テープ上の(+)のような符号を示
しており、断片(P−5)として分類されるが、これ
は、ウィンドウ42内の画像データが金額を示している
か判断するうえで用いるクラスではないことを示すもの
である。残りの対象74、76、78、80、および8
2は、ウィンドウ42の底部に接触することから、段階
C−1においてC1 Prの処理によってリスト43か
ら除外される。
【0050】図4のウィンドウ42内の対象に関する処
理を見直すと、対象58、対象60、結合対象62およ
び64、対象68、および対象70が文字(P−1)と
して分類されている。文字(6および0)間の水平距離
が、本実施例に示す充分な長さを有している場合、ギャ
ップ(P−4)とみなされる。ドットはP−2によっ
て、またコンマはP−3によって示される。ウィンドウ
42の画像データが上記の通り分類された後、ウィンド
ウは評価対象となる現在の新しい画像データに移動す
る。各種対象の部分クラスへの分類により、本発明によ
る方法の第一段階が終了する。
【0051】上記の通り、本発明による前記方法の第二
段階は、既定の「並び」を検出することを目的とした、
文書14の画像データに対する各分類部分(P−1〜P
−4)から成るリスト43の探索に関するものである。
このような並びは、金額を示している。本実施例におい
て前記金額は「ドル」金額を指しているが、これと同じ
原理を拡張し、ドル以外の金額を示す並びを扱うことも
可能である。
【0052】「ドル」金額には、分類部分から成るリス
ト43の審査を行う際に検出される部分クラス(P−1
〜P−4)によって構成される二種類の並び順序があ
る。前記並びは、次のようなものである。
【0053】並び1 文字、ドット、文字、文字 または、 並び2 文字、ギャップ、文字、文字 各分類部分から成るリスト43を探索した結果、前記二
種類の並びのいずれも検出されなかった場合、探索は否
定的結果を出して終了する。このことは、分類された画
像データには金額が含まれていないことを意味してい
る。その後、処理はリスト43の次の並びすなわち記載
項目に進む。並び1は、例えば、$8.48などのドル
金額を示すものであり、この場合、金額には小数点が存
在する。並び2は、同じ金額を示すものではあるが、何
らかの理由によって小数点がC1 Prにより翻訳され
ずに、上記の通り、金額の「8」と「4」の間のギャッ
プが小数点として翻訳かつ分類されたものである。この
とき、文字が文字として解釈されたのではなく、単に、
部分の並びが金額の既定パターンに合致しただけである
点に注意すること。本実施例において、ドル金額$8.
48のセントを表す桁の右側に位置する部分は無視され
るが、最も右側の桁の左側にある部分は金額を表す文字
とみなされる。また、例えば、千ドル以上の金額につい
ては、通常の金額の表示方法に従い、一定の文字の間に
コンマを入れる。各部分から成る並びが金額を示す場
合、前記並びは強調表示される。これにより、本発明の
第二段階が終了する。
【0054】本発明の第三段階は、C1 Prによって
分類された各部分が一定の幾何学的基準に則している点
について判断することを目的とした、各部分に対する縦
方向の規則性検査に関するものである。通常、審査対象
となる機械文字に対し、文字部分の縦方向の長さが、基
準となるパラメタの範囲内にあるかどうか判断するため
に、前記長さの審査が行われる。この審査により、分類
された文字が実際に文字であることがさらに確実なもの
となる。前記条件に合わない場合は、ウィンドウ42内
の「文字部分」に対し、前記方法が否定的結果を出して
終了する。審査が肯定的結果を伴って終了した場合は、
機械印刷によるドル金額が検出されたことになる。金額
が検出された場合は、前記ドル金額を囲んでいる最も小
さい矩形枠の上下左右の各座標がリスト43に記録され
る。このとき、文字部分はドル金額に対して正しい順序
に並んでいるが、各文字が表している内容については識
別されていない点に注意する。実際の金額の確認は、矩
形枠内の文字部分に対して後続の文字認識動作が実行さ
れることにより行われる。
【0055】本方法の第二段階において分類部分の並び
1または並び2のいずれが検出されても、前記第三段階
により、分類文字(P−1)の最上部と底部が検査さ
れ、前記文字の縦方向の長さが一定のパラメタ内にある
ことを確認する。図5の略図により、この検査方法を示
している。
【0056】文字の最上部と底部によって示される前記
文字の縦方向の長さに関する検査は、図5を参照すると
よく理解できる。上記の通り、ウィンドウ42は、文書
14に関する囲みのある画像データの位置付けをする一
定の座標を有している。さらにウィンドウ42には原点
0、0(xおよびy座標用)があり、ウィンドウ42内
の文字の最上部と底部に対する測定用の基準点として用
いられる。この処理の第三段階に用いられる式を次に示
す。
【0057】
【数1】 引き続き図5に示す例を説明すると、文字の最上部8
4、86、88、および90は、これから説明する計算
に使用されるものである。さらに、前述した最上部の距
離は、それぞれ、23、24、22、23であり、これ
は、図5に示すウィンドウ42の原点0、0からの単位
である。前記4つの距離を加算してN(4)で割ると、
平均値t=23が得られる。この平均値23は、破線9
2で示されている。底部94、96、98、および10
0の4つの距離3、4、2、および3を加算してNで割
ると、式2により平均値b=3が得られる。
【0058】処理の次の段階は、式3および式4により
判断を行うものである。式3は、図5の各文字のそれぞ
れの最上部が、破線92に示す平均値(23)を基準に
したとき見られるバラツキの絶対偏差を示すものであ
る。図示している例の場合、最上部84、86、88、
および90の平均値23(破線92)からの絶対距離
は、それぞれ、0、1、1、0であり、合計が2にな
る。式3のNが4であることから、Tは2/4すなわち
0.5となる。式4は、同様に処理されBが計算され
る。以上の例は、前記処理に用いられる手法の説明のた
め、大幅に簡素化されている。
【0059】式5および式6は、本システムの規則性に
必要な条件に関するものである。式5および式6の要素
Dは、既定の解像度に依存するしきい値を示している。
例えば、この方法が採用される本システムの解像度が、
1インチにつき200画素であるとする。このような解
像度であれば、文字の最上部と底部に既定数の画素以上
のバラツキはないと言うことができる。この既定数が、
上記の式のDに当たる。このような条件に合わない場
合、本方法は否定的結果を出して終了する。この条件に
合えば、本方法は肯定的結果を出して終了し、機械印刷
によるドル金額が検出されたことになる。また、前記金
額を囲む最小の矩形枠による前記金額の上下左右の各座
標が、この金額に対して用いられる。
【0060】図6および図7を合わせて参照することに
より、本発明による方法に関する総体的な段階が理解で
きる。楕円や矩形などの各種囲み図形を、以後ステップ
と呼ぶことにする。本方法は、ステップ102から開始
する。ステップ104においてウィンドウ42が作成さ
れ、ステップ106で対象リスト43が作成される。ま
た、リスト43に含まれる対象の処理は、図7にも示さ
れているステップ108から開始する。
【0061】対象に関する処理(図7)は、「対象リス
ト43は空か?」という問いが出されるステップ110
により開始する。ここで、対象に関する処理が開始し、
リスト内の次の対象が取り上げられるステップ112に
示すようにすでに処理された対象があるものとする。次
に、ステップ114において、「xはウィンドウ42の
最上部または底部に接しているか?」という問いが出さ
れる。「YES」の場合、本方法は、対象が活字片(P
−5)の新規部分となるステップ116に進む。対象x
がウィンドウ42の最上部と底部のいずれにも接してい
ない場合は、図4の対象62および64に関する説明の
通り、「xは現部分と水平方向に重複しているか?」と
いう問いが出されるステップ118に進む。「YES」
の場合、ステップ120に示す通り、対象が現部分に加
えられる。
【0062】ステップ114からさらに処理を続行する
と、xが現部分と水平方向に重複していない場合、ステ
ップ122(図7)に進む。ステップ122では、「x
の縦方向の長さはコンマよりも長いか?」という問いが
出される。「YES」の場合、ステップ124に進み、
ここでは、xおよび現部分間の水平距離が、対象64と
対象68の間の距離に関して説明した(図4)ギャップ
に対して充分な大きさであるかどうか判断するための審
査が行われる。ステップ124の答えが「YES」であ
れば、ステップ126で活字ギャップ(P−4)の新規
部分が作成される。「NO」であれば、ステップ128
で活字文字(P−1)の新規部分が作成される。
【0063】ここで図7のステップ122に戻り、xの
縦方向の長さがコンマよりも長い場合、ステップ130
(図7)に進む。ステップ130では、「xはドットに
対して正しいサイズか?」という問いが出される。「Y
ES」であれば、ステップ132で活字ドット(P−
2)の新規部分が作成される。ステップ130の答えが
「NO」であれば、ステップ134に進み、「xはコン
マに対して正しいサイズか?」という問いが出される。
答えが「YES」であれば、ステップ136に進み、活
字コンマ(P−3)の新規部分が作成される。ステップ
134の答えが「NO」であれば、ステップ116に進
み、活字片(P−5)の新規部分が作成される。この活
字片の分類は、P−1〜P−4のクラスのいずれにも当
てはまらないことを示している。
【0064】図7の各ステップは、図6の総体的ステッ
プ138によって示されており、このステップは各部分
の作成と分類に関するものである。対象リストが空であ
るとき(図7のステップ110)、図6にも示されてい
るステップ140に進む。ステップ140からは、ステ
ップ142に進み、部分P−1〜P−5の並びを探索し
てドル金額のパターンを検出する処理が行われる。パタ
ーンの一致すなわち並び順序は次の二通りである。
【0065】並び1 文字、ドット、文字、文字 または、 並び2 文字、ギャップ、文字、文字 ステップ144で一致するパターンがある場合は、ステ
ップ146に進み、前記部分が予め定められた規則性に
必要な条件を満たしているかどうか判断するために審査
が行われる。前記審査は、前述した式1〜式6により実
施される。前記部分が条件を満たしている場合、すなわ
ち適正なサイズである場合は、ステップ148に進み、
各部分はドル金額が検出されたことを示すものであるこ
とが確認される。前記部分がステップ146の条件に合
わない場合は、特定のウィンドウ42に対しドル金額が
全く検出されなかったことを示している(ステップ15
0)。
【0066】図6のステップ146が終了すると、ウィ
ンドウ42(図3)は移動して前記画像の新しい部分を
囲み、新規ウィンドウ内の画像データが、図6および図
7に述べた手順によって審査される。
【0067】
【発明の効果】以上詳細に説明したように、本発明によ
れば、2値画像内の一定箇所にウィンドウを位置付けて
対象リストを作成し、分類した部分クラスと金額パター
ンとの一致を検出し、さらに各部分クラスが幾何学的基
準に合致している点を確認することにより、文字認識に
依らずに2値画像内の金額の位置を検出できるようにな
るので、機械印刷された金額の検出が容易になり、経済
性が向上する。
【図面の簡単な説明】
【図1】 本発明による方法を実行する際に用いる装置
を示す全体図である。
【図2】 中央の画素と周囲の画素を示す略図である。
【図3】 文書の2値画像内の一定のデータを囲むウィ
ンドウを示す略図である。
【図4】 図3に示すウィンドウの拡大図である。
【図5】 ウィンドウ内の文字の規則性に関する検査に
用いる文字の最上部と底部を示す線図である。
【図6】 両図面により、本発明の方法に関する総体的
段階を示している。
【図7】 両図面により、本発明の方法に関する総体的
段階を示している。
【符号の説明】
10 システム 12 項目移送機構 14 項目 16 走査線 18 スキャナ 20 処理回路 22 データマトリックス 24 制御装置 26 制御装置 28 読出し専用メモリ(ROM) 30 ランダムアクセスメモリ(RAM) 32 キーボード 34 ディスプレイ 36 インタフェース 38 インタフェース 40 インタフェースおよび制御論理回路

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】(a)バイナリ1すなわち黒の画素がデー
    タ有りを示し、バイナリ0すなわち白の画素がデータ無
    しを示す2値画像のある一定の箇所に既定サイズのウィ
    ンドウを位置づける段階と、(b)対象を連続した黒の
    画素と定義し、前記ウィンドウ内の対象リストを作成す
    る段階と、(c)分類された部分を作成し、前記分類部
    分について文字認識を行わずに金額を示すパターンとの
    一致を判断するために、既定の基準に従って前記対象を
    処理する段階と、(d)金額を示す前記パターンを用い
    て、一致が検出されたときに、関連する分類部分が一定
    の幾何学的基準を満たしている場合には、ウィンドウ内
    に金額が有ることを示す段階とから成る文書の2値画像
    内にある金額の機械による位置検出方法。
  2. 【請求項2】(a)バイナリ1すなわち黒の画素がデー
    タ有りを示し、バイナリ0すなわち白の画素がデータ無
    しを示す2値画像のある一定の箇所に既定サイズのウィ
    ンドウを位置づける段階と、(b)対象を連続した黒の
    画素と定義し、前記ウィンドウ内の対象リストを作成す
    る段階と、(c)既定の基準により前記対象を部分クラ
    スに分類する段階と、(d)前記部分クラスが金額を示
    す一定の並びと一致しているか判断するためにこれを審
    査する段階と、(e)段階(d)で前記一定の並びが検
    出された場合、前記部分クラスのサイズが金額を示す既
    定のパラメタの範囲内にあるかどうかどうか判断するた
    めに前記部分クラスを審査する段階とから成る文書の2
    値画像内にある金額の機械による位置検出方法。
JP6130144A 1993-06-15 1994-06-13 2値画像内の機械印刷された金額の検出方法 Pending JPH07141463A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/077,692 1993-06-15
US08/077,692 US5444793A (en) 1993-06-15 1993-06-15 Method for detecting machine printed monetary amounts in binary images

Publications (1)

Publication Number Publication Date
JPH07141463A true JPH07141463A (ja) 1995-06-02

Family

ID=22139528

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6130144A Pending JPH07141463A (ja) 1993-06-15 1994-06-13 2値画像内の機械印刷された金額の検出方法

Country Status (5)

Country Link
US (1) US5444793A (ja)
EP (1) EP0629970B1 (ja)
JP (1) JPH07141463A (ja)
AU (1) AU664518B2 (ja)
DE (1) DE69428082T2 (ja)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5905810A (en) 1990-02-05 1999-05-18 Cummins-Allison Corp. Automatic currency processing system
US6748101B1 (en) 1995-05-02 2004-06-08 Cummins-Allison Corp. Automatic currency processing system
US6363164B1 (en) 1996-05-13 2002-03-26 Cummins-Allison Corp. Automated document processing system using full image scanning
US5982918A (en) 1995-05-02 1999-11-09 Cummins-Allison, Corp. Automatic funds processing system
US6661910B2 (en) 1997-04-14 2003-12-09 Cummins-Allison Corp. Network for transporting and processing images in real time
US8950566B2 (en) 1996-05-13 2015-02-10 Cummins Allison Corp. Apparatus, system and method for coin exchange
US8162125B1 (en) 1996-05-29 2012-04-24 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US7903863B2 (en) 2001-09-27 2011-03-08 Cummins-Allison Corp. Currency bill tracking system
US20050276458A1 (en) 2004-05-25 2005-12-15 Cummins-Allison Corp. Automated document processing system and method using image scanning
US7187795B2 (en) 2001-09-27 2007-03-06 Cummins-Allison Corp. Document processing system using full image scanning
US6021883A (en) * 1996-11-25 2000-02-08 Cummins Allison, Corp. Funds processing system
US8478020B1 (en) 1996-11-27 2013-07-02 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US6039645A (en) 1997-06-24 2000-03-21 Cummins-Allison Corp. Software loading system for a coin sorter
US5940623A (en) 1997-08-01 1999-08-17 Cummins-Allison Corp. Software loading system for a coin wrapper
US6637576B1 (en) 1999-04-28 2003-10-28 Cummins-Allison Corp. Currency processing machine with multiple internal coin receptacles
AU4679400A (en) 1999-04-28 2000-11-10 Cummins-Allison Corp. Currency processing machine with multiple coin receptacles
US8701857B2 (en) 2000-02-11 2014-04-22 Cummins-Allison Corp. System and method for processing currency bills and tickets
US7647275B2 (en) 2001-07-05 2010-01-12 Cummins-Allison Corp. Automated payment system and method
US8437530B1 (en) 2001-09-27 2013-05-07 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US8437529B1 (en) 2001-09-27 2013-05-07 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US8428332B1 (en) 2001-09-27 2013-04-23 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US8944234B1 (en) 2001-09-27 2015-02-03 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US8433123B1 (en) 2001-09-27 2013-04-30 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US6896118B2 (en) 2002-01-10 2005-05-24 Cummins-Allison Corp. Coin redemption system
EP1376484A1 (en) * 2002-06-25 2004-01-02 Mars Incorporated Method and apparatus for processing signals in testing currency items
US7167587B2 (en) * 2002-08-30 2007-01-23 Lockheed Martin Corporation Sequential classifier for use in pattern recognition system
US8171567B1 (en) 2002-09-04 2012-05-01 Tracer Detection Technology Corp. Authentication method and system
US8627939B1 (en) 2002-09-25 2014-01-14 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
CN100338618C (zh) * 2004-09-30 2007-09-19 致伸科技股份有限公司 一种倾斜图像自动校正方法
US7946406B2 (en) 2005-11-12 2011-05-24 Cummins-Allison Corp. Coin processing device having a moveable coin receptacle station
US7980378B2 (en) 2006-03-23 2011-07-19 Cummins-Allison Corporation Systems, apparatus, and methods for currency processing control and redemption
US7929749B1 (en) 2006-09-25 2011-04-19 Cummins-Allison Corp. System and method for saving statistical data of currency bills in a currency processing device
US8417017B1 (en) 2007-03-09 2013-04-09 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
GB2459223B (en) 2007-03-09 2012-07-11 Cummins Allison Corp Document imaging and processing system
US8538123B1 (en) 2007-03-09 2013-09-17 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US8391583B1 (en) 2009-04-15 2013-03-05 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US8437532B1 (en) 2009-04-15 2013-05-07 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US8929640B1 (en) 2009-04-15 2015-01-06 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US9141876B1 (en) 2013-02-22 2015-09-22 Cummins-Allison Corp. Apparatus and system for processing currency bills and financial documents and method for using the same

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4034210A (en) * 1975-09-19 1977-07-05 Dynetics Engineering Corporation Credit card carriers and methods of manufacture
CH609795A5 (ja) * 1976-04-30 1979-03-15 Gretag Ag
US4172552A (en) * 1978-09-21 1979-10-30 Case John M Credit card processing system
JPS57101986A (en) * 1980-12-17 1982-06-24 Toshiba Corp Character detecting and cutting method
US4564752A (en) * 1982-12-23 1986-01-14 Ncr Canada Ltd Concurrent, image-based, reject-re-entry system and method
US4817186A (en) * 1983-01-07 1989-03-28 International Business Machines Corporation Locating individual images in a field for recognition or the like
US4685141A (en) * 1983-12-19 1987-08-04 Ncr Canada Ltd - Ncr Canada Ltee Method and system for finding image data associated with the monetary amount on financial documents
JPS60164867A (ja) * 1984-02-06 1985-08-27 Glory Ltd 小切手カ−ド自動発行装置
US4680803A (en) * 1984-12-17 1987-07-14 Ncr Corporation Method and apparatus for isolating image data for character recognition
US4797882A (en) * 1985-10-02 1989-01-10 American Telephone And Telegraph Company, At&T Bell Laboratories Mesh-based switching network
GB2190778B (en) * 1986-05-19 1990-04-25 Ricoh Kk Character recognition with variable subdivisions of a character region
US4903313A (en) * 1986-07-03 1990-02-20 Ricoh Company, Ltd. Character recognition method
US5208869A (en) * 1986-09-19 1993-05-04 Holt Arthur W Character and pattern recognition machine and method
WO1988002157A1 (en) * 1986-09-19 1988-03-24 Arthur Wheeler Holt Character and pattern recognition machine and method
US5053607A (en) * 1986-10-06 1991-10-01 Carlson Steven R Point-of-sale device particularly adapted for processing checks
JPS63182793A (ja) * 1987-01-26 1988-07-28 Sharp Corp 文字切り出し方式
US5040226A (en) * 1988-05-31 1991-08-13 Trw Financial Systems, Inc. Courtesy amount read and transaction balancing system
US4901365A (en) * 1988-12-19 1990-02-13 Ncr Corporation Method of searching binary images to find search regions in which straight lines may be found
JPH0348328A (ja) * 1989-07-14 1991-03-01 Sharp Corp 桁揃え機能を有する文字処理装置
US5151948A (en) * 1990-03-12 1992-09-29 International Business Machines Corporation System and method for processing documents having amounts recorded thereon
US5119433A (en) * 1990-03-12 1992-06-02 International Business Machines Corporation Method and system for locating the amount field on a document
EP0551392A1 (en) * 1990-09-28 1993-07-21 Unisys Corporation Character recognition methods including separating and extractingparticular portions from extracted data

Also Published As

Publication number Publication date
EP0629970A3 (en) 1995-03-15
AU664518B2 (en) 1995-11-16
DE69428082T2 (de) 2002-03-28
AU6346994A (en) 1994-12-22
US5444793A (en) 1995-08-22
EP0629970A2 (en) 1994-12-21
EP0629970B1 (en) 2001-08-29
DE69428082D1 (de) 2001-10-04

Similar Documents

Publication Publication Date Title
JPH07141463A (ja) 2値画像内の機械印刷された金額の検出方法
JP3308032B2 (ja) スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置
EP0621552B1 (en) Method and apparatus for automatic character script determination
EP0723247A1 (en) Document image assessment system and method
US5915039A (en) Method and means for extracting fixed-pitch characters on noisy images with complex background prior to character recognition
JP6900164B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP2001109895A (ja) 複数のディジタル画像の処理方法
EP0045803A1 (en) System and method for processing horizontal line characteristics in an image
JP2001101426A (ja) ディジタル画像処理方法
JP5111055B2 (ja) 画像処理装置及び画像処理方法、コンピュータプログラム
JPH0512487A (ja) バーコード文字の光学的認識システム及び認識方法
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP2021044803A (ja) 画像処理装置、画像処理方法、及びプログラム
MXPA02008494A (es) Correccion de distorsiones en el proceso de formas.
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JP2002133424A (ja) 文書の傾き角度及び境界の検出方法
JP2009116520A (ja) 画像認識装置、画像認識方法及びプログラム
JP2020047138A (ja) 情報処理装置
JP4242962B2 (ja) 文字切出装置
US11710331B2 (en) Systems and methods for separating ligature characters in digitized document images
JP4810995B2 (ja) 画像処理装置、方法及びプログラム
KR19990011500A (ko) 화상 시스템의 국부 이치화 방법
JP2003016385A (ja) 画像処理装置、方法、プログラム、及び記憶媒体
JP2001043372A (ja) 文字検査装置
JPS6337488A (ja) 文字認識方法