JPH05225390A - 光学的文字認識のためのドット・マトリックス・ビデオの位置をつきとめフィルタリングする方法および装置 - Google Patents

光学的文字認識のためのドット・マトリックス・ビデオの位置をつきとめフィルタリングする方法および装置

Info

Publication number
JPH05225390A
JPH05225390A JP4293287A JP29328792A JPH05225390A JP H05225390 A JPH05225390 A JP H05225390A JP 4293287 A JP4293287 A JP 4293287A JP 29328792 A JP29328792 A JP 29328792A JP H05225390 A JPH05225390 A JP H05225390A
Authority
JP
Japan
Prior art keywords
signal
dot matrix
video data
input video
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4293287A
Other languages
English (en)
Inventor
George A Hadgis
ジョージ・アンソニー・ハッジス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eastman Kodak Co
Original Assignee
Eastman Kodak Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eastman Kodak Co filed Critical Eastman Kodak Co
Publication of JPH05225390A publication Critical patent/JPH05225390A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】 【目的】 ディジタルイメージのドットマトリックス印
字テキストを見つけ、それが含まれると判断された領域
のみをフィルタする方法及び装置を提供する。 【構成】 ピクセル単位で走査される文書のドット・マ
トリックス印字を検出し、該ドットマトリックス印字が
存在する場所を示すフィルタマスクを提供する装置にお
いて、文書を走査して入力ビデオデータ信号を提供する
手段、入力ビデオデータのドットマトリックス印字文字
の存在を検出してフィルタマスク信号を生じる手段(2
25)、入力ビデオデータ信号を第1の経路に沿ってフ
ィルタする手段(226)、入力ビデオデータ信号を第
2の経路に沿って所定の量だけ遅らせる手段(22
7)、及びフィルタマスク信号に応答して第1の経路の
信号を選択し、フィルタマスク信号が存在しない時は第
2の経路の信号を選択するセレクタ手段(228)、か
らなる装置。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ドット・マトリックス
印字されたテキストを2進数イメージ内に配置し、ドッ
ト・マトリックス印字テキストを含むように決定された
文書イメージのこれら領域をフィルタするシステムに関
する。ドット・マトリックス印字テキストのある特性に
より決定されると、ピクセル近傍はドット・マトリック
ス印字テキストを含むものとしてフラッグを立てられ
る。これら近傍は、全てのドット・マトリックス印字テ
キストの位置を識別するマップ即ちフィルタ・マスクを
生成することにより識別される。次いで、制御システム
を用いて、ピクセルのある近傍がフィルタ・アルゴリズ
ムを用いて処理されるべきかを判定する。
【0002】従って、ドット・マトリックス印字テキス
トを含むものと判定されたあるイメージ内の領域のみ
が、改善された光学的文字認識のため強調される。
【0003】
【従来の技術】文字のディジタル化イメージ・データを
そのASCIIデータへ変換するため、光学的文字認識
(OCR)アルゴリズムが広範囲の用途において現在使
用されている。これは、数千の文書が毎日処理されるデ
ータ入力用途において特に有効である。例えば、健康申
告書式の処理において、今日多くの保険会社がデータ入
力員を介してそのデータベースにデータを入力する。O
CRを利用することにより、データはより正確にかつ高
いスループットでデータベースに入力することができ、
これにより関連するコストを低減する。
【0004】OCRは、ゴシックまたはクーリエの如き
タイプで打ったフォントに対して特に適用可能である。
これらの形式のフォントについてのOCRの読みやすさ
は、かなりよい。しかし、前記の保険産業においては、
申告書式は多くの異なる供給源から受取られる。これら
書式のあるものは、タイプライタを用いて埋められ、あ
るものは手書きで埋められ、他のものはドット・マトリ
ックス・プリンタで埋められている。これら入ってくる
文書の分類は、保険会社が、タイプで打った文書を読取
るためOCR装置を使用し、手で写された文書に対して
手動データ入力をすることを可能にする。しかし、ドッ
ト・マトリックス書類は、機械が生成するものである
(タイプ打ちと手書きとして分類することが容易でな
い)が印字品質は低いOCR読取り速度(従って、誤り
を直すため更に多くの人手によるデータ入力)となる。
【0005】
【発明が解決しようとする課題】タイプ打ちテキストに
対する認識速度は、一貫した印字品質により非常に良好
である。例えば、ゴシック文字の「S」はクーリエの
「S」と非常によく似ているが、いずれの「S」も数字
「5」とは容易に弁別し得る。異なるプリンタのドット
・マトリックス文字もまた似ているが、「5」を「S」
から弁別する情報は少ない。このことは、安いプリンタ
の典型である9ピンのドラフト品質のドット・マトリッ
クスに特に妥当する。文字を形成する個々のドットは、
ドット・マトリックス印字テキストに対して特に開発さ
れなかったOCRアルゴリズムを混乱させる傾向があ
り、これにより精度を低下させる。
【0006】タイプライタから得られる如き連続的なフ
ォントについて培われたOCRアルゴリズムは、ドット
・マトリックス・プリンタで得られる文字よりもはるか
に正確にその文字を認識する。ドット・マトリックス印
字テキストに対する読取り速度は、米国特許出願第57
5,715号「DOT−MATRIX ENHANCE
MENT FOR OPTICAL CHARACTE
R RECOGNITION」に記載されるようにイメ
ージ・データをフィルタすることにより増加し得ること
が判った。不都合にも、このフィルタの使用は、OCR
アルゴリズムによる受入れ得る認識を越えてフィルタが
タイプライタ打ちテキスト・イメージを歪めるため、ユ
ーザがドット・マトリックス印字テキストをタイプライ
タ打ち文書から分けることを必要とした。別の短所は、
ある文書に対するOCRアルゴリズムにより「読取られ
る」ビデオ情報が全て同じタイプでなければならない
(即ち、ドット・マトリックス印字テキストまたはタイ
プライタ打ちテキストのいずれかであって、両方ではな
い)ことである。タイプライタ打ちテキストからドット
・マトリックス印字テキストを弁別できることが重要で
あるのは、この理由からである。
【0007】ドット・マトリックス・フィルタをドット
・マトリックス検出回路と組合わせることにより、この
システムは、ドット・マトリックス印字テキストを含む
ものとして識別された領域の位置をつきとめそのテキス
トをフィルタリングし、タイプライタ打ちテキストの読
取り精度に影響を及ぼすことなくドット・マトリックス
印字テキストの読取り精度を実質的に改善する。
【0008】
【課題を解決するための手段】本発明は、2つのタイプ
の印刷物を識別して位置をつきとめることができるよう
に、文字のビデオ・イメージ・データ(タイプライタと
ドット・マトリックスの両方)を調べることが可能であ
るシステムを提供する。
【0009】従って、ドット・マトリックス・イメージ
・データは、識別される時、タイプライタ打ちテキスト
をフィルタすることなくフィルタされ、この全ては検出
アルゴリズムにより判定される。
【0010】本発明の目的は、イメージの各サブセクシ
ョンについて作業を行う必要なく上記の手順を実行する
ことにある。
【0011】本発明の別の目的は、走査装置の全データ
速度で走査装置からのイメージ・データのスループット
の低下なしに上記の如くイメージ・データを処理するこ
とにある。
【0012】
【実施例】ドット・マトリックス印字文字をタイプライ
タ打ち文字から識別する1つの特性は固有の不連続性で
ある。図1Aにおいて、ドット・マトリックス印字文字
「R」10が個々のドット12とスペース(不連続)1
4とからなることが判る。図1Bは、タイプライタ打ち
文字「R」16のビット・マップである(このタイプの
文字は図1Aに見出される不連続14がないことに注
意)。ドット・マトリックス印字テキスト10の不連続
14を取除くことにより、OCRアルゴリズムは文字認
識を改善する更なる情報が提供される。
【0013】ドット・マトリックス印字テキストの検出
の背後にある原理は、1つの文字のビット・マップ化さ
れたイメージ・データを処理して、固有の不連続を探す
ことである。図2は、200DPI(ドット/インチ)
で走査されたドット・マトリックス印字文字「B」の実
際のビデオ・データである。強調されたマス目18は、
特定のビット・パターンを含む。実際に、水平、垂直、
および左右の対角方向に異なる一連の多数のピクセルを
調べるならば、これに似たビット・パターンを識別する
ことができる。
【0014】図2のマス目18で強調されたビット・パ
ターンが図3に示される。白いピクセル26、28によ
り分けられた3つのグループの黒いピクセル20、2
2、24があることに注意。実際に、図2を全ての4つ
の予め定めた方向(水平、垂直、および左右の対角方
向)で厳密に(ピクセル単位に)調べることにより、似
た特性を持つピクセルの8つのシーケンスを見出すこと
ができる。このグループの特徴的なビット・パターン
は、特徴ビット・パターン32で示されるピクセル・シ
ーケンスにより一般化することができ、そしてこれはド
ット・マトリックス印字テキストを検出するため本文全
体にわたり使用されるビット・パターンである。明るく
点彩されたピクセル34は、カーネルにおける無用の
(don’t care)ピクセルを表わし、この特定
のピクセルがドット・マトリックス印字テキストの存在
の判定に使用されないことを示す。白いピクセル36
は、ドット・マトリックス印字テキストに特有の図2に
示された不連続14を表わすカーネル(kernal)
におけるピクセルである。黒いピクセル38は、図2の
ドット・マトリックス印字文字10を構成するドット1
2を表わすカーネルにおけるピクセルである。クロスハ
ッチを施した中心のピクセル40は、問題となるピクセ
ルであり、検出のため使用されるパターンの中心を表わ
す。全ての予め定めた方向のパターンは、問題となる共
通の中心ピクセル、即ちピクセル40を共有する(必要
に応じて、このピクセルもまた黒でなければならな
い)。xおよびyのドット・ピッチおよびxおよびyの
走査解像度に応じて、類似のビット・パターンを構成す
ることができる。
【0015】この1次元の原理を2次元に拡張すること
により、ピクセルのマトリックスを図4に示すように形
成することができる。図に明るく点彩されたピクセル
(「無用の」ピクセル)34は、ドット・マトリックス
文字の検出に寄与しないピクセルである。図3における
一般化された1次元のビット・パターンが図4の4つの
方向(水平、垂直、左右の対角方向)で複写されること
に注意されたい。
【0016】図4の(問題の中心ピクセル40について
の)イメージ・データにおける1つのビット・パターン
が4つの方向のどれかにおける図3の一般化されたビッ
ト・パターンと一致する(即ち、各方向が与えられたビ
ット・パターンに対して独立的に評価される)ならば、
問題の中心ピクセル40についてドット・マトリックス
が存在する。上記のビット・パターンでは、検出器が少
なくとも1つの白いピクセル36(ドット間のスペー
ス)で分けられる3つの黒いピクセル38(おそらく
は、ドット・マトリックス印字文字からの3つのドット
の中心)について文字(または、文書)を4つの予め定
めた方向のいずれかに走査する。「無用の」ピクセル3
4は、ドットの大きさあるいは白いピクセルに対する黒
いピクセルの比のいずれも重要でないことを示す。ドッ
ト・マトリックス文字を検出するための唯一の要件は、
白いピクセル40により分けられた少なくとも3つの黒
いピクセル38がある領域内の4つの予め定めた方向の
いずれかで直線状に配置されることである。
【0017】所要のビット・パターンについてビット・
マップ化されたイメージ・データを(ピクセル単位で)
左側から右側へ、また上方から下方へ走査し、そして問
題の中心ピクセルの位置を知ることにより、ドット・マ
トリックス印字テキストが元のイメージと関連するもの
として検出された問題の中心ピクセル40を識別する初
期フィルタ・マスクを形成することができる。図5は、
図2に示される文字に対するフィルタ・マスクの形成に
おけるこの最初のステップを示している。この特定のド
ット・マトリックス文字では、ピクセルの1.85%の
みが問題となるドット・マトリックスの中心ピクセル5
0として判定されたことに注意されたい。しかし、これ
が、後で示すように、隣接する文字に影響を及ぼすこと
なく文字の全体イメージをフィルタするのに充分な情報
である。
【0018】図6において、問題となるドット・マトリ
ックスの中心ピクセル52が見出される場所が一旦決定
されると、問題の中心ピクセル52についての2次元の
領域54を描くことができる。この特定例では、15×
15の領域54が使用された。
【0019】図6の境界領域54から、フィルタされる
べき問題の中心ピクセル52を囲む15×15の領域5
4内の全てのピクセルを含むように最終的なフィルタ・
マスクを形成することができる。図7は、図6の問題の
中心ピクセル52を囲む領域54を含めた後、フィルタ
・マスク56が何に見えるかを示している。
【0020】図2のイメージを図8に示されるように図
7のフィルタ・マスク56と重ねることにより、イメー
ジのどの領域がフィルタされるべきか、またどの領域が
フィルタされないままにするかが明らかになるであろ
う。図8のAでは、陰影を施した領域がフィルタ・マス
ク56およびフィルタで処理される領域を表わしてい
る。図8のBは、最終的なフィルタされたイメージを示
している。
【0021】検出アルゴリズムは、個別の論理回路によ
り構成された。スループットを最大化するために、この
回路はイメージデータをリアルタイムで(即ち、走査装
置の全データ速度で)処理するように設計された。
【0022】この検出回路のハードウエア構成は、図
9、図10および図11に示されるように4つの部分か
らなる。即ち、(1)走査線データの一時記憶域に対す
るライン・ストア・レジスタ122と、(2)マトリッ
クスを検査して図8のフィルタ・マスク56を形成する
ため使用されるルックアップテーブル60と、(3)1
5×15ピクセル・レジスタ・マトリックス124と、
(4)問題の中心ピクセルについて拡張する回路であ
る。更に、上記の3つの回路をマイクロプロセッサとリ
ンクさせて、ルックアップテーブルのデータをダウンロ
ードし、マイクロプロセッサに関して制御/状況バイト
を出入りさせるインターフェースが存在する。
【0023】上記のプロセスは、15×15カーネルが
調べられるビット・マップ化イメージ・データに跨って
シフトされる如く考えることができるように提示され
た。本発明のハードウエアの構成は、ビット・マップ化
イメージ・データが下記のように固定の15×15カー
ネルに跨ってシフトされる如くに考えることができるこ
とを除いて同じ方法で行われる。
【0024】しかし、回路について述べる前に、イメー
ジ・データの伝送についての簡単な論議が必要である。
2進イメージ・データがイメージの左上隅部から始めて
同期的に逐次送られることを理解すべきである。このデ
ータは、走査線を左から右に横切って一時に1つのピク
セルずつ回路へ送られる。一旦1つの走査線が送られる
と、次の走査線が同じフォーマットで送られる。同様
に、出力はピクセル単位で左から右へ、また上から下へ
逐次送られる。
【0025】図9のライン・ストア・レジスタ122
は、M本(15×15のカーネル124の垂直寸法)の
全走査線を記憶することができる記憶装置からなる。各
ライン・ストア・レジスタ122は、最初のシフト・イ
ンされたピクセルが最初のシフト・アウトされたピクセ
ルであるように、逐次に2進データをシフトすることが
できる。先入れ先出し(FIFO)ライン・バッファは
このような装置である。15×15のカーネルが、この
文書全体にわたり使用されるため、本実施例においては
15個のライン・ストア・レジスタ122が必要とされ
る。このライン・ストア・レジスタ122の目的は、如
何なる時も調べられる走査線の垂直方向の整合を維持す
ることである。換言すれば、ライン・ストア・レジスタ
122の使用は、ある走査線の最初のピクセルが前また
は次の走査線の最初ピクセルのそれぞれ上または下にあ
ることを保証する。図12のAは、必要な垂直方向の整
合の原理を示す。ライン(n+2)のピクセル1は、更
にラインnのピクセル1と整合されるライン(n+1)
のピクセル1にわたって垂直方向に整合される。
【0026】図9は15×15カーネル124を示す。
このカーネルは、124aaの出力を124abの入力
に与え、124abを124acに与え、等々、という
ように配置された225個のDタイプ・フリップフロッ
プのマトリックスである。同様に、124baを124
bbに与え、124bbを124bcに与え、等々、の
如くである。
【0027】ライン・ストア・レジスタ122oの出力
をカーネルエレメント124oaに与え、最後に15×
15カーネル124を介してライン・ストア・レジスタ
122nに与える。同様に、ライン・ストア・レジスタ
122nはカーネルエレメント124anに与え、これ
が更にライン・ストア・レジスタ122mに与えられ、
等々、の如くである。最後のライン・ストア・レジスタ
122aの場合は、出力はカーネル124aaに与えら
れる。カーネル124aoの出力は、別のライン・スト
ア・レジスタに対する入力ではなく回路の出力として使
用される。
【0028】水平方向のルックアップテーブル60のブ
ロック図が図10に示される。ルックアップテーブル6
0にランダム・アクセス・メモリー(RAM)装置を使
用することができる。カーネル要素124ha〜124
hoの各々の出力は、水平方向のRAM装置に対するア
ドレス・ビットとして使用される。図12のBは、RA
M装置をルックアップテーブルとして使用する構成の詳
細を示している。同様に、他の方向は独立的なRAM装
置により処理される。4つの予め定めた方向と対応する
4個のRAM装置が一緒にORされて、4つの方向の任
意のものについての所要のビット・パターンを有効に探
す。この部分の出力は図5と対応している。
【0029】図11の拡張回路を用いて、フィルタ・マ
スクを問題の中心ピクセルについて拡張させる。サブ回
路70は、水平方向に拡張する。問題の中心ピクセルが
ドット・マトリックスの中心として識別される時は常
に、この回路がこれを水平方向に15ピクセルに拡張す
る。
【0030】サブ回路72は、この水平のマスクを垂直
方向に15ラインだけ拡張する。この2次元の拡張の完
了と同時に、図7に示されるものと対応するフィルタ・
マスクが生成される。
【0031】ドット・マトリックス印刷の選択的フィル
タ処理 図13は、ドット・マトリックス文字「R」201が個
々のドット202とスペース即ち不連続203とからな
ることを示す。図13はまた、ドット・マトリックス印
字文字201に見出される不連続203がないタイプラ
イタ文字「R」204を示す。ドット・マトリックス印
字文字における不連続203の排除は、文字認識を改善
する光学的文字認識に対する更なる情報を提供する。
【0032】図14は、2つの形式の文字を示す。最も
左方のイメージ205は、ドット・マトリックス文字
「R」のビデオ・データを表わす。右方におけるイメー
ジ206は、タイプライタ文字「A」のビデオ・データ
である。もし図14が完全にフィルタされるとすれば、
タイプライタ文字はOCRアルゴリズムにより認識され
ないであろう。一方、ドット・マトリックス文字は認識
され得る。従って、図14の左方のイメージ205をフ
ィルタし、右方のイメージ206はフィルタしないこと
が望ましい。
【0033】ドット・マトリックス・テキストおよびタ
イプライタ打ちテキスト間を弁別するため、先に述べた
ようにフィルタ・マスクが生成される。この際、ドット
・マトリックス・テキストの領域が見出される。このよ
うなフィルタ・マスクは、図15に示される。このフィ
ルタ・マスクは図14に示されるドット・マトリックス
印字文字の場所を示す領域207を含むことに注意され
たい。
【0034】前に述べたアルゴリズムによりイメージ・
データが完全にフィルタされるものとすれば、イメージ
に対するビデオは図16に示されるように存在する。ド
ット・マトリックス印字文字208に対するビデオ・デ
ータが補正されて、機械プリントのため培われたOCR
アルゴリズムを用いる時OCRの精度を改善することに
注意されたい。一方、タイプライタ文字209のビデオ
・データはこのフィルタによって劣化されて、OCRの
この種の文字に対する認識精度を低下させる。
【0035】図16のイメージ・データを図15のフィ
ルタ・マスクに重ねることにより、ドット・マトリック
ス印字テキストが元のイメージに存在する領域120
が、図17に示される如く画成される。一旦領域210
が規定されると、ドット・マトリックス印字テキストを
含むものと判定された領域210がフィルタされたイメ
ージからコピーされてそして元のイメージにおける対応
する場所に貼り付け(ペースト)られる、コピーおよび
ペースト操作を視覚化することができ、ドット・マトリ
ックス印字テキストを含むことが知られている領域のみ
を有効にフィルタする。このコピーおよびペースト操作
の結果は、図18に示される。ドット・マトリックス印
字文字211のフィルタされたバージョンがフィルタさ
れるが、タイプライタ文字212は変化しないままであ
ることに注意されたい。領域213は、図17からコピ
ーされた領域を示す。
【0036】図19は、本システムのブロック図であ
る。ハードウエア構成の理解を助ける工夫において、同
図は図14乃至図18と対照することができる、ハード
ウエアにおいて生じる種々のステップと関連する図を有
する。
【0037】入力ビデオ・データ229は、検出器22
5に対して逐次入力される。検出器225の目的は、逐
次入力データ229を調べ、入力データ232のコピー
を逐次出力し、2進イメージ内の各ドット・マトリック
ス印字文字の場所を識別するフィルタ・マスク・データ
230を逐次出力することである。
【0038】入力ビデオ・データ232の逐次コピー
は、次にフィルタ回路226およびバイパス回路227
の両方に同時に送られる。フィルタ回路226は、ドッ
ト・マトリックス印字文字の存在の如何に拘わらず、イ
メージ全体をフィルタする。フィルタされたビデオ・デ
ータ231は、逐次にセレクタ228へ出力される。バ
イパス回路227は、入力データ232の逐次コピーを
単に遅らせるために使用される。セレクタ228は、逐
次フィルタされたビデオ・データ231、そして第2に
逐次バイパス(フィルタされない)ビデオ・データ22
3、を選択する2つの入力を有する。この選択は、フィ
ルタ・マスク・データ230の出力に基いている。セレ
クタ228は、適当なデータ・ストリームを選択して処
理された出力データ234を出力する。
【0039】ピクセル整合が逐次フィルタされたビデオ
・データ231と逐次バイパス・ビデオ・データ223
間で維持されることが重要である。即ち、逐次フィルタ
されたビデオ・データ231のピクセル番号1は対応す
る逐次バイパス・ビデオ・データ・ピクセルを持つべき
である。同様に、これらのピクセルは、対応するフィル
タ・マスク要素を持ち、フィルタ・マスク・データ23
0における最初の要素であるべきである。
【0040】図20は、第2の信号トレース240が、
ピクセル・クロック241に同期されるバイパスされた
逐次ビデオ・データのサンプルを示している、タイミン
グ図を示している。第2の信号トレース(バイパスされ
た逐次ビデオ・データ)240のピクセル番号2が論理
レベル1にある。これは、これもまた論理レベル1であ
る第3の信号トレース242における対応するフィルタ
されたピクセル(ピクセル番号2)を有する。これら両
信号240および242が時間定義域において整合する
ことを理解すべきである。従って、セレクタ228は、
同じ時点で両信号240、242に対してアクセスし
て、これをリアルタイムで「オンザフライ」のフィルタ
されたビデオ・データとフィルタされないビデオ・デー
タ間での選択をすることを可能にする。このリアルタイ
ム処理を行うため、第3の信号が要求される。この信号
は、図20に第4の信号トレース243として示され
る。これは、図19の検出器225から出力されるフィ
ルタ・マスク・データと対応する。各ピクセルが図19
の検出器225により処理される時、検出器は、特定ピ
クセルがフィルタされるかされないべきかを表示する各
ピクセルに対するフィルタ・マスクを出力する。上記の
事例のピクセル番号2の場合、検出器は、ピクセル番号
2が図20における第4のトレース243の論理レベル
1により示される如くフィルタされるべきと判定し、こ
れがピクセル番号2と対応する。
【0041】このため、ピクセル番号2に対する出力信
号244がフィルタされたイメージである。フィルタ・
マスクが論理値0であったならば、フィルタされないイ
メージが特定ピクセルに対して選択されたことになる。
この事例は、図20におけるピクセル18となる。出力
ピクセルは、イメージ・データのフィルタされないバー
ジョンとなる。下式は、図19のセレクタ228を規定
するため使用することができる。
【0042】output=((select)and
(filter))または((selectの反転)a
nd(bypass)) (出力=((選択)及び(フィルタ))または((選択
の反転)及び(バイパス))) 上記の論理式(ブール式)は、フィルタ・マスク(上式
における「選択」変数として示される)が与えられたピ
クセルに対して1であるならば、出力はフィルタされた
ピクセル(式における「フィルタ」変数)となる。フィ
ルタ・マスクが与えられたピクセルに対して1でなけれ
ば、出力はバイパスされたピクセル(上式における「バ
イパス」変数として示される)となる。対応するフィル
タ・マスク要素を持って、示したフィルタ・データとバ
イパス・データ・ストリームの双方におけるピクセルの
整合を維持することにより、フィルタ・マスクに基きリ
アルタイムの「オンザフライ」においてイメージの部分
のみをフィルタすることが可能である。
【0043】望ましい実施態様は2進ビデオ・システム
について記述したが、同じ原理をグレー・スケール・シ
ステムに適用することもできる。
【0044】実験結果 テスト結果は、ドット・マトリックス印字文書対タイプ
ライタ文書に対する読取り速度が与えられた文書セット
に対して表1に示される如くであったことを示す(読取
り速度は使用された特定文書に従って変化する)。
【0045】 表 1 ドットマトリックス 選択的フィルタ テキストの種類 処理なし(%) リングあり(%) ドット・マトリックス 92.4 98.0 タイプライタ打ち 99.9 99.2 この予備データから、システムがドット・マトリックス
印字テキストの読取り速度を著しく改善したことが判
る。更に、これがタイプライタ打ちテキストに大きな影
響を及ぼさなかった。その結果、どの種類のテキストか
が予期されなければ、自動検出アルゴリズムの使用が有
効である。
【0046】
【発明の効果】本発明の方法および装置は、タイプライ
タ打ちテキストに著しく影響を及ぼすことなくドット・
マトリックス印字テキストのOCR読取り速度を改善す
ることを意図する。特に、アルゴリズムは2進イメージ
・データを調べ、文字のイメージ・データに不連続が存
在するかどうかを判定する。実験から、図4に示された
ビット・パターンが200ドット/インチ(約25.4
mm)で走査されたドット・マトリックス印字文字に対
しても有効であることが判った。
【0047】検出RAMバンクを適正にプログラミング
することにより、他のどんなビット・パターンに対して
も探索が可能である。おそらくは、ディジタル化された
ライン・アートにおける不連続を検出することが望まし
い。
【図面の簡単な説明】
【図1】Aは9ピンのドット・マトリックスで印字した
「R」のビット・マップを示す図である。Bはタイプラ
イタで打った文字「R」のビット・マップを示す図であ
る。
【図2】1インチ(約25.4mm)当たり200ドッ
トで走査された9ピン・ドット・マトリックス印字文字
「B」の実際のビット・マップ・ビデオ・データを示す
図である。
【図3】図2で強調された水平ビット・パターンであ
る。
【図4】4方向、即ち水平、垂直、および左右の対角方
向に拡張された図3の一般化されたビット・パターンを
示す2次元表示である。
【図5】ドット・マトリックス印字テキストが検出され
た問題となる中心ピクセルを示すマップである。
【図6】ドット・マトリックス印字テキストが検出され
た問題となる中心ピクセルについて拡張された15×1
5ピクセル領域を示す図である。
【図7】図2のビデオを処理するため使用されるフィル
タ・マスクを示す図である。
【図8】Aは図7のフィルタ・マスクが重ねられた図2
のイメージを示す図である。Bは境界領域として図7に
より図2のイメージにフィルタを用いた後の最終イメー
ジを示す図である。
【図9】ハードウエアの構成のための自動検出回路のブ
ロック図である。
【図10】ハードウエアの構成のための自動検出回路の
ブロック図である。
【図11】ハードウエアの構成のための自動検出回路の
ブロック図である。
【図12】Aは図9のライン・ストア・レジスタが必要
とする縦方向の整合を示す図である。BはRAMルック
アップテーブルを示し、このルックアップテーブルが構
成される方法を示す図である。
【図13】9ピンのドット・マトリックス印字文字
「R」が何に見え、タイプライタ打ち文字がどのように
見えるかを示す図である。
【図14】ドット・マトリックス文字「R」とタイプラ
イタ文字「A」を示す図である。
【図15】図14のイメージと関連するフィルタ・マス
クを示す図である。
【図16】図14のフィルタ・バージョンを示す図であ
る。
【図17】図15のフィルタ・マスクを重ねた図16の
イメージを示す図である。
【図18】図17において強調されたイメージ・データ
をコピーし、イメージ・データを図14の元のイメージ
・データに重ね、ドット・マトリックス印字テキストを
含むと見做されるこれらの領域のみをフィルタした結果
を示す図である。
【図19】テキストに記載されるハードウエア・システ
ムを示すブロック図である。
【図20】フィルタされたビデオ・データとフィルタさ
れないビデオ・データの「オン・ザ・フライ」間を適正
に選定するため必要なタイミング関係を示すタイミング
図である。
【符号の説明】
10 ドット・マトリックス印字文字「R」 12 個々のドット 14 スペース(不連続) 16 タイプライタ打ち文字「R」 18 マス目 20 黒いピクセル 22 黒いピクセル 24 黒いピクセル 26 白いピクセル 28 白いピクセル 32 特徴ビット・パターン 34 「無用の」ピクセル 36 白いピクセル 38 黒いピクセル 40 問題の中心ピクセル 54 15×15の領域 56 フィルタ・マスク 60〜63 32K×1SRAM 70 サブ回路 72 サブ回路 122 ライン・ストア・レジスタ 124 ピクセル・レジスタ・マトリックス 201 ドット・マトリックス文字「R」 202 個々のドット 203 不連続 204 タイプライタ文字「R」 205 イメージ 206 イメージ 207 ドット・マトリックス印字文字の場所を示す領
域 208 ドット・マトリックス印字文字 209 タイプライタ文字 210 領域 211 ドット・マトリックス印字文字 212 タイプライタ文字 223 バイパス(フィルタされない)ビデオ・データ 225 検出器 226 フィルタ回路 227 バイパス回路 228 セレクタ 229 入力ビデオ・データ 230 フィルタ・マスク・データ 231 フィルタされたビデオ・データ 232 入力ビデオ・データのコピー 234 出力データ 240 第2の信号トレース 241 ピクセル・クロック 242 第3の信号トレース 243 第4の信号トレース 244 ピクセル番号2に対する出力信号

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 ピクセル単位で走査される文書における
    ドット・マトリックス印字を検出して、該ドット・マト
    リックス印字が存在するイメージにおける場所を示すフ
    ィルタ・マスクを提供する装置において、 文書を走査して入力ビデオ・データ信号を提供する手段
    と、 前記入力ビデオ・データにおけるドット・マトリックス
    印字文字の存在を検出してフィルタ・マスク信号を生じ
    る手段と、 前記入力ビデオ・データ信号を第1の経路に沿ってフィ
    ルタする手段と、 前記入力ビデオ・データ信号を第2の経路に沿って予め
    定めた量だけ遅らせる手段と、 前記フィルタ・マスク信号に応答して前記第1の経路の
    信号を選択し、該フィルタ・マスク信号が存在しない時
    は前記第2の経路の信号を選択するセレクタ手段と、を
    設けてなることを特徴とする装置。
  2. 【請求項2】 前記検出手段およびフィルタ手段が更
    に、グレースケール入力ビデオ信号を受取ることを特徴
    とする請求項1記載の装置。
  3. 【請求項3】 テキスト文字の2進ピクセル入力ビデオ
    ・データを調べる装置において、 イメージにおけるテキスト文字の不連続を検出して、与
    えられた領域における前記不連続性の存在を表示するマ
    スク信号を生じる手段と、 前記入力ビデオ信号をフィルタして、第1の信号経路に
    沿ってテキスト文字における不連続を埋める手段と、 第2の信号経路に沿って前記入力ビデオ信号を予め定め
    た量だけ遅らせる手段と、 前記マスク信号に応答して前記第1の信号経路を選択
    し、前記マスク信号が存在しない時前記第2の信号経路
    を選択する手段と、を設けてなることを特徴とする装
    置。
  4. 【請求項4】 前記入力ビデオ・データがグレースケー
    ル入力ビデオ信号の形態であることを特徴とする請求項
    3記載の装置。
  5. 【請求項5】 ピクセル単位で走査される文書における
    ドット・マトリックス印字を検出して、該ドット・マト
    リックス印字が存在するイメージにおける場所を示すフ
    ィルタ・マスクを提供する方法において、 文書を走査して入力ビデオ・データ信号を生じるステッ
    プと、 前記入力ビデオ・データ信号におけるドット・マトリッ
    クス印字文字の存在を検出して、フィルタ・マスク信号
    を生じるステップと、 前記入力ビデオ・データ信号を第1の経路に沿ってフィ
    ルタするステップと、 前記入力ビデオ・データ信号を第2の経路に沿って遅ら
    せるステップと、 前記フィルタ・マスク信号に応答して前記第1の経路の
    信号を選択し、前記フィルタ・マスク信号が存在しない
    時前記第2の経路の信号を選択するステップと、を含む
    ことを特徴とする方法。
  6. 【請求項6】 前記入力ビデオ・データ信号がグレース
    ケール信号であることを特徴とする請求項5記載の方
    法。
JP4293287A 1991-11-01 1992-10-30 光学的文字認識のためのドット・マトリックス・ビデオの位置をつきとめフィルタリングする方法および装置 Pending JPH05225390A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US786476 1991-11-01
US07/786,476 US5357581A (en) 1991-11-01 1991-11-01 Method and apparatus for the selective filtering of dot-matrix printed characters so as to improve optical character recognition

Publications (1)

Publication Number Publication Date
JPH05225390A true JPH05225390A (ja) 1993-09-03

Family

ID=25138709

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4293287A Pending JPH05225390A (ja) 1991-11-01 1992-10-30 光学的文字認識のためのドット・マトリックス・ビデオの位置をつきとめフィルタリングする方法および装置

Country Status (3)

Country Link
US (1) US5357581A (ja)
EP (1) EP0539853A2 (ja)
JP (1) JPH05225390A (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5745909A (en) * 1996-07-09 1998-04-28 Webtv Networks, Inc. Method and apparatus for reducing flicker when displaying HTML images on a television monitor
US6353675B1 (en) * 1999-01-19 2002-03-05 Xerox Corporation Methods and apparatus for identifying marking process and modifying image data based on image spatial characteristics
US6525845B1 (en) 1999-01-19 2003-02-25 Xerox Corporation Methods and apparatus for modifying image data based on identification of marking process
US6330941B1 (en) * 2000-05-25 2001-12-18 Habasit Ag Radius conveyor belt

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3634822A (en) * 1969-01-15 1972-01-11 Ibm Method and apparatus for style and specimen identification
FR2106843A5 (ja) * 1970-09-25 1972-05-05 Thomson Csf
US3737855A (en) * 1971-09-30 1973-06-05 Ibm Character video enhancement system
GB1587613A (en) * 1976-11-04 1981-04-08 Norprint Ltd Character identification
JPS5931958B2 (ja) * 1978-08-31 1984-08-06 エルム工業株式会社 手動式テ−プ印字器
US4274079A (en) * 1979-07-12 1981-06-16 Burroughs Corporation Apparatus and method for dynamic font switching
US4263504A (en) * 1979-08-01 1981-04-21 Ncr Corporation High density matrix code
JPS5729186A (en) * 1980-07-29 1982-02-17 Toshiba Corp Character segmenting device
US4389677A (en) * 1980-12-08 1983-06-21 Ncr Canada Ltd - Ncr Canada Ltee Method and apparatus for removing erroneous elements from digital images
JPS57141779A (en) * 1981-02-26 1982-09-02 Nec Corp Character cutout system
JPS58130673A (ja) * 1982-01-29 1983-08-04 Fuji Xerox Co Ltd 画像処理装置
US4484068A (en) * 1982-11-04 1984-11-20 Ncr Canada Ltd - Ncr Canada Ltee Bar code processing apparatus
US4561022A (en) * 1983-08-11 1985-12-24 Eastman Kodak Company Image processing method based on processing of interrelated image gradients
IL70213A (en) * 1983-11-13 1988-02-29 Paul Fenster Digital fluorographic image enhancement system
US4680805A (en) * 1983-11-17 1987-07-14 Texas Instruments Incorporated Method and apparatus for recognition of discontinuous text
US4646355A (en) * 1985-03-15 1987-02-24 Tektronix, Inc. Method and apparatus for input picture enhancement by removal of undersired dots and voids
JPS62133585A (ja) * 1985-12-05 1987-06-16 Ricoh Co Ltd 単語切出方式
US5073959A (en) * 1986-10-24 1991-12-17 Canon Kabushiki Kaisha Image processing apparatus with contour extraction
JPS63261486A (ja) * 1987-04-20 1988-10-28 Nec Corp 書体識別装置
USH681H (en) * 1987-06-05 1989-09-05 Dot matrix print detector
US4783840A (en) * 1987-12-04 1988-11-08 Polaroid Corporation Method for enhancing image data by noise reduction or sharpening
JP2747491B2 (ja) * 1989-02-09 1998-05-06 富士通株式会社 画像の補間処理方式
JPH03282683A (ja) * 1990-03-30 1991-12-12 Hitachi Ltd ノイズ量に自動的に適応するパターン検出方法および装置
US5182778A (en) * 1990-08-31 1993-01-26 Eastman Kodak Company Dot-matrix video enhancement for optical character recognition
US5212741A (en) * 1992-01-21 1993-05-18 Eastman Kodak Company Preprocessing of dot-matrix/ink-jet printed text for Optical Character Recognition

Also Published As

Publication number Publication date
EP0539853A3 (ja) 1994-05-04
EP0539853A2 (en) 1993-05-05
US5357581A (en) 1994-10-18

Similar Documents

Publication Publication Date Title
JP3305772B2 (ja) 形態学的技術を用いて手書き指示イメージを検出する方法
US5619592A (en) Detection of highlighted regions
US5048109A (en) Detection of highlighted regions
JP2797224B2 (ja) デジタル化された映像をドットマトリックスフォーマットで発生する装置により表示される映像を修正する方法および装置
CA1160347A (en) Method for recognizing a machine encoded character
CA2192436C (en) System and method for automatic page registration and automatic zone detection during forms processing
JP3844791B2 (ja) ディジタル画像の密度の調節方法
KR100251600B1 (ko) 이미지 처리 방법 및 디지탈 컴퓨터
EP0012173B1 (en) Apparatus for picture processing with resolution conversion
US6345130B1 (en) Method and arrangement for ensuring quality during scanning/copying of images/documents
US5065437A (en) Identification and segmentation of finely textured and solid regions of binary images
US6937762B2 (en) Image processing device and program product
US6775410B1 (en) Image processing method for sharpening corners of text and line art
US5467410A (en) Identification of a blank page in an image processing system
JPH07322057A (ja) 2進入力画像の解像度の増大方法及びその増大装置、ならびに2進入力画像の外観の改良方法
US7536052B2 (en) Corner sharpening of text and line art in a super resolution anti-aliasing image path
JPH05225390A (ja) 光学的文字認識のためのドット・マトリックス・ビデオの位置をつきとめフィルタリングする方法および装置
US5606628A (en) Apparatus and method for generating bit-mapped patterns of print characters
US5394482A (en) Method and apparatus for the detection of dot-matrix printed text so as to improve optical character recognition
US5970169A (en) Method and apparatus for image enhancement
JP3171626B2 (ja) 文字認識の処理領域・処理条件指定方法
JP2001309163A (ja) カラーデータとともに伝送されるハーフトーン付き黒色データの解像度向上
JPH0916713A (ja) 画像領域分割方法
JP3756012B2 (ja) 印字有無判定方法
JP2006261772A (ja) 画像形成装置及び画像形成方法