JPH05225390A

JPH05225390A - 光学的文字認識のためのドット・マトリックス・ビデオの位置をつきとめフィルタリングする方法および装置

Info

Publication number: JPH05225390A
Application number: JP4293287A
Authority: JP
Inventors: George A Hadgis; ジョージ・アンソニー・ハッジス
Original assignee: Eastman Kodak Co
Current assignee: Eastman Kodak Co
Priority date: 1991-11-01
Filing date: 1992-10-30
Publication date: 1993-09-03
Also published as: EP0539853A3; EP0539853A2; US5357581A

Abstract

(57)【要約】【目的】ディジタルイメージのドットマトリックス印
字テキストを見つけ、それが含まれると判断された領域
のみをフィルタする方法及び装置を提供する。【構成】ピクセル単位で走査される文書のドット・マ
トリックス印字を検出し、該ドットマトリックス印字が
存在する場所を示すフィルタマスクを提供する装置にお
いて、文書を走査して入力ビデオデータ信号を提供する
手段、入力ビデオデータのドットマトリックス印字文字
の存在を検出してフィルタマスク信号を生じる手段（２
２５）、入力ビデオデータ信号を第１の経路に沿ってフ
ィルタする手段（２２６）、入力ビデオデータ信号を第
２の経路に沿って所定の量だけ遅らせる手段（２２
７）、及びフィルタマスク信号に応答して第１の経路の
信号を選択し、フィルタマスク信号が存在しない時は第
２の経路の信号を選択するセレクタ手段（２２８）、か
らなる装置。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、ドット・マトリックス
印字されたテキストを２進数イメージ内に配置し、ドッ
ト・マトリックス印字テキストを含むように決定された
文書イメージのこれら領域をフィルタするシステムに関
する。ドット・マトリックス印字テキストのある特性に
より決定されると、ピクセル近傍はドット・マトリック
ス印字テキストを含むものとしてフラッグを立てられ
る。これら近傍は、全てのドット・マトリックス印字テ
キストの位置を識別するマップ即ちフィルタ・マスクを
生成することにより識別される。次いで、制御システム
を用いて、ピクセルのある近傍がフィルタ・アルゴリズ
ムを用いて処理されるべきかを判定する。

【０００２】従って、ドット・マトリックス印字テキス
トを含むものと判定されたあるイメージ内の領域のみ
が、改善された光学的文字認識のため強調される。

【０００３】

【従来の技術】文字のディジタル化イメージ・データを
そのＡＳＣＩＩデータへ変換するため、光学的文字認識
（ＯＣＲ）アルゴリズムが広範囲の用途において現在使
用されている。これは、数千の文書が毎日処理されるデ
ータ入力用途において特に有効である。例えば、健康申
告書式の処理において、今日多くの保険会社がデータ入
力員を介してそのデータベースにデータを入力する。Ｏ
ＣＲを利用することにより、データはより正確にかつ高
いスループットでデータベースに入力することができ、
これにより関連するコストを低減する。

【０００４】ＯＣＲは、ゴシックまたはクーリエの如き
タイプで打ったフォントに対して特に適用可能である。
これらの形式のフォントについてのＯＣＲの読みやすさ
は、かなりよい。しかし、前記の保険産業においては、
申告書式は多くの異なる供給源から受取られる。これら
書式のあるものは、タイプライタを用いて埋められ、あ
るものは手書きで埋められ、他のものはドット・マトリ
ックス・プリンタで埋められている。これら入ってくる
文書の分類は、保険会社が、タイプで打った文書を読取
るためＯＣＲ装置を使用し、手で写された文書に対して
手動データ入力をすることを可能にする。しかし、ドッ
ト・マトリックス書類は、機械が生成するものである
（タイプ打ちと手書きとして分類することが容易でな
い）が印字品質は低いＯＣＲ読取り速度（従って、誤り
を直すため更に多くの人手によるデータ入力）となる。

【０００５】

【発明が解決しようとする課題】タイプ打ちテキストに
対する認識速度は、一貫した印字品質により非常に良好
である。例えば、ゴシック文字の「Ｓ」はクーリエの
「Ｓ」と非常によく似ているが、いずれの「Ｓ」も数字
「５」とは容易に弁別し得る。異なるプリンタのドット
・マトリックス文字もまた似ているが、「５」を「Ｓ」
から弁別する情報は少ない。このことは、安いプリンタ
の典型である９ピンのドラフト品質のドット・マトリッ
クスに特に妥当する。文字を形成する個々のドットは、
ドット・マトリックス印字テキストに対して特に開発さ
れなかったＯＣＲアルゴリズムを混乱させる傾向があ
り、これにより精度を低下させる。

【０００６】タイプライタから得られる如き連続的なフ
ォントについて培われたＯＣＲアルゴリズムは、ドット
・マトリックス・プリンタで得られる文字よりもはるか
に正確にその文字を認識する。ドット・マトリックス印
字テキストに対する読取り速度は、米国特許出願第５７
５，７１５号「ＤＯＴ−ＭＡＴＲＩＸＥＮＨＡＮＣＥ
ＭＥＮＴＦＯＲＯＰＴＩＣＡＬＣＨＡＲＡＣＴＥ
ＲＲＥＣＯＧＮＩＴＩＯＮ」に記載されるようにイメ
ージ・データをフィルタすることにより増加し得ること
が判った。不都合にも、このフィルタの使用は、ＯＣＲ
アルゴリズムによる受入れ得る認識を越えてフィルタが
タイプライタ打ちテキスト・イメージを歪めるため、ユ
ーザがドット・マトリックス印字テキストをタイプライ
タ打ち文書から分けることを必要とした。別の短所は、
ある文書に対するＯＣＲアルゴリズムにより「読取られ
る」ビデオ情報が全て同じタイプでなければならない
（即ち、ドット・マトリックス印字テキストまたはタイ
プライタ打ちテキストのいずれかであって、両方ではな
い）ことである。タイプライタ打ちテキストからドット
・マトリックス印字テキストを弁別できることが重要で
あるのは、この理由からである。

【０００７】ドット・マトリックス・フィルタをドット
・マトリックス検出回路と組合わせることにより、この
システムは、ドット・マトリックス印字テキストを含む
ものとして識別された領域の位置をつきとめそのテキス
トをフィルタリングし、タイプライタ打ちテキストの読
取り精度に影響を及ぼすことなくドット・マトリックス
印字テキストの読取り精度を実質的に改善する。

【０００８】

【課題を解決するための手段】本発明は、２つのタイプ
の印刷物を識別して位置をつきとめることができるよう
に、文字のビデオ・イメージ・データ（タイプライタと
ドット・マトリックスの両方）を調べることが可能であ
るシステムを提供する。

【０００９】従って、ドット・マトリックス・イメージ
・データは、識別される時、タイプライタ打ちテキスト
をフィルタすることなくフィルタされ、この全ては検出
アルゴリズムにより判定される。

【００１０】本発明の目的は、イメージの各サブセクシ
ョンについて作業を行う必要なく上記の手順を実行する
ことにある。

【００１１】本発明の別の目的は、走査装置の全データ
速度で走査装置からのイメージ・データのスループット
の低下なしに上記の如くイメージ・データを処理するこ
とにある。

【００１２】

【実施例】ドット・マトリックス印字文字をタイプライ
タ打ち文字から識別する１つの特性は固有の不連続性で
ある。図１Ａにおいて、ドット・マトリックス印字文字
「Ｒ」１０が個々のドット１２とスペース（不連続）１
４とからなることが判る。図１Ｂは、タイプライタ打ち
文字「Ｒ」１６のビット・マップである（このタイプの
文字は図１Ａに見出される不連続１４がないことに注
意）。ドット・マトリックス印字テキスト１０の不連続
１４を取除くことにより、ＯＣＲアルゴリズムは文字認
識を改善する更なる情報が提供される。

【００１３】ドット・マトリックス印字テキストの検出
の背後にある原理は、１つの文字のビット・マップ化さ
れたイメージ・データを処理して、固有の不連続を探す
ことである。図２は、２００ＤＰＩ（ドット／インチ）
で走査されたドット・マトリックス印字文字「Ｂ」の実
際のビデオ・データである。強調されたマス目１８は、
特定のビット・パターンを含む。実際に、水平、垂直、
および左右の対角方向に異なる一連の多数のピクセルを
調べるならば、これに似たビット・パターンを識別する
ことができる。

【００１４】図２のマス目１８で強調されたビット・パ
ターンが図３に示される。白いピクセル２６、２８によ
り分けられた３つのグループの黒いピクセル２０、２
２、２４があることに注意。実際に、図２を全ての４つ
の予め定めた方向（水平、垂直、および左右の対角方
向）で厳密に（ピクセル単位に）調べることにより、似
た特性を持つピクセルの８つのシーケンスを見出すこと
ができる。このグループの特徴的なビット・パターン
は、特徴ビット・パターン３２で示されるピクセル・シ
ーケンスにより一般化することができ、そしてこれはド
ット・マトリックス印字テキストを検出するため本文全
体にわたり使用されるビット・パターンである。明るく
点彩されたピクセル３４は、カーネルにおける無用の
（ｄｏｎ’ｔｃａｒｅ）ピクセルを表わし、この特定
のピクセルがドット・マトリックス印字テキストの存在
の判定に使用されないことを示す。白いピクセル３６
は、ドット・マトリックス印字テキストに特有の図２に
示された不連続１４を表わすカーネル（ｋｅｒｎａｌ）
におけるピクセルである。黒いピクセル３８は、図２の
ドット・マトリックス印字文字１０を構成するドット１
２を表わすカーネルにおけるピクセルである。クロスハ
ッチを施した中心のピクセル４０は、問題となるピクセ
ルであり、検出のため使用されるパターンの中心を表わ
す。全ての予め定めた方向のパターンは、問題となる共
通の中心ピクセル、即ちピクセル４０を共有する（必要
に応じて、このピクセルもまた黒でなければならな
い）。ｘおよびｙのドット・ピッチおよびｘおよびｙの
走査解像度に応じて、類似のビット・パターンを構成す
ることができる。

【００１５】この１次元の原理を２次元に拡張すること
により、ピクセルのマトリックスを図４に示すように形
成することができる。図に明るく点彩されたピクセル
（「無用の」ピクセル）３４は、ドット・マトリックス
文字の検出に寄与しないピクセルである。図３における
一般化された１次元のビット・パターンが図４の４つの
方向（水平、垂直、左右の対角方向）で複写されること
に注意されたい。

【００１６】図４の（問題の中心ピクセル４０について
の）イメージ・データにおける１つのビット・パターン
が４つの方向のどれかにおける図３の一般化されたビッ
ト・パターンと一致する（即ち、各方向が与えられたビ
ット・パターンに対して独立的に評価される）ならば、
問題の中心ピクセル４０についてドット・マトリックス
が存在する。上記のビット・パターンでは、検出器が少
なくとも１つの白いピクセル３６（ドット間のスペー
ス）で分けられる３つの黒いピクセル３８（おそらく
は、ドット・マトリックス印字文字からの３つのドット
の中心）について文字（または、文書）を４つの予め定
めた方向のいずれかに走査する。「無用の」ピクセル３
４は、ドットの大きさあるいは白いピクセルに対する黒
いピクセルの比のいずれも重要でないことを示す。ドッ
ト・マトリックス文字を検出するための唯一の要件は、
白いピクセル４０により分けられた少なくとも３つの黒
いピクセル３８がある領域内の４つの予め定めた方向の
いずれかで直線状に配置されることである。

【００１７】所要のビット・パターンについてビット・
マップ化されたイメージ・データを（ピクセル単位で）
左側から右側へ、また上方から下方へ走査し、そして問
題の中心ピクセルの位置を知ることにより、ドット・マ
トリックス印字テキストが元のイメージと関連するもの
として検出された問題の中心ピクセル４０を識別する初
期フィルタ・マスクを形成することができる。図５は、
図２に示される文字に対するフィルタ・マスクの形成に
おけるこの最初のステップを示している。この特定のド
ット・マトリックス文字では、ピクセルの１．８５％の
みが問題となるドット・マトリックスの中心ピクセル５
０として判定されたことに注意されたい。しかし、これ
が、後で示すように、隣接する文字に影響を及ぼすこと
なく文字の全体イメージをフィルタするのに充分な情報
である。

【００１８】図６において、問題となるドット・マトリ
ックスの中心ピクセル５２が見出される場所が一旦決定
されると、問題の中心ピクセル５２についての２次元の
領域５４を描くことができる。この特定例では、１５×
１５の領域５４が使用された。

【００１９】図６の境界領域５４から、フィルタされる
べき問題の中心ピクセル５２を囲む１５×１５の領域５
４内の全てのピクセルを含むように最終的なフィルタ・
マスクを形成することができる。図７は、図６の問題の
中心ピクセル５２を囲む領域５４を含めた後、フィルタ
・マスク５６が何に見えるかを示している。

【００２０】図２のイメージを図８に示されるように図
７のフィルタ・マスク５６と重ねることにより、イメー
ジのどの領域がフィルタされるべきか、またどの領域が
フィルタされないままにするかが明らかになるであろ
う。図８のＡでは、陰影を施した領域がフィルタ・マス
ク５６およびフィルタで処理される領域を表わしてい
る。図８のＢは、最終的なフィルタされたイメージを示
している。

【００２１】検出アルゴリズムは、個別の論理回路によ
り構成された。スループットを最大化するために、この
回路はイメージデータをリアルタイムで（即ち、走査装
置の全データ速度で）処理するように設計された。

【００２２】この検出回路のハードウエア構成は、図
９、図１０および図１１に示されるように４つの部分か
らなる。即ち、（１）走査線データの一時記憶域に対す
るライン・ストア・レジスタ１２２と、（２）マトリッ
クスを検査して図８のフィルタ・マスク５６を形成する
ため使用されるルックアップテーブル６０と、（３）１
５×１５ピクセル・レジスタ・マトリックス１２４と、
（４）問題の中心ピクセルについて拡張する回路であ
る。更に、上記の３つの回路をマイクロプロセッサとリ
ンクさせて、ルックアップテーブルのデータをダウンロ
ードし、マイクロプロセッサに関して制御／状況バイト
を出入りさせるインターフェースが存在する。

【００２３】上記のプロセスは、１５×１５カーネルが
調べられるビット・マップ化イメージ・データに跨って
シフトされる如く考えることができるように提示され
た。本発明のハードウエアの構成は、ビット・マップ化
イメージ・データが下記のように固定の１５×１５カー
ネルに跨ってシフトされる如くに考えることができるこ
とを除いて同じ方法で行われる。

【００２４】しかし、回路について述べる前に、イメー
ジ・データの伝送についての簡単な論議が必要である。
２進イメージ・データがイメージの左上隅部から始めて
同期的に逐次送られることを理解すべきである。このデ
ータは、走査線を左から右に横切って一時に１つのピク
セルずつ回路へ送られる。一旦１つの走査線が送られる
と、次の走査線が同じフォーマットで送られる。同様
に、出力はピクセル単位で左から右へ、また上から下へ
逐次送られる。

【００２５】図９のライン・ストア・レジスタ１２２
は、Ｍ本（１５×１５のカーネル１２４の垂直寸法）の
全走査線を記憶することができる記憶装置からなる。各
ライン・ストア・レジスタ１２２は、最初のシフト・イ
ンされたピクセルが最初のシフト・アウトされたピクセ
ルであるように、逐次に２進データをシフトすることが
できる。先入れ先出し（ＦＩＦＯ）ライン・バッファは
このような装置である。１５×１５のカーネルが、この
文書全体にわたり使用されるため、本実施例においては
１５個のライン・ストア・レジスタ１２２が必要とされ
る。このライン・ストア・レジスタ１２２の目的は、如
何なる時も調べられる走査線の垂直方向の整合を維持す
ることである。換言すれば、ライン・ストア・レジスタ
１２２の使用は、ある走査線の最初のピクセルが前また
は次の走査線の最初ピクセルのそれぞれ上または下にあ
ることを保証する。図１２のＡは、必要な垂直方向の整
合の原理を示す。ライン（ｎ＋２）のピクセル１は、更
にラインｎのピクセル１と整合されるライン（ｎ＋１）
のピクセル１にわたって垂直方向に整合される。

【００２６】図９は１５×１５カーネル１２４を示す。
このカーネルは、１２４ａａの出力を１２４ａｂの入力
に与え、１２４ａｂを１２４ａｃに与え、等々、という
ように配置された２２５個のＤタイプ・フリップフロッ
プのマトリックスである。同様に、１２４ｂａを１２４
ｂｂに与え、１２４ｂｂを１２４ｂｃに与え、等々、の
如くである。

【００２７】ライン・ストア・レジスタ１２２ｏの出力
をカーネルエレメント１２４ｏａに与え、最後に１５×
１５カーネル１２４を介してライン・ストア・レジスタ
１２２ｎに与える。同様に、ライン・ストア・レジスタ
１２２ｎはカーネルエレメント１２４ａｎに与え、これ
が更にライン・ストア・レジスタ１２２ｍに与えられ、
等々、の如くである。最後のライン・ストア・レジスタ
１２２ａの場合は、出力はカーネル１２４ａａに与えら
れる。カーネル１２４ａｏの出力は、別のライン・スト
ア・レジスタに対する入力ではなく回路の出力として使
用される。

【００２８】水平方向のルックアップテーブル６０のブ
ロック図が図１０に示される。ルックアップテーブル６
０にランダム・アクセス・メモリー（ＲＡＭ）装置を使
用することができる。カーネル要素１２４ｈａ〜１２４
ｈｏの各々の出力は、水平方向のＲＡＭ装置に対するア
ドレス・ビットとして使用される。図１２のＢは、ＲＡ
Ｍ装置をルックアップテーブルとして使用する構成の詳
細を示している。同様に、他の方向は独立的なＲＡＭ装
置により処理される。４つの予め定めた方向と対応する
４個のＲＡＭ装置が一緒にＯＲされて、４つの方向の任
意のものについての所要のビット・パターンを有効に探
す。この部分の出力は図５と対応している。

【００２９】図１１の拡張回路を用いて、フィルタ・マ
スクを問題の中心ピクセルについて拡張させる。サブ回
路７０は、水平方向に拡張する。問題の中心ピクセルが
ドット・マトリックスの中心として識別される時は常
に、この回路がこれを水平方向に１５ピクセルに拡張す
る。

【００３０】サブ回路７２は、この水平のマスクを垂直
方向に１５ラインだけ拡張する。この２次元の拡張の完
了と同時に、図７に示されるものと対応するフィルタ・
マスクが生成される。

【００３１】ドット・マトリックス印刷の選択的フィル
タ処理図１３は、ドット・マトリックス文字「Ｒ」２０１が個
々のドット２０２とスペース即ち不連続２０３とからな
ることを示す。図１３はまた、ドット・マトリックス印
字文字２０１に見出される不連続２０３がないタイプラ
イタ文字「Ｒ」２０４を示す。ドット・マトリックス印
字文字における不連続２０３の排除は、文字認識を改善
する光学的文字認識に対する更なる情報を提供する。

【００３２】図１４は、２つの形式の文字を示す。最も
左方のイメージ２０５は、ドット・マトリックス文字
「Ｒ」のビデオ・データを表わす。右方におけるイメー
ジ２０６は、タイプライタ文字「Ａ」のビデオ・データ
である。もし図１４が完全にフィルタされるとすれば、
タイプライタ文字はＯＣＲアルゴリズムにより認識され
ないであろう。一方、ドット・マトリックス文字は認識
され得る。従って、図１４の左方のイメージ２０５をフ
ィルタし、右方のイメージ２０６はフィルタしないこと
が望ましい。

【００３３】ドット・マトリックス・テキストおよびタ
イプライタ打ちテキスト間を弁別するため、先に述べた
ようにフィルタ・マスクが生成される。この際、ドット
・マトリックス・テキストの領域が見出される。このよ
うなフィルタ・マスクは、図１５に示される。このフィ
ルタ・マスクは図１４に示されるドット・マトリックス
印字文字の場所を示す領域２０７を含むことに注意され
たい。

【００３４】前に述べたアルゴリズムによりイメージ・
データが完全にフィルタされるものとすれば、イメージ
に対するビデオは図１６に示されるように存在する。ド
ット・マトリックス印字文字２０８に対するビデオ・デ
ータが補正されて、機械プリントのため培われたＯＣＲ
アルゴリズムを用いる時ＯＣＲの精度を改善することに
注意されたい。一方、タイプライタ文字２０９のビデオ
・データはこのフィルタによって劣化されて、ＯＣＲの
この種の文字に対する認識精度を低下させる。

【００３５】図１６のイメージ・データを図１５のフィ
ルタ・マスクに重ねることにより、ドット・マトリック
ス印字テキストが元のイメージに存在する領域１２０
が、図１７に示される如く画成される。一旦領域２１０
が規定されると、ドット・マトリックス印字テキストを
含むものと判定された領域２１０がフィルタされたイメ
ージからコピーされてそして元のイメージにおける対応
する場所に貼り付け（ペースト）られる、コピーおよび
ペースト操作を視覚化することができ、ドット・マトリ
ックス印字テキストを含むことが知られている領域のみ
を有効にフィルタする。このコピーおよびペースト操作
の結果は、図１８に示される。ドット・マトリックス印
字文字２１１のフィルタされたバージョンがフィルタさ
れるが、タイプライタ文字２１２は変化しないままであ
ることに注意されたい。領域２１３は、図１７からコピ
ーされた領域を示す。

【００３６】図１９は、本システムのブロック図であ
る。ハードウエア構成の理解を助ける工夫において、同
図は図１４乃至図１８と対照することができる、ハード
ウエアにおいて生じる種々のステップと関連する図を有
する。

【００３７】入力ビデオ・データ２２９は、検出器２２
５に対して逐次入力される。検出器２２５の目的は、逐
次入力データ２２９を調べ、入力データ２３２のコピー
を逐次出力し、２進イメージ内の各ドット・マトリック
ス印字文字の場所を識別するフィルタ・マスク・データ
２３０を逐次出力することである。

【００３８】入力ビデオ・データ２３２の逐次コピー
は、次にフィルタ回路２２６およびバイパス回路２２７
の両方に同時に送られる。フィルタ回路２２６は、ドッ
ト・マトリックス印字文字の存在の如何に拘わらず、イ
メージ全体をフィルタする。フィルタされたビデオ・デ
ータ２３１は、逐次にセレクタ２２８へ出力される。バ
イパス回路２２７は、入力データ２３２の逐次コピーを
単に遅らせるために使用される。セレクタ２２８は、逐
次フィルタされたビデオ・データ２３１、そして第２に
逐次バイパス（フィルタされない）ビデオ・データ２２
３、を選択する２つの入力を有する。この選択は、フィ
ルタ・マスク・データ２３０の出力に基いている。セレ
クタ２２８は、適当なデータ・ストリームを選択して処
理された出力データ２３４を出力する。

【００３９】ピクセル整合が逐次フィルタされたビデオ
・データ２３１と逐次バイパス・ビデオ・データ２２３
間で維持されることが重要である。即ち、逐次フィルタ
されたビデオ・データ２３１のピクセル番号１は対応す
る逐次バイパス・ビデオ・データ・ピクセルを持つべき
である。同様に、これらのピクセルは、対応するフィル
タ・マスク要素を持ち、フィルタ・マスク・データ２３
０における最初の要素であるべきである。

【００４０】図２０は、第２の信号トレース２４０が、
ピクセル・クロック２４１に同期されるバイパスされた
逐次ビデオ・データのサンプルを示している、タイミン
グ図を示している。第２の信号トレース（バイパスされ
た逐次ビデオ・データ）２４０のピクセル番号２が論理
レベル１にある。これは、これもまた論理レベル１であ
る第３の信号トレース２４２における対応するフィルタ
されたピクセル（ピクセル番号２）を有する。これら両
信号２４０および２４２が時間定義域において整合する
ことを理解すべきである。従って、セレクタ２２８は、
同じ時点で両信号２４０、２４２に対してアクセスし
て、これをリアルタイムで「オンザフライ」のフィルタ
されたビデオ・データとフィルタされないビデオ・デー
タ間での選択をすることを可能にする。このリアルタイ
ム処理を行うため、第３の信号が要求される。この信号
は、図２０に第４の信号トレース２４３として示され
る。これは、図１９の検出器２２５から出力されるフィ
ルタ・マスク・データと対応する。各ピクセルが図１９
の検出器２２５により処理される時、検出器は、特定ピ
クセルがフィルタされるかされないべきかを表示する各
ピクセルに対するフィルタ・マスクを出力する。上記の
事例のピクセル番号２の場合、検出器は、ピクセル番号
２が図２０における第４のトレース２４３の論理レベル
１により示される如くフィルタされるべきと判定し、こ
れがピクセル番号２と対応する。

【００４１】このため、ピクセル番号２に対する出力信
号２４４がフィルタされたイメージである。フィルタ・
マスクが論理値０であったならば、フィルタされないイ
メージが特定ピクセルに対して選択されたことになる。
この事例は、図２０におけるピクセル１８となる。出力
ピクセルは、イメージ・データのフィルタされないバー
ジョンとなる。下式は、図１９のセレクタ２２８を規定
するため使用することができる。

【００４２】ｏｕｔｐｕｔ＝（（ｓｅｌｅｃｔ）ａｎｄ
（ｆｉｌｔｅｒ））または（（ｓｅｌｅｃｔの反転）ａ
ｎｄ（ｂｙｐａｓｓ））（出力＝（（選択）及び（フィルタ））または（（選択
の反転）及び（バイパス）））上記の論理式（ブール式）は、フィルタ・マスク（上式
における「選択」変数として示される）が与えられたピ
クセルに対して１であるならば、出力はフィルタされた
ピクセル（式における「フィルタ」変数）となる。フィ
ルタ・マスクが与えられたピクセルに対して１でなけれ
ば、出力はバイパスされたピクセル（上式における「バ
イパス」変数として示される）となる。対応するフィル
タ・マスク要素を持って、示したフィルタ・データとバ
イパス・データ・ストリームの双方におけるピクセルの
整合を維持することにより、フィルタ・マスクに基きリ
アルタイムの「オンザフライ」においてイメージの部分
のみをフィルタすることが可能である。

【００４３】望ましい実施態様は２進ビデオ・システム
について記述したが、同じ原理をグレー・スケール・シ
ステムに適用することもできる。

【００４４】実験結果テスト結果は、ドット・マトリックス印字文書対タイプ
ライタ文書に対する読取り速度が与えられた文書セット
に対して表１に示される如くであったことを示す（読取
り速度は使用された特定文書に従って変化する）。

【００４５】表１ドットマトリックス選択的フィルタテキストの種類処理なし（％）リングあり（％）ドット・マトリックス９２．４９８．０タイプライタ打ち９９．９９９．２この予備データから、システムがドット・マトリックス
印字テキストの読取り速度を著しく改善したことが判
る。更に、これがタイプライタ打ちテキストに大きな影
響を及ぼさなかった。その結果、どの種類のテキストか
が予期されなければ、自動検出アルゴリズムの使用が有
効である。

【００４６】

【発明の効果】本発明の方法および装置は、タイプライ
タ打ちテキストに著しく影響を及ぼすことなくドット・
マトリックス印字テキストのＯＣＲ読取り速度を改善す
ることを意図する。特に、アルゴリズムは２進イメージ
・データを調べ、文字のイメージ・データに不連続が存
在するかどうかを判定する。実験から、図４に示された
ビット・パターンが２００ドット／インチ（約２５．４
ｍｍ）で走査されたドット・マトリックス印字文字に対
しても有効であることが判った。

【００４７】検出ＲＡＭバンクを適正にプログラミング
することにより、他のどんなビット・パターンに対して
も探索が可能である。おそらくは、ディジタル化された
ライン・アートにおける不連続を検出することが望まし
い。

【図面の簡単な説明】

【図１】Ａは９ピンのドット・マトリックスで印字した
「Ｒ」のビット・マップを示す図である。Ｂはタイプラ
イタで打った文字「Ｒ」のビット・マップを示す図であ
る。

【図２】１インチ（約２５．４ｍｍ）当たり２００ドッ
トで走査された９ピン・ドット・マトリックス印字文字
「Ｂ」の実際のビット・マップ・ビデオ・データを示す
図である。

【図３】図２で強調された水平ビット・パターンであ
る。

【図４】４方向、即ち水平、垂直、および左右の対角方
向に拡張された図３の一般化されたビット・パターンを
示す２次元表示である。

【図５】ドット・マトリックス印字テキストが検出され
た問題となる中心ピクセルを示すマップである。

【図６】ドット・マトリックス印字テキストが検出され
た問題となる中心ピクセルについて拡張された１５×１
５ピクセル領域を示す図である。

【図７】図２のビデオを処理するため使用されるフィル
タ・マスクを示す図である。

【図８】Ａは図７のフィルタ・マスクが重ねられた図２
のイメージを示す図である。Ｂは境界領域として図７に
より図２のイメージにフィルタを用いた後の最終イメー
ジを示す図である。

【図９】ハードウエアの構成のための自動検出回路のブ
ロック図である。

【図１０】ハードウエアの構成のための自動検出回路の
ブロック図である。

【図１１】ハードウエアの構成のための自動検出回路の
ブロック図である。

【図１２】Ａは図９のライン・ストア・レジスタが必要
とする縦方向の整合を示す図である。ＢはＲＡＭルック
アップテーブルを示し、このルックアップテーブルが構
成される方法を示す図である。

【図１３】９ピンのドット・マトリックス印字文字
「Ｒ」が何に見え、タイプライタ打ち文字がどのように
見えるかを示す図である。

【図１４】ドット・マトリックス文字「Ｒ」とタイプラ
イタ文字「Ａ」を示す図である。

【図１５】図１４のイメージと関連するフィルタ・マス
クを示す図である。

【図１６】図１４のフィルタ・バージョンを示す図であ
る。

【図１７】図１５のフィルタ・マスクを重ねた図１６の
イメージを示す図である。

【図１８】図１７において強調されたイメージ・データ
をコピーし、イメージ・データを図１４の元のイメージ
・データに重ね、ドット・マトリックス印字テキストを
含むと見做されるこれらの領域のみをフィルタした結果
を示す図である。

【図１９】テキストに記載されるハードウエア・システ
ムを示すブロック図である。

【図２０】フィルタされたビデオ・データとフィルタさ
れないビデオ・データの「オン・ザ・フライ」間を適正
に選定するため必要なタイミング関係を示すタイミング
図である。

【符号の説明】

１０ドット・マトリックス印字文字「Ｒ」１２個々のドット１４スペース（不連続）１６タイプライタ打ち文字「Ｒ」１８マス目２０黒いピクセル２２黒いピクセル２４黒いピクセル２６白いピクセル２８白いピクセル３２特徴ビット・パターン３４「無用の」ピクセル３６白いピクセル３８黒いピクセル４０問題の中心ピクセル５４１５×１５の領域５６フィルタ・マスク６０〜６３３２Ｋ×１ＳＲＡＭ７０サブ回路７２サブ回路１２２ライン・ストア・レジスタ１２４ピクセル・レジスタ・マトリックス２０１ドット・マトリックス文字「Ｒ」２０２個々のドット２０３不連続２０４タイプライタ文字「Ｒ」２０５イメージ２０６イメージ２０７ドット・マトリックス印字文字の場所を示す領
域２０８ドット・マトリックス印字文字２０９タイプライタ文字２１０領域２１１ドット・マトリックス印字文字２１２タイプライタ文字２２３バイパス（フィルタされない）ビデオ・データ２２５検出器２２６フィルタ回路２２７バイパス回路２２８セレクタ２２９入力ビデオ・データ２３０フィルタ・マスク・データ２３１フィルタされたビデオ・データ２３２入力ビデオ・データのコピー２３４出力データ２４０第２の信号トレース２４１ピクセル・クロック２４２第３の信号トレース２４３第４の信号トレース２４４ピクセル番号２に対する出力信号

Claims

【特許請求の範囲】

【請求項１】ピクセル単位で走査される文書における
ドット・マトリックス印字を検出して、該ドット・マト
リックス印字が存在するイメージにおける場所を示すフ
ィルタ・マスクを提供する装置において、文書を走査して入力ビデオ・データ信号を提供する手段
と、前記入力ビデオ・データにおけるドット・マトリックス
印字文字の存在を検出してフィルタ・マスク信号を生じ
る手段と、前記入力ビデオ・データ信号を第１の経路に沿ってフィ
ルタする手段と、前記入力ビデオ・データ信号を第２の経路に沿って予め
定めた量だけ遅らせる手段と、前記フィルタ・マスク信号に応答して前記第１の経路の
信号を選択し、該フィルタ・マスク信号が存在しない時
は前記第２の経路の信号を選択するセレクタ手段と、を
設けてなることを特徴とする装置。
【請求項２】前記検出手段およびフィルタ手段が更
に、グレースケール入力ビデオ信号を受取ることを特徴
とする請求項１記載の装置。
【請求項３】テキスト文字の２進ピクセル入力ビデオ
・データを調べる装置において、イメージにおけるテキスト文字の不連続を検出して、与
えられた領域における前記不連続性の存在を表示するマ
スク信号を生じる手段と、前記入力ビデオ信号をフィルタして、第１の信号経路に
沿ってテキスト文字における不連続を埋める手段と、第２の信号経路に沿って前記入力ビデオ信号を予め定め
た量だけ遅らせる手段と、前記マスク信号に応答して前記第１の信号経路を選択
し、前記マスク信号が存在しない時前記第２の信号経路
を選択する手段と、を設けてなることを特徴とする装
置。
【請求項４】前記入力ビデオ・データがグレースケー
ル入力ビデオ信号の形態であることを特徴とする請求項
３記載の装置。
【請求項５】ピクセル単位で走査される文書における
ドット・マトリックス印字を検出して、該ドット・マト
リックス印字が存在するイメージにおける場所を示すフ
ィルタ・マスクを提供する方法において、文書を走査して入力ビデオ・データ信号を生じるステッ
プと、前記入力ビデオ・データ信号におけるドット・マトリッ
クス印字文字の存在を検出して、フィルタ・マスク信号
を生じるステップと、前記入力ビデオ・データ信号を第１の経路に沿ってフィ
ルタするステップと、前記入力ビデオ・データ信号を第２の経路に沿って遅ら
せるステップと、前記フィルタ・マスク信号に応答して前記第１の経路の
信号を選択し、前記フィルタ・マスク信号が存在しない
時前記第２の経路の信号を選択するステップと、を含む
ことを特徴とする方法。
【請求項６】前記入力ビデオ・データ信号がグレース
ケール信号であることを特徴とする請求項５記載の方
法。