JPH05314315A - 光学文字認識用画像データ処理方法 - Google Patents

光学文字認識用画像データ処理方法

Info

Publication number
JPH05314315A
JPH05314315A JP5008602A JP860293A JPH05314315A JP H05314315 A JPH05314315 A JP H05314315A JP 5008602 A JP5008602 A JP 5008602A JP 860293 A JP860293 A JP 860293A JP H05314315 A JPH05314315 A JP H05314315A
Authority
JP
Japan
Prior art keywords
image data
character recognition
optical character
ink jet
data processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5008602A
Other languages
English (en)
Inventor
Lori L Barski
エル バルスキ ロリ
Roger S Gaborski
エス ガボルスキ ロジャー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eastman Kodak Co
Original Assignee
Eastman Kodak Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eastman Kodak Co filed Critical Eastman Kodak Co
Publication of JPH05314315A publication Critical patent/JPH05314315A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

(57)【要約】 【目的】 ドット・マトリックス又はインク・ジェット
印刷されたテキストの光学文字認識精度を高めることが
できる光学文字認識用画像データ処理方法及び処理装置
を提供することを目的とする。 【構成】 ドット・マトリックス/インク・ジェット画
像データの画像特性を、画像データの画素の濃度値のヒ
ストグラムを作成することによって判定し、第2のステ
ップで、画像データのダイナミック領域を、画像データ
の文字の構造をドットから2−D空間平均化演算による
ストロークの一つに変更することによって減少させ、ま
た、第3のステップで、第2のステップでなされた変更
された文字構造に対して、コントラスト・ストレッチン
グを実行し、第4のステップで、第3のステップで得ら
れた画像データにエッジ強調を実行し、第5のステップ
においては、第4のステップで得られたエッジ強調され
た画像データを2値化する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】ドット・マトリックスあるいはイ
ンク・ジェットによる印刷物の光学文字認識(OCR)
を改善するために、2値化に先だってグレー・レベル・
データを処理する方法とその装置に関する。
【0002】
【従来の技術】市販の光学文字認識(OCR)装置は、
区分化と認識エラーのために、ドット・マトリックスあ
るいはインク・ジェット印刷物とうまく適合できないも
のが多い。ドットによって形成されているドット・マト
リックスあるいはインク・ジェット印刷物の文字の構造
が不連続であるために、OCR装置において区分化が困
難だからである。標準的な従来の区分化アルゴリズム
は、文字間の白い空白部を探すからである。ドット・マ
トリックスあるいはインク・ジェット印刷文字の場合、
従来の区分化アルゴリズムは、文字を構成しているドッ
トと、文字間の空白部の区別ができない。他方、認識エ
ラーは、区分化が不十分なことと、不規則な文字の構造
に由来するものである。例えば、非ドット・マトリック
ス・プリンター(レーザーあるいは、デジー・ホイール
・プリンター)による「A」と、ドット・マトリックス
・プリンターによる「A」とは全く異なって見える。従
って、ドット・マトリックス/インク・ジェット印刷物
に対処するには、別個の「分類装置」が必要である。
【0003】種々の書式あるいは文書を処理する場合、
手操作のデータ入力に比べて、OCRはより高速で読み
とり、より多量の情報処理を行う。残念なことに、OC
R装置は所定のセットのテキスト文字だけを処理するの
である。様々な出所よりの書式を扱かっている処理産業
界では、OCR装置は、種々の印刷機によって印刷され
る文書を扱えることが要求される。現在、OCR処理現
場では、OCR読取り可能なテキスト文書と、不可能な
文書に分けて分類することが要求されている。OCR読
取り不能な文書には、例えば、手書きのテキスト、イン
ク・ジェット及びバブル・ジェットのみならずドット・
マトリックス・プリンターによる文書がある。OCR読
取り不能な文書の場合、手操作によるデータの入力が必
要となる。この種のOCR装置では、読取り精度が非常
に貧弱であるからである。
【0004】2進画像データを調べ、画像文字の不連続
性を修正する従来技術もある。このような技術の一つ
が、アメリカ特許第4,791,679号(エル・バー
スキー他、1988年12月13日発行)に開示されて
いる。この特許には、2進画像の線切れかあるいは薄い
文字を改善する方法が開示されている。特に、所定のm
×m核を用いて2進画像データを処理し、画像の周囲を
1時に1画素ずつ核を移動させて、文字ストロークを強
調している。各画素位置において、m個の四角い部分に
分割されている核が、特殊な法則に従って各部の黒画素
の数に比例して黒い画素で選択的に満たされる。
【0005】1990年8月20日付けのアメリカ特許
第4,953,114号(エッチ・佐藤)は、画像信号
処理装置を開示している。この装置は、画像信号のライ
ンを記憶するライン・メモリー、画像内容判別器、平滑
化回路、エッジ強調回路とスイッチ手段を含んでいる。
画像内容判別器は、直列に接続された振幅検知回路と比
較器を有する。振幅検知器は、可視の障害物が発生され
る周波数近辺の画像信号の振幅を検知する。振幅検知回
路からの出力信号は、ドット画像あるいはハーフ・トー
ン画像に応じて各画素を領域(area)に分割する所
定の閾値と比較される。平滑化回路と、エッジ強調回路
は、平行に配置され、それぞれライン・メモリーから画
像信号を受ける。比較器からの出力は、スイッチ手段の
位置を選択し、平滑化回路あるいはエッジ強調回路か
ら、比較の結果に基づいて出力信号を発生する。
【0006】1991年9月10日発行のアメリカ特許
第5,048,097号(アール・ガボースキー他)に
は、機械印刷の文字の光学文字認識(OCR)ニューラ
ル・ネットワーク装置が開示されている。特に、ニュー
ラル・ネットワークに送られる文字画像は、先ず文字画
像を正規化するOCR前処理装置によって処理される。
なお、ニューラル・ネットワークは、所定セットの記号
を認識するようになされている。ニューラル・ネットワ
ークの出力は、OCR事後処理装置によって処理され
る。事後処理装置は、ニューラル・ネットワークによる
記号認識エラーを修正する。ニューラル・ネットワーク
によって低い点数(score)で認識された文字につ
いて、事後処理装置は、カーンドレター(字づらの一部
が活字のボディからはみ出している活字)である隣接文
字と、接触している文字を探し、分離しようとする。画
像の幾何学的パラメータに応じて、9つの連続して開始
されるプロセスの中の一つにおいて、その接触している
文字が分離される。全てが失敗すると、2番目あるいは
3番目の得点の記号は、最とも高い得点の記号と混乱さ
れ易いという可能性に基づいて、事後処理装置はニュー
ラル・ネットワークによって認識された2番目あるいは
3番目の得点の記号を選択する。
【0007】
【発明が解決しようとする課題】ここで、このように印
刷されたテキストの光学文字認識精度を高めるために、
インク・ジェットのみならずドット・マトリックス・プ
リンターによって印刷されたテキストを前処理する改良
された方法の提供が望まれていた。
【0008】すなわち、本発明は、ドット・マトリック
ス/インク・ジェット印刷されたテキストの画像データ
を処理する方法と装置に関し、このような印刷物の光学
文字認識(OCR)の読取り速度を高めることを目的と
している。
【0009】
【課題を解決するための手段】特に、光学文字認識(O
CR)ためのドット・マトリックス/インク・ジェット
印刷物の画像データを処理する方法に関し、以下のステ
ップより構成される。先ず、ドット・マトリックス/イ
ンク・ジェット画像データの画像特性が、画像データの
画素の濃度値のヒストグラムを作成することによって判
定される。2番目のステップでは、画像データのダイナ
ミック領域が、画像データの文字の構造をドットから、
2−D空間平均化演算によるストロークの一つに変更す
ることによって、減少される。第3のステップでは、第
2のステップでなされた変更された文字構造に対して、
コントラスト・ストレッチングが実行される。
【0010】第4のステップでは、第3のステップで得
られた画像データにエッジ強調が実行される。第5のス
テップにおいては、第4のステップで得られたエッジ強
調された画像データが、2値化される。2値化された画
像データは、ニューラル・ネットワーク分類装置に送ら
れる。この分類装置によって、光学文字認識(OCR)
に先立ち、所定のセットの記号から2値化された画像デ
ータ中の文字を認識する。
【0011】また、本発明の装置は、ドット・マトリッ
クスあるいはインク・ジェット印刷テキストの画像デー
タを前処理する手段と、2値化手段を有する。画像デー
タの前処理手段は、(a)ドット・マトリックス/イン
ク・ジェット画像データの画像特性判定手段、(b)2
−D空間平均化手段、(c)コントラスト・ストレッチ
ング手段と、(d)エッジ強調手段を含んでいる。
【0012】ドット・マトリックス/インク・ジェット
画像データの画像特性判定手段は、画像データの画素の
濃度値のヒストグラムを作成する機能を有する。2−D
空間平均化手段は、画像データ中の文字構造をドットか
らストロークに変更することによって画像データのダイ
ナミック領域を減少する機能を有する。コントラスト・
ストレッチング手段は、2−D空間平均化手段によって
得られた変更後文字構造に対してコントラスト・ストレ
ッチングを実行する。エッジ強調手段は、コントラスト
・ストレッチング手段によって得られた画像データにエ
ッジ強調を実行する。2値化手段は、前処理手段からの
エッジ強調された画像データを2値化する。
【0013】
【作用】本発明においては、ドット・マトリックス/イ
ンク・ジェット画像データの画像特性が、画像データの
画素の濃度値のヒストグラムを作成することによって判
定され、第2のステップでは、画像データのダイナミッ
ク領域が、画像データの文字の構造をドットから、2−
D空間平均化演算によるストロークの一つに変更するこ
とによって減少され、また、第3のステップでは、第2
のステップでなされた変更された文字構造に対して、コ
ントラスト・ストレッチングが実行され、第4のステッ
プでは、第3のステップで得られた画像データにエッジ
強調が実行され、第5のステップにおいては、第4のス
テップで得られたエッジ強調された画像データが、2値
化される。
【0014】
【実施例】図1は、通常印刷のテキストと、ドット・マ
トリックス/インク・ジェット印刷テキストを、本発明
に従って処理する際のステップのフローチャートであ
る。ブロック10で示される第1のステップにおいて、
印刷されたテキストの走査された画像データは、ドット
・マトリックス/インク・ジェット印刷検知器に受け入
れられる。走査済み画像データ中のドット・マトリック
ス/インク・ジェット印刷テキストを認識する印刷検知
器は、適当な技術を使用可能である。例えば、1991
年9月23日出願のアメリカ出願第764,415号
(エル・バースキー、他)に開示のインク・ジェットあ
るいはドット・マトリックス印刷の検知方法を使用でき
る。開示の方法では、ドット・マトリックスあるいはイ
ンク・ジェット・プリンターの文字として分類されるテ
キストは、適切な解像度で走査される。個々の文字のビ
ットマップ画像全体に数個の水平と垂直スライスが形成
される。これらのスライスに含まれる画素の濃度値が、
各スライスについて濃度プロフィールとして記憶され
る。これらの濃度プロフィールの結果として、文字がド
ット・マトリックスあるいはインク・ジェット・プリン
ターで印刷されたものか否か、あるいはデジー・ホイー
ル・プリンター等の高品質のプリンターで印刷されたも
のか否かについて判定がなされる。ブロック10の機能
に使われる印刷検知器は、通常印刷テキストを第1の経
路12(点線で示す)に、ドット・マトリックスあるい
はインク・ジェット印刷テキストを第2の経路14(実
線で示す)に送り出す。
【0015】ブロック10において、印刷検知器によっ
て検知された通常印刷テキストは、第1の経路12を通
って、従来の技法によって適切に処理される。例えば、
通常印刷テキストにおける走査された画像データは、ブ
ロック16に示すように先ず2値化される。ブロック1
6で得られた2値化されたデータは、ブロック18に示
されるように、通常印刷テキスト分類器によって処理さ
れる。この分類器は、従来の印刷テキスト分類器プログ
ラムあるいは回路を使用している。ブロック18にて得
られる出力信号は、アスキー・データ形式である。アス
キー・データは以後の光学文字認識(OCR)に使用さ
れる。
【0016】ブロック10にて印刷検知器によって検知
されたドット・マトリックス/インク・ジェット印刷テ
キストは、第2の経路14を経て、本発明に基づく前処
理セクション20(点線の四角の中)に到達する。前処
理セクション20は、2値化前のグレー・レベル・ドッ
ト・マトリックス/インク・ジェット印刷データの処理
に基づいており、ドット・マトリックスとインク・ジェ
ット印刷のOCRに必要な特殊な分類器に対する前処理
ステップであるとみなされる。特に、本発明に基づいて
セクション20で実行される前処理ステップは、セクシ
ョン20のブロック22に示されるように画像特性を計
算する第1のステップを含んでいる。ブロック22で
は、画像特性のヒストグラムが、公知の技術を使って実
行される。例えば、8−ビットのグレー・レベル画像
は、0〜255までの濃度値(明度あるいは暗度のレベ
ル)を持つN×M個のグレー・レベル画素を含むN×M
マトリックスで表される。画像データのヒストグラム
は、各濃度値に対するマトリックス中の正確な数の画素
のみを保存して、空間情報は保存しない。ヒストグラム
を作るために、例えば、長さ255のベクトルが定義さ
れる。この場合、横座標の各素子は、0〜255の濃度
値を個々に表す。画像の各画素について、その濃度値が
測定され、ヒストグラム中の対応素子が一つ増加され
る。ブロック22の機能は、以下の図2、図3と図4に
関する検討からよく理解できよう。
【0017】図2、図3と図4は、典型的な画像(図示
せず)のヒストグラム作成ステップのフローチャートで
ある。図3は、各画素の測定された濃度値を示す典型的
なN×Mマトリックスの画素の一部分を示し、図4は、
図3のマトリックスにおける典型的な濃度値から、図2
に示すステップによって得られた典型的なヒストグラム
を示す。図2のブロック40で表される第1のステップ
において、図3の典型的なN×Mマトリックス中の第1
の画素の位置[p(N,M)」値が読み込まれる。図2
のブロック42で表される第2のステップにおいて、ブ
ロック40における第1のステップで読み込まれた画素
位置「p(N,M)」が測定される。図2のブロック4
4に表される第3のステップにおいて、測定された濃度
値(d)に対応するベクトル成分(素子)が1つ増加さ
れる。ブロック40、42と44に示されるステップ
が、原画像のN×Mマトリックスの画素の残りの画素位
置の各々について繰り返される。N×Mマトリックスの
全ての画素が図2のステップで処理されると、図4に示
されるようなヒストグラムが作成される。ヒストグラム
においては、X軸に沿って濃度値が増加し、Y軸に沿っ
てカウント(数)が増加する。このヒストグラムでは、
N×Nマトリックスの画素では、濃度値ゼロの画素が2
つあり、濃度値1の画素が5つあり、濃度値2の画素が
3つあり、濃度値3の画素が16個、濃度値4の画素が
20個等あることを示している。
【0018】図1に戻ると、ブロック22の第1の前処
理ステップにおいて画像特性が判定されると、2−D空
間平均化(平滑化)演算がブロック24において実行さ
れる。2−D平均化(平滑化)オペレータは、ドットを
ぼかすか汚して、文字の構造をドットからストロークへ
と変更する。平滑化演算は、例えば、画像を5×5(5
−by−5)の空間平均マスクで畳み込むことによって
なされる。平滑化演算用の典型的なマスクが、図5に示
されている。このマスクを画像上で動かすと、マスクの
中央の画素でオーバーレイされた画像の画素が、マスク
がオーバーレイしている25個の画素の平均値と取り替
えられる。これによって平滑化された画像が得られる。
使用されるマスクの大きさで、ぼかし量が決められる。
この場合、マスクが大きいと、画像はより平滑化され
る。非常に大きなドット、あるいは印刷されたテキスト
のドット間の空間が大きいドットには、より大きな平滑
化用の核が必要となる。2−D空間平均化演算は、デー
タのダイナミック領域(最も暗い画素濃度と最も明るい
画素濃度との差)を減少する。空間平均化演算アルゴリ
ズムに関しては、例えば、ネイル・ケー・ジェイン著の
「ディジタル画像処理の基本」、プレンティス・ホール
出版の244頁と245頁を参照されたい。
【0019】さらに図1を参照する。2−D空間平滑化
(平均化)演算に続いて、画像データに、ブロック26
に示されているコントラスト・ストレッチング演算が実
行される。コントラスト・ストレッチング演算は、画像
の暗い領域をより暗くし、画像の明るい領域をより明る
くする。ブロック24の2−D平滑化演算の前に、画像
データにコントラスト・ストレッチング演算が行われる
と、その効果は2−D平滑化演算によって減らされてし
まう。コントラスト・ストレッチング演算に使用される
アルゴリズムは、ブロック22にて得られた原画像のヒ
ストグラム(図4参照)により決定される。コントラス
ト・ストレッチング演算の詳細については、例えば、前
述の「ディジタル画像処理の基本」の235頁を参照さ
れたい。ブロック26の機能は、図6と図7に関する検
討から明らかになろう。
【0020】図6は、典型的な原ヒストグラム曲線のグ
ラフであり、コントラスト・ストレッチング演算に使わ
れる必要なパラメータの決定に使用される。Y軸は増加
するカウント(数)を、X軸は増加する濃度値を表して
いる。図7は、図6のヒストグラムに基づく典型的なコ
ントラスト・ストレッチング変形の曲線のグラフであ
る。X軸は、増加する入力濃度値を、Y軸は増加する出
力濃度値を表している。図6のヒストグラムでは、曲線
の最初のピーク50のカウントは、2番目のピーク52
のカウントより通常大きいことが分かる。最初のピーク
50は、原画の背景濃度に対応する。印刷されたテキス
トの文字によって表されるより暗い画素と比べて、書類
の背景領域を表すより明るい画素があるからである。第
2のピーク52は、はっきりとしてはいないが、前景の
濃度、文字の濃度あるいは他の印刷された記号の濃度に
対応する。図6と図7に示されているパラメータX1,
X2,dX、uとmは、第1と第2のピーク50と52
に関連するものである。
【0021】特に、パラメータX1は、デルタX(d
X)と呼ばれるシフト値だけ第1のピーク値Xpよりも
大きな濃度値である。通常、dXは処理中の書類の性質
に基づいて経験によって決められる。本発明のコントラ
スト・ストレッチング演算用の実験的なdXの値は、数
値「2」である。パラメータX2は、ヒストグラムの最
も右側のゼロではない素子に対応する。X1からX2の
領域でコントラスト・ストレッチングが実行される。図
7に示すように、「u」はコントラスト・ストレッチン
グがなされる前の画素値を示す。「v]は、コントラス
ト・ストレッチング後の画素値を示す。0からX1まで
の全ての画素値が、ゼロにマップされ、X2から255
までの全ての画素値が、255(測定可能な最大実験上
の濃度値を表す)にマップされる。X1からX2までの
画素値が、255/(X2−X1)(u−X1)の直線
的な関係に基づいて変更される。有効に達成されること
は、対象領域(X1からX2)外の画素値は、強制的に
それぞれの境界(0または255)に押しやられること
である。X1以下(0からX1)は、背景と同じ画素レ
ベルに設定され、X2以上の(X2から255)画素
は、前景と同じ画素レベルに設定される。X1からX2
間の濃度を持つ画素は、0−255中の限定された領域
ではなくて、全領域(0−255)をカバーするように
再度マップされる。従って、画像のダイナミック領域が
拡張される。前処理のこの時点では、文字の個々のドッ
トは、線に平滑化され、画像のダイナミック領域が拡張
される。
【0022】図1に戻って、コントラスト・ストレッチ
ング演算が実行されてから、ブロック28に示すように
エッジ強調が実行される。ブロック26のコントラスト
・ストレッチングの前に、エッジ強調が実行されると、
D−2の空間平均化ステップによって得られた画像のダ
イナミック領域が減少してしまうため、エッジ強調が有
効でなくなってしまう。さらに、ブロック24のD−2
空間平均化ステップの前にエッジ強調を実行すると、D
−2の空間平均化ステップによって平滑化される前に、
印刷文書の個々のドットが強調されることになる。これ
は、本発明の目的と矛盾する現象である。
【0023】図8には、図1のブロック28のエッジ強
調を実施するための典型的なマスクが示されている。エ
ッジ強調演算の機能は、高周波数のライン・ディーテイ
ル(もはやドットではない)を明らかにすることであ
る。エッジ強調のために、図8のマスクを画像上で移動
させ、画像を減らし、当業者にはよく知られているよう
に、前処理されたドット・マトリックス/インク・ジェ
ット印刷テキストの文字のエッジ情報のみを表示する。
この点については、1978年2月14に発行のアメリ
カ特許第4,074,231号(矢島他)を参照された
い。パターン処理システムにおいてエッジ強調に使用さ
れるマスクが開示されている。マスクを使用する以外の
方法で、エッジ強調を実行できることは明かである。エ
ッジ検知/強調については、グレゴリー・エー・バクシ
ーズ著の「ディジタル画像処理−実際的な入門書」、プ
レンティス・ホール出版、52−56頁を参照された
い。
【0024】図1を参照すると、セクション20のグレ
ー・レベル前処理ステップが完了すると、前処理された
結果としてのデータの2値化が「2値化」と表示されて
いるブロック30で実行される。2値化演算は、適当な
手段によってなされることに注目されたい。例えば、ブ
ロック22、24、26と28の前処理ステップから、
変更された画像の濃度値のヒストグラムを作成すること
によって、2値化が実行される。このようなヒストグラ
ムから、中間点の濃度値のような閾濃度値が決定され
る。閾濃度値と等しいかそれ以上の濃度値を持つ各画素
が255(2進法の1))に設定され、閾濃度値以下の
濃度値の各画素はゼロ(2進法のゼロ)に設定される。
【0025】2値化の後、2値化されたデータは、ドッ
ト・マトリックス/インク・ジェットOCRニューラル
・ネットワーク分類装置において処理される。このブロ
ックは「ドット/マトリックス・インク・ジェット・ニ
ューラル・ネットワーク分類装置」と表示されている。
ニューラル・ネットワーク分類装置は、逆方向エラー伝
搬パラダイムに基づいており、1991年9月10日発
行のアメリカ特許第5,048,097号(アール・エ
ス・ガボルスキー他)に開示されているものと同じ種類
である。参考として、この特許は本願に組み入れられる
ものとする。ニューラル・ネットワーク分類装置は、印
刷物の画像データに含まれている所定のセットの記号を
認識するように予め調整されている。ニューラル・ネッ
トワーク分類装置の演算の出力は、アスキー・データで
あり、例えばOCR用の前処理装置によって処理されて
いる。
【0026】図9は、図1に示すようなドット・マトリ
ックス・インク・ジェット印刷テキストを処理するため
の本発明に基づく装置のブロック図である。この装置
は、ドット・マトリックス/インク・ジェット印刷検知
器60、中央処理装置またはマイクロコンピュータを含
む処理装置62と、処理装置62に対応する記憶装置6
4より構成される。走査された画像は、ドット・マトリ
ックスあるいはインク・ジェット印刷テキスト検知器6
0に受け入れられ、走査済み画像データがドット・マト
リックスあるいはインク・ジェット印刷テキストを含む
か否かが判定される。ドット・マトリックスあるいはイ
ンク・ジェット印刷画像データが、処理装置62に送ら
れる。処理装置62は、前述の如き画像データを先ず前
処理するために記憶装置64に記憶されたプログラム及
びデータを使用する。記憶装置64は、画像特性プログ
ラム及びデータ部66、2−D空間平均化プログラム及
びデータ部68、コントラスト・ストレッチング・プロ
グラム及びデータ部70、エッジ強調プログラム及びデ
ータ部72、2値化プログラム及びデータ部74、及び
ドット・マトリックス/インク・ジェット・ニューラル
・ネットワーク分類装置76を含む。プログラム及びデ
ータ部66、68、70、72、74と76の各々は、
記憶装置64の点線部に別々に示されている。
【0027】すなわち、処理ユニット62は、記憶装置
64の画像特性プログラム及びデータ部66にアクセス
して、受け取ったドット・マトリックス/インク・ジェ
ット画像データに、図1に示される一番目の前処理を実
行する。画像特性プログラムにより、処理ユニット62
は図2から図4に示されている受信した画像データのヒ
ストグラムを作成する。ヒストグラムが作成され、記憶
装置64に記憶されると、処理ユニット62は、記憶装
置64の2−D空間平均化プログラム及びデータ部68
にアクセスする。プログラム及びデータ部68にアクセ
スしている間、処理ユニット62は、印刷文字の平滑化
演算を実施し、例えば図5に示されている典型的な5×
5マスクを使って画像データのダイナミック領域を減少
させる。次に、処理ユニット62は、記憶装置64のコ
ントラスト・ストレッチング・プログラム及びデータ部
70にアクセスする。このプログラム及びデータ部70
は、図6と図7に示されているように文字の暗い前景部
をさらに暗くし、明るい背景部をさらに明るくする。そ
して、処理ユニット62は、記憶装置64のエッジ強調
プログラム及びデータ部72にアクセスする。このプロ
グラム及びデータ部72は、例えば図8に示される典型
的なマスクを使って、文字の高周波ディーテイルを得
る。
【0028】図1のブロック22、24、26と28に
示すされる前処理を完了すると、前処理されたドット・
マトリックス/インク・ジェット印刷データ(エッジ強
調部70のプログラム及びデータを使って得た)を、記
憶装置64の2値化プログラム及びデータ部74にアク
セスすることにより、処理ユニット62は2値化する。
前処理された画像データが2値化されると、処理ユニッ
ト62は、記憶装置64のニューラル・ネットワーク分
類装置プログラム及びデータ部76にアクセスする。こ
のプログラム及びデータ部76は、原稿印刷テキスト中
に存在すると思われる文字を、所定のセットの記号から
認識する。認識された記号は、アスキーデータであり、
光学文字認識(OCR)を実行するための事後処理装置
(図示せず)に送られる。
【0029】図10には、典型的な一群の4個のドット
・マトリックス/インク・ジェット文字に、前処理と2
値化ステップを実行した典型的な結果が示されている。
すなわち、図10の一番上にあり、「オリジナル」と表
示された一群の4個のドット・マトリックスあるいはイ
ンク・ジェット文字(AMBR)は、入力された画像デ
ータ中の典型的な一群の文字を表す。2−D空間平均化
(平滑化)ステップ(図1のブロック24に示す)の
後、これら4個の文字は図10の2段目に示され「5×
5空間平均」と表示されるような文字となる。図1のブ
ロック26においてこれらの4文字にコントラスト・ス
トレッチングが実施されて、これらの文字は図10の中
央に示され「コントラスト・ストレッチ」と表示される
ものになる。図1のブロック28のエッジ強調ステップ
により、これらの文字は、図10の下から二番目に示さ
れ「エッジ強調」と表示されるようになる。最後に、エ
ッジ強調された文字は、図1のブロック30に示すよう
に二値化され、図10の一番下に示され「二値化」と表
示されるような文字となる。
【0030】以上、本発明の実施例につき説明したが、
これらは単に本発明の一般的な原理を示すものであり、
本発明の範囲内で様々な変形、変更が当業者には可能で
あることは明かであろう。例えば、図9のいくつかのセ
クションを、処理ユニット62からの適切なデータを、
処理のために別の回路に転送することも可能である。そ
のようなセクションの一つは、図10にある記憶装置6
4の二値化セクション74である。すなわち、二値化ス
テップは、比較器等の回路で実行可能である。この比較
器は、画素の濃度レベルが所定閾値よりも低い場合に
は、「0」を出力し、画素の濃度値が所定閾値と等しい
か大きい場合には、「1」を出力する。
【0031】
【発明の効果】本発明に基づく光学文字認識用画像デー
タ処理方法及び処理装置によれば、ドット・マトリック
ス又はインク・ジェット印刷されたテキストの光学文字
認識精度を高めることができる。
【図面の簡単な説明】
【図1】ドット・マトリックス/インク・ジェット印刷
テキスト用の前処理ステップを含む本発明に基づいて、
印刷されたテキストを画像処理するステップのフローチ
ャートである。
【図2】図1の第一の前処理ステップにおいて、ヒスト
グラムを作成する典型的なステップのフローチャートで
ある。
【図3】図2のヒストグラム作成ステップに使用される
濃度値を示す画素の典型的なマトリックスの一部を示す
図である。
【図4】図3のマトリックス部に類似のマトリックスの
画素から図2のステップによって作成された典型的なヒ
ストグラムを示す。
【図5】図1の第二の前処理ステップにおける2ーD空
間平均化の実行に使用される典型的なマスクを示す。
【図6】図1の第三の前処理ステップにおけるコントラ
スト・ストレッチングを実行に使用されるパラメータを
決定するための典型的な原ヒストグラム曲線のグラフで
ある。
【図7】図1の第三の前処理ステップにおけるコントラ
スト・ストレッチングの実行に使用される典型的なマス
クを示す。
【図8】図1の第四の前処理ステップにおけるエッジ強
調を実行に使用される典型的なマスクを示す。
【図9】図1のドット・マトリックス/インク・ジェッ
ト印刷テキストの処理を実行する典型的な装置のブロッ
ク図である。
【図10】典型的な一群の4個のドット・マトリックス
/インク・ジェット文字に対して、図1の前処理と、二
値化ステップを実行した結果を順次示している。図面
は、必ずしも縮尺が一定していない。
【符号の説明】
10、16、18、22、24、26、28、30、3
2 ブロック 22 セクション

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 ドット・マトリックス又はインク・ジェ
    ット印刷されたテキストについての光学文字認識(OC
    R)用画像データ処理方法であり、(a)画像データの
    画素の濃度値のヒストグラムを作成することによって、
    ドット・マトリックス/インク・ジェット画像データの
    画像文字を判定するステップと、(b)画像データ中の
    文字の構造をドット構造から、2−D空間平均演算を使
    用するストロークの一つに変更することによって、画像
    データのダイナミック領域を減少するステップと、
    (c)ステップ(b)で形成された文字の変更後の構造
    に対してコントラスト・ストレッチングを実施するステ
    ップと、(d)ステップ(c)で得られた画像データの
    文字にエッジ強調を実施するステップと、(e)ステッ
    プ(d)のエッジ強調された画像を2値化するステップ
    とを有することを特徴とする光学文字認識用画像データ
    処理方法。
  2. 【請求項2】 請求項1に記載の光学文字認識用画像デ
    ータ処理方法において、(f)ステップ(a)に先立
    ち、ドット・マトリックスあるいはインク・ジェット印
    刷されたテキストが、画像データに存在するか否かを検
    知するステップと、(g)ステップ(a)から(e)に
    よる処理のために全てのドット・マトリックスまたはイ
    ンク・ジェット印刷画像データを送付するステップとを
    さらに含むことを特徴とする光学文字認識用画像データ
    処理方法。
  3. 【請求項3】 請求項1に記載の光学文字認識用画像デ
    ータ処理方法において、(h)ステップ(e)において
    2値化された画像データを、以後のOCRのために所定
    のセットのシンボルから画像データ中の文字を認識する
    ためのニューラル・ネットワーク分類装置を用いて処理
    するステップをさらに含むことを特徴とする光学文字認
    識用画像データ処理方法。
  4. 【請求項4】 請求項1に記載の光学文字認識用画像デ
    ータ処理方法において、ステップ(b)の実施におい
    て、(b1)画像データ中を、Nを1以上の奇数の正数
    とする所定のN×Nマスクを画素毎に移動させるサブス
    テップと、(b2)マスクによってオーバーレイされた
    N×N個の画素の平均濃度値を計算するサブステップ
    と、(b3)N×Nマスクによってオーバーレイされた
    中央の画素を、N×N個の画素の平均と取り替えるサブ
    ステップとを含むことを特徴とする光学文字認識用画像
    データ処理方法。
  5. 【請求項5】 ドット・マトリックス又はインク・ジェ
    ット印刷されたテキストについての光学文字認識(OC
    R)用画像データ処理方法であり、(a)画像データ中
    にドット・マトリックスあるいはインク・ジェット印刷
    されたテキストが存在するか否かを検知するステップ
    と、(b)画像データの画素の濃度値のヒストグラムを
    作成することによって、ステップ(a)で検知されたド
    ット・マトリックス/インク・ジェット画像データの画
    像特性を判定するステップと、(c)画像データ中の文
    字の構造をドット構造から、ステップ(a)で作成され
    たヒストグラムを用いて、2−D空間平均演算を使用す
    るストロークの一つに変更することによって、画像デー
    タのダイナミック領域を減少するステップと、(d)ス
    テップ(c)で形成された文字の変更後の構造に対して
    コントラスト・ストレッチングを実施するステップと、
    (e)ステップ(d)で得られた画像データの文字にエ
    ッジ強調を実施するステップと、(f)ステップ(e)
    のエッジ強調された画像を2値化するステップとを有す
    ることを特徴とする光学文字認識用画像データ処理方
    法。
  6. 【請求項6】 請求項5に記載の光学文字認識用画像デ
    ータ処理方法が、さらに、(g)ステップ(f)におい
    て2値化された画像データを、以後のOCRのために所
    定のセットのシンボルから画像データ中の文字を認識す
    るためのニューラル・ネットワーク分類装置を用いて処
    理するステップを含むことを特徴とする光学文字認識用
    画像データ処理方法。
  7. 【請求項7】 請求項5に記載の光学文字認識用画像デ
    ータ処理方法において、ステップ(c)の実施におい
    て、(c1)画像データ中を、Nを1以上の奇数の正数
    とする所定のN×Nマスクを画素毎に移動させるステッ
    プと、(c2)マスクによってオーバーレイされたN×
    N個の画素の平均濃度値を計算するステップと、(c
    3)N×Nマスクによってオーバーレイされた中央の画
    素を、N×N個の画素の平均と取り替えるステップとを
    含むことを特徴とする光学文字認識用画像データ処理方
    法。
  8. 【請求項8】 ドット・マトリックス又はインク・ジェ
    ット印刷されたテキストについての光学文字認識(OC
    R)用画像データ処理装置であって、ドット・マトリッ
    クスまたはインク・ジェット印刷されたテキストの画像
    データを前処理するための前処理手段を含み、この前処
    理手段は、(a)画像データの画素の濃度値のヒストグ
    ラムを作成することによって、ドット・マトリックス又
    はインク・ジェット画像データの画像特性を判定する判
    定手段と、(b)画像データ中の文字の構造をドット構
    造から、ストロークの一つに変更して画像データのダイ
    ナミック領域を減少する2−D空間平均手段と、(c)
    2−D平均手段によって形成された文字の変更後の構造
    に対してコントラスト・ストレッチングを実施するコン
    トラスト・ストレッチング手段と、(d)コントラスト
    ・ストレッチング手段によって得られた画像データの文
    字のエッジを強調するエッジ強調手段と、(e)前処理
    手段からのエッジ強調された画像を2値化する2値化手
    段とを含むことを特徴とする光学文字認識用画像データ
    処理装置。
  9. 【請求項9】 請求項8に記載の光学文字認識用画像デ
    ータ処理装置が、さらに、画像データ中にドット・マト
    リックスあるいはインク・ジェット印刷されたテキスト
    が存在するか否かを検知し、画像データがドット・マト
    リックスあるいはインク・ジェット印刷されたテキスト
    を含むか否かの判定手段に画像データを送付するため印
    刷検知手段を含むことを特徴とする光学文字認識用画像
    データ処理装置。
  10. 【請求項10】 請求項8に記載の光学文字認識用画像
    データ処理装置が、さらに、2値化された画像データを
    2値化手段から受け、以後のOCRのために所定のセッ
    トのシンボルから画像データ中の文字を認識するための
    ニューラル・ネットワーク分類装置を含むことを特徴と
    する光学文字認識用画像データ処理装置。
  11. 【請求項11】 請求項8に記載の光学文字認識用画像
    データ処理装置において、2−D空間平均手段は、さら
    に、(a)画像データ中を、Nを1以上の奇数の正数と
    する所定のN×Nマスクを画素毎に移動させるステップ
    と、(b)マスクによってオーバーレイされたN×N個
    の画素の平均濃度値を計算し、N×N個のマスクによっ
    てオーバーレイされた中央の画素を、N×N個の画素の
    平均と取り替える為の手段とを含むことを特徴とする光
    学文字認識用画像データ処理装置。
  12. 【請求項12】 請求項8に記載の光学文字認識用画像
    データ処理装置におて、前処理手段は中央処理装置ある
    いはマイクロコンピューターであり、光学文字認識用画
    像データ処理装置が、 処理装置と、 ドット・マトリックスあるいはインク・ジェット画像デ
    ータに対して、画像特性の演算、2−D空間平均、コン
    トラスト・ストレッチング、及びエッジ強調を処理装置
    に実行させるためのプログラム及びデータを記憶する記
    憶領域を有する記憶装置とを含むことを特徴とする光学
    文字認識用画像データ処理装置。
JP5008602A 1992-01-21 1993-01-21 光学文字認識用画像データ処理方法 Pending JPH05314315A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/822,818 US5212741A (en) 1992-01-21 1992-01-21 Preprocessing of dot-matrix/ink-jet printed text for Optical Character Recognition
US822818 1992-01-21

Publications (1)

Publication Number Publication Date
JPH05314315A true JPH05314315A (ja) 1993-11-26

Family

ID=25237069

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5008602A Pending JPH05314315A (ja) 1992-01-21 1993-01-21 光学文字認識用画像データ処理方法

Country Status (4)

Country Link
US (1) US5212741A (ja)
EP (1) EP0552704B1 (ja)
JP (1) JPH05314315A (ja)
DE (1) DE69308905T2 (ja)

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04219067A (ja) * 1990-12-19 1992-08-10 Canon Inc 画像処理方法
EP0539854B1 (en) * 1991-11-01 1999-03-17 Eastman Kodak Company Method and apparatus for the detection of dot-matrix printed text so as to improve optical character recognition
US5357581A (en) * 1991-11-01 1994-10-18 Eastman Kodak Company Method and apparatus for the selective filtering of dot-matrix printed characters so as to improve optical character recognition
EP0557099B1 (en) * 1992-02-21 1999-07-07 Canon Kabushiki Kaisha Image processing apparatus and method
EP0564201B1 (en) * 1992-03-30 2000-05-24 Canon Kabushiki Kaisha Image processing apparatus and method
JPH05328121A (ja) * 1992-05-20 1993-12-10 Ricoh Co Ltd 画像処理方法およびその装置
US5521985A (en) * 1992-08-13 1996-05-28 International Business Machines Corporation Apparatus for recognizing machine generated or handprinted text
JPH0698152A (ja) * 1992-09-11 1994-04-08 Toshiba Corp 画像形成装置
US5526143A (en) * 1992-09-16 1996-06-11 Scitex Corporation Ltd. Apparatus and technique for generating a screened reproduction of an image
DE69410191T2 (de) * 1993-08-26 1998-09-24 Canon Kk Auf Übergangspegeldaten basierte OCR-Klassifikation
CA2128389C (en) * 1993-10-15 1999-05-11 Lawrence Patrick O'gorman Method of reducing document size for digital display
US5467408A (en) * 1994-04-22 1995-11-14 The Gillette Company Ball point writing quality analysis
US5519787A (en) * 1994-07-25 1996-05-21 Canon Kabushiki Kaisha Method of compressing image data having a uniform background tint
US5647027A (en) * 1994-10-28 1997-07-08 Lucent Technologies Inc. Method of image enhancement using convolution kernels
US5751855A (en) * 1994-12-01 1998-05-12 Xerox Corporation Method and apparatus for detecting whether an electronic image has been faxed
US5933540A (en) * 1995-05-11 1999-08-03 General Electric Company Filter system and method for efficiently suppressing noise and improving edge definition in a digitized image
JP3305576B2 (ja) * 1996-06-26 2002-07-22 シャープ株式会社 画質測定方法
US6055336A (en) * 1996-11-18 2000-04-25 Canon Kabushiki Kaisha Image processing system which converts multi-value image data into binary image data
US6501565B1 (en) 1998-07-07 2002-12-31 Electronics For Imaging, Inc. Method and apparatus for smoothing text outlines
US6310697B1 (en) 1998-07-07 2001-10-30 Electronics For Imaging, Inc. Text enhancement system
JP3717357B2 (ja) * 2000-01-07 2005-11-16 理想科学工業株式会社 2値化閾値算出方法および装置
US7072072B1 (en) * 2000-05-02 2006-07-04 Xerox Corporation Color rendering optimized for text and line art
US6778700B2 (en) 2001-03-14 2004-08-17 Electronics For Imaging, Inc. Method and apparatus for text detection
MXPA04000987A (es) * 2001-07-30 2005-02-17 Ackley Martinez Company Dba Mg Sistema y metodo de un sistema de compensacion de mezclado.
US7400768B1 (en) 2001-08-24 2008-07-15 Cardiff Software, Inc. Enhanced optical recognition of digitized images through selective bit insertion
US7236643B2 (en) * 2002-03-22 2007-06-26 Lockheed Martin Corporation System and method for filtering and binarization of images in the presence of specular noise
JP4112968B2 (ja) * 2002-12-26 2008-07-02 富士通株式会社 ビデオテキスト処理装置
KR100703284B1 (ko) * 2003-01-30 2007-04-03 삼성전자주식회사 영상신호의 이진화 장치 및 방법
US7379507B2 (en) * 2004-10-01 2008-05-27 Industrial Technology Research Institute Method and device for modulation recognition of digitally modulated signals with multi-level magnitudes
US7605959B2 (en) 2005-01-05 2009-10-20 The Ackley Martinez Company System and method of color image transformation
US8422999B1 (en) * 2007-08-06 2013-04-16 Harris Technology, Llc Portable camera enabled device applications
US8606010B2 (en) 2011-03-18 2013-12-10 Seiko Epson Corporation Identifying text pixels in scanned images
US8731296B2 (en) 2011-04-21 2014-05-20 Seiko Epson Corporation Contact text detection in scanned images
GB201116095D0 (en) 2011-09-16 2011-11-02 Wessex Technology Opto Electronic Products Ltd Machine reading of printed data
WO2018031890A1 (en) 2016-08-11 2018-02-15 Videojet Technologies Inc. Printer device, printer marking system and method with multi-stage production print inspection
US10192132B1 (en) * 2016-09-27 2019-01-29 Matrox Electronic Systems Ltd. Method and apparatus for detection of dots in an image
US10176399B1 (en) 2016-09-27 2019-01-08 Matrox Electronic Systems Ltd. Method and apparatus for optical character recognition of dot text in an image
US10223618B1 (en) 2016-09-27 2019-03-05 Matrox Electronic Systems Ltd. Method and apparatus for transformation of dot text in an image into stroked characters based on dot pitches
US10176400B1 (en) 2016-09-27 2019-01-08 Matrox Electronic Systems Ltd. Method and apparatus for locating dot text in an image
US9973654B1 (en) 2017-04-04 2018-05-15 Xerox Corporation Methods and devices for enhancing edges of a graphic object
RU2721188C2 (ru) 2017-12-14 2020-05-18 Общество с ограниченной ответственностью "Аби Продакшн" Улучшение контраста и снижение шума на изображениях, полученных с камер
US20230145252A1 (en) * 2020-01-24 2023-05-11 Oswego Innovations Two Inc. Portable tire scanners and related methods and systems

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3196398A (en) * 1962-05-21 1965-07-20 Ibm Pattern recognition preprocessing techniques
DE1187411B (de) * 1963-04-11 1965-02-18 Siemens Ag Schaltung zur Unterdrueckung von Stoersignalen in einer Anordnung zur maschinellen Erkennung von Schriftzeichen
US3737855A (en) * 1971-09-30 1973-06-05 Ibm Character video enhancement system
JPS5273747A (en) * 1975-12-17 1977-06-21 Hitachi Ltd Image processing device
USH461H (en) * 1978-11-30 1988-04-05 Non-reflective/reflective phase transition optical modulator
US4263504A (en) * 1979-08-01 1981-04-21 Ncr Corporation High density matrix code
IL58119A (en) * 1979-08-27 1983-03-31 Yeda Res & Dev Histogram image enhancement system
US4691239A (en) * 1982-12-23 1987-09-01 Nelson Martin N Dynamic video system and method
IL70213A (en) * 1983-11-13 1988-02-29 Paul Fenster Digital fluorographic image enhancement system
JPS60120482A (ja) * 1983-12-02 1985-06-27 Canon Inc 画像信号処理装置
US4646355A (en) * 1985-03-15 1987-02-24 Tektronix, Inc. Method and apparatus for input picture enhancement by removal of undersired dots and voids
USH681H (en) * 1987-06-05 1989-09-05 Dot matrix print detector
US4791679A (en) * 1987-12-26 1988-12-13 Eastman Kodak Company Image character enhancement using a stroke strengthening kernal

Also Published As

Publication number Publication date
US5212741A (en) 1993-05-18
EP0552704A3 (en) 1994-05-25
DE69308905D1 (de) 1997-04-24
EP0552704B1 (en) 1997-03-19
DE69308905T2 (de) 1997-10-16
EP0552704A2 (en) 1993-07-28

Similar Documents

Publication Publication Date Title
JPH05314315A (ja) 光学文字認識用画像データ処理方法
US7062099B2 (en) Image processing method and apparatus using self-adaptive binarization
US7054485B2 (en) Image processing method, apparatus and system
US5524070A (en) Local adaptive contrast enhancement
US6778700B2 (en) Method and apparatus for text detection
JP4006224B2 (ja) 画像品質判定方法、判定装置、判定プログラム
US7636180B2 (en) Methods and apparatus for smoothing text outlines
EP2003600A2 (en) Method and apparatus for recognizing characters in a document image
US7411699B2 (en) Method and apparatus to enhance digital image quality
Mesquita et al. A new thresholding algorithm for document images based on the perception of objects by distance
CN110210467B (zh) 一种文本图像的公式定位方法、图像处理装置、存储介质
Yan et al. Decompose-threshold approach to handwriting extraction in degraded historical document images
JPH06187496A (ja) 印字識別方法
JP3476595B2 (ja) 画像領域分割方法、および画像2値化方法
JPH08272902A (ja) 異字体異品質文字の認識方法
JP2812256B2 (ja) 文字認識装置および方法
JP3268542B2 (ja) 微細文字画像の拡大方法
JP6797763B2 (ja) 文字認識装置
JPH1031717A (ja) 画像認識方法
CN111476243A (zh) 影像文字识别方法及装置
JP3210224B2 (ja) 文字認識装置
JP2003281470A (ja) 文字認識装置及び文字認識方法
JPH11175659A (ja) 文字認識装置
JPH04343193A (ja) 2値化閾値設定方法
AU2002321998A1 (en) Method and apparatus for text detection