JPH0728943A - 文字画像補正装置 - Google Patents

文字画像補正装置

Info

Publication number
JPH0728943A
JPH0728943A JP5196808A JP19680893A JPH0728943A JP H0728943 A JPH0728943 A JP H0728943A JP 5196808 A JP5196808 A JP 5196808A JP 19680893 A JP19680893 A JP 19680893A JP H0728943 A JPH0728943 A JP H0728943A
Authority
JP
Japan
Prior art keywords
character
pixel
black
pixels
continuous
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5196808A
Other languages
English (en)
Inventor
Makoto Torigoe
真 鳥越
Sadamasa Hirogaki
節正 広垣
Naohiro Amamoto
直弘 天本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP5196808A priority Critical patent/JPH0728943A/ja
Publication of JPH0728943A publication Critical patent/JPH0728943A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 辞書容量を増大させずに文字認識率を向上さ
せる。 【構成】 前処理部1を介して入力された文書画像10
について黒画素数判別部21で各ライン毎に連続する黒
画素数が求められる。例えば、縦方向の各ラインについ
て1画素ずつ黒画素か白画素かを判別し、連続する黒画
素数を計数する。そして、この黒画素数を所定の閾値と
比較し、連続する黒画素数が所定の閾値より小さいとき
は、その連続する画素数を画素変更部22により適切な
画素数に変更する。例えば、連続する黒画素数が1個だ
けのときは、その黒画素の直後の1個の白画素を黒画素
に変更する。これにより、文書画像10上の文字画像の
線が細くなりすぎている部分が適当な太さに修正され、
文字認識部3での文字認識が適切に行なわれる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、OCR(文字認識装
置)等における文書画像を補正する文字画像補正装置に
関するものである。
【0002】
【従来の技術】従来、文字認識において、明朝体、ゴシ
ック体、イタリック体等のさまざまな字体の文字を認識
する場合があった。このような場合、各字体の文字パタ
ーンをすべて辞書に登録し、読み取った文字をこれらの
辞書データと比較して文字認識を行なっていた。図2及
び図3は、ゴシック体及びイタリック体の文字の認識例
を示す。図2においては、読み取った文字について行方
向及び垂直方向の周辺分布を求める。すると、図2
(a)に示すように、ゴシック体の文字については、文
字間隔が明確となるのに対し、図2(b)に示すよう
に、イタリック体の文字については、文字間隔が不明確
となる。
【0003】一方、図3においては、読み取った文字に
ついて行方向及び斜め方向の周辺分布を求める。する
と、図3(a)に示すように、ゴシック体の文字につい
ては、文字間隔が不明確となるのに対し、図3(b)に
示すように、イタリック体の文字については、文字間隔
が明確となる。このような周辺分布により、ゴシック
体、イタリック体等の周辺分布を特定し、フォントの種
類を決定する。文字認識の辞書には、ゴシック体、イタ
リック体等毎にフォントが用意されており、上述のよう
にして決定されたフォントを使って読み取った文字につ
いての文字認識を行なう(例えば、特開平3−7138
0号公報参照)。
【0004】
【発明が解決しようとする課題】しかしながら、上述し
た従来の技術には、次のような問題があった。即ち、ゴ
シック体、イタリック体等の字体を正確に判別したにも
かかわらず、文字を構成する線幅がわずかに異なるだけ
で、文字認識を誤る場合がある。この微妙な線幅に対応
した辞書を追加することもできるが、そうすると、その
文字種の認識率は向上しても、辞書容量が増大し、比較
する文字種が増える。このため、処理速度が遅くなるだ
けでなく、全体的な認識率は低下してしまうという問題
があった。本発明は、以上の点に着目してなされたもの
で、辞書容量を増大させずに認識率を向上できる文字画
像補正装置を提供することを目的とするものである。
【0005】
【課題を解決するための手段】本発明の文字画像補正装
置は、文字パターンの走査時に、同一ライン上の連続す
る黒画素数を計数し、当該連続する黒画素数が所定の閾
値より小さいか否かを判別する黒画素数判別部と、当該
黒画素数判別部の判別の結果、連続する黒画素数が所定
の閾値より小さいと判別されたときは、当該連続する黒
画素の直後の白画素を黒画素に変更する画素変更部とを
備えたことを特徴とするものである。
【0006】
【作用】本発明の文字画像補正装置においては、前処理
部を介して入力された文書画像について黒画素数判別部
で各ライン毎に連続する黒画素数が求められる。例え
ば、縦方向の各ラインについて1画素ずつ黒画素か白画
素かを判別し、連続する黒画素数を計数する。そして、
この黒画素数を所定の閾値と比較し、連続する黒画素数
が所定の閾値より小さいときは、その連続する画素数を
画素変更部により適切な画素数に変更する。例えば、連
続する黒画素数が1個だけのときは、その黒画素の直後
の1個の白画素を黒画素に変更する。これにより、文書
画像上の文字画像の線が細くなりすぎている部分が適当
な太さに修正され、文字認識部での文字認識が適切に行
なわれる。
【0007】
【実施例】以下、本発明の実施例を図面を参照して詳細
に説明する。 (第1実施例)図1は、本発明の文字画像補正装置の第
1実施例のブロック図である。図示の装置は、前処理部
1、文字画像補正処理部2、文字認識部3から成る。前
処理部1は、図示しない読取部で読み取られた文書画像
10から文字領域を抽出する。文字画像補正処理部2
は、前処理部1で得られた認識対象文字を走査し、適度
の補正を行なう。この文字画像補正処理部2は、黒画素
数判別部21、画素変更部22から成る。
【0008】黒画素数判別部21は、1ライン毎にその
ライン上の連続する黒画素数を計数する。例えば、図5
(a)に示す縦方向のラインX1についてそのラインX
1上の連続する黒画素数“1”を計数する。また、同様
に、図5(a)に示す縦方向のラインX2についてその
ラインX2上の連続する黒画素数“1”を計数し、ライ
ンX3についてそのラインX3上の連続する黒画素数
“3”を計数する。そして、これらの黒画素数が所定の
閾値(例えば、2)より小さいか否かを判別する。この
結果、例えば、図5(a)に示すラインX1、X2にあ
る連続する黒画素の幅は所定の閾値より小さいと判別さ
れ、ラインX3にある連続する黒画素の幅は所定の閾値
以上と判別される。
【0009】画素変更部22は、黒画素数判別部21に
より、所定の閾値より小さいと判別された連続する黒画
素の直後の白画素を黒画素に変更する。例えば、図5
(a)に示すラインX1、X2上の1個の黒画素の直後
の黒画素を白画素に変更する。この結果、図5(b)に
示すように、ラインX1、X2上の1個の黒画素は、2
個の連続する黒画素に変更される。一方、ラインX3等
については、連続する黒画素数は変更されず、図5
(b)に示すように、図5(a)に示す状態と同様の状
態に維持される。文字認識部3は、補正された文字を辞
書データと比較することにより、文字認識を行ない、認
識結果を候補文字として出力する。
【0010】次に、上述した装置の動作を説明する。図
4に、図1の文字画像補正装置の処理手順のフローチャ
ートを示す。まず、ステップS1で最初のラインX1を
図5において縦方向に走査する。その際、ステップS2
で最初のラインX1の最初の画素が黒画素か否かを判定
する。黒画素であるときは、ステップS3で縦方向の黒
画素数を“1”増加させる。尚、縦方向の黒画素数は、
“0”に初期設定されている。そして、ラインX1上の
最後の画素でないときは、ステップS6を経てステップ
S7で次の画素へ移動し、ステップS2でその画素が黒
画素か否かを判定する。黒画素が連続する限り、以上の
ステップS2、S3、S6、S7の処理を繰り返す。こ
れにより、ステップS3における縦方向の黒画素数は、
その連続する黒画素数となる。
【0011】ステップS2で次の画素が白画素であると
判定されたときは、縦方向の黒画素数が所定の閾値より
小さく、かつ、黒画素数が“0”でないか否かを判定す
る。黒画素数が所定の閾値より小さいときは、その白画
素を黒画素に変更し、ステップS3における縦方向の黒
画素数を“0”にクリアする。この所定の閾値は、例え
ば、“2”とする。その後、次の画素へ移動し、その画
素が白画素であるときは、縦方向の黒画素数が“0”に
なっているので、次の画素へ移動する。以後、白画素が
連続する限り、ステップS2、S4、S6、S7の処理
が繰り返される。そして、黒画素が現われたときは、ス
テップS2からステップS3に進み、上述した黒画素に
ついてのステップS2、S3、S6、S7の処理が繰り
返され、ステップS4の判定で黒画素数が所定の閾値よ
り小さいときは、ステップS5で黒画素の直後の白画素
が黒画素に変更される。
【0012】ステップS6で、ラインX1の最後の画素
に至ったときは、ステップS8を経てステップS9で次
のラインX2を走査し、上述したステップS1〜S7の
処理を繰り返す。ステップS8で、最後のラインに至っ
たときは、処理を終了する。この結果、図6(a)に示
す「字」という文字の縦方向の線幅のうち、1画素の線
幅の部分が図6(b)に示すように2画素の線幅に変更
される。また、図6に示す「字」という文字の横方向の
線幅には、1画素の部分はないが、もし、1画素となる
部分があるときは、横方向について前述した縦方向の補
正処理と同様の手順による処理を行なって補正する。
【0013】(第2実施例)図7は、本発明の文字画像
補正装置の第2実施例のブロック図である。図示の装置
は、前処理部1、文字画像縮小処理部4、文字認識部3
から成る。前処理部1及び文字認識部3は、前述した図
1に示すものと同様である。文字画像縮小処理部4は、
前処理部1を介して入力された文書画像10上の文字画
像が大きすぎて図示しないパターンメモリに入り切らな
い場合にその文字画像を適当な大きさに縮小する。この
文字画像縮小処理部4は、文字サイズ判別部41、文字
画像縮小部42、文字画像補正処理部43から成る。
【0014】文字サイズ判別部41は、文字画像のう
ち、黒画素の部分の縦方向及び横方向の幅をそれぞれ検
出することにより、文字サイズを検出する。これによ
り、例えば、48×48画素等の文字サイズが検出され
る。一方、文字パターンを格納するパターンメモリは、
一定の大きさがある。その大きさを画素数で表わせば、
例えば、24×24画素等である。このため、前処理部
1を介して入力された文字画像をパターンメモリに格納
するためにそのパターンメモリに入れることができる大
きさで最も認識率が高い文字サイズに文字画像を縮小す
る。この縮小処理は、文字画像縮小部42で行なう。文
字サイズ判別部41は、文字サイズがパターンメモリの
サイズより大きいことを判別した後、この縮小のための
縮小率を計算する。この縮小率は、目標とする文字サイ
ズを入力された文字サイズで割ることにより求められ
る。
【0015】文字画像縮小部42は、縮小の際、どの画
素を残し、どの画素を間引くかを選択するための選択画
素テーブルを作成する。例えば、図9(a)に示す文字
パターンの一部を縮小する場合は、その文字パターンを
3×3画素のブロックに分割し、そのブロックの中央の
画素を選択し、残りの画素を間引く。この結果、図9
(b)に示すような文字パターンの一部が得られる。文
字画像補正処理部43は、前述した図1に示す文字画像
補正処理部2と同様であり、文字画像縮小部42で縮小
された文字パターンについて図4のフローチャートに従
って補正処理を行なう。
【0016】次に、上述した装置の動作を説明する。図
8に、図7の文書画像縮小処理部の処理手順のフローチ
ャート示す。まず、ステップS11で前処理部1から入
力された認識対象文字についてその文字のサイズを計算
する。そして、ステップS12でその文字のサイズをパ
ターンメモリのサイズと比較し、文字サイズの方が小さ
い場合はそのまま終了する。一方、文字サイズの方が大
きい場合は、ステップS13でパターンメモリに格納可
能な大きさで最も認識率が高い文字サイズになるように
縮小率を計算する。そして、ステップS14でその縮小
率で最も文字が明確となるように、画素を選択し、その
選択する画素の座標を求める。この座標は、選択画素テ
ーブルに格納される。
【0017】ステップS15では、選択画素テーブルに
従って選択される画素を例えば縦方向に走査し、図4の
フローチャートに従って文字画像の補正処理を行なう。
この結果、図9(b)に示す縦方向の1個だけの画素の
部分は、図9(c)に示すように、2個の連続する画素
に変更される。従って、文字を縮小した場合にも、文字
の各線が明確となり、文字認識の精度を向上させること
ができる。
【0018】尚、上述した実施例においては、文字画像
の縦方向の連続する画素を補正する場合について説明し
たが、本発明はこれに限定されるものではなく、横方向
の連続する画素を補正する場合についても図4のフロー
チャートで横方向の各ラインについて処理を行なうこと
により同様に適用することができることはいうまでもな
い。また、上述した実施例においては、連続する黒画素
の直後の白画素を黒画素に変更する場合について説明し
たが、これに限らず、連続する黒画素の直後の複数の連
続する白画素を連続する黒画素に変更するようにしても
よい。
【0019】
【発明の効果】以上説明したように、本発明の文字画像
補正装置によれば、連続する黒画素数が所定の閾値より
小さいときは、その連続する黒画素の直後の白画素を黒
画素に変更するようにしたので、文字ごとに異なる線幅
を適切に補正することができ、従って、微妙な線幅に対
応した辞書を用意しない場合でも、文字認識の精度を向
上させることができる。また、文字を縮小してその文字
の一部の線幅が細くなった場合にも、線幅を適切に補正
することができ、文字認識の精度を向上させることがで
きる。
【図面の簡単な説明】
【図1】本発明の文書画像補正装置の第1実施例のブロ
ック図である。
【図2】従来技術における字体判別(その1)の説明図
である。
【図3】従来技術における字体判別(その2)の説明図
である。
【図4】図1の文字画像補正装置の処理手順を示すフロ
ーチャートである。
【図5】線幅の補正過程の説明図(その1)である。
【図6】文字の線幅の補正結果の説明図である。
【図7】本発明の文字画像補正装置の第2実施例のブロ
ック図である。
【図8】図8の文書画像縮小処理部の処理手順を示すフ
ローチャートである。
【図9】線幅の補正過程の説明図(その2)である。
【符号の説明】
1 前処理部 2 文字画像補正処理部 3 文字認識部 10 文書画像 21 黒画素数判別部 22 画素変更部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 文字パターンの走査時に、同一ライン上
    の連続する黒画素数を計数し、当該連続する黒画素数が
    所定の閾値より小さいか否かを判別する黒画素数判別部
    と、 当該黒画素数判別部の判別の結果、連続する黒画素数が
    所定の閾値より小さいと判別されたときは、当該連続す
    る黒画素の直後の白画素を黒画素に変更する画素変更部
    とを備えたことを特徴とする文字画像補正装置。
JP5196808A 1993-07-14 1993-07-14 文字画像補正装置 Pending JPH0728943A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5196808A JPH0728943A (ja) 1993-07-14 1993-07-14 文字画像補正装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5196808A JPH0728943A (ja) 1993-07-14 1993-07-14 文字画像補正装置

Publications (1)

Publication Number Publication Date
JPH0728943A true JPH0728943A (ja) 1995-01-31

Family

ID=16363999

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5196808A Pending JPH0728943A (ja) 1993-07-14 1993-07-14 文字画像補正装置

Country Status (1)

Country Link
JP (1) JPH0728943A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109816847A (zh) * 2018-12-20 2019-05-28 深圳怡化电脑股份有限公司 一种判断手写字迹涂改的方法、装置及终端设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109816847A (zh) * 2018-12-20 2019-05-28 深圳怡化电脑股份有限公司 一种判断手写字迹涂改的方法、装置及终端设备
CN109816847B (zh) * 2018-12-20 2021-01-01 深圳怡化电脑股份有限公司 一种判断手写字迹涂改的方法、装置及终端设备

Similar Documents

Publication Publication Date Title
US4903312A (en) Character recognition with variable subdivisions of a character region
US5613016A (en) Area discrimination system for text image
JP3108979B2 (ja) 画像処理方法および画像処理装置
JPH05242292A (ja) 分離方法
EP0381773A1 (en) Character recognition apparatus
US6493470B1 (en) Image processing method and apparatus for detecting the tilt amount of input image data
WO1991017519A1 (en) Row-by-row segmentation and thresholding for optical character recognition
JPH11341259A (ja) 文書画像の傾き補正方法
US7151859B2 (en) Method and system for correcting direction or orientation of document image
JP2644041B2 (ja) 文字認識装置
JPH0728943A (ja) 文字画像補正装置
US6580805B1 (en) Method and recognizing music and computer-readable recording medium having music-recognizing program recorded therein
JP2917395B2 (ja) 文字パターンの細線化装置及び文字パターン細線化方法
JP3710164B2 (ja) 画像処理装置及び方法
JP2003271897A (ja) 文字認識装置、画像処理装置、画像処理方法及び同方法の実行に用いるプログラム
JP3210224B2 (ja) 文字認識装置
JP3277977B2 (ja) 文字認識方法
JP3915974B2 (ja) 画像処理装置、画像処理方法、プログラム及び記録媒体
JPH06223224A (ja) 行切出し方法
JP2917394B2 (ja) 文字認識装置及び文字切り出し方法
JPH05128305A (ja) 領域分割方法
JPH05166010A (ja) 文字切出方法
JPH0535921A (ja) 文字照合装置及びそのための方法
JPH05189604A (ja) 光学的文字読取装置
JPH01124082A (ja) 文字認識装置