JPH03260887A - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JPH03260887A
JPH03260887A JP2060553A JP6055390A JPH03260887A JP H03260887 A JPH03260887 A JP H03260887A JP 2060553 A JP2060553 A JP 2060553A JP 6055390 A JP6055390 A JP 6055390A JP H03260887 A JPH03260887 A JP H03260887A
Authority
JP
Japan
Prior art keywords
character
difference
sample
relative ratio
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2060553A
Other languages
English (en)
Inventor
Takao Aoki
孝夫 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2060553A priority Critical patent/JPH03260887A/ja
Publication of JPH03260887A publication Critical patent/JPH03260887A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
〔概要〕 文字認識方法に係り、特に認識する文字を辞書内のサン
プルと比較することにより、その類似度が最も大きかっ
たものを認識の結果とする文字認識方法に関し、 文字を辞書のサンプルとの比較にて算出される相違度に
よってその文字を認識する際の認識率を向上させること
を目的とし、 光学的に読み取った文字を辞書内のサンプルと比較し、
相違度が最も小さいものを選別することにより、当該文
字の認識を行う文字認識方法に於いて、前記文字および
前記サンプルを、n×mドット(但し、nおよびmは1
を越える正の整数〉からなる複数の領域に分割し、該分
割した各領域内での黒画素と白画素の相対比を求め、該
文字と該サンプル間における同位置領域の該相対比の差
分を求め、該差分の合計値を該文字と該サンプル間の相
違度とするよう槽底する。 〔産業上の利用分野〕 本発明は、文字認識方法に係り、特に認識する文字を辞
書内のサンプルと比較することにより、その類似度が最
も大きかったものを認識の結果とする文字認識方法に関
するものである。 〔従来の技術〕 従来、文字を認識する方法としては、第7図に示すよう
に、人力された文字(b−1)をixjのドツトイメー
ジ化(b−2)に表現し、それを二値化処理する。 一方、辞書を読みだすことにより、かかる辞書内にドツ
トイメージ化され二値化処理されてなるサンプルが抽出
される(即ち、辞書内には、第7図のa−1,a−2,
a−3の処理が完了したものを格納しておく)。 上記辞書内のサンプル(全テンプレート)と文字とを比
較してその差を相違度として算出し、その相違度が最も
小さいものを該当文字として認識していた。 従って、第7図にあるような認識しようとする文字にか
すれ或いはゴミ等が発生していても、ある程度の許容を
有するものであった。 〔発明が解決しようとする課題〕 しかしながら従来のような文字認識方法では、人力され
たイメージをそのまま特徴として認識処理していたため
、文字の状態によっては認識結果に悪影響を及ぼしてし
まうということがあった。 従って、本発明は文字を辞書のサンプルとの比較にて算
出される相違度によってその文字を認識する際の認識率
を向上させることを目的とするものである。 〔課題を解決するための手段〕 上記目的は、光学的に読み取った文字を辞書内のサンプ
ルと比較し、相違度が最も小さいものを選別することに
より、当該文字の認識を行う文字認識方法に於いて、 前記文字および前記サンプルを、nxmドツト(但し、
nおよびmはlを越える正の整数)からなる複数の領域
に分割し、 該分割した各領域内での黒画素と白画素の相対比を求め
、 該文字と該サンプル間における同位置領域の該相対比の
差分を求め、 該差分の合計値を該文字と該サンプル間の相違度とする
ことを特徴とする文字認識方法、によって遠戚される。 〔作用〕 即ち、本発明においては、文字およびサンプル共にn×
mドット(但し、nおよびmはlを越える正の整数)の
複数の領域に分割し、その分割された領域単位に白黒の
相対比を求め、同位置領域についての比較を行いその差
分を求め、その差分の合計値を相違度としている。 従って、文字とサンプルとの間では1ドツトレベルの比
較に変えて、複数ドツトレベルの比較を行うようにする
ことによって、かすれまたはゴミ等を全体で打ち消すこ
とが可能となる。 〔実施例〕 以下、本発明の実施例を第2図乃至第6図を用いて詳細
に説明する。 第2図は本発明の実施例を示すフローチャートであり、 第3図は文字側の特徴抽出を示す図であり、第4図はサ
ンプル側の特徴抽出を示す図であり、第5図は相違度抽
出を示す図であり、 第6図は本発明のハード図である。 第2図に示すフローチャートに基づき、本実施例を説明
する。尚、本実施例については、認識対象とする文字は
手書き文字とする。
【ステップ20】 任意のOCR用紙の所定欄に手書きによって書かれたN
XMの大きさを有する文字31を公知のイメージスキャ
ナ61によって、−文字単位に切り出した状態で読み取
る(第3図(1)の切り出し処理参照)、この読み取ら
れた文字はマイクロプロセッサ60の制御によって画像
格納用メモリ62に転送される。 尚、30は切り出し領域を示す。
【ステップ2N 画像格納用メモリ62から切り出された文字を読み出し
、この読み出した文字について公知の輪郭抽出手段を用
いて輪郭追跡処理を行い、その輪郭によって包囲される
内側領域を1ドツトレベルで全て黒画素に塗り潰し、輪
郭の外側領域を同しく1ドツトレベルで全て白画素とす
る(第3図(2)の輪郭抽出処理参照)。 尚、32は上記輪郭抽出処理を行うことで得られる輪郭
文字である。 【ステップ22】 白黒に振り分けられた文字に対して、二値化処理を行う
。即ち、黒画素については“1”とし、白画素について
は0”とする。
【ステップ23】 次に、1ドツトレベルで二値化処理された文字について
、第3図(3)の様に2ドツト×2ドツトである領域に
複数個分割する。
【ステップ24】 上記によって分割された一領域単位に白黒の相対比を算
出する。具体的には、第3図(3)の太線で囲まれた(
X、Y)が(1,1)の領域を例にとってみると、1ド
ツトが25ポイントの重みをもっているものとした場合
、かかる領域の4ドツトのうち、3ドツトが“1゛とな
っているので計75ポイントの重みを有する。以下、(
X、Y)が(N、−M)の領域の相対比の算出が終了す
るまでその処理を続行する(第3図(4)相対比抽出処
理参照)。
【ステップ301 一方、辞書用メモリ63からそのサンプル41(テンプ
レート)をNXMの領域40のように一文字単位に全て
読み出す。この読み出されたサンプル41毎に上記切り
出された文字と同様にステップ21乃至ステップ24の
処理を行う(第4図(1)乃至(4)まで)。 尚、辞書内に格納されているサンプルを第4図(1)の
如くではなく、第4図(3)如き二値化処理まで終了し
たものを格納しておけば、格納する際の処理は必要とな
るものの、その後からは記憶したものをそのまま流用す
ることができるため、ステップ21およびステップ22
を省略した形となり処理の高速化を望め、第2図のフロ
ーチャートにおいては破線のルートとなる。 【ステシブ25】 第3図(4)および第4図(4)の相対比抽出処理によ
って得られた第5図(1)および(2)のサンプル相対
比表501文字相対比表51における2ドツト×2ドツ
トである一領域に対する同−位if SI域について、
その相対比の差分を算出する。−例を挙げると、太線で
かこまれた領域(X、 Y)が(1,1)についてはそ
の差分は′0”であり、(1,2)、  (1,3)に
ついては各々“50”、  “100”である。
【ステップ26】 相対比の差分を2ドツト×2ドツトである領域単位に求
めてゆき、切り出した文字(NxMレベル)、即ち(X
、Y)が(5,5)までの領域についての照合が終了し
たいなかを判断し、終了していなければステップ25の
人力地点までフィードバックする。終了していれば、第
5図(3)にあるような差分値表52が得られる。
【ステップ27】 各領域についての照合が終了とすることで得られる差分
を記した差分値表の値を全て計数して、文字とサンプル
間の相違度とする。 本例においては、文字相対比表とサンプル相対比表との
全体の差分は“175“であり、これが相違度となる。
【ステップ28】 上記相違度抽出は辞書内のサンプル毎に繰り返し行われ
、全サンプルが終了するまで続行する。 全サンプルについて相違度が抽出されれば、それを第5
図(d)に示すように文字および相違度数を付して、相
違度が小である順番に並び替えて記憶する。一方、全サ
ンプルとの照合が終了していなければ、上記ステップ2
3にフィードバックし、照合が完了するので行われる。
【ステップ29】 第5図(d)のように抽出された各サンプルのうち、そ
の認識対象とする文字(即ち、切り出した文字)との相
違度が最も小さいものを選別することで認識の結果とし
て出力する。 この認識結果は認識結果格納用メモリ65に記憶され、
必要に応じてメモリ外部に出力される。 尚、上記読み出し処理2輪郭抽出処理、二値化処理1分
割処理、相対比抽出処理、相違度抽出処理、認識処理は
全て認識処理部64にて行われるものであり、マイクロ
プロセッサ60の制御に基づき行われるものである。 〔発明の効果〕 以上説明したように、文字のかすれ、ゴミを複数ドツト
に対して許容した形で認識するため、更に認識率の向上
が期待できる。 また、分割領域の数を減少することで相違度演算処理時
間を短縮し、認識速度の向上に寄与することができる。
【図面の簡単な説明】
第1図は本発明の原理図であり、 第2図は本発明の実施例を示すフローチャートであり、 第3図は文字側の特徴抽出を示す図であり、第4図はサ
ンプル側の特徴抽出を示す図であり、第5図は相違度抽
出を示す図であり、 第6図は本発明のハード図である。 第7図は従来の認識方法を示すものである。 図において、 30・・・・切り出し領域。 31・・・・文字(認識対象)。 32・・・・輪郭文字。 41・・・・サンプル。 42・・・・輪郭サンプル。 50・・・・サンプル相対比表。 51・・・・文字相対比表。 52・・・・差分値表。 をそれぞれ示す。

Claims (1)

  1. 【特許請求の範囲】 光学的に読み取った文字を辞書内のサンプルと比較し、
    相違度が最も小さいものを選別することにより、当該文
    字の認識を行う文字認識方法に於いて、 前記文字および前記サンプルを、n×mドット(但し、
    nおよびmは1を越える正の整数)からなる複数の領域
    に分割し、 該分割した各領域内での黒画素と白画素の相対比を求め
    、 該文字と該サンプル間における同位置領域の該相対比の
    差分を求め、 該差分の合計値を該文字と該サンプル間の相違度とする
    ことを特徴とする文字認識方法。
JP2060553A 1990-03-12 1990-03-12 文字認識方法 Pending JPH03260887A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2060553A JPH03260887A (ja) 1990-03-12 1990-03-12 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2060553A JPH03260887A (ja) 1990-03-12 1990-03-12 文字認識方法

Publications (1)

Publication Number Publication Date
JPH03260887A true JPH03260887A (ja) 1991-11-20

Family

ID=13145594

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2060553A Pending JPH03260887A (ja) 1990-03-12 1990-03-12 文字認識方法

Country Status (1)

Country Link
JP (1) JPH03260887A (ja)

Similar Documents

Publication Publication Date Title
JP2930612B2 (ja) 画像形成装置
EP0543593B1 (en) Method for determining boundaries of words in text
US6185341B1 (en) Image processing using vector data to reduce noise
JP2940936B2 (ja) 表領域識別方法
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
CN111401372A (zh) 一种扫描文档图文信息提取与鉴别的方法
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
JPH0721319A (ja) 自動アジア言語決定装置
JPH05282490A (ja) 語形形成方法
JP2000132690A (ja) ト―クン化によるイメ―ジ分割を用いたイメ―ジ処理方法および装置
US5195147A (en) Image forming apparatus
JP2001283153A (ja) カラー画像から文字列パターンを抽出する装置および方法
JP3149221B2 (ja) 画像処理装置
JP3058489B2 (ja) 文字列抽出方法
JPH03260887A (ja) 文字認識方法
CN112419208A (zh) 一种基于施工图审查矢量图纸编译方法及系统
Konya et al. Adaptive methods for robust document image understanding
US5894525A (en) Method and system for simultaneously recognizing contextually related input fields for a mutually consistent interpretation
JPH1031717A (ja) 画像認識方法
JP2894111B2 (ja) 光学式活字文字認識装置における認識結果の総合判定方式
EP0446630A2 (en) Method and apparatus for segmenting characters in an amount field on a financial document
JP2613211B2 (ja) 画像入力装置
JPH05128306A (ja) 文章画像の属性判別方法
JPH11316797A (ja) 文書画像の領域識別方法および装置
JP3454626B2 (ja) 大分類方法