JPH02166583A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH02166583A
JPH02166583A JP63322317A JP32231788A JPH02166583A JP H02166583 A JPH02166583 A JP H02166583A JP 63322317 A JP63322317 A JP 63322317A JP 32231788 A JP32231788 A JP 32231788A JP H02166583 A JPH02166583 A JP H02166583A
Authority
JP
Japan
Prior art keywords
pattern
sampling
handwritten
segment
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63322317A
Other languages
English (en)
Other versions
JP2795860B2 (ja
Inventor
Kenji Mishima
三縞 健司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP63322317A priority Critical patent/JP2795860B2/ja
Publication of JPH02166583A publication Critical patent/JPH02166583A/ja
Application granted granted Critical
Publication of JP2795860B2 publication Critical patent/JP2795860B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) この発明は、例えば光学文字読取装置等において、手書
きブロック化数字の認識を行なう文字認識装置に関する
(従来の技術) 従来、手書きブロック化数字を認識する方法として、人
力された文字パタンを正規化し、この正規化された文字
パタンに対し所定の処理を行なうことにより標本化パタ
ンを作成する前処理を行い、この前処理によって得られ
た標本化パタンと予め用意されている辞書パタンとの類
似度や距離の大小により入力文字を認識する方法、ある
いは、入力文字パタン中で手書きブロク化数字を構成す
る各セグメントに対応する領域を走査し、各セグメント
に対応する領域に画素が存在するか否かを判断すること
により入力文字を認識する方法等が知られている。
しかしながら、上記類似度や距離の大小により入力文字
を認識するものは、類似度や距離を算出するための積和
計算に膨大な時間がかかり、認識速度に劣るという欠点
があった。また、セグメントに対応する領域を走査して
、その領域に画素が存在するか否かを判断することによ
り入力文字を認識するものは、線分の切れや掠れがある
と入力文字の認識率が低下するという欠点があった。
(発明が解決しようとする課題) この発明の文字認識装置は、前処理によって得られた標
本化パタンと予め用意された辞書パタンとの類似度や距
離の大小により入力文字を認識するものは、類似度や距
離を算出するための積和計算に膨大な時間がかかり認識
速度に劣るという欠点、および、セグメントに対応する
領域を走査して、その領域に画素が存在するか否かを判
断することにより入力文字を認識するものは、線分の切
れや掠れがあると入力文字の認識率が低下するという欠
点を解消するためになされたもので、高速に文字認識を
行なうことができるとともに、入力文字パタンの線分に
切れや掠れがあっても高い認識率を得ることのできる文
字認識装置を提供することを目的する。
[発明の構成] (課題を解決するための手段) この発明の文字認識装置は、手書きブロック化数字を認
識する文字認識装置において、入力文字パタンを正規化
する正規化手段、この正規化手段が出力する正規化パタ
ンをぼけ変換することにより標本化する標本化手段、こ
の標本化手段が出力する標本化パタン中の手書きブロッ
ク化数字を構成する各セグメントに対応する部分の画素
の濃度特徴を抽出して特徴値を得る特徴抽出手段、この
特徴抽出手段により得られた前記特徴値を2値化する2
@化手段、および、この2値化手段で2値化された前記
特徴値に基づき、手書きブロック化数字を構成する各セ
グメントの有無を判断して前記入力文字パタンを認識す
る認識手段から構成される。
(作用) この発明は、手書きブロック化数字として与えられた入
力文字パタンを正規化し、この正規化によって得られた
正規化パタンをぼけ変換することにより標本化パタンを
得、この標本化パタン中の手書きブロック化数字を構成
する各セグメントに相当する部分の画素濃度を特徴値と
して抽出し、この特徴値により手書きブロック化数字を
構成する各セグメントの有無を判断して入力文字パタン
を認識するようにしたものである。これにより、積和計
算の量が飛躍的に減少して高速認識処理が可能となると
ともに、線分の切れや掠れによる影響を受けにくいもの
となっている。
(実施例) 以下、この発明の一実施例につき図面を参照して説明す
る。
第2図は、この発明の文字認識装置が認識の対象とする
手書きブロック化数字の記入枠である。
すなわち、太線の枠内に点線で示した部分をなぞること
により数字(線分)を記入するようになっており、1個
の数字は、12個のセグメント11〜22のうち任意の
セグメントを組合せて表現されるようになっている。
第3図は、上記記入枠に記入する数字「1」〜「0」の
標準字形を示すものであり、入力された数字を認識する
にあたっては、上記標準字形に倣って記入されているこ
とを前提として処理されるようになっている。
第1図は、この発明の文字認識装置の構成を概略的に示
すものである。図において、1は正規化部である。この
正規化部1に入力される文字パタンは、例えば、カメラ
等の撮像装置により撮像された画像情報を、CCD (
電荷結合デバイス)等の光電変換素子により光電変換し
て画像信号を生成し、この画像信号を画素濃度に応じて
黒画素および白画素に2値化したデータとして与えられ
るものである。このような文字パタンを入力した正規化
部1は、上記文字パタンの縦幅あるいは横幅を拡大ある
いは縮小することにより大きさおよび文字位置を正規化
する。この正規化に際しては、数字「1」の横幅が過剰
に拡大されないように、入力された文字パタンの横幅が
一定の閾値以下のときは、横幅の正規化は行われず、文
字位置の正規化のみが行われるようになっている。第4
図(a)は、入力された数字「3」を11画素×11画
素に正規化した場合の一例を示す。
第1図の標本化部2は、上記正規化部1により正規化さ
れた正規化パタンを入力し、標本化マスクに従ってぼけ
変換を施し標本化パタンを得るものである。
この標本化部2におけるぼけ変換は、例えば第4図(b
)に示すような、3画素×3画素の各画素成分に重み(
図示例ではrlJ   r2J「4」)を付けた標本化
マスクを用いて行われる。
すなわち、上記標本化マスクを、正規化部1で作成され
た正規化パタン上を2画素ずつ縦および横方向にシフト
しながら移動させ、この標本化マスクの各画素成分の重
みの総和を算出して当該位置における画素濃度値とする
。このようにして得られた標本化パタンの一例を第4図
(′C)に示す。
すなわち、2画素ずつシフトすることにより、5画素×
5画素のマトリックスの各画素成分を画素濃度値で表示
した標本化パタンか得られる。なお、上記画素濃度値は
、標本化マスクで囲まれた正規化パタン中の画素が全て
「0」であるときに最小値の「0」となり、正規化パタ
ン中の画素が全て「1」であるときに最大値の「16」
となり、その他の場合は、「0」〜「16」の間に分布
する。
第1図の特徴抽出部3は、上記標本化部2からの標本化
パタンを入力し、この標本化パタンに基づいて手書きブ
ロック化数字の各セグメント11〜22に対応する画素
濃度を算出するものである。
すなわち、5画素×5画素のマトリックスの各画素成分
を、第5図(a)に示すように、a −yとした場合に
、各セグメントの中央位置の重みを「1」とし、その両
端の重みをrl/2Jとして各セグメント毎の画素濃度
を算出し、これを当該セグメントの特徴値とする。例え
ば、セグメント11の特徴値は、r a / 2 + 
b 十c / 2 Jの式により算出する。他のセグメ
ントも、第5図(b)に示すように、同様の算式で特徴
値が算出される。
また、セグメントが存在しない領域、つまり第5図(a
)のgS l、Q%Sの位置は空白部分であり、通常は
画素濃度がゼロになる部分である。したがって、画素が
出現する確率も少ない部分である。そこで、この部分は
他の部分より大きな特徴を有すると考えられ、重みも「
2」として特徴抽出を行なうようになっている。以上の
ようにして得られた16個の特徴値により、以下の数字
認識が行われることになる。
第1図の2値化部4は、特徴抽出部3で特徴抽出された
特徴値を、所定のスライスレベルによりスライスするこ
とによって2値化し、2値化された特徴値を得るもので
ある。本実施例では、上記スライスレベルを「12」に
設定している。
認識部5は、上記2値化部4によって得られた2値化さ
れた特徴値と、標準字形である数字「1」〜「0」の2
値化された特徴値として予め用意された基準特徴値とを
比較することにより、入力された文字パタンの認識を行
なうものである。第6図は、予め用意される基準特徴値
の種類と認諏結果として出力される数字との対応を示す
ものである。
次に、上記のような構成において動作について説明する
まず、第2図に示す記入枠に手書きにより記入したブロ
ック化数字を、図示しない撮像装置により撮像して光電
変換することにより画像信号を得る。そして、この画像
信号を、黒画素を「1」、白画素を「0」に対応させて
2値化し、認識の対象となる文字パタンとして正規化部
1に入力する。
正規化部1では、上記文字パタンを受取って大きさおよ
び位置の正規化を行なう。第4図(a)に、数字「3」
を11画素×11画素に正規化した場合の文字パタンの
一例を示す。図中、「1」で示した部分が黒画素部で、
「0」で示した部分が白画素部である。
このようにして作成された正規化パタンは、標本化部2
へ送られる。標本化部2では、上記標本化パタンにぼけ
変換を施し、標本化パタンを得る。
すなわち、第4図(b)に・示す標本化マスクを、同図
(a)に示す正規化パタン上に投射し、その標本化マス
クで定義された重みに従って当該領域の画素濃度を算出
する。例えば、正規化パタンの左上隅30に標本化マス
クを投射した場合の画素濃度は、rlX1+IX2+I
X1+IX2+IX4+1x2+Oxl+Ox2+0x
l=12Jとして求められる。次いで、標本化マスクを
2画素分右方向ヘシフトし、同様にして画素濃度「12
」を求める。以下同様にして順次右方向へ画素濃度を求
めていき、右上隅の画素濃度「15」を求めたら、下へ
2画素分シフトする。そして、上記と同様の計算により
2列目の画素濃度を求める。このようにして最下列の右
隅の画素濃度「15」を求めたらぼけ変換処理を終了す
る。
以上の処理により求められた標本化パタンは、141f
fl (c)に示すようなマトリックスとして得られ、
入力された文字パタンを5画素X5画素のマトリックス
で表わした場合の各画素成分位置における画素濃度を反
映している。つまり、上記5画素X5画素のマトリック
スを手書きブロック化数字を構成する各セグメントに対
応させて見た場合に、数字「3」を構成するセグメント
11.12.15.16.17.20.21.22に相
当する近辺の画素濃度値が大きくなっていることがわか
る。
このようにして作成された標本化パタンは、特徴抽出部
3へ送られる。特徴抽出部3では、上記標本化パタンの
特徴を抽出する。すなわち、各セグメント毎に上述した
算式を用いて特徴値を算出する。第5図(b)に、上記
算式に従って算出した各セグメント11〜22の特徴値
を示す。この際、手書きブロック化数字のセグメントが
存在しない領域、つまり第5図(a)のgS Lsqs
sの領域に対応する特徴値も第5図(b)に示す算式に
従って算出される。
次いで、上記特徴値は2ti化部4に送られる。
2値化部4は、上記特徴値をスライスレベル「12」で
スライスすることにより2値化して2値化された特徴値
を得る。
この2値化部4で得られた2値化された特徴値は認識部
5に送られる。認識部5では、あらかにめ用意されてい
る標準字形としての数字「1」〜「0」の基準特徴値と
順次比較する処理を行なう。
そして、一致する基準特徴値があると、その基準特徴値
に該当する数字(答)を認識結果として出力する。一方
、一致する基準特徴値がないと、認識不能としてリジェ
クトする。
以上説明したように、手書きブロック化数字として与え
られた入力文字パタンを正規化し、これをぼけ変換する
ことにより標本化パタンを得、この標本化パタン中の手
書きブロック化数字を構成する各セグメントに相当する
部分の画素濃度を特徴を抽出し、この特徴値により手書
きブロック化数字を構成する各セグメントの有無を判断
して入力文字パタンを認識するようにしたので、類似度
により文字二e識を行なうものに比較し積和計算の量が
飛躍的に減少して高速認識処理が可能となるとともに、
セグメントに対応する領域を走査して当該セグメントの
有無により文字認識を行なうもののように線分の切れや
掠れによる影響を受けにくいので、認識率を向上させる
ことができるものとなっている。
なお、前記実施例では、特徴抽出部3で得られた特徴値
を2値化するに際し、スラスレベルを「12」としたが
、これに限らず、他の値であっても良い。
[発明の効果] 以上説明したように、この発明によれば、高速に文字認
識を行なうことができるとともに、入力文字パタンの線
分に切れや掠れがあっても高い認識率を得ることのでき
る文字詔講装置を提供することができる。
【図面の簡単な説明】
図は本発明の一実施例を示すもので、第1図は全体の構
成を概略的に示すブロック図、第2図は手書きブロック
化数字の記入枠を示す図、第3図は手書きブロック化数
字の標準字形を示す図、第4図は標本化の動作を説明す
るための図であり、同図(a)は入力される正規化パタ
ンの一例を示す図、同図(b)は標本化マスクの一例を
示す図、同図(c)は出力される標本化パタンの一例を
示す図、第5図は特徴抽出の動作を説明するための図で
あり、同図(a)は標本化パタンの各画素成分の位置を
示す図、同図(b)は各セグメントに対する特徴値算出
式、算出された特徴値および2値化された特徴値を示す
図、第6図は予め用意される基準特徴値と認識結果の関
係を示す図である。 1・・・正規化部(正規化手段)、2・・・標本化部(
標本化手段) 3・・・特徴抽出部(特徴抽出手段)、
4・・・2値化部(2値化手段)、5・・・認識部(認
鷹手段)、11〜22・・・セグメント。

Claims (1)

  1. 【特許請求の範囲】 手書きブロック化数字を認識する文字認識装置において
    、 入力文字パタンを正規化する正規化手段と、この正規化
    手段が出力する正規化パタンをぼけ変換することにより
    標本化する標本化手段と、この標本化手段が出力する標
    本化パタン中の手書きブロック化数字を構成する各セグ
    メントに対応する部分の画素の濃度特徴を抽出して特徴
    値を得る特徴抽出手段と、 この特徴抽出手段により得られた前記特徴値を2値化す
    る2値化手段と、 この2値化手段で2値化された前記特徴値に基づき、手
    書きブロック化数字を構成する各セグメントの有無を判
    断して前記入力文字パタンを認識する認識手段と を具備することを特徴とする文字認識装置。
JP63322317A 1988-12-21 1988-12-21 文字認識装置 Expired - Lifetime JP2795860B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63322317A JP2795860B2 (ja) 1988-12-21 1988-12-21 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63322317A JP2795860B2 (ja) 1988-12-21 1988-12-21 文字認識装置

Publications (2)

Publication Number Publication Date
JPH02166583A true JPH02166583A (ja) 1990-06-27
JP2795860B2 JP2795860B2 (ja) 1998-09-10

Family

ID=18142282

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63322317A Expired - Lifetime JP2795860B2 (ja) 1988-12-21 1988-12-21 文字認識装置

Country Status (1)

Country Link
JP (1) JP2795860B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010015508A (ja) * 2008-07-07 2010-01-21 Mitsubishi Electric Corp 路線映像管理システムおよび映像管理方法
US8249378B2 (en) 2009-02-24 2012-08-21 Kabushiki Kaisha Toshiba Image recognition apparatus and image recognition method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010015508A (ja) * 2008-07-07 2010-01-21 Mitsubishi Electric Corp 路線映像管理システムおよび映像管理方法
US8249378B2 (en) 2009-02-24 2012-08-21 Kabushiki Kaisha Toshiba Image recognition apparatus and image recognition method

Also Published As

Publication number Publication date
JP2795860B2 (ja) 1998-09-10

Similar Documents

Publication Publication Date Title
JP2940936B2 (ja) 表領域識別方法
EP0543593B1 (en) Method for determining boundaries of words in text
US6347156B1 (en) Device, method and storage medium for recognizing a document image
US5410611A (en) Method for identifying word bounding boxes in text
US4757551A (en) Character recognition method and system capable of recognizing slant characters
US5841905A (en) Business form image identification using projected profiles of graphical lines and text string lines
JP2000207489A (ja) 文字抽出方法、装置および記録媒体
JPH05166002A (ja) ソース画像を分析する方法
US6983071B2 (en) Character segmentation device, character segmentation method used thereby, and program therefor
JPH1125222A (ja) 文字切り出し方法及び文字切り出し装置
JPH02166583A (ja) 文字認識装置
JP2871590B2 (ja) 画像抽出方式
Aparna et al. A complete OCR system development of Tamil magazine documents
JP2002133424A (ja) 文書の傾き角度及び境界の検出方法
JP2917427B2 (ja) 図面読取装置
JPH0548510B2 (ja)
JP2789622B2 (ja) 文字/図形領域判定装置
EP0446630A2 (en) Method and apparatus for segmenting characters in an amount field on a financial document
JP3104355B2 (ja) 特徴抽出装置
JPS6361382A (ja) 線画像からの文字成分除去方法
KR940003623B1 (ko) 한글문자 인식 빗침 자획추출방법
JP3277977B2 (ja) 文字認識方法
JP3210224B2 (ja) 文字認識装置
JP2878327B2 (ja) 文字切り出し装置
KR930005568B1 (ko) 오 추출 라인 검출 방법