JP2803892B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP2803892B2
JP2803892B2 JP2145668A JP14566890A JP2803892B2 JP 2803892 B2 JP2803892 B2 JP 2803892B2 JP 2145668 A JP2145668 A JP 2145668A JP 14566890 A JP14566890 A JP 14566890A JP 2803892 B2 JP2803892 B2 JP 2803892B2
Authority
JP
Japan
Prior art keywords
character
image
horizontal
vertical
cut
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2145668A
Other languages
English (en)
Other versions
JPH0438584A (ja
Inventor
保直 伊崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2145668A priority Critical patent/JP2803892B2/ja
Publication of JPH0438584A publication Critical patent/JPH0438584A/ja
Application granted granted Critical
Publication of JP2803892B2 publication Critical patent/JP2803892B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 〔概要〕 手書き文字を認識する文字認識装置に関し、 標準パターン辞書の1字種あたりのパターン数を少な
くでき、照合に要する時間を短縮でき、高精度の認識を
行なうことを目的とし、 入力文字列から1文字に相当する部分を切り出し、切
り出された文字画像の特徴を抽出して標準パターン辞書
と照合し、照合結果として認識した文字の候補列を出力
する文字認識装置において、該切り出された文字画像の
黒画素の水平方向及び垂直方向のヒストグラムを求める
ヒストグラム作成手段と、該切り出された文字画像の水
平方向及び垂直方向の重心位置を求める重心作成手段
と、該切り出された文字画像を一定の大きさに拡大又は
縮小して特徴抽出のための正規化画像を得る正規化手段
とを有し、該正規化画像の水平方向及び垂直方向の重心
位置を標準パターンに合わせた一定位置とするよう該切
り出された文字画像の該垂直方向及び水平方向のヒスト
グラムの値が所定値以下の部分で該正規化手段での拡大
又は縮小を行なうように構成する。
〔産業上の利用分野〕
本発明は文字認識装置に関し、手書き文字を認識する
文字認識装置に関する。
〔従来の技術〕
従来の文字認識装置は手書き文字を認識するとき文字
列から一文字ずつの範囲を決める文字切出しを行い、切
り出された文字を標準パターンとの照合がうまくいくよ
うに予め決まった大きさ、例えば48×48ドットに正規化
する操作をおこない、その正規化された文字画像から認
識するための特徴例えば、線密度特徴、線方向特徴を抽
出し、その特徴と予め用意されている標準パターン辞書
とで距離計算または類似度計算することで、相違度が小
さい順、あるいは類似度が大きい順に候補文字を出力し
ている。
〔発明が解決しようとする課題〕
手書き文字は筆記者によって多様な変形を受ける。例
えば大きな文字を書く筆記者もいれば小さな文字を書く
筆記者もいる。また右上がりに書いたり、草書体のよう
にくずして書く筆記者もいて、記入された文字の字形は
各人別々の字形となる。そのため認識する際に文字の大
きさをある大きさにする正規化という操作がなされる。
また文字の大きさを正規化するだけでなく標準パターン
として1字あたり複数のパターンをもつようにして字形
の変形を吸収することがなされている。例えば使用され
る特徴は256次元、あるいは384次元という大きなもので
あり、また標準パターンの数も1字種あたり3〜5パタ
ーンであり変形を吸収して認識制度を上げようとすると
標準パターン辞書の容量は多くなる傾向がある。したが
って、標準パターンとのマッチングに時間がかかり、ま
た字形の変形をすべて吸収できるわけではないという問
題があった。
本発明は上記の点に鑑みなされたもので、標準パター
ン辞書の1字種あたりのパターン数を少なくでき、照合
に要する時間を短縮でき、高精度の認識を行なう文字認
識装置を提供することを目的とする。
〔課題を解決するための手段〕
本発明の文字認識装置は入力文字列から1文字に相当
する部分を切り出し、切り出された文字画像の特徴を抽
出して標準パターン辞書と照合し、照合結果として認識
した文字の候補列を出力する文字認識装置において、 切り出された文字画像の黒画素の水平方向及び垂直方
向のヒストグラムを求めるヒストグラム作成手段と、 切り出された文字画像の水平方向及び垂直方向の重心
位置を求める重心作成手段と、 切り出された文字画像を一定の大きさに拡大又は縮小
して特徴抽出のための正規化画像を得る正規化手段とを
有し、 正規化画像の水平方向及び垂直方向の重心位置を標準
パターンに合わせた一定位置とするよう切り出された文
字画像の垂直方向及び水平方向のヒストグラムの値が所
定値以下の部分で正規化手段での拡大又は縮小を行な
う。
〔作用〕
本発明においては、正規化手段において、正規化画像
の水平方向及び垂直方向の重心位置が一定位置とされて
標準パターンに合わせられるため、正規化画像から抽出
した特徴が標準パターンに近く精度の高い文字認識がな
される。従って、標準パターン辞書の1字種あたりのパ
ターン数を削除でき、その分だけ照合に要する時間が短
縮される。
〔実施例〕
第2図は本発明の装置の一実施例のブロック図を示
す。
同図中、文字入力部11に記入された文字列画像は2値
化部12で黒画素を‘1'白画素を‘0'と表すように2値化
され画像メモリ13に格納される。この画像メモリ13から
各文字の画像が1文字ずつ切り出され、正規化部14で例
えば48ドット×48ドットの大きさに正規化されて正規化
画像メモリ15に格納される。
この正規化部14の動作を第1図により更に詳しく説明
する。第1図中、端子20には画像メモリ13からの切り出
された各文字の画像例えば第3図,第4図の画像A1,A2
に示す如き画像が入来してヒストグラム作成部21、重心
作成部22、拡大縮小部23夫々に供給される。ヒストグラ
ム作成部21は画像を構成する画素f(x,y)(但しf
(x,y)=0又は1、x,yは画像中でのx,y座標)を用い
て次式の演算を行ない、黒画素の水平方向ヒストグラム
H(y)及び垂直方向ヒストグラムH(x)を求める。
但しwは文字幅、hは文字高さである。ヒストグラム
作成部21は上記の演算によって第3図、第4図に示す水
平方向ヒストグラムH1(y),H2(y)及び垂直方向ヒ
ストグラムH1(x),H2(x)を得て、これらを水平方
向ヒストグラムメモリ25、垂直方向ヒストグラムメモリ
24夫々に格納する。
重心作成部22は次式の演算を行ない水平方向の重心位
置GX及び垂直方向重心位置GYを求める。
なお、上記(2a),(2b)式の分母は水平,垂直方向
の重みをつけた黒画素数、分子は水平、垂直方向の黒画
素数である。
ここで、得られた重心位置GX,GYは重心メモリ26に格
納される。第3図,第4図夫々に画像A1,A2夫々の水平
方向重心位置GX1,GX2を示す。
拡大・縮小部23は端子20より供給される画素を水平方
向及び垂直方向に拡大・縮小して幅48ドット高さ48ドッ
トの正規化画像とする。このとき正規化画像の重心位置
(GX,GY)を正規化画像の中心位置(24,24)とするよう
に拡大・縮小を行なう。水平方向の拡大又は縮小は垂直
方向ヒストグラムの値が所定値未満のライン行の画素を
重ねる(又は間引く)ことにより行なわれ、垂直方向の
拡大(縮小)は水平方向ヒストグラムの値が所定値未満
の列の画素を重ねる(又は間引く)ことにより行なわれ
る。例えば第4図の画像A2の場合には、画像A2のX座標
1〜GX2を正規化画像のX座標1〜24とするために垂直
方向ヒストグラムの値の小さい部分を拡大又は縮小し、
同様に画像A2のX座標GX2+1〜wを正規化画像のX座
標25〜48とするために垂直方向ヒストグラムの値の小さ
い部分を拡大又は縮小する。このようにして、第3図,
第4図夫々の画像A1,A2夫々は第5図,第6図夫々に示
す正規化画像とされ、端子27から第2図に示す正規化画
像メモリ15に供給されて格納される。
第2図に戻って説明するに、特徴抽出部30は正規化画
像メモリ15に格納された各文字の正規化画像から文字の
複雑さを表わす線密度特徴、文字を構成するストローク
の方向性を表わす線方向特徴、ストローク間に囲まれた
領域を表す領域特徴等の256次元(又は384次元)の特徴
を抽出し、特徴メモリ31に格納する。次に大分類部32は
標準パターン辞書である大分類辞書33を用いて上記特徴
と標準パターンとの照合を行なって文字の大分類を行な
い、大分類を大分類結果メモリ34に格納する。
更に詳細分類部35は標準パターン辞書である詳細分類
辞書36を用いて大分類結果及び特徴と標準パターンとの
照合を行なって距離計算又は類似度を計算し、相違度が
小さい順、又は類似度が大きい順に候補文字を選択し、
この候補文字を候補メモリに格納する。
上記の大分類辞書33及び詳細分類辞書36に予め登録さ
れている標準パターンは各文字の重心位置が画像の中心
位置にあるパターンを有している。
ここで、第3図に示す画像A1の水平方向重心位置GX1
は略w/2に等しいため本発明装置は勿論従来の装置でも
第5図に示す正規化画像が得られ、この文字から抽出さ
れる特徴は標準パターンに近く、精度の高い文字認識を
行なうことができる。
しかし、第4図に示す画像A2の水平方向重心位置GX2
はw/2を越えているため、従来装置では第7図に示す正
規化画像となり、この文字から抽出される特徴は標準パ
ターンから遠く文字認識の精度が低くなるが、本発明装
置では第6図に示す正規化画像となり、この文字から抽
出される特徴は標準パターンに近く精度の高い文字認識
が可能となる。
このように正規化手段において、正規化画像の水平方
向及び垂直方向の重心位置が一定位置とされて標準パタ
ーンに合わせられるため、正規化画像から抽出した特徴
が標準パターンに近く精度の高い文字認識がなされる。
従って、標準パターン辞書の1字種あたりのパターン数
を削減でき、その分だけ照合に要する時間が短縮され
る。
〔発明の効果〕
上述の如く、本発明の文字認識装置によれば、標準パ
ターン辞書の1字種あたりのパターン数を少なくでき、
照合に要する時間を短縮でき、高精度の認識を行なうこ
とができ、実用上きわめて有用である。
【図面の簡単な説明】
第1図は本発明装置の正規化部の一実施例のブロック
図、 第2図は本発明装置の一実施例のブロック図、 第3図、第4図夫々は文字画像及びヒストグラムの各例
を示す図、 第5図、第6図、第7図夫々は正規化画像の各例を示す
図である。 図において、 21はヒストグラム作成部、 22は重心作成部、 23は拡大・縮小部、 24は垂直方向ヒストグラムメモリ、 25は水平方向ヒストグラムメモリ、 26は重心メモリ、 33は大分類辞書、 36は詳細分類辞書 を示す。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】入力文字列から1文字に相当する部分を切
    り出し、切り出された文字画像の特長を抽出して標準パ
    ターン辞書と照合し、照合結果として認識した文字の候
    補列を出力する文字認識装置において、 該切り出された文字画像の黒画素の水平方向及び垂直方
    向のヒストグラムを求めるヒストグラム作成手段(21)
    と、 該切り出された文字画像の水平方向及び垂直方向の重心
    位置を求める重心作成手段(22)と 該切り出された文字画像を一定の大きさに拡大又は縮小
    して特徴抽出のための正規化画像を得る正規化手段(2
    3)とを有し、 該正規化画像の水平方向及び垂直方向の重心位置を標準
    パターンに合わせた一定位置とするよう該切り出された
    文字画像の該垂直方向及び水平方向のヒストグラムの値
    が所定値以下の部分で該正規化手段(23)での拡大又は
    縮小を行なうことを特徴とする文字認識装置。
JP2145668A 1990-06-04 1990-06-04 文字認識装置 Expired - Fee Related JP2803892B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2145668A JP2803892B2 (ja) 1990-06-04 1990-06-04 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2145668A JP2803892B2 (ja) 1990-06-04 1990-06-04 文字認識装置

Publications (2)

Publication Number Publication Date
JPH0438584A JPH0438584A (ja) 1992-02-07
JP2803892B2 true JP2803892B2 (ja) 1998-09-24

Family

ID=15390325

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2145668A Expired - Fee Related JP2803892B2 (ja) 1990-06-04 1990-06-04 文字認識装置

Country Status (1)

Country Link
JP (1) JP2803892B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6931665B2 (en) 2001-07-30 2005-08-23 3M Innovative Properties Company Vapor permeable retroreflective garment

Also Published As

Publication number Publication date
JPH0438584A (ja) 1992-02-07

Similar Documents

Publication Publication Date Title
US7437001B2 (en) Method and device for recognition of a handwritten pattern
El Abed et al. Comparison of different preprocessing and feature extraction methods for offline recognition of handwritten arabicwords
Ismail et al. Online Arabic handwritten character recognition based on a rule based approach
Naz et al. Challenges in baseline detection of Arabic script based languages
JP2803892B2 (ja) 文字認識装置
Sajedi et al. Persian handwritten number recognition using adapted framing feature and support vector machines
KR20090111202A (ko) 한글의 기본 구성요소인 수평선, 수직선, 사선, 원의개수와 특성치를 이용한 한글인식 방법 및 장치
JP4092847B2 (ja) 文字認識装置および文字認識方法
CN113537216B (zh) 一种点阵字体文本行倾斜校正方法及装置
JP2984315B2 (ja) 認識装置
Kaothanthong et al. Improving Thai optical character recognition using circular-scan histogram
Kawtrakul et al. Multifeature extraction for printed thai character recognition
JP2636512B2 (ja) 文字正規化方式
JPH0664629B2 (ja) 文字認識方式
JPH0776980B2 (ja) 文字認識方法
JPH03126188A (ja) 文字認識装置
JP2972443B2 (ja) 文字認識装置
JP3245241B2 (ja) 文字認識装置および方法
Calarasanu et al. Towards the Rectification of Highly Distorted Texts.
JPH076211A (ja) オンライン文字認識装置
JP4859027B2 (ja) 文字パターン生成方法および文字認識方法
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
JP2918363B2 (ja) 文字分類方法及び文字認識装置
Senior Normalisation and Preprocessing for a Recurrent Network Off-line Handwriting Recognition System
Tiwari et al. A novel technique to read small and capital handwritten character

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080717

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090717

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees