JPS63228390A - 文字図形認識方式 - Google Patents

文字図形認識方式

Info

Publication number
JPS63228390A
JPS63228390A JP62061241A JP6124187A JPS63228390A JP S63228390 A JPS63228390 A JP S63228390A JP 62061241 A JP62061241 A JP 62061241A JP 6124187 A JP6124187 A JP 6124187A JP S63228390 A JPS63228390 A JP S63228390A
Authority
JP
Japan
Prior art keywords
character
pattern
divided
series
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62061241A
Other languages
English (en)
Other versions
JPH0799534B2 (ja
Inventor
Toshiyuki Itezono
射手園 敏行
Koichi Higuchi
浩一 樋口
Koji Ito
伊東 晃治
Yoshiyuki Yamashita
山下 義征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP62061241A priority Critical patent/JPH0799534B2/ja
Publication of JPS63228390A publication Critical patent/JPS63228390A/ja
Publication of JPH0799534B2 publication Critical patent/JPH0799534B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は媒体上の文字図形を認識する文字図形認識方式
に関するものである。
(従来の技術) 従来、文字図形認識装置では、文字図形パターンよりス
トロークを抽出し、それら抽出されたストロークの位置
、長さ、ストローク間の相互関係等を用いて認識する方
式が多く採用されている。
その手法は(1)文字図形の輪郭を追跡することにょシ
検出された輪郭点系列について曲率を計算し、その曲率
の大きな値の点を分割点とじて輪郭系列を分割し、分割
された系列を組合わせることによりストロークを抽出す
るか、(2)文字図形パターンに細線化処理を行なって
骨格化し、その骨格パターンの連結性及び骨格パターン
を追跡し急激な角度の変化点等を検出してストローク全
抽出し、前記(11f21より抽出されたスl−ローク
について幾何学的な特徴等を抽出して識別を行なってい
た。
(発明が解決しようとする問題点) しかしながら、前記従来の文字図形認識方式では、次の
ような問題点がある。
(1)の方式では文字図形パターンが犬きくなり、又文
字図形パターンが複雑化すると、その処理量が増大し処
理速度の低下を招いていた。(2)の方式では文字図形
パターンを細線化する必要があり、又その細線化による
パターンのひずみ、ヒゲ等の問題があシ、その後の処理
を複雑なものとしていた。
本発明は以上述べた問題点全解決し、簡単な処理で高速
に文字図形を認識することが可能な文字図形認識方式全
提供することを目的とする。
(問題点を解決するための手段) 本発明は前記問題点を解決するために、媒体上の文字図
形を読取って2値化して得られるパターンを記憶する記
憶手段2備え、前記パターンに基づいて文字図形を認識
する文字図形認識方式において、(al前記パターンを
走査して文字図形の外接枠全検出する第1の検出手段、
(b)前記パターンを走査して所定の2つの軸に投影し
た各軸方向の黒ビット数分布全作成する作成手段、(c
)前記2つの軸方向の前記外接枠内の範囲で各黒ビット
数分布の重心座標を決定し、決定した各重心座標で外接
枠内の範囲を分割した各分割範囲に対し各黒ビット数分
布の重心座標を決定する過程を繰ジ返して各軸方向の重
心座標系列を検出する第2の検出手段、(dl前記重心
座標系列に基づいて各軸方向の分割座標系列を決定する
決定手段、(e)前記分割座標系列で分割される前記外
接枠の領域の長さを対応する軸方向の外接枠の長さで正
規化した各軸方向の分割領域長系列を計算する計算手段
、及び(チ)前記分割領域系列と予め計算された標準パ
ターンの分割領域長系列とを照合して前記パターンの文
字図形を認識する認識手段を具備するものである。
(作用) 本発明によれば、以上のように文字認識方式を構成した
ので、技術的手段は次のように作用する。
記憶手段に格納されたパターンを走査することによって
、第1の検出手段では文字図形の外接枠(文字枠)が検
出され、作成手段では各軸方向(例えばX軸、Y軸方向
)の黒ビット数分布が作成される。このように得られた
外接枠及び各黒ビット数分布に基づいて、第2の検出手
段で各軸方向の重心座標系列が検出される。検出された
重心座標系列に基づいて、決定手段により各軸方向の分
割座標系列が決定される。例えば、文字図形の複雑度て
応じて各軸方向の公約数が定められ、重心座標系列にほ
ぼ均等に対応した各軸方向の分割座標系列が決定される
。決定された分割座標系列で分割される前記外接枠の領
域の長さ全対応する軸方向の外接枠の長で正規化した各
軸方向の分割領域長の系列(分割領域長系列)が計算手
段により計算される。この正規化した分割領域長系列と
予め同様にして計算された標準パターンの分割領域長系
列とが認識手段により照合され、該当する標準パターン
のカテゴリ名を文字囲形名として出力される。このよう
に本発明では、文字図形のパターでいるので、簡単な処
理で高速な文字認識が可能となる。
(実施例) 以下、第1図乃至第4図を参照して本発明の詳細な説明
する。
第1図は本発明の文字図形認識方式の一実施例2示す機
能ブロック図でるる。
1は文字、図形、記号等(以下、文字という)が記載さ
れた帳票等の媒体からの光入力である。
この光入力1は光電変換部2に入力される。光電変換部
2は1つの文字予定領域k128x128の画素へ分解
し、各画素を2値のディジタル信号(以下これを人力文
字パターンと呼ぶ)へ変換するものであり、平均的大き
さの1文字は60X60ビット程度の入力文字パターン
で表現される。ノ(ターンレジスタ3は文字予定領域に
おける各画素のX、Y座標を再現できる形式で入力文字
パターンを記憶するものであり、文字予定領域に対応し
て128X128ピツトの容量を有するものである。
文字枠検出部4は、例えば文字の外接枠(文字枠)をそ
のパターンレジスタにおける左端座標X1、右端座標X
r、上端座標Yt、下端座標Ybで表現して検出する。
文字投影作成部5はパターンレジスタ30入力文字パタ
ーンを所定の軸、例えばX軸、Y軸(夫夫パターンレジ
スタ302次元座標における水平方向、垂直方向)へ投
影して黒ビット数の分布を求め、黒ビット数分布5X(
x)、5Y(y)を作成する。
(以T−倣切 但し、X、yはパターンレジスタ3における夫夫0〜1
27なる2次元座標であり、yt、ybは文字枠のY軸
方向の上端座標、下端座標、Xl、XrはX軸方向の左
端座標、右端座標であ)、P(x。
y)は黒ビット又は白ビットヲ意味し、黒ビット(有意
色)の場合P(x、y)=1、白ビット(背景色)の場
合P(x、y)=0をとる。
第2図(a)に入力文字パターン例として漢字「天」5
X(x)、5Y(y)’に示す。
重心検出部6は、文字枠のX、Y各軸方向の全範囲X1
−Xr、 Yj−Yb及び前の過程で検出した重心座標
でその範囲X1〜Xr、 Yj−Ybを分割しX(Mp
)、Y(M、)e求めるものでメハ各範囲の1次モーメ
ントの和をその範囲の黒ビット和で除算することによっ
て求めるものでちる。但し、M、、Mqは座標値の大き
さの順に付した重心座標番号でろp、yr、=t〜MX
(MXはX軸方向の重心の個数でるって奇数)M、=1
〜MY(MYはY軸方向の重心の個数であって奇数)で
ある。X軸方向の重心座標の個数ハとしては、15個程
度の比較的多い数(分割数に比べて)を採用することが
望ましいが、説明の簡略化のために7個の重心座gX(
Mp)k検出する場合について述べる。
まず、文字枠のX軸方向の範囲X1−Xre対象として
、次式に示すように人力文字パターンの黒ビット数分布
5X(x)の1次モーメント和をその範囲の黒ビット和
で除算することによって、中央の重心座標番号にの重心
座標X(M、)ffi求め次いで、その重心座標X(M
4)で分割された夫夫の範囲、X1〜X(M4)、X(
M4)〜Xrヲ対象として2つの重心座標X(Ml) 
、X(Me)”i求める。
次いで、これまで検出された重心座標X(Ml) 。
X(M4) 、 X(Ma)で分割された範囲X1〜X
(Ml)。
X(Ml) 〜X(M4) 、 X(M4) 〜X(M
a) 、X (M。) 〜Xrを対象として4個の重心
座標X(Ml) 、 X(M3) 。
X(M5) 、X(MY)を求める。
Y軸方向の重心座標Y(M9)の検出も検出する重心座
標個数MYe7個とした場合、まず、文字枠の範囲Yt
−Ybe対象として入力文字パターンの黒ビット分布5
Y(y)の重心座標Y(M4) e検出し、次いで文字
枠を重心座標で2分した範囲Yt−Y(M、)、Y(M
4)〜Ybそれぞれを対象として黒ビット分布5y(y
)の重心座標Y(M2)、Y(MOを検出し、更にこれ
までに検出された重心座標Y(M2) 、 Y(M4)
 、 Y(Ma)でY軸方向の文字枠を分割した夫々の
範囲Yt−Y(M2) 、 Y (M2)〜Y(Mイ)
Y(M4)〜Y (Ma ) 、 Y (Ma )〜Y
bを対象として黒ビット分布5Y(y)の重心座標を検
出することによって、計7個の重心座標Y(M+)〜Y
(MY) e検出する。
漢字「天」と「夫」の入力文字パターン(第2X(M+
)〜X(MY)、Y(M+)−Y(MY)を示す。
文字枠分割点決定部7は、各サブパターン対応OX、Y
軸方向の分割数′ff:NX1(、NYk とし、各サ
ブパターン対応のX、Y軸各方向の分割座標系列をDX
(ki)、DY(kj)として、X、Y軸各方向の重心
座標系列X(M、)、Y(M、)’e分割座標候補とし
て、重心座標番号M、、M、e分割座標番号ki、kj
にほぼ均等に対応づけて分割座標DX(k i ) 、
 DY(k j )を決定するものである。
この実施例における分割単位領域の分割形式は、X軸方
向に関する分割数としてNX=4 、5 、6 。
8なる4形式を取ることができ、同様にY軸方向に関す
る分割数NYとしてNY=4.5.6.8  なる4形
式を取ることができ、X軸方向の分割座標番号をki(
ki=1〜NX−1、NX=4 、5 、6.8 )と
し且つY軸方向の分割座標番号1J(J=1〜NY−1
、NY=4.5.6.8)として、文字枠をNX−NY
なる個数の分割単位領域に分割する分割座標系列DX(
k i ) 、 DY(kj )を決定する。X。
Y軸各方向の重心座標番号Mp、M、とX、Y軸方向の
分割座標番号ki、kj’eはぼ均等に対応づけて分割
座標系列DX(ki)、DY(kj)を決定するために
用いるデープルを第1表に示す。
(以下余白) 第1表 このデープルを参照して、X、Y軸各方向の分割数NX
、NYに対応してこのテーブルから重心座標番号M、、
M、’e読み出し、その重心座標番号Mp、M、に対応
した重心座標X(Mp)、Y(Mq)全分割座標DX(
k i ) 、DY(k j )  として決定する。
第1表のテーブルは、重心検出部6で検出する重心座標
の個数MX、MYが7個の場合であるが、一般的な場合
においても、X、Y各方向の分割数の重心座標が含まれ
るように対応させ、且つその際余分の重心座標が残った
場合は両端の領域から順に1個多い重心座標が含まれる
ように対応させることによって作ることができる。
第3図には、X、Y軸各方向の分割数NX、NYとして
NX=NY=5なる分割数が指定された場合について、
分割座標系列DX(k i ) 、DY(k j ) 
 と重心座標系列X(Mp)、Y(M、)との対応関係
を示すと共に、それらの分割座標系列DX(ki)。
DY(kj)で設定される分割単位領域(ki 、J)
を示す。
なお、分割数NX 、 NYは入力文字の複雑度に応じ
て分割数NX、NY’e決定し、或いはいったんリジェ
クトされた場合に分割数NX、NYi変更して再度文字
認識を行なわせるものである。
以上の様に文字枠分割点決定部7では、分割単位領域の
分割形式は、X軸方向に関する分割数としてNX=4.
5.6.8なる4形式、Y軸方向に関する分割数として
NY=4.5,6.8なる4形式をとることができる。
本実施列では説明の簡略化のため、分割数ff1NX=
NY=4として以下説明する。この場合、X軸方向につ
いては、重心座標X(M2)。
X(M4) 、X(Ma)に対応する分割座標DX(1
1。
DXf2) 、 DX(31、Y軸方向については、重
心座標Y(M2) 、 Y(M4) 、 y(M、)に
対応する分割座標DYtl) 、 DYf2) 、 D
Yf3)を決定する。
正規化分割領域長計算部8は、文字図形パターンの分割
数に対応したX軸方向の文字枠座標及び分割座標Xl、
DX(11、DXf21、DX?31、Xr  とY軸
方向の文字枠座標及び分割座標Yt、 DY(1)、D
Yt2)、DY(3)、Yb ’r受けて、各軸上にお
いて各分割座標で分割される各領域の長さを、上記両端
座標間の長さで正規化した正規化分割領域長系列を以下
の式によって計算する。
X軸正規化分割座標系列; X軸両端座標間長;LX=Xr−Xl+1  ・・・・
・・(7)Y軸正規化分割座標系列; Y軸両端座標間長; LY = Yb−yt+ 1  
 ・・曲(9)ただし、DX(0)=Xl、 DX(4
1=Xr、 DY(0)=Y4 。
DY(41= Yb である。
漢字「天」と「夫」夫々の入力文字パターンにおける分
割座標DX10)〜DX(41、DY(0)〜DY(4
1、X軸方向の正規化分割領域長BEX[11〜BEX
(4+、Y軸方向の正規化分割領域長B EY(11〜
BEYf41に各入力文字パターンと共に第2図(a)
に示す。
正規化分割領域長計算部8で得られた入力文字パターン
の特徴情報としての正規化分割領域系列t i= (B
EXII)、BEY(1)I I=1〜4 )は識別部
9に与えられる。
辞書メモリ10には、入力文字パターンの場合と同様に
して計算され標準パターンに対する特徴情報としての正
規化分割領域系列fmが予め登録されている。
識別部9は人力文字パターン及び標準パターンの特徴情
報の類似度を測定し、最も類似する標準パターンの文字
コードを入力文字パターン名として認識し、その文字コ
ードを文字コード出力端子11に出力する。本実施例で
は、辞書メモリ10内の標準パターンの正規化分割領域
長系列fmと入力文字パターンの正規化分割領域長系列
fi  との間における下記のユークリッド距離(D)
の最小値を与える標準パターンを最も類似する標準パタ
ーンとする。
D=(l曹て=Tロア  ・・・・・・・・・・・U■
なおま念、前記実施例においてはテーブルを採用するこ
とによって重心座標と分割座標とを対応づけたが、所定
の手順のフローチャートの演算処理を実行させることに
よっても対応づけることができる。この場合のフローチ
ャー[f−第4図に示す。なお、第4図における除算の
結果はすべて小数点以下切り捨てである。
第4図において、ステップS1で重心個数MXを分割数
NXで割つ几数′M4’を求め、ステップS2゜S3で
MX/NXの剰余R1とそのR1の剰余R2を求める。
又、ステップS4で分割数の中央値4そ求め、ステップ
S5.S6で分割番号ki  と重心番号Mp k O
にセットする。又、ステップS7゜88.39で、分割
番号ki’i1つ増加する毎に、前に設定されているR
2’z1つ浦じ、重心番号MptMよずつ増加させる。
ステップSIOで剰余R2が負でないことを調べ、剰余
R2が負でない限フステツ7’S11で重心番号の数を
1つ増し、ステップS12でその重心番号Mpを分割番
号kiに対応づけ、分割座標DX(Mp)’e決定する
R2が負の場合、ステップS13で現在の分割番号ki
が中央値−より大きいか否かを判定し、大きい場合は重
心番号を1つ増し、小さい場合はステップS9で設定さ
れた重心番号を、分割座標DX(Mp)’r決定し、ス
テップS14で分割番号kiが(NX−1)に一致した
ことを検出して終了する。
以上述べた本実施例の文字図形認識方式の特徴情報であ
る分割領域長系列の有効性を以下に説明する。
例えば第2図(a)にそれぞれ示される「天」と「夫」
の入力文字パターンにおいて、両パターンの相異点とな
る中央縦ストロークの上部の突き出しの有無がBEml
において顕著な差となってあられれ、正規化分割領域長
系列が文字図形パターンの差異を有効に反映しているこ
とが明らかである。
以上のように本実施例によれば、入力文字パタ−ンを走
査することによって、得られる正規化分割領域長系列を
特徴情報としたもので簡単な処理の高速な文字図形認識
を実現することができる。
(発明の効果) 以上詳細に説明したように本発明によれば、従来の認識
方式の特徴情報抽出ておける、輪郭追跡や細線化等の複
雑なパターン処理を行なうことなく、入力文字図形パタ
ーンを走査するだけで得られる所定の軸上における黒ビ
ット数分布から、重心を利用して特徴情報である正規化
した分割領域長系列を得ているので、簡単な処理の高速
な文字認識が実現できる。
【図面の簡単な説明】
第1図は本発明による文字図形認識方式の一実施例を示
す機能ブロック図、第2図は入力文字パターン例と、重
心座標系列、分割座標系列、正規化分割領域長系列との
関係を示す図、第3図は重心座標系列と分割座標系列と
の対応関係金示す図、第4図は分割座標系列の他の決定
方法を示すフローチャートである。 1・・・光入力、2・・・光電変換部、3・・・パター
ンレジスタ、4・・・文字枠検出部、5・・・文字投影
作成部、6001重心検出部、7・・・文字枠分割点決
定部、8・・・正規化分割領域長計算部、9・・・識別
部、10・・・辞書メモリ、11・・・出力端子

Claims (1)

  1. 【特許請求の範囲】 媒体上の文字図形を読取つて2値化して得られるパター
    ンを記憶する記憶手段を備え、前記パターンに基づいて
    、文字図形を認識する文字図形認識方式において、 (a)前記パターンを走査して文字図形の外接枠を検出
    する第1の検出手段、 (b)前記パターンを走査して所定の2つの軸に投影し
    た各軸方向の黒ビット数分布を作成する作成手段、 (c)前記2つの軸方向の前記外接枠内の範囲で各黒ビ
    ット数分布の重心座標を決定し、決定した各重心座標で
    外接枠内の範囲を分割した各分割範囲に対し各黒ビット
    数分布の重心座標を決定する過程を繰り返して各軸方向
    の重心座標系列を検出する第2の検出手段、 (d)前記重心座標系列に基づいて各軸方向の分割座標
    系列を決定する決定手段、 (e)前記分割座標系列で分割される前記外接枠の領域
    の長さを対応する軸方向の外接枠の長さで正規化した各
    軸方向の分割領域長系列を計算する計算手段、 (f)前記分割領域系列と予め計算された標準パターン
    の分割領域長系列とを照合して前記パターンの文字図形
    を認識する認識手段とを具備することを特徴とする文字
    図形認識方式。
JP62061241A 1987-03-18 1987-03-18 文字図形認識方式 Expired - Fee Related JPH0799534B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62061241A JPH0799534B2 (ja) 1987-03-18 1987-03-18 文字図形認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62061241A JPH0799534B2 (ja) 1987-03-18 1987-03-18 文字図形認識方式

Publications (2)

Publication Number Publication Date
JPS63228390A true JPS63228390A (ja) 1988-09-22
JPH0799534B2 JPH0799534B2 (ja) 1995-10-25

Family

ID=13165536

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62061241A Expired - Fee Related JPH0799534B2 (ja) 1987-03-18 1987-03-18 文字図形認識方式

Country Status (1)

Country Link
JP (1) JPH0799534B2 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58123171A (ja) * 1982-01-18 1983-07-22 Oki Electric Ind Co Ltd 文字認識方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58123171A (ja) * 1982-01-18 1983-07-22 Oki Electric Ind Co Ltd 文字認識方式

Also Published As

Publication number Publication date
JPH0799534B2 (ja) 1995-10-25

Similar Documents

Publication Publication Date Title
JPS63228390A (ja) 文字図形認識方式
CN112464753B (zh) 图像中关键点的检测方法、检测装置及终端设备
JPS63238686A (ja) 特徴抽出方式
JPS63234372A (ja) 特徴抽出方式
CN111598835A (zh) 一种服装图片颜色的匹配方法、系统和匹配装置
JPH0147835B2 (ja)
JPS63234374A (ja) 文字図形認識方式
JPH02206894A (ja) 文字認識方法
JPH0147829B2 (ja)
JPS63238685A (ja) 文字図形認識方式
JPH08101880A (ja) 文字認識装置
JPS6214277A (ja) 画像処理方式
JP2616994B2 (ja) 特徴抽出装置
JPH0438024B2 (ja)
JP2658154B2 (ja) 文字識別方式
CN117409420A (zh) 一种自然场景下弯曲文本识别的方法
JPH11238135A (ja) イメージ認識方法およびイメージ認識装置
JPH01187684A (ja) 文字認識装置
JP3352467B2 (ja) オンライン文字認識装置
JP2801246B2 (ja) 文字処理装置及び方法
JPS59154577A (ja) 図形照合装置の二値化装置
JP2974167B2 (ja) 文字の大分類認識方法
JPS6174079A (ja) 図形認識装置
JPH0547871B2 (ja)
JPS63233486A (ja) 特徴抽出方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees