JPH0475553B2 - - Google Patents

Info

Publication number
JPH0475553B2
JPH0475553B2 JP58196222A JP19622283A JPH0475553B2 JP H0475553 B2 JPH0475553 B2 JP H0475553B2 JP 58196222 A JP58196222 A JP 58196222A JP 19622283 A JP19622283 A JP 19622283A JP H0475553 B2 JPH0475553 B2 JP H0475553B2
Authority
JP
Japan
Prior art keywords
character
pattern
scanning
coordinate
distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP58196222A
Other languages
English (en)
Other versions
JPS6089288A (ja
Inventor
Koichi Higuchi
Hirohisa Goto
Yoshuki Yamashita
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP58196222A priority Critical patent/JPS6089288A/ja
Publication of JPS6089288A publication Critical patent/JPS6089288A/ja
Publication of JPH0475553B2 publication Critical patent/JPH0475553B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 (技術分野) 本発明は高速で安定な特徴抽出方式に関し、文
字の認識に利用することができる。
(背景技術) 従来、文字図形認識装置に於ては、文字図形パ
ターンよりストロークを抽出し、それら抽出され
たストロークの位置、長さ、ストローク間の相互
関係等を用いて認識する方式が多く採用されてい
る。この種の装置においては、(1)文字図形の輪郭
を追跡することにより検出された輪郭点系列につ
いて曲率を計算し、その曲率の大きな値の点を分
割点として輪郭系列を分割し、分割された系列を
組合わせることによりストロークを抽出するか、
又は(2)文字図形パターンに細線化処理を行なつて
骨格化し、その骨格パターンの連結性及び骨格パ
ターンを追跡し急激な角度の変化点等を検出して
ストロークを抽出し、該抽出されたストロークに
ついて幾何学的な特徴等を抽出し字文図形の識別
を行なつていた。しかしながら、(1)の方法は、文
字図形パターンが大きくなり又文字図形パターン
が複雑化すると、その処理量が増大しそのため処
理速度の低下を招き、(2)の方法は、文字図形パタ
ーンを細線化する必要があり又その細線化による
パターンのひずみ、ヒゲ等の問題があり、その後
の処理を複雑なものとしていた。そこでこれらの
欠点を改善するものとして、文字図形パターンを
所望の方向に走査し、当該走査方向のストローク
成分を表わすサブパターンを抽出し、サブパター
ンについて文字枠の複数の辺上の各点から走査し
てすべての文字線との交点を検出し、走査を開始
した辺上の点と前記文字線との交点間の距離のN
乗和を抽出し、もつて文字図形パターンの特徴抽
出をなす方法が考案されている。しかし手書文字
のように局所的な文字線の移動、たとえば図3の
漢字の〓上〓のようにストロークが同図aの位置
からbの位置に移動すると、同図に示すように文
字枠下辺から走査したとき抽出される特徴Hb
(x)が大きく変動する。このような特徴の変動
を吸収するためには、文字認識の段階で変形に対
応した辞書マスクをあらかじめ複数個用意しなけ
ればならず、辞書メモリの増大及び処理速度の低
下を招いていた。
(発明の課題) 本発明の目的はこのような従来の技術の欠点を
除去することにあり、文字枠の各辺から文字線ま
での距離を文字パターンの周辺分布を利用して、
文字線の位置変動に追従した尺度に変換すること
により位置変動の特徴量に対する影響を軽減した
ものであり、その特徴は、文字図形パターンを予
め定めた方向に走査して、該走査方向における文
字線の断面を検出し、断面長が前記文字図形パタ
ーンの文字線幅より十分長い断面を抽出すること
によりサブパターンを抽出し、該サブパターンに
ついて前記文字図形パターンの方形の文字外接枠
の4辺のうち、少なくとも2辺の辺上の各点から
所定の方向へ走査して走査線上におけるすべての
文字線の位置を検出し、走査を開始した辺上の点
と前記検出した文字線との距離のN乗和(N:定
数)を抽出することにより、文字図形パターンの
特徴抽出を行なう特徴抽出方式において、 入力文字図形パターンを垂直軸、水平軸とに夫
夫投影して、文字図形部分の投影分布を求める段
階と、文字外接枠の範囲を対象として夫々の分布
の重心座標を決定し、次いですでに検出した重心
座標で、投影分布を分割し、分割した夫々の範囲
を対象として夫々の前記投影分布の重心座標を決
定する過程を複数回繰返して重心座標系列を求め
る段階を備え、 前記走査を開始した辺上の点の座標及び前記検
出した文字線の位置座標を、重心座標系列の座標
値と対応させて、重心座標系列に座標値の小さな
順に付した重心座標番号を尺度とする値にそれぞ
れ変換し、この2つの値の差のN乗和(N:定
数)を抽出することにより特徴抽出を行うことに
ある。
(発明の構成および作用) 第1図は本発明の文字認識装置における一実施
例を示す図である。同図において、1は光電変換
部、2はパターンレジスタ、3は線幅計算部、4
はサブパターン抽出部、5は文字枠検出部、6は
文字投影作成部、7は重心座標系列抽出部、8は
特徴抽出部、9は特徴マトリクス抽出部、10は
識別部、11は文字名出力である。
本実施例の動作は、次のとおりである。まず、
読取機構にセツトされた帳票上の文字は、光電変
換部1において2値の量子化されたデイジタル電
気信号に変換され、パターンレジスタ2に格納さ
れる。それと同時に、線幅計算部3において入力
パターンの線幅(W)が計算される。サブパターン抽
出部4は、パターンレジスタについて垂直スキヤ
ンを全面行なつて、黒ビツトの連続長さと線幅計
算部3において計算された線幅との関係より垂直
サブパターン(VSP)を抽出する。同様に、水
平スキヤンにより水平サブパターン(HSP)を、
右斜め45゜スキヤンにより右斜めサブパターン
(RSP)を、左斜め45゜スキヤンにより左斜めサブ
パターン(LSP)を抽出する。第2図は原パター
ンと各サブパターンの例でaは原パターン、bは
垂直サブパターン(VSP)、cは水平サブパター
ン(HSP)、dは右斜めサブパターン(RSP)、
eは左斜めサブパターン(LSP)である。
文字枠検出部5はパターンレジスタ内の文字図
形パターンに外接する方形の枠(以後文字枠と称
する)を検出し、パターンレジスタで定義される
2次元平面における前記文字枠を規定する為の位
置座標を特徴抽出部8へ送出する。以後の説明に
おいては文字枠の左下を原点とし、水平方向をX
軸、垂直方向をY軸とする座標系を使用する。
文字投影作成部6はパターンレジスタに格納さ
れている文字図形パターンをX軸、Y軸へ投影し
て黒ビツト数の分布を求め、黒ビツト数分布SX
(x),SY(y)を作成する。
SX(x)=y=Yby=Yt P(x,y) SY(y)=x=xrx=xl P(x,y) (1) 但し、x,yはパターンレジスタ2における夫
夫0〜127なる2次座標であり、Yt,Ybは文字枠
のY軸方向の上端座標、下端座標、Xl,XrはX
軸方向の左端座標、右端座標であり、背景部はP
(x,y)=0、文字線部はP(x,y)=1であ
る。
重心座標系列抽出部7は、文字枠の範囲を対象
として文字投影作成部6で成形した黒ビツト分布
SX(x),SY(y)の重心座標系列、X(Mp),Y(Mq
を求めるものであり、これは文字枠のX軸方向又
はY軸方向の全範囲又はそれまでに求めた重心座
標で分割された範囲における一次モーメントの和
をその範囲の黒ビツト和で除算することにより求
めるものである。但し、Mp,Mqは座標値の大き
さの順に付した重心座標番号であり、Mp=1〜
MX(MXはX軸方向の重心の個数であつて奇
数)、Mq=1〜MY(MYはY軸方向の重心の個
数であつて奇数)である。MX,MYの値として
は、文字図形パターンの大きさ(この実施例では
60×60ビツト)に近い値として15個又は31個程度
を採用することが望ましいが、ここでは説明の簡
略化のため7個の重心座標X(Mp)を検出する場
合について述べる。
まず、文字枠のX軸方向の範囲X1〜Xrを対象
として、次式に示すように入力文字パターンの黒
ビツト数分布SX(x)の1次モーメント和をその範
囲の黒ビツト和で除算することによつて、中央の
重心座標番号4の重心座標X(4)を求める。
X(4)=x=Xrx=Xl SX(x)・x/x=Xrx=Xl SX(x) (2) 次いで、その重心座標X(4)で分割された夫々の範
囲、Xl〜X(4),X(4)〜Xrを対象として2つの重
心座標X(2),X(6)を求める。
X(2)=x=X(4)x=Xl SX(x)・x/x=X(4)x=Xl SX(x) X(6)=x=Xrx=(4) SX(x)・x/x=Xrx=X(4) SX(x) (3) 次いで、これまで検出された重心座標X(2),X
(4),X(6)で分割された範囲X1〜X(2),X(2)〜X
(4),X(4)〜X(6),X(6)〜Xrを対象として4個の
重心座標X(1),X(3),X(5),X(7)を求める。
X(1)=x=X(2)x=Xl SX(x)・x/x=X(2)x=Xl SX(x) X(3)=x=X(4)x=X(2) SX(x)・x/x=X(4)x=X(2) SX(x) 〓 X(7)=x=Xrx=X(6) SX(x)・x/x=Xrx=X(6) SX(x) (4) Y軸方向の重心座標Y(Mq)の検出も検出する重
心座標個数MYを7個とした場合、まず、文字枠
の範囲Yb〜Ytを対象として入力文字パターンの
黒ビツト分布SY(y)の重心座標Y(4)を検出し、次
いで方形文字外接枠を重心座標で2分した範囲
Yb〜Y(4),Y(4)〜Ytそれぞれを対象として黒ビ
ツト分布SY(y)の重心座標Y(2),Y(6)を検出し、
更にこれまでに検出された重心座標Y(2),Y(4),
Y(6)でY軸方向の方形文字外接枠を分割した夫々
の範囲Yb〜Y(2),Y(2)〜Y(4),Y(4)〜Y(6),Y
(6)〜Ytを対象として黒ビツト分布SY(y)の重心座
標を検出することによつて、計7個の重心座標Y
(1)〜Y(7)を検出する。
第4図に漢字の〓上〓を例としてSY(y)及びY
(Mq)を示した。
特徴抽出部8は、まず垂直サブパターンについ
て文字枠を構成する4辺のうち垂直な辺である左
辺上の点P(Xl,y)から水平走査を開始し、白
点から黒点への変化点をすべて検出する。次にこ
の変化点座標を変換式を用いて重心座標番号を尺
度とする値に変換する。変換は次のように行う。
重心座標系列抽出部7で抽出したX軸方向の重心
座標系列X(Mp)を用いて前記検出した変化点の
x座標を(5)式に従つて重心座標番号を尺度とする
値x′に変換する。
X(Mp)≦x<X(Mp+1)の場合 x′=Mp+(x−X(Mp))/(X(Mp+1)−X
(Mp)) x=Xlの場合 x′=0 x=Xrの場合 x′=MX+1 …(5) 但し、X(0)=Xl,X(Mp+1)=Xrとする。
このx′と走査開始点のx座標の変換値との差
ΔX′kのN乗(Nは定数、本実施例ではN=2)
の値の計算を前記検出したすべての変化点につい
て行ない、その値の総和を配列要素Vl(y)に格納す
る。但し、前記白点とは文字背景部を表わし、黒
点は文字線部を表わす。また式(6)は前記のVl(y)を
式で表わしたものであり、式中のΔXk′はそれぞ
れの変化点と文字枠辺との座標変換値の差を表わ
す。
Vl(y)=〓(ΔX′kN …(6) 上記の様な処理を文字枠の2つの垂直辺上のす
べての点を開始点として行ない、垂直サブパター
ンについて、文字枠の左辺上の点から水平走査を
開始して作成する配列Vl(y)、文字枠の右辺上の点
から水平走査を開始して作成する配列Vr(y)を抽
出する。但し、y=0,…,Yt,Ytは文字枠上
辺のY座標である。同様な処理により、水平サブ
パターン、右斜めサブパターン左斜めサブパター
ンについては文字枠の2個の水平辺上すなわち上
辺及び下辺のすべての点から垂直走査を行なつ
て、水平サブパターンについて配列Hb(x),Ht(x)、
右斜めサブパターンについての配列Rb(x),Rt(x)、
左斜めサブパターンについての配列Lb(x),Lt(x)を
抽出する。但し、j=0,…,Xr,Xrは文字枠
右辺のX座標である。
特徴マトリクス抽出部9は、特徴抽出部8にお
いて抽出された8種の配列を使用し、各配列をM
個に分割し、分割された配列の同一分割単位内の
配列の値の平均値を計算することにより、M×8
次元の特徴マトリクスF(m,n)を抽出する。
但しm=1,…,M,n=1,…,8である。
識別部10は特徴マトリクス抽出部7で抽出され
た特徴マトリクスと、同形式で記述された標準文
字マスクf(m,n)との間の式(7)で示される距
離(D)を計算し、その距離が最も小さい値を与える
標準文字マスクのカテゴリ名を文字名出力11へ
出力する。
D=√〓{(,)−(,)}2…(7) (発明の効果) 以上説明した様に本実施例では、文字パターン
の周辺分布の重心座標系列を用いて文字枠の各辺
から文字線までの距離を文字線の局所的な位置変
動に追従した尺度に変換しているので、抽出され
る特徴が安定である。第3図に従来の技術の特徴
抽出例、第4図に本方式の特徴抽出例を示すよう
に、Hb(x)の値が従来の技術では4倍の変動があ
つたものが、本方式では1.5倍の変動に緩和され
ている。このように抽出される特徴が安定である
から、認識精度の良い文字認識を行うことができ
る。
本発明は、文字パターンの各辺から文字線まで
の距離を文字パターンの周辺分布を利用して文字
線の位置変動に追従した尺度に変換しているの
で、安定な特徴を抽出することができるという利
点があり、高速で認識精度の良い文字認識装置に
利用することができる。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロツク図、
第2図a〜eは原パターン及びサブパターンの例
を示す図、第3図は従来の技術の説明図、第4図
は本発明を適用した場合における、文字図形パタ
ーン周辺分布、重心座標系列及び特徴抽出結果を
示す図である。 1…光電変換部、2…パターンレジスタ、3…
線幅計算部、4…サブパターン抽出部、5…文字
枠検出部、6…文字投影作成部、7…重心座標系
列抽出部、8…特徴抽出部、9…特徴マトリクス
抽出部、10…識別部、11…文字名出力。

Claims (1)

  1. 【特許請求の範囲】 1 文字図形パターンを予め定めた方向に走査し
    て、該走査方向における文字線の断面を検出し、
    断面長が前記文字図形パターンの文字線幅より十
    分長い断面を抽出することによりサブパターンを
    抽出し、該サブパターンについて前記文字図形パ
    ターンの方形の文字外接枠の4辺のうち、少なく
    とも2辺の辺上の各点から所定の方向へ走査して
    走査線上におけるすべての文字線の位置を検出
    し、走査を開始した辺上の点と前記検出した文字
    線との距離N乗和(N:定数)を抽出することに
    より、文字図形パターンの特徴抽出を行なう特徴
    抽出方式において、 入力文字図形パターンを垂直軸、水平軸とに夫
    夫投影して、文字図形部分の投影分布を求める段
    階と、文字外接枠の範囲を対象として夫々の分布
    の重心座標を決定し、次いですでに検出した重心
    座標で、投影分布を分割し、分割した夫々の範囲
    を対象として夫々の前記投影分布の重心座標を決
    定する過程を複数回繰返して重心座標系列を求め
    る段階を備え、 前記走査を開始した辺上の点の座標及び前記検
    出した文字線の位置座標を、重心座標系列の座標
    値と対応させて、重心座標系列に座標値の小さな
    順に付した重心座標番号を尺度とする値にそれぞ
    れ変換し、この2つの値の差のN乗和(N:定
    数)を抽出することにより特徴抽出を行うことを
    特徴とする特徴抽出方式。
JP58196222A 1983-10-21 1983-10-21 特徴抽出方式 Granted JPS6089288A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58196222A JPS6089288A (ja) 1983-10-21 1983-10-21 特徴抽出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58196222A JPS6089288A (ja) 1983-10-21 1983-10-21 特徴抽出方式

Publications (2)

Publication Number Publication Date
JPS6089288A JPS6089288A (ja) 1985-05-20
JPH0475553B2 true JPH0475553B2 (ja) 1992-12-01

Family

ID=16354227

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58196222A Granted JPS6089288A (ja) 1983-10-21 1983-10-21 特徴抽出方式

Country Status (1)

Country Link
JP (1) JPS6089288A (ja)

Also Published As

Publication number Publication date
JPS6089288A (ja) 1985-05-20

Similar Documents

Publication Publication Date Title
JPH0475553B2 (ja)
JPS6019287A (ja) 文字認識方法
JPH0547871B2 (ja)
JP2616994B2 (ja) 特徴抽出装置
JPH0545991B2 (ja)
JPH0632080B2 (ja) 文字認識方式
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
JPH0545993B2 (ja)
JPS5837780A (ja) 文字認識方式
JPS6363952B2 (ja)
JPH01152586A (ja) 文字図形認識方法
JP2749947B2 (ja) 文字認識方法
JP3365941B2 (ja) 文字パターン認識方法及びその装置
JPS6318787B2 (ja)
JPH0632081B2 (ja) 文字認識方式
JPH0656625B2 (ja) 特徴抽出方式
JP2749946B2 (ja) 文字認識方法
JPH035630B2 (ja)
JPH0545990B2 (ja)
JPH0580711B2 (ja)
JPS6262392B2 (ja)
JPH01152585A (ja) 特徴抽出方法
JPS60181884A (ja) 文字認識方式
JPH04148488A (ja) 文字認識装置
JPH02287894A (ja) 文字認識装置