JPH0545992B2 - - Google Patents
Info
- Publication number
- JPH0545992B2 JPH0545992B2 JP58110210A JP11021083A JPH0545992B2 JP H0545992 B2 JPH0545992 B2 JP H0545992B2 JP 58110210 A JP58110210 A JP 58110210A JP 11021083 A JP11021083 A JP 11021083A JP H0545992 B2 JPH0545992 B2 JP H0545992B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- pattern
- sub
- stroke
- slope
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 239000011159 matrix material Substances 0.000 claims description 16
- 238000000034 method Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Description
【発明の詳細な説明】
(技術分野)
本発明は安定で精度のよい文字認識方法に関す
るものである。
るものである。
(背景技術)
従来、文字認識装置においては、第1図の例の
様な、手書文字の筆者の違いによる文字線の傾
斜、又は印字文字の印字の傾斜に起因する抽出し
た特徴のばらつきを吸収するために、辞書マスク
の複数化の手段により前記特徴のばらつきを吸収
していた。しかしながらこの手段は識別を行なう
際の抽出した特徴と辞書との照合の時間が辞書マ
スクの数に比例して増大し、装置の処理速度の低
下を招いていた。この欠点を除去する為に、各方
向の文字線傾斜を抽出して、使用する辞書マスク
を選択することにより処理速度を向上させる方法
があるが、認識精度の向上のためには文字線の傾
きに応じて多種類の辞書マスクを用意しなければ
ならず、辞書の構成の複雑化を招くという欠点が
あつた。
様な、手書文字の筆者の違いによる文字線の傾
斜、又は印字文字の印字の傾斜に起因する抽出し
た特徴のばらつきを吸収するために、辞書マスク
の複数化の手段により前記特徴のばらつきを吸収
していた。しかしながらこの手段は識別を行なう
際の抽出した特徴と辞書との照合の時間が辞書マ
スクの数に比例して増大し、装置の処理速度の低
下を招いていた。この欠点を除去する為に、各方
向の文字線傾斜を抽出して、使用する辞書マスク
を選択することにより処理速度を向上させる方法
があるが、認識精度の向上のためには文字線の傾
きに応じて多種類の辞書マスクを用意しなければ
ならず、辞書の構成の複雑化を招くという欠点が
あつた。
(発明の課題)
本発明は、このような欠点を除去するために、
各サブパターンの傾斜を抽出し、その後特徴マト
リクスを作成する段階において前記傾斜に従つて
分割領域を決定することにより複数の辞書マスク
を不用としたもので、その目的は安定で精度の良
い文字認識方法を提供することにある。
各サブパターンの傾斜を抽出し、その後特徴マト
リクスを作成する段階において前記傾斜に従つて
分割領域を決定することにより複数の辞書マスク
を不用としたもので、その目的は安定で精度の良
い文字認識方法を提供することにある。
(発明の構成及び作用)
第2図は、本発明の文字認識装置における一実
施例の構成図を示す。図において、文字の光信号
は、光信号入力1より光電変換部2において2値
の量子化されたデイジタル電気信号に変換され、
パターンレジスタ3に格納される。それと同時
に、線幅計算部4において入力パターンの線幅
(W)が計算される。サブパターン抽出部5は、
パターンレジスタ3について垂直スキヤンを全面
行なつて黒点(文字線部を黒点とする)の連続の
長さと線幅計算部4において計算された線幅との
関係より垂直サブパターン(VSP)を抽出し、
サブパターンレジスタに格納する。同様に、水平
スキヤンにより水平サブパターン(HSP)を、
右斜め45°スキヤンにより右斜めサブパターン
(RSP)を、左斜め45°スキヤンにより左斜めサブ
パターン(LSP)を抽出し、各サブパターンレジ
スタに格納する。第3図は原パターンとと各サブ
パターンの例でaは原パターン、bは垂直サブパ
ターン(VSP)、cは水平サブパターン(HSP)、
dは右斜めサブパターン(RSP)、eは左斜めサ
ブパターン(LSP)である。
施例の構成図を示す。図において、文字の光信号
は、光信号入力1より光電変換部2において2値
の量子化されたデイジタル電気信号に変換され、
パターンレジスタ3に格納される。それと同時
に、線幅計算部4において入力パターンの線幅
(W)が計算される。サブパターン抽出部5は、
パターンレジスタ3について垂直スキヤンを全面
行なつて黒点(文字線部を黒点とする)の連続の
長さと線幅計算部4において計算された線幅との
関係より垂直サブパターン(VSP)を抽出し、
サブパターンレジスタに格納する。同様に、水平
スキヤンにより水平サブパターン(HSP)を、
右斜め45°スキヤンにより右斜めサブパターン
(RSP)を、左斜め45°スキヤンにより左斜めサブ
パターン(LSP)を抽出し、各サブパターンレジ
スタに格納する。第3図は原パターンとと各サブ
パターンの例でaは原パターン、bは垂直サブパ
ターン(VSP)、cは水平サブパターン(HSP)、
dは右斜めサブパターン(RSP)、eは左斜めサ
ブパターン(LSP)である。
ストローク抽出部6は、各サブパターンレジス
タにおける水平又は垂直スキヤンを全面行ない、
白点から黒点、黒点から白点への変化点を検出
し、1列(又は行)前のスキヤンにおける変化点
個数に変化点座標と現列(又は行)の変化点個数
と変化点座標の関係よりストロークを抽出し、抽
出した各サブパターンレジスタ内のストロークの
両端点のパターンレジスタ3で定義される2次元
座標系における座標(パターンレジスタの左下を
原点とする)を傾斜抽出部7へ送出する。傾斜抽
出部7はストローク抽出部6において抽出した各
サブパターンレジスタ内のストロークの両端点座
標を参照し、HSP及びVSPの平均傾斜を計算す
る。即ち、水平サブパターンHSPより抽出した
ストロークの両端点座標を(HXSo,HYSo),
(HXEo,HYEo)、但しn=1,……P,Pは水
平サブパターンより抽出したストローク数とし
て、(1)式により水平サブパターンの傾斜θHを計算
する。(但しHXEP>HXSP) (1)式中のHLGPは当該ストロークの長さを表わ
し、(2)式の近似式により求める。
タにおける水平又は垂直スキヤンを全面行ない、
白点から黒点、黒点から白点への変化点を検出
し、1列(又は行)前のスキヤンにおける変化点
個数に変化点座標と現列(又は行)の変化点個数
と変化点座標の関係よりストロークを抽出し、抽
出した各サブパターンレジスタ内のストロークの
両端点のパターンレジスタ3で定義される2次元
座標系における座標(パターンレジスタの左下を
原点とする)を傾斜抽出部7へ送出する。傾斜抽
出部7はストローク抽出部6において抽出した各
サブパターンレジスタ内のストロークの両端点座
標を参照し、HSP及びVSPの平均傾斜を計算す
る。即ち、水平サブパターンHSPより抽出した
ストロークの両端点座標を(HXSo,HYSo),
(HXEo,HYEo)、但しn=1,……P,Pは水
平サブパターンより抽出したストローク数とし
て、(1)式により水平サブパターンの傾斜θHを計算
する。(但しHXEP>HXSP) (1)式中のHLGPは当該ストロークの長さを表わ
し、(2)式の近似式により求める。
HLGP=MAX{|HXEP−HXSP|,
|HYEP−HYSP|}+MIN{|HXEP−HXSP|,|H
YEP−HYSP|}/2(2) (2)式は2点間の距離を、2点間の水平及び垂直
座標差のうちで小さい方の1/2と他の一方との和
とする近似式である。
YEP−HYSP|}/2(2) (2)式は2点間の距離を、2点間の水平及び垂直
座標差のうちで小さい方の1/2と他の一方との和
とする近似式である。
同様に垂直サブパターンの傾斜QVを(3)式によ
り計算する。但しVYEq>VYSqとする。
り計算する。但しVYEq>VYSqとする。
なお上記式中Qは垂直サブパターンより抽出し
たストローク数である。またストローク数が0の
ときは傾斜も0とする。またストロークの長さ
VLGqは(2)式と同様な計算式により算出する。
たストローク数である。またストローク数が0の
ときは傾斜も0とする。またストロークの長さ
VLGqは(2)式と同様な計算式により算出する。
傾斜抽出部7は上記式(1)〜(3)より計算した各サ
ブパターンの傾斜を特徴マトリクス抽出部10へ
送出する。文字枠検出部8はパターンレジスタ3
内の文字パターンに外接する文字枠を検出し、そ
の結果を文字枠分割部9へ送る。
ブパターンの傾斜を特徴マトリクス抽出部10へ
送出する。文字枠検出部8はパターンレジスタ3
内の文字パターンに外接する文字枠を検出し、そ
の結果を文字枠分割部9へ送る。
文字枠分割決定部9は検出された文字枠内をM
×Nの領域(M,Nは整定数、本実施例ではM=
N=5)に分割するためのX軸、Y軸上の分割点
座標を決定する。ここでX軸は文字枠の水平方向
を、Y軸は垂直方向をそれぞれ示す。
×Nの領域(M,Nは整定数、本実施例ではM=
N=5)に分割するためのX軸、Y軸上の分割点
座標を決定する。ここでX軸は文字枠の水平方向
を、Y軸は垂直方向をそれぞれ示す。
特徴マトリクス抽出部10は、文字枠分割決定
部9により決定された分割点座標X1,X2,……
XM-1及びY1,Y2,……YN-1と傾斜抽出部7より
得られた傾斜量θH,θVとにより、VSP,HSP,
RSP,LSPの各サブパターンレジスタ上の文字
枠領域をM×N個の部分領域に分割する。以下分
割領域の決定方法を説明する。
部9により決定された分割点座標X1,X2,……
XM-1及びY1,Y2,……YN-1と傾斜抽出部7より
得られた傾斜量θH,θVとにより、VSP,HSP,
RSP,LSPの各サブパターンレジスタ上の文字
枠領域をM×N個の部分領域に分割する。以下分
割領域の決定方法を説明する。
まず、分割点座標X1,X2……XM-1及びY1,Y2
……YN-1と傾斜量θH,θVとにより、文字枠の左下
を原点とする2次元平面上に(4)式で示される(M
+N−2)本の直線を定義する。(但しY1<Y2…
…<YN-1,X1<X2……<XM-1) y=θHx+Y1 y=θHx+YN-1 x=θVy+X1 x=θVy+XM-1 (4) 文字枠内の任意の点A(xe,ye)が(5)式の不等
式を満たすときA点は部分領域(m,n)に含ま
れる。
……YN-1と傾斜量θH,θVとにより、文字枠の左下
を原点とする2次元平面上に(4)式で示される(M
+N−2)本の直線を定義する。(但しY1<Y2…
…<YN-1,X1<X2……<XM-1) y=θHx+Y1 y=θHx+YN-1 x=θVy+X1 x=θVy+XM-1 (4) 文字枠内の任意の点A(xe,ye)が(5)式の不等
式を満たすときA点は部分領域(m,n)に含ま
れる。
θHxe+Yo-1<ye≦θHxe+Yo
かつ
θVye+Xn-1<xe≦θVye+Xn (5)
但し Y0=X0=0、YN=XN=∞
すなわち(4)式の直線を境界として文字枠内を複
数の部分領域に分割する。第4図はM=N=5の
場合の分割例である。特徴マトリクス抽出部10
は、上記の方法で文字枠内を部分領域に分割した
各サブパターンレジスタの各領域の黒点数Bijを
計算し、線幅計算部4で計算した線幅Wを用いて
式(6)により文字線長をあらわす特徴を計算し、M
×N×4次元の特徴マトリクスを作成する。
数の部分領域に分割する。第4図はM=N=5の
場合の分割例である。特徴マトリクス抽出部10
は、上記の方法で文字枠内を部分領域に分割した
各サブパターンレジスタの各領域の黒点数Bijを
計算し、線幅計算部4で計算した線幅Wを用いて
式(6)により文字線長をあらわす特徴を計算し、M
×N×4次元の特徴マトリクスを作成する。
Lij=Bij/W (6)
さらにVSP特徴マトリクスは文字枠のY軸方
向の長さΔYで、HSP特徴マトリクスは文字枠の
X軸方向の長さΔXで、RSP及びLSP特徴マトリ
クスは(ΔX+ΔY)/2でそれぞれ正規化を行
ない最終的にM×N×4次元の特徴マトリクスを
作成する。
向の長さΔYで、HSP特徴マトリクスは文字枠の
X軸方向の長さΔXで、RSP及びLSP特徴マトリ
クスは(ΔX+ΔY)/2でそれぞれ正規化を行
ない最終的にM×N×4次元の特徴マトリクスを
作成する。
識別部11は、特徴マトリクス抽出部10で抽
出された特徴マトリクスFとあらかじめ用意した
辞書マスクfとの間に、式(7)で定義される距離D
を適用し、Dが最小の値となる辞書マスクのカテ
ゴリ名を文字名出力12へ出力するものである。
出された特徴マトリクスFとあらかじめ用意した
辞書マスクfとの間に、式(7)で定義される距離D
を適用し、Dが最小の値となる辞書マスクのカテ
ゴリ名を文字名出力12へ出力するものである。
D=√(−)2 (7)
以上説明したように、本実施例では水平サブパ
ターン及び垂直サブパターンのストロークの傾斜
を抽出して、その傾斜に従つて文字枠領域を分割
し、特徴マトリクスを抽出しているので、辞書マ
スクを増大させることなくストロークの傾斜によ
る特徴のばらつきを吸収できるという利点があ
る。
ターン及び垂直サブパターンのストロークの傾斜
を抽出して、その傾斜に従つて文字枠領域を分割
し、特徴マトリクスを抽出しているので、辞書マ
スクを増大させることなくストロークの傾斜によ
る特徴のばらつきを吸収できるという利点があ
る。
換言すれば、傾斜を利用して文字枠内を分割す
るこの方法は手書文字認識における筆者の違いに
よる文字の変形に追従して特徴を抽出するので有
効である。
るこの方法は手書文字認識における筆者の違いに
よる文字の変形に追従して特徴を抽出するので有
効である。
(発明の効果)
本発明は、文字パターン内の各方向の文字線の
傾斜を抽出し、その傾斜に従つて文字枠内領域を
分割して特徴マトリクスを抽出しているので、辞
書マスクの構成を複雑化させることなく、文字の
傾斜による特徴のばらつきを吸収できるという利
点があり、安定で認識精度の良い文字認識装置を
実現することができる。
傾斜を抽出し、その傾斜に従つて文字枠内領域を
分割して特徴マトリクスを抽出しているので、辞
書マスクの構成を複雑化させることなく、文字の
傾斜による特徴のばらつきを吸収できるという利
点があり、安定で認識精度の良い文字認識装置を
実現することができる。
第1図は手書文字例を示す図、第2図は本発明
の文字認識装置の一実施例を示す構成図、第3図
は原パターンと各サブパターンの例を示す図、第
4図は領域分割の例を示す図である。 1……光信号入力、2……光電変換部、3……
パターンレジスタ、4……線幅計算部、5……サ
ブパターン抽出部、6……ストローク抽出部、7
……傾斜抽出部、8……文字枠検出部、9……文
字枠分割決定部、10……特徴マトリクス抽出
部、11……識別部、12……文字名出力。
の文字認識装置の一実施例を示す構成図、第3図
は原パターンと各サブパターンの例を示す図、第
4図は領域分割の例を示す図である。 1……光信号入力、2……光電変換部、3……
パターンレジスタ、4……線幅計算部、5……サ
ブパターン抽出部、6……ストローク抽出部、7
……傾斜抽出部、8……文字枠検出部、9……文
字枠分割決定部、10……特徴マトリクス抽出
部、11……識別部、12……文字名出力。
Claims (1)
- 1 文字図形パターンの特定方向のストロークを
あらわすサブパターンにおける任意の分割単位領
域の黒ビツト数を、文字線幅とストローク方向に
対応した文字枠の大きさとで正規化して得られる
量を特徴要素として、ストローク方向の異なる複
数の各サブパターン毎に且つ文字枠内を分割する
ことによつて得られる前記各分割単位領域毎に入
力文字パターンから前記特徴要素を抽出してサブ
パターン特徴マトリクスを作成し、標準文字マス
クが当該サブパターン特徴マトリクスと同形式で
記述されている辞書を参照して入力文字パターン
の認識を行う文字認識方法において、前記サブパ
ターンよりストロークを抽出し、抽出した各スト
ロークの傾斜をそれぞれのストロークの長さを重
みとして加重平均したものを当該サブパターンの
傾斜として抽出し、特徴マトリクスを作成する段
階において文字枠内の分割単位領域を前記サブパ
ターンの傾斜に従つて決定することを特徴とする
文字認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58110210A JPS603078A (ja) | 1983-06-21 | 1983-06-21 | 文字認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58110210A JPS603078A (ja) | 1983-06-21 | 1983-06-21 | 文字認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS603078A JPS603078A (ja) | 1985-01-09 |
JPH0545992B2 true JPH0545992B2 (ja) | 1993-07-12 |
Family
ID=14529845
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58110210A Granted JPS603078A (ja) | 1983-06-21 | 1983-06-21 | 文字認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS603078A (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2749947B2 (ja) * | 1990-04-17 | 1998-05-13 | 沖電気工業株式会社 | 文字認識方法 |
JP2749946B2 (ja) * | 1990-04-17 | 1998-05-13 | 沖電気工業株式会社 | 文字認識方法 |
JPH04590A (ja) * | 1990-04-17 | 1992-01-06 | Oki Electric Ind Co Ltd | 文字認識方法 |
-
1983
- 1983-06-21 JP JP58110210A patent/JPS603078A/ja active Granted
Also Published As
Publication number | Publication date |
---|---|
JPS603078A (ja) | 1985-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4556985A (en) | Pattern recognition apparatus | |
JPH09311905A (ja) | 行検出方法および文字認識装置 | |
JPH0545992B2 (ja) | ||
JP3936039B2 (ja) | 網がけ領域抽出装置 | |
JPS62154079A (ja) | 文字認識方式 | |
JPS5837780A (ja) | 文字認識方式 | |
JP2795860B2 (ja) | 文字認識装置 | |
JPS62125485A (ja) | 文字認識方式 | |
JPH0420227B2 (ja) | ||
JPH0127474B2 (ja) | ||
JPH03670B2 (ja) | ||
JPH0632080B2 (ja) | 文字認識方式 | |
JPS60201485A (ja) | 手書文字認識装置 | |
JPH0545991B2 (ja) | ||
JP2918363B2 (ja) | 文字分類方法及び文字認識装置 | |
JP3127413B2 (ja) | 文字認識装置 | |
JPH05274472A (ja) | 画像認識装置 | |
JPH01124082A (ja) | 文字認識装置 | |
JPS6019287A (ja) | 文字認識方法 | |
JPH0576673B2 (ja) | ||
JPH01152586A (ja) | 文字図形認識方法 | |
JPS6318787B2 (ja) | ||
JPS5894067A (ja) | 文字認識方法 | |
JPH0580711B2 (ja) | ||
JPH0545990B2 (ja) |