JPS6019287A - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JPS6019287A
JPS6019287A JP58126236A JP12623683A JPS6019287A JP S6019287 A JPS6019287 A JP S6019287A JP 58126236 A JP58126236 A JP 58126236A JP 12623683 A JP12623683 A JP 12623683A JP S6019287 A JPS6019287 A JP S6019287A
Authority
JP
Japan
Prior art keywords
character
array
extracted
scanning
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58126236A
Other languages
English (en)
Inventor
Koji Ito
伊東 晃治
Koichi Higuchi
浩一 樋口
Yoshiyuki Yamashita
山下 義征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP58126236A priority Critical patent/JPS6019287A/ja
Publication of JPS6019287A publication Critical patent/JPS6019287A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔技術分野〕 本発明は高速で精度の良い文字認識方法に関するもので
ある。
〔従来技術〕
従来の文字図形認識装置に於ては、文字図形・ぐターン
よりストロークを抽出し、それら抽出されたストローク
の位置、長さ、ストローク間の相互関係等を用いて認識
する方法が多く採用されている。この種の装置において
は、(1)文字図形の輪郭を追跡することにより検出さ
れた輪郭点系列について曲率を計算し、その曲率の大き
な値の点を分刻点として輪郭系列を分割し、分割された
系列を組合わぜることによりストロークを抽出するか、
又は(2)文字図形・やターンに細線化処理を行なって
骨格化し、その骨格・ぞターンの連結性及び骨格・ぐタ
ー/を追跡し急激な角度の変化点等を検出してストロー
クを抽出し、該抽出されたストロークについて幾可学的
な特徴等を抽出し文字図形の識別を行なっていた。しか
しながら、(1)の方法は、文字図形・ぐターンが大き
くなり又文字図形パターンが複雑化すると、その処理量
が増大しそのため処理速度の低下を招き、(2)の方法
は、文字図形・ぐターンを細線化する必要があり又その
細線化によるパターンのひずみ、ヒゲ等の問題があり、
その後の処理が複雑なものとなる欠点がある。
〔発明の目的〕
この発明の目的は、高速で安定な文字認識方法を提供す
るにある。
〔発明の概要〕
上記目的を達成するために、この発明では、文字図形・
ぐターンの所望の方向のストローク成分を表ワすサブパ
ターンを抽出し、サブパターンについて文字外接枠の辺
上の点から走査して走査線上のすべての文字線の位置を
検出し、走査開始点と文字線との距離を前記走査方向の
文字外接枠の大きさで正規化して抽出したもののN乗和
の辺単位の配列を分割する際に、複数の分割領域を決定
し、隣接する分割領域を所定の幅だけオー・ぐ−ラノゾ
させることにより筆者の違いによる文字線の位置ずれを
吸収することを特徴としている。
〔発明の実施例〕
第1図は本発明の第1の実施例を示すブロック図である
。第1図において1は光電変換部、2は・(ターンレジ
スタ、3は線幅計算部、4aは垂直サブ・ぐターン抽出
部、4bは水平サブパターン抽出部、4Cは右斜めサブ
パターン抽出部、4dは左斜めサブパターン抽出部、5
は文字枠検出部、6は特徴抽出部、7は特徴ベクトル抽
出部、8は識別部である。以下、第1図の動作につき説
明する。
第1図に示す本実施例の動作は、読取機構にセットされ
た帳票上の文字は光電変換部)において2値の量子化さ
れたディジタル電気信号に変換され、パターンレジスタ
2に格納される。それと同時に、線幅計算部3において
入力・ぐターンの線幅(ホ)が計算される。垂直サブパ
ターン抽出部4aは、パターンレジスタについて垂直ス
キャンを全血行なって、黒ビットの連続する長さと線幅
計算部3において計算された線幅との関係よシ垂直サブ
パターン(vsp )を抽出する。同様に、水平サブパ
ターン抽出部4bでは水平スキャンによシ水乎すブiE
ターン(H4F)を、右斜めサブパターン抽出部4cで
は右斜め45°スキヤンによシ右斜めサブパターン(H
8F )を、左斜めサブ・ぐターン抽出部4dでは左斜
め45°スキヤンにょシ左斜めザブノeり〜ン(LSP
)をそれぞれ抽出する。
第2図は、文字「ホ」の原パターンと各サブノやターン
の例で(a)は原パターン、(b)は垂直サブ・ぐター
ン(vsp) 、 (c)は水平サブパターン(H4F
) 、 (d)は右肩メサフハターン(H8F) 、 
(e)は左斜めサブパターン(LSP)である。文字枠
検出部5はノやターンレジスタ内の文字図形ツクターン
に外接する方形の枠(以後文字枠と称する)を検出し、
・ぐターンレジスタで定義される2次元平面における前
記文字枠を規定する為の位置座標を特徴抽出部6へ送出
する。
以後の説明においては文字枠の左下を原点とし、水平方
向をX軸、垂直方向iY軸とする座標系を使用する。特
徴抽出部6はまず垂直サブ・ぐターンについて、文字枠
を構成する4辺のうち垂直な辺である左辺上の点p(o
+y)から水平走査を開始し、白点から黒点への変化点
をすべて検出し、検出した変化点と前記走査を開始した
垂直辺上の点pとの間の距離すなわちX座標の差を文字
枠のX方向の長さを正規化定数として正規化した値のN
乗(Nは定数、本実施例ではN−2)の値の計算を前記
検出したすべての変化点について行ない、その総和を配
列VQ (y)に格納する。但し前記白点とは文字背景
部を表わし、黒点とは文字線部を表わす。
また式(1)は前記のVt(y)を式で表わしたもので
ありΔXkはそれぞれの変化点と文字枠辺上の走査開始
点との距離を示し、k=1.・・・・・、に、には検出
された変化点個数を表わす。又、式(1)中のΔXは文
字枠の水平方向の長さてあり、Cは整数化定数であり本
実施例においてはC−50とした。
上記の様な処理を文字枠の2つの垂直辺上のすべての点
を開始点として行ない、垂直サブパターンについて、文
字枠の左辺上の点から水平走査を開始して作成する配列
Vt (1)、文字枠の右辺上の点から水平走査を開始
して作成する配列vr(1)を抽出する。但し、i−0
,・・・・YT 、 YTは文字枠上辺のY座標である
。同様な処理により、水平サブ・々ターン、右斜めサブ
・ぐターン、左斜めサブパターンについては文字枠の2
個の水平辺上のすべての点が垂直走査を行なって、水平
サブ・ぐターンについて配列H5(j) 、 Hl (
j) 、右斜めサブノ’?ターンについての配列R5(
j) 、Rt(j) 、左斜めサブ・ぐターンについて
の配列Lb(j) −Ll(j)を抽出する。但し、j
−0,・・・、XR。
XRは文字枠右辺のX座標である。
前記水平サブ・ぞターン、右斜めサブ・ぐターン。
左斜メサブパターンについて抽出する配列の添字すは文
字枠の水平な下辺上の点を開始点としたものを表わしt
は水平な上辺上の点を開始点としたものを表わす。又、
HH(j) 1H((j) 1Rb(j) 、 R1(
j) 、L6(j) 。
Ll(j)を抽出する際における走査開始点と前記変化
点との距離の正規化定数としては文字枠の垂直方向の長
さΔYl使用した。
特徴ベクトル抽出部7は、特徴抽出部6において抽出さ
れた8種の配列を使用し、各配列をM個(Mは定数、本
実施例ではM=7)に分割し、Vt(i) 、 Vr(
i)の分割領域は文字枠の水平方向の長さくΔX)のB
/Aの幅をオーバーラツプさせる。(A。
Bは定数、本実施例ではA=15 、 B=1 )同様
にHH(j) 、 Ht(j)の分割領域は文字枠の垂
直方向の長さくΔY)のB/Aの幅をオーバーラツプさ
せ、 R,(J) *R1(j)、 Lb(j)、 L
l(j)の分割領域は文字枠の水平方向の長さくΔX)
と垂直方向の長さくΔY)の平均値Δχ+ΔY (□−)のB/Aの幅をオーバーラッグさせる。
第3図に、漢字「三」から抽出したHb(j)配列を分
割した例を示す。この配列Hb(、+)はその要素Hb
(0)、Hb(1)、Hb(2)・・・・・・・H,(
XR)から成っており、前述の如く、まず最初にこの配
列Hb(j)を単純に7等分割している。第3図で単純
7分割点として示した位置がその分割位置である。これ
により配列H)、(j)の各要素H5(0) 、 Hb
(1) 、 Hb(2) 、・・・・・・・Hb(XR
)は7つの低分割領域に分けられる。さらに隣接する低
分割領域を所定の幅(ここでは例えばΔX/15)だけ
オーバーラツプさせ、分割領域11分割領域2.・・・
分割領域7を決定している。
以上の処理により、分割された配列の同一分割領域内に
おける配列の要素の値の平均値を計算することによりM
X8次元の特徴ベクトルF(m、n)を抽出する。但し
、m = 1・・・、M、n==1 、・・8である。
識別部8は、特徴ベクトル抽出部7において抽出された
。特徴ベクトルと、同形式で記述された標準文字マスク
f(m、n)との間の後述の式(2)で示される距離(
D) f:計算しその距離が最も小さい値を与える標準
文字マスクのカテゴリ名を文字名以上説明した様に、本
実施例の特徴ベクトル抽出部において抽出された特徴ベ
クトルは、文字図形・ぐターンのストロークの位置、長
さ、方向等全表わすもので、文字特有な性質を表現して
いる。
又、第4図に2種の形が類似した文字パターンと特徴抽
出部で抽出する配列を図形的に表現した例において、観
察されるように、文字の局所的な違いが前記配列に充分
反映されるので認識精度の向上を図ることができる。又
、特徴抽出部において各配列を作成する際に走査を開始
した文字枠辺−ヒの点と文字線との距離を文字枠の当該
走査方向の大きさで正規化しさらに特徴ベクトル抽出部
においては、隣接する分割領域を所定の幅だけオーバー
ラッグさせているので手書文字に特有な筆者の違いによ
る文字の大きさ、文字線の変動等を吸収することができ
るので、精度の良い認識が可能である。
又、文字図形・ぞターンからの特徴抽出を単純な走査と
いう処理により実現しているので、高速な認識が可能で
あり、装置の小型化を図ることもてきる利点がある。
〔発明の効果〕
本発明は、文字図形・やターンから各方向のストローク
成分を抽出した各サブ・ぐターンを垂直又は、水平に走
査し、文字枠辺と文字線との距離を当該走査方向の文字
枠の大きさで正規化した値のN乗和金−要素とする配列
をめ、さらにその配列を複数の分割領域に分割する際、
隣接した分割領域を所定の幅だけオーバーラツプさせる
ので、複雑な処理を必要とせず、手書文字の変形9文字
線の変動を吸収することができ、安定で高速な文字認識
装置に利用することができる。
【図面の簡単な説明】
第1図は、この発明の文字認識装置における実施例、第
2図は、1ノ一プA’ターン例、第3図は、特徴配列分
割例、第4図は、特徴例である。 I・・・光電変換部、2・・りぐターンレノスタ、3・
・・線幅計算部、4a・・・垂直サブ・ぞターン抽出部
、4b・・・水平サブ・ぐターン抽出部、4c・・・右
斜めサブノRターン抽出部、4d・・・左斜めサブA’
ターン抽出部、5・・・文字枠検出部、6・・・特徴抽
出部、7・・・特徴ベクトル抽出部、8・・・識別部、
9・・・文字名出力。 特許出願人 沖電気工業株式会社 第1図 ■ 第2図 +01 (bl (C1 (d) (el 第3図 単に7今fl急 第4図 )−1b(j) 昭和 年 月 日 特許庁長官 殿 1、事件の表示 昭和58年 特 許 願第126236号2、発明の名
称 文字認識方法 3、補正をする者 事件との関係 特 許 出 願 人 別凪のとおリ \:1”’、/ う 補正の内容 (1)明細書第4頁第17行目から第18行目に「8は
識別部である。」とあるのを[8は識別部、9は文字名
出力である。]と補正する。 (2)同書第8頁第11行目から第12行目に「文字枠
の水平方向の長さくΔX)のB/Aの」とあるのを「文
字枠の垂直方向の長さくΔY)のB/Aの」と補正する
。 (3)同書第8頁第14行目から第15行目に「文字枠
の垂直方向の長さくΔY)のB/Aの」とあるのを「文
字枠の水平方向の長さくΔX)のB/Aの」と補正する
。 (4)同書第9頁第12行目にrMX8次元」とあるの
を「M×8次元」と補正する。 (5)図面「第1図」一番却二涯ヨ」A−2を別紙のと
おシ補正する。

Claims (1)

    【特許請求の範囲】
  1. 文字図形・ぐターンを所望の方向に走査して当該走査方
    向における文字線の断面を検出し、断面長が前記文字図
    形・ぐターンの文字線幅より十分長い断面を抽出するこ
    とにより行うサブパターン毎出を複数の方向について行
    い、抽出した複数の前記サブ/ぞターンのそれぞれにつ
    いて前記文字図形・やターンの文字外接枠の辺上の点を
    開始点として所定の方向へ走査して走査線上におけるす
    べての文字線の位置を検出し、走査を開始した前記辺上
    の点と前記検出した文字線との距離を前記文字外接枠の
    前記所定の方向の大きさで正規化した値のN乗和(Nは
    定数)を抽出する処理を前記サブパターン毎に且つ前記
    文字外接枠の4辺のうち少なくとも相対向する2辺上の
    すべての点を開始点として走査線毎に行なって、各サブ
    パターン毎に文字外接枠の前記各辺に対応したN乗和の
    配列を抽出し、抽出した前記N乗和の配列をそれぞれM
    個(Mは定数)に分割する際に分割領域を所定の幅だけ
    オーバーラツプさせ、各分割領域内の前記N乗和の平均
    値を計算したものを特徴ベクトルとして、それぞれの配
    列からM次元の特徴ベクトル群を抽出し、抽出した特徴
    ベクトル群と同形式で表現された標準文字マスクと照合
    することにより文字を認識することを特徴とする文字認
    識方法。
JP58126236A 1983-07-13 1983-07-13 文字認識方法 Pending JPS6019287A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58126236A JPS6019287A (ja) 1983-07-13 1983-07-13 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58126236A JPS6019287A (ja) 1983-07-13 1983-07-13 文字認識方法

Publications (1)

Publication Number Publication Date
JPS6019287A true JPS6019287A (ja) 1985-01-31

Family

ID=14930154

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58126236A Pending JPS6019287A (ja) 1983-07-13 1983-07-13 文字認識方法

Country Status (1)

Country Link
JP (1) JPS6019287A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62157983A (ja) * 1986-01-06 1987-07-13 Oki Electric Ind Co Ltd 文字認識方式
JPH0528369U (ja) * 1991-09-21 1993-04-16 健 岩切 ゴルフ練習器具

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62157983A (ja) * 1986-01-06 1987-07-13 Oki Electric Ind Co Ltd 文字認識方式
JPH0528369U (ja) * 1991-09-21 1993-04-16 健 岩切 ゴルフ練習器具
JP2566683Y2 (ja) * 1991-09-21 1998-03-30 健 岩切 ゴルフ練習器具

Similar Documents

Publication Publication Date Title
JPS6019287A (ja) 文字認識方法
Tsai et al. Efficiently extracting and classifying objects for analyzing color documents
JPH0545991B2 (ja)
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
Kumar A three tier scheme for devanagari hand-printed character recognition
JPH0475553B2 (ja)
JPS5837780A (ja) 文字認識方式
JPH0656625B2 (ja) 特徴抽出方式
Sadri et al. Statistical characteristics of slant angles in handwritten numeral strings and effects of slant correction on segmentation
JP2616994B2 (ja) 特徴抽出装置
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JPS62125485A (ja) 文字認識方式
JPS6057474A (ja) 特徴抽出方法
JPH0545992B2 (ja)
JPH0547871B2 (ja)
JPS62154079A (ja) 文字認識方式
JPS622382A (ja) 画像処理方法
JPS58165178A (ja) 文字読取り装置
JPH0580711B2 (ja)
JPH0632080B2 (ja) 文字認識方式
JP3365941B2 (ja) 文字パターン認識方法及びその装置
JPS6363952B2 (ja)
JPH0545990B2 (ja)
JPH01152585A (ja) 特徴抽出方法
JPS62157983A (ja) 文字認識方式