JPS6318787B2 - - Google Patents

Info

Publication number
JPS6318787B2
JPS6318787B2 JP56037887A JP3788781A JPS6318787B2 JP S6318787 B2 JPS6318787 B2 JP S6318787B2 JP 56037887 A JP56037887 A JP 56037887A JP 3788781 A JP3788781 A JP 3788781A JP S6318787 B2 JPS6318787 B2 JP S6318787B2
Authority
JP
Japan
Prior art keywords
character
pattern
feature matrix
sub
original pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56037887A
Other languages
English (en)
Other versions
JPS57153384A (en
Inventor
Yoshuki Yamashita
Koichi Higuchi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP56037887A priority Critical patent/JPS57153384A/ja
Publication of JPS57153384A publication Critical patent/JPS57153384A/ja
Publication of JPS6318787B2 publication Critical patent/JPS6318787B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 本発明は高速で正確な文字認識方法に関するも
のである。従来、文字図形認識装置においては文
字図形パターンよりストロークを抽出し、それら
抽出されたストロークの位置、長さ、ストローク
間の相互関係等の幾何学的な特徴を用いて認識す
る方法が多く採用されている。ストロークの抽出
方法として、次の2つの方法が知られている。
文字図形の輪郭を追跡することにより検出さ
れた輪郭点系列について曲率を計算し、その曲
率の大きな値の点を分割点として輪郭系列を分
割し、分割された系列を組合わせることにより
ストロークを抽出する。
文字図形パターンに細線化処理を行なつて骨
格化し、その骨格パターンの連結性及び骨格パ
ターンを追跡し急激な角度の変化点等を検出し
てストロークを抽出する。
しかし、の方法は文字図形パターンが大きく
なり、また文字図形パターンが複雑化すると、そ
の処理量が増大し、処理速度の低下を招くこと、
の方法は文字図形パターンを細線化する必要が
あり、またその細線化によるパターンの歪、ヒゲ
の発生等の問題があり、その後の処理を複雑なも
のとすること、等の欠点を有していた。これらの
欠点を除去する方法として、文字図形パターンの
線巾Wを検出し、このパターンを所望の方向に走
査し、パターンの当該走査方向における記入点の
長さlと、前記線巾Wとの間でl≧Nw(Nは定
数)を満足する記入点を取り出すことにより、走
査方向のストローク成分を表わすサブパターンを
抽出し、さらに文字枠内を(N×M)の領域
(N、Mは定数)に分割して各領域の文字線量を
計算して特徴マトリクスを作成し、内蔵辞書と照
合して識別する方法が提案されている。
またこの方法においてストロークの欠如を防ぐ
ために、原パターンの各方向ストロークを抽出す
る際に、さらに原パターンの黒ビツトのうち、前
記各サブパターンに属さない黒ビツトをもつて未
定義サブパターンを抽出しこれを含めた特徴マト
リクスを作成し、前記の識別において類似文字が
得られた場合にはこのマトリクスを用いて識別を
行う方法が提案されている。
しかし、一般の文字パターンにおいては多くの
場合、未定義サブパターンを含まない特徴マトリ
クスを用いることにより識別が可能であり、すべ
ての文字パターンについて未定義サブパターンを
抽出し、それを含めた特徴マトリクスを内蔵辞書
と照合して識別を行うことは、識別に要する時間
の増大を招くという欠点を有していた。
本発明の目的は従来の技術の上記欠点を除去し
た、高速で正確な文字認識方法を提供することに
あり、その特徴は文字パターンよりサブパターン
を抽出し作成した特徴マトリクスと、内蔵辞書と
の照合の際2種以上の類似文字候補が得られた場
合に限り、原パターンより抽出した未定義サブパ
ターンを含めた特徴マトリクスを用いて、前記類
似候補の内蔵辞書と照合し、文字認識を行うこと
にある。以下図面により詳細に説明する。
第1図は本発明の文字認識装置における実施例
を示したものである。本装置の動作を説明する
と、光信号入力1は光電変換部2において2値の
量子化された電気信号に変換されパターンレジス
タ3に格納される。それと同時に線巾計算部4に
おいて入力パターンの線巾が計算される。垂直サ
ブパターン抽出部5はパターンレジスタ3につい
て垂直スキヤンを全面行なつて、黒ビツトの連続
の長さと線巾計算部4において計算された線巾と
の関係より垂直サブパターン(VSP)を抽出す
る。同様に水平サブパターン抽出部6は水平スキ
ヤンにより水平サブパターン(HSP)を、右斜
めサブパターン抽出部7は右斜め(45゜)スキヤ
ンにより右斜めサブパターン(RSP)を、左斜
めサブパターン抽出部8は左斜め(45゜)スキヤ
ンにより、左斜めサブパターン(LSP)を抽出す
る。
未定義サブパターン抽出部9は、パターンレジ
スタ3に格納される黒ビツトのうち、前述のすべ
てのサブパターンに属さない黒ビツトをもつて、
未定義サブパターン(USP)を抽出する。
このUSPは、HSP、VSP、RSP、LSPと原パ
ターンPとの間に下記の論理式(1)を適用すること
により抽出する。
USP=P∩∩∩∩………(1) 文字枠検出部10はパターンレジスタ3内の文
字パターンに外接する文字枠を検出しその結果を
文字枠分割決定部11へ送る。文字枠分割決定部
11は、文字枠検出部10より検出された文字枠
内を(N×M)の領域(N、Mは定数、本実施例
ではN=M=5)に分割する為のX軸、Y軸(文
字枠の水平方向をX軸、垂直方向をY軸とする)
上の分割点座標を決定する。
特徴マトリクス抽出部12は、文字枠分割決定
部11により決定された分割点座標によりVSP、
HSP、RSP、LSPの各サブパターンレジスタ上
の文字枠領域を(N×M)の領域に分割し、各領
域の黒ビツト数(Bij)を計数し、線巾Wを使用
して、下記式(2)により文字線長(Lij)を示す特
徴を計算して、(N×M)×4次元の特徴マトリク
スを作成する。
Lij=Bij/W ………(2) その後VSP特徴マトリクスは文字枠のy方向
の長さΔYで、HSP特徴マトリクスはx方向の長
さΔXで、RSPとLSPの特徴マトリクスは√
(ΔX)2+(ΔY)2で正規化を行ない、最終的に(N
×M)×4次元の文字の大きさで正規化した特徴
マトリクスを作成する。
USP特徴マトリクス抽出部13は、USPにつ
いて特徴マトリクス抽出部12と同様の動作によ
り、(N×M)×1次元の特徴マトリクスを作成す
る。USP特徴マトリクスは、本実施例では√
(ΔX)2+(ΔY)2で正規化する。第1識別部14は
標準文字マスク(fn)と、特徴マトリクス抽出部
12において抽出された特徴マトリクス(fi)の
間に周知の下式(3)の距離Dを用いて、Dが最小の
ものから順序付けを行ない、候補文字名及び距離
(D)を出力する。
D=√(ni2 ………(3) 第2識別部15は第1識別部14より得られた
第1位候補の標準文字マスクとの距離(D1)と、
第i位候補(i=2、3、4、………)の標準マ
スクとの距離(Di)が、本実施例では次に示す式
(4)を満足する場合に、当該候補と第1位候補は類
似文字候補とみなし、類似文字候補が存在しない
場合は、第1位候補の文字名を文字名出力16に
出力する。
|D1−Di|/D1<C(Cは定数) ………(4) 類似文字候補が存在する場合は、特徴マトリク
ス抽出部12より得られた特徴マトリクスに
USP特徴マトリクス抽出部13より得られた
USP特徴マトリクスを含めた(N×M)×5次元
の特徴マトリクスと、前記類似文字候補の標準文
字マスクとの間に前記式(3)の距離(D)を適用して、
Dが最小の値となる標準文字マスクのカテゴリ名
を文字名出力16に出力する。第2図は原パター
ンと抽出されたサブパターンの例を示したもので
ある。(A)は原パターン、(B)がVSP、(C)がHSP、、
DがRSP、(E)がLSP、(F)がUSPをそれぞれ示す。
以上実施例に基づいて説明したように、本発明
によれば特徴マトリクスと内蔵辞書との照合の
際、2種以上の類似文字候補が得られた場合に限
り、未定義サブパターン特徴マトリクスを含めた
識別を行うので、高速で、かつストロークの欠如
による誤読のない文字認識を行うことが出来る利
点がある。
【図面の簡単な説明】
第1図は本発明の実施例に於ける構成図、第2
図はサブパターン抽出例をそれぞれ示したもので
ある。 1……光信号入力、2……光電変換部、3……
パターンレジスタ、5〜9……サブパターン抽出
部、10……文字枠検出部、11……文字枠分割
決定部、12……特徴マトリクス抽出部、13…
…未定義サブパターン特徴マトリクス抽出部、1
4……第1識別部、15……第2識別部、16…
…文字名出力。

Claims (1)

    【特許請求の範囲】
  1. 1 文字図形を光電変換し、量子化して得られた
    デイジタル信号を原パターンとしてパターンレジ
    スタに格納し、前記原パターンより各方向のスト
    ローク成分をあらわすサブパターンを抽出してサ
    ブパターンレジスタに格納し、前記原パターンの
    文字枠内領域を前記サブパターンレジスタについ
    て(N×M)個の領域(N、Mは定数)に分割
    し、各領域内の文字線長をあらわす特徴量を、文
    字の大きさで正規化して第1の特徴マトリクスを
    作成し、この第1の特徴マトリクスをあらかじめ
    貯蔵された辞書と照合して文字図形を識別する文
    字認識方法において、前記第1の特徴マトリクス
    と前記辞書との照合の際2種以上の類似文字が候
    補として得られた場合に、前記原パターンより抽
    出した前記サブパターンのいずれにも属さない未
    定義サブパターンを前記サブパターンに含めて第
    2の特徴マトリクスを作成し、この第2の特徴マ
    トリクスを用いて前記類似文字を前記辞書と照合
    して文字を識別することを特徴とする文字認識方
    法。
JP56037887A 1981-03-18 1981-03-18 Character recognizing method Granted JPS57153384A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56037887A JPS57153384A (en) 1981-03-18 1981-03-18 Character recognizing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56037887A JPS57153384A (en) 1981-03-18 1981-03-18 Character recognizing method

Publications (2)

Publication Number Publication Date
JPS57153384A JPS57153384A (en) 1982-09-21
JPS6318787B2 true JPS6318787B2 (ja) 1988-04-20

Family

ID=12510042

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56037887A Granted JPS57153384A (en) 1981-03-18 1981-03-18 Character recognizing method

Country Status (1)

Country Link
JP (1) JPS57153384A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0664629B2 (ja) * 1985-11-26 1994-08-22 沖電気工業株式会社 文字認識方式

Also Published As

Publication number Publication date
JPS57153384A (en) 1982-09-21

Similar Documents

Publication Publication Date Title
JPS6318787B2 (ja)
JPS6262393B2 (ja)
JPS6262392B2 (ja)
JPH0545991B2 (ja)
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
JPS5894067A (ja) 文字認識方法
JPS5837780A (ja) 文字認識方式
JPS6038755B2 (ja) 特徴抽出方式
JPS62154079A (ja) 文字認識方式
KR20010083265A (ko) 다국어 인쇄체 문서인식을 위한 문자 특징 추출 장치 및그 방법
KR100317653B1 (ko) 대용량인쇄체문자인식을위한특징추출방법
JPS622382A (ja) 画像処理方法
JPH0664629B2 (ja) 文字認識方式
JPH0545992B2 (ja)
JP3127413B2 (ja) 文字認識装置
JPH0632080B2 (ja) 文字認識方式
JPH0656625B2 (ja) 特徴抽出方式
JPH0545993B2 (ja)
JP2576491B2 (ja) 特徴抽出方式
KR940001225B1 (ko) 패턴 인식방법
JPH03126188A (ja) 文字認識装置
JPS6019287A (ja) 文字認識方法
JPS634231B2 (ja)
JPH0632081B2 (ja) 文字認識方式
JPH0545990B2 (ja)