JPS6061876A - 文字認識方式 - Google Patents

文字認識方式

Info

Publication number
JPS6061876A
JPS6061876A JP58169754A JP16975483A JPS6061876A JP S6061876 A JPS6061876 A JP S6061876A JP 58169754 A JP58169754 A JP 58169754A JP 16975483 A JP16975483 A JP 16975483A JP S6061876 A JPS6061876 A JP S6061876A
Authority
JP
Japan
Prior art keywords
dictionary
classification
feature
features
decision
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58169754A
Other languages
English (en)
Inventor
Hiroyuki Kami
上 博行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, Nippon Electric Co Ltd filed Critical NEC Corp
Priority to JP58169754A priority Critical patent/JPS6061876A/ja
Publication of JPS6061876A publication Critical patent/JPS6061876A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は文字認識における辞書γ、特に階層化辞書の構
成方法と詳細識別用辞書による判定に関するものである
7゜ 文字認識におい7て判定、処理時間の短縮化を計るため
の大分類用と詳縦識別用とに辞書を階層化りまず大分類
用辞、書で判定し、次に大分類用によって限定された詳
細識別用辞書のみで判定する方法が一般に採用され、て
いて、大分類に用いる特徴と詳細識別に用いる特徴とは
異なっている。そのため同一の特徴抽出を用いることが
出来ないという問題があり、また大分類に用いた特徴の
特徴値を詳細識別で再度使うことはなかった。
さらに類似した文字を区別するためには、あらかじめ相
違のあ2る特徴、を選んでおき、詳細識別の際に、選択
された特徴に重み付けを行い類似度で判定を行うのが一
般的であった。そのためあらかじめ認識対象の文字パタ
ーンを知っていて、特徴値の評価や類似し、たパターン
7があれば特徴の選択と重みの決定を1行って、いなけ
、ればならなかった。
本発明の目的は同一の特徴抽出で得られた特徴の中から
辞書を7元割するのに有効な特徴を詳細識別用辞書の特
徴値から選び選択された特徴によって詳細識別用辞書を
分類することで辞書の階層化を行い、判定処理時間の短
編化を計り、詳細識別において類似しているカテゴリが
複数個あるときにはカテゴリベアに対応する詳細識別用
辞書から違いの大きい複数個の特徴を選び、選択された
特徴の特徴値だけで類似度をめ判定を行い、トーナメン
トによシ一つのカテゴリに決定することで類似ハターン
の識別を行う文字認識方式を提供することにある。
本発明によれは、一種類の%徴抽出により標準文字から
抽出された特徴値で構成される文字認識み 用辞書と未知文字から同様に抽出でれた特徴値と類似度
により判定する文字認識方式において、文字認識用辞書
は各標準文字の特徴値をもとに標準文字を分類するのに
有効な特徴により110次数個に分類された階層化辞■
であり、類似したパターンの区別は、候補カテゴリから
作られるカテゴリベアに対応する詳細識別用辞書から違
いの大きい複数個の特徴を選び、選択された特徴の特徴
値だけで類似度をめどちらかに判定し、順次トーナメン
トによシ一つのカテゴリーになるまでくシ返すことで行
う文字認識方式が得られる。
以下本発明について実施例を示す図面を参照して説明す
る。
第1図は従来の文字認識方式を説明するだめのブロック
図である。図はおいて1は分類用特徴抽出部、2は分類
処理部、3は分類用辞書部、4は識別用特徴抽出部、5
は識別処理部、6は識別用辞書部、7はトーナメント処
理部、8はトーナメント辞書部であp、分類用辞書部3
、識別用辞書部6、トーナメント辞書部8は必らかしめ
認識対象の文字の特徴値を用いて作られている。
未知文字が人力されると分類用特徴抽出部1において特
徴値がめられ、得られた特徴値と分類用辞書部30分類
用辞書によシ分類処理部2は分類結果を出力する。識別
用特徴抽出部4は分類結果と識別用辞書部6の識別用辞
書とから、抽出すべき特徴を取出し、対応する特徴値の
抽出を行う。
識別処理部5は識別用特徴抽出部4から得られる特徴値
と識別用辞書部6の辞書とによシ判定処理を行う。トー
ナメント処理部7は識別処理部50判定結果で複数のカ
テゴリーが得られたとき、トーナメント辞書部8のトー
ナメント辞書を用いて、′一つのカテゴリに決定する。
前述のように従来の方法はあらかじめ分類用特徴をめて
おき、またその特徴に対応する分類用辞書を用意してお
く必要があった。さらに詳細識別のためのトーナメント
辞相、もあらかじめ必要であった。
第2図は階層化辞書の形式を表わす一例である。
図中点線よシ上にある1側は二段の分類用辞書で干゛は
特徴、θは特徴値の閾値を表わし、4個の特徴と4個の
閾値によ99種類に詳細識別用辞書が分類される。2側
は詳細識別用辞書で認識対象の文字カテゴリごとに一つ
づつ用意されている。例−えば認識対象の文字カテゴリ
がM個あるとすると、第2図の階層化辞書では平均して
M/9 個に分類されでいるので、階層化されてないと
きの9倍の速度で判定出来ることになる。階層化辞書に
おける分類用特徴は次の順序で検出される。ただし詳細
識別用辞書は各標準文字から抽出される同一の特徴から
の特徴値とする。
(a)認識対象の文字に対する詳細識別用辞書をめる。
(bl求まった詳細識別用辞書から各%徴ごとの特徴値
分布を作る。
(C1作られた特徴値分布より分布の広がりすなわち分
散値によシ特徴の評価を行い、分散値が最大である特徴
の選択と分類の閾値決定を行う。
(d)選択された特徴の閾値により詳細識別用辞書を分
類する。
(e)分類された各詳細識別用辞書に対して、(b)か
ら(d)をくシ返し、再分類する。
上記処理のくり返しによシ、詳細識別用辞書と同じ特徴
を用い、分類用辞書の作成が出来る0従って第2図は1
つの特徴で3つに分類して得られた2段の階層化辞書と
なる。
次に類似したパターンの区別は、次のようなトーナメン
ト処理で行える。
(a)詳細識別にお腔て類似していた複数個のカテゴリ
の中から2つのカテゴリーを組合せてカテゴリペアとす
る。
(b)カテゴリペアの各カテゴリに対応する詳細識別用
辞書を選び出す。
(C1選び出された詳細識別用辞書をもとに値の最も違
う特徴から順に複数個特徴を選ぶ。
(d)選ばれた特徴に対応する未知文字の特徴値と詳細
識別用辞書の特徴値とを用いて類似度をめどちらかのカ
テゴリーに判定する。
未知文字の特徴値をfよ、f21016114、fn、
カテゴIJa、bの詳細識別用辞書の特徴値を、各々d
Nd;、・・・・・・、d:、とdffi、dR、・・
・・・・、 dRとすると、類似度Sa、Sb は次式
で表わされる。
又は、Sa =Ir1− c+′il”+Ir2− d
BI2+−+−1tn−a:l 2Sb−”lfi a
ffi12+/f2−”’I2+”−+Ifn−dl”
である。
類似度値をもとにSo<Sbのときにはaのカテゴリー
に判定する。
(e)未判定のカテゴリーが残っていればカテゴリペア
を作り、(b)から(d)をくシ返す。残っていなけれ
ば、最後のカテゴリー名を判定結果とする。
第3図は本発明の一実施例を説明するブロック図である
。図において1は特徴抽出部、2は分類部、3は詳細識
別部、4はトーナメント判定部、5は詳細識別辞書記憶
部である。未知文字の人力に先立って特徴抽出部1で標
準文字から特徴抽出し得られる特徴値を詳細識別辞書と
し、詳細識別辞書記憶部5にセットする。また分類部2
は詳細識別辞書記憶部5にある詳細識別辞書を用い、前
述の処理で分類用特徴を検出し分類用辞書を作も未知文
字が人力されると、特徴抽出部1において特徴値がめら
れ、分類部2で分類用辞書を用い分類処理がなされ、詳
細識別部3では詳細識別辞書部5にある詳細識別辞書の
うちで分類部2により限定された詳細識別辞書とで類似
度を計q、シ、類似度をもとに判定結果を出力する。ト
ーナメント判定部4は詳細識別部30判定結果によシト
ーナメント処理を行い、最終判定結果を出力する。
本発明の方法によれば、詳細識別用辞書の特徴と同じ特
徴で階層化された分類用辞書で判定処理時間の短縮化が
計れ1.詳細識別用辞書をペアとして有効な特徴を選び
、選択された特徴の特徴値だけで判定することにで類似
パターンの区別が出来る。また本発明では、分類用特徴
、詳細識別用特徴、類似パターンの区別のだめの特徴は
同じ特徴を用いているので、特徴抽出が一回ですむ。な
お前記実施例において、分類用辞去は2段で、詳細用辞
書は9個に分類されているが、本発明はこの実施例に限
らないことは勿論である。また詳細識別辞書は1カテゴ
リに1個に限らず、複数個でも同様である。
【図面の簡単な説明】
第1図は従来の文字認識方式を説明するブロック図。 第2図は、階層化辞書の形式を表わす例を示す図。第3
図は本発明の一実施例を説明するブロック図である。 図において、1は特徴抽出部、2は詳細識別部、4はト
ーナメント判定部、5は詳細識別辞書記憶7+1 図 第2図 オ 3 図

Claims (1)

    【特許請求の範囲】
  1. 一種類の特徴抽出によシ標準文字から抽出された特徴値
    で構成される文字認識用辞書と未知文字から同様に抽出
    された特徴値との類似度によシ判定する文字認識におい
    て、文字認識用辞書は各標準文字の特徴値をもとに標準
    文字を分類するのに有効な特徴により順次数個に分類さ
    れた階層化辞書であり、類似したパターンの区別は候補
    カテゴリから作られるカテゴリペアに対応する詳細識別
    用辞書から違いの大きい複数個の特徴を選び、選択され
    た特徴の特徴値だけで類似度をめどちらかに判定し、ト
    ーナメントによシ一つのカテゴリに決定することを特長
    とする文字認識方式。
JP58169754A 1983-09-14 1983-09-14 文字認識方式 Pending JPS6061876A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58169754A JPS6061876A (ja) 1983-09-14 1983-09-14 文字認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58169754A JPS6061876A (ja) 1983-09-14 1983-09-14 文字認識方式

Publications (1)

Publication Number Publication Date
JPS6061876A true JPS6061876A (ja) 1985-04-09

Family

ID=15892224

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58169754A Pending JPS6061876A (ja) 1983-09-14 1983-09-14 文字認識方式

Country Status (1)

Country Link
JP (1) JPS6061876A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63172388A (ja) * 1987-01-10 1988-07-16 Alps Electric Co Ltd 文字画像の認識方式
JPS6465680A (en) * 1987-09-04 1989-03-10 Fujitsu Ltd Character recognizing system
JPH01219971A (ja) * 1988-02-29 1989-09-01 Fujitsu Ltd 文字認識方式
US4989258A (en) * 1987-09-09 1991-01-29 International Business Machines Corporation Character recognition apparatus

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63172388A (ja) * 1987-01-10 1988-07-16 Alps Electric Co Ltd 文字画像の認識方式
JPS6465680A (en) * 1987-09-04 1989-03-10 Fujitsu Ltd Character recognizing system
US4989258A (en) * 1987-09-09 1991-01-29 International Business Machines Corporation Character recognition apparatus
JPH01219971A (ja) * 1988-02-29 1989-09-01 Fujitsu Ltd 文字認識方式

Similar Documents

Publication Publication Date Title
CN103136504B (zh) 人脸识别方法及装置
CN107392241A (zh) 一种基于加权列抽样XGBoost的图像目标分类方法
CN104809393A (zh) 一种基于流行度分类特征的托攻击检测算法
CN101876987A (zh) 一种面向类间交叠的两类文本分类方法
CN117194920A (zh) 一种基于大数据分析的数据系统处理平台及处理方法
JP4802176B2 (ja) パターン認識装置、パターン認識プログラム及びパターン認識方法
WO2021199706A1 (ja) データ分類装置、データ分類方法およびデータ分類プログラム
JPS6061876A (ja) 文字認識方式
Rahmat et al. Image classification of ribbed smoked sheet using Learning Vector Quantization
JPH07160822A (ja) パターン認識方法
JP6659120B2 (ja) 情報処理装置、情報処理方法、およびプログラム
Farhan et al. Fingerprint identification using fractal geometry
CN111598116B (zh) 数据分类方法、装置、电子设备及可读存储介质
CN110390309B (zh) 一种基于残差分布的手指静脉非法用户识别方法
Hanmandlu et al. Detection of fabric defects using fuzzy decision tree
Rehkha Differentiating monozygotic twins by facial features
CN109190547B (zh) 快速高效的行人检测方法
CA2377602A1 (en) Multi-neural net imaging apparatus and method
CN106933847B (zh) 一种建立数据分类模型的方法和装置
JPH02158871A (ja) 文書分類装置
CN109919463A (zh) 基于svm学习模型的科技期刊来稿质量评价系统
CN109635845B (zh) 基于主成分分析和支持向量机结合的物料分选方法及系统
JPS6355677A (ja) パタ−ン認識方法
Razmjooy et al. A new image threshold technique based on metaheuristics
JPS6068483A (ja) 文字識別装置