JPH0266691A - パターン辞書の構成方式 - Google Patents

パターン辞書の構成方式

Info

Publication number
JPH0266691A
JPH0266691A JP63218067A JP21806788A JPH0266691A JP H0266691 A JPH0266691 A JP H0266691A JP 63218067 A JP63218067 A JP 63218067A JP 21806788 A JP21806788 A JP 21806788A JP H0266691 A JPH0266691 A JP H0266691A
Authority
JP
Japan
Prior art keywords
pattern
group
distribution
character
belong
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63218067A
Other languages
English (en)
Other versions
JP2868770B2 (ja
Inventor
Katsuteru Yamamoto
山本 勝輝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alps Alpine Co Ltd
Original Assignee
Alps Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alps Electric Co Ltd filed Critical Alps Electric Co Ltd
Priority to JP63218067A priority Critical patent/JP2868770B2/ja
Publication of JPH0266691A publication Critical patent/JPH0266691A/ja
Application granted granted Critical
Publication of JP2868770B2 publication Critical patent/JP2868770B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はパターンデータ、特に多数存在する文字を、そ
の外観の特徴によって階層的に分類してグループ化し、
入力された未知の文字の探索、認識のスピードをアップ
し、及び認識率を向上させるためのパターン辞書の構成
方式に関する。
〔従来の技術〕
従来1文字識別方式としては、入力された未知の文字パ
ターンの特徴と、パターン辞書内に収容されているすべ
ての特徴との間で類似度を求め、これらの類似度の中で
最も大きな類似度を与えるパターン辞書内のパターンを
、前記した入力される。
また、近時では、文字パターンの特徴抽出の手続を大分
類、中分類・・・個別認識等のプロセスによって段階的
に遂行する方式も増加している。この方式は、まず、大
まかな特徴抽出過程で、入力された未知文字に対する類
似度が、ある閾値以上のパターンをすべて認識文字の候
補として選出する(大分類)0次に、こうして選出され
たすべての候補文字に対して、前段階より特徴量を多く
抽出して入力された未知文字とのパターンマツチングを
行ない、その中で、類似度の値の大きい順番に、例えば
10字種程度まで絞り込む(中分類)。これらの手続を
同様に繰り返して最終的に1個の個別文字まで絞り込み
、その最終的に絞り込まれた1個のパターン字種を入力
された未知文字の認識文字とする。
〔発明が解決しようとする課題〕
しかしながら、上記した従来の文字認識方式によると、
いずれの方式を採った場合でも、入力された未知文字に
対してパターン辞書内のすべてのパターンとの総当りマ
ツチングで類似度を求め、これらの類似度を基にして識
別処理が実行されるので、計算量が膨大なものとなり、
個別認識に至るまでの必要な処理時間が非常に長くなっ
てしまり。
本発明は係る従来の技術の問題点に着目し、かかる問題
点を解決するためになされたもので、その解決のため、
高速な認識処理系を実現するため、パターン辞書を階層
的構造とし、また、精度の高い認識処理系を実現するた
め、例えば単にパターンデータを階層的にグループ化し
ていくと、最終的な各グループの構成要素は相互に独立
した関係となって、例えば第5図に示すようにグループ
1とグループ2間で実際上の類似性から文字特徴を共有
する重合部分が発生することが多くなるが、その重合部
分1aはグループ1に含まれるのに境界を越えるためグ
ループ2と識別され、また2aはグループ2に含まれる
のにグループlと識別されてしまう誤分類率が高くなっ
てしまう問題もクリアしたグループ構成法を加味したパ
ターン辞書の構成方式を提供することを目的としてぃ〔
課題を解決するための手段〕 この目的を達成するために、本発明に係るパターン辞書
の構成方式は、パターンデータを階層的に分類して複数
のパターングループをつくることを特徴としている。
〔作用〕
上記したように、階層的にパターン辞書を構成すること
で、処理スピードの高速化が図れ、また、加えて複数の
パターングループをつくることで各グループ間で類似型
骨する部分はいずれのグループにも所属することとなり
、誤分類率が大きく減少して精度の高い認識が得られ、
さらに、これらの処理が少ないマツチング回数で実現で
きる。
〔実施例〕
次に、本発明の実施の一例を第1図乃至第4C図を参照
して詳細に説明する。
第1図は本発明に係るパターン辞書の構成方式の要旨の
概念を示す説明図であり、階層的にパターンデータ、特
に文字データをその外観的特徴により、パターングルー
プの分布11.12が正規分布すると仮定し、その分布
11.12がその周囲気で共有部分を有する場合、ある
境界(基準量)と比較して、lla部分は分布12に属
させ、一方12a部分は分布11に属させることで各分
布11.12内の構成要素を修正操作することである。
即ち、多少データサイズは大きくなるが、共有部分11
a、12aはグループ11.12のいずれにも所属させ
ることとなる。
第2図は上記したように共有部分を各グループに強制的
に所属させていくための処理の概略的な流れを表すフロ
ーチャートであり、この第2図中鎖線で区切った各エリ
アE1〜E4ごとに第3A図〜第4C図として具体的に
後述する。まず、グループ化しようとする多数のパター
ンデータ(特に文字種)を入力して、目的とする各グル
ープの代表パターンを作成し1次いで、各文字種の標準
パターンと各グループにおける代表パターンとの距離を
求め、各文字種の標準パターンと入るべきグループの代
表パターンの距離と、各文字種の標準パターンと各グル
ープの代表パターンとの差を求める。それから、共有部
分εの大きさを差(基準電)と比較し、同等もしくはそ
れ以とならば標準パターンの入るべきグループとし、小
さければ標準パターンの入るべきグループとはしない、
この処理が終ると、出力して処理は終了となる。
ここで、この第2図として示したフローチャートのエリ
アE1〜E4を具体的に説明すると、第3A図〜第3C
図がElの詳細なフローチャートである。このフローチ
ャートにおいてはn種類の文字を具体的にグループ化し
ている。ここでは、クラスタリング結果を入力して1番
目の標準パターンの入るべき番号GGをCLNUM(1
)と置き換え、この操作を文字数のn回繰り返す(第3
A図)、この処理が終ると、第3B図にあっては、CD
AT、NDAT (共に操作上用いられる変数名)を「
0」 (初期化)としてα特徴及びβ特徴での各文字種
の標準パターンの特徴ベクトル(DAT)を入力するこ
とによって、各グループに入る文字種の標準パターンの
特徴ベクトルを加え合わせている(CDAT)、この処
理中、ベクトルはα特徴及びβ特徴を合わせたものとな
る(BDAT)。ここで、α特徴はp次元、β特徴はq
次元で、この処理中でp+q=r次元の特徴となり、こ
の処理を文字数のn回繰り返す、この処理が終ると第3
C図にあって、各グループの平均特徴ベクトル(代表パ
ターン)を作成するが、CDAT (I 、J)は各グ
ループにおいて、グループに入る文字種の特徴ベクトル
の総和であり、NDAT(I)は各グループでの文字種
である。尚、■はグループ番号、Jは特徴項目数である
。これより、CDAT/NDATとすることによって、
各グループの平均特徴ベクトル(代表パターン)がつく
れる、また、処理の繰り返し数gnはグループ数である
。こうして代表パターンが作成されると第2図中のE2
へ処理が移行し、そのE2は第3D図のようになる。こ
の第3D図でADATは2乗距離を表わす変数で、この
処理にあっては各文字種の標準パターンと各グループの
代表パターンとの2乗距離を求め(操作A)、この操作
Aで求めた2乗距離と各文字種の標準パターンと、含ま
れるグループの代表パターンとの2乗距離との差を求め
てEDATとする(操作B)、このEDATを出力して
第2図中のE3に入力する。
この第2図中のE3は第4A図、第4B図に示す処理と
なっており、第4A図ではE2で求められたEDAT 
(2乗距離の差)を入力する。これを文字数のn回繰り
返す、このEDATの入力が終ると第4B図のようにS
Hに各グループ間の共有部分εの大きさを入力する。こ
のεの値は探索的に求めたもので、EDATがSHより
小さければADATに「1」を代入し、大きければ「0
」を代入する。従って、この第4B図におけるADAT
はE2までに用いたものとは違っている。この処理操作
を各文字について、即ち、n回繰り返す、この第4B図
における処理は、各文字種に対し、前記したクラスタリ
ング結果で決定されたグループ以外のグループにもその
文字種を共有させるもので、その文字を共有するか否か
はEDATの大きさに対して距離のしきい値SH(εの
大きさ)による、また、こうして各文字種について所属
するグループが決まると、第2図中のE4へ処理が移行
し、この出力については第4C図に示されるようになっ
ている。データ出力のADAT(I、J)には「0」ま
たは「1」が割り当てられ出力されることとなるが、こ
こで■は文字種の番号、Jはグループ番号である。AD
AT (I 。
J)が「1」の時、工番目の文字種が1番目のグループ
に含まれることを示し、このことから辞書作成を行ない
、大分類を行なう。
〔発明の効果〕
上述したように、本発明に係るパターン辞書の構成方式
によると、階層構造としたことによって高速な処理が得
られ、また、各パターンの分布上、共有する部分は複数
の分類グループへ所属することとなるので、誤分類率は
減少して精度の高い認識が得られ、さらに、かかる処理
のためのマツチング回数も少なくて済む。
【図面の簡単な説明】
第1図は本発明に係るパターン辞書の構成方式の要旨の
概念を説明する図、第2図は同処理の流れの概要を表わ
すフローチャート、第3A図〜第3D図は第2図中の8
1〜82部分の詳細を表わすフローチャート、第4A図
〜第4C図は同じくE3〜E4の詳細を表わすフローチ
ャート、第5図は単に階層的に分類した場合を説明する
図である。 11台12・・・パターン分布 11a−12a・・・共有部分 第 図 第3へ 図 山 第 因 第3B 図 第3C図 第4A 図 ■ *3D図 区コ 第4B図 第4C図 第 図

Claims (1)

    【特許請求の範囲】
  1. パターンデータを階層的に分類して複数のパターングル
    ープをつくることを特徴とするパターン辞書の構成方式
JP63218067A 1988-08-31 1988-08-31 パターン辞書の構成方式 Expired - Fee Related JP2868770B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63218067A JP2868770B2 (ja) 1988-08-31 1988-08-31 パターン辞書の構成方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63218067A JP2868770B2 (ja) 1988-08-31 1988-08-31 パターン辞書の構成方式

Publications (2)

Publication Number Publication Date
JPH0266691A true JPH0266691A (ja) 1990-03-06
JP2868770B2 JP2868770B2 (ja) 1999-03-10

Family

ID=16714130

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63218067A Expired - Fee Related JP2868770B2 (ja) 1988-08-31 1988-08-31 パターン辞書の構成方式

Country Status (1)

Country Link
JP (1) JP2868770B2 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58105387A (ja) * 1981-12-17 1983-06-23 Nec Corp 文字認識方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58105387A (ja) * 1981-12-17 1983-06-23 Nec Corp 文字認識方法

Also Published As

Publication number Publication date
JP2868770B2 (ja) 1999-03-10

Similar Documents

Publication Publication Date Title
CN113344113B (zh) 一种基于改进k-means聚类的Yolov3锚框确定方法
CN111539444A (zh) 一种修正式模式识别及统计建模的高斯混合模型方法
Rani Visual analytics for comparing the impact of outliers in k-means and k-medoids algorithm
Van Ham et al. Visualization of state transition graphs
Azmi et al. Features extraction of Arabic calligraphy using extended triangle model for digital jawi paleography analysis
CN113850811A (zh) 基于多尺度聚类和掩码打分的三维点云实例分割方法
Hamdi et al. Hybrid neural network and genetic algorithm for off-lexicon online Arabic handwriting recognition
El-Sheikh et al. Automatic recognition of isolated arabic characters
CN109919057B (zh) 一种基于高效卷积神经网络的多模态融合手势识别方法
JPH0266691A (ja) パターン辞書の構成方式
US7061491B2 (en) Method for solving frequency, frequency distribution and sequence-matching problems using multidimensional attractor tokens
Chuang et al. Automatic classification of block-shaped parts based on their 2D projections
KR20230065443A (ko) 포인트 클라우드 데이터 증강 방법 및 이를 이용하는 학습 방법
CN113344626A (zh) 一种基于广告推送的数据特征优化方法及装置
KR102069073B1 (ko) 의약품 분류 장치, 이를 이용한 의약품 분류 방법 및 의약품 분류를 위한 학습 방법, 이를 수행하기 위한 기록매체
CN113313213A (zh) 一种加速目标检测算法训练的数据集处理方法
CN110956177A (zh) 一种混合型验证码的识别方法及系统
CN113326433B (zh) 一种基于集成学习的个性化推荐方法
JP2991750B2 (ja) 辞書作成方法
JPS63263590A (ja) 文字認識方式
Mao et al. Unsupervised style classification of document page images
JPH07111732B2 (ja) 文字図形認識用辞書作成装置
JP2890753B2 (ja) 特徴選択方法
JPS63118993A (ja) 文字認識方法
Mitzev et al. Concatenated Decision Paths Classification for Datasets with Small Number of Class Labels.

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees