JPH0481988A - クラスタリング方式 - Google Patents

クラスタリング方式

Info

Publication number
JPH0481988A
JPH0481988A JP2196749A JP19674990A JPH0481988A JP H0481988 A JPH0481988 A JP H0481988A JP 2196749 A JP2196749 A JP 2196749A JP 19674990 A JP19674990 A JP 19674990A JP H0481988 A JPH0481988 A JP H0481988A
Authority
JP
Japan
Prior art keywords
vector
class
representative
representative vector
storage means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2196749A
Other languages
English (en)
Inventor
Hideaki Tanaka
秀明 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2196749A priority Critical patent/JPH0481988A/ja
Priority to US07/733,041 priority patent/US5187751A/en
Publication of JPH0481988A publication Critical patent/JPH0481988A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 【産業上の利用分野】
本発明は、光学的文字読み取り装置(以下、OCRと称
する)において文字データを所定個数のフォントクラス
に分類するクラスタリング方式に関する。
【従来の技術】
一般に、OCRにおけるクラスタリングには、多変量解
析でのクラスタ分析の各手法やK −means法が用
いられており、クラスの個数と各クラスの代表ベクトル
を初期値として入力するものと、自動的に代表ベクトル
やクラスの個数が求まるものの2種類に大別できる。 これらの手法のうち、従来から多く用いられているのは
初期値を与えるK −means法であり、この手法は
、文字データの特徴ベクトル群を初期値として与えられ
た各代表ベクトルとの距離計算で最も近い代表ベクトル
のクラスへの分類した後、各クラスごとに平均ベクトル
を求め、この平均ベクトルを新たな代表ベクトルとする
。そして、この新たな代表ベクトルとの距離計算による
クラス分類を再び行ない、クラス間での特徴ベクトルの
入れ換えがなくなるまで、つまり収束するまで新代表ベ
クトルの算出とクラスの再分類を繰り返すものである。
【発明が解決しようとする課題】
ところが、上記従来のK −means法は、代表ベク
トルとの距離計算により分類された各クラスごとにその
クラスに属する特徴ベクトルの単なる平均ベクトルを求
め、これをそのクラスの新たな代表ベクトルとしている
ため、そのクラスにたまたまイレギュラなベクトルが入
ってしまった場合、次の代表ベクトルである平均ベクト
ルにずれが生じ、その結果次のクラス分類でさらに他の
イレギユラベクトルを拾って、収束後にはそのクラスに
最初の代表ベクトル(初期値)が存在しなくなるという
不具合が生じる。 フォント数が膨大(1000以上)な英数字や、各個人
が1フオントに対応する手書文字は、フォント数が明朝
、ゴシック、教科書体、#書体と少ない日本語のような
フォント名によるクラスタリング処理が難しい。しかし
、これらの文字でも、活字英数字であれば、一般書物に
見られる普通の文字を代表として1クラス、ボールド体
の如き構成線分が太い文字を代表として1クラスという
ように、また手會文字であれば、例えば左に傾いた°I
゛を代表として1クラス、右に傾いた°夏°を代表とし
て1クラスというように、人間がクラスの個数および各
クラスの代表ベクトルを直感的に決定することは簡単に
できる。 しかるに、このように直感的に決定したクラス個数と代
表ベクトルの初期値を用いても、上記従来のに一−ea
ns法による限り、収束後のクラスにそのクラスの代表
ベクトルの上記初期値が存在しなくなるという不具合が
生じるのであって、初期値を決めた人間に従来法の欠点
を感じさせるうえ、収束後に求まった各クラスの代表ベ
クトルを標準フォントとして辞書に登録し、この標準フ
ォントに基づいて文字データを認識処理しても認識率が
向上しない。 そこで、本発明の目的は、新たな代表ベクトルの生成手
法を改善することにより、イレギュラなベクトルによる
代表ベクトルの変動を押さえて、収束後のクラスに最初
の代表ベクトルを存在せしめ、求まった代表ベクトルに
基づいて高い認識率で文字データの認識処理を行なうこ
とができるクラスタリング方式を提供することにある。
【課題を解決するための手段】
上記目的を達成するため、本発明のクラスタリング方式
は、光学的文字読み取り装置における辞書作成時に、文
字データを所定個数のフォントクラスに分類するもので
あって、分類すべき文字データの特徴ベクトル群を記憶
する第1記憶手段と、予め与えられるクラスの個数およ
び各クラスを代表するフォントの文字特徴たる代表ベク
トルを記憶する第2記憶手段と、上記第1記憶手段に記
憶された各特徴ベクトルと上記第2記憶手段に記憶され
た各代表ベクトルとのeO8θを夫々計算する余弦計算
手段と、各特徴ベクトルを上記余弦計算手段で算出され
たCOSθが最も大きいクラスへ分類するとともに、そ
の特徴ベクトルに最大のcoso値を第3記憶手段に格
納する分類手段と、この分類手段で分類されたクラス毎
にそのクラスに含まれる各特徴ベクトルから上記第3記
憶手段に格納されたその特徴ベクトルに最大のe(Mθ
値を重みとして総和ベクトルを計算し、計算結果たる重
み付き総和ベクトルをそのクラスの新たな代表ベクトル
として上記第2記憶手段の記憶内容を更新する総和ベク
トル計算手段と、上記余弦計算手段。 分類手段、総和ベクトル計算手段を分類手段によるクラ
ス分けでクラス間に特徴ベクトルの移動がなくなるまで
繰り返し動作させる収束判別手段を備えたことを特徴と
する。
【作用】
分類すべき文字データの特徴ベクトル群は、第1記憶手
段に、予め与えられたクラスの個数と各クラスを代表す
るフォントの文字特徴たる代表ベクトルは、第2記憶手
段に夫々記憶されている。 余弦計算手段は、第1記憶手段に記憶された各特徴ベク
トルと第2記憶手段に記憶された各代表ベクトルとのc
osθを夫々計算し、分類手段は、各特徴ベクトルを算
出された上記cosθが最も大きいクラスへ分類し、か
つその特徴ベクトルに最大のcosO値を第3記憶手段
に格納する。次に、総和ベクトル計算手段は、分類され
たクラス毎にそのクラスに含まれる各特徴ベクトルから
第3記憶手段に格納されたその特徴ベクトルの最大のc
osO値を重みとして総和ベクトルを計算し、計算結果
たる重み付き総和ベクトルをそのクラスの新たな代表ベ
クトルとして上記第2記憶手段の記憶内容を更新する。 一方、収束判別手段は、余弦計算手段9分類手段、総和
ベクトル計算手段を、分類手段によるクラス分けでクラ
ス間に特徴ベクトルの移動つまり入れ換えがなくなるま
で繰り返し動作させ、移動がなくなるとクラスタリング
が収束したとして処理を終了する。このように、各クラ
スの新たな代表ベクトルを、そのクラスに属する特徴ベ
クトルから前回の代表ベクトルとのeO8θを重みとし
た総和ベクトルにより生成しているので、仮にイレギュ
ラな特徴ベクトルがクラスに入り込んでも、収束時のク
ラスに最初の代表ベクトル(初期値)が存在しなくなる
ということがなく、適切なりラスタリングができ、各ク
ラスに最適の代表ベクトルが求まる。従って、この代表
ベクトルに基づいてOCRで読み取った文字データの認
識処理を行なえば、認識率を向上させることができる。
【実施例】
以下、本発明を図示の実施例により詳細に説明する。 第1図は、本発明のクラスタリング方式を採用したOC
Rの一実施例を示す概略ブロック図であこのOCRは、
読み取った文字データを辞書作成のため所定個数のフォ
ントクラスに分類するものであり、分類すべき文字デー
タの特徴ベクトル群を記憶する第1記憶手段としてのベ
クトル群メモリlと、予め与えられるクラスの個数およ
び各クラスを代表するフォントの文字特徴たる代表ベク
トルを記憶する第2記憶手段としての代表ベクトルメモ
リ2と、上記メモリlに記憶された各特徴ベクトルと上
記メモリ2に記憶された各代表ベクトルとのeO8θを
夫々計算する余弦計算手段としてのCO8θ計算部4と
、各特徴ベクトルを上記cosθ計算部4で算出された
COSθが最も大きいクラスへ分類し、かつその特徴ベ
クトルに最大のe。 Se値を第3記憶手段たるeO8θメモリ3に格納する
分類手段としてのクラスタリング制御部5を備える。 また、上記OCRは、クラスタリング制御部5で分類さ
れたクラス毎に、そのクラスに含まれる各特徴ベクトル
からCogθメモリ3に格納されたその特徴ベクトルに
最大のeo11θ値を重みとして総和ベクトルを計算し
、計算結果たる霞み付き総和ベクトルをそのクラスの新
たな代表ベクトルとして上記代表ベクトルメモリ2の記
憶内容を更新する総和ベクトル計算部6を備える。さら
に、上記クラスタリング制御部5は、収束判別手段とし
て、自らが分類手段として行なうクラス分けでクラス間
に特徴ベクトルの移動がなくなったか否かを判別し、肯
と判別するまで上記Cogθ計算部4゜総和ベクトル計
算部6を繰り返し動作させ、かつ自ら上述のクラス分類
を繰り返し行なう。 上記構成のOCRによるクラスタリング動作は、次のと
おりである。 いま、説明を簡単にするため、例えば同一文字に対して
P個の特徴ベクトルX r 、 X * 、・・・、X
Pが、ベクトル群メモリ!に記憶されており、2つのク
ラスfとgの代表ベクトルF、Gが、上記特徴ベクトル
の中からF=Xi=(Xit、Xit、−、X1n)、
G=Xj=(Xit、XJ*、X3n)と選択されて代
表ベクトルメモリ2に記憶されているものとする(第2
図のSl、S2参照)。 但し、X+=(X+++X+t、”・、Xl)Xt=(
Xt++Xtt、−、X*n)Xp=(Xp+、Xpz
、・、Xpn)i+jかつl≦i≦p、l≦j≦p COSθ計算部4は、各特徴ベクトルX1〜.Xpと代
表ベクトルF、G とのCOSθを次式により計算する
(第2図の54参照)。 XkとF とのcosθ クラスタリング制御部5は、特徴ベクトルXkを上記c
osθ計算部4で算出されたcosθが大きい方のクラ
スへ分類する(第2図のS5参照)。即ち、cosθf
xk≧cosθgxgならばXkをクラスfに、Cos
θrxk<cosθgxkならばXkをクラスgに夫々
分類するとともに、その特徴ベクトルに最大のcosθ
値、即ちcc+fk=cosθfxkまたはωgk=c
osθgxkのいずれか大きい方をCOSθメモリ3に
格納する。かくて、分類後のクラス「には、例えばl1
1(≦g+<p)個の特徴ベクトルX+、Xt、・・・
、’X+a(ここでは、各ペクトcosofxk=(j
”、 Yk)/(It W It ・II Ykll 
)XkとGとのcosθ eogθgxk=(G、″”1k)i(116++ −
++ xk++ >(k=1,2.・・・、p) ルに新たな添数字を与えて表わしている)が所属し、分
類後のクラスgには、残るp−m個の特徴ベクトルが所
属することになる。 但し、 なお、 ω値 X+=(X++、X+z、・−X+n)   ωLクラ
スr  xt=cxt+、xtt、”’、xtn)  
(+JftXm=(Xw+、Xmt、−、Xmn)  
 ωfs+次に、総和ベクトル計算部6は、上記クラス
fの新たな代表ベクトルF’=CF’、、F’l、−、
F’n)を、このクラスfに属する各特徴ベクトルから
、Cosθメモリ3に格納された上記ωrQ(Q= 1
 、2 、・・・m)による重み付き総和ベクトルとし
て次式により計算する(第2図の89参照)。 表ベクトルメモリ2の記憶内容を更新する。 さらに、クラスタリング制御部5は、COSθ計算部4
を再び動作させ、上記新たな代表ベクトルF’、G’に
よる再度のクラス分類を行ない、このクラス分類が前回
のクラス分類と同じ結果つまりクラス118間に特徴ベ
クトルXkの移動即ち入れ換但し、ωr(1=cose
 rxk: fみ(@回の代表ベクトルとのcosθ) 0≦ωrQ≦1 つまり、前回の代表ベクトルFに近い特徴ベクトルの要
素は強められ、遠い特徴ベクトルの要素は弱められて加
算されて新たな代表ベクトルFの各要素が生成されるこ
とになるので、イレギュラな特徴ベクトルがたまたまク
ラスfに入り込んでも、新たな代表ベクトルFが最初に
与えられた代表ベクトルFから大きく外れることはない
。 総和ベクトル計算部6は、クラスgの新たな代表ベクト
ルG′も、上述と同様にして計算し、その後、計算結果
たる重み付き総和ベクトルF’ 、G’を夫々クラスf
、gの新たな代表ベクトルとして代えがなかったなら、
クラスタリングが収束したとして処理を終了する(第2
図の86参照)。一方、クラス118間に特徴ベクトル
の移動があり、例えばクラスgに属していた特徴ベクト
ルXαがクラスfに分類されたなら、クラスfのm+1
個の特徴ベクトルならびにクラスgのp−ta−1個の
特徴ベクトルの夫々について、総和ベクトル計算部6を
動作させて次の新たな代表ベクトルを求め、上述のc。 Sθ計算とクラス分類をクラスタリングが収束するまで
縁り返すのである(第2図の96.S9参照)。 なお、第2図において、ステップS3では、CO8θ計
算部計算上4特徴ベクトル群の各特徴ベクトルと代表ベ
クトルとのcosθ計算が終了したか否かが判断され、
ステップS7では、各クラスの代表ベクトルとのCog
θ計算が終了したか否かおよび総てのクラス間でベクト
ル移動の有無を調へたか否かが判断され、ステップS8
では、総和ベクトル計算部6による各クラスの新代表ベ
クトルの算出が終了したか否かが判断される。 このように、本発明では、各クラスf側の新たな代表ベ
クトルF’、G’を、そのクラスに属する特のeO8θ
(ωra、ωgQ)を重みとした総和ベクトルにより生
成しているので、仮にイレギュラな特徴ベクトルがその
クラスに入り込んでも、新たな代表ベクトルF”、G’
が最初に与えられた代表ベクトルF、Gから大きく外れ
ず、収束時のクラスに最初の代表ベクトル(初期値)が
存在しなくなるということがない。従って、本発明によ
れば適切なりラスタリングができ、各クラスに最適の代
表ベクトルが求まり、この代表ベクトルに基づいて辞書
を作成し、OCRで読み取った文字データのフォント認
識処理を行なえば、英数字や手書文字のようなフォント
数の多い文字でも、初期値を与えることでフォント数の
少ない日本語のフォント名によるクラスタリングと同様
のクラスタリングが可能となり、認識率を大いに向上さ
せることができる。 なお、本発明の各手段は、実施例のものに限られず、ま
た、クラスの個数は、実施例の2個に限らず3個以上に
することができる。
【発明の効果】
以上の説明で明らかなように、本発明のOCRにおける
クラスタリング方式は、分類すべき文字データの特徴ベ
クトル群を第1記憶手段に、予め与えられたクラス数と
各クラスの代表ベクトルを第2記憶手段に夫々記憶し、
余弦計算手段で両記憶手段の各特徴ベクトルと各代表ベ
クトルとのc。 Sθを計算した後、算出されたcO8θが最大のクラス
へ分類手段により各特徴ベクトルを分類し、かつ最大の
cosO値を第3記憶手段に格納する一方、総和ベクト
ル計算手段によって、分類手段で分類されたクラス毎に
、そのクラスに属する各特徴ベクトルから第3記憶手段
に格納されたその特徴ベクトルに最大のcosO値を重
みとして総和ヘクトルを計算し、計算結果たる重み付き
総和ベクトルをそのクラスの新たな代表ベクトルとして
第2記憶手段の記憶内容を更新するとともに、収束判別
手段によって、分類手段によるクラス分けでクラス間に
特徴ベクトルの移動がなくなるまで上記余弦計算手段1
分類手段、総和ベクトル計算手段を繰り返し動作させる
ようにしているので、イレギュラな特徴ベクトルが入り
込んでも、収束時の各クラスに最初の代表ベクトルが存
在しなくなることがなく、適切なりラスタリングで各ク
ラスに最適の代表ベクトルが求まり、読取り文字データ
をこの代表ベクトルに基づいてフォント認識処理すれば
、英数字等のフォント数の多い文字でも認識率を向上さ
せることができる。
【図面の簡単な説明】
第1図は本発明のクラスタリング方式を採用したOCR
の一実施例を示す概略ブロック図、第2図は上記実施例
のクラスタリング処理の流れを示すフローチャートであ
る。 l ・ベクトル群メモリ、 2・・代表ベクトルメモリ、3 ・COSθメモリ、4
−・・・cosθ計算部、5・・クラスタリング制御部
、6・・・総和ベクトル計算部。

Claims (1)

    【特許請求の範囲】
  1. (1)光学的文字読み取り装置における辞書作成時に、
    文字データを所定個数のフォントクラスに分類するクラ
    スタリング方式であって、 分類すべき文字データの特徴ベクトル群を記憶する第1
    記憶手段と、予め与えられるクラスの個数および各クラ
    スを代表するフォントの文字特徴たる代表ベクトルを記
    憶する第2記憶手段と、上記第1記憶手段に記憶された
    各特徴ベクトルと上記第2記憶手段に記憶された各代表
    ベクトルとのcosθを夫々計算する余弦計算手段と、
    各特徴ベクトルを上記余弦計算手段で算出されたcos
    θが最も大きいクラスへ分類するとともに、その特徴ベ
    クトルに最大のcosθ値を第3記憶手段に格納する分
    類手段と、この分類手段で分類されをたクラス毎にその
    クラスに含まれる各特徴ベクトルから上記第3記憶手段
    に格納されたその特徴ベクトルに最大のcosθ値を重
    みとして総和ベクトルを計算し、計算結果たる重み付き
    総和ベクトルをそのクラスの新たな代表ベクトルとして
    上記第2記憶手段の記憶内容を更新する総和ベクトル計
    算手段と、上記余弦計算手段、分類手段、総和ベクトル
    計算手段を分類手段によるクラス分けでクラス間に特徴
    ベクトルの移動がなくなるまで繰り返し動作させる収束
    判別手段を備えたことを特徴とするクラスタリング方式
JP2196749A 1990-07-24 1990-07-24 クラスタリング方式 Pending JPH0481988A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2196749A JPH0481988A (ja) 1990-07-24 1990-07-24 クラスタリング方式
US07/733,041 US5187751A (en) 1990-07-24 1991-07-22 Clustering system for optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2196749A JPH0481988A (ja) 1990-07-24 1990-07-24 クラスタリング方式

Publications (1)

Publication Number Publication Date
JPH0481988A true JPH0481988A (ja) 1992-03-16

Family

ID=16362971

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2196749A Pending JPH0481988A (ja) 1990-07-24 1990-07-24 クラスタリング方式

Country Status (2)

Country Link
US (1) US5187751A (ja)
JP (1) JPH0481988A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7697732B2 (en) 1999-03-12 2010-04-13 Sony Corporation Data processing apparatus, data processing method and recording medium

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5325445A (en) * 1992-05-29 1994-06-28 Eastman Kodak Company Feature classification using supervised statistical pattern recognition
US6272238B1 (en) * 1992-12-28 2001-08-07 Canon Kabushiki Kaisha Character recognizing method and apparatus
US5537488A (en) * 1993-09-16 1996-07-16 Massachusetts Institute Of Technology Pattern recognition system with statistical classification
JP3260979B2 (ja) * 1994-07-15 2002-02-25 株式会社リコー 文字認識方法
US6345119B1 (en) * 1996-02-19 2002-02-05 Fujitsu Limited Handwritten character recognition apparatus and method using a clustering algorithm
JP3969775B2 (ja) * 1996-12-17 2007-09-05 キヤノン株式会社 手書き情報入力装置および手書き情報入力方法
GB2344446A (en) * 1998-12-02 2000-06-07 Mars Inc Classifying currency items
US6684177B2 (en) * 2001-05-10 2004-01-27 Hewlett-Packard Development Company, L.P. Computer implemented scalable, incremental and parallel clustering based on weighted divide and conquer
CN1303563C (zh) * 2003-09-29 2007-03-07 摩托罗拉公司 用于压缩手写字符模板的方法和系统
US8175394B2 (en) * 2006-09-08 2012-05-08 Google Inc. Shape clustering in post optical character recognition processing
CN102053992B (zh) * 2009-11-10 2014-12-10 阿里巴巴集团控股有限公司 聚类方法和系统
TWI490711B (zh) * 2010-02-11 2015-07-01 Alibaba Group Holding Ltd Clustering methods and systems

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3626368A (en) * 1969-01-13 1971-12-07 Hsing Chu Lee Character-reading apparatus including improved character set sensing structure
US3727193A (en) * 1971-05-18 1973-04-10 School Of Electrical Eng Signal vector recognition system
JPS6057475A (ja) * 1983-09-07 1985-04-03 Toshiba Corp パタ−ン認識方式
US4731859A (en) * 1985-09-20 1988-03-15 Environmental Research Institute Of Michigan Multispectral/spatial pattern recognition system
US5060277A (en) * 1985-10-10 1991-10-22 Palantir Corporation Pattern classification means using feature vector regions preconstructed from reference data
US5142593A (en) * 1986-06-16 1992-08-25 Kabushiki Kaisha Toshiba Apparatus and method for classifying feature data at a high speed
JPH01183793A (ja) * 1988-01-18 1989-07-21 Toshiba Corp 文字認識装置
US5075896A (en) * 1989-10-25 1991-12-24 Xerox Corporation Character and phoneme recognition based on probability clustering

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7697732B2 (en) 1999-03-12 2010-04-13 Sony Corporation Data processing apparatus, data processing method and recording medium
US7916977B2 (en) 1999-03-12 2011-03-29 Sony Corporation Data processing apparatus, data processing method and recording medium

Also Published As

Publication number Publication date
US5187751A (en) 1993-02-16

Similar Documents

Publication Publication Date Title
Lee et al. Recognition of human front faces using knowledge-based feature extraction and neurofuzzy algorithm
Kahan et al. On the recognition of printed characters of any font and size
US5974404A (en) Method and apparatus for input classification using a neural network
Goldberger et al. Hierarchical clustering of a mixture model
JPH0481988A (ja) クラスタリング方式
Kashima et al. Kernels for semi-structured data
US4975975A (en) Hierarchical parametric apparatus and method for recognizing drawn characters
Anagnostopoulos et al. Hypersphere ART and ARTMAP for unsupervised and supervised, incremental learning
JPH04311286A (ja) オンライン手書き文字認識における類似文字のプロトタイプを改良するための方法および装置
CN110717492A (zh) 基于联合特征的图纸中字符串方向校正方法
EP1197913B1 (en) Training method and apparatus for adjusting a neuron
Morita et al. Segmentation and recognition of handwritten dates: an HMM-MLP hybrid approach
JP3630734B2 (ja) 情報処理方法
Anigbogu et al. Hidden Markov models in text recognition
US5999922A (en) Neuroprocessing service
JP4116688B2 (ja) 辞書学習方法および文字認識装置
JP2894305B2 (ja) 認識装置の候補修正方式
JP2680419B2 (ja) 文字認識装置
Abuhaiba EFFICIENT OCR USING SIMPLE FEATURES AND DECISION TREES WITH BACKTRACKING.
Moed et al. Design of an elliptical neural network with application to degraded character classification
JP3930174B2 (ja) 文字認識方法および文字認識装置
Zia et al. A Novel Procedure for Font Recognition through Deep Learning
Aksela et al. Methods for adaptive combination of classifiers with application to recognition of handwritten characters
Hung et al. Supervised Adaptive Hamming Net for classification of multiple-valued patterns
Aksela et al. On adaptive confidences for critic-driven classifier combining