JPH10222611A - 文字種選択方法、文字認識装置及び記録媒体 - Google Patents

文字種選択方法、文字認識装置及び記録媒体

Info

Publication number
JPH10222611A
JPH10222611A JP9330341A JP33034197A JPH10222611A JP H10222611 A JPH10222611 A JP H10222611A JP 9330341 A JP9330341 A JP 9330341A JP 33034197 A JP33034197 A JP 33034197A JP H10222611 A JPH10222611 A JP H10222611A
Authority
JP
Japan
Prior art keywords
character
pattern
similar
character type
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9330341A
Other languages
English (en)
Inventor
Yoshimi Katou
嘉巳 加藤
Yumi Nakayama
由美 中山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
N T T DATA TSUSHIN KK
NTT Data Corp
Original Assignee
N T T DATA TSUSHIN KK
NTT Data Communications Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by N T T DATA TSUSHIN KK, NTT Data Communications Systems Corp filed Critical N T T DATA TSUSHIN KK
Priority to JP9330341A priority Critical patent/JPH10222611A/ja
Publication of JPH10222611A publication Critical patent/JPH10222611A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 文字パタンの認識精度を低下させることなく
認識精度を向上させることができる文字認識装置を提供
する。 【解決手段】 特徴抽出部11は認識対象文字パタンに
ついての特徴ベクトルを抽出する。特徴ベクトル変換部
12は、抽出された特徴ベクトルを判別分析等に基づい
て変換して、パタン識別に寄与する度合いの大きい成分
から成るベクトルを生成する。この特徴ベクトル変換部
12で生成されたベクトルに基づいて、分類処理部14
及び識別処理部15は、文字種辞書13から認識対象文
字パタンに類似する文字種を選択する。確度演算処理部
16は選択された文字種に基づいて文字パタンの候補確
度を算出する。詳細識別部17はこの候補確度がしきい
値に満たないとき、選択された文字種からさらに類似す
る文字種を選択する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字認識技術に係
り、特に、登録された複数の文字種から抽出された特徴
量に基づいて、少ない処理量で認識精度を低下させるこ
となく類似文字種を選択する手法に関する。
【0002】
【従来の技術】文字認識装置では、通常、予め登録され
た文字種から認識対象となる文字パタンに類似する文字
種を、抽出した特徴量に基づいて選択することが行われ
る。このとき、文字認識に要する処理量を減らすため、
特徴量の全ての成分についてではなく、特徴量の一部成
分に基づいて文字種の選択を行うことも行われている。
この手法は、具体的には、まず、特徴量の一部成分に基
づいて、大まかに文字パタンの文字種を類似するものと
しないものとに分類し、さらに、より多くの特徴量の成
分を用いて類似するものとして分類された文字種を絞り
込む。このように多段階の処理を経て、文字の認識処理
を行っている。
【0003】上記多段階の処理を経て文字種選択及び文
字認識を行う従来の文字認識装置の構成例を図3に示
す。この文字認識装置3は、入力された文字パタンにつ
いてのn次元の特徴ベクトルを抽出する特徴抽出部31
を有している。ここで抽出されたn次元の特徴ベクトル
は、分類処理部34に保持される。特徴ベクトル変換部
32は、分類処理部34からの要求に応じ、上記保持さ
れているn次元の特徴ベクトルからパタン識別への寄与
度の大きな成分が上位成分となるj次元ベクトルを生成
する。分類処理部34は、このj次元ベクトルを用い
て、N個の文字種毎の基準ベクトルを格納した文字種辞
書33から、上記文字パタンに類似する文字種を分別す
る。分類処理部34における分別結果は、識別処理部3
5に渡される。識別処理部35は、特徴ベクトル変換部
32に、l(n>l>j)次元ベクトルの変換を要求
し、これにより得られたl次元ベクトルを用いて、分別
された文字種の中から、上記文字パタンにより類似する
文字種を選択する。なお、特徴ベクトル変換部32にお
ける特徴ベクトルの変換は、多変数解析における判別分
析等に基づいて行われる。
【0004】上記文字認識装置3における文字種選択の
手順は、図4に示す通りである。すなわち、特徴抽出部
31に認識対象の文字パタンが入力されると(ステップ
S201)、特徴抽出部31は、入力された文字パタン
からn次元の特徴ベクトルを抽出する(ステップS20
2)。
【0005】特徴ベクトル変換部32は、分類処理部3
4からの要求に応じて、特徴抽出部31で抽出された特
徴ベクトルを判別分析等に基づいて変換し、j次元(j
<n)ベクトルを生成する。分類処理部34は、文字種
辞書33に格納された文字種毎に、このj次元ベクトル
と文字種の基準ベクトルの上位j成分から成るj次元ベ
クトルとの距離を算出した上で、距離の小さな上位d個
の文字種を類似するグループとして分別する(ステップ
S203)。次いで、識別処理部35は、ステップS2
03で分別されたd個の文字種からさらに類似する文字
種を選択する(ステップS204)。このとき、特徴ベ
クトル変換部32は、識別処理部35からの要求に応じ
て、上記j次元ベクトルを上位成分として含むl次元
(n>l>j)ベクトルを生成する。識別処理部35
は、上記j次元ベクトルよりさらに次元の高いこのl次
元ベクトル(n>l>j)を使用して、j次元ベクトル
を用いた場合よりさらに精度よく類似する文字種を識別
する。そして、ステップS204で選択された文字種を
認識結果として後処理部に出力する(ステップS20
5)。なお、変換後ベクトルは、識別への寄与度の大き
な成分が上位にあるため、何次元のベクトルを用いるか
によって識別精度が左右される。一般に、次元数が高く
なれば識別精度は向上するが、認識速度は低下する傾向
がある。
【0006】後の説明の便宜のため、上記文字認識処理
に係る処理量について説明する。ここでの処理量は、上
記ステップS201からステップS205の特徴ベクト
ルに関わる処理に基づくもので、おおよそ特徴抽出に関
わる処理量、特徴ベクトルの変換に関わる処理量、距離
計算に関わる処理量、その他ソート等に関わる処理量と
の和で与えられる。いま、特徴ベクトルの変換に関わる
処理量をR、距離計算に関わる処理量をDとする。定性
的には、処理量Rは、おおよそ特徴ベクトルの次元数の
関数として扱われ、処理量Dは、おおよそ照合先となる
文字種の数と特徴ベクトルの次元数の関数として扱われ
る。こうして、ステップS201からステップS205
までの全体の処理量は、次式で与えられる。
【0007】
【数1】q=R(j)+D(N,j)+R(l-j)+D(d,l-j)+O1
【0008】数1式の右辺第1項は、ステップS203
において、特徴ベクトル変換部32がj次元ベクトルを
生成した際に要した処理量である。第2項は、ステップ
S203において、上記j次元ベクトルを用いてd個の
類似する文字種を分別した際に要した処理量である。第
3項は、ステップS204において特徴ベクトル変換部
32がl次元ベクトルを生成した際に要した処理量であ
る。第4項は、ステップS204において、d個の文字
種からl次元ベクトルを用いてさらに類似する文字種を
識別する際に要した処理量である。そして最後のO1
は、特徴抽出に要する処理量をはじめとする、その他の
処理量の和を表している。
【0009】
【発明が解決しようとする課題】上述のように、一般
に、文字パタンの認識精度と認識速度とはトレードオフ
の関係にある。すなわち、文字パタンについての高い認
識精度を得るには多くの特徴量を処理しなければなら
ず、それ故、処理量が増大して認識速度が低下する。こ
のため、上記従来技術では、まず、少ない特徴量を用い
て登録された全ての文字種の中から認識対象となる文字
パタンに類似するグループと類似しないグループに分類
し、その後に、類似するグループの文字種の中からさら
に多くの特徴量を用いてより類似する文字種を識別して
いた。しかしながら、このように多段階識別を用いた上
で高い認識精度を保つためには、最終段階の識別で多く
の特徴量を用いる必要があった。
【0010】一方、認識速度を向上させる為には、最初
の分類の段階で、できるだけ少数の候補文字種に絞り込
んでおく必要がある。しかし、候補文字種を予め少数に
絞り込むためには、多くの特徴量を扱わなければならな
い。例えば、文字種辞書33の中に、文字種として「J
IS X 0208」が収められているとする。このと
き、文字種辞書33の中には、カナや記号類を含める
と、第一水準だけでも3000種類以上、第二水準まで
を含めると、おおよそ6000種類以上の文字種が存在
する。このように、分類の段階で、既に何千に及ぶ文字
種と認識対象となる文字パタンとの照合が必要とされる
ため、分類の段階で候補文字種を絞り込もうとして特徴
量を増大させれば、それに伴って認識速度が大幅に低下
するという問題があった。
【0011】そこで本発明の課題は、認識精度を低下さ
せることなく、より少ない処理量で文字パタンを認識し
て認識速度を向上させる文字種選択方法を提供すること
にある。本発明の他の課題は、上記文字種選択方法の実
施に適した文字認識装置、及び上記文字種選択方法を汎
用のコンピュータで実施するための記録媒体を提供する
ことにある。
【0012】
【課題を解決するための手段】上記課題を解決するた
め、本発明は、文字認識装置に登録された複数の文字種
の中から該文字認識装置に取り込まれた文字パタンに類
似する文字種を選択する文字種選択方法を提供する。こ
の方法は、前記文字パタンの特徴量に基づいてパタンが
類似する文字種を前記登録された複数の文字種から選択
する第1ステップと、前記文字パタンの前記選択された
文字種に類似する度合いに応じた候補確度を算出する第
2ステップと、前記算出された候補確度がしきい値以下
であるとき、前記文字パタンの特徴量に基づいて前記選
択された文字種の中から、より類似する文字種を選択す
る第3ステップとを含むことを特徴とする。
【0013】前記第1ステップは多段階的に行われるこ
とが好ましい。すなわち、一の段階において前記文字パ
タンの特徴量に基づいて類似するものとして選別された
文字種が、次の段階において、前記文字パタンの特徴量
に基づいてさらに類似するものとして選別されるように
する。また、第1ステップに、前記文字パタンの特徴量
をパタン識別の際により優位となる特徴量に変換する段
階を含ませ、さらにこの第1ステップ及び第3ステップ
では、前記変換して得られた特徴量の全部またはパタン
識別に寄与する度合いがより高い一部分に基づいて、類
似する文字種の選択が行われるようにすることもでき
る。
【0014】また、前記第1及び第3ステップにおいて
各々選択された前記文字種の数及び前記しきい値等が、
文字認識の際の認識精度及び認識速度に対して最適化さ
れるようにすれば、より効果的である。
【0015】上記他の課題を解決する本発明の文字認識
装置は、予め登録された複数の文字種の中から認識対象
となる文字パタンに類似する文字種を選択する文字認識
装置であって、前記文字パタンの特徴量に基づいてパタ
ンが類似する文字種を前記登録された複数の文字種から
選択する選択手段と、前記文字パタンの前記選択された
文字種に類似する度合い応じた候補確度を算出する候補
確度演算手段と、前記候補確度演算手段で算出された候
補確度がしきい値以下であるとき、前記文字パタンの特
徴量に基づいて前記選択された文字種の中からより類似
する文字種を選択する詳細選択手段を有することを特徴
とする。
【0016】また、上記他の課題を解決する本発明の記
録媒体は、下記の処理をコンピュータに実行させるため
のプログラムがコンピュータ読取可能な形態で記録され
た記録媒体である。 (1)既登録の複数の文字種の中から取り込まれた文字
パタンに類似する文字種を前記既登録の複数の文字種か
ら選択する第1処理、(2)前記文字パタンの前記選択
された文字種に類似する度合いに応じた候補確度を算出
する第2処理、(3)前記算出された候補確度がしきい
値以下であるとき、前記文字パタンの特徴量に基づいて
前記選択された文字種の中からより類似する文字種を選
択する第3処理。各処理は、上記文字種選択方法におけ
る処理ステップに対応する。
【0017】
【発明の実施の形態】以下、図面を参照して本発明の実
施形態を詳細に説明する。図1は、本発明の一実施形態
による文字認識装置のブロック構成図である。この文字
認識装置1は、コンピュータによって実現されるもの
で、コンピュータの内部あるいは外部記憶装置内に設け
られる文字種辞書13と、そのコンピュータが所定のプ
ログラムを読み込んで実行することにより形成される、
特徴抽出部11、特徴ベクトル変換部12、分類処理部
14、識別処理部15、確度演算処理部16、詳細識別
処理部17の機能ブロックとを備えて構成される。ま
た、図示しないが、文字パタン等を入力するための入力
装置、認識結果を利用者等に提示するための出力装置を
も備えている。
【0018】上記プログラムは、通常、上記内部記憶装
置あるいは外部記憶装置に格納され、随時読み取られて
実行されるようになっているが、コンピュータとは分離
可能な記録媒体、例えばCD−ROMやFD等の可搬性
記録媒体、あるいは当該コンピュータ装置と構内ネット
ワークを通じて接続されたプログラムサーバ等に格納さ
れ、使用時に上記内部記憶装置または外部記憶装置にイ
ンストールされて随時実行に供されるものであってもよ
い。
【0019】特徴抽出部11は、入力装置を通じて入力
された文字パタンについてのn次元の特徴ベクトルを抽
出する特徴抽出部11を有している。抽出されたn次元
の特徴ベクトルは、分類処理部14に一時的に保持され
る。特徴ベクトル変換部12は、分類処理部14からの
要求に応じ、上記保持されているn次元の特徴ベクトル
からパタン識別への寄与度の大きな成分が上位成分とな
るj次元ベクトルを生成する。
【0020】分類処理部14は、このj次元ベクトルを
用いて、N個の文字種毎の基準ベクトルを格納した文字
種辞書13から、上記文字パタンに類似する文字種を分
別する。分類処理部14における分別結果は識別処理部
15に渡される。識別処理部15は、特徴ベクトル変換
部12にk(n>k>j)次元ベクトルの変換を要求
し、これにより得られたk次元ベクトルを用いて、分別
された文字種の中から、上記文字パタンにより類似する
文字種を識別する。識別処理部15における識別結果は
確度演算処理部16に渡される。
【0021】確度演算処理部16は、認識対象となる文
字パタンが識別処理部15において識別された文字種に
類似する度合いを表す候補確度を算出する。算出された
候補確度は詳細識別処理部17に渡される。この候補確
度は、識別の確からしさの度合いを示す指標となり、認
識対象となる文字パタン毎に与えられる。
【0022】詳細識別処理部17には、予め候補確度に
ついてのしきい値が設定してあり、確度演算処理部16
から渡された候補確度としきい値との比較を行うように
なっている。詳細識別処理部17は、認識対象となる文
字パタンの候補確度がしきい値以下のとき、特徴ベクト
ル変換部12にl(n>l>k)次元ベクトルの変換を
要求し、これにより得られたl次元ベクトルを用いて、
識別処理部15で識別された文字種の中から、上記文字
パタンにより類似する文字種をさらに詳細に識別する。
なお、詳細識別処理部17による詳細な識別は一段階で
あるが、必要に応じて多段階にすることも可能である。
また、特徴ベクトル変換部12において、j次元ベクト
ル、k次元ベクトル、l次元ベクトルが生成されると
き、例えば、多変量解析における判別分析等が用いられ
る。
【0023】次に、図2を参照して、上記文字認識装置
1を用いた文字種選択方法、及びその後続処理について
説明する。特徴抽出部11に認識対象の文字パタンが入
力されると(ステップS101)、特徴抽出部11は、
入力された文字パタンからn次元の特徴ベクトルを抽出
する(ステップS102)。
【0024】特徴ベクトル変換部12は、分類処理部1
4からの要求に応じて、特徴抽出部11で抽出された特
徴ベクトルを判別分析等に基づいて変換し、j次元(j
<n)ベクトルYj=(y1,y2,…,yj)を生成
する。なお、上記特徴ベクトルは図示しないメモリ等に
保持し、以後の処理においても使用できるようにしてお
くことが望ましい。分類処理部14は、上記j次元ベク
トルYjと文字種辞書13に格納された基準ベクトルの
上位j成分から成るj次元ベクトルとの距離(例えばユ
ークリッド距離)を算出する。そして算出した距離に基
づいて、距離の小さな上位d個の文字種を類似候補とし
て分類する(ステップS103)。ここで文字種辞書1
3における文字種cの基準ベクトルをTc=(tc1,
tc2,,…,tcn)とすれば、基準ベクトルのj次
元ベクトルTcjは、(tc1,tc2,,…,tc
j)となる。また、YjとTcjとのユークリッド距離
をdis(Yj,Tcj)で表せば、このユークリッド
距離dis(Yj,Tcj)は、次式で与えられる。
【0025】
【数2】 dis(Yj,Tcj)=(Σi=1〜j (yi-tci)^2)^(1/2)
【0026】但し、x^yはxのy乗であることを表し
ている。識別処理部15は、文字種辞書13を参照し
て、ステップS103で分類された上位d個の文字種か
ら、さらに類似するe個(e<d)の文字種を選択する
(ステップS104)。このとき、特徴ベクトル変換部
12は、識別処理部15からの要求に応じて、特徴抽出
部11で抽出された特徴ベクトルを判別分析等に基づい
て変換し、上記j次元ベクトルYjを上位成分として含
むk次元(j<k<n)ベクトルYk=(y1,y2,
…,yk)を生成する。識別処理部15は、このk次元
ベクトルYkと、Tcjの代わりに上位k成分から成る
k次元ベクトルTckを用いて、YkとTckとのユー
クリッド距離dis(Yk,Tck)を算出する。そし
て、上位d個の文字種から特徴ベクトルの距離dis
(Yk,Tck)がより小さい文字種をe個選択する。
【0027】確度演算処理部16は、識別処理部15で
識別された上位e個の文字種に基づいて、文字パタンの
候補確度を算出する(ステップS105)。算出した候
補確度がしきい値を越えるとき(ステップS106:Y
es)、識別処理部15で識別された上位e個の文字種
を認識結果として、図示されていない後処理部に出力す
る(ステップS108)。一方、算出した候補確度がし
きい値以下のときは、識別処理部15で識別された上位
e個の文字種について、もう一段階さらに詳細な識別を
行う(ステップS106:No、S107)。このステ
ップS107では、特徴ベクトル変換部12は、詳細識
別処理部17からの要求に応じて、特徴抽出部11で抽
出された特徴ベクトルを判別分析等に基づいて変換し、
l次元ベクトルYl=(y1,y2,…,yl)を生成
する。詳細識別処理部17は、このl次元ベクトルYl
と基準ベクトルの上位l成分からなるl次元ベクトルT
clとのユークリッド距離dis(Yl,Tcl)を算
出する。そして、dis(Yl,Tcl)の小さな上位
候補を選択して後処理部に認識結果として出力する(ス
テップS108)。
【0028】上記文字認識装置1によれば、文字種選択
及びその後の文字認識に要する処理量が減少する。その
理由を以下に説明する。ステップS101からステップ
S108までの分類及び識別に関する処理量をQとし、
ステップS107における詳細識別の実行の割合をr
(0<r<1)とする。ここで、詳細識別の実行の割合
rは、概ねしきい値等によって決定されるもので、入力
される認識対象の文字パタン中で、確度演算処理部16
で算出される候補確度がしきい値以下となる文字パタン
が占める割合を表すものである。このときの処理量Q
は、次式で与えられる。
【0029】
【数3】Q=R(j)+D(N,j)+R(k-j)+D(d,k-j)+r×(R(l-k)+D
(e,l-k))+O2
【0030】数3式の右辺第1項は、ステップS103
において、特徴ベクトル変換部12がj次元ベクトルを
生成した際に要した処理量である。第2項は、ステップ
S103において、j次元ベクトルを用いてd個の類似
する文字種を分別した際に要した処理量である。第3項
(R(k−j))は、ステップS104において、特徴
ベクトル変換部12がk次元ベクトルを生成した際に要
した処理量である。この場合の引数(k−j)は、ステ
ップS103において既に計算したj次元ベクルの計算
結果を利用できることを意味しており、これによって計
算の繰り返しを不要としているものである。第4項は、
ステップS104において、d個の文字種からk次元ベ
クトルを用いてさらに類似する文字種を識別する際に要
した処理量である。この場合の引数(k−j)は、ステ
ップS103におけるj次元ベクトルの距離の計算結果
を利用したことによる。
【0031】また、数3式において、rが掛かった括弧
の中の第5項と第6項は、それぞれ、l次元ベクトルを
生成した際に要した処理量、l次元ベクトルに基づいて
e個の文字種を詳細識別した際に要した処理量である。
また、第5項と第6項における引数(l−k)は、上述
の場合と同様、計算の繰り返しを不要とし得ることを意
味している。そして数3式における最後のO2は、特徴
抽出に要する処理量をはじめとする、その他の処理量の
和を表す。
【0032】上記処理量Qと従来の文字認識装置3の処
理量qとを比較する。処理量qは既に数1式により与え
らている。そして、処理量qで使用された引き数N,
d,j,l等は、本実施形態による処理量Qにも共通に
使用される。従って、これらの処理量の差q−Qは、処
理量qに含まれた特徴抽出に関する処理量と処理量Qに
含まれた特徴抽出に関する処理量とが同一であることか
ら、下記数4式により与えられる。
【0033】
【数4】q-Q=R(l-j)-R(k-j)-rR(l-k)+D(d,l-j)-D(d,k-
j)-rD(e,l-k)
【0031】数4式の近似式を計算する。このとき、処
理量Rは概ね次元数に比例することからR(x)=α
x、処理量Dは概ね文字種数と次元数に比例することか
らD(x,y)=βxy、とそれぞれ近似できる事実を
用いる。但し、α>0かつβ>0である。これらの処理
量R,Dについての近似式により、処理量の差q−Q
は、数5式のように近似することができる。
【0034】
【数5】q-Q=α(1-r)(l-k)+β(d-re)(l-k)
【0035】l−k>0、1−r>0、d−re>0な
ので、q−Q>0となる。これは、処理量Qを処理量q
より小さくすることができることを意味している。すな
わち、本実施形態によれば処理量を減少させることがで
きる。その結果、文字認識装置1の処理速度を従来の文
字認識装置3と比較して向上させることができる。
【0036】本発明者による実験によれば、適当なパラ
メータk、rにおいて認識精度の低下を避けることがで
きることが確認されている。また、本実施形態の文字認
識装置1を用いて手書き文字パタンについての文字認識
を行った結果、認識精度に関する認識率が97.80%
から97.90%に向上するとともに、認識速度を2.
27倍に速くできることが確認されている。さらに、文
字認識装置1において、全てのパラメータj、k、l、
r、d、eを総合的に最適化すれば、認識精度をより向
上させることができることも確認されている。
【0037】なお、処理量qの引き数が、処理量Qの引
き数の一部として共通に使用されたことは本質的なこと
ではない。処理量の引き数についての最適化後は、処理
量qの引き数と処理量Qの引き数の値は一般には異な
る。
【0038】
【発明の効果】以上の説明から明らかなように、本発明
によれば、認識が容易なパタンに対しては少ない特徴量
を使用し、認識が困難なパタンに対しては多い特徴量を
使用することができるので、認識精度が低下することな
く、認識に要する全体の処理量が減少し、認識速度が向
上する効果がある。
【図面の簡単な説明】
【図1】本発明の一実施形態による文字認識装置のブロ
ック構成図。
【図2】文字認識装置を用いた文字種選択方法の手順説
明図。
【図3】従来の文字認識装置のブロック構成図。
【図4】従来の文字認識装置における文字種選択方法の
手順説明図。
【符号の説明】
1、3 文字認識装置 11、31 特徴抽出部 12、32 特徴ベクトル変換部 13、33 文字種辞書 14、34 分類処理部 15、35 識別処理部 16 確度演算処理部 17 詳細識別処理部

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 文字認識装置に登録されている複数の文
    字種の中から該文字認識装置に取り込まれた文字パタン
    に類似する文字種を選択する方法であって、 前記文字パタンに類似する文字種を前記登録されている
    複数の文字種から選択する第1ステップと、 前記文字パタンの前記選択された文字種に類似する度合
    いに応じた候補確度を算出する第2ステップと、 前記算出された候補確度がしきい値以下であるとき、前
    記文字パタンの特徴量に基づいて前記選択された文字種
    の中からより類似する文字種を選択する第3ステップ
    と、 を含むことを特徴とする文字種選択方法。
  2. 【請求項2】 前記第1ステップにおける文字種の選択
    は多段階的であって、一の段階において前記文字パタン
    の特徴量に基づいて類似するものとして選別された文字
    種を、次の段階において、該文字パタンの特徴量に基づ
    いてさらに類似するものとして選択することを特徴とす
    る請求項1記載の文字種選択方法。
  3. 【請求項3】 前記第1及び第3ステップにおいて各々
    選択された前記文字種の数及び前記しきい値が、文字認
    識の際の認識精度及び認識速度に対して最適化されるこ
    とを特徴とする請求項1または2に記載の文字種選択方
    法。
  4. 【請求項4】 前記第1ステップは、前記文字パタンの
    特徴量をパタン識別の際により優位となる特徴量に変換
    する段階を含み、 前記第1ステップ及び第3ステップでは、前記変換して
    得られた特徴量の全部またはパタン識別に寄与する一部
    分に基づいて、類似する文字種の選択を行うことを特徴
    とする請求項1ないし3のいずれかの項記載の文字種選
    択方法。
  5. 【請求項5】 予め登録された複数の文字種の中から認
    識対象となる文字パタンに類似する文字種を選択する文
    字認識装置であって、 前記登録された複数の文字種から前記文字パタンの特徴
    量に基づいてパタンの類似する文字種を選択する文字種
    選択手段と、 前記文字パタンの前記選択された文字種に類似する度合
    いに応じた候補確度を算出する候補確度演算手段と、 前記候補確度演算手段で算出された候補確度がしきい値
    以下であるとき、前記文字パタンの特徴量に基づいて前
    記選択された文字種の中からより類似する文字種を選択
    する詳細選択手段と、 を有することを特徴とする文字認識装置。
  6. 【請求項6】 既登録の複数の文字種の中から取り込ま
    れた文字パタンに類似する文字種を前記既登録の複数の
    文字種から選択する第1処理、 前記文字パタンの前記選択された文字種に類似する度合
    いに応じた候補確度を算出する第2処理、 前記算出された候補確度がしきい値以下であるとき、前
    記文字パタンの特徴量に基づいて前記選択された文字種
    の中からより類似する文字種を選択する第3処理、をコ
    ンピュータに実行させるためのプログラムがコンピュー
    タ読取可能な形態で記録された記録媒体。
  7. 【請求項7】 前記第1処理における文字種の選択は多
    段階的であって、一の段階において前記文字パタンの特
    徴量に基づいて類似するものとして選別された文字種
    を、次の段階において、該文字パタンの特徴量に基づい
    てさらに類似するものとして選択することを特徴とする
    請求項6記載の記録媒体。
  8. 【請求項8】 前記第1及び第3処理において各々選択
    された前記文字種の数及び前記しきい値が、文字認識の
    際の認識精度及び認識速度に対して最適化されることを
    特徴とする請求項6または7に記載の記録媒体。
  9. 【請求項9】 前記第1処理は、前記文字パタンの特徴
    量をパタン識別の際により優位となる特徴量に変換する
    段階を含み、 前記第1処理及び第3処理では、前記変
    換して得られた特徴量の全部またはパタン識別に寄与す
    る一部分に基づいて、類似する文字種の選択を行うこと
    を特徴とする請求項6ないし9のいずれかの項記載の記
    録媒体。
JP9330341A 1996-12-05 1997-12-01 文字種選択方法、文字認識装置及び記録媒体 Pending JPH10222611A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9330341A JPH10222611A (ja) 1996-12-05 1997-12-01 文字種選択方法、文字認識装置及び記録媒体

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP8-325638 1996-12-05
JP32563896 1996-12-05
JP9330341A JPH10222611A (ja) 1996-12-05 1997-12-01 文字種選択方法、文字認識装置及び記録媒体

Publications (1)

Publication Number Publication Date
JPH10222611A true JPH10222611A (ja) 1998-08-21

Family

ID=26571897

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9330341A Pending JPH10222611A (ja) 1996-12-05 1997-12-01 文字種選択方法、文字認識装置及び記録媒体

Country Status (1)

Country Link
JP (1) JPH10222611A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007188190A (ja) * 2006-01-11 2007-07-26 Sharp Corp パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007188190A (ja) * 2006-01-11 2007-07-26 Sharp Corp パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体

Similar Documents

Publication Publication Date Title
JP3689455B2 (ja) 情報処理方法及び装置
Lamghari et al. Template matching for recognition of handwritten Arabic characters using structural characteristics and Freeman code
JP2007179413A (ja) パターン認識装置、パターン認識方法、および特徴抽出パラメータの生成方法
JPH10222611A (ja) 文字種選択方法、文字認識装置及び記録媒体
Singh et al. Machine learning & image processing for hand written digits and alphabets recognition from document image through MATLAB simulation
CN110942089B (zh) 一种基于多级决策的击键识别方法
JP2556477B2 (ja) パタン照合装置
JP5020513B2 (ja) パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体
JP4852086B2 (ja) パターン認識装置
JPS5922179A (ja) 文字認識方法
Psomopoulos et al. A finite state automata based technique for protein classification rules induction
Tormási et al. Fuzzy-based multi-stroke character recognizer
CN110580469B (zh) 一种基于嵌入式设备的掌脉识别系统及方法
JP2009037640A (ja) パターン認識装置および特徴抽出パラメータの生成方法
JP4215385B2 (ja) パターン認識装置、パターン認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2515732B2 (ja) パタン照合装置
JPS6186882A (ja) オンライン手書き文字認識処理方式
JP3079202B2 (ja) 文字認識方法及び文字認識装置
Xu Discovery of Weibo New Words Based on Rules and SVM
Jia et al. Classifying images using multiple binary-class decision trees for object-based image retrieval
JP2921838B2 (ja) 手書き文字認識方式
JPS5922178A (ja) 図形認識装置
JPS6252912B2 (ja)
JPH08212300A (ja) 文字認識方法及び文字認識装置
JPH05197813A (ja) 特徴選択方法