JP2001202521A - パターン認識装置及びパターン認識方法 - Google Patents

パターン認識装置及びパターン認識方法

Info

Publication number
JP2001202521A
JP2001202521A JP2000014168A JP2000014168A JP2001202521A JP 2001202521 A JP2001202521 A JP 2001202521A JP 2000014168 A JP2000014168 A JP 2000014168A JP 2000014168 A JP2000014168 A JP 2000014168A JP 2001202521 A JP2001202521 A JP 2001202521A
Authority
JP
Japan
Prior art keywords
pattern
recognition
category
value
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000014168A
Other languages
English (en)
Inventor
Tsuguaki Ryu
紹明 劉
Kazuhisa Ichikawa
一寿 市川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2000014168A priority Critical patent/JP2001202521A/ja
Publication of JP2001202521A publication Critical patent/JP2001202521A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 未知入力パターンと標準パターンとを簡易か
つ高認識率でマッチングさせる。 【解決手段】 パターンカテゴリデータ作成手段11
は,カテゴリ内に属しているすべての学習サンプルか
ら,特徴量の各次元毎に,値の最小値及び最大値を求
め,これらをそのパターンのカテゴリデータとする。パ
ターンカテゴリデータは,カテゴリに属しているすべて
の学習サンプルを含む外接多次元長方形である。この外
接長方形は多次元空間に該パターンカテゴリに属してい
るすべての学習サンプルが各次元毎に現れる位置範囲を
表し,該パターンの認識範囲である。類似度計算手段1
3の類似度は、未知入力パターンの特徴量の各次元の値
がカテゴリデータの最小値及び最大値の間に入るときに
はその分大きくなる。認識手段4はこの類似度のスコア
に応じて認識結果を出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は認識装置及び認識方
法に関し,特にパターン認識を行う認識装置及びパター
ン認識を行う認識方法に関するものである。
【0002】
【従来の技術】パターン認識分野においては一般的につ
ぎのような認識方法を採る。すなわち,パターン毎に該
パターンのすべての学習サンプルを用いて該パターンの
標準パターンを求め,求められた標準パターンを認識辞
書に記憶しておく。認識するとき,入力された未知パタ
ーンを認識辞書に格納しているすべての標準パターンと
比較し,もっとも近いものが認識の結果として出力され
る。ここで,パターン特徴量の選択方法,標準パターン
の作成方法,距離尺度或いは類似度尺度は認識精度を左
右する重要な要素である。
【0003】標準パターンの作成方法について,各パタ
ーン毎に,該パターンのすべての学習サンプルの中心値
を該パターンの標準パターンとして認識辞書に記憶さ
せ,認識辞書を作成する方法がある。しかし,パターン
の学習サンプルの分布がばらつき,かつ数が多い場合
は,認識率が低いという問題点がある。
【0004】認識率を上げるために,各パターン毎に複
数の標準パターンを用いて認識を行う方法がある。例え
ば,特開昭63−129488号公報においては,マル
チフォント文字パターンを認識するために,各文字毎に
複数の標準パターンを認識辞書に記憶しておき,その認
識辞書を用いて認識を行う方法が提案された。また,学
習サンプルを学習しながら,対応している標準パターン
を修正し,或いは新しい標準パターンを追加して,認識
辞書を作成する方法がある。例えば,特開平7−289
55号公報に記載されている方法が上記したものであ
る。しかし,これらの方法には,認識辞書に標準パター
ンの数が多いので,認識時間が長いという問題があり,
パターン数が多い場合には,パターン認識に要する処理
時間は無視できないものとなる。
【0005】認識時間を短縮するために,例えば,特開
平10−162103号公報に示すように,手書き文字
学習サンプルを用いて手書き文字認識辞書を作成し,ま
た,活字文字学習サンプルを用いて活字文字認識辞書を
作成しておき,入力された文字パターンが手書き文字か
活字文字かを判断し,手書き文字の場合は手書き文字認
識辞書,活字文字の場合は活字文字認識辞書を用いて認
識を行う方法が提案された。しかし,文字フォントの種
類が多いので,文字フォントの種類をすべて区別するの
は容易ではないし,特に手書き文字の場合は,学習サン
プルの分布が一定の法則に従わないので,1つの標準パ
ターンで学習サンプルを表現するのは,認識率が低いと
いう問題がある。
【0006】距離尺度或いは類似度尺度については,こ
れまで数多く提案されている。代表的なものは,シテイ
ブロック距離,ユークリッド距離,重み付きユークリッ
ド距離,マハラノビス距離,投影距離などが挙げられ
る。これらの方法は文献『画像の処理と認識』安居院猛
・長尾智晴(1992,昭晃堂),『基本多変量解析』
浅野長一郎・江島伸興(日本規格協会),“手書き文字
認識における投影距離法”池田正幸・田中英彦・岡本達
(情処学論,vol.24,no.1,pp.106−
112,1983)に記載されている。パターンX=
(x1,x2,…,xn)とパターンY=(y1,y2
…,yn)の間のシテイブロック距離Dc(X,Y)は次
の公式で計算する。ここで,|A|はAの絶対値を表
す。
【0007】
【数2】 パターンX=(x1,x2,…,xn)とパターンY=
(y1,y2,…,yn)の間のユークリッド距離D
e(X,Y)は次の公式で計算する。
【0008】
【数3】 パターンiの学習サンプルをS1,S2,…,Skとし,
サンプルS1,S2,…,Skの中心値,すなわち,パタ
ーンiの標準パターンをUiで表す。パターンX=
(x1,x2,…,xn)と標準パターンUi=(ui1,u
i2,…,uin)間の重み付きユークリッド距離D
w(X,Ui)は次の公式で計算する。
【0009】
【数4】 ここで,
【0010】
【数5】 である。パターンX=(x1,x2,…,xn)と標準パ
ターンUi=(ui1,ui2,…,uin)間のマハラノビ
ス距離Dm(X,Ui)は次の公式で計算する。
【0011】
【数6】 ここで,Σiはパターンiの学習サンプルの共分散行列
を表し,A-1は行列Aの逆行列であり,ATは行列Aの
転置行列である。パターンX=(x1,x2,…,xn
と標準パターンUi=(ui1,ui2,…,uin)間の投
影距離Dt(X,Ui)は次の公式で計算する。
【0012】
【数7】 ここで,Φjはパターンの学習サンプルから計算された
固有値を降順に並べたときにj番目に位置する固有値に
対応する固有ベクトルであり,(α,β)はベクトルα
とβの内積を表す。
【0013】シテイブロック距離,ユークリッド距離及
び重み付きユークリッド距離は比較的簡単に求められる
が,高い認識率を保証するのは困難である。マハラノビ
ス距離は,生起確率がχ2分布に従ったデータを対象と
している距離であり,生起確率の高い分布の中心部分ほ
ど距離が近く計算される。しかし,実際のパターンの学
習サンプルの分布はχ2分布に従っているわけではない
ので,認識率を保証できない,また,パターンの共分散
行列を記憶するため,認識辞書が巨大であり,莫大な計
算時間がかかるので,実用性が低い。投影距離は,特徴
空間の部分空間において,データが超楕円状に一様に分
布していることを想定した距離であり,比較的に高い認
識率が得られる。しかし,認識時間が長い,認識辞書が
大きいという欠点がある。
【0014】上述した従来技術には,2つの特徴があ
る。(1)1つ或いは複数の標準パターンでパターンカ
テゴリを代表する;(2)パターンとパターンの間の距
離,或いは類似度でパターンを比較する。次に従来技術
の特徴(1)と(2)は誤認が発生する重要な原因であ
ることを示す。
【0015】パターンカテゴリに属している学習パター
ンは一般に一定の分布に従わない,集中して固まってい
る場合もあるし,ばらばらに分散している場合もある。
1つの標準パターンでパターンカテゴリを代表する場合
は,図9に示すように,パターンPの認識範囲は,該パ
ターンの標準パターンを中心として(特徴(1)よ
り),該パターンカテゴリ内に属しているすべての学習
サンプルの中に,標準パターンともっとも遠い学習サン
プルと標準パターンの間の距離を半径とする(特徴
(2)より)多次元円E1になる。すなわち,入力され
た未知パターンがE1範囲に入ると,パターンPと認識
されるはずである。しかし,認識範囲E1は実際のパタ
ーン学習サンプルの分布範囲E2より大きいため,多く
のパターンの認識範囲と重なってしまう。認識すると
き,入力された未知パターンが重なっている範囲に入る
と,間違って認識されることがある。例えば,図10に
示すように,パターンP1の実際の分布範囲E4とパタ
ーンP2の実際の分布範囲E6と重なっていないが,パ
ターンP1の認識範囲E3とパターンP2の認識範囲E
5と重なっている。入力された未知パターンXがパター
ンP1の実際の分布範囲E4に入るので,パターンP1
と認識されるはずであるが,XがP1とP2の重なって
いる認識範囲に入っているので,パターンP2と間違っ
て認識される。すなわち,XとパターンP2の標準パタ
ーン間の距離がXとパターンP1の標準パターン間の距
離より小さいので,パターンP2と誤認される。
【0016】パターン毎に複数の標準パターンを用いて
認識を行う場合は,認識範囲が重なっているパターンの
数が少なくなり,認識精度がある程度改善されるが,本
質的な解決法ではない。
【0017】パターンの分布に従ってパターンの認識範
囲を縮小する,或いはパターンの分布を想定して,認識
範囲を想定した分布の形に近似するような距離関数,或
いは類似度関数を用いて認識を行う場合は(例えば,重
み付きユークリッド距離,マハラノビス距離など),認
識範囲が重なっているパターンの数が少なくなり,認識
精度がある程度改善されるが,分布が一定の規則に従わ
ないパターンに対して,高い認識率を保証できない問題
点があり,本質的な解決法ではない。
【0018】
【発明が解決しようとする課題】本発明は,上述した事
情に鑑みてなされたもので,パターンカテゴリの標準パ
ターン及びパターン間の距離或いは類似度を用いてパタ
ーン認識を行うときの認識率低下問題を解決し,簡単に
高い認識率を実現できるパターン認識技術を提供するこ
とを目的とするものである。
【0019】
【課題を解決するための手段】上記の課題を解決するた
め,特許請求の範囲に記載のとおりの構成を採用してい
る。この点について補充的に説明を行う。すなわち、本
発明の一例においては,各パターン毎に,該パターンの
すべての学習サンプルから,学習サンプル特徴量ベクト
ルの各次元毎に,次元の値の最小値及び最大値を求め,
求められた各次元の最小値及び最大値を該パターンのカ
テゴリデータとして認識辞書に記憶させ,認識辞書を作
成しておく。認識するとき,パターンとパターンカテゴ
リ間の類似度の計算方法を用いて,入力された未知パタ
ーンと認識辞書に格納されているすべてのパターンカテ
ゴリデータ間の類似度を計算し,もっとも類似なパター
ンカテゴリを認識の結果として出力することによりパタ
ーンを高精度・高速に認識することができる。
【0020】なお、この発明では、すべての学習サンプ
ルを用いるのではなく、所定範囲の選別されたサンプル
を用いてもよい。また特徴量ベクトルの各次元の最小
値、最大値自体ではなく、それから導かれる値を上側、
下側特性値として用いてもよい。
【0021】また、この発明は装置としても方法として
も実現することができる。また、その一部をコンピュー
タソフトウェアとして実現してもよい。
【0022】
【発明の実施の形態】以下,本発明の実施例を図面を参
照して説明する。図1は本発明の認識装置の原理を示す
図である。認識装置1はパターン認識を行う。パターン
カテゴリデータ作成手段11はパターンカテゴリ内に属
しているすべての学習サンプルを用いてパターンカテゴ
リデータを作成する。作成された各パターンカテゴリデ
ータを用いて,認識辞書作成手段12で認識辞書を作成
する。認識辞書の詳細については後述する。認識手段1
4は,類似度計算手段13を用いて,認識辞書に格納さ
れているパターンカテゴリデータの中から,入力された
未知パターンともっとも類似なパターンカテゴリを検出
する。
【0023】次に本発明の認識装置1の詳細構成につい
て図2および図3を用いて説明する。図2は認識装置1
の構成を示す図である。
【0024】パターン情報格納手段16は,入力された
未知パターンの特徴量ベクトルを格納している。
【0025】パターンカテゴリデータ作成手段11は,
各パターン毎に,パターンカテゴリに属しているすべて
の学習サンプルを用いてパターンカテゴリデータを作成
する。
【0026】認識辞書格納手段12aは,パターンカテ
ゴリデータ作成手段11で作成された各パターンのカテ
ゴリデータを用いて,認識辞書作成手段12で作成され
た認識辞書を格納する。図3は認識辞書内の認識辞書デ
ータを示す図である。認識辞書データ30は,すべての
パターン(m個)のデータ31〜3mから構成されてい
る。各パターンのデータはパターンの名前とカテゴリデ
ータのベクトルから構成されている。
【0027】メモリM1は,パターン情報格納手段16
から読み出された1つの未知パターンの特徴量ベクトル
を格納する。
【0028】メモリM2は,認識辞書から認識手段14
で検出された入力された未知パターンともっとも類似な
パターンの名前とカテゴリデータを格納する。
【0029】認識手段14は,類似度計算手段13を用
いて,認識辞書格納手段12aに格納された認識辞書の
中に,メモリM1に格納された未知パターンともっとも
類似なパターンを求め,その結果をメモリM2に記憶さ
せる。
【0030】記憶手段15は,認識手段14で認識され
たパターンの名前とカテゴリデータを格納する。
【0031】次に認識装置1の装置適用例として,情報
端末装置に適用させた場合の装置構成について説明す
る。図4は認識装置1を情報端末装置に適用させた場合
の装置構成を示す図である。
【0032】情報端末装置2は,キーボート21,外部
記憶装置22,ディスプレイ23,プロセッサ部24か
ら構成される。キーボート21は,ユーザが操作を指示
するための入力装置であり,その他の入力装置が付加さ
れていてもよい。外部記憶装置22は,入力された未知
パターンのデータや,認識辞書のデータや,認識結果
や,ソフトウェアを格納する。また,パターン情報格納
手段16,認識辞書格納手段12aをこの外部記憶装置
22の一部として構成することができる。さらに,記憶
部15によって認識されたパターンの名前とカテゴリデ
ータを格納してもよい。外部記憶装置22の具体例とし
て,例えばハードディスクなどで構成することができ
る。ディスプレイ23は,ユーザに対するメッセージや
認識パターンのデータ,認識の結果などを表示するため
の出力装置である。もちろん他の出力装置が付加されて
いてもよい。プロセッサ部24は,外部記憶装置22に
格納されているソフトウェアなどに従って,実際の処理
を行う。プロセッサ部24は,具体的にマイクロプロセ
ッサや,パーソナルコンピュータなどのコンピュータシ
ステムで構成することができる。そして,パターンカテ
ゴリデータ作成手段11,類似度計算手段13,認識手
段14は,このプロセッサ部24の上で動作するソフト
ウェアによって構成することができる。
【0033】次に本発明の認識装置1の動作をさらに詳
細に説明する。まず,パターン情報格納手段16に格納
されている認識パターンについて説明する。パターン情
報格納手段16に格納されている未知パターンのデータ
は,パターンの特徴量ベクトルである。
【0034】次に認識辞書格納手段12aでパターンカ
テゴリデータを格納するときのパターンカテゴリデータ
の作成手段11について説明する。パターンカテゴリデ
ータ作成手段11は,カテゴリ内に属しているすべての
学習サンプルから,特徴量の各次元毎に,次元の値の最
小値及び最大値を求め,求められた各次元の最小値と最
大値をそのパターンのカテゴリデータとする。例えば,
図5(a)に示すパターンカテゴリに属している5つの
学習サンプルからカテゴリデータを求める場合は,1次
元目の値の変化範囲は3〜8であるので,カテゴリデー
タの1次元目の最小値が3であり,最大値が8である。
これを(3,8)と書く。同様に他の次元の最小値と最
大値も求めることができる。図5(b)は求められたカ
テゴリデータを示している。
【0035】パターンカテゴリデータの作成方法から分
かるように,パターンカテゴリデータは,カテゴリに属
しているすべての学習サンプルを含む外接多次元長方形
である。この外接長方形は多次元空間に該パターンカテ
ゴリに属しているすべての学習サンプルが各次元毎に現
れる位置範囲を表し,該パターンの認識範囲である。外
接長方形は比較的にパターンの学習サンプルの分布に近
いので,認識範囲が重なっているパターンの数を大幅に
削減することができる。例えば,図6(a)に示してい
る7つのパターンP1,P2,…,P7について,従来
の技術により,P1〜P7の認識範囲は図6(a)に示
している点線円E11〜E17である。E11はE12
及びE16と,E12はE11,E13,E15及びE
16と,E13はE12及びE14と,E16はE1
1,E12,E15,E17と重なっている。しかし,
本発明により,パターンの認識範囲は図6(b)に示す
E21〜E27である。図から分かるように,E21,
E22,…,E27は相互に重なっていない。
【0036】次にパターンとカテゴリ間の類似度の計算
手段13について説明する。類似度の計算手段13は,
メモリM1に格納されている未知パターンX=(x1
2,…,xn)と認識辞書に格納しているパターンカテ
ゴリデータCat(k)=((catmin(k,1),
catmax(k,1)),(catmin(k,2),ca
max(k,2)),…,(catmin(k,n),ca
max(k,n)))間の類似度S(X,Cat
(k))は次式で計算される。
【0037】
【数8】 ここで,f(a,b,c)=1, if b≦a≦c;
f(a,b,c)=0,if a<b or a>cで
ある。
【0038】関数f()の定義から分かるように,入力
された未知パターンXのi次元目の値xiはカテゴリデ
ータのi次元目の値の変化範囲に入ると,類似度がすこ
し高くなる。逆に,入力された未知パターンXのi次元
の値xiはカテゴリデータのi次元目の値の変化範囲以
外に入ると,類似度がすこし低くなる。すべての次元に
対して,f()=1なら,類似度=1であるので,カテ
ゴリに属しているすべての学習サンプルと該パターンの
カテゴリデータ間の類似度は同じであり,“1”であ
る。認識するとき,未知パターンXがパターンカテゴリ
データで示すパターンPの認識範囲に入ると,S(X,
P)=1になり,パターンPが認識の結果として出力さ
れる。これは従来技術で実現できなかった部分である。
【0039】本発明のパターンカテゴリデータ作成方法
及びパターンとパターンカテゴリ間の類似度の計算方法
は,人間の認識機能に近似するものである。人間はもの
の特徴を思い出すときに,ものの各特徴及び特徴量の変
化範囲を思い出す。例えば,“リンゴ”の特徴を思い出
すとき,“色は赤い,黄色い或いは青いなどがあり,黒
はないこと;味は甘い,甘酢っぱいなとがあり,辛いは
ないこと;重さが150グラム位〜450グラム位;”
などが自然に思い出される。つまり,人間はパターンを
学習するとき,パターンの各特徴量を取って,各特徴及
び特徴量の変化範囲を記憶していることが考えられる。
例えば,いろんな“リンゴ”を学習した後,“色”,
“形”,“味”,“重さ”,“高さ”,“幅”等の特
徴,“色”特徴量の変化範囲が“赤色,青色,黄色”,
“重さ”特徴量の変化範囲が“150グラム位〜400
位グラム”,“高さ”特徴量の変化範囲が“6cm位〜
12cm位”などが記憶されるはずである。認識すると
き,取れた特徴量の値は学習した“リンゴ”の特徴量の
変化範囲内の場合は,“リンゴ”として認識されるはず
である。勿論,人間は連想という機能を持っているの
で,未学習のリンゴも認識できる。これは,未学習のリ
ンゴは,学習したリンゴに似ているからである。
【0040】次に認識手段14について説明する。認識
手段14は,パターンとパターンカテゴリ間の類似度を
計算する手段13を用いて,メモリM1に格納している
未知パターンと,認識辞書に格納されているすべてのパ
ターンカテゴリデータ間の類似度を計算し,未知パター
ンともっとも類似なパターンカテゴリを認識の結果とし
てメモリM2に出力する。
【0041】次にパターンカテゴリに属しているすべて
の学習サンプルから,パターンカテゴリデータを作成す
る手段11の動作をフローチャートを用いて説明する。
図7はパターンカテゴリデータ作成手段11の動作手順
を示すフローチャートである。図7の処理は以下のとお
りである。
【0042】[S1]:パターンの個数をmと設定し,
パターン特徴量ベクトル及びカテゴリデータベクトルの
次元数をnと設定する。パターンの学習順番i=1と設
定する。 [S2]:パターンiの学習サンプルの個数をa(i)
と設定し,次元数j=1と設定する。 [S3]:カテゴリデータのj次元目の最小値θmin
最大値Max,最大値θmax=0,サンプルの学習順番
k=1と設定する。ここで,最大値Maxはコンピュー
タ上にθmin変数の型が表現できる値の範囲の上限であ
る。 [S4]:パターンiの第k番目の学習サンプルのj次
元目の値Sam(i,k,j)がθminより小さいかど
うかを判断する。小さい場合は,S5へ行く。小さくな
い場合はS6へ行く。 [S5]:Sam(i,k,j)をθminにコピーす
る。 [S6]:パターンiの第k番目の学習サンプルのj次
元目の値Sam(i,k,j)がθmaxより大きいかど
うかを判断する。大きい場合は,S7へ行く。大きくな
い場合はS8へ行く。 [S7]:Sam(i,k,j)をθmaxにコピーす
る。 [S8]:次に学習するサンプルを設定する。 [S9]:パターンiのすべての学習サンプルを学習し
た場合は,S10へ行く。学習するサンプルはまた残っ
た場合は,S4へ行く。 [S10]:求められた最小値θminと最大値θmaxをパ
ターンiのカテゴリデータのj次元目の値としてCat
(i,j)に記憶させる。 [S11]:次に学習する次元を設定する。 [S12]:すべての次元が処理されたら,S13へ行
く。そうではない場合は,S3へ行く。 [S13]:次に学習するパターンを設定する。 [S14]:すべてのパターンが学習された場合は,終
了する。学習パターンがまた残った場合は,S2へ行
く。
【0043】次に認識手段14の動作をフローチャート
を用いて説明する。図8は認識手段14の動作手順を示
すフローチャートである。図8の処理は以下のとおりで
ある。
【0044】[S20]:認識辞書に格納しているパタ
ーンカテゴリデータの個数をmと設定し,パターンカテ
ゴリデータの比較順番i=1,最大類似度の初期値S
max=0,認識結果を記憶する変数Res=0にする。 [S21]:類似度計算手段13を用いて,入力された
未知パターンXと認識辞書に格納されているパターンi
のカテゴリデータCat(i)間の類似度S(X,Ca
t(i))を計算する。 [S22]:類似度S(X,Cat(i))が最大類似
度Smaxより大きい場合は,S23へ行く。大きくない
場合は,S24へ行く。 [S23]:類似度S(X,Cat(i))を最大類似
度Smaxにコピーし,パターンiを認識の結果としてR
esに記憶させる。 [S24]:次に比較するパターンカテゴリデータを設
定する。 [S25]:すべてのパターンカテゴリデータが比較さ
れた場合は,終了する。比較するパターンカテゴリデー
タがまた残った場合は,S21へ行く。
【0045】次に本発明の認識装置1を用いて,具体的
に文字パターンを認識したときの認識率及び認識速度に
ついて説明する。
【0046】文字パターンは,紙に印刷された文字画像
をスキャナでコンピュータに入力されたものである。ま
た,411次元の複合特徴量(124次元のペリフェラ
ル特徴量+62次元のストローク特徴量+225次元の
メッシュ特徴量)で文字パターンを表現する。文字パタ
ーンの個数は3455個である。13種類の文字フォン
トから文字毎に平均700個の学習サンプルを用意し
た。
【0047】文字毎に,該文字のすべての学習サンプル
から該文字のカテゴリデータを求め,認識辞書を作成す
る。従来の認識方法と比較するために,文字毎に,文字
カテゴリに属しているすべての学習サンプルの中心値を
求め,各次元毎に,重みwiを求める。求められた文字
カテゴリの中心値を該文字の代表とし,認識辞書を作成
する。また,すべての文字に対して,文字カテゴリに属
しているすべての学習サンプルを用いて,該文字カテゴ
リの共分散行列,固有値及び固有ベクトルを求める。
【0048】本発明の認識方法及び従来の認識方法を用
いて,学習したサンプルを認識する実験を行った。従来
の認識方法は,それぞれシテイブロック距離,ユークリ
ッド距離,重み付きユークリッド距離,投影距離(J=
3)を用いて認識を行う方法である。次の表は実験の結
果を表している。
【0049】
【表1】 従来認識方法の中に,もっとも高い認識率は97.8%
であり,平均認識時間は88msであった。本発明の認
識方法の認識率は98.4%であり,平均認識時間は1
7msであった。
【0050】従って,パターン認識分野における未知パ
ターンを認識する問題に対して,より高い認識精度かつ
高速にパターンを認識することが可能になる。
【0051】なお,この発明は上述の実施例に限定され
るものではなくその趣旨を逸脱しない範囲で種々変更が
可能である。例えば,上述の実施例では,学習サンプル
の特徴量ベクトルの各次元の値の最大値及び最小値その
ものを用いて類似度を計算したが,その他,最大値及び
最小値から算出される値を類似度計算用の特性値として
用いてもよい。また,すべての学習サンプルを利用して
特性値(最大値,最小値等)を求めるのではなく,所定
範囲のサンプル例えば中央の所定割合のサンプルのみを
用いてもよい。また,先に示した類似度計算手法に限ら
ず,要するに上側の特性値と下側の特性値とを利用して
類似度計算手法であればよく,種々変更が可能である。
【0052】
【発明の効果】以上の説明から明らかなように,本発明
の認識装置は,パターンの学習サンプルを用いてパター
ンカテゴリデータを求め,求められたパターンカテゴリ
データを認識辞書に記憶させ認識辞書を作成しておく。
入力された未知パターンを認識するとき,学習サンプル
の特徴量の各次元の値の上側特性値および下側特性値に
着目した、パターンとパターンカテゴリ間の類似度の計
算方法を用いて,入力された未知パターンを前記作成さ
れた認識辞書に格納されているすべてのパターンカテゴ
リと比較し,もっとも類似なパターンカテゴリを認識の
結果として出力される。これにより,入力された認識パ
ターンを高精度・高速かつ簡単に認識することができ
る。
【図面の簡単な説明】
【図1】 本発明の認識装置の原理を示す図である。
【図2】 本発明の認識装置の構成を示す図である。
【図3】 認識辞書内のデータを示す図である。
【図4】 認識装置を情報端末装置に適用させた場合の
装置構成を示す図である。
【図5】 パターンカテゴリデータを求める方法の説明
図である。
【図6】 従来技術及び本発明の技術によるパターンの
認識範囲を示す図である。
【図7】 パターンカテゴリデータの作成手段の動作手
順を示すフローチャートである。
【図8】 認識手段の動作手順を示すフローチャートで
ある。
【図9】 パターンの学習サンプルの分布範囲と認識範
囲を示す図である。
【図10】 従来技術で認識を行うときの問題点を示す
図である。
【符号の説明】
1 認識装置 11 パターンカテゴリデータ作成手段 13 パターンとカテゴリ間の類似度の計算手段 14 認識手段 X 入力された認識パターン

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 パターンの複数の特徴量を用いてパター
    ン認識を行うパターン認識装置において,パターンカテ
    ゴリ毎に,各特徴量の上側特性値及び下側特性値からな
    る標準データを記憶する記憶手段と,入力された未知パ
    ターンの各特徴量と前記パターンカテゴリの標準データ
    とに基づいて前記未知パターンと前記パターンカテゴリ
    との間の類似度を計算する手段と,計算された前記類似
    度に基づいて認識結果を出力する手段とを有することを
    特徴とするパターン認識装置。
  2. 【請求項2】 前記パターンカテゴリ毎に,当該パター
    ンカテゴリに属している学習サンプルから,特徴量ベク
    トルの各次元の値の最小値及び最大値を求め,求められ
    た各次元の最大値及び最小値を,当該パターンカテゴリ
    の各特徴量の上側特性値及び下側特性値とする請求項1
    に記載のパターン認識装置。
  3. 【請求項3】 前記パターンカテゴリ毎に,当該パター
    ンカテゴリに属している学習サンプルから,特徴量ベク
    トルの各次元の値の最小値及び最大値を求め,求められ
    た各次元の最小値及び最大値から,当該パターンカテゴ
    リの各特徴量の上側特性値及び下側特性値を算出する請
    求項1に記載のパターン認識装置。
  4. 【請求項4】 前記学習サンプルは当該パターンカテゴ
    リに属しているすべての学習サンプルとする請求項2ま
    たは3記載のパターン認識装置。
  5. 【請求項5】 前記入力された未知パターンと前記パタ
    ーンカテゴリとの間の類似度を,前記未知パターンX=
    (x1,x2,…,xn)と前記パターンカテゴリの標準
    データCat=((catmin(1),cat
    max(1)),(catmin(2),cat
    max(2)),…,(catmin(n),cat
    max(n)))に基づいて次のように計算される請求項
    1,2,3または4記載のパターン認識装置。 【数1】 ここで,f(a,b,c)=1,if b≦a≦c;
    f(a,b,c)=0,if a<b or a>cで
    ある。また,catmax(i)は上側特性値,catmin
    (i)は下側特性値である。
  6. 【請求項6】 パターンの複数の特徴量を用いてパター
    ン認識を行うパターン認識方法において,パターンカテ
    ゴリ毎に,各特徴量の上側特性値及び下側特性値からな
    る標準データを記憶するステップと,入力された未知パ
    ターンの各特徴量と前記パターンカテゴリの標準データ
    とに基づいて前記未知パターンと前記パターンカテゴリ
    との間の類似度を計算するステップと,計算された前記
    類似度に基づいて認識結果を出力するステップとを有す
    ることを特徴とするパターン認識方法。
  7. 【請求項7】 パターンの複数の特徴量を用いてパター
    ン認識を行うために用いるプログラムを記録したパター
    ン認識用コンピュータ読み取り可能な記録媒体におい
    て,パターンカテゴリ毎に記憶された,各特徴量の上側
    特性値及び下側特性値からなる標準データと,入力され
    た未知パターンの各特徴量とに基づいて前記未知パター
    ンと前記パターンカテゴリとの間の類似度を計算するス
    テップと,計算された前記類似度に基づいて認識結果を
    出力するステップとをコンピュータに実行させるための
    プログラムを記録したことを特徴とするパターン認識用
    コンピュータ読み取り可能な記録媒体。
JP2000014168A 2000-01-20 2000-01-20 パターン認識装置及びパターン認識方法 Pending JP2001202521A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000014168A JP2001202521A (ja) 2000-01-20 2000-01-20 パターン認識装置及びパターン認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000014168A JP2001202521A (ja) 2000-01-20 2000-01-20 パターン認識装置及びパターン認識方法

Publications (1)

Publication Number Publication Date
JP2001202521A true JP2001202521A (ja) 2001-07-27

Family

ID=18541660

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000014168A Pending JP2001202521A (ja) 2000-01-20 2000-01-20 パターン認識装置及びパターン認識方法

Country Status (1)

Country Link
JP (1) JP2001202521A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104959790A (zh) * 2015-07-02 2015-10-07 广船国际有限公司 一种弯曲管的加工工艺

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104959790A (zh) * 2015-07-02 2015-10-07 广船国际有限公司 一种弯曲管的加工工艺

Similar Documents

Publication Publication Date Title
JP4757116B2 (ja) パラメータ学習方法及びその装置、パターン識別方法及びその装置、プログラム
Chen et al. A new LDA-based face recognition system which can solve the small sample size problem
Cevikalp Best fitting hyperplanes for classification
Huang et al. Face detection from cluttered images using a polynomial neural network
Zhu et al. Max margin and/or graph learning for parsing the human body
CN106570521B (zh) 多语言场景字符识别方法及识别系统
CN113033398B (zh) 一种手势识别方法、装置、计算机设备及存储介质
CN110889865B (zh) 一种基于局部加权稀疏特征选择的视频目标跟踪方法
JP6170860B2 (ja) 文字認識装置及び識別関数生成方法
Escalera et al. Boosted Landmarks of Contextual Descriptors and Forest-ECOC: A novel framework to detect and classify objects in cluttered scenes
Mohebi et al. A convolutional recursive modified self organizing map for handwritten digits recognition
CN113239839B (zh) 基于dca人脸特征融合的表情识别方法
WO2019205729A1 (zh) 用于识别物体的方法、设备和计算机可读存储介质
KR102268174B1 (ko) 가버 함수를 이용한 패턴 인식 시스템 및 방법
JP3537949B2 (ja) パターン認識装置及び同装置における辞書修正方法
Daliri et al. Classification of silhouettes using contour fragments
JP2000137732A (ja) 検索装置、検索方法及び検索プログラムを記録したコンピュ―タ読み取り可能な記録媒体
JP2001202521A (ja) パターン認識装置及びパターン認識方法
Kurita et al. A modification of kernel-based Fisher discriminant analysis for face detection
CN114357307A (zh) 一种基于多维度特征的新闻推荐方法
JP4062866B2 (ja) 文字認識装置及び文字認識方法
Li et al. Multi-level Fisher vector aggregated completed local fractional order derivative feature vector for face recognition
JP5030235B2 (ja) パターン認識装置及びパターン認識方法
US20220277198A1 (en) Method for discriminating class of data to be discriminated using machine learning model, information processing device, and computer program
Kobayashi Discriminative local binary pattern

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040109

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060928

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061003

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070213