JP2000339470A - パターン辞書作成方法及び装置、パターン認識方法及び装置、並びに、記録媒体 - Google Patents

パターン辞書作成方法及び装置、パターン認識方法及び装置、並びに、記録媒体

Info

Publication number
JP2000339470A
JP2000339470A JP11151564A JP15156499A JP2000339470A JP 2000339470 A JP2000339470 A JP 2000339470A JP 11151564 A JP11151564 A JP 11151564A JP 15156499 A JP15156499 A JP 15156499A JP 2000339470 A JP2000339470 A JP 2000339470A
Authority
JP
Japan
Prior art keywords
pattern
dictionary
pattern data
feature vector
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11151564A
Other languages
English (en)
Other versions
JP4026738B2 (ja
Inventor
Toshihiro Suzuki
俊博 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP15156499A priority Critical patent/JP4026738B2/ja
Publication of JP2000339470A publication Critical patent/JP2000339470A/ja
Application granted granted Critical
Publication of JP4026738B2 publication Critical patent/JP4026738B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 既存の辞書の弱点を補強するための、副作用
が少なく大幅な認識精度向上をもたらすパターン辞書を
作成する。 【解決手段】 入力部101により学習対象パターンと
認識結果を入力し、特徴抽出部102で各パターンの構
造特徴と特徴ベクトルを抽出する。クラス分類部103
で構造特徴の同一性に基づき各パターンをクラス分類す
る。空間学習部104でクラス毎に特徴ベクトルの空間
的学習を行うが、所属の全パターンが同一カテゴリのク
ラスについては、特徴ベクトルの空間的学習を行わず、
そのカテゴリ名と構造特徴を辞書情報とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字パターン、そ
の他のパターンの認識技術の分野に係り、特に、学習デ
ータとその認識結果に基づいて新しいパターン辞書を作
成する技術と、作成した辞書を用いてパターンを認識す
る技術に関する。
【0002】
【従来の技術】パターン認識装置の認識精度を高めるた
めの従来技術として、特開昭55−138180号公
報、特開昭61−193282号公報、特開昭60−2
37583号公報、特開平03ー214286号公報な
どに述べられているような、認識できなかった文字パタ
ーン又は特徴を辞書項目として追加し、パターン辞書の
弱点を補強する方式(従来技術1)や、特開昭57−1
87781号公報に述べられているような、認識できな
かった文字パターン又は特徴を、標準の辞書とは別の拡
張辞書に格納し標準辞書の弱点を補強する方式(従来技
術2)が知られている。さらに、特開平05−2107
63号号公報などに見られるような、ニューラルネット
ワークを利用するパターン認識装置において、認識でき
なかった文字パターンを再学習してニューラルネットワ
ーク内の荷重データを更新する方式(従来技術3)、特
開昭52−112235号公報に述べられているよう
な、各標準パターンに、入力文字パターンとの類似度又
は相違度の判定のための固有の閾値を持たせる方式(従
来技術4)、これと同様な特開昭59−77579号公
報に述べられている従来技術5などが知られている。
【0003】
【発明が解決しようとする課題】しかし、従来技術1及
び従来技術2は、一定の効果は期待できるものの、辞書
項目追加による副作用があるため大幅な精度向上を期待
することは困難である。従来技術3も同様の問題があ
る。従来技術4は、標準パタ−ン毎に固有の関値を持た
せることで副作用を抑えて精度の向上を狙っているが、
肝心の固有閾値の決め方が開示されておらず、固有値の
決定が不適切であると所望の効果を期待できない。ま
た、同様の従来技術5は、固有閾値の値がカテゴリによ
らず一定であるため、十分な精度向上を期待できない。
【0004】本発明は、上述のごとき実状に鑑みてなさ
れたもので、副作用が少なく、大幅な精度向上(正読向
上または誤読低減)をもたらすパターン辞書の作成方法
及び装置を提供することを目的とする。本発明のもう一
つの目的は、パターン辞書を作成するための処理量の削
減を図ることである。本発明の他の目的は、本発明によ
り作成されたパターン辞書を利用し、高精度のパターン
認識を行う方法及び装置を提供することである。もう一
つの目的は、そのようなパターン認識のための処理量の
削減を図ることである。
【0005】
【課題を解決するための手段】本発明のパターン辞書作
成方法及び装置の骨子は 学習対象パターンデータを、
その構造特徴の同一性に基づいてクラスに分類し、クラ
ス別に学習対象パターンデータの特徴ベクトルの空間的
学習を行うことであり、副作用が少なく大幅な精度向上
(正読増加、誤読減少)をもたらすパターン辞書を作成
することが可能になる。また、一般的に学習対象パター
ンデータが増加するにつれてパターン辞書作成のための
処理量が増加するが、本発明によれば、上に述べたよう
な構造特徴に基づく一種の大分類を導入し、かつ特徴ベ
クトルの空間的学習の対象をクラス単位とすることによ
って、処理量の増加を抑えることができる。
【0006】本発明のパターン認識方法及び装置に骨子
は、本発明により作成された第1のパターン辞書と、こ
の第1のパターン辞書の作成のための学習対象パターン
データの認識結果を得るために用いられた第2のパター
ン辞書の両方を、入力パターンデータの認識に利用する
ことである。好ましい態様によれば、入力パターンデー
タの構造特徴及び特徴ベクトルを用いて、第1のパター
ン辞書及び第2のパターン辞書とのマッチングを行うこ
とによって認識結果を得るが、認識結果を決定できるま
で、構造特徴を用いた第1のパターン辞書とのマッチン
グ、特徴ベクトルを用いた第1のパターン辞書とのマッ
チング、第2のパターン辞書とのマッチングの順にマッ
チングを行うことにより、パターン認識のための処理量
を減らしつつ高精度のパターン認識を実現する。
【0007】
【発明の実施の形態】以下、添付図面を参照して、本発
明の実施の形態を説明する。図1は本発明によるパター
ン辞書作成装置の構成の一例を示すブロック図であり、
図2は図1中の空間学習部における特徴ベクトルの空間
的学習のための構成の一例を示すブロック図である。図
3は、図1及び図2に示す構成のパターン辞書作成装置
における処理を示すフローチャートである。図6は本発
明によるパターン認識装置の構成の一例を示すブロック
図であり、図7はその処理の流れを示すフローチャート
である。
【0008】図6に示すパターン認識装置は、パターン
認識のための辞書として、通常の辞書(既存の辞書)2
05に加えて追加辞書206を有する。この追加辞書2
06は、通常の辞書205のみを利用した場合の弱点を
補強するために追加された辞書であり、図1及び図2に
示した辞書105に対応するものである。後述のよう
に、この追加辞書206を作成するために、図1のパタ
ーン認識辞書作成装置に対し、学習対象パターンデータ
の認識結果が入力されるが、この認識結果を得る際に用
いられたパターン辞書が通常の辞書205に相当する。
【0009】図1に示すパターン辞書作成装置は、作成
される辞書105と、学習対象パターンデータとその認
識結果を入力する入力部101と、入力された学習対象
パターンデータから構造特徴と特徴べクトルを含む特徴
を抽出する特徴抽出部102と、学習対象パターンデー
タ(およびその特徴)を、その構造特徴の同一性に基づ
いてクラス分類するクラス分類部103と、クラス別に
特徴べクトルの空間的学習(特徴ベクトルを識別するた
めの学習)を行って辞書情報を作成し、それを辞書10
5に書き込む空間学習部104とから構成されている。
【0010】また、空間学習部104は、クラス別の特
徴ベクトルの空間的学習のために、図2に示すような学
習対象パターンデータの特徴べクトルと認識結果を取り
込む入力部111と、入力された各特徴べクトルを中心
とする近傍領域を算出する近傍領域算出部112と、近
傍領域のうち最大のものを検出する最大近傍領域検出部
113と、最大近傍領域から辞書項目を決定する辞書項
目決定部114と、決定された辞書項目を辞書情報とし
て辞書105に書き込む出力部115と、検出された最
大近傍領域に属する特徴べクトルを除いて次の最大近傍
領域を最大近傍領域検出部113に検出させるための制
御を行う領域検出制御部116とを具備している。
【0011】次に、このパターン辞書作成装置における
パターン辞書作成処理の内容を図3のフローチャートに
沿って説明する。このフローチャート中の主要処理部分
(ステップS11〜S19)について説明し、その後
に、図2に示した構成に関連したクラス別の特徴ベクト
ルの空間的学習の処理部分(ステップS21〜S27)
について説明する。
【0012】まず、入力部101により、全ての学習対
象パターンデータと、それぞれの認識結果とを入力する
(ステップSl1)。
【0013】次に、特徴抽出部102において、入力さ
れた全ての学習対象パターンデータに関して、人間の直
感にあったパターンの幾何的・位相的特徴の表現である
構造特徴を抽出(Sl2)する。ここで抽出される構造
特徴の一例として、特許第2719202号(特開平0
3‐108079号)の請求項2記載の線図形特徴抽出
方法によるところの準位相的構造表現を輪郭に適用して
ものを考える。この表現は、その詳細については特許第
2719202号公報に譲るが、概略を述べれば、輪郭
を構成する境界点列を多角形近似し、それらを単純な曲
線構成要素(プリミティブと呼ばれる)の連鎖よりなる
プリミティブ系列とし、その系列要素の組み合わせと系
列要素の2項関係を求めて輪郭近似結果を特徴付けた表
現である。この表現の利点は、線図形(特に文字)の変
形を吸収するうえで柔軟な表現であり、マッチングにお
ける計算量が少なく処理の高精度化と高速化に有利であ
ることである。もちろん、これ以外の構造特徴を抽出す
ることも可能である。なお、ここで構造特徴を抽出する
のは、構造特徴のマッチングが距離計算などの算術演算
ではなく論理演算で実現できるため、高速化に有利であ
るからである。
【0014】次に、クラス分類部103において、学習
対象パターンデータを、その構造特徴の同一性に基づい
てクラスに分類する(ステップS13)。ここでいうク
ラスとは、同一構造を持つ学習対象パターンデータの集
合である。このクラス分類を行う主たる目的は、特徴ベ
クトルの空間的学習(特徴べクトルを識別するための学
習)の対象を構造特徴が同一のクラス単位に制限するこ
とで、空間学習のための処理量の削減と副作用の影響の
低減を図るためである。また、構造特徴のみで認識可能
なパターンについては、その特徴ベクトルを用いたマッ
チングを行うことなく認識可能にするパターン辞書を作
成するためである。
【0015】構造特徴に基づいたクラス分類が終わる
と、空間学習部104の処理が開始する。空間学習部1
04において、まず未処理のクラスを一つ取り出す(ス
テップS14)。未処理のクラスがなければ(ステップ
Sl5、No)、全てのクラスに対する処理が終わった
ので、辞書作成処理は終了となる。
【0016】一方、未処理のクラスがあれば(ステップ
Sl5、Yes)、その取り出したクラス(カレント・
クラスと呼ぶ)に所属している全ての学習対象パターン
データが同一カテゴリであるか否かを調べる(ステップ
S16)。これは、カレントクラスに属している学習対
象パターンデータに関し、その特徴ベクトルの空間的学
習が必要であるか否かの判断(構造特徴に基づく大分
類)である。
【0017】同一カテゴリでないならば(ステップSl
6、No)、カレントクラスに属する学習対象パターン
データは、その構造特徴のみではカテゴリを特定するこ
とが困難である。このようなカレントクラスについて
は、特徴べクトルの空間的学習処理(ステップS21〜
S27)を行うが、これについては後述する。
【0018】カレントクラスに属する全ての学習対象パ
ターンデータが同一カテゴリであるならば(ステップS
l6、Yes)、このカレントクラスに属する学習対象
パターンデータは構造特徴のみに基づいてカテゴリを一
意に特定することができる。そこで、カレントクラスの
構造特徴とカテゴリ名とを合わせて辞書項目とし(ステ
ップS17)、その辞書項目を辞書情報として辞書10
5に出力し(ステップS18)、カレントクラスを処理
済みとする(ステップS19)。そして、ステップS1
4に戻り、別のクラスに関する処理を続ける。
【0019】なお、ステップS16の判定(大分類)を
行わず、全てのクラスを空間的学習処理(ステップS2
1〜S27)の対象とすることも可能である。しかし、
上に述べたように、クラスに含まれる全ての学習対象パ
ターンデータが同一カテゴリにある場合に、その学習対
象パターンデータの空間的学習処理を省略してカテゴリ
名を付与するようにすれば、処理量を一層削滅できるた
め、処理の高速化に有利である。
【0020】次に空間的学習処理(ステップS21〜S
29)について、図2に示した構成を参照しつつ説明す
る。空間学習部104は、処理対象となったカレントク
ラス内の全ての学習対象パターンデータに関し、特徴抽
出部102で特徴ベクトルの抽出を行わせ、抽出された
特徴ベクトルと認識結果(これは入力部101で入力さ
れたもの)を入力部111で取り込む(ステップS2
1)。なお、ここでいう特徴ベクトルは、文字等のパタ
ーンの認識分野で周知の方向コード特徴やペリフェラル
特徴などの統計的特徴量のべクトルである。
【0021】次に、近傍領域算出部112において、入
力された全ての特徴ベクトルの近傍領域の算出を行う
(ステップS22)。近傍領域とは、対象とする特徴べ
クトルを代表とする領域に包含される特徴べクトルの集
合である。この包含の条件として、 (a)近傍領域内の特徴べクトルはすべて誤読データで
ある (b)近傍領域内の特徴べクトルはすべて誤読データま
たは拒否データである (c)近傍領域内の特徴べクトルはすべて同一カテゴリ
である などを定めることができる。同一カテゴリであればその
近傍領域に含まれるものをそのカテゴリと判定すること
で、正読にすることができる。あるいは、近傍領域に含
まれるものを拒否と判定することで、誤読を避けること
ができる。このように、その要素が共通のカテゴリ判定
対象となるような、特徴べクトルの集合を近傍領域と呼
ぶ。
【0022】近傍領域算出の様子を図4に示す。同図に
おいて、黒塗りの丸、四角、三角のような記号は、誤読
パターンデータの特徴ベクトルを示す。また、白塗りの
丸、四角、三角のような記号は、正読パターンデータの
特徴ベクトルを表す。また、同じ形状の記号は、同じカ
テゴリの特徴ベクトルであることを示す。
【0023】近傍領域の算出においては、まず対象とす
る特徴べクトルに近い順に全ての特徴べクトルを順序付
けた表現を求める。図4に対してこの表現を求めると、
図5のようになる。同図において各特徴ベクトル(記
号)の下に示した数値は、その特徴ベクトルから対象と
する特徴ベクトルまでの距離を表している。最も左にあ
るのが領域中心となる特徴べクトルであり、他の特徴ベ
クトルは距離の近い順に並べられている。ここでは、上
記(a)の包含条件を採用するものとして領域境界を定
め、領域境界を挟んで隣り合う2つの特徴べクトルのそ
れぞれの距離値の平均値を領域半径とする。図4の特徴
べクトルAについては、図5から分かるように、距離5
5の正読の特徴ベクトルと、その左隣の誤読の特徴ベク
トルとの間が領域境界となり、領域半径は(45+5
5)/2=50となる。同様に、図4の特徴ベクトルB
については、同特徴ベクトルと、距離22の正読の特徴
ベクトルとの間が領域境界となり、領域半径は(0+2
2)/2=11となる。こうした処理が入力された全て
の特徴べクトルに対して行われ、その全ての特徴ベクト
ルを領域中心とする近傍領域が算出される。
【0024】なお、入力された全ての特徴ベクトルの近
傍領域を求めるのではなく、誤読の特徴ベクトルのみを
領域中心とする近傍領域表現だけを求めたり、又は、誤
読と拒否の特徴ベクトルのみを領域中心とする近傍領域
表現だけを求めたりすることも可能である。このように
すれば、全ての特徴ベクトルを領域中心とする近傍領域
表現を求める場合に比べ、図5の行の数が大幅に削減さ
れるため(ただし、列の数は変わらない)、処理量を削
減できるという利点がある。また、近傍領域の包含条件
として上記(b)又は(c)の条件を採用することも可
能である。
【0025】次に、最大近傍領域検出部113におい
て、得られた近傍領域の中から最大の近傍領域を検出す
る(ステップS23)。このときの検出基準となるの
は、ここでは領域半径である。すなわち、領域半径が最
大の近傍領域を最大近傍領域とする。なお、最大近傍領
域の算出基準として、領域半径に代えて、領域内に含ま
れる特徴べクトル数(学習対象パターンデータ数)を用
いることも可能である。
【0026】続いて、領域検出制御部116において、
最大近傍領域が検出されたか否かを調べる(ステップS
24)。検出されない場合は、すべての特徴べクトルが
既に登録済みの近傍領域に含まれた場合であるので、カ
レントクラスに対する空間学習処理を終了し、ステップ
S19以降の処理に戻る。
【0027】一方、最大近傍領域が検出されたならば、
辞書項目決定部114で、その近傍領域の辞書項目の内
容を決定する(ステップS25)。この辞書項目には、
少なくとも (1)領域中心の特徴べクトル (2)領域半径 (3)カテゴリ名(リジェクトコードの場合もある) が含まれる。カテゴリ名の決定に関しては、領域中心の
特徴ベクトルのカテゴリ名を無条件に辞書項目のカテゴ
リ名に採用するような様々な方法が可能であるが、その
近傍領域内の特徴ベクトルが全て同一カテゴリであると
きにのみ、そのカテゴリ名を辞書項目のカテゴリ名に採
用する方法によれば、誤読の削減のみならず、正読の向
上を図ることができる。また、その領域半径がきわめて
小さい場合には、正読データと誤読データとが密集して
いると考えられるため、未学習データに対して正読のみ
ならず誤読をも増やすことが懸念される。これを避ける
ために、領域半径があらかじめ定められた閾値以下の場
合に、辞書項目のカテゴリ名を拒否(リジェクト)とす
るのが有効である。
【0028】次に、図6に示すパターン認識装置につい
て説明する。このパターン認識装置は、パターン認識辞
書として、元々備えている通常の辞書205に加えて、
図1乃至図5に関連して説明したような本発明のパター
ン認識辞書作成装置により作成された追加辞書206を
有し、また、認識対象であるパターンデータを入力する
入力部201と、入力されたパターンデータの構造特徴
及び特徴べクトルを抽出する特徴抽出部202と、抽出
された構造特徴又は特徴べクトルに関し追加辞書206
又は通常の辞書205との間でマッチングを行って入力
パターンデータを認識する識別部203と、この識別部
203の認識結果を出力する出力部204とを有する構
成である。
【0029】このパターン認識装置における処理を、図
7のフローチャートに沿って説明する。まず、入力部2
01により読み取り対象となるパターンデータを入力し
(ステップS31)、特徴抽出部202で入力パターン
データから構造特徴を抽出する(ステップS32)。続
いて、抽出された構造特徴と追加辞書206内の構造特
徴とのマッチングを識別部203で行う(ステップS3
3)。マッチングの取れた全てのクラスが同一カテゴリ
であれば(ステップS34、Yes)、特徴べクトルを
抽出することなく入力パターンデータのカテゴリを一意
に決定することができるので、そのクラスのカテゴリ名
を認識結果として出力部204により出力する(ステッ
プS39)。このように構造特徴のみで認識が可能な入
力パターンデータについて、特徴ベクトルの抽出とその
マッチングを行わないようにすると、処理量の削減に有
利である。
【0030】構造特徴のマッチングがとれたクラス中に
カテゴリの異なるクラスが含まれている場合には(ステ
ップS34、No)、この段階ではカテゴリを一位に決
定できないため、特徴抽出部202によって入力パター
ンデータから特徴べクトルを抽出する(ステップS3
5)。続いて、識別部203において、特徴ベクトルの
マッチングを行うが、最初に追加辞書206との間でマ
ッチングを行う(ステップS36)。追加辞書206に
登録されている辞書項目は、前述のように少なくとも中
心となる特徴べクトルと、その領域半径と、カテゴリ名
とからなる。このマッチングでは、入力パターンデ−タ
から抽出された特徴べクトルと、各辞書項目の特徴べク
トルとの距離を算出し、その値が、その辞書項目の領域
半径以下であればマッチしたと見なし、いずれの辞書項
目の特徴ベクトルとの距離もその領域半径以下でなけれ
ばマッチしないと見なす。追加辞書206との特徴ベク
トルのマッチングでマッチした場合には(ステップS3
7、Yes)、出力部204は該当辞書項目のカテゴリ
名を認識結果として出力する(ステップS39)。
【0031】特徴ベクトルを用いた追加辞書206との
マッチングで、どの辞書項目ともマッチしない場合には
(ステップS37、No)、識別部203は、通常の辞
書205との間で特徴ベクトルのマッチングを行って入
力パターンを認識し(ステップS38)、その結果を出
力部204より出力し(ステップS39)、処理を終了
する。
【0032】このように、図6に示す本発明のパターン
認識装置は、全体としては一般的なパターン認識装置の
構成に類似するが、違いは本発明により作成された追加
辞書206を用いることにある。これにより、追加辞書
206を用いない、それまでのパターン認識装置で苦手
としたケースのみを特別扱いし、学習対象パターンデー
タに対して厳密に学習した結果に置き換えることができ
る。したがって、従来のパターン認識装置に対してわず
かな変更を施すだけで、従来技術のような単純な学習を
行う場合に問題となった副作用を抑え、大幅な精度向上
(正読増加、誤読減少)を達成でき、また処理量も削減
できる。
【0033】本発明は、例えば図8に示すCPU30
2、記憶装置303、補助記憶装置304、CD−RO
Mなどの記録媒体307を読み書きするためのドライブ
306、入力インターフェース301、出力インターフ
ェース305などをバス310で接続したような一般的
な構成のコンピュータを利用し、ソフトウェアにより実
施することも可能である。図1及び図2に関連して説明
したような本発明によるパターン辞書作成装置の各手段
をコンピュータのハードウエアを利用して実現するため
のプログラム、図3に示したような本発明によるパター
ン認識辞書作成のための各処理ステップをコンピュータ
に実行させるためのプログラム、図6に関連して説明し
たような本発明によるパターン認識装置の各手段をコン
ピュータのハードウエアを利用して実現するためのプロ
グラム、又は、図7に示したような本発明によるパター
ン認識のための各処理ステップをコンピュータに実行さ
せるためのプログラムは、例えば、同プログラムが記録
された記録媒体307からドライブ306を通じて補助
記憶装置303に読み込まれ、CPU302が補助記憶
装置304や記憶装置303との間で情報をやり取りし
ながら、同プログラムの各ステップを実行する。学習デ
ータに基づいて作成された辞書(図1及び図2に示す辞
書107)は例えば補助記憶装置304に保存され、ま
た、必要に応じて記録媒体307に出力される。パター
ン認識のための通常の辞書及び追加辞書(図6に示す辞
書205及び追加辞書206)は、例えばプログラムが
記録された記録媒体307又は別の記録媒体307から
補助記憶装置304に読み込まれ、パターン認識処理に
利用される。
【0034】
【発明の効果】以上の説明から明らかなように、請求項
1乃至8及び請求項15乃至18に記載の発明によれ
ば、既存の辞書の弱点を補強するための、副作用が少な
く大幅な精度向上をもたらすパターン辞書を、少ない処
理量で作成可能である。特に、請求項7、8及び16記
載の発明によれば、空間的学習の対象を減らし一層の処
理量の削減が可能である。請求項8及び16記載の発明
によれば、構造特徴のみで認識可能なパターンについて
は特徴ベクトルを利用することなく効率的に認識可能に
するパターン辞書を作成できる。請求項2及び17記載
の発明によれば、パターンの変形に強くパターン認識処
理の高精度化に有利で、かつマッチングのための計算量
が少なくパターン認識処理の高速化に有利なパターン辞
書を作成できる。請求項4及び5記載の発明によれば、
特徴ベクトルの空間的学習のための処理量を一層減らし
パターン辞書作成処理の高速化に有利であり、請求項6
記載の発明によれば、誤読を減らすことができる。請求
項10乃至13及び請求項19乃至21記載の発明によ
れば、高精度のパターン認識が可能になる。特に、請求
項10及び20記載の発明によれば、構造特徴のみで認
識可能なパターンの認識のための処理量を減らすること
ができ、請求項13及び21記載の発明によれば、パタ
ーンの変形に強く、かつ高速のパターン認識処理が可能
になる。請求項9記載の発明によれば一般的なコンピュ
ータを利用して請求項1乃至8記載の発明を容易に実施
することができ、請求項14記載の発明によれば請求項
10乃至12記載の発明を一般的なコンピュータを利用
し容易に実施できる等々の効果を得られる。
【図面の簡単な説明】
【図1】本発明によるパターン辞書作成装置の構成の一
例を示すブロック図である。
【図2】特徴ベクトルの空間的学習のための構成の一例
を示すブロック図である。
【図3】図1のパターン辞書作成装置における処理のフ
ローチャートである。
【図4】近傍領域算出の様子を示す図である。
【図5】近傍領域算出のために、対象とする特徴べクト
ルに近い順に特徴べクトルを順序付けた表現を示す図で
ある。
【図6】本発明によるパターン認識装置の構成の一例を
示すブロック図である。
【図7】図6のパターン認識装置における処理のフロー
チャートである。
【図8】本発明を実施するためのコンピュータの一例を
示すブロック図である。
【符号の説明】
101 入力部 102 特徴抽出部 103 クラス分類部 104 空間学習部 105 辞書 111 入力部 112 近傍領域算出部 113 最大近傍領域検出部 114 辞書項目決定部 115 出力部 116 領域検出制御部 117 新しく作成される辞書 201 入力部 202 特徴抽出部 203 識別部 204 出力部 205 通常の辞書(既存の辞書) 206 追加辞書
フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 15/00 G10L 3/00 521C 521J 561A 5/06 Z

Claims (21)

    【特許請求の範囲】
  1. 【請求項1】 学習対象パターンデータとその認識結果
    に基づいて新しいパターン辞書を作成する方法であっ
    て、学習対象パターンデータを、その構造特徴の同一性
    に基づいてクラスに分類する処理と、クラス別に学習対
    象パターンデータの特徴ベクトルの空間的学習を行って
    辞書情報を生成する処理とを有することを特徴とするパ
    ターン辞書作成方法。
  2. 【請求項2】 構造特徴として、パターンの輪郭に対す
    る準位相的構造表現を用いることを特徴とする請求項1
    記載のパターン辞書作成方法。
  3. 【請求項3】 クラス別の特徴ベクトルの空間的学習の
    処理において、各特徴べクトルを中心とする近傍領域を
    求め、求めた近傍領域から最大の近傍領域を求め、その
    最大近傍領域に属する特徴べクトルを除いて次の最大近
    傍領域を求める処理を繰り返し、各最大近傍領域に関し
    領域中心の特徴ベクトル、領域半径及びカテゴリ名を含
    む辞書情報を生成することを特徴とする請求項1又は2
    記載のパターン辞書作成方法。
  4. 【請求項4】 クラス別の特徴ベクトルの空間的学習の
    処理において、誤読された学習対象パターンデータの特
    徴べクトルを中心とする近傍領域のみが求められること
    を特徴とする請求項3記載のパターン辞書作成方法。
  5. 【請求項5】 クラス別の特徴ベクトルの空間的学習の
    処理において、誤読された学習対象パターンデータ及び
    拒否された学習対象パターンデータの特徴べクトルを中
    心とする近傍領域のみが求められることを特徴とする請
    求項3記載のパターン辞書作成方法。
  6. 【請求項6】 クラス別の特徴ベクトルの空間的学習の
    処理において、最大近傍領域の領域半径があらかじめ定
    められた閾値以下であるときに、その最大近傍領域のカ
    テゴリ名を拒否(リジェクト)とすることを特徴とする
    請求項3項記載のパターン辞書作成方法。
  7. 【請求項7】 所属する全ての学習対象パターンデータ
    が同一カテゴリであるクラスを除いたクラスのみを特徴
    ベクトルの空間的学習の対象とすることを特徴とする請
    求項1乃至6のいずれか1項記載のパターン辞書作成方
    法。
  8. 【請求項8】 所属する全ての学習対象パターンデータ
    が同一のカテゴリであるクラスについて、そのカテゴリ
    名と構造特徴を含む辞書情報を生成する処理を有するこ
    とを特徴とする請求項1乃至7のいずれか1項記載のパ
    ターン辞書作成方法。
  9. 【請求項9】 請求項1乃至8のいずれか1項記載のパ
    ターン辞書作成のための処理をコンピュータに実行させ
    るためのプログラムが記録されたことを特徴とするコン
    ピュータ読み取り可能記録媒体。
  10. 【請求項10】 請求項1乃至8のいずれか1項記載の
    パターン辞書作成方法により作成された第1のパターン
    辞書、及び、該第1のパターン辞書の作成のための学習
    対象パターンデータの認識結果を得るために用いられた
    第2のパターン辞書を、入力パターンデータの認識のた
    めに利用することを特徴とするパターン認識方法。
  11. 【請求項11】 入力パターンデータの構造特徴を用い
    て、請求項8記載のパターン辞書作成方法により作成さ
    れた第1のパターン辞書とのマッチングを行う処理と、
    この処理で認識結果を決定できない場合に、入力パター
    ンデータの特徴ベクトルを用いて前記第1のパターン辞
    書とのマッチングを行う処理と、この処理で認識結果が
    決定できない場合に、前記第1のパターン辞書の作成の
    ための学習対象パターンの認識結果を得るために用いら
    れた第2のパターン辞書を利用して認識結果を決定する
    処理とを有することを特徴とするパターン認識方法。
  12. 【請求項12】 構造特徴を用いた前記第1のパターン
    辞書とのマッチングの処理において同一カテゴリのクラ
    スのみマッチした場合に、そのクラスのカテゴリ名を認
    識結果とすることを特徴とする請求項11記載のパター
    ン認識方法。
  13. 【請求項13】 特徴ベクトルを用いた前記第1のパタ
    ーン辞書とのマッチングの処理において、前記第1のパ
    ターン辞書の各項目の特徴ベクトルとの距離が当該項目
    の領域半径以下である場合に、当該項目のカテゴリ名を
    認識結果とすることを特徴とする請求項11記載のパタ
    ーン認識方法。
  14. 【請求項14】 請求項11、12又は13記載のパタ
    ーン認識のための処理をコンピュータに実行させるため
    のプログラムが記録されたことを特徴とするコンピュー
    タ読み取り可能記録媒体。
  15. 【請求項15】 学習対象パターンデータとその認識結
    果に基づいて新しいパターン辞書を作成する装置であっ
    て、学習対象パターンデータ及びその認識結果を入力す
    る手段と、学習対象パターンデータの構造特徴及び特徴
    ベクトルを抽出する手段と、学習パターンデータを、そ
    の構造特徴の同一性に基づいてクラスに分類する手段
    と、クラス別に学習対象パターンデータの特徴ベクトル
    の空間的学習を行って辞書情報を生成する手段とを具備
    することを特徴とするパターン辞書作成装置。
  16. 【請求項16】 学習対象パターンデータとその認識結
    果に基づいて新しいパターン辞書を作成する装置であっ
    て、学習対象パターンデータ及びその認識結果を入力す
    る手段と、学習対象パターンデータの構造特徴及び特徴
    ベクトルを抽出する手段と、学習パターンデータを、そ
    の構造特徴の同一性に基づいてクラスに分類する手段
    と、所属する全ての学習対象パターンデータが同一のカ
    テゴリであるクラスについて、そのカテゴリ名と構造特
    徴を含む辞書情報を生成する手段と、所属する全ての学
    習対象パターンデータが同一カテゴリであるクラスを除
    いたクラスに関し、クラス別に学習対象パターンデータ
    の特徴ベクトルの空間的学習を行って辞書情報を生成す
    る手段とを具備することを特徴とするパターン辞書作成
    装置。
  17. 【請求項17】 構造特徴として、パターンの輪郭に対
    する準位相的構造表現が抽出されることを特徴とする請
    求項15又は16記載のパターン辞書作成装置。
  18. 【請求項18】 特徴ベクトルの空間的学習を行って辞
    書情報を生成するための前記手段が、対象クラスに属す
    る学習対象パターンデータの特徴ベクトルと認識結果を
    入力する手段と、対象クラスに属する各学習対象パター
    ンデータの特徴べクトルを中心とする近傍領域を求める
    手段と、求められた近傍領域から最大の近傍領域を求
    め、その最大近傍領域に属する特徴べクトルを除いて次
    の最大近傍領域を求める処理を繰り返す手段と、求めら
    れた各最大近傍領域に関し領域中心の特徴ベクトル、領
    域半径及びカテゴリ名を含む辞書情報を生成する手段
    と、生成された辞書情報を出力する手段とを具備するこ
    とを特徴とする請求項15、16又は17記載のパター
    ン辞書作成装置。
  19. 【請求項19】 請求項8記載のパターン辞書作成方法
    により作成された第1のパターン辞書と、該第1のパタ
    ーン辞書の作成のための学習対象パターンの認識結果を
    得るために用いられた第2のパターン辞書と、認識対象
    のパターンデータを入力するための手段と、入力パター
    ンデータの構造特徴及び特徴ベクトルを抽出するための
    手段と、入力パターンの構造特徴及び特徴ベクトルを用
    いて前記第1のパターン辞書及び前記第2のパターン辞
    書とのマッチングを行って認識結果を得るための手段
    と、認識結果を出力するための手段とを具備することを
    特徴とするパターン認識装置。
  20. 【請求項20】 マッチングを行って認識結果を得るた
    めの前記手段が、入力パターンデータの構造特徴を用い
    て前記第1のパターン辞書とのマッチングを行い、この
    マッチングで認識結果を決定できない場合に、入力パタ
    ーンデータの特徴ベクトルを用いて前記第1のパターン
    辞書とのマッチングを行い、このマッチングで認識結果
    が決定できない場合に、入力パターンデータの特徴ベク
    トルを用いて前記第2のパターン辞書とのマッチングを
    行うことを特徴とする請求項19記載のパターン認識装
    置。
  21. 【請求項21】 構造特徴としてパターンの輪郭に対す
    る準位相的構造表現が抽出されることを特徴とする請求
    項19又は20記載のパターン認識装置。
JP15156499A 1999-05-31 1999-05-31 パターン認識方法及び装置、並びに記録媒体 Expired - Fee Related JP4026738B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP15156499A JP4026738B2 (ja) 1999-05-31 1999-05-31 パターン認識方法及び装置、並びに記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP15156499A JP4026738B2 (ja) 1999-05-31 1999-05-31 パターン認識方法及び装置、並びに記録媒体

Publications (2)

Publication Number Publication Date
JP2000339470A true JP2000339470A (ja) 2000-12-08
JP4026738B2 JP4026738B2 (ja) 2007-12-26

Family

ID=15521299

Family Applications (1)

Application Number Title Priority Date Filing Date
JP15156499A Expired - Fee Related JP4026738B2 (ja) 1999-05-31 1999-05-31 パターン認識方法及び装置、並びに記録媒体

Country Status (1)

Country Link
JP (1) JP4026738B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006148878A (ja) * 2004-10-14 2006-06-08 Mitsubishi Electric Research Laboratories Inc 画像中の画素を分類する方法
KR101247220B1 (ko) * 2011-03-10 2013-03-25 서울대학교산학협력단 반복 패턴을 이용한 영상 처리 방법 및 장치
US9911067B2 (en) 2014-05-15 2018-03-06 Ricoh Company, Ltd. Image processing apparatus, method of processing image, and program
JP2018128574A (ja) * 2017-02-08 2018-08-16 日本電信電話株式会社 中間特徴量計算装置、音響モデル学習装置、音声認識装置、中間特徴量計算方法、音響モデル学習方法、音声認識方法、プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006148878A (ja) * 2004-10-14 2006-06-08 Mitsubishi Electric Research Laboratories Inc 画像中の画素を分類する方法
KR101247220B1 (ko) * 2011-03-10 2013-03-25 서울대학교산학협력단 반복 패턴을 이용한 영상 처리 방법 및 장치
US9911067B2 (en) 2014-05-15 2018-03-06 Ricoh Company, Ltd. Image processing apparatus, method of processing image, and program
JP2018128574A (ja) * 2017-02-08 2018-08-16 日本電信電話株式会社 中間特徴量計算装置、音響モデル学習装置、音声認識装置、中間特徴量計算方法、音響モデル学習方法、音声認識方法、プログラム

Also Published As

Publication number Publication date
JP4026738B2 (ja) 2007-12-26

Similar Documents

Publication Publication Date Title
CN107748877B (zh) 一种基于细节点和纹理特征的指纹图像识别方法
JP3155577B2 (ja) 文字認識方法及び装置
US6128410A (en) Pattern matching apparatus and method that considers distance and direction
US6338062B1 (en) Retrieval system, retrieval method and computer readable recording medium that records retrieval program
JP4802176B2 (ja) パターン認識装置、パターン認識プログラム及びパターン認識方法
JP2000339470A (ja) パターン辞書作成方法及び装置、パターン認識方法及び装置、並びに、記録媒体
Soryani et al. Application of genetic algorithms to feature subset selection in a Farsi OCR
JP3095069B2 (ja) 文字認識装置、学習方法および文字認識プログラムを記録した記録媒体
Koga et al. Segmentation of Japanese handwritten characters using peripheral feature analysis
KR20220068357A (ko) 딥러닝 객체 검출 처리 장치
JPH11328309A (ja) 光学的文字読み取り方法とその装置
JP4055974B2 (ja) パターン辞書作成方法及び装置、並びに記録媒体
JP2009259190A (ja) 文字認識プログラムおよび文字認識装置
JP2001092924A (ja) パターン認識方法および装置
JP2957097B2 (ja) パタン認識用辞書作成方法およびパタン認識方法
JP4215385B2 (ja) パターン認識装置、パターン認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
Singh et al. Machine Learning: A Review on Supervised Classification Algorithms and their Applications to Optical Character Recognition in Indic Scripts
JP2868770B2 (ja) パターン辞書の構成方式
JP2866920B2 (ja) 標準パターン作成方法及び装置並びに文字認識装置及び方法
KR930012139B1 (ko) 문자인식을 위한 자획추출방법
JP3659688B2 (ja) 文字認識装置
JPS62271190A (ja) セグメント数字認識方式
JP3760040B2 (ja) 文字認識方法、文字認識装置及び情報記録媒体
JP3754118B2 (ja) パターン認識装置及びパターン認識方法
Samadiani et al. A Modfied Self-organizing Map Neural Network to Recognize Multi-font Printed Persian Numerals (RESEARCH NOTE)

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060529

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060607

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060807

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070131

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070402

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071003

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071004

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101019

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101019

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111019

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121019

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131019

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees