JPH06124349A - パターン学習方法及びパターン学習装置 - Google Patents

パターン学習方法及びパターン学習装置

Info

Publication number
JPH06124349A
JPH06124349A JP4272717A JP27271792A JPH06124349A JP H06124349 A JPH06124349 A JP H06124349A JP 4272717 A JP4272717 A JP 4272717A JP 27271792 A JP27271792 A JP 27271792A JP H06124349 A JPH06124349 A JP H06124349A
Authority
JP
Japan
Prior art keywords
learning
pattern
dictionary
threshold
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP4272717A
Other languages
English (en)
Inventor
Hiroaki Harada
裕明 原田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP4272717A priority Critical patent/JPH06124349A/ja
Publication of JPH06124349A publication Critical patent/JPH06124349A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

(57)【要約】 【目的】 パターン学習方法及びパターン学習装置に係
り、特に文字や図形、音声などのメディアをパターン認
識して自動的にコンピュータ等の内部データに変換する
ときに、パターン認識する対象の辞書を自動的に作成す
るためのものである。 【構成】 文字や図形、音声などのメディアをパターン
認識して自動的にコンピュータ等の内部データに変換
し、パターン認識対象の学習辞書を自動作成し、認識対
象が1つのカテゴリーのみで未知の入力パターンがその
カテゴリーに含まれるか否かを判定する認識装置の学習
方法において、学習時にそのカテゴリーに含まれる正サ
ンプルと、そのカテゴリーに含まれないパターンである
負サンプルとをそれぞれ入力したとき、特徴空間を正サ
ンプルのみを含む領域と、負サンプルのみを含む領域と
に自動的に分離して学習辞書として記憶する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はパターン学習方法及びパ
ターン学習装置に係り、特に文字や図形、音声などのメ
ディアをパターン認識して自動的にコンピュータ等の内
部データに変換する技術分野において、特にパターン認
識する対象の認識辞書を自動作成するための学習方法及
びパターン学習装置に関するものである。
【0002】
【従来の技術】コンピュータを使用して、未知の文字や
図形、音声などのパターン認識技術の中でも最も重要な
課題は、パターンの学習をいかに効率的に行うかという
テーマである。手書き文字認識(OCR)や音声認識の
分野では、一つの認識装置を構成するためにできるだけ
多くの学習サンプルを収集し、それらから膨大な特徴デ
ータを抽出して辞書を作成する。
【0003】しかし現実には必ずしも統計的に十分な数
のサンプルを収集することができない場合や、未知のパ
ターンについて会話的に少数サンプルの学習を行わなけ
ればならない場合もある。
【0004】例えば図形認識の場合では、OCRのよう
に一般に使用される文字パターンだけではなく、ユーザ
が独自に決めたマークや図形も学習、認識しなければな
らない。この場合には多くのサンプルデータを収集する
ことは不可能である。したがって少数のサンプルから認
識辞書を作成する手法が要求されている。またサンプル
の入替えや、追加などが頻繁に行われることを考慮する
と、学習方法が簡単で学習に要する時間が短いことが望
ましい。
【0005】現在、装置化されている認識方式の多く
は、図14に示す如く、比較判定部Cと、学習辞書Dを
設け、学習辞書Dにカテゴリー毎の特徴を格納してお
く。そして入力されたパターンから対象に応じた特徴量
X1、X2・・・を抽出し、それと学習辞書Dの特徴θ
11、θ21・・・との比較により判別を行う。
【0006】比較方法としては、複数の特徴量X1、X
2・・・が、それぞれにあらかじめ決められた閾値内に
入っているか否かで判別する。例えば図12の場合iが
1〜4までのとき、 θ11<X1<θ21 θ12<X2<θ22 θ13<X3<θ23 θ14<X4<θ24 のいずれも成立するとき、認識が成立する。これは工業
用の簡単な形状認識装置などに多く使用されている。
【0007】例えば図15に示す如く、正方形と円形の
2種類の形状を識別する場合、図形の周囲長と面積の2
つの特徴量を選び、閾値範囲を設けて認識を行う。この
判別方法は線形であり、認識対象に応じた認識論理が作
りやすいこと、誤判別の原因が見つけやすいことが利点
である反面、閾値の学習が複雑になる欠点がある。
【0008】
【発明が解決しようとする課題】従来の代表的な学習方
法として、線形分離法、非線形分離法(バックプロパゲ
ーション法)の2つを取り上げ説明する。
【0009】線形分離法は特徴空間を超平面で分割し、
その平面で囲まれた領域を一つの認識カテゴリーに割り
当てる方法である。特徴量をn次元ベクトルXで表現す
ると、(n+1)次元の荷重ベクトルWとの内積値が判
別関数fになる。ここで内積計算ではXはダミー1を追
加して(n+1)次元としている。
【0010】f(x)=WX この手法における学習は、最適な分離ができる荷重Wを
探すことに相当する。Wは特徴空間での1つの超平面を
示す。たいていのパターン認識では特徴量が多く、次元
数nが大きくなるため、線形分離を仮定してもよいが、
少数サンプルの場合には、特徴の次元数が線形分離に十
分か否かを判断することが難しく、いい加減に決めた次
元数では、非線形な分布になる可能性が高い。そのよう
な場合、線形学習はうまく進まないという欠点がある。
さらに学習は漸近計算の反復であるので、学習時間も相
当かかるものと予想される。
【0011】第二の非線形分離法(バックプロパゲーシ
ョン法)は非線形な分離面を自動的に生成する。サンプ
ルを順番にネットワークに提示するだけで、ネットワー
クの荷重が自動更新されて、収束していく。サンプルの
収集以外は人間が学習に関与しなくても済むなど、いく
つかの長所がある反面、学習が収束する保証がない、学
習パラメータ(特に隠れユニット数)の決定が難しいな
ど欠点も多い。
【0012】このように、従来技術に共通した問題点
は、学習の収束条件のあいまいさ、及び学習時間が長い
ことであり、これを解決するパターン学習方法が必要で
ある。
【0013】
【課題を解決するための手段】本発明では、閾値による
認識を次のように定式化する。すなわち、カテゴリーC
と認識するための条件としてn次元の特徴量X1、X2
・・・Xnについて、下式が全部成立することを必要と
する。
【0014】
【数1】
【0015】すなわち、n次元の特徴量について、それ
ぞれ上限/下限閾値を設け、すべての次元の区間内に対
象が入るかどうかを判定する。特徴量によっては上限あ
るいは上限が存在しない場合もあるが、そのときは仮想
的に大きな数M、−Mを用いて同じ形式で記述するもの
とする。
【0016】考え得る最大の大きさの区間を以下では臨
界と呼ぶことにする。またここでは扱う特徴量および次
元数はすべてあらかじめ決められており、学習するのは
カテゴリーごとの上限/下限閾値の値である。
【0017】
【作用】本発明では、認識条件をすべての次元の区間内
に対象とする特徴量が入るか否かというきわめて簡単な
判断で行うことができるので、特別な学習を必要とする
ことなく、簡単に判定できる。
【0018】
【実施例】本発明の一実施例を説明するに先立ち、図2
により本発明の基本的な考え方について説明する。図2
(A)に示すように、カテゴリーAの特徴領域RP(○
印で示す特徴点を有する領域)と、カテゴリーBの特徴
点領域RN(×印で示す特徴点を有する領域)が存在す
る場合、両者の混在領域RCに対しては、図2(B)に
示す如く、カテゴリーAの特徴のみが存在する特徴領域
A2と、カテゴリーBの特徴のみが存在する特徴領域B
2、B3に矩形状に分割する。また特徴点が混在してい
ない特徴領域に対しても、矩形状の領域である特徴領域
A0、A1及びB0、B1にそれぞれ分割する。これに
より識別のときに、この矩形状の領域内に存在している
か否かを判定すればよく、判定がきわめて容易なものと
なる。
【0019】本発明の一実施例を図1にもとづき説明す
る。図1において、1は特徴抽出部、2は閾値学習部、
3は学習辞書、4は閾値比較部である。この図における
閾値学習部2に、本発明の最も特徴的なものがある。
【0020】図1において学習フェイズでは、入力され
た既知のサンプルパターンから複数の特徴量を特徴抽出
部1で、例えば数値として抽出し、後述詳記するよう
に、閾値学習部2において最適な閾値を求める。そして
これにより得られた複数組の閾値データを学習辞書3に
格納する。
【0021】また認識フェイズでは、未知の入力パター
ンから特徴抽出部1が、同様の特徴量を抽出し、それら
の値を学習辞書3内の閾値データと閾値比較部4で比較
する。その結果、すべての閾値条件を満たすパターンを
該当カテゴリーとして認識する。そしてこの認識カテゴ
リーに含まれる場合は眞(カテゴリー)、そうでない場
合は偽を出力する。
【0022】今、最も単純な場合として、認識カテゴリ
ーが1つしかなく、そのカテゴリーに含まれるもの(以
下正サンプルという)の集合と、含まないもの(以下負
サンプル)の集合が与えられているとする。すなわち全
特徴空間を認識カテゴリーの領域と、そうでない領域の
2つに分類する。以下、本発明は、認識カテゴリーが1
つで、このカテゴリーに含まれるか否かを学習する方法
について説明する。
【0023】このように問題を設定したのは、現実のパ
ターン認識装置では、あらかじめ特徴抽出の方法や認識
方法は確定しているが、認識対象に応じて上式の閾値θ
11、θ12・・・を最適設定しなければならない状況
が多いためである。
【0024】上式による問題の定式化により、正サンプ
ル(認識カテゴリーに含めるサンプル)と負サンプル
(認識対象ではないサンプル)が与えられ、この2つの
領域をうまく分離する超直方体を探索すればよい。なお
この超直方体とは境界面がすべて特徴空間の軸に平行な
ものである。ただし、複数の島状となって一つの超直方
体ではカバーできない場合もあるため、このような場合
には複数の超直方体を作成する。すなわち上式の条件判
定を一組の閾値で実行するだけではなく、複数の組につ
いても同様の判定を行って得られた結果を重ねて目的を
達成するようにする。
【0025】従って認識条件を、次のように変形する。 〔カテゴリーCと認識するための条件〕
【0026】
【数2】
【0027】ここでKは一つのカテゴリーを覆っている
超直方体の総数である。すなわち複数の超直方体のいず
れかの領域に含まれれば、そのカテゴリーと判断する。
なお前式において、「直方体1の領域」として示してあ
るのが従来のものであり、残りの領域は本発明により追
加されたものである。
【0028】図3により、前式の判別の手法を説明す
る。図3(A)は複数の閾値の組に対応したK個の比較
判定器4−1、4−2・・・4−Kとこれらの出力をO
Rする判別部5により図1における閾値比較部4を構成
する例を示す。入力された特徴量X1、X2・・・に対
して並列に判定を行うことができる。
【0029】図3(B)の例では1組の比較判定器4′
により比較判定が実行された後、判定結果が真の場合に
は即座にバッファ6内の真値が出力される。しかし偽で
あるときは、偽判定部6が学習辞書3から次の閾値の組
を読み出して判定を繰り返す。学習辞書3が空になった
とき、偽判定部7が偽の信号を出力し、オア回路8がこ
れによりバッファ6内の偽値を最終的な判定値として出
力する。この図3(B)の構成は、組の数Kがあらかじ
めわからない場合や、機構の規模を小さくする場合に有
効である。
【0030】このように用いられる複数の閾値の組を学
習すること、すなわち超直立体を求めるための基本的な
考え方を繰り返すと下記の如く要約される。すなわち、
正サンプルと負サンプルが混在していない領域は適当な
超平面で超立方体を作り、混在している領域はその中を
さらに適当な平面で分割し、正サンプルまたは負サンプ
ルのみからなる小領域に分割する。
【0031】この方法では最悪の場合でも正サンプルあ
るいは負サンプル1個だけからなる超直方体を作った時
点で小領域の分割を停止する。当然、元のサンプルが有
限個なら、有限回数の再帰処理で実行できる。
【0032】図4に、この小領域に分割する本発明の基
本フローを示す。なおこの処理は、図1における閾値学
習部2で行われるものである。すなわち、図4におい
て、初期に設定された特徴空間の超直方体を、正サンプ
ル領域と負サンプル領域を計算して分ける。もし交差し
た領域があれば、その内部を同様に正サンプル領域、負
サンプル領域に分割する。これを繰り返して、正サンプ
ル領域と負サンプル領域が互いに混在しない、素になる
まで領域分割を実行する。このようにして分割された複
数の超直方体領域により閾値の組が生成される。
【0033】具体的には次のような手順で実行する。処
理対象とする特徴空間をn次元、正サンプル集合をP、
負サンプル集合をN、各要素をそれぞれpi、niとす
る。各pi、niはn次元空間内の1点に相当する。
【0034】
【数3】
【0035】niについても同様である。そしてこれら
の点を囲む初期の超直方体を、例えば図5(A)に示す
如く、ROとする。
【0036】まず、図5(A)に示す如く、正サンプル
と負サンプルの分布状況から、それらが混ざり合ってい
る箇所RCと、そうでない箇所RP、RNを下記の如く
分離する。これはそれぞれのサンプルを囲む最小直方体
が重なりを持つか否かにより簡単に判断できる。
【0037】先ず次の領域を求める。 RP=RECT(P) RN=RECT(N) ここでRECTは、与えられた点集合をカバーする最小
超直方体を示す。RP、RNは2つの点で表現された超
直方体である。すなわち、任意の点p1、p2・・・p
m(ここで各piは正サンプル、負サンプルのいずれで
もよい)の集合X=(p1、p2・・・pm)を考える
と、Xに対するRECTは次のように定義される。
【0038】RECT(X)≡(MIN(X),MAX
(X)) MIN(X)≡(min(xil),min(xi2)
・・・,min(xin)) MAX(X)≡(max(xil),max(xi2)
・・・,max(xin)) ただし、 X={p1,p2・・・,pm} pi=(xi1,xi2・・・xin) ところで正サンプルと負サンプルが混在している部分つ
まりRPとRNの重なり部分RCはそれぞれの超直方体
の2点の座標を比較すればよい。
【0039】RC=RP∩RN 重なりを持たなければつまりRC=0ならば、例えば図
5(B)に示す如く、正サンプルと負サンプルは離れた
分布を持つため、正サンプル領域、負サンプル領域それ
ぞれについて適当な大きさの超直方体を作る。実際には
隙間を作らないために、RR、RNを互いに交らない程
度に領域を膨張させ、例えば互いにその中間が境界にな
る程度に膨張させて、閾値区間に余裕を持たせる。
【0040】重なりが存在する場合、つまりRCが零で
なければ、重なっている領域とそうでない領域とに分離
する。さらに次のような領域RCP、RCN、RCP
T、RCNTを求める。
【0041】
【数4】
【0042】このRCPR、RCNTを使用してRP、
RNの領域を最大限まで膨張させる。すなわち次のよう
なRP′、RN′、RC′を求める。
【0043】
【数5】
【0044】ここでRP′はRCPを含む超直方体で、
RC内の負サンプル点を含まない最大の大きさを持つも
のを示す。RN′も同様である。次の性質があることは
自明である。
【0045】
【数6】
【0046】重なっていない領域(RP′−RC′及び
RN′−RC′)を複数の超直方体に分割する。重なっ
ている領域RC′はその中に存在する正サンプルと負サ
ンプルについて同様の重なり判定を行って分離を行う。
そして最後に正サンプル、負サンプルのいずれかのみの
超直方体領域となった時点で処理を終了する。
【0047】また、図6(C)に示す如く、重なり領域
RC′が元の超直方体と同じ大きさになる場合(RC′
=RO)は、適当な箇所で分離平面を作り、強制的に分
割を行う。
【0048】次に前記の各処理を行う、図1における閾
値学習部2の動作を図7にもとづき説明する。 (L0)初めに特徴量の各次元がとりうる最大値/最小
値を臨界Bとして設定する。また学習すべき正サンプ
ル、負サンプルを入力し、領域ROとしてスタックSに
プッシュ(push)する。
【0049】(L1)スタックSから前記プッシュした
領域ROをポップアップ(pupup)する。もしスタ
ックSが空ならば出力テーブルを出力して停止する。空
でなければROの大きさを臨界Bに設定する。
【0050】(L2)次に領域RO内の正サンプルP点
の領域RPと、負サンプルN点の領域PNを求める。領
域RPのみが存在する場合には、領域PRを出力テーブ
ルに登録する(L21)。また領域RNのみが存在する
場合には、領域RNを出力テーブルに登録する(L2
2)。RPもRNも共に存在しなければ前記(L1)に
戻る。
【0051】(L3)RPとRNの共通領域RCを求め
る。共通領域RCが存在しなければ、RPとPNが互い
に分離状態であり、RPとRNを互いに膨張させる(L
31)。膨張したそれぞれをRP′、RN′として出力
テーブルに出力する。
【0052】(L4)正サンプルと負サンプルの混在す
る領域RC内のP領域RCPと、N領域RCNを求め
る。 (L5)RP−RCP(=RCP′)と、PN−RCN
(=RCN′)を求める。
【0053】(L6)RPをRCN′に対して膨張させ
る膨張処理を行う。このとき最大でも臨界Bを超えない
ようにする。同様にRNをRPN′に対して膨張させ
る。このようにして膨張処理したものをRP′、RN′
とする。
【0054】(L7)RP′とRN′の共通領域R
C′、及び分割領域RP1、RN1、・・・を求める分
割処理を行う。分割領域は出力テーブルに登録する。 (L8)もしRC′=ROなら、つまり前記領域ROが
正サンプルと負サンプルの混在した共通領域RC′であ
れば、強制分割処理を行う(L81)。このためRC′
を適当な面で2つに分割して強制分割処理を行う(=R
C1、RC2)。これらRC1とRC2を共にスタック
Sにプッシュする。さもなければRC′をスタックSに
プッシュする。そして前記(L1)に戻る。
【0055】前記処理に必要な、交差判定、膨張処理、
分割処理、強制分割処理等を図8〜図10にもとづき説
明する。図8により交差判定処理を説明する。
【0056】(L1)いま交差判定の対象となる二つの
超直方体をA=(a1、a2)、B=(b1、b2)と
する。ここでa1、a2、b1、b2はそれぞれ超直方
体の最小点、最大点を示している。i=1とおく。ここ
でa1=(a11、a12・・・a1n)である。以下
a2、b1、b2に対しても同様である。
【0057】(L2)第i次元の座標a1i、a2i、
b1i、b2iについて次式の判定を行う。
【0058】
【数7】
【0059】(L3)もしも前記(L2)の判定が不成
立(false)なら交差なしと判定して終了する。さ
もなければ、すなわち成立(true)すれば、i=i
+1として(L2)を反復し、1〜n次元ですべて成立
すれば交差ありとして終了する。
【0060】図9により膨張処理を説明する。 (L1)膨張させる領域をA、膨張を抑制する領域をB
とする。そしてi=1とおく。
【0061】(L2)第i次元のa1iを臨界と同じ値
にする。すなわち第i軸の最小値を与える。 (L3)このように拡張した領域内にBに属する点が含
まれているか否かをチエックし、含まれていればa1i
の値をBに属する点を含まない位置にずらす(L3
1)。含まれていなければa1iの値をBに属する点と
Aに属する点の中点に設定する(L32)。
【0062】(L4)次に前記(L2)と同様にa2i
を臨界と同じ値にする。すなわち第i軸の最大値を与え
る。 (L5)この領域内にBに属する点が含まれているか否
かをチエックし、含まれていなければa2iの値をBに
属する点を含まない位置にずらす(L51)。含まれて
いなければa2iの値をBに属する点とAに属する点の
中点に設定する(L52)。
【0063】(L6)i=i+1として前記L2〜L5
を反復する。図10(A)により分割処理を説明する。 (L1)元の超直方体をA、その重複領域をBとする。
i=1とおく。第i次元の軸について以下の処理を反復
する。
【0064】(L2)Bの第i軸区間がAの第i軸区間
に含まれている場合、すなわち、a1i<b1iかつb
2i<a2iのとき、b1iとb2iを分割平面として
3つの区間〔a1i、b1i〕、〔b1i、b2i〕、
〔b2i、a2i〕に分割する。
【0065】(L3)AとBが交差しているとき、交差
点をCとすると、2つの区間〔a1i、C〕、〔C、a
2i〕に分割する。 (L4)分割平面を境界としてL2あるいはL3で求め
た3ないし2つの超直方体を作る。このうち重複領域を
含む超直方体をA、i=i+1として前記(L2)に戻
る。
【0066】(L5)i=n+1となった時点でAとな
っているのが重複のある超直方体である。その他、途中
で生成された超直方体はすべて正あるいは負サンプルの
み含む領域である。
【0067】図10(B)により強制分割処理を説明す
る。 (L1)強制分割する対象をAとする。Aの各軸の中で
最大の幅を持つ軸jを探す。
【0068】このため次式を演算する。
【0069】
【数8】
【0070】(L2)軸jに沿ったサンプル点の重心g
を求める。すなわち次式を演算する。
【0071】
【数9】ただしN(A)はA内のサンプル点の数であ
る。 (L3)xij=gなるサンプル点が存在しなければg
においてAを分割する。存在する場合は、gはδgだけ
移動させ、同じ判定を繰り返す。なおこのδはあらかじ
め外部から適当に指定される係数とする。
【0072】以上の説明では、認識対象がカテゴリーA
(正サンプルの領域)とカテゴリーB(負サンプルの領
域)のみから成る場合について述べたが、これを一般に
N個のカテゴリーを識別する装置についても、全く同様
の説明ができる。
【0073】すなわち本発明の基本となる交差判定処
理、分割処理、強制分割処理、膨張処理のいずれの処理
においても、N個のカテゴリーを対象にするように拡張
ができることは自明である。
【0074】前記の如く処理した処理例を図11、図1
2、図13に示す。図11(A)は学習しようとする正
サンプル、負サンプルの座標位置を示している。ここで
の例では特徴量はx1、x2の2次元として、サンプル
は図12(A)のように計8個とする。図12(A)に
おいて、No.1〜4は正サンプルであり、No.5〜
8は負サンプルである。今特徴空間の臨界(最大の大き
さ)は、原点0から(100、100)までとする。図
13は学習辞書内のデータの配置例を示す。
【0075】図7の主処理フローに概略を沿って説明す
る。先ず最初にスタックSに初期領域ROを入れる。R
OはNo.1〜8の全サンプルを囲む長方形であり、図
12(B)に示す座標を持つ。
【0076】次に正サンプルの領域RPと負サンプルの
領域RNを求める、この例の場合、前記交差判定によ
り、RPとRNの交差部RCが存在することがわかる。
RP、RN、RC共に空ではないので、RCPとRCN
を求める。RCPとRCNはそれぞれRC内の正サンプ
ル領域と負サンプル領域である。次にRPとRCPとの
差領域RCP′、RNとRCNとの差領域RCN′を求
める。
【0077】RP領域をRCN′に対して膨張させると
RP′となる。これはRP領域をRN領域の中からRC
に含まれる負サンプルを除いたものを対象に膨張させる
ことと同じである。このRP′の最小座標(0、0)は
臨界座標であり、(32、27)は点6、7、8に対し
て最も膨張させた位置である。同様にRN′を作成す
る。
【0078】次にあらためてRP′とRN′の交差部R
C′を求める。さらにRP′、RN′をより小さな長方
形領域に分割する。そうするとRP1、RP2、RN
1、RN2ができる。これらを出力テーブルに記録す
る。RC′をスタックSに入れて、処理の最初に戻る。
【0079】再度スタックSを確認すると空ではないの
で、RC′を次の処理対象としてポップ(pop)す
る。そしてこれまでの処理と同様に点3と5について交
差部の判定や正負サンプル領域の膨張を行う。求めたR
C′はすでに互いに素になるので、これ以上の処理は進
まず、図11(B)に示す如く、計6つの長方形領域が
最終結果として出力される。
【0080】この最終結果は、図12(B)のRC1〜
RC6として示される。これらの長方形領域内には、正
サンプルあるいは負サンプルのみを含み、かつ境界を接
している。この境界線は正負サンプルの丁度中間位置に
存在している。従ってパターン認識時には、RC1、R
C3、RC5の領域に特徴量が含まれるパターンは認識
対象として識別し、RC2、RC4、RC6に含まれる
パターンは認識対象ではないと判定できる。
【0081】
【発明の効果】以上説明したように、本発明には下記の
効果がある。学習は再帰的な処理を基本としており、互
いに素になるまで反復する。従って反復回数は有限であ
り、どのような学習サンプルを与えても必ず学習処理が
停止する。このようなことは従来の線形分離法やバック
プロパゲーション法が保証していないことであり、学習
上の利点である。
【0082】学習は特徴空間での大小比較判定のみを使
用しているので、高速である。このことは従来の学習方
法に比べて大きな利点がある。また学習処理自体が高速
であるため、そのやり直しも簡単である。したがってパ
ターン認識にはつきものである学習サンプリングの追加
や入替え、再学習も極めて容易である。これにより従来
技術が持つ大きな課題を克服できる。
【図面の簡単な説明】
【図1】本発明の一実施例である。
【図2】本発明の基本的説明図である。
【図3】本発明の閾値比較部構成図である。
【図4】本発明の動作手順説明図である。
【図5】本発明における基本概念及び膨張処理概念図で
ある。
【図6】本発明における分割処理及び強制分割処理説明
図である。
【図7】本発明における主処理フローである。
【図8】本発明における交差判定フローである。
【図9】本発明における膨張処理フローである。
【図10】本発明における分割処理フロー及び強制分割
処理フローである。
【図11】本発明におけるデータ処理説明図である。
【図12】本発明における正負サンプルのデータ及びそ
の処理過程説明図である。
【図13】学習辞書の構成例である。
【図14】従来技術における閾値判定方法である。
【図15】特徴量と閾値判定の関係説明図である。
【符号の説明】
1 特徴抽出部 2 閾値学習部 3 学習辞書 4 閾値比較部

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 文字や図形、音声などのメディアをパタ
    ーン認識して自動的にコンピュータ等の内部データに変
    換し、パターン認識対象の学習辞書を自動作成し、認識
    対象が1つのカテゴリーのみで未知の入力パターンがそ
    のカテゴリーに含まれるか否かを判定する認識装置の学
    習方法において、 学習時にそのカテゴリーに含まれる正サンプルと、その
    カテゴリーに含まれないパターンである負サンプルとを
    それぞれ入力したとき、 特徴空間を正サンプルのみを含む領域と、負サンプルの
    みを含む領域とに自動的に分離して学習辞書として記憶
    するようにしたことを特徴とするパターン学習方法。
  2. 【請求項2】 認識対象パターンからあらかじめ決めた
    特徴を数値として抽出する特徴抽出部と、 この複数の特徴から自動的に学習辞書を作成する学習部
    と学習辞書データを格納する学習辞書部と、 学習辞書データを用いて未知パターンの特徴と比較する
    ことにより認識対象か否かを判定する認識部を具備した
    ことを特徴とするパターン学習装置。
  3. 【請求項3】 パターンの認識判定をすべて特徴がある
    決められた閾値の範囲内にあるか否かで判定する閾値比
    較部を認識部として持ち、その閾値を与えられたサンプ
    ルから自動的に学習する閾値学習部を持ち、その学習し
    た閾値データを学習辞書として記憶する学習辞書部を持
    つことを特徴とする請求項2記載のパターン学習装置。
  4. 【請求項4】 1つの認識対象を表す学習辞書が複数組
    の閾値データからなる場合、その閾値データの組の数だ
    けの比較判定部を並列接続し、それぞれの比較判定部に
    学習辞書から異なる組の閾値データを設定し、未知パタ
    ーンの特徴を並列にそれぞれの比較判定部に入力し、そ
    れぞれの比較判定部が異なる閾値判定を実行し、その結
    果を論理和したものを最終判定結果して出力する学習辞
    書部及び認識部を具備することを特徴とする請求項3記
    載のパターン学習装置。
  5. 【請求項5】 1つの認識対象を表す学習辞書が複数組
    の閾値データからなる場合、1つの比較判定部を持ち、
    学習辞書から最初の組の閾値データを比較判定部に設定
    し、未知パターンに対する判定結果が真の場合にはその
    結果を最終結果としてそのまま出力し、判定結果が偽の
    場合には学習辞書内の次の組の閾値データを取り出し、
    比較判定部に設定する動作を反復し、真の判定結果が得
    られるかまたは辞書内の未使用データがもはや存在しな
    いときに、その時点の判定結果を最終結果として出力す
    る学習辞書部と認識部を持つことを特徴とする請求項3
    記載のパターン学習装置。
  6. 【請求項6】 特徴の数だけの次元を持つ特徴空間内に
    おいて、正サンプルの特徴座標の集合と負サンプルの特
    徴座標の集合とを囲む超直方体領域を初期領域として設
    定し、その初期領域内の正サンプル点のみを囲むような
    超直方体領域と、負サンプル点のみを囲む領域とを求
    め、その2つの領域が交差しているか否か判定し、交差
    していなければその2領域を学習辞書として登録し、交
    差しているならばその交差部とそれ以外の領域とに分割
    し、交差部を初期領域とみなして互いに素になるまで判
    定を繰り返し、それ以外の領域は学習辞書として登録す
    る閾値学習部を有することを特徴とする請求項3記載の
    パターン学習装置。
  7. 【請求項7】 1つの認識対象について1つ以上の辞書
    データを持ち、1つの辞書データが特徴の数だけの組か
    らなる閾値データを持ち、各閾値データが1つの特徴に
    ついて最小値と最大値閾値のペアからなり、全体として
    特徴空間内で1つ以上の超直方体領域を認識対象領域と
    して記憶するような学習辞書を有することを特徴とする
    請求項3記載のパターン学習装置。
  8. 【請求項8】 特徴空間において、正サンプル点と負サ
    ンプル点をそれぞれ囲む領域を求め、その交差部が空の
    場合には正サンプル領域と負サンプル領域を互いに交差
    しないように領域を膨張させ、それを辞書として記憶
    し、交差部が空でない場合には交差部内の正負サンプル
    を元の正サンプル領域と負サンプル領域から除いて作成
    した領域を互いに交差しないように膨張させ、交差部と
    それ以外の小領域に分割し、交差部は初期領域として反
    復処理の対象とし、それ以外の小領域を辞書として記憶
    するような閾値学習部を有することを特徴とする請求項
    6記載のパターン学習装置。
  9. 【請求項9】 得られた交差部が初期領域と同じ大きさ
    の領域であるときは、その交差部をある基準に基づいて
    適当な位置で分割して複数の領域を作成し、それぞれ次
    の初期領域として登録するような閾値学習部を有するこ
    とを特徴とする請求項8記載のパターン学習装置。
  10. 【請求項10】 認識対象が複数のカテゴリーであり、
    未知の入力パターンがそのうちどれに含まれるかを判定
    する認識装置の学習機構において、 学習時に各カテゴリーに含まれるサンプルを入力された
    とき、 特徴空間を各カテゴリーのサンプルのみからなる部分領
    域に自動的に分離して学習辞書として記憶することを特
    徴とする請求項2又は3又は4又は5又は6又は7又は
    8又は9に記載のパターン学習装置。
JP4272717A 1992-10-12 1992-10-12 パターン学習方法及びパターン学習装置 Withdrawn JPH06124349A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4272717A JPH06124349A (ja) 1992-10-12 1992-10-12 パターン学習方法及びパターン学習装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4272717A JPH06124349A (ja) 1992-10-12 1992-10-12 パターン学習方法及びパターン学習装置

Publications (1)

Publication Number Publication Date
JPH06124349A true JPH06124349A (ja) 1994-05-06

Family

ID=17517809

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4272717A Withdrawn JPH06124349A (ja) 1992-10-12 1992-10-12 パターン学習方法及びパターン学習装置

Country Status (1)

Country Link
JP (1) JPH06124349A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008059624A1 (fr) * 2006-11-13 2008-05-22 Fujitsu Limited Procédé, programme et dispositif de réalisation d'un modèle de classification/prévision à deux classes
JP5104877B2 (ja) * 2007-12-18 2012-12-19 富士通株式会社 二クラス分類予測モデルの作成方法、分類予測モデル作成のためのプログラムおよび二クラス分類予測モデルの作成装置
CN113450776A (zh) * 2020-03-24 2021-09-28 合肥君正科技有限公司 一种改善婴儿哭声检测模型效果的数据增强方法及其系统
CN117830302A (zh) * 2024-03-04 2024-04-05 瀚依科技(杭州)有限公司 肺段分割的优化方法及装置、电子设备和存储介质

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008059624A1 (fr) * 2006-11-13 2008-05-22 Fujitsu Limited Procédé, programme et dispositif de réalisation d'un modèle de classification/prévision à deux classes
JPWO2008059624A1 (ja) * 2006-11-13 2010-02-25 富士通株式会社 2クラス分類予測モデルの作成方法、分類予測モデル作成のためのプログラムおよび2クラス分類予測モデルの作成装置
US7725413B2 (en) 2006-11-13 2010-05-25 Fujitsu Limited Generating two-class classification model for predicting chemical toxicity
JP4985653B2 (ja) * 2006-11-13 2012-07-25 富士通株式会社 2クラス分類予測モデルの作成方法、分類予測モデル作成のためのプログラムおよび2クラス分類予測モデルの作成装置
KR101232945B1 (ko) * 2006-11-13 2013-02-13 후지쯔 가부시끼가이샤 2클래스 분류 예측 모델의 작성 방법, 분류 예측 모델 작성을 위한 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체 및 2클래스 분류 예측 모델의 작성 장치
JP5104877B2 (ja) * 2007-12-18 2012-12-19 富士通株式会社 二クラス分類予測モデルの作成方法、分類予測モデル作成のためのプログラムおよび二クラス分類予測モデルの作成装置
CN113450776A (zh) * 2020-03-24 2021-09-28 合肥君正科技有限公司 一种改善婴儿哭声检测模型效果的数据增强方法及其系统
CN117830302A (zh) * 2024-03-04 2024-04-05 瀚依科技(杭州)有限公司 肺段分割的优化方法及装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
Lai et al. Detection of dimension sets in engineering drawings
Hodgson Reducing the computational requirements of the minimum-distance classifier
US5267332A (en) Image recognition system
CN106022254A (zh) 图像识别技术
JP3709803B2 (ja) パターン照合装置とそのパターン照合方法、及びパターン照合プログラム
CN111553351A (zh) 一种基于语义分割的场景任意形状的文本检测方法
Aksoy et al. An industrial visual inspection system that uses inductive learning
JPH06124349A (ja) パターン学習方法及びパターン学習装置
Chi et al. Separation of single-and double-touching handwritten numeral strings
JPH10143613A (ja) パタン認識方法
Fu et al. Effective classification of planar shapes based on curve segment properties
Foggia et al. Combining statistical and structural approaches for handwritten character description
Kasimov et al. Vectorization of raster mechanical drawings on the base of ternary segmentation and soft computing
Guimaraes et al. A new automatic circular decomposition algorithm applied to blood cells image
Jobaneh Fingerprint recognition using markov chain and kernel smoothing technique with generalized regression Neural network and adaptive resonance theory with mapping
Cheng et al. Recognition of broken and noisy handwritten characters using statistical methods based on a broken-character-mending algorithm
EP0519737A2 (en) Image recognition system
De Jesus et al. ECIR-an electronic circuit diagram image recognizer
Izumi et al. Characters recognition method based on vector field and simple linear regression model
CN116416214A (zh) 产品缺陷识别方法、装置及设备
Bezerra et al. A hierarchical immune-inspired approach for text clustering
Espelid A Raster-to-Vector Conversion Concept Based on Industrial Requirements.
Mokhtarian et al. Efficient curvature-based shape representation for similarity retrieval
JPH07200738A (ja) 文字認識方法
Wong Design of a realtime high speed recognizer for unconstrained handprinted alphanumeric characters

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20000104