JPH07105372A - パターン認識装置および方法 - Google Patents

パターン認識装置および方法

Info

Publication number
JPH07105372A
JPH07105372A JP5250829A JP25082993A JPH07105372A JP H07105372 A JPH07105372 A JP H07105372A JP 5250829 A JP5250829 A JP 5250829A JP 25082993 A JP25082993 A JP 25082993A JP H07105372 A JPH07105372 A JP H07105372A
Authority
JP
Japan
Prior art keywords
category
pattern
similarity
vector
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5250829A
Other languages
English (en)
Other versions
JP2880383B2 (ja
Inventor
Tatsuo Makino
辰夫 牧野
Toru Yamashita
透 山下
Masanao Wada
正尚 和田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kawasaki Heavy Industries Ltd
Original Assignee
Kawasaki Heavy Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kawasaki Heavy Industries Ltd filed Critical Kawasaki Heavy Industries Ltd
Priority to JP5250829A priority Critical patent/JP2880383B2/ja
Publication of JPH07105372A publication Critical patent/JPH07105372A/ja
Application granted granted Critical
Publication of JP2880383B2 publication Critical patent/JP2880383B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

(57)【要約】 【目的】 パターン識別の誤認識率を低減し、識別精度
の高いパターン認識装置および方法を提供する。 【構成】 特徴抽出手段2によって抽出された特徴ベク
トルと、識別手段3から出力される補正カテゴリベクト
ルに基づいて特徴想起手段5によって想起された特徴ベ
クトルとの類似度Lを、類似度算出手段6によって算出
する。識別結果判定手段4は、算出された類似度Lをレ
ベル弁別し、類似する度合が大きい場合にのみ、識別手
段3から出力された識別結果を正しいものとして出力手
段7に出力する。したがって未知パターンや大きなノイ
ズが重畳したパターンなどに対する識別結果を棄却する
ことができ、誤認識を著しく低減させることができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、画像や音声などの入力
パターンを、複数の予め定めた種類のカテゴリのどのカ
テゴリに属するかを識別するパターン認識装置および方
法に関する。
【0002】
【従来の技術】図10は、典型的な従来例であるパター
ン認識装置41の構成を示すブロック図である。画像や
音声などの入力パターンは、特徴抽出手段42に与えら
れる。特徴抽出手段42は、入力パターンからそのパタ
ーンを特徴づける特徴量を抽出する。特徴量とは、たと
えば画像であれば、画像パターンをより簡潔に表現し、
後述する識別に用いられる本質的な情報のことである。
抽出された特徴量を要素とする特徴ベクトルは、識別手
段43に与えられる。
【0003】識別手段43は、入力された特徴ベクトル
に基づいて、前記入力パターンが複数の予め定めた種類
のカテゴリのどのカテゴリに属するかを表現するカテゴ
リベクトルを算出して出力する。識別手段43は、特徴
ベクトルとカテゴリベクトルとの関係を予め学習させた
ニューラルネットワークで実現される。算出されたカテ
ゴリベクトルは、識別結果判定手段44に与えられる。
識別結果判定手段44は、与えられたカテゴリベクトル
に基づいて、入力パターンが属するカテゴリを決定し、
識別結果として出力する。識別結果は、出力手段45に
与えられる。出力手段45は、たとえばCRT(陰極線
管)などの表示装置で実現され、識別結果を外部(操作
者)に出力(報知)する。
【0004】前記識別手段43に用いられるニューラル
ネットワークとしては、たとえば、公知の技術であるバ
ックプロパゲーションニューラルネットワーク(以下、
「BPNN」と略称する)が使用される。このBPNN
については、「NATURE vol.323 9 p536-553 (Oct 1986)
Learning Representations by backpropagationerror
s」に述べられている。
【0005】BPNNは、入力層、出力層、および1つ
または複数の中間層から成り、これらの各層は複数のノ
ード群で構成される。ニューラルネットワークによる識
別では、たとえばニューラルネットワークの出力層の各
ノードを識別させたいカテゴリに1対1で対応させた一
般的な構成の場合、出力層を構成する複数のノードの中
で最大値を出力しているノードに対応したカテゴリを識
別結果としている。
【0006】
【発明が解決しようとする課題】しかしながら、上述の
パターン認識装置41は、入力パターンをいずれかのカ
テゴリに強制的に分類するため、識別手段43からのカ
テゴリベクトルに基づく識別結果を棄却する何らかの手
段が必要である。この点を考慮して、識別結果を棄却す
る信号識別装置が、特開平4−294444号公報に開
示されている。この信号識別装置では、識別手段を構成
するニューラルネットワークの出力層を構成する各ノー
ドの中の最大値を、予め設定した閾値と比較し、閾値を
超えたときはそのノードに対応したカテゴリを識別結果
とし、閾値以下のときには識別結果の信頼度は低いとし
て識別結果を棄却している。上記公開公報においては、
識別手段を構成するニューラルネットワークの出力を処
理し、識別結果の信頼性を判定する方法がいくつか記載
されている。
【0007】しかしながら、BPNNのようなシグモイ
ド関数を用いた層状のニューラルネットワークでは、そ
の出力値に閾値を設けて識別結果を判定することはでき
ないことが知られている。これは、たとえば「電子情報
通信学会春季大会vol6 p35 (1992)AIC情報量基準を用い
たクラスタリング形ニューロの最適化」に述べられてい
る。
【0008】また上述のことは、実験からも確認されて
いる。図11および図12は、上述の従来技術による識
別結果の出力例を示す図である。ここでは、航空機のシ
ルエット画像から航空機の機種を識別する画像認識装置
の場合を示している。図11は未知パターン46を識別
した場合を示しており、図12は画像の一部が欠落した
機種A11のパターン47を識別した場合を示してい
る。
【0009】図11において、未知パターン46の識別
結果は識別結果表示欄48に表示され、識別手段43か
らの出力であるカテゴリベクトルはカテゴリベクトル表
示欄49に表示される。表示欄49の表示内容は下記の
表1に示されている。
【0010】
【表1】
【0011】未知パターン46を識別した場合、上述の
パターン識別装置41では、未知パターンとは識別せず
に、機種A9と識別している。これは、上記表1に示さ
れているように、カテゴリベクトルの要素のうち、最大
値0.997469は他の値に比べて充分大きく、また
他の数値は最大値に比べて非常に小さい値であるため、
表1に示すカテゴリベクトルに基づいて識別結果を判定
した場合、機種A9と誤って認識してしまう。
【0012】また図12では、画像の一部が欠落した機
種A11のパターン47を識別させている。この場合の
カテゴリベクトルは、下記の表2に示されている。
【0013】
【表2】
【0014】図12の場合は、本来は機種A11または
未知パターンとして識別させたいが、カテゴリベクトル
の要素のうち、最大値0.984345は他の値に比べ
て充分大きく、それに比べて他の数値は非常に小さいた
め、機種A2と誤って識別している。
【0015】このように、カテゴリベクトルを構成する
数値のみに基づいて、絶対的にあるいは相対的に識別結
果を判定した場合であっても、最大値が他の数値に比べ
て充分大きく、かつそれに比べて他の数値が充分に小さ
い場合は、入力パターンを誤って認識・識別してしま
う。
【0016】パターン識別装置において、未知パターン
を棄却できる能力は、実用的なパターン認識の意味から
も重要である。特に、上述したように入力パターンが画
像であったり、音声などであったりする場合には、使用
範囲を限定しない限り、どのような入力がなされるかが
わからず、上記未知パターンの棄却能力は非常に重要で
ある。
【0017】このように、従来のパターン識別装置で
は、どのカテゴリにも属しない未知パターン、部分的に
画像が欠落したパターン、クラッタなどの大きなノイズ
が重畳したパターンなどに起因する誤認識が非常に多く
発生し、識別精度が著しく劣化することが問題となって
いる。
【0018】本発明の目的は、上述の問題点を解決し、
パターン識別の誤認識率を低減し、識別精度の高いパタ
ーン認識装置および方法を提供することである。
【0019】
【課題を解決するための手段】本発明は、入力パターン
を複数の予め定めた種類のカテゴリに識別する識別手段
と、前記識別手段からの出力カテゴリに基づいて、入力
パターンを想起する想起手段と、前記入力パターンと前
記想起手段からのパターンとを比較してパターンの類似
度を算出する算出手段と、前記算出手段からの類似度を
レベル弁別し、類似度が高いとき、前記識別手段からの
出力カテゴリを正しいものとして出力する判定手段とを
含むことを特徴とするパターン認識装置である。
【0020】また本発明は、入力パターンから、パター
ンを特徴づける特徴量を要素とする特徴ベクトルを算出
する特徴抽出手段と、前記特徴抽出手段からの特徴ベク
トルに基づいて、入力パターンが複数の予め定めた種類
のカテゴリのどのカテゴリに属するかを表現するカテゴ
リベクトルを算出する識別手段と、前記識別手段からの
カテゴリベクトルに基づいて、特徴ベクトルを算出する
特徴想起手段と、前記特徴抽出手段からの特徴ベクトル
と、前記特徴想起手段からの特徴ベクトルとに基づい
て、両ベクトルの類似度を算出する算出手段と、前記算
出手段からの類似度をレベル弁別し、類似度が高いと
き、前記識別手段からのカテゴリベクトルによって表現
されるカテゴリを識別結果として出力する判定手段とを
含むことを特徴とするパターン認識装置である。
【0021】また本発明は、入力パターンを複数の予め
定めた種類のカテゴリに識別するステップと、識別した
カテゴリに基づいて、入力パターンを想起するステップ
と、前記入力パターンと想起されたパターンとを比較し
てパターンの類似度を算出するステップと、算出された
類似度をレベル弁別し、類似度が高いとき識別したカテ
ゴリを正しいものとして出力するステップとを含むこと
を特徴とするパターン認識方法である。
【0022】
【作用】本発明に従えば、入力パターンは識別手段によ
って複数の予め定めた種類のカテゴリに識別され、出力
カテゴリは想起手段および判定手段に与えられる。想起
手段では、出力カテゴリに基づいて入力パターンが想起
され、この想起された入力パターンは算出手段に与えら
れる。算出手段では、入力パターンと前記想起手段によ
って想起された入力パターンとを比較し、類似度が算出
され、算出された類似度は判定手段に与えられる。判定
手段は、算出された類似度をレベル弁別し、類似度が高
いとき、前記識別手段からの出力カテゴリを正しいもの
として出力する。
【0023】また本発明に従えば、パターンが入力され
ると、特徴抽出手段によって入力パターンからパターン
を特徴づける特徴量を要素とする特徴ベクトルを算出す
る。特徴ベクトルは、識別手段および算出手段に与えら
れる。識別手段では、与えられる特徴ベクトルに基づい
て、入力パターンが複数の予め定めた種類のカテゴリの
どのカテゴリに属するかを表現するカテゴリベクトルを
算出し、特徴想起手段と判定手段に与える。特徴想起手
段では、前記識別手段から与えられるカテゴリベクトル
に基づいて、特徴ベクトルが算出され、算出された特徴
ベクトルは算出手段に与えられる。算出手段では、前記
特徴抽出手段からの特徴ベクトルと、前記特徴想起手段
からの特徴ベクトルとに基づいて、両ベクトルの類似度
が算出され、算出された類似度は判定手段に与えられ
る。判定手段では、算出された類似度をレベル弁別し、
類似度が高いときは前記識別手段から与えられるカテゴ
リベクトルによって表現されるカテゴリを正しい識別結
果として出力する。
【0024】さらに本発明に従えば、入力パターンは複
数の予め定めた種類のカテゴリに識別され、識別された
カテゴリに基づいて入力パターンが想起される。続いて
入力パターンと想起されたパターンとを比較してパター
ンの類似度が算出され、算出された類似度をレベル弁別
し、類似度が高いときは識別したカテゴリを正しいもの
として出力する。
【0025】
【実施例】図1は、本発明の一実施例であるパターン認
識装置1の構成を示すブロック図である。入力パターン
は、特徴抽出手段2に与えられる。特徴抽出手段2は、
入力パターンから識別に用いる特徴量を抽出し、この特
徴量を要素とする特徴ベクトルを出力する。出力された
特徴ベクトルは、識別手段3および類似度算出手段6に
与えられる。識別手段3は、たとえばニューラルネット
ワークを含んで構成され、特徴ベクトルをカテゴリベク
トルに変換して出力するとともに、後述する補正によっ
て得られる補正カテゴリベクトルを出力する。本実施例
では、特徴ベクトルは6要素から成り、カテゴリベクト
ルおよび補正カテゴリベクトルは11要素から成る。カ
テゴリベクトルは、識別結果判定手段4に与えられ、補
正カテゴリベクトルは識別結果判定手段4および特徴想
起手段5に与えられる。
【0026】特徴想起手段5は、与えられた補正カテゴ
リベクトルに基づいて、当該補正カテゴリベクトルによ
って示されるカテゴリに属する標準的な特徴ベクトルを
想起する。想起された特徴ベクトルは、類似度算出手段
6に与えられる。類似度算出手段6は、前記特徴抽出手
段2からの特徴ベクトルと、前記特徴想起手段5からの
特徴ベクトルとに基づいて、両ベクトルの類似度Lを算
出する。算出された類似度Lは、識別結果判定手段4に
与えられる。
【0027】識別結果判定手段4は、前記識別手段3か
らのカテゴリベクトルと、前記類似度算出手段6からの
類似度Lとに基づいて、識別結果を判定して出力する。
判定は、類似度Lの大小に基づいて実行され、類似度L
が高いときだけカテゴリベクトルによって示される特定
のカテゴリを識別結果として出力する。識別結果は、出
力手段7に与えられる。出力手段7は、たとえばCRT
などの表示装置および音声合成装置を含んで構成され、
識別結果を外部(操作者)に出力(報知)する。
【0028】このように、入力パターンから抽出された
特徴ベクトルと、識別手段3によって変換・補正された
補正カテゴリベクトルに基づいて想起された特徴ベクト
ルとに基づいて類似度Lを算出し、識別手段3からのカ
テゴリベクトルが信頼できるか否かを判定して最終的な
識別結果を出力するようにし、これによって誤認識を防
いでいる。
【0029】まず特徴抽出手段2について説明する。前
述したように、特徴抽出手段2は、入力パターンから識
別に用いる特徴量を抽出して、特徴ベクトルとして出力
する。ここで画像の特徴量について説明する。画像の特
徴とは、画像パターンをより簡潔に表現し、識別にとっ
て本質的な情報のことである。画像の特徴は、画像を構
成する部分的な画像パターンである1次特徴(エッジパ
ターン、領域パターンなど)と、1次特徴から計測され
る2次特徴とに分けられる。たとえば、端点、分岐点な
どは1次特徴であり、それらの端点および分岐点などの
位置、個数などは2次特徴である。本実施例では2次特
徴を識別手段3に入力している。
【0030】実際の画像認識に使用される2次特徴とし
ては、領域パターン(面)の2次特徴量が用いられる場
合が多い。2次特徴量の一例としては、面積、周囲長、
外接長方形の幅および高さ、コンパクト比(=縦横
比)、複雑度(=(周囲長)2/面積)、領域内の濃度
平均および濃度分散、濃度ヒストグラム、モーメント、
フーリエ記述子(偏角関数のフーリエスペクトル)、テ
クスチャ特徴(濃度値、濃度勾配の大きさ、方向の平均
値や分散、2次元フーリエ変換の空間周波数スペクトル
による特徴量、共起行列に基づく特徴量など)、位相幾
何学的特徴(穴の数、オイラー数など)などが挙げられ
る。
【0031】本実施例のパターン認識装置1では、画像
認識に有効と考えられる特徴量の1つとして、不変モー
メント特徴を用いる。不変モーメントは、1962年に
Huによって提案された特徴量であり、広く用いられて
いる。
【0032】不変モーメントの最大の性質は、画像パタ
ーンの並進、伸縮、平面内での回転に対して不変なこと
であり、これらの幾何学的変換に依存しない画像認識が
可能となる。不変モーメントについては、たとえば「NA
ECON vol.2 p743-749 (May 1991) Effect of noise in
moment invariant neural network aircraftclassifica
tion」に述べられている。以下、不変モーメント特徴の
導出について説明する。
【0033】不変モーメント特徴の原型となるモーメン
ト特徴は、画像の濃度値をf(x,y)で表すと次式で
与えられる。
【0034】
【数1】
【0035】ここでp,qは0以上の整数 位置不変性は、式(1)を重心位置からのモーメント式
に変更することで得られる。
【0036】
【数2】
【0037】ただしxa=m10/m00,ya=m01/m
00 サイズ不変性は、式(2)を正規化することで得られ
る。
【0038】 ηpq = μpq/μ00 (p+q+2)/2 …(3) 回転不変性は、低次の成分を組合わせることで得られ、
最終的な不変モーメント特徴は次式で表される。
【0039】 I1 = η20+η02 …(4) I2 =(η20−η022+4η11 2 …(5) I3 =(η30−3η122+(η03−3η212 …(6) I4 =(η30+η122+(η03+η212 …(7) I5 =(η30−3η12)(η30+η12){(η30+η122−3(η21+ η032}+(η03−3η21)(η03+η21){(η03+η212 −3(η12+η302} …(8) I6 =(η20−η02){(η30+η122−(η03+η212} +4η11(η30+η12)(η03+η21) …(9) I7 =(3η21−η03)(η30+η12){(η30+η122−3(η03+ η212}−(3η12−η30)(η03+η21){(η03+η212 −3(η12+η302} …(10) 7次以降の高次成分は、非常に小さいので導かれていな
い。本実施例では上記不変モーメント特徴のうち、I1
〜I6までを用い、これらの特徴量を要素とするベクト
ルを特徴ベクトルと称する。
【0040】次に、識別手段3および特徴想起手段5に
ついて説明する。本実施例においては、識別手段3およ
び特徴想起手段5は、共にニューラルネットワークを含
んで構成されている。以下、図2を参照してニューラル
ネットワークについて説明する。
【0041】図2は、ニューラルネットワーク11の概
略的構成を示す図である。ニューラルネットワーク11
は、上述のBPNNであり、入力層12、中間層13お
よび出力層14とで構成される。入力層12は、複数の
ノードNI1〜NImで構成される。中間層13は、1
または複数の層構造であり、各層はそれぞれ複数のノー
ドNMで構成される。出力層14は、複数のノードNO
1〜NOnで構成される。前記入力層12および出力層
14を構成する各ノードの数は、入力される数値の数お
よび出力すべき数値の数に対応して決定される。本実施
例では特徴ベクトルは6つの要素から成り、またカテゴ
リベクトルは11の要素から成る。したがって、識別手
段3にニューラルネットワーク11を用いる場合、入力
層12は6つのノードNI1〜NI6で構成され、出力
層14は11個のノードNO1〜NO11で構成され
る。また特徴想起手段5にニューラルネットワーク11
を用いた場合、入力層12は11個のノードNI1〜N
I11で構成され、出力層14は6個のノードNO1〜
NO6で構成される。本実施例では中間層13は1層と
し、構成するノードの数は経験的に10とした。
【0042】図3は、識別手段3の機能を説明するため
の図である。識別手段3は、特徴ベクトル(If1,I
f2,…If6)が入力されると、カテゴリベクトル
(C1,C2,…,C11)を出力する。識別手段3を
構成するニューラルネットワークは、予め特徴ベクトル
とカテゴリベクトルとの関係を学習させてある。カテゴ
リベクトルは、識別したいカテゴリをニューラルネット
ワークの出力層のノードの状態で表現したものである。
出力層のノードと識別したいカテゴリとを1対1に対応
させている。識別手段3を構成するニューラルネットワ
ークの学習は、たとえば出力層の4番目のノードに対応
したカテゴリを学習させるときは、特徴ベクトルとして
下記の表3に示すベクトルを与えるとともに、教師信号
として下記の表4に示されるカテゴリベクトルを与え
る。
【0043】
【表3】
【0044】
【表4】
【0045】図4は、特徴想起手段5の機能を説明する
ための図である。特徴想起手段5は、カテゴリベクトル
(C1,C2,…,C11)が入力されると、特徴ベク
トル(Of1,Of2,…,Of6)を出力する。特徴
想起手段5を構成するニューラルネットワークは、予め
カテゴリベクトルと特徴ベクトルとの関係を学習させて
ある。ニューラルネットワークの学習は、カテゴリベク
トルとして下記の表5に示すベクトルを与えるととも
に、教師信号として下記の表6に示される特徴ベクトル
を与えることによって実現される。
【0046】
【表5】
【0047】
【表6】
【0048】図5は、識別結果判定手段4の概略的構成
を示すブロック図である。識別結果判定手段4は、処理
手段21、レベル弁別手段22および基準値出力手段2
3を含んで構成される。処理手段21は、識別手段3か
ら与えられる補正カテゴリベクトルを、前記レベル弁別
手段22からの弁別結果に基づいて処理した後、最終的
な識別結果として出力する。識別結果には、補正前のカ
テゴリベクトルが含まれる。レベル弁別手段22は、類
似度算出手段6からの類似度Lと、基準値出力手段23
からの予め定める基準値とをレベル弁別し、類似度Lが
大きい場合(類似する度合が大きい場合)は識別結果が
正しいことを表す信号を処理手段21に出力する。
【0049】続いて類似度算出手段6について説明す
る。類似度算出手段6は、特徴抽出手段2によって抽出
された特徴ベクトルと、特徴想起手段5によって想起さ
れた特徴ベクトルとの類似度Lを算出する。類似度Lと
は、2つのベクトルがどれくらい近似しているかを表す
度合であり、種々の計算方法が考えられる。したがっ
て、計算方法によって、類似度Lの値が大きければ近似
している場合と、類似度Lの値が小さければ近似してい
る場合とがある。類似度Lは、たとえば下記の数式(1
1)に従って算出される。
【0050】
【数3】
【0051】ただし、fmi=min(│Ifi│,│
Ofi│) 上記類似度Lは、本願発明者が任意に作成した評価関数
である。この関数は、特徴ベクトルの各成分の相対誤差
の総和を示している。上記式(11)において、fmi=
0のときはその項は無視して計算する。
【0052】たとえば、(If1,If2,If3,I
f4,If5,If6)=(1,2,3,4,5,6)
と、(Of1,Of2,Of3,Of4,Of5,Of
6)=(2,1,3,2,0,2)との類似度Lは、
【0053】
【数4】
【0054】となる。
【0055】類似度Lとしては、下記数式(12)によ
って算出される類似度Laを用いてもよいし、下記の数
式(13)によって算出されるユークリッド距離Lbを
用いてもよいし、また下記の数式(14)によって算出
される内積Lcを用いてもよい。
【0056】
【数5】
【0057】 Lb={(If1−Of1)2+(If2−Of2)2+(If3−Of3)2 +(If4−Of4)2+(If5−Of5)2+(If6−Of6)21/2 …(13) Lc=If1・Of1+If2・Of2+If3・Of3+If4・Of4 +If5・Of5+If6・Of6 …(14) さらに類似度Lとして、たとえばマンハッタン距離、角
度などを用いてもよい。
【0058】図6は、出力手段7の出力例を示す図であ
る。出力手段7を構成する表示装置の表示画面が図6に
示されている。出力手段7には、入力パターンとして航
空機のシルエット画像であるパターン31が表示され、
パターン31の識別結果が識別結果表示欄32に表示さ
れるとともに、前記識別手段3から出力されるカテゴリ
ベクトルと、カテゴリベクトルの各要素に対応するカテ
ゴリである機種名とがカテゴリベクトル表示欄33に表
示される。パターン認識装置1の使用者は、出力手段7
の出力結果を見ることによって入力パターンの識別結果
を知ることができる。音声合成装置によって識別結果を
音響化して出力してもよい。
【0059】図7は、パターン認識装置1の動作を説明
するフローチャートである。ここでは類似度Lとしてベ
クトルのユークリッド距離Lbを用いた場合を説明す
る。ステップa1では、特徴抽出手段2によって入力パ
ターンから特徴量が抽出され、特徴ベクトルが算出され
る。ここでは、たとえば下記の表7に示される入力特徴
ベクトルが算出された場合を想定して説明する。
【0060】
【表7】
【0061】ステップa2では、識別手段3を構成する
ニューラルネットワークによってカテゴリベクトルが算
出される。ここでは、下記の表8に示すカテゴリベクト
ルが算出されたものとする。
【0062】ステップa3では、識別手段3においてニ
ューラルネットワークによって算出されたカテゴリベク
トルの中から最大の値を持つカテゴリを検索する。これ
は、カテゴリベクトルの各要素の値を相互に比較するこ
とで簡単に見つけることができる。検索後、表8に示す
ように、最大カテゴリに対応する値を1.0とし、他の
値を0.0とした補正カテゴリベクトルを求める。
【0063】
【表8】
【0064】ステップa4では、識別手段3から出力さ
れる補正カテゴリベクトルを特徴想起手段5に与えるこ
とによって、検索された最大カテゴリの標準的な特徴ベ
クトルを想起する。ここでは前記表7に示される想起特
徴ベクトルが想起されたものとする。
【0065】ステップa5では、想起した特徴ベクトル
と算出した特徴ベクトルとの類似度であるユークリッド
距離Lbが算出される。
【0066】ステップa6では、識別結果判定手段4が
備えるレベル弁別手段22において類似度のレベル弁別
が行われる。すなわち算出された距離Lbが予め定める
閾値以下であるかどうかが判断される。判断が肯定の場
合はステップa7に進み、判断が否定の場合はステップ
a8に進む。
【0067】ステップa7では、距離Lbが閾値以下の
場合であるので、想起した標準的な特徴ベクトルと算出
した特徴ベクトルとは類似する度合が高く、ニューラル
ネットワークによる識別結果を信頼できるものと判断し
て、最大カテゴリを識別結果として出力する。すなわち
前記表8に示されるカテゴリベクトルに基づいて、前記
の表8に示す識別結果を出力する。
【0068】ステップa8では、距離Lbが閾値を超え
た場合であり、想起した標準的な特徴ベクトルと算出し
た特徴ベクトルとは類似する度合が低く、ニューラルネ
ットワークによる識別結果は信頼できないと判断して、
識別結果を棄却し、未知パターンとしての識別結果を出
力する。
【0069】たとえば、下記の表9に示される入力特徴
ベクトルが抽出されて識別手段3に入力された場合、識
別手段3からは表10に示されるカテゴリベクトルおよ
び補正カテゴリベクトルが出力される。表10に示され
る補正カテゴリベクトルを特徴想起手段5に与えること
によって表9に示される想起特徴ベクトルが想起され
る。この場合、表9に示される入力特徴ベクトルと想起
特徴ベクトルとの類似する度合は低いため、識別結果判
定手段4は識別手段3の識別結果を棄却し、表10に示
される識別結果を出力する。
【0070】
【表9】
【0071】
【表10】
【0072】ここで、表10に示されるカテゴリベクト
ルに対して、前述の公開公報に開示されている棄却方法
を適用した場合、最大値0.997383が他の数値に
比べて充分大きいため、識別結果は棄却されずに、カテ
ゴリC9を識別結果として出力し、誤認識が発生する。
しかしながら、本実施例では、当該識別結果は棄却さ
れ、誤認識は発生しない。
【0073】ステップa9では、出力手段7によって識
別結果が出力される。識別結果の出力は、表示装置への
表示および音声合成装置による発声などによって実現さ
れる。
【0074】図8および図9は、パターン認識装置1で
識別結果を棄却したときの出力例を示す図である。図8
および図9は、従来技術で説明した図11および図12
にそれぞれ対応している。図8は、未知パターン46を
識別させた場合であり、識別結果表示欄32には「未知
パターン」と表示される。カテゴリベクトル表示欄33
には、前述の表1に示される内容が表示される。
【0075】図9は、機種A11の一部が欠落したパタ
ーン47を識別させた場合であり、未知パターン46の
場合と同様に識別結果表示欄32には「未知パターン」
と表示される。カテゴリベクトル表示欄33には、前述
の表2に示される内容が表示される。
【0076】ここでは、下記表11に示される入力特徴
ベクトルおよび想起特徴ベクトルに基づいて、前記数式
(11)に従って類似度L=7.60が算出される。予
め定めた閾値は、ここでは経験的に2.5に設定されて
いる。したがって、識別手段3による識別結果は棄却さ
れる。
【0077】
【表11】
【0078】このように、従来のパターン認識装置1で
は複数のカテゴリの中のいずれかの機種として認識され
ていたパターンが未知パターンとして認識されており、
パターン認識の精度が向上している。
【0079】以上のように本実施例によれば、実際の入
力パターンと想起された入力パターンとの類似度に基づ
いて識別結果を判定するので、未知パターンや大きなノ
イズが重畳したパターンなどに対する識別結果を棄却す
ることができ、誤認識の発生を著しく低減することがで
きる。これによって精度の高いパターン認識を実現する
ことができる。
【0080】また識別手段3および特徴想起手段5にぞ
れぞれニューラルネットワークを使用しているため、高
速かつ汎化性の高いパターン認識を実現することができ
る。さらに、抽出した特徴量と分類させたいカテゴリと
の間のロジックを考えることなく、事例の学習によりそ
れを獲得することができる。このため、識別対象を変更
してもアルゴリズムを新たに考えたり変更したりする必
要がなく、事例を用意し、ニューラルネットワークに学
習させるだけで対応させることができる。このことは特
徴想起手段5についても同様である。このように主要な
認識部分にニューラルネットワークを用いるので、ニュ
ーラルネットワークが持つ、高速処理、汎化能力、事例
学習による入出力特性の獲得、フォールトトレランス性
などの性質を持ったパターン認識装置を実現することが
できる。
【0081】なお、識別手段3および特徴想起手段5と
して、カテゴリ毎に標準的な特徴ベクトルをルックアッ
プテーブルに格納しておき、逐次検索させるようにして
もよい。
【0082】本実施例では、パターン認識の一例とし
て、航空機シルエットの画像認識の場合を説明したけれ
ども、その他の物体認識や文字認識などにも使用でき
る。また、画像以外にも、音声、超音波、レーダなどの
電磁気、地震波、地磁気などのパターン識別に用いても
構わない。さらに、これらの複数のパターンを入力する
場合も本発明の適用範囲である。
【0083】たとえば、文字認識の場合には、画像から
適当な処理によって切り出した文字を正規化した後、特
徴量として縦方向濃淡ヒストグラムなどを、識別手段3
を構成するニューラルネットワークに入力してもよい。
また、音声認識の場合には、音声波形に窓関数を掛けて
切り出した波形からフーリエスペクトルなどの特徴量を
抽出して用いてもよい。
【0084】上述のBPNNは、層の数や各層を構成す
るノード数が変わっても同じ効果が得られることは勿論
である。また、ニューラルネットワークをBPNNとし
て説明したが、シグモイド関数以外の非線形関数を用い
たり、さらにBPNN以外の他のどのようなニューラル
ネットワークを使用した場合でも、未知パターンに対す
る誤認識を低減して識別精度を向上させる効果がある。
【0085】さらに、識別手段3を構成するニューラル
ネットワークの部分を、入力パターンと各カテゴリとの
距離を直接求めない他の識別方法、たとえばベイズ(B
ayes)識別法などの統計的パターン識別方法に置き
換えても、未知パターンに対する誤認識を低減して識別
精度を向上させる効果がある。これらのパターン認識方
法は、ハードウェアで構成しても構わない。
【0086】本実施例における特徴想起、比較、判定と
いう操作は、いわゆるパターンマッチング手法と混同さ
れ、処理時間がかかると思われがちであるが、パターン
マッチング手法のように逐次検索をする必要はなく、た
だ1つの特徴量を呼出して計算すればよいので、非常に
高速な処理が実現される。また、識別および想起にそれ
ぞれニューラルネットワークを用いているので、識別と
想起の両方ともが高速処理できるので、高速なパターン
識別ができる。
【0087】本実施例では、特徴ベクトルとカテゴリと
が1対1の関係であることが必要であるが、厳密に1対
1の関係がなくても識別結果を棄却することができ、誤
認識を低減することができる。
【0088】また、特徴量に1つまたは複数の適当なパ
ラメータを付加して、そのパラメータとカテゴリベクト
ルを合わせたものを改めてカテゴリベクトルとすること
で、1対1の関係をとることも可能である。この場合に
は、そのパラメータは連続して変化するアナログ量で与
えることができるけれども、この場合は特徴ベクトルの
想起にはルックアップテーブルを用いるよりもニューラ
ルネットワークを用いた方がよい。なぜならば、ニュー
ラルネットワークを識別と想起とに使用することで特徴
ベクトルとカテゴリベクトルの変換を連続量で行うこと
ができ、ニューラルネットワークの汎化能力が活かせる
ためである。
【0089】
【発明の効果】以上のように本発明によれば、実際に入
力されたパターンと、識別されたカテゴリに基づいて想
起された入力パターンとを比較し、類似度を求め、類似
度の高いときだけ識別手段の出力カテゴリを正しいもの
として出力するので、未知パターンやノイズが重畳され
たパターンなどに対する誤った認識結果を棄却すること
ができ、精度の高い識別を実現することができる。
【0090】また本発明によれば、入力されたパターン
から、パターンを特徴づける特徴量を要素とする特徴ベ
クトルを算出し、当該特徴ベクトルに基づいて識別を行
うパターン認識装置においても、上述と同様に入力パタ
ーンから算出された特徴ベクトルと、識別手段からのカ
テゴリベクトルに基づいて算出された特徴ベクトルとを
比較して類似度を求め、類似度が高いときだけ識別手段
からの識別結果であるカテゴリベクトルを正しいものと
出力しているので、未知パターンやノイズが重畳された
パターンに対する誤った認識結果を棄却することがで
き、精度の高いパターン認識を実現することができる。
【図面の簡単な説明】
【図1】本発明の一実施例であるパターン認識装置1の
構成を示すブロック図である。
【図2】ニューラルネットワーク11の構成を示す図で
ある。
【図3】識別手段3の機能を説明するための図である。
【図4】特徴想起手段5の機能を説明するための図であ
る。
【図5】識別結果判定手段4の構成を示すブロック図で
ある。
【図6】出力手段7による識別結果の出力例を示す図で
ある。
【図7】パターン認識装置1の動作を説明するフローチ
ャートである。
【図8】パターン認識装置1において認識結果を棄却し
た際の出力例を示す図である。
【図9】パターン認識装置1において認識結果を棄却し
た際の出力例を示す図である。
【図10】従来のパターン認識装置41の構成を示すブ
ロック図である。
【図11】従来のパターン認識装置41による識別結果
の表示例を示す図である。
【図12】従来のパターン認識装置41による識別結果
の表示例を示す図である。
【符号の説明】
1 パターン認識装置 2 特徴抽出手段 3 識別手段 4 識別結果判定手段 5 特徴想起手段 6 類似度算出手段 7 出力手段 11 ニューラルネットワーク 12 入力層 13 中間層 14 出力層 21 処理手段 22 レベル弁別手段 23 基準値出力手段 31 パターン 32 識別結果表示欄 33 カテゴリベクトル表示欄 L 類似度 NI1〜NIm,NM,NO1〜NOn ノード

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 入力パターンを複数の予め定めた種類の
    カテゴリに識別する識別手段と、 前記識別手段からの出力カテゴリに基づいて、入力パタ
    ーンを想起する想起手段と、 前記入力パターンと前記想起手段からのパターンとを比
    較してパターンの類似度を算出する算出手段と、 前記算出手段からの類似度をレベル弁別し、類似度が高
    いとき、前記識別手段からの出力カテゴリを正しいもの
    として出力する判定手段とを含むことを特徴とするパタ
    ーン認識装置。
  2. 【請求項2】 入力パターンから、パターンを特徴づけ
    る特徴量を要素とする特徴ベクトルを算出する特徴抽出
    手段と、 前記特徴抽出手段からの特徴ベクトルに基づいて、入力
    パターンが複数の予め定めた種類のカテゴリのどのカテ
    ゴリに属するかを表現するカテゴリベクトルを算出する
    識別手段と、 前記識別手段からのカテゴリベクトルに基づいて、特徴
    ベクトルを算出する特徴想起手段と、 前記特徴抽出手段からの特徴ベクトルと、前記特徴想起
    手段からの特徴ベクトルとに基づいて、両ベクトルの類
    似度を算出する算出手段と、 前記算出手段からの類似度をレベル弁別し、類似度が高
    いとき、前記識別手段からのカテゴリベクトルによって
    表現されるカテゴリを識別結果として出力する判定手段
    とを含むことを特徴とするパターン認識装置。
  3. 【請求項3】 入力パターンを複数の予め定めた種類の
    カテゴリに識別するステップと、 識別したカテゴリに基づいて、入力パターンを想起する
    ステップと、 前記入力パターンと想起されたパターンとを比較してパ
    ターンの類似度を算出するステップと、 算出された類似度をレベル弁別し、類似度が高いとき識
    別したカテゴリを正しいものとして出力するステップと
    を含むことを特徴とするパターン認識方法。
JP5250829A 1993-10-06 1993-10-06 パターン認識装置および方法 Expired - Lifetime JP2880383B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5250829A JP2880383B2 (ja) 1993-10-06 1993-10-06 パターン認識装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5250829A JP2880383B2 (ja) 1993-10-06 1993-10-06 パターン認識装置および方法

Publications (2)

Publication Number Publication Date
JPH07105372A true JPH07105372A (ja) 1995-04-21
JP2880383B2 JP2880383B2 (ja) 1999-04-05

Family

ID=17213650

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5250829A Expired - Lifetime JP2880383B2 (ja) 1993-10-06 1993-10-06 パターン認識装置および方法

Country Status (1)

Country Link
JP (1) JP2880383B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004532458A (ja) * 2001-03-23 2004-10-21 インテル コーポレイション 距離測定法を用いる画像検索
JP2005513941A (ja) * 2001-12-28 2005-05-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 自動器具識別及びプログラミングを有するユニバーサル・リモコン装置
US8483465B2 (en) 2008-04-08 2013-07-09 Yamaguchi University X-ray image processing method and X-ray image processing system using open curve fourier descriptors

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004532458A (ja) * 2001-03-23 2004-10-21 インテル コーポレイション 距離測定法を用いる画像検索
JP2005513941A (ja) * 2001-12-28 2005-05-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 自動器具識別及びプログラミングを有するユニバーサル・リモコン装置
US8483465B2 (en) 2008-04-08 2013-07-09 Yamaguchi University X-ray image processing method and X-ray image processing system using open curve fourier descriptors

Also Published As

Publication number Publication date
JP2880383B2 (ja) 1999-04-05

Similar Documents

Publication Publication Date Title
Hosang et al. Learning non-maximum suppression
Bazen et al. Segmentation of fingerprint images
US7958070B2 (en) Parameter learning method, parameter learning apparatus, pattern classification method, and pattern classification apparatus
JP3088171B2 (ja) 自己組織型パタ−ン分類システム及び分類方法
CN109101897A (zh) 水下机器人的目标检测方法、系统及相关设备
CN113378676A (zh) 基于多特征融合的图像中人物交互检测方法
US5119438A (en) Recognizing apparatus
CN107239792A (zh) 一种基于二进制描述子的工件识别方法及装置
KR102488789B1 (ko) 인공지능 기반 단일 클래스 이상 탐지 모델을 이용한 예측 분류 방법, 장치 및 프로그램
CN113221956B (zh) 基于改进的多尺度深度模型的目标识别方法及装置
JP4039708B2 (ja) パターン認識方法およびパターン認識装置
Cho et al. A comparison of rule-based, K-nearest neighbor, and neural net classifiers for automated
JP2880383B2 (ja) パターン認識装置および方法
Mekhalfa et al. Gentle Adaboost algorithm for weld defect classification
CN111652350A (zh) 神经网络可视化解释方法及弱监督定位物体方法
Kaur et al. Offline signature verification in Punjabi based on SURF features and critical point matching using HMM
KR100621883B1 (ko) 학습에 기반을 둔 적응형 실시간 얼굴검출방법
JP2017117025A (ja) パターン識別方法及びその装置、そのプログラム
Sanders et al. Pre-locating corners in images in order to improve the extraction of Fourier descriptors and subsequent recognition of shipbuilding parts
Hunter et al. Detection of echocardiographic left ventricle boundaries using neural networks
CN114333840A (zh) 语音鉴别方法及相关装置、电子设备和存储介质
Kumar et al. Keyword spotting framework using dynamic background model
JP2778194B2 (ja) パターン認識方法および装置
JP2924442B2 (ja) パターン認識装置
WO2022181303A1 (ja) アンサンブル学習システムおよびアンサンブル学習プログラム

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090129

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100129

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110129

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120129

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120129

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130129

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130129

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140129

Year of fee payment: 15

EXPY Cancellation because of completion of term