JPS6355677A - パタ−ン認識方法 - Google Patents

パタ−ン認識方法

Info

Publication number
JPS6355677A
JPS6355677A JP61201017A JP20101786A JPS6355677A JP S6355677 A JPS6355677 A JP S6355677A JP 61201017 A JP61201017 A JP 61201017A JP 20101786 A JP20101786 A JP 20101786A JP S6355677 A JPS6355677 A JP S6355677A
Authority
JP
Japan
Prior art keywords
axis
feature
pattern
categories
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61201017A
Other languages
English (en)
Other versions
JPH0652537B2 (ja
Inventor
Yoshihiko Hamamoto
義彦 浜本
Yasumasa Murai
村井 康眞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61201017A priority Critical patent/JPH0652537B2/ja
Publication of JPS6355677A publication Critical patent/JPS6355677A/ja
Publication of JPH0652537B2 publication Critical patent/JPH0652537B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、文字や音声等の入カバターンを認識するパタ
ーン認識方法に関するものである0〔従来の技術〕 パターン認識法における認識用辞書の自動作成法の1つ
に特徴選択法がある。こ:rLニ、予め大分類に工す設
定さt′Lfc各分類において、予めパターンから抽出
さn’fl:、大量の特徴の中から識別に有用な少数の
特徴全選択するものである。
従来のパターン認識法における代表的な特徴選択法に判
別分析法がある。これはフィッシャ(Fisher)比
を評価関数とし、フィッシャ比の大きい特徴を選択する
もので、複雑な計算上必要とせず、極めて容易に実行で
きるという利点をもつ。この判別分析法は、たとえば、
数理統計学(Mathematieal  5tati
stics )著者名:WilkstS、 、発行: 
John Wiley & 5ons  。
1962)に記載さnている。
〔発明が解決しょうとする問題点〕
しかしながら、上述し九従米のパターン認識法における
判別分析法は、正規分布を前提とし次統計的手法である
ため、正規分布に従わない非統計的データに対しては識
別に有用でないXvf徴t−選択してしまうという問題
点金有する0 〔問題点全解決する友めの手段〕 本発明のパターン認識方法は、特徴軸毎にカテゴリー間
のパターン分布の分離状態全表わす分離度が最大となる
特徴軸會第1軸とし、第2軸以降を順次に求める際に前
記第1軸から第(N−1)軸までの各特徴軸上において
他カテゴリーのパターン領域に属するパターンだけ全周
いて求め之分離度が最大となる特徴軸を第N軸とし、前
記第1軸から順に選択した1または2以上の特徴軸の特
徴のみt用いてパターン認Rを行うことヶ特徴とするO 〔実施例〕 以下1本発明′に実施例を用いて詳細に説明するO第1
図に本発明のパターン認識方法の一実施例を示すブロッ
ク図である0人カバターンに2値化部1で多値パターン
から2値パターンに変換さn。
前処理部2でノイズ除去・正規化等の処理が施さn、特
徴抽出部3で種々の特徴量が抽出さn1犬分類部4で大
まかに分類さnる。次に、大分類部4による分類毎に、
予め、特徴選択辞書作成部10で、カテゴリーの既知な
るパターンを用いて、特命抽出部3において抽出さfL
几大量の特徴の中からその分類において識別に有用な少
数の特徴を選択し、その特徴軸名t4!徴選択辞1iF
8に格納しておく。特徴選択部5では、入カバターンの
特徴の中から特徴選択辞書8に格納されている特徴を選
択し、整合部6で選択さnた特徴についてだけ整合用辞
書9に格納さnている標準パターンとの整合を行ない、
その結果に基づいて判定部7で入カバターンの属するカ
テゴリーが決定さnる0第1図の構成のうち1%徴選択
作成部10以外の部分は公知の技術から比較的容易に構
成できるので説明全省略し、特徴選択作成部10におけ
る学習について詳細に説明する。
第2図は特徴選択作成部10の詳細な構E’に示すブロ
ック図である。本実施例では、分類内に相異なるカテゴ
リーかに個存在する場合について説明する。まず、パタ
ー/の識別に最も有用な第1軸の選択について説明する
。パターン領域作底部11では、カテゴIJ−iのに番
目のパターンの特徴軸n上における特徴量(X i k
 (n) )己1の最大値[Jinと最小値Linとを
求めることにエフ、カテゴIJ −iのパターン領域を
設定する。
ここに、Ni1lカテゴリーiのパターン数である〇第
3因に一例として、特徴軸n上におけるカテゴリー1、
カテゴリー2のパターン領域を示す。
式(1)1式(2)にエフ各カテゴリーに対してパター
ン領域を設定する。
次に距離計算部12について説明する0特徴軸n上にお
けるカテゴリーiのバター7領域に対するカテゴ17 
+ jのに番目のパターンXjMωの距離Dik(n)
全次式で定義する。
Dik(n) = max(Lin −Xjk(n) 
、 Xjk(n) −Uin、 0 )k=1 、2 
、・・・・・・、Nj、j#i      (3)次に
評価関数計算部13について説明する。特徴軸n上で、
カテゴリーiのパターン領域に属さないカテゴリ+jの
パターン番号全要素とする集合5ij(n!−次式で定
義する。
5ij(n)= (k l D’1k(n) > O、
j’Ei 、に=1.2゜°゛°゛°°・Nj )  
      (4)特徴軸n上においてカテゴリーiと
は異なる全てのカテゴリーのパターンのうちで、カテゴ
リーiのパターン領域に属さないパターン数’kNi(
n)で表わす。
ここに、S は集合Sの要素数を表わす0ここで、評価
rA数となる分離度J (n)k式(6)で定義する。
この分離度J(n)が大きい特徴軸が識別に有用な特徴
軸である。特徴選択辞書構成部14において最大分離度
を与える特徴軸全第1軸として選択するO 具体的な例會用いて分離度による特徴軸の選択を説明す
る。第3図と第4図はそnぞlf″L特徴軸n機軸びm
上のパターン分布で、カテゴリーが2つの場合である。
第3図では2つのカテゴリーのパターン分布に重なりが
なく、第4図では重なりがあるのでJ←)〈J(−とな
り、特徴軸mエフ特徴軸nの万が優nていると言える。
次に、第2軸以降の%機軸の選択法について説明する。
分離度J(n)が最大の特徴軸を第1軸とし、第2軸は
第1軸上において他カテゴリーのパターン領域に属する
パターンだけ音用いて、最大分離度を与える特徴軸を求
めることにエタ得らnるO他カテゴリーのパターン領域
に属するパターンとハ、相異なるカテゴリーのパターン
分布間の重なりに属するパターンでらる0第2軸以降の
特徴軸は、パターン分布間の重なジを分離する工うな特
徴軸を求めることにエフ得らnる。
第3軸は第1軸上で他カテゴリーのパターン領域から分
離さ′t″L九パターンを除き、第2軸において他カテ
ゴリーのパターン領域に属するパターンだけ上用いて最
大分離度を与える特徴軸全求めることに工り得らnる0
言いかえnば第3軸は第1軸お工び第2軸(第2軸金求
めた際の状態、すなわち第1軸上において他カテゴリー
のパターン領域に属するパターンだけt用いた状態)そ
nぞnにおいて他カテゴリーのパターン領域に属するパ
ターンだけt用いて最大分離度を与える特徴軸を求める
ことにエフ得らnる。
さらに、第4軸、第5軸・・・・・・と顆次に求めてい
く。一般的に表わせば、第N軸(Nは2以上の整数)は
、第1軸から第(N−1)軸までの各軸を求める際に各
軸上において他カテゴリーのパターン領域から分離さ扛
たパターンで除いたものだけを用いて最大分離度金与え
る特徴軸を求めることにエフ得らnる0言いかえnば、
第N41]は、第1軸から第(N−1)軸までの各軸を
求める際に、各軸上において、他カテゴリーのパターン
領域に属するパターンだけを用いて、最大分離度全与え
る特徴軸を求めることによ夕得らnる。
以上の工うに第1軸、第2軸・・・・−・と順位が定め
らn7?:特徴軸のうち、第1軸から適当な順位までの
特徴軸を選択してパターン認識を行うことにより、効率
工くパターン認R’lすることが可能となる0 〔発明の効果〕 以上説明した工うに本発明は、判別分析法の工うにパタ
ーン分布に正規分布に基づく統計的データという仮定を
おく必要ハなく、このLつな統計的データお工び正規分
布に基づかない非統計的データの両方に対して相異なる
カテゴリーのパターン分布間の重なりt−評価すること
にエフ、パターンの識別に最適な特徴全選択することが
でき、選択さjL7j特徴だけ全周いて認識を行なうこ
とにエフ、複雑な計算を行なうことなく容易に高精度の
パターン認識率が得らnる効果がある。マ友本発明全適
用して特徴選択全学習にエフコンビエータを用いて自動
的に行なうことも可能である。
【図面の簡単な説明】
第1図は本発明のパターン認識方法の一実施例を説明す
るためのブロック図、第2図は第1図に示す特徴選択辞
書作成部10の詳細なブロック図、第3図は特徴軸上に
おけるパターン分布の例を示す概念図で2つのカテゴリ
ーのパターン分布が重なる場合、第4図は特徴軸上にお
け・るパターン分布の例を示す概念図で2つのカテゴリ
ーのパターン分布に重なりがない場合である。 1・・・・・・2値化部、2・・・・・・前処理部、吐
・・・・・特徴抽出部、4・・・・・・大分類部、5・
・・・・・特徴選択部、6・・・・・・整合部、7・・
・・・・判定部、8・・・・・・特徴選択辞書、9・・
・・・・整合用辞書、10・・・・・・特徴選択辞書作
成部。 +  + ゛−−−−− 1ey−二$zfi5に#、
  12 ・= ・=  21!J *すX4.13・
・・・・・紳傷藺数計1部、14−、、、、・竹徴選−
伏片苦槙広部。 11,7\ 代理人弁理士内原  4=−””” \ニノ“ 第 31 茶 4i!I

Claims (1)

    【特許請求の範囲】
  1. 特徴軸毎にカテゴリー間のパターン分布の分離状態を表
    わす分離度が最大となる特徴軸を第1軸とし、第2軸以
    降を順次に求める際に前記第1軸から第(N−1)軸ま
    での各特徴軸上において他カテゴリーのパターン領域に
    属するパターンだけを用いて求めた分離度が最大となる
    特徴軸を第N軸とし、前記第1軸から順に選択した1ま
    たは2以上の特徴軸の特徴のみを用いてパターン認識を
    行うことを特徴とするパターン認識方法。
JP61201017A 1986-08-26 1986-08-26 パタ−ン認識方法 Expired - Lifetime JPH0652537B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61201017A JPH0652537B2 (ja) 1986-08-26 1986-08-26 パタ−ン認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61201017A JPH0652537B2 (ja) 1986-08-26 1986-08-26 パタ−ン認識方法

Publications (2)

Publication Number Publication Date
JPS6355677A true JPS6355677A (ja) 1988-03-10
JPH0652537B2 JPH0652537B2 (ja) 1994-07-06

Family

ID=16434090

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61201017A Expired - Lifetime JPH0652537B2 (ja) 1986-08-26 1986-08-26 パタ−ン認識方法

Country Status (1)

Country Link
JP (1) JPH0652537B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10160508A (ja) * 1996-11-26 1998-06-19 Omron Corp 状態判別装置
CN103324941A (zh) * 2013-06-19 2013-09-25 鲁东大学 一种基于临近距离的遥感分类图斑边界精度评价方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3630734B2 (ja) 1994-10-28 2005-03-23 キヤノン株式会社 情報処理方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10160508A (ja) * 1996-11-26 1998-06-19 Omron Corp 状態判別装置
CN103324941A (zh) * 2013-06-19 2013-09-25 鲁东大学 一种基于临近距离的遥感分类图斑边界精度评价方法

Also Published As

Publication number Publication date
JPH0652537B2 (ja) 1994-07-06

Similar Documents

Publication Publication Date Title
US6026397A (en) Data analysis system and method
CN112464638B (zh) 一种基于改进谱聚类算法的文本聚类方法
CN104137097B (zh) 谓语模板收集装置以及特定短语对收集装置
CN106503805A (zh) 一种基于机器学习的双模态人人对话情感分析系统及其方法
CN109299480A (zh) 基于上下文语境的术语翻译方法及装置
CN108845982B (zh) 一种基于词的关联特征的中文分词方法
CN111210846B (zh) 基于集成流形降维的帕金森语音识别系统
CN108846047A (zh) 一种基于卷积特征的图片检索方法及系统
CN109408811A (zh) 一种数据处理方法及服务器
CN110472203B (zh) 一种文章的查重检测方法、装置、设备及存储介质
CN110738201B (zh) 基于融合形态特征的自适应多卷积神经网络文字识别方法
CN109766419A (zh) 基于语音分析的产品推荐方法、装置、设备及存储介质
CN111274371A (zh) 一种基于知识图谱的智能人机对话方法及设备
JPH02238588A (ja) 文字認識装置
CN107885723A (zh) 对话角色区分方法和系统
WO2021128704A1 (zh) 一种基于分类效用的开集分类方法
US20220318506A1 (en) Method and apparatus for event extraction and extraction model training, device and medium
CN111462762B (zh) 一种说话人向量正则化方法、装置、电子设备和存储介质
JPS6355677A (ja) パタ−ン認識方法
CN109885680B (zh) 一种基于义原扩展的短文本分类预处理方法、系统及装置
CN111159370A (zh) 一种短会话新问题生成方法、存储介质和人机交互装置
CN110413757A (zh) 一种词语释义确定方法、装置及系统
KR102452814B1 (ko) 문서 내 현안 분석 및 추출하기 위한 방법
KR102457455B1 (ko) 인공지능 기반의 미술품 가격 예측 장치 및 방법
CN108062563A (zh) 一种基于类别均衡的代表样本发现方法