JP2012093423A - パターン認識方法 - Google Patents

パターン認識方法 Download PDF

Info

Publication number
JP2012093423A
JP2012093423A JP2010238520A JP2010238520A JP2012093423A JP 2012093423 A JP2012093423 A JP 2012093423A JP 2010238520 A JP2010238520 A JP 2010238520A JP 2010238520 A JP2010238520 A JP 2010238520A JP 2012093423 A JP2012093423 A JP 2012093423A
Authority
JP
Japan
Prior art keywords
data
pattern recognition
unit space
recognition method
sensitivity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2010238520A
Other languages
English (en)
Inventor
Takeshi Hayashi
毅 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Motors Corp
Original Assignee
Mitsubishi Motors Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Motors Corp filed Critical Mitsubishi Motors Corp
Priority to JP2010238520A priority Critical patent/JP2012093423A/ja
Publication of JP2012093423A publication Critical patent/JP2012093423A/ja
Withdrawn legal-status Critical Current

Links

Images

Abstract

【課題】情報の欠落を抑えてパターン認識の判別能力を向上でき、多値離散量や連続量のデータに対して適応可能なRT法によるパターン認識方法を提供する。
【解決手段】複数のサンプルデータから構成される単位空間内に、判別対象のデータが属するか否かを判別するパターン認識方法であって、サンプルデータ及び判別対象のデータを定義する複数の項目を、係数及び切片を有する一次式によって平均値m、感度β及び、標準SN比ηに圧縮し、これらの値を用いて判別対象のデータが単位空間内に属するか否かを判別する。
【選択図】図2

Description

本発明は、パターン認識方法に係り、MTシステム(Mahalanobis Taguchi System)における情報圧縮技術に関する。
ある個体から得られるさまざまな情報を処理し、その個体がどのような集団に属するかを認識する技術であるパターン認識において、パターン認識技術の一体系として、MTシステムが知られている。MTシステムではパターン認識を実施する目的に対し均質性を有する集団を単位空間と設定し,単位空間に属するデータに基づきマハラノビスの距離を定め、パターン認識の対象となるデータが単位空間に属するかどうかを判別する。
MTシステムによるパターン認識方法において、マハラノビス距離を算出するためには、パターン毎に複数のサンプルを前もって準備する必要がある。パターンを認識する際に扱える情報量(項目数)は、サンプル数以下となるが、サンプル数を十分に準備できない場合がある。
このようにサンプル数が十分に準備できない場合には、情報の取捨選択や圧縮といった手法が多く用いられている。
例えば、2つのパターン間における違いを最もよく表す部分の情報(特徴部分)のみを扱い、それ以外の情報を処理から省くことにより、マハラノビス距離算出時の計算量を減らす方法が提案されている(特許文献1)。
また、サンプル数を十分に準備できない場合の対応方法として、特に信号の出力値が数値で定義できない場合に対応するために、RT法が提案されている。RT法は、データを規定する項目が何個であっても,2個の変数、即ち標準SN比ηと比例定数βに情報圧縮してパターン認識を行う方法である。したがって、RT法では、複数の単位空間を定義することが可能であり、多重共線性の問題が発生せず、単位空間のメンバー数(データ数)が変数の数より少なくてもパターン認識が可能であるという利点がある。
特開平9−161062号公報
しかしながら、上記特許文献1では、情報の取捨選択が行なわれることで、パターン認識の判別能力が低下してしまうといった問題点がある。
また、RT法は、本来2値データに対して適用されるべく提案されたものであって、単位空間に属するデータの項目とその平均値とがゼロ点を通る比例関係にあると見なして情報圧縮を行なうものである。したがって、多値離散量や連続量に対して適用しようとすると、データの相関性を正確に把握することができずに必要なデータを相関性の低いものと誤判断して欠落させてしまう虞があり、結果としてパターン認識の判別能力が低下する虞がある。
本発明は、この様な問題を解決するためになされたもので、その目的とするところは、
情報の欠落を抑えてパターン認識の判別能力を向上でき、多値離散量や連続量のデータに対して適応可能なRT法によるパターン認識方法を提供することにある。
上記の目的を達成するために、請求項1のパターン認識方法は、複数のサンプルデータから構成される単位空間内に、判別対象のデータが属するか否かを判別するパターン認識方法であって、サンプルデータ及び判別対象のデータを定義する複数の項目を、係数及び切片を有する一次式によって項目の数より少ない変数に圧縮し、変数を用いて判別対象のデータが単位空間内に属するか否かを判別することを特徴とする。
また、請求項2のパターン認識方法は、請求項1において、変数は平均値、感度及び標準SN比であるとともに、平均値、感度及び標準SN比に基づいてマハラノビス距離を演算し、マハラノビス距離を用いて判別対象のデータが単位空間内に属するか否かを判別することを特徴とする。
また、請求項3のパターン認識方法は、請求項1または2において、サンプルデータ及び判別対象のデータは、音声データであることを特徴とする。
請求項1の発明によれば、サンプルデータや判別対象のデータを項目の数より少ない変数に圧縮することで、サンプルデータが2個以上であれば項目の数が多くとも、判別対象のデータが単位空間内に属するか否かを判別することが可能となる。
特に、本願発明では、係数及び切片を有する一次式により複数の項目を圧縮するので、データの項目とその平均値との関係がゼロ点を通るとは限らない連続量や多値離散量データであっても、相関性の高いデータであれば欠落させることなく採用することができ、パターン認識をより正確に行なうことができる。
また、請求項2の発明によれば、項目を平均値、感度及び標準SN比に圧縮し、これらに基づいて1つの数量であるマハラノビス距離が演算されるので、単位空間内に属するか否かを定量的に容易に判別することが可能となる。
また、請求項3の発明によれば、音声データをパターン認識することで、音の大きさと音質との両方について判別対象のデータがサンプルデータにより構成される単位空間内に属するか否かを判別することが可能となる。
本実施形態に係る音質評価方法を実行する機器構成を示すブロック図である。 音質評価方法の手順を示すフローチャートである。 単位空間の平均値とサンプルの散布図の一例である。
以下、本発明の実施の形態を図面に基づき説明する。
本実施形態では、送風機の音質評価方法に本願発明のパターン認識方法を適用したものであり、音質といった感応評価を数値化して定量評価を行なうものである。
図1は、本実施形態の音質評価方法を実行する機器構成を示すブロック図である。
図1に示すように、本実施形態では、音質評価方法を実行する機器として、マイク1、1/3oct分析機2、計算機3、ディスプレイ4を備えている。
マイク1は、評価対象としての送風機の作動音を入力する機能を有する。
1/3oct分析機2は、公知の機器であり、マイク1より入力した送風機の作動音について、1/3オクターブバンド分析を行ない、1/3オクターブ毎の音圧レベルをデータ化する機能を有する。
計算機3は、良品の送風機の作動音のデータを複数個記憶したデータベース10を備えており、演算部11において、マイク1から入力した評価対象の送風機の作動音からそのデータの特徴を抽出し、データベース10に記憶した良品のデータと比較して、作動音が良品の範囲内であるのか否かを判別する機能を有する。良品の送風機は、あらかじめ用意したサンプルの中から、例えば複数の人数で評価の上採用すればよい。そして、良品であると判断された送風機の作動音を、あらかじめマイクから入力し、演算部11で特徴となるデータを抽出し、データベース10に記憶しておく。
ディスプレイ4は、計算機3により作動音を判別した評価対象の送風機について良品であるか否かの判定結果を表示する機能を有する。
図2は、送風機の音質評価方法の手順を示すフローチャートである。
始めに、ステップS10では、上記のようにマイク1により計測した送風機の作動音を、1/3oct分析器2に入力させる。そして、ステップS20に進む。
ステップS20では、1/3oct分析器2において、マイクより入力した作動音について、1/3オクターブバンド分析を行ない、データ化して、計算機3に入力する。そして、ステップS30に進む。
ステップS30では、計算機3において、1/3oct分析器2から入力した送風機の作動音について、データベース10にあらかじめ記憶してある良品の特徴となるデータを基に、RT法により、平均値m、感度β、標準SN比ηの算出を行なう。なお、ステップS30からステップS50における具体的なRT法による演算方法については後述する。そして、ステップS40に進む。
ステップS40では、ステップS30で演算した平均値m、感度β、標準SN比ηに基づいて、マハラノビス距離Dを算出する。そして、ステップS50に進む。
ステップS50では、ステップS40で算出したマハラノビス距離Dが閾値2σ以下であるか否かを判別する。閾値2σは、データベース10にあらかじめ記憶されている良品のデータについて夫々求めたマハラノビス距離Dの標準偏差σの2倍の値である。マハラノビス距離Dが閾値2σ以下である場合は、ステップS60に進む。なお、閾値に関しては、目的や入力条件等に応じて、標準偏差σの何倍に設定するかを適宜変更してもよい。
ステップS60では、ステップS10で作動音を入力した評価対象の送風機が良品であると判定し、ディスプレイ4に出力する。そして、本ルーチンを終了する。
ステップS50でマハラノビス距離Dが閾値2σより大きいと判定した場合には、ステップS70に進む。
ステップS70では、ステップS10で作動音を入力した評価対象の送風機が不良品であると判定し、ディスプレイ4に出力する。そして、本ルーチンを終了する。
次に、上記ステップS30〜S50で行なわれるRT法の具体的な演算方法について説明する。
本実施形態では、上記のように、あらかじめ良品のデータとしてn個のメンバーが得られており、単位空間を構成するメンバー(サンプルデータ)としてデータベース10に記憶されている。各メンバーについては、夫々k個の項目xnkが得られている。項目xnkは、具体的には、1/3オクターブ分析により得られた周波数帯域毎の音圧レベルである。
まず、項目ごとの平均値mと,平均値の偏差平方和γを次式(1)〜(3)により求める。
Figure 2012093423
Figure 2012093423
Figure 2012093423
上記(1)〜(11)を、良品のデータである各メンバーに対して夫々演算する。これらのデータをまとめると次表1のようになる。
Figure 2012093423
Figure 2012093423
Figure 2012093423
Figure 2012093423
単位空間の全てのメンバーについて、次式(15)によりYi1,Yi2,Yi3を求め、それぞれの平均値を算出する。
Figure 2012093423
(12)〜(14)式により求めたYi1,Yi2,Yi3を用いて分散共分散行列Vを求める。
Figure 2012093423
分散共分散行列Vの余因子行列Aを次式(23)により求める。
Figure 2012093423
単位空間のi番目のメンバーのマハラノビス距離Diを次式(24)、(25)により求める。
Figure 2012093423
次に、ステップS50において用いられる標準偏差σの演算方法について詳述する。
標準偏差σは、次式(26)で求めるように、式(25)により求めたDiの標準偏差である。
Figure 2012093423
Figure 2012093423
そして、図2に示すフローチャートのように、新たに取得した評価対象としての送風機の作動音のデータが、単位空間に属するかどうか判別を行う。まず、単位空間メンバーと同様に(9)式、(10)式、(11)式で、評価対象の送風機について平均値m、感度β、標準SN比ηを求め(ステップS30に該当する)、(12)式、(13)式、(14)式でY=(Y1,Y2,Y3)を求める。そのYを(24)式に代入し,マハラノビス距離Dを求める(ステップS40に該当する)。
そして、(26)式で得られている標準偏差の2倍値2σを閾値として、ステップS50のように良品か否かを判別するのである(ステップS50に該当する)。
以上のように、送風機の作動音を1/3oct分析したデータを、良品のメンバーにより構成される単位空間との差を示すマハラノビス距離Dという数値に置き換えることで、多くの項目を有する作動音を容易に良品であるか否かを判別することが可能となり、単純な音量だけでなく、音質という感応的評価を数値に置き換えて評価することができる。
マハラノビス距離Dを演算する際に、本実施形態では、RT法といった公知の情報圧縮技術を応用して採用しており、周波数帯域毎の音圧レベルといった多数の項目を有する各メンバーの情報を感度βや標準SN比ηといった情報に集約するので、良品のメンバー数(サンプルデータ数)が項目の数より少なくとも良品であるか否かを容易に判別することができる。
そして、本実施形態では、一次式をベースとして情報圧縮を行うことで、感度及び標準SN比だけではなく、平均値も加えてマハラノビス距離Dを演算することが可能となり、判定精度を向上させることができる。
従来のRT法では、パターン認識時において、サンプルと単位空間との間には、原点を必ず通るゼロ点比例式の関係が成り立っていると考え、この関係から大きく外れるサンプルについては、パターンが異なるものであると判定される。詳しくは、次式(27)に示すように、サンプルの値xと単位空間の平均値mとが、比例定数(感度)βを有する比例関係にあるものとしてパターン認識を行っている。
x=β・m・・・(27)
したがって、ゼロ点比例式の関係から大きく外れるサンプルについては、相関性のないものとして単位空間を構成するメンバーとしては採用されない。
これに対し、本実施形態では、RT法において、一次式により情報圧縮を行っている。詳しくは、サンプルの値xと単位空間の平均値mとの関係が、次式(28)に示すように係数(感度)βと切片αを有する一次式の関係にあるものとして、情報圧縮を行っている。
x=α+β・m・・・(28)
なお、本実施形態のように音声データをパターン認識した場合には、音の大きさの差が切片α(平均値m)で表され、音質の差が感度βと標準SN比ηに表れ、特に音の高低が感度βに、離散音の有無がηに表れる。
このように、一次式をベースとして情報圧縮を行なうと、パターン認識時において、従来のゼロ点比例式では相関性がないものとして判定されていたサンプルを、相関性のあるものとして採用することが可能となる。
例えば、図3の(A)及び(B)は、単位空間の平均値mとサンプルの散布図の一例を示している。下図3の(A)及び(B)は、いずれも略同じ比例定数βと標準SN比ηを有している。しかしながら、(A)及び(B)は、明らかに性質が異なっており、(B)ではサンプルの値xと単位空間の平均値mとの間に相関性が認められる。特に(B)においては、ゼロ点比例方式では(A)と同様に相関性が低いと認識したデータを欠落させてしまうが、一次式をベースとして情報圧縮を行う本実施形態では略全てのデータを相関性のある有用なデータとして採用することができる。
このように、本実施形態では、一次式をベースとして情報圧縮を行うことで、パターン認識を行う際に、多値離散量や連続量を持つ対象に適用する場合においても,対象に応じてより適切な近似式を選択することができ、判別能力を大きく向上させることができる。
なお、本実施形態では、送風機の音質評価において、本発明を適用しているが、音が発生する他の部品やシステムの音質評価に適用することができる。また、本発明は、音声データだけではなく、各種データのパターン認識の際に広く適用することが可能である。
1 計算機
2 演算部
3 データベース

Claims (3)

  1. 複数のサンプルデータから構成される単位空間内に、判別対象のデータが属するか否かを判別するパターン認識方法であって、
    前記サンプルデータ及び前記判別対象のデータを定義する複数の項目を、係数及び切片を有する一次式によって前記項目の数より少ない変数に圧縮し、前記変数を用いて前記判別対象のデータが前記単位空間内に属するか否かを判別することを特徴とするパターン認識方法。
  2. 前記変数は平均値、感度及び標準SN比であるとともに、
    前記平均値、感度及び標準SN比に基づいてマハラノビス距離を演算し、前記マハラノビス距離を用いて前記判別対象のデータが前記単位空間内に属するか否かを判別することを特徴とする請求項1に記載のパターン認識方法。
  3. 前記サンプルデータ及び判別対象のデータは、音声データであることを特徴とする請求項1または2に記載のパターン認識方法。
JP2010238520A 2010-10-25 2010-10-25 パターン認識方法 Withdrawn JP2012093423A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010238520A JP2012093423A (ja) 2010-10-25 2010-10-25 パターン認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010238520A JP2012093423A (ja) 2010-10-25 2010-10-25 パターン認識方法

Publications (1)

Publication Number Publication Date
JP2012093423A true JP2012093423A (ja) 2012-05-17

Family

ID=46386845

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010238520A Withdrawn JP2012093423A (ja) 2010-10-25 2010-10-25 パターン認識方法

Country Status (1)

Country Link
JP (1) JP2012093423A (ja)

Similar Documents

Publication Publication Date Title
CN108108902B (zh) 一种风险事件告警方法和装置
Müller et al. Accuracy of fatigue limits estimated by the staircase method using different evaluation techniques
TW201350836A (zh) 用於自動缺陷分類之不明缺陷拒絕率之最佳化
TW201407154A (zh) 自動及手動缺陷分類之整合
CN117407661B (zh) 一种用于设备状态检测的数据增强方法
Lengyel et al. Assessing the relative importance of methodological decisions in classifications of vegetation data
CN111860698A (zh) 确定学习模型的稳定性的方法和装置
US9400868B2 (en) Method computer program and system to analyze mass spectra
WO2012105386A1 (ja) 有音区間検出装置、有音区間検出方法、及び有音区間検出プログラム
JP2013182468A (ja) パラメータ値設定誤り検出システム、パラメータ値設定誤り検出方法およびパラメータ値設定誤り検出プログラム
JP5178471B2 (ja) 最適部分波形データ生成装置及び方法ならびにロープ状態判定装置及び方法
CN105070297B (zh) 一种mp3音频压缩历史检测方法
US11789001B2 (en) Information processing apparatus, sensor operation optimization method, and program
JP2012093423A (ja) パターン認識方法
CN116127450A (zh) 一种模型评估方法及装置
Jung et al. A new method to determine the number of experimental data using statistical modeling methods
Balamurali An investigation of the effects of misclassification errors on the analysis of means
Hong et al. VUS and HUM represented with Mann-Whitney statistic
JP2017130025A (ja) 要因分析装置、方法およびプログラム
Olsen et al. Predicting dactyloscopic examiner fingerprint image quality assessments
JP2008258486A (ja) 分布解析方法および装置、異常設備推定方法および装置、上記分布解析方法または異常設備推定方法をコンピュータに実行させるためのプログラム、並びに上記プログラムを記録したコンピュータ読み取り可能な記録媒体
CN115631448B (zh) 一种音视频质检处理方法及系统
US11674937B2 (en) Method and apparatus for encoding odorants
CN110728615B (zh) 基于序贯假设检验的隐写分析方法、终端设备及存储介质
TWI836607B (zh) 用以估計失真程度的方法及系統

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20140107