JP2012093423A

JP2012093423A - パターン認識方法

Info

Publication number: JP2012093423A
Application number: JP2010238520A
Authority: JP
Inventors: Takeshi Hayashi; 毅林
Original assignee: Mitsubishi Motors Corp
Current assignee: Mitsubishi Motors Corp
Priority date: 2010-10-25
Filing date: 2010-10-25
Publication date: 2012-05-17

Abstract

【課題】情報の欠落を抑えてパターン認識の判別能力を向上でき、多値離散量や連続量のデータに対して適応可能なＲＴ法によるパターン認識方法を提供する。
【解決手段】複数のサンプルデータから構成される単位空間内に、判別対象のデータが属するか否かを判別するパターン認識方法であって、サンプルデータ及び判別対象のデータを定義する複数の項目を、係数及び切片を有する一次式によって平均値ｍ、感度β及び、標準ＳＮ比ηに圧縮し、これらの値を用いて判別対象のデータが単位空間内に属するか否かを判別する。
【選択図】図２

Description

本発明は、パターン認識方法に係り、ＭＴシステム（Mahalanobis Taguchi System）における情報圧縮技術に関する。

ある個体から得られるさまざまな情報を処理し、その個体がどのような集団に属するかを認識する技術であるパターン認識において、パターン認識技術の一体系として、ＭＴシステムが知られている。ＭＴシステムではパターン認識を実施する目的に対し均質性を有する集団を単位空間と設定し，単位空間に属するデータに基づきマハラノビスの距離を定め、パターン認識の対象となるデータが単位空間に属するかどうかを判別する。

ＭＴシステムによるパターン認識方法において、マハラノビス距離を算出するためには、パターン毎に複数のサンプルを前もって準備する必要がある。パターンを認識する際に扱える情報量（項目数）は、サンプル数以下となるが、サンプル数を十分に準備できない場合がある。
このようにサンプル数が十分に準備できない場合には、情報の取捨選択や圧縮といった手法が多く用いられている。

例えば、２つのパターン間における違いを最もよく表す部分の情報（特徴部分）のみを扱い、それ以外の情報を処理から省くことにより、マハラノビス距離算出時の計算量を減らす方法が提案されている（特許文献１）。
また、サンプル数を十分に準備できない場合の対応方法として、特に信号の出力値が数値で定義できない場合に対応するために、ＲＴ法が提案されている。ＲＴ法は、データを規定する項目が何個であっても，２個の変数、即ち標準ＳＮ比ηと比例定数βに情報圧縮してパターン認識を行う方法である。したがって、ＲＴ法では、複数の単位空間を定義することが可能であり、多重共線性の問題が発生せず、単位空間のメンバー数（データ数）が変数の数より少なくてもパターン認識が可能であるという利点がある。

特開平９−１６１０６２号公報

しかしながら、上記特許文献１では、情報の取捨選択が行なわれることで、パターン認識の判別能力が低下してしまうといった問題点がある。
また、ＲＴ法は、本来２値データに対して適用されるべく提案されたものであって、単位空間に属するデータの項目とその平均値とがゼロ点を通る比例関係にあると見なして情報圧縮を行なうものである。したがって、多値離散量や連続量に対して適用しようとすると、データの相関性を正確に把握することができずに必要なデータを相関性の低いものと誤判断して欠落させてしまう虞があり、結果としてパターン認識の判別能力が低下する虞がある。

本発明は、この様な問題を解決するためになされたもので、その目的とするところは、
情報の欠落を抑えてパターン認識の判別能力を向上でき、多値離散量や連続量のデータに対して適応可能なＲＴ法によるパターン認識方法を提供することにある。

上記の目的を達成するために、請求項１のパターン認識方法は、複数のサンプルデータから構成される単位空間内に、判別対象のデータが属するか否かを判別するパターン認識方法であって、サンプルデータ及び判別対象のデータを定義する複数の項目を、係数及び切片を有する一次式によって項目の数より少ない変数に圧縮し、変数を用いて判別対象のデータが単位空間内に属するか否かを判別することを特徴とする。

また、請求項２のパターン認識方法は、請求項１において、変数は平均値、感度及び標準ＳＮ比であるとともに、平均値、感度及び標準ＳＮ比に基づいてマハラノビス距離を演算し、マハラノビス距離を用いて判別対象のデータが単位空間内に属するか否かを判別することを特徴とする。
また、請求項３のパターン認識方法は、請求項１または２において、サンプルデータ及び判別対象のデータは、音声データであることを特徴とする。

請求項１の発明によれば、サンプルデータや判別対象のデータを項目の数より少ない変数に圧縮することで、サンプルデータが２個以上であれば項目の数が多くとも、判別対象のデータが単位空間内に属するか否かを判別することが可能となる。
特に、本願発明では、係数及び切片を有する一次式により複数の項目を圧縮するので、データの項目とその平均値との関係がゼロ点を通るとは限らない連続量や多値離散量データであっても、相関性の高いデータであれば欠落させることなく採用することができ、パターン認識をより正確に行なうことができる。

また、請求項２の発明によれば、項目を平均値、感度及び標準ＳＮ比に圧縮し、これらに基づいて１つの数量であるマハラノビス距離が演算されるので、単位空間内に属するか否かを定量的に容易に判別することが可能となる。
また、請求項３の発明によれば、音声データをパターン認識することで、音の大きさと音質との両方について判別対象のデータがサンプルデータにより構成される単位空間内に属するか否かを判別することが可能となる。

本実施形態に係る音質評価方法を実行する機器構成を示すブロック図である。音質評価方法の手順を示すフローチャートである。単位空間の平均値とサンプルの散布図の一例である。

以下、本発明の実施の形態を図面に基づき説明する。
本実施形態では、送風機の音質評価方法に本願発明のパターン認識方法を適用したものであり、音質といった感応評価を数値化して定量評価を行なうものである。
図１は、本実施形態の音質評価方法を実行する機器構成を示すブロック図である。
図１に示すように、本実施形態では、音質評価方法を実行する機器として、マイク１、１／３oct分析機２、計算機３、ディスプレイ４を備えている。

マイク１は、評価対象としての送風機の作動音を入力する機能を有する。
１／３oct分析機２は、公知の機器であり、マイク１より入力した送風機の作動音について、１／３オクターブバンド分析を行ない、１／３オクターブ毎の音圧レベルをデータ化する機能を有する。
計算機３は、良品の送風機の作動音のデータを複数個記憶したデータベース１０を備えており、演算部１１において、マイク１から入力した評価対象の送風機の作動音からそのデータの特徴を抽出し、データベース１０に記憶した良品のデータと比較して、作動音が良品の範囲内であるのか否かを判別する機能を有する。良品の送風機は、あらかじめ用意したサンプルの中から、例えば複数の人数で評価の上採用すればよい。そして、良品であると判断された送風機の作動音を、あらかじめマイクから入力し、演算部１１で特徴となるデータを抽出し、データベース１０に記憶しておく。

ディスプレイ４は、計算機３により作動音を判別した評価対象の送風機について良品であるか否かの判定結果を表示する機能を有する。
図２は、送風機の音質評価方法の手順を示すフローチャートである。
始めに、ステップＳ１０では、上記のようにマイク１により計測した送風機の作動音を、１／３oct分析器２に入力させる。そして、ステップＳ２０に進む。

ステップＳ２０では、１／３oct分析器２において、マイクより入力した作動音について、１／３オクターブバンド分析を行ない、データ化して、計算機３に入力する。そして、ステップＳ３０に進む。
ステップＳ３０では、計算機３において、１／３oct分析器２から入力した送風機の作動音について、データベース１０にあらかじめ記憶してある良品の特徴となるデータを基に、ＲＴ法により、平均値ｍ、感度β、標準ＳＮ比ηの算出を行なう。なお、ステップＳ３０からステップＳ５０における具体的なＲＴ法による演算方法については後述する。そして、ステップＳ４０に進む。

ステップＳ４０では、ステップＳ３０で演算した平均値ｍ、感度β、標準ＳＮ比ηに基づいて、マハラノビス距離Ｄを算出する。そして、ステップＳ５０に進む。
ステップＳ５０では、ステップＳ４０で算出したマハラノビス距離Ｄが閾値２σ以下であるか否かを判別する。閾値２σは、データベース１０にあらかじめ記憶されている良品のデータについて夫々求めたマハラノビス距離Ｄ_ｉの標準偏差σの２倍の値である。マハラノビス距離Ｄが閾値２σ以下である場合は、ステップＳ６０に進む。なお、閾値に関しては、目的や入力条件等に応じて、標準偏差σの何倍に設定するかを適宜変更してもよい。

ステップＳ６０では、ステップＳ１０で作動音を入力した評価対象の送風機が良品であると判定し、ディスプレイ４に出力する。そして、本ルーチンを終了する。
ステップＳ５０でマハラノビス距離Ｄが閾値２σより大きいと判定した場合には、ステップＳ７０に進む。
ステップＳ７０では、ステップＳ１０で作動音を入力した評価対象の送風機が不良品であると判定し、ディスプレイ４に出力する。そして、本ルーチンを終了する。

次に、上記ステップＳ３０〜Ｓ５０で行なわれるＲＴ法の具体的な演算方法について説明する。
本実施形態では、上記のように、あらかじめ良品のデータとしてｎ個のメンバーが得られており、単位空間を構成するメンバー（サンプルデータ）としてデータベース１０に記憶されている。各メンバーについては、夫々ｋ個の項目ｘ_ｎｋが得られている。項目ｘ_ｎｋは、具体的には、１／３オクターブ分析により得られた周波数帯域毎の音圧レベルである。

まず、項目ごとの平均値ｍ_ｊと，平均値の偏差平方和γを次式（１）〜（３）により求める。

上記（１）〜（１１）を、良品のデータである各メンバーに対して夫々演算する。これらのデータをまとめると次表1のようになる。

単位空間の全てのメンバーについて、次式（１５）によりＹ_i1，Ｙ_i2，Ｙ_i3を求め、それぞれの平均値を算出する。

（１２）〜（１４）式により求めたＹ_i1，Ｙ_i2，Ｙ_i3を用いて分散共分散行列Vを求める。

分散共分散行列Ｖの余因子行列Ａを次式（２３）により求める。

単位空間のi番目のメンバーのマハラノビス距離Ｄ_iを次式（２４）、（２５）により求める。

次に、ステップＳ５０において用いられる標準偏差σの演算方法について詳述する。
標準偏差σは、次式（２６）で求めるように、式（２５）により求めたＤ_iの標準偏差である。

そして、図２に示すフローチャートのように、新たに取得した評価対象としての送風機の作動音のデータが、単位空間に属するかどうか判別を行う。まず、単位空間メンバーと同様に（９）式、（１０）式、（１１）式で、評価対象の送風機について平均値ｍ、感度β、標準ＳＮ比ηを求め（ステップＳ３０に該当する）、（１２）式、（１３）式、（１４）式でＹ＝（Ｙ₁，Ｙ₂，Ｙ₃）を求める。そのＹを（２４）式に代入し，マハラノビス距離Ｄを求める（ステップＳ４０に該当する）。

そして、（２６）式で得られている標準偏差の２倍値２σを閾値として、ステップＳ５０のように良品か否かを判別するのである（ステップＳ５０に該当する）。
以上のように、送風機の作動音を１／３oct分析したデータを、良品のメンバーにより構成される単位空間との差を示すマハラノビス距離Ｄという数値に置き換えることで、多くの項目を有する作動音を容易に良品であるか否かを判別することが可能となり、単純な音量だけでなく、音質という感応的評価を数値に置き換えて評価することができる。

マハラノビス距離Ｄを演算する際に、本実施形態では、ＲＴ法といった公知の情報圧縮技術を応用して採用しており、周波数帯域毎の音圧レベルといった多数の項目を有する各メンバーの情報を感度βや標準ＳＮ比ηといった情報に集約するので、良品のメンバー数（サンプルデータ数）が項目の数より少なくとも良品であるか否かを容易に判別することができる。

そして、本実施形態では、一次式をベースとして情報圧縮を行うことで、感度及び標準ＳＮ比だけではなく、平均値も加えてマハラノビス距離Ｄを演算することが可能となり、判定精度を向上させることができる。
従来のＲＴ法では、パターン認識時において、サンプルと単位空間との間には、原点を必ず通るゼロ点比例式の関係が成り立っていると考え、この関係から大きく外れるサンプルについては、パターンが異なるものであると判定される。詳しくは、次式（２７）に示すように、サンプルの値x_ｊと単位空間の平均値ｍ_ｊとが、比例定数（感度）βを有する比例関係にあるものとしてパターン認識を行っている。
x_ｊ=β・ｍ_ｊ・・・（２７）
したがって、ゼロ点比例式の関係から大きく外れるサンプルについては、相関性のないものとして単位空間を構成するメンバーとしては採用されない。

これに対し、本実施形態では、ＲＴ法において、一次式により情報圧縮を行っている。詳しくは、サンプルの値x_ｊと単位空間の平均値ｍ_ｊとの関係が、次式（２８）に示すように係数（感度）βと切片αを有する一次式の関係にあるものとして、情報圧縮を行っている。
x_ｊ=α＋β・ｍ_ｊ・・・（２８）
なお、本実施形態のように音声データをパターン認識した場合には、音の大きさの差が切片α（平均値ｍ）で表され、音質の差が感度βと標準ＳＮ比ηに表れ、特に音の高低が感度βに、離散音の有無がηに表れる。

このように、一次式をベースとして情報圧縮を行なうと、パターン認識時において、従来のゼロ点比例式では相関性がないものとして判定されていたサンプルを、相関性のあるものとして採用することが可能となる。
例えば、図３の（Ａ）及び（Ｂ）は、単位空間の平均値ｍ_ｊとサンプルの散布図の一例を示している。下図３の（Ａ）及び（Ｂ）は、いずれも略同じ比例定数βと標準ＳＮ比ηを有している。しかしながら、（Ａ）及び（Ｂ）は、明らかに性質が異なっており、（Ｂ）ではサンプルの値x_ｊと単位空間の平均値ｍ_ｊとの間に相関性が認められる。特に（Ｂ）においては、ゼロ点比例方式では（Ａ）と同様に相関性が低いと認識したデータを欠落させてしまうが、一次式をベースとして情報圧縮を行う本実施形態では略全てのデータを相関性のある有用なデータとして採用することができる。

このように、本実施形態では、一次式をベースとして情報圧縮を行うことで、パターン認識を行う際に、多値離散量や連続量を持つ対象に適用する場合においても，対象に応じてより適切な近似式を選択することができ、判別能力を大きく向上させることができる。
なお、本実施形態では、送風機の音質評価において、本発明を適用しているが、音が発生する他の部品やシステムの音質評価に適用することができる。また、本発明は、音声データだけではなく、各種データのパターン認識の際に広く適用することが可能である。

１計算機
２演算部
３データベース

Claims

複数のサンプルデータから構成される単位空間内に、判別対象のデータが属するか否かを判別するパターン認識方法であって、
前記サンプルデータ及び前記判別対象のデータを定義する複数の項目を、係数及び切片を有する一次式によって前記項目の数より少ない変数に圧縮し、前記変数を用いて前記判別対象のデータが前記単位空間内に属するか否かを判別することを特徴とするパターン認識方法。
前記変数は平均値、感度及び標準ＳＮ比であるとともに、
前記平均値、感度及び標準ＳＮ比に基づいてマハラノビス距離を演算し、前記マハラノビス距離を用いて前記判別対象のデータが前記単位空間内に属するか否かを判別することを特徴とする請求項１に記載のパターン認識方法。
前記サンプルデータ及び判別対象のデータは、音声データであることを特徴とする請求項１または２に記載のパターン認識方法。