JP2010020714A

JP2010020714A - 情報処理装置、情報処理方法、およびプログラム

Info

Publication number: JP2010020714A
Application number: JP2008183019A
Authority: JP
Inventors: Yoshiyuki Kobayashi; 由幸小林
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2008-07-14
Filing date: 2008-07-14
Publication date: 2010-01-28
Anticipated expiration: 2028-07-14
Also published as: US20100010947A1; JP4591566B2; CN101630508A; CN101630508B; US8626685B2

Abstract

【課題】複数の評価指標のトレードオフ関係となる複数のアルゴリズムを提示することができるようにする。
【解決手段】アルゴリズム自動構築部１３は、遺伝的探索手法により、入力信号が異常音であるかまたは正常音であるかを判別するアルゴリズムを構築する。トレードオフ分析部１４は、アルゴリズム自動構築部１３により構築されたアルゴリズムを基にトレードオフ分析を行って、複数のパレート最適解を求める。使用アルゴリズム決定部１６は、複数のアルゴリズムのなかから、複数の評価指標の要求条件に合致するパレート最適解を決定する。本発明は、例えば、入力信号を判別する情報処理装置に適用できる。
【選択図】図１

Description

本発明は、情報処理装置、情報処理方法、およびプログラムに関し、特に、複数の評価指標のトレードオフ関係となる複数のアルゴリズムを提示することができるようにする情報処理装置、情報処理方法、およびプログラムに関する。

従来、遺伝的探索手法により、与えられたデータの特徴を表す特徴量を抽出する特徴量抽出アルゴリズムを自動的に構築する技術（アルゴリズム自動構築技術：Automatic Algorithm Generation Technology）が提案されている。アルゴリズム自動構築技術によれば、音声認識、画像認識などのためのアルゴリズムを自動構築することができる。

例えば、本出願人により、楽曲データなどのコンテンツデータから、特徴量を高精度で速やかに抽出することができるアルゴリズムを構築する技術が提案されている（例えば、特許文献１参照）。

国際公開WO２００７／０４９６４１号公報

従来のアルゴリズム自動構築技術は、最高性能（最高精度）のアルゴリズムのみを出力するので、例えば、性能（精度）と速度（処理時間）という２つの評価指標があった場合に、少し性能は落ちても高速に動作するアルゴリズムを得ることはできなかった。また、一旦アルゴリズムを構築した後は、一方の評価指標の要求は下げてもよいが、他方の評価指標の要求を高くしたいといった変更に対応できなかった。

本発明は、このような状況に鑑みてなされたものであり、複数の評価指標のトレードオフ関係となる複数のアルゴリズムを提示することができるようにするものである。

本発明の一側面の情報処理装置は、遺伝的探索手法により、入力信号を判別するアルゴリズムを構築するアルゴリズム構築手段と、前記アルゴリズム構築手段により構築された前記アルゴリズムを基にトレードオフ分析を行うことにより、複数の評価指標に対する前記アルゴリズムの複数のパレート最適解を求めるトレードオフ分析手段とを備える。

前記複数のパレート最適解のなかから、前記複数の評価指標の要求条件に合致する最適アルゴリズムを決定する最適アルゴリズム決定手段をさらに設けることができる。

前記アルゴリズム構築手段により構築されるアルゴリズムは、複数の特徴抽出式と、前記複数の特徴抽出式の結合式である情報推定式により構成されるようにすることができる。

前記トレードオフ分析手段には、前記アルゴリズム構築手段により構築されたアルゴリズムから、特徴抽出式を１つずつ削除して作成した、特徴抽出式の数が異なるアルゴリズムを用いて、初期状態のパレート最適解を生成させることができる。

前記トレードオフ分析手段には、前記アルゴリズム構築手段により構築された単一のアルゴリズムを初期状態のパレート最適解とさせることができる。

前記トレードオフ分析手段には、前記初期状態のパレート最適解から、各特徴抽出式の使用または未使用をランダムに変更することにより、前記パレート最適解を更新させることができる。

前記最適アルゴリズム決定手段には、前記複数のパレート最適解のなかから、要求される処理時間および精度に基づいて、前記最適アルゴリズムを決定させることができる。

前記情報推定式における各特徴抽出式の評価値を求める評価値計算手段をさらに設け、前記アルゴリズム構築手段には、前記評価値計算手段による各特徴抽出式の評価値に基づいて、前記情報推定式を構成する特徴抽出式を更新させることができる。

前記評価値計算手段には、前記アルゴリズム構築手段が構築するアルゴリズムとしての情報推定式が複数ある場合、各情報推定式における同一の特徴抽出式の寄与率の合計値を、前記各特徴抽出式の評価値とさせることができる。

本発明の一側面の情報処理方法は、アルゴリズムを構築するアルゴリズム構築手段と、前記アルゴリズムのパレート最適解を求めるトレードオフ分析手段とを備える情報処理装置が、遺伝的探索手法により、入力信号を判別する前記アルゴリズムを構築し、構築された前記アルゴリズムを基にトレードオフ分析を行うことにより、複数の評価指標に対する前記アルゴリズムの複数のパレート最適解を求める。

本発明の一側面のプログラムは、コンピュータに、遺伝的探索手法により、入力信号を判別するアルゴリズムを構築するアルゴリズム構築手段と、前記アルゴリズム構築手段により構築された前記アルゴリズムを基にトレードオフ分析を行うことにより、複数の評価指標に対する前記アルゴリズムの複数のパレート最適解を求めるトレードオフ分析手段として機能させる。

本発明の一側面においては、遺伝的探索手法により、入力信号を判別するアルゴリズムが構築され、構築されたアルゴリズムを基にトレードオフ分析を行うことにより、複数の評価指標に対するアルゴリズムの複数のパレート最適解が求められる。

本発明の一側面によれば、複数の評価指標のトレードオフ関係となる複数のアルゴリズムを提示することができるようにする。

図１は、本発明を適用した情報処理装置の一実施の形態の構成例を示している。

情報処理装置１は、異常音を検出する処理を行う装置であり、学習データとして入力される、異常音および正常音が既知のサンプル信号に基づいてアルゴリズムを自動構築し、自動構築されたアルゴリズムに従って、新たな入力信号（以下、新規信号と称する）が異常音であるかまたは正常音であるかを判別する。

情報処理装置１は、サンプル信号入力部１１、サンプル信号保存部１２、アルゴリズム自動構築部１３、トレードオフ分析部１４、パレート最適解保存部１５、使用アルゴリズム決定部１６、新規信号入力部１７、異常音自動判別部１８、異常音判別結果出力部１９、および修正情報入力部２０により構成されている。

サンプル信号入力部１１は、情報処理装置１の図示せぬ他のブロック、または、他の装置から入力されてくる、アルゴリズム構築のためのサンプル信号を受け付け、サンプル信号保存部１２に供給する。

サンプル信号保存部１２は、サンプル信号入力部１１から供給される教師データとしてのサンプル信号を保存する。異常音自動判別部１８および修正情報入力部２０からサンプル信号保存部１２に供給される信号については後述する。

サンプル信号入力部１１に入力されるサンプル信号には、その信号が正常音であるのか、または、異常音であるのかを表すデータがラベルとして付加されている。

図２は、サンプル信号入力部１１に入力されるサンプル信号の例を示している。図２の横軸は時間を表し、サンプル信号とラベルが各時刻において１対１に対応している。なお、正常音であるのか、または、異常音であるのかを表すラベルは、例えば、HighレベルまたはLowレベルの信号として与えることができる。

アルゴリズム自動構築部１３は、遺伝的探索手法に基づく学習を行うことにより、異常音であるかまたは正常音であるかが未知の新規信号に対し、異常音であるかまたは正常音であるかを判別するアルゴリズムを構築（生成）する。アルゴリズム構築の詳細については、図３等を参照して後述するが、構築されるアルゴリズムは、入力信号の所定の特徴を表す特徴量を抽出するアルゴリズム（特徴量抽出アルゴリズム）であり、アルゴリズムにより抽出された特徴量（の値）が所定の閾値以上であるか否かにより、異常音か正常音を判別することができる。

トレードオフ分析部１４は、アルゴリズム自動構築部１３により構築されたアルゴリズムを基にトレードオフ分析を行って、パレート最適解を求める。そして、トレードオフ分析部１４は、パレート最適解としての複数のアルゴリズムをパレート最適解保存部１５に保存させる。パレート最適解保存部１５は、トレードオフ分析部１４から供給されたパレート最適解としての複数のアルゴリズムを保存する。

使用アルゴリズム決定部１６は、パレート最適解保存部１５に保存されている複数のアルゴリズムのなかから、現在の情報処理装置１の空きリソース状況、および要求される性能など、複数の評価指標の要求条件に合致する最適なアルゴリズムを決定し、異常音自動判別部１８に供給する。

新規信号入力部１７は、異常音か否かを検出する対象である新規信号の入力を受け付け、異常音自動判別部１８に供給する。

異常音自動判別部１８は、使用アルゴリズム決定部１６から供給されたアルゴリズムを用いて、新規信号入力部１７から供給される新規信号が異常音であるか、または正常音であるかを判別し、判別結果を異常音判別結果出力部１９に供給する。また、異常音自動判別部１８は、新規信号入力部１７から供給される新規信号に、判別結果をラベルとして付加して、サンプル信号保存部１２に供給し、保存させる。即ち、新規信号入力部１７から供給された新規信号が新たなサンプル信号としてサンプル信号保存部１２に保存される。

異常音判別結果出力部１９は、異常音自動判別部１８から供給された判別結果を、音声または映像で出力する。例えば、異常音判別結果出力部１９は、新規信号が異常音である場合に異常音であることを表す音を出力したり、「正常音」または「異常音」の文字を表示した映像を画面に表示させる。

修正情報入力部２０は、サンプル信号保存部１２に保存されているサンプル信号のラベルに間違いがある場合、そのラベルの修正を行う。すなわち、修正情報入力部２０は、ユーザの操作を受け付け、サンプル信号のラベルの書き替えを行う。

従って、サンプル信号保存部１２には、サンプル信号入力部１１から供給されるラベル付きのサンプル信号の他、異常音自動判別部１８からもラベル付きのサンプル信号が供給され、異常音自動判別部１８から供給されたサンプル信号のラベルに間違いがある場合には、そのラベルが修正情報入力部２０によって修正される。

次に、アルゴリズム自動構築部１３が行うアルゴリズムの構築について、詳細に説明する。

図３は、構築されるアルゴリズムの構造を説明する図である。

構築されるアルゴリズムは、ｍ個（ｍは１より大の整数）の特徴抽出式１乃至ｍと、そのｍ個の特徴抽出式１乃至ｍの線形結合式で表される情報推定式により構成される。特徴抽出式は、入力信号に対して所定の演算を行い、演算結果として１次元の値を出力する。情報推定式は、特徴抽出式の出力値である１次元の値を用いて、入力信号の特徴を示す情報を推定する。アルゴリズム自動構築部１３は、情報推定式である異常音判別式Uを求める。

図４は、異常音判別式Uの具体的な例を示している。出力すべき判別結果は、異常音であるか、または、正常音であるかの２値であるので、異常音判別式Uの演算結果が、所定の閾値Th以下であるか、または、所定の閾値Thより大きいかによって、入力信号が正常音であるか異常音であるかが判別される。例えば、図４に示されるように、異常音判別式Uの演算結果が、所定の閾値Th以下である場合には、入力信号が正常音であるという判別結果を出力し、所定の閾値Thより大きい場合には、入力信号が異常音であるという判別結果を出力する。図４に示される異常音判別式Uの例では、特徴抽出式１乃至ｍのうち、特徴抽出式１，２，５、および１５のみが使用されているが、これは、それ以外の特徴抽出式の線形結合係数がゼロであるためである。

なお、構築されるアルゴリズムとしては、異常音であるか、または、正常音であるかのような２値ではなく、例えば、楽曲の速さや明るさの度合い（レベル）というような所定の範囲内の数値を推定するものもある。この場合、図５に示すように、入力信号の速さを表す値は、ｍ個の特徴抽出式１乃至ｍの線形結合式で表される速さ推定式の演算結果で求められ、入力信号の明るさを表す値は、ｍ個の特徴抽出式１乃至ｍの線形結合式で表される明るさ推定式の演算結果で求められる。

図５０以降を参照して後述する次の実施の形態では、図６に示されるように、新規信号を入力したときに、その速さや明るさの値を抽出する特徴抽出機として使用されるアルゴリズムを構築する例について説明する。

図７は、特徴抽出式１乃至ｍの例を示している。

特徴抽出式は、複数次元で表現可能な入力信号を、１つの値、すなわち、スカラ量になるまで加工することが可能な式である。図８は、特徴抽出式の１つの例を示している。

特徴抽出式は、入力信号の種類を示す情報、および、入力信号に対して施す信号処理を示す情報であるオペレータにより構成され、オペレータには、対象処理軸および処理内容と、必要に応じて処理におけるパラメータが含まれる。図８の例においては、12TonesMは入力データの種類を示す情報であり、その後ろ４つのF#Differential, F#MaxIndex, T#LPF_1;0.861, T#UVarianceが、それぞれオペレータである。

入力信号の種類を示す情報としては、図８の例に示す、モノラルのPCM(pulse coded modulation sound source)波形データを時間軸に沿って音程解析したものであることを表す12TonesMの他、波形を表すWav、音声のスペクトルである２次元画像を表すSpectrumなどがある。

特徴抽出式は、入力信号に対して、入力信号の種類を示す情報に近い方から、オペレータで表される信号処理が、順に施されることを表す。オペレータの先頭には、処理対象の軸（対象処理軸）が記載されている。処理対象の軸は、Tが時間方向であることを表し、Fが周波数（音程方向）であることを表している。

オペレータの処理対称軸に続く処理内容としては、Differentialが微分することを表し、MaxIndexが最大値インデックスを取得することを表し、LPF_1がローパスフィルタリングを行うことを表し、UVarianceが不偏分散を演算することを表す。また、それぞれのオペレータには、必要に応じてパラメータが付与される。図８の例では、LPF_1（ローパスフィルタリング）の処理に対して、0.861のパラメータが付与されている。

したがって、図８の特徴抽出式は、PCM波形データを時間軸に沿って音程解析したデータを、音程方向に微分し、音程方向に最大値を示すIndexを計算し（一番音の強い音程の番号を得て）、時間軸方向にローパスフィルタをかけ、最後に不偏分散を計算して、その計算結果を出力するものである。

なお、本実施の形態では、入力信号は音を表す信号で波形を表すWavを採用するが、特徴抽出式は、音の信号だけでなく、マトリックス形式（多次元のマトリックスに値が入っている形式）で表現できるものであれば、静止画像、動画像など何でもよい。

例えば、入力信号が、図９に示されるような、振幅と時間とチャンネルとのマトリクスとした音声波形の信号、図１０に示されるような、フレームのＸ軸、Ｙ軸、ＲＧＢ（R：赤，G:緑，B:青）のマトリクスと捉えた画像の信号、図１１に示されるような、フレームのＸ軸、Ｙ軸、ＲＧＢ、および、時間のマトリクスと捉えた動画像の信号である場合にも適用可能である。さらに、マトリックスで表現できるバイナリデータなどでもよい。

なお、オペレータの種類としては、図１２に示されるものがある。例えば、オペレータの種類として、平均値（Mean）、高速フーリエ変換（FFT）、標準偏差(StDev)、出現率(Ratio)、ローパスフィルタ(LPF_1)、ハイパスフィルタ(HPF_1)、絶対値(ABS)、２乗(Sqr)、平方根(Sqrt)、正規化(Normalize)、微分(Differential)、積分(Integrate)、最大値(MaxIndex)、不偏分散(UVariance)、ダウンサンプリング(DownSampling)などがある。なお、決定されたオペレータによっては処理対称軸が固定されていることがあるので、その場合、オペレータに固定されている処理対称軸を採用する。また、パラメータを必要とするオペレータが決定された場合、パラメータもランダムまたは予め設定されている値に決定する。

次に、図１３乃至図１８を参照して、アルゴリズム自動構築部１３が遺伝的探索手法に基づいて行う、アルゴリズム自動生成の流れについて説明する。

図１３に示されるように、アルゴリズム自動構築部１３は、現世代の特徴抽出式１乃至ｍに対して、各特徴抽出式を評価するための評価値を算出する。そして、アルゴリズム自動構築部１３は、現世代の特徴抽出式１乃至ｍを評価値の高い順に並び換えた後、選択生成、交差生成、突然変異生成、およびランダム生成を行うことにより、次世代の特徴抽出式１乃至ｍを生成する。現世代の特徴抽出式１乃至ｍを評価値の高い順に並び換えるのは、次世代の特徴抽出式を生成するための特徴抽出式を選択する際に、評価値の高い方から選択するためである。そして、次世代の特徴抽出式１乃至ｍが現世代の特徴抽出式１乃至ｍとなり、現世代の特徴抽出式１乃至ｍに基づく次世代の特徴抽出式１乃至ｍの生成が繰り返される。

選択生成、交差生成、突然変異生成、およびランダム生成について詳しく説明する。

選択生成は、現世代の特徴抽出式のうち、評価値の高い方から順に所定数の特徴抽出式を、そのまま次世代の特徴抽出式として選択することにより、新たな特徴抽出式を生成することを表す。

例えば、図１４に示されるように、現世代の特徴抽出式１，２，３の評価値が、それぞれ、０．５３，０．８５，０．７４である場合、最も評価値の高い現世代の特徴抽出式２が選択され、次世代の特徴抽出式１とされる。

交差生成は、現世代の特徴抽出式のうち、評価値の高い方が選ばれやすいような重み付けをしてランダムに選択した２つの特徴抽出式を、ランダムな位置で組み替える（交差する）ことにより、新たな特徴抽出式を生成することを表す。

例えば、図１５に示されるように、評価値の高かった第１の特徴抽出式「Wav,T#Differential,T#IndexLR0」と第２の特徴抽出式「Wav,T#HPF_1;0.262544,T#Mean」が選択され、第１の特徴抽出式の「Wav,T#Differential」部分と第２の特徴抽出式の「T#Mean」部分を組み合わせて、換言すれば、第１の特徴抽出式の「T#IndexLR0」部分を第２の特徴抽出式の「T#Mean」部分に組み替えて、新たな特徴抽出式が生成される。

突然変異生成は、現世代の特徴抽出式のうち、評価値の高い方が選ばれやすいような重み付けをしてランダムに選択した特徴抽出式の一部をランダムに変更することにより、新たな特徴抽出式を生成することを表す。

例えば、図１６に示されるように、評価値の高かった特徴抽出式「Wav,T#LPF_1;0.3,T#IndexLR0」が突然変異元として選択され、その特徴抽出式のなかからの１つのオペレータ「T#LPF_1;0.3」が削除されたり（突然変異例１）、オペレータ「Sqr」が追加されたり（突然変異例２）、特徴抽出式のなかの１つのオペレータ「T#LPF_1;0.3」のパラメータが0.7に変更されたりして（突然変異例３）、新たな特徴抽出式が生成される。

ランダム生成は、入力信号が１つの値（スカラ量）になるようにランダムにオペレータを組み合わせることにより、新たな特徴抽出式を生成することを表す。なお、第１世代の特徴抽出式１乃至ｍは、元にする前世代の特徴抽出式が存在しないため、すべてランダム生成により生成される。

以上の選択生成、交差生成、突然変異生成、およびランダム生成のうち、例えば、アルゴリズム自動構築部１３は、図１７に示されるように、次世代の特徴抽出式１乃至３については選択生成により求め、次世代の特徴抽出式４乃至７については交差生成により求め、次世代の特徴抽出式８乃至１３については突然変異生成により求め、次世代の特徴抽出式１乃至ｍについてはランダム生成により求める。

図１８は、現世代の特徴抽出式１乃至ｍから、次世代の特徴抽出式１乃至ｍが生成された例を示している。

図１９は、アルゴリズム自動構築部１３の詳細な構成例を示すブロック図である。

アルゴリズム自動構築部１３は、学習データ切り出し部３１、特徴抽出式リスト生成部３２、特徴量計算部３３、機械学習部３４、および特徴量抽出アルゴリズム出力部３５により構成される。

学習データ切り出し部３１は、サンプル信号保存部１２に保存されている学習データを切り出して、特徴量計算部３３および機械学習部３４に供給する。即ち、学習データ切り出し部３１は、サンプル信号保存部１２に保存されているサンプル信号とそのラベルを所定の単位時間ごとに分割し、分割された各単位時間のサンプル信号を特徴量計算部３３に供給し、分割された各単位時間のラベルを機械学習部３４に供給する。

いま、図２０に示されるように、サンプル信号保存部１２に保存されているサンプル信号とそのラベルが、学習データ切り出し部３１により、ｎ個の単位時間に分割されたとし、１番目乃至ｎ番目の各単位時間のサンプル信号を、それぞれ、データD₁乃至データD_nと称し、データD₁乃至データD_nそれぞれに対応するラベルをラベルデータと称する。この場合、学習データ切り出し部３１は、データD₁乃至データD_nを特徴量計算部３３に供給し、データD₁乃至データD_nのラベルデータを機械学習部３４に供給する。

特徴抽出式リスト生成部３２は、機械学習部３４から供給される現世代の特徴抽出式１乃至ｍの評価値に基づいて、次世代の特徴抽出式１乃至ｍを生成し、特徴量計算部３３に供給する。具体的には、特徴抽出式リスト生成部３２は、現世代の特徴抽出式１乃至ｍを、評価値の高い順に並び換え、現世代の所定の特徴抽出式に対する選択生成、交差生成、および突然変異生成と、ランダム生成を行うことにより、次世代の特徴抽出式１乃至ｍを生成する。

特徴量計算部３３は、学習データ切り出し部３１から供給されたデータD₁乃至データD_nそれぞれに対して、特徴抽出式リスト生成部３２から供給された特徴抽出式１乃至ｍの計算を行い、計算結果を、データD₁乃至データD_nの各特徴量として機械学習部３４に供給する。

図２１は、特徴量計算部３３によって計算され、機械学習部３４に供給される特徴量の例を示している。

機械学習部３４は、特徴量計算部３３から供給されたデータD₁乃至データD_nの各特徴量と、学習データ切り出し部３１から供給されたデータD₁乃至データD_nのラベルデータとを用いて、異常音判別式Uを特徴選択付き線形判別により推定する。換言すれば、特徴量計算部３３から供給されたデータD₁乃至データD_nの各特徴量を用いて、学習データ切り出し部３１から供給されたデータD₁乃至データD_nのラベルデータに最も適合する、特徴抽出式を用いた異常音判別式Uを推定する。また、機械学習部３４は、推定した異常音判別式Uを用いた場合の、各特徴抽出式の評価値を算出し、特徴抽出式リスト生成部３２に供給する。

機械学習部３４の処理についてさらに詳しく説明する。

図２２は、特徴量計算部３３と学習データ切り出し部３１から機械学習部３４に供給されたデータの例を示している。

機械学習部３４は、現世代の特徴抽出式１乃至ｍのうち、どの特徴抽出式を使用した場合または使用しない場合がデータD₁乃至データD_nのラベルデータに最も適合するかを評価し、使用する特徴抽出式の最適な組合せを決定する。

初めに、機械学習部３４は、図２３Aに示すように、現世代の特徴抽出式１乃至ｍの全てを使用しない状態（特徴抽出式１乃至ｍが未使用の状態）を基準状態として、基準状態から、図２３Bに示される、各特徴抽出式の使用/未使用を１つずつ反転させた、ｍ個の特徴抽出式の使用組み合わせを決定する。図２３Aおよび図２３Bにおいて、１行の０または１の並びは、特徴抽出式１乃至ｍの各特徴抽出式を使用する場合を“１”で、使用しない場合を“０”で表したものであり、１行の左側から順に、特徴抽出式１，２，３，・・・・，ｍの使用又は未使用を表す。

次に、機械学習部３４は、ｍ個の特徴抽出式の使用組み合わせそれぞれの場合について、異常音判別式Uを生成（推定）する。異常音判別式Uは、特徴抽出式１乃至ｍによる特徴量をＸ₁乃至Ｘ_m、線形結合係数をｂ₁乃至ｂ_m、切片をｂ₀とした場合、次の式（１）で表される。

Ｕ＝ｂ₁Ｘ₁＋ｂ₂Ｘ₂＋ｂ₃Ｘ₃＋・・・＋ｂ_mＸ_m＋ｂ₀・・・（１）

なお、式（１）において、未使用とされた特徴量に対する線形結合係数の値はゼロとなる。

線形結合係数ｂ₁乃至ｂ_mと切片ｂ₀を求めるためには、最小二乗法を用いることができる。即ち、特徴量計算部３３から供給されたデータD₁乃至データD_nの各ラベルデータのうちのｋ番目のラベルデータ（真値）をＵ_kと表すとともに、式（１）によって得られる真値Ｕ_kの予測値をＵ_k’と表すと、その予測誤差ｅ_kはｅ_k＝｛Ｕ_k−Ｕ_k’｝で表すことができる。そして、データD₁乃至データD_nの各ラベルデータについての予測誤差ｅ_kの二乗誤差Ｅ＝Σｅ_k ²が最小となる線形結合係数ｂ₁乃至ｂ_mと切片ｂ₀を求めることにより、最適な線形結合係数ｂ₁乃至ｂ_mと切片ｂ₀を求めることができる。

求められた異常音判別式Uは、例えば、次のような式となる。

Ｕ＝０．５×Ｘ₁＋０．３×Ｘ₂＋０．０×Ｘ₃＋・・・＋０．７Ｘ_m＋０．２
この異常音判別式Uの例では、線形結合係数ｂ₁，ｂ₂，ｂ₃，・・・，ｂ_m，ｂ₀が、それぞれ、０．５，０．３，０．０，・・・，０．７，０．２であり、線形結合係数がゼロである特徴抽出式３による特徴量は未使用となる。

次に、機械学習部３４は、ｍ個の特徴抽出式の使用組み合わせそれぞれの場合について生成された異常音判別式Uの評価値を計算する。ここで、異常音判別式Uの評価値を、各特徴抽出式の評価値と区別するため、評価基準値と称する。

評価基準値を求めるための評価関数には、例えば、AIC（Akaike Information Criteria）を採用することができる。AICは、小さい値ほどよい（評価が高い）ことを表す関数であり、次式（２）により計算される。

式（２）において、ｎは、教師データ、即ち、学習データ切り出し部３１から供給されたデータの数を表し、PIは円周率を表す。また、（||E||÷ｎ）は、データD₁乃至データD_nの各データに対する平均二乗誤差を表し、ｍ’は、使用となっている特徴抽出式の数を表す。

図２４は、図２３Bのｍ個の特徴抽出式の使用組み合わせそれぞれの場合について計算された各異常音判別式Uの評価基準値を表す。

機械学習部３４は、評価の最も高かった（評価基準値の最も小さかった）特徴抽出式の使用組み合わせを、次の基準状態として選択する。図２４に示した例では、図２５に示されるように、特徴抽出式４のみを使用することとした使用組み合わせによる異常音判別式Uの評価基準値が最も小さいため、機械学習部３４は、特徴抽出式４のみを使用することとした使用組み合わせを、次の基準状態として選択する。

そして、機械学習部３４は、図２６Ａに示される、基準状態である特徴抽出式４のみを使用することとした使用組み合わせに対し、図２６Ｂに示される、各特徴抽出式の使用/未使用を１つずつ反転させた、ｍ個の特徴抽出式の使用組み合わせを決定する。

機械学習部３４は、決定したｍ個の特徴抽出式の使用組み合わせそれぞれの場合について、異常音判別式Uを生成（推定）し、その評価基準値を計算し、次の基準状態を決定することを繰り返す。以上の、基準状態の決定、異常音判別式Uの生成、その評価基準値の計算が、評価基準値が更新されなくなるまで、即ち、さらに小さい評価基準値が計算されなくなるまで、繰り返される。

評価基準値が更新されなくなった異常音判別式Uが得られると、機械学習部３４は、その得られた異常音判別式Uの線形結合係数に基づいて、各特徴抽出式１乃至ｍの評価値を算出する。

具体的には、機械学習部３４は、式（３）で表される、ｉ番目の特徴量の寄与率Ｃ_iを、特徴抽出式ｉの評価値として計算する。

Ｃ_i＝ｂ_i÷StDev (Ｘ_i)×StDev（Ｔ）×Correl（Ｘ_i，Ｔ）・・・（３）

ここで、StDev(Ｘ_i)は、データD₁乃至データD_nにおける特徴抽出式ｉの値（特徴量Ｘ_i）の標準偏差を表し、StDev(Ｔ)は、データD₁乃至データD_nのラベルデータＴの標準偏差を表す。Correl(Ｔ)は、データD₁乃至データD_nにおける特徴抽出式ｉの値（特徴量Ｘ_i）と、そのラベルデータＴのピアソンの相関係数を示す。

以上のように算出された各特徴抽出式１乃至ｍの評価値が、生成された異常音判別式Uとともに、特徴抽出式リスト生成部３２に供給される。

また、次世代の特徴抽出式を生成する処理を所定回数行うなど、所定の終了条件に達した場合には、機械学習部３４は、最終世代の特徴抽出式と異常音判別式Uを特徴量抽出アルゴリズム出力部３５に供給する。最終世代の特徴抽出式は、特徴抽出式リスト生成部３２または特徴量計算部３３から取得される。

特徴量抽出アルゴリズム出力部３５は、機械学習部３４から供給された最終世代の特徴抽出式と異常音判別式Uを、トレードオフ分析部１４（図１）に供給する。

次に、トレードオフ分析部１４の詳細な処理について説明する。

トレードオフ分析部１４は、アルゴリズム自動構築部１３により構築されたアルゴリズム（異常音判別式U）を最初の１つのパレート最適解とし、アルゴリズムの実行速度と精度の２つの評価指標を用いたトレードオフ分析を行うことで、新たなパレート最適解を求める。なお、新たなパレート最適解を求める場合のパレート最適解の探索では、トレードオフ分析部１４は、現在のパレート最適解としての特徴量抽出アルゴリズムから突然変異のみで次のパレート最適解候補を生成する簡易的な遺伝的アルゴリズムを採用する。

図２７を参照して、パレート最適解について説明する。

２つの評価指標を用いてアルゴリズムを評価する場合、すべての評価指標で、評価の高い他の解が存在しない場合、その解は、パレート最適解であるということができる。反対に、すべての評価指標で、評価の高い他の解が存在する場合、その解は、パレート最適解ではない。図２７では、パレート最適解が黒丸で、非パレート最適解が白丸で示されている。

図２７に示したような、パレート最適解としての複数の異常音判別式Uを求めるため、トレードオフ分析部１４は、初めに、パレート最適解の初期化を行う。即ち、トレードオフ分析部１４は、アルゴリズム自動構築部１３により構築された異常音判別式Uに含まれる特徴抽出式のうち、ラベルデータとの相関（上述のCorrel(Ｔ)）が低い特徴抽出式から１つずつ順に未使用に設定することにより、アルゴリズム自動構築部１３により構築された異常音判別式Uに含まれる特徴抽出式の個数を最大個数として、その最大個数から１個まで、使用する特徴抽出式の個数が１個ずつ異なる複数の異常音判別式Uを生成する。

アルゴリズム自動構築部１３により構築された異常音判別式Uを基に、使用する特徴抽出式の個数が１個ずつ異なる複数の異常音判別式Uを生成することをパレート最適解の初期化という。なお、アルゴリズム自動構築部１３から供給された異常音判別式Uが、すべての特徴抽出式を使用するとは限らないので、アルゴリズム自動構築部１３により構築された異常音判別式Uに含まれる特徴抽出式の個数は、ｍ個より小さい場合があり得るが、本実施の形態では、説明を簡単にするため、すべての特徴抽出式を使用する異常音判別式Uが、アルゴリズム自動構築部１３から供給されたとして説明する。

パレート最適解の初期化について、図２８乃至図３１を参照してさらに説明する。

トレードオフ分析部１４は、図２８に示されるように、各特徴抽出式の計算にかかる平均時間（平均計算時間）と、各特徴抽出式により計算されるラベルデータとの相関係数のリストを作成する。平均計算時間は、データD₁乃至データD_nを入力して計算することにより求めることができ、相関係数は、式（３）のCorrel(Ｔ)で求めることができる。

次に、トレードオフ分析部１４は、使用している特徴抽出式のうち、最も相関係数の低い特徴抽出式を未使用に設定し、残った特徴抽出式により抽出された特徴量のみを用いて、線形結合係数ｂ₁乃至ｂ_mと切片ｂ₀を求め、新たな異常音判別式Uを決定する。また、とレートオフ分析部１４は、決定した新たな異常音判別式Uを用いて異常音判別を行ったときの判別にかかる時間（合計計算時間）と精度（推定精度）も計算する。

図２８に示したデータの例では、特徴抽出式３の相関係数が“０．０５”で最も低いため、図２９に示されるように、特徴抽出式３が未使用に設定される。そして、特徴抽出式３を除く特徴抽出式１乃至ｍを用いたときの新たな異常音判別式Uとその精度が決定され、特徴抽出式３にかかる計算時間（０．１１ms）を除く合計計算時間が計算される。

同様に、相関係数の低い順に、順次、特徴抽出式が１個ずつ未使用に設定され、新たな異常音判別式Uと、合計計算時間および精度が計算され、図３０のパレート最適解候補のリストが作成される。

トレードオフ分析部１４は、図３０に示されるパレート最適解候補のリストから、パレート最適解のみを取り出す（非パレート最適解を削除する）。具体的には、図３０に示される、パレート最適解の候補としての、特徴抽出式をｍ個使用した解１から、１個の特徴抽出式のみを使用した解ｍまでの異常音判別式Uのうち、より高精度で、かつ合計計算時間の短い他の解が存在する解３乃至解５が、非パレート最適解であるとして削除され、残った解がパレート最適解とされる。

一般的には、特徴抽出式の個数が少なくなると、合計計算時間は少なくなるが精度が低くなるという傾向をもつので、パレート最適解の初期化により生成された複数の異常音判別式Uの合計計算時間と精度をグラフにすると、図３１に示すようになる。図３１のグラフの横軸は合計計算時間（ms）であり、縦軸はF値による精度（FMs：F-Measures）である。

以上のパレート最適解の初期化により、初期状態のパレート最適解が決定される。

次に、トレードオフ分析部１４は、初期状態としての複数のパレート最適解を突然変異させることにより新たな解を生成し、より良いパレート最適解を探索するパレート最適解の更新を行う。より良いパレート最適解に更新されると、パレート最適解で結ばれる線は、図３１において矢印で示されるように、左上方向に移動する。

具体的には、トレードオフ分析部１４は、初期状態としての複数のパレート最適解のなかからランダムに１つの解を選択し、その選択された解（選択解）の複数個（例えば、１ないし３個）の特徴抽出式について、使用または未使用をランダムに変更した新たな解を生成する。

図３２は、選択解の特徴抽出式７を使用から未使用に変更し、特徴抽出式８を未使用から使用に変更することにより新たな解を生成した突然変異の例を示している。

そして、トレードオフ分析部１４は、新たな解について、合計計算時間および精度を計算し、図３０のリストを再作成して非パレート最適解を削除する。

トレードオフ分析部１４は、残ったパレート最適解に対して、再びランダムに１つの解を選択し、その選択解を基に突然変異によって新たな解を生成し、より良いパレート最適解を探索する処理を、終了条件を満足するまで、例えば、所定の繰り返し回数に達するまで実行する。

図３３は、パレート最適解を探索する処理を、初期状態のパレート最適解から、２００回繰り返し実行した後のパレート最適解を示している。

図３３において、黒丸を結ぶ実線が２００回繰り返し実行した後の各パレート最適解であり、点線が初期状態のパレート最適解を示している。また、白抜きの丸（○）は、探索処理において計算された非パレート最適解を示している。

図３４は、同様に、パレート最適解を探索する処理を１０００回繰り返し実行した後のパレート最適解を示しており、図３５は、５０００回繰り返し実行した後のパレート最適解を示している。繰り返し回数が多いほど、よりよいパレート最適解が得られるが、１０００回実行後と５０００回実行後では大きな差はみられず、所定回数の実行で十分なパレート最適解が得られることが分かる。

次に、使用アルゴリズム決定部１６および異常音自動判別部１８の処理について説明する。

使用アルゴリズム決定部１６は、上述したようにトレードオフ分析部１４により求められ、パレート最適解保存部１５に保存されているパレート最適解としての複数のアルゴリズム（異常音判別式U）のなかから、要求される処理時間および精度に基づいて、最適なアルゴリズムを決定し、異常音自動判別部１８に供給する。

例えば、図３６に示されるように、リソースには余裕があり、処理時間をかけても最高性能（最高精度）を要求する場合には、使用アルゴリズム決定部１６は、精度の最も高いパレート最適解５１のアルゴリズム（異常音判別式U）を決定し、異常音自動判別部１８に供給する。

また例えば、使用アルゴリズム決定部１６は、精度として０．７６（FMs）以上であることが要求されている場合には、要求を満足するなかで、合計計算時間（処理時間）が最も短いパレート最適解５２のアルゴリズム（異常音判別式U）を決定し、異常音自動判別部１８に供給する。

さらに、使用アルゴリズム決定部１６は、合計計算時間（処理時間）として１データ当たりの処理時間が２（ms）以下であることが要求されている場合には、パレート最適解５３のアルゴリズム（異常音判別式U）を決定し、異常音自動判別部１８に供給する。

異常音自動判別部１８は、図３７に示されるように、新規信号入力部１７から供給される新規信号を、学習データ切り出し部３１と同様の単位時間ごとに分割し、分割された各単位時間の新規信号を、使用アルゴリズム決定部１６から供給されたアルゴリズムを用いて、異常音であるか、または正常音であるかを判別し、判別結果を異常音判別結果出力部１９に供給する。なお、上述したように、新規信号の単位時間ごとの判別結果は、サンプル信号保存部１２にも供給され、保存される。

次に、図３８のフローチャートを参照して、アルゴリズム自動構築部１３が行うアルゴリズム自動構築処理について説明する。

初めに、ステップＳ１において、学習データ切り出し部３１は、サンプル信号保存部１２に保存されている学習データを切り出して、特徴量計算部３３および機械学習部３４に供給する。具体的には、学習データ切り出し部３１は、学習データから切り出したデータD₁乃至データD_nを特徴量計算部３３に供給し、データD₁乃至データD_nのラベルデータを機械学習部３４に供給する。

ステップＳ２において、特徴抽出式リスト生成部３２は、機械学習部３４から供給される現世代の特徴抽出式１乃至ｍの評価値に基づいて、次世代の特徴抽出式１乃至ｍ（特徴抽出式リスト）を生成する特徴抽出式リスト生成処理を実行する。なお、繰り返し行われるステップＳ２の処理のうち、現世代の特徴抽出式１乃至ｍが存在しない初回のステップＳ２の処理では、ランダム生成によって、次世代の特徴抽出式１乃至ｍが生成される。特徴抽出式リスト生成処理の詳細な処理は、図３９を参照して後述する。

ステップＳ３において、特徴量計算部３３は、特徴量計算処理を実行する。即ち、特徴量計算部３３は、学習データ切り出し部３１から供給されたデータD₁乃至データD_nそれぞれに対して、特徴抽出式リスト生成部３２から供給された特徴抽出式１乃至ｍに従い計算した結果を、データD₁乃至データD_nの各特徴量として機械学習部３４に供給する。特徴量計算処理の詳細な処理は、図４６を参照して後述する。

ステップＳ４において、機械学習部３４は、機械学習処理を実行する。即ち、機械学習部３４は、特徴量計算部３３から供給されたデータD₁乃至データD_nの各特徴量を用いて、学習データ切り出し部３１から供給されたデータD₁乃至データD_nのラベルデータに最も適合する、特徴抽出式を用いた異常音判別式Uを推定する。また、機械学習部３４は、推定した異常音判別式Uを用いた場合の、各特徴抽出式の評価値を算出し、特徴抽出式リスト生成部３２に供給する。機械学習処理の詳細な処理は、図４７を参照して後述する。

ステップＳ５において、機械学習部３４は、終了条件に達したかを判定する。具体的には、例えば、上述したステップＳ２乃至Ｓ４の処理を予め設定した所定回数繰り返し実行した場合や終了する操作が検出された場合、機械学習部３４は、終了条件に達したと判定する。

ステップＳ５で、終了条件に達していないと判定された場合、処理はステップＳ２に戻り、それ以降の処理が繰り返される。

一方、ステップＳ５で、終了条件に達したと判定された場合、処理はステップＳ６に進み、機械学習部３４は、最終世代の特徴抽出式と異常音判別式Uを特徴量抽出アルゴリズム出力部３５に供給する。特徴量抽出アルゴリズム出力部３５は、最終世代の特徴抽出式と異常音判別式Uを、トレードオフ分析部１４に出力して、処理を終了する。

次に、図３９のフローチャートを参照して、図３８のステップＳ２において実行される、特徴抽出式リスト生成処理について説明する。

ステップＳ２１において、特徴抽出式リスト生成部３２は、生成する特徴抽出式リストは、２世代目以降であるかを判定する。

ステップＳ２１において、２世代目以降ではない、すなわち、１世代目だと判定された場合、処理はステップＳ２２に進み、特徴抽出式リスト生成部３２は、図４０を参照して後述する、ランダム生成処理を実行する。

ステップＳ２１において、２世代目以降であると判定された場合、処理はステップＳ２３に進み、特徴抽出式リスト生成部３２は、図４１を参照して後述する次世代リスト生成処理を実行する。

ステップＳ２２またはステップＳ２３の処理の終了後、ステップＳ２４において、特徴抽出式リスト生成部３２は、ステップＳ２２またはステップＳ２３の処理によって生成された特徴抽出式リストを特徴量計算部３３に供給し、処理は、図３８のステップＳ２に戻り、ステップＳ３に進む。

このように、１世代目においては、全ての特徴抽出式がランダムに生成され、２世代目以降においては、遺伝的探索手法を用いた次世代のリストの生成処理が実行される。

次に、図４０のフローチャートを参照して、図３９のステップＳ２２において実行される、ランダム生成処理について説明する。

ステップＳ４１において、特徴抽出式リスト生成部３２は、式ループパラメータＭを１に初期化して式ループを開始する。なお、式ループは、特徴抽出式リストを構成する特徴抽出式の数ｍだけ繰り返される。

ステップＳ４２において、特徴抽出式リスト生成部３２は、第Ｍ番目の特徴抽出式（以下、特徴抽出式[Ｍ]とも記述する）の入力信号の種類を決定する。本実施の形態では、入力信号の種類は、波形を表すWavに決定される。

ステップＳ４３において、特徴抽出式リスト生成部３２は、生成する特徴抽出式[Ｍ]の処理対称軸とオペレータをランダムに１つ決定する。

ステップＳ４４において、特徴抽出式リスト生成部３２は、現時点までに生成されている特徴抽出式[Ｍ]の演算結果がスカラ量（１次元）であるかを判定する。ステップＳ４４において、演算結果がスカラ量ではないと判定された場合、処理はステップＳ４３に戻り、それ以降の処理が繰り返されて、オペレータが１つ追加される。

そして、ステップＳ４４において、演算結果がスカラ量であると判定された場合、ステップＳ４５において、特徴抽出式リスト生成部３２は、式ループパラメータＭが最大値ｍよりも小さいかを判定する。ステップＳ４５において、式ループパラメータＭが最大値ｍよりも小さいと判定された場合、式ループパラメータＭが１だけインクリメントされて、処理はステップＳ４２に戻り、それ以降の処理が繰り返される。

一方、ステップＳ４５において、式ループパラメータＭが最大値ｍよりも小さくない（式ループパラメータＭが最大値ｍと同値である）と判定された場合、式ループを抜けて、処理は図３９のステップＳ２２に戻り、ステップＳ２４に進む。

以上の処理により、１世代目の特徴抽出式リストが生成される。

次に、図４１のフローチャートを参照して、図３９のステップＳ２３において実行される、次世代リスト生成処理について説明する。

ステップＳ６１において、特徴抽出式リスト生成部３２は、選択生成処理により生成する特徴抽出式の数（選択数）をms、交差生成処理により生成する特徴抽出式の数（交差数）をmx、突然変異生成処理により生成する特徴抽出式の数（突然変異数）をmm、ランダム生成処理により生成する特徴抽出式の数（ランダム生成数）をmrとして、それぞれの値を、ｍｓ＋ｍｘ＋ｍｍ＋ｍｒ＝ｍ（ｍは特徴抽出式の総数）を満たすように決定する。

それぞれの値は、その比率が予め定められているものであっても良いし、ｍｓ＋ｍｘ＋ｍｍ＋ｍｒ＝ｍを満たすようにランダムに決定しても良い。

ステップＳ６２において、特徴抽出式リスト生成部３２は、図４２を参照して後述する選択生成処理を実行する。

ステップＳ６３において、特徴抽出式リスト生成部３２は、図４３を参照して後述する交差生成処理を実行する。

ステップＳ６４において、特徴抽出式リスト生成部３２は、図４４を参照して後述する突然変異処理を実行する。

ステップＳ６５において、特徴抽出式リスト生成部３２は、図４５を参照して後述するランダム生成処理を実行する。ランダム生成処理終了後、処理は図３９のステップＳ２３に戻り、ステップＳ２４に進む。

このような処理により、２世代目以降の特徴抽出式リストが、遺伝的探索手法に基づいて生成される。

次に、図４２のフローチャートを参照して、図４１のステップＳ６２において実行される、選択生成処理について説明する。

ステップＳ９１において、特徴抽出式リスト生成部３２は、現世代の特徴抽出式を、評価値の高い順にソートする。

ステップＳ９２において、特徴抽出式リスト生成部３２は、上位ms個の特徴抽出式を次世代の特徴抽出式として採用し、処理は図４１のステップＳ６２に戻り、ステップＳ６３に進む。

このような処理により、評価値の高い特徴抽出式を選択して、次世代の特徴抽出式リストにコピーすることができる。

次に、図４３のフローチャートを参照して、図４１のステップＳ６３において実行される、交差生成処理について説明する。

ステップＳ１２１において、特徴抽出式リスト生成部３２は、交差ループパラメータＭＸを１に初期化して、交差ループを開始する。なお、交差ループは、交差数ｍｘだけ繰り返される。

ステップＳ１２２において、特徴抽出式リスト生成部３２は、現世代の特徴抽出式リストに含まれる全ての特徴抽出式から、評価値が高いものほど選択されやすいように重み付けをしながらランダムに特徴抽出式を1つ選択して式Ａとする。

ステップＳ１２３において、特徴抽出式リスト生成部３２は、現世代の特徴抽出式リストに含まれる全ての特徴抽出式から、評価値が高いものほど選択されやすいように重み付けをしながらランダムに特徴抽出式を1つ選択して式Ｂとする。

ステップＳ１２４において、特徴抽出式リスト生成部３２は、式Ｂは式Ａとは異なる特徴抽出式であるかを判定する。ステップＳ１２４において、式Ｂは式Ａとは異なる特徴抽出式ではないと判定された場合、処理はステップＳ１２３に戻り、それ以降の処理が繰り返されて、式Ｂは式Ａとは異なる特徴抽出式であると判定されるまで、式Ｂが新たに選択される。

ステップＳ１２４において、式Ｂは式Ａとは異なる式であると判定された場合、処理はステップＳ１２５に進み、特徴抽出式リスト生成部３２は、式Ａと式Ｂのうちの一部を組み替えて、新しい特徴抽出式を作る。

このとき、特徴抽出式リスト生成部３２は、組み合わせた後の特徴抽出式を計算することにより、入力されたデータからスカラ量を求めることができるような、すなわち、先頭から順番に演算処理を実行した場合、処理軸の矛盾が発生しないような組み合わせで、この２つの式の一部を組み合わせる。

ステップＳ１２６において、特徴抽出式リスト生成部３２は、ステップＳ１２５において生成された新しい特徴抽出式を次世代の特徴抽出式に加える。

ステップＳ１２７において、特徴抽出式リスト生成部３２は、交差ループパラメータＭＸが最大値である交差数ｍｘよりも小さいかを判定する。ステップＳ１２７において、交差ループパラメータＭＸが交差数ｍｘよりも小さいと判定された場合、交差ループパラメータＭＸを１インクリメントして、処理はステップＳ１２２に戻り、それ以降の処理が繰り返される。一方、ステップＳ１２７において、交差ループパラメータＭＸが交差数ｍｘよりも小さくない、すなわち、同一の値であると判定された場合、交差ループを抜けるので、処理は図４１のステップＳ６３に戻り、ステップＳ６４に進む。

交差ループであるステップＳ１２２乃至Ｓ１２６の処理が１回実行されるごとに、次世代の特徴抽出式リストに含まれる特徴抽出式のうちの１個が生成され、交差ループが終了された場合、特徴抽出式リストに含まれる特徴抽出式のうちのｍｘ個が生成されたことになる。

このような処理により、現世代の特徴抽出式リストのうち、評価値が高いものほど選択されやすいように重み付けをしながら特徴抽出式が選択され、それを用いて、交差生成処理により、次世代の特徴抽出式リストに含まれる特徴抽出式が生成される。

次に、図４４のフローチャートを参照して、図４１のステップＳ６４において実行される、突然変異生成処理について説明する。

ステップＳ１５１において、特徴抽出式リスト生成部３２は、突然変異ループパラメータＭＭを１に初期化して、突然変異ループを開始する。なお、突然変異ループは、突然変異数ｍｍだけ繰り返される。

ステップＳ１５２において、特徴抽出式リスト生成部３２は、現世代の特徴抽出式リストに含まれる全ての特徴抽出式から、評価値が高いものほど選択されやすいように重み付けをしながらランダムに特徴抽出式を1つ選択して式Ａとする。

ステップＳ１５３において、特徴抽出式リスト生成部３２は、選択した式Ａの一部に対して、変更、削除、または、内部のパラメータを変更するなどの処理を施すことにより突然変異させて新しい特徴抽出式を作る。

このとき、特徴抽出式リスト生成部３２は、特徴抽出式の一部を変更した後の特徴抽出式を計算することにより、入力されたデータからスカラ量を求めることができるような、すなわち、先頭から順番に演算処理を実行した場合、処理軸の矛盾が発生しないような方法で、特徴抽出式の一部を変更する。

ステップＳ１５４において、特徴抽出式リスト生成部３２は、ステップＳ１５３において生成された新しい特徴抽出式を次世代の特徴抽出式に加える。

ステップＳ１５５において、特徴抽出式リスト生成部３２は、突然変異ループパラメータＭＭが最大値である突然変異数ｍｍよりも小さいかを判定する。ステップＳ１２７において、突然変異ループパラメータＭＭが突然変異数ｍｍよりも小さいと判定された場合、突然変異ループパラメータＭＭを１インクリメントして、処理はステップＳ１５２に戻り、それ以降の処理が繰り返される。一方、ステップＳ１５５において、突然変異ループパラメータＭＭが突然変異数ｍｍよりも小さくない、すなわち、同一の値であると判定された場合、突然変異ループを抜けるので、処理は図４１のステップＳ６４に戻り、ステップＳ６５に進む。

突然変異ループであるステップＳ１５２乃至Ｓ１５４の処理が１回実行されるごとに、次世代の特徴抽出式リストに含まれる特徴抽出式のうちの１個が生成され、突然変異ループが終了された場合、特徴抽出式リストに含まれる特徴抽出式のうちのｍｍ個が生成されたことになる。

このような処理により、現世代の特徴抽出式リストのうち、評価値が高いものほど選択されやすいように重み付けをしながら特徴抽出式が選択され、それを用いて、突然変異生成処理により、次世代の特徴抽出式リストに含まれる特徴抽出式が生成される。

次に、図４５のフローチャートを参照して、図４１のステップＳ６５において実行される、ランダム生成処理について説明する。

ステップＳ１８１において、特徴抽出式リスト生成部３２は、ランダム生成ループパラメータＭＲを１に初期化してランダム生成ループを開始する。なお、ランダム生成ループは、特徴抽出式リストを構成する特徴抽出式の数ｍｒだけ繰り返される。

ステップＳ１８２において、特徴抽出式リスト生成部３２は、第ＭＲ番目の特徴抽出式（以下、特徴抽出式[ＭＲ]とも記述する）の入力信号の種類を決定する。本実施の形態では、入力信号の種類は、波形を表すWavに決定される。

ステップＳ１８３において、特徴抽出式リスト生成部３２は、生成する特徴抽出式[ＭＲ]の処理対称軸とオペレータをランダムに１つ決定する。

ステップＳ１８４において、特徴抽出式リスト生成部３２は、現時点までに生成されている特徴抽出式[ＭＲ]の演算結果がスカラ量（１次元）であるかを判定する。ステップＳ１８４において、演算結果がスカラ量ではないと判定された場合、処理はステップＳ１８３に戻り、それ以降の処理が繰り返されて、オペレータが１つ追加される。

そして、ステップＳ１８４において、演算結果がスカラ量であると判定された場合、ステップＳ１８５において、特徴抽出式リスト生成部３２は、ランダム生成ループパラメータＭＲが最大値ｍｒよりも小さいかを判定する。ステップＳ１８５において、ランダム生成ループパラメータＭＲが最大値ｍｒよりも小さいと判定された場合、ランダム生成ループパラメータＭＲが１だけインクリメントされて、処理はステップＳ１８２に戻り、それ以降の処理が繰り返される。一方、ステップＳ１８５において、ランダム生成ループパラメータＭＲが最大値ｍｒよりも小さくない（ランダム生成ループパラメータＭＲが最大値ｍｒと同値である）と判定された場合、ランダム生成ループを抜けて、処理は図４１のステップＳ６５に戻り、さらに図３９のステップＳ２３に戻り、ステップＳ２４に進む。

ランダム生成ループであるステップＳ１８２乃至Ｓ１８５の処理が１回実行されるごとに、次世代の特徴抽出式リストに含まれる特徴抽出式のうちの１個が生成され、ランダム生成ループが終了された場合、特徴抽出式リストに含まれる特徴抽出式のうちのｍｒ個が生成されたことになる。

このような処理により、ランダム生成処理により、次世代の特徴抽出式リストに含まれる特徴抽出式のうちの一部が生成される。

次に、図４６のフローチャートを参照して、図３８のステップＳ３において実行される、特徴量計算処理について説明する。

ステップＳ２１１において、特徴量計算部３３は、特徴抽出式リスト生成部３２から、特徴抽出式リストを取得し、式ループパラメータＭを１に初期化して、式ループを開始する。なお、式ループは、特徴抽出式リストを構成する特徴抽出式の数ｍだけ繰り返される。

ステップＳ２１２において、特徴量計算部３３は、データループパラメータＮを１に初期化してデータループを開始する。なお、データループは、学習データ切り出し部３１により切り出されたデータＤの数ｎだけ繰り返される。

ステップＳ２１３において、特徴量計算部３３は、データD_Nに対して、第Ｍ番目の特徴抽出式（特徴抽出式[Ｍ]）を用いたときの特徴量を計算する。

ステップＳ２１４において、特徴量計算部３３は、データループパラメータＮが最大値ｎよりも小さいかを判定する。ステップＳ２１４において、データループパラメータＮが最大値ｎよりも小さいと判定された場合、データループパラメータＮが１だけインクリメントされて、処理はステップＳ２１３に戻り、それ以降の処理が繰り返される。

一方、ステップＳ２１４において、データループパラメータＮが最大値ｎよりも小さくない（データループパラメータＮが最大値ｎと同値である）と判定された場合、データループを抜けて、処理はステップＳ２１５に進む。

ステップＳ２１５において、特徴量計算部３３は、式ループパラメータＭが最大値ｍよりも小さいかを判定する。ステップＳ２１５において、式ループパラメータＭが最大値ｍよりも小さいと判定された場合、式ループパラメータＭが１だけインクリメントされて、処理はステップＳ２１２に戻り、それ以降の処理が繰り返される。一方、ステップＳ２１５において、式ループパラメータＭが最大値ｍよりも小さくない（式ループパラメータＭが最大値ｍと同値である）と判定された場合、式ループを抜けて、処理は図３８のステップＳ３に戻り、ステップＳ４に進む。

以上の処理により、各特徴抽出式を用いた特徴量が計算される。

次に、図４７のフローチャートを参照して、図３８のステップＳ４において実行される、機械学習処理について説明する。

ステップＳ２４１において、機械学習部３４は、現世代の特徴抽出式１乃至ｍの基準状態を作成する。即ち、機械学習部３４は、現世代の特徴抽出式１乃至ｍの全てを未使用に設定する。

ステップＳ２４２において、機械学習部３４は、特徴量ループパラメータＭを１に初期化して特徴量ループを開始する。なお、特徴量ループは、特徴抽出式リストを構成する特徴抽出式の数ｍだけ繰り返される。

ステップＳ２４３において、機械学習部３４は、基準状態の特徴抽出式１乃至ｍから、Ｍ番目の特徴抽出式による特徴量の使用/未使用を反転させた特徴抽出式の使用組み合わせ（以下、特徴抽出式の反転使用組み合わせ[Ｍ]とも記述する）を決定する。

ステップＳ２４４において、機械学習部３４は、特徴抽出式の反転使用組み合わせ[Ｍ]における異常音判別式Uを生成（推定）する。

ステップＳ２４５において、機械学習部３４は、生成された異常音判別式Uの評価基準値（AIC）を計算する。

ステップＳ２４６において、機械学習部３４は、特徴量ループパラメータＭが最大値ｍよりも小さいかを判定する。ステップＳ２４６において、特徴量ループパラメータＭが最大値ｍよりも小さいと判定された場合、特徴量ループパラメータＭが１だけインクリメントされて、処理はステップＳ２４３に戻り、それ以降の処理が繰り返される。一方、ステップＳ２４６において、特徴量ループパラメータＭが最大値ｍよりも小さくない（特徴量ループパラメータＭが最大値ｍと同値である）と判定された場合、特徴量ループを抜けて、処理はステップＳ２４７に進む。

そして、ステップＳ２４７において、機械学習部３４は、評価の最も高かった（評価基準値の最も小さかった）特徴抽出式の反転使用組み合わせを新たな基準状態として選択する。

ステップＳ２４８において、機械学習部３４は、生成された異常音判別式Uの評価基準値が更新されなくなったかを判定する。ステップＳ２４８において、評価基準値がまだ更新されていると判定された場合、処理はステップＳ２４２に戻り、それ以降の処理が繰り返される。

一方、ステップＳ２４８において、評価基準値が更新されなくなったと判定された場合、処理は図３８のＳ４に戻り、ステップＳ５に進む。

次に、図４８のフローチャートを参照して、トレードオフ分析部１４が実行する、トレードオフ分析処理について説明する。

ステップＳ２７１において、トレードオフ分析部１４は、図４９を参照して後述するパレート最適解の初期化処理を行う。これにより、初期状態の複数のパレート最適解が生成される。

ステップＳ２７２において、トレードオフ分析部１４は、初期状態の複数のパレート最適解のなかからランダムに１つの解を選択し、その選択された解（選択解）の突然変異によって新たな解を生成する。例えば、トレードオフ分析部１４は、選択解の１ないし３個の特徴抽出式について、使用/未使用をランダムに変更した新たな解を生成する。

ステップＳ２７３において、トレードオフ分析部１４は、新たな解を用いた場合の合計計算時間および精度を計算する。

続くステップＳ２７４乃至Ｓ２７７の処理により、トレードオフ分析部１４は、パレート最適解を更新する。即ち、ステップＳ２７４において、トレードオフ分析部１４は、新たな解をパレート最適解に加え、解ループパラメータＫを１に初期化して解ループを開始する。なお、解ループは、現在保存しているパレート最適解の総数ｋだけ繰り返される。

ステップＳ２７５において、トレードオフ分析部１４は、Ｋ番目のパレート最適解（以下、パレート最適解[Ｋ]とも記述する）よりも高速かつ精度の高い解が存在するかを判定する。ステップＳ２７５において、パレート最適解[Ｋ]よりも高速かつ精度の高い解が存在すると判定された場合、処理はステップＳ２７６に進み、トレードオフ分析部１４は、パレート最適解[Ｋ]をパレート最適解から削除する。

一方、ステップＳ２７５において、パレート最適解[Ｋ]よりも高速かつ精度の高い解が存在しないと判定された場合、処理はステップＳ２７７に進み、トレードオフ分析部１４は、解ループパラメータＫが最大値ｋよりも小さいかを判定する。ステップＳ２７５において、解ループパラメータＫが最大値ｋよりも小さいと判定された場合、解ループパラメータＫが１だけインクリメントされて、処理はステップＳ２７５に戻り、それ以降の処理が繰り返される。

一方、解ループパラメータＫが最大値ｋよりも小さくない（解ループパラメータＫが最大値ｋと同値である）と判定された場合、解ループを抜けて、処理はステップＳ２７８に進む。

ステップＳ２７８において、トレードオフ分析部１４は、複数のパレート最適解から突然変異させ、新たな解を生成してパレート最適解を探索する処理を所定回数繰り返したかを判定する。ステップＳ２７８において、パレート最適解を探索する処理を所定回数繰り返していないと判定された場合、処理はステップＳ２７２に戻り、それ以降の処理が繰り返される。

一方、ステップＳ２７８において、パレート最適解を探索する処理を所定回数繰り返したと判定された場合、処理は終了する。

次に、図４９のフローチャートを参照して、図４８のステップＳ２７１において実行される、パレート最適解の初期化処理について説明する。

ステップＳ３０１において、トレードオフ分析部１４は、特徴量ループパラメータＭを１に初期化して特徴量ループを開始する。なお、特徴量ループは、特徴抽出式リストを構成する特徴抽出式の数ｍだけ繰り返される。

ステップＳ３０２において、トレードオフ分析部１４は、第Ｍ番目の特徴抽出式（以下、特徴抽出式[Ｍ]とも記述する）の計算にかかる平均時間（平均計算時間）と、ラベルデータとの相関係数を計算する。

ステップＳ３０３において、トレードオフ分析部１４は、特徴量ループパラメータＭが最大値ｍよりも小さいかを判定する。ステップＳ３０３において、特徴量ループパラメータＭが最大値ｍよりも小さいと判定された場合、特徴量ループパラメータが１だけインクリメントされて、処理はステップＳ３０２に戻り、それ以降の処理が繰り返される。ステップＳ３０３において、特徴量ループパラメータＭが最大値ｍよりも小さくない（特徴量ループパラメータＭが最大値ｍと同値である）と判定された場合、特徴量ループを抜けて、処理はステップＳ３０４に進む。

ステップＳ３０４において、トレードオフ分析部１４は、使用している特徴抽出式のうち、最も相関係数の低い特徴抽出式を未使用に設定する。

ステップＳ３０５において、トレードオフ分析部１４は、未使用に設定された特徴抽出式を除いて、残った特徴抽出式により抽出された特徴量のみを用いて線形判別を行い、新たな異常音判別式Uを決定する。また、ステップＳ３０５において、トレードオフ分析部１４は、決定した新たな異常音判別式Uを用いて異常音判別を行ったときの精度を計算する。

ステップＳ３０６において、トレードオフ分析部１４は、決定した新たな異常音判別式Uを用いて異常音判別を行ったときの判別にかかる時間（合計計算時間）を計算し、パレート最適解候補のリストに加える。

ステップＳ３０７において、トレードオフ分析部１４は、残っている特徴抽出式が１つであるかを判定する。ステップＳ３０７において、残っている特徴抽出式が１つではないと判定された場合、処理はステップＳ３０４に戻り、それ以降の処理が繰り返される。

一方、残っている特徴抽出式が１つであると判定された場合、処理はステップＳ３０８に進み、トレードオフ分析部１４は、パレート最適解を更新する処理を行う。このパレート最適解を更新する処理は、上述した図４８のステップＳ２７４乃至Ｓ２７７の処理と同様であるので、その説明は省略する。ステップＳ３０８の後、処理は図４８のステップＳ２７１に戻り、ステップＳ２７２に進む。

以上のように、パレート最適解の初期化が行われた後、より良いパレート最適解が探索され、更新される。

上述したトレードオフ分析処理により求められ、パレート最適解保存部１５に保存されているパレート最適解としての複数のアルゴリズム（異常音判別式U）のなかから、使用アルゴリズム決定部１６は、現在の情報処理装置１の空きリソース状況、要求される性能などの情報に基づいて、最適なアルゴリズムを決定し、異常音自動判別部１８に供給する。異常音自動判別部１８は、使用アルゴリズム決定部１６から供給されたアルゴリズムに基づいて、入力された新規信号が異常音であるかまたは正常音であるかを判別する。

従って、情報処理装置１は、空きリソース状況（処理速度）、要求される性能（精度）など、複数の評価指標のトレードオフ関係となる複数のアルゴリズムを提示することができる。また、情報処理装置１は、複数の評価指標のトレードオフ関係となる複数のアルゴリズムのなかから、そのときの状況に応じて最適なアルゴリズムを決定し、決定したアルゴリズムを用いた判別を行うことができる。

次に、上述したパレート最適解の概念を用いたその他の実施の形態について説明する。

図５０は、本発明を適用したその他の実施の形態であるアルゴリズム自動構築システム１０１のブロック図である。なお、最初の実施の形態と対応する部分については同一の符号を付してあり、その説明は適宜省略する。

アルゴリズム自動構築システム１０１は、教師データ取得部１３１、特徴抽出式リスト生成部３２、特徴量計算部１３２、評価値計算部１３３、およびアルゴリズム出力部１３４により構成されている。

教師データ取得部１３１は、入力される教師データとしての複数の波形信号（波形データ）とそれらのデータから抽出すべき目的変数の値を取得し、波形信号を特徴量計算部１３２に供給するとともに、その波形信号の目的変数の値を評価値計算部１３３に供給する。

例えば、図５１に示されるように、ｌ個の波形データDD₁乃至DD_lとその目的変数の値が教師データとして取得され、特徴量計算部１３２または評価値計算部１３３に供給される。

特徴量計算部１３２は、教師データ取得部１３１から供給された波形データDD₁乃至DD_lそれぞれに対して、特徴抽出式リスト生成部３２から供給された特徴抽出式１乃至ｍの計算を行い、計算結果を、波形データDD₁乃至DD_lの各特徴量として評価値計算部１３３に供給する。

また、特徴量計算部１３２は、各特徴抽出式を計算するのにかかる平均時間を計算し、評価値計算部１３３に供給する。

図５２は、特徴量計算部１３２により計算され、評価値計算部１３３に供給される各特徴量と平均時間の例を示している。

評価値計算部１３３は、パレート最適解の候補である解候補を生成する。

最初に、評価値計算部１３３は、ランダムに特徴抽出式１乃至ｍによる各特徴量の使用/未使用を決定する。また、評価値計算部１３３は、１以上のパレート最適解を既に保持している場合には、その保持しているパレート最適解のなかからランダムに１つの解を選択し、選択した解を突然変異させることにより（任意の特徴抽出式の使用/未使用を変更することにより）、特徴抽出式１乃至ｍによる各特徴量の使用/未使用を決定することもできる。

図５３Aは、ランダムに特徴抽出式１乃至ｍによる各特徴量の使用/未使用が決定された例を示しており、図５３Bは、パレート最適解のなかから選択した解を突然変異させることにより、特徴抽出式１乃至ｍによる各特徴量の使用/未使用が決定された例を示している。

次に、評価値計算部１３３は、決定されたｍ個の特徴抽出式の使用組み合わせによる、解候補としての情報推定式を生成（推定）する。すなわち、評価値計算部１３３は、図５４に示されるように、特徴量計算部１３２から供給された波形データDD₁乃至DD_lの各特徴量と目的変数を対応付け、式（１）と同様の情報推定式に代入し、目的変数の予測誤差の二乗誤差が最小となるような線形結合係数ｂ₁乃至ｂ_mと切片ｂ₀を求める。なお、情報推定式は、速さと明るさの両方の目的変数について作成される。

続いて、評価値計算部１３３は、式（２）を使って、生成した情報推定式を評価するための評価基準値（情報量基準）を目的変数ごとに計算する。

また、評価値計算部１３３は、生成した情報推定式により目的変数を計算した場合にかかる時間である合計計算時間を計算する。具体的には、図５５に示されるように、特徴量計算部１３２から供給された、各特徴抽出式の演算に要する平均時間のうち、未使用の特徴抽出式の平均時間を除外して合計した時間の和が、生成した情報推定式の合計計算時間となる。図５５の例では、特徴抽出式３が未使用であるため、特徴抽出式３の平均時間である０．３msは合計計算時間には含まれない。

図５６は、解候補としての情報推定式に対して計算された、速さの評価基準値、明るさの評価基準値、および合計計算時間を示している。

次に、評価値計算部１３３は、解候補の速さの評価基準値、明るさの評価基準値、および合計計算時間と、現在保持しているパレート最適解の速さの評価基準値、明るさの評価基準値、および合計計算時間とを比較して、非パレート最適解を削除する。

図５７は、現在保持しているｐ個のパレート最適解と、解候補とを比較した例を示している。

図５７に示される例では、パレート最適解３が、速さの評価基準値、明るさの評価基準値、および合計計算時間のいずれの評価指標においても、解候補より劣るので、非パレート最適解であるとしてパレート最適解から削除される。

なお、評価値計算部１３３は、１つのパレート最適解または解候補ごとに、各特徴抽出式の使用/未使用を表す情報、目的変数（情報の種類）ごとの情報推定式のパラメータ（線形結合係数ｂ₁乃至ｂ_mと切片ｂ₀）、目的変数（情報の種類）ごとの評価基準値、および合計計算時間を保持している。

次に、評価値計算部１３３は、残ったパレート最適解を用いて、各特徴抽出式の評価値を算出する。各特徴抽出式の評価値の算出の基本的な考え方は、最初の実施の形態と同様であるが、本実施の形態では、目的変数（情報の種類）が複数あり、パレート最適解（情報推定式）も複数あるので、評価値算出部１３３は、各パレート最適解（情報推定式）のｉ番目の特徴量の寄与率Ｃ_iどうしを、全ての目的変数（情報の種類）で合計した値として求める。

すなわち、上述した式（３）の寄与率Ｃ_iを、ｊ番目（ｊ＝１乃至ｋ）の目的変数（情報の種類）Ｔ_jについての、パレート最適解ｏ（ｏ＝１乃至ｐ）のｉ番目の特徴量Ｘ_iの寄与率Ｃ（ｏ，Ｘ_i，Ｔ_j）として書き直すと、

と表すことができる。

そして、寄与率Ｃ（ｏ，Ｘ_i，Ｔ_j）を全てのパレート最適解の全ての目的変数で合計する式（５）のＳＵＭ＿Ｃ_iにより、各特徴抽出式の評価値が算出される。

評価値計算部１３３は、式（５）で表される各特徴抽出式の評価値ＳＵＭ＿Ｃ_iを計算し、その結果を特徴抽出式リスト生成部３２に供給する。

上述したパレート最適解の更新および各特徴抽出式の評価値の計算を所定回数だけ行うことにより、所定の終了条件に達した場合には、評価値計算部１３３は、最終的に残ったパレート最適解をアルゴリズム出力部１３４に供給する。

アルゴリズム出力部１３４は、供給されたパレート最適解のなかから、求める速さや明るさの精度を重視するのか、または、処理速度（合計計算時間）を重視するのかなど、必要に応じて最適なアルゴリズムを選択し、出力する。なお、どのアルゴリズムを選択するかは、例えば、ユーザの指示に応じて決定してもよい。

次に、図５８のフローチャートを参照して、特徴抽出式リスト生成部３２、特徴量計算部１３２、および評価値計算部１３３が行う、パレート最適解探索処理について説明する。

初めに、ステップＳ４０１において、特徴抽出式リスト生成部３２は、評価値計算部１３３から供給される現世代の特徴抽出式１乃至ｍの評価値に基づいて、次世代の特徴抽出式１乃至ｍ（特徴抽出式リスト）を生成する特徴抽出式リスト生成処理を実行する。この処理は、上述した図３８のステップＳ２の処理と同様であるので詳細な説明は省略する。

ステップＳ４０２において、特徴量計算部１３２は、特徴量計算処理を実行する。即ち、特徴量計算部１３２は、教師データ取得部１３１から供給された波形データDD₁乃至DD_lそれぞれに対して、各特徴抽出式による特徴量と各特徴抽出式を計算するのにかかる平均時間を計算する。特徴量計算処理の詳細は、図５９のフローチャートを参照して後述する。

ステップＳ４０３において、評価値計算部１３３は、評価値計算処理を実行する。即ち、評価値計算部１３３は、パレート最適解の候補である解候補を生成し、現在保持しているパレート最適解と比較して、非パレート解を削除するパレート最適解の更新を行い、残ったパレート最適解に基づいて、各特徴抽出式の評価値を計算する。評価値計算処理の詳細は、図６１のフローチャートを参照して後述する。

ステップＳ４０４において、評価値計算部１３３は、終了条件に達したかを判定する。具体的には、例えば、上述したステップＳ４０１乃至Ｓ４０３の処理を予め設定した所定回数繰り返し実行した場合や終了する操作が検出された場合、評価値計算部１３３は、終了条件に達したと判定する。

ステップＳ４０４で、終了条件に達していないと判定された場合、処理はステップＳ４０１に戻り、それ以降の処理が繰り返される。

一方、ステップＳ４０４で、終了条件に達したと判定された場合、処理はステップＳ４０５に進み、評価値計算部１３３は、最終世代の特徴抽出式と情報推定式のパレート最適解をアルゴリズム出力部１３４に出力して、処理を終了する。

アルゴリズム出力部１３４は、評価値計算部１３３から供給されたパレート最適解のなかから、速さや明るさの精度を重視するのか、または、処理速度（合計計算時間）を重視するのかなど、必要に応じて最適なアルゴリズムを選択し、出力する。

次に、図５９のフローチャートを参照して、図５８のステップＳ４０２において実行される、特徴量計算処理について説明する。

ステップＳ４１１において、特徴量計算部１３２は、特徴抽出式リスト生成部３２から、特徴抽出式リストを取得し、式ループパラメータＭを１に初期化して、式ループを開始する。なお、式ループは、特徴抽出式リストを構成する特徴抽出式の数ｍだけ繰り返される。

ステップＳ４１２において、特徴量計算部１３２は、データループパラメータＬを１に初期化してデータループを開始する。なお、データループは、教師データ取得部１３１が取得した波形データDDの数ｌだけ繰り返される。

ステップＳ４１３において、特徴量計算部１３２は、波形データDD_Lに対して、Ｍ番目の特徴抽出式（特徴抽出式[Ｍ]）を用いたときの特徴量を計算するとともに、その計算に要した時間を保持する。

ステップＳ４１４において、特徴量計算部１３２は、データループパラメータＬが最大値ｌよりも小さいかを判定する。ステップＳ４１４において、データループパラメータＬが最大値ｌよりも小さいと判定された場合、データループパラメータＬが１だけインクリメントされて、処理はステップＳ４１３に戻り、それ以降の処理が繰り返される。

一方、ステップＳ４１４において、データループパラメータＬが最大値ｌよりも小さくない（データループパラメータＬが最大値ｌと同値である）と判定された場合、コンテンツループを抜けて、処理はステップＳ４１５に進む。

ステップＳ４１５において、特徴量計算部１３２は、特徴抽出式[Ｍ]を計算するのにかかる平均時間を計算する。すなわち、特徴量計算部１３２は、ステップＳ４１３で計算し、保持しておいた、波形データDD₁乃至DD_lそれぞれの特徴抽出式[Ｍ]の計算時間の平均値を計算する。

ステップＳ４１６において、特徴量計算部１３２は、式ループパラメータＭが最大値ｍよりも小さいかを判定する。ステップＳ４１６において、式ループパラメータＭが最大値ｍよりも小さいと判定された場合、式ループパラメータＭが１だけインクリメントされて、処理はステップＳ４１２に戻り、それ以降の処理が繰り返される。一方、ステップＳ４１６において、式ループパラメータＭが最大値ｍよりも小さくない（式ループパラメータＭが最大値ｍと同値である）と判定された場合、式ループを抜けて、処理は図５８のステップＳ４０２に戻り、ステップＳ４０３に進む。

次に、図６０のフローチャートを参照して、図５８のステップＳ４０３において実行される、評価値計算処理について説明する。

ステップＳ４３１において、評価値計算部１３３は、特徴抽出式１乃至ｍによる各特徴量の使用/未使用を決定する。評価値計算部１３３は、ランダムに決定したり、保持しているパレート最適解のなかからランダムに選択した１つの解の使用/未使用を変更する（突然変異させる）ことにより、特徴抽出式１乃至ｍによる各特徴量の使用/未使用を決定することができる。ただし、１回目のステップＳ４３１の処理では、保持しているパレート最適解がないので、必ずランダムに決定される。

ステップＳ４３２において、評価値計算部１３３は、目的変数ループパラメータＫを１に初期化してデータループを開始する。なお、目的変数ループは、目的変数としての情報の種類ｋだけ繰り返される。

ステップＳ４３３において、評価値計算部１３３は、ステップＳ４３１で決定したｍ個の特徴抽出式の使用組み合わせによる、目的変数Ｋに対応する情報の量を推定する、解候補としての情報推定式を生成（推定）する。

ステップＳ４３４において、評価値計算部１３３は、式（２）を使って、目的変数Ｋに対応する情報の量を推定する情報推定式を評価するための評価基準値を計算する。

ステップＳ４３５において、評価値計算部１３３は、目的変数ループパラメータＫが最大値ｋよりも小さいかを判定する。ステップＳ４３５において、目的変数ループパラメータＫが最大値ｋよりも小さいと判定された場合、目的変数ループパラメータＫが１だけインクリメントされて、処理はステップＳ４３３に戻り、それ以降の処理が繰り返される。

一方、ステップＳ４３５において、目的変数ループパラメータＫが最大値ｋよりも小さくない（目的変数ループパラメータＫが最大値ｋと同値である）と判定された場合、目的変数ループを抜けて、処理はステップＳ４３６に進む。

ステップＳ４３６において、評価値計算部１３３は、特徴量計算部１３２から供給された各特徴抽出式の平均時間に基づいて、生成した情報推定式により目的変数を計算した場合にかかる時間である合計計算時間を計算する。

ステップＳ４３７乃至Ｓ４４０において、評価値計算部１３３は、パレート最適解を更新する。即ち、ステップＳ４３７において、評価値計算部１３３は、解候補をパレート最適解に加え、解ループパラメータｏを１に初期化して解ループを開始する。なお、解ループは、解候補を含め、現在保持しているパレート最適解の総数ｐだけ繰り返される。

ステップＳ４３８において、評価値計算部１３３は、o番目のパレート最適解（以下、パレート最適解[ｏ]とも記述する）よりも高速かつ精度の高い解が存在するかを判定する。ステップＳ４３８において、パレート最適解[ｏ]よりも高速かつ精度の高い解が存在すると判定された場合、処理はステップＳ４３９に進み、評価値計算部１３３は、パレート最適解[ｏ]をパレート最適解から削除する。

一方、ステップＳ４３８において、パレート最適解[ｏ]よりも高速かつ精度の高い解が存在しないと判定された場合、処理はステップＳ４４０に進み、評価値計算部１３３は、解ループパラメータｏが最大値ｐよりも小さいかを判定する。ステップＳ４３８において、解ループパラメータｏが最大値ｐよりも小さいと判定された場合、解ループパラメータｏが１だけインクリメントされて、処理はステップＳ４３８に戻り、それ以降の処理が繰り返される。

一方、解ループパラメータｏが最大値ｐよりも小さくない（解ループパラメータｏが最大値ｐと同値である）と判定された場合、解ループを抜けて、処理はステップＳ４４１に進む。

ステップＳ４４１において、評価値計算部１３３は、解候補を生成してパレート最適解を探索する処理を所定回数繰り返したかを判定する。ステップＳ４４１において、パレート最適解を探索する処理を所定回数繰り返していないと判定された場合、処理はステップＳ４３１に戻り、それ以降の処理が繰り返される。

一方、ステップＳ４４１において、パレート最適解を探索する処理を所定回数繰り返したと判定された場合、処理はステップＳ４４２に進み、評価値計算部１３３は、残ったパレート最適解を用いて、各特徴抽出式の評価値を算出する評価値算出処理を実行する。

図６１は、図６０のステップＳ４４２の評価値算出処理の詳細処理を示すフローチャートである。

初めに、ステップＳ４６１において、評価値計算部１３３は、特徴量ループパラメータｉを１に初期化して、特徴量ループを開始する。なお、特徴量ループは、特徴抽出式リストを構成する特徴抽出式の数ｍだけ繰り返される。

ステップＳ４６２において、評価値計算部１３３は、式（５）で表されるｉ番目の特徴抽出式の評価値ＳＵＭ＿Ｃ_iをゼロにリセットする。

ステップＳ４６３において、評価値計算部１３３は、解ループパラメータｏを１に初期化して解ループを開始する。この解ループは、現在保持しているパレート最適解の数を合わせた数ｐだけ繰り返される。

ステップＳ４６４において、評価値計算部１３３は、目的変数ループパラメータｊを１に初期化してデータループを開始する。なお、目的変数ループは、目的変数としての情報の種類ｋだけ繰り返される。

ステップＳ４６５において、評価値計算部１３３は、ｊ番目の目的変数Ｔ_jについての、パレート最適解ｏのｉ番目の特徴量Ｘ_iの寄与率Ｃ（ｏ，Ｘ_i，Ｔ_j）を求め、評価値ＳＵＭ＿Ｃ_iに加算する。

ステップＳ４６６において、評価値計算部１３３は、目的変数ループパラメータｊが最大値ｋよりも小さいかを判定する。ステップＳ４６６において、目的変数ループパラメータｊが最大値ｋよりも小さいと判定された場合、目的変数ループパラメータｊが１だけインクリメントされて、処理はステップＳ４６５に戻り、それ以降の処理が繰り返される。

一方、ステップＳ４６６において、目的変数ループパラメータｊが最大値ｋよりも小さくない（目的変数ループパラメータｊが最大値ｋと同値である）と判定された場合、目的変数ループを抜けて、処理はステップＳ４６７に進む。

ステップＳ４６７において、評価値計算部１３３は、解ループパラメータｏが最大値ｐよりも小さいかを判定する。ステップＳ４６７において、解ループパラメータｏが最大値ｐよりも小さいと判定された場合、解ループパラメータｏが１だけインクリメントされて、処理はステップＳ４６４に戻り、それ以降の処理が繰り返される。

一方、解ループパラメータｏが最大値ｐよりも小さくない（解ループパラメータｏが最大値ｐと同値である）と判定された場合、解ループを抜けて、処理はステップＳ４６８に進む。

ステップＳ４６８において、評価値計算部１３３は、特徴量ループパラメータｉが最大値ｍよりも小さいかを判定する。ステップＳ４６８において、特徴量ループパラメータｉが最大値ｍよりも小さいと判定された場合、特徴量ループパラメータｉが１だけインクリメントされて、処理はステップＳ４６２に戻り、それ以降の処理が繰り返される。

一方、ステップＳ４６８において、特徴量ループパラメータｉが最大値ｍよりも小さくない（特徴量ループパラメータｉが最大値ｍと同値である）と判定された場合、特徴量ループを抜けて、処理は図６０のステップＳ４４２に戻り、さらに図５８のステップＳ４０３に戻り、図５８のステップＳ４０４に進む。

以上のように、アルゴリズム自動構築システム１０１は、特徴抽出式リスト生成部３２から供給された特徴抽出式１乃至ｍによる特徴量の使用／未使用をランダムに決定して作成した単一のアルゴリズムを初期状態のパレート最適解として、特徴抽出式１乃至ｍによる各特徴量の使用/未使用をランダムに決定したり、保持しているパレート最適解のなかからランダムに選択した１つの解を突然変異させて特徴抽出式１乃至ｍによる各特徴量の使用/未使用を決定することで、パレート最適解の解候補を作成して、解候補と保持しているパレート最適解の評価基準値および合計計算時間を比較することで、各目的変数の精度または処理速度を重視する度合いを変えた複数のパレート最適解を求める。

これにより、アルゴリズム自動構築システム１０１は、入力された新規信号の速さや明るさの量を抽出するにあたり、各目的変数の精度または処理速度のそれぞれを重視する度合いが異なるパレート最適解としての複数の情報抽出アルゴリズムを提示することができる。すなわち、複数の評価指標のトレードオフ関係となる複数のアルゴリズムを提示することができる。

そして、ユーザは、各目的変数の精度または処理速度の重要度の度合いに応じて最適なアルゴリズムを選択して、目的変数の抽出結果を得ることができる。

なお、図１の情報処理装置１に対し、アルゴリズム自動構築部１３とトレードオフ分析部１４に代えて、アルゴリズム自動構築システム１０１の教師データ取得部１３１、特徴量計算部１３２、評価値計算部１３３、および特徴抽出式リスト生成部３２で構成される情報抽出ブロックを設けることが可能である。この場合、情報処理装置１は、入力される新規信号に対して、速さと明るさの量を抽出する情報抽出処理を行う装置として利用することができる。

従来のアルゴリズム自動構築技術では、最高性能（最高精度）のアルゴリズムのみを求めるものであったため、人がアルゴリズムを構築する場合のように、要求を満足して、必要最低限のリソースや精度で処理できるアルゴリズムを構築することはできなかったが、本発明を適用した情報処理装置１およびアルゴリズム自動構築システム１０１によれば、そのようなアルゴリズムの構築が可能である。

上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウェアにより実行させることもできる。この場合、上述した処理は、図６２に示されるようなコンピュータ５００により実行される。

図６２において、CPU（Central Processing Unit）２０１は、ROM(Read Only Memory)２０２に記憶されているプログラム、または、記憶部２０８からRAM(Random Access Memory)２０３にロードされたプログラムに従って各種の処理を実行する。RAM２０３にはまた、CPU２０１が各種の処理を実行する上において必要なデータなどが適宜記憶される。

CPU２０１、ROM２０２、およびRAM２０３は、内部バス２０４を介して相互に接続されている。この内部バス２０４にはまた、入出力インターフェース２０５も接続されている。

入出力インターフェース２０５には、キーボード、マウスなどよりなる入力部２０６、CRT，LCDなどよりなるディスプレイ、スピーカなどよりなる出力部２０７、ハードディスクなどより構成される記憶部２０８、並びに、モデム、ターミナルアダプタなどより構成される通信部２０９が接続されている。通信部２０９は、電話回線やCATVを含む各種のネットワークを介しての通信処理を行う。

入出力インターフェース２０５にはまた、必要に応じてドライブ２１０が接続され、磁気ディスク、光ディスク、光磁気ディスク、あるいは半導体メモリなどによりなるリムーバブルメディア２２１が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて記憶部２０８にインストールされる。

なお、コンピュータ２００が実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

本明細書において、フローチャートに記述されたステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。

本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。

本発明を適用した情報処理装置の一実施の形態の構成例を示すブロック図である。情報処理装置に入力されるサンプル信号の例を示す図である。構築されるアルゴリズムの構造を説明する図である。異常音判別式の構成を示す図である。構築されるアルゴリズムのその他の構造を説明する図である。情報抽出機の構成例を示すブロック図である。特徴抽出式１乃至ｍそれぞれの例を示す図である。１つの特徴抽出式の例を示す図である。入力信号の種類を説明する図である。入力信号の種類を説明する図である。入力信号の種類を説明する図である。オペレータの種類を説明する図である。アルゴリズム自動構築部の詳細な構成例を示すブロック図である。最適なアルゴリズム生成の流れについて説明する図である。選択生成について説明する図である。交差生成について説明する図である。突然変異生成について説明する図である。次世代の特徴抽出式について説明する図である。生成された次世代の特徴抽出式の例を示す図である。学習データ切り出し部の処理を説明する図である。特徴量計算部によって計算される特徴量の例を示す図である。機械学習部に供給されるデータの例を示す図である。機械学習部の処理を説明する図である。機械学習部の処理を説明する図である。機械学習部の処理を説明する図である。機械学習部の処理を説明する図である。パレート最適解を説明する図である。パレート最適解の初期化を説明する図である。パレート最適解の初期化を説明する図である。パレート最適解の初期化を説明する図である。パレート最適解の初期化を説明する図である。パレート最適解の更新を説明する図である。パレート最適解の更新の様子を示す図である。パレート最適解の更新の様子を示す図である。パレート最適解の更新の様子を示す図である。最適なアルゴリズムの決定を説明する図である。異常音判別処理について説明する図である。アルゴリズム自動構築処理を説明するフローチャートである。特徴抽出式リスト生成処理を説明するフローチャートである。ランダム生成処理を説明するフローチャートである。次世代リスト生成処理を説明するフローチャートである。選択生成処理を説明するフローチャートである。交差生成処理を説明するフローチャートである。突然変異生成処理を説明するフローチャートである。ランダム生成処理を説明するフローチャートである。特徴量計算処理を説明するフローチャートである。機械学習処理を説明するフローチャートである。トレードオフ分析処理を説明するフローチャートである。パレート最適解の初期化処理を説明するフローチャートである。本発明を適用したその他の実施の形態であるアルゴリズム自動構築システムの構成例を示すブロック図である。教師データの例を示す図である。評価値計算部に供給される各特徴量と平均時間の例を示す図である。各特徴量の使用/未使用の例を示す図である。計算された特徴量の例を示す図である。合計計算時間の計算の例を示す図である。速さの評価基準値、明るさの評価基準値、および合計計算時間の例を示す図である。パレート最適解の更新を説明する図である。パレート最適解探索処理を説明するフローチャートである。特徴量計算処理を説明するフローチャートである。評価値計算処理を説明するフローチャートである。評価値算出処理を説明するフローチャートである。本発明を適用したコンピュータの一実施の形態の構成例を示すブロック図である。

符号の説明

１情報処理装置，１３アルゴリズム自動構築部，１４トレードオフ分析部，１６使用アルゴリズム決定部，３２特徴抽出式リスト生成部，３３特徴量計算部，３４機械学習部，１０１情報抽出機，１３２特徴量計算部，１３３評価値計算部

Claims

遺伝的探索手法により、入力信号を判別するアルゴリズムを構築するアルゴリズム構築手段と、
前記アルゴリズム構築手段により構築された前記アルゴリズムを基にトレードオフ分析を行うことにより、複数の評価指標に対する前記アルゴリズムの複数のパレート最適解を求めるトレードオフ分析手段と
を備える情報処理装置。
前記複数のパレート最適解のなかから、前記複数の評価指標の要求条件に合致する最適アルゴリズムを決定する最適アルゴリズム決定手段をさらに備える
請求項１に記載の情報処理装置。
前記アルゴリズム構築手段により構築されるアルゴリズムは、複数の特徴抽出式と、前記複数の特徴抽出式の結合式である情報推定式により構成される
請求項１に記載の情報処理装置。
前記トレードオフ分析手段は、前記アルゴリズム構築手段により構築されたアルゴリズムから、特徴抽出式を１つずつ削除して作成した、特徴抽出式の数が異なるアルゴリズムを用いて、初期状態のパレート最適解を生成する
請求項３に記載の情報処理装置。
前記トレードオフ分析手段は、前記アルゴリズム構築手段により構築された単一のアルゴリズムを初期状態のパレート最適解とする
請求項３に記載の情報処理装置。
前記トレードオフ分析手段は、前記初期状態のパレート最適解から、各特徴抽出式の使用または未使用をランダムに変更することにより、前記パレート最適解を更新する
請求項４に記載の情報処理装置。
前記最適アルゴリズム決定手段は、前記複数のパレート最適解のなかから、要求される処理時間および精度に基づいて、前記最適アルゴリズムを決定する
請求項２に記載の情報処理装置。
前記情報推定式における各特徴抽出式の評価値を求める評価値計算手段をさらに備え、
前記アルゴリズム構築手段は、前記評価値計算手段による各特徴抽出式の評価値に基づいて、前記情報推定式を構成する特徴抽出式を更新する
請求項１に記載の情報処理装置。
前記評価値計算手段は、前記アルゴリズム構築手段が構築するアルゴリズムとしての情報推定式が複数ある場合、各情報推定式における同一の特徴抽出式の寄与率の合計値を、前記各特徴抽出式の評価値とする
請求項８に記載の情報処理装置。
アルゴリズムを構築するアルゴリズム構築手段と、前記アルゴリズムのパレート最適解を求めるトレードオフ分析手段とを備える情報処理装置が、
遺伝的探索手法により、入力信号を判別する前記アルゴリズムを構築し、
構築された前記アルゴリズムを基にトレードオフ分析を行うことにより、複数の評価指標に対する前記アルゴリズムの複数のパレート最適解を求める
情報処理方法。
コンピュータに、
遺伝的探索手法により、入力信号を判別するアルゴリズムを構築するアルゴリズム構築手段と、
前記アルゴリズム構築手段により構築された前記アルゴリズムを基にトレードオフ分析を行うことにより、複数の評価指標に対する前記アルゴリズムの複数のパレート最適解を求めるトレードオフ分析手段として
機能させるためのプログラム。