JP4433323B2 - 情報処理装置、情報処理方法、およびプログラム - Google Patents

情報処理装置、情報処理方法、およびプログラム Download PDF

Info

Publication number
JP4433323B2
JP4433323B2 JP2007273417A JP2007273417A JP4433323B2 JP 4433323 B2 JP4433323 B2 JP 4433323B2 JP 2007273417 A JP2007273417 A JP 2007273417A JP 2007273417 A JP2007273417 A JP 2007273417A JP 4433323 B2 JP4433323 B2 JP 4433323B2
Authority
JP
Japan
Prior art keywords
feature quantity
quantity extraction
feature
formula
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007273417A
Other languages
English (en)
Other versions
JP2009104274A (ja
Inventor
由幸 小林
Original Assignee
ソニー株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニー株式会社 filed Critical ソニー株式会社
Priority to JP2007273417A priority Critical patent/JP4433323B2/ja
Priority claimed from US12/243,690 external-priority patent/US8131657B2/en
Publication of JP2009104274A publication Critical patent/JP2009104274A/ja
Application granted granted Critical
Publication of JP4433323B2 publication Critical patent/JP4433323B2/ja
Application status is Expired - Fee Related legal-status Critical
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、情報処理装置、情報処理方法、およびプログラムに関し、特に、例えば、楽曲データなどのコンテンツデータの特徴量を計算できる特徴量計算アルゴリズムを自動的に構築するようにした情報処理装置、情報処理方法、およびプログラムに関する。

従来、楽曲データや画像データなどを入力データとして、前記入力データの特徴量(入力データが楽曲データである場合、速さ、明るさ、にぎやかさ等)を出力することができる特徴量計算アルゴリズムを遺伝的探索方法を用いて自動的に構築する発明が提案されている(例えば、特許文献1参照)。

国際公開WO2007/049641号公報

しかしながら、従来技術によって自動的に構築された特徴量計算アルゴリズムは、人手によって構築した特徴量計算アルゴリズムに比較して冗長な演算を含んでいることが多く、結果として入力データに対応する特徴量を得る演算に要する時間が長くなってしまうことがあった。

また、特徴量計算アルゴリズムの開発者の間では、開発しようとする特徴量計算アルゴリズムによって計算するまでもなく得ることができる既存の特徴量のうち、特徴量計算アルゴリズムの構築に有効であると考えられるものを経験的に知り得ていたが、特徴量計算アルゴリズムの構築に利用する手法は従来提案されていなかった。

なお、以下、本明細書においては、自動的に構築しようとする特徴量計算アルゴリズムによって計算するまでもなく得ることができる既存の特徴量を既存特徴量と称する。これに対して、特徴量計算アルゴリズムによって得ようとする特徴量を目的特徴量と称する。

本発明はこのような状況に鑑みてなされたものであり、入力データに対応する既存特徴量も利用して、入力データに対応する目的特徴量を計算できる特徴量計算アルゴリズムを自動的に構築するようにするものである。

本発明の一側面である情報処理装置は、前世代の遺伝子に対して、選択処理、交差処理、突然変異処理、およびランダム生成処理を行うことにより、次世代の遺伝子を生成する遺伝的アルゴリズムを用い、入力データおよび前記入力データに対応する既存特徴量を入力として、前記入力データに対応する目的特徴量を出力する目的特徴量計算式を生成する情報処理装置において、複数の演算子から成る特徴量抽出式を複数含む次世代の特徴量抽出式リストを、前世代の前記特徴量抽出式リストに含まれる複数の特徴量抽出式を前記遺伝子とみなし、所定の評価値計算方法により計算された前記特徴量抽出式の評価値に基づいた前記遺伝的アルゴリズムを用いて前世代の前記特徴量抽出式リストを更新することにより生成する特徴量抽出式リスト生成手段と、生成された現世代の前記特徴量抽出式リストに含まれる各特徴量抽出式に、教師データとして供給された実データを入力して、前記実データに対応する複数の特徴量を計算する特徴量計算手段と、計算された前記実データに対応する前記複数の特徴量を用いるとともに、教師データとして供給された前記実データに対応する既存特徴量も前記複数の特徴量と同等に用いて、教師データとして供給された前記実データに対応する目的特徴量を推定するための所定の機械学習により、前記目的特徴量計算式を生成する目的特徴量計算式生成手段と、前記特徴量抽出式リストに含まれる各特徴量抽出式の前記評価値を、生成された前記目的特徴量計算式の教師データへのあてはまりのよさを示す値として算出する前記所定の評価値計算方法により計算する評価値計算手段とを含む。
前記目的特徴量計算式生成手段は、各特徴量抽出式に実データを代入して計算された複数の特徴量f、および教師データにふくまれる既存特徴量Fと、係数bとの線形結合によって前記目的特徴量計算式を表現した場合に、前記教師データを用いた線形判別または線形回帰を行うことにより前記目的特徴量計算式を生成し、前記評価値計算手段は、前記特徴量抽出式の前記評価値として、生成される各目的特徴量抽出式に対する前記特徴量抽出式の寄与率を合計した合計寄与率を計算するか、またはpearson相関係数の平均値を計算するようにすることができる。

前記目的特徴量計算式生成手段は、計算された前記実データに対応する前記複数の特徴量のうちのいくつかと、教師データとして供給された前記実データに対応する複数の既存特徴量のうちのいくつかを選択的に、かつ、同等に用いて、教師データとして供給された前記実データに対応する前記目的特徴量を推定するための所定の機械学習により、前記目的特徴量計算式を生成するようにすることができる。

前記評価値計算手段は、計算された前記実データに対応する前記複数の特徴量の前記目的特徴量計算式における寄与率に基づいて、前記特徴量抽出式リストに含まれる各特徴量抽出式の前記評価値を計算するようにすることができる。

本発明の一側面である情報処理方法は、前世代の遺伝子に対して、選択処理、交差処理、突然変異処理、およびランダム生成処理を行うことにより、次世代の遺伝子を生成する遺伝的アルゴリズムを用い、入力データおよび前記入力データに対応する既存特徴量を入力として、前記入力データに対応する目的特徴量を出力する目的特徴量計算式を生成する情報処理装置の情報処理方法において、複数の演算子から成る特徴量抽出式を複数含む特徴量抽出式リストをランダムに生成し、生成された現世代の前記特徴量抽出式リストに含まれる各特徴量抽出式に、教師データとして供給された実データを入力して、前記実データに対応する複数の特徴量を計算し、計算された前記実データに対応する前記複数の特徴量を用いるとともに、教師データとして供給された前記実データに対応する既存特徴量も前記複数の特徴量と同等に用いて、教師データとして供給された前記実データに対応する目的特徴量を推定するための所定の機械学習により、前記目的特徴量計算式を生成し、前記特徴量抽出式リストに含まれる各特徴量抽出式の評価値を、生成された前記目的特徴量計算式の教師データへのあてはまりのよさを示す値として算出する所定の評価値計算方法により計算し、次世代の前記特徴量抽出式リストを、前世代の前記特徴量抽出式リストに含まれる複数の特徴量抽出式を前記遺伝子とみなし、前記所定の評価値計算方法により計算された前記特徴量抽出式の前記評価値に基づいた前記遺伝的アルゴリズムを用いて前世代の前記特徴量抽出式リストを更新することにより生成するステップを含む。

本発明の一側面であるプログラムは、前世代の遺伝子に対して、選択処理、交差処理、突然変異処理、およびランダム生成処理を行うことにより、次世代の遺伝子を生成する遺伝的アルゴリズムを用い、入力データおよび前記入力データに対応する既存特徴量を入力として、前記入力データに対応する目的特徴量を出力する目的特徴量計算式を生成する情報処理装置の制御用のプログラムであって、複数の演算子から成る特徴量抽出式を複数含む特徴量抽出式リストをランダムに生成し、生成された現世代の前記特徴量抽出式リストに含まれる各特徴量抽出式に、教師データとして供給された実データを入力して、前記実データに対応する複数の特徴量を計算し、計算された前記実データに対応する前記複数の特徴量を用いるとともに、教師データとして供給された前記実データに対応する既存特徴量も前記複数の特徴量と同等に用いて、教師データとして供給された前記実データに対応する目的特徴量を推定するための所定の機械学習により、前記目的特徴量計算式を生成し、前記特徴量抽出式リストに含まれる各特徴量抽出式の評価値を、生成された前記目的特徴量計算式の教師データへのあてはまりのよさを示す値として算出する所定の評価値計算方法により計算し、次世代の前記特徴量抽出式リストを、前世代の前記特徴量抽出式リストに含まれる複数の特徴量抽出式を前記遺伝子とみなし、前記所定の評価値計算方法により計算された前記特徴量抽出式の前記評価値に基づいた前記遺伝的アルゴリズムを用いて前世代の前記特徴量抽出式リストを更新することにより生成するステップを含む処理を情報処理装置のコンピュータに実行させる。

本発明の一側面においては、複数の演算子から成る特徴量抽出式を複数含む特徴量抽出式リストがランダムに生成されて、生成された現世代の特徴量抽出式リストに含まれる各特徴量抽出式に、教師データとして供給された実データが入力されて実データに対応する複数の特徴量が計算される。また、計算された実データに対応する複数の特徴量が用いられるとともに、教師データとして供給された前記実データに対応する既存特徴量も前記複数の特徴量と同等に用いられ、教師データとして供給された実データに対応する目的特徴量を推定するための所定の機械学習により、目的特徴量計算式が生成される。さらに、特徴量抽出式リストに含まれる各特徴量抽出式の評価値が、生成された前記目的特徴量計算式の教師データへのあてはまりのよさを示す値として算出する所定の評価値計算方法により計算され、次世代の前記特徴量抽出式リストが、前世代の特徴量抽出式リストに含まれる複数の特徴量抽出式を遺伝子とみなし、所定の評価値計算方法により計算された特徴量抽出式の評価値に基づいた遺伝的アルゴリズムを用いて前世代の特徴量抽出式リストが更新されることにより生成される

本発明の一側面によれば、入力データの既存特徴量も利用して、入力データに対応する目的特徴量を計算できる特徴量計算アルゴリズムを自動的に構築することができる。

以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。

本発明を適用した目的特徴量計算式構築システム10(図3)は、図1に示すような、入力データCとそれに対応する複数の既存特徴量F1C,F2C,・・・,FnCを入力とし、当該入力データに対応する複数の目的特徴量Iをそれぞれ出力する目的特徴量計算式1を、供給される複数の教師データを用いた機械学習によって生成するものである。

図2は、教師データのデータ構造を示している。すなわち、教師データTi(i=1,2,・・・,L)は、入力データCと同じ種類のデータである実データDi、実データDiに対応する複数の既存特徴量F1i乃至Fni、および実データDiに対応する複数の目的特徴量I1i乃至Ikiから構成される。

既存特徴量F1i乃至Fniは、実データDiから既存の方法によって検出される実データDiの特徴を示す値である。目的特徴量I1i乃至Ikiは、既存の方法では検出できない実データDiの特徴を示す値であり、例えば、実データDiを複数の人にモニタリングさせて得られる感想を数値化するなどして決定された値である。

図2に示されたように、目標特徴量がk種類である場合、目的特徴量計算式構築システム10によってk本の目的特徴量計算式が生成されることになる。

なお、入力データCは、多次元のデータであればよく、その種類は任意である。例えば、時間の次元とチャンネルの次元を有する楽曲データ、X次元とY次元と画素の次元を有する画像データ、画像データに時間の次元を加えた動画像データなどを入力データCとすることができる。

なお、以下の説明においては、楽曲データを入力データCとした例について説明する。楽曲データに対応する複数の既存特徴量としては、テンポ、スピード、テンポの揺らぎなどを挙げることができる。また、楽曲データに対応する目的特徴量としては、楽曲データの明るさ、速さ、楽器の多さなどを挙げることができる。

図3は、本発明を適用した目的特徴量計算式構築システム10の構成例を示している。この目的特徴量計算式構築システム10は、複数の特徴量抽出式からなる特徴量抽出式リストを生成、更新する特徴量抽出式リスト生成部11、生成された各特徴量抽出式に教師データTiの実データDiを代入して特徴量を計算する特徴量計算部12、特徴量計算部12によって計算された教師データTiに対応する特徴量と教師データTiの既存特徴量F1i乃至Fniから教師データTiの目的特徴量I1i乃至Ikiをそれぞれ推定できる目的特徴量計算式を機械学習により生成するとともに各特徴抽出式の評価値を計算する目的特徴量計算式生成部13、および、最終的に更新された最終世代の特徴量抽出式リストと目的特徴量計算式を最適化する最適化部15から構成される。

特徴量抽出式リスト生成部11は、第1世代の特徴量抽出式リストを構成する複数の特徴量抽出式をランダムに生成して特徴量計算部12に出力する。

ここで、特徴量抽出式リスト生成部11によって生成される特徴量抽出式について、図4を参照して説明する。図4A乃至図4Dは、それぞれ特徴量抽出式の例を示している。

特徴量抽出式には、左端に入力データの種類が記述され、入力データの種類の右側には、1種類以上のオペレータ(演算子)が演算される順序に従って記述される。各オペレータには、適宜、処理対称軸とパラメータが含まれる。

オペレータの種類としては、平均値(Mean)、高速フーリエ変換(FFT)、標準偏差(StDev)、出現率(Ratio)、ローパスフィルタ(LPF)、ハイパスフィルタ(HPF)、絶対値(ABS)、2乗(Sqr)、平方根(Sqrt)、正規化(Normalize)、微分(Differential)、積分(Integrate)、最大値(MaxIndex)、不偏分散(UVariance)、ダウンサンプリング(DownSampling)などを挙げることができる。なお、決定されたオペレータによっては処理対称軸が固定されていることがあるので、その場合、パラメータに固定されている処理対称軸を採用する。また、パラメータを必要とするオペレータが決定された場合、パラメータもランダムまたは予め設定されている値に決定する。

例えば、図4Aに示された特徴量抽出式の場合、12TonesMが入力データであり、32#Differential,32#MaxIndex,16#LPF_1;O.861,16#UVarianceそれぞれがオペレータである。また、各オペレータ中の32#,16#などは処理対称軸を示している。

ここで、12TonesMはモノラルのPCM(pulse coded modulation sound source)波形データを時間軸に沿って音程解析したものであることを示しており、48#はチャンネル軸、32#は周波数軸と音程軸、16#は時間軸を示している。オペレータ中の0.861はローパスフィルタ処理におけるパラメータであり、例えば透過させる周波数の閾値を示している。

なお、第1世代の特徴量抽出式リストを構成する各特徴量抽出式の入力データの種類は入力データCと同じもの、オペレータの数と種類はランダムに決定されるが、各特徴量抽出式を生成する際の制約として、図5に示すように、複数のオペレータに対応する演算が順次実行されるにつれて、演算結果の保有次元数が順次減少し、特徴量抽出式の最終的な演算結果がスカラになるか、あるいはその次元数が所定の小さい値(例えば、1,2など)となるようになされている。

図4A乃至図4Dに示された例から明らかなように、特徴量抽出式によって計算される特徴量は、例えば、楽曲データに対するテンポ、画像データに対する画素のヒストグラムなどのように、既存の概念で有意義と判断される値になるわけではない。すなわち、特徴量抽出式によって計算される特徴量は、単に入力データを特徴量抽出式に代入したときの演算結果に過ぎないものでよい。

以下、特徴量抽出式リスト生成部11によって生成される特徴量抽出式リストは、図6に示すように、m本の特徴量抽出式f1乃至fmによって構成されているものとする。特徴量抽出式f1乃至fmの入力データであるWavMはモノラルのPCM波形データであり、保有次元は時間軸とチャンネル軸である。

図3に戻る。特徴量抽出式リスト生成部11はまた、第2世代以降の特徴量抽出式リストを、前世代の特徴量抽出式リストを遺伝的アルゴリズム(GA:genetic algorism)に従って更新することによって生成する。

ここで、遺伝的アルゴリズムとは、現世代の遺伝子から、選択処理、交差処理、突然変異処理、およびランダム生成処理により、次世代の遺伝子を生成するアルゴリズムを指す。具体的には、特徴量抽出式リストを構成する複数の各特徴量抽出式を遺伝子とみなし、現世代の特徴量抽出式リストを構成する複数の特徴量抽出式の評価値に応じて選択処理、交差処理、突然変異処理、およびランダム生成処理を行い、次世代の特徴量抽出式リストを生成する。

すなわち、例えば図7に示すように、選択処理では、現世代の特徴量抽出式リストを構成する複数の特徴量抽出式のうち、評価値の高い特徴量抽出式f2を選択して次世代の特徴量抽出式リストに含める。交差処理では、現世代の特徴量抽出式リストを構成する複数の特徴量抽出式のうち、評価値の高い複数の特徴量抽出式f2とf5を交差させて(組み合わせて)特徴量抽出式を生成し、次世代の特徴量抽出式リストに含める。

突然変異処理では、現世代の特徴量抽出式リストを構成する複数の特徴量抽出式のうち、評価値の高い特徴量抽出式f2を部分的に突然変異させて(変更して)特徴量抽出式を生成し、次世代の特徴量抽出式リストに含める。ランダム生成処理では、新たな特徴量抽出式をランダムに生成して次世代の特徴量抽出式リストに含める。

図3に戻る。特徴量計算部12は、特徴量抽出式リスト生成部11から供給された特徴量抽出式リストを構成する各特徴量抽出式f1乃至fmに、供給される教師データTiの実データDiを代入し、教師データTiに対する特徴量を計算するとともに、各特徴量抽出式f1乃至fmの計算に要した計算時間も測定し、特徴量抽出式毎に異なるL個の実データDiを代入して計算したときの平均計算時間を算出する。計算された特徴量と算出された平均計算時間は目的特徴量計算式生成部13に供給される。

上述したように、教師データTiの数はL、特徴量抽出式リストを構成する特徴量抽出式の数はmであるので、特徴量計算部12では、(L×m)個の特徴量が算出されることになる。以下、特徴量抽出式fj(j=1,2,・・・,m)に、教師データTi(i=1,2,・・・,L)の実データDiを代入して計算された特徴量をfj[Ti]と記述する。

目的特徴量計算式生成部13は、特徴量計算部12から現世代の特徴量抽出式リストに対応する(L×m)個の特徴量fj[Ti]が供給される毎、例えば次式(1)に示される、入力データCに対応する既存特徴量F1C乃至FnCと特徴量f1[C]乃至fm[C]との線形結合によって入力データCに対応する目的特徴量I1Cを推定する目的特徴量計算式を、特徴量計算部12の計算結果である(L×m)個の特徴量fj[Ti]、教師データTiに含まれる(L×n)個の既存特徴量F1i乃至Fni、および、教師データTiに含まれるL個の目的特徴量I1iを用いた機械学習(特徴選択付き線形判別または回帰)によって生成する。
目的特徴量I1C=b0+b1・F1C+b2・F2C+・・・+bn・FnC
+bn+1・f1[C]+bn+2・f2[C]+・・・+bn+m・fm[C]
・・・(1)

なお、式(1)において、b0は切片であり、b1,b2,・・・,bn+mは線形結合係数である。また、目的特徴量計算式生成部13で実際に生成される目的特徴量計算式では、既存特徴量F1C乃至FnCと特徴量f1[C]乃至fm[C]の全てが使用されるわけではなく、選択的に使用される。この場合、使用されない既存特徴量F1C乃至FnCや特徴量f1[C]乃至fm[C]に対応する線形結合係数は0とされる。

同様に、入力データCに対応する既存特徴量F1C乃至FnCと特徴量f1[C]乃至fm[C]との線形結合によって入力データCに対応する目的特徴量I2C乃至IkCをそれぞれ計算できる目的特徴量計算式も生成される。

したがって、目的特徴量計算式生成部13ではk本の目的特徴量計算式が生成される。

そして、生成した目的特徴量計算式が所望の精度に到達するか、あるいはユーザから所定の指示が行われた場合、その時点での特徴量抽出式リストを最終世代の特徴量抽出式リストとして、目的特徴量計算式とともに最適化部15に供給する。

また、目的特徴量計算式生成部13は、内蔵する評価値計算部14によって、現世代の特徴量抽出式リストを構成する各特徴量抽出式の評価値を計算する。すなわち、評価値計算部14は、k本の各目的特徴量計算式における各特徴量抽出式それぞれの寄与率を計算し、計算したk本分の寄与率を合計した合計寄与率を、現世代の特徴量抽出式リストを構成する各特徴量抽出式の評価値に決定する。

ここで、寄与率の計算方法について次式(2)を用いて説明する。なお、式(2)は、式(1)の既存特徴量F1C,・・・,FnCと特徴量f1[C],・・・,fm[C]を、X1,X2,・・・,Xn+mに置換したものである。
目的特徴量I1C=b0+b1・X1+b2・X2+・・・+bn+m・Xn+m
・・・(2)

式(2)による目的特徴量I1Cの計算におけるXM(M=1,2,・・・,n+m)の寄与率(XM)は、次式(3)で計算される。

(XM)=bM ×Stdev(XM)StDev(I1)×Correl(XM,I1) ・・・(3)

ここで、StDev(XM)は、機械学習に用いたL個のXMの標準偏差を示す。

Stdev(I1)は、機械学習に用いた、教師データTiに含まれるL個の目的特徴量I1iの標準偏差を示す。

Correl(XM,I1)は、機械学習に用いた、L個のXMと教師データTiに含まれるL個の目的特徴量I1iのpearsonの相関係数を示す。

なお、pearsonの相関係数Correl(XM,I1)は、次式(4)に示されるように、L個のXMとL個の目的特徴量I1iとの共分散を、L個のXMの標準偏差とL個の目的特徴量I1iの標準偏差の積で除算することにより算出される。
Correl(XM,I1)
=(XMとI1iとの共分散)/(XMの標準偏差×I1iの標準偏差)
・・・(4)

なお、評価値計算部14において、現世代の特徴量抽出式リストを構成する各特徴量抽出式f1乃至fmの評価値を、上述したように、目的特徴量計算式における各特徴量抽出式f1乃至fmの出力値である特徴量f1[]乃至fm[]の寄与率に基づいて決定する代わりに、pearsonの相関係数に基づいて評価値を決定するようにしてもよい。

例えば、L個の教師データTiの実データDiをそれぞれ特徴量抽出式f1に代入して計算したL個の特徴量f1[Di]と、L個の教師データTiのk種類の目的特徴量I1i乃至Ikiとのpearson相関係数をそれぞれ算出し、算出したk個のpearson相関係数の平均値を、特徴量抽出式f1の評価値とするようにしてもよい。

なおまた、評価値計算部14において、各特徴量抽出式f1乃至fmの評価値を計算するだけでなく、各既存特徴量F1乃至Fmの評価値も計算するようにしてもよい。

さらに、評価値計算部14は、上述したようにして決定した、現世代の特徴量抽出式リストを構成する各特徴量抽出式f1乃至fmの評価値を、特徴量計算部12から供給される各特徴量抽出式f1乃至fmの平均計算時間に基づいて修正する。具体的には、平均計算時間が所定の閾値以上である特徴量抽出式の評価値をその設定範囲の最低値に修正する。そして、修正済みの評価値を特徴量抽出式リスト生成部11に通知する。

このような評価値の修正により、平均計算時間が所定の閾値以上である当該特徴量抽出式が次世代の特徴量抽出式リストに遺伝されないようにすることができる。したがって、次世代以降の特徴量計算部12の演算負荷を軽減させることができる。なお、平均計算時間と比較する所定の閾値は、特徴量計算部12の演算能力に応じて自動的に設定するようにしてもよし、ユーザが任意に設定できるようにしてもよい。

最適化部15は、目的特徴量計算式生成部13から供給される最終世代の特徴量抽出式リストを構成する特徴量抽出式f1乃至fmを最適化する特徴量抽出式最適化部16と、最適化された特徴量抽出式f1乃至fmを用いて目的特徴量計算式を再構築する目的特徴量計算式再構築部17を内蔵する。

特徴量抽出式最適化部16は、最終世代の特徴量抽出式リストを構成する各特徴量抽出式f1乃至fmから、予め登録されている冗長な演算の組み合わせ(以下、最適化パターンと称する)を検出して、同等の演算結果を得られるより処理負荷の小さい演算に置換することにより第1次最適化を行う。以下に第1次最適化の例を挙げる。

絶対値を演算するオペレータAbsが2つ以上連続している最適化パターンは、2回目以降のオペレータAbsが冗長なので、1つのオペレータAbsに置換することにより最適化する。

正規化演算を示すオペレータNormalizeが2つ以上連続している最適化パターンは、2回目以降のオペレータNormalizeが冗長なので、1つのオペレータNormalizeに置換することにより最適化する。

2乗演算を示すオペレータSqrと、平方根を演算するオペレータSqrtが連続している最適化パターンは、同じ結果を得るより演算負荷の小さいオペレータAbsに置換することにより最適化する。

微分演算を示すオペレータDefferentialと、積分演算を示すオペレータIntegrateが連続している最適化パターンは、無駄な演算なので、オペレータDefferential,Integrateを削除することにより最適化する。

なお、最適化パターンとその最適化方法は上述した例に限定されるものではない。

さらに、特徴量抽出式最適化部16は、各特徴量抽出式f1乃至fmを、より短い計算時間で同等の計算結果が得られるよう遺伝的アルゴリズムを利用して第2次最適化を行う。

目的特徴量計算式再構築部17は、最適化された特徴量抽出式f1乃至fmと教師データを用いた機械学習により目的特徴量計算式を再構築する。

次に、目的特徴量計算式構築システム10の動作について、図8のフローチャートを参照して説明する。

ステップS1において、特徴量抽出式リスト生成部11は、第1世代の特徴量抽出式リストを構成するm本の特徴量抽出式をランダムに生成し、m本の特徴量抽出式から成る特徴量抽出式リストを特徴量計算部12に供給する。

ステップS2において、目的特徴量計算式構築システム10は、教師データTi(i=1,2,・・・,L)を取得する。取得された教師データTiは、特徴量計算部12、目的特徴量計算式生成部13、および最適化部15に供給される。

ステップS3において、特徴量計算部12は、特徴量抽出式リスト生成部11から供給された特徴量抽出式リストを構成する各特徴量抽出式f1乃至fmに、教師データTiに含まれる実データDiをそれぞれ代入して、(L×m)個の特徴量fj[Ti]を計算するとともに、各特徴量抽出式f1乃至fmの計算に要した計算時間も測定し、特徴量抽出式毎に異なるL個の実データDiを代入して計算したときの平均計算時間を算出する。計算された、(L×m)個の特徴量fj[Ti]と、各特徴量抽出式f1乃至fmにそれぞれ対応する平均計算時間は目的特徴量計算式生成部13に供給される。

ステップS4において、目的特徴量計算式生成部13は、特徴量計算部12による計算結果である(L×m)個の特徴量fj[Ti]と、教師データTiに含まれる(L×n)個の既存特徴量F1i乃至Fniとから、教師データTiに含まれるL個の目的特徴量I1iを推定する目的特徴量計算式を特徴選択付き線形判別または回帰により学習する。

目的特徴量計算式生成部13によるステップS4の処理(以下、学習処理と称する)について、図9のフローチャートを参照して詳述する。

ステップS21において、目的特徴量計算式生成部13は、目的特徴量計算式を生成するにあたって、n個の既存特徴量F1乃至Fnとm個の特徴抽出式f1乃至fmの出力である特徴量f1[]乃至fm[]のうち、使用する(選択する)ものと使用しないもの(非選択とする)を示す複数の選択テーブルTBをランダムに生成して第1世代の選択テーブル群を生成する。この選択テーブル群は、構成される複数の選択テーブルTBが遺伝子とみなされ、以下のステップS29において遺伝的アルゴリズムに基づいて更新されることになる。

図10は、生成される複数の選択テーブルTBからなる選択テーブル群の例を示している。なお、図10において、丸印○は選択を示し、バツ印×は非選択を示している。

ステップS22において、目的特徴量計算式生成部13は、現世代の選択テーブル群を構成する各選択テーブルTBを順に1つずつ注目して選択テーブル群ループを開始する。なお、選択テーブル群ループは、選択テーブル群を構成する選択テーブルTBの数(図10の例ではx)だけを繰り返される。

ステップS23において、目的特徴量計算式生成部13は、特徴量計算部12から供給された各特徴量抽出式f1乃至fmにそれぞれ対応する平均計算時間を用い、注目している選択テーブルTBによって選択されている特徴量fj[]に対応する特徴抽出式fjの平均計算時間の合計が所定の閾値以下であるか否かを判定する。この平均計算時間の合計と比較する所定の閾値は、目的特徴量計算式生成部13などの演算能力に応じて自動的に設定するようにしてもよし、ユーザが任意に設定できるようにしてもよい。

平均計算時間の合計が所定の閾値以下であると判定された場合、処理はステップS24に進められる。

ステップS24において、目的特徴量計算式生成部13は、特徴量計算部12による計算結果である(L×m)個の特徴量fj[Ti]と、教師データTiに含まれる(L×n)個の既存特徴量F1i乃至Fniのうち、注目している選択テーブルTBによって選択されているものを用いた線形判別または回帰により目的特徴量の種類の数(k)の目的特徴量計算式を学習する。

ステップS25において、目的特徴量計算式生成部13は、注目している選択テーブルTBの評価値として、ステップS24の処理による学習結果の情報量基準AICを計算する。

なお、ステップS23において、注目している選択テーブルTBによって選択されている特徴量fj[]に対応する特徴抽出式fjの平均計算時間の合計が所定の閾値以下ではないと判定された場合、処理はステップS26に進めらる。ステップS26において、目的特徴量計算式生成部13は、注目している選択テーブルTBの評価値をその設定範囲の最低値とする。このように、合計の平均計算時間が所定の閾値よりも長くなる選択テーブルを次世代に遺伝しないようにすることにより、生成される目的特徴量計算式の計算に要する時間が長くなることを抑止することできる。

ステップS25またはステップS26に処理で注目している選択テーブルTBの評価値が決定された後、処理はステップS27に進められる。ステップS27において、目的特徴量計算式生成部13は、現世代の選択テーブル群を構成する全ての選択テーブルTBを注目したか否か判定し、注目していない選択テーブルTBが残っている場合、処理をステップS22に戻し、ステップS22乃至S27の処理を繰り返す。そして、ステップS27において、現世代の選択テーブル群を構成する全ての選択テーブルTBを注目したと判定された場合、処理はステップS28に進められる。

ステップS28において、目的特徴量計算式生成部13は、最も評価が良い選択テーブルTBの評価値が、所定の数世代の間、向上していないか否かを判定する。そして、最も評価が良い選択テーブルTBの評価値が向上している、または、まだ向上しなくなってから所定の世代数が経過していないと判定された場合、処理はステップS29に進められる。

ステップS29において、目的特徴量計算式生成部13は、現世代の選択テーブル群を各選択テーブルTBの評価値に基づく、遺伝的アルゴリズムによって更新することにより、次世代の選択テーブル群を生成する。処理はステップS22に戻り、それ以降の処理が繰り返される。

そして、ステップS28において、最も評価が良い選択テーブルTBの評価値が、所定の数世代の間、向上していないと判定された場合、処理は図8のステップS5に進められる。

以上説明した学習処理により、現世代の特徴量抽出式リストに対応するk種類の目的特徴量をそれぞれ計算するための目的特徴量計算式が生成されたことになる。

なお、上述した説明では、学習処理に、遺伝子的探索法とAICを用いるものとして説明したが、異なる方法により、学習処理を行ってもよい。また、既存特徴量や特徴抽出式の出力値の選択または非選択を決定に遺伝的アルゴリズムを用いる代わりに、近傍探索を用いるようにしてもよい。

例えば、近傍検索を用いる場合、n個の既存特徴量F1乃至Fnとm個の特徴抽出式f1乃至fmの出力である特徴量f1[]乃至fm[]の全ての非選択として学習を開始する。そして、n個の既存特徴量F1乃至Fnとm個の特徴抽出式f1乃至fmの出力である特徴量f1[]乃至fm[]のうちの1つを選択、その他を非選択としてn+m個の選択テーブルを生成し、各選択テーブルに対してAICなどで評価を行う。そして、最も評価が高い、すなわち、AICの値の小さい選択テーブルを決定する。さらに、決定した選択テーブルを基に、n個の既存特徴量F1乃至Fnとm個の特徴抽出式f1乃至fmの出力である特徴量f1[]乃至fm[]のうちのさらに1つを選択、その他を非選択としてn+m個の選択テーブルを生成して各選択テーブルに対してAICなどで評価を行う処理を行う。以上の処理を、AICなどの評価が向上しなくなるまで繰り返せばよい。

図8に戻る。ステップS5において、目的特徴量計算式生成部13の評価値計算部14は、現時点で生成されているk本の各目的特徴量計算式における各特徴量抽出式f1乃至fmの計算結果である特徴量f1[]乃至fm[]の寄与率を計算し、計算したk本分の寄与率を合計した合計寄与率を、現世代の特徴量抽出式リストを構成する各特徴量抽出式f1乃至fmの評価値に決定する。

なお、ステップS5において、現世代の特徴量抽出式リストを構成する各特徴量抽出式f1乃至fmの評価値を、上述したように、目的特徴量計算式における各特徴量抽出式f1乃至fmの出力値である特徴量f1[]乃至fm[]の寄与率に基づいて決定する代わりに、pearsonの相関係数に基づいて評価値を決定するようにしてもよい。

ステップS6において、評価値計算部14は、ステップS5の処理で決定した、現世代の特徴量抽出式リストを構成する各特徴量抽出式f1乃至fmの評価値を、特徴量計算部12から供給される各特徴量抽出式f1乃至fmの平均計算時間に基づいて修正する。具体的には、平均計算時間が所定の閾値以上である特徴量抽出式の評価値をその設定範囲の最低値に修正する。そして、修正済みの評価値を特徴量抽出式リスト生成部11に通知する。

ステップS7において、目的特徴量計算式生成部13は、現時点で生成されている目的特徴量計算式による計算結果が所望の精度に達したか否か、または、ユーザにより終了操作が行われたか否かを判定する。計算結果が所望の精度に達しておらず、また、ユーザにより終了操作が行われていないと判定された場合、処理はステップS8に進められる。

ステップS8において、特徴量抽出式リスト生成部11はまた、次世代の特徴量抽出式リストを、現世代の特徴量抽出式リストを遺伝的アルゴリズムに従って更新することによって生成する。この後、処理はステップS3に戻り、ステップS3以降の処理が繰り返される。

そして、ステップS7において、現時点で生成されている目的特徴量計算式による計算結果が所望の精度に達した、またはユーザにより終了操作が行われたと判定された場合、処理はステップS9に進められる。

ステップS9において、目的特徴量計算式生成部13は、現世代の特徴量抽出式リストと、現時点で生成されている目的特徴量計算式を、最終世代の特徴量抽出式リストとそれに対応するk本の目的特徴量計算式として最適化部15に出力する。

ステップS10において、最適化部15は、目的特徴量計算式生成部13から入力された最終世代の特徴量抽出式リストの各特徴量抽出式f1乃至fmを最適化するとともに、最適化した各特徴量抽出式f1乃至fmを用いた目的特徴量計算式を再構築する。

最適化部15によるステップS10の処理について、図11のフローチャートを参照して詳述する。

ステップS41において、特徴量抽出式最適化部16は、最終世代の特徴量抽出式リストを構成する各特徴量抽出式f1乃至fm中から最適化パターンを検出して、同等の結果を得られるより処理負荷の小さい演算に置換する第1次最適化を行う。

ステップS42において、特徴量抽出式最適化部16は、第1次最適化後の各特徴量抽出式f1乃至fmを、より短い計算時間で同等の計算結果が得られるよう遺伝的アルゴリズムを利用して第2次最適化を行う。

特徴量抽出式最適化部16によるステップS42の処理について、図12のフローチャートを参照して詳述する。

ステップS51において、特徴量抽出式最適化部16は、第1次最適化後の最終世代の特徴量抽出式リストを構成する特徴量抽出式f1乃至fmを順に1つずつ注目して特徴量抽出式リストループを開始する。なお、特徴量抽出式リストループは、特徴量抽出式リストを構成する特徴量抽出式f1乃至fmの数m)だけ繰り返される。

ステップ52において、特徴量抽出式最適化部16は、注目する特徴量抽出式fjの一部を突然変異させたR本の最適化候補式fj’r(r=1,2,・・・,R)を生成し、第1世代の最適化候補式群とする。

ステップS53において、特徴量抽出式最適化部16は、注目する特徴量抽出式fjにS個の評価データ(入力データCと同じ種類のデータ)を代入して、S個の特徴量fj[]を計算する。

ステップS54において、特徴量抽出式最適化部16は、現世代の最適化候補式群を構成するR本の最適化候補式を順に1つずつ注目して最適化候補式群ループを開始する。なお、最適化候補式群ループは、最適化候補式群を構成する最適化候補式の数だけ繰り返される。

ステップS55において、特徴量抽出式最適化部16は、注目する最適化候補式fj’rに、ステップ53でも用いたS個の評価データを代入して、S個の特徴量fj’r[]を計算するとともに、各評価データを代入したときの計算時間を測定し、さらに平均計算時間を算出する。

ステップS56において、特徴量抽出式最適化部16は、ステップS53の処理結果であるS個の特徴量fj[]と、ステップS55の処理結果であるS個の特徴量fj’r[]との相関度を示すpearsonの相関係数を計算し、S個の特徴量fj[]と、S個の特徴量fj’r[]との相関度がほぼ1.0であるか否かを判定する。そして、S個の特徴量fj[]と、S個の特徴量fj’r[]との相関度がほぼ1.0であると判定された場合、処理はステップS57に進められる。

ステップS57において、特徴量抽出式最適化部16は、注目する最適化候補式fj’rの評価値として、ステップS55の処理で算出された平均計算時間の逆数を設定する。

なお、ステップS56において、S個の特徴量fj[]と、S個の特徴量fj’r[]との相関度がほぼ1.0ではないとあるか否かを判定する。そして、S個の特徴量fj[]と、S個の特徴量fj’r[]との相関度がほぼ1.0ではないと判定された場合、処理はステップS58に進められる。

ステップS58において、特徴量抽出式最適化部16は、注目する最適化候補式fj’rの評価値にその範囲の最低値を設定する。

ステップS57の処理またはステップS58の処理で、注目する最適化候補式fj’rの評価値が決定された後、処理はステップS59に進められる。ステップS59において、特徴量抽出式最適化部16は、現世代の最適化候補式群を構成する全ての最適化候補式fj’rを注目したか否か判定し、注目していない最適化候補式fj’rが残っている場合、処理をステップS54に戻し、ステップS54乃至S59の処理を繰り返す。そして、ステップS59において、現世代の最適化候補式群を構成する全ての最適化候補式fj’rを注目したと判定された場合、処理はステップS60に進められる。

ステップS60において、特徴量抽出式最適化部16は、最も評価が良い最適化候補式の評価値が、所定の数世代の間、向上していないか否かを判定する。そして、最も評価が良い最適化候補式の評価値が向上している、または、まだ向上しなくなってから所定の世代数が経過していないと判定された場合、処理はステップS61に進められる。

ステップS61において、特徴量抽出式最適化部16は、現世代の最適化候補式群を各最適化候補式fj’rの評価値に基づく、遺伝的アルゴリズムによって更新することにより、次世代の最適化候補式群を生成する。ただし、次世代の最適化候補式群には、前世代の最も評価が良い最適化候補式を含めるようにし、残りの(R−1)本の最適化候補式は、前世代の最も評価が良い最適化候補式と、注目する特徴量抽出式fjとの一部をそれぞれ突然変異させて生成するようにする。処理はステップS54に戻り、それ以降の処理が繰り返される。

そして、ステップS60において、最も評価が良い最適化候補式の評価値が、所定の数世代の間、向上していないと判定された場合、処理はステップS62に進められる。

以上、ステップS52乃至S60の処理により、第1次最適化後の最終世代の特徴量抽出式リストを構成する全ての特徴量抽出式のうちの1本に第2次最適化が行われたことになる。

ステップS62において、特徴量抽出式最適化部16は、第1次最適化後の最終世代の特徴量抽出式リストを構成する全ての特徴量抽出式f1乃至fmを注目したか否か判定し、注目していない特徴量抽出式fjが残っている場合、処理をステップS51に戻し、ステップS51乃至S62の処理を繰り返す。そして、ステップS62において、第1次最適化後の最終世代の特徴量抽出式リストを構成する全ての特徴量抽出式f1乃至fmを注目したと判定された場合、第1次最適化後の最終世代の特徴量抽出式リストを構成する全ての特徴量抽出式f1乃至fmに第2次最適化が行われたことになるので、処理は図11のステップS43に進められる。

図11に戻る。ステップS43において、目的特徴量計算式再構築部17は、第2次最適化された特徴量抽出式f1乃至fmと教師データを元にして、統計解析、機械学習により、目的特徴量計算式生成部13から供給されたk本の目的特徴量計算式を再構築する。そして、最終的な特徴量抽出式リストと目的特徴量計算式が出力されて、目的特徴量計算式構築システム10の動作が終了される。

以上、目的特徴量計算式構築システム10の動作説明を終了する。

以上説明したように、本発明を適用した目的特徴量計算式構築システム10によれば、既存特徴量を利用して目的特徴量計算式を自動構築するので、特徴量計算式の計算結果のみを用いて目的特徴量計算式を構築した場合と比較して、冗長と成りがちな特徴量抽出式の数を少なくすることができる。よって、目的特徴量計算式から目的特徴量を計算するときの演算処理量を減少させることができる。

また、本発明を適用した目的特徴量計算式構築システム10によれば、計算時間が長い特徴量計算式の遺伝子を遺伝的アルゴリズムにおいて後世に残さないようにしているので、演算時間に制約を設けた目的特徴量計算式を構築することができる。また、目的特徴量計算式の構築時間が短縮することができる。

さらに、本発明を適用した目的特徴量計算式構築システム10によれば、特徴量抽出式リストを構成する特徴量抽出式を最適化しているので、目的特徴量計算式から目的特徴量を計算するときの演算処理量を減少させることができる。

ところで、上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。

図13は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。

このコンピュータ100において、CPU(Central Processing Unit)101,ROM(Read Only Memory)102,RAM(Random Access Memory)103は、バス104により相互に接続されている。

バス104には、さらに、入出力インタフェース105が接続されている。入出力インタフェース105には、キーボード、マウス、マイクロホンなどよりなる入力部106、ディスプレイ、スピーカなどよりなる出力部107、ハードディスクや不揮発性のメモリなどよりなる記憶部108、ネットワークインタフェースなどよりなる通信部109、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどの着脱可能な記録媒体111を駆動するドライブ110が接続されている。

以上のように構成されるコンピュータでは、CPU101が、例えば、記憶部108に記憶されているプログラムを、入出力インタフェース105およびバス104を介して、RAM103にロードして実行することにより、上述した一連の処理が行われる。

なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

また、プログラムは、1台のコンピュータにより処理されるものであってもよいし、複数のコンピュータによって分散処理されるものであってもよい。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであってもよい。

また、本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。

なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。

本発明が適用された目的特徴量計算式構築システムによって生成される目的特徴量計算式を説明する図である。 教師データのデータ構造を示す図である。 本発明が適用された目的特徴量計算式構築システムの構成例を示すブロック図である。 特徴量抽出式の例を示す図である。 特徴量抽出式の構成を説明する図である。 特徴量抽出式リストの例を示す図である。 遺伝的アルゴリズムを説明するための図である。 本発明が適用された目的特徴量計算式構築システムの動作を説明するフローチャートである。 図8のステップS4を詳述するフローチャートである。 選択テーブル群の例を示す図である。 図8のステップS10を詳述するフローチャートである。 図11のステップS42を詳述するフローチャートである。 コンピュータの構成例を示すブロック図である。

符号の説明

10 目的特徴量計算式構築システム, 11 特徴量抽出式リスト生成部, 12 特徴量計算部, 13 目的特徴量計算式生成部, 14 評価値計算部, 15 最適化部, 16 特徴量抽出式最適化部, 17 目的特徴量計算式再構築部, 101 CPU, 111 記録媒体

Claims (6)

  1. 前世代の遺伝子に対して、選択処理、交差処理、突然変異処理、およびランダム生成処理を行うことにより、次世代の遺伝子を生成する遺伝的アルゴリズムを用い、入力データおよび前記入力データに対応する既存特徴量を入力として、前記入力データに対応する目的特徴量を出力する目的特徴量計算式を生成する情報処理装置において、
    複数の演算子から成る特徴量抽出式を複数含む次世代の特徴量抽出式リストを、前世代の前記特徴量抽出式リストに含まれる複数の特徴量抽出式を前記遺伝子とみなし、所定の評価値計算方法により計算された前記特徴量抽出式の評価値に基づいた前記遺伝的アルゴリズムを用いて前世代の前記特徴量抽出式リストを更新することにより生成する特徴量抽出式リスト生成手段と、
    生成された現世代の前記特徴量抽出式リストに含まれる各特徴量抽出式に、教師データとして供給された実データを入力して、前記実データに対応する複数の特徴量を計算する特徴量計算手段と、
    計算された前記実データに対応する前記複数の特徴量を用いるとともに、教師データとして供給された前記実データに対応する既存特徴量も前記複数の特徴量と同等に用いて、教師データとして供給された前記実データに対応する目的特徴量を推定するための所定の機械学習により、前記目的特徴量計算式を生成する目的特徴量計算式生成手段と、
    前記特徴量抽出式リストに含まれる各特徴量抽出式の前記評価値を、生成された前記目的特徴量計算式の教師データへのあてはまりのよさを示す値として算出する前記所定の評価値計算方法により計算する評価値計算手段と
    を含む情報処理装置。
  2. 前記目的特徴量計算式生成手段は、各特徴量抽出式に実データを代入して計算された複数の特徴量f、および教師データにふくまれる既存特徴量Fと係数bとの線形結合によって前記目的特徴量計算式を表現した場合に、前記教師データを用いた線形判別または線形回帰を行うことにより前記目的特徴量計算式を生成し、
    前記評価値計算手段は、前記特徴量抽出式の前記評価値として、生成される各目的特徴量抽出式に対する前記特徴量抽出式の寄与率を合計した合計寄与率を計算するか、またはpearson相関係数の平均値を計算する
    請求項1に記載の情報処理装置。
  3. 前記目的特徴量計算式生成手段は、計算された前記実データに対応する前記複数の特徴量のうちのいくつかと、教師データとして供給された前記実データに対応する複数の既存特徴量のうちのいくつかを選択的に、かつ、同等に用いて、教師データとして供給された前記実データに対応する前記目的特徴量を推定するための所定の機械学習により、前記目的特徴量計算式を生成する
    請求項2に記載の情報処理装置。
  4. 前記評価値計算手段は、計算された前記実データに対応する前記複数の特徴量の前記目的特徴量計算式における寄与率に基づいて、前記特徴量抽出式リストに含まれる各特徴量抽出式の前記評価値を計算する
    請求項2に記載の情報処理装置。
  5. 前世代の遺伝子に対して、選択処理、交差処理、突然変異処理、およびランダム生成処理を行うことにより、次世代の遺伝子を生成する遺伝的アルゴリズムを用い、入力データおよび前記入力データに対応する既存特徴量を入力として、前記入力データに対応する目的特徴量を出力する目的特徴量計算式を生成する情報処理装置の情報処理方法において、
    複数の演算子から成る特徴量抽出式を複数含む特徴量抽出式リストをランダムに生成し、
    生成された現世代の前記特徴量抽出式リストに含まれる各特徴量抽出式に、教師データとして供給された実データを入力して、前記実データに対応する複数の特徴量を計算し、
    計算された前記実データに対応する前記複数の特徴量を用いるとともに、教師データとして供給された前記実データに対応する既存特徴量も前記複数の特徴量と同等に用いて、教師データとして供給された前記実データに対応する目的特徴量を推定するための所定の機械学習により、前記目的特徴量計算式を生成し、
    前記特徴量抽出式リストに含まれる各特徴量抽出式の評価値を、生成された前記目的特徴量計算式の教師データへのあてはまりのよさを示す値として算出する所定の評価値計算方法により計算し、
    次世代の前記特徴量抽出式リストを、前世代の前記特徴量抽出式リストに含まれる複数の特徴量抽出式を前記遺伝子とみなし、前記所定の評価値計算方法により計算された前記特徴量抽出式の前記評価値に基づいた前記遺伝的アルゴリズムを用いて前世代の前記特徴量抽出式リストを更新することにより生成する
    ステップを含む情報処理方法。
  6. 前世代の遺伝子に対して、選択処理、交差処理、突然変異処理、およびランダム生成処理を行うことにより、次世代の遺伝子を生成する遺伝的アルゴリズムを用い、入力データおよび前記入力データに対応する既存特徴量を入力として、前記入力データに対応する目的特徴量を出力する目的特徴量計算式を生成する情報処理装置の制御用のプログラムであって、
    複数の演算子から成る特徴量抽出式を複数含む特徴量抽出式リストをランダムに生成し、
    生成された現世代の前記特徴量抽出式リストに含まれる各特徴量抽出式に、教師データとして供給された実データを入力して、前記実データに対応する複数の特徴量を計算し、
    計算された前記実データに対応する前記複数の特徴量を用いるとともに、教師データとして供給された前記実データに対応する既存特徴量も前記複数の特徴量と同等に用いて、教師データとして供給された前記実データに対応する目的特徴量を推定するための所定の機械学習により、前記目的特徴量計算式を生成し、
    前記特徴量抽出式リストに含まれる各特徴量抽出式の評価値を、生成された前記目的特徴量計算式の教師データへのあてはまりのよさを示す値として算出する所定の評価値計算方法により計算し、
    次世代の前記特徴量抽出式リストを、前世代の前記特徴量抽出式リストに含まれる複数の特徴量抽出式を前記遺伝子とみなし、前記所定の評価値計算方法により計算された前記特徴量抽出式の前記評価値に基づいた前記遺伝的アルゴリズムを用いて前世代の前記特徴量抽出式リストを更新することにより生成する
    ステップを含む処理を情報処理装置のコンピュータに実行させるプログラム。
JP2007273417A 2007-10-22 2007-10-22 情報処理装置、情報処理方法、およびプログラム Expired - Fee Related JP4433323B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007273417A JP4433323B2 (ja) 2007-10-22 2007-10-22 情報処理装置、情報処理方法、およびプログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2007273417A JP4433323B2 (ja) 2007-10-22 2007-10-22 情報処理装置、情報処理方法、およびプログラム
US12/243,690 US8131657B2 (en) 2007-10-22 2008-10-01 Information processing device, information processing method, and program
CN 200810170287 CN101419610B (zh) 2007-10-22 2008-10-20 信息处理设备和信息处理方法
US13/366,585 US8326779B2 (en) 2007-10-22 2012-02-06 Information processing device, information processing method, and program

Publications (2)

Publication Number Publication Date
JP2009104274A JP2009104274A (ja) 2009-05-14
JP4433323B2 true JP4433323B2 (ja) 2010-03-17

Family

ID=40630402

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007273417A Expired - Fee Related JP4433323B2 (ja) 2007-10-22 2007-10-22 情報処理装置、情報処理方法、およびプログラム

Country Status (2)

Country Link
JP (1) JP4433323B2 (ja)
CN (1) CN101419610B (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5581864B2 (ja) * 2010-07-14 2014-09-03 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム
JP5881048B2 (ja) * 2012-09-18 2016-03-09 株式会社日立製作所 情報処理システム、及び、情報処理方法
CN106708609A (zh) * 2015-11-16 2017-05-24 阿里巴巴集团控股有限公司 一种特征生成方法及系统

Also Published As

Publication number Publication date
CN101419610B (zh) 2011-11-16
JP2009104274A (ja) 2009-05-14
CN101419610A (zh) 2009-04-29

Similar Documents

Publication Publication Date Title
Altonji et al. Cross section and panel data estimators for nonseparable models with endogenous regressors
Sigtia et al. An end-to-end neural network for polyphonic piano music transcription
Cemgil et al. Monte Carlo methods for tempo tracking and rhythm quantization
Hadjeres et al. Deepbach: a steerable model for bach chorales generation
Farrell et al. Modelling transposition latencies: Constraints for theories of serial order memory
Manaris et al. Zipf's law, music classification, and aesthetics
JP4825800B2 (ja) 楽曲分類方法
Fuhrer Inflation persistence
JP2006285899A (ja) 学習装置および学習方法、生成装置および生成方法、並びにプログラム
JP2007299365A (ja) データ処理装置、データ処理方法、及びプログラム
Mesaros et al. Detection and classification of acoustic scenes and events: Outcome of the DCASE 2016 challenge
Benetos et al. Automatic music transcription: challenges and future directions
Fernández et al. AI methods in algorithmic composition: A comprehensive survey
Fiebrink et al. Human model evaluation in interactive supervised learning
US20140297012A1 (en) Information processing apparatus, information processing method, and program
CN103635960A (zh) 从统计文本到语音合成系统输出的语音的统计增强
JP5201602B2 (ja) 音源分離システム、音源分離方法及び音源分離用コンピュータプログラム
Cemgil et al. Rhythm quantization for transcription
Qi et al. Music analysis using hidden Markov mixture models
Alvarez et al. DARWIN: An evolutionary program for nonlinear modeling of chaotic time series
Cemgil Bayesian music transcription
Gašić et al. Gaussian processes for pomdp-based dialogue manager optimization
Benetos et al. A shift-invariant latent variable model for automatic music transcription
Ni et al. An end-to-end machine learning system for harmonic analysis of music
JPH0782348B2 (ja) 音声認識用サブワードモデル生成方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090702

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090821

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090917

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091109

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091203

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091216

R151 Written notification of patent or utility model registration

Ref document number: 4433323

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130108

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees