WO2007049641A1

WO2007049641A1 - 情報処理装置、情報処理方法、およびプログラム

Info

Publication number: WO2007049641A1
Application number: PCT/JP2006/321260
Authority: WO
Inventors: Yoshiyuki Kobayashi
Original assignee: Sony Corporation
Priority date: 2005-10-25
Filing date: 2006-10-25
Publication date: 2007-05-03
Also published as: KR101193265B1; CN101091204A; EP1843323B1; EP1843323A4; JP2008123011A; KR20080069509A; EP1843323A1; CN101091204B; JP4948118B2; US8315954B2; US20100094782A1

Abstract

　本発明は楽曲データなどのコンテンツデータから対応する特徴量を抽出できるアルゴリズムを、高精度で速やかに生成することができる情報処理装置、情報処理方法、およびプログラムに関する。特徴量抽出アルゴリズム生成装置２０は、ｍ種類の低レベル特徴量抽出式から成る低レベル特徴量抽出式リストをｎ個生成する低レベル特徴量抽出式リスト生成部２１、ｎ個の低レベル特徴量抽出式リストにｊ曲分の入力データを代入して、各入力データに対応するｍ種類の低レベル特徴量をｎ組得る低レベル特徴量演算部２４、ｎ組の低レベル特徴量出力と対応する教師データ（ｊ曲にそれぞれ対応するｋ項目の高レベル特徴量）に基づいて高レベル特徴量抽出式を学習によって推定する高レベル特徴量抽出式学習部２５から構成される。本発明は、楽曲や映像の高レベル特徴量を取得するシステムに適用できる。

Description

明細書

情報処理装置、情報処理方法、およびプログラム

技術分野

[0001] 本発明は、情報処理装置、情報処理方法、およびプログラムに関し、特に、例えば

、楽曲データなどのコンテンツデータの特徴量を抽出するアルゴリズムを自動的に生成するようにした情報処理装置、情報処理方法、およびプログラムに関する。

背景技術

[0002] 従来、楽曲データを入力として前記楽曲データの特徴量 (楽曲データの速さ、明るさ、にぎや力さ等)を出力とするアルゴリズムの自動生成に関する発明が提案されている（例えば、特許文献 1参照)。

[0003] 特許文献 1 :米国特許出願公報 US2004Z0181401A1

発明の開示

発明が解決しょうとする課題

[0004] 特許文献 1に記載の発明では、図 1に示すように、その特徴量の種類毎に特徴量を抽出する特徴量抽出アルゴリズムを作成しており、特徴量抽出過程に要する演算量が膨大であって、実行する演算の中に無駄な演算が多く含まれて！/、る。

[0005] したがって、できるだけ無駄なく少な!/、演算量で、楽曲データから対応する特徴量を速やかに抽出できるアルゴリズムの生成方法の出現が望まれている。

[0006] 本発明はこのような状況に鑑みてなされたものであり、楽曲データなどのコンテンツデータを入力とし、当該コンテンツデータに対応する特徴量を高精度で速やかに抽出できるアルゴリズムを生成できるようにするものである。

課題を解決するための手段

[0007] 本発明の一側面である情報処理装置は、コンテンツデータの特徴量を検出するための特徴量検出アルゴリズムを生成する情報処理装置にぉ、て、前記コンテンツデータまたは前記コンテンツデータに対応するメタデータを入力として低レベル特徴量を出力する複数の低レベル特徴量抽出式から構成される次世代の式リストを、前世代の前記式リストに基づく学習によって生成する低レベル特徴量抽出式リスト生成手段と、低レベル特徴量抽出式リスト生成手段によって生成された前記式リストを用いて前記低レベル特徴量を演算する演算手段と、前記コンテンツデータに対応する予め用意された真の高レベル特徴量を教師データとした学習により、前記演算手段によって演算された前記低レベル特徴量を入力として前記コンテンツデータの特徴を示す高レベル特徴量を出力する高レベル特徴量抽出式を生成する高レベル特徴量抽出式生成手段とを含む。

[0008] 前記高レベル特徴量抽出式生成手段は、生成した前記高レベル特徴量抽出式の精度、または前記高レベル特徴量抽出式における前記低レベル特徴量の寄与率の少なくとも一方を算出し、前記低レベル特徴量抽出式リスト生成手段は、前記高レべル特徴量抽出式生成手段により算出された前記高レベル特徴量抽出式の精度、または前記高レベル特徴量抽出式における前記低レベル特徴量の寄与率の少なくとも一方に基づき、前記低レベル特徴量抽出式リストを構成する前記低レベル特徴量抽出式を更新するようにすることができる。

[0009] 前記低レベル特徴量抽出式リスト生成手段は、第 1世代の前記式リストをランダムに生成するよう〖こすることができる。

[0010] 前記低レベル特徴量抽出式リスト生成手段は、次世代の前記式リストを前世代の前記式リストに基づく遺伝的アルゴリズムにより選択処理、交差処理、または突然変異処理の少なくとも 1つによって生成するようにすることができる。

[0011] 前記低レベル特徴量抽出式リスト生成手段は、予め設定された定数の低レベル特徴量抽出式力構成される次世代の式リストを生成するようにすることができる。

[0012] 前記低レベル特徴量抽出式リスト生成手段は、前記リストを生成する度にランダムに決定する数の低レベル特徴量抽出式から構成される次世代の式リストを生成するようにすることができる。

[0013] 前記高レベル特徴量抽出式生成手段は、生成した前記高レベル特徴量抽出式の評価値、または前記高レベル特徴量抽出式における前記低レベル特徴量の寄与率の少なくとも一方を算出し、前記低レベル特徴量抽出式リスト生成手段は、前記高レベル特徴量抽出式生成手段により算出された前記高レベル特徴量抽出式の評価値、または前記高レベル特徴量抽出式における前記低レベル特徴量の寄与率の少なくとも一方に基づき、前記低レベル特徴量抽出式リストを構成する前記低レベル特徴量抽出式を更新するようにすることができる。

[0014] 本発明の一側面である情報処理方法は、コンテンツデータの特徴量を検出するための特徴量検出アルゴリズムを生成する情報処理装置の情報処理方法において、前記コンテンッデータまたは前記コンテンッデータに対応するメタデータを入力として低レベル特徴量を出力する複数の低レベル特徴量抽出式から構成される次世代の式リストを、前世代の前記式リストに基づく学習によって生成し、生成された前記式リストを用いて前記低レベル特徴量を演算し、前記コンテンツデータに対応する予め用意された真の高レベル特徴量を教師データとした学習により、演算された前記低レベル特徴量を入力として前記コンテンツデータの特徴を示す高レベル特徴量を出力する高レベル特徴量抽出式を生成するステップを含む。

[0015] 本発明の一側面であるプログラムは、コンテンツデータの特徴量を検出するための特徴量検出アルゴリズムを生成する情報処理装置の制御用のプログラムであって、前記コンテンッデータまたは前記コンテンッデータに対応するメタデータを入力として低レベル特徴量を出力する複数の低レベル特徴量抽出式から構成される次世代の式リストを、前世代の前記式リストに基づく学習によって生成し、生成された前記式リストを用いて前記低レベル特徴量を演算し、前記コンテンツデータに対応する予め用意された真の高レベル特徴量を教師データとした学習により、演算された前記低レベル特徴量を入力として前記コンテンツデータの特徴を示す高レベル特徴量を出力する高レベル特徴量抽出式を生成するステップを含む処理をコンピュータに実行させる。

[0016] 本発明の一側面においては、コンテンツデータまたはコンテンツデータに対応するメタデータを入力として低レベル特徴量を出力する複数の低レベル特徴量抽出式から構成される次世代の式リストが、前世代の式リストに基づく学習によって生成され、生成された式リストを用いて低レベル特徴量が演算され、コンテンツデータに対応する予め用意された真の高レベル特徴量を教師データとした学習により、演算された低レベル特徴量を入力としてコンテンツデータの特徴を示す高レベル特徴量を出力する高レベル特徴量抽出式が生成される。発明の効果

[0017] 本発明の一側面によれば、楽曲データなどのコンテンツデータを入力とし、当該コンテンッデータに対応する特徴量を高精度で速やかに抽出できるアルゴリズムを生成することができる。

図面の簡単な説明

[0018] [図 1]従来の特徴量抽出アルゴリズムを説明するための図である。

[図 2]本発明を適用した特徴量抽出アルゴリズム生成装置によって生成される特徴量抽出アルゴリズムの概要を示す図である。

[図 3]低レベル特徴量抽出式の例を示す図である。

[図 4]高レベル特徴量抽出式の例を示ず図である。

[図 5]本発明を適用した特徴量抽出アルゴリズム生成装置の第 1の構成例を示すプロック図である。

[図 6]特徴量抽出アルゴリズム生成装置を構成する高レベル特徴量演算部の構成例を示すブロック図である。

[図 7]特徴量抽出アルゴリズム学習処理を説明するフローチャートである。

[図 8]低レベル特徴量抽出式リストの例を示す図である。

[図 9]低レベル特徴量抽出式リスト生成処理を説明するフローチャートである。

[図 10]図 5の低レベル特徴量抽出式リスト生成部による第 1世代リストランダム生成処理を説明するフローチャートである。

[図 11]低レベル特徴量抽出式の記述方法を示す図である。

[図 12]入力データの例を列記した図である。

[図 13]入力データ Wavを説明する図である。

[図 14]入力データ Chordを説明する図である。

[図 15]入力データ Keyを説明する図である。

[図 16]低レベル特徴量抽出式の保有次元を説明する図である。

[図 17]次世代リストジェネティック生成処理を説明するフローチャートである。

[図 18]図 5の低レベル特徴量抽出式リスト生成部による選択生成処理を説明するフロ一チャートである。 [図 19]図 5の低レベル特徴量抽出式リスト生成部による交差生成処理を説明するフロ一チャートである。

圆 20]図 5の低レベル特徴量抽出式リスト生成部による突然変異生成処理を説明するフローチャートである。

[図 21]オペレータ Meanの演算を説明するための図である。

[図 22]低レベル特徴量演算部の処理を説明するための図である。

[図 23]教師データの例を示す図である。

[図 24]図 5の高レベル特徴量抽出式学習部による高レベル特徴量抽出式学習処理を説明するフローチャートである。

[図 25]学習アルゴリズムの例を説明するための図である。

[図 26]学習アルゴリズムの例を説明するための図である。

[図 27]学習アルゴリズムの例を説明するための図である。

[図 28]学習アルゴリズムの例を説明するための図である。

[図 29]学習アルゴリズムの例を説明するための図である。

[図 30]学習アルゴリズムの例を説明するための図である。

[図 31]学習アルゴリズムの例を説明するための図である。

[図 32]学習アルゴリズムの例を説明するための図である。

[図 33]学習アルゴリズムの例を説明するための図である。

[図 34]図 5の高レベル特徴量抽出式学習部による学習アルゴリズムに基づく学習処理を説明するフローチャートである。

[図 35]オペレータの組み合わせの例を示す図である。

[図 36]オペレータの組み合わせの例を示す図である。

[図 37]新規オペレータ生成処理を説明するフローチャートである。

圆 38]高精度高レベル特徴量演算処理を説明するフローチャートである。

[図 39]高精度リジェクト処理を説明するフローチャートである。

圆 40]本発明を適用した特徴量抽出アルゴリズム生成装置の第 2の構成例を示すブロック図である。

圆 41]図 40の低レベル特徴量抽出式リスト生成部による第 1世代リストランダム生成処理を説明するフローチャートである。

[図 42]図 40の低レベル特徴量抽出式リスト生成部による選択生成処理を説明するフローチャートである。

[図 43]図 40の低レベル特徴量抽出式リスト生成部による交差生成処理を説明するフローチャートである。

[図 44]図 40の低レベル特徴量抽出式リスト生成部による突然変異生成処理を説明するフローチャートである。

[図 45]図 40の高レベル特徴量抽出式学習部による高レベル特徴量抽出式学習処理を説明するフローチャートである。

[図 46]図 5の高レベル特徴量抽出式学習部による学習アルゴリズムに基づく学習処理を説明するフローチャートである。

[図 47]汎用パーソナルコンピュータの構成例を示すブロック図である。

符号の説明

[0019] 20 特徴量抽出アルゴリズム生成装置， 21 低レベル特徴量抽出式リスト生成部 , 22 オペレータ組検出部， 23 オペレータ生成部， 24 低レベル特徴量演算部， 25 高レベル特徴量抽出式学習部， 26 高レベル特徴量演算部， 27 制御部， 41 低レベル特徴量演算部， 42 高レベル特徴量演算部， 43 2乗誤差演算部， 44 リジェクト領域抽出式学習部， 45 特徴量抽出精度演算部， 60 特徴量抽出アルゴリズム生成装置， 61 低レベル特徴量抽出式リスト生成部， 62 高レベル特徴量演算部， 100 パーソナルコンピュータ， 101 CPU, 111 記録媒体

発明を実施するための最良の形態

[0020] 以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。

[0021] 図 2は、本発明を適用した実施の形態である特徴量抽出アルゴリズム生成装置 20 ( 図 5)または特徴量抽出アルゴリズム生成装置 60 (図 40)によって生成される特徴量抽出アルゴリズムの概要を示して、る。

[0022] この特徴長抽出アルゴリズム 11は、コンテンツデータ（楽曲データ）とそれに対応するメタデータ (属性データ）を入力として低レベル特徴量を出力する低レベル特徴量抽出部 12、および、低レベル特徴量を入力として高レベル特徴量を出力する高レべル特徴量抽出部 14から構成される。

[0023] 低レベル特徴量抽出部 12は、入力データに所定の演算を施す 1以上のオペレータ（演算子）が組み合わされた m種類の低レベル特徴量抽出式カゝら成る低レベル特徴量抽出式リスト 13を有している。したがって、低レベル特徴量抽出部 12は、 m種類の低レベル特徴量を高レベル特徴量抽出部 14に出力する。

[0024] ここで、低レベル特徴量抽出式リストを構成する低レベル特徴量抽出式の数 mは、図 5に示される特徴量抽出アルゴリズム生成装置 20の場合、予め決定されている定数である。また、図 40に示される特徴量抽出アルゴリズム生成装置 60の場合、ランダムに決定される乱数である。

[0025] 図 3は低レベル特徴量抽出式の例を示して！/、る。

[0026] 例えば、図 3の Aに示す低レベル特徴量抽出式 flは、楽曲データの 1種である波形データを入力として、各チャンネル（例えば、 L(Left)チャンネルと R (Right)チャンネル)間で波形データの平均値 (Mean)を演算し、演算された平均値を時間軸に沿って高速フーリエ変換 (FFT)を行い、 FFT結果力も周波数の標準偏差 (StDev)を求め、その結果を低レベル特徴量 aとして出力する。

[0027] また例えば、図 3の Bに示す低レベル特徴量抽出式 f2は、楽曲データの 1種であるコード進行データを入力として、時間軸に沿ってマイナーコードの出現率 (Ratio)を求め、その結果を低レベル特徴量 bとして出力する。

[0028] なお、低レベル特徴量抽出部 12の出力である低レベル特徴量は、それ単体で意味のある値である必要な!/、。

[0029] 高レベル特徴量抽出部 14は、入力される m種類の低レベル特徴量のうちの 1種類以上の低レベル特徴量に比較的単純な演算（四則演算、累乗演算など)を行い、その演算結果を高レベル特徴量として出力する k種類の高レベル特徴量抽出式を有している。したがって、高レベル特徴量抽出部 14は、 k種類の高レベル特徴量を出力する。

[0030] 図 4は高レベル特徴量抽出式の例を示している。 [0031] 例えば、図 4の Aに示す高レベル特徴量抽出式 Flは、低レベル特徴量 a, b, c, d , eに四則演算を行い、この演算結果を 1種類の高レベル特徴量である速さの値として出力する。

[0032] また例えば、図 4の Bに示す低レベル特徴量抽出式 F2は、低レベル特徴量 a, c, d

, eに四則演算と累乗演算（POWER)を行い、この演算結果を 1種類の高レベル特徴量である明るさの値として出力する。

[0033] 次に、図 5は本発明の第 1の実施の形態である特徴量抽出アルゴリズム生成装置 2

0の構成例を示している。

[0034] この特徴量抽出アルゴリズム生成装置 20は、最適な低レベル特徴量抽出式と高レベル特徴量抽出式を遺伝的なアルゴリズムに基づく学習によって生成するものである。

[0035] 特徴量抽出アルゴリズム生成装置 20は、 m本の低レベル特徴量抽出式カゝら成る低レベル特徴量抽出式リストを n個生成する低レベル特徴量抽出式リスト生成部 21、低レベル特徴量抽出式リスト生成部 21から供給される n個の低レベル特徴量抽出式リストに j曲分の入力データ（コンテンツデータおよびメタデータ）を入力として各入力データに対応する m種類の低レベル特徴量を n組分演算する低レベル特徴量演算部 2 4、低レベル特徴量演算部 24から出力される n組分の低レベル特徴量と対応する教師データ (j曲にそれぞれ対応する k項目の高レベル特徴量）に基づ!/、て高レベル特徴量抽出式を学習によって推定する高レベル特徴量抽出式学習部 25、遺伝的な学習力進められることによって最終的に生成される高レベル特徴量抽出式を用ヽて高レベル特徴量を演算する高レベル特徴量演算部 26、および、各部の動作の繰り返し (ループ）を制御する制御部 27から構成される。

[0036] なお、本明細書にぉ、て、遺伝的なアルゴリズムに基づく学習を、ジェネティック enetic)な学習とも記述する。

[0037] 低レベル特徴量抽出式リスト生成部 21は、予め設定されている定数である m本の低レベル特徴量抽出式から構成される低レベル特徴量抽出式リストを、第 1世代についてはランダムに、第 2世代以降の低レベル特徴量抽出式リストについては 1世代前の低レベル特徴量抽出式リストに基づく低レベル特徴量を用いて学習された高レベル特徴量抽出式の精度などに基づヽて生成する。

[0038] 低レベル特徴量抽出式リスト生成部 21に内蔵されたオペレータ組検出部 22は、生成された低レベル特徴量抽出式中に頻出する複数のオペレータ (演算子）の組み合わせを検出する。オペレータ生成部 23は、オペレータ組検出部 22によって検出された複数のオペレータの組み合わせを新たな 1種類のオペレータとして登録する。

[0039] 高レベル特徴量抽出式学習部 25は、 n組の低レベル特徴量にそれぞれ対応し、 k 種類の高レベル特徴量抽出式を生成するとともに、各高レベル特徴量抽出式の推定精度と各高レベル特徴量抽出式における各低レベル特徴量の寄与率を算出して低レベル特徴量抽出式リスト生成部 21に出力する。また、高レベル特徴量抽出式学習部 25は、学習の最終世代において、 n組の低レベル特徴量抽出式リストのうち、得られた高レベル特徴量の平均精度が最も高カゝつた低レベル特徴量抽出式リストを構成する m本の低レベル特徴量抽出式と、これに対応する k種類の高レベル特徴量抽出式を高レベル特徴量演算部 26に供給する。

[0040] 高レベル特徴量演算部 26は、最終的に高レベル特徴量抽出式学習部 25から供給される低レベル特徴量抽出式および高レベル特徴量抽出式を用いて高レベル特徴量を演算する。

[0041] 次に、図 6は高レベル特徴量演算部 26の詳細な構成例を示している。

[0042] この高レベル特徴量演算部 26は、入力データ (コンテンツデータとそれに対応するメタデータ）を最終的な低レベル特徴量抽出式リストに代入して低レベル特徴量を演算する低レベル特徴量演算部 41、低レベル特徴量演算部 41による演算結果である低レベル特徴量を最終的な高レベル特徴量抽出式に代入して高レベル特徴量を演算する高レベル特徴量演算部 42、高レベル特徴量演算部 42による演算結果である高レベル特徴量と教師データ (入力データに対応する真の高レベル特徴量）との 2乗誤差を演算する 2乗誤差演算部 43、低レベル特徴量演算部 41の演算結果である低レベル特徴量を入力、 2乗誤差演算部 43の演算結果である 2乗誤差を出力とするリジェタト領域抽出式を学習により生成するリジェクト領域抽出式学習部 44、および、入力データをリジェクト領域抽出式学習部 44によって生成されたリジェクト領域抽出式に代入し、入力データに対応して演算される高レベル特徴量の特徴抽出精度（2 乗誤差)を推定し、推定した特徴抽出精度が所定の閾値以上である場合だけ高レべル特徴量演算部 42に高レベル特徴量を演算させる特徴量抽出精度演算部 45から構成される。

[0043] 次に、本発明の第 1の実施の形態である特徴量抽出アルゴリズム生成装置 20の動作について説明する。

[0044] 図 7は特徴量抽出アルゴリズム生成装置 20の基本的な動作である特徴量抽出アルゴリズム生成処理を説明するフローチャートである。

[0045] ステップ S1において、制御部 27は、学習ループパラメータ Gを 1に初期化して学習ループを開始する。なお、学習ループは、ユーザなどによって予め設定されている学習回数 gだけ繰り返される。

[0046] ステップ S2において、低レベル特徴量抽出式リスト生成部 21は、図 8に示すように

、m種類の低レベル特徴量抽出式カゝら成る低レベル特徴量抽出式リストを n個生成して低レベル特徴量演算部 24に出力する。

[0047] ステップ S2の処理（低レベル特徴量抽出式リスト生成処理）につ、て、図 9のフローチャートを参照して詳述する。

[0048] ステップ S11において、低レベル特徴量抽出式リスト生成部 21は、生成する低レべル特徴量抽出式リストが第 1世代である力否かを判定する。なお、この判定では学習ループパラメータ Gが 0であるとき、生成する低レベル特徴量抽出式リストが第 1世代であると判定される。

[0049] 学習ループパラメータ Gが 0であることにより、生成する低レベル特徴量抽出式リストが第 1世代であると判定された場合、処理はステップ S12に進められる。ステップ S12 において、低レベル特徴量抽出式リスト生成部 21は、第 1世代の低レベル特徴量抽出式リストをランダムに生成する。

[0050] 反対に、ステップ S 11において、生成する低レベル特徴量抽出式リストが第 1世代ではないと判定された場合、処理はステップ S13に進められる。ステップ S13において、低レベル特徴量抽出式リスト生成部 21は、次世代の低レベル特徴量抽出式リストを、 1世代前の低レベル特徴量抽出式リストに基づいて遺伝的アルゴリズムによりジエネティック (Genetic)に生成する。 [0051] ステップ S12の処理（第 1世代リストランダム生成処理）について、図 10のフローチヤートを参照して詳述する。

[0052] ステップ S21にお!/、て、制御部 27は、リストループパラメータ Nを 1に初期化してリストループを開始する。なお、リストループは、予め設定されているリスト数 nだけ繰り返される。

[0053] ステップ S22において、制御部 27は、式ループパラメータ Mを 1に初期化して式ループを開始する。なお、式ループは、 1個の低レベル特徴量抽出式リストを構成する低レベル特徴量抽出式の式数 mだけ繰り返される。

[0054] ここで、式ループ内において生成される低レベル特徴量抽出式の記述方法について図 11を参照して説明する。

[0055] 低レベル特徴量抽出式は、入力データが左端に記述され、その右側に 1種類以上のオペレータ (演算子）が演算の順序に対応して記述される。各オペレータには、適宜、処理対称軸とパラメータが含まれる。

[0056] 例えば、図 11に示された低レベル特徴量抽出式の例の場合、 12TomesMが入力データであり、 32#Dilferential, 32#MaxIndex,16#LPF_l ;0.861などがオペレータである。また、オペレータ中の 32#, 16#などは処理対称軸を示している。例えば、 12TomesM は、入力データがモノラノレの PCM(pulse coded modulation sound source)波开データを時間軸方向にであることを示している。 48#はチャンネル軸、 32#は周波数軸と音程軸、 16#は時間軸を示す。オペレータ中の 0.861はローパスフィルタ処理におけるパラメータであり、例えば透過させる周波数の閾値を示している。

[0057] 図 10に戻る。ステップ S23において、低レベル特徴量抽出式リスト生成部 21は、生成する第 N番目の低レベル特徴量抽出式リスト（以下、リスト Nとも記述する）の第 M 本目の低レベル特徴量抽出式 (以下、低レベル特徴量抽出式 Mとも記述する）の入力データをランダムに決定する。

[0058] 入力データの種類としては、例えば図 12に示す Wav, 12Tones, Chord, Keyなどを挙げることができる。

[0059] 入力データである WAVは、図 13に示すような PCM波形データであり、保有次元は時間軸とチャンネル軸である。入力データである 12Tonesは、 PCM波形データを時間軸に沿って音程毎に解析したものであり、保有次元は時間軸と音程軸である。入力データである Chordは、図 14に示すような楽曲のコード進行（C, C # , D, · · · , Bm) を示すデータであり、保有次元は時間軸と音程軸である。入力データである Keyは、楽曲のキー (C, C # , D, · · · , B)を示すデータであり、保有次元は時間軸と音程軸である。

[0060] 図 10に戻る。ステップ S 24において、低レベル特徴量抽出式リスト生成部 21は、生成するリスト Nの低レベル特徴量抽出式 Mの処理対称軸とパラメータをランダムに 1 つ決定する。

[0061] パラメータの種類としては、平均値 (Mean)、高速フーリエ変換 (FFT)、標準偏差 (St Dev)、出現率 (Ratio)、ローパスフィルタ (LPF)、ハイパスフィルタ (HPF)、絶対値 (ABS)、微分 (Differential最大値 (Maxlndex)、不偏分散 (UVariance)などを挙げることができる。なお、決定されたオペレータによっては処理対称軸が固定されていることがあるので、その場合、パラメータに固定されている処理対称軸を採用する。また、パラメ一タを必要とするオペレータが決定された場合、パラメータもランダムまたは予め設定されている値に決定する。

[0062] ステップ S25において、低レベル特徴量抽出式リスト生成部 21は、現時点までに生成されているリスト Nの低レベル特徴量抽出式 Mの演算結果がスカラ（1次元）である力または次元数が所定の値 (例えば、 1または 2程度の小さい数)以下である力否かを判定し、否と判定した場合、ステップ S24の処理に戻ってオペレータを 1つ追加する。そして、ステップ S24および S25の処理が繰り返されることにより、図 16に示すように演算結果の保有次元数が減少していき、ステップ S25において、リスト Nの低レべル特徴量抽出式 Mの演算結果カ^カラである力あるいはは次元数が所定の値 (例えば、 1または 2程度の小さい数)以下であると判定された場合、処理はステップ S26 に進められる。

[0063] ステップ S26において、制御部 27は、式ループパラメータ Mが最大値 mよりも小さいか否かを判定し、式ループパラメータ Mが最大値 mよりも小さい場合、式ループパラメータ Mを 1だけインクリメントして処理をステップ S23に戻す。反対に、式ループパラメータ Mが最大値 mよりも小さくない場合 (式ループパラメータ Mが最大値 mと同値の場合）、式ループを抜けて処理をステップ S27に進める。ここまでの処理により、第 N番目の低レベル特徴量抽出式リストが生成されたことになる。

[0064] ステップ S27において、制御部 27は、リストループパラメータ Nが最大値 nよりも小さいか否かを判定し、リストループパラメータ Nが最大値 nよりも小さい場合、リストループパラメータ Nを 1だけインクリメントして処理をステップ S22に戻す。反対に、リストループパラメータ Nが最大値 nよりも小さくな、場合 (リストループパラメータ Nが最大値 nと同値の場合)、リストループを抜けて第 1世代リストランダム生成処理を終了する。ここまでの処理により、第 1世代の低レベル特徴量抽出式リストが n個生成されたことになる。

[0065] 次に、図 9のステップ S13における第 2世代以降の低レベル特徴量抽出式リストを生成する処理（次世代リストジェネティック生成処理）について、図 17のフローチヤ一トを参照して詳述する。

[0066] ステップ S31において、低レベル特徴量抽出式リスト生成部 21は、生成する低レべル特徴量抽出式リストの個数 nのうち、遺伝的アルゴリズムの選択を適用するリスト数を示す選択数 ns、遺伝的アルゴリズムの交差を適用するリスト数を示す交差数 nx、遺伝的アルゴリズムの突然変異を適用するリスト数を示す突然変異数 nmをランダムに決定する。ただし、選択数 ns、交差数 nx、突然変異数 nmの総和は nである。なお、選択数 ns、交差数 nx、突然変異数 nmは予め設定した定数を採用してもよい。

[0067] ステップ S32において、低レベル特徴量抽出式リスト生成部 21は、 1世代前の n個の低レベル特徴量抽出式リストのうち、決定した選択数 nsの低レベル特徴量抽出式リストを用いて、 ns個の低レベル特徴量抽出式リストを生成する。ステップ S33において、低レベル特徴量抽出式リスト生成部 21は、 1世代前の n個の低レベル特徴量抽出式リストのうち、決定した交差数 nxの低レベル特徴量抽出式リストを用いて、 nx個の低レベル特徴量抽出式リストを生成する。ステップ S 34において、低レベル特徴量抽出式リスト生成部 21は、 1世代前の n個の低レベル特徴量抽出式リストのうち、決定した突然変異数 nmの低レベル特徴量抽出式リストを用いて、 nm個の低レベル特徴量抽出式リストを生成する。

[0068] ステップ S32乃至 S34の処理につ!、て詳述する。 [0069] ステップ S32の選択生成処理について、図 18のフローチャートを参照して詳述する。この選択生成処理では、次世代の n個の低レベル特徴量抽出式リストのうちの選択数 ns個の低レベル特徴量抽出式リストが生成される。

[0070] ステップ S41において、低レベル特徴量抽出式リスト生成部 21は、 1世代前の n個の低レベル特徴量抽出式リストを、高レベル特徴量抽出式学習部 25から入力された高レベル特徴量抽出式の推定精度の平均値が高い順に並び替える。そして、ステツプ S42において、低レベル特徴量抽出式リスト生成部 21は、並び替えた 1世代前の n個の低レベル特徴量抽出式リストのうち、上位 ns個を次世代の低レベル特徴量抽出式リストとして採用する。以上で選択生成処理は終了される。

[0071] 図 17のステップ S33の交差生成処理について、図 19のフローチャートを参照して詳述する。この交差生成処理では、次世代の n個の低レベル特徴量抽出式リストのうちの交差数 nx個の低レベル特徴量抽出式リストが生成される。

[0072] ステップ S51において、制御部 27は、交差ループパラメータ NXを 1に初期化して交差ループを開始する。なお、交差ループは、交差数 nxだけ繰り返される。

[0073] ステップ S52において、低レベル特徴量抽出式リスト生成部 21は、前世代の低レべル特徴量抽出式リストから、高レベル特徴量抽出式学習部 25の出力した高レベル特徴量抽出式の推定精度の平均値が高い方のものから順に優先的に選択されるよう重み付けをした後、ランダムに 2個の低レベル特徴量抽出式リスト A, Bを選択する。なお、ここでの選択は、上述した選択生成処理で選択された ns個の低レベル特徴量抽出式リストを選択候補力除外してもよ!/、し、選択候補に残してぉ、てもよ、。

[0074] ステップ S53において、制御部 27は、式ループパラメータ Mを 1に初期化して式ループを開始する。なお、式ループは、 1個の低レベル特徴量抽出式リストに含まれる式数 mだけ繰り返される。

[0075] ステップ S54において、低レベル特徴量抽出式リスト生成部 21は、低レベル特徴量抽出式リスト A, Bに含まれる 2m本の低レベル特徴量抽出式から、高レベル特徴量抽出式学習部 25から入力された高レベル特徴量抽出式における寄与率が高い方のものが優先的に選択されるように重み付けをした後、ランダムに 1本の低レベル特徴量抽出式を選択して次世代の低レベル特徴量抽出式リストに追加する。 [0076] ステップ S55において、制御部 27は、式ループパラメータ Mが最大値 mよりも小さいか否かを判定し、式ループパラメータ Mが最大値 mよりも小さい場合、式ループパラメータ Mを 1だけインクリメントして処理をステップ S54に戻す。反対に、式ループパラメータ Mが最大値 mよりも小さくない場合 (式ループパラメータ Mが最大値 mと同値の場合）、式ループを抜けて処理をステップ S56に進める。式ループであるステップ S 53乃至 S55の処理により、 1個の低レベル特徴量抽出式リストが生成されたことになる。

[0077] ステップ S56において、制御部 27は、交差ループパラメータ NXが最大値 nxよりも小さいか否かを判定し、交差ループパラメータ NXが最大値 nxよりも小さい場合、交差ループパラメータ NXを 1だけインクリメントして処理をステップ S52に戻す。反対に、交差ループパラメータ NXが最大値 nxよりも小さくな、場合 (交差ループパラメータ NXが最大値 nxと同値の場合)、交差ループを抜けて交差生成処理を終了する。この交差ループの処理により、交差数 nx個の低レベル特徴量抽出式リストが生成されたことになる。

[0078] 図 17のステップ S34の突然変異生成処理について、図 20のフローチャートを参照して詳述する。この突然変異生成処理では、次世代の n個の低レベル特徴量抽出式リストのうちの突然変異数 nm個の低レベル特徴量抽出式リストが生成される。

[0079] ステップ S61において、制御部 27は、突然変異ループパラメータ NMを 1に初期化して突然変異ループを開始する。なお、突然変異ループは、突然変異数 nmだけ繰り返される。

[0080] ステップ S62において、低レベル特徴量抽出式リスト生成部 21は、前世代の低レべル特徴量抽出式リストから、高レベル特徴量抽出式学習部 25の出力した高レベル特徴量抽出式の推定精度の平均値が高い方のものが優先的に選択されるように重み付けをした後、ランダムに 1個の低レベル特徴量抽出式リスト Aを選択する。なお、ここでの選択は、上述した選択生成処理で選択された ns個の低レベル特徴量抽出式リストを選択候補力も除外してもよいし、選択候補に残しておいてもよい。また、上述した交差生成処理のステップ S52の処理で選択された低レベル特徴量抽出式リストを選択候補力除外してもよ、し、選択候補に残してぉ、てもよ、。 [0081] ステップ S63において、制御部 27は、式ループパラメータ Mを 1に初期化して式ループを開始する。なお、式ループは、 1個の低レベル特徴量抽出式リストに含まれる式数 mだけ繰り返される。

[0082] ステップ S64において、低レベル特徴量抽出式リスト生成部 21は、低レベル特徴量抽出式リスト Aに含まれる m本の低レベル特徴量抽出式のうちの M番目のものに注目して、 M番目の低レベル特徴量抽出式の演算結果である低レベル特徴量の寄与率が、低レベル特徴量抽出式リスト Aに含まれる他の低レベル特徴量抽出式の演算結果である低レベル特徴量の寄与率に比較して低、か否かを判定する。具体的には、例えば低レベル特徴量抽出式リスト Aに含まれる m本の低レベル特徴量抽出式のうち、演算結果である低レベル特徴量の寄与率が低ヽ方の所定の順番までに属するカゝ否かを判定する。

[0083] ステップ S64にお!/、て、 M番目の低レベル特徴量抽出式の演算結果である低レべル特徴量の寄与率が他よりも低いと判定された場合、処理はステップ S65に進められ、低レベル特徴量抽出式リスト生成部 21は、 M番目の低レベル特徴量抽出式をランダムに変形して (突然変異させて)次世代の低レベル特徴量抽出式リストに追加する。

[0084] 反対に、ステップ S64において、 M番目の低レベル特徴量抽出式の演算結果である低レベル特徴量の寄与率が他よりも低くな、と判定された場合、処理はステップ S6 6に進められ、低レベル特徴量抽出式リスト生成部 21は、 M番目の低レベル特徴量抽出式を突然変異させることなぐそのまま次世代の低レベル特徴量抽出式リストに追加する。

[0085] ステップ S67において、制御部 27は、式ループパラメータ Mが最大値 mよりも小さいか否かを判定し、式ループパラメータ Mが最大値 mよりも小さい場合、式ループパラメータ Mを 1だけインクリメントして処理をステップ S64に戻す。反対に、式ループパラメータ Mが最大値 mよりも小さくない場合 (式ループパラメータ Mが最大値 mと同値の場合）、式ループを抜けて処理をステップ S68に進める。ステップ S63乃至 S67の式ループの処理により、低レベル特徴量抽出式リストが 1個生成されたことになる。

[0086] ステップ S68において、制御部 27は、突然変異ループパラメータ NMが最大値 nm よりも小さいか否かを判定し、突然変異ループパラメータ NMが最大値 nmよりも小さ V、場合、突然変異ループパラメータ NMを 1だけインクリメントして処理をステップ S62 に戻す。反対に、突然変異ループパラメータ NMが最大値 nmよりも小さくない場合（突然変異ループパラメータ NMが最大値 nmと同値の場合）、突然変異ループを抜けて突然変異生成処理を終了する。ここまでの処理により、突然変異数 nm個の低レべル特徴量抽出式リストが生成されたことになる。

[0087] 以上説明した次世代リストジェネティック生成処理によれば、 1世代前の低レベル特徴量抽出式リストに対応する推定精度が高いもの、低レベル特徴量抽出式に対応する寄与率が高いものは次世代に継承され、推定精度や寄与率が低いものは次世代に継承されず淘汰されることになる。したがって、世代が進むに連れて、低レベル特徴量抽出式リストに対応する推定精度は向上し、低レベル特徴量抽出式に対応する寄与率も向上することが期待できる。

[0088] 図 7に戻る。以上のようにして生成された次世代の低レベル特徴量抽出式リストは、低レベル特徴量抽出式リスト生成部 21から低レベル特徴量演算部 24に出力される。ステップ S3において、低レベル特徴量演算部 24は、低レベル特徴量抽出式リスト生成部 21から入力された n個の低レベル特徴量抽出式リストそれぞれに楽曲 C1乃至 Cjの j曲分の入力データ（コンテンツデータやメタデータ）を代入して低レベル特徴量を演算する。

[0089] なお、ここで入力される j曲分の入力データは、それぞれ k項目の教師データ (対応する高レベル特徴量）が予め得られているものを使用する。

[0090] 例えば、低レベル特徴量演算部 24は、図 21の Aに示されるような保有次元が音程軸と時間軸である入力データに対して #16Meanのオペレータに相当する演算を実行した場合、図 21の Bに示すように時間軸を処理対象軸にして各音程の値の平均値を算出する。そして演算結果として得られる図 22に示すような、各入力データにそれぞれ対応する n組の低レベル特徴量組 (m種類の低レベル特徴量力成る）を高レベル特徴量抽出式学習部 25に出力する。

[0091] 図 7に戻る。ステップ S4において、高レベル特徴量抽出式学習部 25は、低レベル特徴量演算部 24から入力された n組の低レベル特徴量組と、対応する教師データ（図 23に示すように、各入力データ (楽曲 C1乃至 Cj)にそれぞれ対応する k種類の高レベル特徴量）に基づいて、 k種類の高レベル特徴量抽出式から成る高レベル特徴量抽出式組を n組、学習によって推定する（生成する)。また、各高レベル特徴量抽出式の推定精度と各高レベル特徴量抽出式における各低レベル特徴量の寄与率を算出して低レベル特徴量抽出式リスト生成部 21に出力する。

[0092] ステップ S4における高レベル特徴量抽出式学習処理について、図 24のフローチヤートを参照して詳述する。

[0093] ステップ S71にお!/、て、制御部 27は、リストループパラメータ Nを 1に初期化してリストループを開始する。なお、リストループは、予め設定されているリスト数 nだけ繰り返される。ステップ S72において、制御部 27は、教師データループパラメータ Kを 1に初期化して教師データループを開始する。なお、教師データループは、予め設定されて、る教師データの種類数 kだけ繰り返される。

[0094] ステップ S73にお!/、て、制御部 27は、アルゴリズムループパラメータ Aを 1に初期化してアルゴリズムループを開始する。なお、アルゴリズムループは、適用される学習ァルゴリズムの種類数 _aだけ繰り返される。

[0095] 適用する学習アルゴリズムとして、例えば、 Regression (回帰解析）、 Classify (クラス分類）、 SVM(Support Vector Machine),および GP(Genetic Programming)の 4種類を挙げることができる。

[0096] Regressionに属する学習アルゴリズムとしては、図 25に示すように、教師データと低レベル特徴量が線形の関係にあるとの仮定に基づいて教師データと Yの 2乗誤差が最小となるようにパラメータ bを学習するもの、および、図 26に示すように、教師データと低レベル特徴量が非線形の関係にあるとの仮定に基づいて教師データと Yの 2 乗誤差が最小となるようにパラメータ b を学習するものを挙げることができる。

nm

[0097] Classifyに属する学習アルゴリズムとしては、図 27に示すように、各クラス（同図の場合、男性ボーカルクラスと女性ボーカルクラス）のそれぞれの中心からのユークリッド距離 dを算出してユークリッド距離 dが最短のクラスに分類するもの、図 28に示すように、各クラス（同図の場合、男性ボーカルクラスと女性ボーカルクラス）の平均ベクトルとの相関係数 correlを算出して相関係数 correlが最大のクラスに分類するもの、図 29 に示すように、各クラス（同図の場合、男性ボーカルクラスと女性ボーカルクラス）のそれぞれの中心からのマハラノビス距離 dを算出してマハラノビス距離 dが最短のクラスに分類するものを挙げることができる。

[0098] さらに、図 30の Aに示すように、各クラス群（同図の場合、男性ボーカルクラス群と女性ボーカルクラス群）の分布を複数のクラスで表現し、それぞれのクラス群の中心力のユークリッド距離 dを算出してユークリッド距離 dが最短のクラスに分類するもの、および、図 30の Bに示すように、各クラス群（同図の場合、男性ボーカルクラス群と女性ボーカルクラス群）の分布を複数のクラスで表現し、それぞれのクラス群の中心力のマハラノビス距離 dを算出してマハラノビス距離 dが最短のクラスに分類するものを挙げることができる。

[0099] SVMに属する学習アルゴリズムとしては、図 31に示すように、各クラス（同図の場合、男性ボーカルクラスと女性ボーカルクラス）の境界面をサポートベクトルで表現し、分離面と境界付近のベクトルとの距離 (マージン）が最大になるようにパラメータ b應を学習するものを挙げることができる。

[0100] GPに属する学習アルゴリズムとしては、図 32に示すように、低レベル特徴量を組み合わせた式を GPで生成するもの、図 33の Aに示すように、低レベル特徴量を組み合わせた式を交差させるもの、および、図 33の Bに示すように、低レベル特徴量を組み合わせた式を突然変異させるものを挙げることができる。

[0101] 例えば、上述した全ての学習アルゴリズムを採用した場合、学習アルゴリズムの種類数 aは 11とされる。

[0102] 図 24に戻る。ステップ S 74において、制御部 27は、クロスバリデーシヨンループパラメータ Cを 1に初期化してクロスバリデーシヨンループを開始する。なお、クロスノくリデーシヨンループは、予め設定されて、るクロスノくリデーシヨン回数 cだけ繰り返される。

[0103] ステップ S75において、高レベル特徴量抽出式学習部 25は、 k種類の教師データのうち、 K番目の種類の j曲分の教師データ（真の高レベル特徴量）をランダムに学習用と評価用に 2分割する（クロスノくリデーシヨン)。以下、教師データのうち、学習用に分類されたものを学習用データ、評価用に分類されたものを評価用データと記述する。 [0104] ステップ S76において、高レベル特徴量抽出式学習部 25は、 N番目の低レベル特徴量抽出式リストを用いて演算された m種類の低レベル特徴量カゝら成る低レベル特徴量組と学習用データとを a番目の学習アルゴリズムに適用して高レベル特徴量抽出式を学習により推定する。この学習に際しては、演算量の削減と過学習 (オーバフイツティング）を抑止するために、 m種類の低レベル特徴量のうちのいくつかをジエネティックに選択して使用する。

[0105] この低レベル特徴量を選択するときの評価値には、関数である情報量基準 AIC(Ak ai e Information Criterion入ま 7こ【ます青 ¾量牵131し (Bayesian Information Criterion) を用いる。情報量基準 AICおよび BICは学習モデル (いまの場合、選択されている低レベル特徴量）の選択基準として用いるものであり、その値が小さい学習モデルほど良い (評価が高い)とされる。

[0106] AICは次式のように表記される。

AIC =— 2 X最大対数尤度 + 2 X自由パラメータ数

[0107] 例えば、学習アルゴリズムに Regression (線形）が採用されている場合（図 25の場合 ) , 自由ノラメータ数 =n+ l

対数尤度 =ー0. 5 X学習用データ数 X ( (log27u ) + l +log (平均 2乗誤差)）であるので、

AIC =学習用データ数 X ( (log27u ) + l +log (平均 2乗誤差)） + 2 X (n+ 1) となる。

[0108] BICは次式のように表記される。

BIC=— 2 X最大対数尤度 +log (学習用データ数） X自由パラメータ数

[0109] 例えば、学習アルゴリズムに Regression (線形）が採用されている場合（図 25の場合 )、

BIC =学習用データ数 X ( (log2 π ) + 1 + log (平均 2乗誤差) )

+log (学習用データ数） X (n+ 1)

となる。

[0110] BICは AICと比較して、学習用データ数が増加してもその値が増加し難いことが特徴である。 [0111] ここで、ステップ S76の学習アルゴリズムに基づく学習処理について、図 34を参照して説明する。この学習処理に際しては、上述したように、演算量の削減と過学習（ォーバフィッティング）を抑止するために、演算された m種類の低レベル特徴量のうちの V、くつかをジェネティックに選択して使用する。

[0112] ステップ S91において、高レベル特徴量抽出式学習部 25は、 m種類の低レベル特徴量のうち、選択するもの（学習に使用するもの）をランダムに抽出した初期集団を P 組生成する。

[0113] ステップ S92において、高レベル特徴量抽出式学習部 25は、ジェネティックァルゴリズム (GA:遺伝的アルゴリズム）による特徴選択ループを開始する。この GAによる特徴選択ループは、後述するステップ S98におヽて所定の条件を満たすまで繰り返される。

[0114] ステップ S93において、制御部 27は、初期集団ループパラメータ Pを 1に初期化して初期集団ループを開始する。なお、初期集団ループは、ステップ S91の処理で生成された低レベル特徴量の初期集団数 pだけ繰り返される。

[0115] ステップ S94において、高レベル特徴量抽出式学習部 25は、 P番目の初期集団に含まれる低レベル特徴量と、教師データのうちの学習用データとを用い、 A番目の学習アルゴリズムに適用して高レベル特徴量抽出式を学習により推定する。

[0116] ステップ S95において、高レベル特徴量抽出式学習部 25は、ステップ S94の処理結果として得られた高レベル特徴量の評価値として、情報量基準 AICまたは BICを演算する。

[0117] ステップ S96において、制御部 27は、初期集団ループパラメータ Pが最大値よりも小さいか否かを判定し、初期集団ループパラメータ Pが最大値 pよりも小さい場合、初期集団ループパラメータ Pを 1だけインクリメントして処理をステップ S94に戻す。反対に、初期集団ループパラメータ Pが最大値 Pよりも小さくな、場合 (初期集団ループパラメータ Pが最大値 pと同値の場合）、初期集団ループを抜けて処理をステップ S97 に進める。このステップ S93乃至 S96の初期集団ループの処理により、各初期集団に基づいて学習された高レベル特徴量抽出式の評価値として情報量基準 AICまたは BICを得ることができる。 [0118] ステップ S97において、高レベル特徴量抽出式学習部 25は、学習に使用する低レベル特徴量力もなる P組の初期集団を、その評価値に基づ、てジェネティックに更新する。具体的には、図 17のステップ S32乃至 S34と同様に、選択、交差、突然変異によって初期集団を更新する。この更新により、当初はランダムに生成された初期集団が高レベル特徴量抽出式の評価値を向上させる学習の進められたものとなる。

[0119] ステップ S98において、制御部 27は、 p組の初期集団にそれぞれ対応する高レべル特徴量抽出式のうち、最も評価値が高い (情報量基準が小さい）高レベル特徴量抽出式の評価値が、 GAによる特徴選択ループが繰り返される毎に向上している（情報量基準が減少している)場合、特徴選択ループを継続するため、処理をステップ S 93に戻す。反対に、 p組の初期集団にそれぞれ対応する高レベル特徴量抽出式のうち、最も評価値の高い高レベル特徴量抽出式の評価値が、 GAによる特徴選択ループを繰り返しても向上しなくなつてきた (情報量基準が減少しなくなってきた)場合、 G Aによる特徴選択ループを抜け、最も評価値の高!、高レベル特徴量抽出式を後段の処理（図 24のステップ S77の処理）に出力する。そして、学習アルゴリズムに基づく学習処理は終了される。

[0120] なお、ステップ S91において選択する低レベル特徴量の数は固定としてもよい。この場合、教師データのエントロピを利用して必要な低レベル特徴量の数を求めるようにしてもよい。同様に、教師データの主成分分析を行い、低レベル特徴量の数を主成分の数と同数にしてもょ、。

[0121] 図 24に戻る。ステップ S77において、高レベル特徴量抽出式学習部 25は、ステツプ S76の処理で得た最も評価値の高ヽ高レベル特徴量抽出式を、評価用データを用いて評価する。具体的には、得られた高レベル特徴量抽出式を用いて高レベル特徴量を演算し、評価用データとの 2乗誤差を算出する。

[0122] ステップ S78において、制御部 27は、クロスバリデーシヨンループパラメータ Cが最大値 cよりも小さ、か否かを判定し、クロスノくリデーシヨンループパラメータ Cが最大値 cよりも小さ、場合、クロスバリデーシヨンループパラメータ Cを 1だけインクリメントして処理をステップ S 75に戻す。反対に、クロスノくリデーシヨンループパラメータ Cが最大値 cよりも小さくない場合 (クロスノくリデーシヨンループパラメータ Cが最大値 cと同値の場合）、クロスバリデーシヨンループを抜けて処理をステップ S79に進める。ステップ S 74乃至 S78のクロスノくリデーシヨンループの処理により、 c本の学習結果、すなわち、高レベル特徴量抽出式が得られたことになる。なお、クロスノくリデーシヨンループにより、学習用データと評価用データがランダムに変換されるので、高レベル特徴量抽出式が過学習されて、な、ことを確認することができる。

[0123] ステップ S79において、高レベル特徴量抽出式学習部 25は、クロスバリデーシヨンループによって得られた c本の学習結果、すなわち、高レベル特徴量抽出式のうち、ステップ S77の処理における評価値が最も高いものを選択する。

[0124] ステップ S80において、制御部 27は、アルゴリズムループパラメータ Aが最大値 aよりも小さ!/、か否かを判定し、アルゴリズムループパラメータ Aが最大値 aよりも小さ、場合、アルゴリズムループパラメータ Aを 1だけインクリメントして処理をステップ S74に戻す。反対に、アルゴリズムループパラメータ Aが最大値 aよりも小さくない場合 (アルゴリズムループパラメータ Aが最大値 aと同値の場合）、アルゴリズムループを抜けて処理をステップ S81に進める。ステップ S73乃至 S80のアルゴリズムループの処理により、 a種類の学習アルゴリズムによって学習された K番目の種類の高レベル特徴量抽出式が a本得られたことになる。

[0125] そしてステップ S81において、高レベル特徴量抽出式学習部 25は、アルゴリズムループによって得られた a本の学習結果、すなわち、高レベル特徴量抽出式のうち、ステツプ S77の処理における評価値が最も高いものを選択する。

[0126] ステップ S82において、制御部 27は、教師データループパラメータ Kが最大値 kよりも小さ、か否かを判定し、教師データループパラメータ Kが最大値 kよりも小さヽ場合、教師データループパラメータ Kを 1だけインクリメントして処理をステップ S73に戻す。反対に、教師データループパラメータ Kが最大値 kよりも小さくない場合 (教師データループパラメータ Kが最大値 kと同値の場合）、教師データループを抜けて処理をステップ S83に進める。ステップ S72乃至 S82の教師データループの処理により、 N番目の低レベル特徴量抽出式リストに対応する、 k種類の高レベル特徴量抽出式が得られたことになる。

[0127] ステップ S83において、制御部 27は、リストループパラメータ Nが最大値 nよりも小さいか否かを判定し、リストループパラメータ Nが最大値 nよりも小さい場合、リストループパラメータ Nを 1だけインクリメントして処理をステップ S72に戻す。反対に、リストループパラメータ Nが最大値 nよりも小さくな、場合 (リストループパラメータ Nが最大値 nと同値の場合）、リストループを抜けて処理をステップ S84に進める。ステップ S71乃至 S83のリストループの処理により、 n個の低レベル特徴量抽出式リストにそれぞれ対応する、 k種類の高レベル特徴量抽出式が得られたことになる。

[0128] ステップ S84において、高レベル特徴量抽出式学習部 25は、得られた n個の低レベル特徴量抽出式リストにそれぞれ対応する、 k種類の高レベル特徴量抽出式の推定精度と各高レベル特徴量抽出式における各低レベル特徴量の寄与率を算出して低レベル特徴量抽出式リスト生成部 21に出力する。以上で、高レベル特徴量抽出式学習処理が終了される。

[0129] 図 7に戻る。ステップ S5において、制御部 27は、学習ループパラメータ Gが最大値 gよりも小さいか否かを判定し、学習ループパラメータ Gが最大値 gよりも小さい場合、学習ループパラメータ Gを 1だけインクリメントして処理をステップ S2に戻す。反対に、学習ループパラメータ Gが最大値 gよりも小さくな、場合 (学習ループパラメータ Gが最大値 gと同値の場合）、学習ループを抜けて処理をステップ S6に進める。なお、ステツプ S1乃至 S5の学習ルールが特徴量抽出アルゴリズムの学習過程であり、これ以降のステップ S6は、特徴量抽出アルゴリズムを用いた高レベル特徴量の演算のための処理である。

[0130] ステップ S6において、高レベル特徴量抽出式学習部 25は、学習によって得られた最終世代の n組の低レベル特徴量抽出式リストのうち、得られた高レベル特徴量の平均精度が最も高カゝつたリストを構成する m本の低レベル特徴量抽出式と、これに対応する k種類の高レベル特徴量抽出式を高レベル特徴量演算部 26に供給する。

[0131] ステップ S7において、高レベル特徴量演算部 26は、高レベル特徴量抽出式学習部 25から供給された低レベル特徴量抽出式および高レベル特徴量抽出式のうち、最後に高レベル特徴量抽出式学習部 25から供給された低レベル特徴量抽出式および高レベル特徴量抽出式を用いて高レベル特徴量を高精度に演算する。なお、このステップ S7における高精度高レベル特徴量演算処理については図 38以降を参照して後述する。

[0132] 以上、特徴量抽出アルゴリズム生成装置 20による特徴量抽出アルゴリズム生成処理の説明を終了する。

[0133] 次に、上述した特徴量抽出アルゴリズム生成処理におけるステップ S1乃至 S6の学習ループが繰り返されて低レベル特徴量抽出式リストの世代が進み成長したとき、すなわち、低レベル特徴量抽出式の寄与度が向上したり、対応する高レベル特徴量抽出式の推定精度が向上したりしたときに実行する新規オペレータ生成処理について説明する。

[0134] 低レベル特徴量抽出式リストの世代が進み成長した場合、低レベル特徴量抽出式リストの中には、図 35に示すように複数のオペレータの順列（以下、オペレータの組み合わせと称する）が異なる低レベル特徴量抽出式上に頻出することになる。そこで、異なる低レベル特徴量抽出式上に頻出する複数のオペレータの組み合わせを新たなオペレータの 1つとして、低レベル特徴量抽出式リスト生成部 21において使用するオペレータに登録するようにする。

[0135] 例えば、図 35の場合、 3つのオペレータの組み合わせ" 32 # FFT, Log, 32 # FF T"が 5本の低レベル特徴量抽出式に出現している。この" 32 # FFT, Log, 32 # FF T"が 1つのオペレータ NewOperatorlとして登録された場合、次世代以降の低レベル特徴量抽出式には、例えば図 36に示すようにオペレータ NewOperatorlが含まれることになる。

[0136] この新規オペレータ生成処理について、図 37のフローチャートを参照して説明する。ステップ S101において、オペレータ組検出部 22は、所定の数 (例えば、 1乃至 5程度）以下のオペレータ力なるオペレータの順列（順序のあるオペレータの組み合わせ)を生成する。ここで生成されるオペレータの組み合わせ数を ogとする。

[0137] ステップ S102において、制御部 27は、組み合わせループパラメータ OGを 1に初期化して組み合わせループを開始する。なお、組み合わせループは、オペレータの組み合わせ数 ogだけ繰り返される。

[0138] ステップ S 103において、 og番目のオペレータの組み合わせの出現頻度 Countを 1 に初期化する。ステップ S104において、制御部 27は、リストループパラメータ Nを 0 に初期化してリストループを開始する。なお、リストループは、予め設定されているリスト数 nだけ繰り返される。ステップ S 105において、制御部 27は、式ループパラメータ Mを 1に初期化して式ループを開始する。なお、式ループは、 1個の低レベル特徴量抽出式リストを構成する低レベル特徴量抽出式数 mだけ繰り返される。

[0139] ステップ S106において、オペレータ組検出部 22は、 N番目の低レベル特徴量抽出式リストを構成する M番目の低レベル特徴量抽出式上に og番目のオペレータの組み合わせが存在するか否かを判定し、存在すると判定した場合、処理をステップ S 107に進めて出現頻度 Countを 1だけインクリメントする。反対に、 og番目のオペレータの組み合わせが存在しないと判定した場合、ステップ S 107をスキップして、処理をステップ S 108に進める。

[0140] ステップ S 108において、制御部 27は、式ループパラメータ Mが最大値 mよりも小さいか否かを判定し、式ループパラメータ Mが最大値 mよりも小さい場合、式ループパラメータ Mを 1だけインクリメントして処理をステップ S 106に戻す。反対に、式ループノラメータ Mが最大値 mよりも小さくない場合 (式ループパラメータ Mが最大値 mと同値の場合）、式ループを抜けて処理をステップ S 109に進める。

[0141] ステップ S 109において、制御部 27は、リストループパラメータ Nが最大値 nよりも小さいか否かを判定し、リストループパラメータ Nが最大値 nよりも小さい場合、リストループパラメータ Nを 1だけインクリメントして処理をステップ S 105に戻す。反対に、リストループパラメータ Nが最大値 nよりも小さくない場合 (リストループパラメータ Nが最大値 nと同値の場合）、リストループを抜けて処理をステップ S110に進める。

[0142] ステップ S110において、制御部 27は、組み合わせループパラメータ OGが最大値 ogよりも小さ、か否かを判定し、組み合わせループパラメータ OGが最大値 ogよりも zJ、さ、場合、組み合わせループパラメータ OGを 1だけインクリメントして処理をステツプ S103に戻す。反対に、組み合わせループパラメータ OGが最大値 ogよりも小さくない場合 (組み合わせループパラメータ OGが最大値 ogと同値の場合）、組み合わせループを抜けて処理をステップ S 110に進める。ここまでの処理により、全てオペレータの組み合わせにそれぞれ対応する出現頻度 Countが検出されたことになる。

[0143] ステップ S111において、オペレータ組検出部 22は、出現頻度 Countが所定の閾値以上のオペレータの組み合わせを抽出してオペレータ生成部 23に出力する。ステップ S112において、オペレータ生成部 23は、オペレータ組検出部 22から入力されたオペレータの組み合わせを新たな 1つのオペレータとして登録する。以上で新規ォペレータ生成処理が終了される。

[0144] 以上説明したように、新規オペレータ生成処理によれば、出現頻度の高い、すなわち、高レベル特徴量を演算する上で有効であると考えられるオペレータの組み合わせが 1つのオペレータとされ、次世代以降の低レベル特徴量抽出式において使用されるので、低レベル特徴量抽出式の作成速度と成長速度が向上する。また、有効な低レベル特徴量抽出式が早期に発見されることとなる。さらに、従来、人手により発見していた有効であると考えられるオペレータの組み合わせを自動的に検出できるので、この点も新規オペレータ生成処理が奏する効果のひとつである。

[0145] 次に、上述した図 7のステップ S7における高精度高レベル特徴量演算処理について、図 38のフローチャートを参照して詳述する。

[0146] ステップ S141において、高レベル特徴量演算部 26は、高レベル特徴量抽出式学習部 25から供給された最終的な高レベル特徴量抽出式のうち、高い精度の演算結果を得られるもののみを選択するための高精度リジェクト処理を実行する。

[0147] 高精度リジェクト処理は、「高レベル特徴量の精度は低レベル特徴量の値に因果関係がある」との考えに基づき、低レベル特徴量を入力として高レベル特徴量の精度を出力するリジェクト領域抽出式を学習によって得るものである。この高精度リジェクト処理について、図 39のフローチャートを参照して詳述する。

[0148] ステップ S151において、高レベル特徴量演算部 26内の低レベル特徴量演算部 4 1は、最終的な低レベル特徴量抽出式リストを取得する。高レベル特徴量演算部 26 内の高レベル特徴量演算部 42は、最終的な高レベル特徴量抽出式を取得する。

[0149] ステップ S152において、制御部 27は、コンテンツループパラメータ Jを 1に初期化してコンテンツループを開始する。なお、コンテンツループは、高精度リジェクト処理を実行するために用意できる入力データ (コンテンツデータとメタデータ）の数 jだけ繰り返される。なお、用意できる入力データに対応する高レベル特徴量も、教師データとして用意されて、るものとする。 [0150] ステップ S153において、低レベル特徴量演算部 41は、ステップ S151の処理で取得した最終的な低レベル特徴量抽出式リストに L番目の入力データを代入し、その演算結果である m種類の低レベル特徴量を高レベル特徴量演算部 42およびリジェクト領域抽出式学習部 44に出力する。高レベル特徴量演算部 42は、ステップ S151の処理で取得した最終的な高レベル特徴量抽出式に、低レベル特徴量演算部 41から入力された m種類の低レベル特徴量を代入し、その演算結果である高レベル特徴量を 2乗誤差演算部 43に出力する。

[0151] ステップ S154において、 2乗誤差演算部 43は、高レベル特徴量演算部 42から入力された高レベル特徴量と、教師データ (入力データに対応する真の高レベル特徴量)との 2乗誤差を演算してリジェクト領域抽出式学習部 44に出力する。この演算結果である 2乗誤差力高レベル特徴量演算部 42において演算される高レベル特徴量抽出式の精度 (以下、特徴抽出精度と称する）となる。

[0152] ステップ S155において、制御部 27は、コンテンツループパラメータ Jが最大値はりも小さいか否かを判定し、コンテンツループパラメータ Jが最大値 jよりも小さい場合、コンテンツループパラメータ Jを 1だけインクリメントして処理をステップ S153に戻す。反対に、コンテンツループパラメータ Jが最大値 jよりも小さくない場合 (コンテンツループパラメータ Jが最大値 jと同値の場合）、コンテンツループを抜けて処理をステップ S 156に進める。ステップ S151乃至 S155のコンテンツループの処理により、各入力データにそれぞれ対応する、演算によって得られた高レベル特徴量と教師データとの 2 乗誤差が得られたことになる。

[0153] ステップ S156において、リジェクト領域抽出式学習部 44は、低レベル特徴量演算部 41から入力される低レベル特徴量と 2乗誤差演算部 43から入力される 2乗誤差とに基づく学習により、低レベル特徴量を入力としてそれに基づいて演算される高レべル特徴量の特徴抽出精度を出力とするリジェクト領域抽出式を生成し、生成したリジェクト領域抽出式を特徴量抽出精度演算部 45に供給する。以上で高精度リジェクト処理を終了され、処理は図 38のステップ S142に進められる。

[0154] ステップ S142において、低レベル特徴量演算部 41は、高レベル特徴量を取得した!、楽曲の入力データを、最終的な低レベル特徴量抽出式リストに代入して低レべル特徴量を演算し、演算結果を高レベル特徴量演算部 42および特徴量抽出精度演算部 45に出力する。

[0155] ステップ S143において、特徴量抽出精度演算部 45は、低レベル特徴量演算部 4 1から入力された低レベル特徴量を、リジェクト領域抽出式学習部 44から供給されたリジェクト領域抽出式に代入して、低レベル特徴量演算部 41から入力される低レべル特徴量に基づいて演算される高レベル特徴量の特徴量抽出精度 (すなわち、高レベル特徴量演算部 42で演算される高レベル特徴量に対して推定される 2乗誤差)を演算する。

[0156] ステップ S144において、特徴量抽出精度演算部 45は、ステップ S143の処理で演算した特徴量抽出精度が所定の閾値以上であるか否かを判定し、演算した特徴量抽出精度が所定の閾値以上であると判定した場合、処理をステップ S 145に進める。ステップ S 145において、特徴量抽出精度演算部 45は、高レベル特徴量演算部 42 に対して高レベル特徴量の演算を実行させる。高レベル特徴量演算部 42は、ステツプ S 142の処理で低レベル特徴量演算部 41から入力された m種類の低レベル特徴量を、最終的な高レベル特徴量抽出式に代入して高レベル特徴量を演算する。そして、ここで演算された高レベル特徴量が最終的な出力とされる。以上で、高精度高レベル特徴量演算処理が終了される。

[0157] なお、ステップ S144において、演算した特徴量抽出精度が所定の閾値よりも小さ V、と判定された場合、ステップ S 145の処理はスキップされて高精度高レベル特徴量演算処理は終了される。

[0158] したがって、高精度高レベル特徴量演算処理によれば、高レベル特徴量抽出式により計算される高レベル特徴量の精度を推定することができる。また、高い精度が期待できな、高レベル特徴量を演算しな、ので、無駄な演算を省略することが可能となる。

[0159] 以上説明したように、本発明の第 1の実施の形態である特徴量抽出アルゴリズム生成装置 20による特徴量抽出アルゴリズム学習処理によれば、楽曲データから対応する特徴量を抽出できるアルゴリズムを、高精度で速やかに生成することが可能となるだけでなぐ高精度の高レベル特徴量だけを少ない演算量で取得することが可能となる。

[0160] 次に、本発明の第 2の実施の形態である特徴量抽出アルゴリズム生成装置 60につ V、て説明する。図 40は特徴量抽出アルゴリズム生成装置 60の構成例を示して、る。

[0161] この特徴量抽出アルゴリズム生成装置 60は、特徴量抽出アルゴリズム生成装置 20 における低レベル特徴量抽出式リスト生成部 21および高レベル特徴量抽出式学習部 25を、それぞれ低レベル特徴量抽出式リスト生成部 61または高レベル特徴量抽出式学習部 65に置換したものである。

[0162] 特徴量抽出アルゴリズム生成装置 60の特徴量抽出アルゴリズム生成装置 20との相違点は、特徴量抽出アルゴリズム生成装置 20の低レベル特徴量抽出式リスト生成部 21が生成する低レベル特徴量抽出式リスト内の式数 mは定数であることに対し、特徴量抽出アルゴリズム生成装置 60の低レベル特徴量抽出式リスト生成部 61が生成する各低レベル特徴量抽出式リスト内の数 mはランダムに決定されることである。

[0163] また、特徴量抽出アルゴリズム生成装置 20の高レベル特徴量抽出式学習部 25が低レベル特徴量抽出式リスト生成部 21に対するフィードバックとして推定精度および寄与率を出力していたことに対し、特徴量抽出アルゴリズム生成装置 60の高レベル特徴量抽出式学習部 65が低レベル特徴量抽出式リスト生成部 61に対するフィードノックとして評価値および寄与率を出力することである。

[0164] 特徴量抽出アルゴリズム生成装置 60の低レベル特徴量抽出式リスト生成部 61および高レベル特徴量抽出式学習部 65以外の構成要素については、特徴量抽出アルゴリズム生成装置 20のそれと共通であって同一の符号を付して、るので、それらの説明は省略する。

[0165] 次に、特徴量抽出アルゴリズム生成装置 60の動作について、特徴量抽出アルゴリズム生成装置 20の動作説明に用いた図面を適宜流用して説明する。

[0166] まず、特徴量抽出アルゴリズム生成装置 60の基本的な動作である特徴量抽出アルゴリズム生成処理について、図 7に示されたフローチャートを流用して説明する。

[0167] ステップ S1において、制御部 27は、学習ループパラメータ Gを 1に初期化して学習ループを開始する。なお、学習ループは、ユーザなどによって予め設定されている学習回数 gだけ繰り返される。 [0168] ステップ S2において、低レベル特徴量抽出式リスト生成部 61は、 n個の低レベル特徴量抽出式リストを生成して低レベル特徴量演算部 24に出力する。

[0169] ステップ S2の処理 (低レベル特徴量抽出式リスト生成処理）について、図 9に示されたフローチャートを流用して詳述する。

[0170] ステップ S11において、低レベル特徴量抽出式リスト生成部 61は、生成する低レべル特徴量抽出式リストが第 1世代である力否かを判定する。なお、この判定では学習ループパラメータ Gが 0であるとき、生成する低レベル特徴量抽出式リストが第 1世代であると判定される。

[0171] 学習ループパラメータ Gが 0であることにより、生成する低レベル特徴量抽出式リストが第 1世代であると判定された場合、処理はステップ S12に進められる。ステップ S12 において、低レベル特徴量抽出式リスト生成部 61は、第 1世代の低レベル特徴量抽出式リストをランダムに生成する。

[0172] 反対に、ステップ S 11において、生成する低レベル特徴量抽出式リストが第 1世代ではないと判定された場合、処理はステップ S13に進められる。ステップ S13において、低レベル特徴量抽出式リスト生成部 61は、次世代の低レベル特徴量抽出式リストを、 1世代前の低レベル特徴量抽出式リストに基づいて遺伝的アルゴリズムによりジエネティック (Genetic)に生成する。

[0173] ステップ S12における、低レベル特徴量抽出式リスト生成部 61による第 1世代リストランダム生成処理につ、て、図 41のフローチャートを参照して詳述する。

[0174] ステップ S171において、制御部 27は、リストループパラメータ Nを 1に初期化してリストループを開始する。なお、リストループは、予め設定されているリスト数 nだけ繰り返される。

[0175] ステップ S172において、低レベル特徴量抽出式リスト生成部 61は、生成する第 1 世代の第 N番目の低レベル特徴量抽出式リストを構成する低レベル特徴量抽出式の式数 mをランダムに決定する。

[0176] ステップ S173において、制御部 27は、式ループパラメータ Mを 1に初期化して式ループを開始する。なお、式ループは、 1個の低レベル特徴量抽出式リストを構成する低レベル特徴量抽出式の式数 mだけ繰り返される。 [0177] ステップ S174において、低レベル特徴量抽出式リスト生成部 61は、生成する第 1 世代の第 N番目の低レベル特徴量抽出式リスト（以下、リスト Nとも記述する）の第 M 本目の低レベル特徴量抽出式 (以下、低レベル特徴量抽出式 Mとも記述する）の入力データをランダムに決定する。

[0178] ステップ S175において、低レベル特徴量抽出式リスト生成部 61は、生成するリスト Nの低レベル特徴量抽出式 Mの処理対称軸とパラメータをランダムに 1つ決定する。

[0179] ステップ S176において、低レベル特徴量抽出式リスト生成部 61は、現時点までに生成されているリスト Nの低レベル特徴量抽出式 Mの演算結果がスカラ（1次元)である力、または次元数が所定の値 (例えば、 1または 2程度の小さい数)以下であるか否かを判定し、否と判定した場合、ステップ S175の処理に戻ってオペレータを 1つ追カロする。そして、ステップ S175および S176の処理が繰り返されることにより、図 16に示すように演算結果の保有次元数が減少していき、ステップ S 176において、リスト Nの低レベル特徴量抽出式 Mの演算結果カ^カラである力、あるいはは次元数が所定の値 (例えば、 1または 2程度の小さい数)以下であると判定された場合、処理はステツプ S177に進められる。

[0180] ステップ S177において、制御部 27は、式ループパラメータ Mが最大値 mよりも小さいか否かを判定し、式ループパラメータ Mが最大値 mよりも小さい場合、式ループパラメータ Mを 1だけインクリメントして処理をステップ S174に戻す。反対に、式ループノラメータ Mが最大値 mよりも小さくない場合 (式ループパラメータ Mが最大値 mと同値の場合）、式ループを抜けて処理をステップ S 178に進める。ステップ S173乃至 S 177の処理により、第 1世代の第 N番目の低レベル特徴量抽出式リストが生成されたことになる。

[0181] ステップ S 178において、制御部 27は、リストループパラメータ Nが最大値 nよりも小さいか否かを判定し、リストループパラメータ Nが最大値 nよりも小さい場合、リストループパラメータ Nを 1だけインクリメントして処理をステップ S172に戻す。反対に、リストループパラメータ Nが最大値 nよりも小さくない場合 (リストループパラメータ Nが最大値 nと同値の場合)、リストループを抜けて第 1世代リストランダム生成処理を終了する。ここまでの処理により、第 1世代のそれぞれ構成する低レベル特徴量抽出式の式数 mが共通ではない n個の低レベル特徴量抽出式リストが生成されたことになる。

[0182] 次に、低レベル特徴量抽出式リスト生成部 61による、図 9のステップ S13における第 2世代以降の低レベル特徴量抽出式リストを生成する処理 (次世代リストジエネティック生成処理）について、図 17を流用して説明する。

[0183] ステップ S31において、低レベル特徴量抽出式リスト生成部 61は、生成する低レべル特徴量抽出式リストの個数 nのうち、遺伝的アルゴリズムの選択を適用するリスト数を示す選択数 ns、遺伝的アルゴリズムの交差を適用するリスト数を示す交差数 nx、遺伝的アルゴリズムの突然変異を適用するリスト数を示す突然変異数 nmをランダムに決定する。ただし、選択数 ns、交差数 nx、突然変異数 nmの総和は nである。なお、選択数 ns、交差数 nx、突然変異数 nmは予め設定した定数を採用してもよい。

[0184] ステップ S32において、低レベル特徴量抽出式リスト生成部 61は、 1世代前の n個の低レベル特徴量抽出式リストのうち、決定した選択数 nsの低レベル特徴量抽出式リストを用いて、 ns個の低レベル特徴量抽出式リストを生成する。ステップ S33において、低レベル特徴量抽出式リスト生成部 61は、 1世代前の n個の低レベル特徴量抽出式リストのうち、決定した交差数 nxの低レベル特徴量抽出式リストを用いて、 nx個の低レベル特徴量抽出式リストを生成する。ステップ S 34において、低レベル特徴量抽出式リスト生成部 61は、 1世代前の n個の低レベル特徴量抽出式リストのうち、決定した突然変異数 nmの低レベル特徴量抽出式リストを用いて、 nm個の低レベル特徴量抽出式リストを生成する。

[0185] ステップ S32乃至 S34の処理につ!、て詳述する。

[0186] 低レベル特徴量抽出式リスト生成部 61による、ステップ S32の選択生成処理について、図 42のフローチャートを参照して詳述する。この選択生成処理では、次世代の n個の低レベル特徴量抽出式リストのうちの選択数 ns個の低レベル特徴量抽出式リストが生成される。

[0187] ステップ S181において、低レベル特徴量抽出式リスト生成部 61は、 1世代前の n 個の低レベル特徴量抽出式リストを、高レベル特徴量抽出式学習部 65から入力された高レベル特徴量抽出式の評価値の平均値が高い順に並び替える。そして、ステツプ S182において、低レベル特徴量抽出式リスト生成部 61は、並び替えた 1世代前の n個の低レベル特徴量抽出式リストのうち、上位 ns個を次世代の低レベル特徴量抽出式リストとして採用する。以上で選択生成処理は終了される。

[0188] 低レベル特徴量抽出式リスト生成部 61による、図 17のステップ S33の交差生成処理について、図 43のフローチャートを参照して詳述する。この交差生成処理では、次世代の n個の低レベル特徴量抽出式リストのうちの交差数 nx個の低レベル特徴量抽出式リストが生成される。

[0189] ステップ S191において、制御部 27は、交差ループパラメータ NXを 1に初期化して交差ループを開始する。なお、交差ループは、交差数 nxだけ繰り返される。

[0190] ステップ S192において、低レベル特徴量抽出式リスト生成部 61は、前世代の低レベル特徴量抽出式リストから、高レベル特徴量抽出式学習部 65の出力した高レベル特徴量抽出式の評価値の平均値が高い方のものから順に優先的に選択されるよう重み付けをした後、ランダムに 2個の低レベル特徴量抽出式リスト A, Bを選択する。なお、ここでの選択は、上述した選択生成処理で選択された ns個の低レベル特徴量抽出式リストを選択候補力除外してもよ!/、し、選択候補に残してぉ、てもよ、。

[0191] ステップ S193において、低レベル特徴量抽出式リスト生成部 61は、以下の式ループによって生成する低レベル特徴量抽出式リストの式数 mを次式の範囲でランダムに決定する。

m= ( (リスト Aの式数 +リスト Bの式数） Z2)士 mr

mrは予め決定されて、る値

[0192] ステップ S194において、制御部 27は、式ループパラメータ Mを 1に初期化して式ループを開始する。なお、式ループは、ステップ S193の処理でランダムに決定された式数 mだけ繰り返される。

[0193] ステップ S195において、低レベル特徴量抽出式リスト生成部 61は、低レベル特徴量抽出式リスト A, Bに含まれる全ての低レベル特徴量抽出式から、高レベル特徴量抽出式学習部 65から入力された高レベル特徴量抽出式における寄与率が高い方のものが優先的に選択されるように重み付けをした後、ランダムに 1本の低レベル特徴量抽出式を選択して次世代の低レベル特徴量抽出式リストに追加する。

[0194] ステップ S 196において、制御部 27は、式ループパラメータ Mが最大値 mよりも小さいか否かを判定し、式ループパラメータ Mが最大値 mよりも小さい場合、式ループパラメータ Mを 1だけインクリメントして処理をステップ S 195に戻す。反対に、式ループノラメータ Mが最大値 mよりも小さくない場合 (式ループパラメータ Mが最大値 mと同値の場合）、式ループを抜けて処理をステップ S197に進める。式ループであるステツプ S194乃至 S196の処理により、 1個の低レベル特徴量抽出式リストが生成されたことになる。

[0195] ステップ S197において、制御部 27は、交差ループパラメータ NXが最大値 nxよりも小さ!/ヽか否かを判定し、交差ループパラメータ NXが最大値 nxよりも小さ、場合、交差ループパラメータ NXを 1だけインクリメントして処理をステップ S192に戻す。反対に、交差ループパラメータ NXが最大値 nxよりも小さくな、場合 (交差ループパラメータ NXが最大値 nxと同値の場合)、交差ループを抜けて交差生成処理を終了する。この交差ループの処理により、次世代の交差数 nx個の低レベル特徴量抽出式リストが生成されたことになる。

[0196] 低レベル特徴量抽出式リスト生成部 61による、図 17のステップ S34の突然変異生成処理について、図 44のフローチャートを参照して詳述する。この突然変異生成処理では、次世代の n個の低レベル特徴量抽出式リストのうちの突然変異数 nm個の低レベル特徴量抽出式リストが生成される。

[0197] ステップ S201において、制御部 27は、突然変異ループパラメータ NMを 1に初期化して突然変異ループを開始する。なお、突然変異ループは、突然変異数 nmだけ繰り返される。

[0198] ステップ S202において、低レベル特徴量抽出式リスト生成部 61は、前世代の低レベル特徴量抽出式リストから、高レベル特徴量抽出式学習部 65の出力した高レベル特徴量抽出式の評価値の平均値が高い方のものが優先的に選択されるように重み付けをした後、ランダムに 1個の低レベル特徴量抽出式リスト Aを選択する。なお、ここでの選択は、上述した選択生成処理で選択された ns個の低レベル特徴量抽出式リストを選択候補力も除外してもよいし、選択候補に残しておいてもよい。また、上述した交差生成処理のステップ S192の処理で選択された低レベル特徴量抽出式リストを選択候補力除外してもよ、し、選択候補に残してぉ、てもよ、。 [0199] ステップ S203において、低レベル特徴量抽出式リスト生成部 61は、以下の式ループによって生成する低レベル特徴量抽出式リストの式数 mをランダムに決定する。

[0200] ステップ S203において、低レベル特徴量抽出式リスト生成部 61は、以下の式ループによって生成する低レベル特徴量抽出式リストの式数 mを次式の範囲でランダムに決定する。

m=リスト Aの式数士 mr

mrは予め決定されて、る値

[0201] ステップ S204において、制御部 27は、式ループパラメータ Mを 1に初期化して式ループを開始する。なお、式ループは、ステップ S203の処理でランダムに決定された式数 mだけ繰り返される。

[0202] ステップ S205において、低レベル特徴量抽出式リスト生成部 61は、低レベル特徴量抽出式リスト Aに含まれる全ての低レベル特徴量抽出式のうち、 M番目のものに注目して、 M番目の低レベル特徴量抽出式の演算結果である低レベル特徴量の寄与率が、低レベル特徴量抽出式リスト Aに含まれる他の低レベル特徴量抽出式の演算結果である低レベル特徴量の寄与率に比較して低、か否かを判定する。具体的には、例えば低レベル特徴量抽出式リスト Aに含まれる全ての低レベル特徴量抽出式のうち、演算結果である低レベル特徴量の寄与率が低、方の所定の順番までに属するカゝ否かを判定する。

[0203] ステップ S205において、 M番目の低レベル特徴量抽出式の演算結果である低レベル特徴量の寄与率が他よりも低いと判定された場合、処理はステップ S206に進められ、低レベル特徴量抽出式リスト生成部 61は、 M番目の低レベル特徴量抽出式をランダムに変形して (突然変異させて)次世代の低レベル特徴量抽出式リストに追加する。

[0204] 反対に、ステップ S205において、 M番目の低レベル特徴量抽出式の演算結果である低レベル特徴量の寄与率が他よりも低くなヽと判定された場合、処理はステップ S207に進められ、低レベル特徴量抽出式リスト生成部 61は、 M番目の低レベル特徴量抽出式を突然変異させることなぐそのまま次世代の低レベル特徴量抽出式リストに追加する。 [0205] なお、ランダムに決定された式数 mが低レベル特徴量抽出式リスト Aを構成する低レベル特徴量抽出式の式数よりも大き、場合、式ループパラメータ Mが低レベル特徴量抽出式リスト Aを構成する低レベル特徴量抽出式の式数よりも大きくなつた時点でステップ S205における判定を省略し、ランダムに低レベル特徴量抽出式を新規に生成して次世代の低レベル特徴量抽出式リストに追加するようにする。

[0206] ステップ S208において、制御部 27は、式ループパラメータ Mが最大値 mよりも小さいか否かを判定し、式ループパラメータ Mが最大値 mよりも小さい場合、式ループパラメータ Mを 1だけインクリメントして処理をステップ S205に戻す。反対に、式ループノラメータ Mが最大値 mよりも小さくない場合 (式ループパラメータ Mが最大値 mと同値の場合）、式ループを抜けて処理をステップ S209に進める。

[0207] ステップ S203乃至 S208の処理により、低レベル特徴量抽出式リストが 1個生成されたことになる。

[0208] ステップ S209において、制御部 27は、突然変異ループパラメータ NMが最大値 n mよりも小さ、か否かを判定し、突然変異ループパラメータ NMが最大値 nmよりも小さ、場合、突然変異ループパラメータ NMを 1だけインクリメントして処理をステップ S 202に戻す。反対に、突然変異ループパラメータ NMが最大値 nmよりも小さくない場合 (突然変異ループパラメータ NMが最大値 nmと同値の場合）、突然変異ループを抜けて突然変異生成処理を終了する。ここまでの処理により、突然変異数 nm個の低レベル特徴量抽出式リストが生成されたことになる。

[0209] 以上説明した低レベル特徴量抽出式リスト生成部 61による次世代リストジエネテイツク生成処理によれば、 1世代前の低レベル特徴量抽出式リストに対応する評価値が高いもの、低レベル特徴量抽出式に対応する寄与率が高いものは次世代に継承され、評価値や寄与率が低いものは次世代に継承されず淘汰されることになる。したがつて、世代が進むに連れて、低レベル特徴量抽出式リストに対応する評価値は向上し、低レベル特徴量抽出式に対応する寄与率も向上することが期待できる。

[0210] 図 7に戻る。以上のようにして生成された次世代の低レベル特徴量抽出式リストは、低レベル特徴量抽出式リスト生成部 61から低レベル特徴量演算部 24に出力される。ステップ S3において、低レベル特徴量演算部 24は、低レベル特徴量抽出式リスト生成部 61から入力された n個の低レベル特徴量抽出式リストそれぞれに楽曲 CI乃至 Cjの j曲分の入力データ（コンテンツデータやメタデータ）を代入して低レベル特徴量を演算する。そして、演算結果として得られた n組の低レベル特徴量組を高レベル特徴量抽出式学習部 65に出力する。

[0211] ステップ S4において、高レベル特徴量抽出式学習部 65は、低レベル特徴量演算部 24から入力された n組の低レベル特徴量組と、対応する教師データに基づいて、 k 種類の高レベル特徴量抽出式から成る高レベル特徴量抽出式組を n組、学習によつて推定する（生成する)。また、各高レベル特徴量抽出式の評価値と各高レベル特徴量抽出式における各低レベル特徴量の寄与率を算出して低レベル特徴量抽出式リスト生成部 61に出力する。

[0212] 高レベル特徴量抽出式学習部 65による、ステップ S4における高レベル特徴量抽出式学習処理にっ、て、図 45のフローチャートを参照して詳述する。

[0213] ステップ S211において、制御部 27は、リストループパラメータ Nを 1に初期化してリストループを開始する。なお、リストループは、予め設定されているリスト数 nだけ繰り返される。ステップ S212において、制御部 27は、教師データループパラメータ Kを 1 に初期化して教師データループを開始する。なお、教師データループは、予め設定されて、る教師データの種類数 kだけ繰り返される。

[0214] ステップ S213において、制御部 27は、アルゴリズムループパラメータ Aを 1に初期化してアルゴリズムループを開始する。なお、アルゴリズムループは、適用される学習アルゴリズムの種類数 _aだけ繰り返される。適用するアルゴリズムの例については、上述した特徴量抽出アルゴリズム生成装置 20の動作説明と同様である。

[0215] ステップ S214において、制御部 27は、クロスノくリデーシヨンループパラメータ Cを 1 に初期化してクロスバリデーシヨンループを開始する。なお、クロスバリデーシヨンループは、予め設定されて、るクロスノくリデーシヨン回数 cだけ繰り返される。

[0216] ステップ S215において、高レベル特徴量抽出式学習部 65は、 k種類の教師データのうち、 K番目の種類の j曲分の教師データ (真の高レベル特徴量）をランダムに学習用と評価用に 2分割する（クロスバリデーシヨン)。以下、教師データのうち、学習用に分類されたものを学習用データ、評価用に分類されたものを評価用データと記述する。

[0217] ステップ S216において、高レベル特徴量抽出式学習部 65は、 N番目の低レベル特徴量抽出式リストを用いて演算された複数の低レベル特徴量から成る低レベル特徴量組と学習用データとを a番目の学習アルゴリズムに適用して高レベル特徴量抽出式を学習により推定する。

[0218] なお、この学習に際しては、高レベル特徴量抽出式学習部 25と異なり、 N番目の低レベル特徴量抽出式リストを用いて演算された全ての低レベル特徴量 (以下、低レべル特徴量組と記述する）を使用する。これにより高レベル特徴量抽出式の評価値は、元の低レベル特徴量の数が十分であるか否かの評価も考慮した値となる。

[0219] 高レベル特徴量抽出式学習部 65による、ステップ S216の学習アルゴリズムに基づく学習処理について、図 46を参照して説明する。

[0220] ステップ S231において、高レベル特徴量抽出式学習部 65は、低レベル特徴量組と、教師データのうちの学習用データとを用い、 A番目の学習アルゴリズムに適用して高レベル特徴量抽出式を学習により推定する。

[0221] ステップ S232において、高レベル特徴量抽出式学習部 65は、ステップ S232の処理結果として得られた高レベル特徴量の評価値として、情報量基準 AICまたは BICを演算する。以上で、学習アルゴリズムに基づく学習処理は終了される。

[0222] 図 45に戻る。ステップ S217において、高レベル特徴量抽出式学習部 65は、ステツプ S216の処理で得た高レベル特徴量抽出式を、評価用データを用いて評価する。具体的には、得られた高レベル特徴量抽出式を用いて高レベル特徴量を演算し、評価用データとの 2乗誤差を算出する。

[0223] ステップ S218において、制御部 27は、クロスノくリデーシヨンループパラメータじが最大値 cよりも小さ、か否かを判定し、クロスノくリデーシヨンループパラメータ Cが最大値 cよりも小さ、場合、クロスバリデーシヨンループパラメータ Cを 1だけインクリメントして処理をステップ S215に戻す。反対に、クロスバリデーシヨンループパラメータじが最大値 cよりも小さくない場合 (クロスノくリデーシヨンループパラメータ Cが最大値 cと同値の場合）、クロスバリデーシヨンループを抜けて処理をステップ S219に進める。ステップ S214乃至 S218のクロスバリデーシヨンループの処理により、 c本の学習結果、すなわち、高レベル特徴量抽出式が得られたことになる。なお、クロスノくリデーシヨンループにより、学習用データと評価用データがランダムに変換されるので、高レベル特徴量抽出式が過学習されていないことを確認することができる。

[0224] ステップ S219において、高レベル特徴量抽出式学習部 65は、クロスバリデーションループによって得られた c本の学習結果、すなわち、高レベル特徴量抽出式のうち、ステップ S217の処理における評価が最も高いものを選択する。

[0225] ステップ S220において、制御部 27は、アルゴリズムループパラメータ Aが最大値 a よりも小さ、か否かを判定し、アルゴリズムループパラメータ Aが最大値 aよりも小さヽ場合、アルゴリズムループパラメータ Aを 1だけインクリメントして処理をステップ S214 に戻す。反対に、アルゴリズムループパラメータ Aが最大値 aよりも小さくない場合 (ァルゴリズムループパラメータ Aが最大値 aと同値の場合）、アルゴリズムループを抜けて処理をステップ S221に進める。ステップ S213乃至 S220のアルゴリズムループの処理により、 a種類の学習アルゴリズムによって学習された K番目の種類の高レベル特徴量抽出式が a本得られたことになる。

[0226] ステップ S221において、高レベル特徴量抽出式学習部 65は、アルゴリズムループによって得られた a本の学習結果、すなわち、高レベル特徴量抽出式のうち、ステツプ S217の処理における評価が最も高いものを選択する。

[0227] ステップ S222において、制御部 27は、教師データループパラメータ Kが最大値 k よりも小さいか否かを判定し、教師データループパラメータ Kが最大値 kよりも小さい場合、教師データループパラメータ Kを 1だけインクリメントして処理をステップ S213 に戻す。反対に、教師データループパラメータ Kが最大値 kよりも小さくない場合 (教師データループパラメータ Kが最大値 kと同値の場合）、教師データループを抜けて処理をステップ S223に進める。ステップ S212乃至 S222の教師データループの処理により、 N番目の低レベル特徴量抽出式リストに対応する、 k種類の高レベル特徴量抽出式が得られたことになる。

[0228] ステップ S223において、制御部 27は、リストループパラメータ Nが最大値 nよりも小さいか否かを判定し、リストループパラメータ Nが最大値 nよりも小さい場合、リストループパラメータ Nを 1だけインクリメントして処理をステップ S212に戻す。反対に、リストループパラメータ Nが最大値 nよりも小さくない場合 (リストループパラメータ Nが最大値 nと同値の場合）、リストループを抜けて処理をステップ S224に進める。ステップ S211乃至 S223のリストループの処理〖こより、 n個の低レベル特徴量抽出式リストにそれぞれ対応する、 k種類の高レベル特徴量抽出式が得られたことになる。

[0229] ステップ S224において、高レベル特徴量抽出式学習部 65は、得られた n個の低レベル特徴量抽出式リストにそれぞれ対応する、 k種類の高レベル特徴量抽出式における各低レベル特徴量の寄与率を算出し、ステップ S217の処理で計算した高レべル特徴量抽出式の評価値とともに低レベル特徴量抽出式リスト生成部 61に出力する。以上で、高レベル特徴量抽出式学習処理が終了される。

[0230] 図 7に戻る。ステップ S5において、制御部 27は、学習ループパラメータ Gが最大値 gよりも小さいか否かを判定し、学習ループパラメータ Gが最大値 gよりも小さい場合、学習ループパラメータ Gを 1だけインクリメントして処理をステップ S2に戻す。反対に、学習ループパラメータ Gが最大値 gよりも小さくな、場合 (学習ループパラメータ Gが最大値 gと同値の場合）、学習ループを抜けて処理をステップ S6に進める。なお、ステツプ S1乃至 S5の学習ルールが特徴量抽出アルゴリズムの学習過程であり、これ以降のステップ S6は、特徴量抽出アルゴリズムを用いた高レベル特徴量の演算のための処理である。

[0231] ステップ S6において、高レベル特徴量抽出式学習部 65は、学習によって得られた最終世代の n組の低レベル特徴量抽出式リストのうち、得られた高レベル特徴量の平均評価値が最も高かった低レベル特徴量抽出式リストを構成する低レベル特徴量抽出式と、これに対応する k種類の高レベル特徴量抽出式を高レベル特徴量演算部 2 6に供給する。

[0232] ステップ S7において、高レベル特徴量演算部 26は、高レベル特徴量抽出式学習部 65から供給された低レベル特徴量抽出式および高レベル特徴量抽出式のうち、最後に高レベル特徴量抽出式学習部 65から供給された低レベル特徴量抽出式および高レベル特徴量抽出式を用いて高レベル特徴量を高精度に演算する。なお、このステップ S7における高精度高レベル特徴量演算処理については、上述した特徴量抽出アルゴリズム生成装置 20の動作と同様であるので、その説明は省略する。 [0233] 以上、特徴量抽出アルゴリズム生成装置 60による特徴量抽出アルゴリズム生成処理の説明を終了する。

[0234] 以上説明したように、本発明の第 2の実施の形態である特徴量抽出アルゴリズム生成装置 60による特徴量抽出アルゴリズム学習処理によれば、楽曲データから対応する特徴量を抽出できるアルゴリズムを、高精度で速やかに生成することが可能となるだけでなぐ高精度の高レベル特徴量だけを少ない演算量で取得することが可能となる。

[0235] 特に、低レベル特徴量抽出式リストを構成する式数 mをランダムに決定しているので、特徴量抽出アルゴリズム生成装置 20による特徴量抽出アルゴリズム学習処理に比較して、低レベル特徴量の数が無駄に多過ぎて処理が重くなつたり、精度が十分に出なくなったりすることを抑止し、結果としてより高い精度を得ることができる。

[0236] なお、本発明は、楽曲の高レベル特徴量を取得する場合だけでなぐ映像データなどあらゆる種類のコンテンツデータの高レベル特徴量を取得する場合に適用することが可能である。

[0237] ところで、上述した一連の処理は、ハードウェアにより実行させることもできる力ソフトウエア〖こより実行させることもできる。一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラム力専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば図 47に示すように構成された汎用のパーソナルコンピュータなどに、記録媒体からインストールされる。

[0238] このパーソナルコンピュータ 100は、 CPU(Central Processing Unit)101を内蔵している。 CPU101にはバス 104を介して、入出力インタフェース 105が接続されている。ノス 104には、 ROM(Read Only Memory)102および RAM(Random Access Memory) 103が接続されている。

[0239] 入出力インタフェース 105には、ユーザが操作コマンドを入力するキーボード、マウス等の入力デバイスよりなる入力部 106、操作画面などを表示する CRT(Cathode Ray Tube)または LCD(Liquid Crystal Display)等のディスプレイよりなる出力部 107、プログラムや各種データを格納するハードディスクドライブなどよりなる記憶部 108、およびモデム、 LAN(Local Area Network)アダプタなどよりなり、インタネットに代表されるネットワークを介した通信処理を実行する通信部 109が接続されている。また、磁気ディスク（フレキシブルディスクを含む）、光ディスク（CD- ROM(Compact Disc-Read O nly Memory), DVD(Digital Versatile Disc)を含む）、光磁気ディスク（MD(Mini Disc) を含む）、もしくは半導体メモリなどの記録媒体 111に対してデータを読み書きするドライブ 110が接続されて、る。

[0240] このパーソナルコンピュータ 100に上述した一連の処理を実行させるプログラムは、記録媒体 111に格納された状態でパーソナルコンピュータ 100に供給され、ドライブ 110によって読み出されて記憶部 108に内蔵されるハードディスクドライブにインストールされている。記憶部 108にインストールされているプログラムは、入力部 106に入力されるユーザからのコマンドに対応する CPU101の指令によって、記憶部 108から RAM103にロードされて実行される。

[0241] なお、本明細書にぉ、て、プログラムに基づ、て実行されるステップは、記載された順序に従って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。

[0242] また、プログラムは、 1台のコンピュータにより処理されるものであってもよいし、複数のコンピュータによって分散処理されるものであってもよい。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであってもよい。

[0243] また、本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。

[0244] なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなぐ本発明の要旨を逸脱しな、範囲にぉ、て種々の変更が可能である。

Claims

請求の範囲

[1] コンテンツデータの特徴量を検出するための特徴量検出アルゴリズムを生成する情報処理装置において、

前記コンテンツデータまたは前記コンテンツデータに対応するメタデータを入力として低レベル特徴量を出力する複数の低レベル特徴量抽出式から構成される次世代の式リストを、前世代の前記式リストに基づく学習によって生成する低レベル特徴量抽出式リスト生成手段と、

低レベル特徴量抽出式リスト生成手段によって生成された前記式リストを用いて前記低レベル特徴量を演算する演算手段と、

前記コンテンツデータに対応する予め用意された真の高レベル特徴量を教師データとした学習により、前記演算手段によって演算された前記低レベル特徴量を入力として前記コンテンツデータの特徴を示す高レベル特徴量を出力する高レベル特徴量抽出式を生成する高レベル特徴量抽出式生成手段と

を含む情報処理装置。

[2] 前記高レベル特徴量抽出式生成手段は、生成した前記高レベル特徴量抽出式の精度、または前記高レベル特徴量抽出式における前記低レベル特徴量の寄与率の少なくとも一方を算出し、

前記低レベル特徴量抽出式リスト生成手段は、前記高レベル特徴量抽出式生成手段により算出された前記高レベル特徴量抽出式の精度、または前記高レベル特徴量抽出式における前記低レベル特徴量の寄与率の少なくとも一方に基づき、前記低レベル特徴量抽出式リストを構成する前記低レベル特徴量抽出式を更新する

請求項 1に記載の情報処理装置。

[3] 前記低レベル特徴量抽出式リスト生成手段は、第 1世代の前記式リストをランダムに生成する

請求項 1に記載の情報処理装置。

[4] 前記低レベル特徴量抽出式リスト生成手段は、次世代の前記式リストを前世代の前記式リストに基づく遺伝的アルゴリズムにより選択処理、交差処理、または突然変異処理の少なくとも 1つによって生成する請求項 1に記載の情報処理装置。

[5] 前記低レベル特徴量抽出式リスト生成手段は、予め設定された定数の低レベル特徴量抽出式から構成される次世代の式リストを生成する

請求項 1に記載の情報処理装置。

[6] 前記低レベル特徴量抽出式リスト生成手段は、前記リストを生成する度にランダムに決定する数の低レベル特徴量抽出式から構成される次世代の式リストを生成する請求項 1に記載の情報処理装置。

[7] 前記高レベル特徴量抽出式生成手段は、生成した前記高レベル特徴量抽出式の評価値、または前記高レベル特徴量抽出式における前記低レベル特徴量の寄与率の少なくとも一方を算出し、

前記低レベル特徴量抽出式リスト生成手段は、前記高レベル特徴量抽出式生成手段により算出された前記高レベル特徴量抽出式の評価値、または前記高レベル特徴量抽出式における前記低レベル特徴量の寄与率の少なくとも一方に基づき、前記低レベル特徴量抽出式リストを構成する前記低レベル特徴量抽出式を更新する請求項 6に記載の情報処理装置。

[8] コンテンツデータの特徴量を検出するための特徴量検出アルゴリズムを生成する情報処理装置の情報処理方法にお!、て、

前記コンテンツデータまたは前記コンテンツデータに対応するメタデータを入力として低レベル特徴量を出力する複数の低レベル特徴量抽出式から構成される次世代の式リストを、前世代の前記式リストに基づく学習によって生成し、

生成された前記式リストを用いて前記低レベル特徴量を演算し、

前記コンテンツデータに対応する予め用意された真の高レベル特徴量を教師データとした学習により、演算された前記低レベル特徴量を入力として前記コンテンツデータの特徴を示す高レベル特徴量を出力する高レベル特徴量抽出式を生成するステップを含む情報処理方法。

[9] コンテンツデータの特徴量を検出するための特徴量検出アルゴリズムを生成する情報処理装置の制御用のプログラムであって、

前記コンテンツデータに対応する予め用意された真の高レベル特徴量を教師データとした学習により、演算された前記低レベル特徴量を入力として前記コンテンツデータの特徴を示す高レベル特徴量を出力する高レベル特徴量抽出式を生成するステップを含む処理をコンピュータに実行させるプログラム。