JP5035598B2 - 情報処理装置および方法、並びに、プログラム - Google Patents

情報処理装置および方法、並びに、プログラム Download PDF

Info

Publication number
JP5035598B2
JP5035598B2 JP2006305245A JP2006305245A JP5035598B2 JP 5035598 B2 JP5035598 B2 JP 5035598B2 JP 2006305245 A JP2006305245 A JP 2006305245A JP 2006305245 A JP2006305245 A JP 2006305245A JP 5035598 B2 JP5035598 B2 JP 5035598B2
Authority
JP
Japan
Prior art keywords
data
algorithm
teacher data
feature
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006305245A
Other languages
English (en)
Other versions
JP2008123180A (ja
Inventor
由幸 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2006305245A priority Critical patent/JP5035598B2/ja
Publication of JP2008123180A publication Critical patent/JP2008123180A/ja
Application granted granted Critical
Publication of JP5035598B2 publication Critical patent/JP5035598B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、情報処理装置および方法、並びに、プログラムに関し、特に、データの特徴を抽出するアルゴリズムを構築する情報処理装置および方法、並びに、プログラムに関する。
従来、GA(Genetic Algorithm、遺伝的アルゴリズム)またはGP(Genetic Programming、遺伝的プログラミング)により、与えられたデータ(以下、入力データとも称する)の特徴を表す特徴量を抽出する特徴量抽出アルゴリズムを自動的に構築することが提案されている(例えば、特許文献1参照)。
図1は、GAまたはGPにより入力データの特徴量を抽出する、従来の情報処理装置の構成の例を示すブロック図である。図1の情報処理装置1は、アルゴリズム構築部11および特徴量抽出部12を含むように構成される。
アルゴリズム構築部11は、入力データと同様の形式の課題データと、その課題データから抽出されるべき特徴量、すなわち、その課題データの特徴を表す特徴量の正しい値を示す正解データとの組み合わせを含む教師データを用いて、GAまたはGPに基づく学習を行うことにより、入力データの所定の特徴を表す特徴量を抽出する特徴量抽出アルゴリズムを自動的に構築する。例えば、教師データは、課題データ、および、課題データが所定の特徴を有するか否かをtrueまたはfalseの2値により表す正解データの組み合わせを含む。
特徴量抽出部12は、アルゴリズム構築部11により構築された特徴量抽出アルゴリズムを用いて、入力データの特徴量を抽出し、出力する。
米国特許出願公報 US2004/0181401A1
しかしながら、特徴量抽出アルゴリズムを自動構築する場合、特徴量抽出アルゴリズムを人手により構築し、特徴量抽出アルゴリズムで用いる各種のパラメータのみをGPまたはGAを用いて自動推定する場合と比較して、計算量が膨大になり、特徴量抽出アルゴリズムを構築するまでにより多くの時間を要するときがある。
本発明は、このような状況に鑑みてなされたものであり、データの特徴を抽出するアルゴリズムをより高速に構築できるようにするものである。
本発明の側面の情報処理装置は、入力データと同様の形式の課題データと前記課題データの特徴を表す特徴量の正しい値を示す正解データとの組み合わせを含む教師データを用いて、GP(Genetic Programming)またはGA(Genetic Algorithm)により、前記入力データの特徴を表す特徴量を抽出するアルゴリズムを構築する情報処理装置において、新たに構築するアルゴリズムである新規アルゴリズムの構築に用いる前記教師データである新規教師データの前記課題データの特徴を表す特徴量を、過去に構築されたアルゴリズムである構築済アルゴリズムを用いて抽出する抽出手段と、抽出された前記特徴量と前記新規教師データの前記正解データとの類似度を算出する算出手段と、前記類似度に基づいて、前記新規アルゴリズムの構築に用いる遺伝子に利用する前記構築済アルゴリズムを選択する選択手段とが設けられている。
前記抽出手段には、前記新規教師データに含まれ、前記構築済アルゴリズムの構築に用いた教師データである過去教師データに含まれない前記課題データである未含有課題データの特徴を表す特徴量を、前記過去教師データを用いて構築された前記構築済アルゴリズムを用いて抽出し、抽出した前記特徴量を前記未含有課題データに対する前記正解データとして前記過去教師データに追加させ、前記算出手段には、同じ前記課題データに対する、前記正解データが追加された前記過去教師データの前記正解データと前記新規教師データの前記正解データとの類似度を、前記過去教師データと前記新規教師データとの前記類似度として算出させることができる。
本発明の側面の情報処理方法またはプログラムは、入力データと同様の形式の課題データと前記課題データの特徴を表す特徴量の正しい値を示す正解データとの組み合わせを含む教師データを用いて、GP(Genetic Programming)またはGA(Genetic Algorithm)により、前記入力データの特徴を表す特徴量を抽出するアルゴリズムを構築する情報処理装置の情報処理方法、または、入力データと同様の形式の課題データと前記課題データの特徴を表す特徴量の正しい値を示す正解データとの組み合わせを含む教師データを用いて、GP(Genetic Programming)またはGA(Genetic Algorithm)により、前記入力データの特徴を表す特徴量を抽出するアルゴリズムを構築する情報処理をコンピュータに実行させるプログラムにおいて、新たに構築するアルゴリズムである新規アルゴリズムの構築に用いる前記教師データである新規教師データの前記課題データの特徴を表す特徴量を、過去に構築されたアルゴリズムである構築済アルゴリズムを用いて抽出する抽出ステップと、抽出された前記特徴量と前記新規教師データの前記正解データとの類似度を算出する算出ステップと、前記類似度に基づいて、前記新規アルゴリズムの構築に用いる遺伝子に利用する前記構築済アルゴリズムを選択する選択ステップとを含む。
前記抽出ステップにおいて、前記構築済アルゴリズムの構築に用いた教師データである過去教師データに含まれない前記課題データである未含有課題データの特徴を表す特徴量を、前記過去教師データを用いて構築された前記構築済アルゴリズムを用いて抽出し、抽出した前記特徴量を前記未含有課題データに対する前記正解データとして前記過去教師データに追加させ、前記算出ステップにおいて、同じ前記課題データに対する、前記正解データが追加された前記過去教師データの前記正解データと前記新規教師データの前記正解データとの類似度を、前記過去教師データと前記新規教師データとの前記類似度として算出させるようにすることができる。
本発明の側面においては、新たに構築するアルゴリズムである新規アルゴリズムの構築に用いる前記教師データである新規教師データの前記課題データの特徴を表す特徴量が、過去に構築されたアルゴリズムである構築済アルゴリズムを用いて抽出され、抽出された前記特徴量と前記新規教師データの前記正解データとの類似度が算出され、前記類似度に基づいて、前記新規アルゴリズムの構築に用いる遺伝子に利用する前記構築済アルゴリズムが選択される。
本発明の側面によれば、アルゴリズムの構築に用いる遺伝子が選択される。また、本発明の側面によれば、データの特徴を抽出するアルゴリズムをより高速に構築することができる。
以下に本発明の実施の形態を説明するが、本発明の構成要件と、明細書または図面に記載の実施の形態との対応関係を例示すると、次のようになる。この記載は、本発明をサポートする実施の形態が、発明の詳細な説明に記載されていることを確認するためのものである。従って、発明の詳細な説明中には記載されているが、本発明の構成要件に対応する実施の形態として、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その構成要件に対応するものではないことを意味するものではない。逆に、実施の形態が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。
本発明の側面の情報処理装置(例えば、図3のアルゴリズム構築部111)は、入力データと同様の形式の課題データと前記課題データの特徴を表す特徴量の正しい値を示す正解データとの組み合わせを含む教師データを用いて、GP(Genetic Programming)またはGA(Genetic Algorithm)により、前記入力データの特徴を表す特徴量を抽出するアルゴリズムを構築する情報処理装置において、新たに構築するアルゴリズムである新規アルゴリズムの構築に用いる前記教師データである新規教師データの前記課題データの特徴を表す特徴量を、過去に構築されたアルゴリズムである構築済アルゴリズムを用いて抽出する抽出手段(例えば、図5の特徴量抽出部131)と、抽出された前記特徴量と前記新規教師データの前記正解データとの類似度を算出する算出手段(例えば、図5の類似度算出部132)と、前記類似度に基づいて、前記新規アルゴリズムの構築に用いる遺伝子に利用する前記構築済アルゴリズムを選択する選択手段(例えば、図5の選択部133)とを備える。
本発明の側面の情報処理方法またはプログラムは、入力データと同様の形式の課題データと前記課題データの特徴を表す特徴量の正しい値を示す正解データとの組み合わせを含む教師データを用いて、GP(Genetic Programming)またはGA(Genetic Algorithm)により、前記入力データの特徴を表す特徴量を抽出するアルゴリズムを構築する情報処理装置の情報処理方法、または、入力データと同様の形式の課題データと前記課題データの特徴を表す特徴量の正しい値を示す正解データとの組み合わせを含む教師データを用いて、GP(Genetic Programming)またはGA(Genetic Algorithm)により、前記入力データの特徴を表す特徴量を抽出するアルゴリズムを構築する情報処理をコンピュータに実行させるプログラムにおいて、新たに構築するアルゴリズムである新規アルゴリズムの構築に用いる前記教師データである新規教師データの前記課題データの特徴を表す特徴量を、過去に構築されたアルゴリズムである構築済アルゴリズムを用いて抽出する抽出ステップ(例えば、図5のステップS5)、抽出された前記特徴量と前記新規教師データの前記正解データとの類似度を算出する算出ステップ(例えば、図5のステップS6)、前記類似度に基づいて、前記新規アルゴリズムの構築に用いる遺伝子に利用する前記構築済アルゴリズムを選択する選択ステップ(例えば、図5のステップS8)を含む。
以下、図を参照して、本発明の実施の形態について説明する。
図2は、本発明を適用した情報処理装置の一実施の形態を示すブロック図である。図2の情報処理装置101は、アルゴリズム構築部111および特徴量抽出部112を含むように構成される。
アルゴリズム構築部111は、GAまたはGPにより、入力データの特徴を表す特徴量を抽出する特徴量抽出アルゴリズムを自動構築し、特徴量抽出部112に供給する。
アルゴリズム構築部111は、1種類目の特徴を表す特徴量を抽出する特徴量抽出アルゴリズムを構築する場合、図3に示されるように、従来と同様に、外部から与えられた教師データのみを用いて、GAまたはGPに基づく学習を行うことにより、特徴量抽出アルゴリズムを構築する。そして、アルゴリズム構築部111は、2種類目以降の特徴を表す特徴量を抽出する特徴量抽出アルゴリズムを構築する場合、図4に示されるように、外部から与えられた教師データに加えて、以前構築した特徴量抽出アルゴリズムおよびその特徴量抽出アルゴリズムの構築に用いた教師データを用いて、GAまたはGPに基づく学習を行うことにより、特徴量抽出アルゴリズムを構築する。
特徴量抽出部112は、アルゴリズム構築部111により構築された特徴量抽出アルゴリズムを用いて、入力データの特徴を表す特徴量を抽出し、出力する。
図5は、図2のアルゴリズム構築部111の機能的構成を示すブロック図である。アルゴリズム構築部111は、第1世代遺伝子生成部121、遺伝子評価部122、第2世代以降遺伝子生成部123、推定式生成部124、および、教師データ記憶部125を含むように構成される。
第1世代遺伝子生成部121は、各種の関数の組み合わせを示す遺伝子の第1世代を生成する。第1世代遺伝子生成部121は、特徴量抽出部131、類似度算出部132、選択部133、交差部134、突然変異部135、ランダム生成部136、および、学習結果記憶部137を含むように構成される。
特徴量抽出部131は、過去にアルゴリズム構築部111により構築された特徴量抽出アルゴリズム(以下、構築済アルゴリズムとも称する)、および、その特徴量抽出アルゴリズムの構築に用いた教師データ(以下、過去教師データとも称する)を学習結果記憶部137から取得する。また、特徴量抽出部131は、新たに構築する特徴量抽出アルゴリズム(以下、新規アルゴリズムとも称する)の構築に用いる教師データ(以下、新規教師データとも称する)を教師データ記憶部125から取得する。
特徴量抽出部131は、図7および図8などを参照して後述するように、学習結果記憶部137に記憶されている各過去教師データについて、新規教師データに含まれ、過去教師データに含まれない課題データ(以下、未含有課題データと称する)に対する特徴量を、構築済アルゴリズムを用いて抽出し、抽出した特徴量を未含有課題データに対する正解データとして、その構築済アルゴリズムの構築に用いた過去教師データに追加する。特徴量抽出部131は、未含有課題データに対する正解データを追加した過去教師データを類似度算出部132に供給する。
また、特徴量抽出部131は、学習結果蓄積部137に学習結果が蓄積されていない場合、学習結果が蓄積されていないことをランダム生成部136に通知する。
類似度算出部132は、図7および図8などを参照して後述するように、各構築済アルゴリズムについて、対応する過去教師データと新規教師データとの類似度を算出する。類似度算出部132は、構築済アルゴリズム、および、算出した類似度を選択部133に供給する。
選択部133は、図7および図8などを参照して後述するように、類似度に基づいて、新規アルゴリズムの構築に用いる遺伝子に利用する構築済アルゴリズムを選択する。選択部133は、選択した構築済アルゴリズムを構築する関数の組み合わせを示す遺伝子を生成し、交差部134および突然変異部135に供給する。また、選択部133は、生成した遺伝子を第1世代の遺伝子として遺伝子評価部122に供給する。さらに、選択部133は、生成した遺伝子の数に応じた数の遺伝子の生成をランダム生成部136に指示する。
交差部134は、図7および図8などを参照して後述するように、選択部133から供給された遺伝子の中からランダムに選択した2つの遺伝子間で関数の一部を交換し、各遺伝子の関数を組み替えることにより、2つの遺伝子を交差させる。交差部134は、交差させた遺伝子を第1世代の遺伝子として遺伝子評価部122に供給する。
突然変異部135は、図7および図8などを参照して後述するように、選択部133から供給された遺伝子の中からランダムに選択した遺伝子の関数の一部をランダムに変形することにより、遺伝子を突然変異させる。突然変異部135は、突然変異させた遺伝子を第1世代の遺伝子として遺伝子評価部122に供給する。
ランダム生成部136は、図7および図8などを参照して後述するように、各種の関数をランダムに組み合わせることにより、新たな遺伝子を生成する。ランダム生成部136は、生成した遺伝子を遺伝子評価部122に供給する。
遺伝子評価部122は、第1世代遺伝子生成部121または第2世代以降遺伝子生成部123により生成された各遺伝子について、新規教師データの課題データから、どの程度の精度で正しい特徴量を抽出できるかを評価する。遺伝子評価部122は、実行部141、および、評価部142を含むように構成される。
実行部141は、新規教師データの各課題データに対して、各遺伝子に示される関数の処理を順に実行することにより、各課題データに対する遺伝子の計算値を求める。実行部141は、求めた計算値を評価部142に供給する。
評価部142は、図7および図8などを参照して後述するように、第1世代遺伝子生成部121または第2世代以降遺伝子生成部123により生成された各遺伝子について、新規教師データの課題データから、どの程度の精度で正しい特徴量を抽出できるかを示す評価値を算出する。評価部142は、評価した遺伝子、および、その評価値を示す情報を、第2世代以降遺伝子生成部123の選択部151、交差部152、および、突然変異部153に供給する。また、評価部142は、所定の数の遺伝子の生成をランダム生成部154に指示する。さらに、評価部142は、評価値が安定し、遺伝子の進化が収束したと判定した場合、進化が収束したと判定した世代の遺伝子、各遺伝子の評価値、および、新規教師データを選択部151に供給する。
第2世代以降遺伝子生成部123は、第2世代以降の遺伝子を生成する。第2世代以降遺伝子生成部123は、選択部151、交差部152、突然変異部153、および、ランダム生成部154を含むように構成される。
選択部151は、図7および図8などを参照して後述するように、評価部142により求められた評価値に基づいて、現在の世代の中から次の世代に継承する遺伝子を選択し、選択した遺伝子を次の世代の遺伝子として遺伝子評価部122に供給する。また、選択部151は、遺伝子の進化が収束したと判定された場合、評価値が最も高い遺伝子を選択し、選択した遺伝子(以下、最終選択遺伝子とも称する)、および、新規教師データを推定式生成部124に供給する。
交差部152は、図7および図8などを参照して後述するように、現在の世代の遺伝子のうち評価値が高い遺伝子の中からランダムに選択した2つの遺伝子間で関数の一部を交換し、各遺伝子の関数を組み替えることにより、2つの遺伝子を交差させる。交差部152は、交差させた遺伝子を次の世代の遺伝子として遺伝子評価部122に供給する。
突然変異部153は、図7および図8などを参照して後述するように、現在の世代の遺伝子のうち評価値が高い遺伝子の中からランダムに選択した遺伝子の関数の一部をランダムに変形することにより、遺伝子を突然変異させる。突然変異部153は、突然変異させた遺伝子を、次の世代の遺伝子として遺伝子評価部122に供給する。
ランダム生成部154は、図7および図8などを参照して後述するように、各種の関数をランダムに組み合わせることにより、新たな遺伝子を生成する。ランダム生成部154は、生成した遺伝子を次の世代の遺伝子として遺伝子評価部122に供給する。
推定式生成部124は、図7および図8などを参照して後述するように、最終選択遺伝子により計算される計算値に基づいて特徴量を推定するための推定式を生成する。推定式生成部124は、最終選択遺伝子に示される関数の組み合わせに、求めた推定式を組み合わせることにより特徴量抽出アルゴリズム(新規アルゴリズム)を生成し、特徴量抽出部112に出力する。また、推定式生成部124は、新規アルゴリズムおよび新規教師データを関連づけて、新たな学習結果として学習結果記憶部137に記憶させる。
教師データ記憶部125は、外部から入力される教師データを記憶する。
図6は、図2の特徴量抽出部112の機能的構成の一例を示すブロック図である。図6の特徴量抽出部112は、明るさ抽出部211、速さ抽出部212、エネルギー感抽出部213、リズムの割合抽出部214、および、ジャンル判別部215などを含むように構成される。
明るさ抽出部211は、アルゴリズム構築部111により構築された特徴量抽出アルゴリズムを用いて、楽曲の波形データから楽曲の明るさを特徴量として抽出し、後段に出力する。
速さ抽出部212は、アルゴリズム構築部111により構築された特徴量抽出アルゴリズムを用いて、楽曲の波形データから楽曲を聴いたときに感じる楽曲の速さの度合いを特徴量として抽出し、後段に出力する。
エネルギー感抽出部213は、アルゴリズム構築部111により構築された特徴量抽出アルゴリズムを用いて、楽曲の波形データから楽曲を聴いたときに感じるエネルギー感を特徴量として抽出し、後段に出力する。
リズムの割合抽出部214は、アルゴリズム構築部111により構築された特徴量抽出アルゴリズムを用いて、楽曲の波形データから楽曲全体のエネルギーのうちリズム楽器によるエネルギーが占める割合を表すリズムの割合を特徴量として抽出し、後段に出力する。
ジャンル判別部215は、アルゴリズム構築部111により構築された特徴量抽出アルゴリズムを用いて、楽曲の波形データから楽曲のジャンルを判別し、後段に出力する。
次に、図7乃至図22を参照して、情報処理装置101の処理について説明する。
まず、図7および図8のフローチャートを参照して、アルゴリズム構築部111により実行されるアルゴリズム構築処理について説明する。
まず、1種類目の特徴を表す特徴量を抽出する特徴量抽出アルゴリズムを構築する場合のアルゴリズム構築処理について説明する。
ステップS1において、アルゴリズム構築部111は、ユーザにより入力された教師データを取得し、教師データ記憶部125に記憶させる。
図9は、教師データの一例を示している。図9の教師データは、楽曲の波形データから楽曲の明るさを表す特徴量を抽出する抽出特徴量抽出アルゴリムの構築に用いられる教師データであり、楽曲を識別するための識別子(例えば、タイトルなど)、図6の特徴量抽出部112に入力される入力データと同様の形式の波形データであって、楽曲の音声の振幅の時系列の変化を示す波形データである課題データ、および、課題データの特徴である明るさを表す特徴量の正しい値を示す正解データの組み合わせを含む。正解データは、trueまたはfalseの2値で表され、明るい曲調の楽曲にはtrueが設定され、暗い曲調の楽曲にはfalseが設定される。
ステップS2において、特徴量抽出部131は、学習結果が蓄積されているかを判定する。いまの場合、1種類目の特徴量抽出アルゴリズムを構築する処理を行っており、過去に特徴量抽出アルゴリズムが構築されておらず、過去の学習結果が学習結果記憶部137に記憶されていないので、学習結果が蓄積されていないと判定され、処理はステップS3に進む。
ステップS3において、ランダム生成部136は、遺伝子をランダムに生成する。具体的には、特徴量抽出部131は、学習結果が蓄積されていないことをランダム生成部136に通知する。ランダム生成部136は、フーリエ変換(FFT)、ウェーブレット変換、メル周波数ケプストラム係数(MFCC)変換などの各種変換関数、LPF(Low Pass filter)、HPF(High Pass filter)、BPF(Band Pass Filter)、各種の窓関数などの各種フィルタ、平均、標準偏差などを計算する各種統計関数、および、四則演算、絶対値演算、各種の正規化、対数演算、指数演算、微積分などのその他の関数をランダムに組み合わせることにより、所定の数の遺伝子を生成する。
遺伝子は、例えば、[処理軸#]関数名[(係数[,係数2…])]のフォーマットで表される関数が、実行順に左から並べられた形式で表される。
図10は、遺伝子の表記の例を示している。図10の上側の遺伝子251は、5個の関数を組み合わせることにより構成される。遺伝子251は、入力データに対して、1番目の関数であるTime#Split(2048,1024)により、時間軸方向に1024サンプルずつオーバーラップさせながら2048サンプルずつデータを切り出し、2番目の関数であるTime#Window_Hunningにより、ハニング窓をかけ、3番目の関数であるTime#FFTにより、時間軸をFFT(高速フーリエ変換)し、4番目の関数であるFreq#LogAxis(32)により、周波数軸を32次元のログ軸に変換し、5番目の関数であるFreq#StDevにより、周波数方向の標準偏差を取る処理を行う。
また、図10の下側の遺伝子252は、7個の関数を組み合わせることにより構成される。遺伝子252は、入力データに対して、1番目の関数であるTime#Split(256,8)により、8サンプルずつオーバーラップさせながら256サンプルずつデータを切り出し、2番目の関数であるTime#Window_Hunningにより、ハニング窓をかけ、3番目の関数であるTime#FFTにより、時間軸をFFTし、4番目の関数であるFreq#Meanにより、周波数軸方向の平均を取り、5番目の関数であるTime2#Split(256,8)により、再び8フレームずつオーバーラップさせながら256フレームずつデータを切り出し、6番目の関数であるTime2#FFTにより、1番目の関数により切り出されたデータの時間軸をFFTし、7番目の関数であるTime3#Meanにより、5番目の関数により切り出されたデータを時間軸方向の平均を取る処理を行う。
ランダム生成部136は、生成した遺伝子を第1世代の遺伝子として遺伝子評価部122に供給する。
その後、処理はステップS12に進む。
ステップS12において、実行部141は、まだ評価していない遺伝子を1つ選択する。いまの場合、実行部141は、ランダム生成部136により生成された第1世代の遺伝子の中から、まだ評価していない遺伝子を評価対象として1つ選択する。
ステップS13において、実行部141は、新規教師データの中から未処理の課題データを1つ選択する。具体的には、実行部141は、教師データ記憶部125に記憶されている新規教師データの中から、評価対象の遺伝子による処理が実行されていない課題データを1つ選択する。
ステップS14において、実行部141は、選択した課題データに対する評価対象の遺伝子の計算値を求める。具体的には、実行部141は、選択した課題データに対して、評価対象の遺伝子に示される関数の処理を順に実行することにより、課題データに対する遺伝子の計算値を求める。実行部141は、求めた計算値を評価部142に供給する。
ステップS15において、実行部141は、全ての課題データについて処理したかを判定する。実行部141は、新規教師データの課題データのうち、評価対象の遺伝子の示す処理が実行されていない課題データがある場合、まだ全ての課題データについて処理していないと判定し、処理はステップS13に戻る。その後、ステップS15において、全ての課題データについて処理したと判定されるまで、ステップS13乃至S15の処理が繰り返し実行される。
これにより、例えば、図11に示されるように、新規教師データに含まれる全楽曲について、課題データである各楽曲の波形データに対して、評価対象の遺伝子に示される関数の処理を実行することにより、各課題データに対する遺伝子の計算値が求められる。
ステップS15において、全ての課題データについて処理したと判定された場合、処理はステップS16に進む。
ステップS16において、評価部142は、遺伝子を評価する。具体的には、評価部142は、図12に示されるように、新規教師データの各課題データに対して、評価対象の遺伝子により求めた計算値に基づいて、どの程度の精度で正しい特徴量を推定することができるかを示す評価値を算出する。すなわち、この評価値は、評価対象の遺伝子に示される関数の組み合わせを利用して、新規教師データの課題データから、どの程度の精度で正しい特徴量を抽出できるかを示す。
新規教師データの正解データに示される特徴量が連続した数値(numericalな値)で表される場合、例えば、正解データに示される特徴量が、0.0乃至1.0の範囲内の連続した数値で表される楽曲のスピード感である場合、例えば、ピアソンの相関係数の絶対値が遺伝子の評価値として用いられる。具体的には、新規教師データの各課題データに対する正解データの値を変数Xとし、各課題データについて評価対象の遺伝子により求めた計算値を変数Yとした場合、変数Xと変数Yとの間の相関係数rは、次の式(1)により求められる。
Figure 0005035598
図13乃至図15は、正解データの値を横軸とし、評価対象の遺伝子により求めた計算値を縦軸とした散布図の例を示している。評価対象の遺伝子により求めた計算値と正解データの値との相関が弱いほど、図13に示されるように、散布図においてデータがランダムに分布するようになり、相関係数rは0または0に近い値となる。一方、評価対象の遺伝子により求めた計算値と正解データの値との相関が強いほど、図15に示されるように、散布図においてデータがほぼ一直線かつ右肩上がりに分布するか、または、図示はしていないが、散布図においてデータがほぼ一直線かつ右肩下がりに分布するようになり、相関係数rは1.0もしくは1.0に近い値、または、-1.0もしくは-1.0に近い値となる。
なお、評価対象の遺伝子により求めた計算値と正解データの値との相関が強いほど、評価対象の遺伝子による計算値に基づいて推定される入力データの特徴量の精度は高くなり、評価対象の遺伝子の示す関数の組み合わせを利用して抽出される入力データの特徴量の精度が高くなる可能性は高くなる。従って、相関係数rの絶対値が1.0に近いほど、評価対象の遺伝子の示す関数の組み合わせを利用して、入力データの特徴量を精度よく抽出できる可能性は高くなり、相関係数rの絶対値が0.0に近いほど、評価対象の遺伝子の示す関数の組み合わせを利用して、入力データの特徴量を精度よく抽出できる可能性は低くなる。
また、新規教師データの正解データに示される特徴量が所定のクラスに分類される場合、例えば、正解データに示される特徴量が、MajorまたはMinorの2つのクラスに分類されたり、ロック、ジャズ、クラシックなどの複数のジャンルに分類される場合、例えば、フィッシャーの分散分析(FDR(Fisher Discriminant Ratio))が評価値として用いられる。
例えば、特徴量が2つのクラスに分類される場合、換言すれば、特徴量が2値で表される場合、評価対象の遺伝子による計算値を、その計算値に対応する課題データの正解データの値により2つの集合に分類し、一方の集合X、もう一方の集合Yとしたとき、FDRは、以下の式(2)により求められる。
Figure 0005035598
図16乃至図18は、集合Xに属する計算値の確率分布と、集合Yに属する計算値の確率分布を示すグラフである。
評価対象の遺伝子により求めた計算値と属する集合との相関が弱いほど、すなわち、評価対象の遺伝子により求めた計算値と正解データの値との相関が弱いほど、図16に示されるように、集合Xの確率分布の山と集合Yの確率分布の山が重なる部分が多くなり、FDRの値は小さくなる。一方、評価対象の遺伝子により求めた計算値と属するクラスとの相関が強いほど、すなわち、評価対象の遺伝子により求めた計算値と正解データの値との相関が強いほど、図18に示されるように、集合Xの確率分布の山と集合Yの確率分布の山が重なる部分が少なくなり、FDRの値は大きくなる。
上述したように、評価対象の遺伝子により求めた計算値と正解データの値との相関が強いほど、評価対象の遺伝子の示す関数の組み合わせに基づいて抽出される入力データの特徴量の精度が高くなる可能性は高くなるので、FDRの値が大きいほど、評価対象の遺伝子の示す関数の組み合わせを利用して、入力データの特徴量を精度よく抽出できる可能性は高くなり、FDRの値が小さいほど、評価対象の遺伝子の示す関数の組み合わせを利用して、入力データの特徴量を精度よく抽出できる可能性は低くなる。
なお、上述した遺伝子の評価値の算出方法はその一例であり、上述した算出方法に限定されるものではなく、遺伝子により求められる計算値、および、特徴量の性質などに応じた適切な方法を用いることが望ましい。
ステップS17において、評価部142は、全ての遺伝子を評価したかを判定する。まだ全ての遺伝子を評価していないと判定された場合、処理はステップS12に戻り、ステップS17において、全ての遺伝子を評価したと判定されるまで、ステップS12乃至S17の処理が繰り返し実行される。
ステップS17において、全ての遺伝子を評価したと判定された場合、いまの場合、第1世代の全ての遺伝子の評価が終了した場合、処理はステップS18に進む。
ステップS18において、評価部142は、過去の世代の遺伝子と現在の世代の遺伝子の評価値を比較する。いまの場合、第1世代の遺伝子の評価が行われており、過去の世代の遺伝子の評価値は記憶されていないため、評価部142は、第1世代の遺伝子の評価値の最大値を、現時点の遺伝子の評価値として記憶する。
ステップS19において、評価部142は、評価値が所定の世代の間更新されていないかを判定する。いまの場合、直前のステップS18において、評価値が更新されているので、処理はステップS20に進む。
ステップS20において、選択部151は、遺伝子を選択する。具体的には、評価部142は、現在の世代の全ての遺伝子、および、各遺伝子の評価値を示す情報を選択部151に供給する。選択部151は、評価値が高いものから順に所定の数の遺伝子を選択し、選択した遺伝子を次の世代の遺伝子として遺伝子評価部122に供給する。
ステップS21において、交差部152は、遺伝子を交差させる。具体的には、評価部142は、現在の世代の全ての遺伝子、および、各遺伝子の評価値を示す情報を交差部152に供給する。交差部152は、評価値が所定の値以上の遺伝子の中から2つの遺伝子をランダムに選択し、選択した遺伝子間で関数の交換を行い、各遺伝子の関数を組み替えることにより、2つの遺伝子を交差させる。交差部152は、所定の数の遺伝子を交差させ、交差させた遺伝子を、次の世代の遺伝子として遺伝子評価部122に供給する。
ステップS22において、突然変異部153は、遺伝子を突然変異させる。具体的には、評価部142は、現在の世代の全ての遺伝子、および、各遺伝子の評価値を示す情報を突然変異部153に供給する。突然変異部153は、評価値が所定の値以上の遺伝子の中から所定の数の遺伝子をランダムに選択し、選択した遺伝子の関数の一部をランダムに変形することにより、遺伝子を突然変異させる。突然変異部153は、突然変異させた遺伝子を、次の世代の遺伝子として遺伝子評価部122に供給する。
ステップS23において、ランダム生成部154は、遺伝子をランダムに生成する。具体的には、評価部142は、所定の数の遺伝子の生成をランダム生成部154に指示する。ランダム生成部154は、ステップS3のランダム生成部136による処理と同様に、各種の関数をランダムに組み合わせた所定の数の遺伝子を生成する。ランダム生成部154は、生成した遺伝子を、次の世代の遺伝子として遺伝子評価部122に供給する。
その後、処理はステップS12に戻り、ステップS17において、全ての遺伝子を評価したと判定されるまで、ステップS12乃至S17の処理が繰り返され、第2世代の遺伝子の評価が行われる。
ステップS17において、全ての遺伝子を評価したと判定された場合、すなわち、第2世代の全ての遺伝子の評価が終了した場合、処理はステップS18に進む。
ステップS18において、いまの場合、評価部142は、記憶している1世代前における遺伝子の評価値、すなわち、第1世代における遺伝子の評価値と、第2世代の遺伝子の評価値の最大値を比較する。評価部142は、第2世代の遺伝子の評価値の最大値の方が第1世代における遺伝子の評価値より大きい場合、現時点の遺伝子の評価値を第2世代の遺伝子の評価値の最大値に更新し、第2世代の遺伝子の評価値の最大値が第1世代における遺伝子の評価値以下である場合、遺伝子の評価値を更新せず、そのまま現時点の遺伝子の評価値とする。
その後、ステップS19において、評価値が所定の世代の間更新されていないと判定されるまで、ステップS12乃至S23の処理が繰り返し実行される。すなわち、遺伝子の評価値が所定の世代にわたって更新されなくなるまで、新たな世代の遺伝子が生成され、生成された遺伝子が評価され、1世代前における遺伝子の評価値と、新たな世代の遺伝子の評価値の最大値とが比較され、新たな世代の遺伝子の評価値の最大値の方が大きい場合、遺伝子の評価値を更新する処理が繰り返される。
ステップS19において、評価値が所定の世代の間更新されていないと判定された場合、すなわち、遺伝子の評価値が安定し、遺伝子の進化が収束したと判定された場合、処理はステップS24に進む。
なお、ステップS19において、現在の世代の遺伝子の評価値の最大値が所定の閾値以上であるか否かを判定するようにしてもよい。この場合、ステップS19において、現在の世代の遺伝子の評価値の最大値が所定の閾値未満であると判定された場合、すなわち、現在の世代の遺伝子に示される関数の組み合わせを用いて抽出される特徴量の精度が所望の値に達していないと判定された場合、処理はステップS20に進み、現在の世代の遺伝子の評価値の最大値が所定の閾値以上であると判定された場合、すなわち、現在の世代の遺伝子に示される関数の組み合わせを用いて抽出される特徴量の精度が所望の値に達していると判定された場合、処理はステップS24に進む。
ステップS24において、選択部151は、特徴量抽出アルゴリズムに用いる遺伝子を選択する。具体的には、評価部142は、現在の世代の全ての遺伝子、各遺伝子の評価値を示す情報、および、新規教師データを選択部151に供給する。選択部151は、評価値が最も高い遺伝子、すわなち、最終選択遺伝子を選択し、最終選択遺伝子および新規教師データを推定式生成部124に供給する。
ステップS25において、推定式生成部124は、特徴量を推定するための推定式を生成する。具体的には、推定式生成部124は、特徴量が連続した数値で表される場合、新規教師データの正解データ、および、新規教師データの各課題データに対して最終選択遺伝子を用いて求められる計算値に基づいて、例えば、統計回帰解析の手法を用いて、計算値から教師データの正解データを推定するための回帰式を推定式として生成する。
また、推定式生成部124は、特徴量が所定のクラスに分類される場合、新規教師データの正解データ、および、新規教師データの各課題データに対して最終選択遺伝子を用いて求められる計算値に基づいて、例えば、線形判別の手法を用いて、計算値から教師データの正解データを推定するための判別式を推定式として生成する。
推定式生成部124は、最終選択遺伝子に示される関数の組み合わせに、求めた推定式を組み合わせることにより特徴量抽出アルゴリズム(新規アルゴリズム)を生成し、特徴量抽出部112に出力する。特徴量抽出部112は、新規アルゴリズムを用いて、入力データの所定の特徴を示す特徴量を抽出する抽出部(例えば、図1の明るさ抽出部211など)を生成する。
なお、推定式を求める方法は、上述した方法に限定されるものではなく、計算値および特徴量の性質などに応じた適切な方法を用いることが望ましい。
また、推定式生成部124は、最終選択遺伝子を用いて計算される計算値をそのまま特徴量として用いることができる場合、最終選択遺伝子に示される関数の組み合わせをそのまま新規アルゴリズムとして特徴量抽出部112に出力する。
ステップS26において、推定式生成部124は、学習結果を蓄積し、特徴量抽出アルゴリズム構築処理は終了する。具体的には、推定式生成部124は、新規アルゴリズムおよび新規教師データを関連づけて、新たな学習結果として学習結果記憶部137に記憶させる。
次に、図7および図8のフローチャートを参照して、2種類目以降の特徴を表す特徴量を抽出する特徴量抽出アルゴリズムを構築する場合のアルゴリズム構築処理について説明する。
ステップS1において、上述したように教師データが取得される。
ステップS2において、いまの場合、過去に特徴量抽出アルゴリズムが構築されており、過去の学習結果が学習結果記憶部137に記憶されているので、学習結果が蓄積されていると判定され、処理はステップS4に進む。
ステップS4において、特徴量抽出部131は、特徴量抽出アルゴリズムを1つ選択する。具体的には、特徴量抽出部131は、学習結果記憶部137に記憶されている特徴量抽出アルゴリズム(構築済アルゴリズム)のうち、まだ処理していないものを1つ選択する。
ステップS5において、特徴量抽出部131は、選択した特徴抽出アルゴリズムを用いて、新規教師データの課題データの特徴量を抽出する。具体的には、特徴量抽出部131は、選択した特徴抽出アルゴリズム(以下、選択アルゴリズムとも称する)の構築に用いた過去教師データを学習結果記憶部137から取得する。また、特徴量抽出部131は、新規教師データを教師データ記憶部125から取得する。特徴量抽出部131は、新規教師データに含まれ、過去教師データに含まれない課題データ(未含有課題データ)を新規教師データから抽出する。特徴量抽出部131は、選択アルゴリズムを用いて未含有課題データの特徴量を抽出し、抽出した特徴量を未含有課題データに対する正解データとして過去教師データに追加する。
ここで、図19を参照して、ステップS5の処理の例を説明する。新規教師データ301は、各楽曲の波形データである図示せぬ課題データ、および、各課題データの特徴である楽曲のリズムの多さをtrue(リズムが多い、リズミックである)またはfalse(リズムが少ない、リズミックでない)の2値で表す特徴量の正しい値を示す正解データの組み合わせを含む。過去教師データ302は、各楽曲の波形データである図示せぬ課題データ、および、各課題データの特徴である楽曲のエネルギッシュさをtrue(エネルギッシュである)またはfalse(エネルギッシュでない)の2値で表す特徴量の正しい値を示す正解データの組み合わせを含む。
例えば、図19に示されるように、新規教師データ301が楽曲3に対する正解データを含み、過去教師データ302が楽曲3に対する正解データを含まない場合、特徴量抽出部131は、過去に構築されている、楽曲のエネルギッシュさを表す特徴量を抽出する構築済アルゴリズムを用いて、楽曲3のエネルギッシュさを表す特徴量を抽出する。特徴量抽出部131は、抽出した特徴量を、過去教師データ302における楽曲3に対する正解データであると推定し、過去教師データ302に追加する。特徴量抽出部131は、他にも、新規教師データ301に含まれ、過去教師データ302に含まれない楽曲がある場合、同様の方法により、それらの全ての楽曲に対する正解データを推定し、過去教師データ302に追加する。これにより、過去教師データ302Aが生成される。
なお、このとき、過去教師データに追加した正解データに対応する未含有課題データを過去教師データに追加するようにしてもよいし、新規教師データのどの課題データ(未含有課題データ)に対応する正解データであるかを示すデータ(例えば、データの番号や楽曲のタイトル名などを)未含有課題データの代わりに、過去課題データに追加するようにしてもよい。
また、特徴量抽出部131は、新規教師データに含まれる課題データに対する正解データが全て過去教師データに含まれる場合、学習結果記憶部137から取得した過去教師データをそのまま類似度算出部132に供給する。
なお、ステップS5において、特徴量抽出部131が、過去教師データに含まれ、新規課題データに含まれない課題データに対する正解データを過去教師データから削除してから、類似度算出部132に供給するようにしてもよい。
ステップS6において、類似度算出部132は、過去教師データと新規教師データの類似度を算出する。類似度算出部132は、同じ課題データに対する過去教師データの正解データと新規教師データの正解データとの類似度を、過去教師データと新規教師データの類似度として算出する。例えば、類似度算出部132は、同じ課題データに対して過去教師データの正解データと新規教師データの正解データの一致する割合を、過去教師データと新規教師データの類似度として算出する。
例えば、図19の新規教師データ301と過去教師データ302Aの類似度を算出する場合、新規教師データ301と過去教師データ302Aとで共通の課題データに対する両者の正解データを比較し、正解データが一致する数を共通する課題データの総数で割った値、すなわち、同じ課題データに対して過去教師データの正解データと新規教師データの正解データの一致する割合を、新規教師データ301と過去教師データ302Aの類似度として算出する。
例えば、図20においては、新規教師データ301と過去教師データ302Aの類似度が83%になることが示されている。また、図20においては、新規教師データ301と、各楽曲の波形データである図示せぬ課題データ、および、各課題データの特徴である楽曲の速さをtrue(速い)またはfalse(遅い)の2値で表す特徴量の正しい値を示す正解データの組み合わせを含む過去教師データ311との類似度が70%になることが示されている。
また、例えば、過去教師データと新規教師データとで共通の課題データに対する正解データを、両者からそれぞれ抽出し、抽出した正解データを要素とする2つのベクトル間のユークリッド距離などに基づいて、過去教師データと新規教師データとの類似度を算出するようにしてもよい。
なお、類似度の計算方法は、特定の手法に限定されるものではなく、正解データの性質等に応じて、類似度の計算に適した計算方法を用いることが望ましい。
ステップS7において、特徴量抽出部131は、全ての特徴量抽出アルゴリズムについて処理したかを判定する。特徴量抽出部131は、学習結果記憶部137に記憶されている構築済アルゴリズムのうち、まだステップS4乃至S6の処理を行っていない構築済アルゴリズムがある場合、まだ全ての特徴量抽出アルゴリズムについて処理していないと判定し、処理はステップS4に戻る。
その後、ステップS7において、全ての特徴量抽出アルゴリズムについて処理したと判定されるまで、ステップS4乃至S7の処理が繰り返し実行され、学習結果記憶部137に記憶されている全ての構築済アルゴリズムについて、その構築済アルゴリズムの構築に用いられた過去教師データと新規教師データの類似度が計算される。
ステップS7において、全ての特徴量抽出アルゴリズムについて処理したと判定された場合、処理はステップS8に進む。
ステップS8において、選択部133は、教師データの類似度に基づいて、第1世代の遺伝子に利用する特徴量抽出アルゴリズムを選択する。例えば、選択部133は、新規教師データとの類似度が所定の閾値以上となる過去教師データを用いて構築された構築済アルゴリズムを、第1世代の遺伝子に利用する特徴量抽出アルゴリズムとして選択する。また、例えば、選択部133は、新規教師データとの類似度が上位のものから所定の数または割合に入る過去教師データを用いて構築された構築済アルゴリズムを、第1世代の遺伝子に利用する特徴量抽出アルゴリズムとして選択する。
選択部133は、選択した構築済アルゴリズムを構築する関数の組み合わせを示す遺伝子を生成し、交差部134および突然変異部135に供給する。また、選択部133は、生成した遺伝子を第1世代の遺伝子として遺伝子評価部122に供給する。
ステップS9において、交差部134は、遺伝子を交差させる。具体的には、交差部134は、上述したステップS21の交差部152による処理と同様の処理により、選択部133から供給された遺伝子の数に応じた個数の遺伝子を交差させ、交差させた遺伝子を第1世代の遺伝子として遺伝子評価部122に供給する。
ステップS10において、突然変異部135は、遺伝子を突然変異させる。具体的には、突然変異部135は、上述したステップS22の突然変異部153による処理と同様の処理により、選択部133から供給された遺伝子の数に応じた個数の遺伝子を突然変異させ、突然変異させた遺伝子を第1世代の遺伝子として遺伝子評価部122に供給する。
ステップS11において、ランダム生成部136は、遺伝子をランダムに生成する。具体的には、選択部133は、生成した遺伝子の数に応じた数の遺伝子の生成をランダム生成部136に指示する。ランダム生成部136は、指示された数の遺伝子をランダムに生成し、生成した遺伝子を、第1世代の遺伝子として遺伝子評価部122に供給する。
その後、上述したステップS12乃至S26の処理が実行され、新規教師データに基づいて、特徴量抽出アルゴリズムが生成され、特徴抽出部112に出力される。
以上のように、新規教師データとの類似度が高い過去教師データを用いて構築された構築済アルゴリズムを用いて第1世代の遺伝子を生成した場合、その構築済アルゴリズムは、新規教師データを用いた学習により構築される特徴量抽出アルゴリズムに近い可能性が高いため、第1世代から遺伝子の評価値が高くなる可能性が高く、その結果、早い世代において遺伝子の進化が収束する可能性が高い。従って、少ない計算量で、より高速に特徴量抽出アルゴリズムを構築することができる。
また、構築済アルゴリズムの数が増え、過去の学習結果の蓄積が増えるほど、最終的に構築される特徴量抽出アルゴリズムの関数の組み合わせにより近い遺伝子を第1世代から生成することができるようになり、さらに処理の高速化を期待することができる。
なお、上述したステップS5の処理において、特徴量抽出部131が、過去教師データに含まれるか否かに関わらず、新規教師データの全ての課題データデータについて、選択アルゴリズムを用いて類似度を算出し、抽出した特徴量を未含有課題データに対する正解データとする仮想の過去教師データを生成するようにしてもよい。
この場合、例えば、図21に示されるように、過去にアルゴリズムAおよびBが構築されている場合、新規教師データ301の全ての課題データについて、アルゴリズムAを用いて抽出した特徴量を正解データとする仮想の過去教師データ321、および、アルゴリズムBを用いて抽出した特徴量を正解データとする仮想の過去教師データ322が生成される。
そして、例えば、ステップS6において、類似度算出部132により、新規教師データ301の正解データと仮想の過去教師データ321の正解データとが一致する割合に基づいて、新規教師データ301と仮想の過去教師データ321の類似度が82%と算出され、新規教師データ301の正解データと仮想の過去教師データ322の正解データとが一致する割合に基づいて、新規教師データ301と仮想の過去教師データ322の類似度が73%と算出される。
また、例えば、過去教師データと新規教師データとの間で共通する課題データが多い場合、上述したステップS5の処理をスキップして、過去教師データに正解データを追加せずに、過去教師データと新規教師データとで課題データが共通する正解データの類似度を算出するようにしてもよい。
次に、図22を参照して、特徴量抽出部112により実行される特徴抽出処理について説明する。
ステップS41において、特徴量抽出部112は、入力データを取得する。
ステップS42において、特徴量抽出部112は、特徴量を抽出する。具体的には、特徴量抽出部112の各抽出部は、設定されている特徴量抽出アルゴリズムに基づく処理を入力データに対して行うことにより、入力データの特徴量を抽出する。
ステップS43において、特徴量抽出部112の各抽出部は、抽出した特徴量を出力し、特徴抽出処理は終了する。
なお、以上の説明では、各アルゴリズム構築処理において構築された特徴量抽出アルゴリズム、および、対応する教師データのみを学習結果として蓄積する例を示したが、その他の評価値の高い遺伝子に基づく特徴量抽出アルゴリズムも学習結果として蓄積するようにしてもよい。例えば、各世代の遺伝子の評価が終わるごとに、評価値が所定の閾値以上の遺伝子を選択し、選択した遺伝子に対する推定式を生成し、選択した遺伝子に示される関数の組み合わせに、生成した推定式を組み合わせることにより特徴量抽出アルゴリズムを生成し、対応する教師データとともに、学習結果として蓄積するようにしてもよい。
また、以上の説明では、主に楽曲の波形データの特徴量を抽出する例を示したが、本発明は、データの形式や種類などに関わらず、GPまたはGAによりデータの特徴を表す特徴量を抽出する特徴量抽出アルゴリズムを構築する装置やソフトウエアなどに適用することができる。例えば、本発明は、音声データまたは動画像の画像データを記録し再生する記録再生装置、音声データまたは動画像の画像データを記録する記録装置、音声データまたは動画像の画像データを再生する再生装置などに適用することができる。
上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行させる場合には、そのソフトウエアを構成するプログラムが、専用のハードウエアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。
図23は、上述した一連の処理をプログラムにより実行するパーソナルコンピュータ400の構成の例を示すブロック図である。CPU(Central Processing Unit)401は、ROM(Read Only Memory)402、または記録部408に記憶されているプログラムに従って各種の処理を実行する。RAM(Random Access Memory)403には、CPU401が実行するプログラムやデータなどが適宜記憶される。これらのCPU401、ROM402、およびRAM403は、バス404により相互に接続されている。
CPU401にはまた、バス404を介して入出力インタフェース405が接続されている。入出力インタフェース405には、キーボード、マウス、マイクロホンなどよりなる入力部406、ディスプレイ、スピーカなどよりなる出力部407が接続されている。CPU401は、入力部406から入力される指令に対応して各種の処理を実行する。そして、CPU401は、処理の結果を出力部407に出力する。
入出力インタフェース405に接続されている記録部408は、例えばハードディスクからなり、CPU401が実行するプログラムや各種のデータを記憶する。通信部409は、インターネットやローカルエリアネットワークなどのネットワークを介して外部の装置と通信する。
また、通信部409を介してプログラムを取得し、記録部408に記憶してもよい。
入出力インタフェース405に接続されているドライブ410は、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア411が装着されたとき、それらを駆動し、そこに記録されているプログラムやデータなどを取得する。取得されたプログラムやデータは、必要に応じて記録部408に転送され、記憶される。
コンピュータにインストールされ、コンピュータによって実行可能な状態とされるプログラムを格納するプログラム記録媒体は、図23に示すように、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)を含む)、光磁気ディスク、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア411、または、プログラムが一時的もしくは永続的に格納されるROM402や、記録部408を構成するハードディスクなどにより構成される。プログラム記録媒体へのプログラムの格納は、必要に応じてルータ、モデムなどのインタフェースである通信部409を介して、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の通信媒体を利用して行われる。
なお、本明細書において、プログラム記録媒体に格納されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
さらに、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
従来の情報処理装置の構成の例を示すブロック図である。 本発明を適用した情報処理装置の一実施の形態を示すブロック図である。 図2の情報処理装置の処理の概要を説明するための図である。 図2の情報処理装置の処理の概要を説明するための図である。 図2のアルゴリズム構築部の一実施の形態を示すブロック図である。 図2の特徴抽出部の一実施の形態を示すブロック図である。 図2のアルゴリズム構築部により実行されるアルゴリズム構築処理を説明するためのフローチャートである。 図2のアルゴリズム構築部により実行されるアルゴリズム構築処理を説明するためのフローチャートである。 教師データの例を示す図である。 遺伝子の表記の例を示す図である。 遺伝子の計算値を説明するための図である。 遺伝子の評価について説明するための図である。 正解データの値と評価対象の遺伝子を用いて求めた計算値との相関を示す散布図の例を示す図である。 正解データの値と評価対象の遺伝子を用いて求めた計算値との相関を示す散布図の他の例を示す図である。 正解データの値と評価対象の遺伝子を用いて求めた計算値との相関を示す散布図のさらに他の例を示す図である。 遺伝子を用いて求めた計算値のクラスごとの確率分布の例を示す図である。 遺伝子を用いて求めた計算値のクラスごとの確率分布の他の例を示す図である。 遺伝子を用いて求めた計算値のクラスごとの確率分布のさらに他の例を示す図である。 図7のステップS5の処理を説明するための図である。 過去教師データと新規教師データとの類似度を説明するための図である。 過去教師データと新規教師データとの類似度を説明するための図である。 図2の特徴量抽出部により実行される特徴量抽出処理を説明するためのフローチャートである。 パーソナルコンピュータの構成の例を示すブロック図である。
符号の説明
101 情報処理装置, 111 アルゴリズム構築部, 112 特徴量抽出部, 121 第1世代遺伝子生成部, 122 遺伝子評価部, 123 第2世代以降遺伝子生成部, 124 推定式生成部, 125 教師データ記憶部, 131 特徴量抽出部, 132 類似度算出部, 133 選択部, 134 交差部, 135 突然変異部, 136 ランダム生成部, 137 学習結果記憶部, 141 実行部, 142 評価部, 151 選択部, 152 交差部, 153 突然変異部, 154 ランダム生成部

Claims (6)

  1. 入力データと同様の形式の課題データと前記課題データの特徴を表す特徴量の正しい値を示す正解データとの組み合わせを含む教師データを用いて、GP(Genetic Programming)またはGA(Genetic Algorithm)により、前記入力データの特徴を表す特徴量を抽出するアルゴリズムを構築する情報処理装置において、
    新たに構築するアルゴリズムである新規アルゴリズムの構築に用いる前記教師データである新規教師データの前記課題データの特徴を表す特徴量を、過去に構築されたアルゴリズムである構築済アルゴリズムを用いて抽出する抽出手段と、
    抽出された前記特徴量と前記新規教師データの前記正解データとの類似度を算出する算出手段と、
    前記類似度に基づいて、前記新規アルゴリズムの構築に用いる遺伝子に利用する前記構築済アルゴリズムを選択する選択手段と
    を含む情報処理装置。
  2. 前記抽出手段は、前記新規教師データに含まれ、前記構築済アルゴリズムの構築に用いた教師データである過去教師データに含まれない前記課題データである未含有課題データの特徴を表す特徴量を、前記過去教師データを用いて構築された前記構築済アルゴリズムを用いて抽出し、抽出した前記特徴量を前記未含有課題データに対する前記正解データとして前記過去教師データに追加し、
    前記算出手段は、同じ前記課題データに対する、前記正解データが追加された前記過去教師データの前記正解データと前記新規教師データの前記正解データとの類似度を、前記過去教師データと前記新規教師データとの前記類似度として算出する
    請求項1に記載の情報処理装置。
  3. 入力データと同様の形式の課題データと前記課題データの特徴を表す特徴量の正しい値を示す正解データとの組み合わせを含む教師データを用いて、GP(Genetic Programming)またはGA(Genetic Algorithm)により、前記入力データの特徴を表す特徴量を抽出するアルゴリズムを構築する情報処理装置が
    新たに構築するアルゴリズムである新規アルゴリズムの構築に用いる前記教師データである新規教師データの前記課題データの特徴を表す特徴量を、過去に構築されたアルゴリズムである構築済アルゴリズムを用いて抽出する抽出ステップと、
    抽出された前記特徴量と前記新規教師データの前記正解データとの類似度を算出する算出ステップと、
    前記類似度に基づいて、前記新規アルゴリズムの構築に用いる遺伝子に利用する前記構築済アルゴリズムを選択する選択ステップと
    含む情報処理方法。
  4. 前記抽出ステップにおいて、前記構築済アルゴリズムの構築に用いた教師データである過去教師データに含まれない前記課題データである未含有課題データの特徴を表す特徴量を、前記過去教師データを用いて構築された前記構築済アルゴリズムを用いて抽出し、抽出した前記特徴量を前記未含有課題データに対する前記正解データとして前記過去教師データに追加し、
    前記算出ステップにおいて、同じ前記課題データに対する、前記正解データが追加された前記過去教師データの前記正解データと前記新規教師データの前記正解データとの類似度を、前記過去教師データと前記新規教師データとの前記類似度として算出する
    請求項3に記載の情報処理方法。
  5. 入力データと同様の形式の課題データと前記課題データの特徴を表す特徴量の正しい値を示す正解データとの組み合わせを含む教師データを用いて、GP(Genetic Programming)またはGA(Genetic Algorithm)により、前記入力データの特徴を表す特徴量を抽出するアルゴリズムを構築する情報処理をコンピュータに実行させるプログラムにおいて、
    新たに構築するアルゴリズムである新規アルゴリズムの構築に用いる前記教師データである新規教師データの前記課題データの特徴を表す特徴量を、過去に構築されたアルゴリズムである構築済アルゴリズムを用いて抽出する抽出ステップと、
    抽出された前記特徴量と前記新規教師データの前記正解データとの類似度を算出する算出ステップと、
    前記類似度に基づいて、前記新規アルゴリズムの構築に用いる遺伝子に利用する前記構築済アルゴリズムを選択する選択ステップと
    を含むプログラム。
  6. 前記抽出ステップにおいて、前記構築済アルゴリズムの構築に用いた教師データである過去教師データに含まれない前記課題データである未含有課題データの特徴を表す特徴量を、前記過去教師データを用いて構築された前記構築済アルゴリズムを用いて抽出し、抽出した前記特徴量を前記未含有課題データに対する前記正解データとして前記過去教師データに追加し、
    前記算出ステップにおいて、同じ前記課題データに対する、前記正解データが追加された前記過去教師データの前記正解データと前記新規教師データの前記正解データとの類似度を、前記過去教師データと前記新規教師データとの前記類似度として算出する
    請求項5に記載のプログラム。
JP2006305245A 2006-11-10 2006-11-10 情報処理装置および方法、並びに、プログラム Expired - Fee Related JP5035598B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006305245A JP5035598B2 (ja) 2006-11-10 2006-11-10 情報処理装置および方法、並びに、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006305245A JP5035598B2 (ja) 2006-11-10 2006-11-10 情報処理装置および方法、並びに、プログラム

Publications (2)

Publication Number Publication Date
JP2008123180A JP2008123180A (ja) 2008-05-29
JP5035598B2 true JP5035598B2 (ja) 2012-09-26

Family

ID=39507883

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006305245A Expired - Fee Related JP5035598B2 (ja) 2006-11-10 2006-11-10 情報処理装置および方法、並びに、プログラム

Country Status (1)

Country Link
JP (1) JP5035598B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000172852A (ja) * 1998-09-28 2000-06-23 Canon Inc 画像処理方法、装置および記録媒体

Also Published As

Publication number Publication date
JP2008123180A (ja) 2008-05-29

Similar Documents

Publication Publication Date Title
JP5282548B2 (ja) 情報処理装置、音素材の切り出し方法、及びプログラム
JP4640407B2 (ja) 信号処理装置、信号処理方法及びプログラム
JP5593608B2 (ja) 情報処理装置、メロディーライン抽出方法、ベースライン抽出方法、及びプログラム
JP4274221B2 (ja) 情報処理装置および方法、プログラム、並びに記録媒体
WO2019232928A1 (zh) 音乐模型训练、音乐创作方法、装置、终端及存储介质
JP5007714B2 (ja) 情報処理装置および方法、プログラム、並びに記録媒体
JP4364838B2 (ja) 楽曲リミックス可能な音楽再生装置ならびに楽曲リミックス方法およびプログラム
JP2010054802A (ja) 音楽音響信号からの単位リズムパターン抽出法、該方法を用いた楽曲構造の推定法、及び、音楽音響信号中の打楽器パターンの置換法
CN113691909B (zh) 具有音频处理推荐的数字音频工作站
Kirchhoff et al. Evaluation of features for audio-to-audio alignment
Niyazov et al. Content-based music recommendation system
JP6151121B2 (ja) コード進行推定検出装置及びコード進行推定検出プログラム
WO2016102738A1 (en) Similarity determination and selection of music
JP2008216486A (ja) 音楽再生システム
JP6288197B2 (ja) 評価装置及びプログラム
JP4239109B2 (ja) 情報処理装置および方法、プログラム、並びに記録媒体
JP6102076B2 (ja) 評価装置
WO2019176954A1 (en) Machine learning method, electronic apparatus, electronic musical instrument, model generator for part selection, and method of part determination
JP5035598B2 (ja) 情報処理装置および方法、並びに、プログラム
CN116778946A (zh) 人声伴奏分离方法、网络训练方法、设备及存储介质
CN107025902B (zh) 数据处理方法及装置
US20240038258A1 (en) Audio content identification
McDermott et al. Evolutionary computation applied to sound synthesis
Ramırez et al. Deep learning and intelligent audio mixing
Li et al. Main melody extraction from polyphonic music based on frequency amplitude and multi-octave relation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091104

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120424

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120521

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120607

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120620

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150713

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 5035598

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150713

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees