WO2008072459A1

WO2008072459A1 - 能動学習システム、能動学習方法、及び能動学習用プログラム

Info

Publication number: WO2008072459A1
Application number: PCT/JP2007/072651
Authority: WO
Inventors: Yoshiko Yamashita; Yukiko Kuroiwa; Minoru Asogawa
Original assignee: Nec Corporation
Priority date: 2006-12-11
Filing date: 2007-11-22
Publication date: 2008-06-19
Also published as: US20100005043A1; EP2096585A1; JPWO2008072459A1; JP5187635B2; EP2096585A4

Abstract

以前から蓄積されているデータよりも、新しく取得されたデータを重要視した学習が行われるために、学習データの取得順序に応じて学習データに重みを設定する機能を設ける。また、前サイクルで取得したデータとその結果をより反映した学習が行われるために、前サイクルで学習した結果をルールにフィードバックし、データのラベルと予測値の関係に応じて学習データに重みを設定する機能を設ける。

Description

明細書

能動学習システム、能動学習方法、及び能動学習用プログラム技術分野

[0001] 本発明は能動学習システムに関し、特に機械学習における能動学習システムに関する。この出願 (ま、 2006年 12月 11曰 ίこ出願された特許出願番号 2006— 332983 号の日本特許出願に基づいており、その出願による優先権の利益を主張し、その出願の開示は、引用することにより、そっくりそのままここに組み込まれている。

背景技術

[0002] 能動学習とは、学習者 (コンピュータ）が学習データを能動的に選択できる、機械学習手法の一形態である。能動学習では、（1)実験→(2)結果の学習→(3)次の実験対象の選択→ (1)実験、のサイクルを繰り返すことでトータルの実験量を減らすことができる。（2)と（3)はコンピュータによって行われる。能動学習は、少ない実験回数あるいは実験量で多くの結果を得るための方法であり、多くの費用と時間を必要とする実験を適切に計画する実験計画法で使われる。能動学習を用いたコンピュータシステム（以下、能動学習システム）は、例えば、膨大な種類の化合物の中から特定のタンパク質に対し活性のある化合物を発見する創薬スクリーニングなどに適した技術として注目されている。

[0003] 能動学習システムで扱われるデータ（学習データ）は、複数の記述子（属性）と 1以上のラベルとで表現される。記述子はそのデータの構造などを特徴付けるものであり、ラベルはそのデータの或る事象に関する状態を示している。例えば、能動学習による創薬スクリーニングの場合、個々の化合物データは、ベンゼン環などの部分構造の有無を 0/1のビット列で記述したものや、分子量などの各種物理化学定数などを記述した複数の記述子によって表現される。また、ラベルは、例えば特定のタンパク質に対する活性の有無を示すために使用される。ラベルの取り得る値は、活性あり、活性なしのように離散値の場合、クラスと呼ばれる。他方、ラベルが取り得る値が連続値の場合、関数値と呼ばれる。つまり、ラベルはクラス又は関数値を含んでいる。

[0004] 学習データの集合として複数の学習データのうちの、ラベルの値が既知である（ラベルが設定されて!/、る）学習データは既知学習データ群と呼ばれ、ラベルの値が未知である（ラベルが設定されて!/、な!/、）学習データは未知学習データ群と呼ばれる。能動学習システムでは、最初の学習は、既知学習データを使って行われる。既知学習データ群のうちの、利用者にとって価値のある学習データを「正例」（正例学習データ）とし、利用者にとって価値がないものを「負例」（負例学習データ）として区別し、能動学習システムは、既知学習データ群から選択した正例学習データ及び負例学習データの双方を用いて学習する。正例、負例は、能動学習システムにより注目されるラベルの値で決まる。その注目されるラベルの値が 2値を取る場合、利用者の注目する値が正例となり、そうでない値が負例となる。例えば、或るラベルが或るタンパク質に対する活性の有無を示してレ、るものとし、そのタンパク質に対して活性のある化合物に注目する場合、活性ありの値のラベルが正例となり、活性なしの値のラベルが負例になる。なお、ラベルが多値の場合、能動学習システムにより注目されている 1 つ以上の値は正例となり、それ以外の全ての値は負例となる。またラベルの取り得る値が連続値の場合、能動学習システムにより注目される値付近にラベル値が存在するものは正例となり、それ以外のところにあるものは負例となる。

[0005] 能動学習システムは、既知学習データ群の中から、任意の既知学習データを選択し、アンサンブル学習（複数の学習機械を統合して予測を行う手法）を適用して、その学習データに対して前記正例学習データ又は前記負例学習データを選別するためのルールを生成する正例と負例を使ってルールを生成（学習）する。ルールは、任意の既知学習データの記述子が入力されたとき、その学習データのラベルの値が注目している値かどうか、換言すればそのデータが正例か、負例かを選別するための仮説、規則を表している。代表的なアンサンブル学習手法として、パギング (Bagging) とブースティング（Boosting)がある。

[0006] バギングとは、アンサンブル学習法の 1つであり、各学習機械は、同一の既知事例のデータベースからデータのリサンプリングを行って生成された、異なった学習データ群を用いて学習を行い、これらの予測値の多数決によって、未知事例のクラスを予測する手法である。

[0007] ブースティングとは、複数の異なる判別ルールがあるとき、それらをうまく統合して 1 つの性能の良い判別ルールを作るための 1つの学習アルゴリズムである。実際には、統合された判別ルールとは、それぞれの判別ルールは後述するスコアが与えられて、そのスコアによる重み付き多数決ルールを指す。学習の過程でそのスコアの上げ下げが繰り返されることからブースティングと呼ばれる。

[0008] 能動学習システムは、既知学習データ群のうちの任意の既知学習データで学習して、任意の既知学習データに対するルールを生成する。未知学習データ群を候補学習データ群とし、そのルールを候補学習データ群に適用し、候補学習データ群のラベルの値の予測を行う。即ち、候補学習データ群に対して正例学習データであるか否かを予測し、予測結果を生成する。この予測結果は、スコアと呼ばれる数値で定量的に示される。スコアは、個々の候補学習データ群に対して正例らしさを表す数値であり、値が大きいほど、正例である可能性が高いことを示している。能動学習システムは、候補学習データ群に対する予測結果に基づいて、候補学習データ群の中から、学習対象となる学習データを表す選択候補学習データを選択して出力する。この選択方法に関しては、予測が割れたデータを選択する方法や、スコアの高い順に選択する方法、或る関数を用いて選択する方法等、幾つかの方法がある。

[0009] 選択候補学習データは、ラベルの値が未知であるため、実験や調査などによってラベルの実際の値が調べられ、能動学習システムにフィードバックされる。能動学習システムは、ラベルを選択候補学習データに設定し、選択候補学習データを候補学習データ群から取り除いて既知学習データとして既知学習データ群に追加し、上述と同様の動作が再度繰り返される。このような処理の繰り返しは、予め定められた終了条件が満たされるまで続けられる。

[0010] これにより、能動学習システムは、少ない実験量で、かつ早期に正例を発見する技術として用いられる。例えば、上述のように、創薬スクリーニングでは、膨大な種類の化合物の中から特定のタンパク質に対し活性のある化合物を発見する。この場合、活性なしの化合物 (負例）が大多数であり、活性ありの化合物（正例）が極僅かである。このように正例と負例の数がアンバランスな場合においても、少ない化合物数の実験量で早期に活性のある化合物（正例）を発見できる。

[0011] しかし、従来技術には、以下のような問題点が存在する。第 1の問題点において、能動学習システムは、既知学習データ群のうちの、以前から蓄積されている既知学習データと、新たに追加された既知学習データとが同じ极いにしていることである。これにより、以前から蓄積されている既知学習データに対するルールと、新たに追加された既知学習データに対するルールは、それほど変わらない。このような能動学習システムでは、以前から蓄積されている既知学習データに新たに既知学習データが加わったことによる顕著な効果はない。

[0012] このように、上述の能動学習システムでは、ルールに変化がないため、そのルールを用いて次のルールを学習するための学習効率が向上しない。特に創薬スクリー二ングのように未知ラベルの値を実験によって求める際のコストが大きい分野では、学習コストが著しく増大する。

[0013] なお、関連する技術として、特開 2005— 107743号公報に学習システムが開示されている。

この従来技術では、データ処理部の学習部は、ユーザの入力装置の操作により学習データと下位学習アルゴリズムと終了条件とを入力する。学習データは、ラベル (クラス又は関数値)が設定されたデータである。下位学習アルゴリズムは、能動学習を行うためのコンピュータプログラムである。学習部は、入力した学習データと終了条件とを学習データ記憶部に格納する。下位学習アルゴリズムは、学習データと終了条件と共に入力されているが、予めに学習データ記憶部に格納されていても良い。学習部は、下位学習アルゴリズムを用いて学習処理を行う。

[0014] また、特開 2001— 325272号公報に情報整理方法、情報処理装置、記憶媒体、及びプログラム伝送装置が開示されている。

この従来技術では、新しく出現した単語に対して重み付けを高くして選別することを特徴とする旨が示されてレ、る。

[0015] また、特開 2005— 284348号公報に情報処理装置及び方法、記録媒体、並びにプログラムが開示されている。

この従来技術では、データ重みを利用して弱判別器を選択し、選択された弱判別器による学習サンプルの判別結果を、信頼度により重み付けした値の累積和に基づいて基準値を演算する。演算された基準値に基づいて学習サンプルの一部を削除し、削除されなかった学習サンプルに基づ!/、てデータ重みを演算する。

[0016] また、特開 2006— 139718号公報に話題語結合方法及び話題語結合 ·代表語抽出方法及び装置及びプログラムが開示されている。

この従来技術では、文書共有度算出の際に、文書数の代わりに文書それぞれが持つ日付や時刻の鮮度の重みを用いて、文書共有度を計算することもできる。例えば、文書共有度 = (共有する文書それぞれの鮮度の重みの和） / (2つの該当する話題語が持つ文書のそれぞれの鮮度の重みの和）。この鮮度の重みは、文書の日付や時間が新しいものほど、文書共有度が高くなるように作用する。

[0017] 更に、特開 2006— 185099号公報に確率モデル作成方法が開示されている。

この従来技術では、所定の事象を説明するための 1つ以上の変数を含む説明変数と該説明変数に応じた値を取る非説明変数とを組とするサンプルの集合である学習データの各サンプル毎に、予め用意された確率モデルに基づいて、非説明変数の値に対応する確率を算出する。また、該算出された確率に基づいて、学習データの各サンプルに対する重みを算出する。また、算出された重みと学習データとに基づいて新たな確率モデルを作成してモデル記憶装置に記憶する。更に、モデル記憶装置に記憶された確率モデルを用いて、説明変数と同じデータ形式の入力パラメータに対して、事象が発生又は発生しない確率を算出する。

発明の開示

[0018] 本発明の目的は、学習データの取得順序を考慮することにより、学習効率が向上する能動学習システムを提供することにある。

[0019] 本発明の能動学習システムは、学習データ記憶部と、制御部と、学習部と、候補データ記憶部と、予測部と、候補データ選択部と、データ更新部と、を具備している。学習データ記憶部は、複数の学習データのうちの、利用者にとって価値があるか否かを表すラベルが設定された既知学習データ群を記憶する。制御部は、前記既知学習データ群のそれぞれに対して取得順序に比例して増加する重みを設定する。ここで、前記既知学習データ群のうちの、利用者にとって価値がある学習データを正例学習データとし、利用者にとって価値がない学習データを負例学習データとする。学習部は、前記既知学習データ群の中から、前記重みが最も大きい選択既知学習データを選択し、前記選択既知学習データに対して前記正例学習データ又は前記負例学習データを選別するためのルールを生成する。候補データ記憶部は、前記複数の学習データのうちの前記既知学習データ群以外の学習データである候補学習データ群として記憶する。予測部は、前記ルールを前記複数の学習データのうちの前記既知学習データ群以外の学習データである候補学習データ群に適用して、前記候補学習データ群に対して前記正例学習データであるか否かを予測し、予測結果を生成する。候補データ選択部は、前記予測結果に基づいて、前記候補学習データ群の中から、学習対象となる学習データを表す選択候補学習データを選択する。データ更新部は、前記選択候補学習データを出力装置に出力し、入力装置から入力される前記ラベルを前記選択候補学習データに設定し、前記選択候補学習データを前記候補学習データ群から除いて既知学習データとして前記既知学習データ群に追加する。

図面の簡単な説明

[0020] 上記発明の目的、効果、特徴は、添付される図面と連携して実施の形態の記述から、より明ら力、になる。

[0021] [図 1]図 1は、本発明の第 1及び第 2実施例による能動学習システムのブロック図であ

[図 2]図 2は、本発明の第 1実施例による能動学習システムのブロック図である。

[図 3]図 3は、本発明で扱う学習データのフォーマット例を示す図である。

[図 4]図 4は、ルール記憶部の内容例を示す図である。

[図 5]図 5は、本発明の第 1実施例で扱う学習データ集合の例を示す図である。

[図 6]図 6は、本発明の第 1実施例による能動学習システムの動作を示すフローチヤートである。

[図 7]図 7は、本発明の第 2実施例による能動学習システムのブロック図である。

[図 8]図 8は、本発明の第 2実施例による能動学習システムの動作を示すフローチヤートである。

発明を実施するための最良の形態

[0022] 以下に添付した図面を参照して、本発明の実施例による能動学習システムについて説明する。

[0023] 図 1に示されるように、本発明の第 1実施例による能動学習システムは、入出力装置 110と、処理装置 120と、記憶装置 130とを具備している。

[0024] 入出力装置 110は、キーボードやマウス等の入力装置と、 LCDやプリンタ等の出力装置とを含んでいる。記憶装置 130は、半導体メモリや磁気ディスク等を含んでいる。

[0025] 処理装置 120は、コンピュータであり、 CPU (Central Processing Unit) 20を具備している。記憶装置 130は、コンピュータに実行させるためのコンピュータプログラム 10が記憶された記録媒体 30を具備している。 CPU20は、コンピュータの起動時などにコンピュータプログラム 10を記録媒体 30から読み取って実行する。

[0026] 図 2に示されるように、記憶装置 130は、更に、学習データ記憶手段（学習データ記憶部 131)と、ルール記憶手段 (ルール記憶部 132)と、候補データ記憶手段 (候補データ記憶部 133)と、選択データ記憶手段 (選択データ記憶部 134)とを具備している。

[0027] 学習データ記憶部 131には、学習データの集合として複数の学習データのうちの、ラベルの値が既知である（ラベルが設定されて!/、る）学習データを表す既知学習データ群が記憶される。既知学習データ群の各々は、例えば図 3に示されるように、当該学習データを識別するための識別子 201と、複数の記述子 202と、複数のラベル 203と、重み 204と、取得サイクル数 205とを含んでいる。記述子 202は、当該学習データの構造などを特徴付けるものである。ラベル 203は、当該学習データの或る事象に関する状態を示し、クラス又は関数を含んでいる。

[0028] ラベル 203は、事象に関するものとして、利用者にとって価値があるか否かを表している。既知学習データ群のうちの、利用者にとって価値のある学習データは「正例」（正例学習データ）と呼ばれ、利用者にとって価値がない学習データは「負例」（負例学習データ）と呼ばれる。

[0029] 重み 204は、例えば 0から 1までの値を取り、 1に近いほど（値が大きいほど）重要度が高いことを示している。初回は同一の重みが設定されている。取得サイクル数 205 は、学習データに対するルールの生成に関する有意性の指標を得るための情報であり、当該学習データが取得されたサイクル数が記録されている。なお、取得サイクル数 205は複数の学習データの各々に含めるのではなぐ複数の学習データと対応付けて学習データ記憶部 131に記憶しても良!/、。

[0030] ルール記憶部 132には、学習データ記憶部 131に記憶された既知学習データ群を用いて、それぞれ、例えばパギング法によって学習されたルール群が記憶される。図 4に示されるように、ルール群 301は、それぞれ、自己を識別するルール識別子群 30 2を含み、これによつて他のルールと区別される。各ルール 301は、任意の学習データの記述子 202が入力されたとき、その学習データが、利用者にとって価値のある正例を表してレ、るかどうか、つまり所望のラベルの値が所望値であるかどうかを予測するためのもので、スコアの算出に関与する。スコアは、当該学習データの正例らしさを表す数値であり、例えば 0〜；!の値を取り、大きいほど、より正例らしいことを示してい

[0031] 候補データ記憶部 133には、複数の学習データのうちの、ラベルの値が未知である（ラベルが設定されて!/、な!/、）学習データを表す未知学習データ群として候補学習データ群が記憶される。候補学習データ群は、学習データ記憶部 131に記憶された学習データと同様に図 3に示したような構造を有している。但し、複数のラベル 203のうちの学習が行われるラベル (所望のラベル）は、既知学習データ群にあっては既知、すなわち有意な値が設定されているのに対し、候補学習データ群にあっては未知、すなわち未設定になっている点が相違する。

[0032] 選択データ記憶部 134は、候補データ記憶部 133に記憶された候補学習データ群のうち、次に学習すべき学習データとして処理装置 120によって選択された選択候補学習データを記憶する部分である。

[0033] 上記のコンピュータプログラム 10は、能動学習部 140と、制御部 150とを含んでい

[0034] 能動学習部 140は、学習手段（学習部 141)と、予測手段（予測部 142)と、候補データ選択手段 (候補データ選択部 143)と、データ更新手段（データ更新部 144)とを備えている。

[0035] 学習部 141は、学習データ記憶部 131から既知学習データ群を読み出し、既知学習データ群の中から、重み 204 (後述）が最も大きい選択既知学習データを選択する。選択既知学習データは、既知学習データ群のうちの選択既知学習データ以外の学習データよりも最新の学習データを表している。学習部 141は、選択既知学習データに対して正例学習データ又は前記負例学習データを選別するためのルール 30 1を生成（学習）し、最新のルール 301としてルール記憶部 132に記憶する。

[0036] 予測部 142は、ルール記憶部 132に記憶されたルール群 301の中から、最新のルール 301を読み出すと共に、候補データ記憶部 133から候補学習データ群を読み出す。予測部 142は、読み出されたルール 301を候補学習データ群に適用して、候補学習データ群に対して正例学習データであるか否かを予測する。即ち、予測結果として、候補学習データ群の各々に対して、その記述子をルール 301に入力して正例らしさを表すスコアを算出する。予測部 142は、その予測結果を候補データ選択部 143に出力する。

[0037] 候補データ選択部 143は、予測結果として算出された候補学習データの各々に対するスコアに基づいて、候補学習データ群の中から、次の学習対象となる学習データを表す選択候補学習データを選択し、選択候補学習データを選択データ記憶部 1 34に記憶する。選択候補学習データを選択する方法としては、候補学習データ群の各々に対してスコアの合計あるいは平均を求め、スコアの合計あるいは平均の高い順に選択候補学習データとして選択する方法や、特開 2005— 107743号公報に記載されるように所定の関数を用いて選択する方法などが利用できる。また、スコアの分散を求め、予測が割れた候補学習データを選択候補学習データとして選択する方法など、他の方法も適用可能である。

[0038] データ更新部 144は、選択データ記憶部 134に記憶された選択候補学習データを読み出して入出力装置 110に出力する。このとき、ラベル (所望のラベル）の値が入出力装置 110から入力される。データ更新部 144は、そのラベル (ラベルの値)を選択候補学習データに設定し、選択候補学習データを、候補学習データ記憶部 133 に記憶された候補学習データ群から除いて、既知学習データとして学習データ記憶部 131に記憶された既知学習データ群に追加する。既知学習データを学習データ記憶部 131に追加する際に、取得サイクル数 205に現在の能動学習サイクル数を記録する。次に学習すべき選択候補学習データの入出力装置 110からの出力は、図 3 に示したデータ構造全体であっても良いし、識別子 201だけであっても良い。また、入出力装置 110からのラベルの値の入力は、その値が入力されたデータ全体であつても良いし、識別子 201とラベル番号とラベルの値の組であっても良い。ラベル番号は複数のラベルの中から 1つのラベルを特定する番号である。この場合、データ更新部 144は、入力された識別子 201を持つ選択候補学習データを選択データ記憶部 1 34から検索し、指定されたラベル番号のラベルに入力値を設定して既知学習データとして学習データ記憶部 131に登録する一方、入力された識別子 201を持つ選択候補学習データを候補データ記憶部 133から検索して削除する。

[0039] 制御部 150は、学習設定取得手段 (学習設定取得部 151)と、学習データ調査手段（学習データ調査部 152)と、学習データ重み設定手段（学習データ重み設定部 1 53)とを備えている。

[0040] 学習設定取得部 151は、利用者等から入出力装置 110を通じて所望のラベルを表す情報 (学習するラベルとその正例のときの値)を含む学習条件を取得し、能動学習部 140の学習部 141に処理を移す。

[0041] 学習データ調査部 152は、学習データ記憶部 131に記憶されている取得サイクノレ数 205を調べ、学習データ重み設定部 153に出力する。

[0042] 学習データ重み設定部 153は、学習データ記憶部 131から既知学習データ群を読み出し、既知学習データ群のそれぞれに対して取得順序に比例して増加する重み 2 04を設定する。ここで、重み 204は、既知学習データ群のうちの、新たに追加された既知学習データを、以前から蓄積されてレ、る既知学習データより重要視した学習を行うための値（0· 0〜； ! · 0)であり、取得サイクル数 205に基づいて決定される。重みを設定する方法としては、取得サイクル数 205に対して単調増加な関数を用いて設定する方法などが利用できる。学習データ重み設定部 153は、既知学習データ群の取得順序に応じて、既知学習データ群のそれぞれに対して重み 204を設定する。このとき、既知学習データ群には、例えば図 5に示されるように、サイクル数 Xまで単調増加な関数 f (x)が適用される。学習データ重み設定部 153は、重みの設定処理を終えると、能動学習部 140の学習部 141に処理を進める。

[0043] 学習部 141以降の処理においては、学習の重み 204の値により重要度に差をつけて学習を進める。つまり、重み 204の大きな学習データは、それより重みの小さな学習データより重要視して学習を進める。

[0044] 次に、図 6を参照して、本実施形態の動作を説明する。

[0045] 能動学習を開始するに際しては、記憶装置 130の学習データ記憶部 131に既知学習データ群が記憶され、候補データ記憶部 133には候補学習データ群が記憶されている。既知学習データ群及び候補学習データ群の重み 204は同一の重みに設定されている。またルール記憶部 132にはルールが保存されていなぐ選択データ記憶部 134にも 1つも選択データは保存されていない。この状態で処理装置 120が起動されると、図 6に示す処理が開始される。

[0046] (1)ステップ S 101

まず、入出力装置 110から与えられた学習条件が制御部 150の学習設定取得部 1 51へ供給される。そして、処理は学習部 141に移行する。

[0047] (2)ステップ S 102

学習部 141は、学習データ記憶部 131から既知学習データ群を読み出し、既知学習データ群の中から、重み 204が最も大きい選択既知学習データを選択する。選択既知学習データは、既知学習データ群のうちの選択既知学習データ以外の学習データよりも最新の学習データを表している。学習部 141は、選択既知学習データに対して正例学習データ又は前記負例学習データを選別するためのルール 301を生成（学習）し、最新のルール 301としてルール記憶部 132に記憶する。

[0048] (3)ステップ S 103

予測部 142は、ルール記憶部 132に記憶された最新のルール 301を、候補データ記憶部 133に記憶された候補学習データ群に適用して、候補学習データ群に対して正例学習データであるか否かを予測する。予測部 142は、その予測結果を候補データ選択部 143に出力する。

[0049] (4)ステップ S 104

候補データ選択部 143は、予測結果に基づいて、候補学習データ群の中から、次の学習対象となる学習データを表す選択候補学習データを選択し、選択候補学習データを選択データ記憶部 134に記憶する。 [0050] (5)ステップ SI 05

データ更新部 144は、選択データ記憶部 134に記憶された選択候補学習データを読み出して入出力装置 110に出力する。ラベル (所望のラベル）の値が入出力装置 1 10から入力されたとき、データ更新部 144は、そのラベル (ラベルの値)を選択候補学習データに設定する。データ更新部 144は、選択候補学習データを、候補データ記憶部 133に記憶された候補学習データ群から除いて、既知学習データとして学習データ記憶部 131に記憶された既知学習データ群に追加する。これで、能動学習の 1サイクルが終了し、処理が制御部 150に移行する。

[0051] (6)ステップ S106

制御部 150は、終了条件が成立した力、どうかを判定し、終了条件が成立していなければ、学習データ調査部 152に処理を進める。この場合、学習データ記憶部 131には、既知学習データ群のうちの、学習開始時点に存在した既知学習データと、データ更新部 144によって追加された既知学習データとが混在している。後者の追加された既知学習データの所望のラベルの値は実験なり調査なりで調べられた実際の値である。他方、終了条件が成立していれば、制御部 150は能動学習サイクルの繰り返しを停止させる。終了条件は、入出力装置 110から与えられ、その条件は、能動学習サイクルの最大繰り返し回数等、任意の条件で良レ、。

[0052] (7)ステップ S107

学習データ調査部 152は、学習データ記憶部 131に記憶されている学習データの取得サイクル数 205を調べ、学習データ重み設定部 153に出力する。

[0053] (8)ステップ S108

学習データ重み設定部 153は、学習データ記憶部 131から学習データを読み出し、既知学習データ群のそれぞれに対して取得順序に比例して増加する重み 204を E¾疋 ^る。

[0054] 本発明の第 1実施例による能動学習システムによれば、既知学習データ群のうちの、新たに加えられた既知学習データを、以前から蓄積されている既知学習データより重要視した学習を行うことができる。その理由としては、取得サイクル数 205に応じて、新しく取得された既知学習データほど大きい値の重み 204を設定し、以前から蓄積されている既知学習データほど小さい値の重み 204を設定する。これによつて、新しく取得された既知学習データをより反映したルール 301が生成される。更には、以前のサイクルで生成されたルール 301と性質の異なったルール 301が生成されることが期待される。そのルール 301を適用して候補学習データから選択される次に学習すべき既知学習データは、重要度に差をつけない学習に比べて、正例の数がより多ぐそして多様な正例が含まれる確率が高くなる。このように、本発明の第 1実施例による能動学習システムでは、既知学習データの取得順序を考慮することにより、学習効率が向上する。

[0055] 次に、本発明の第 2実施例について説明する。

[0056] 本発明の第 2実施例による能動学習システムは、後述のとおり、制御部 150が学習データ調査部 152と学習データ重み設定部 153の代わりに学習見直し手段（学習見直し部 154)を備える点と、記憶装置 130が更にルール識別子記憶手段 (ルール識別子記憶部 135)を備える点で、図 2に示した第 1実施例と相違する。

[0057] 図 7を参照すると、本発明の第 2実施例による能動学習システムは、図 2に示した第 1実施例と同様に、入出力装置 110と、処理装置 120と、記憶装置 130とを具備している。処理装置 120は、能動学習部 140と、制御部 150とを備えている。

[0058] ここでは、記憶装置 130は、学習データ記憶部 131と、ルール記憶部 132と、候補データ記憶部 133と、選択データ記憶部 134と、ルール識別子記憶部 135とを備えている。また、制御部 150は、学習設定取得部 151と、学習見直し部 154とを備えている。他の構成については、図 2に示した第 1実施例と同様である。

[0059] 学習見直し部 154は、学習データ記憶部 131から既知学習データ群を読み出し、既知学習データ群のそれぞれに対応するルール 301であるルール群 301をルール記憶部 132から読み出す。学習見直し部 154は、既知学習データ群のそれぞれに対して取得順序に比例して増加する重み 204を設定する。学習見直し部 154は、ルール群 301の取得順序に応じて、既知学習データ群のうちの、正例学習データを表す正例既知学習データ群に対してルール群 301を適用したときの正例学習データの数を表すスコアを決定し、スコアに基づいて、既知学習データ群のそれぞれに対して設定された重み 204を調整する。これにつ!/、て以下に説明する。 [0060] 学習見直し部 1 54は、前サイクルでデータ更新部 144によって追加された既知学習データ、すなわち最も新しく取得した既知学習データの結果をルールに照らし合わせ、ルール生成の起因となった前々サイクル以前の学習データにフィードバックする。すなわち、学習データ記憶部 131に記憶されている既知学習データ群の中から、取得サイクル数 205として前サイクル番号が記録されている既知学習データ群を検索する。

[0061] 学習見直し部 1 54は、検索された既知学習データ群が、所望のラベル 203が正例であることを表す正例既知学習データ群である場合、その正例既知学習データ群に対して、ルール記憶部 132に記憶されて!/、るルール群 301を適用して重要度を算出する。ルール群 301の各々の重要度の算出は、正例既知学習データ群に適用したときの正例学習データの数を表すスコアを求め、スコアの最大値又は平均値としても良い。学習見直し部 154は、ノレール群 301のうちの、重要度が高いルールを選択ルーノレ 301として選択し、選択ノレ一ノレ 301のノレ一ノレ識另 IJ子 302を選択ノレ一ノレ識另 IJ子 302 としてルール識別子記憶部 135に記憶する。ルールの重要度の高さの判定は、ある閾値以上の値としても良いし、算出された値の上位一定割合としても良いし、ルール数の上位一定割合としても良い。

[0062] 次に、学習見直し部 154は、学習データ記憶部 131に記憶されている既知学習データ群の中から、取得サイクル数 205として前々サイクル番号以下の番号が記憶されている既知学習データを読み出し、その既知学習データの各々に対して、その記述子を選択ルール 301に入力して正例らしさを表すスコアを算出する。

[0063] 学習見直し部 1 54は、算出されたスコアと所望ラベル値を照らし合わせ、既知学習データ群のうちの、正例学習データであり、算出されたスコアが所定スコアよりも高い既知学習データについては、その重み 204を所定値だけ大きくする。また、正例学習データである力 S、算出されたスコアが所定スコアよりも低い既知学習データについては、その重み 204を所定値だけ小さくする。一方、負例学習データであり、算出されたスコアが所定スコアよりも低い既知学習データについては、その重み 204を所定値だけ大きくする。また、負例学習データであるが、算出されたスコアが所定スコアよりも高い既知学習データであっても、その重み 204を所定値だけ小さくする。重みを増減させる値は、定数としても良いし、算出されたスコア値としても良い。

[0064] 学習見直し部 154は、重みの設定処理を終えると、能動学習部 140の学習部 141 に処理を進める。

[0065] 学習部 141以降の処理においては、学習の重み 204の値により重要度に差をつけて学習を進める。つまり、重み 204の大きな学習データは、それより重みの小さな学習データより重要視して学習を進める。

[0066] 図 8を参照すると、本実施形態に力、かる能動学習システムの動作フローは、後述のとおり、図 5に示した第 1実施例と比較して、ステップ S402、 S403の代わりにステツプ S701〜S704が設けられている点が相違する。

[0067] 以下、本実施形態の動作を説明する。

なお、本実施形態のスタートから 1サイクル目のステップ S206までの動作は、第 1 実施例のスタートからステップ S106までの動作と同じである。

[0068] (1)ステップ S 201

[0069] (2)ステップ S202

学習部 141は、学習データ記憶部 131から既知学習データ群を読み出し、既知学習データ群の中から、重み 204が最も大きい選択既知学習データを選択する。選択既知学習データは、既知学習データ群のうちの選択既知学習データ以外の学習データよりも正しく予測された学習データを表している。学習部 141は、選択既知学習データに対して正例学習データ又は前記負例学習データを選別するためのルール 301を生成（学習）し、最新のルール 301としてルール記憶部 132に記憶する。

[0070] (3)ステップ S203

[0071] (4)ステップ S204 候補データ選択部 143は、予測結果に基づいて、候補学習データ群の中から、次の学習対象となる学習データを表す選択候補学習データを選択し、選択候補学習データを選択データ記憶部 134に記憶する。

[0072] (5)ステップ S205

[0073] (6)ステップ S206

制御部 150は、終了条件が成立した力、どうかを判定し、終了条件が成立していなければ、学習見直し部 154に処理が移る。この場合、学習データ記憶部 131には、既知学習データ群のうちの、学習開始時点に存在した既知学習データと、データ更新部 144によって追加された既知学習データとが混在している。後者の追加された学習データの所望のラベルの値は実験なり調査なりで調べられた実際の値である。他方、終了条件が成立していれば、制御部 150は能動学習サイクルの繰り返しを停止させる。終了条件は、入出力装置 110から与えられ、その条件は、能動学習サイクルの最大繰り返し回数等、任意の条件で良い。

[0074] (7)ステップ S207

学習見直し部 154は、学習データ記憶部 131に記憶されている既知学習データ群の中から、取得サイクル数 205として前サイクル番号が記録されている既知学習データ群を検索する。学習見直し部 154は、検索された既知学習データ群が、所望のラベル 203が正例であることを表す正例既知学習データ群である場合、その正例既知学習データ群に対して、ルール記憶部 132に記憶されているルール群 301を適用して重要度を算出する。

[0075] (8)ステップ S208 次に、学習見直し部 154は、ノレール群 301のうちの、重要度が高いルールを選択ルール 301として選択し、選択ルール 301のルール識別子 302を選択ルール識別子 302としてルール識別子記憶部 135に記憶する。

[0076] (9)ステップ S209

次に、学習見直し部 154は、学習データ記憶部 131に記憶されている既知学習データ群の中から、取得サイクル数 205として前々サイクル番号以下の番号が記憶されている既知学習データを読み出し、その既知学習データの各々に対して、その記述子を選択ルール 301に入力して正例らしさを表すスコアを算出する。

[0077] (10)ステップ S210

学習見直し部 154は、算出されたスコアと所望ラベル値を照らし合わせ、既知学習データ群のうちの、正例学習データであり、算出されたスコアが所定スコアよりも高い既知学習データについては、その重み 204を所定値だけ大きくする。また、正例学習データである力 S、算出されたスコアが所定スコアよりも低い既知学習データについては、その重み 204を所定値だけ小さくする。一方、負例学習データであり、算出されたスコアが所定スコアよりも低い既知学習データについては、その重み 204を所定値だけ大きくする。また、負例学習データであるが、算出されたスコアが所定スコアよりも高い既知学習データであっても、その重み 204を所定値だけ小さくする。そして、能動学習部 140に処理が移る。

[0078] 学習部 141以降の処理においては、第 1実施例と同じである。能動学習部 140で能動学習の 1サイクルが終了すると、制御部 150に再び処理が移る。

[0079] なお、第 1、第 2実施例のいずれかの動作 (能動学習方法)を規定したコンピュータプログラムを用いて、諸般のコンピュータに本発明の能動学習方法における動作を実施させるようにすることあでさる。

[0080] 本発明の第 2実施例による能動学習システムによれば、能動学習サイクル毎に、前サイクルで得られた正例データをルールにフィードバックする機能が設けられている。これにより、正例取得に効果のあったルールに対して、正例を正例らしいと正しく予測した学習データの重みを増やし、正例を正例らしくな!/、と誤って予測した学習データの重みを減らしている。一方、負例を正例らしくないと正しく予測した学習データの重みを増やし、負例を正例らし!/、と誤って予測した学習データの重みを減らして!/、る。その結果、次サイクルの学習時において、前サイクルで正例を得たルールを反映した学習が行われることが期待できる。また、新しく取得した正例が極僅かであった場合にも、以前から蓄積されていたデータに引きずられたルールではなぐその新たに取得した極僅かな正例を重視したルールが生成されることが期待される。ルールのフイードバック機能がある学習は、ルールのフィードバック機能がない学習に比べて、正例の数がより多ぐそして多様な正例が含まれる確率が高くなる。このように、本発明の第 2実施例による能動学習システムでは、既知学習データに対応するルールの取得順序を考慮することにより、学習効率が向上する。

[0081] 次に第 2実施例の変形例について説明する。

[0082] 前述したように、学習見直し部 154は、学習データ記憶部 131から既知学習データ群を読み出し、既知学習データ群のそれぞれに対応するルール 301であるルール群 301をルール記憶部 132から読み出す。学習見直し部 154は、既知学習データ群のそれぞれに対して取得順序に比例して増加する重み 204を設定する。学習見直し部 154は、ルール群 301の取得順序に応じて、既知学習データ群のうちの、正例学習データを表す正例既知学習データ群に対してルール群 301を適用したときの正例学習データの数を表すスコアを決定し、スコアに基づいて、既知学習データ群のそれぞれに対して設定された重み 204を調整している。即ち、既知学習データ群のうちの、所望のラベル 203が正例である学習データに対してのみ、ルール記憶部 1 32に記憶されて!/、るルール群 301に適用して!/、る。

[0083] 一方、変形例では、学習見直し部 154は、ルール群 301の取得順序に応じて、既知学習データ群に対してルール群 301を適用したときの正例学習データの数を表すスコアを決定し、スコアに基づいて、既知学習データ群のそれぞれに対して設定された重み 204を調整する。即ち、既知学習データ群のうちの、所望のラベル 203が正例だけでなく負例を含めた学習データに対して、ルール群 301に適用する。正例の場合は算出されたスコアがそのままルールの重要度に反映する力負例の場合、例えば、スコアは 0〜1の範囲を取り、 1に近いほど正例である可能性が高いとした場合、算出されたスコアを 1から引いた値を正例スコアとする。こうして算出されたスコアからルール群 301の各々の重要度を算出する。

[0084] 本実施形態の変形例によれば、能動学習サイクル毎に、前サイクルで得られた正例学習データだけでなぐ負例学習データもルールにフィードバックする機能が設けられている。このため、次サイクルの学習時において、新しく取得した学習データの分類能力が高い学習が行われることが期待される。ルールのフィードバック機能がある学習は、ルールのフィードバック機能がない学習に比べて、正例の数がより多ぐそして多様な正例が含まれる確率が高くなる。このように、本発明の第 2実施例による能動学習システムでは、既知学習データに対応するルールの取得順序を考慮することにより、学習効率が向上する。

[0085] 以上、実施例を参照して本発明を説明した力本発明は上記の実施例に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

[0086] 本発明の能動学習システム及び方法は、例えば、創薬スクリーニングの場面において活性化合物を探索するなどのように、多数の候補データからユーザが所望するデータを選択するようなデータマイニングの用途に適用できる。

Claims

請求の範囲

[1] 複数の学習データのうちの、利用者にとって価値があるか否かを表すラベルが設定された既知学習データ群を記憶する学習データ記憶手段と、

前記既知学習データ群のそれぞれに対して取得順序に比例して増加する重みを設定する制御手段と、ここで、前記既知学習データ群のうちの、利用者にとって価値がある学習データを正例学習データとし、利用者にとって価値がなレ、学習データを負例学習データとし、

前記既知学習データ群の中から、前記重みが最も大きい選択既知学習データを選択し、前記選択既知学習データに対して前記正例学習データ又は前記負例学習データを選別するためのルールを生成する学習手段と、

前記複数の学習データのうちの前記既知学習データ群以外の学習データである候補学習データ群として記憶する候補データ記憶手段と、

前記ルールを前記複数の学習データのうちの前記既知学習データ群以外の学習データである候補学習データ群に適用して、前記候補学習データ群に対して前記正例学習データであるか否かを予測し、予測結果を生成する予測手段と、

前記予測結果に基づいて、前記候補学習データ群の中から、学習対象となる学習データを表す選択候補学習データを選択する候補データ選択手段と、

前記選択候補学習データを出力装置に出力し、入力装置から入力される前記ラベルを前記選択候補学習データに設定し、前記選択候補学習データを前記候補学習データ群から除いて既知学習データとして前記既知学習データ群に追加するデータ更新手段と、

を具備する能動学習システム。

[2] 前記学習データ記憶手段は、取得サイクル数を更に記憶し、

前記制御手段は、

前記取得サイクル数に基づ!/、て前記重みを決定し、前記既知学習データ群の取得順序に応じて、前記既知学習データ群のそれぞれに対して前記重みを設定する学習データ重み設定手段、

を具備する請求の範囲 1に記載の能動学習システム。 [3] 前記選択既知学習データは、前記既知学習データ群のうちの前記選択既知学習データ以外の学習データよりも最新の学習データを表している

請求の範囲 1に記載の能動学習システム。

[4] 前記既知学習データ群のそれぞれに対応する前記ルールをルール群として記憶するルール記憶手段、

を更に具備し、

前記学習データ記憶手段は、取得サイクル数を更に記憶し、

前記制御手段は、

前記取得サイクル数に基づ!/、て前記重みを決定し、前記既知学習データ群のそれぞれに対して前記重みを設定し、前記ルール群の取得順序に応じて、前記既知学習データ群に対して前記ルール群を適用したときの前記正例学習データの数を表すスコアを決定し、前記スコアに基づいて、前記既知学習データ群のそれぞれに対して設定された前記重みを調整する学習見直し手段、

を具備する請求の範囲 1に記載の能動学習システム。

[5] 前記選択既知学習データは、前記既知学習データ群のうちの前記選択既知学習データ以外の学習データよりも正しく予測された学習データを表している

請求の範囲 4に記載の能動学習システム。

[6] 前記学習見直し手段は、

前記ルール群の取得順序に応じて、前記既知学習データ群のうちの、前記正例学習データを表す正例既知学習データ群に対して前記ルール群を適用したときの前記正例学習データの数を表す前記スコアを決定し、前記スコアに基づいて、前記既知学習データ群のそれぞれに対して設定された前記重みを調整する

請求の範囲 4に記載の能動学習システム。

[7] 複数の学習データのうちの、利用者にとって価値があるか否かを表すラベルが設定された既知学習データ群を学習データ記憶手段に記憶するステップと、

前記既知学習データ群のそれぞれに対して取得順序に比例して増加する重みを設定するステップと、ここで、前記既知学習データ群のうちの、利用者にとって価値がある学習データを正例学習データとし、利用者にとって価値がな!、学習データを負例学習データとし、

前記既知学習データ群の中から、前記重みが最も大きい選択既知学習データを選択し、前記選択既知学習データに対して前記正例学習データ又は前記負例学習データを選別するためのルールを生成するステップと、

前記複数の学習データのうちの前記既知学習データ群以外の学習データである候補学習データ群として候補データ記憶手段に記憶するステップと、

前記ルールを前記複数の学習データのうちの前記既知学習データ群以外の学習データである候補学習データ群に適用して、前記候補学習データ群に対して前記正例学習データであるか否かを予測し、予測結果を生成するステップと、

前記予測結果に基づいて、前記候補学習データ群の中から、学習対象となる学習データを表す選択候補学習データを選択するステップと、

前記選択候補学習データを出力装置に出力し、入力装置から入力される前記ラベルを前記選択候補学習データに設定し、前記選択候補学習データを前記候補学習データ群から除いて既知学習データとして前記既知学習データ群に追加するステツプと、

を具備する能動学習方法。

[8] 前記学習データ記憶手段に記憶するステップは、

取得サイクル数を更に前記学習データ記憶手段に記憶するステップ、を具備し、

刖 ci重みを刖記！^定するステップは、

前記取得サイクル数に基づ!/、て前記重みを決定し、前記既知学習データ群の取得順序に応じて、前記既知学習データ群のそれぞれに対して前記重みを設定するステップ、

を具備する請求の範囲 7に記載の能動学習方法。

[9] 前記選択既知学習データは、前記既知学習データ群のうちの前記選択既知学習データ以外の学習データよりも最新の学習データを表している

請求の範囲 7に記載の能動学習方法。

[10] 前記既知学習データ群のそれぞれに対応する前記ルールをルール群としてルール記憶手段に記憶するステップ、

を更に具備し、

前記学習データ記憶手段に記憶するステップは、

刖 ci重みを刖記！^定するステップは、

前記取得サイクル数に基づ!/、て前記重みを決定し、前記既知学習データ群のそれぞれに対して前記重みを設定し、前記ルール群の取得順序に応じて、前記既知学習データ群に対して前記ルール群を適用したときの前記正例学習データの数を表すスコアを決定し、前記スコアに基づいて、前記既知学習データ群のそれぞれに対して設定された前記重みを調整するステップ、

を具備する請求の範囲 7に記載の能動学習方法。

[11] 前記選択既知学習データは、前記既知学習データ群のうちの前記選択既知学習データ以外の学習データよりも正しく予測された学習データを表している

請求の範囲 10に記載の能動学習方法。

[12] 前記重みを調整するステップは、

前記ルール群の取得順序に応じて、前記既知学習データ群のうちの、前記正例学習データを表す正例既知学習データ群に対して前記ルール群を適用したときの前記正例学習データの数を表す前記スコアを決定し、前記スコアに基づいて、前記既知学習データ群のそれぞれに対して設定された前記重みを調整するステップ、を具備する請求の範囲 10に記載の能動学習方法。

[13] 複数の学習データのうちの、利用者にとって価値があるか否かを表すラベルが設定された既知学習データ群を学習データ記憶手段に記憶するステップと、

の各ステップをコンピュータに実行させるためのコンピュータプログラムが記憶され、前記コンピュータプログラムを前記コンピュータが読み取り可能な記録媒体。

前記学習データ記憶手段に記憶するステップは、

を具備する請求の範囲 13に記載の記録媒体。

[15] 前記選択既知学習データは、前記既知学習データ群のうちの前記選択既知学習データ以外の学習データよりも最新の学習データを表している

請求の範囲 13に記載の記録媒体。

[16] 前記コンピュータプログラムは、

前記既知学習データ群のそれぞれに対応する前記ルールをルール群としてルール記憶手段に記憶するステップ、

を更に前記コンピュータに実行させ、

前記学習データ記憶手段に記憶するステップは、

刖 ci重みを刖記！^定するステップは、

を具備する請求の範囲 13に記載の記録媒体。

[17] 前記選択既知学習データは、前記既知学習データ群のうちの前記選択既知学習データ以外の学習データよりも正しく予測された学習データを表している

請求の範囲 16に記載の記録媒体。

[18] 前記重みを調整するステップは、

前記ルール群の取得順序に応じて、前記既知学習データ群のうちの、前記正例学習データを表す正例既知学習データ群に対して前記ルール群を適用したときの前記正例学習データの数を表す前記スコアを決定し、前記スコアに基づいて、前記既知学習データ群のそれぞれに対して設定された前記重みを調整するステップ、を具備する請求の範囲 16に記載の記録媒体。