JP4645288B2 - 能動学習方法および能動学習システム - Google Patents

能動学習方法および能動学習システム Download PDF

Info

Publication number
JP4645288B2
JP4645288B2 JP2005130952A JP2005130952A JP4645288B2 JP 4645288 B2 JP4645288 B2 JP 4645288B2 JP 2005130952 A JP2005130952 A JP 2005130952A JP 2005130952 A JP2005130952 A JP 2005130952A JP 4645288 B2 JP4645288 B2 JP 4645288B2
Authority
JP
Japan
Prior art keywords
data
learning
label
value
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2005130952A
Other languages
English (en)
Other versions
JP2006309485A (ja
Inventor
慶子 山下
勉 襲田
由希子 黒岩
稔 麻生川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2005130952A priority Critical patent/JP4645288B2/ja
Priority to US11/412,088 priority patent/US20070011127A1/en
Priority to EP06252296A priority patent/EP1717737A1/en
Publication of JP2006309485A publication Critical patent/JP2006309485A/ja
Application granted granted Critical
Publication of JP4645288B2 publication Critical patent/JP4645288B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は機械学習に関し、特に能動学習方法および能動学習システムに関する。
能動学習とは、学習者(コンピュータ)が学習データを能動的に選択できる、機械学習手法の一形態である。能動学習では、データ数や計算量の意味で学習の効率を向上させることができるため、例えば、膨大な種類の化合物の中から特定のタンパク質に対し活性のある化合物を発見する創薬スクリーニングなどに適した技術として注目されている(例えば非特許文献1参照)。
能動学習システムで扱われるデータは、複数の記述子(属性)と1以上のラベルとで表現される。記述子はそのデータの構造などを特徴付けるものであり、ラベルはそのデータの或る事象に関する状態を示す。例えば、能動学習による創薬スクリーニングの場合、個々の化合物データは、分子量などの各種物理化学定数などを記述した複数の記述子によって構造が特定される。また、ラベルは、例えば特定のタンパク質に対する活性の有無を示すために使用される。ラベルのとり得る値が、活性あり、活性なしのように離散値の場合、クラスと呼ぶ。他方、ラベルがとり得る値が連続値の場合、関数値と呼ぶ。つまり、ラベルはクラスまたは関数値を含む。
ラベルの値が既知であるデータを既知データ、ラベルの値が未知であるデータを未知データと呼ぶ。能動学習では、最初の学習は、既知データを使って行う。既知データのうち、利用者にとって価値のあるデータを正例、そうでないものを負例として区別し、既知データの集合から選択した正例および負例の双方を使って学習する。正例、負例は、注目するラベルの値で決まる。注目するラベルの値が2値をとる場合、利用者の注目する値が正例、そうでない値が負例になる。例えば、或るラベルが或るタンパク質に対する活性の有無を示すものとし、そのタンパク質に対して活性のある化合物に注目する場合、活性ありの値のラベルが正例、活性なしの値のラベルが負例になる。なお、ラベルが多値の場合、注目している1つの値を正例、それ以外の全ての値を負例とする。またラベルのとり得る値が連続値の場合、注目する値付近にラベル値が存在するものを正例、それ以外のところにあるものを負例とする。
正例と負例を使って能動学習システムが学習するのは、任意のデータの記述子の入力に対して、そのデータのラベルの値が注目している値かどうか、換言すればそのデータが正例か、負例かを選別するためのルール(仮説、規則)である。このとき能動学習では、アンサンブル学習を適用して、学習データから複数のルールを生成(学習)する。代表的なアンサンブル学習手法として、バギング(Bagging)とブースティング(Boosting)がある。
既知データで学習し複数のルールを生成すると、その学習した複数のルールをラベル値が未知の多数のデータに適用し、未知データのラベル値の予測を行う。複数のルールによる予測結果は統合され、スコアと呼ばれる数値で定量的に示される。スコアは、個々の未知データの正例らしさの数値であり、例えば値が大きいほど、正例である可能性が高いことを示す。能動学習システムは、各未知データの予測結果に基づいて、未知データの中から効率的に学習が行えるようなデータを選択し、出力する。この選択方法に関しては、予測が割れたデータを選択する方法や、スコアの高い順に選択する方法、或る関数を用いて選択する方法等、幾つかの方法がある(例えば特許文献1、2参照)。
上記出力されたラベルの値が未知のデータについて、実験や調査などによってラベルの実際の値が調べられ、その結果が学習システムにフィードバックされる。学習システムは、ラベルの実際の値が求まった未知データを未知データの集合から取り除いて既知データの集合に混ぜ、上述と同様の動作を再度繰り返す。つまり、既知データの集合から再度選択した正例と負例を使って複数のルールの学習を進め、そのルールを未知データに対して適用して予測を行い、予測結果に基づいてデータの選択と出力を行う。このような処理の繰り返しは、予め定められた終了条件が満たされるまで続けられる。
特開平11−316754号公報 特開2005−107743号公報 Manfred K. Warmuth著「Active Learning with Support Vector Machines in the Drug Discovery Process」 Journal of Chemical Information and Computer Sciences、Volume 43, Number 1, January 2003
従来の能動学習システムは、学習開始時点の初期の状態において、既知データの集合中に負例と共に正例が存在していることが前提であり、正例が全く存在しないか、ごく僅かしか存在しない場合、システムを起動させることは全く考えられなかった。何故なら、そのような状態でシステムを起動してもルールの学習が全く意味をなさず、無意味なルールで未知データのラベルを予測することになり、その予測結果に基づいて学習に使うデータを選択しても、そのような未知データはランダムに選択したデータと実質的に何ら変わりがないからである。選択されたデータが正例である確率が、ランダム選択の場合と同様に極めて低いものであれば、学習コストが増大する。特に創薬スクリーニングのように未知ラベルの値を実験によって求める際のコストが大きい分野では、学習コストが著しく増大する。
本発明はこのような従来の問題点を改善したものであり、その目的は、学習開始時点の初期の状態において既知データの集合中に正例が全く存在しないか、ごく僅かしか存在しない場合でも、意味のある学習が行える能動学習システムを提供することにある。
本発明の第1の能動学習システムは、複数の記述子と複数のラベルとで構成されるデータの所望ラベルの値を該所望ラベルが示す事象と類似する事象の状態を示す他のラベルの値で書き換えたデータを学習データとして前記学習データの集合を学習データ記憶部上に生成する制御部と、前記所望ラベルが未知のデータを候補データとして前記候補データの集合を記憶する候補データ記憶部と、前記所望ラベルが所望値のデータを正例、それ以外のデータを負例とするとき、前記学習データ記憶部に記憶された正例と負例のデータを使って、任意のデータの記述子の入力に対してそのデータの正例らしさを計算するルールを学習する学習部、学習したルールを前記候補データ記憶部に記憶された候補データの集合に適用して各候補データの正例らしさを予測する予測部、予測結果に基づいて次に学習すべきデータを選択する候補データ選択部、および、選択したデータを出力装置から出力し、前記所望ラベルの実際の値が入力装置から入力されたデータについては候補データの集合から取り除いて学習データの集合に追加するデータ更新部を含み、前記制御部により能動学習サイクルの繰り返しが制御される能動学習部とを備えることを特徴とする。
本発明の第2の能動学習システムは、第1の能動学習システムにおいて、前記制御部は、前記入力装置から入力された前記所望ラベルの情報に基づいて前記学習データ記憶部に予め記憶された学習データの集合に含まれる正例の数を調べる学習設定取得部と、調べられた正例の数が閾値より少ない場合に前記所望ラベルと類似する他のラベルに関する類似情報を前記入力装置から入力する類似情報取得部と、前記学習データ記憶部に記憶された学習データの前記所望ラベルの値を前記類似情報が示す他のラベルの値で書き換えるデータラベル変換部とを含むことを特徴とする。
本発明の第3の能動学習システムは、第1の能動学習システムにおいて、前記制御部は、前記所望ラベルの値が他のラベルの値で書き換え済みの学習データを外部装置から受信して前記学習データ記憶部に保存するものであることを特徴とする。
本発明の第4の能動学習システムは、第1、第2または第3の能動学習システムにおいて、前記制御部は、他のラベルの値で書き換えられた結果前記所望ラベルが所望値になっている仮の正例よりも、前記所望ラベルが実際に所望値である真の正例を重要視した学習が前記能動学習部で行われるための重みを前記学習データに設定するデータ重み付け部を有することを特徴とする。
本発明の第5の能動学習システムは、第1、第2または第3の能動学習システムにおいて、前記制御部は、前記能動学習部による能動学習中に、予め定められた仮設定一括解除条件が成立したかどうかを判定し、前記仮設定一括解除条件が成立した場合、前記学習データ記憶部に記憶されている学習データのうち、前記所望ラベルの値が他のラベルの値で書き換えられている学習データの全てについて正例としての学習への影響をなくす処理を行う仮設定一括解除部を有することを特徴とする。
本発明の第6の能動学習システムは、第5の能動学習システムにおいて、前記仮設定一括解除部は、前記所望ラベルの値が他のラベルの値で書き換えられている学習データの全てを書き換え前の状態に戻すものであることを特徴とする。
本発明の第7の能動学習システムは、第5の能動学習システムにおいて、前記仮設定一括解除部は、書き換え前の状態に戻した学習データの前記所望ラベルが未知の場合、該学習データを前記学習データ記憶部から前記候補データ記憶部へ移動させるものであることを特徴とする。
本発明の第8の能動学習システムは、第1、第2または第3の能動学習システムにおいて、前記制御部は、前記能動学習部による能動学習の1サイクル終了毎に、予め定められた仮設定漸次解除条件が成立したかどうかを判定し、前記仮設定漸次解除条件が成立した場合、前記学習データ記憶部に記憶されている学習データのうち、前記所望ラベルの値が他のラベルの値で書き換えられている学習データについて正例としての学習への影響を徐々に弱める処理を行う仮設定漸次解除部を有することを特徴とする。
本発明の第9の能動学習システムは、第8の能動学習システムにおいて、前記仮設定漸次解除部は、前記所望ラベルの値が他のラベルの値で書き換えられている学習データの一部を書き換え前の状態に戻すものであることを特徴とする。
本発明の第10の能動学習システムは、第8の能動学習システムにおいて、前記仮設定漸次解除部は、書き換え前の状態に戻した学習データの前記所望ラベルが未知の場合、該学習データを前記学習データ記憶部から前記候補データ記憶部へ移動させるものであることを特徴とする。
本発明の第11の能動学習システムは、第8の能動学習システムにおいて、前記仮設定漸次解除部は、前記所望ラベルの値が他のラベルの値で書き換えられている学習データの学習の重みを調整するものであることを特徴とする。
本発明の第1の能動学習方法は、a)制御部が、複数の記述子と複数のラベルとで構成されるデータの所望ラベルの値を該所望ラベルが示す事象と類似する事象の状態を示す他のラベルの値で書き換えたデータを学習データとして前記学習データの集合を学習データ記憶部上に生成するステップ、b)能動学習部が、前記所望ラベルが所望値のデータを正例、それ以外のデータを負例とするとき、前記学習データ記憶部に記憶された正例と負例のデータを使って、任意のデータの記述子の入力に対してそのデータの正例らしさを計算するルールを学習するステップ、c)前記能動学習部が、前記所望ラベルが未知のデータを候補データとして前記候補データの集合を記憶する候補データ記憶部に記憶された前記候補データの集合に対して、前記学習したルールを適用して各候補データの正例らしさを予測するステップ、d)前記能動学習部が、予測結果に基づいて次に学習すべきデータを選択するステップ、e)前記能動学習部が、選択したデータを出力装置から出力し、前記所望ラベルの実際の値が入力装置から入力されたデータについては候補データの集合から取り除いて学習データの集合に追加するステップ、f)前記制御部が終了条件の成否に基づき前記能動学習部による能動学習サイクルの繰り返しを制御するステップ、を含むことを特徴とする。
本発明の第2の能動学習方法は、第1の能動学習方法において、前記ステップaにおいて、前記制御部は、前記入力装置から入力された前記所望ラベルの情報に基づいて前記学習データ記憶部に予め記憶された学習データの集合に含まれる正例の数を調べ、調べた正例の数が閾値より少ない場合に前記所望ラベルと類似する他のラベルに関する類似情報を前記入力装置から入力し、前記学習データ記憶部に記憶された学習データの前記所望ラベルの値を前記類似情報が示す他のラベルの値で書き換えることを特徴とする。
本発明の第3の能動学習方法は、第1の能動学習方法において、前記ステップaにおいて、前記制御部は、前記所望ラベルの値が他のラベルの値で書き換え済みの学習データを外部装置から受信して前記学習データ記憶部に保存することを特徴とする。
『作用』
学習データを構成する複数の記述子は、そのデータの構造などを特定するものであり、個々のラベルは、そのデータのそれぞれ異なる事象に関する状態を示す。ここで、異なる事象であっても、類似している事象であれば、それらのラベルの値は或る程度同じ値をとる傾向があると考えられる。本発明はこの点に着目し、学習開始時点の初期の状態において既知データの集合中に正例(所望ラベルの値が所望値のデータ)が全く存在しないか、ごく僅かしか存在しない場合、学習データの所望ラベルの値を類似する別のラベルの値で置換する。こうすると、類似する他のラベルの値が所望ラベルの所望値と同じであれば、置換後の学習データは正例と同じになり、正例の数を見かけ上増やすことができる。この正例は、所望ラベルがもともと所望値であった真の正例ではなく、いわば仮の正例であるが、所望ラベルと置換に使用したラベルとの間には類似関係があるため、仮の正例を用いて学習するルールは、或る程度意味のあるルールとなる。このため、そのルールを適用して候補データから選択した次に学習すべきデータは、ランダム選択したデータに比べて、より正例である確率が高くなり、ランダム選択に比べて学習効率が向上することになる。
本発明によれば、学習開始時点の初期の状態において学習データの集合中に正例が全く存在しないか、ごく僅かしか存在しない場合でも意味のある学習が行えるため、能動学習の効率を向上させることが可能である。
次に本発明の実施の形態について図面を参照して詳細に説明する。
「第1の実施の形態」
図1を参照すると、本発明の第1の実施の形態にかかる能動学習システムは、キーボードやマウス等の入力装置とLCDやプリンタ等の出力装置とで構成される入出力装置110と、プログラム制御により動作する処理装置120と、半導体メモリや磁気ディスク等で構成される記憶装置130とから構成されている。
記憶装置130は、学習データ記憶部131、ルール記憶部132、候補データ記憶部133および選択データ記憶部134を有する。
学習データ記憶部131には、学習データの集合が記憶される。個々の学習データは、例えば図2に示されるように、当該学習データを一意に識別するための識別子201、複数の記述子202、複数のラベル203および復元情報204で構成される。記述子202は当該データの構造などを特徴付けるものである。ラベル203は当該データの或る事象に関する状態を示し、クラスまたは関数値を含む。復元情報204は、或るラベルの値が他のラベルの値で置換された状態を置換前の状態に戻すための情報であり、ラベル変換された場合には例えば置換対象となったラベルの番号と元の値が記録され、ラベル変換されていない場合は例えばNULLになっている。なお、復元情報204は各データ毎に持たせるのではなく、データとは別に記憶しても良い。
ルール記憶部132は、学習データ記憶部131に記憶された学習データを使って例えばバギング法によって学習した複数のルールを記憶する。図3(a)に示されるように、個々のルール301はルール識別子302によって他のルールと区別される。各ルール301は、任意のデータの複数の記述子202の入力に対して、そのデータが正例であるかどうか、つまり所望ラベルの値が所望値であるかどうかを予測するためのものである。個々のルール301の一例を図3(b)に示す。この例では、個々のルール301は、”IF 条件文 THEN スコア”の形式を有するルールの集合である。条件文では、データの記述子を変数とした論理条件が設定される。スコアは、当該データの正例らしさの数値であり、例えば0〜1の値をとり、大きいほど、より正例らしいことを示す。
候補データ記憶部133には、候補データの集合が記憶される。個々の候補データは、学習データと同様に図2に示したような構造を有する。但し、複数のラベル203のうちの学習を行うラベル(所望ラベル)は、学習データにあっては既知、すなわち有意な値が設定されているのに対し、候補データにあっては未知、すなわち未設定になっている点が相違する。
選択データ記憶部134は、候補データ記憶部133に記憶された候補データのうち、次に学習すべきデータとしてシステムが選択したデータを記憶する部分である。
処理装置120は、能動学習部140および制御部150で構成される。
能動学習部140は、学習データの集合を使って複数のルールを学習し、学習したルールを候補データの集合に適用して各候補データの正例らしさを予測し、予測結果に基づいて次に学習すべきデータを選択して出力し、所望ラベルの実際の値が入力されたデータについては候補データの集合から取り除いて学習データの集合に追加する処理を、1能動学習サイクルとして実行する。能動学習部140は、学習部141、予測部142、候補データ選択部143およびデータ更新部144で構成される。
学習部141は、学習データ記憶部131から学習データを読み出し、正例と負例の学習データを使用して、任意のデータの記述子の入力に対してそのデータが正例かどうかを予測する複数のルール301を学習し、ルール記憶部132に保存する。能動学習サイクルが繰り返される場合、ルール記憶部132に保存されたルールをベースに学習が続けられる。
予測部142は、ルール記憶部132から複数のルールを読み出すと共に候補データ記憶部133から候補データの集合を読み出し、各候補データ毎に、その記述子を各ルールに入力して正例らしさのスコアを各ルール毎に算出し、算出結果を候補データ選択部143に出力する。
候補データ選択部143は、予測部142で求められた各候補データ毎の正例らしさのスコアに基づいて、次に学習すべきデータを所定個数のM個だけ選択し、選択した候補データを選択データ記憶部134に保存する。M個選択する方法としては、各候補データ毎に複数ルールのスコアの合計あるいは平均を求め、スコアの合計あるいは平均の高い順にM個選択する方法や、特許文献2に記載されるように所定の関数を用いて選択する方法などが利用できる。また、複数ルールのスコアの分散を求め、予測が割れたデータを選択する方法など、他の方法も適用可能である。
データ更新部144は、選択データ記憶部134から次に学習すべきデータを読み出して入出力装置110に出力し、所望ラベルの値が入出力装置110から入力されたデータは候補データ記憶部133から削除して学習データ記憶部131に追加する。次に学習すべきデータの入出力装置110からの出力は、図2に示したデータ構造全体であっても良いし、識別子201だけであっても良い。また、入出力装置110からのラベル値の入力は、ラベル値が入力されたデータ全体であっても良いし、識別子201とラベル番号とラベル値の組であっても良い。ラベル番号は複数のラベルの中から1つのラベルを特定する番号である。この場合、データ更新部144は、入力された識別子201を持つデータを選択データ記憶部134から検索し、指定されたラベル番号のラベルに入力値を設定して学習データ記憶部131に登録する一方、入力された識別子201を持つ候補データを候補データ記憶部133から検索して削除する。
制御部150は、能動学習部140における能動学習サイクルの繰り返し制御や、学習データのラベル変換処理などを実行する。制御部150は、学習設定取得部151、類似情報取得部152およびデータラベル変換部153を有する。
学習設定取得部151は、利用者等から入出力装置110を通じて少なくとも所望ラベル情報(学習するラベルとその正例のときの値)を含む学習条件を取得し、学習データ記憶部131に記憶されている学習データの所望ラベルの値を調査し、正例の数が所定値(0あるいは予め定められた正の整数)未満であれば、類似情報取得部152に処理を移し、正例の数が所定値以上であれば、能動学習部140の学習部141に処理を移す。
類似情報取得部152は、必要に応じて学習設定取得部151の判定結果を入出力装置110に出力し、利用者等から入出力装置110を通じて、学習データの所望ラベルと類似関係にある他のラベルの情報を類似情報として取得し、データラベル変換部153に出力する。学習データの各ラベルは、そのデータの或る事象に関する状態を示す。従って、所望ラベルが示す事象と類似する事象の状態を示す他のラベルは、所望ラベルと類似関係にある。例えば、ラベル番号1のラベルが或るタンパク質Aとの活性の有無を示し、ラベル番号2のラベルがタンパク質Aと類縁関係にある別のタンパク質Bとの活性の有無を示す場合、ラベル番号1とラベル番号2のラベル同士は類似関係にあると言える。また一般に、類似するラベルどうしは、一方がクラスであれば他方もクラス、一方が関数値であれば他方も関数値で、かつ、数値の意味も同じになっている。
データラベル変換部153は、学習データ記憶部131から学習データを読み出し、各学習データにおける所望ラベルの値を、所望ラベルと類似関係にある別のラベルの値で書き換える。例えば、図2において、ラベル番号1のラベルが所望ラベル(学習ラベル)であり、「ラベル番号1とラベル番号2は類似関係にある」との類似情報が入力された場合、ラベル番号2のラベルの値でラベル番号1のラベルを書き換え、復元情報204に、ラベル番号1とラベル1の元の値を記録しておく。なお、真の正例はラベル変換の対象から除外しても良い。例えば、前記の例において、ラベル1が所望値の1であるデータは真の正例であるため、ラベル変換の対象としない。データラベル変換部153は、ラベル書き換え処理を終えると、能動学習部140の学習部141に処理を進める。
次に本実施の形態の動作を説明する。
能動学習を開始するに際しては、記憶装置130の学習データ記憶部131に複数の学習データが記憶され、候補データ記憶部133には複数の候補データが記憶されている。またルール記憶部132には有意なルールが存在せず、選択データ記憶部134には1つも選択データは保存されていない。この状態で処理装置120が起動されると、図4に示す処理が開始される。
まず、入出力装置110から与えられた学習条件が制御部150の学習設定取得部151へ供給される(図4のステップS401)。学習設定取得部151は、学習条件に含まれる所望ラベルの情報(例えば所望ラベルのラベル番号と所望値)をキーに学習データ記憶部131を検索し、所望ラベルの値が所望値になっている学習データの数、つまり正例の数を計数し、予め定められた閾値と比較する(ステップS402)。正例の数が閾値以上であれば、処理が学習部141に移行する。他方、正例の数が閾値より少ない場合、類似情報取得部152は、所望ラベルの類似情報を入出力装置110から取得してデータラベル変換部153に伝達する(ステップS403)。データラベル変換部153は、所望ラベルの類似情報に基づいて、学習データ記憶部131に記憶されている全ての学習データの所望ラベルの値を、類似ラベルの値に置き換え、復元情報204に復元のための情報を記録する(ステップS404)。そして、処理を学習部141に移行する。
本実施の形態の場合、学習部141以降の処理は従来の能動学習システムと同様に行われる。具体的には、まず学習部141は、学習データ記憶部131に記憶された学習データの集合を使って例えばバギング法によって複数のルール301を学習して図3に示したようにルール記憶部132に保存する(ステップS405)。バギングとは、アンサンブル学習法(複数の学習機械を統合して予測を行う手法)の1つであり、各学習機械は、同一の既知事例のデータベースからデータのリサンプリングを行って生成された、異なったデータ群を用いて学習を行い、これらの予測値の多数決によって、未知事例のクラスを予測する手法である。次に予測部142は、その学習したルールを候補データ記憶部133中の各候補データに適用して正例らしさのスコアを算出する(ステップS406)。次に候補データ選択部143は、この算出された各候補データのスコアに基づいて、次に学習すべきデータをM個選択する(ステップS407)。次に、データ更新部144は、この選択されたM個のデータを例えば表形式で入出力装置110から出力し、その後に所望ラベルの実際の値が入出力装置110から入力されたデータについては、候補データ記憶部133中の候補データの集合から取り除いて学習データ記憶部131中の学習データの集合に追加する(ステップS408)。これで、能動学習の1サイクルが終了し、処理が制御部150に戻される。
制御部150は、終了条件が成立したかどうかを判定し(ステップS409)、終了条件が成立していなければ、再び学習部141に処理を進める。以降、前述と同様の処理が繰り返される。この場合、学習データ記憶部131には、学習開始時点に存在した学習データとデータ更新部144によって追加された学習データとが混在している。後者の学習データの所望ラベルの値は実験なり調査なりで調べられた実際の値である。これに対して前者の学習データの所望ラベルの値は、若しデータラベル変換部153が動作していれば、他のラベルの値で置換されたままである。本実施の形態の場合、これらの学習データは特に区別されることなく使用される。他方、終了条件が成立していれば、制御部150は能動学習サイクルの繰り返しを停止させる。この時点でルール記憶部132に保存されている複数のルールが最終結果のルールになる。終了条件は、入出力装置110から与えられ、その条件は、能動学習サイクルの最大繰り返し回数等、任意の条件で良い。
次に、具体的な例を用いて本実施の形態の動作を説明する。
創薬スクリーニングの場面において活性化合物を探索する例として、創薬の多くのターゲットとなっているGタンパク質共役型受容体(GPCR)のうち生体アミン受容体に作用するリガンド化合物、特に生体アミン受容体ファミリーの1つであるアドレナリンに作用するリガンド化合物を探索する場合を例に挙げる。
図5を参照すると、学習データ記憶部131にはx個の学習データ(化合物データ)が記憶されている。各化合物データは、識別子によって一意に識別され、また記述子1〜nによって構造が特定される。ラベル1〜mは当該化合物の活性を示し、ここでは、ラベル1がアドレナリンに対する活性の有無を示し、ラベル2がヒスタミンに対する活性の有無を示すものとする。何れの場合も、活性有りの場合は数値1、活性無しの場合は数値0に設定される。ここで、学習データ記憶部131には、生体アミン受容体のファミリーの1つであるヒスタミンに対して活性を持つ化合物は登録されているが、同じファミリーに属するアドレナリンに対して活性を持つ化合物は1つも登録されていないものとする。また、候補データ記憶部133には、アドレナリンに対する活性の有無が不明な多数の化合物データが候補データとして記憶されているものとする。
この状態で処理装置120の制御部150が動作を開始し、入出力装置110から所望ラベルとしてラベル1、つまりアドレナリンに活性があるデータを正例とする学習条件が入力されると、学習設定取得部151は、学習データ記憶部131を検索してラベル1の値が1になっている正例の数を計数し、閾値未満であることを判定する。このため、次に類似情報取得部152による類似情報の入力処理が行われる。
今の場合、利用者は、ラベル1とラベル2は類似している旨の類似情報を入出力装置110から入力したとする。これは、ヒスタミンはアドレナリンと同じGPCRの生体アミン受容体のファミリーに属していること、タンパク質同士が類縁関係にあるとき、リガンド化合物もしばしば似ていることがあることを利用者が考慮したことによる。
データラベル変換部153は、類似情報取得部152で取得された類似情報に従って、ラベル2の値が1であるデータ、つまりヒスタミンに作用する化合物データを、学習データ記憶部131から検索し、検索したデータのラベル1の値を図6に示すようにラベル2の値で置換する。そして、ラベル1の値が1であるデータを正例、ラベル1の値が0であるデータを負例として、能動学習部140による学習が以下のように実行される。
まず学習部141は、学習データ記憶部131の化合物データを用いて正負分類の学習を行い、生成されたルールをルール記憶部132に保存する。次に予測部142は、候補データ記憶部133に格納されているラベル1が未知の化合物データに関して前記ルールを適用して正例らしさのスコアを算出する。次に、候補データ選択部143は、予測部142で算出されたスコアに基づいて候補データの集合の中から次に実験候補となる化合物データを選択して選択データ記憶部134に保存し、データ更新部144は、選択データ記憶部134に保存されている化合物データを入出力装置110に出力する。
利用者は、入出力装置110から出力された化合物データに関し、実際にアッセイ実験を行い、アドレナリンに対する活性の有無を調べる。その結果は、アドレナリンに対して活性があったり、なかったりするが、その結果に基づいて前記出力された各化合物データのラベル1の値を入出力装置110から入力する。データ更新部144は、入力されたラベル値を各化合物データのラベル1に設定したデータを学習データ記憶部131に追加し、候補データ記憶部133から削除する。
2回目以降の能動学習サイクルにおいては、学習データ記憶部131に記憶される化合物データのうち、上記のアッセイ実験でアドレナリンに対して活性があることが判明した化合物データとヒスタミンに活性があるためにデータラベル変換部153によりラベル変換された化合物データとが正例として、その他の化合物データが負例として用いられ、上述と同様の学習が繰り返される。
このように標的タンパク質のリガンド情報がない、あるいは少ない場合に、類縁タンパク質の情報を活用して所望のリガンド化合物を効率良く見つけることが可能となり、かつ、見つけたリガンド化合物を正例として学習を続けることができる。
次に本実施の形態の効果を説明する。
本実施の形態によれば、学習開始時点の初期の状態において学習データの集合中に正例が全く存在しないか、ごく僅かしか存在しない場合でも、意味のある学習が行える。その理由は次の通りである。本実施の形態では、所望ラベルに類似する他のラベルの情報を類似情報として入力すると、学習データの所望ラベルの値が類似する別のラベルの値で置換される。この結果、類似する他のラベルの値が所望ラベルの所望値と同じであれば、置換後の学習データは正例と同じになる。これによって、正例の数が見かけ上増大する。また、置換後の正例は、所望ラベルがもともと所望値であった真の正例ではなく、いわば仮の正例であるが、類似関係があるため、仮の正例を用いて学習するルールは、或る程度意味のあるルールとなる。このため、そのルールを適用して候補データから選択した次に学習すべきデータは、ランダム選択したデータに比べて、より正例である確率が高くなり、ランダム選択に比べて学習効率が向上する。
また本実施の形態によれば、学習設定取得部151は、正例数が閾値以上あれば、類似情報取得部152およびデータラベル変換部153による処理を省いて、従来と同様に真の正例のみで学習を開始させることができる。このため、真の正例の数が十分にあるのに仮の正例で学習が開始されることを防止できる。
また本実施の形態によれば、データラベル変換部153による学習データのラベル変換時、ラベル変換対象となったラベル番号と元の値をそのデータの復元情報204に記録してあるので、必要に応じてラベル変換された学習データを元の状態に復元することができる。
次に第1の実施の形態の変形例について説明する。
前述した例では、類似情報取得部152は、所望ラベルに類似する他のラベルを1つだけ受け付けたが、この変形例では、類似する2以上の他のラベルを含む類似情報を入力装置110にて受け取り、データラベル変換部153は、個々の学習データにおいて、類似する2以上の他のラベルの値のうち所望値をとる値を所望ラベルの値に設定する。例えば、図2において、ラベル1を所望ラベル、ラベル2とラベルmをラベル1に類似するラベル、ラベル1の所望値を1とする場合、或る学習データのラベル1が0、ラベル2が1、ラベルmが0のとき、ラベル2の値をラベル1に設定する。また、ラベル2が0、ラベルmが1であれば、ラベルmの値をラベル1に設定する。こうすることで、1つの類似ラベルだけでは仮の正例の数が足りない場合でも、十分な数の仮の正例を確保することが可能となる。
また、複数の類似するラベルを指定する場合、所望ラベルとの類似度の程度に応じた使用順を類似情報で指定し、データラベル変換部153は、使用順の早い(類似度の高い)ものを1つ選択してラベル変換する毎に所望ラベルが所望値となっている正例の数を計数し、所定個数に達していなければ次の順番の類似ラベルを選択してラベル変換を行うようにしてもよい。
「第2の実施の形態」
図7を参照すると、本発明の第2の実施の形態にかかる能動学習システムは、制御部150がデータ重み付け部701を備えている点で、図1に示した第1の実施の形態と相違する。
データ重み付け部701は、データラベル変換部153によって学習データ記憶部131の学習データに対するラベル変換が実施された場合、および能動学習部140のデータ更新部144によって学習データ記憶部131へ新たな学習データが追加された場合、学習データ記憶部131の各学習データに対し、真の正例を仮の正例より重要視した学習を行うための重み付けを設定する。
図8を参照すると、学習データ記憶部131に記憶される各学習データは、識別子201、複数の記述子202、複数のラベル203および復元情報204に加えて、学習の重み801を有する。重み801は、例えば0から1までの値をとり、1に近いほど(値が大きいほど)重要度が高いことを示す。
図9を参照すると、本実施の形態にかかる能動学習システムの動作フローは、図4に示した第1の実施の形態と比較して、学習データの重みを設定するステップS901が設けられている点が相違する。
以下、本実施の形態の動作を説明する。
スタートからステップS404までの動作は第1の実施の形態と同じである。データラベル変換部153によるラベル変換が行われると、データ重み付け部701に処理が移る。データ重み付け部701は、学習データ記憶部131から各学習データの復元情報204を調べてラベル変換の有無を判定し、ラベル変換ありの学習データの正例については重み値に小さな値を設定し、ラベル変換なしの学習データについては重み値に大きな値を設定する(ステップS901)。その後、能動学習部140に処理が移る。
学習部141以降の処理においては、学習の重み801の値により重要度に差を付けて学習を進める。つまり、重み801の大きな学習データは、それより重みの小さな学習データより重要視して学習を進める。具体例には、バギング法では、学習データの集合からサンプリングしたデータを複数の学習アルゴリズム(学習機械)に与えることで複数のルールを生成するため、学習データに付加された重み801に従って重み付けを行いながら、学習データの集合内のデータをサンプリングする。なお、学習データに付加された重みに応じて学習の重要度を変える方法は上述した例に限定されず、その他各種の方法を採用することが可能である。
能動学習部140で能動学習の1サイクルが終了すると、データ重み付け部701に再び処理が移る。データ重み付け部701は、学習データ記憶部131に新たに追加された学習データについては、真の正例あるいは負例に応じた学習の重み801を設定する。
その他の動作は第1の実施の形態と同じである。
本実施の形態によれば、学習の当初から最後まで、真の正例を仮の正例より重要視した学習が可能である。従って、学習の当初に僅かではあるが真の正例が存在するような場合、ラベル変換によって生成された仮の正例よりも真の正例を重要視した学習が初回から実施されることになる。
次に第2の実施の形態の変形例について説明する。
前述した例では、第1の実施の形態と同様に、類似情報取得部152は、所望ラベルに類似する他のラベルを1つだけ受け付けたが、第1の実施の形態の変形例と同様に、類似する2以上の他のラベルを含む類似情報を受け付け、データラベル変換部153は、個々の学習データにおいて、類似する2以上の他のラベルの値のうち所望値をとる値を所望ラベルの値に設定するようにしても良い。また、複数の類似するラベルを指定する場合、所望ラベルとの類似度の程度に応じた使用順を類似情報で指定し、データラベル変換部153は、使用順の早い(類似度の高い)ものを1つ選択してラベル変換する毎に所望ラベルが所望値となっている正例の数を計数し、所定個数に達していなければ次の順番の類似ラベルを選択してラベル変換を行うようにしてもよい。
さらに、データ重み付け部701は、類似度に応じて仮の正例間に学習の重み801の差を付けるようにしても良い。例えば、図8において、ラベル1を所望ラベル、ラベル2とラベルmをラベル1に類似するラベル、ラベル1とラベル2の類似度を0.8、ラベル1とラベルmの類似度を0.4とする場合、ラベル1をラベルmの値で置き換えた場合の重み801を、ラベル1をラベル2の値で置き換えた場合の重み801の例えば半分にする。こうすれば、学習の当初から最後まで、真の正例を仮の正例より重要視し、かつ仮の正例間ではより類似度の高いものを重要視した学習が可能である。
「第3の実施の形態」
図10を参照すると、本発明の第3の実施の形態にかかる能動学習システムは、制御部150が仮設定一括解除部1001を有する点で、図1に示した第1の実施の形態と相違する。
仮設定一括解除部1001は、能動学習部140による能動学習の1サイクル終了毎に、予め定められた仮設定一括解除条件が成立しているかどうかを判定し、仮設定一括解除条件が成立していた場合、学習データ記憶部131に記憶されている全ての仮の正例をデータラベル変換部153によるラベル変換前の状態に戻す処理を行う。
図11を参照すると、本実施の形態にかかる能動学習システムの動作フローは、図4に示した第1の実施の形態と比較して、ステップS1101〜S1103が追加されている点が相違する。
以下、本実施の形態の動作を説明する。
能動学習部140で最初の1サイクルの能動学習が終了するまでの動作(ステップS401〜S408)は、第1の実施の形態と同じである。データ更新部144による学習データ記憶部131への新たな学習データの追加が行われ、処理が制御部150に戻されると、第1の実施の形態と同様に終了条件が成立したかどうか判定され(ステップS409)、成立していなければ仮設定一括解除部1001に処理が移る。
仮設定一括解除部1001は、仮設定一括解除済みでなければ(ステップS1101でNO)、仮設定一括解除条件が成立しているかどうかを判定する(ステップS1102)。仮設定一括解除条件は予めシステムに設定されている。例えば、学習データ記憶部131に存在する真の正例の数が予め設定された閾値以上になったことを、仮設定一括解除条件として設定しておくことができる。この場合、仮設定一括解除部1001は、学習データ記憶部131に記憶されたデータのうち、所望ラベルが所望値であり且つ復元情報がNULLであるデータの数を計数し、閾値と比較する。なお、データ更新部144によって学習データ記憶部131に追加された全データに占める正例の割合が所定値以上になったこと等、他の条件を仮設定一括解除条件とすることもできる。
仮設定一括解除部1001は、仮設定一括解除条件が成立している場合(ステップS1102でYES)、学習データ記憶部131に記憶されている各データの復元情報204を調べ、ラベル変換対象のラベル番号と元の値が記録されていれば、そのデータの当該ラベル番号のラベルの値を元の値で書き換えることで、データラベル変換前の状態に戻す(ステップS1103)。その後、能動学習部140の学習部141に処理が移り、次の能動学習サイクルが開始される。これにより、以降の能動学習サイクルにおいては、学習データ記憶部131に記憶された真の正例と負例を用いて学習が行われる。
その他の動作は第1の実施の形態と同じである。
次に、第1の実施の形態で用いたものと同様な具体例、つまり、創薬スクリーニングの場面において活性化合物を探索する例として、創薬の多くのターゲットとなっているGタンパク質共役型受容体(GPCR)のうち生体アミン受容体に作用するリガンド化合物、特に生体アミン受容体ファミリーの1つであるアドレナリンに作用するリガンド化合物を探索する場合を例に挙げて、本実施の形態の動作を説明する。能動学習部140で最初の1サイクルの能動学習が終了するまでの動作(ステップS401〜S408)は、第1の実施の形態の具体例と同じである。
データ更新部144による学習データ記憶部131への新たな学習データの追加が行われ、処理が制御部150に戻されると、第1の実施の形態と同様に終了条件が成立したかどうか判定され、成立していなければ仮設定一括解除部1001に処理が移る。この時点で学習データ記憶部131には、図12に示されるように識別子x+1からx+aまでのa個の真の正例および負例が追加されているものとする。
仮設定一括解除部1001は、学習データ記憶部131に存在する真の正例の数を調べて閾値と比較し、仮設定一括解除条件の成立性を判定する。そして、仮設定一括解除条件が成立している場合、学習データ記憶部131に記憶されている仮の正例をラベル変換前の状態に戻す。図12中、識別子1と識別子3のデータは仮の正例であり、それらはラベル1の値が元の値に戻される。この結果、学習データ記憶部131の内容は図13に示すようになり、仮の正例は全て負例になり、学習データは真の正例と負例だけになる。このため以降の能動学習サイクルにおいては、学習データ記憶部131に記憶される化合物データのうち、上記のアッセイ実験でアドレナリンに対して活性があることが判明した化合物データのみが正例として、その他の化合物データは全て負例として用いられ、上述と同様の学習が繰り返される。
このように標的タンパク質のリガンド情報がない、あるいは少ない場合に、類縁タンパク質の情報を活用して所望のリガンド化合物を効率良く見つけることが可能となり、かつ、仮設定一括解除条件が成立した後は、見つけたリガンド化合物のみを正例として学習を続けることができる。
次に本実施の形態の効果を説明する。
本実施の形態によれば、学習開始時点の初期の状態において学習データの集合中に正例が全く存在しないか、ごく僅かしか存在しない場合でも、意味のある学習が行えるという第1の実施の形態と同様の効果が得られると共に、能動学習サイクルが繰り返されて真の正例が獲得され、仮設定一括解除条件が成立すると、正例に関し、データラベルの一括逆変換処理によって仮の正例を使用した学習から真の正例のみを使用した学習に移行することができる。このため、仮の正例を使用し続ける場合に比べて、精度の良い学習が可能となる。
次に第3の実施の形態の変形例について説明する。
前述した例では、仮設定一括解除部1001は、学習データ記憶部131に記憶されている仮の正例のラベルを元のラベルに変換することによって、仮の正例による学習への影響をなくしたが、第2の実施の形態で説明した学習の重みを利用して、仮の正例による学習への影響をなくすこともできる。すなわち、仮の正例の学習の重みを0に設定する。但し、この変形例によれば、仮の正例を真の負例にすることはできない。つまり、データの重みが0(ゼロ)であることは、データが存在しないことを意味し、真の負例を意味しない。
「第4の実施の形態」
図14を参照すると、本発明の第4の実施の形態にかかる能動学習システムは、制御部150が仮設定一括解除部1001の代わりに仮設定漸次解除部1401を有する点で、図10に示した第3の実施の形態と相違する。
仮設定漸次解除部1401は、能動学習部140による能動学習の1サイクル終了毎に、予め定められた仮設定漸次解除条件が成立しているかどうかを判定し、仮設定漸次解除条件が成立していた場合、学習データ記憶部131に記憶されている一部の仮の正例をデータラベル変換部153によるラベル変換前の状態に戻す処理を行う。
図15を参照すると、本実施の形態にかかる能動学習システムの動作フローは、図11に示した第3の実施の形態と比較して、ステップS1501〜S1503の処理が相違する。
以下、本実施の形態の動作を説明する。
能動学習部140で最初の1サイクルの能動学習が終了するまでの動作(ステップS401〜S408)は、第3の実施の形態と同じである。データ更新部144による学習データ記憶部131への新たな学習データの追加が行われ、処理が制御部150に戻されると、第3の実施の形態と同様に終了条件が成立したかどうか判定され(ステップS409)、成立していなければ仮設定漸次解除部1401に処理が移る。
仮設定漸次解除部1401は、学習データ記憶部131の仮の正例の全てをラベル変換前の状態に戻していなければ(ステップS1501でNO)、仮設定漸次解除条件が成立しているかどうかを判定する(ステップS1502)。仮設定漸次解除条件は予めシステムに設定されている。例えば、学習データ記憶部131に存在する真の正例の数が、下記の式(1)で与えられる閾値以上になったことを、仮設定漸次解除条件として設定しておくことができる。ただし、αは予め定められた正の正数である。
閾値=α×現在まで実行された能動学習サイクル数 …(1)
この例の仮設定漸次解除条件の場合、仮設定漸次解除部1401は、学習データ記憶部131に記憶されたデータのうち、所望ラベルが所望値であり且つ復元情報がNULLであるデータの数を計数し、前記式(1)で計算した閾値と比較する。なお、仮設定漸次解除条件は上記の例に限定されるものではない。
仮設定漸次解除部1401は、仮設定漸次解除条件が成立している場合(ステップS1502でYES)、学習データ記憶部131に記憶されている各データの復元情報204を調べ、復元情報204がNULLでないデータのうち、予め定められた数のデータについて、そのデータの所望ラベルの値を元の値で書き換えることで、データラベル変換前の状態に戻す(ステップS1503)。その後、能動学習部140の学習部141に処理が移り、次の能動学習サイクルが開始される。そして、能動学習サイクルが終了すると、再び上述した仮設定漸次解除部1401による判定と処理が実施される。これにより、能動学習サイクルが進んで真の正例の数が次第に増えるに従って、学習データ記憶部131に記憶された仮の正例の数が次第に減少し、最後には真の正例と負例を用いて学習が行われる。
その他の動作は第3の実施の形態と同じである。
次に本実施の形態の効果を説明する。
本実施の形態によれば、学習開始時点の初期の状態において学習データの集合中に正例が全く存在しないか、ごく僅かしか存在しない場合でも、意味のある学習が行えるという第1の実施の形態と同様の効果が得られると共に、能動学習サイクルが繰り返されて真の正例が次第に獲得されるに従って、仮の正例の数が次第に減らされるため、正例に関し、仮の正例を使用した学習から真の正例のみを使用した学習に徐々に移行することができる。
次に第4の実施の形態の変形例について説明する。
前述した例では、仮設定漸次解除部1401は、学習データ記憶部131に記憶されている一部の仮の正例のラベルを元のラベルに変換することによって、仮の正例による学習への影響を徐々になくしたが、第2の実施の形態で説明した学習の重みを利用して、仮の正例による学習への影響を徐々になくすこともできる。すなわち、仮設定漸次解除条件が成立する毎に、一部の仮の正例の学習の重みを0に設定するか、全ての仮の正例の学習の重みを所定値だけ小さくする。但し、この変形例によれば、仮の正例を真の負例にすることはできないので、全ての仮の正例の学習の重みが0になった時点で、全ての仮の正例のラベルをラベル変換前の状態に戻すのが望ましい。また、この変形例と第4の実施の形態とを組み合わせ、仮設定漸次解除条件が成立する毎に、一部の仮の正例のラベルをラベル変換前の状態に戻すと同時に、残りの仮の正例の学習の重みを所定値だけ下げるような変形例も考えられる。
「第5の実施の形態」
図16を参照すると、本発明の第5の実施の形態にかかる能動学習システムは、仮の正例の所望ラベルの値が未知である点と、制御部150が仮設定一括解除部1001の代わりに仮設定一括解除部1601を有する点で、図10に示した第3の実施の形態と相違する。
図17を参照すると、学習データ記憶部131には図5と同様な化合物データがy個記憶されている。各学習データは、識別子によって一意に識別され、また記述子1〜nによって構造が特定される。ラベル1〜mは当該化合物の活性を示し、ここでは、ラベル1がアドレナリンに対する活性の有無を示し、ラベル2がヒスタミンに対する活性の有無を示す。何れの場合も、活性有りの場合は数値1、活性無しの場合は数値0に設定され、未知の場合はNULLに設定される(図17では「?」で表示)。本例の場合、学習データ記憶部131には、生体アミン受容体のファミリーの1つであるヒスタミンに対して活性を持つ或いは持たない化合物が登録されているが、それらの化合物が、同じファミリーに属するアドレナリンに対して活性を持つか、持たないかは未知である場合を想定している。また、候補データ記憶部133には、アドレナリンに対する活性の有無が不明な多数の化合物データが候補データとして記憶されている。
仮設定一括解除部1601は、能動学習部140による能動学習の1サイクル終了毎に、予め定められた仮設定一括解除条件が成立しているかどうかを判定し、仮設定一括解除条件が成立していた場合、学習データ記憶部131に記憶されている全ての仮の正例をデータラベル変換部153によるラベル変換前の状態に戻す処理を行う。この処理は第3の実施の形態における仮設定一括解除部1001の処理と同じであるが、さらに仮設定一括解除部1601は、ラベル変換前の状態に戻した学習データの所望ラベルの値を調べ、NULLであれば、その学習データを候補データ記憶部133に追加し、学習データ記憶部131から削除する。NULLでなければ、そのまま学習データ記憶部131に残し、正例または負例として学習に使用する。
図18を参照すると、本実施の形態にかかる能動学習システムの動作フローは、図11に示した第3の実施の形態と比較して、ステップS1801が追加されている点が相違する。
以下、本実施の形態の動作を説明する。
能動学習部140で最初の1サイクルの能動学習が終了するまでの動作(ステップS401〜S408)は、第3の実施の形態と同じである。ただし、本実施の形態の場合、学習データの所望ラベルの値は未知であるため、データラベル変換部153は、類似ラベルの値が所望値であるか否かにかかわらず、所望ラベルの値に設定することで、仮の正例だけでなく、仮の負例も生成する。例えば、図17において、所望ラベルであるラベル1に類似するラベルをラベル2とすると、識別子1の学習データのラベル1には1が設定されて仮の正例となり、識別子2の学習データのラベル1には0が設定されて仮の負例となる。その後、データ更新部144による学習データ記憶部131への新たな学習データの追加が行われ、処理が制御部150に戻されると、第3の実施の形態と同様に終了条件が成立したかどうか判定され、成立していなければ仮設定一括解除部1601に処理が移る。この時点の学習データ記憶部131の内容例を図19に示す。図12と同様にa個の新たな学習データが追加されている。
仮設定一括解除部1601は、仮設定一括解除済みでなければ(ステップS1101でNO)、仮設定一括解除条件が成立しているかどうかを判定し(ステップS1102)、仮設定一括解除条件が成立している場合(ステップS1102でYES)、学習データ記憶部131に記憶されている各データの復元情報204を調べ、ラベル変換対象のラベル番号と元の値が記録されていれば、そのデータの当該ラベル番号のラベルの値を記録されている元の値で書き換えることで、データラベル変換前の状態に戻す(ステップS1103)。そして、データラベル変換前の状態に戻したデータの所望ラベルが未知であれば、そのデータを学習データ記憶部131から候補データ記憶部133へ移動させる(ステップS1801)。従って、図19の場合、識別子1、2、3、xのデータが候補データ記憶部133に移される。その後、能動学習部140の学習部141に処理が移り、次の能動学習サイクルが開始される。これにより、以降の能動学習サイクルにおいては、学習データ記憶部131に記憶された真の正例と負例を用いて学習が行われる。また、学習データ記憶部131から候補データ記憶部133に移されたデータが、次に学習すべきデータの候補データとして扱われる。
その他の動作は第3の実施の形態と同じである。
本実施の形態によれば、学習開始時点の初期の状態において学習データの集合中に正例が全く存在しないか、ごく僅かしか存在しない場合でも、意味のある学習が行え、また、能動学習サイクルが繰り返されて真の正例が獲得され、仮設定一括解除条件が成立すると、正例に関し、データラベルの一括逆変換処理によって仮の正例を使用した学習から真の正例のみを使用した学習に移行することができるという第3の実施の形態と同様の効果が得られると共に、所望ラベルの値が未知であった仮の正例を候補データとして扱うことが可能となり、候補データ数を増やすことができる。
「第6の実施の形態」
図20を参照すると、本発明の第6の実施の形態にかかる能動学習システムは、仮の正例の所望ラベルの値が未知である点と、制御部150が仮設定漸次解除部1401の代わりに仮設定漸次解除部2001を有する点で、図14に示した第4の実施の形態と相違する。
仮設定漸次解除部2001は、能動学習部140による能動学習の1サイクル終了毎に、予め定められた仮設定漸次解除条件が成立しているかどうかを判定し、仮設定漸次解除条件が成立していた場合、学習データ記憶部131に記憶されている一部の仮の正例をデータラベル変換部153によるラベル変換前の状態に戻す処理を行う。この処理は第4の実施の形態における仮設定漸次解除部1401の処理と同じであるが、さらに仮設定漸次解除部2001は、ラベル変換前の状態に戻した学習データの所望ラベルの値を調べ、未知(NULL)であれば、その学習データを候補データ記憶部133に追加し、学習データ記憶部131から削除する。NULLでなければ、そのまま学習データ記憶部131に残し、正例または負例として学習に使用する。本実施の形態の動作は、この仮設定漸次解除部2001の動作を除き、第4の実施の形態と同じである。
本実施の形態によれば、学習開始時点の初期の状態において学習データの集合中に正例が全く存在しないか、ごく僅かしか存在しない場合でも、意味のある学習が行え、また能動学習サイクルが繰り返されて真の正例が次第に獲得されるに従って、仮の正例の数が次第に減らされるため、正例に関し、仮の正例を使用した学習から真の正例のみを使用した学習に徐々に移行することができるという第4の実施の形態と同様の効果が得られると共に、所望ラベルの値が未知であった仮の正例を候補データとして扱うことが可能となり、候補データ数を増やすことができる。
「第7の実施の形態」
図21を参照すると、本発明の第7の実施の形態は、処理装置120とは独立した別の処理装置2101とそれに接続された入出力装置2102とを備えている点で、第1ないし第6の実施の形態と相違する。
処理装置2101は、図1の学習設定取得部151、類似情報取得部152およびデータラベル変換部153の機能を備えており、キーボードやLCD等で構成された入出力装置2102からの指示に従って、ラベル変換処理済みの学習データ、すなわち、複数の記述子と複数のラベルとで構成されるデータの所望ラベルの値を該所望ラベルが示す事象と類似する事象の状態を示す他のラベルの値で書き換えたデータを学習データとして生成し、処理装置間の通信路を通じて処理装置120に送信する。処理装置120は、第1ないし第6の実施の形態と同様の構成を有するが、処理装置2101から前記学習データを受信すると、それを記憶装置130の学習データ記憶部131に記憶し、学習設定取得部151、類似情報取得部152およびデータラベル変換部153による処理は省略する。
本実施の形態によれば、複数の記述子と複数のラベルとで構成されるデータの所望ラベルの値を該所望ラベルが示す事象と類似する事象の状態を示す他のラベルの値で書き換えたデータを学習データとして生成する処理が外部の処理装置で行われるため、能動学習部140を有する処理装置120の負荷を軽減することができる。
なお、上記の動作説明では、処理装置2101で生成した学習データを通信路を通じて処理装置へ伝達したが、処理装置2101から可搬型の記憶装置に学習データを書き込み、この記憶装置を処理装置120の設置場所まで運搬し、処理装置120にセットして記憶装置130に読み込ませるか、この記憶装置そのものを学習データ記憶部131として使用するようにしてもよい。
「本発明のその他の実施の形態」
以上本発明の実施の形態について説明したが、本発明は以上の例に限定されずその他各種の付加変更が可能である。また、本発明の能動学習システムは、その有する機能をハードウェア的に実現することは勿論、コンピュータと能動学習プログラムとで実現することができる。能動学習プログラムは、磁気ディスクや半導体メモリ等のコンピュータ可読記録媒体に記録されて提供され、コンピュータの立ち上げ時などにコンピュータに読み取られ、そのコンピュータの動作を制御することにより、そのコンピュータを前述した各実施の形態における制御部および能動学習部内の各機能手段として機能させる。
本発明の能動学習システムおよび方法は、例えば、創薬スクリーニングの場面において活性化合物を探索するなどのように、多数の候補データからユーザが所望するデータを選択するようなデータマイニングの用途に適用できる。
本発明の第1の実施の形態にかかる能動学習システムのブロック図である。 本発明で扱う学習データのフォーマット例を示す図である。 ルール記憶部の内容例を示す図である。 本発明の第1の実施の形態にかかる能動学習システムの処理例を示すフローチャートである。 学習データ記憶部の内容例を示す図である。 ラベル変換処理後の学習データ記憶部の内容例を示す図である。 本発明の第2の実施の形態にかかる能動学習システムのブロック図である。 本発明で扱う学習データの別のフォーマット例を示す図である。 本発明の第2の実施の形態にかかる能動学習システムの処理例を示すフローチャートである。 本発明の第3の実施の形態にかかる能動学習システムのブロック図である。 本発明の第3の実施の形態にかかる能動学習システムの処理例を示すフローチャートである。 学習がある程度進んだ時点の学習データ記憶部の内容例を示す図である。 仮設定一括解除処理後の学習データ記憶部の内容例を示す図である。 本発明の第4の実施の形態にかかる能動学習システムのブロック図である。 本発明の第4の実施の形態にかかる能動学習システムの処理例を示すフローチャートである。 本発明の第5の実施の形態にかかる能動学習システムのブロック図である。 学習データ記憶部の別の内容例を示す図である。 本発明の第5の実施の形態にかかる能動学習システムの処理例を示すフローチャートである。 仮設定一括解除処理後の学習データ記憶部の別の内容例を示す図である。 本発明の第6の実施の形態にかかる能動学習システムのブロック図である。 本発明の第7の実施の形態にかかる能動学習システムのブロック図である。
符号の説明
110…入出力装置
120…処理装置
130…記憶装置
131…学習データ記憶部
132…ルール記憶部
133…候補データ記憶部
134…選択データ記憶部
140…能動学習部
141…学習部
142…予測部
143…候補データ選択部
144…データ更新部
150…制御部
151…学習設定取得部
152…類似情報取得部
153…データラベル変換部

Claims (15)

  1. 所望ラベルと類似関係にある他のラベルの情報を示す類似情報に従って、複数の記述子と複数のラベルとで構成されるデータの所望ラベルの値を該所望ラベルが示す事象と類似する事象の状態を示す他のラベルの値で書き換えたデータを学習データとして前記学習データの集合を学習データ記憶部上に生成する制御部と、
    前記所望ラベルが未知のデータを候補データとして前記候補データの集合を記憶する候補データ記憶部と、
    前記所望ラベルが所望値のデータを正例、それ以外のデータを負例とするとき、前記学習データ記憶部に記憶された正例と負例のデータを使って、任意のデータの記述子の入力に対してそのデータの正例らしさを計算するルールを学習する学習部、学習したルールを前記候補データ記憶部に記憶された候補データの集合に適用して各候補データの正例らしさを予測する予測部、予測結果に基づいて次に学習すべきデータを選択する候補データ選択部、および、選択したデータを出力装置から出力し、該出力したデータのうち前記所望ラベルの実際の値が入力装置から入力されたデータについては候補データの集合から取り除いて学習データの集合に追加するデータ更新部を含み、前記制御部により能動学習サイクルの繰り返しが制御される能動学習部とを備えることを特徴とする能動学習システム。
  2. 前記制御部は、前記入力装置から入力された前記所望ラベルの情報に基づいて前記学習データ記憶部に予め記憶された学習データの集合に含まれる正例の数を調べる学習設定取得部と、調べられた正例の数が閾値より少ない場合に前記所望ラベルと類似する他のラベルに関する類似情報を前記入力装置から入力する類似情報取得部と、前記学習データ記憶部に記憶された学習データの前記所望ラベルの値を前記類似情報が示す他のラベルの値で書き換えるデータラベル変換部とを含むことを特徴とする請求項1記載の能動学習システム。
  3. 前記制御部は、前記所望ラベルの値が他のラベルの値で書き換え済みの学習データを外部装置から受信して前記学習データ記憶部に保存するものであることを特徴とする請求項1記載の能動学習システム。
  4. 前記制御部は、他のラベルの値で書き換えられた結果前記所望ラベルが所望値になっている仮の正例よりも、前記所望ラベルが実際に所望値である真の正例を重要視した学習が前記能動学習部で行われるための重みを前記学習データに設定するデータ重み付け部を有することを特徴とする請求項1、2または3記載の能動学習システム。
  5. 前記制御部は、前記能動学習部による能動学習中に、予め定められた仮設定一括解除条件が成立したかどうかを判定し、前記仮設定一括解除条件が成立した場合、前記学習データ記憶部に記憶されている学習データのうち、前記所望ラベルの値が他のラベルの値で書き換えられている全ての学習データを書き換え前の状態に戻す仮設定一括解除部を有することを特徴とする請求項1、2または3記載の能動学習システム。
  6. 前記仮設定一括解除部は、書き換え前の状態に戻した学習データの前記所望ラベルが未知の場合、該学習データを前記学習データ記憶部から前記候補データ記憶部へ移動させるものであることを特徴とする請求項5記載の能動学習システム。
  7. 前記制御部は、前記能動学習部による能動学習の1サイクル終了毎に、予め定められた仮設定漸次解除条件が成立したかどうかを判定し、前記仮設定漸次解除条件が成立した場合、前記学習データ記憶部に記憶されている学習データのうち、前記所望ラベルの値が他のラベルの値で書き換えられている一部の学習データを書き換え前の状態に戻す仮設定漸次解除部を有することを特徴とする請求項1、2または3記載の能動学習システム。
  8. 前記仮設定漸次解除部は、書き換え前の状態に戻した学習データの前記所望ラベルが未知の場合、該学習データを前記学習データ記憶部から前記候補データ記憶部へ移動させるものであることを特徴とする請求項記載の能動学習システム。
  9. 前記制御部は、前記能動学習部による能動学習の1サイクル終了毎に、予め定められた仮設定漸次解除条件が成立したかどうかを判定し、前記仮設定漸次解除条件が成立した場合、前記学習データ記憶部に記憶されている学習データのうち、前記所望ラベルの値が他のラベルの値で書き換えられている一部の学習データの学習の重みを0に設定するか、または前記所望ラベルの値が他のラベルの値で書き換えられている全ての学習データの学習の重みを所定値だけ小さくする仮設定漸次解除部を有することを特徴とする請求項1、2または3記載の能動学習システム。
  10. a)制御部が、所望ラベルと類似関係にある他のラベルの情報を示す類似情報に従って、複数の記述子と複数のラベルとで構成されるデータの所望ラベルの値を該所望ラベルが示す事象と類似する事象の状態を示す他のラベルの値で書き換えたデータを学習データとして前記学習データの集合を学習データ記憶部上に生成するステップ、
    b)能動学習部が、前記所望ラベルが所望値のデータを正例、それ以外のデータを負例とするとき、前記学習データ記憶部に記憶された正例と負例のデータを使って、任意のデータの記述子の入力に対してそのデータの正例らしさを計算するルールを学習するステップ、
    c)前記能動学習部が、前記所望ラベルが未知のデータを候補データとして前記候補データの集合を記憶する候補データ記憶部に記憶された前記候補データの集合に対して、前記学習したルールを適用して各候補データの正例らしさを予測するステップ、
    d)前記能動学習部が、予測結果に基づいて次に学習すべきデータを選択するステップ、
    e)前記能動学習部が、選択したデータを出力装置から出力し、該出力したデータのうち前記所望ラベルの実際の値が入力装置から入力されたデータについては候補データの集合から取り除いて学習データの集合に追加するステップ、
    f)前記制御部が終了条件の成否に基づき前記能動学習部による能動学習サイクルの繰り返しを制御するステップ、
    を含むことを特徴とする能動学習方法。
  11. 前記ステップaにおいて、前記制御部は、前記入力装置から入力された前記所望ラベルの情報に基づいて前記学習データ記憶部に予め記憶された学習データの集合に含まれる正例の数を調べ、調べられた正例の数が閾値より少ない場合に前記所望ラベルと類似する他のラベルに関する類似情報を前記入力装置から入力し、前記学習データ記憶部に記憶された学習データの前記所望ラベルの値を前記類似情報が示す他のラベルの値で書き換えることを特徴とする請求項10記載の能動学習方法。
  12. 前記ステップaにおいて、前記制御部は、前記所望ラベルの値が他のラベルの値で書き換え済みの学習データを外部装置から受信して前記学習データ記憶部に保存することを特徴とする請求項10記載の能動学習方法。
  13. 記憶装置と入力装置と出力装置とを備えたコンピュータを、所望ラベルと類似関係にある他のラベルの情報を示す類似情報に従って、複数の記述子と複数のラベルとで構成されるデータの所望ラベルの値を該所望ラベルが示す事象と類似する事象の状態を示す他のラベルの値で書き換えたデータを学習データとして前記学習データの集合を前記記憶装置上に生成する制御手段、前記所望ラベルが所望値のデータを正例、それ以外のデータを負例とするとき、前記記憶装置に記憶された学習データの正例と負例のデータを使って、任意のデータの記述子の入力に対してそのデータの正例らしさを計算するルールを学習し、学習したルールを前記記憶装置に予め記憶された前記所望ラベルが未知の候補データの集合に適用して各候補データの正例らしさを予測し、予測結果に基づいて次に学習すべきデータを選択し、選択したデータを前記出力装置から出力し、該出力したデータのうち前記所望ラベルの実際の値が前記入力装置から入力されたデータについては候補データの集合から取り除いて学習データの集合に追加する、能動学習サイクルを終了条件が成立するまで繰り返す能動学習手段、として機能させるためのプログラム。
  14. 前記制御手段は、前記入力装置から入力された前記所望ラベルの情報に基づいて前記学習データ記憶部に予め記憶された学習データの集合に含まれる正例の数を調べる学習設定取得手段と、調べられた正例の数が閾値より少ない場合に前記所望ラベルと類似する他のラベルに関する類似情報を前記入力装置から入力する類似情報取得手段と、前記学習データ記憶部に記憶された学習データの前記所望ラベルの値を前記類似情報が示す他のラベルの値で書き換えるデータラベル変換手段とを含むことを特徴とする請求項13記載のプログラム。
  15. 前記制御手段は、前記所望ラベルの値が他のラベルの値で書き換え済みの学習データを外部装置から受信して前記学習データ記憶部に保存するものであることを特徴とする請求項13記載のプログラム。
JP2005130952A 2005-04-28 2005-04-28 能動学習方法および能動学習システム Active JP4645288B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2005130952A JP4645288B2 (ja) 2005-04-28 2005-04-28 能動学習方法および能動学習システム
US11/412,088 US20070011127A1 (en) 2005-04-28 2006-04-27 Active learning method and active learning system
EP06252296A EP1717737A1 (en) 2005-04-28 2006-04-28 Active learning method and active learning system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005130952A JP4645288B2 (ja) 2005-04-28 2005-04-28 能動学習方法および能動学習システム

Publications (2)

Publication Number Publication Date
JP2006309485A JP2006309485A (ja) 2006-11-09
JP4645288B2 true JP4645288B2 (ja) 2011-03-09

Family

ID=36741396

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005130952A Active JP4645288B2 (ja) 2005-04-28 2005-04-28 能動学習方法および能動学習システム

Country Status (3)

Country Link
US (1) US20070011127A1 (ja)
EP (1) EP1717737A1 (ja)
JP (1) JP4645288B2 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5044980B2 (ja) * 2006-05-10 2012-10-10 日本電気株式会社 実験計画方法、実験計画システムおよび、実験計画プログラム
JP5169831B2 (ja) * 2006-10-19 2013-03-27 日本電気株式会社 能動学習システム、方法およびプログラム
US20100005043A1 (en) * 2006-12-11 2010-01-07 Yoshiko Yamashita Active learning system, active learning method and program for active learning
US8086549B2 (en) * 2007-11-09 2011-12-27 Microsoft Corporation Multi-label active learning
JP5212007B2 (ja) * 2008-10-10 2013-06-19 株式会社リコー 画像分類学習装置、画像分類学習方法、および画像分類学習システム
JP5378909B2 (ja) * 2009-08-12 2013-12-25 Kddi株式会社 サポートベクトルマシンの再学習方法
US9967218B2 (en) * 2011-10-26 2018-05-08 Oath Inc. Online active learning in user-generated content streams
EP2872154B1 (en) * 2012-07-11 2017-05-31 Sangamo BioSciences, Inc. Methods and compositions for delivery of biologics
JP6679266B2 (ja) * 2015-10-15 2020-04-15 キヤノン株式会社 データ解析装置、データ解析方法及びプログラム
JP6602243B2 (ja) * 2016-03-16 2019-11-06 株式会社東芝 学習装置、方法、及びプログラム
KR102348536B1 (ko) * 2017-10-30 2022-01-06 삼성에스디에스 주식회사 기계 학습 기반의 이상 행위 탐지 방법 및 그 장치
WO2020026643A1 (ja) * 2018-08-03 2020-02-06 ソニー株式会社 情報処理装置、情報処理方法及び情報処理プログラム
JP2020046883A (ja) 2018-09-18 2020-03-26 株式会社東芝 分類装置、分類方法およびプログラム
JP7200571B2 (ja) * 2018-09-26 2023-01-10 富士通株式会社 機械学習方法、機械学習装置および機械学習プログラム
JP7063393B2 (ja) * 2018-10-05 2022-05-09 日本電気株式会社 教師データ拡張装置、教師データ拡張方法およびプログラム
JP7120914B2 (ja) * 2018-12-25 2022-08-17 株式会社日立製作所 生産実績データ分析装置
US11551437B2 (en) 2019-05-29 2023-01-10 International Business Machines Corporation Collaborative information extraction
CN115398452A (zh) * 2020-04-20 2022-11-25 富士通株式会社 调整程序、调整方法以及信息处理装置
JP7190479B2 (ja) 2020-12-28 2022-12-15 楽天グループ株式会社 学習装置、機械学習モデル及び学習方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001229026A (ja) * 1999-12-09 2001-08-24 Nec Corp 知識発見方式
JP2005107743A (ja) * 2003-09-29 2005-04-21 Nec Corp 学習システム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3149157B2 (ja) * 1996-03-04 2001-03-26 株式会社日立情報システムズ 事例ベースの処理方法
JPH11316754A (ja) * 1998-05-06 1999-11-16 Nec Corp 実験計画法及び実験計画プログラムを記録した記録媒体
JP4034602B2 (ja) * 2002-06-17 2008-01-16 富士通株式会社 データ分類装置、データ分類装置の能動学習方法及び能動学習プログラム
WO2005048184A1 (ja) * 2003-11-17 2005-05-26 Nec Corporation 能動学習方法およびシステム
US7587064B2 (en) * 2004-02-03 2009-09-08 Hrl Laboratories, Llc Active learning system for object fingerprinting

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001229026A (ja) * 1999-12-09 2001-08-24 Nec Corp 知識発見方式
JP2005107743A (ja) * 2003-09-29 2005-04-21 Nec Corp 学習システム

Also Published As

Publication number Publication date
US20070011127A1 (en) 2007-01-11
EP1717737A1 (en) 2006-11-02
JP2006309485A (ja) 2006-11-09

Similar Documents

Publication Publication Date Title
JP4645288B2 (ja) 能動学習方法および能動学習システム
CN105745647B (zh) 调用路径查找器
US10936950B1 (en) Processing sequential interaction data
JP5169831B2 (ja) 能動学習システム、方法およびプログラム
US8707259B2 (en) Framework for open dynamic reflective applications
US8275730B2 (en) Information processing apparatus, information processing method, and computer program product for reducing states in a deterministic finite state automaton
JP5423596B2 (ja) 情報処理装置および情報処理方法
US20200380409A1 (en) Apparatus and method for analyzing time-series data based on machine learning
EP3745317A1 (en) Apparatus and method for analyzing time series data based on machine learning
KR20140101786A (ko) 룰―기반 컨텍스트 획득 방법
JP5187635B2 (ja) 能動学習システム、能動学習方法、及び能動学習用プログラム
US20210248492A1 (en) Learning and Using Property Signatures for Computer Programs
WO2020247731A1 (en) Systems and methods for neighbor frequency aggregation of parametric probability distributions with decision trees
EP3916530A1 (en) Method of searching for object for executing automation scenario and apparatus for performing the method
Sagar et al. Sequence Retriever for known, discovered, and user-specified molecular fragments
US20230409956A1 (en) Machine learning prediction of additional steps of a computerized workflow
WO2021220776A1 (ja) 材料の特性値を推定するシステム
US20230316113A1 (en) Inference apparatus, inference method, and computer-readable recording medium
US20230237351A1 (en) Inference apparatus, inference method, and computer-readable recording medium
JP4752388B2 (ja) 文書管理システム、文書管理方法及び文書管理プログラム
Singh et al. Correlation-based feature subset selection technique for web spam classification
Newton et al. Evolving macro-actions for planning
CN116303998A (zh) 一种菜单数据获取方法及装置
JP2021177266A (ja) プログラム、情報処理装置、情報処理方法及び学習モデルの生成方法
Rattanakronkul et al. Predicting protein structural class from closed protein sequences

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061013

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090525

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20090525

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101109

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101122

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131217

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4645288

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150