WO2008047835A1

WO2008047835A1 - Système, procédé et programme d'étude active

Info

Publication number: WO2008047835A1
Application number: PCT/JP2007/070256
Authority: WO
Inventors: Yukiko Kuroiwa; Yoshiko Yamashita; Minoru Asogawa
Original assignee: Nec Corporation
Priority date: 2006-10-19
Filing date: 2007-10-17
Publication date: 2008-04-24
Also published as: JPWO2008047835A1; EP2083379B1; EP2083379A1; US20100023465A1; JP5169831B2; EP2083379A4

Description

明細書

能動学習システム、方法およびプログラム

技術分野

[0001] 本発明は機械学習技術に関し、特に能動学習システム、方法及びプログラムに関する。

背景技術

[0002] 能動学習とは、学習者 (コンピュータ）が学習データを能動的に選択できる、機械学習手法の一形態である。能動学習は、データ数や計算量の意味で学習の効率を向上できるため、例えば、創薬において、膨大な種類の化合物の中から特定のタンパク質に対し活性のある化合物を発見するスクリーニングなどに適した技術として注目されてレ、る（例えば文献 1参照）。

[0003] 能動学習システムで扱うデータは、記述子（属性）とラベルとで表現される。記述子はそのデータの構造などを特徴付けるものであり、ラベルはそのデータの或る事象に関する状態を示す。例えば、創薬におけるスクリーニングの場合、個々の化合物データは、特定の部分構造の有無や、特定の部分構造の個数、分子量などの各種物理化学定数などを記述した複数の記述子によって特定される。また、ラベルは、例えば特定のタンパク質に対する活性の有無や、活性の強さを示すために使用される。ラベルのとり得る値力活性あり、活性なしのように離散値の場合、ラベルをクラスと呼ぶ。他方、ラベルのとり得る値力活性の強さのように連続値の場合、ラベルを関数値と呼ぶ。ここで、ラベルの値が既知であるデータの集合を既知データ、ラベルの値が未知であるデータの集合を未知データと呼ぶことにする。

[0004] 能動学習システムで扱われる学習アルゴリズムは、既知データを用いて、 1つあるいは複数のルールを生成する。ルールは、任意のデータの記述子の入力に対して、データのラベル値を予測するもので、例えば、決定木、サポートベクタマシン（SVM) 、ニューラルネットワークなどである。予測された値は、学習で用いたラベル値そのものとは限らない。つまり、ラベル値が離散値であっても、予測値は離散値とは限らない。例えば、ラベルの値が 2値 {0, 1 }をとる場合であっても、学習アルゴリズムは、予測値が 0· 8などと予測できるためである。また、複数のルールを生成した場合、個々のルールでの予測値がラベル値である 2値 { 0, 1 }であったとしても、予測値は、値の平均をとるなどして統合された値となるからである。ここで、複数のルールを生成するには、例えば、集団学習という手法があり、バギングゃブースティングが知られている (例えば文献 3、文献 4参照）。

[0005] 従来の能動学習では、最初の学習は、ランダムに選ばれ、実験や調査によってラベルの実際の値が調べられた既知データを用いて行う。能動学習システムは、未知データの各データに対して、学習により生成されたルールを用いて予測値を計算し、その予測値に基づいて、未知データの中から効率的に学習できるようなデータを選択し、出力する。この選択方法に関しては、集団学習での予測値が割れたデータを選択する方法や、所望するラベル値に近い予測値のデータを選択する方法や、予測値に対する或る関数を用いて選択する方法など、幾つかの方法がある。例えば、文献 1、文献 2、特許文献 1参照)。

[0006] 上記出力されたデータについて、実験や調査などによってラベルの実際の値が調ベられ、その結果が能動学習システムにフィードバックされる。能動学習システムは、ラベルの実際の値が決まったデータを未知データの集合から取り除いて既知データに混ぜ、上述と同様の動作を再度繰り返す。つまり、既知データから再度選択したデータを用いてルールを学習し、そのルールを未知データに適用して予測し、予測結果に基づいてデータの選択と出力を行う。このような処理の繰り返しは、予め定められた終了条件が満たされるまで続けられる。

文献 1

[0007] ワームス (Warmuth)著「サポートベクタマシンフォアアクティブラーニングインザドフックアイスカノリープロセス (Support Vector Machines for Active Learning in the Drug Discovery Process)]、 2003年発 fiの論文誌「ジャーナノレォブケミカノレインフォメーシヨンサイエンス (Journal of Chemical InformationSciencesノ」、 4d巻 2号、 pp. 66 7 - 673

文献 2

[0008] 安倍直樹、馬見塚拓著「クエリーラーニングストラテジーズユージングブーステイングダノドノギング (Query Learning Strategies using Boosting and Bagging)」ゝ 1 998年発行の国際会議予稿集「プロシーディンダスォブザフィフィーンスインターナショナノレコンフエレンスオンマシンラーニング（Proceedings of The 15-th I nternational Conference on Machine Learning)」、 pp. 1― 9

文献 3

[0009] ブライマン (Breiman)著「バギングプレディクターズ (Bagging Predictors)]、 1996年発行の論文誌「マシンラーニング (Machine Learning)] , 24巻 2号、 pp . 123— 140 文献 4

[0010] フロインド (Freund)とシャピレ (Shapire)著「ァデイシジョンセォレティックジエネララィゼーシヨンォブオンラインラーニングアンドアンアプリケーショントゥーブースティノグ (A decision -thoretic generalization of on-line learning and an application to bo osting)」 1995年発行の国際会議予稿集「プロシーディンダスォブセカンドョ一口ピアンコンファランスオンコンピューテーショナノレラーニングセオリー (Proceedings of the secona European conference on computational learning theory)」、 pp . 2ό― 3 ί

[001 1] 従来の能動学習システムの問題点は、既知データ中に様々なラベル値のデータが存在していることが前提であり、或るラベル値 (所望ラベル値）のデータ（所望データ）が全く存在しないか、ごく僅力、しか存在しない場合、システムを起動させても所望ラベノ W直を効率的に学習できないことである。

[0012] その理由は、既知データ中に、所望データが全く存在しないか、ごく僅力、しか存在しない場合、学習アルゴリズムは、任意のデータに対して所望ラベル値以外の値と予測するルールを生成しがちになり、所望データに対しても所望ラベル値以外と予測され、ランダムに選択するのと実質的に何ら変わりがなくなるためである。例えば、ラベルの値が 2値 {A, Β }の場合、既知データ中に、ラベル Αのデータが全く存在しない場合には、常にラベル Bと予測するルールが生成され、その予測結果に基づいてデータを選択しても、選択されたデータはランダムに選択したデータと実質的に何ら変わりがない。また、ラベルの値が 3値 {A, B, C }で、 3つのラベルが独立の事象を示す時、既知データ中に、ラベル Aのデータが全く存在しないか、ごく僅かしか存在しない場合には、任意のデータに対して、ラベル Bまたは Cと予測するルールが生成されがちであり、ラベル Aを持つ所望データは、意味のあるルールで予測されず、ランダムに選択されるだけであり、ラベル Aは効率的に学習されないからである。ラベルの値が連続値の場合も、或る範囲のラベル値を所望ラベル値と考えれば、同様であり、所望ラベル値を効率的に学習できなレ、。

[0013] 従来の能動学習システムの第 2の問題点は、利用者がデータについて補助情報を持っていても、その補助情報を用いて、より効率的に学習することができないことであ

[0014] その理由は、従来の能動学習システムでは、学習にラベルが明らかになった既知データを用いており、既知データ以外の利用者の補助的な知識をシステムで用いることができないからである。利用者は、領域に対する背景知識や特許'文献などの補助知識を持っている場合がある。例えば、創薬におけるスクリーニングで、活性あり化合物と活性なし化合物とを学習する場合、文献などの補助情報から、活性がありそうな化合物が分かる力手元にその化合物が無いために実験で活性の有無を確かめられない場合、そのような活性のありそうな化合物は、既知データでもなく未知データでもないため、従来の能動学習システムでは极うことができない。そのため、活性のありそうな化合物の情報を用いて、より効率的に学習することができない。また、スクリーユングで、活性あり化合物と活性なし化合物とを学習する場合、活性なし化合物に分類されるが、それ以外の活性なし化合物に比べて僅かだが活性のある化合物があつた場合、そのような僅かな活性あり化合物は、従来の能動学習システムでは既知データの中の活性なし化合物に分類してしか用いることができない。そのため、僅かに活性があるという情報を用いて、より効率的に学習することができない。

発明の概要

[0015] 本発明の目的は、既知データ中に或るラベル値付近 (所望ラベル値）のデータ（所望データ）が全く存在しないか、ごく僅力もか存在しない場合にも、効率的な学習をすることができる能動学習システムを提供することにある。

[0016] 本発明は、第 1の態様において、ラベルの値が未知のデータについてラベルの値が所定の値であるデータとの類似度を計算し、該計算した類似度に基づいて次に学習するデータを選択する第 1のデータ選択部と、ラベルの値が既知のデータに基づいてルールを学習し、該学習したルールをラベルの値が未知のデータの集合に適用して次に学習するデータを選択する第 2のデータ選択部とを備えることを特徴とする能動学習システムを提供する。

[0017] 本発明は、第 2の態様において、 1以上の記述子と 1以上のラベルとで構成されるデータのうち、所望ラベルの値を既知とした既知データの集合と前記所望ラベルの値を未知とした未知データの集合とを記憶する記憶部と、前記記憶部に記憶された既知データの集合から前記所望ラベルの値が所定値を持つデータを所定データとして選択し、前記各未知データ毎に前記所定データとの類似度を計算し、該計算した類似度に基づいて次に学習すべきデータを前記未知データの集合から選択する第 1のデータ選択動作と、前記記憶部に記憶された既知データに基づ!/、て任意のデータの記述子の入力に対してそのデータの前記所望ラベルの値を計算するルールを学習し、該学習したルールを前記未知データの集合に適用して各未知データの前記所望ラベルの値を予測し、該予測結果に基づレ、て次に学習すべきデータを前記未知データの集合力選択する第 2のデータ選択動作とのうち、指定された側の動作を行うデータ選択手段と、前記データ選択手段で選択されたデータを出力装置から出力し、前記所望ラベルの値が入力装置から入力されたデータを前記未知データの集合力取り除いて前記既知データの集合に追加する制御手段とを備えることを特徴とする能動学習システムを提供する。

[0018] 本発明は、第 3の態様において、 1以上の記述子と 1以上のラベルとで構成されるデータのうち、所望ラベルの値を既知とした既知データの集合と前記所望ラベルの値を未知とした未知データの集合と既知データまたは未知データの所望ラベルの値を書き換えた補助データの集合とを記憶する記憶部と、前記記憶部に記憶された既知データの集合と補助データの集合とから計算用データを生成し前記記憶部に記憶する計算用データ生成手段と、前記記憶部に記憶された計算用データの集合から前記所望ラベルの値が所定値を持つデータを所定データとして選択し、前記各未知データ毎に前記所定データとの類似度を計算し、該計算した類似度に基づいて次に学習すべきデータを前記未知データの集合から選択する第 1のデータ選択動作と、前記記憶部に記憶された計算用データに基づいて任意のデータの記述子の入力に対してそのデータの前記所望ラベルの値を計算するルールを学習し、該学習したルールを前記未知データの集合に適用して各未知データの前記所望ラベルの値を予測し、該予測結果に基づいて次に学習すべきデータを前記未知データの集合から選択する第 2のデータ選択動作とのうち、指定された側の動作を行うデータ選択手段と、前記データ選択手段で選択されたデータを出力装置から出力し、前記所望ラベルの値が入力装置から入力されたデータを前記未知データの集合から取り除いて前記既知データの集合に追加する制御手段とを備えることを特徴とする能動学習システムを提供する。

[0019] 本発明は、第 4の態様において、 1以上の記述子と 1以上のラベルとで構成されるデータのうち、所望ラベルの値を既知とした既知データの集合と前記所望ラベルの値を未知とした未知データの集合と既知データまたは未知データの所望ラベルの値を書き換えた補助データの集合とを記憶する記憶部と、前記記憶部に記憶された既知データの集合と補助データの集合とから、重み付きの計算用データを生成し前記記憶部に記憶する計算用データ生成手段と、前記記憶部に記憶された重み付きの計算用データの集合力前記所望ラベルの値が所定値を持つデータを所定データとして選択し、前記各未知データ毎に前記所定データとの類似度をデータの重みを考慮して計算し、該計算した類似度に基づいて次に学習すべきデータを前記未知データの集合力選択する第 1のデータ選択動作と、前記記憶部に記憶された重み付きの計算用データに基づいて任意のデータの記述子の入力に対してそのデータの前記所望ラベルの値を計算するルールをデータの重みを考慮して学習し、該学習したルールを前記未知データの集合に適用して各未知データの前記所望ラベルの値を予測し、該予測結果に基づレ、て次に学習すべきデータを前記未知データの集合から選択する第 2のデータ選択動作とのうち、指定された側の動作を行うデータ選択手段と、前記データ選択手段で選択されたデータを出力装置から出力し、前記所望ラベルの値が入力装置から入力されたデータを前記未知データの集合から取り除いて前記既知データの集合に追加する制御手段とを備えることを特徴とする能動学習システムを提供する。

[0020] 本発明は、第 5の態様において、コンピュータを用いた能動学習方法であって、前記コンピュータが、ラベルの値が未知のデータについてラベルの値が所定の値であるデータとの類似度を計算し、該計算した類似度に基づいて次に学習するデータを選択する能動学習サイクルを 1サイクル以上繰り返した後、ラベルの値が既知のデータに基づいてルールを学習し、該学習したルールをラベルの値が未知のデータの集合に適用して次に学習するデータを選択する能動学習サイクルへ移行することを特徴とする能動学習方法を提供する。

[0021] 本発明の上記、及び、他の目的、特徴及び利益は、図面を参照する以下の説明により明らかになる。

図面の簡単な説明

[0022] [図 1]本発明の第 1の実施形態例に力、かる能動学習システムのブロック図である。

[図 2]本発明の第 1の実施形態例に力、かる能動学習システムで扱うデータの構造例を示す図である。

[図 3]本発明の第 1の実施形態例に力、かる能動学習システムの動作を示す流れ図である。

[図 4]本発明の第 2の実施形態例に力、かる能動学習システムのブロック図である。

[図 5]本発明の第 2の実施形態例に力、かる能動学習システムで扱うデータの構造例を示す図である。

[図 6]本発明の第 2の実施形態例に力、かる能動学習システムの動作を示す流れ図である。

発明を実施するための最良の形態

[0023] [第 1の実施形態例]

図 1を参照すると、本発明の第 1の実施形態例に力、かる能動学習システムは、利用者からの指示やデータを入力するキーボード等で構成された入力装置 1と、プロダラム制御により動作する処理装置 2と、半導体メモリや磁気ディスク等で構成される記憶装置 3〜7と、ディスプレイ装置等で構成される出力装置 8とから構成されている。記憶装置 3〜7は物理的に別の装置である必要はなぐ同じ記憶装置を論理的に分割したものを記憶装置 3〜7として使用することが可能である。

[0024] 記憶装置 3は、入力装置 1から入力された既知データ 31、未知データ 32および補助データ 33を記憶する。既知データ 31、未知データ 32および補助データ 33のデータ構造の一例を図 2に示す。図 2を参照すると、既知データ 31、未知データ 32および補助データ 33は、自データを一意に識別するための識別子 201、 1以上の記述子 202および 1以上のラベル 203を含んで構成される。記述子 202は当該データの構造などを特徴付けるものである。ラベル 203は当該データの或る事象に関する状態を示し、クラスまたは関数値である。ここで、 1以上のラベル 203のうち、予測の対象となるラベルを所望ラベルと呼び、未知データ 32にあっては所望ラベルの値は未知（未設定状態）であり、既知データ 31にあっては所望ラベルの値は既知（設定済状態）になっている。補助データ 33の所望ラベルの値は、既知データ 31と同じく設定済状態である力 S、既知データ 31の所望ラベルの値が実際に確かめられた確かな値であるのに対し、補助データ 33の所望ラベルの値は不確実な値である点で相違する。

[0025] 補助データ 33としては、所望ラベルの値が不確実なため既知データ 31として扱うのには適当でないが、効率的な学習の補助として有効に利用できるデータが利用される。例えば、創薬におけるスクリーニングで、活性あり化合物と活性なし化合物とを学習する場合、利用者の有する当該領域における知識と文献などの情報とから活性がありそうな或る化合物に注目したとする。その化合物が手元にあって実験で活性の有無を確かめられれば、既知データに分類できるが、そのような実験ができない場合、既知データには分類できない。また、活性がありそうな化合物なので、未知データに分類してしまうのも勿体ない。このようなとき、本実施形態では、所望ラベルの値を活性ありに設定して補助データとして扱うことで、言わば仮の既知データとして真の既知データと明確に区別して学習に利用できるようにする。同様に、創薬におけるスクリーニングで、活性あり化合物と活性なし化合物とを学習する場合、他の活性なし化合物に比べて僅かだが活性のある化合物は、従来においては既知データ中の活性なし化合物に分類してしか用いることができなかった力本実施形態では、所望ラベルの値を活性ありに設定した補助データとして扱うことにより、仮の既知データとして真の既知データと明確に区別して学習に利用できるようにする。

[0026] さらに、異なる事象であっても、類似している事象であれば、それらのラベルの値は或る程度同じ値をとる傾向がある点に着目して、既知データあるいは未知データの所望ラベルの値を該所望ラベルが示す事象と類似する事象の状態を示す他のラベルの値で書き換えることで、既知データまたは未知データから補助データを生成することも可能である。例えば、創薬におけるスクリーニングにおいて活性化合物を探索する例として、創薬の多くのターゲットになっている Gタンパク質共役型受容体 (GPCR) のうち生体アミン受容体に作用するリガンド化合物、特に生体アミン受容体ファミリーの 1つであるアドレナリンに作用するリガンド化合物を探索する場合を例にすると、次のようにして既知データあるいは未知データから補助データを生成できる。まず、複数のラベルのうちラベル 1がアドレナリンに対する活性の有無を示し、ラベル 2がヒスタミンに対する活性の有無を示すものとする。このとき、ラベル 1が活性なしあるいは未知、ラベル 2が活性ありとなっている或る化合物のデータのラベル 1をラベル 2の活性ありに書き換えたデータを補助データとする。これは、ヒスタミンはアドレナリンと同じ G PCRの生体アミン受容体のファミリーに属していること、タンパク質同士が類縁関係にあるとき、リガンド化合物もしばしば似て!/、ることがあることを利用者が考慮したことによ ·ο。

[0027] 再び図 1を参照すると、記憶装置 4は、入力装置 1から入力された制御条件を記憶する。本実施形態の場合、制御条件は、補助条件 41、予測条件 42、データ選択条件 43、終了条件 44、出力条件 45および所定ラベル値 46を含む。

[0028] 補助条件 41は、補助データ 33を計算に利用する条件であり、例えば以下のような条件を用いることができる。

補助条件 Α:初回から予め定めた反復回数 Νまでは補助データ 33を計算に利用す補助条件 Β：予め定めた数の所望データが得られるまでは補助データ 33を計算に利用する。ここで、所望データとは、所望ラベルの値が所望値である既知データのことである。所望値とは、利用者にとって価値のあるラベル値のことである。例えば、創薬におけるスクリーニングで、所望ラベルが特定のタンパク質に対する活性の有無であり、利用者にとって活性ありの化合物が価値のある場合、所望値は活性ありになる

〇

補助条件 C：既知データの一部を評価データとして残しておき、評価データ以外の既知データで計算した場合の評価データに対する予測精度が、評価データ以外の既知データおよび補助データから変換して得られた計算用データを用いた場合の評価データに対する予測精度よりも低ければ、補助データ 33を利用する。

補助条件 D：補助条件 Cで評価データを残す代わりに、推定した予測精度を用いて、補助データ 33を用いずに推定した予測精度が補助データ 33を用いて推定した予測精度よりも低ければ、補助データ 33を利用する。

補助条件 E：補助データ 33を利用するかどうかの利用者からの指示に従う。

[0029] 上記の補助条件のうち、補助条件 A、 B、 C、 Dはそれぞれ単独または任意の組み合わせで指定できる。また、補助条件 Eは常に考慮すべき条件として設定される。

[0030] 予測条件 42は、次に学習するデータの予測方法を指定する。具体的には、類似度計算により導出するか、ルールにより導出するかを指定する。

[0031] 次に学習するデータをルールにより導出する方法は、従来の能動学習と同じであり、その予測方法としては従来の能動学習で用いられて!/、る手法をそのまま用いることができる。従来の能動学習で用いられる手法としては、例えば、決定木、二ユーラノレネットワーク、サポートベクタマシンなどによる学習や、それらを組み合わせたバギングゃブースティングなどの集団学習を用いて、ルールを学習し、学習によって得られたルールを用いて未知データの所望ラベルの値を予測する手法などがある。

[0032] 他方、次に学習するデータを類似度計算により導出する方法は、従来の能動学習では用いられなかった方法である。具体的には、既知データ 31の集合 (補助データ 33を利用する場合には、既知データ 31と補助データ 33とから生成される計算用データの集合)から所望ラベルの値が所定値を持つすべてのデータを所定データとして選択し、未知データ 32の集合中のデータ毎に所定データとの類似度を計算し、計算した類似度に基づいて次に学習すべきデータを未知データ 32の集合から選択する方法である。

[0033] 所定データの典型例は、所望ラベルの値が所望値であるデータ、つまり所望データである。所望データは、利用者にとって価値のあるデータであり、所望データ力、どうかはラベルの値で決まる。ラベルの値が 2値をとる場合、一方のラベル値のデータが所望データである。例えば、創薬におけるスクリーニングで、ラベルが特定のタンパク質に対する活性の有無であり、利用者にとって活性あり化合物に価値があれば、活性あり化合物が所望データとなる。ラベルが連続値をとる場合、利用者にとって価値のある範囲のラベル値となるデータを所望データとする。例えば、ラベルが特定のタンパク質に対する活性の強さで、利用者にとって価値のあるデータが或る閾値以上の活性の強さである場合、その閾値以上の活性の強さであるデータが所望データとなる。なお、後述するように、所定ラベルの値が所望値でないデータを所定データとする場合もある。

[0034] 類似度の計算は、比較する 2つのデータの記述子どうしを比較して行う。具体的には、例えば記述子が全部で n個ある場合、 n個の記述子どうしを比較し、例えば一致する記述子の数に応じた値を類似度とする。所定データが全部で m個存在する場合、 1つの未知データを m個の所定データのそれぞれと比較する。その結果、たとえば、その中で最も高い類似度を当該未知データの類似度とする。勿論、すべての所定データとの類似度の平均値などの統計データを当該未知データの類似度としても良い。

[0035] データ選択条件 43は、次に学習するデータの選択方法を指定する。次に学習するデータをルールにより導出する方法を用いる場合、集団学習での予測値が割れたデータを選択する方法や、所望するラベル値に近!/、予測値のデータを選択する方法や、予測値に対する或る関数を用いて選択する方法など、従来の能動学習で用いられている選択方法と同様の方法を用いることができる。他方、類似度計算により次に学習するデータを選択する方法を用いる場合、類似度の最も高いデータを選択する、あるいはその逆に類似度の最も低!/、データを選択すると!/、つた選択方法を用いること力 Sできる。

[0036] 終了条件 44は、計算を終了する条件であり、例えば以下のような条件を用いることができる。

終了条件 a：予め定めた反復回数 Nを超えたら終了する。

終了条件 b：予め定めた数の所望データが得られれば終了する。

終了条件 c：計算用データの一部を評価データとして予測に用いずに残しておき、評価データの予測精度が予め定めた値よりも高くなれば終了する。終了条件 d :予測精度を推定し、推定した予測精度が予め定めた値よりも高くなれば終了する。

終了条件 e :終了条件 b、 c、 dの何れかにおいて、値の向上する傾き（向上曲線）が予め定めた値よりも小さくなれば終了する。

終了条件 f :終了するかどうかの利用者からの指示に従う。

[0037] 上記の終了条件のうち、終了条件 a、 b、 c、 d、 eはそれぞれ単独または任意の組み合わせで指定できる。また、補助条件 fは常に考慮すべき条件として設定される。

[0038] 出力条件 45は、計算の結果生成されたルール、既知データおよび所望データのうちのどれを出力するかを指定する。生成されたルール以外に既知データおよび所望データも出力できるようにした理由は、例えば、創薬におけるスクリーニングで、ラベルが特定のタンパク質に対する活性の有無である場合、利用者にとってはラベルが既知となった活性あり化合物に価値があり、出力することに意味があるためである。

[0039] 所定ラベル値 46は、注目するラベルとその値を指定する。典型的には、利用者にとつて価値のあるデータのラベルとその値を指定する力 S、反対の場合もある。

[0040] 記憶装置 5は、既知データ 31と補助データ 33とから処理装置 2において生成された計算用データ 51を記憶する。計算用データ 51の生成方法については後述する。

[0041] 記憶装置 6は、処理装置 2において類似度計算によって選択された次に学習すベきデータ 61を記憶する。記憶装置 7は、処理装置 2において生成されたルール 71およびルール 71によって選択された次に学習すべき選択データ 72を記憶する。処理装置 2は、初期設定手段 21、計算用データ生成手段 22、データ選択手段 23、処理制御手段 24およびデータ更新手段 25を備えている。

[0042] 初期設定手段 21は、入力装置 1から既知データ 31、未知データ 32および補助データ 33が入力されると、それらを記憶装置 3へ格納する。また、入力装置 1から補助条件 41、予測条件 42、データ選択条件 43、終了条件 44、出力条件 45および所定ラベル値 46が入力されると、それらを記憶装置 4へ格納する。既知データ 31、未知データ 32および補助データ 33は、それぞれ独立に入力しても良いし、一括して入力することもできる。同様に、補助条件 41、予測条件 42、データ選択条件 43、終了条件 44、出力条件 45および所定ラベル値 46は、それぞれ独立に入力しても良いし、一括して入力することもできる。また、計算の開始から終了までの期間中に、既に入力した既知データ 31、未知データ 32、補助データ 33、補助条件 41、予測条件 42、データ選択条件 43、終了条件 44、出力条件 45および所定ラベル値 46を別の入力データで置さ換免ることあでさる。

[0043] 計算用データ生成手段 22は、記憶装置 4から補助条件 41を読み出し、記憶装置 3 力も既知データ 31および補助データ 33を読み出し、計算用データ 51を生成して、記憶装置 5に格納する。具体的には、補助条件 41の成否を判定し、補助データ 33 を利用する条件が成立していれば、補助データ 33と、既知データ 31のうち補助データ 33と記述子がすべて一致するデータを除く残りのデータとを計算用データ 51とする。他方、補助データ 33を利用する条件が成立していなければ、既知データ 31を計算用データ 51とする。

[0044] データ選択手段 23は、第 1のデータ選択部 26および第 2のデータ選択部 27を備え、この 2つのデータ選択部 26、 27のうち、記憶装置 4に記憶された予測条件 42に応じた何れか一方を選択的に実行する。或る態様では、計算の開始時には第 1のデータ選択部 26を実行し、後に第 2のデータ選択部 27の実行に切り替わり、計算の終了まで第 2のデータ選択部 27を実行し続ける。また、別の態様では、計算の開始から終了まで第 2のデータ選択部 27を実行する。

[0045] 第 1のデータ選択部 26は、記憶装置 5から計算用データ 51を読み出し、記憶装置 3から未知データ 32を読み出し、記憶装置 4からデータ選択条件 43および所定ラベノレ値 46を読み出し、計算用データ 51の集合から所定ラベル値 46を持つデータを所定データとして選択し、未知データ 32の集合中のデータ毎に所定データとの類似度を計算し、この計算した類似度とデータ選択条件 43とに基づいて次に学習すべきデータを未知データ 32の集合から選択し、選択データ 61として記憶装置 6に格納する

〇

[0046] 第 2のデータ選択部 27は、記憶装置 5から計算用データ 51を読み出し、記憶装置 3から未知データ 32を読み出し、記憶装置 4からデータ選択条件 43および所定ラベノレ値 46を読み出し、計算用データ 51に基づいて任意のデータの記述子の入力に対してそのデータの所定ラベルの値を計算するルールを学習し、この学習したルールを未知データ 32の集合に適用して各未知データの所定ラベルの値を予測し、この予測結果とデータ選択条件 43とに基づいて次に学習すべきデータを未知データ 32の集合から選択し、選択データ 72として前記生成したルール 71と一緒に記憶装置 7に格納する。

[0047] 処理制御手段 24は、記憶装置 4から終了条件 44を読み出して終了可否を判定し、終了条件を満たしていれば、記憶装置 4から読み出した出力条件 45に従って、記憶装置 7に格納されているルール 71、記憶装置 3に格納されている既知データ 31、および既知データ 31に含まれる所望データなどを出力装置 8に出力し、処理装置 2の計算処理を終了する。他方、終了条件 44を満たしていなければ、第 1のデータ選択部 26が動作中であれば記憶装置 6に格納された選択データ 61、第 2のデータ選択部 27が動作中であれば記憶装置 7に格納された選択データ 72を出力装置 8に出力する。そして、利用者の入力装置 1の操作により、前記出力したデータのラベルの値が入力されると、入力されたラベル値を設定したデータをデータ更新手段 25に渡し、処理装置 2の計算処理を続行させる。

[0048] データ更新手段 25は、ラベル値の設定されたデータを記憶装置 3の既知データ 31 の集合に加え、未知データ 32の集合から該当する元のデータを取り除く。

[0049] 処理装置 2は、終了条件 44が満たされるまで、図 1に破線で示される制御の流れに沿って、計算用データ生成手段 22、データ選択手段 23、処理制御手段 24およびデータ更新手段 25の処理を繰り返し実行する。

[0050] 図 3は本実施形態に力、かる能動学習システムの全体の動作を示すフローチャートである。以下、図 1乃至図 3を参照して、本実施形態の動作を説明する。

[0051] 処理装置 2は、利用者による入力装置 1からの指示等によって起動されると、図 3のフローチャートに示す処理を開始する。処理装置 2の初期設定手段 21は、入力装置

1からデータと制御条件とを入力し、データを記憶装置 3に格納し、制御条件を記憶装置 4に格納する（図 3のステップ S101)。入力されるデータは、既知データ 31、未知データ 32および補助データ 33の 3種類である。これら 3種類のデータは、それぞれに分けて格納しても良いし、あるいは図 2で示したようにデータにデータ番号や一意に振られた IDなどの識別子 201を付けて、データを分けずに格納し、識別子 201 とデータ種類との対応情報を別の場所に格納しても良い。また、ラベルも対応付けを行って、記述子とは分けて格納しても良い。なお、既知データ 31と補助データ 33の何れか一方は空集合であっても構わない。既知データ 31が空集合の場合、計算用データ 51は補助データのみとなる。

[0052] また入力される制御条件は、補助条件 41、予測条件 42、データ選択条件 43、終了条件 44、出力条件 45および所定ラベル値 46を含む。これらは全てが必須の制御条件ではなぐ必要に応じて省略可能なものもある。例えば、所定ラベル値 46は、他の制御条件の何れかにおレ、て所定ラベル値や所定データが用いられな!/、場合には省略すること力 Sできる。また、図 3のフローチャートには示されていないが、各制御条件は他の制御条件と一緒に入力する必要はなく個別に入力することもでき、また初期設定時のみでなく計算途中に入力することもできる。例えば、予測条件は計算途中で類似度を用いる条件からルール学習を行う条件に変更することができる。

[0053] 次に処理装置 2の計算用データ生成手段 22は、記憶装置 4から補助条件 41を読み出して成立の可否を判定し (ステップ S 102)、補助条件が満たされないなら、記憶装置 3から読み出した既知データ 31の集合を計算用データ 51として記憶装置 5に格納する（ステップ S103)。他方、補助条件 41を満たすなら、記憶装置 3から既知データ 31と補助データ 33とを読み出し、補助データ 33を計算用データ 51として記憶装置 5に格納するとともに、既知データ 31から補助データ 33と記述子が同じデータを除いた残りを計算用データ 51として記憶装置 5に追加格納する（ステップ S104)。既知データ 31から補助データ 33と記述子が同じデータを取り除く理由は、既知データのラベルの値を書き換えて生成された補助データ 33を利用者が使用している可能性があるためである。この場合、補助データ 33を用いて既知データ 31のラベルの値を変換してレ、ることと等価になる。

[0054] 次に処理装置 2のデータ選択手段 23は、記憶装置 4から予測条件 42を読み出し、類似度を用いて処理を行うか、ルール学習により処理を行うかを判定する（ステップ S 105)。類似度を用いて処理を行うと判定した場合は第 1のデータ選択部 26を起動し、ルール学習により処理を行うと判定した場合は第 2のデータ選択部 27を起動する。

[0055] 第 1のデータ選択部 26は、まず記憶装置 5に格納された計算用データ 51の集合から所定ラベル値 46と同じラベル値を持つすべてのデータを所定データとして選択し、計算用所定データとする (ステップ S 106)。次に、記憶装置 3に格納された未知データ 32の集合中のデータ毎に、計算用所定データとの類似度を計算する (ステップ S1 07)。最後に、計算した各未知データの類似度と、記憶装置 4に格納されたデータ選択条件 43とに基づいて、未知データ 32の集合から次に学習すべきデータを選択データ 61として選択し、記憶装置 6に格納する（ステップ S 108)。

[0056] 第 2のデータ選択部 27は、まず記憶装置 5に格納された計算用データ 51に基づいて任意のデータの記述子の入力に対してそのデータの所定ラベルの値を計算するルール 71を学習し、記憶装置 7に記憶する (ステップ S 109)。次に、この学習したルール 71を記憶装置 3に格納された未知データ 32の集合に適用して各未知データの所定ラベルの値を予測する (ステップ S110)。最後に、各未知データの所定ラベルの予測結果と、記憶装置 4に格納されたデータ選択条件 43とに基づいて、未知データ 32の集合から次に学習すべきデータを選択データ 72として選択し、記憶装置 7に格納する。

[0057] 次に処理装置 2の処理制御手段 24は、記憶装置 4から終了条件 44を読み出して成立の可否を判定する（ステップ S 112)。そして、終了条件 44が成立していなければ、データ選択手段 23で選択されたデータを記憶装置 6または記憶装置 7から読み出して出力装置 8に出力し、利用者の入力装置 1の操作により、前記出力したデータのラベルの値を入力する（ステップ S 113)。次に処理装置 2のデータ更新手段 25は、ラベル値が入力されたデータを未知データ 32から取り除き、既知データ 31に追加する（ステップ S 114)。そして、制御を計算用データ生成手段 22に戻し、上述した処理と同様の処理を終了条件が成立するまで繰り返す。

[0058] ステップ S113における選択データの出力では、データそのものを出力しても良いし、選択されたデータの識別子 201を出力しても良い。同じくステップ S 113におけるラベル値の入力では、記述子とラベルを含めたデータそのものを入力しても良いし、データのラベルの値のみを入力しても良い。さらに、利用者がシステムが出力したデータ以外にラベルをつけたい場合には、データとの対応を示せば、別のデータのラベルを入力しても構わない。これは、能動学習システムが利用者に対する支援を目指しており、利用者が自身の知識に基づいて、選択されたデータが不適切と判断すれば別のデータにラベル付けを行うことを可能にするためである。

[0059] また、処理制御手段 24に制御が移っているステップ S 113の時点で、利用者に補助データを変更するかどうかを問レ、合わせ、新たな補助データを利用者に入力させても良い。さらに、以前に利用者から入力された補助データ 33に対し、入力装置 1の操作によってラベル値が入力された場合には、補助データの取り消しを行うかどうかを利用者に確認しても良い。このように補助データを変更する場合には、記憶装置 3 の補助データ 33を新たな補助データに書き換える。またさらに、現在の既知データ 3 1の内容、あるいはその中の所定データの内容や数などを、出力装置 8に出力し、利用者に対して予測条件 42を変更するかどうかを問!/、合わせ、新たな予測条件 42を利用者に入力させても良い。

[0060] 他方、処理装置 2の処理制御手段 24は、終了条件 44が成立して!/、れば、記憶装置 4に格納された出力条件 45に応じて、ルール 71および既知データ 31などを出力装置 8から出力し (ステップ S115)、処理を終える。次に幾つかの状況を想定して本実施形態の動作をより詳しく説明する。

[0061] 前提として、処理装置 2で扱うデータが図 2に示したようなデータ構造をしており、ラベル 1が所望ラベル、ラベル 1のとり得る値が 2値 {A, B}とする。また、そのうち所望のラベル値は Aとする。例えば、創薬におけるスクリーニングの場合、ラベル 1が或るタンパク質に対する活性の有無で、 Aが活性あり、 Bが活性なしに相当する。利用者の目的は、ラベル 1の値が未知のデータ 32の集合の中から、ラベル 1が Aであるデータを、ランダム選択よりは効率良く発見することである。ここで、未知データの多くはラベル 1の値が Bであることが前提になっている。従って、ラベル 1の値が Bであるデータはランダム選択によって容易に発見することができる。これに対してラベル 1の値が Aのデータは、ランダム選択では発見コストが著しく増加することになる。

[0062] (1)想定例 1

まず、ラベル 1の値が Bの既知データは必要十分な数だけ準備できた力 S、ラベル 1 の値が Aの既知データは全く存在しない状況を想定する。これは例えば、或るタンパク質に活性のない化合物のデータは多数存在する力活性のある化合物のデータはまったく存在しな!/、状況に相当する。

[0063] このような状況の下で、ラベル 1の値が Aの既知データを効率良く発見する方法には、主に以下の 3通りの方法がある。

(1 1)ラベル 1の値が Bの既知データとの類似度が最も低い未知データを、ラベル 1 の値が Aのデータの候補として選択する予測方法で処理を開始し、ラベル 1の値が A のデータがある程度収集できた時点で、ルールを学習する予測方法に切り替える。 (1 2)ラベル 1の値が Aの補助データを生成し、この補助データとの類似度が最も高い未知データを、ラベル 1の値が Aのデータの候補として選択する予測方法で処理を開始し、ラベル 1の値が Aのデータがある程度収集できた時点で、ルールを学習する予測方法に切り替える。

(1 3)ラベル 1の値が Aの補助データを生成し、最初からルールを学習する予測方法で予測を行う。

以下、それぞれの場合について動作を説明する。

[0064] (1 1)動作例 1

まず、初期設定で、ラベル 1の値力 ¾であるデータだけを含む既知データ 31と、ラベル 1の値が未知の未知データ 32とを記憶装置 3に記憶する。ここでは補助データ 3 3は使用しない。また、予測条件 42で類似度を用いる予測方式を指定し、データ選択条件 43で最も類似度の低!/、データを選択すると!/、う条件を指定する。所定ラベル値 46ではラベル 1の値 Bを指定する。

[0065] 図 3の処理が開始されると、まず、ラベル 1の値が Bである既知データ 31が計算用データ 51として生成される (ステップ S 103)。次に、計算用データ 51から所定ラベル値 46を持つすべてのデータ、つまりラベル 1の値が Bのデータが計算用所定データとして選択される（ステップ S106)。次に、未知データ 32中の各データについて、計算用所定データとの類似度が計算される (ステップ S 107)。次に、データ選択条件 4 3に従って、計算用所定データとの類似度が最も低い未知データ、すなわちラベル 1 の値力 ¾である既知データに最も似ていない未知データが選択データ 61として選択される（ステップ S108)。そして、この選択データ 61が処理制御手段 24により出力装置 8に出力され、利用者は、実験等によって選択データ 61のラベル 1の値を調べて入力装置 1から入力する（ステップ SI 13)。ここで、選択データ 61は、ラベル 1の値が Bであるデータに最も似ていないデータであるから、未知データ 32の集合からランダムに選択するよりは、ラベル 1の値が Aであるデータである確率が高くなる。データ更新手段 25は、ラベル 1に値が入力されたデータを未知データ 32から取り除き、既知データ 31に追加する（ステップ S114)。

[0066] 以上と同様な動作が繰り返され、ラベル 1の値が Aの計算用データあるいは既知データがルール学習に必要な数だけ集まった時点で、入力装置 1から予測条件 42をルール学習による予測に変更し、所定ラベル値 46をラベル 1の値 Aに変更する。これにより、以降は従来の能動学習システムと同様の方法でルールが学習され、学習されたルールによって未知データ 32の中からデータが選択されていく。なお、入力装置 1から予測条件 42を変更する代わりに、予測条件 42自体に、ラベル 1の値が A の計算用データあるいは既知データが或る閾値以上揃ったらルール学習に変更するという条件を設定しておいて処理制御手段 24が自動的に予測方法を切り替えるようにすることあでさる。

[0067] (1 2)動作例 2

本動作例では、ラベル 1の値を Aに設定した補助データ 33を使用する。このような補助データ 33は前述したように、例えば既知データ 31あるいは未知データ 32中の或るデータのラベル 1の値を、ラベル 1が示す事象と類似する事象の状態を示す他のラベルの値で書き換えることで、生成すること力 Sできる。

[0068] まず、初期設定で、ラベル 1の値が Bであるデータだけを含む既知データ 31と、ラベル 1の値が未知の未知データ 32と、ラベル 1の値が Aである補助データ 33とを記憶装置 3に記憶する。また、予測条件 42で類似度を用いる予測方式を指定し、データ選択条件 43で最も類似度の高いデータを選択するという条件を指定する。所定ラベル値 46ではラベル 1の値 Aを指定する。補助データ 33を使用するので、適当な補助条件 41を指定しておく。

[0069] 図 3の処理が開始されると、まず、ラベル 1の値が Aの補助データ 33と、ラベル 1の値が Bである既知データ 31のうち補助データ 33と記述子が同一のデータを除いた残りのデータとが計算用データ 51として生成される（ステップ S104)。次に、計算用データ 51から所定ラベル値 46を持つすべてのデータ、つまりラベル 1の値が Aのデータが計算用所定データとして選択される（ステップ S106)。次に、未知データ 32中の各データについて、計算用所定データとの類似度が計算される (ステップ S107)。次に、データ選択条件 43に従って、計算用所定データとの類似度が最も高い未知データ、すなわちラベル 1の値が Aである補助データに最も似ている未知データが選択データ 61として選択される（ステップ S 108)。そして、この選択データ 61が処理制御手段 24により出力装置 8に出力され、利用者は、実験等によって選択データ 61のラベル 1の値を調べて入力装置 1から入力する（ステップ S 113)。ここで、補助データ 3 3は、ラベル 1が Aである既知データではなぐいわば仮の既知データであるが、ラベノレ 1と置換に使用した他のラベルとの間には類似関係があるため、真の既知データと構造が似ている可能性が高い。そして選択データ 61は、ラベル 1の値が Aである補助データに最も似ているデータであるから、未知データ 32の集合からランダムに選択するよりは、ラベル 1の値が Aであるデータである確率が高くなる。データ更新手段 25 は、ラベル 1に値が入力されたデータを未知データ 32から取り除き、既知データ 31 に追加する（ステップ S 114)。

[0070] 以上と同様な動作が繰り返され、ラベル 1の値が Aの計算用データあるいは既知データがルール学習に必要な数だけ集まった時点で、入力装置 1から予測条件 42をルール学習による予測に変更する。これにより、以降は従来の能動学習システムと同様の方法でルールが学習され、学習されたルールによって未知データ 32の中からデータが選択されていく。ただし、補助条件 41が成立している間は補助データ 33が仮の既知データとして使われる点が従来とは相違する。補助データ 33は、ラベル 1が Aである既知データではなぐいわば仮の既知データであるが、ラベル 1と置換に使用した他のラベルとの間には類似関係があるため、補助データを用いて学習するノレールは、或る程度意味のあるルールとなる。なお、入力装置 1から予測条件 42を変更する代わりに、予測条件 42自体に、ラベル 1の値が Aの計算用データが或る閾値以上揃ったらルール学習に変更するという条件を設定しておいて処理制御手段 24 が自動的に予測方法を切り替えるようにすることもできる。

[0071] (1 3)動作例 3 ラベル 1の値が Aである補助データがルール学習に必要十分な数だけ準備できる場合、類似度による予測を一切使わずに処理の開始からルール学習による予測を行わせることも可能である。

[0072] まず、初期設定で、ラベル 1の値が Bであるデータだけを含む既知データ 31と、ラベル 1の値が未知の未知データ 32と、ラベル 1の値が Aである補助データ 33とを記憶装置 3に記憶する。また、予測条件 42でルール学習を用いる予測方式を指定する。所定ラベル値 46ではラベル 1の値 Aを指定する。補助データ 33を使用するので、適当な補助条件 41を指定しておく。

[0073] 図 3の処理が開始されると、まず、ラベル 1の値が Aの補助データ 33と、ラベル 1の値が Bである既知データ 31のうち補助データ 33と記述子が同一のデータを除いた残りのデータとが計算用データ 51として生成される（ステップ S104)。次に、計算用データ 51を用!/、てルールを学習し、記憶装置 7にルール 71として記憶する（ステップ S 109)。次に、ルール 71を用いて未知データ 32の集合に対してラベル 1の値を予測し (ステップ S 110)、その予測結果とデータ選択条件 43とに基づいて次に学習するデータを選択して記憶装置 7に記憶する (ステップ S 111)。そして、この選択データ 7 2が処理制御手段 24により出力装置 8に出力され、利用者は、実験等によって選択データ 72のラベル 1の値を調べて入力装置 1から入力する（ステップ S113)。ここで、データ選択条件 43がたとえば所望するラベル値に近い予測値のデータを選択するものであれば、未知データ 32の集合からランダムに選択するよりは、ラベル 1の値が Aであるデータである確率が高くなる。データ更新手段 25は、ラベル 1に値が入力されたデータを未知データ 32から取り除き、既知データ 31に追加する（ステップ S114 )。

以上と同様な動作が終了条件 44が成立するまで繰り返される。

[0074] (2)想定例 2

想定例 1と異なり、ラベル 1の値が Aの既知データが僅かに存在する状況を想定する。これは例えば、或るタンパク質に活性のない化合物のデータは多数存在するが、活性のある化合物のデータがごく僅力、しか存在しない状況に相当する。

[0075] このような状況の下で、ラベル 1の値が Aの既知データを効率良く発見する方法には、主に以下の 3通りの方法がある。

(2- 1)前述した想定例 1の動作例 1と同様に、ラベル 1の値が Bの既知データとの類似度が最も低い未知データを、ラベル 1の値が Aのデータの候補として選択する予測方法で処理を開始し、ラベル 1の値が Aのデータがある程度収集できた時点で、ルールを学習する予測方法に切り替える。

(2- 2)僅かに存在するラベル 1の値が Aの既知データとの類似度が最も高!/、未知データを、ラベル 1の値が Aのデータの候補として選択する予測方法で処理を開始し、ラベル 1の値が Aのデータがある程度収集できた時点で、ルールを学習する予測方法に切り替える。

(2- 3)ラベル 1の値が Aの補助データを生成し、ラベル 1の値が Aの既知データとあわせて、最初からルールを学習する予測方法で予測を行う。

以下、それぞれの場合について動作を説明する。

[0076] (2— 1)動作例 4

まず、初期設定で、ラベル 1の値が Aである僅かなデータとラベル 1の値が Bである十分な数のデータを含む既知データ 31と、ラベル 1の値が未知の未知データ 32とを記憶装置 3に記憶する。ここでは補助データ 33は使用しない。また、予測条件 42で類似度を用いる予測方式を指定し、データ選択条件 43で最も類似度の低いデータを選択するという条件を指定する。所定ラベル値 46ではラベル 1の値 Bを指定する。

[0077] 図 3の処理が開始されると、まず、既知データ 31が計算用データ 51として保存される（ステップ S103)。次に、計算用データ 51から所定ラベル値 46を持つすべてのデータ、つまりラベル 1の値力 ¾の既知データが計算用所定データとして選択される（ステツプ S 106)。次に、未知データ 32中の各データについて、計算用所定データとの類似度が計算される (ステップ S 107)。次に、データ選択条件 43に従って、計算用所定データとの類似度が最も低い未知データ、すなわちラベル 1の値が Bである既知データに最も似ていない未知データが選択データ 61として選択される（ステップ S10 8)。そして、この選択データ 61が処理制御手段 24により出力装置 8に出力され、禾 IJ 用者は、実験等によって選択データ 61のラベル 1の値を調べて入力装置 1から入力する（ステップ S113)。ここで、選択データ 61は、ラベル 1の値が Bであるデータに最も似ていないデータであるから、未知データ 32の集合からランダムに選択するよりは、ラベル 1の値が Aであるデータである確率が高くなる。データ更新手段 25は、ラベノレ 1に値が入力されたデータを未知データ 32から取り除き、既知データ 31に追加する（ステップ S 114)。

[0078] 以上と同様な動作が繰り返され、ラベル 1の値が Aの計算用データあるいは既知データがルール学習に必要な数だけ集まった時点で、入力装置 1から予測条件 42をルール学習による予測に変更し、所定ラベル値 46をラベル 1の値 Aに変更する。これにより、以降は従来の能動学習システムと同様の方法でルールが学習され、学習されたルールによって未知データ 32の中からデータが選択されていく。なお、入力装置 1から予測条件 42を変更する代わりに、予測条件 42自体に、ラベル 1の値が A の計算用データあるいは既知データが或る閾値以上揃ったらルール学習に変更するという条件を設定しておいて処理制御手段 24が自動的に予測方法を切り替えるようにすることあでさる。

[0079] (2— 2)動作例 5

本動作例では、まず初期設定で、ラベル 1の値が Aである僅かなデータとラベル 1 の値が Bであるデータを含む既知データ 31と、ラベル 1の値が未知の未知データ 32 とを記憶装置 3に記憶する。また、予測条件 42で類似度を用いる予測方式を指定し、データ選択条件 43で最も類似度の高いデータを選択するという条件を指定する。所定ラベル値 46ではラベル 1の値 Aを指定する。

[0080] 図 3の処理が開始されると、まず、ラベル 1の値が Aであるデータおよび Bであるデータを含む既知データ 31が計算用データ 51として生成される (ステップ S 103)。次に、計算用データ 51から所定ラベル値 46を持つすべてのデータ、つまりラベル 1の値が Aのデータが計算用所定データとして選択される（ステップ S106)。次に、未知データ 32中の各データについて、計算用所定データとの類似度が計算される (ステップ S 107)。次に、データ選択条件 43に従って、計算用所定データとの類似度が最も高い未知データ、すなわちラベル 1の値が Aである既知データに最も似ている未知データが選択データ 61として選択される（ステップ S108)。そして、この選択データ 6 1が処理制御手段 24により出力装置 8に出力され、利用者は、実験等によって選択データ 61のラベル 1の値を調べて入力装置 1から入力する（ステップ S 113)。ここで、選択データ 61は、ラベル 1の値が Aである既知データに最も似ているデータであるから、未知データ 32の集合からランダムに選択するよりは、ラベル 1の値が Aであるデータである確率が高くなる。データ更新手段 25は、ラベル 1に値が入力されたデータを未知データ 32から取り除き、既知データ 31に追加する（ステップ S 114)。

[0081] 以上と同様な動作が繰り返され、ラベル 1の値が Aの計算用データあるいは既知データがルール学習に必要な数だけ集まった時点で、入力装置 1から予測条件 42をルール学習による予測に変更する。これにより、以降は従来の能動学習システムと同様の方法でルールが学習され、学習されたルールによって未知データ 32の中からデータが選択されていく。なお、入力装置 1から予測条件 42を変更する代わりに、予測条件 42自体に、ラベル 1の値が Aの計算用データが或る閾値以上揃ったらルール学習に変更するという条件を設定しておいて処理制御手段 24が自動的に予測方法を切り替免るようにすることあでさる。

[0082] (2— 3)動作例 6

ラベル 1の値が Aである補助データを幾つか準備できる場合、ラベル 1の値が Aの既知データとあわせて、処理の開始からルール学習による予測を行わせることも可能である。

[0083] まず、初期設定で、ラベル 1の値が Aである僅かなデータとラベル 1の値が Bであるデータを含む既知データ 31と、ラベル 1の値が未知の未知データ 32と、ラベル 1の値が Aである補助データ 33とを記憶装置 3に記憶する。また、予測条件 42でルール学習を用いる予測方式を指定する。所定ラベル値 46ではラベル 1の値 Aを指定する。補助データ 33を使用するので、適当な補助条件 41を指定しておく。

[0084] 図 3の処理が開始されると、まず、ラベル 1の値が Aの補助データ 33と、ラベル 1の値が Aである僅かなデータとラベル 1の値が Bであるデータとを含む既知データ 31のうち補助データ 33と記述子が同一のデータを除いた残りのデータとが計算用データ 51として生成される（ステップ S104)。次に、計算用データ 51を用いてルールを学習し、記憶装置 7にルール 71として記憶する（ステップ S109)。次に、ルール 71を用いて未知データ 32の集合に対してラベル 1の値を予測し (ステップ S 110)、その予測結果とデータ選択条件 43とに基づいて次に学習するデータを選択して記憶装置 7に記憶する（ステップ S111)。そして、この選択データ 72が処理制御手段 24により出力装置 8に出力され、利用者は、実験等によって選択データ 72のラベル 1の値を調べて入力装置 1から入力する（ステップ S113)。ここで、データ選択条件 43がたとえば所望するラベル値に近!/、予測値のデータを選択するものであれば、未知データ 32 の集合からランダムに選択するよりは、ラベル 1の値が Aであるデータである確率が高くなる。

データ更新手段 25は、ラベル 1に値が入力されたデータを未知データ 32から取り除き、既知データ 31に追加する（ステップ S 114)。

[0085] 本実施形態によれば、学習開始時点の初期の状態において既知データの集合中に所望データが全く存在しないかごく僅力、しか存在しないような、ルール学習が正しく行えない状況であっても、ランダム選択よりは効率的に未知データの集合から所望データを選択することができ、最終的に所望データを使ったルール学習が可能にな

[0086] その理由は、既知データの集合に存在する所望データ以外のデータと最も似て!/、ないデータを未知データから選択するという類似度による予測方法によってランダム選択よりは効率的に所望データの発見が行えるためである。また別の理由は、僅かに存在する所望データあるいは仮の所望データである補助データに最も似ているデータを未知データから選択するという類似度による予測方法によってランダム選択よりは効率的に所望データの発見が行えるためである。さらに別の理由は、仮の所望データである補助データを使って意味のある学習が行えるためである。

[0087] [第 2の実施形態例]

図 4を参照すると、本発明の第 2の実施形態例に力、かる能動学習システムは、図 1 に示した第 1の実施形態例に力、かる能動学習システムと比較して、計算用データ生成手段 22の代わりに重み付き計算用データ生成手段 28を備え、データ選択手段 2 3の代わりに重みを考慮して予測を行うデータ選択手段 29を備えている点で相違す [0088] 重み付き計算用データ生成手段 28は、第 1の実施形態例の計算用データ生成手段 22と同様の機能を有する計算用データ生成部 28Aと、この計算用データ生成部 2 8Aにより生成された計算用データに対して重みを付与するデータ重み付け部 28Bと力、ら構成される。

[0089] 図 5を参照すると、重み付き計算用データのデータ構造の一例は、図 2に示した計算用データに重み 204の項目を付加した構造を持つ。重み 204は、例えば 0から 1までの値をとり、 1に近!/、ほど (値が大き!/、ほど）重要度が高!/、ことを示す。

[0090] データ重み付け部 28Bは、既知データ 31が補助データ 33より重要視したルール学習や類似度計算が行われるように、既知データ 31から生成された計算用データに対する重みを補助データ 33から生成された計算用データに対する重みよりも相対的に大きくする。それぞれに対してどの程度の値の重みを使用するかは、制御条件の一つに追加した重み条件で初期設定時および計算中に外部から指定するようにしても良いし、例えば既知データには値 1、補助データにはその半分の値を設定するものと予め定めておいても良い。

[0091] 図 6は本実施形態に力、かる能動学習システムの全体の動作を示すフローチャートである。以下、図 4乃至図 6を参照して、本実施形態の動作を説明する。処理装置 2 は、利用者による入力装置 1からの指示等によって起動されると、図 6のフローチヤ一トに示す処理を開始する。

[0092] 処理装置 2の初期設定手段 21は、入力装置 1からデータと制御条件とを入力し、データを記憶装置 3に格納し、制御条件を記憶装置 4に格納する（図 6のステップ S 101 )。次に処理装置 2の重み付き計算用データ生成手段 28の計算用データ生成部 28 Aは、記憶装置 4から補助条件 41を読み出して成立の可否を判定し (ステップ S102 )、補助条件が満たされないなら、記憶装置 3から読み出した既知データ 31をデータ重み付け部 28Bに与え、データ重み付け部 28Bは与えられた既知データ 31に既知データ用の重みを付加して、計算用データ 51として記憶装置 5に格納する（ステップ S 103)。

[0093] 他方、補助条件を満たすなら、計算用データ生成部 28Aは、記憶装置 3から既知データ 31と補助データ 33とを読み出し、補助データ 33をデータ重み付け部 28Bに与え、データ重み付け部 28Bは与えられた補助データ 33に補助データ用の重みを付加して、計算用データ 51として記憶装置 5に格納する (ステップ S201)。さらに計算用データ生成部 28Aは、既知データ 31から補助データ 33と記述子が同じデータを除いた残りのデータをデータ重み付け部 28Bに与え、データ重み付け部 28Bは与えられたデータに既知データ用の重みを付加して、計算用データ 51として記憶装置 5に追加格納する（ステップ S 201)。

[0094] 次に処理装置 2のデータ選択手段 29は、記憶装置 4から予測条件 42を読み出し、類似度を用いて処理を行うか、ルール学習により処理を行うかを判定する（ステップ S 105)。類似度を用いて処理を行うと判定した場合は第 1のデータ選択部 26を起動し、ルール学習により処理を行うと判定した場合は第 2のデータ選択部 27を起動する。

[0095] 第 1のデータ選択部 26は、まず記憶装置 5に格納された重み付きの計算用データ

51の集合から所定ラベル値 46と同じラベル値を持つすべてのデータを所定データとして選択し、計算用所定データとする (ステップ S 106)。次に、記憶装置 3に格納された未知データ 32の集合中のデータ毎に、計算用所定データとの類似度を計算する（ステップ S202)。この類似度の計算時に重みを考慮し、既知データ 31を補助データ 33より重要視するような類似度を計算する。例えば、記述子が全部で n個ある場合、未知データと計算用所定データとの間で n個の記述子どうしを比較し、例えば一致する記述子の数に応じた値に、その計算用所定データに付加されている重みを乗じた値を類似度とする。次に、計算した各未知データの類似度と、記憶装置 4に格納されたデータ選択条件 43とに基づいて、未知データ 32の集合から次に学習すべきデータを選択データ 61として選択し、記憶装置 6に格納する（ステップ S 108)。

[0096] 第 2のデータ選択部 27は、まず記憶装置 5に格納された計算用データ 51に基づいて任意のデータの記述子の入力に対してそのデータの所定ラベルの値を計算するルール 71を学習し、記憶装置 7に記憶する（ステップ S 203)。このルールの学習時に重みを考慮し、既知データ 31を補助データ 33より重要視するような学習を行う。具体的には、例えば、パギング法では、計算用データからサンプリングしたデータを複数回生成することにより複数のルールを生成している力このサンプリング時に重みの値が大きい計算用データが重みの値が小さい計算用データに比べてよりサンプリングされ易くする。勿論、計算用データに付加された重みに応じて学習の重要度を変える方法は上述した例に限定されず、その他各種の方法を採用することが可能である。次に、学習したルール 71を記憶装置 3に格納された未知データ 32の集合に適用して各未知データの所定ラベルの値を予測する (ステップ S 110)。最後に、各未知データの所定ラベルの予測結果と、記憶装置 4に格納されたデータ選択条件 43とに基づレ、て、未知データ 32の集合から次に学習すべきデータを選択データ 72として選択し、記憶装置 7に格納する。

[0097] 次に処理装置 2の処理制御手段 24は、記憶装置 4から終了条件 44を読み出して成立の可否を判定する（ステップ S 112)。そして、終了条件 44が成立していなければ、データ選択手段 29で選択されたデータを記憶装置 6または記憶装置 7から読み出して出力装置 8に出力し、利用者の入力装置 1の操作により、前記出力したデータのラベルの値を入力する（ステップ S 113)。次に処理装置 2のデータ更新手段 25は、ラベル値が入力されたデータを未知データ 32から取り除き、既知データ 31に追加する（ステップ S 114)。そして、制御を重み付き計算用データ生成手段 28に戻し、上述した処理と同様の処理を終了条件が成立するまで繰り返す。他方、処理装置 2の処理制御手段 24は、終了条件 44が成立していれば、記憶装置 4に格納された出力条件 45に応じて、ルール 71および既知データ 31などを出力装置 8から出力し (ステップ S 115)、処理を終える。

[0098] 本実施形態によれば、重み付き計算用データ生成手段 28を備えるように構成されているため、既知データ 31を補助データ 33より重要視したルール学習や類似度計算を行うことが可能である。補助データは、ラベルが未知であるか又は本来のラベル値とは異なるラベル値を利用者により設定されたもので、真の既知データほど重要ではないため、そのような違いを反映した処理が可能となることにより、より効率的な予測が可能となる。

[0099] 以上本発明の実施形態例について説明したが、本発明は以上の実施形態例にのみ限定されず、その他各種の付加変更が可能である。また、本発明の能動学習システムは、その有する機能をハードウェア的に実現することは勿論、コンピュータと能動学習用プログラムとで実現することができる。能動学習用プログラムは、磁気ディスクや半導体メモリ等のコンピュータ可読記録媒体に記録されて提供され、コンピュータの立ち上げ時などにコンピュータに読み取られ、そのコンピュータの動作を制御することにより、そのコンピュータを前述した各実施形態例における初期設定手段 21、計算用データ生成手段 22または重み付き計算用データ生成手段 28、データ選択手段 23またはデータ選択手段 29、処理制御手段 24およびデータ更新手段 25として機能させ、また図 3、図 6に示した処理を実行させる。

[0100] 本発明にあっては、従来の能動学習システムで行われているルール学習によるデータ選択とは別に、類似度計算によって次に学習するデータを選択する。ルール学習を正しく行うためには、様々なラベル値の既知データが必要になるが、類似度計算による選択では、所望ラベルが所望値であるデータが既知データとして全く存在しな

V、場合、所望ラベルが所望値以外の値である既知データと最も似て!/、な!/、未知データを選択することで、ランダム選択の場合に比べて効率良く所望データを発見すること力 Sできる。また、僅かでも所望データが存在すれば、所望データと最も似ている未知データを選択することで、ランダム選択の場合に比べて効率良く所望データを発見すること力 Sできる。さらに、所望データがない場合に、利用者が所望データに近いと類推するデータを補助データとして用いることも可能である。所望データが集まった後は、類似度計算による予測から従来と同様のルール学習による予測へ移行すること力 Sできる。

[0101] 上記実施形態能動学習システムによると、既知データ中に或るラベル値付近 (所望ラベル値）のデータ（所望データ）が全く存在しな!/、か、ごく僅力、しか存在しな!/、場合にも、ランダム選択の場合に比べて効率良く次に学習するデータを選択できる。

[0102] その理由は、未知データについて既知データとの類似度を計算し次に学習するデータを選択する手段を備えているためである。より具体的には、既知データの集合に存在する所望データ以外のデータと最も似て!/、な!/、データを未知データから選択したり、僅かに存在する所望データに最も似ているデータを未知データから選択するといった類似度による予測方法によってランダム選択よりは効率的に所望データの発見が fiえるためである。

[0103] また、利用者がもつ補助情報を利用して、より効率的に学習できる。その理由は、仮の所望データである補助データを使って類似度計算を行ったり、ルール学習が行えるためである。

[0104] 本発明を特別に示し且つ例示的な実施形態を参照して説明したが、本発明は、その実施形態及びその変形に限定されるものではない。当業者に明らかなように、本発明は、添付のクレームに規定される本発明の精神及び範囲を逸脱することなぐ種々の変更が可能である

[0105] 本出願は、 2006年 10月 19日出願に係る日本特許出願 2006— 284660号を基礎とし且つその優先権を主張するものであり、引用によってその開示の内容の全てを本出願の明細書中に加入する。

産業上の利用可能性

[0106] 本発明は、例えば、創薬におけるスクリーニングの場面において活性化合物を探索する場合などのように、多数の候補データからデータを選択して効率的に学習するような能動学習といった用途に適用できる。

Claims

請求の範囲

[1] ラベルの値が未知のデータについてラベルの値が所定の値であるデータとの類似度を計算し、該計算した類似度に基づいて次に学習するデータを選択する第 1のデータ選択部（26)と、ラベルの値が既知のデータに基づいてルールを学習し、該学習したルールをラベルの値が未知のデータの集合に適用して次に学習するデータを選択する第 2のデータ選択部（27)とを備えたことを特徴とする能動学習システム。

[2] ラベルの値が所定の値であるデータ力 S、ラベルの値が既知のデータまたはラベルの値が未知のデータのラベルを書き換えた補助データを含むことを特徴とする請求項 1記載の能動学習システム。

[3] ラベルの値が既知のデータと補助データとに異なったデータ重みを付与する手段（ 28)を備えることを特徴とする請求項 2記載の能動学習システム。

[4] 1以上の記述子と 1以上のラベルとで構成されるデータのうち、所望ラベルの値を既知とした既知データの集合と前記所望ラベルの値を未知とした未知データの集合とを記憶する記憶部（3)と、

前記記憶部に記憶された既知データの集合から前記所望ラベルの値が所定値を持つデータを所定データとして選択し、前記各未知データ毎に前記所定データとの類似度を計算し、該計算した類似度に基づいて次に学習すべきデータを前記未知データの集合から選択する第 1のデータ選択部動作と、前記記憶部に記憶された既知データに基づいて任意のデータの記述子の入力に対してそのデータの前記所望ラベルの値を計算するルールを学習し、該学習したルールを前記未知データの集合に適用して各未知データの前記所望ラベルの値を予測し、該予測結果に基づレ、て次に学習すべきデータを前記未知データの集合から選択する第 2のデータ選択動作とのうち、指定された側の動作を行うデータ選択手段（23)と、

前記データ選択手段で選択されたデータを出力装置（8)から出力し、前記所望ラベルの値が入力装置から入力されたデータを前記未知データの集合から取り除いて前記既知データの集合に追加する制御手段（24)と、を備えることを特徴とする能動学習システム。

[5] 1以上の記述子と 1以上のラベルとで構成されるデータのうち、所望ラベルの値を既知とした既知データの集合と前記所望ラベルの値を未知とした未知データの集合と既知データまたは未知データの所望ラベルの値を書き換えた補助データの集合とを記憶する記憶部（3)と、

前記記憶部に記憶された既知データの集合と補助データの集合とから計算用データを生成し前記記憶部に記憶する計算用データ生成手段（22)と、

前記記憶部に記憶された計算用データの集合力前記所望ラベルの値が所定値を持つデータを所定データとして選択し、前記各未知データ毎に前記所定データとの類似度を計算し、該計算した類似度に基づいて次に学習すべきデータを前記未知データの集合力選択する第 1のデータ選択動作と、前記記憶部に記憶された計算用データに基づいて任意のデータの記述子の入力に対してそのデータの前記所望ラベルの値を計算するルールを学習し、該学習したルールを前記未知データの集合に適用して各未知データの前記所望ラベルの値を予測し、該予測結果に基づレ、て次に学習すべきデータを前記未知データの集合から選択する第 2のデータ選択動作とのうち、指定された側の動作を行うデータ選択手段（23)と、

1以上の記述子と 1以上のラベルとで構成されるデータのうち、所望ラベルの値を既知とした既知データの集合と前記所望ラベルの値を未知とした未知データの集合と既知データまたは未知データの所望ラベルの値を書き換えた補助データの集合とを記憶する記憶部（3)と、

前記記憶部に記憶された既知データの集合と補助データの集合とから、重み付きの計算用データを生成し前記記憶部に記憶する計算用データ生成手段（28)と、前記記憶部に記憶された重み付きの計算用データの集合から前記所望ラベルの値が所定値を持つデータを所定データとして選択し、前記各未知データ毎に前記所定データとの類似度をデータの重みを考慮して計算し、該計算した類似度に基づいて次に学習すべきデータを前記未知データの集合から選択する第 1のデータ選択動作と、前記記憶部に記憶された重み付きの計算用データに基づいて任意のデータの記述子の入力に対してそのデータの前記所望ラベルの値を計算するルールをデータの重みを考慮して学習し、該学習したルールを前記未知データの集合に適用して各未知データの前記所望ラベルの値を予測し、該予測結果に基づレ、て次に学習すべきデータを前記未知データの集合から選択する第 2のデータ選択動作とのうち、指定された側の動作を行うデータ選択手段（29)と、

前記データ選択手段で選択されたデータを出力装置から出力し、前記所望ラベルの値が入力装置から入力されたデータを前記未知データの集合から取り除いて前記既知データの集合に追加する制御手段（24)と、を備えることを特徴とする能動学習システム。

[7] コンピュータを用いた能動学習方法であって、

ラベルの値が未知のデータについてラベルの値が所定の値であるデータとの類似度を計算し、

該計算した類似度に基づいて次に学習するデータを選択する能動学習サイクルを 1サイクル以上繰り返した後、ラベルの値が既知のデータに基づ!/、てルールを学習し該学習したルールを、ラベルの値が未知のデータの集合に適用して、次に学習するデータを選択する能動学習サイクルへ移行する能動学習方法。

[8] ラベルの値が所定の値であるデータ力 S、ラベルの値が既知のデータまたはラベルの値が未知のデータのラベルを書き換えた補助データを含むことを特徴とする請求項 7記載の能動学習方法。

[9] ラベルの値が既知のデータと補助データとに異なったデータ重みを付与することを特徴とする請求項 8記載の能動学習方法。

[10] コンピュータを用いた能動学習システムのためのプログラムであって、前記コンビュータに、

ラベルの値が未知のデータについてラベルの値が所定の値であるデータとの類似度を計算し、該計算した類似度に基づいて次に学習するデータを選択する能動学習サイクルを 1サイクル以上繰り返し実行する処理と、ラベルの値が既知のデータに基づ!/、てルールを学習し、該学習したルールをラベルの値が未知のデータの集合に適用して次に学習するデータを選択する能動学習サイクルを実行する処理と、を順次に行わせるための能動学習プログラム。

[11] ラベルの値が所定の値であるデータ力 S、ラベルの値が既知のデータまたはラベルの値が未知のデータのラベルを書き換えた補助データを含むことを特徴とする請求項 10記載の能動学習プログラム。

[12] ラベルの値が既知のデータと補助データとに異なったデータ重みを付与することを特徴とする請求項 11記載の能動学習プログラム。