WO2005048184A1

WO2005048184A1 - 能動学習方法およびシステム

Info

Publication number: WO2005048184A1
Application number: PCT/JP2004/014917
Authority: WO
Inventors: Tsutomu Osoda; Yoshiko Yamashita
Original assignee: Nec Corporation
Priority date: 2003-11-17
Filing date: 2004-10-08
Publication date: 2005-05-26
Also published as: JPWO2005048184A1; GB0611998D0; US20070094158A1; GB2423395A; JP2009104632A; US7483864B2

Abstract

　既知データをサンプリングし、既知データに対しては複数の学習機械で独立に学習を行い、未知データに対しては次に学習すべきデータを選択する能動学習システムは、既知データをサンプリングする時に重み付けを行うためのサンプリング重み付け装置と、複数の学習機械の学習結果を統合する際に重み付けを行うための予測重み付け装置と、次に学習すべきデータを選択するときに重み付けを行うためデータ重み付け装置と、を備える。各重み付け装置は、データ数に極端に偏りが発生しているときに、その比重を重くするように重み付けを行う。

Description

明細書

能動学習方法およびシステム

技術分野

[0001] 本発明は、能動学習方法及び能動学習システムに関する。

背景技術

[0002] 能動学習とは、安倍らによれば、学習者が学習データを能動的に選択することにできる学習形態である ([1]安部直榭、馬見塚拓， "能動学習と発見科学"、森下真一 '宫野悟編、 "発見科学とデータマイニング"、共立出版、 2001年 6月、

ISBN4-320-12018-3, pp. 64-71)。一般に学習を能動的に行うことにより、データ数や計算量の意味で学習の効率性を向上することができることが知られている。能動学習を行うシステムを能動学習システムと呼ぶ。例えば、集められたデータに対して統計的に分析を行い、ラベル値が未知のデータに対しては、過去のデータの傾向から結果の予測を行うような学習システムを考える。そのような学習システムには、能動学習システムを適用することができる。以下、この種の能動学習システムの概略を説明する。

[0003] ラベル値が未知のデータとラベル値が既知のデータが存在するものとする。ラベル値が既知のデータで学習を行!、、その学習した結果をラベル値が未知のデータに適用する。そのときに、ラベル値が未知のデータ力も効率的に学習を行えるようなデータを学習システムが選択し、そのデータを出力する。出力されたデータに対して実験するなり調査するなりして、ラベル値が未知のデータに対する結果を得て、それを入力したのちラベル値が既知のデータに混ぜて、同じように学習を行う。その一方で、ラベル値が未知のデータの集合からは、結果が得られたデータを削除する、というものである。能動学習システムでは、そのような動作を繰り返して行っていく。

[0004] また、データは以下のように記述されている。 1つのデータは、複数の属性とラベルというもので記述される。たとえば有名な評価データの中には、 "golf"というものがある。それはゴルフをプレーする力しないかを判定するものであって、天気、温度、湿度、風の強さという 4つのものから記述されている。天気は、「晴れ」、「曇り」または「雨」、風は、「有」または「無」という値をとる。気温と湿度は実数値である。たとえば 1つのデータは、天気：晴れ、温度： 15度、湿度: 40%、風:無、プレー：する、というように書かれている。そのデータの場合、天気、温度、湿度、風の 4つを属性と呼ぶ。また、プレ一する、しないという結果のことをラベルと呼ぶ。本明細書では、ラベルがとりうる値が離散値の場合には、特にクラスと呼ぶ。

[0005] ここで、さまざまな用語を定義しておく。

[0006] 仮にラベルは 2値であるとしておく。その 2値のうち注目しているラベルの方を正例、それ以外のものを負例とする。またラベルが多値の場合には、注目している 1つのラベル値を正例、それ以外のすべてのラベル値を負例とする。またラベルがとりうる値が連続値の場合には注目する値付近にラベル値が存在するとき正例と呼び、それ以外のところにあるときに負例と呼ぶことにする。

[0007] 学習の精度を測る指標としては、 ROC (受信者動作特性: receiver operating

characteristic)曲線、ヒット率、正解率の推移などがある。以下の説明では、これら 3 つの指標を用いて評価を行う。

[0008] ROC曲線は、以下のように定義される。

横軸:負例のうち正例と判断されたデータの個数 Z全負例数，

縦軸：正例のうち正例と判断されたデータの個数 Z全正例数.

ランダムな予測を行ったとき、 ROC曲線は、原点と（1, 1)を結ぶ対角線となる。

[0009] ヒット率は以下のように定義される。

横軸：ラベル値が既知のデータ数 z (ラベル値が未知 +既知のデータ数），縦軸：ラベル値が既知のデータの中の正例数 z全正例数.

ランダムな予測を行ったとき。ヒット率は、原点と（1, 1)を結ぶ対角線となる。また、限界は原点と (正例数 Z (ラベル値が未知 +既知のデータ数)， 1)を結んだ線となる

[0010] 正解率の推移は以下のように定義される。

横軸：ラベル値が既知のデータ数，

縦軸：正しく判断されたデータの個数 zラベル値が既知のデータ数.

[0011] 後述する「発明を実施するための最良の形態」においては、これらの指標を用いて、本発明による能動学習システムを評価している（図 3A— 3C、 5、 7、 9、 11、 13A、 13B、 15A、 15B、 18を参照）。

[0012] またエントロピーとは、以下のように定義される。各 P— iは iである確率を示して!/、るとする。

[0013] エントロピー =—(_p—l * log (P一 1) +p_2 * log (P一 2) H—— hP_n * log (P_ n) )

[0014] なお、従来の能動学習システムを開示するものとしては、日本国特許公開：特開平 11— 316754号公報 [2]に開示されたものがある。この公報に開示の能動学習システムは、学習の精度を向上するために、下位アルゴリズムに学習を行わせる学習段階と、学習精度をブースティングにより向上させるブースティング段階と、複数の入力候補点に対する関数値予測段階と、重みの総和が最大の出力値の重み和と、重みの総和が次に大きい出力値の重み和との差が最も小さいような入力点を選択する入力点指定段階と、を行うことを特徴とするものである。

[0015] 安倍らはさらに、複数の学習機械を備えるシステムを使用し、各学習機械はデータ力もランダムにサンプリングしてそのデータを学習し、ラベル値が未知のデータに対してはそれぞれの学習機械が予測を行ってもっとも分散が大きくなるような点を次に学習すべき点として出力するような手法を開示している [1]。

発明の開示

発明が解決しょうとする課題

[0016] し力しながら上述した従来の手法は、次に学習すべきデータとして出力するものをユーザーの意思で制御できない、という課題を有する。その理由は、これらの従来の手法は、なるべく早く学習精度を向上することを目標とするために、次の候補点として最も分散の大きな点や、下位の学習機械力もの出力が割れる点のみを選んでいるからである。

[0017] 従来の手法は、学習データにおいて、対象となる値やクラスのデータ数が他のクラスゃ値のものに比べてきわめて低ヽ状況下にお、て、対象となってヽる値やクラスの正解率を得るのが困難である、という課題も有する。その理由は、今までに開発されてきた下位学習アルゴリズムが極端な個数の不平等な状況までを考察して設計されたものでないことにあるば力りでなぐ従来の能動学習アルゴリズムも同じようにそのような状況を想定して、な、ことにある。

[0018] 従来の手法が用いる能動学習アルゴリズムには、入力すべきデータの選択の段階において、似たようなデータを入力点として数多く出力してしまう、という課題がある。その理由もやはり、従来の能動学習アルゴリズム力下位の学習アルゴリズムが学習したものを十分に活力しきるようなメカニズムを有していないことにある。

[0019] さらにこれらの従来の手法は、システムにおいて最終判断の方法が予め定められているために、学習の精度を変えられない、という課題も有する。

[0020] そこで本発明の目的は、能動学習法の精度を向上させつつ、利用者の意思で精度を制御することができ、また、興味のあるデータを先に抜き出すという機能なども備える能動学習方法を提供することにある。

[0021] そこで本発明の別の目的は、能動学習法の精度を向上させつつ、利用者の意思で精度を制御することができ、また、興味のあるデータを先に抜き出すという機能なども備える能動学習システムを提供することにある。

課題を解決するための手段

[0022] 本発明の目的は、ラベル値が既知のデータを既知データとしラベル値が未知のデータを未知データとして既知データの集合と未知データの集合とを格納する記憶装置と、複数の学習機械とを使用する能動学習方法であって、複数の学習機械が、既知データに関し、記憶装置力もそれぞれ独立にサンプリングを行った後に学習を行う段階と、学習の結果として、複数の学習機械の出力結果を統合して出力する段階と、複数の学習機械が、記憶装置力未知データを取り出して予測を行う段階と、予測の結果に基づいて次に学習すべきデータを計算して出力する段階と、次に学習すベきデータに対応するラベル値を入力する段階と、ラベル値が入力されたデータを未知データの集合から削除して既知データの集合に追加する段階と、を有し、既知データをサンプリングするとき、複数の学習機械による学習の結果を統合するとき、及び、複数の学習機械による予測から次に学習すべきデータを計算するとき、のうちの少なくとも 1つにおいて、均等でない重み付けを実行する能動学習方法によって達成される。 [0023] 本発明の能動学習方法における重み付けでは、例えば、データ数に極端に偏りが発生しているときに、その比重を重くするようにする。さらにこの方法では、次に予測のために学習装置に入力すべきデータの選択において、選ばれてきた候補のデータの中力空間的なデータの分布を考慮に入れながらさらに選び出すというデータの分布に広がりを持たせる機構を付け加えることによって、お互いに似たようなデータを出力することを避けることができる。

[0024] 本発明の他の目的は、ラベル値が既知のデータを既知データとしラベル値が未知のデータを未知データとして既知データの集合と未知データの集合とを格納する記憶装置と、既知データの学習及び未知データの予測を行う複数の学習機械と、学習機械ごとに設けられ、記憶装置力既知データをサンプリングして対応する学習機械に入力する複数のサンプリング装置と、各学習機械が既知データに基づいて行った学習の結果を統合する第 1の統合手段と、各学習機械が未知データに基づいて行つた予測の結果から次に学習すべきデータを計算して出力する第 2の統合手段と、次に学習すべきデータに対応するラベル値を入力する結果入力手段と、ラベル値が入力されたデータを未知データの集合から削除して既知データの集合に追加する制御手段と、を有するとともに、（1)サンプリング装置ごとにサンプリング時の重みを設定するサンプリング重み付け手段、（2)第 1の統合手段で学習の結果を統合する際に用いられる重みを設定する予測重み付け手段、（3)第 2の統合手段で次に学習すベきデータを選択する際に用いられる重みを設定するデータ重み付け手段、及び (4) 既知データ及び未知データにおいてグループ分けを行うグループ生成手段のうちの少なくとも 1つを有する能動学習システムによって達成される。

[0025] 本発明の能動学習システムにおける重み付けでは、例えば、データ数に極端に偏りが発生しているときに、その比重を重くするようにする。

[0026] 本発明では、（1)学習データをサンプリングする際にデータに重み付けを行う、 (2) 入力候補点から入力点を選び出す際にデータに重み付けを行う、及び (3)入力されたデータに対して予測を行う際にデータに重み付けを行う、の計 3通りの重み付けのうちの少なくとも 1つを採用するしている。これによつて、本発明によれば、対象となつているデータの重みを重くすることで重点的に学習を行うことができるので、対象となつているデータの、全体に対する割合が極めて低い状況下において、マイニングの精度を向上させながら、カバー率を向上させることができる。また、対象となっているデータの重みを軽くすることで、対象となっているものが未発見の領域の学習を行つて!、くことが可能になるため、対象となって!/、るデータがさまざまな特徴に基づヽてヽるとき、それを、早期に発見できる。

[0027] 従来の能動学習法は、データの予測を行うときに均等に学習結果を扱っているのに対し、本発明によれば、重み付けすることが可能なため、重みを変えることで精度を制御することが可能になり、任意の精度で学習することが可能になる。従来の方法では、次に学習すべきデータが、空間的にある領域に固まる傾向にあるが、本発明では、それらのデータが空間的に散らばるような機構を設けることにより、従来の能動学習法の欠点を修正でき、正解率を従来のものよりも高めることができる。

図面の簡単な説明

[0028] [図 1]図 1は、本発明の第 1の実施形態の能動学習システムの構成を示すブロック図である。

[図 2]図 2は、図 1に示すシステムを用いた能動学習法の処理を示すフローチャートである。

[図 3A]図 3Aは、図 1に示すシステムによる能動学習法と従来の能動学習法とにおける学習精度を比較する、ヒット率を示すグラフである。

[図 3B]図 3Bは、図 1に示すシステムによる能動学習法と従来の能動学習法とにおける学習精度を比較する、 ROC曲線を示すグラフである。

[図 3C]図 3Cは、図 1に示すシステムによる能動学習法と従来の能動学習法とにおける学習精度を比較する、正解率の推移を示すグラフである。

[図 4]図 4は、本発明の第 2の実施形態の能動学習システムの構成を示すブロック図である。

[図 5]図 5は、図 4に示すシステムによる能動学習法と従来の能動学習法とにおける学習精度を比較する、 ROC曲線のグラフである。

[図 6]図 6は、本発明の第 3の実施形態の能動学習システムの構成を示すブロック図である。 [図 7]図 7は、図 6に示すシステムによる能動学習法と従来の能動学習法とにおける学習精度を比較する、 ROC曲線のグラフである。

[図 8]図 8は、本発明の第 4の実施形態の能動学習システムの構成を示すブロック図である。

[図 9]図 9は、図 8に示すシステムによる能動学習法と従来の能動学習法とにおける学習精度を比較する、正解率推移を示すグラフである。

[図 10]図 10は、本発明の第 5の実施形態の能動学習システムの構成を示すブロック図である。

[図 11]図 11は、図 10に示すシステムによる能動学習法と従来の能動学習法とにおける学習精度を比較する、 ROC曲線のグラフである。

[図 12]図 12は、本発明の第 6の実施形態の能動学習システムの構成を示すブロック図である。

[図 13A]図 13Aは、図 12に示すシステムによる能動学習法と従来の能動学習法とにおける学習精度を比較する、ヒット率を示すグラフである。

[図 13B]図 13Bは、図 12に示すシステムによる能動学習法と従来の能動学習法とにおける学習精度を比較する、 ROC曲線を示すグラフである。

[図 14]図 14は、本発明の第 7の実施形態の能動学習システムの構成を示すブロック図である。

[図 15A]図 15Aは、図 14に示すシステムによる能動学習法と従来の能動学習法とにおける学習精度を比較する、ヒット率を示すグラフである。

[図 15B]図 15Bは、図 14に示すシステムによる能動学習法と従来の能動学習法とにおける学習精度を比較する、 ROC曲線を示すグラフである。

[図 16]図 16は、本発明の第 8の実施形態の能動学習システムの構成を示すブロック図である。

[図 17]図 17は、図 16に示すシステムを用いた能動学習法の処理を示すフローチヤートである。

[図 18]図 18は、図 16に示すシステムによる能動学習法と従来の能動学習法とにおける学習精度を比較する、正解率推移を示すグラフである。 [図 19]図 19は、本発明の第 9の実施形態の能動学習システムの構成を示すブロック図である。

発明を実施するための最良の形態

[0029] 本発明の能動学習システムは、（1)学習データをサンプリングする際にデータに重み付けを行う、（2)入力候補点力入力点を選び出す際にデータに重み付けを行う、及び（3)入力されたデータに対して予測を行う際にデータに重み付けを行う、の計 3通りの重み付けのうちの少なくとも 1つを採用することにより、上述した本発明の目的を達しようとするものである。これらの重み付けにおいては、データ数に極端に偏りが発生しているときに、その比重を重くするように重み付けを行っている。本発明は、どの段階で重み付けを行うかによつて種々の実施形態が考えられる。

[0030] また、本発明では、次に学習すべきデータを選択する際に、選ばれてきた候補のデ一タカ空間的なデータの分布を考慮に入れながらさらに選び出すという、データの分布に広がりを持たせるメカニズムを付けカ卩えることによって、お互いに似たようなデータを出力することを避けることができる。このようなメカニズムの有無によっても、本発明は種々の実施形態が考えられる。

[0031] 以下、このような各種の実施形態について説明する。

[0032] 《第 1の実施形態》

図 1に示す本発明の第 1の実施形態の能動学習システムは、ラベル値が既にわかつているデータ (すなわち既知データ）を蓄えておく記憶装置 101と、記憶装置 101 内の既知データをサンプリングする時に重み付けを行うためのデータを生成するサンプリング重み付け装置 102と、予測を行う時に重み付けを行うためのデータを生成する予測重み付け装置 103と、次に学習すべきデータを選択するときに重み付けを行うためのデータを生成するデータ重み付け装置 104と、複数の学習機械 106と、記憶装置 101からデータをサンプリングして対応する学習機械 106に対してデータを供給する複数のサンプリング装置 105と、複数の学習機械 106からの学習結果をまとめる規則統合装置 107と、規則統合装置 107に接続した出力装置 111と、複数の学習機械 106での結果に基づき次に学習すべきデータを計算するデータ統合装置 108と、データ統合装置 108に接続した出力装置 112と、次に学習すべきデータの出力結果に対て結果を入力する結果入力装置 113と、ラベル値がわ力つて、な、データ（すなわち未知データ）を格納する記憶装置 109と、この能動学習システム全体の制御を行う制御装置 110と、を備えている。

[0033] 制御装置 110は、結果入力装置 113によって入力された結果を例えば表形式のものとしてまとめ、記憶装置 109内における該当するデータを削除し、その代わりに、結果が加えられたデータを記憶装置 101内に格納するという制御を行う。サンプリング装置 105と学習機械 106とは、ここでは、 1対 1の関係で設けられている。また、各学習機械 106には、対応するサンプリング装置 105からデータが供給されるとともに、記憶装置 109からは未知データが供給される。規則統合装置 107に接続した出力装置 111からは、学習した規則が出力され、データ統合装置 108に接続した出力装置 112からは、次に学習すべきデータが出力される。

[0034] サンプリング重み付け装置 102は、各サンプリング装置 105に対して、記憶装置 10 1に格納された既知データに基づき、サンプリング時にデータに対して重み付けを行うための重み付けデータを生成して供給する。予測重み付け装置 103は、記憶装置 101に格納された既知データに基づき、規則統合装置 107において各学習機械 10 6ごとの学習結果をまとめる際に重み付けを行うための重み付けデータを生成し、生成した重み付けデータを規則統合装置 107に供給する。同様にデータ重み付け装置 104は、記憶装置 101に格納された既知データに基づき、データ統合装置 108において次に学習すべきデータを選択して出力する際に重み付けを行うための重み付けデータを生成し、生成した重み付けデータをデータ統合装置 108に供給する。

[0035] ここで、サンプリング重み付け装置 102、予測重み付け装置 103及びデータ重み付け装置 104のそれぞれによる重み付けを説明する。これらの重み付け装置 102— 10 4による重み付けとしては、均等でない重み付けであれば種々のものを使用できる。

[0036] サンプリング重み付け装置 102での重み付けとしては、例えば、（1)既知データにおけるクラスあるいは値に応じた重みを設定する、（2)ラベル値が離散値を取る場合に、各サンプリング装置 105が、独立して、あるクラスのデータの全てとそれ以外のクラスのデータ力もランダムにサンプリングするように重みを設定する、（3)ラベル値が連続値を取る場合に、各サンプリング装置 105が、特定のラベルの値の付近のデータの全てとそれ以外のラベル値のデータ力もランダムにサンプリングするように重みを設定する、などが挙げられる。

[0037] 予測重み付け装置 103での重み付けとしては、例えば、各学習機械 106が出力した結果につ!、てクラス (ラベル値が離散値を取る場合)ごとあるいは数値における区間（ラベル値が連続値を取る場合)ごとに重みを決定する方法がある。

[0038] データ重み付け装置 104での重み付けとしては、例えば、（1)ラベル値が離散値をとる場合にクラスごとの頻度力も計算されるばらつき具合に応じて重みを割当てる、 ( 2)各学習機械 106での結果として得られる値の分散に応じて重みを割当てる、（ 3) ラベル値が離散値をとる場合にクラスごとの頻度力計算されるエントロピーに応じて重みを割当てる、などが挙げられる。ばらつき具合に応じて重みを割当てる場合には、ばらつき具合が最大のところのみが最大の重みになることは除くようにしてもょ、。同様に、分散あるいはエントロピーに応じて重みを割当てる場合には、それら分散あるいはエントロピーが最大のところのみが最大の重みになることは除くようにしてもよい。さらに、これらの重みとは別個に各学習機械 106で得られる結果そのものに対して重みを割当てるようにしてもよい。

[0039] 次に、本実施形態の能動学習システムの動作について、図 2に示すフローチャートを利用して説明する。ここでは、データは表形式で与えられるものとする。

[0040] まず、ステップ 201において、ラベル値が既知のデータは記憶装置 101に、ラベル値が未知のデータは記憶装置 109に記憶される。その結果、既知データの集合が記憶装置 101に格納され、未知データの集合が記憶装置 109に格納されることになる

[0041] 次に、ステップ 202において、サンプリング重み付け装置 102は、記憶装置 101から送られてきたデータに基づヽて重み (すなわち重み付けデータ）を生成し、ある、はそのような重みを読み込み、各サンプリング装置 105に送る。各サンプリング装置 1 05は、サンプリング重み付け装置 102から送られてきた重みにしたがって重み付けを行いながら、記憶装置 101内の既知データをサンプリングし、サンプリングしたデータを対応する学習機械 106に送る。各学習機械 106は、ステップ 203において、サンプリング装置力送られてきたデータに基づいて学習を実行する。 [0042] 記憶装置 101からは予測重み付け装置 103にもデータが送られており、ステップ 2 04において、予測重み付け装置 103は、記憶装置 101から送られてきたデータに基づ、て重み (すなわち重み付けデータ）を生成し、ある、はそのような重みを読み込み、それらを規則統合装置 107へ送る。規則統合装置 107は、重み付けデータに基づいて、各学習機械 106からの学習結果に重み付けを行いながらこれらの学習結果をまとめる。このとき、各学習機械 106が出力した結果についてクラス (ラベル値が離散値を取る場合)ごとあるいは数値における区間 (ラベル値が連続値を取る場合)ごとに頻度を計算し、頻度と上述した重みとを乗算し、その値がもっとも大きな値となっているものを予想値として出力する。規則統合装置 107は、学習結果をまとめた結果を規則として出力装置 111に送る。

[0043] 次に各学習機械 106は、ステップ 205において、記憶装置 109に格納されたラベル値が未知のデータに対して予測を行い、その結果は、データ統合装置 108に送られる。このとき、記憶装置 101からはデータ重み付け装置 104にもデータが送られており、ステップ 206において、データ重み付け装置 104は、記憶装置 101から送られてきたデータに基づヽて重み (すなわち重み付けデータ）を生成し、あるいはそのような重みを読み込み、それらをデータ統合装置 108へ送る。データ統合装置 108は、重み付けデータに基づいて、各学習機械 106からの予測結果に重み付けを行いな力これらの結果をまとめ、次に学習すべきデータを選択する。次に学習すべきデータの選択方法としては、以下のようなものが挙げられる。例えば、（1)ばらつき具合あるいはエントロピーに応じて重みが割当てられている場合には、各学習機械 106が出力した結果力もそのクラスごとに頻度を計算し、頻度を元にばらつき具合あるいはエントロピーを示す数値を計算し、ばらつき具合あるいはエントロピーに応じて割り当てられた重みが重い順番にデータを選択する、（2)分散に応じて重みが割当てられている場合には、各学習機械 106が出力した結果力その分散を計算し、分散に応じて割り当てられた重みが重い順番にデータを選択する、 (3)ばらつき具合あるいはエントロピーと結果とのそれぞれに応じて重みが割当てられている場合には、各学習機械 106が出力した結果力もそのクラスごとに頻度を計算し、頻度を元にばらつき具合あるいはエントロピーを示す数値を計算し、ばらつき具合あるいはエントロピーに応じて割り当てられた重みと結果に割り当てられた重みとをあわせて重みの重、順番にデータを選択する、（4)分散と結果のそれぞれに応じて重みが割当てられている場合には、各学習機械 106が出力した結果力その分散を計算し、分散に応じて割り当てられた重みと結果に割り当てられた重みとをあわせて重みの重い順番にデータを選択する。データ統合装置 108は、その結果を次に学習すべきデータとして出力装置 112に送る。

[0044] 次に、ステップ 207において、次に学習すべきデータに対する結果 (ラベル値）が、結果入力装置 113を介し、人手によって、あるいはコンピュータにより入力される。入力された結果は制御装置 110に送られ、制御装置 110は、その結果が入力されたデータを記憶装置 109から削除し、その代わりに記憶装置 101に記憶させる。

[0045] 以後、上述の処理が繰り返され、能動学習が進行する。この場合、これらの処理は、最長の場合で記憶装置 109内に未知データがなくなるまで行われる力その前に打ち切るようにしてもよい。後述するように本実施形態によれば、迅速に"よい結果"を得ることができるので、例えば適当な反復回数を設定してそこで処理を打ち切るようにすることができる。サンプリング重み付け装置 102、予測重み付け装置 103及びデータ重み付け装置 104は、 Vヽずれも均等でな 1、重み付けを行う。

[0046] 図 3A— 3Cは、第 1の実施形態の能動学習システムの効果を説明している。

[0047] 図 3Aにおいて、破線 301は、従来の能動学習法を用いた場合のヒット率を示し、実線 302は、本実施形態の能動学習システムを用いた場合のヒット率を示している。本実施形態によれば、従来の能動学習法よりも早期の段階において、対象となっているクラス (値）のデータを見つけて!/、ることがわかる。

[0048] 図 3Bにおいて、破線 303は、従来の能動学習法を用いた場合の ROC曲線を示し、実線 304は、本実施形態の能動学習システムを用いた場合の ROC曲線を示している。本実施形態によれば、従来の能動学習法に比べて高い精度で学習を行えていることがわ力る。さらに、従来の能動学習法では、精度は、曲線上のある 1点に存在するので、どのような精度にするのかを外部から制御することができな力つた。これに対して本実施形態の手法では、予測重み付け装置 103における重みを変えることで、任意の精度を設定できる。図 3Bには、図示 A— Dで示される 4つの直線が存在するが、本実施形態では、任意の位置に直線を設定できるので、任意の精度を設定することができる。

[0049] 図 3Cにおいて、破線 305は、従来の能動学習法を用いた場合の正解率の推移を示し、破線 306は、本実施形態の能動学習システムを用いた場合における正解率の推移を示している。本実施形態によれば、対象となっているクラス (値)のデータの重みを重くすることによって、そのクラスに関する正解率を上げることができることがわかる。

[0050] 《第 2の実施形態》

次に、本発明の第 2の実施形態について、図 4を参照して説明する。図 4に示す能動学習システムは、第 1の実施形態の能動学習システムと同様のものであるが、予測重み付け装置とデータ重み付け装置とが設けられていない点で、第 1の実施形態のものと相違する。予測重み付け装置とデータ重み付け装置とが設けられていないことにより、規則統合装置 107では、学習機械 106から出てきた結果がすべて均等に取り扱われ、多数決などの手段によって最終的な規則が出力されることになる。具体的には、規則統合装置 107は、各学習機械 106が出力した結果について、ラベル値が離散値を取る場合にはクラスごとに、あるいはラベル値が連続値を取る場合には数値における区間ごとに、頻度を計算し、その値力 Sもっとも大きな値となっているものを予想値として出力する。

[0051] またデータ統合装置 108においも同様に出力結果が均等に扱われ、もっとも判断に迷うデータが出力されることになる。具体的には、例えば、（1)ラベル値が離散値を取る場合に、各学習機械 106が出力した結果力そのクラスごとに頻度を計算し、頻度を元にばらつき具合を示す数値を計算し、あるクラスと判断されたデータとばらつき具合を示す指標が最大もしくは最大付近のデータから、次に学習すべきデータを選択する。（2)ラベル値が連続値を取る場合に、各学習機械 106が出力した結果からその分散を計算し、ある数値の付近にあるデータと分散が最大もしくは最大付近のデータから、次に学習すべきデータを選択する。（3)各学習機械 106が出力した結果力もその分散を計算し、特定のクラス以外のデータ (あるいはある数値付近になヽデータ）であってかつ"分散が最小もしくは最小に近い"データから、次に学習すべきデータを選択する。

[0052] 図 5は、第 2の実施形態の能動学習システムの効果を示している。図において、破線 307は、従来の能動学習法を用いた場合の学習精度を表す ROC曲線であり、実線 308は、本実施形態の能動学習システムにより、対象となっているクラス (値)のデータが多く選ばれるようなサンプリングをしたとき学習精度を示す ROC曲線である。本実施形態によれば、従来の能動学習法よりも高い精度が得られることがわかる。

[0053] 《第 3の実施形態》

次に、本発明の第 3の実施形態について、図 6を参照して説明する。図 6に示す能動学習システムは、第 1の実施形態の能動学習システムと同様のものである力サンプリング重み付け装置とデータ重み付け装置とが設けられていない点で、第 1の実施形態のものと相違する。サンプリング重み付け装置とデータ重み付け装置とが設けられていないことにより、各サンプリング装置 105では既知のデータがすべて均等に取り扱われ、ランダムなサンプリングが行われる。またデータ統合装置 108では、第 2の実施形態の場合と同様に、出力結果が均等に扱われ、もっとも判断に迷うデータが出力されること〖こなる。

[0054] 図 7は、第 3の実施形態の能動学習システムの効果を示している。図において、線 3 09は、この能動学習システムの学習精度を表す ROC曲線を示している。従来の能動学習法では学習結果を統合するときに均等に結果を扱っていたため、ある特定の精度でしか能動学習システムを構築することができな力た。本実施形態によれば、任意の重みで学習結果を統合することができるため、例えば、図示 A、 B、 C、 Dのような精度でシステムを構成することができる。

[0055] 《第 4の実施形態》

次に、本発明の第 4の実施形態について、図 8を参照して説明する。図 8に示す能動学習システムは、第 1の実施形態の能動学習システムと同様のものである力サンプリング重み付け装置と予測重み付け装置とが設けられていない点で、第 1の実施形態のものと相違する。サンプリング重み付け装置と予測重み付け装置とが設けられていないことにより、各サンプリング装置 105では既知のデータがすべて均等に取り扱われ、ランダムなサンプリングが行われる。また、規則統合装置 107では、第 2の実施形態の場合と同様に、学習機械 106から出てきた結果がすべて均等に取り扱われ、多数決などの手段によって最終的な規則が出力されることになる。

[0056] 図 9は、第 4の実施形態の能動学習システムの効果を示している。図において、破線 310は従来の能動学習法を用いた場合の正解率の推移を示し、破線 311は、本実施形態の能動学習システムを用いた場合における正解率の推移を示して、る。本実施形態では、サンプリングのときの重みとして、次に実験すべきデータがなるべく散らばるような重み付けを行っている。このような重み付けを用いることにより、従来の能動学習法よりも早く学習していることわ力る。

[0057] 《第 5の実施形態》

次に、本発明の第 5の実施形態について、図 10を参照して説明する。図 10に示す能動学習システムは、第 1の実施形態の能動学習システムと同様のものであるが、データ重み付け装置が設けられていない点で、第 1の実施形態のものと相違する。データ重み付け装置が設けられていないことにより、データ統合装置 108では、第 2の実施形態の場合と同様に、出力結果が均等に扱われ、もっとも判断に迷うデータが出力されること〖こなる。

[0058] 図 11は、第 5の実施形態の能動学習システムの効果を示して、る。図にお、て、破線 312は、従来の能動学習法を用いた場合の ROC曲線を示し、破線 313は、本実施形態の能動学習システムを用いた場合における ROC曲線を示している。本実施形態では、サンプリング時には、あるクラス (値)の重みが重くなるような重み付けを行い、次に学習すべきデータを選択する時には、同様に、そのクラスの重みが重くなるような重み付けを行っている。図 11から分力るように、本実施形態によれば、学習の精度が向上し、また、予測重み付け装置の重みを変えることで、図示 A、 B、 C、 Dにあるように、任意の精度で学習を行うことができるようになる。

[0059] 《第 6の実施形態》

次に、本発明の第 6の実施形態について、図 12を参照して説明する。図 12に示す能動学習システムは、第 1の実施形態の能動学習システムと同様のものであるが、予測重み付け装置が設けられていない点で、第 1の実施形態のものと相違する。予測重み付け装置が設けられていないことにより、規則統合装置 107では、第 2の実施形態の場合と同様に、学習機械 106から出てきた結果がすべて均等に取り扱われ、多数決などの手段によって最終的な規則が出力されることになる。

[0060] 図 13A、 13Bは、第 6の実施形態の能動学習システムの効果を示している。図 13A において、破線 314は、従来の能動学習法を用いた場合のヒット率を示し、実線 315 は、本実施形態の能動学習システムを用いた場合におけるヒット率を示している。図 13Bにおいて、破線 316は、従来の能動学習法を用いた場合の ROC曲線を示し、実線 317は、本実施形態の能動学習システムを用いた場合の ROC曲線を示している。本実施形態においては、サンプリング時には、あるクラス (値)の重みが重くなるように重み付けを行っており、次に学習すべきデータを選択するときも、同様に、そのクラスの重みが重くなるように重み付けを行っている。本実施形態によれば、対象となるクラス (値)の 9割を従来のものよりも早く発見でき、また、学習精度も向上していることがわカゝる。

[0061] 《第 7の実施形態》

次に、本発明の第 7の実施形態について、図 14を参照して説明する。図 14に示す能動学習システムは、第 1の実施形態の能動学習システムと同様のものであるが、サンプリング重み付け装置が設けられていない点で、第 1の実施形態のものと相違する。サンプリング重み付け装置が設けられていないことにより、各サンプリング装置 105 では既知のデータがすべて均等に取り扱われ、ランダムなサンプリングが行われる。

[0062] 図 15A、図 15Bは、第 7の実施形態の能動学習システムの効果を示している。図 1 5Aにおいて、破線 318は、従来の能動学習法を用いた場合のヒット率を示す、実線 319は、本実施形態の能動学習システムを用いた場合のヒット率を示している。図 15 Bにおいて、破線 320は、本実施形態の能動学習システムを用いた場合における R OC曲線を示している。本実施形態では、次に学習すべきデータを選択するときの重み付けも、学習結果を統合するときの重み付けも、あるクラス (値)のデータの重みが重くなるようにした。本実施形態によれば、重みを重くしたクラスのデータが早く出力されており、また図示 A、 B、 C、 Dに示されるように、任意の精度で学習を行えるようになっている。

[0063] 《第 8の実施形態》次に、本発明の第 8の実施形態について、図 16を参照して説明する。図 16に示す能動学習システムは、第 1の実施形態の能動学習システムと同様のものであるが、グループ生成装置 115が付加されているとともに、データ統合装置とそのデータ統合装置に接続する出力装置とがデータ統合選択装置 114で置き換えられている点で相違する。データ統合選択装置 114は、第 1の実施形態のシステム（図 1参照）におけるデータ統合装置 108と出力装置 112の機能を合わせ持つものである力次に学習すべきデータを選択する際に、グループ生成装置 115でのグループ分けにしたがつて、相互のデータがなるべくグループに散らばるように選択する。グループ選択装置 114は、記憶装置 101に格納されたラベル値が既知のデータ、または記憶装置 1 09に格納されたラベル値が未知のデータ、もしくはその両者のデータをグループ分けするものである。

[0064] 次に、本実施形態の能動学習システムの動作について、図 17に示すフローチヤ一トを利用して説明する。ここでは、データは表形式で与えられるものとする。

[0065] まず、ステップ 211において、ラベル値が既知のデータは記憶装置 101に、ラベル値が未知のデータは記憶装置 109に記憶される。グループ生成装置 115は、ステツプ 212において、記憶装置 101内の既知データと記憶装置 109内の未知データに関してグループ分けを行う。グループ分けの結果は、グループ生成装置 115からグループ情報として出力される。

[0066] 次に、ステップ 213において、サンプリング重み付け装置 102は、記憶装置 101から送られてきたデータに基づヽて重み (すなわち重み付けデータ）を生成し、ある、はそのような重みを読み込み、各サンプリング装置 105に送る。各サンプリング装置 1 05は、サンプリング重み付け装置 102から送られてきた重みにしたがって重み付けを行いながら、記憶装置 101内の既知データをサンプリングし、サンプリングしたデータを対応する学習機械 106に送る。各学習機械 106は、ステップ 214において、サンプリング装置力送られてきたデータに基づいて学習を実行する。

[0067] 記憶装置 101からは予測重み付け装置 103にもデータが送られており、ステップ 2 15において、予測重み付け装置 103は、記憶装置 101から送られてきたデータに基づ、て重み (すなわち重み付けデータ）を生成し、ある、はそのような重みを読み込み、それらを規則統合装置 107へ送る。規則統合装置 107は、重み付けデータに基づいて、各学習機械 106からの学習結果に重み付けを行いながらこれらの学習結果をまとめる。規則統合装置 107は、学習結果をまとめた結果を規則として出力装置 1 11に送る。

[0068] 次に各学習機械 106は、ステップ 216において、記憶装置 109に格納されたラベル値が未知のデータに対して予測を行い、その結果は、データ統合選択装置 114に送られる。

[0069] このとき、記憶装置 101からはデータ重み付け装置 104にもデータが送られており、ステップ 217において、データ重み付け装置 104は、記憶装置 101から送られてきたデータに基づいて重み (すなわち重み付けデータ）を生成し、あるいはそのような重みを読み込み、それらをデータ統合選択装置 114へ送る。データ統合選択装置 1 14は、重み付けデータとグループ生成装置 115からのグループ情報とに基づき、各学習機械 106からの予測結果に重み付けを行いながらこれらの結果をまとめ、次に学習すべきデータを選択する。その際、データ統合選択装置 114は、グループ生成装置 814でのグループ分けにしたがって、お互いのデータがなるべくグループに散らばるように、次に学習すべきデータをする。

[0070] 次に、ステップ 218において、次に学習すべきデータに対する結果 (ラベル値）が、結果入力装置 113を介し、人手によって、あるいはコンピュータにより入力される。入力された結果は制御装置 110に送られ、制御装置 110は、その結果が入力されたデータを記憶装置 109から削除し、その代わりに記憶装置 101に記憶させる。以後、第 1の実施形態の場合と同様に、上述の処理が繰り返され、能動学習が進行する。

[0071] 図 18は、第 8の実施形態の能動学習システムの効果を説明している。図において、破線 321は、従来の能動学習法を用いた場合の正解率の推移を示し、破線 322は、第 1の実施形態の能動学習システムを用いた場合における正解率の推移を示し、実線 323は、グループ生成装置 115によって作成されたグループ情報をもとにして次に学習すべきデータを選択する本実施形態の能動学習システムを用いた場合における正解率の推移を示して、る。グループ生成装置によって生成されたグループの情報をもとにして、次に学習すべきデータを選択する際にお互、のデータがなるべく異なったグループに属するようにデータを選択することで、正解率を早!、段階で高くすることができることがゎカゝる。

[0072] なお、本実施形態は、サンプリング重み付け装置 102、予測重み付け装置 103及びデータ重み付け装置 104のうちの一部または全部を設けない構成とすることもできる。

[0073] 《第 9の実施形態》

次に、本発明の第 9の実施形態について、図 19を参照して説明する。図 19に示す能動学習システムは、第 8の実施形態の能動学習システムと同様のものであるが、データ選択装置 116が新たに設けられ、また、データ統合選択装置の代わりに第 1の実施形態の場合と同様のデータ統合装置 108及び出力装置 112が設けられている点で、第 8の実施形態のものと相違する。データ選択装置 118は、グループ生成装置 115からのグループ情報にしたがって、各学習機械 106での予測の対象となる未知データを記憶装置 109から選択し、選択された未知データを各学習機械 106に送るものである。

[0074] この能動学習システムでは、グループ生成装置 115で生成されたグループは、データ選択装置 116に送られる。記憶装置 109からは未知データがデータ選択装置 1 16に送られる。データ選択装置 116は、なるべく異なったグループに散らばるように未知データが選択して、選択されたデータが、予測のために学習機械 106に送られる。データ統合装置 108は、データ重み付け装置 904で決定された重み付けを適用して、次に学習すべきデータを選択する。この能動学習システムは、第 8の実施形態の能動学習システムと同様の効果を奏する。

[0075] なお、本実施形態は、サンプリング重み付け装置 102、予測重み付け装置 103及びデータ重み付け装置 104のうちの一部または全部を設けない構成とすることもできる。

[0076] 以上説明した能動学習システムは、それを実現するためのコンピュータプログラムを、パーソナルコンピュータやワークステーションなどのコンピュータに読み込ませ、そのプログラムを実行させることによつても実現できる。能動学習を行うためのプログラム (能動学習システム用プログラム）は、磁気テープや CD— ROMなどの記録媒体によって、あるいはネットワークを介して、コンピュータに読み込まれる。そのようなコンピュータは、一般に、 CPUと、プログラムやデータを格納するためのハードディスク装置と、主メモリと、キーボードやマウスなどの入力装置と、 CRTや液晶ディスプレイなどの表示装置と、磁気テープや CD - ROM等の記録媒体を読み取る読み取り装置と、ネットワークとのインタフェースとなる通信インタフェースとから構成されている。ハードディスク装置、主メモリ、入力装置、表示装置、読み取り装置及び通信インタフエ一スは、いずれも CPUに接続している。このコンピュータでは、能動学習を実行するためのプログラムを格納した記録媒体を読み取り装置に装着し、記録媒体力プロダラムを読み出してハードディスク装置に格納し、あるいはそのようなプログラムをネットヮ一タカもダウンロードしてハードディスク装置に格納し、その後、ハードディスク装置に格納されたプログラムを CPUが実行することにより、上述した能動学習が実行されることになる。

したがって本発明の範疇には、上述したプログラム、このようなプログラムを格納した記録媒体、このようなプログラムからなるプログラムプロダクトも含まれる。

Claims

請求の範囲

[1] ラベル値が既知のデータを既知データとしラベル値が未知のデータを未知データとして前記既知データの集合と前記未知データの集合とを格納する記憶装置と、複数の学習機械とを使用する能動学習方法であって、

前記複数の学習機械が、前記既知データに関し、前記記憶装置からそれぞれ独立にサンプリングを行った後に学習を行う段階と、

前記学習の結果として、前記複数の学習機械の出力結果を統合して出力する段階と、

前記複数の学習機械が、前記記憶装置から未知データを取り出して予測を行う段階と、

前記予測の結果に基づいて次に学習すべきデータを計算して出力する段階と、前記次に学習すべきデータに対応するラベル値を入力する段階と、

前記ラベル値が入力されたデータを前記未知データの集合から削除して前記既知データの集合に追加する段階と、

を有し、

前記既知データをサンプリングするとき、前記複数の学習機械による学習の結果を統合するとき、及び、前記複数の学習機械による予測から次に学習すべきデータを計算するとき、のうちの少なくとも 1つにおいて、均等でない重み付けを実行する、能動学習方法。

[2] 前記既知データ及び前記未知データにぉ、てグループ分けを行う段階をさらに有し、前記次に学習すべきデータを計算する際に、グループで散らばるようにデータを選択する、請求項 1に記載の能動学習方法。

[3] 前記既知データ及び前記未知データにぉ、てグループ分けを行う段階をさらに有し、前記予測を行う段階において、グループで散らばるように前記各学習機械に前記未知データを供給する、請求項 1に記載の能動学習方法。

[4] ラベル値が既知のデータを既知データとしラベル値が未知のデータを未知データとして前記既知データの集合と前記未知データの集合とを格納する記憶装置と、既知データの学習及び未知データの予測を行う複数の学習機械と、前記学習機械ごとに設けられ、前記記憶装置から前記既知データをサンプリングして対応する学習機械に入力する複数のサンプリング装置と、

前記各学習機械が前記既知データに基づいて行った学習の結果を統合する第 1 の統合手段と、

前記各学習機械が前記未知データに基づいて行った予測の結果から次に学習すべきデータを計算して出力する第 2の統合手段と、

前記次に学習すべきデータに対応するラベル値を入力する結果入力手段と、前記ラベル値が入力されたデータを前記未知データの集合から削除して前記既知データの集合に追加する制御手段と、

前記サンプリング装置ごとにサンプリング時の重みを設定するサンプリング重み付け手段と、

を有する能動学習システム。

[5] ラベル値が既知のデータを既知データとしラベル値が未知のデータを未知データとして前記既知データの集合と前記未知データの集合とを格納する記憶装置と、既知データの学習及び未知データの予測を行う複数の学習機械と、

前記学習機械ごとに設けられ、前記記憶装置から前記既知データをサンプリングして対応する学習機械に入力する複数のサンプリング装置と、

前記第 1の統合手段で前記学習の結果を統合する際に用!、られる重みを設定する予測重み付け手段と、

を有する、能動学習システム。

[6] 前記第 1の統合手段で前記学習の結果を統合する際に用!、られる重みを設定する予測重み付け手段を有する、請求項 4に記載の能動学習システム。

[7] 前記第 2の統合手段で次に学習すべきデータを選択する際に用いられる重みを設定するデータ重み付け手段を有する、請求項 4乃至 6の、ずれか 1項に記載の能動学習システム。

[8] 前記既知データ及び前記未知データにお!、てグループ分けを行うグループ生成手段をさらに有し、

前記第 2の統合手段は前記次に学習すべきデータを計算する際に、グループで散らばるようにデータを選択する、請求項 4乃至 7のいずれか 1項に記載の能動学習システム。

[9] 前記既知 1データ及び前記未知データにお!、てグループ分けを行うグループ生成手段と、

グループで散らばるように前記各学習機械に前記未知データを供給するデータ選択手段とをさらに有する、請求項 4乃至 7のいずれか 1項に記載の能動学習システム。

[10] ラベル値が既知のデータを既知データとしラベル値が未知のデータを未知データとして前記既知データの集合と前記未知データの集合とを格納する記憶装置と、既知データの学習及び未知データの予測を行う複数の学習機械と、

前記第 2の統合手段で次に学習すべきデータを選択する際に用いられる重みを設定するデータ重み付け手段と、

を有する、能動学習システム。 [11] 前記既知データ及び前記未知データにぉ、てグループ分けを行うグループ生成手段をさらに有し、

前記第 2の統合手段は前記次に学習すべきデータを計算する際に、グループで散らばるようにデータを選択する、請求項 10に記載の能動学習システム。

[12] 前記既知 1データ及び前記未知データにぉ、てグループ分けを行うグループ生成手段と、

グループで散らばるように前記各学習機械に前記未知データを供給するデータ選択手段とをさらに有する、請求項 10に記載の能動学習システム。

[13] ラベル値が既知のデータを既知データとしラベル値が未知のデータを未知データとして前記既知データの集合と前記未知データの集合とを格納する記憶装置と、既知データの学習及び未知データの予測を行う複数の学習機械と、

前記次に学習すべきデータに対応するラベル値を入力する結果入力手段と、前記ラベル値が入力されたデータを前記未知データの集合から削除して前記既知データの集合に制御手段と、

前記既知データ及び前記未知データにおいてグループ分けを行うグループ生成手段と、

を有し、前記第 2の統合手段は前記次に学習すべきデータを計算する際に、ダループで散らばるようにデータを選択する、能動学習システム。

[14] ラベル値が既知のデータを既知データとしラベル値が未知のデータを未知データとして前記既知データの集合と前記未知データの集合とを格納する記憶装置と、既知データの学習及び未知データの予測を行う複数の学習機械と、

前記学習機械ごとに設けられ、前記記憶装置から前記既知データをサンプリングして対応する学習機械に入力する複数のサンプリング装置と、前記各学習機械が前記既知データに基づいて行った学習の結果を統合する第 1 の統合手段と、

グループで散らばるように前記各学習機械に前記未知データを供給するデータ選択手段と、

を有する、能動学習システム。

コンピュータを、

ラベル値が既知のデータを既知データとしラベル値が未知のデータを未知データとして前記既知データの集合と前記未知データの集合とを格納する記憶手段、前記記憶手段から既知データをサンプリングするとともに既知データの学習及び未知データの予測を行う複数の学習手段、

前記各学習機械が前記既知データに基づいて行った学習の結果を統合する第 1 の統合手段、

前記各学習手段が前記未知データに基づいて行った予測の結果から次に学習すべきデータを計算して出力する第 2の統合手段、

前記次に学習すべきデータに対応するラベル値を入力する結果入力手段、前記ラベル値が入力されたデータを前記未知データの集合から削除して前記既知データの集合に追加する制御手段、

前記サンプリング装置でのサンプリング時の重み、前記第 1の統合手段で用、られる重み、及び前記第 2の統合手段で用いられる重みのうちの少なくとも 1つの重みを設定する重み付け手段、として機能させるプログラム。

[16] 前記コンピュータをさらに、前記既知データ及び前記未知データにおいてグループ分けを行うグループ生成手段として機能させ、前記第 2の統合手段において前記次に学習すべきデータを計算する際に、グループで散らばるようにデータが選択されるようにする、請求項 15に記載のプログラム。

[17] 前記コンピュータをさらに、

前記既知データ及び前記未知データにおいてグループ分けを行うグループ生成手段、

グループで散らばるように前記各学習機械に前記未知データを供給するデータ選択手段、

として機能させる請求項 15に記載のプログラム。

[18] コンピュータが読み取り可能な記録媒体であって、請求項 15乃至 17のいずれか 1 項に記載のプログラムを格納した記録媒体。