WO2021240707A1

WO2021240707A1 - データ分類システム、データ分類方法および記録媒体

Info

Publication number: WO2021240707A1
Application number: PCT/JP2020/021055
Authority: WO
Inventors: 元紀草野; 智哉坂井
Original assignee: 日本電気株式会社
Priority date: 2020-05-28
Filing date: 2020-05-28
Publication date: 2021-12-02
Also published as: JPWO2021240707A1; US20230195851A1

Abstract

データ分類システムが、クラス分類の学習に用いられる教師データに示されるクラスである既知クラスの各々について、対象データが全ての既知クラスのうちその既知クラスに所属することの尤もらしさを示す既知クラス尤度を計算する、既知クラス尤度計算手段と、前記クラス分類における全てのクラスのうち、少なくとも１つの前記既知クラスを前記既知クラス尤度に基づいて除いたクラスを、前記対象データが所属するクラスの候補として選択する、クラス候補選択手段と、少なくとも前記候補に含まれるクラスの各々について、前記対象データが全てのクラスのうちそのクラスに所属することの尤もらしさを示す全クラス尤度を計算する、全クラス尤度計算手段と、前記全クラス尤度に基づいて、前記対象データが所属するクラスを前記候補のうち何れかのクラスと推定する、クラス推定手段と、を備える。

Description

データ分類システム、データ分類方法および記録媒体

　本発明はデータ分類システム、データ分類方法および記録媒体に関する。

　テストデータの正解クラスが教師データにない場合、このテストデータを正解クラスに分類するためには、このテストデータを教師データに存在していないクラスに分類する必要がある。以降、教師データに存在するクラスを既知クラス、存在しないクラスを未知クラスと呼ぶことにする。
　未知クラスに所属するデータの識別も可能にするデータ分類方法の学習はゼロショット学習（Zero Shot Learning）と呼ばれる。以降、ゼロショット学習を用いた未知クラスに所属するデータの識別も可能にするデータ分類技術をゼロショット型データ分類技術と呼ぶことにする。

　ゼロショット型データ分類技術で、各クラスに付随する属性と呼ばれる情報を読み込み、テストデータに対するクラス尤度をクラスの属性を用いて計算し、計算されたクラス尤度を用いてテストデータの所属クラスを推定するものがある。
　例えば、非特許文献１では、テストデータのクラス属性を推定し、その推定したクラス属性と各クラスの属性との類似度を用いてクラス尤度を計算している。
　また、特許文献１では、テストデータが既知クラスに所属する確率を用いて、既存のゼロショット型データ分類技術によって得られるクラス尤度を補正し、新しく得られた補正済みクラス尤度を用いてテストデータの所属クラスを推定している。

国際公開第２０１９／１７１４１６号

Mohammad Norouzi、外７名、"Zero-shot learning by convex combination of semantic embeddings"、International Conference on Learning Representations 2014、２０１４年

　教師データに示されないクラスを含むクラス分類の精度の向上を図れることが好ましい。

　本発明は、上述の課題を解決することのできるデータ分類システム、データ分類方法および記録媒体を提供することを目的としている。

　本発明の第１の態様によれば、データ分類システムは、クラス分類の学習に用いられる教師データに示されるクラスである既知クラスの各々について、対象データが全ての既知クラスのうちその既知クラスに所属することの尤もらしさを示す既知クラス尤度を計算する、既知クラス尤度計算手段と、前記クラス分類における全てのクラスのうち、少なくとも１つの前記既知クラスを前記既知クラス尤度に基づいて除いたクラスを、前記対象データが所属するクラスの候補として選択する、クラス候補選択手段と、少なくとも前記候補に含まれるクラスの各々について、前記対象データが全てのクラスのうちそのクラスに所属することの尤もらしさを示す全クラス尤度を計算する、全クラス尤度計算手段と、前記全クラス尤度に基づいて、前記対象データが所属するクラスを前記候補のうち何れかのクラスと推定する、クラス推定手段と、を備える。

　本発明の第２の態様によれば、データ分類方法は、クラス分類の学習に用いられる教師データに示されるクラスである既知クラスの各々について、対象データが全ての既知クラスのうちその既知クラスに所属することの尤もらしさを示す既知クラス尤度を計算することと、前記クラス分類における全てのクラスのうち、少なくとも１つの前記既知クラスを前記既知クラス尤度に基づいて除いたクラスを、前記対象データが所属するクラスの候補として選択することと、少なくとも前記候補に含まれるクラスの各々について、前記対象データが全てのクラスのうちそのクラスに所属することの尤もらしさを示す全クラス尤度を計算することと、前記全クラス尤度に基づいて、前記対象データが所属するクラスを前記候補のうち何れかのクラスと推定することと、を含む。

　本発明の第３の態様によれば、記録媒体は、コンピュータに、クラス分類の学習に用いられる教師データに示されるクラスである既知クラスの各々について、対象データが全ての既知クラスのうちその既知クラスに所属することの尤もらしさを示す既知クラス尤度を計算することと、前記クラス分類における全てのクラスのうち、少なくとも１つの前記既知クラスを前記既知クラス尤度に基づいて除いたクラスを、前記対象データが所属するクラスの候補として選択することと、少なくとも前記候補に含まれるクラスの各々について、前記対象データが全てのクラスのうちそのクラスに所属することの尤もらしさを示す全クラス尤度を計算することと、前記全クラス尤度に基づいて、前記対象データが所属するクラスを前記候補のうち何れかのクラスと推定することと、を実行させるためのプログラムを記録する記録媒体である。

　上記したデータ分類システム、データ分類方法および記録媒体によれば、教師データに示されないクラスを含むクラス分類の精度の向上を図ることができる。

第１の実施形態に係るデータ分類システムの構成例を示す概略ブロック図である。第１の実施形態に係るデータ分類システムにおける学習時の動作例を示す流れ図である。第１の実施形態に係るデータ分類システムがテストデータを分類する推論時の動作例を示す流れ図である。第２の実施形態に係るデータ分類システムの構成例を示す概略ブロック図である。第２の実施形態に係るデータ分類システムにおける学習時の動作例を示す流れ図である。第２の実施形態に係るデータ分類システムにおける推論時の動作例を示す流れ図である。第４の実施形態に係るデータ分類システムの構成例を示す図である。第５の実施形態に係る判定方法における処理手順の例を示す図である。少なくとも１つの実施形態に係るコンピュータの構成を示す概略ブロック図である。

　以下、本発明の実施形態を説明するが、以下の実施形態は請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
　以降、教師データに存在するクラスを既知クラス、存在しないクラスを未知クラスと呼ぶことにする。また、既知クラスの個数および未知クラスの個数は何れも有限とし、テストデータは既知クラスのいずれか、または、未知クラスのいずれかに所属するとする。

　上述したように、既知クラスは教師データに現れるクラスである。未知クラスは教師データに現れないクラスである。M個の既知クラスを c^s ₁, ..., c^s _M、N個の未知クラスをc^u ₁, ..., c^u _Nと書く。
　また、ここでいうテストデータは、クラス分類対象のデータである。ただし、テストデータは、クラス分類の評価のためのデータに限らず、実運用におけるクラス分類対象のデータであってもよい。テストデータをxと書く。また、テストデータを対象データとも称する。

（第１の実施の形態）
（構成の説明）
　図１は、第１の実施形態に係るデータ分類システムの構成例を示す概略ブロック図である。図１に示す構成で、データ分類システム１０１は、既知クラス尤度計算部１１１と、未知クラス尤度計算部１１２と、全クラス尤度計算部１１３と、クラス候補選択部１１４と、クラス推定部１１５と、モデル記憶部１１６と、教師データ記憶部１２１と、クラス属性記憶部１２２と、モデル生成部１２３と、を備える。

　データ分類システム１０１は、分類対象であるテストデータを、既知クラスの何れか、または、未知クラスの何れかに分類する。
　データ分類システム１０１が、１つの装置として構成されていても良い。あるいは、データ分類システム１０１が、複数の装置の組み合わせにて構成されていても良い。

　既知クラス尤度計算部１１１は、テストデータの既知クラスにおけるクラス尤度を計算する。以降、既知クラス尤度計算部１１１が計算するテストデータxの既知クラスc^s _iにおける尤度を既知クラス尤度と称し、L_S(c^s _i | x)と書く。
　ここでいうテストデータxの尤度は、テストデータxが観測されたときに、そのテストデータxが、あるクラスcに所属する確率、すなわちp (c | x)である。pは確率を表し、p ( | ) は条件付確率を表す。

　既知クラス尤度は、既知クラスを分類対象のクラスとした場合に、データが特定の既知クラスに所属する確率である。すなわち、既知クラス尤度L_S(c^s _i | x)は、テストデータxが全ての既知クラスのうち何れかのクラスに所属するとの仮定の下で、そのテストデータxが特定の既知クラスc^s _iに所属する確率である。
　ただし、既知クラス尤度が、必ずしも確率の要件を満たす必要は無い。テストデータが、全ての既知クラスのうちある既知クラスに所属することの尤もらしさを示す指標値を、既知クラス尤度として用いることができる。

　既知クラス尤度計算部１１１がテストデータの既知クラスにおける尤度を計算する方法として、いろいろな方法を用いることができる。例えば、既知クラス尤度計算部１１１が計算する既知クラス尤度として、サポートベクターマシンやロジスティック回帰、ニューラルネットワークなどによって計算されるクラス尤度を用いても良い。また、既知クラス尤度計算部１１１が計算する既知クラス尤度として、公知のゼロショット型データ分類器によるテストデータに基づいた既知クラスの尤度を用いても良い。
　既知クラス尤度計算部１１１は、既知クラス尤度計算手段の例に該当する。

　未知クラス尤度計算部１１２は、テストデータの未知クラスにおけるクラス尤度を計算する。以降、未知クラス尤度計算部１１２が計算するテストデータxの未知クラスc^u _jにおける尤度を未知クラス尤度と称し、L_U(c^u _j | x)と書く。
　未知クラス尤度は、未知クラスを分類対象のクラスとした場合に、データが特定の未知クラスに所属する確率である。すなわち、未知クラス尤度L_U(c^u _j | x)は、テストデータxが全ての未知クラスのうち何れかのクラスに所属するとの仮定の下で、そのテストデータxが特定の未知クラスc^u _jに所属する確率である。
　ただし、未知クラス尤度が、必ずしも確率の要件を満たす必要は無い。テストデータが、全ての未知クラスのうちある未知クラスに所属することの尤もらしさを示す指標値を、未知クラス尤度として用いることができる。

　未知クラス尤度計算部１１２がテストデータの未知クラスにおける尤度を計算する方法として、いろいろな方法を用いることができる。例えば、未知クラス尤度計算部１１２が計算する未知クラス尤度として、公知のゼロショット型データ分類器によるテストデータに基づいた未知クラスの尤度を用いても良い。
　未知クラス尤度計算部１１２は、未知クラス尤度計算手段の例に該当する。

　全クラス尤度計算部１１３は、テストデータの既知クラスと未知クラスの全てを合わせたクラスにおけるクラス尤度を計算する。以降、全クラス尤度計算部１１３が計算するテストデータxの既知クラス、未知クラスいずれかのクラスcにおける尤度を全クラス尤度と称し、L(c | x)と書く。全ての既知クラスと全ての未知クラスとを合わせたクラス全体を全クラスと称する。

　全クラス尤度は、全クラスを分類対象のクラスとした場合に、データが特定のクラスに所属する確率である。すなわち、全クラス尤度L(c | x)は、テストデータxが全てのクラスのうち何れかのクラスに所属するとの仮定の下で、そのテストデータxが特定のクラスcに所属する確率である。
　ただし、全クラス尤度が、必ずしも確率の要件を満たす必要は無い。テストデータが、全てのクラスのうちあるクラスに所属することの尤もらしさを示す指標値を、全クラス尤度として用いることができる。

　全クラス尤度計算部１１３がテストデータの全てのクラスにおける尤度を計算する方法として、いろいろな方法を用いることができる。例えば、全クラス尤度計算部１１３が計算する全クラス尤度として、公知のゼロショット型データ分類器によるテストデータに基づいたクラス尤度を用いても良い。
　全クラス尤度計算部１１３は、全クラス尤度計算手段の例に該当する。

　クラス候補選択部１１４は、既知クラス尤度L_S(c^s _i | x) と未知クラス尤度L_U(c^u _j | x) を用いてテストデータxに関連するクラスの候補を複数個選択し、それらのクラスをまとめたクラス候補集合を出力する。以降、テストデータxに関連するクラス候補集合を C^{^} _x と表すことにする。ここでいう、データに関連するクラスの候補とは、例えば、そのデータが属するクラスの候補である。

　クラス候補選択部１１４がテストデータxに関連するクラス候補を選ぶ方法として、いろいろな方法を用いることができる。例えば、クラス候補選択部１１４が、既知クラス、未知クラスのそれぞれについて、テストデータxが所属する尤度の高い順に所定個のクラスを選択しても良い。具体的には、クラス候補選択部１１４は、予め定められた整数値Kに対して、既知クラス尤度が高い既知クラスを上から順番にK個（c^s _[1], ..., c^s _[K]）選択する。また、クラス候補選択部１１４は、予め定められた整数値Lに対して、未知クラス尤度が高い未知クラスを上から順番にL個（c^u _[1], ..., c^u _[L]）選択する。そして、クラス候補選択部１１４は、それらのクラスを合わせた要素 (K+L) 個の集合 C^{^} _x = { c^s _[1], ..., c^s _[K], c^u _[1], ..., c^u _[L]} をテストデータxに関連するクラス候補集合C^{^} _xとして出力する。

　あるいは、例えば、クラス候補選択部１１４が、既知クラス、未知クラスのそれぞれについて、尤度が所定値以上に高いクラスを選択しても良い。具体的には、クラス候補選択部１１４は、予め定められた実数値θに対して、既知クラス尤度L_S(c^s _i | x) が θ 以上となる既知クラスを選択する。また、クラス候補選択部１１４は、予め定められた実数値ηに対して、未知クラス尤度L_U(c^u _j | x) が η 以上となる未知クラスを選択する。そして、クラス候補選択部１１４は、それらのクラスをまとめた集合をテストデータxに関連するクラス候補集合C^{^} _xとして出力する。
　クラス候補選択部１１４は、クラス候補選択手段の例に該当する。

　クラス推定部１１５は、クラス候補選択部１１４で求めたテストデータxに関連するクラス候補集合 C^{^} _x の各クラスの尤度を全クラス尤度計算部１１３により計算する。そして、クラス推定部１１５は、 C^{^} _x の中で一番大きい尤度を返すクラスをテストデータxの所属クラスとして推定する。
　クラス推定部１１５は、クラス推定手段の例に該当する。

　クラス推定部１１５が全クラス尤度を用いてテストデータの所属クラスを推定できるように、全クラス尤度計算部１１３は、少なくともクラス候補集合に含まれる各クラスについて、全クラス尤度を計算する。全クラス尤度計算部１１３が、全ての既知クラスおよび全ての未知クラスについて、全クラス尤度を計算するようにしてもよい。

　モデル記憶部１１６は、既知クラス尤度計算部１１１と未知クラス尤度計算部１１２と全クラス尤度計算部１１３で用いる学習済み尤度計算モデルをそれぞれ記憶する。

　教師データ記憶部１２１は、教師データを記憶する。教師データ記憶部１２１が記憶する教師データは、教師データとして使用できるデータとそのデータが所属するクラスのペアの集合として構成される。ここでのデータは全て既知クラスに所属しており、教師データには、未知クラスに所属するデータは含まれていない。

　クラス属性記憶部１２２は、既知クラスと未知クラスを合わせた全クラスのクラス属性を記憶する。
　例えば、クラス属性は、整数値の要素または実数値の要素あるいはそれら両方を含む多次元数値ベクトルで表現されていても良い。
　あるいは、クラス属性は、そのクラスの名前やコメントなどを示す文字列およびそのクラスを表現する複数のタグなどをまとめた集合であっても良い。

　モデル生成部１２３は、各尤度計算部で用いる学習済み尤度計算モデルがモデル記憶部１１６に存在していない場合に、教師データ記憶部１２１が記憶する教師データ、および、クラス属性記憶部１２２が記憶するクラス属性を用いる学習にて、各尤度計算モデルを生成する。

　尤度計算モデルにゼロショット型データ分類器を用いる場合、モデル生成部１２３が、教師データ記憶部１２１によって得られる教師データとクラス属性記憶部１２２によって得られるクラス属性を用いて、学習済みゼロショット型データ分類器を生成しても良い。

　既知クラス尤度計算部１１１において、サポートベクターマシンやロジスティック回帰、ニューラルネットワークなどの教師あり学習で用いられる手法を尤度計算モデルの学習に用いる場合、モデル生成部１２３が、教師データ記憶部１２１によって得られる教師データを用いて既知クラス尤度を計算する学習済み尤度計算モデルを生成しても良い。

（動作の説明）
　次に、データ分類システム１０１の動作について図２および図３を用いて説明する。
　図２は、データ分類システム１０１における学習時の動作例を示す流れ図である。

　図２の処理で、モデル生成部１２３は、モデル記憶部１１６に学習済みの既知クラス尤度計算モデルが有るか否かを判定する（ステップＳ１０１）。学習済みの既知クラス尤度計算モデルが有ると判定した場合（ステップＳ１０１：ＹＥＳ）、データ分類システム１０１は、ステップＳ１０１およびＳ１０２の一群の処理を終了する。

　一方、学習済みの既知クラス尤度計算モデルが無いと判定した場合（ステップＳ１０１：ＮＯ）、モデル生成部１２３は、教師データとクラス属性を用いて既知クラス尤度計算モデルを生成し、モデル記憶部１１６に記憶させる（ステップＳ１０２）。ステップＳ１０２の後、データ分類システム１０１は、ステップＳ１０１およびＳ１０２の一群の処理を終了する。

　また、モデル生成部１２３は、モデル記憶部１１６に学習済みの未知クラス尤度計算モデルが有るか否かを判定する（ステップＳ１０３）。学習済みの未知クラス尤度計算モデルが有ると判定した場合（ステップＳ１０３：ＹＥＳ）、データ分類システム１０１は、ステップＳ１０３およびＳ１０４の一群の処理を終了する。

　一方、学習済みの未知クラス尤度計算モデルが無いと判定した場合（ステップＳ１０３：ＮＯ）、モデル生成部１２３は、教師データとクラス属性を用いて未知クラス尤度計算モデルを生成し、モデル記憶部１１６に記憶させる（ステップＳ１０４）。ステップＳ１０４の後、データ分類システム１０１は、ステップＳ１０３およびＳ１０４の一群の処理を終了する。

　また、モデル生成部１２３は、モデル記憶部１１６に学習済みの全クラス尤度計算モデルが有るか否かを判定する（ステップＳ１０５）。学習済みの全クラス尤度計算モデルが有ると判定した場合（ステップＳ１０５：ＹＥＳ）、データ分類システム１０１は、ステップＳ１０５およびＳ１０６の一群の処理を終了する。

　一方、学習済みの全クラス尤度計算モデルが無いと判定した場合（ステップＳ１０５：ＮＯ）、モデル生成部１２３は、教師データとクラス属性を用いて全クラス尤度計算モデルを生成し、モデル記憶部１１６に記憶させる（ステップＳ１０６）。ステップＳ１０６の後、データ分類システム１０１は、ステップＳ１０５およびＳ１０６の一群の処理を終了する。

　ステップＳ１０１およびＳ１０２の一群の処理と、ステップＳ１０３およびＳ１０４の一群の処理と、ステップＳ１０５およびＳ１０６の一群の処理とは並列実行可能である。モデル生成部１２３が、これらの処理を並行処理で実行するようにしても良い。
　ステップＳ１０１およびＳ１０２の一群の処理と、ステップＳ１０３およびＳ１０４の一群の処理と、ステップＳ１０５およびＳ１０６の一群の処理とを終了した場合、データ分類システム１０１は、図２の処理を終了する。

　図３は、データ分類システム１０１がテストデータを分類する推論時の動作例を示す流れ図である。
　まず、データ分類システム１０１はテストデータを読み取る（ステップＳ２０１）。

　次に、モデル記憶部１１６から学習済みの既知クラス尤度計算モデルを読み込んだ既知クラス尤度計算部１１１は、入力されたテストデータの既知クラス尤度を計算する（ステップＳ２０２）。
　また、モデル記憶部１１６から学習済みの未知クラス尤度計算モデルを読み込んだ未知クラス尤度計算部１１２は、入力されたテストデータの未知クラス尤度を計算する（ステップＳ２０３）。ステップＳ２０２の処理とステップＳ２０３の処理とは並列実行可能である。

　ステップＳ２０２およびＳ２０３の後、クラス候補選択部１１４は、テストデータの既知クラス尤度とテストデータの未知クラス尤度を用いて、テストデータに関連するクラス候補を選択する（ステップＳ２０４）。
　次に、モデル記憶部１１６から学習済みの全クラス尤度計算モデルを読み込んだ全クラス尤度計算部１１３は、ステップＳ２０４で得られるクラス候補の各々の全クラス尤度を計算する（ステップＳ２０５）。
　次に、クラス推定部１１５は、ステップＳ２０５で得られる全クラス尤度を用いて、テストデータの所属クラスを推定する（ステップＳ２０６）。
　ステップＳ２０６の後、データ分類システム１０１は、図３の処理を終了する。

（効果の説明）
　次に、第１の実施の形態の効果について説明する。
　第１の実施の形態では、クラス候補選択部１１４がクラスを選択したことにより、クラス推定部１１５の分類対象クラス数が減少している。また、クラス候補選択部１１４が選択するクラスは、既知クラス尤度計算部１１１と未知クラス尤度計算部１１２が高いクラス尤度を付けたクラスに限定される。つまり、クラス候補選択部１１４によって選ばれるクラスはテストデータの正解クラスと関連が高いクラスになっている。
　これにより、クラス推定部１１５の推定対象クラスをクラス候補選択部１１４が選択したクラスに制限することで、クラス分類の精度が向上することが期待される。

　以上のように、既知クラス尤度計算部１１１は、クラス分類の学習に用いられる教師データに示されるクラスである既知クラスの各々について、対象データが全ての既知クラスのうちその既知クラスに所属することの尤もらしさを示す既知クラス尤度を計算する。クラス候補選択部１１４は、クラス分類における全てのクラスのうち、少なくとも１つの既知クラスを既知クラス尤度に基づいて除いたクラスを、対象データが所属するクラスの候補として選択する。全クラス尤度計算部１１３は、少なくとも対象データが所属するクラスの候補に含まれるクラスの各々について、対象データが全てのクラスのうちそのクラスに所属することの尤もらしさを示す全クラス尤度を計算する。クラス推定部１１５は、全クラス尤度に基づいて、対象データが所属するクラスを、対象データが所属するクラスの候補のうち何れかのクラスと推定する。

　このように、クラス候補選択部１１４が、対象データが所属するクラスの候補を既知クラス尤度に基づいて絞り込むことで、データ分類システム１０１が比較的高精度にクラス分類を行えると期待される。
　例えば、既知クラスのうち、既知クラス尤度が最も高いクラスと、全クラス尤度が最も高いクラスとが異なり、全クラス尤度が最も高いクラスの既知クラス尤度は比較的低い場合を考える。

　このように、既知クラス尤度と全クラス尤度とで齟齬が生じている場合、既知クラス尤度計算モデルのほうが、全クラス尤度計算モデルよりも、教師データに現れるクラスへの分類を行う点で、モデルの学習の精度が高いと期待される。このことからすると、対象データが所属する正解クラスが既知クラスの何れかであるとの仮定の下では、既知クラス尤度を用いてクラス推定を行うほうが、全クラス尤度を用いてクラス推定を行うよりも精度が高いと期待される。

　仮に、クラス推定部１１５が、全クラス尤度が最も高い既知クラスを、対象データが所属するクラスと推定した場合、推定されたクラスの既知クラス尤度が比較的低いことから、推定結果が誤りである可能性が高い。
　これに対して、全クラス尤度が最も高い既知クラスの既知クラス尤度が比較的低いことで、クラス候補選択部１１４が、この既知クラスを、対象クラスが所属するクラスの候補から除外することが期待される。クラス候補選択部１１４が、この既知クラスを除外することで、クラス推定部１１５が、この既知クラスを、対象データが所属するクラスと推定することは無い。これにより、誤推定を回避できると期待される。
　このように、データ分類システム１０１によれば、教師データに示されないクラスである未知クラスを含むクラス分類の精度の向上を図ることができる。

　また、未知クラス尤度計算部１１２は、既知クラス以外のクラスである未知クラスの各々について、対象データが全ての未知クラスのうちその未知クラスに所属することの尤もらしさを示す未知クラス尤度を計算する。クラス候補選択部１１４は、既知クラス尤度と未知クラス尤度を用いて、対象データが所属するクラスの候補を選択する。

　これにより、クラス推定部１１５が、対象データが所属するクラスを未知クラスの何れかに推定する場合も、推定精度が高いことが期待される。具体的には、クラス推定部１１５が推定する未知クラスは、未知クラス尤度および全クラス尤度の何れも比較的高いクラスである。この点で、クラス推定部１１５の推定結果は、複数の評価方法の何れでも比較的高い評価を受けていると解することができ、推定精度が高いと期待される。

　また、クラス候補選択部１１４は、対象データの既知クラス尤度が高い順に所定の個数の既知クラスと、対象データの未知クラス尤度が高い順に所定の個数の未知クラスとを、対象データが所属するクラスの候補として選択する。
　これにより、クラス候補選択部１１４は、既知クラス、未知クラスそれぞれを尤度が高い順に順位付けをして所定の個数だけ選択するという比較的簡単な処理で候補を選択でき、処理負荷が比較的軽くて済む。

　また、クラス候補選択部１１４は、既知クラスのうち対象データの既知クラス尤度が所定の閾値よりも高いクラスと、未知クラスのうち対象データの未知クラス尤度が所定の閾値よりも高いクラスを、対象データが所属するクラスの候補として選択する。
　これにより、クラス候補選択部１１４は、既知クラス、未知クラスそれぞれについて、尤度と閾値とを比較するという比較的簡単な処理で候補を選択でき、処理負荷が比較的軽くて済む。

（第２の実施の形態）
（構成の説明）
　図４は、第２の実施形態に係るデータ分類システムの構成例を示す概略ブロック図である。図４に示す構成で、データ分類システム１０２は、既知クラス尤度計算部１１１と、未知クラス尤度計算部１１２と、全クラス尤度計算部１１３と、クラス候補選択部１１４と、クラス推定部１１５と、モデル記憶部１１６と、クラス間類似度計算部１１７と、教師データ記憶部１２１と、クラス属性記憶部１２２と、モデル生成部１２３と、を備える。
　データ分類システム１０２の各部のうちデータ分類システム１０１（図１）の場合と同様の部分については、図１の場合と同一の符号を付して詳細な説明を省略する。

　第２の実施形態に係るデータ分類システム１０２の、第１の実施形態との違いは、データ分類システム１０２がクラス間類似度計算部１１７を備えていることにある。
　また、第２の実施形態では未知クラス尤度計算部１１２が未知クラス尤度を計算する具体的方法が、第１の実施形態の場合と異なる。また、第２の実施形態のモデル記憶部１１６は未知クラス尤度計算モデルを記憶しておく必要が無い。

　クラス間類似度計算部１１７は、二つのクラスの類似度を計算する。
　例えば、クラス間類似度計算部１１７は、二つのクラスそれぞれについてクラス属性記憶部１２２からクラス属性を読み出す。そしてクラス間類似度計算部１１７は、二つのクラスのクラス属性を類似度関数に入力した出力値（類似度関数値）を計算する。類似度関数の値域が非負の実数値のみを含む場合、クラス間類似度計算部１１７は、類似度関数の出力値を、二つのクラスの類似度として用いる。一方、類似度関数の値域が負の実数値を含む場合、クラス間類似度計算部１１７は、類似度関数の出力値に対して必ず非負の実数値になるような変換を施した値を、二つのクラスの類似度として用いる。

　クラス間類似度計算部１１７が用いる類似度関数として、いろいろな関数を用いることができる。
　例えば、クラス属性が多次元数値ベクトルの場合、クラス間類似度計算部１１７が、コサイン類似度またはガウス関数などを類似度関数として用いても良い。
　また、例えば、クラス属性が文字列の場合、クラス間類似度計算部１１７が、レーベンシュタイン距離またはジャロ・ウィンクラー距離など類似度関数として用いても良い。また、クラス属性が集合の場合、クラス間類似度計算部１１７が、ジャッカード類似度またはシンプソン係数などを類似度関数として用いても良い。
　クラス間類似度計算部１１７は、クラス間類似度計算手段の例に該当する。

　上記のように、類似度関数値が負の実数値をとり得る場合、クラス間類似度計算部１１７は、類似度関数値に対して必ず非負の実数値になるような変換を施す。この変換の仕方としていろいろな方法を用いることができる。
　例えば、類似度関数値が必ず非負の実数値に変換されるような変換は、類似度関数値から、類似度関数の最小値に相当するオフセットを減算する変換であっても良い。類似度関数の最小値が負の値である場合、類似度関数の最小値に相当するオフセットを減算することは、類似度関数の最小値の絶対値に相当する正の値を加算することである。
　あるいは、類似度関数値が必ず非負の実数値に変換されるような変換は、ネイピア数の類似度関数値乗を計算する変換であっても良い。

　以下の説明では、クラス属性記憶部１２２が記憶するクラスcのクラス属性をa_cと表すことにする。また、クラス間類似度計算部１１７による二つのクラスcとc’の類似度をsim(a_c, a_c’) と表すことにする。未知クラス尤度計算部１１２が、テストデータxの未知クラスc^u _j における未知クラス尤度L_U(c^u _j | x) を、以下に示す式（１）のように算出してもよい。

　また、式（１）において全ての既知クラスに関して和を取るのではなく、全ての既知クラスc^s ₁, ..., c^s _Mのうち選択した複数個のクラスc^s _[1], ..., c^s _[K]に関して和を取っても良い。この場合、未知クラス尤度計算部１１２が、テストデータxの未知クラスc^u _j における未知クラス尤度L_U(c^u _j | x) を、以下に示す式（２）のように算出してもよい。

　全ての既知クラスのうち複数個のクラスc^s _[1], ..., c^s _[K] を選択する手段として、いろいろな手段を用いることができる。
　例えば、第１の実施の形態で述べた、予め定められた整数値Kに対して、既知クラス尤度が高いクラスを上から順番にK個c^s _[1], ..., c^s _[K] 選択する方法を採用しても良い。

　クラス候補選択部１１４が、全ての既知クラスのうち複数個のクラスc^s _[1], ..., c^s _[K] を選択するようにしても良い。あるいは、未知クラス尤度計算部１１２が、この選択を行うようにしても良い。あるいは、クラス間類似度計算部１１７が、この選択を行うようにしても良い。

（動作の説明）
　次に、データ分類システム１０２の動作について図５および図６を用いて説明する。
　図５は、データ分類システム１０２における学習時の動作例を示す流れ図である。

　図５の処理で、モデル生成部１２３は、モデル記憶部１１６に学習済みの既知クラス尤度計算モデルが有るか否かを判定する（ステップＳ３０１）。学習済みの既知クラス尤度計算モデルが有ると判定した場合（ステップＳ３０１：ＹＥＳ）、データ分類システム１０２は、ステップＳ３０１およびＳ３０２の一群の処理を終了する。

　一方、学習済みの既知クラス尤度計算モデルが無いと判定した場合（ステップＳ３０１：ＮＯ）、モデル生成部１２３は、教師データとクラス属性を用いて既知クラス尤度計算モデルを生成し、モデル記憶部１１６に記憶させる（ステップＳ３０２）。ステップＳ３０２の後、データ分類システム１０２は、ステップＳ３０１およびＳ３０２の一群の処理を終了する。

　また、モデル生成部１２３は、モデル記憶部１１６に学習済みの全クラス尤度計算モデルが有るか否かを判定する（ステップＳ３０３）。学習済みの全クラス尤度計算モデルが有ると判定した場合（ステップＳ３０３：ＹＥＳ）、データ分類システム１０２は、ステップＳ３０３およびＳ３０４の一群の処理を終了する。

　一方、学習済みの全クラス尤度計算モデルが無いと判定した場合（ステップＳ３０３：ＮＯ）、モデル生成部１２３は、教師データとクラス属性を用いて全クラス尤度計算モデルを生成し、モデル記憶部１１６に記憶させる（ステップＳ３０４）。ステップＳ３０４の後、データ分類システム１０２は、ステップＳ３０３およびＳ３０４の一群の処理を終了する。

　ステップＳ３０１およびＳ３０２の一群の処理と、ステップＳ３０３およびＳ３０４の一群の処理とは並列実行可能である。モデル生成部１２３が、これらの処理を並行処理で実行するようにしても良い。
　ステップＳ３０１およびＳ３０２の一群の処理と、ステップＳ３０３およびＳ３０４の一群の処理とを終了した場合、データ分類システム１０１は、図５の処理を終了する。

　図６は、データ分類システム１０２がテストデータを分類する推論時の動作例を示す流れ図である。
　まず、データ分類システム１０２はテストデータを読み取る（ステップＳ４０１）。
　次に、モデル記憶部１１６から学習済みの既知クラス尤度計算モデルを読み込んだ既知クラス尤度計算部１１１は、入力されたテストデータの既知クラス尤度を計算する（ステップＳ４０２）。

　また、クラス間類似度計算部１１７は、クラス属性記憶部１２２から得られるクラス属性を用いて既知クラスと未知クラスの類似度を計算する（ステップＳ４０３）。ステップＳ４０２の処理とＳ４０３の処理とは並列実行可能である。
　ステップＳ４０２およびＳ４０３の後、未知クラス尤度計算部１１２は、入力されたテストデータの未知クラス尤度を、既知クラス尤度とクラス間類似度を用いて計算する（ステップＳ４０４）。

　次に、クラス候補選択部１１４は、テストデータの既知クラス尤度とテストデータの未知クラス尤度を用いて、テストデータに関連するクラスの候補を選択する（ステップＳ４０５）。
　次に、モデル記憶部１１６から学習済みの全クラス尤度計算モデルを読み込んだ全クラス尤度計算部１１３は、ステップＳ４０５で得られるクラス候補の各々の全クラス尤度を計算する（ステップＳ４０６）。
　次に、クラス推定部１１５は、ステップＳ４０６で得られる全クラス尤度を用いて、テストデータの所属クラスを推定する（ステップＳ４０７）。
　ステップＳ４０７の後、データ分類システム１０２は、図６の処理を終了する。

（効果の説明）
　次に、本実施の形態の効果について説明する。
　第２の実施形態では、クラス候補選択部１１４によって選ばれる未知クラスは、高い既知クラス尤度を持つ既知クラスと高い類似性を持つ。一般的に、テストデータが既知クラスに所属する場合には、全クラス尤度計算部１１３よりも既知クラス尤度計算部１１１を用いた分類器のほうが、教師データに現れるクラスへの分類を行う点で学習の精度が高いと期待され、この点で、分類精度が高い。そのため、高い既知クラス尤度を持つ既知クラスはテストデータの正解クラスと高い類似度を持つ可能性が高く、テストデータの正解クラスと類似度が高い未知クラスの尤度も高くなり、ゼロショット型データ分類技術の分類精度が向上する。

　以上のように、クラス間類似度計算部１１７は、二つのクラスの類似度を計算する。未知クラス尤度計算部１１２は、既知クラス尤度とクラスの類似度を用いて、テストデータの未知クラス尤度を計算する。
　既知クラスが教師データに現れるクラスである点で、既知クラス尤度計算モデルの学習精度が高く、既知クラス尤度の精度が高いことが期待される。未知クラス尤度計算部１１２が、精度の高い既知クラス尤度を用いて未知クラス尤度を計算することで、未知クラス尤度の精度が高いことが期待される。

（第３の実施形態）
　第３の実施形態では、第２の実施形態に係るデータ分類システム１０２が行う処理の、より具体的な例について説明する。
　一例として、画像分類タスクにおいて、教師データとしての画像データベースに含まれていないクラスに所属するテスト画像のクラスを正しく推定することを考える。ここでは、テスト画像のクラスが画像データベースにない「フェネック」クラスに所属する場合を考える。

　まず、既知クラス尤度計算部１１１が、テスト画像に対し、画像データベースの中に存在するクラスの中から既知クラス尤度計算部が高い尤度を付与するクラスを選択する。テスト画像をxとし、例えば、今回の分類対象の既知クラスが「キタキツネ、柴犬、三毛猫、馬」で、既知クラス尤度計算部１１１が、L_S (キタキツネ|x)=0.5、 L_S (柴犬|x)=0.3、 L_S (三毛猫|x)=0.1、 L_S(馬|x)=0.1と算出した場合を考える。
　クラス候補選択部１１４は、既知クラスのうち予め定義された閾値0.25以上の尤度を持つクラスを選択するものとする。この場合、クラス候補選択部１１４は、既知クラスのうち「キタキツネ、柴犬」を選択する。

　次に、クラス候補選択部１１４は、画像データベースの中に存在しないクラスの中から未知クラス尤度計算部が高い尤度を付与するクラスを選択する。例えば、今回の分類対象の未知クラスが「フェネック、ニホンオオカミ、ペルシャ猫」で、未知クラス尤度計算部１１２が、L_U(フェネック|x)=0.6, L_U(ニホンオオカミ|x)=0.3, L_U(ペルシャ猫|x)=0.1と算出した場合を考える。
　クラス候補選択部１１４は、未知クラスのうち予め定義された閾値0.3以上の尤度を持つクラスを選択するものとする。この場合、クラス候補選択部１１４は、未知クラスのうち「フェネック、ニホンオオカミ」を選択する。

　第２の実施形態における未知クラス尤度計算部１１２が未知クラス尤度L_Uを計算する際には、クラス間類似度計算部１１７が、属性データベースから得られるクラス属性を用いてクラス間類似度を計算する。
　フェネックがネコ目で、イヌ科で、キツネ属で、鳥類でなく、耳が大きくて、茶色い動物の場合に、フェネックのクラス属性はa_{フェネック} = (1, 1, 1, 0, 1, 1) と0と1で表現されるベクトルとして定義されていてもよい。

　クラス候補選択部１１４は、選択した既知クラスと選択した未知クラスとの集合を、テスト画像xに対するクラス候補集合C^{^} _xとする。ここでは、クラス候補選択部１１４は、選択した既知クラス「キタキツネ」および「柴犬」と、選択した未知クラス「フェネック」および「ニホンオオカミ」との集合{キタキツネ,柴犬,フェネック,ニホンオオカミ}を、テスト画像xに対するクラス候補集合C^{^} _xとする。

　全クラス尤度計算部１１３は、クラス候補集合C^{^} _xに含まれる各クラスの全クラス尤度を計算する。全クラス尤度計算部１１３が、公知のゼロショット型データ分類技術を用いて全クラス尤度を計算するようにしてもよい。
　クラス推定部１１５は、全クラス尤度計算部１１３が計算した全クラス尤度を用いて、テスト画像xの所属するクラスを推定する。
　例えば、クラス候補集合C^{^} _xの各クラスを全クラス尤度の大きい順に並べると、「フェネック」、「キタキツネ」、「柴犬」、「ニホンオオカミ」の順番になる場合を考える。この場合、クラス推定部１１５は、一番高い全クラス尤度を持つクラス「フェネック」をテスト画像xの所属する推定クラスとして出力する。

　また、上記のフェネックスのテスト画像の例で、仮に、公知のゼロショット型データ分類技術を用いると「ペルシャ猫」のクラス尤度が全クラスの中で一番高くなってしまう場合について考える。この場合、公知のゼロショット型データ分類技術による分類器では、「ペルシャ猫」をテスト画像が所属する推定クラスとして出力すると考えられる。すると、この分類器は、「フェネック」の画像を「ペルシャ猫」の画像と誤分類してしまうことになる。

　これに対し、データ分類システム１０２が行うクラス分類では、ペルシャ猫がネコ目で、イヌ科でなく、キツネ属でなく、鳥類でなく、耳が大きくなく、茶色い動物でない場合に、ペルシャ猫のクラス属性はa_{ペルシャ猫} = (1, 0, 0, 0, 0, 0) となる。このため、クラス間類似度計算部１１７が計算するイヌ科の「キタキツネ、柴犬」の各々とペルシャ猫とのクラス間類似度は何れも低くなる。これにより、未知クラス尤度計算部１１２がペルシャ猫に高いクラス尤度を付与する可能性は低くなり、クラス候補選択部１１４は、「ペルシャ猫」をクラス候補集合に含めない。第２の実施形態に係るデータ分類システム１０２では、イヌ科の「フェネック」と類似度が低い「ペルシャ猫」をクラス候補集合に入れないことで、誤分類を避けることができ、分類精度の向上が期待される。

　また、第１の実施形態に係るデータ分類システム１０１、および、第２の実施形態に係るデータ分類システム１０２によれば、他にも、文章をその文章が所属するカテゴリに分類する文章分類において、文章データベースに含まれていないカテゴリに所属する文章のカテゴリを正しく推定することができると期待される。例えば、SNS（Social Networking Service）等に投稿されたある商品に対するコメントに対して、そのコメントが指している商品名が新商品などの文章データベースにまだ存在していない商品である場合に、そのコメントが指している商品名を正しく推定することを考える。このとき、前記の画像分類タスクにおける画像をコメントに、画像が所属するクラスを商品名に、画像のクラス属性を商品ジャンルや成分などから定まる商品のクラス属性に置き換えることで、上述した手続と同様の手続きで、コメントが指している商品名を高精度で推定することができる。

（第４の実施形態）
　図７は、第４の実施形態に係るデータ分類システムの構成例を示す図である。図７に示す構成で、データ分類システム５０１は、既知クラス尤度計算部５１１と、クラス候補選択部５１２と、全クラス尤度計算部５１３と、クラス推定部５１４とを備える。

　かかる構成で、既知クラス尤度計算部５１１は、クラス分類の学習に用いられる教師データに示されるクラスである既知クラスの各々について、対象データが全ての既知クラスのうちその既知クラスに所属することの尤もらしさを示す既知クラス尤度を計算する。クラス候補選択部５１２は、クラス分類における全てのクラスのうち、少なくとも１つの既知クラスを既知クラス尤度に基づいて除いたクラスを、対象データが所属するクラスの候補として選択する。全クラス尤度計算部５１３は、少なくとも、対象データが所属するクラスの候補に含まれるクラスの各々について、対象データが全てのクラスのうちそのクラスにすることの尤もらしさを示す全クラス尤度を計算する。クラス推定部５１４は、全クラス尤度に基づいて、対象データが所属するクラスを、対象データが所属するクラスの候補のうち何れかのクラスと推定する。

　このように、クラス候補選択部５１２が、対象データが所属するクラスの候補を既知クラス尤度に基づいて絞り込むことで、データ分類システム５０１が比較的高精度にクラス分類を行えると期待される。データ分類システム５０１によれば、この点で、教師データに示されないクラスを含むクラス分類の精度の向上を図ることができる。

（第５の実施形態）
　図８は、第５の実施形態に係るデータ分類方法における処理手順の例を示す図である。
　図８に示すデータ分類方法は、既知クラス尤度計算工程（ステップＳ５０１）と、クラス候補選択工程（ステップＳ５０２）と、全クラス尤度計算工程（ステップＳ５０３）と、クラス推定工程（ステップＳ５０４）とを含む。

　既知クラス尤度計算工程（ステップＳ５０１）では、クラス分類の学習に用いられる教師データに示されるクラスである既知クラスの各々について、対象データが全ての既知クラスのうちその既知クラスに所属することの尤もらしさを示す既知クラス尤度を計算する。
　クラス候補選択工程（ステップＳ５０２）では、クラス分類における全てのクラスのうち、少なくとも１つの既知クラスを既知クラス尤度に基づいて除いたクラスを、対象データが所属するクラスの候補として選択する。

　全クラス尤度計算工程（ステップＳ５０３）では、少なくとも、対象データが所属するクラスの候補に含まれるクラスの各々について、対象データが全てのクラスのうちそのクラスに所属することの尤もらしさを示す全クラス尤度を計算する。
　クラス推定工程（ステップＳ５０４）では、全クラス尤度に基づいて、対象データが所属するクラスを、対象データが所属するクラスの候補のうち何れかのクラスと推定する。

　図８に示すデータ分類方法によれば、対象データが所属するクラスの候補を既知クラス尤度に基づいて絞り込むことで、比較的高精度にクラス分類を行えると期待される。図８に示すデータ分類方法によれば、この点で、教師データに示されないクラスを含むクラス分類の精度の向上を図ることができる。

　図９は、少なくとも１つの実施形態に係るコンピュータの構成を示す概略ブロック図である。
　図９に示す構成で、コンピュータ７００は、ＣＰＵ７１０と、主記憶装置７２０と、補助記憶装置７３０と、インタフェース７４０とを備える。
　上記のデータ分類システム１０１、データ分類システム１０２およびデータ分類システム５０１のうち何れか１つ以上が、コンピュータ７００に実装されてもよい。その場合、上述した各処理部の動作は、プログラムの形式で補助記憶装置７３０に記憶されている。ＣＰＵ７１０は、プログラムを補助記憶装置７３０から読み出して主記憶装置７２０に展開し、当該プログラムに従って上記処理を実行する。また、ＣＰＵ７１０は、プログラムに従って、上述した各記憶部に対応する記憶領域を主記憶装置７２０に確保する。各装置と他の装置との通信は、インタフェース７４０が通信機能を有し、ＣＰＵ７１０の制御に従って通信を行うことで実行される。

　データ分類システム１０１がコンピュータ７００に実装される場合、既知クラス尤度計算部１１１、未知クラス尤度計算部１１２、全クラス尤度計算部１１３、クラス候補選択部１１４、クラス推定部１１５、および、モデル生成部１２３の動作は、プログラムの形式で補助記憶装置７３０に記憶されている。ＣＰＵ７１０は、プログラムを補助記憶装置７３０から読み出して主記憶装置７２０に展開し、当該プログラムに従って上記処理を実行する。
　また、ＣＰＵ７１０は、プログラムに従って、モデル記憶部１１６、教師データ記憶部１２１、および、クラス属性記憶部１２２に対応する記憶領域を主記憶装置７２０に確保する。

　データ分類システム１０２がコンピュータ７００に実装される場合、既知クラス尤度計算部１１１、未知クラス尤度計算部１１２、全クラス尤度計算部１１３、クラス候補選択部１１４、クラス推定部１１５、クラス間類似度計算部１１７、および、モデル生成部１２３の動作は、プログラムの形式で補助記憶装置７３０に記憶されている。ＣＰＵ７１０は、プログラムを補助記憶装置７３０から読み出して主記憶装置７２０に展開し、当該プログラムに従って上記処理を実行する。
　また、ＣＰＵ７１０は、プログラムに従って、モデル記憶部１１６、教師データ記憶部１２１、および、クラス属性記憶部１２２に対応する記憶領域を主記憶装置７２０に確保する。

　データ分類システム５０１がコンピュータ７００に実装される場合、既知クラス尤度計算部５１１、クラス候補選択部５１２、全クラス尤度計算部５１３、および、クラス推定部５１４の動作は、プログラムの形式で補助記憶装置７３０に記憶されている。ＣＰＵ７１０は、プログラムを補助記憶装置７３０から読み出して主記憶装置７２０に展開し、当該プログラムに従って上記処理を実行する。

　なお、判定装置１００、および、判定措置２１０が行う処理の全部または一部を実行するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各部の処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、ＯＳや周辺機器等のハードウェアを含むものとする。
　また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ＲＯＭ（Read Only Memory）、ＣＤ－ＲＯＭ（Compact Disc Read Only Memory）等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。

　以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。

　本発明の実施形態は、データ分類システム、データ分類方法および記録媒体に適用してもよい。

１０１、１０２、５０１　データ分類システム
１１１、５１１　既知クラス尤度計算部
１１２　未知クラス尤度計算部
１１３、５１３　全クラス尤度計算部
１１４、５１２　クラス候補選択部
１１５、５１４　クラス推定部
１１６　モデル記憶部
１１７　クラス間類似度計算部
１２１　教師データ記憶部
１２２　クラス属性記憶部
１２３　モデル生成部

Claims

　クラス分類の学習に用いられる教師データに示されるクラスである既知クラスの各々について、対象データが全ての既知クラスのうちその既知クラスに所属することの尤もらしさを示す既知クラス尤度を計算する、既知クラス尤度計算手段と、
　前記クラス分類における全てのクラスのうち、少なくとも１つの前記既知クラスを前記既知クラス尤度に基づいて除いたクラスを、前記対象データが所属するクラスの候補として選択する、クラス候補選択手段と、
　少なくとも前記候補に含まれるクラスの各々について、前記対象データが全てのクラスのうちそのクラスに所属することの尤もらしさを示す全クラス尤度を計算する、全クラス尤度計算手段と、
　前記全クラス尤度に基づいて、前記対象データが所属するクラスを前記候補のうち何れかのクラスと推定する、クラス推定手段と、
　を備えるデータ分類システム。
　前記既知クラス以外のクラスである未知クラスの各々について、前記対象データが全ての未知クラスのうちその未知クラスに所属することの尤もらしさを示す未知クラス尤度を計算する、未知クラス尤度計算手段、
　をさらに備え、
　前記クラス候補選択手段は、前記既知クラス尤度と前記未知クラス尤度を用いて、前記候補を選択する、
　請求項１記載のデータ分類システム。
　前記クラス候補選択手段は、前記対象データの前記既知クラス尤度が高い順に所定の個数の前記既知クラスと、前記対象データの前記未知クラス尤度が高い順に所定の個数の前記未知クラスとを、前記候補として選択する、
　請求項２記載のデータ分類システム。
　前記クラス候補選択手段は、前記既知クラスのうち前記対象データの前記既知クラス尤度が所定の閾値よりも高いクラスと、前記未知クラスのうち前記対象データの前記未知クラス尤度が所定の閾値よりも高いクラスを前記候補として選択する、
　請求項２記載のデータ分類システム。
　二つのクラスの類似度を計算する、クラス間類似度計算手段
　をさらに備え、
　前記未知クラス尤度計算手段は、前記既知クラス尤度と前記類似度を用いて、前記対象データの前記未知クラス尤度を計算する、
　請求項２から４の何れか一項記載のデータ分類システム。
　クラス分類の学習に用いられる教師データに示されるクラスである既知クラスの各々について、対象データが全ての既知クラスのうちその既知クラスに所属することの尤もらしさを示す既知クラス尤度を計算することと、
　前記クラス分類における全てのクラスのうち、少なくとも１つの前記既知クラスを前記既知クラス尤度に基づいて除いたクラスを、前記対象データが所属するクラスの候補として選択することと、
　少なくとも前記候補に含まれるクラスの各々について、前記対象データが全てのクラスのうちそのクラスに所属することの尤もらしさを示す全クラス尤度を計算することと、
　前記全クラス尤度に基づいて、前記対象データが所属するクラスを前記候補のうち何れかのクラスと推定することと、
　を含むデータ分類方法。
　コンピュータに、
　クラス分類の学習に用いられる教師データに示されるクラスである既知クラスの各々について、対象データが全ての既知クラスのうちその既知クラスに所属することの尤もらしさを示す既知クラス尤度を計算することと、
　前記クラス分類における全てのクラスのうち、少なくとも１つの前記既知クラスを前記既知クラス尤度に基づいて除いたクラスを、前記対象データが所属するクラスの候補として選択することと、
　少なくとも前記候補に含まれるクラスの各々について、前記対象データが全てのクラスのうちそのクラスに所属することの尤もらしさを示す全クラス尤度を計算することと、
　前記全クラス尤度に基づいて、前記対象データが所属するクラスを前記候補のうち何れかのクラスと推定することと、
　を実行させるためのプログラムを記録する記録媒体。