JP5684084B2

JP5684084B2 - 誤分類検出装置、方法、及びプログラム

Info

Publication number: JP5684084B2
Application number: JP2011220337A
Authority: JP
Inventors: 昭典藤野; 具治岩田; 永田　昌明; 昌明永田
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2011-10-04
Filing date: 2011-10-04
Publication date: 2015-03-11
Anticipated expiration: 2031-10-04
Also published as: JP2013080395A

Description

本発明は、誤分類検出装置、方法、及びプログラムに係り、特に、サンプル集合の中から、誤ったカテゴリに分類されたコンテンツのサンプルを検出する誤分類検出装置、方法、及びプログラムに関する。

コンテンツのカテゴリ分類は、多くの場合、人手による分類作業によって行われる。あるいは、人手によってカテゴリに分類されたいくつかのコンテンツを訓練データとして用いて統計的分類器を設計し、新規のコンテンツのカテゴリを推定するのに統計的分類器を用いることでコンテンツの自動分類を行う。

しかし、人手による分類作業には、コンテンツを誤ったカテゴリに分類する誤分類の危険性が常に存在する。また、誤ったカテゴリに分類されたコンテンツは、統計的分類器の自動分類性能の低下をもたらす。それ故、与えられた分類済みのサンプルの中から、誤ったカテゴリに分類されているサンプルを検出する誤分類検出技術は重要である。

従来の技術では、分類済みのサンプルの集合の中から誤分類されたサンプルを推定するため、まず、分類済みのサンプルのすべてを訓練データとし、交差検定法を用いて学習した統計的分類器を用いてサンプルのカテゴリを推定する。次に、その推定されたカテゴリが分類されているカテゴリと一致しないサンプルを、誤分類されたサンプルとして検出する。検出精度を高めるため、非特許文献１、２の技術では、複数の統計的分類器で得られるカテゴリ推定の結果の多数決を取ることで、統計的分類器の種類に依存するカテゴリ推定のバイアスの悪影響を抑制している。非特許文献３、４の技術では、カテゴリの種類が２つしかない問題で、１つのサンプルのカテゴリを異なるカテゴリに置き換えて学習させた統計的分類器を用いて別のサンプルのカテゴリを推定する。カテゴリを置き換えるサンプルを変えて集めた複数の推定結果から最終判定を行うことで、カテゴリ推定の精度を高めている。

Carla E. Brodley and Mark A. Friedl. Identifying mislabeled training data.Journal of Artificial Intelligence Research, 11(11):131−166, 1999. Sundara Venkataraman, Dimitris Metaxas, Dmitriy Fradkin, Casimir Kulikowski, and Ilya Muchnik. Distinguishing mislabeled data from correctly labeled data in classifier design. In Proceedings of the 16th IEEE International Conference on Tools with Artificial Intelligence (ICTAI’04), pages 668−672, 2004. Andrea Mallosini, Enrico Blanzieri, and Raymond T. Ng. Detecting potential labeling errors in microarrays by data perturbation. Bioinformatics, 22(17):2114−2121, 2006. Chen Zhang, Chunguo Wu, Enrico Blanzieri, You Zhou, Yan Wang, Wei Du, and Yanchun Liang. Methods for labeling error detection in microarrays based on the effect of data perturbation on the regression model. Bioinformatics, 25(20):2708−2714, 2009.

上記の非特許文献１、２の技術では、カテゴリの推定に用いる統計的分類器を、推定対象のサンプルを除いた訓練データを用いて学習させる。その訓練データの中には、誤分類されたサンプルが含まれている。一般に、誤分類されたサンプルを含む訓練データ集合を用いて学習させた統計的分類器の性能は、誤分類されたサンプルを訓練データ集合から除外して学習させた統計的分類器の性能より劣る。したがって、統計的分類器の精度を向上させるために、誤分類されたサンプルが統計的分類器の学習に与える悪影響を抑制する技術が必要となる。

上記の非特許文献３、４では、訓練データ中のサンプルに付与されたカテゴリを入れ換えて学習を行うことで、カテゴリの推定精度を向上させている。しかし、上記の非特許文献３、４に記載の技術は、カテゴリの種類が２つの場合のみの問題を想定しており、カテゴリが複数ある分類問題には適用できない。

本発明は、上記の事情を鑑みてなされたもので、検出に利用する統計的分類器の学習に誤分類されたサンプルが与える悪影響を抑制して、カテゴリが複数ある一般的な分類問題で誤分類されたサンプルを検出することができる誤分類検出装置、方法、及びプログラムを提供することを目的とする。

上記の目的を達成するために本発明に係る誤分類検出装置は、誤ったカテゴリに分類されたコンテンツである誤分類サンプルを含む、コンテンツの属するカテゴリが既知のサンプル集合の中から、誤分類サンプルを検出する誤分類検出装置であって、
コンテンツｘとカテゴリｙで表わされるサンプルの同時確率モデルｐ（ｘ、ｙ；Θ）のパラメータΘの推定値＾Θを、一点除外交差検定法に基づく前記同時確率モデルｐ（ｘ、ｙ；Θ）の予測尤度を最大化させるように、サンプルｎごとに設定した重みｗ_nを用いて計算する確率モデル生成手段と、
前記確率モデル生成手段によって計算された前記同時確率モデルｐ（ｘ、ｙ；Θ）のパラメータ値Θの推定値＾Θに基づいて、各サンプルｎについてコンテンツｘ_nが分類されているカテゴリｙ_nの予測クラス事後確率Ｐ（ｙ_n｜ｘ_n ；＾Θ）を計算し、各サンプルｎの予測クラス事後確率Ｐ（ｙ_n｜ｘ_n ；＾Θ）に基づいて、誤分類サンプルを検出する誤分類サンプル検出手段と、
を含み、
前記確率モデル生成手段は、
誤って分類されているサンプルｎに大きな値を設定すべき重みｗ _0n 及び正しく分類されているサンプルｎに大きな値を設定すべき重みｗ _1n を規定する重みパラメータ行列の推定値^Ｗに基づいて求められる、一点除外交差検定法に基づくパラメータΘの推定値＾Θ _-n を用いて、各サンプルｎが正しく分類されているか否かを表す潜在変数ｚの予測を与える正誤予測確率Ｐ（ｚ｜ｘ _n 、ｙ _n ；Θ _-n ）を計算する正誤予測確率計算手段と、
前記正誤予測確率計算手段によって計算された前記正誤予測確率Ｐ（ｚ｜ｘ _n 、ｙ _n ；＾Θ _-n ）を用いて、前記重みパラメータ行列の推定値^Ｗを計算する重み計算手段と、
前記重みパラメータ行列の推定値^Ｗの変化量を計算し収束条件を満たす前記重みパラメータ行列の推定値^Ｗが求まるまで、あるいは所定の回数に達するまで、前記正誤予測確率計算手段による計算及び前記重み計算手段による計算の繰り返し処理を行う収束判定手段と、
前記収束判定手段による繰り返し処理により得られた前記重みパラメータ行列の推定値^Ｗを用いて、サンプルｎごとに、前記同時確率モデルｐ（ｘ、ｙ；Θ）のパラメータΘの一点除外交差検定法に基づく推定値^Θ _-n を計算するパラメータ計算手段と、を含んで構成されている。

本発明に係る誤分類検出方法は、誤ったカテゴリに分類されたコンテンツである誤分類サンプルを含む、コンテンツの属するカテゴリが既知のサンプル集合の中から、誤分類サンプルを検出する誤分類検出方法であって、
確率モデル生成手段によって、コンテンツｘとカテゴリｙで表わされるサンプルの同時確率モデルｐ（ｘ、ｙ；Θ）のパラメータΘの推定値＾Θを、一点除外交差検定法に基づく前記同時確率モデルｐ（ｘ、ｙ；Θ）の予測尤度を最大化させるように、サンプルｎごとに設定した重みｗ_nを用いて計算するステップと、
誤分類サンプル検出手段によって、前記確率モデル生成手段によって計算された前記同時確率モデルｐ（ｘ、ｙ；Θ）のパラメータ値Θの推定値＾Θに基づいて、各サンプルｎについてコンテンツｘ_nが分類されているカテゴリｙ_nの予測クラス事後確率Ｐ（ｙ_n｜ｘ_n ；＾Θ）を計算し、各サンプルｎの予測クラス事後確率Ｐ（ｙ_n｜ｘ_n ；＾Θ）に基づいて、誤分類サンプルを検出するステップと、
を含み、
前記同時確率モデルｐ（ｘ _n 、ｙ _n ）のパラメータ値Θを計算するステップは、
正誤予測確率計算手段によって、誤って分類されているサンプルｎに大きな値を設定すべき重みｗ _0n 及び正しく分類されているサンプルｎに大きな値を設定すべき重みｗ _1n を規定する重みパラメータ行列の推定値^Ｗに基づいて求められる、一点除外交差検定法に基づくパラメータΘの推定値＾Θ _-n を用いて、各サンプルｎが正しく分類されているか否かを表す潜在変数ｚの予測を与える正誤予測確率Ｐ（ｚ｜ｘ _n 、ｙ _n ；Θ _-n ）を計算するステップと、
重み計算手段によって、前記正誤予測確率計算手段によって計算された前記正誤予測確率Ｐ（ｚ｜ｘ _n 、ｙ _n ；＾Θ _-n ）を用いて、前記重みパラメータ行列の推定値^Ｗを計算するステップと、
収束判定手段によって、前記重みパラメータ行列の推定値^Ｗの変化量を計算し収束条件を満たす前記重みパラメータ行列の推定値^Ｗが求まるまで、あるいは所定の回数に達するまで、前記正誤予測確率計算手段による計算及び前記重み計算手段による計算の繰り返し処理を行うステップと、
パラメータ計算手段によって、前記収束判定手段による繰り返し処理により得られた前記重みパラメータ行列の推定値^Ｗを用いて、サンプルｎごとに、前記同時確率モデルｐ（ｘ、ｙ；Θ）のパラメータΘの一点除外交差検定法に基づく推定値^Θ _-n を計算するステップと、
を含むことを特徴とする。

本発明によれば、確率モデル生成手段によって、コンテンツｘとカテゴリｙで表わされるサンプルの同時確率モデルｐ（ｘ、ｙ；Θ）のパラメータΘの推定値＾Θを、一点除外交差検定法に基づく前記同時確率モデルｐ（ｘ、ｙ；Θ）の予測尤度を最大化させるように、サンプルｎごとに設定した重みｗ_nを用いて計算する。

そして、誤分類サンプル検出手段によって、前記確率モデル生成手段によって計算された前記同時確率モデルｐ（ｘ、ｙ；Θ）のパラメータ値Θの推定値＾Θに基づいて、各サンプルｎについてコンテンツｘ_nが分類されているカテゴリｙ_nの予測クラス事後確率Ｐ（ｙ_n｜ｘ_n ；＾Θ）を計算し、各サンプルｎの予測クラス事後確率Ｐ（ｙ_n｜ｘ_n ；＾Θ）に基づいて、誤分類サンプルを検出する。

このように、同時確率モデルｐ（ｘ、ｙ；Θ）のパラメータΘの推定値＾Θを、一点除外交差検定法に基づく同時確率モデルｐ（ｘ、ｙ；Θ）の予測尤度を最大化させるように、サンプルｎごとに設定した重みを用いて計算し、同時確率モデルｐ（ｘ、ｙ；Θ）のパラメータ値Θの推定値＾Θに基づいて計算される各サンプルｎの予測クラス事後確率Ｐ（ｙ_n｜ｘ_n ；＾Θ）を用いて、誤分類サンプルを検出することにより、検出に利用する統計的分類器の学習に誤分類されたサンプルが与える悪影響を抑制して、カテゴリが複数ある一般的な分類問題で誤分類されたサンプルを検出することができる。

本発明に係る確率モデル生成手段は、一点除外交差検定法に基づく各サンプルｎの対数尤度の和を最大化させるように、正しく分類されているサンプルｎに大きな値を設定すべき重みｗ_1nを規定する重みパラメータ行列の推定値^Ｗを計算する重み計算手段と、前記重みパラメータ行列の推定値^Ｗの変化量を計算し収束条件を満たす前記重みパラメータ行列の推定値^Ｗが求まるまで、あるいは所定の回数に達するまで、前記重み計算手段による計算の繰り返し処理を行う収束判定手段と、前記収束判定手段による繰り返し処理により得られた前記重みパラメータ行列の推定値^Ｗを用いて、サンプルｎごとに、前記同時確率モデルｐ（ｘ、ｙ；Θ）のパラメータΘの一点除外交差検定法に基づく推定値^Θ_-nを計算するパラメータ計算手段と、を含むようにすることができる。

本発明に係るプログラムは、コンピュータを、上記の誤分類検出装置の各手段として機能させるためのプログラムである。

以上説明したように、本発明の誤分類検出装置、方法、及びプログラムによれば、同時確率モデルｐ（ｘ、ｙ；Θ）のパラメータΘの推定値＾Θを、一点除外交差検定法に基づく同時確率モデルｐ（ｘ、ｙ；Θ）の予測尤度を最大化させるように、サンプルｎごとに設定した重みを用いて計算し、同時確率モデルｐ（ｘ、ｙ；Θ）のパラメータ値Θの推定値＾Θに基づいて計算される各サンプルｎの予測クラス事後確率Ｐ（ｙ_n｜ｘ_n ；＾Θ）を用いて、誤分類サンプルを検出することにより、検出に利用する統計的分類器の学習に誤分類されたサンプルが与える悪影響を抑制して、カテゴリが複数ある一般的な分類問題で誤分類されたサンプルを検出することができる、という効果が得られる。

本発明の第１の実施の形態に係る誤分類検出装置の構成を示す概略図である。本発明の第１の実施の形態に係る誤分類検出装置における確率モデル生成部の構成を示す図である。本発明の第１の実施の形態に係る誤分類検出装置における誤分類検出処理ルーチンの内容を示すフローチャートである。本発明の第１の実施の形態に係る誤分類検出装置における確率モデル生成処理ルーチンの内容を示すフローチャートである。本発明の第２の実施の形態に係る誤分類検出装置における確率モデル生成部の構成を示す図である。本発明の第２の実施の形態に係る誤分類検出装置における確率モデル生成処理ルーチンの内容を示すフローチャートである。

以下、図面を参照して本発明の実施の形態を詳細に説明する。データベースに含まれる論文、特許等の文書、オンラインニュースデータ、電子メール等のテキスト情報から成るコンテンツや、Webデータ、blogデータ等のテキスト情報とリンク情報から成るコンテンツ、あるいは画像データ等のコンテンツ、といった特徴ベクトルにより表現することが可能なコンテンツを、スポーツ、音楽、数学といった種別を表すカテゴリに分類したサンプルの集合の中から、誤ったカテゴリに分類されているサンプルを検出する誤分類検出装置に本発明を適用した場合について説明する。

〔第１の実施の形態〕
＜システム構成＞
本発明の第１の実施の形態に係る誤分類検出装置１００は、所属するカテゴリのラベルが付与されたコンテンツを含むサンプルの集合が入力され、入力されたサンプルの集合の中から、誤ったカテゴリのラベルが付与されているサンプルを検出して出力する。この誤分類検出装置１００は、ＣＰＵと、ＲＡＭと、後述する誤分類検出処理ルーチンを実行するためのプログラムを記憶したＲＯＭとを備えたコンピュータで構成され、機能的には次に示すように構成されている。図１に示すように、誤分類検出装置１００は、入力部１０と、演算部２０と、出力部３０とを備えている。

入力部１０は、入力された、所属するカテゴリのラベルが付与されたコンテンツを含むサンプルの集合を受け付ける。コンテンツに含まれる単語や画素、リンク、あるいはそれらの組み合わせ等により構成される特徴量空間をＴ＝｛ｔ₁, ... ,ｔ_i, ... ,ｔ_V｝とするとき、コンテンツの特徴ベクトルｘは、コンテンツに含まれるｔiの頻度ｘiをもとにｘ＝｛ｘ₁, ... ,ｘ_i, ... ,ｘ_V）^Tで表現される。Vはコンテンツに含まれる可能性がある特徴の種類の数を表す。例えば、コンテンツがテキストデータである場合、Vはコンテンツに出現する可能性がある語彙の総数を表す。サンプル集合の各サンプルは、コンテンツの特徴ベクトルｘと、所属するカテゴリのラベルｙとを含む。

また、入力部１０は、入力された、後述する各種パラメータ（ハイパーパラメータベクトルηと、カテゴリの事前確率P(y)、正誤の事前確率P(z)と、n番目のサンプルのカテゴリy_nが誤っている場合のクラス条件付確率P(y|x, z₀)）を受け付ける。

演算部２０は、サンプルデータベース２１、確率モデル生成部２２、記憶部２３、及び誤分類サンプル検出部２４を備えている。

サンプルデータベース２１は、入力部１０により受け付けたサンプル集合を記憶する。ここで、誤分類検出対象のサンプル集合を、D={(x_n, y_n)}^N _n=1とする。

確率モデル生成部２２は、誤分類検出対象のサンプル集合D={(x_n, y_n)}^N _n=1に対して、同時確率モデルp(x, y; θ_y)のパラメータΘ=[θ₁, . . . , θ_k, . . . , θ_K]の一点交差検定法に基づく推定値{＾Θ_−n}^N _n=1を計算する。計算された確率モデルのパラメータの推定値{＾Θ_−n}^N _n=1は、記憶部２３に記憶される。

ここで、ｎは誤分類検出対象のサンプル集合に含まれるサンプルのID番号を表し、x_nはn番目のサンプルの特徴ベクトル、y∈{1, . . . , k, . . . ,K} はサンプルが属するカテゴリを表す。＾Θ_−nはn番目のサンプル(x_n,y_n)をサンプル集合Dから除外して得られるサブ集合D_−n={(x_n', y_n')}_n'≠nを用いて計算される確率モデルのパラメータの推定値であり、pは確率密度を表す。

誤分類サンプル検出部２４は、同時確率モデルのパラメータの推定値＾Θ_−nを用いて各サンプルの予測クラス事後確率P(y_n|x_n;＾Θ_−n)＝p(x_n,y_n;＾θ_yn,−n)/Σ^K _k=1p(x_n,k;＾θ_k,−n)を計算し、その予測クラス事後確率が小さいサンプルを誤ったカテゴリに分類された疑いがあるサンプルとして検出する。あるいは、誤分類サンプル検出部２４は、サンプルが分類されているカテゴリy_n以外のカテゴリy≠y_nに対する予測事後確率の最大値と予測クラス事後確率との比R_n=P(y_n|x_n; ＾Θ_−n)/max_y≠ynP(y|x_n;＾Θ_−n)を計算し、R_nが小さいサンプルを検出しても良い。ここで、Pは確率値を表す。

出力部３０は、誤分類サンプルの検出結果をユーザに対して出力する。

図２に示すように、確率モデル生成部２２は、正誤予測確率計算部３１と、重み計算部３２と、第１収束判定部３３と、第２収束判定部３４と、パラメータ計算部３５と、を備える。

正誤予測確率計算部３１は、サンプルデータベース２１に記憶されたサンプル集合D={(x_n,y_n)}^N _n=1を読み込んで、重みパラメータ行列の初期値W⁽⁰⁾、もしくは第２収束判定部３４から入力される収束途中の重みパラメータ行列W^(t)と、ハイパーパラメータベクトルηと、カテゴリの事前確率P(y)と、正誤の事前確率P(z)と、n番目のサンプルのカテゴリy_nが誤っている場合のクラス条件付確率P(y|x, z₀) と、を用いて、各サンプルｎの正誤予測確率P(z|x_n,y_n;＾Θ^(t) _−n)を計算する。ここで、z∈{z₁,z₀}はサンプルのコンテンツｘが分類されているカテゴリyが正しいか否かを表す潜在変数であり、z=z₁の場合は正しく分類されていることを意味し、z=z₀の場合は誤って分類されていることを意味する。重みパラメータ行列Wは、ｎ番目のサンプルが正しく分類されている可能性が高いほど大きな値が与えられる重みw_1nを要素とする重みベクトルw₁=(w₁₁, ... ,w_1n, ... ,w_1N)^Tと、ｎ番目のサンプルが誤って分類されている可能性が高いほど大きな値が与えられる重みw_0nを要素とする重みベクトルw₀=(w₀₁, . . . ,w_0n, . . . ,w_0N)^Tと、から成る行列W=[w₁,w₀]である。a^Tはaの転置ベクトルを表す。

重み計算部３２は、重みパラメータ行列の初期値W⁽⁰⁾、もしくは第２収束判定部３４から入力される収束途中の重みパラメータ行列W^(t)、もしくは第１収束判定部３３から入力される収束途中の重みパラメータ行列W^(s)と、各サンプルｎの正誤予測確率P(z|x_n,y_n;＾Θ^(t) _−n)と、を用いて重みパラメータ行列の更新値W^(s+1)を計算する。

第１収束判定部３３は、重みパラメータ行列の変化量d(s)を計算し、収束条件d(s)<ε_sを満たせば、W^(t+1)←W^(s+1)として重みパラメータ行列の推定値W^(t+1)を第２収束判定部３４に出力する。収束条件を満たさなければ、パラメータの学習のステップをs←s+1のように更新して、重み計算部３２の処理を再度実施する。この処理は収束条件を満たすか、sが所定の回数s_maxに到達するまで繰り返される。

第２収束判定部３４は、重みパラメータ行列の変化量d(t)を計算し、収束条件d(t)<εを満たせば、＾W←W^(t+1)として、重みパラメータ行列の推定値＾Wを出力する。収束条件を満たさなければ、パラメータの学習のステップをt←t+1のように更新して、正誤予測確率計算部３１、重み計算部３２、及び第１収束判定部３３による一連の処理を再度実施する。この処理は収束条件を満たすか、tが所定の回数t_maxに到達するまで繰り返される。

パラメータ計算部３５は、重みパラメータ行列の推定値＾Wを用いて、確率モデルの一点除外交差検定法に基づく推定値{＾Θ_−n}^N _n=1を計算して出力する。

ここで、本実施の形態における確率モデルについて説明する。以下では、確率モデルp(x,y;θy)に、多項分布に基づくNaive Bayesモデル(以下、NB モデル)を用いる場合を例に説明する。

多項分布に基づくNBモデルでは、コンテンツが正しいカテゴリに分類されている場合に、カテゴリyと特徴ベクトルxの同時確率モデルp(x,y;θ_y)=p(x|y;θ_y)P(y)のp(x|y;θ_y)を、カテゴリyにおけるそれぞれの特徴t_iの出現確率θy_iが独立であると仮定して、以下の（１)式で定義する。

ここで、θ_y=(θ_y1, . . . ,θ_yi, . . . ,θ_yV)^Tであり、θ_yi>0かつ||θ_y||₁=Σ^V _i=1θ_yi=1である。また、Θ=[θ₁, . . . ,θ_k, . . . ,θ_K]^TはNBモデルのパラメータ行列を表す。P(y)>0はカテゴリyの出現確率を表し、Σ^K _k=1P(k)=1を満たす。

また、本実施の形態では、誤ったカテゴリに分類されたサンプルの特徴ベクトルxの確率モデルを、それぞれの特徴t_iの出現確率θ_z0iが独立であると仮定して、以下の（２）式で定義する。

ここで、θ_z0=(θ_z01, . . . ,θ_z0i, . . . , θ_z0V)^Tであり、θ_z0i>0かつ||θ_z0||₁=Σ^V _i=1θ_z0i=1である。

＜誤分類検出装置の作用＞
次に、第１の実施の形態に係る誤分類検出装置１００の作用について説明する。まず、所属するクラスがラベル付けされたコンテンツを含むサンプルの集合が誤分類検出装置１００に入力されると、誤分類検出装置１００によって、入力されたサンプル集合が、サンプルデータベース２１へ格納される。また、各種パラメータ（ハイパーパラメータベクトルηと、カテゴリの事前確率P(y)と、正誤の事前確率P(z)と、n番目のサンプルのカテゴリy_nが誤っている場合のクラス条件付確率P(y|x, z₀)））が、誤分類検出装置１００に入力されると、誤分類検出装置１００によって、図３に示す誤分類検出処理ルーチンが実行される。

まず、ステップＳ１０１において、確率モデル生成部２２によって、サンプルデータベース２１から、誤分類検出対象のサンプル集合D={(x_n,y_n)}^N _n=1を読み込んで、各サンプルｎについて、確率モデルのパラメータの一点除外交差検定法に基づく推定値＾Θ_−nの計算を行う。＾Θ_−nの各要素は、入力された重みパラメータ行列Ｗ⁽⁰⁾または計算された重みパラメータ行列Ｗ^(t)の要素である重みパラメータベクトルw₁と、入力されたハイパーパラメータ値η_y,∀_yを用いて、以下の（３）式で計算される。

ここで、I_y(y_n')は、y_n'=yの場合にI_y(y_n')=1とし、y_n'≠yの場合にI_y(y_n')=0とする指示関数である。||x_n'||₁はx_n'のL1ノルムを表す。

同様に、誤ったカテゴリに分類されたサンプルの特徴ベクトルxの確率モデルp(x|z₀;θ_z0)のパラメータの、一点除外交差検定法に基づく推定値＾θ_z0,−nの各要素を、入力された重みパラメータ行列Ｗ⁽⁰⁾または計算された重みパラメータ行列Ｗ^(t)の要素である、重みパラメータベクトルw₀と、入力されたハイパーパラメータ値η_z0とを用いて、以下の（４）式に従って計算する。

ハイパーパラメータベクトルη=(η₁, . . . ,η_k, . . . ,η_K,η_z0)は、パラメータ計算のために事前に設定された定数値である。

ここで、確率モデルのパラメータの一点除外交差検定法に基づく推定値＾Θ_−nを計算する原理について説明する。

本実施の形態では、重みパラメータ行列Wの値を、サンプル集合Dに対する同時確率モデルp(x, y)の、一点除外交差検定法に基づく予測尤度の最大化により与える。サンプル集合の中には誤ったカテゴリに分類されたサンプルも含まれるため、コンテンツの特徴ベクトルxと、カテゴリyと、正誤を表す潜在変数z∈{z₁,z₀}との同時確率モデルp(x,y,z)=p(x,y|z)P(z)を用いて、同時確率モデルp(x,y)=Σ¹ _j=0p(x,y|z_j)P(z_j)を設計する。サンプルのクラスが正しい場合(z=z₁)のp(x,y|z₁)を以下の（５）式で与える。

また、サンプルのクラスが誤りである場合(z=z₀)のp(x,y|z₀)を、以下の（６)式で与える。

このとき、重みパラメータ行列Wの値は、以下の（７)式に示す目的関数の最大化により与えられる。

なお、上記（７)式のＬ（Ｗ）は、一点除外交差検定法に基づく同時確率モデルｐ（ｘ_n、ｙ_n）の予測尤度に対応している。

上記（７）式に示す目的関数を最大化させるWの値は、期待値最大化(EM)アルゴリズムのような繰り返し計算を二重に行うことによって求めることができる。なお、ＥＭアルゴリズムについては、参考文献（A. P. Dempster, N. M.Laird, and D. B. Rubin: Maximum likelihood from incomplete data via the EM algorithm. Journal of the Royal Statistical Society, Series B, 39, 1−38 (1977)）に記載されているため、詳細な説明を省略する。

Wの学習ステップ(t)での推定値をW^(t)とするとき、log b≦b−1よりL(W)−L(W^(t))≧Q(W,W^(t))−Q(W^(t),W^(t))を満たすＱ関数を以下の（８）式で与えることができる。

上記（８）式に示すＱ関数は、一点除外交差検定法に基づく各サンプルの対数尤度を、上記正誤予測確率で重み付けして加算することにより与えられる。

学習ステップ(t+1)でQ(W,W^(t))を最大化させる値を推定値W^(t+1)として繰り返し計算することでL(W)を局所的に最大化させるWを求めることができる。

そして、最終的に求められた重みパラメータ行列の推定値^Ｗに基づいて、上記（３）式に従って、確率モデルのパラメータの一点除外交差検定法に基づく推定値{＾Θ_−n}^N _n=1を計算する。

上記ステップＳ１０１の処理は、図４に示す確率モデル生成処理ルーチンによって実現される。

ステップＳ１１１において、正誤予測確率計算部３１によって、各サンプルｎに対して、以下のように、上記（９）式、（１０）式で与えられるP(z|x_n,y_n;＾Θ^(t) _−n)を計算する。

まず、入力された重みパラメータ行列の推定値W^(t)を上記（３）式及び（４）式に代入して得られるパラメータ値を＾Θ^(t) _−n=[＾θ^(t) _1,−n, ... , ＾θ^(t) _k,−n, ... , ＾θ^(t) _K,−n, ＾θ^(t) _z0,−n]とする。つぎに、その値を上記（１）式のθ_yと上記（２）式のθ_z0に代入することで、p(x_n|y_n;＾θ _yn,−n(w^(t) ₁)) とp(x_n;＾θ_z0,−n(w^(t) ₀ ))の値を得る。さらに、その値を、上記（９）式と（１０）式に代入して計算することでP(z|x_n,y_n;＾Θ^(t) _−n)を得る。すなわち、正誤予測確率計算部３１は、正しいカテゴリに分類されているサンプルに対して設計した同時確率モデルと、誤分類サンプルに対して設計した同時確率モデルと、を用いて正誤予測確率を計算する。上記（９）式と（１０）式に含まれる事前確率P(y),P(z)と、クラス条件付確率P(y|x, z₀)は、未知パラメータとして値を推定することも可能であるが、パラメータ計算アルゴリズムの簡略化と、これらのパラメータ値の調節によって精度向上を図るために、本実施の形態では、外部より与えるパラメータ値とする。

また、Q(W,W^(t))を最大化させるWの値は、Wの学習ステップ(s)での推定値をW^(s)とするとき、log ≦b−1よりQ(W,W^(t))−Q(W^(s),W^(t))≧Q'(W,W^(s)|W^(t))−Q'(W^(s),W^(s)|W^(t))を満たすQ関数を以下の（１１）式で与えることができる。

したがって、学習ステップ(s+1)でQ'(W,W^(s)|W^(t))を最大化させる値を推定値W^(s+1)として繰り返し計算することでQ(W,W^(t))をW^(t)の近傍で局所的に最大化させるWを求めることができる。

ステップＳ１１２では、重み計算部３２によって、Q'(W,W^(s)|W^(t))を最大化させるWの解W^(s+1)を、以下の（１４）式、（１５）式に従って計算する。

学習ステップ（ｓ＋１）における重みパラメータ行列Ｗ^(s+1)を計算した後、ステップＳ１１３において、第１収束判定部３３によって、例えば以下の（１６）式で与える収束条件を満たすか否かを判定する。

ここで、||w_(s)j||₂はベクトルw^(s) _jのL2ノルムを表す。ε_sは設計者が与える微小な値である。上記ステップＳ１１３で収束条件を満たすと判定された場合は、W^(s+1)をW^(t+1)として、ステップＳ１１４へ進む。一方、収束条件を満たさないと判定された場合は、s←s+1として、上記ステップＳ１１２からステップＳ１１３までの処理を繰り返す。

学習ステップ(t+1)における重みパラメータ行列W^(t+1)を計算したあと、ステップＳ１１４において、第２収束判定部３４によって、例えば以下の（１７）式で与える収束条件を満たすか否かを判定する。

ここで、ε_tは設計者が与える微小な値である。上記ステップＳ１１４で収束条件を満たすと判定された場合は、W^(t+1)を重みパラメータ行列の推定値＾W としてステップＳ１１５へ進む。一方、収束条件を満たさない場合は、t←t+1として、上記ステップＳ１１１からステップＳ１１４までの処理を繰り返す。

ステップＳ１１５では、パラメータ計算部３５によって、重みパラメータ行列の推定値＾Wを上記（３）式に代入して、サンプルｎごとに確率モデルの一点除外交差検定法に基づくパラメータの推定値＾Θ_-nを計算して、記憶部２３に格納し、確率モデル生成処理ルーチンを終了する。

以上説明したパラメータ計算アルゴリズムを整理して書くと下記のようになる。

手順１：各種パラメータの設定。
1. ハイパーパラメータηと、事前確率P(y),P(z)と、クラス条件付確率P(y|x, z₀)とを所定値として外部から設定。
2. 収束条件のパラメータε_t,ε_sと、最大繰り返し計算数t_max,s_maxの値を設定。

手順２；学習ステップtと重みパラメータ行列の初期値を設定。
1. tに0を代入。
2. 重みパラメータ行列の値W^(t)を設定。

手順3：重みパラメータ行列の推定値＾Wを計算。
1. W^(t)を用いて、上記（１）式〜（４）式、（９）式、（１０）式により、サンプルｎごとに、サンプルの正誤予測確率P(z|x_n,y_n;＾Θ^(t) _−n)を計算(ステップＳ１１１、図4)。
2. sに0を代入。W^(s)にW^(t)を代入。
3. Q(W,W^(t))を最大化させる重みパラメータ行列の値W^(t+1)を計算。
(a) W^(s)を用いて、上記（１２）式〜（１５）式によりW^(s+1)を計算(ステップＳ１１２、図4)。
(b) 上記（１６）式を用いて収束判定処理を実行(ステップＳ１１３、図4)。
4. 上記（１７）式を用いて収束判定処理を実行(ステップＳ１１４、図4)。

手順4：収束した重みパラメータ行列の推定値＾Wを上記（３）式に代入して、サンプルｎごとに一点除外交差検定法に基づく確率モデルのパラメータの推定値＾Θ_-nを計算(ステップＳ１１５、図4)。

手順5：パラメータの推定値{＾Θ_−n}^N _n=1を誤分類サンプル検出部２４に出力。

そして、誤分類検出処理ルーチンのステップＳ１０２では、誤分類サンプル検出部２４によって、同時確率モデルのパラメータの推定値＾Θ_−nを用いて各サンプルｎの予測クラス事後確率P(y_n|x_n;＾Θ_−n)=p(x_n|y_n;＾θ_yn,−n)P(y_n)/Σ^K _k=1p(x_n|k;＾θ_k,−n)P(k)を計算し、その予測クラス事後確率が閾値以下となるサンプルを誤ったカテゴリに分類された疑いがあるサンプルとして検出する。あるいは、誤分類サンプル検出部２４によって、サンプルが分類されているカテゴリy_n以外のカテゴリy≠y_nに対する予測事後確率の最大値と予測クラス事後確率の比R_n=P(y_n|x_n;＾Θ_−n)/max_y≠ynP(y|x_n;＾Θ_−n)を計算し、R_nが閾値以下となるサンプルを検出しても良い。

上記ステップＳ１０２の処理は、一般的な並び換えを行うアルゴリズムで簡単に実現することが可能であるので、これ以上の説明は省略する。

以上説明したように、第１の実施の形態に係る誤分類検出装置によれば、同時確率モデルｐ（ｘ_n、ｙ_n）のパラメータ値Θを、一点除外交差検定法に基づく同時確率モデルｐ（ｘ_n、ｙ_n）の予測尤度を最大化させるように、サンプルｎごとに設定した重みを用いて計算し、同時確率モデルｐ（ｘ_n、ｙ_n）のパラメータ値Θに基づいて計算される各サンプルｎの予測クラス事後確率Ｐ（ｙ_n｜ｘ_n）を用いて、誤分類サンプルを検出することにより、検出に利用する統計的分類器の学習に、誤分類されたサンプルが与える悪影響を抑制して、カテゴリが複数ある一般的な分類問題で誤分類されたサンプルを検出することができる。

訓練データ集合に含まれる各サンプルに重みを与え、その重み付き訓練データ集合を用いて確率モデルに基づく統計的分類器のパラメータ値Θを学習させることで、訓練データ集合に含まれる誤分類されたサンプルが確率モデルの学習に与える悪影響を低減させることを可能にする。また、訓練データ集合に含まれる各サンプルに与えられた重みを、一点交差検定法に基づいて得られる確率モデルの尤度を最大化させるように設定することで、誤分類されたサンプルが正確に分類されたサンプルより少ない場合に、誤分類されたサンプルより正確に分類されたサンプルのカテゴリに高い予測確率を与える確率モデルを得る。この効果によって、カテゴリの予測確率を用いて誤分類されたサンプルの検出を行う装置の性能が高まる。

〔第２の実施の形態〕
＜システム構成＞
次に、第２の実施の形態について説明する。なお、第１の実施の形態と同様の構成となる部分については、同一符号を付して説明を省略する。

第２の実施の形態では、正誤予測確率計算部と第２収束判定部が省略されている点が、第１の実施の形態と異なっている。

図５に示すように、第２の実施の形態に係る誤分類検出装置の確率モデル生成部２２２は、重み計算部２３２と、第１収束判定部２３３と、パラメータ計算部３５とを備えている。

重み計算部２３２は、重みパラメータ行列の初期値W⁽⁰⁾、もしくは第１収束判定部２３３から入力される収束途中の重みパラメータ行列W^(s)を用いて重みパラメータ行列の更新値W^(s+1)を計算する。

第１収束判定部２３３は、重みパラメータ行列の変化量d(s)を計算し、収束条件d(s)<ε_sを満たせば、^W←W^(s+1)として重みパラメータ行列の推定値^Wを出力する。収束条件を満たさなければ、パラメータの学習のステップをs←s+1のように更新して、重み計算部２３２の処理を再度実施する。この処理は収束条件を満たすか、sが所定の回数s_maxに到達するまで繰り返される。

本実施の形態では、コンテンツの特徴ベクトルxと、カテゴリyと、正誤を表す潜在変数z∈{z₁,z₀}との同時確率モデルp(x,y,z)=p(x,y|z)P(z)に対して、Ｐ（ｚ₁）＝１、Ｐ（ｚ₀）＝０とする。

重みパラメータ行列Wの値は、以下の（１８)式に示す目的関数の最大化により与えられる。なお、Ｐ（ｚ₀）＝０としているため、重みパラメータ行列Wのうち、重みベクトルw₀=(w₀₁, . . . ,w_0n, . . . ,w_0N)^Tは計算されない。

上記（１８）式に示す目的関数を最大化させるWの値は、上記の第１の実施の形態と同様に、期待値最大化(EM）アルゴリズムのような繰り返し計算を行うことによって求めることができる。

Wの学習ステップ(ｓ)での推定値をW^(s)とするとき、log b≦b−1よりL(W)−L(W^(s))≧Q(W,W^(s))−Q(W^(s),W^(s))を満たすＱ関数を以下の（１９）式で与えることができる。

以上のように、重みパラメータ行列Wの値は、一点除外交差検定法に基づく各サンプルの対数尤度の和の最大化により与えられる。なお、上記（１８)式のＬ（Ｗ）は、一点除外交差検定法に基づく各サンプルｎの対数尤度の和に対応している。

そして、最終的に求められた重みパラメータ行列の推定値^Ｗに基づいて、上記（３）式に従って、確率モデルの一点除外交差検定法に基づく推定値{＾Θ_−n}^N _n=1を計算する。

＜誤分類検出装置の作用＞
まず、所属するクラスがラベル付けされたコンテンツを含むサンプルの集合が誤分類検出装置１００に入力されると、誤分類検出装置１００によって、入力されたサンプル集合が、サンプルデータベース２１へ格納される。また、ハイパーパラメータベクトルηが、誤分類検出装置１００に入力されると、誤分類検出装置１００によって、上記第１の実施の形態と同様に、誤分類検出処理ルーチンが実行される。

また、第２の実施の形態に係る確率モデル生成処理ルーチンについて、図６を用いて説明する。なお、第１の実施の形態と同様の処理については、同一符号を付して詳細な説明を省略する。

まず、ステップＳ２１１において、重み計算部２３２によって、上記（１９）式のＱ関数を最大化させるWの解W^(s+1)を計算する。

学習ステップ（ｓ＋１）における重みパラメータ行列Ｗ^(s+1)を計算した後、ステップＳ２１２において、第１収束判定部２３３によって、上記（１６）式で与える収束条件を満たすか否かを判定する。

上記ステップＳ２１２で収束条件を満たすと判定された場合は、W^(s+1)を^Wとして、ステップＳ１１５へ進む。一方、収束条件を満たさないと判定された場合は、s←s+1として、上記ステップＳ２１１の処理を繰り返す。

ステップＳ１１５では、重みパラメータ行列の推定値＾W を上記（３）式に代入して、サンプルｎごとに確率モデルの一点除外交差検定法に基づくパラメータの推定値＾Θ_-nを計算して、記憶部２３に格納し、確率モデル生成処理ルーチンを終了する。

なお、第２の実施の形態に係る誤分類検出装置の他の構成及び作用については、第１の実施の形態と同様であるため、説明を省略する。

上記で計算される確率モデルのパラメータの推定値＾Θ_−nは、上記の第１の実施の形態において、正誤の事前確率P(z)を、P(z₁)=1,P(z₀)=0に設定する場合に計算される確率モデルのパラメータの推定値＾Θ_−nと一致する。このように、確率モデル生成部を簡略化して設計することができる。

〔実施例〕
次に、上記の実施の形態に係る手法を適用して実験を行った結果について説明する。

上位カテゴリとしてコンピュータに属する文書データを，５つのサブカテゴリのいずれかに分類する問題で、誤ったサブカテゴリに分類された文書データを検出する評価実験を行った。テキスト分類問題で性能評価に良く用いられるデータベース20 newsgroups（20News、参考文献(K. Nigam, A. McCallum, S. Thrun, and T. Mitchell: Text classification from labeled and unlabeled documents using EM. Machine Learning, Vol. 39, pp. 103−134, 2000.)参照）を用いた。

評価用データセットを作成するため、1000個のサンプルを5つのサブカテゴリに属する文書データの中から無作為に抽出した。そして1000個のサンプルの中からｒ_m％のサンプルを無作為に選択し、文書データが属するサブカテゴリを別の4つのサブカテゴリのいずれかに無作為に変更することで誤分類サンプルを作成した。この操作によって得られた誤分類サンプルを含むデータセットを誤分類検出対象のサンプル集合として性能評価に用いた。性能評価の尺度には、情報検索タスクなどでサンプルの順位付けの良さを測るのによく利用される平均適合率(AP, Average Precision) を用いた。平均適合率は、誤分類サンプルの総数をMとするとき、以下の（２０）式で計算される。

平均適合率は、値が大きいほどサンプルの順位付けの性能が高いことを示す。

表１に、上記第１の実施の形態で説明した確率モデル生成部２２をもつ本発明に係わる装置でP(z₁)=0.5とした場合(方法1)に得られた平均適合率と、上記第２の実施の形態で説明した確率モデル生成部２２２をもつ本発明に係わる装置(方法2)で得られた平均適合率と、重みパラメータ行列を導入せずに単純に一点除外交差検定法をNBモデルに適用(方法3)して得られた平均適合率の結果を示す。

実験では、各方法で得られたパラメータの推定値{＾Θ_−n}^N _n=1を用いてR_n=P(y_n|x_n;＾Θ_−n)/max_y-≠yn P(y|x_n;＾Θ_−n)を計算し、その値が小さい順に誤分類が疑われるサンプルとして検出した。上記表１より、ｒ_mの値を変えて行った実験のすべての場合で、方法１、方法２で得られた平均適合率が、方法３で得られた平均適合率を上回った。以上の結果より、誤って分類されている危険性が高い順にサンプルを検出するのに、本発明に係わる装置は効果があることが分かった。

なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。

例えば、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。

１０入力部
２０演算部
２２、２２２確率モデル生成部
２４誤分類サンプル検出部
３０出力部
３１正誤予測確率計算部
３２、２３２重み計算部
３３第１収束判定部
３４第２収束判定部
３５パラメータ計算部
１００誤分類検出装置
２３３収束判定部

Claims

誤ったカテゴリに分類されたコンテンツである誤分類サンプルを含む、コンテンツの属するカテゴリが既知のサンプル集合の中から、誤分類サンプルを検出する誤分類検出装置であって、
コンテンツｘとカテゴリｙで表わされるサンプルの同時確率モデルｐ（ｘ、ｙ；Θ）のパラメータΘの推定値＾Θを、一点除外交差検定法に基づく前記同時確率モデルｐ（ｘ、ｙ；Θ）の予測尤度を最大化させるように、サンプルｎごとに設定した重みｗ_nを用いて計算する確率モデル生成手段と、
前記確率モデル生成手段によって計算された前記同時確率モデルｐ（ｘ、ｙ；Θ）のパラメータ値Θの推定値＾Θに基づいて、各サンプルｎについてコンテンツｘ_nが分類されているカテゴリｙ_nの予測クラス事後確率Ｐ（ｙ_n｜ｘ_n ；＾Θ）を計算し、各サンプルｎの予測クラス事後確率Ｐ（ｙ_n｜ｘ_n ；＾Θ）に基づいて、誤分類サンプルを検出する誤分類サンプル検出手段と、
を含み、
前記確率モデル生成手段は、
誤って分類されているサンプルｎに大きな値を設定すべき重みｗ _0n 及び正しく分類されているサンプルｎに大きな値を設定すべき重みｗ _1n を規定する重みパラメータ行列の推定値^Ｗに基づいて求められる、一点除外交差検定法に基づくパラメータΘの推定値＾Θ _-n を用いて、各サンプルｎが正しく分類されているか否かを表す潜在変数ｚの予測を与える正誤予測確率Ｐ（ｚ｜ｘ _n 、ｙ _n ；Θ _-n ）を計算する正誤予測確率計算手段と、
前記正誤予測確率計算手段によって計算された前記正誤予測確率Ｐ（ｚ｜ｘ _n 、ｙ _n ；＾Θ _-n ）を用いて、前記重みパラメータ行列の推定値^Ｗを計算する重み計算手段と、
前記重みパラメータ行列の推定値^Ｗの変化量を計算し収束条件を満たす前記重みパラメータ行列の推定値^Ｗが求まるまで、あるいは所定の回数に達するまで、前記正誤予測確率計算手段による計算及び前記重み計算手段による計算の繰り返し処理を行う収束判定手段と、
前記収束判定手段による繰り返し処理により得られた前記重みパラメータ行列の推定値^Ｗを用いて、サンプルｎごとに、前記同時確率モデルｐ（ｘ、ｙ；Θ）のパラメータΘの一点除外交差検定法に基づく推定値^Θ _-n を計算するパラメータ計算手段と、
を含む誤分類検出装置。
誤ったカテゴリに分類されたコンテンツである誤分類サンプルを含む、コンテンツの属するカテゴリが既知のサンプル集合の中から、誤分類サンプルを検出する誤分類検出装置であって、
コンテンツｘとカテゴリｙで表わされるサンプルの同時確率モデルｐ（ｘ、ｙ；Θ）のパラメータΘの推定値＾Θを、一点除外交差検定法に基づく前記同時確率モデルｐ（ｘ、ｙ；Θ）の予測尤度を最大化させるように、サンプルｎごとに設定した重みｗ_nを用いて計算する確率モデル生成手段と、
前記確率モデル生成手段によって計算された前記同時確率モデルｐ（ｘ、ｙ；Θ）のパラメータ値Θの推定値＾Θに基づいて、各サンプルｎについてコンテンツｘ_nが分類されているカテゴリｙ_nの予測クラス事後確率Ｐ（ｙ_n｜ｘ_n ；＾Θ）を計算し、各サンプルｎの予測クラス事後確率Ｐ（ｙ_n｜ｘ_n ；＾Θ）に基づいて、誤分類サンプルを検出する誤分類サンプル検出手段と、
を含み、
前記確率モデル生成手段は、
一点除外交差検定法に基づく各サンプルｎの対数尤度の和を最大化させるように、正しく分類されているサンプルｎに大きな値を設定すべき重みｗ_1nを規定する重みパラメータ行列の推定値^Ｗを計算する重み計算手段と、
前記重みパラメータ行列の推定値^Ｗの変化量を計算し収束条件を満たす前記重みパラメータ行列の推定値^Ｗが求まるまで、あるいは所定の回数に達するまで、前記重み計算手段による計算の繰り返し処理を行う収束判定手段と、
前記収束判定手段による繰り返し処理により得られた前記重みパラメータ行列の推定値^Ｗを用いて、サンプルｎごとに、前記同時確率モデルｐ（ｘ、ｙ；Θ）のパラメータΘの一点除外交差検定法に基づく推定値^Θ_-nを計算するパラメータ計算手段と、
を含む誤分類検出装置。
前記同時確率モデルｐ（ｘ、ｙ；Θ）＝ｐ（ｘ｜ｙ；Θ）Ｐ（ｙ）のｐ（ｘ｜ｙ；Θ）を、パラメータがΘで表されるＮａｉｖｅＢａｙｅｓモデルで与える請求項１又は２記載の誤分類検出装置。
誤ったカテゴリに分類されたコンテンツである誤分類サンプルを含む、コンテンツの属するカテゴリが既知のサンプル集合の中から、誤分類サンプルを検出する誤分類検出方法であって、
確率モデル生成手段によって、コンテンツｘとカテゴリｙで表わされるサンプルの同時確率モデルｐ（ｘ、ｙ；Θ）のパラメータΘの推定値＾Θを、一点除外交差検定法に基づく前記同時確率モデルｐ（ｘ、ｙ；Θ）の予測尤度を最大化させるように、サンプルｎごとに設定した重みｗ_nを用いて計算するステップと、
誤分類サンプル検出手段によって、前記確率モデル生成手段によって計算された前記同時確率モデルｐ（ｘ、ｙ；Θ）のパラメータ値Θの推定値＾Θに基づいて、各サンプルｎについてコンテンツｘ_nが分類されているカテゴリｙ_nの予測クラス事後確率Ｐ（ｙ_n｜ｘ_n ；＾Θ）を計算し、各サンプルｎの予測クラス事後確率Ｐ（ｙ_n｜ｘ_n ；＾Θ）に基づいて、誤分類サンプルを検出するステップと、
を含み、
前記同時確率モデルｐ（ｘ _n 、ｙ _n ）のパラメータ値Θを計算するステップは、
正誤予測確率計算手段によって、誤って分類されているサンプルｎに大きな値を設定すべき重みｗ _0n 及び正しく分類されているサンプルｎに大きな値を設定すべき重みｗ _1n を規定する重みパラメータ行列の推定値^Ｗに基づいて求められる、一点除外交差検定法に基づくパラメータΘの推定値＾Θ _-n を用いて、各サンプルｎが正しく分類されているか否かを表す潜在変数ｚの予測を与える正誤予測確率Ｐ（ｚ｜ｘ _n 、ｙ _n ；Θ _-n ）を計算するステップと、
重み計算手段によって、前記正誤予測確率計算手段によって計算された前記正誤予測確率Ｐ（ｚ｜ｘ _n 、ｙ _n ；＾Θ _-n ）を用いて、前記重みパラメータ行列の推定値^Ｗを計算するステップと、
収束判定手段によって、前記重みパラメータ行列の推定値^Ｗの変化量を計算し収束条件を満たす前記重みパラメータ行列の推定値^Ｗが求まるまで、あるいは所定の回数に達するまで、前記正誤予測確率計算手段による計算及び前記重み計算手段による計算の繰り返し処理を行うステップと、
パラメータ計算手段によって、前記収束判定手段による繰り返し処理により得られた前記重みパラメータ行列の推定値^Ｗを用いて、サンプルｎごとに、前記同時確率モデルｐ（ｘ、ｙ；Θ）のパラメータΘの一点除外交差検定法に基づく推定値^Θ _-n を計算するステップと、
を含むことを特徴とする誤分類検出方法。
誤ったカテゴリに分類されたコンテンツである誤分類サンプルを含む、コンテンツの属するカテゴリが既知のサンプル集合の中から、誤分類サンプルを検出する誤分類検出方法であって、
確率モデル生成手段によって、コンテンツｘとカテゴリｙで表わされるサンプルの同時確率モデルｐ（ｘ、ｙ；Θ）のパラメータΘの推定値＾Θを、一点除外交差検定法に基づく前記同時確率モデルｐ（ｘ、ｙ；Θ）の予測尤度を最大化させるように、サンプルｎごとに設定した重みｗ_nを用いて計算するステップと、
誤分類サンプル検出手段によって、前記確率モデル生成手段によって計算された前記同時確率モデルｐ（ｘ、ｙ；Θ）のパラメータ値Θの推定値＾Θに基づいて、各サンプルｎについてコンテンツｘ_nが分類されているカテゴリｙ_nの予測クラス事後確率Ｐ（ｙ_n｜ｘ_n ；＾Θ）を計算し、各サンプルｎの予測クラス事後確率Ｐ（ｙ_n｜ｘ_n ；＾Θ）に基づいて、誤分類サンプルを検出するステップと、
を含み、
前記同時確率モデルｐ（ｘ_n、ｙ_n）のパラメータ値Θを計算するステップは、
重み計算手段によって、一点除外交差検定法に基づく各サンプルｎの対数尤度の和を最大化させるように、正しく分類されているサンプルｎに大きな値を設定すべき重みｗ_1nを規定する重みパラメータ行列の推定値^Ｗを計算するステップと、
収束判定手段によって、前記重みパラメータ行列の推定値^Ｗの変化量を計算し収束条件を満たす前記重みパラメータ行列の推定値^Ｗが求まるまで、あるいは所定の回数に達するまで、前記重み計算手段による計算の繰り返し処理を行うステップと、
パラメータ計算手段によって、前記収束判定手段による繰り返し処理により得られた前記重みパラメータ行列の推定値^Ｗを用いて、サンプルｎごとに、前記同時確率モデルｐ（ｘ、ｙ；Θ）のパラメータΘの一点除外交差検定法に基づく推定値^Θ_-nを計算するステップと、
を含む誤分類検出方法。
前記同時確率モデルｐ（ｘ、ｙ；Θ）＝ｐ（ｘ｜ｙ；Θ）Ｐ（ｙ）のｐ（ｘ｜ｙ；Θ）を、パラメータがΘで表されるＮａｉｖｅＢａｙｅｓモデルで与える請求項４又は５記載の誤分類検出方法。
コンピュータを、請求項１〜請求項３の何れか１項記載の誤分類検出装置の各手段として機能させるためのプログラム。