JP2006338263A - コンテンツ分類方法、コンテンツ分類装置、コンテンツ分類プログラムおよびコンテンツ分類プログラムを記録した記録媒体 - Google Patents
コンテンツ分類方法、コンテンツ分類装置、コンテンツ分類プログラムおよびコンテンツ分類プログラムを記録した記録媒体 Download PDFInfo
- Publication number
- JP2006338263A JP2006338263A JP2005161362A JP2005161362A JP2006338263A JP 2006338263 A JP2006338263 A JP 2006338263A JP 2005161362 A JP2005161362 A JP 2005161362A JP 2005161362 A JP2005161362 A JP 2005161362A JP 2006338263 A JP2006338263 A JP 2006338263A
- Authority
- JP
- Japan
- Prior art keywords
- content
- parameter
- content classification
- sample
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】 コンピュータが、ラベルありサンプルおよびラベルなしサンプルを取得する手順と、ラベルありコンテンツの特徴ベクトルを算出して、生成モデルのパラメータを算出する手順と、ラベルありサンプルから1つずつコンテンツを除外した場合の生成モデルのパラメータを算出し、この算出結果を用いて結合パラメータを算出する手順と、生成モデルおよび生成モデルの偏りを補正するバイアス補正モデルを、結合パラメータを用いて結合した識別関数を生成する手順と、分類対象のコンテンツの特徴ベクトルを算出する手順と、識別関数を用いて、コンテンツの複数のカテゴリに対する事後確率が最大となるカテゴリを選択する手順とを含んで実行する。
【選択図】 図2
Description
このため、非特許文献1に記載の分類器では、少数のラベルありサンプルに加えて、多数の未分類のラベルなしサンプルを分類器の学習に用いて、学習の偏りを緩和することで分類精度の向上を図っている。
K.Nigam, A.McCallum, S.Thrun and T.Mitchell: Text classification from labeled and unlabeled documents using EM, Machine Learning, 39, p103-134(2000). M.Szummer and T.Jaakkola: Kernel expansions with unlabeled examples, Advances in Neural Information Processing Systems (NIPS), 13, p626-632(2001).
このため、学習に用いるラベルありサンプルとラベルなしサンプルとの統計情報の最適な比率の推定手法が別途必要であり、その推定を可能とする分類器のモデル設計が必要となるという問題がある。
本発明の他の形態については後記する実施の形態の中で詳しく説明する。
ここで、図1は、本実施の形態のコンテンツ分類装置の構成を示す機能ブロック図の例である。
さらに、コンテンツ分類装置1は、分類対象のコンテンツを入力する際のインターフェイスとなる入力部5と、入力された分類対象のコンテンツの分類結果を画面表示したり、入力されたコンテンツを分類・保存して出力する際などのインターフェイスとなる出力部6とを含んで構成される。
訓練データDB2に格納された訓練データ集合は、コンテンツの特徴ベクトル(以下、単にコンテンツ)本体とコンテンツが属するカテゴリID(以下、カテゴリ情報)の対より構成されるラベルありサンプルと、カテゴリ情報が付与されていないコンテンツのみで構成されるラベルなしサンプルとから構成されている。このラベルありサンプルのカテゴリ情報は、利用者またはコンテンツ分類装置1の管理者などによって予め付与されている。
なお、本実施の形態において、訓練データDB2をコンテンツ分類装置1の内部に含む構成としたが、例えば、ネットワークなどで接続された外部のデータベースサーバなどに訓練データDB2を構成して、このデータベースサーバから訓練データ集合を取得する構成としてもよい。
さらに、識別関数生成部3およびコンテンツ分類部4は、例えば、ハードディスクドライブに格納されたプログラムコードであるコンテンツ分類プログラムをRAMに展開して、CPUが実行することで具現される。また、このコンテンツ分類プログラムは、ハードディスクドライブに格納される以外にも、コンピュータのROMや、コンパクトディスクなどの記録媒体などに記録され、コンピュータのRAMに読み込むこともできる。また、コンピュータが、外部からネットワークを介した伝送によりコンテンツ分類プログラムを取得する構成としてもよい。
以下に、図2ないし図4に示したフローチャートを参照しつつ、コンテンツ分類装置1の識別関数生成部3における識別関数の生成手順を詳しく説明する(適宜、図1参照)。
ここで、Θは、生成モデルのパラメータを、Ψは、学習された生成モデルの統計上の偏りを補正するバイアス補正モデルのパラメータを、Λは、非線形の最適化計算である最大エントロピ原理により推定される生成モデルおよびバイアス補正モデルの結合パラメータを表している。つまり、識別関数R(k|x,Θ,Ψ,Λ)は、生成モデルとバイアス補正モデルを結合パラメータを用いて結合した関数として定義される。
さらに、xはコンテンツを、k∈{1,・・・,K}は、コンテンツが属するカテゴリの候補となるクラスを表している。
とカテゴリ情報を有しないコンテンツのサンプル集合であるラベルなしサンプル
とを取り込んで、メモリ7に格納する(ステップS101)。そして、識別関数のパラメータ学習の繰り返し回数を示すカウンタtの初期値t=0と、学習された識別関数の妥当性を測定するために定義された評価関数Fの初期値F(0)=−∞と、バイアス補正モデルのパラメータの初期値Ψ(1)とを与えて、各パラメータを初期化してメモリ7に格納する(ステップS102)。
ここで、ラベルありサンプルのynはコンテンツxnが属するカテゴリに従って付与されたクラスラベル(カテゴリ情報)を示している。
を、メモリ7内に格納されたラベルありサンプルを用いて学習する(ステップS103)。ステップS103における、生成モデルのパラメータは、図3のフローチャートに示すように、まず、訓練データ集合に含まれるサンプルの、訓練データ集合全体に対する特徴ベクトルの偏りを緩和するための平滑化パラメータを学習してメモリ7に格納し(ステップS201)、その結果を用いて最適なパラメータを学習してメモリ7に格納する(ステップS202)ことで推定される。
なお、生成モデルのパラメータの算出手順の詳細を、後記する実施形態例の中で説明する。
を生成してメモリ7に格納する。そして、このメモリ7内の1点除外ラベルありサンプル
を用いて、図3に示したフローチャートと同様の手順により、生成モデルのパラメータΘ(-n)を算出してメモリ7に格納して(ステップS302)、除外したサンプルと生成モデルのパラメータとの対であるサンプル・パラメータ対(xn,yn,Θ(-n))を生成してメモリ7に格納する(ステップS303)。
を生成してメモリ7に格納する(ステップS106)。そして、識別関数を生成すると、識別関数生成部3は、ステップS107にて評価関数の変量F(t+1)−F(t)を求め、収束条件F(t+1)−F(t)<ε(εは分管理者などにより与えられる所定の微小の定数値)を満たせば(ステップS107で‘Yes’の場合)、
として、分類器の識別関数
を決定して、この決定したメモリ7内に格納された識別関数をコンテンツ分類部4に受け渡す(ステップS111)。
をステップS106で得られた識別関数を用いて推定してメモリ7に格納する(ステップS109)。
ここで、バイアス補正モデルのパラメータ学習の詳細は、図3のフローチャートで示した生成モデルのパラメータ学習と同様に、最適な平滑化パラメータを学習してメモリ7に格納し(ステップS201)、このメモリ7内に格納された平滑化パラメータを用いて最適なパラメータを学習してメモリ7に格納する(ステップS202)ことで推定される。
そして、ステップS105からステップS110までの処理はステップS107における収束条件を満たすまで繰り返し実行される。
を取得してメモリ7に格納する(ステップS401)。そして、外部からの入力インターフェイスである入力部5から、分類対象のコンテンツを取得してメモリ7に格納する(ステップS402)。
を用いて、メモリ7内に格納された分類対象のコンテンツのクラス事後確率を算出してメモリ7に格納し(ステップS403)、算出したクラス事後確率が最大となるカテゴリを、このコンテンツの属するカテゴリであると推定してメモリ7に格納する(ステップS404)。
そして、コンテンツ分類部4は、推定したカテゴリを分類結果として出力部6に受け渡し、この分類結果を取得した出力部6は、分類結果を表示画面などに出力し、必要に応じてコンテンツファイルを分類結果に応じて適切な箇所に保存する。
前記したコンテンツ分類装置1において、K個のクラス{1,・・・,k,・・・K}からコンテンツxが属するカテゴリyを1つ選択する場合に、生成モデルおよびバイアス補正モデルに「Naive Bayes」モデル(以下、NBモデル)を用いた場合の実施形態例を詳しく説明する(適宜、図1ないし図5参照)。
NBモデルでは、クラスkからコンテンツxnが生成される確率P(xn|k)は、クラスkにおけるそれぞれの特徴tiの出現確率θikと独立であると仮定して、次の数式(1)で定義する。
は、生成モデルの推定すべきパラメータを表す。バイアス補正モデルP(x|k,ψk)も、数式(1)と同型の分布で定義される。
を、
で与え、それぞれメモリ7に格納する。
は、
でコンテンツの特徴ベクトルを正規化するとき、メモリ7内に格納されたラベルありサンプル集合Dlを用いてMAP推定による以下の数式(2)で得られる。
を学習するために推定すべきパラメータである。また、
である。
の学習は、まず平滑化パラメータの推定値
を学習してメモリ7に格納し(ステップS201)、メモリ7内に格納された
を数式(2)に代入して
を学習してメモリ7に格納する(ステップS202)。
ここで、平滑化パラメータの推定値
は、1点交差確認法(leave-one-out cross validation)を用いて、次の数式(3)で表す対数尤度L1(ξk)を最大化するξkを、EMアルゴリズム(Dempster, A.P.,Laird, N.M. and Rubin, D.B.: Maximum likelihood from incomplete data viathe EM algorithm. Journal of the Royal Statistical Society, SeriesB, 39, 1-38 (1977) )で求めることで得られる。
を用いることで、
を計算してメモリ7に格納し(ステップS302)、サンプル・パラメータ対(xn,yn,Θ(-n))を生成してメモリ7に格納する(ステップS303)。ステップS304の処理により、このパラメータ計算を繰り返し行うことで、すべてのラベルありサンプルに対するサンプル・パラメータ対が得られてメモリ7に格納される。
の推定値Λ(t+1)を、
とメモリ7内に格納されたΨ(t+1)を与えた下で、メモリ7内に格納されたサンプル・パラメータ対
を用いて、以下の関数を最大にするΛとして算出してメモリ7に格納する。
で与えられる。数式(8)の目的関数J(Λ)を最大にするΛは、例えば、IISアルゴリズム(K. Nigam,J. Lafferty and A. McCallum: Using maximum entropy for text classification, In IJCAI-99 Workshop on Machine Learning for Information filtering, p61-67 (1999).)またはL−BFGSアルゴリズム(D.C. Liu and J. Nocedel: On the limited memory BFGS method for large scale optimization. In Math. Programming, 45(3,(ser. B)), p503-528 (1989).)を用いて求めることができる。
とをもとに、MAP推定により、バイアス補正モデルのパラメータの推定値Ψ(t+1)を以下の式に従って学習してメモリ7に格納する。
を学習するために推定すべきパラメータである。また、
は、ステップS103における
の学習と同様に、図3のフローチャートに示すように、平滑化パラメータの学習(ステップS201)と、モデルのパラメータの学習(ステップS202)の処理手順により学習されてメモリ7に格納される。平滑化パラメータの推定値
は、以下の目的関数を最大にするηkを、EMアルゴリズムによって求めることで算出される。
そして、ステップS107における集束条件を満たすと、このときメモリ7内に格納された識別関数をコンテンツ分類部4に受け渡して(ステップS111)、識別関数生成部3における処理が終了する。
図5のフローチャートを参照して、まず、ステップS401において、数式(7)で示される式に
と
を代入することで得られる識別関数
を識別関数生成部3から取得してメモリ7に格納し、このメモリ7内に格納された識別関数を用いて、ステップS402で入力部5から取得してメモリ7内に格納された識別対象のコンテンツのx’を用いて、クラス事後確率を算出してメモリ7に格納し(ステップS403)、識別関数
を最大にするkを、コンテンツx’が属するカテゴリの推定値
として算出することで、コンテンツx’が属するカテゴリを推定してメモリ7に格納する(ステップS404)。
次に、図6は、テキスト自動分類の性能検査用に用いられるデータベースである20News(非特許文献1参照)に、前記した実施形態例のコンテンツ分類装置1を適用した場合のカテゴリの分類性能を示すグラフである。
また、残りのコンテンツのうち、10000のコンテンツをラベルなしサンプルとして、さらに、その残りから任意数のコンテンツをラベルありサンプルとして選択し、訓練データ集合とした。
ここで、ラベルありサンプルとは、コンテンツ本体とカテゴリ情報の両方を訓練データとして用いるサンプルであり、ラベルなしサンプルとはコンテンツ本体のみの情報を訓練データとして用いるサンプルである。すなわち、ラベルなしサンプルが属するカテゴリは未知として、分類器の学習を行う。
2 訓練データDB
3 識別関数生成部
4 コンテンツ分類部
5 入力部
Claims (10)
- 特徴ベクトルで表現されたコンテンツを、複数のカテゴリに分類するコンテンツ分類方法であって、
コンピュータが、
帰属するカテゴリが既知の少数のコンテンツからなるラベルありサンプルおよび帰属するカテゴリが未知の多数のコンテンツからなるラベルなしサンプルを取得するサンプルデータ取得手順と、
前記ラベルありサンプルを用いて、生成モデルのパラメータを算出する生成モデルパラメータ学習手順と、
前記ラベルありサンプルから1つずつコンテンツを除外した場合のサンプルを用いて、前記生成モデルのパラメータを算出し、この算出結果を用いて非線形の最適化計算に基づいて結合パラメータを算出する結合パラメータ学習手順と、
前記生成モデルおよび前記生成モデルの偏りを補正するバイアス補正モデルを、前記結合パラメータを用いて結合した識別関数を生成する識別関数生成手順と、
分類対象のコンテンツを取得する分類対象コンテンツ取得手順と、
前記識別関数を用いて、前記分類対象のコンテンツの前記複数のカテゴリに対する第1の事後確率を算出し、この第1の事後確率が最大となるカテゴリを、前記複数のカテゴリから選択するコンテンツ分類手順と、
を含んで実行することを特徴とすることを特徴とするコンテンツ分類方法。 - 前記生成モデルパラメータ学習手順は、
前記ラベルありサンプルの対数尤度の総和を最大化する平滑化パラメータを算出する第1の平滑化パラメータ生成手順と、
前記算出された平滑化パラメータを用いて、前記生成モデルのパラメータを算出する第1のパラメータ生成手順とを含むこと、
を特徴とする請求項1に記載のコンテンツ分類方法。 - 前記識別関数生成手順のあとに、
前記識別関数が所定の収束条件を満たすまで、前記識別関数を用いて前記ラベルなしサンプルの各コンテンツのカテゴリに対する第2の事後確率を算出し、この第2の事後確率および前記ラベルなしサンプルを用いて、前記バイアス補正モデルのパラメータを算出し、このパラメータを適用した前記バイアス補正モデルを用いて前記結合パラメータを算出して、この結合パラメータを用いて前記識別関数の生成を行う識別関数最適化手順をさらに含むこと、
を特徴とする請求項1または請求項2に記載のコンテンツ分類方法。 - 前記バイアス補正モデルのパラメータの算出は、
前記第2の事後確率および前記ラベルなしコンテンツの積の対数尤度の総和を最大化する平滑化パラメータを算出する第2の平滑化パラメータ生成手順と、
前記算出された平滑化パラメータを用いて、前記バイアス補正モデルのパラメータを算出する第2のパラメータ生成手順とからなること、
を特徴とする請求項3に記載のコンテンツ分類方法。 - 前記非線形の最適化計算が、最大エントロピー原理に基づく計算であること、
を特徴とする請求項1ないし請求項4のいずれか1項に記載のコンテンツ分類装置。 - 特徴ベクトルで表現されたコンテンツを、複数のカテゴリに分類するするコンテンツ分類装置であって、
分類対象のコンテンツを取得する入力部と、
帰属するカテゴリが既知の少数のコンテンツからなるラベルありサンプルおよび帰属するカテゴリが未知の多数のコンテンツからなるラベルなしサンプルから構成されるサンプルデータ集合を格納したデータベースと、
前記ラベルありコンテンツの対数尤度の総和を最大化する平滑化パラメータを算出して、この平 滑化パラメータを用いて、前記生成モデルのパラメータを算出し、前記ラベルありサンプルから1つずつコンテンツを除外した場合の前記生成モデルのパラメータを算出した結果を用いて、非線形の最適化計算に基づいて結合パラメータを算出し、前記生成モデルおよび前記生成モデルの偏りを補正するバイアス補正モデルを、前記結合パラメータを用いて結合した識別関数を生成する識別関数生成部と、
前記識別関数生成部が生成した前記識別関数を用いて、前記入力部が取得した前記分類対象のコンテンツの、前記複数のカテゴリの各カテゴリに対する第1の事後確率を算出し、この第1の事後確率が最大となるカテゴリを、前記複数のカテゴリから選択するコンテンツ分類部と、
を含んで構成されることを特徴とするコンテンツ分類装置。 - 前記識別関数生成部は、所定の収束条件を満たすまで、生成した前記識別関数を用いて、前記ラベルなしサンプルの各サンプルのカテゴリに対する第2の事後確率を算出し、この第2の事後確率から算出される前記ラベルなしサンプルの対数尤度の総和を最大化するように平滑化パラメータを算出して、この平滑化パラメータを用いて、前記バイアス補正モデルのパラメータを算出し、このパラメータを適用した前記バイアス補正モデルを用いて前記結合パラメータを再度算出して、この結合パラメータを用いて前記識別関数を再度生成すること、
を特徴とする請求項6に記載のコンテンツ分類装置。 - 前記非線形の最適化計算が、最大エントロピー原理に基づく計算であること、
を特徴とする請求項6または請求項7に記載のコンテンツ分類装置。 - コンピュータに、請求項1ないし請求項5のいずれか1項に記載のコンテンツ分類方法を実行させるコンテンツ分類プログラム。
- 請求項9に記載のコンテンツ分類プログラムを記録した記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005161362A JP4490876B2 (ja) | 2005-06-01 | 2005-06-01 | コンテンツ分類方法、コンテンツ分類装置、コンテンツ分類プログラムおよびコンテンツ分類プログラムを記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005161362A JP4490876B2 (ja) | 2005-06-01 | 2005-06-01 | コンテンツ分類方法、コンテンツ分類装置、コンテンツ分類プログラムおよびコンテンツ分類プログラムを記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006338263A true JP2006338263A (ja) | 2006-12-14 |
JP4490876B2 JP4490876B2 (ja) | 2010-06-30 |
Family
ID=37558777
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005161362A Expired - Fee Related JP4490876B2 (ja) | 2005-06-01 | 2005-06-01 | コンテンツ分類方法、コンテンツ分類装置、コンテンツ分類プログラムおよびコンテンツ分類プログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4490876B2 (ja) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008276571A (ja) * | 2007-04-27 | 2008-11-13 | Nippon Telegr & Teleph Corp <Ntt> | ラベル付与方法、ラベル付与装置、ラベル付与プログラムおよびその記憶媒体 |
JP2009075671A (ja) * | 2007-09-18 | 2009-04-09 | Nippon Telegr & Teleph Corp <Ntt> | 文書分類装置およびプログラム |
JP2009259109A (ja) * | 2008-04-18 | 2009-11-05 | Nippon Telegr & Teleph Corp <Ntt> | ラベル付与装置、ラベル付与プログラム、ラベル付与プログラムが記録された記録媒体、および、ラベル付与方法 |
JP2010003106A (ja) * | 2008-06-20 | 2010-01-07 | Nippon Telegr & Teleph Corp <Ntt> | 分類モデル生成装置、分類装置、分類モデル生成方法、分類方法、分類モデル生成プログラム、分類プログラムおよび記録媒体 |
JP2011145951A (ja) * | 2010-01-15 | 2011-07-28 | Nippon Telegr & Teleph Corp <Ntt> | コンテンツ自動分類装置、コンテンツ自動分類方法およびコンテンツ自動分類プログラム |
JP2011154469A (ja) * | 2010-01-26 | 2011-08-11 | Nippon Telegr & Teleph Corp <Ntt> | パターン抽出装置、パターン抽出方法及びプログラム |
WO2012124458A1 (ja) * | 2011-03-16 | 2012-09-20 | 株式会社エヌ・ティ・ティ・ドコモ | 本人認証テンプレート学習システム、及び本人認証テンプレート学習方法 |
JP2013080395A (ja) * | 2011-10-04 | 2013-05-02 | Nippon Telegr & Teleph Corp <Ntt> | 誤分類検出装置、方法、及びプログラム |
JP2014507716A (ja) * | 2011-01-25 | 2014-03-27 | アリババ・グループ・ホールディング・リミテッド | 分類された誤配置の識別 |
WO2014087506A1 (ja) * | 2012-12-05 | 2014-06-12 | 三菱電機株式会社 | 語義推定装置、語義推定方法及び語義推定プログラム |
JP2015114681A (ja) * | 2013-12-09 | 2015-06-22 | 日本電信電話株式会社 | キーワード付与装置、キーワード付与方法及びプログラム |
JP2016024502A (ja) * | 2014-07-16 | 2016-02-08 | 日本電信電話株式会社 | モデルパラメータ推定装置、方法、及びプログラム |
WO2017138549A1 (ja) * | 2016-02-12 | 2017-08-17 | 日本電気株式会社 | 情報処理装置、情報処理方法、及び、記録媒体 |
CN116257800A (zh) * | 2023-05-12 | 2023-06-13 | 智慧眼科技股份有限公司 | 一种训练样本的标注方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10320370A (ja) * | 1997-05-16 | 1998-12-04 | Nippon Telegr & Teleph Corp <Ntt> | 複数の識別関数の統合によるパターン認識方法 |
JP2002366926A (ja) * | 2001-06-07 | 2002-12-20 | Nippon Telegr & Teleph Corp <Ntt> | パターン認識方法および装置とパターン認識プログラムおよび該プログラムを記録した記録媒体 |
JP2003256839A (ja) * | 2002-02-27 | 2003-09-12 | Nec Corp | パターンの特徴選択方法及び分類方法及び判定方法及びプログラム並びに装置 |
JP2004265190A (ja) * | 2003-03-03 | 2004-09-24 | Japan Energy Electronic Materials Inc | 階層型ニューラルネットワークの学習方法、そのプログラム及びそのプログラムを記録した記録媒体 |
-
2005
- 2005-06-01 JP JP2005161362A patent/JP4490876B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10320370A (ja) * | 1997-05-16 | 1998-12-04 | Nippon Telegr & Teleph Corp <Ntt> | 複数の識別関数の統合によるパターン認識方法 |
JP2002366926A (ja) * | 2001-06-07 | 2002-12-20 | Nippon Telegr & Teleph Corp <Ntt> | パターン認識方法および装置とパターン認識プログラムおよび該プログラムを記録した記録媒体 |
JP2003256839A (ja) * | 2002-02-27 | 2003-09-12 | Nec Corp | パターンの特徴選択方法及び分類方法及び判定方法及びプログラム並びに装置 |
JP2004265190A (ja) * | 2003-03-03 | 2004-09-24 | Japan Energy Electronic Materials Inc | 階層型ニューラルネットワークの学習方法、そのプログラム及びそのプログラムを記録した記録媒体 |
Non-Patent Citations (1)
Title |
---|
CSNG200501059009, 藤野 昭典, "文書の構成要素モデルのアンサンブル学習に基づくテキスト分類", 電子情報通信学会技術研究報告, 20041012, Vol.104 No.349, 第69頁乃至第74頁, JP, 社団法人電子情報通信学会 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008276571A (ja) * | 2007-04-27 | 2008-11-13 | Nippon Telegr & Teleph Corp <Ntt> | ラベル付与方法、ラベル付与装置、ラベル付与プログラムおよびその記憶媒体 |
JP2009075671A (ja) * | 2007-09-18 | 2009-04-09 | Nippon Telegr & Teleph Corp <Ntt> | 文書分類装置およびプログラム |
JP2009259109A (ja) * | 2008-04-18 | 2009-11-05 | Nippon Telegr & Teleph Corp <Ntt> | ラベル付与装置、ラベル付与プログラム、ラベル付与プログラムが記録された記録媒体、および、ラベル付与方法 |
JP2010003106A (ja) * | 2008-06-20 | 2010-01-07 | Nippon Telegr & Teleph Corp <Ntt> | 分類モデル生成装置、分類装置、分類モデル生成方法、分類方法、分類モデル生成プログラム、分類プログラムおよび記録媒体 |
JP2011145951A (ja) * | 2010-01-15 | 2011-07-28 | Nippon Telegr & Teleph Corp <Ntt> | コンテンツ自動分類装置、コンテンツ自動分類方法およびコンテンツ自動分類プログラム |
JP2011154469A (ja) * | 2010-01-26 | 2011-08-11 | Nippon Telegr & Teleph Corp <Ntt> | パターン抽出装置、パターン抽出方法及びプログラム |
JP2014507716A (ja) * | 2011-01-25 | 2014-03-27 | アリババ・グループ・ホールディング・リミテッド | 分類された誤配置の識別 |
WO2012124458A1 (ja) * | 2011-03-16 | 2012-09-20 | 株式会社エヌ・ティ・ティ・ドコモ | 本人認証テンプレート学習システム、及び本人認証テンプレート学習方法 |
JP5698343B2 (ja) * | 2011-03-16 | 2015-04-08 | 株式会社Nttドコモ | 本人認証テンプレート学習システム、本人認証テンプレート学習方法及びプログラム |
JP2013080395A (ja) * | 2011-10-04 | 2013-05-02 | Nippon Telegr & Teleph Corp <Ntt> | 誤分類検出装置、方法、及びプログラム |
WO2014087506A1 (ja) * | 2012-12-05 | 2014-06-12 | 三菱電機株式会社 | 語義推定装置、語義推定方法及び語義推定プログラム |
JP2015114681A (ja) * | 2013-12-09 | 2015-06-22 | 日本電信電話株式会社 | キーワード付与装置、キーワード付与方法及びプログラム |
JP2016024502A (ja) * | 2014-07-16 | 2016-02-08 | 日本電信電話株式会社 | モデルパラメータ推定装置、方法、及びプログラム |
WO2017138549A1 (ja) * | 2016-02-12 | 2017-08-17 | 日本電気株式会社 | 情報処理装置、情報処理方法、及び、記録媒体 |
US10803358B2 (en) | 2016-02-12 | 2020-10-13 | Nec Corporation | Information processing device, information processing method, and recording medium |
CN116257800A (zh) * | 2023-05-12 | 2023-06-13 | 智慧眼科技股份有限公司 | 一种训练样本的标注方法及系统 |
CN116257800B (zh) * | 2023-05-12 | 2023-08-25 | 智慧眼科技股份有限公司 | 一种训练样本的标注方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
JP4490876B2 (ja) | 2010-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4490876B2 (ja) | コンテンツ分類方法、コンテンツ分類装置、コンテンツ分類プログラムおよびコンテンツ分類プログラムを記録した記録媒体 | |
Krishnan et al. | Improving model calibration with accuracy versus uncertainty optimization | |
Delgado et al. | Why Cohen’s Kappa should be avoided as performance measure in classification | |
Seguy et al. | Large-scale optimal transport and mapping estimation | |
Kolouri et al. | Wasserstein embedding for graph learning | |
Schirrmeister et al. | Understanding anomaly detection with deep invertible networks through hierarchies of distributions and features | |
Nowak | Noisy generalized binary search | |
EP1924926A2 (en) | Methods and systems for transductive data classification and data classification methods using machine learning techniques | |
Frénay et al. | Estimating mutual information for feature selection in the presence of label noise | |
Song et al. | Selective zero-shot classification with augmented attributes | |
Yu et al. | Robust calibration with multi-domain temperature scaling | |
US20220245422A1 (en) | System and method for machine learning architecture for out-of-distribution data detection | |
Bonaccorso | Hands-On Unsupervised Learning with Python: Implement machine learning and deep learning models using Scikit-Learn, TensorFlow, and more | |
Tomani et al. | Parameterized temperature scaling for boosting the expressive power in post-hoc uncertainty calibration | |
Wu et al. | Conditional mutual information-based contrastive loss for financial time series forecasting | |
Vieira et al. | Main concepts in machine learning | |
Girase et al. | Role of matrix factorization model in collaborative filtering algorithm: a survey | |
Li et al. | Data-driven ranking and selection: High-dimensional covariates and general dependence | |
Xiang et al. | Understanding propagation error and its effect on collective classification | |
Yoon et al. | ESD: Expected Squared Difference as a Tuning-Free Trainable Calibration Measure | |
Liu et al. | Reliable semi-supervised learning when labels are missing at random | |
Nikolaou et al. | Calibrating AdaBoost for asymmetric learning | |
Fedorov et al. | Multimodal sparse bayesian dictionary learning | |
Feng et al. | Towards a Unified Analysis of Kernel-based Methods Under Covariate Shift | |
Ghojogh et al. | Generative locally linear embedding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070806 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100315 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100330 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100402 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130409 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140409 Year of fee payment: 4 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |