JP5667004B2 - Data classification apparatus, method and program - Google Patents
Data classification apparatus, method and program Download PDFInfo
- Publication number
- JP5667004B2 JP5667004B2 JP2011158410A JP2011158410A JP5667004B2 JP 5667004 B2 JP5667004 B2 JP 5667004B2 JP 2011158410 A JP2011158410 A JP 2011158410A JP 2011158410 A JP2011158410 A JP 2011158410A JP 5667004 B2 JP5667004 B2 JP 5667004B2
- Authority
- JP
- Japan
- Prior art keywords
- classification
- class
- classification score
- calculating
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、データ分類装置及び方法及びプログラムに係り、特に、分類スコアを用いてデータを分類するためのデータ分類装置及び方法及びプログラムに関する。 The present invention relates to a data classification apparatus, method, and program, and more particularly, to a data classification apparatus, method, and program for classifying data using a classification score.
入力データを分類する際に、複数の分類スコア算出手段の出力を同時に用いる方法として、最大の分類スコアを示すクラスが入力データに対するクラスであることを示す確信度を算出して、最大の確信度を示す分類スコア算出手段画出力するクラスを、入力データが属するクラスとする分類手法がある(例えば、非特許文献1参照)。 As a method of simultaneously using the outputs of multiple classification score calculation means when classifying input data, calculate the certainty factor indicating that the class showing the maximum classification score is the class for the input data, and the maximum certainty factor There is a classification method in which a class to be output is displayed as a class to which input data belongs (for example, see Non-Patent Document 1).
しかしながら、上記の従来技術において、非特許文献1の技術は、分類スコア算出手段毎に、その分類スコア算出手段の分類スコアから、第一位の分類スコアを示すクラスが正解である確率(=確信度)を算出していた。そのため、確信度の算出において他の分類スコア算出手段の分類スコアを反映することができず、そのために予測精度が低下する懸念があった。
However, in the above-described prior art, the technique of
本発明は、上記の点に鑑みなされたもので、分類スコア算出手段毎の分類スコアのみから個々の分類器出力の確信度を予測する方法よりも的確な分類スコア算出手段の選別が可能なデータ分類装置及び方法及びプログラムを提供することを目的とする。 The present invention has been made in view of the above points, and is a data that enables the selection of the classification score calculation means more accurately than the method of predicting the certainty of each classifier output from only the classification score for each classification score calculation means. An object is to provide a classification apparatus, method, and program.
上記の課題を解決するため、本発明(請求項1)は、所定の入力データをクラスへ分類するデータ分類装置であって、
予め求められた相対確信度算出パラメータを格納する算出パラメータ記憶手段と、
算出する分類手法または構成要素や特徴が互いに異なる複数の分類スコア算出手段と、
分類スコアを格納する分類スコア記憶手段と、
相対確信度を算出する相対確信度算出手段と、
前記入力データの属するクラスあるいはクラス群を決定するデータクラス決定手段と、
を有し、
前記分類スコア算出手段は、
前記所定の入力データが複数のクラスのそれぞれに属する事後確率あるいは尤もらしさである尤度あるいは分離超平面からの距離であり、値が大きいほど対応するクラスへ属する確率が高いことを表す分類スコアを算出し、分類スコア記憶手段に格納する手段を含み、
前記相対確信度算出手段は、
前記分類スコア記憶手段から全ての前記分類スコア算出手段によって出力された全ての分類スコアを取得して、該全ての分類スコアから、前記算出パラメータ記憶手段に格納されている前記相対確信度算出パラメータを用いて、各分類スコアの上位N個(N≧1)に対応するクラスあるいはクラス群の中に正解のクラスがあり、かつ、他の分類スコア算出手段の分類スコアの上位N個に対応するクラスあるいはクラス群の中には正解のクラスがない確率を表す相対確信度を算出する手段を含み、
前記データクラス決定手段は、
前記相対確信度が尤も高い分類スコア算出手段の分類スコアに基づいて入力データの属するクラスあるいはクラス群を決定する手段を含む
In order to solve the above problems, the present invention (Claim 1) is a data classification device for classifying predetermined input data into classes,
Calculation parameter storage means for storing a relative certainty factor calculation parameter obtained in advance;
A plurality of classification score calculation means having different classification methods or components and features to be calculated;
Classification score storage means for storing the classification score;
A relative confidence calculating means for calculating the relative confidence,
Data class determining means for determining a class or class group to which the input data belongs;
Have
The classification score calculation means includes:
A likelihood score or likelihood from the separation hyperplane that the predetermined input data belongs to each of a plurality of classes, or a classification score that indicates that the larger the value, the higher the probability of belonging to the corresponding class. Means for calculating and storing in the classification score storage means;
The relative certainty factor calculating means includes:
All classification scores output by all the classification score calculation means are acquired from the classification score storage means, and the relative certainty factor calculation parameters stored in the calculation parameter storage means are obtained from all the classification scores. using, there are correct class in the top N (N ≧ 1) corresponding class or classes in each classification score and corresponds to the top N classification score another class score calculating means Including means for calculating relative confidence representing the probability that there is no correct class in the class or class group,
The data class determining means includes
Means for determining a class or class group to which the input data belongs based on the classification score of the classification score calculation means having the highest relative certainty factor
また、本発明(請求項2)は、前記相対確信度算出手段において、
N個のクラス群を決定するときに、全ての分類スコア算出手段の上位N+1個の分類スコアを用いて算出する手段を含む。
In the present invention (Claim 2), in the relative certainty factor calculating means,
When N class groups are determined, means for calculating using the top N + 1 classification scores of all classification score calculation means is included.
また、本発明(請求項3)は、前記相対確信度算出手段において、
2クラスあるいは多クラスのロジスティック回帰(カーネルを用いるものも含む)あるいは、サポートベクターマシン、あるいは、他の識別モデルに基づく機械学習手法を用いる。
In the present invention (Claim 3), in the relative confidence calculation means,
Use machine learning techniques based on 2-class or multi-class logistic regression (including those using kernels), support vector machines, or other identification models.
本発明(請求項4)は、所定の入力データをクラスへ分類するデータ分類方法であって、
算出する分類手法または構成要素や特徴が互いに異なる複数の分類スコア算出手段が、前記所定の入力データが複数のクラスのそれぞれに属する事後確率あるいは尤もらしさである尤度あるいは分離超平面からの距離であり、値が大きいほど対応するクラスへ属する確率が高いことを表す分類スコアを算出し、分類スコア記憶手段に格納する分類スコア算出ステップと、
相対確信度算出手段が、前記分類スコア記憶手段から全ての前記分類スコア算出手段によって出力された全ての分類スコアを取得して、該全ての分類スコアから、算出パラメータ記憶手段に格納されている相対確信度算出パラメータを用いて、各分類スコアの上位N個(N≧1)に対応するクラスあるいはクラス群の中に正解のクラスがあり、かつ、他の分類スコア算出手段の分類スコアの上位N個に対応するクラスあるいはクラス群の中には正解のクラスがない確率を表す相対確信度を算出する相対確信度算出ステップと、
前記データクラス決定手段が、前記相対確信度が尤も高い分類スコア算出手段の分類スコアに基づいて入力データの属するクラスあるいはクラス群を決定するデータクラス決定ステップと、を行う。
The present invention (Claim 4) is a data classification method for classifying predetermined input data into classes,
A plurality of classification score calculation means for calculating classification methods or different constituent elements and features from each other, a likelihood or a likelihood that the predetermined input data belongs to each of a plurality of classes, or a distance from a separation hyperplane There is a classification score calculating step for calculating a classification score indicating that the larger the value is, the higher the probability of belonging to the corresponding class is, and storing the classification score in the classification score storage unit;
Relative confidence calculation means acquires all classification scores output by all the classification score calculation means from the classification score storage means, and stores the relative confidence stored in the calculation parameter storage means from all the classification scores . with confidence factor computing parameters, there are correct class in the top N (N ≧ 1) corresponding class or classes in each classification score, and the higher the classification score another class score calculating means A relative certainty calculating step for calculating a relative certainty representing the probability that there is no correct class among the classes or classes corresponding to N;
The data class determining means performs a data class determining step of determining a class or class group to which the input data belongs based on the classification score of the classification score calculating means having the highest relative certainty factor.
また、本発明(請求項5)は、前記相対確信度算出ステップにおいて
N個のクラス群を決定するときに、全ての分類スコア算出手段の上位N+1個の分類スコアを用いて算出する。
In the present invention (Claim 5), when N class groups are determined in the relative confidence calculation step, calculation is performed using the top N + 1 classification scores of all the classification score calculation means.
また、本発明(請求項6)は、前記相対確信度算出ステップにおいて、
2クラスあるいは多クラスのロジスティック回帰(カーネルを用いるものも含む)あるいは、サポートベクターマシン、あるいは、他の識別モデルに基づく機械学習手法を用いる。
Further, the present invention (Claim 6), in the relative confidence calculation step,
Use machine learning techniques based on 2-class or multi-class logistic regression (including those using kernels), support vector machines, or other identification models.
本発明(請求項7)は、コンピュータを、請求項1乃至3のいずれか1項に記載のデータ分類装置の各手段として機能させるためのデータ分類プログラムである。
The present invention (Claim 7) is a data classification program for causing a computer to function as each means of the data classification apparatus according to any one of
本発明は、複数の分類スコア算出手段が出力する全ての分類スコア情報を活用することで、他の分類スコア算出手段の分類スコアを反映した相対確信度を求め、この値が高い分類スコア算出手段を推測することにより、分類スコア算出手段毎の分類スコアのみから個々の分類スコア算出手段の出力の確信度を予測するよりも精度が高く、的確な分類スコア算出手段の選別を可能とし、結果として精度の高い分類結果を得ることができる。 The present invention uses all the classification score information output by a plurality of classification score calculation means to obtain a relative certainty factor reflecting the classification score of another classification score calculation means, and the classification score calculation means having a high value Is more accurate than predicting the certainty of the output of each classification score calculation means from only the classification score for each classification score calculation means, and enables an accurate classification score calculation means to be selected as a result. A highly accurate classification result can be obtained.
以下図面と共に、本発明の実施の形態を説明する。 Embodiments of the present invention will be described below with reference to the drawings.
本発明は、複数の分類スコア算出手段が出力する分類スコアを全て入力し、各分類スコア算出手段の相対確信度を識別問題として予測するものである。 The present invention inputs all the classification scores output by a plurality of classification score calculation means, and predicts the relative certainty of each classification score calculation means as an identification problem.
図1は、本発明の一実施の形態におけるデータ分類装置の構成を示す。 FIG. 1 shows a configuration of a data classification apparatus according to an embodiment of the present invention.
同図に示すデータ分類装置10は、入力部11、分類スコア算出制御部12、複数の分類スコア算出手段13、相対確信度算出部14、データクラス決定部15、メモリ16、分類スコア記憶部17、算出パラメータ記憶部18、相対確信度記憶部19、クラス群番号記憶部20から構成され、入力部11には処理対象記憶部1、キーボード2が接続され、出力部15にはディスプレイ3が接続されている。
The
処理対象記憶部1は、文書等の処理対象が格納されているデータベースであり、入力部11により読み出される。
The processing
メモリ16は、入力部11によって入力された処理対象が格納される。
The
算出パラメータ記憶部18は、後述するロジスティック回帰モデルにおけるモデルパラメータ推定手順によって予め求められていた相対確信度算出パラメータが格納される。
ステップと、を行う。
The calculation
And step.
相対確信度記憶部19は、相対確信度算出部14によって求められた相対確信度が格納される。
The relative certainty
クラス番号記憶部20は、相対確信度算出部14で入力された上位N個の分類スコアに対応するクラス番号が格納される。
The class
入力部11は、処理対象記憶部1から処理対象データを読み込み、メモリ16に格納すると共に、キーボード2から入力された分類スコア算出手段13の数及び分類先であるクラス数を取得し、分類スコア算出制御部12に渡す。
The input unit 11 reads the processing target data from the processing
分類スコア算出制御部12は、メモリ16から処理対象データの特徴量を入力する分類スコア算出手段13を決定し、分類スコアを算出させる。
The classification score
分類スコア算出手段13は、入力データが複数のクラスのそれぞれに属する事後確率あるいは尤もらしさである尤度あるいは分離超平面からの距離などの分類スコアを算出し、分類スコア記憶部17に格納する。それぞれの分類スコア算出手段13は、分類手法または構成要素や特徴が互いに異なる。例えば、データの特徴ベクトルとクラスラベルの同時確率分布をモデル化し、ベイズ則に基づいてクラス事後確率を直接モデル化することで、データのクラスラベルを推定する生成アプローチ、クラスの事後確率を直接モデル化する識別アプローチなどがある。
The classification score calculation means 13 calculates a classification score such as a posterior probability or likelihood that the input data belongs to each of a plurality of classes or a distance from the separation hyperplane, and stores the classification score in the classification
相対確信度算出部14は、分類スコア記憶部17に格納されている全ての分類スコアから、算出パラメータ記憶部18に格納されている相対確信度算出パラメータを用いて、各分類スコア算出手段について上位N個(N≧1)に対応するクラスあるいはクラス群の中に正解のクラスがあり、かつ、他の分類スコア算出手段の上位N個に対応するクラスあるいはクラス群の中には正解のクラスがない確率を表す相対確信度を算出し、相対確信度記憶部19に格納する。
The relative certainty
データクラス決定部15は、相対確信度記憶部19から相対確信度を取得し、最も高い相対確信度を示した分類スコア算出手段の分類スコアに基づいて入力データの属するクラスあるいはクラス群を決定し、出力する。
The data
図2は、本発明の一実施の形態におけるデータ分類装置の処理のフローチャートであり、入力データがいずれかに属するクラス群の数がN(≧1)の場合として説明する。 FIG. 2 is a flowchart of the processing of the data classification device according to the embodiment of the present invention, and will be described as a case where the number of class groups to which input data belongs is N (≧ 1).
ステップ101) 入力部11は、処理対象記憶部1から処理対象である入力データをメモリ16上に読み込む。
Step 101) The input unit 11 reads input data to be processed from the processing
ステップ102) 入力部11は、キーボード2から入力された分類スコア算出手段13の数nと、クラス数Kを取得し、分類スコア算出制御部12に渡す。
Step 102) The input unit 11 acquires the number n of classification score calculation means 13 and the number K of classes input from the keyboard 2, and passes them to the classification score
ステップ103) 分類スコア算出制御部12は、分類スコア算出手段13の番号iを1に初期化する(i=1)。
Step 103) The classification score
ステップ104) 分類スコア算出制御部12は、分類スコア算出手段13の番号iがi≦nであればステップ105に移行し、そうでなければステップ110へ移行する。
Step 104) The classification score
ステップ105) 分類スコア算出制御部12は、メモリ14に格納されている入力データWの特徴を第i番目の分類スコア算出手段13iに入力し、入力データがクラスCk(k=1,…,K)(事後確率あるいは尤度あるいは分離超平面からの距離などで、値が大きいほど対応するクラスへ属する確率が高いことを表す)を算出する。算出する方法としては、文献1「上田修功、斉藤和巳、"多重トピックテキストの確率モデルテキストモデル研究の最前線(1)",情報処理学会、会誌「情報処理」45巻2号,pp. 184-190,2004年2月」に記載されているナイーブベイズという方法を用いてもよい。算出された分類スコアを分類スコア記憶部17に格納する。
Step 105) The classification score
ステップ106) 第i分類スコア算出手段13iの上位N個の分類スコアに対応するクラス群hiをクラス群番号記憶部20に格納する。
Step 106) The class group hi corresponding to the top N classification scores of the i-th classification score calculating means 13i is stored in the class group
ステップ107) 分類スコア算出手段13iの番号iをi+1としてステップ104に戻る。 Step 107) The number i of the classification score calculation means 13i is set to i + 1, and the process returns to Step 104.
ステップ110) 分類スコア記憶部17から上記入力データWが各クラスに属する分類スコアを読み込んで全分類スコア算出手段13の上位N+1をLm(m=1,…,N+1)とし、算出パラメータ記憶部18から相対確信度パラメータ
Step 110) Read the classification score that the input data W belongs to each class from the classification
ステップ111) 相対確信度記憶部19から各分類スコア算出手段13の相対確信度Pi(i=1,…,n)を読み込み、最大の相対確信度の分類スコア算出手段を選択する。
Step 111) The relative certainty factor Pi (i = 1,..., N) of each classification score calculating unit 13 is read from the relative certainty
ステップ112) 上記選択した分類スコア算出手段が出力した上位N個の分類スコアに対応するクラス群hをクラス群番号記憶部20から読み込み、これを入力データがいずれかに属するクラス群として出力する。
Step 112) The class group h corresponding to the top N classification scores output by the selected classification score calculating means is read from the class group
なお、上記のデータ分類装置の各構成要素の動作をプログラムとして構築し、データ分類装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。 The operation of each component of the data classification device can be constructed as a program and installed in a computer used as the data classification device for execution or distributed via a network.
本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。 The present invention is not limited to the above-described embodiments, and various modifications and applications are possible within the scope of the claims.
1 処理対象記憶部
2 キーボード
3 ディスプレイ
10 データ分類装置
11 入力部
12 分類スコア算出制御部
13 分類スコア算出手段
14 相対確信度算出部
15 データクラス決定部
16 メモリ
17 分類スコア記憶部
18 算出パラメータ記憶部
19 相対確信度記憶部
20 クラス群番号記憶部
DESCRIPTION OF
Claims (7)
予め求められた相対確信度算出パラメータを格納する算出パラメータ記憶手段と、
算出する分類手法または構成要素や特徴が互いに異なる複数の分類スコア算出手段と、
分類スコアを格納する分類スコア記憶手段と、
相対確信度を算出する相対確信度算出手段と、
前記入力データの属するクラスあるいはクラス群を決定するデータクラス決定手段と、
を有し、
前記分類スコア算出手段は、
前記所定の入力データが複数のクラスのそれぞれに属する事後確率あるいは尤もらしさである尤度あるいは分離超平面からの距離であり、値が大きいほど対応するクラスへ属する確率が高いことを表す分類スコアを算出し、分類スコア記憶手段に格納する手段を含み、
前記相対確信度算出手段は、
前記分類スコア記憶手段から全ての前記分類スコア算出手段によって出力された全ての分類スコアを取得して、該全ての分類スコアから、前記算出パラメータ記憶手段に格納されている前記相対確信度算出パラメータを用いて、各分類スコアの上位N個(N≧1)に対応するクラスあるいはクラス群の中に正解のクラスがあり、かつ、他の分類スコア算出手段の分類スコアの上位N個に対応するクラスあるいはクラス群の中には正解のクラスがない確率を表す相対確信度を算出する手段を含み、
前記データクラス決定手段は、
前記相対確信度が尤も高い分類スコア算出手段の分類スコアに基づいて入力データの属するクラスあるいはクラス群を決定する手段を含む
ことを特徴とするデータ分類装置。 A data classification device for classifying predetermined input data into classes,
Calculation parameter storage means for storing a relative certainty factor calculation parameter obtained in advance;
A plurality of classification score calculation means having different classification methods or components and features to be calculated;
Classification score storage means for storing the classification score;
A relative confidence calculating means for calculating the relative confidence,
Data class determining means for determining a class or class group to which the input data belongs;
Have
The classification score calculation means includes:
A likelihood score or likelihood from the separation hyperplane that the predetermined input data belongs to each of a plurality of classes, or a classification score that indicates that the larger the value, the higher the probability of belonging to the corresponding class. Means for calculating and storing in the classification score storage means;
The relative certainty factor calculating means includes:
All classification scores output by all the classification score calculation means are acquired from the classification score storage means, and the relative certainty factor calculation parameters stored in the calculation parameter storage means are obtained from all the classification scores. using, there are correct class in the top N (N ≧ 1) corresponding class or classes in each classification score and corresponds to the top N classification score another class score calculating means Including means for calculating relative confidence representing the probability that there is no correct class in the class or class group,
The data class determining means includes
A data classification device comprising: means for determining a class or class group to which input data belongs based on a classification score of a classification score calculation means having a high relative certainty factor.
N個のクラス群を決定するときに、全ての分類スコア算出手段の上位N+1個の分類スコアを用いて算出する手段を含む
請求項1記載のデータ分類装置。 The relative certainty factor calculating means includes:
2. The data classification apparatus according to claim 1, further comprising means for calculating using the top N + 1 classification scores of all classification score calculation means when determining N class groups.
2クラスあるいは多クラスのロジスティック回帰(カーネルを用いるものも含む)あるいは、サポートベクターマシン、あるいは、他の識別モデルに基づく機械学習手法を用いる
請求項1または2記載のデータ分類装置。 The relative certainty factor calculating means includes:
3. The data classification apparatus according to claim 1, wherein a machine learning method based on two-class or multi-class logistic regression (including those using a kernel), a support vector machine, or another identification model is used.
算出する分類手法または構成要素や特徴が互いに異なる複数の分類スコア算出手段が、前記所定の入力データが複数のクラスのそれぞれに属する事後確率あるいは尤もらしさである尤度あるいは分離超平面からの距離であり、値が大きいほど対応するクラスへ属する確率が高いことを表す分類スコアを算出し、分類スコア記憶手段に格納する分類スコア算出ステップと、
相対確信度算出手段が、前記分類スコア記憶手段から全ての前記分類スコア算出手段によって出力された全ての分類スコアを取得して、該全ての分類スコアから、算出パラメータ記憶手段に格納されている相対確信度算出パラメータを用いて、各分類スコアの上位N個(N≧1)に対応するクラスあるいはクラス群の中に正解のクラスがあり、かつ、他の分類スコア算出手段の分類スコアの上位N個に対応するクラスあるいはクラス群の中には正解のクラスがない確率を表す相対確信度を算出する相対確信度算出ステップと、
前記データクラス決定手段が、前記相対確信度が尤も高い分類スコア算出手段の分類スコアに基づいて入力データの属するクラスあるいはクラス群を決定するデータクラス決定ステップと、
を行うことを特徴とするデータ分類方法。 A data classification method for classifying predetermined input data into classes,
A plurality of classification score calculation means for calculating classification methods or different constituent elements and features from each other, a likelihood or a likelihood that the predetermined input data belongs to each of a plurality of classes, or a distance from a separation hyperplane There is a classification score calculating step for calculating a classification score indicating that the larger the value is, the higher the probability of belonging to the corresponding class is, and storing the classification score in the classification score storage unit;
Relative confidence calculation means acquires all classification scores output by all the classification score calculation means from the classification score storage means, and stores the relative confidence stored in the calculation parameter storage means from all the classification scores . with confidence factor computing parameters, there are correct class in the top N (N ≧ 1) corresponding class or classes in each classification score, and the higher the classification score another class score calculating means A relative certainty calculating step for calculating a relative certainty representing the probability that there is no correct class among the classes or classes corresponding to N;
A data class determining step, wherein the data class determining means determines a class or a class group to which the input data belongs based on the classification score of the classification score calculating means with the highest relative certainty;
The data classification method characterized by performing.
N個のクラス群を決定するときに、全ての分類スコア算出手段の上位N+1個の分類スコアを用いて算出する
請求項4記載のデータ分類方法。 5. The data classification method according to claim 4, wherein when N class groups are determined in the relative certainty calculation step, calculation is performed using the top N + 1 classification scores of all classification score calculation means.
2クラスあるいは多クラスのロジスティック回帰(カーネルを用いるものも含む)あるいは、サポートベクターマシン、あるいは、他の識別モデルに基づく機械学習手法を用いる
請求項4または5記載のデータ分類方法。 In the relative certainty factor calculating step,
6. The data classification method according to claim 4, wherein a machine learning method based on two-class or multi-class logistic regression (including those using a kernel), a support vector machine, or another identification model is used.
請求項1乃至3のいずれか1項に記載のデータ分類装置の各手段として機能させるためのデータ分類プログラム。 Computer
The data classification program for functioning as each means of the data classification device of any one of Claims 1 thru | or 3.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011158410A JP5667004B2 (en) | 2011-07-19 | 2011-07-19 | Data classification apparatus, method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011158410A JP5667004B2 (en) | 2011-07-19 | 2011-07-19 | Data classification apparatus, method and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013025496A JP2013025496A (en) | 2013-02-04 |
JP5667004B2 true JP5667004B2 (en) | 2015-02-12 |
Family
ID=47783793
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011158410A Expired - Fee Related JP5667004B2 (en) | 2011-07-19 | 2011-07-19 | Data classification apparatus, method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5667004B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US12008799B2 (en) | 2020-05-14 | 2024-06-11 | Kabushiki Kaisha Toshiba | Classification system and learning system |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101864301B1 (en) * | 2016-09-19 | 2018-06-04 | 영남대학교 산학협력단 | Apparatus and method for classifying data |
KR102134324B1 (en) * | 2018-02-27 | 2020-07-15 | 숭실대학교산학협력단 | Apparatus and method for extracting rules of artficial neural network |
CN112767042B (en) * | 2021-01-26 | 2024-07-23 | 凹凸乐享(苏州)信息科技有限公司 | Group generation method and device, electronic equipment and storage medium |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4521459B2 (en) * | 2008-12-18 | 2010-08-11 | 株式会社日立製作所 | Document classification apparatus, document classification method, and program |
JP5063639B2 (en) * | 2009-04-10 | 2012-10-31 | 日本電信電話株式会社 | Data classification method, apparatus and program |
-
2011
- 2011-07-19 JP JP2011158410A patent/JP5667004B2/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US12008799B2 (en) | 2020-05-14 | 2024-06-11 | Kabushiki Kaisha Toshiba | Classification system and learning system |
Also Published As
Publication number | Publication date |
---|---|
JP2013025496A (en) | 2013-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112559784B (en) | Image classification method and system based on incremental learning | |
JP6781415B2 (en) | Neural network learning device, method, program, and pattern recognition device | |
US9002101B2 (en) | Recognition device, recognition method, and computer program product | |
US11521372B2 (en) | Utilizing machine learning models, position based extraction, and automated data labeling to process image-based documents | |
Perez-Ortiz et al. | Graph-based approaches for over-sampling in the context of ordinal regression | |
US8108324B2 (en) | Forward feature selection for support vector machines | |
CN108446741B (en) | Method, system and storage medium for evaluating importance of machine learning hyper-parameter | |
Hua et al. | Collaborative active learning of a kernel machine ensemble for recognition | |
JP6003492B2 (en) | Character recognition device and program | |
Zemmal et al. | A new hybrid system combining active learning and particle swarm optimisation for medical data classification | |
US20180005087A1 (en) | Pattern recognition device, pattern recognition method, and computer program product | |
JP5667004B2 (en) | Data classification apparatus, method and program | |
US20180075324A1 (en) | Information processing apparatus, information processing method, and computer readable storage medium | |
Ismail et al. | Comparative performance of deep learning and machine learning algorithms on imbalanced handwritten data | |
CN116822651A (en) | Large model parameter fine adjustment method, device, equipment and medium based on incremental learning | |
JPWO2015146113A1 (en) | Identification dictionary learning system, identification dictionary learning method, and identification dictionary learning program | |
Farag et al. | Inductive Conformal Prediction for Harvest-Readiness Classification of Cauliflower Plants: A Comparative Study of Uncertainty Quantification Methods | |
JP2016110256A (en) | Information processing device and information processing program | |
JP5633424B2 (en) | Program and information processing system | |
JP7067634B2 (en) | Robust learning device, robust learning method and robust learning program | |
CN113468936A (en) | Food material identification method, device and equipment | |
Kim et al. | A novel deep learning by combining discriminative model with generative model | |
JP2010250391A (en) | Data classification method, device, and program | |
Ramasamy et al. | 8 Meta-learning through ensemble approach: bagging, boosting, and random forest strategies | |
US12131234B2 (en) | Code generation for deployment of a machine learning model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130910 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20131004 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140314 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140415 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140616 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141209 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141211 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5667004 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |