JP7268347B2 - IDENTIFICATION DEVICE, IDENTIFICATION METHOD AND PROGRAM - Google Patents

IDENTIFICATION DEVICE, IDENTIFICATION METHOD AND PROGRAM Download PDF

Info

Publication number
JP7268347B2
JP7268347B2 JP2018239067A JP2018239067A JP7268347B2 JP 7268347 B2 JP7268347 B2 JP 7268347B2 JP 2018239067 A JP2018239067 A JP 2018239067A JP 2018239067 A JP2018239067 A JP 2018239067A JP 7268347 B2 JP7268347 B2 JP 7268347B2
Authority
JP
Japan
Prior art keywords
class
correction
correction parameter
confusion matrix
predicted value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018239067A
Other languages
Japanese (ja)
Other versions
JP2020101958A (en
Inventor
和久 松永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2018239067A priority Critical patent/JP7268347B2/en
Publication of JP2020101958A publication Critical patent/JP2020101958A/en
Application granted granted Critical
Publication of JP7268347B2 publication Critical patent/JP7268347B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、識別装置、識別方法及びプログラムに関する。 The present invention relates to an identification device, identification method and program.

従来から、ニューラルネットワーク(Neural Network)、SVM(Support Vector Machine)等を用いて、入力データが複数のクラスの中のどのクラスに属するかを判定する識別器(分類器とも呼ばれる)が知られており、様々な分野で利用されている。例えば、花の種類をクラスとして、花の画像を入力すると、その花の種類を出力する識別器が存在する。また、皮膚疾患の名称をクラスとして、皮膚の画像を入力すると、その皮膚の疾患名を出力する識別器が存在する。 Conventionally, a classifier (also called a classifier) has been known that uses a neural network, an SVM (Support Vector Machine), or the like to determine which class among a plurality of classes input data belongs to. and is used in various fields. For example, there is a classifier that outputs the type of flower when a flower image is input with the type of flower as a class. There is also a classifier that outputs the name of a skin disease when a skin image is input with the name of a skin disease as a class.

このような識別器は、クラスが既知である多数の学習データを用いて学習させることにより作成される。しかし、学習データに含まれているクラスの構成比率が極端に偏っている(クラス毎のサンプル数の不均衡が大きい)と、比率の高いクラス(サンプル数が多いクラス)にバイアスされてしまって、識別の精度が落ちるという問題がある。この問題を解決するために、特許文献1では、一方のクラスに属する学習データの個数が他方のクラスの個数より極端に少ない場合でも、少数クラスの学習データの一部を複製して増やしたり(オーバーサンプリング)、多数クラスの学習データの一部を除いて減らしたり(アンダーサンプリング)して、学習データのバランスを調整することにより、高精度な識別を行う技術が提案されている。 Such classifiers are created by learning using a large amount of training data whose classes are known. However, if the composition ratio of the classes included in the training data is extremely skewed (large imbalance in the number of samples for each class), it will be biased to classes with a high ratio (classes with a large number of samples). , there is a problem that the accuracy of identification falls. In order to solve this problem, in Patent Document 1, even if the number of learning data belonging to one class is extremely smaller than the number of the other class, part of the learning data of the minority class is duplicated to increase it ( (oversampling), or by removing some of the learning data of many classes and reducing (undersampling) the learning data to adjust the balance of the learning data, thereby performing highly accurate classification.

特開2013-161298号公報JP 2013-161298 A

従来、学習データのバランスを調整する尺度として、各クラスの識別結果をまとめた混同行列が用いられており、従来技術においては、混同行列の要素間の値の対称性が高くなるように、クラス間の個数のバランスが調整されている。しかし、適正なバランスは、各クラスに属するデータの個数だけでなく、クラス間の境界付近のデータの分布状況にも大いに影響されるため、オーバーサンプリングやアンダーサンプリングによって、学習データを適正なバランスに調整するのは容易ではない。 Conventionally, as a scale for adjusting the balance of learning data, a confusion matrix summarizing the classification results of each class is used. The balance between the numbers has been adjusted. However, the proper balance is greatly affected not only by the number of data belonging to each class, but also by the distribution of data near the boundaries between classes. Not easy to adjust.

本発明は、上記問題を解決するためになされたものであり、識別の精度の向上を図ることができる識別装置、識別方法及びプログラムを提供することを目的とする。 SUMMARY OF THE INVENTION The present invention has been made to solve the above problems, and an object of the present invention is to provide an identification device, an identification method, and a program capable of improving the accuracy of identification.

上記目的を達成するため、本発明の識別装置は、
入力される未知データの属する複数のクラスの各々を識別する各クラスの予測値を出力する識別器と、
前記識別器が出力する各クラスの予測値を、各クラスの補正パラメータを用いて補正する補正部と、
前記補正部によって補正された予測値で識別したクラスに基づいて混同行列を作成する作成部と、
前記作成によって作成された混同行列において前記識別器の各正解ラベルに対する各クラスのサンプル数の合計値の偏りが前記複数のクラスの間でより小さくなるように前記補正パラメータを修正する修正部と、
前記識別器の出力する予測値を、前記修正部によって修正された補正パラメータを用いて補正して、最終的な識別結果を取得する結果取得部と、
を備える。
In order to achieve the above object, the identification device of the present invention
a discriminator that outputs a predicted value for each class that discriminates each of a plurality of classes to which unknown data to be input belongs;
a correction unit that corrects the predicted value of each class output by the discriminator using a correction parameter of each class;
A creation unit that creates a confusion matrix based on the class identified by the predicted value corrected by the correction unit;
a modifying unit that modifies the correction parameter so that the deviation of the total number of samples of each class for each correct label of the classifier in the confusion matrix generated by the generating unit is smaller among the plurality of classes; ,
a result acquisition unit that acquires a final identification result by correcting the predicted value output by the classifier using the correction parameter corrected by the correction unit;
Prepare.

本発明によれば、識別の精度の向上を図ることができる。 According to the present invention, it is possible to improve the accuracy of identification.

本発明の実施形態1に係る識別装置の機能構成を示す図である。It is a figure which shows the functional structure of the identification device which concerns on Embodiment 1 of this invention. 実施形態1に係る補正パラメータ取得処理のフローチャートである。5 is a flowchart of correction parameter acquisition processing according to the first embodiment; 実施形態1に係る識別器学習処理のフローチャートである。4 is a flowchart of discriminator learning processing according to the first embodiment. 実施形態1に係る識別処理のフローチャートである。5 is a flowchart of identification processing according to the first embodiment; 混同行列を説明する図である。It is a figure explaining a confusion matrix. 補正パラメータを取得する処理を説明する図である。It is a figure explaining the process which acquires a correction parameter. 予測値を補正パラメータで補正した値での混同行列を説明する図である。FIG. 10 is a diagram illustrating a confusion matrix with values obtained by correcting predicted values with correction parameters; 補正パラメータを修正する処理を説明する図である。It is a figure explaining the process which corrects a correction parameter. 予測値を他の補正パラメータで補正した値での混同行列を説明する図である。FIG. 10 is a diagram illustrating a confusion matrix with values obtained by correcting predicted values with other correction parameters; 補正パラメータをさらに修正する処理を説明する図である。It is a figure explaining the process which corrects a correction parameter further.

以下、本発明の実施形態に係る識別装置等について、図表を参照して説明する。なお、図中同一又は相当部分には同一符号を付す。 Hereinafter, identification devices and the like according to embodiments of the present invention will be described with reference to the drawings. The same reference numerals are given to the same or corresponding parts in the drawings.

(実施形態1)
本発明の実施形態1に係る識別装置100は、サンプルデータの数にクラス間で偏りがあっても、識別器の出力を補正することよって、サンプル数の偏りの影響を軽減して、精度の高い識別を行うことができる。このような識別装置100について、以下に説明する。
(Embodiment 1)
The identification device 100 according to the first embodiment of the present invention reduces the influence of the bias in the number of samples by correcting the output of the classifier even if the number of sample data is biased between classes, and improves the accuracy. A high degree of discrimination can be achieved. Such an identification device 100 will be described below.

実施形態1に係る識別装置100は、図1に示すように、制御部10、記憶部20、データ入力部31、出力部32、通信部33、操作入力部34、を備える。 The identification device 100 according to Embodiment 1 includes a control unit 10, a storage unit 20, a data input unit 31, an output unit 32, a communication unit 33, and an operation input unit 34, as shown in FIG.

制御部10は、CPU(Central Processing Unit)等で構成され、記憶部20に記憶されたプログラムを実行することにより、後述する各部(識別器11、補正部12、結果取得部13)の機能を実現する。 The control unit 10 is composed of a CPU (Central Processing Unit) or the like, and by executing a program stored in the storage unit 20, functions of each unit (discriminator 11, correction unit 12, result acquisition unit 13) to be described later. Realize.

記憶部20は、ROM(Read Only Memory)、RAM(Random Access Memory)等で構成され、制御部10のCPUが実行するプログラム及び必要なデータを記憶する。 The storage unit 20 includes a ROM (Read Only Memory), a RAM (Random Access Memory), etc., and stores programs executed by the CPU of the control unit 10 and necessary data.

データ入力部31は、学習用のデータ、試験用のデータ又は識別する(未知の)データを入力するためのデバイスである。制御部10は、データ入力部31を介してデータを取得する。データ入力部31としては、制御部10がデータを取得できるなら、任意のデバイスを使用することができる。例えば、記憶部20にデータを記憶させておき、制御部10が記憶部20を読み出すことによってデータを取得する場合は、記憶部20がデータ入力部31を兼ねることになる。また、制御部10が通信部33を介して外部のサーバ等からデータを取得する場合は、通信部33がデータ入力部31を兼ねることになる。 The data input unit 31 is a device for inputting learning data, test data, or identifying (unknown) data. The control unit 10 acquires data via the data input unit 31 . Any device can be used as the data input unit 31 as long as the control unit 10 can acquire data. For example, when data is stored in the storage unit 20 and the control unit 10 acquires the data by reading the storage unit 20 , the storage unit 20 also serves as the data input unit 31 . Also, when the control unit 10 acquires data from an external server or the like via the communication unit 33 , the communication unit 33 also serves as the data input unit 31 .

出力部32は、制御部10が、データ入力部31から入力したデータを識別した結果等を出力するためのデバイスである。例えば、出力部32は、液晶ディスプレイや有機EL(Electoro-Luminescence)ディスプレイである。この場合、出力部32は、表示部として機能する。ただし、識別装置100は、出力部32としてこのようなディスプレイ(表示部)を備えてもよいし、外部のディスプレイを接続するためのインタフェースとしての出力部32を備えてもよい。識別装置100は、インタフェースとしての出力部32を備える場合は、出力部32を介して接続した外部のディスプレイに識別結果等を表示する。出力部32は、出力手段として機能する。 The output unit 32 is a device for the control unit 10 to output the results of identification of data input from the data input unit 31 and the like. For example, the output unit 32 is a liquid crystal display or an organic EL (Electro-Luminescence) display. In this case, the output section 32 functions as a display section. However, the identification device 100 may include such a display (display unit) as the output unit 32, or may include the output unit 32 as an interface for connecting an external display. When the identification device 100 has the output unit 32 as an interface, the identification result and the like are displayed on an external display connected via the output unit 32 . The output unit 32 functions as output means.

通信部33は、外部の他の装置(例えば、学習データや試験データのデータベースが格納されているサーバ等)とデータの送受信を行うためのデバイス(ネットワークインタフェース等)である。制御部10は、通信部33を介してデータを取得することができる。 The communication unit 33 is a device (network interface, etc.) for transmitting and receiving data to and from other external devices (for example, a server storing databases of learning data and test data). The control unit 10 can acquire data via the communication unit 33 .

操作入力部34は、識別装置100に対するユーザの操作入力を受け付けるデバイスであり、例えば、キーボード、マウス、タッチパネル等である。識別装置100は、操作入力部34を介して、ユーザからの指示等を受け付ける。操作入力部34は、操作入力手段として機能する。 The operation input unit 34 is a device that receives a user's operation input to the identification device 100, and is, for example, a keyboard, mouse, touch panel, or the like. The identification device 100 receives an instruction or the like from the user via the operation input unit 34 . The operation input unit 34 functions as operation input means.

次に、制御部10の機能について説明する。制御部10は、識別器11、補正部12、結果取得部13、の機能を実現する。 Next, functions of the control unit 10 will be described. The control unit 10 realizes the functions of the discriminator 11 , the correction unit 12 and the result acquisition unit 13 .

識別器11は、ロジスティク回帰やDNN(Deep Neural Network)等で構成され、与えられた入力データの属するクラスを識別する各クラスの予測値を出力することにより、該入力データが複数のクラスの何れに属するかを識別する。ここでは、識別器11が識別するクラスの数はN(識別器11は、Nクラス識別器)とする。識別器11は、入力データが与えられると、各クラスの予測値を0以上1以下の数で出力する。予測値はN(識別するクラス数)個出力されるので、各クラスの予測値をまとめて、N次元のベクトルとして予測値を扱うこともできる。そして、N個の予測値(ベクトルの各要素)のうち、最大の予測値に対応するクラスが、該入力データの識別結果(予測クラス)になる。なお、ロジスティク回帰やDNNによる識別器は、これらを実現するプログラムを制御部10が実行することにより実現することができ、この場合、制御部10は識別器11としても機能することになる。なお、識別器11は、各クラスの予測値を0以上1以下の数で出力するため、識別器11としてSVMを直接用いることはできないが、SVMの出力をシグモイド関数等で0以上1以下の数に変換するようにすれば、SVMを用いた識別器11を構成することも可能である。 The discriminator 11 is composed of logistic regression, DNN (Deep Neural Network), or the like, and outputs predicted values for discriminating the class to which given input data belongs. identify who belongs to Here, the number of classes identified by the discriminator 11 is N (the discriminator 11 is an N class discriminator). The discriminator 11 outputs a predicted value of each class as a number of 0 or more and 1 or less when input data is given. Since N (the number of classes to be identified) predicted values are output, the predicted values of each class can be collected and handled as an N-dimensional vector. Then, the class corresponding to the maximum predicted value among the N predicted values (each element of the vector) becomes the identification result (predicted class) of the input data. Logistic regression and DNN discriminators can be realized by the control unit 10 executing a program for realizing them. In this case, the control unit 10 also functions as the discriminator 11 . Since the discriminator 11 outputs the predicted value of each class as a number between 0 and 1, the SVM cannot be directly used as the discriminator 11. If converted into numbers, it is possible to configure the discriminator 11 using SVM.

補正部12は、識別器11が出力する各クラスの予測値を、混同行列の対称性を高めるように補正する補正パラメータを取得する。なお、混同行列とは、正解のわかっている入力データ(ここでは試験データと言う)を識別器11に入力させた時の、クラス識別の結果をまとめた表のことである。識別器11が識別したクラス(予測クラス)を横方向に、正解クラスを縦方向に取った時に、それぞれの位置に対応するサンプル数が混同行列の要素となる。また、混同行列の対称性が高いとは、入力データの各クラスのサンプル数が均等になるように入力した場合に、列毎の合計値の偏りが少ないことを意味する。 The correction unit 12 acquires a correction parameter for correcting the predicted value of each class output by the discriminator 11 so as to enhance the symmetry of the confusion matrix. The confusion matrix is a table summarizing the results of class discrimination when the classifier 11 receives input data whose correct answer is known (referred to as test data here). When the class (predicted class) identified by the classifier 11 is taken in the horizontal direction and the correct class is taken in the vertical direction, the number of samples corresponding to each position becomes an element of the confusion matrix. A confusion matrix with high symmetry means that the total value of each column is less biased when the number of samples in each class of input data is equal.

より詳しく説明すると、補正部12は、識別器11が識別する各クラスに対応する(N個の)補正パラメータを取得し、識別器11が出力する各クラスの予測値を当該クラスに対応する補正パラメータを用いて補正することにより、補正予測値を取得する。そして、補正予測値で識別したクラスに基づいて混同行列を作成する。そして、混同行列を行方向で(各クラスの正解データ数が1になるように)正規化した時の、列方向の合計(各クラスの予測率合計)ができるだけ1に近づくように当該N個の(各クラスに対応する)補正パラメータを修正する。そして、最終的に各クラスの予測率合計が最も1に近づいた時の補正パラメータを取得する。 More specifically, the correction unit 12 acquires (N) correction parameters corresponding to each class identified by the discriminator 11, and converts the predicted value of each class output by the discriminator 11 to the correction corresponding to the class. A corrected predicted value is obtained by correcting using the parameters. Then, a confusion matrix is created based on the classes identified by the corrected predicted values. Then, when the confusion matrix is normalized in the row direction (so that the number of correct data in each class is 1), the column direction sum (total prediction rate of each class) is as close to 1 as possible. modify the correction parameters (corresponding to each class) of Then, the correction parameter when the total prediction rate of each class is closest to 1 is obtained.

結果取得部13は、識別器11が出力する各クラスの予測値を、補正部12が取得した各クラスの補正パラメータを用いて補正して、最終的な識別結果を取得する。結果取得部13は、結果取得手段として機能する。 The result acquisition unit 13 corrects the predicted value of each class output by the classifier 11 using the correction parameter of each class acquired by the correction unit 12, and acquires the final classification result. The result acquisition unit 13 functions as result acquisition means.

以上、識別装置100の機能構成について説明した。次に、識別装置100の補正部12が補正パラメータを取得する処理(補正パラメータ取得処理)について説明する。この処理は、補正パラメータを取得する際に実行される。また、この処理を実行する前に、正解ラベルが付いている所定の量(ここではM個とする)の試験用の入力データ(試験データ)を記憶部20等に予め用意しておく必要がある。 The functional configuration of the identification device 100 has been described above. Next, a process (correction parameter acquisition process) in which the correction unit 12 of the identification device 100 acquires correction parameters will be described. This process is executed when the correction parameters are acquired. In addition, before executing this process, it is necessary to prepare a predetermined amount (in this case, M) of test input data (test data) with correct labels in advance in the storage unit 20 or the like. be.

正解ラベルとは、その正解ラベルが付いたデータがどのクラスに属するものかを示すものである。例えば、疾患画像を入力データとして入力すると疾患名を出力する識別装置100を用意したいのであれば、「疾患名」を正解ラベルとして各試験データに付けておく必要がある。別の例として、花の画像の画像を入力するとその花の名称を出力する識別装置100を用意したいのであれば、「花の名称」を正解ラベルとして各試験データに付けておく必要がある。では、識別装置100の補正部12が補正パラメータを取得する処理(補正パラメータ取得処理)について、図2を参照して説明する。 A correct label indicates to which class the data with the correct label belongs. For example, if it is desired to prepare an identification device 100 that outputs a disease name when a disease image is input as input data, it is necessary to attach "disease name" as a correct label to each test data. As another example, if it is desired to prepare the identification device 100 that outputs the name of a flower when an image of a flower is input, it is necessary to attach the "name of the flower" as a correct label to each piece of test data. Now, a process (correction parameter acquisition process) in which the correction unit 12 of the identification device 100 acquires correction parameters will be described with reference to FIG.

まず、制御部10は、後述する識別器学習処理により、予め正解ラベルが付いている大量の学習用の入力データ(学習データ)で識別器11を機械学習させる(ステップS101)。識別器11が既に学習済みである場合は、ステップS101はスキップしてよい。 First, the control unit 10 causes the discriminator 11 to undergo machine learning using a large amount of input data for learning (learning data) to which correct labels are attached in advance by discriminator learning processing described later (step S101). If the discriminator 11 has already been trained, step S101 may be skipped.

次に、制御部10は、試験データを識別器11に入力して識別器11の出力である予測値を取得する(ステップS102)。試験データがM個用意されているなら、M個の予測値(それぞれがN(クラス数)次元ベクトル)が取得される。 Next, the control unit 10 inputs the test data to the discriminator 11 and acquires the predicted value output from the discriminator 11 (step S102). If M pieces of test data are prepared, M prediction values (each being an N (number of classes) dimensional vector) are obtained.

そして、補正部12は、各クラスの補正パラメータを1に初期化し、カウンタ変数CTを0に初期化する(ステップS103)。 Then, the correction unit 12 initializes the correction parameter of each class to 1, and initializes the counter variable CT to 0 (step S103).

次に、補正部12は、ステップS102で取得した各予測値を、各クラスの補正パラメータで補正して、補正予測値を取得する(ステップS104)。具体的には、各クラスの予測値を該クラスの補正パラメータでべき乗した値に変換し、それを補正予測値とする。そして、補正予測値から混同行列を作成し(ステップS105)、混同行列の各行を合計が1になるように正規化する(ステップS106)。 Next, the correction unit 12 corrects each predicted value obtained in step S102 with the correction parameter of each class to obtain a corrected predicted value (step S104). Specifically, the predicted value of each class is converted to a value raised to the power of the correction parameter of the class, and the converted value is used as the corrected predicted value. Then, a confusion matrix is created from the corrected prediction values (step S105), and each row of the confusion matrix is normalized so that the sum becomes 1 (step S106).

次に、補正部12は、正規化して混同行列の各列の合計値を各クラス予測率合計として取得する(ステップS107)。そして、各クラス予測率合計と1との差分絶対値が最大となるクラスを検索し、検索されたクラスを変数MCに、差分絶対値の最大値(当該クラスのクラス予測率合計と1との差分絶対値)を変数MDにセットし、カウンタ変数CTをインクリメントする(ステップS108)。 Next, the correction unit 12 normalizes and acquires the total value of each column of the confusion matrix as the total prediction rate of each class (step S107). Then, the class with the maximum absolute difference between the total class prediction rate and 1 is searched for, and the searched class is set as a variable MC, and the maximum absolute difference value (the total class prediction rate of the class and 1 difference absolute value) is set in the variable MD, and the counter variable CT is incremented (step S108).

そして、補正部12は、変数MD(差分絶対値の最大値)が基準値SD(例えば0.02)以下か否かを判定する(ステップS109)。変数MDが基準値SD以下なら(ステップS109;Yes)、現在の補正パラメータで混同行列の対称性は十分上がっていると考えられるので、補正部12は現在の補正パラメータを後述の識別処理で用いる補正パラメータとして確定させ(ステップS114)、補正パラメータ取得処理を終了する。ステップS114は、補正パラメータ取得ステップとも呼ばれる。 Then, the correction unit 12 determines whether or not the variable MD (the maximum value of the absolute difference values) is equal to or less than the reference value SD (for example, 0.02) (step S109). If the variable MD is equal to or less than the reference value SD (step S109; Yes), it is considered that the symmetry of the confusion matrix is sufficiently improved with the current correction parameters, so the correction unit 12 uses the current correction parameters in the identification process described later. It is determined as a correction parameter (step S114), and the correction parameter acquisition process ends. Step S114 is also called a correction parameter acquisition step.

変数MDが基準値SDより大きければ(ステップS109;No)、補正部12は、カウンタ変数CTが最大検索回数LIMIT(例えば100)以上か否かを判定する(ステップS110)。カウンタ変数CTが最大検索回数LIMIT以上なら(ステップS110;Yes)、補正部12は現在の補正パラメータを後述の識別処理で用いる補正パラメータとして確定させ(ステップS114)、補正パラメータ取得処理を終了する。この補正パラメータ取得処理では、変数MDの値が基準値SD以下にならずに振動してしまう場合等があるため、ある程度の回数(LIMITの回数)検索を繰り返しても変数MDが基準値SD以下にならなければ、補正パラメータ取得処理を終了させるためにステップS110での判定を行っている。 If the variable MD is greater than the reference value SD (step S109; No), the correction unit 12 determines whether or not the counter variable CT is equal to or greater than the maximum search count LIMIT (eg, 100) (step S110). If the counter variable CT is equal to or greater than the maximum number of searches LIMIT (step S110; Yes), the correction unit 12 determines the current correction parameters as correction parameters used in the later-described identification process (step S114), and ends the correction parameter acquisition process. In this correction parameter acquisition process, there are cases where the value of the variable MD does not become equal to or less than the reference value SD and the variable MD vibrates. If not, the determination in step S110 is made to end the correction parameter acquisition process.

カウンタ変数CTが最大検索回数LIMIT未満なら(ステップS110;No)、補正部12は、変数MCのクラスのクラス予測率合計が1より大きいか否かを判定する(ステップS111)。変数MCのクラスのクラス予測率合計が1より大きければ(ステップS111;Yes)、変数MCのクラスの補正パラメータを増やし(ステップS112)、ステップS104に戻る。補正パラメータを増やす量は、例えば0.05のような定数としてもよいし、変数MD(差分絶対値の最大値)の値に応じて変化させてもよい(MDの値が大きければ補正パラメータを増やす量も大きくし、MDの値が小さければ補正パラメータを増やす量も小さくする)。ただし、この値が大きいと、変数MDの値が振動したり発散したりし易くなるため、計算時間がかかってもよければ、基本的に増やす量はできるだけ小さい値にする方がよい。 If the counter variable CT is less than the maximum search count LIMIT (step S110; No), the correction unit 12 determines whether or not the total class prediction rate of the class of the variable MC is greater than 1 (step S111). If the total class prediction rate of the class of variable MC is greater than 1 (step S111; Yes), the correction parameter of the class of variable MC is increased (step S112), and the process returns to step S104. The amount by which the correction parameter is increased may be a constant such as 0.05, or may be changed according to the value of the variable MD (maximum value of absolute difference) (if the value of MD is large, the correction parameter is The amount of increase is also increased, and if the value of MD is small, the amount of increase of the correction parameter is also decreased). However, if this value is large, the value of the variable MD tends to oscillate or diverge, so basically it is better to set the amount of increase as small as possible if the computation time is acceptable.

変数MCのクラスのクラス予測率合計が1以下なら(ステップS111;No)、変数MCのクラスの補正パラメータを減らし(ステップS113)、ステップS104に戻る。ステップS112と同様、補正パラメータを減らす量は、例えば0.05のような定数としてもよいし、変数MD(差分絶対値の最大値)の値に応じて変化させてもよい(MDの値が大きければ補正パラメータを減らす量も大きくし、MDの値が小さければ補正パラメータを減らす量も小さくする)。ただし、この値が大きいと、変数MDの値が振動したり発散したりし易くなるため、計算時間がかかってもよければ、基本的に減らす量はできるだけ小さい値にする方がよい。 If the total class prediction rate of the class of the variable MC is 1 or less (step S111; No), the correction parameter of the class of the variable MC is decreased (step S113), and the process returns to step S104. As in step S112, the amount by which the correction parameter is reduced may be a constant value such as 0.05, or may be changed according to the value of the variable MD (maximum absolute value of difference) (when the value of MD is If the value of MD is large, the amount by which the correction parameter is decreased is also increased, and if the value of MD is small, the amount by which the correction parameter is decreased is also decreased). However, if this value is large, the value of the variable MD tends to oscillate or diverge, so basically it is better to set the amount to be reduced as small as possible if the calculation time is acceptable.

以上の補正パラメータ取得処理を説明した。次に、上記ステップS101で行われる識別器学習処理について、図3を参照して説明する。 The above correction parameter acquisition processing has been described. Next, the discriminator learning process performed in step S101 will be described with reference to FIG.

まず、制御部10は、データ入力部31を介して正解ラベルが付いている学習データを取得する(ステップS201)。そして、制御部10は、学習データを識別器11に入力し、学習データに付いている正解ラベルに基づいて、識別器11を学習させる(ステップS202)。 First, the control unit 10 acquires learning data with a correct label through the data input unit 31 (step S201). Then, the control unit 10 inputs the learning data to the discriminator 11, and causes the discriminator 11 to learn based on the correct label attached to the learning data (step S202).

そして、制御部10は、学習を終了するか否かを判定する(ステップS203)。例えば、学習データを予め決められた個数(例えばM個)学習させたら学習を終了する。学習させていない学習データが残っている場合等、学習を終了しないなら(ステップS203;No)、ステップS201に戻って、次の学習データを取得して識別器11を学習させる。学習を終了するなら(ステップS203;Yes)、識別器学習処理を終了する。 Then, the control unit 10 determines whether or not to end learning (step S203). For example, the learning is terminated when a predetermined number (for example, M) of learning data are learned. If learning is not finished (step S203; No), such as when learning data that has not been learned remains (step S203; No), the process returns to step S201 to acquire the next learning data and make the discriminator 11 learn. If learning is to be ended (step S203; Yes), the classifier learning process is ended.

以上、説明した補正パラメータ取得処理(図2)が終了した時点での補正パラメータを、補正部12は取得し、識別装置100は、この補正パラメータで識別器11の出力(予測値)を補正して、入力データの識別を行う。では、識別装置100の識別処理について、図4を参照して説明する。 The correction unit 12 acquires the correction parameters at the time when the correction parameter acquisition process (FIG. 2) described above is completed, and the identification device 100 corrects the output (predicted value) of the discriminator 11 with the correction parameters. to identify the input data. Now, the identification processing of the identification device 100 will be described with reference to FIG.

まず、制御部10は、データ入力部31を介して未知データ(識別するデータ)を取得する(ステップS301)。そして、制御部10は、当該未知データを識別器11に入力し、識別器11が出力した各クラスの予測値を取得する(ステップS302)。 First, the control unit 10 acquires unknown data (identifying data) through the data input unit 31 (step S301). Then, the control unit 10 inputs the unknown data to the discriminator 11 and acquires the predicted value of each class output by the discriminator 11 (step S302).

次に、結果取得部13は、各クラスの予測値を、補正部12が補正パラメータ取得処理(図2)で取得した補正パラメータで補正する(ステップS303)。具体的には、各クラスの予測値を該クラスの補正パラメータでべき乗した値に変換し、それを補正予測値とする。そして、結果取得部13は、補正予測値が最大となるクラスを識別結果として取得し、出力部32を介して出力する(ステップS304)。そして識別処理を終了する。ステップS304は、結果取得ステップとも呼ばれる。 Next, the result obtaining unit 13 corrects the predicted value of each class with the correction parameter obtained by the correction parameter obtaining process (FIG. 2) by the correcting unit 12 (step S303). Specifically, the predicted value of each class is converted to a value raised to the power of the correction parameter of the class, and the converted value is used as the corrected predicted value. Then, the result acquisition unit 13 acquires the class with the largest corrected predicted value as the identification result, and outputs it via the output unit 32 (step S304). Then, the identification processing ends. Step S304 is also called a result acquisition step.

以上の識別処理により、未知データが識別される。そして、この識別は、識別器11の出力した予測値を補正した補正予測値に基づいて行われているため、学習データのクラス毎の数が不均衡だったとしても、その影響を極力排除して、高精度な識別を行うことができる。 Unknown data is identified by the above identification processing. Since this discrimination is performed based on the corrected predicted value obtained by correcting the predicted value output from the classifier 11, even if the number of learning data for each class is unbalanced, the influence thereof is eliminated as much as possible. Therefore, highly accurate identification can be performed.

次に、識別装置100による補正パラメータ取得処理(図2)について、具体例で説明する。ここでは、識別器11は、「A」、「B」、「C」の3つのクラスを識別する3クラス識別器であり、図2のステップS101で学習済みであるとする。また、図5の左に示すような正解ラベルが付けられた24個の試験データが用意されているものとする。そして、24個の試験データを図2のステップS102で識別器11に入力して得られた出力値(予測値)が、正解ラベルの右に記載されている。図2のステップS103で、各クラスの補正パラメータは3つのクラスとも1.0に初期化されるので、これを3次元ベクトル(1.0,1.0,1.0)で表すことにする。また、カウンタ変数CT=0となる。 Next, the correction parameter acquisition processing (FIG. 2) by the identification device 100 will be described with a specific example. Here, the discriminator 11 is a three-class discriminator that discriminates three classes of "A", "B", and "C", and is presumed to have been learned in step S101 of FIG. It is also assumed that 24 pieces of test data labeled with correct answers as shown on the left side of FIG. 5 are prepared. An output value (predicted value) obtained by inputting 24 pieces of test data to the discriminator 11 in step S102 of FIG. 2 is written to the right of the correct label. At step S103 in FIG. 2, the correction parameters of each class are initialized to 1.0 for all three classes, which is represented by a three-dimensional vector (1.0, 1.0, 1.0). . Also, the counter variable CT=0.

例えば一番上の試験データの場合、正解ラベルは「C」であり、識別器11で得られた予測値は(0.7,0.2,0.68)である。この場合、予測値のベクトルの要素の最大値が0.7であり、0.7は最初の要素(Aに対応)なので、識別器11による識別結果は「A」となる。また、補正パラメータの初期値は上述したように、(1.0,1.0,1.0)であり、図2のステップS104で、予測値をこの補正パラメータで補正すると、(0.7^1.0,0.2^1.0,0.68^1.0)で、元の予測値と同じ(0.7,0.2,0.68)が補正予測値として得られ、この補正予測値による識別結果も、予測値による識別結果と同じ「A」となる。 For example, in the case of the test data at the top, the correct label is "C" and the predicted values obtained by the discriminator 11 are (0.7, 0.2, 0.68). In this case, the maximum value of the elements of the predicted value vector is 0.7, and 0.7 is the first element (corresponding to A), so the identification result of the identifier 11 is "A". Also, as described above, the initial values of the correction parameters are (1.0, 1.0, 1.0), and in step S104 of FIG. ^ 1.0, 0.2 ^ 1.0, 0.68 ^ 1.0), and the same (0.7, 0.2, 0.68) as the original prediction values are obtained as corrected prediction values, The identification result based on this corrected predicted value is also "A", which is the same as the identification result based on the predicted value.

図2のステップS105で、24個の試験データ全てについて、正解ラベルと補正予測値による識別結果との関係を表にまとめたものが、図5の右に記載されている混同行列である。この混同行列を見ると、正解ラベルが「A」の試験データのうち、識別結果が「A」となったものが10個、識別結果が「B」となったものが2個、識別結果が「C」となったものが0個あることがわかる。同様に、正解ラベルが「B」の試験データのうち、識別結果が「A」となったものが3個、識別結果が「B」となったものが5個、識別結果が「C」となったものが1個あることがわかる。さらに、正解ラベルが「C」の試験データのうち、識別結果が「A」となったものが2個、識別結果が「B」となったものが0個、識別結果が「C」となったものが1個あることがわかる。 The confusion matrix shown on the right side of FIG. 5 is a table summarizing the relationship between the correct label and the identification result based on the corrected prediction value for all 24 pieces of test data in step S105 of FIG. Looking at this confusion matrix, among the test data with the correct answer label of "A", 10 have the classification result of "A", 2 have the classification result of "B", and the classification result of It can be seen that there are 0 "C". Similarly, among the test data with the correct answer label of "B", three have the identification result of "A", five have the identification result of "B", and have the identification result of "C". It turns out that there is one thing that has become. Furthermore, among the test data with the correct answer label of "C", there are 2 items with the identification result of "A", 0 items with the identification result of "B", and the identification result of "C". It turns out that there is one thing.

次に、この混同行列を正規化して、補正パラメータを取得する処理について、図6を参照して説明する。まず、図2のステップS106で、混同行列を正規化するために、まず、図6の上にあるように各正解ラベルの付いた試験データの個数の合計を求める。そして、図6の上から2番目の表にあるように、混合行列の各行について、要素を合計の値で割ることにより、合計を1に正規化する。 Next, the process of normalizing this confusion matrix and acquiring correction parameters will be described with reference to FIG. First, in step S106 of FIG. 2, in order to normalize the confusion matrix, first, the total number of pieces of test data with each correct label is obtained as shown in the top of FIG. Then, for each row of the mixing matrix, normalize the sum to 1 by dividing the element by the value of the sum, as in the second table from the top of FIG.

そして、図2のステップS107で、この正規化された混同行列の各列について縦方向に要素の合計値(各クラスの予測率合計)を計算すると、図6に示すように、クラス「A」の予測率合計は1.833、クラス「B」の予測率合計は0.722、クラス「C」の予測率合計は0.444となり、これらの値にはかなりばらつきがあることがわかる。この例では、識別結果が「A」となる割合がかなり高く、混同行列の対称性が低くなっている。また平均正解率も0.574とかなり低い。なお、ここで、平均正解率とは、正解がクラス「X」である試験データのうち、識別結果(予測クラス)が「X」になったものの割合を全てのクラスについて平均した値である。図6においては、上から2番目の表の対角線上に存在している値を平均して、(0.833+0.556+0.333)÷3=0.574が得られ、この表の右下にこの平均正解率の数値が記載されている。 Then, in step S107 of FIG. 2, when the total value of the elements in the vertical direction for each column of this normalized confusion matrix (total prediction rate of each class) is calculated, as shown in FIG. is 1.833, the total prediction rate for class "B" is 0.722, and the total prediction rate for class "C" is 0.444. In this example, the proportion of the identification result being "A" is quite high, and the symmetry of the confusion matrix is low. Also, the average accuracy rate is as low as 0.574. Here, the average correct answer rate is a value obtained by averaging the proportion of test data whose correct answer is class "X" and whose identification result (predicted class) is "X" for all classes. In FIG. 6, the values existing on the diagonal line of the second table from the top are averaged to obtain (0.833+0.556+0.333)/3=0.574. The numerical value of this average accuracy rate is described.

混同行列の対称性を高くするには、各列の縦方向の合計値が大きいクラスの予測値を小さい値に補正するか、又は、この合計値が小さいクラスの予測値を大きい値に補正すればよいと考えられる。上述したように識別器11が出力する予測値は0以上1以下の値であり、この値は1より大きな数でべき乗すると(0以上1以下の範囲内で)元の値より小さな値になり、1より小さな値でべき乗すると(0以上1以下の範囲内で)元の値より大きな値になる。したがって、この性質を利用すると、混同行列の対称性を高くするには、各列の縦方向の合計値が大きいクラスの予測値を1より大きな数でべき乗するか、又は、この合計値が小さいクラスの予測値を1より小さな数でべき乗すればよいことになる。 In order to increase the symmetry of the confusion matrix, the predicted value of a class with a large vertical total value in each column should be corrected to a small value, or the predicted value of a class with a small total value should be corrected to a large value. It is considered to be good. As described above, the predicted value output by the discriminator 11 is a value between 0 and 1, and when this value is raised to a power greater than 1 (within the range between 0 and 1), it becomes a smaller value than the original value. , raised to a power less than 1 (between 0 and 1) yields a greater value than the original. Therefore, using this property, in order to increase the symmetry of the confusion matrix, the predicted value of the class with a large vertical total value in each column should be raised to a power greater than 1, or the total value is small It suffices to raise the predicted value of the class to a power smaller than one.

図6の例では、クラス「A」の予測率合計は1.833で最も大きく、クラス「C」の予測率合計は0.444で最も小さい。そこで、クラス「A」の予測値を小さくするために1より大きな数でべき乗し、クラス「C」の予測値を大きくするために1より小さな数でべき乗することが考えられる。ただし、同時に複数のパラメータを変化させると、各クラスの予測値が急激に変化して、識別結果が予想外に変化してしまう可能性がある。そこで、本実施形態1では、一度に1つのパラメータだけを変化させることとしている。この例では、図2のステップS108で、基準値1との差分絶対値が最大となるクラスとして、クラス「A」が検索されて、MC=「A」となり、差分絶対値の最大値MD=|1.833-1|=0.833となる。そして、カウンタ変数CTはインクリメントされて1となる。 In the example of FIG. 6, class "A" has the highest total prediction rate at 1.833 and class "C" has the lowest total prediction rate at 0.444. Therefore, it is conceivable to raise the predicted value of class "A" to a power greater than 1, and to raise the predicted value of class "C" to a power of less than 1. However, if multiple parameters are changed at the same time, there is a possibility that the prediction value of each class will change abruptly and the classification result will change unexpectedly. Therefore, in the first embodiment, only one parameter is changed at a time. In this example, in step S108 of FIG. 2, the class "A" is searched as the class having the maximum absolute difference value from the reference value 1, MC="A", and the maximum absolute difference value MD= |1.833−1|=0.833. Then, the counter variable CT is incremented to one.

次に図2のステップS109では、変数MD(ここでは0.833)が基準値SD(例えば0.02)以下か否かが判定されて判定はNoとなり、ステップS110に進む。ステップS110でカウンタ変数CT(ここでは1)が最大検索回数LIMIT(例えば100)以上か否かが判定されて判定はNoとなり、ステップS111に進む。ステップS111では、クラス「A」のクラス予測率合計である1.833が1より大きいか否かが判定されて判定はYesとなり、ステップS113でクラス「A」の補正パラメータが増やされる。ここでは増やす量は0.05であるとする。すると、クラス「A」の補正パラメータは1.05となり、クラス「B」及びクラス「C」の補正パラメータは1のままなので、補正パラメータをベクトルで表すと(1.05,1.0,1.0)となる。 Next, in step S109 of FIG. 2, it is determined whether or not the variable MD (here, 0.833) is equal to or less than the reference value SD (eg, 0.02), the determination is No, and the process proceeds to step S110. In step S110, it is determined whether or not the counter variable CT (here, 1) is equal to or greater than the maximum search count LIMIT (eg, 100), the determination is No, and the process proceeds to step S111. In step S111, it is determined whether or not 1.833, which is the total class prediction rate of class "A", is greater than 1, the determination is Yes, and in step S113 the correction parameter of class "A" is increased. Here, the amount to be increased is assumed to be 0.05. Then, the correction parameter of class "A" becomes 1.05, and the correction parameters of class "B" and class "C" remain 1. Therefore, if the correction parameters are represented by a vector, (1.05, 1.0, 1 .0).

図示しないが、ステップS113からステップS104に戻って、補正パラメータ(1.05,1.0,1.0)で図5にある識別器の予測値を補正しても、識別結果に変化は生じないので、また同じ混同行列が得られ、ステップS113まで同じように進み、ステップS113でクラスAの補正パラメータは1.1となる。そして、またステップS104に戻って、補正パラメータ(1.1,1.0,1.0)で図5にある識別器の予測値を補正して補正予測値を取得すると、図7に示すように一部の識別結果が変化する。そして、ステップS105で混同行列を作成すると、図7の右にあるような混同行列が作成される。 Although not shown, even if the process returns from step S113 to step S104 and corrects the predicted values of the discriminator shown in FIG. Therefore, the same confusion matrix is obtained again, and the same process proceeds to step S113, where the correction parameter for class A becomes 1.1. Then, returning to step S104, the predicted values of the discriminator shown in FIG. part of the identification results change. Then, when the confusion matrix is created in step S105, the confusion matrix shown on the right side of FIG. 7 is created.

そして、ステップS106で正規化すると、図8の上から2番目の表にあるような正規化した混同行列が得られる。そして、ステップS107で各クラスの予測率合計を計算すると、クラス「A」の予測率合計は1.167、クラス「B」の予測率合計は1.056、クラス「C」の予測率合計は0.778となり、前回の混同行列よりも対称性が高くなったことがわかる。平均正解率も0.796と、前回よりも上昇している。 Then, when normalized in step S106, a normalized confusion matrix as shown in the second table from the top in FIG. 8 is obtained. Then, when the total prediction rate of each class is calculated in step S107, the total prediction rate of class "A" is 1.167, the total prediction rate of class "B" is 1.056, and the total prediction rate of class "C" is It is 0.778, and it can be seen that the symmetry is higher than the previous confusion matrix. The average accuracy rate is 0.796, which is higher than the previous time.

そして、今回の場合は、ステップS108で、基準値1との差分絶対値が最大となるクラスとして、クラス「C」が検索されて、MC=「C」となり、差分絶対値の最大値MD=|0.778-1|=0.222となる。そして、ステップS111で、クラス「C」のクラス予測率合計である0.778が1より大きいか否かが判定されて判定はNoとなり、ステップS112でクラス「C」の補正パラメータが減らされる。ここでは減らす量は0.05であるとする。すると、クラス「C」の補正パラメータは0.95となり、補正パラメータをベクトルで表すと(1.1,1.0,0.95)となる。 In this case, in step S108, the class "C" is searched as the class having the maximum absolute difference from the reference value 1, MC="C", and the maximum absolute difference MD= |0.778−1|=0.222. Then, in step S111, it is determined whether or not 0.778, which is the total class prediction rate of class "C", is greater than 1, the determination is No, and in step S112, the correction parameter of class "C" is decreased. Assume here that the amount to be reduced is 0.05. Then, the correction parameter for class "C" is 0.95, and the correction parameter is expressed as a vector (1.1, 1.0, 0.95).

そして、またステップS104に戻って、補正パラメータ(1.1,1.0,0.95)で図5にある識別器の予測値を補正して補正予測値を取得すると、図9に示すように一部の識別結果が変化する。そして、ステップS105で混同行列を作成すると、図9の右にあるような混同行列が作成される。 Then, returning to step S104, the predicted values of the discriminator shown in FIG. part of the identification results change. Then, when the confusion matrix is created in step S105, the confusion matrix shown on the right side of FIG. 9 is created.

そして、ステップS106で正規化すると、図10の上から2番目の表にあるような正規化した混同行列が得られる。そして、ステップS107で各クラスの予測率合計を計算すると、クラス「A」の予測率合計は0.833、クラス「B」の予測率合計は1.056、クラス「C」の予測率合計は1.111となり、前回の混同行列よりも対称性が高くなったことがわかる。平均正解率も0.907と、前回よりもさらに上昇している。 Then, when normalized in step S106, a normalized confusion matrix as shown in the second table from the top in FIG. 10 is obtained. Then, when the total prediction rate of each class is calculated in step S107, the total prediction rate of class "A" is 0.833, the total prediction rate of class "B" is 1.056, and the total prediction rate of class "C" is 1.111, and it can be seen that the symmetry is higher than the previous confusion matrix. The average accuracy rate is 0.907, which is higher than the previous time.

そして、今回の場合は、ステップS108で、基準値1との差分絶対値が最大となるクラスとして、クラス「A」が検索されて、MC=「A」となり、差分絶対値の最大値MD=|0.833-1|=0.166となる。そして、ステップS111で、クラス「A」のクラス予測率合計である0.833が1より大きいか否かが判定されて判定はNoとなり、ステップS112でクラス「A」の補正パラメータが減らされる。ここでは減らす量は0.05であるとする。すると、クラス「A」の補正パラメータは1.05となり、補正パラメータをベクトルで表すと(1.05,1.0,0.95)となる。このようにして、クラス予測率合計と1との差分絶対値の最大値MDが基準値SD以下になるか、カウンタ変数CTが最大検索回数LIMIT以上になるまで処理が繰り返され、最終的に補正パラメータが求まることになる。 In this case, in step S108, the class "A" is searched as the class having the maximum absolute difference value from the reference value 1, MC="A", and the maximum absolute difference value MD= |0.833−1|=0.166. Then, in step S111, it is determined whether or not 0.833, which is the total class prediction rate of class "A", is greater than 1, the determination is No, and in step S112, the correction parameter of class "A" is decreased. Assume here that the amount to be reduced is 0.05. Then, the correction parameter for class "A" is 1.05, and the correction parameter is expressed as a vector (1.05, 1.0, 0.95). In this way, the process is repeated until the maximum value MD of the absolute difference between the total class prediction rate and 1 becomes equal to or less than the reference value SD, or until the counter variable CT becomes equal to or greater than the maximum number of searches LIMIT. parameters will be obtained.

以上説明した識別処理により、識別装置100は、混同行列の対称性を高めるように識別器11の予測値を補正することにより、サンプルデータがクラス間で偏っていても、偏りの影響を軽減して、精度の高い識別を行うことができる。 With the above-described identification processing, the identification device 100 corrects the prediction values of the classifier 11 so as to increase the symmetry of the confusion matrix, thereby reducing the influence of bias even if sample data is biased between classes. Therefore, highly accurate identification can be performed.

(変形例1)
実施形態1では、補正部12は、識別器11の予測値を補正する際に、予測値を補正パラメータでべき乗する演算を行ったが、補正部12が予測値を補正する際に用いる演算(補正パラメータによって定まる関数)はこれに限られない。予測値は0以上1以下の値であり、予測値を補正パラメータで補正した後の値(補正予測値)も0以上1以下の値である必要があるという前提があるが、補正パラメータを固定した場合に元の予測値の大小関係が、補正した後も(補正予測値でも)保たれることと、補正パラメータの値の大小に応じて予測値が補正された時の変化方向及び変化度合いが定まることとが満たされるなら、補正部12は、他の関数を用いて識別器11の予測値を補正してもよい。
(Modification 1)
In the first embodiment, when correcting the predicted value of the discriminator 11, the correcting unit 12 performs the calculation of exponentiating the predicted value by the correction parameter. function determined by correction parameters) is not limited to this. There is a premise that the predicted value is a value between 0 and 1, and the value after correcting the predicted value with the correction parameter (corrected predicted value) must also be a value between 0 and 1, but the correction parameter is fixed. The magnitude relationship of the original predicted value is maintained even after correction (even the corrected predicted value), and the direction and degree of change when the predicted value is corrected according to the magnitude of the correction parameter value is determined, the correction unit 12 may correct the predicted value of the discriminator 11 using another function.

つまり、補正部12は、入力値(予測値)として0以上1以下の値を0以上1以下の値の出力値(補正予測値)に変換する単調非減少関数(広義の単調増加関数)であって、当該単調非減少関数(広義の単調増加関数)は補正パラメータによって定まる関数であって、入力値(予測値)を固定した場合に補正パラメータによる出力値(補正予測値)の変化も単調非減少又は単調非増加となるような関数であれば、任意の関数を用いて予測値を補正することが可能である。例えば、入力値を補正パラメータによってべき乗する関数は、これらの条件を満たす関数である。 That is, the correction unit 12 is a monotonically non-decreasing function (monotonically increasing function in a broad sense) that converts a value between 0 and 1 as an input value (predicted value) into an output value (corrected predicted value) between 0 and 1. , the monotonically non-decreasing function (broadly defined monotonically increasing function) is a function determined by the correction parameter, and when the input value (predicted value) is fixed, the change in the output value (corrected predicted value) due to the correction parameter is also monotonous Any function that is non-decreasing or monotonically non-increasing can be used to correct the predicted value. For example, a function that exponentiates an input value by a correction parameter is a function that satisfies these conditions.

(変形例2)
実施形態1では、補正パラメータ取得処理(図2)において、差分絶対値の最大値MDが基準値SD以下にならなかったら、カウンタ変数CTが最大検索回数LIMIT内以上になった時の補正パラメータを最終的な補正パラメータとしている。しかし、これに限られない。例えば、ステップS107とステップS108の間で、差分絶対値の最大値MDの値がそれまでで最も小さくなった時の補正パラメータを保存しておき、ステップS109でカウンタ変数CTが最大検索回数LIMIT以上になった場合には、ステップS114でその保存した補正パラメータを最終的な補正パラメータとして確定させるようにしてもよい。このようにすることで、差分絶対値の最大値MDの値が振動したり発散したりしてしまうような場合でも、補正部12は、混同行列の対称性が最も高くなった時の補正パラメータを取得することができる。
(Modification 2)
In the first embodiment, in the correction parameter acquisition process (FIG. 2), if the maximum value MD of the absolute difference value does not become equal to or less than the reference value SD, the correction parameter when the counter variable CT becomes equal to or greater than the maximum number of searches LIMIT is set to It is used as the final correction parameter. However, it is not limited to this. For example, between steps S107 and S108, the correction parameter for when the maximum value MD of the difference absolute value is the smallest is stored, and in step S109, the counter variable CT is set to the maximum number of searches LIMIT or more. If so, the stored correction parameters may be determined as the final correction parameters in step S114. By doing so, even if the value of the maximum value MD of the difference absolute value oscillates or diverges, the correction unit 12 uses the correction parameter when the symmetry of the confusion matrix becomes highest can be obtained.

(変形例3)
実施形態1では、補正パラメータ取得処理(図2)において、各クラスの識別正解率の高低によらずに、混同行列の対称性のみを高くする処理を行っているが、識別正解率の高さを考慮してもよい。例えば、ステップS105で混同行列を正規化した時に、平均正解率(上述したように、正解がクラス「X」である試験データのうち、識別結果(予測クラス)が「X」になったものの割合を全てのクラスについて平均した値であり、図6、図8及び図10の2番目の混同行列の表の右下の数値)も求めておき、この値がそれまでで最大となる時の補正パラメータを保存する。そして、ステップS109でカウンタ変数CTが最大検索回数LIMIT以上になった場合には、ステップS114でその保存した補正パラメータを最終的な補正パラメータとして確定させるようにしてもよい。このようにすることで、差分絶対値の最大値MDの値が振動したり発散したりしてしまうような場合でも、補正部12は、平均正解率が最も高くなった時の補正パラメータを取得することができる。
(Modification 3)
In the first embodiment, in the correction parameter acquisition process (FIG. 2), processing is performed to increase only the symmetry of the confusion matrix regardless of the level of the correct identification rate of each class. may be considered. For example, when the confusion matrix is normalized in step S105, the average correct answer rate (as described above, the percentage of test data whose correct answer is class "X", the identification result (predicted class) is "X" is the average value for all classes, and the lower right numerical value of the second confusion matrix table in FIGS. Save parameters. Then, when the counter variable CT reaches or exceeds the maximum search count LIMIT in step S109, the stored correction parameter may be determined as the final correction parameter in step S114. By doing so, even if the value of the maximum value MD of the difference absolute value oscillates or diverges, the correction unit 12 acquires the correction parameter when the average accuracy rate is the highest. can do.

(変形例4)
識別器11に与えられる入力データ(学習データ及び試験データ)によっては、補正パラメータ取得処理(図2)において、混同行列の対称性の高さと平均正解率の高さとがトレードオフの関係になることがある。そのため、補正パラメータ取得処理(図2)において、補正パラメータを1つに決定してしまうのではなく、ステップS114において、補正パラメータの候補をいくつかユーザに提示して、ユーザに補正パラメータを選択してもらってもよい。
(Modification 4)
Depending on the input data (learning data and test data) given to the discriminator 11, in the correction parameter acquisition process (FIG. 2), there is a trade-off relationship between the high symmetry of the confusion matrix and the high average accuracy rate. There is Therefore, in the correction parameter acquisition process (FIG. 2), instead of deciding on one correction parameter, several correction parameter candidates are presented to the user in step S114, and the user selects the correction parameter. You can have it.

そのような処理を行うために、制御部10は、混同行列の対称性が高い(差分絶対値の最大値MDの値が差分基準値(例えば0.1)以下である)時の補正パラメータや、平均正解率が高い(平均正解率が正解率基準値(例えば90%)以上である)時の補正パラメータを、補正パラメータの候補として記憶部20に保存しておき、ステップS114では、これら保存した補正パラメータを用いて作成した混同行列及び平均正解率を、出力部32を介してユーザに提示する。そして、制御部10は、ユーザから操作入力部34を介して補正パラメータを選択してもらい、ユーザが選択した補正パラメータを、補正部12が取得するようにする。 In order to perform such processing, the control unit 10 has a correction parameter when the confusion matrix has high symmetry (the maximum value MD of the difference absolute value is equal to or less than the difference reference value (for example, 0.1)), , the correction parameters when the average accuracy rate is high (the average accuracy rate is equal to or higher than the accuracy rate reference value (for example, 90%)) are stored in the storage unit 20 as correction parameter candidates. The confusion matrix and average accuracy rate created using the corrected parameters are presented to the user via the output unit 32 . Then, the control unit 10 causes the user to select a correction parameter via the operation input unit 34, and causes the correction unit 12 to acquire the correction parameter selected by the user.

混同行列の対称性の高さと平均正解率の高さとがトレードオフの関係になる場合であっても、変形例4に係る識別装置100では、ユーザに補正パラメータの候補の中から採用する補正パラメータを選択してもらうことにより、妥当な補正パラメータを用いて識別を行うことができる。 Even if there is a trade-off relationship between the high symmetry of the confusion matrix and the high average accuracy rate, the identification device 100 according to Modification 4 allows the user to select the correction parameter to be adopted from among the correction parameter candidates. is selected, identification can be performed using appropriate correction parameters.

なお、上述の実施形態及び変形例では、学習データと試験データは別のデータであるものとして説明したが、学習データの全部又は一部を試験データとして用いて上述の識別器学習処理(図3)及び補正パラメータ取得処理(図2)を行ってもよい。 In the above-described embodiment and modified example, the learning data and the test data are described as different data. ) and correction parameter acquisition processing (FIG. 2) may be performed.

なお、上述の実施形態及び変形例では、識別器11を実現するプログラムを制御部10が実行することにより、制御部10は識別器11としても機能することとしていたが、これに限られない。識別装置100は、制御部10とは別に(例えば、GPU(Graphics Processing Unit)や、専用のIC(Integrated Circuit)等の)識別器11の機能を実現するデバイスを備えてもよい。 In the above-described embodiment and modification, the control unit 10 executes the program that implements the discriminator 11 so that the control unit 10 also functions as the discriminator 11. However, the present invention is not limited to this. The identification device 100 may include a device (for example, a GPU (Graphics Processing Unit), a dedicated IC (Integrated Circuit), etc.) that realizes the function of the identification device 11 , separately from the control unit 10 .

また、上述の実施形態及び変形例は適宜組み合わせることができる。例えば、変形例2と変形例3とを組み合わせ、混同行列の対称性を平均正解率よりも重要視する処理とする場合には、ステップS109でカウンタ変数CTが最大検索回数LIMIT以上になった時に、ステップS114で、差分絶対値の最大値MDの値がそれまでで最も小さくなった時の補正パラメータを識別処理で用いる補正パラメータとして確定させるが、そのような補正パラメータが複数ある場合(複数の補正パラメータにおいて、差分絶対値の最大値MDの値が最小になる場合)には、それぞれの補正パラメータにおける平均正解率を比較し、平均正解率が最も高くなる補正パラメータを識別処理で用いる補正パラメータとして確定させる処理にすればよい。 Also, the above-described embodiments and modifications can be combined as appropriate. For example, in the case of combining Modification 2 and Modification 3 to make the symmetry of the confusion matrix more important than the average correct answer rate, when the counter variable CT becomes equal to or greater than the maximum number of searches LIMIT in step S109, , in step S114, the correction parameter at which the value of the maximum value MD of the absolute difference is the smallest is established as the correction parameter to be used in the identification process. When the maximum value MD of the difference absolute value is the minimum in the correction parameters), the average accuracy rate for each correction parameter is compared, and the correction parameter with the highest average accuracy rate is used in the identification process. It is sufficient to perform processing to determine as .

なお、識別装置100の各機能は、通常のPC(Personal Computer)等のコンピュータによっても実施することができる。具体的には、上記実施形態では、識別装置100が行う識別処理のプログラムが、記憶部20のROMに予め記憶されているものとして説明した。しかし、プログラムを、フレキシブルディスク、CD-ROM(Compact Disc Read Only Memory)、DVD(Digital Versatile Disc)、MO(Magneto-Optical Disc)、メモリカード、USB(Universal Serial Bus)メモリ等のコンピュータ読み取り可能な記録媒体に格納して配布し、そのプログラムをコンピュータに読み込んでインストールすることにより、上述の各機能を実現することができるコンピュータを構成してもよい。 Each function of the identification device 100 can also be performed by a computer such as a normal PC (Personal Computer). Specifically, in the above embodiment, the identification processing program performed by the identification device 100 is pre-stored in the ROM of the storage unit 20 . However, the program may be stored in a computer-readable storage medium such as a flexible disk, CD-ROM (Compact Disc Read Only Memory), DVD (Digital Versatile Disc), MO (Magneto-Optical Disc), memory card, USB (Universal Serial Bus) memory, etc. By storing and distributing the program in a recording medium, and reading and installing the program in the computer, a computer capable of realizing each of the functions described above may be configured.

以上、本発明の好ましい実施形態について説明したが、本発明は係る特定の実施形態に限定されるものではなく、本発明には、特許請求の範囲に記載された発明とその均等の範囲が含まれる。以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。 Although the preferred embodiments of the present invention have been described above, the present invention is not limited to such specific embodiments, and the present invention includes the invention described in the claims and their equivalents. be The invention described in the original claims of the present application is appended below.

(付記1)
入力データの属するクラスを識別する各クラスの予測値を出力する識別器と、
前記識別器の出力する各クラスの予測値をクラス毎の補正パラメータを用いて補正した補正予測値で識別したクラスに基づいて作成した混同行列の対称性を高める前記補正パラメータを取得する補正部と、
前記識別器の出力する予測値を、前記補正部が取得した補正パラメータを用いて補正して、最終的な識別結果を取得する結果取得部と、
を備える識別装置。
(Appendix 1)
a classifier that identifies the class to which the input data belongs and outputs a predicted value for each class;
a correction unit that acquires the correction parameter that enhances the symmetry of the confusion matrix created based on the class identified by the corrected predicted value obtained by correcting the predicted value of each class output from the classifier using the correction parameter for each class; ,
a result acquisition unit that acquires a final identification result by correcting the predicted value output by the discriminator using the correction parameter acquired by the correction unit;
identification device.

(付記2)
前記補正部は、前記混同行列の各クラスの正解データ数が1になるように前記混同行列を正規化した時の、前記正規化後の混同行列の各クラスの予測率合計が、できるだけ1に近づく前記補正パラメータを取得する、
付記1に記載の識別装置。
(Appendix 2)
The correcting unit reduces the total prediction rate of each class of the confusion matrix after normalization to 1 as much as possible when the confusion matrix is normalized so that the number of correct data in each class of the confusion matrix is 1. obtaining the correction parameters that approach;
The identification device according to appendix 1.

(付記3)
前記補正部は、
前記補正パラメータによって定まる単調非減少関数であって、0以上1以下の入力値を0以上1以下の出力値に変換する前記単調非減少関数を用いて前記識別器の出力する予測値を補正して補正予測値を取得し、
前記補正予測値で識別したクラスに基づいて前記混同行列を作成し、
前記作成した前記混同行列の各クラスの正解データ数が1になるように前記混同行列を正規化した時の、前記正規化後の混同行列の各クラスの予測率合計が、できるだけ1に近づく前記補正パラメータを取得する、
付記2に記載の識別装置。
(Appendix 3)
The correction unit is
correcting the predicted value output from the discriminator using the monotonically non-decreasing function determined by the correction parameter, which converts an input value of 0 or more and 1 or less to an output value of 0 or more and 1 or less; to get the corrected predictions, and
creating the confusion matrix based on the classes identified by the corrected predicted values;
When the confusion matrix is normalized so that the number of correct data in each class of the created confusion matrix is 1, the total prediction rate of each class of the confusion matrix after normalization approaches 1 as much as possible get the correction parameters,
The identification device according to appendix 2.

(付記4)
前記単調非減少関数は、前記識別器の出力する予測値を、前記補正パラメータでべき乗する演算を行う関数である、
付記3に記載の識別装置。
(Appendix 4)
The monotone non-decreasing function is a function that performs an operation of exponentiating the predicted value output by the discriminator by the correction parameter,
The identification device according to appendix 3.

(付記5)
前記補正部は、前記各クラスの正解率を平均した平均正解率を取得し、前記混同行列の対称性を高める前記補正パラメータの中で、前記平均正解率が最大となる前記補正パラメータを取得する、
付記1から4のいずれか1つに記載の識別装置。
(Appendix 5)
The correction unit acquires an average accuracy rate by averaging the accuracy rate of each class, and acquires the correction parameter that maximizes the average accuracy rate among the correction parameters that increase the symmetry of the confusion matrix. ,
5. Identification device according to any one of appendices 1 to 4.

(付記6)
識別器の出力する各クラスの予測値をクラス毎の補正パラメータを用いて補正した補正予測値で識別したクラスに基づいて作成した混同行列の対称性を高める前記補正パラメータを取得する補正パラメータ取得ステップと、
前記識別器の出力する予測値を、前記補正パラメータ取得ステップで取得した補正パラメータを用いて補正して、最終的な識別結果を取得する結果取得ステップと、
を含む識別方法。
(Appendix 6)
A correction parameter acquisition step of acquiring the correction parameter that enhances the symmetry of the confusion matrix created based on the class identified by the corrected predicted value obtained by correcting the predicted value of each class output by the discriminator using the correction parameter for each class and,
a result obtaining step of obtaining a final identification result by correcting the predicted value output by the discriminator using the correction parameter obtained in the correction parameter obtaining step;
identification methods, including

(付記7)
識別器を備える識別装置のコンピュータに、
前記識別器の出力する各クラスの予測値をクラス毎の補正パラメータを用いて補正した補正予測値で識別したクラスに基づいて作成した混同行列の対称性を高める前記補正パラメータを取得する補正パラメータ取得ステップ、及び、
前記識別器の出力する予測値を、前記補正パラメータ取得ステップで取得した補正パラメータを用いて補正して、最終的な識別結果を取得する結果取得ステップ、
を実行させるためのプログラム。
(Appendix 7)
In the computer of the identification device equipped with the identifier,
Acquisition of correction parameter for enhancing symmetry of a confusion matrix created based on the class identified by the corrected predicted value obtained by correcting the predicted value of each class output from the classifier using a correction parameter for each class step, and
A result obtaining step of obtaining a final identification result by correcting the predicted value output by the classifier using the correction parameter obtained in the correction parameter obtaining step;
program to run the

10…制御部、11…識別器、12…補正部、13…結果取得部、20…記憶部、31…データ入力部、32…出力部、33…通信部、34…操作入力部、100…識別装置 DESCRIPTION OF SYMBOLS 10... Control part 11... Discriminator 12... Correction part 13... Result acquisition part 20... Storage part 31... Data input part 32... Output part 33... Communication part 34... Operation input part 100... identification device

Claims (7)

入力される未知データの属する複数のクラスの各々を識別する各クラスの予測値を出力する識別器と、
前記識別器が出力する各クラスの予測値を、各クラスの補正パラメータを用いて補正する補正部と、
前記補正部によって補正された予測値で識別したクラスに基づいて混同行列を作成する作成部と、
前記作成部によって作成された混同行列において前記識別器の各正解ラベルに対する各クラスのサンプル数の合計値の偏りが前記複数のクラスの間でより小さくなるように前記補正パラメータを修正する修正部と、
前記識別器の出力する予測値を、前記修正部によって修正された補正パラメータを用いて補正して、最終的な識別結果を取得する結果取得部と、
を備えることを特徴とする識別装置。
a discriminator that outputs a predicted value for each class that discriminates each of a plurality of classes to which unknown data to be input belongs;
a correction unit that corrects the predicted value of each class output by the discriminator using a correction parameter of each class;
A creation unit that creates a confusion matrix based on the class identified by the predicted value corrected by the correction unit;
a modifying unit that modifies the correction parameter so that the deviation of the total number of samples of each class for each correct label of the classifier in the confusion matrix generated by the generating unit is smaller among the plurality of classes; ,
a result acquisition unit that acquires a final identification result by correcting the predicted value output by the classifier using the correction parameter corrected by the correction unit;
An identification device comprising:
前記修正部は、前記混同行列の各クラスの正解データ数が1になるように前記混同行列を正規化した時の、前記正規化後の混同行列の各クラスの予測率合計が、できるだけ1に近づくように前記補正パラメータを修正することを特徴とする、
請求項1に記載の識別装置。
The correction unit reduces the total prediction rate of each class of the confusion matrix after normalization to 1 as much as possible when the confusion matrix is normalized so that the number of correct data in each class of the confusion matrix is 1. characterized by modifying the correction parameters to approximate
2. Identification device according to claim 1.
前記補正部は、
前記補正パラメータによって定まる単調非減少関数であって、0以上1以下の入力値を0以上1以下の出力値に変換する前記単調非減少関数を用いて前記識別器の出力する予測値を補正し、
前記修正部は、
前記作成部によって作成された前記混同行列の各クラスの正解データ数が1になるように前記混同行列を正規化した時の、前記正規化後の混同行列の各クラスの予測率合計が、できるだけ1に近づくように前記補正パラメータを修正することを特徴とする、
請求項2に記載の識別装置。
The correction unit is
correcting the predicted value output from the discriminator using the monotonically non-decreasing function determined by the correction parameter, which converts an input value of 0 or more and 1 or less to an output value of 0 or more and 1 or less; ,
The correction unit
When the confusion matrix created by the creation unit is normalized so that the number of correct data in each class of the confusion matrix is 1, the total prediction rate of each class of the confusion matrix after normalization is as much as possible characterized by modifying the correction parameter to approach 1,
3. Identification device according to claim 2.
前記単調非減少関数は、前記識別器の出力する予測値を、前記補正パラメータでべき乗する演算を行う関数であることを特徴とする、
請求項3に記載の識別装置。
The monotone non-decreasing function is a function that performs an operation to raise the predicted value output by the classifier to the power of the correction parameter,
4. Identification device according to claim 3.
前記補正部は、前記各クラスの正解率を平均した平均正解率を取得し、前記混同行列において前記識別器の各正解ラベルに対する各クラスのサンプル数の合計値の偏りを前記複数のクラスの間でより小さくする前記補正パラメータの中で、前記平均正解率が最大となる前記補正パラメータを取得することを特徴とする、
請求項1から4のいずれか1項に記載の識別装置。
The correcting unit obtains an average accuracy rate by averaging the accuracy rate of each class , and adjusts the bias of the total number of samples of each class for each correct label of the classifier in the confusion matrix between the plurality of classes. Obtaining the correction parameter that maximizes the average accuracy rate among the correction parameters to be made smaller by
Identification device according to any one of claims 1 to 4.
入力される未知データの属する複数のクラスの各々を識別する各クラスの予測値を出力する識別器が出力する各クラスの予測値を、各クラスの補正パラメータを用いて補正する補正ステップと、
前記補正ステップにて補正された予測値で識別したクラスに基づいて混同行列を作成する作成ステップと、
前記作成ステップにて作成された混同行列において前記識別器の各正解ラベルに対する各クラスのサンプル数の合計値の偏りが前記複数のクラスの間でより小さくなるように前記補正パラメータを修正する修正ステップと、
前記識別器の出力する予測値を、前記修正ステップによって修正された補正パラメータを用いて補正して、最終的な識別結果を取得する結果取得ステップと、
を含むことを特徴とする識別方法。
a correction step of correcting the predicted value of each class output by a discriminator that outputs a predicted value of each class for identifying each of a plurality of classes to which unknown data to be input belongs, using a correction parameter of each class;
A creation step of creating a confusion matrix based on the classes identified by the predicted values corrected in the correction step;
A correction step of correcting the correction parameter so that the deviation of the total number of samples of each class for each correct label of the classifier in the confusion matrix created in the creation step is smaller among the plurality of classes. and,
a result obtaining step of obtaining a final identification result by correcting the predicted value output by the discriminator using the correction parameter corrected in the correcting step;
A method of identification comprising:
入力される未知データの属する複数のクラスの各々を識別する各クラスの予測値を出力する識別器を備える識別装置のコンピュータを、
前記識別器が出力する各クラスの予測値を、各クラスの補正パラメータを用いて補正する補正手段、
前記補正手段によって補正された予測値で識別したクラスに基づいて混同行列を作成する作成手段、
前記作成手段によって作成された混同行列において前記識別器の各正解ラベルに対する各クラスのサンプル数の合計値の偏りが前記複数のクラスの間でより小さくなるように前記補正パラメータを修正する修正手段、
前記識別器の出力する予測値を、前記修正手段によって修正された補正パラメータを用いて補正して、最終的な識別結果を取得する結果取得手段、
として機能させるためのプログラム。
A computer of an identification device equipped with a classifier that outputs a predicted value for each class that identifies each of a plurality of classes to which unknown data that is input belongs,
correction means for correcting the predicted value of each class output by the discriminator using a correction parameter of each class;
creating means for creating a confusion matrix based on the classes identified by the predicted values corrected by the correcting means;
Correction means for correcting the correction parameter so that the deviation of the total number of samples of each class for each correct label of the classifier in the confusion matrix created by the creation means is smaller among the plurality of classes;
result acquisition means for acquiring a final identification result by correcting the predicted value output by the classifier using the correction parameter corrected by the correction means;
A program to function as
JP2018239067A 2018-12-21 2018-12-21 IDENTIFICATION DEVICE, IDENTIFICATION METHOD AND PROGRAM Active JP7268347B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018239067A JP7268347B2 (en) 2018-12-21 2018-12-21 IDENTIFICATION DEVICE, IDENTIFICATION METHOD AND PROGRAM

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018239067A JP7268347B2 (en) 2018-12-21 2018-12-21 IDENTIFICATION DEVICE, IDENTIFICATION METHOD AND PROGRAM

Publications (2)

Publication Number Publication Date
JP2020101958A JP2020101958A (en) 2020-07-02
JP7268347B2 true JP7268347B2 (en) 2023-05-08

Family

ID=71139597

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018239067A Active JP7268347B2 (en) 2018-12-21 2018-12-21 IDENTIFICATION DEVICE, IDENTIFICATION METHOD AND PROGRAM

Country Status (1)

Country Link
JP (1) JP7268347B2 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011155123A1 (en) 2010-06-07 2011-12-15 株式会社 日立ハイテクノロジーズ Observation image classification reference optimization method and image classification device
JP2016091166A (en) 2014-10-31 2016-05-23 カシオ計算機株式会社 Machine learning apparatus, machine learning method, classification apparatus, classification method, and program
JP2018045673A (en) 2016-09-09 2018-03-22 株式会社Screenホールディングス Sorter construction method, image sorting method, sorter construction device and image sorting device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011155123A1 (en) 2010-06-07 2011-12-15 株式会社 日立ハイテクノロジーズ Observation image classification reference optimization method and image classification device
JP2016091166A (en) 2014-10-31 2016-05-23 カシオ計算機株式会社 Machine learning apparatus, machine learning method, classification apparatus, classification method, and program
JP2018045673A (en) 2016-09-09 2018-03-22 株式会社Screenホールディングス Sorter construction method, image sorting method, sorter construction device and image sorting device

Also Published As

Publication number Publication date
JP2020101958A (en) 2020-07-02

Similar Documents

Publication Publication Date Title
US11023806B2 (en) Learning apparatus, identifying apparatus, learning and identifying system, and recording medium
Van Den Burg et al. GenSVM: A generalized multiclass support vector machine
US9002101B2 (en) Recognition device, recognition method, and computer program product
JP6897749B2 (en) Learning methods, learning systems, and learning programs
US20150254496A1 (en) Discriminant function specifying device, discriminant function specifying method, and biometric identification device
JP5123759B2 (en) Pattern detector learning apparatus, learning method, and program
JP2006277413A (en) Document classification device and document classification method
CN108133224B (en) Method for evaluating complexity of classification task
JP5821590B2 (en) Image identification information addition program and image identification information addition device
JP2018092615A (en) Determination device and determination method for convolutional neural network model
JP6365032B2 (en) Data classification method, data classification program, and data classification apparatus
JP6468364B2 (en) Information processing apparatus, information processing method, and program
JP5311899B2 (en) Pattern detector learning apparatus, learning method, and program
US20200320409A1 (en) Model creation supporting method and model creation supporting system
CN110489131B (en) Gray level user selection method and device
JP7268347B2 (en) IDENTIFICATION DEVICE, IDENTIFICATION METHOD AND PROGRAM
US20230385690A1 (en) Computer-readable recording medium storing determination program, determination apparatus, and method of determining
JP7350587B2 (en) Active learning devices, active learning methods and programs
JP2015001968A (en) Machine learning device, machine learning method and program
JP6233432B2 (en) Method and apparatus for selecting mixed model
JP2016207136A (en) Model estimation system, model estimation method, and model estimation program
WO2022162839A1 (en) Learning device, learning method, and recording medium
JP2016197371A (en) Classifier generation apparatus, classifier generation method, estimation device, estimation method, and program
JP7348945B2 (en) Information processing method and information processing system
JP2018163586A (en) Learning program, learning method and learning device

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211210

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211210

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221017

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230322

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230404

R150 Certificate of patent or registration of utility model

Ref document number: 7268347

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150