JP2020154513A - Apparatus, method and program for determination - Google Patents

Apparatus, method and program for determination Download PDF

Info

Publication number
JP2020154513A
JP2020154513A JP2019050865A JP2019050865A JP2020154513A JP 2020154513 A JP2020154513 A JP 2020154513A JP 2019050865 A JP2019050865 A JP 2019050865A JP 2019050865 A JP2019050865 A JP 2019050865A JP 2020154513 A JP2020154513 A JP 2020154513A
Authority
JP
Japan
Prior art keywords
classes
classifiers
data
input data
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019050865A
Other languages
Japanese (ja)
Inventor
一冠 三上
Ikkan Mikami
一冠 三上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nexty System Design Corp
Original Assignee
Nexty System Design Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nexty System Design Corp filed Critical Nexty System Design Corp
Priority to JP2019050865A priority Critical patent/JP2020154513A/en
Publication of JP2020154513A publication Critical patent/JP2020154513A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

To provide an apparatus, method and program for determination that allows for determining to which class data belongs more accurately without having knowledge of the data.SOLUTION: An apparatus for determination 10 comprises a plurality of classifiers 11 that respectively output values for classifying input data into two or more classes out of a plurality of classes, a voting section 12 that compares a plurality of output values of the plurality of classifiers respectively with thresholds and, on each of the plurality of classifiers, casts votes to any one of two or more classes or votes to all of the two or more classes or no votes to any of the two or more classes, and a determining section 14 that determines to which one of the plurality of classes the input data is classified based on the number of votes to the plurality of classes.SELECTED DRAWING: Figure 1

Description

本発明は、判定装置、判定方法及び判定プログラムに関する。 The present invention relates to a determination device, a determination method, and a determination program.

従来、入力データを2以上のクラスに分類する分類器が用いられている。分類器として、例えば、決定木やロジスティック回帰、サポートベクターマシン等が知られている。 Conventionally, a classifier that classifies input data into two or more classes has been used. As a classifier, for example, a decision tree, logistic regression, a support vector machine, and the like are known.

下記非特許文献1は、サポートベクターマシンの解説記事である。 The following Non-Patent Document 1 is a commentary article on a support vector machine.

栗田 多喜夫、″サポートベクターマシン入門″、[online]、[平成31年3月1日検索]、インターネット(https://home.hiroshima-u.ac.jp/tkurita/lecture/svm.pdf)Takio Kurita, "Introduction to Support Vector Machines", [online], [Search on March 1, 2019], Internet (https://home.hiroshima-u.ac.jp/tkurita/lecture/svm.pdf)

分類器は、単体で用いた場合、共通の特徴を有するデータの分類が困難な場合がある。そのため、複数の分類器を階層的に用いてデータの分類を行うことがあるが、階層毎に適切な分類器を設定する必要があり、データに関する知見を有しなければ適切な分類器を設定することが困難な場合がある。 When the classifier is used alone, it may be difficult to classify data having common characteristics. Therefore, data may be classified using multiple classifiers hierarchically, but it is necessary to set an appropriate classifier for each layer, and if you do not have knowledge about the data, set an appropriate classifier. It can be difficult to do.

そこで、本発明は、データに関する知見を有しなくても、データがいずれのクラスに属するかをより精度良く判定することのできる判定装置、判定方法及び判定プログラムを提供する。 Therefore, the present invention provides a determination device, a determination method, and a determination program capable of more accurately determining which class the data belongs to without having knowledge about the data.

本発明の一態様に係る判定装置は、入力データを複数のクラスのうちの2以上のクラスに分類する値をそれぞれ出力する複数の分類器と、複数の分類器の複数の出力値をそれぞれ閾値と比較して、複数の分類器ごとに、2以上のクラスのうちいずれか1つに投票又は2以上のクラス全てに投票若しくは2以上のクラスいずれにも投票しない投票部と、複数のクラスごとの得票数に基づいて、入力データが複数のクラスのうちいずれに分類されるか判定する判定部と、を備える。 The determination device according to one aspect of the present invention has a plurality of classifiers that output values for classifying input data into two or more classes among a plurality of classes, and a plurality of output values of the plurality of classifiers as threshold values. In comparison with multiple classifiers, a voting department that votes for any one of two or more classes, votes for all two or more classes, or does not vote for any of two or more classes, and for each of multiple classes It is provided with a determination unit for determining which of a plurality of classes the input data is classified based on the number of votes obtained.

この態様によれば、入力データが2以上のクラスのうちいずれか1つに属すると確定できない場合に、2以上のクラス全てに投票若しくは2以上のクラスいずれにも投票しないことで、誤分類を防止して、入力データがいずれのクラスに属するかをより精度良く判定することができる。 According to this aspect, if it cannot be determined that the input data belongs to any one of the two or more classes, the misclassification is made by voting for all the two or more classes or not voting for either of the two or more classes. By preventing this, it is possible to more accurately determine which class the input data belongs to.

上記態様において、入力データは、時系列データであり、複数の分類器は、時系列データの複数の時点における値をそれぞれ2以上のクラスに分類する複数の出力値を出力してもよい。 In the above aspect, the input data is time series data, and the plurality of classifiers may output a plurality of output values for classifying the values of the time series data at a plurality of time points into two or more classes.

この態様によれば、時系列データの複数の時点における値に関する分類器の出力値を用いて投票を行い、時系列データが2以上のクラスのうちいずれに分類されるか判定することができる。 According to this aspect, voting can be performed using the output values of the classifier regarding the values of the time series data at a plurality of time points, and it can be determined which of the two or more classes the time series data is classified into.

上記態様において、投票部は、得票数が上位所定割合であるクラスが2以上ある場合に、当該2以上のクラスに対応する出力値を出力した分類器を抽出し、抽出した分類器それぞれの出力値を閾値と比較して、2以上のクラスのうちいずれか1つに再投票又は2以上のクラス全てに再投票若しくは2以上のクラスいずれにも再投票せず、判定部は、再投票された複数のクラスごとの得票数に基づいて、入力データが複数のクラスのうちいずれに分類されるか判定してもよい。 In the above aspect, when there are two or more classes in which the number of votes obtained is a high-ranking predetermined ratio, the voting unit extracts a classifier that outputs an output value corresponding to the two or more classes, and outputs each of the extracted classifiers. The value is compared to the threshold and the verdict is revoted without revoting any one of the two or more classes, revoting all of the two or more classes, or revoting any of the two or more classes. Based on the number of votes obtained for each of the plurality of classes, it may be determined which of the plurality of classes the input data is classified into.

この態様によれば、得票数が上位所定割合であるクラスが2以上あり、入力データが当該クラスのうちいずれに分類されるか確定できない場合に、当該クラスに対応する出力値を出力した分類器によって再投票を行い、入力データがいずれのクラスに属するかをより精度良く判定することができる。 According to this aspect, when there are two or more classes in which the number of votes obtained is a high-ranking predetermined ratio and it is not possible to determine which of the classes the input data is classified into, the classifier that outputs the output value corresponding to the class. It is possible to re-vote by and more accurately determine which class the input data belongs to.

上記態様において、複数の分類器は、2以上のクラスそれぞれについて1の代表データを含む学習データを用いて学習された複数のサポートベクターマシンを含んでもよい。 In the above embodiment, the plurality of classifiers may include a plurality of support vector machines trained using training data including one representative data for each of two or more classes.

この態様によれば、各クラスについて少なくとも1つの学習データを用意することで、複数の分類器を構築することができる。 According to this aspect, a plurality of classifiers can be constructed by preparing at least one learning data for each class.

上記態様において、閾値は、複数の分類器毎に設定されていてもよい。 In the above aspect, the threshold value may be set for each of a plurality of classifiers.

この態様によれば、複数の分類器により用いられる特徴空間に適した閾値を設定することができ、入力データがいずれのクラスに属するかをより精度良く判定することができる。 According to this aspect, it is possible to set a threshold value suitable for the feature space used by a plurality of classifiers, and it is possible to more accurately determine which class the input data belongs to.

上記態様において、閾値は、学習データを用いて複数の分類器の学習処理を行う場合に、複数の分類器が誤分類した学習データに関する出力値に基づいて設定されていてもよい。 In the above aspect, the threshold value may be set based on the output value of the learning data misclassified by the plurality of classifiers when the learning process of the plurality of classifiers is performed using the learning data.

この態様によれば、複数の分類器が誤分類し得るデータを、2以上のクラスのうちいずれか1つに属すると確定できないデータとして扱うことができ、入力データがいずれのクラスに属するかをより精度良く判定することができる。 According to this aspect, data that can be misclassified by a plurality of classifiers can be treated as data that cannot be determined if it belongs to any one of two or more classes, and which class the input data belongs to can be determined. The judgment can be made more accurately.

本発明の他の態様に係る判定方法は、判定装置に、複数の分類器によって、入力データを複数のクラスのうちの2以上のクラスに分類する値をそれぞれ出力することと、複数の分類器の複数の出力値をそれぞれ閾値と比較して、複数の分類器ごとに、2以上のクラスのうちいずれか1つに投票又は2以上のクラス全てに投票若しくは2以上のクラスいずれにも投票しないことと、複数の分類器ごとの得票数に基づいて、入力データが複数のクラスのうちいずれに分類されるか判定することと、を実行させる判定方法。 The determination method according to another aspect of the present invention is to output to the determination device a value for classifying the input data into two or more classes out of a plurality of classes by a plurality of classifiers, and a plurality of classifiers. Compare multiple output values of each with the threshold, and vote for any one of two or more classes, vote for all two or more classes, or vote for none of two or more classes for each classifier. A determination method for executing the determination of which of a plurality of classes the input data is classified based on the number of votes obtained for each of a plurality of classifiers.

この態様によれば、入力データが2以上のクラスのうちいずれか1つに属すると確定できない場合に、2以上のクラス全てに投票若しくは2以上のクラスいずれにも投票しないことで、誤分類を防止して、入力データがいずれのクラスに属するかをより精度良く判定することができる。 According to this aspect, if it cannot be determined that the input data belongs to any one of the two or more classes, the misclassification is made by voting for all the two or more classes or not voting for either of the two or more classes. By preventing this, it is possible to more accurately determine which class the input data belongs to.

本発明の他の態様に係る判定プログラムは、判定装置に、複数の分類器によって、入力データを複数のクラスのうちの2以上のクラスに分類する値をそれぞれ出力することと、複数の分類器の複数の出力値をそれぞれ閾値と比較して、複数の分類器ごとに、2以上のクラスのうちいずれか1つに投票又は2以上のクラス全てに投票若しくは2以上のクラスいずれにも投票しないことと、複数のクラスごとの得票数に基づいて、入力データが複数のクラスのうちいずれに分類されるか判定することと、を実行させる判定プログラム。 The determination program according to another aspect of the present invention outputs to the determination device a value for classifying the input data into two or more classes out of a plurality of classes by a plurality of classifiers, and a plurality of classifiers. Compare multiple output values of each with the threshold, and for each of the multiple classifiers, vote for any one of the two or more classes, vote for all the two or more classes, or do not vote for any of the two or more classes. A determination program that executes the determination of which of the plurality of classes the input data is classified based on the number of votes obtained for each of the plurality of classes.

この態様によれば、入力データが2以上のクラスのうちいずれか1つに属すると確定できない場合に、2以上のクラス全てに投票若しくは2以上のクラスいずれにも投票しないことで、誤分類を防止して、入力データがいずれのクラスに属するかをより精度良く判定することができる。 According to this aspect, if it cannot be determined that the input data belongs to any one of the two or more classes, the misclassification is made by voting for all the two or more classes or not voting for either of the two or more classes. By preventing this, it is possible to more accurately determine which class the input data belongs to.

本発明によれば、データに関する知見を有しなくても、データがいずれのクラスに属するかをより精度良く判定することのできる判定装置、判定方法及び判定プログラムを提供することができる。 According to the present invention, it is possible to provide a determination device, a determination method, and a determination program capable of more accurately determining which class the data belongs to without having knowledge about the data.

本発明の実施形態に係る判定装置の機能ブロックを示す図である。It is a figure which shows the functional block of the determination apparatus which concerns on embodiment of this invention. 本実施形態に係る判定装置の物理的構成を示す図である。It is a figure which shows the physical structure of the determination apparatus which concerns on this embodiment. 本実施形態に係る学習装置により実行される閾値設定処理の概要を示す図である。It is a figure which shows the outline of the threshold value setting process executed by the learning apparatus which concerns on this embodiment. 本実施形態に係る学習装置により実行される学習処理及び閾値設定処理のフローチャートである。It is a flowchart of the learning process and the threshold value setting process executed by the learning apparatus which concerns on this embodiment. 本実施形態に係る判定装置により実行される投票処理のフローチャートである。It is a flowchart of the voting process executed by the determination apparatus which concerns on this embodiment. 本実施形態に係る判定装置により実行される判定処理のフローチャートである。It is a flowchart of the determination process executed by the determination apparatus which concerns on this embodiment.

添付図面を参照して、本発明の実施形態について説明する。なお、各図において、同一の符号を付したものは、同一又は同様の構成を有する。 Embodiments of the present invention will be described with reference to the accompanying drawings. In each figure, those having the same reference numerals have the same or similar configurations.

図1は、本発明の実施形態に係る判定装置10の機能ブロックを示す図である。判定装置10は、複数の分類器11と、投票部12と、スイッチ13と、判定部14と、分岐部15とを備える。 FIG. 1 is a diagram showing a functional block of the determination device 10 according to the embodiment of the present invention. The determination device 10 includes a plurality of classifiers 11, a voting unit 12, a switch 13, a determination unit 14, and a branch unit 15.

複数の分類器11は、入力データ(Data input)を複数のクラスのうち2以上のクラスに分類する値をそれぞれ出力する。本実施形態では、複数の分類器11は、2以上のクラスそれぞれについて1の代表データを含む学習データを用いて学習された複数のサポートベクターマシンを含む。本例では、入力データが第1クラスから第9クラスのいずれに属するか判定する場合、すなわち複数のクラスが第1クラスから第9クラスである場合について説明する。 The plurality of classifiers 11 output values for classifying input data (Data input) into two or more classes among the plurality of classes. In the present embodiment, the plurality of classifiers 11 include a plurality of support vector machines trained using training data including one representative data for each of two or more classes. In this example, a case where it is determined which of the first class to the ninth class the input data belongs to, that is, a case where a plurality of classes belong to the first class to the ninth class will be described.

本実施形態では、複数の分類器11は、入力データが第1クラス(Class1)に属するか、第2クラス(Class2)に属するか、そのいずれでもないか分類する第1サポートベクターマシン(SVM Classifier Class1 vs Class2)を含む。同様に、複数の分類器11は、入力データが第1クラス(Class1)に属するか、第3クラス(Class3)に属するか、そのいずれでもないか分類する第2サポートベクターマシン(SVM Classifier Class1 vs Class3)を含む。また、複数の分類器11は、入力データが第1クラス(Class1)に属するか、第4クラス(Class4)に属するか、そのいずれでもないか分類する第3サポートベクターマシン(SVM Classifier Class1 vs Class4)を含む。以降、同様に、複数の分類器11は、第4サポートベクターマシンから第35サポートベクターマシンを含み、最後に、複数の分類器11は、入力データが第8クラス(Class8)に属するか、第9クラス(Class9)に属するか、そのいずれでもないか分類する第36サポートベクターマシン(SVM Classifier Class8 vs Class8)を含む。 In the present embodiment, the plurality of classifiers 11 classify the input data according to whether the input data belongs to the first class (Class1), the second class (Class2), or neither of them, the first support vector machine (SVM Classifier). Includes Class1 vs Class2). Similarly, the plurality of classifiers 11 classify a second support vector machine (SVM Classifier Class1 vs.) that classifies whether the input data belongs to the first class (Class1), the third class (Class3), or neither. Includes Class3). Further, the plurality of classifiers 11 classify whether the input data belongs to the first class (Class1), the fourth class (Class4), or neither of them, and the third support vector machine (SVM Classifier Class1 vs Class4). )including. Hereinafter, similarly, the plurality of classifiers 11 include the 4th support vector machine to the 35th support vector machine, and finally, the plurality of classifiers 11 have the input data belonging to the 8th class (Class 8) or the first. Includes a 36th support vector machine (SVM Classifier Class8 vs Class8) that classifies whether it belongs to 9 classes (Class9) or not.

なお、本実施形態では、複数の分類器11それぞれによって、入力データがクラスAに属するかクラスBに属するかの分類を行う場合について説明するが、複数の分類器11は、入力データがあるクラスに属するか、それ以外のクラスに属するか分類するものであってもよい。 In this embodiment, a case where the input data belongs to the class A or the class B is classified by each of the plurality of classifiers 11, but the plurality of classifiers 11 are classes having the input data. It may be classified as belonging to or other classes.

複数の分類器11をサポートベクターマシンで構成することで、各クラスについて少なくとも1つの学習データを用意することで、複数の分類器を構築することができる。もっとも、複数の分類器11は、任意の2値分類器で構成されてよく、ロジスティック回帰、決定木又は回帰木を用いた分類器を含んでもよい。 By configuring the plurality of classifiers 11 with the support vector machine, it is possible to construct a plurality of classifiers by preparing at least one training data for each class. However, the plurality of classifiers 11 may be composed of any binary classifier, and may include a classifier using logistic regression, a decision tree, or a regression tree.

投票部12は、複数の分類器11の複数の出力値をそれぞれ閾値と比較して、複数の分類器11ごとに、2以上のクラスのうちいずれか1つに投票又は2以上のクラス全てに投票若しくは2以上のクラスいずれにも投票しない。具体的には、投票部12は、第1サポートベクターマシンの出力値f(x)を閾値Th1+(x)及びTh1-(x)と比較して、f(x)>Th1+(x)であれば第1クラス(Class1)に投票し、f(x)<Th1-(x)であれば第2クラス(Class2)に投票し、Th1+(x)≧f(x)≧Th1-(x)であれば第1クラス(Class1)及び第2クラス(Class2)に投票する。また、投票部12は、第2サポートベクターマシンの出力値f(x)を閾値Th2+(x)及びTh2-(x)と比較して、f(x)>Th2+(x)であれば第1クラス(Class1)に投票し、f(x)<Th2-(x)であれば第3クラス(Class3)に投票し、Th2+(x)≧f(x)≧Th2-(x)であれば第1クラス(Class1)及び第3クラス(Class3)に投票する。同様に、投票部12は、第3サポートベクターマシンの出力値f(x)を閾値Th3+(x)及びTh3-(x)と比較して、f(x)>Th3+(x)であれば第1クラス(Class1)に投票し、f(x)<Th3-(x)であれば第4クラス(Class4)に投票し、Th3+(x)≧f(x)≧Th3-(x)であれば第1クラス(Class1)及び第4クラス(Class4)に投票する。さらに、投票部12は、第36サポートベクターマシンの出力値f(x)を閾値Th36+(x)及びTh36-(x)と比較して、f(x)>Th36+(x)であれば第8クラス(Class8)に投票し、f(x)<Th36-(x)であれば第9クラス(Class9)に投票し、Th36+(x)≧f(x)≧Th36-(x)であれば第8クラス(Class8)及び第9クラス(Class9)に投票する。 The voting unit 12 compares the plurality of output values of the plurality of classifiers 11 with the threshold values, and votes for any one of the two or more classes or all of the two or more classes for each of the plurality of classifiers 11. Do not vote or vote for more than one class. Specifically, voting section 12, the output value f of the first support vector machine (x) a threshold Th1 + (x) and Th1 - compared to (x), f (x)> Th1 + (x) vote for the first class (Class1) if, f (x) <Th1 - voted for the second class if (x) (Class2), Th1 + (x) ≧ f (x) ≧ Th1 - ( If x), vote for the first class (Class1) and the second class (Class2). Also, voting section 12, the output value f of the second support vector machine (x) a threshold Th2 + (x) and Th2 - compared to (x), if f (x)> Th2 + (x) vote for the first class (Class1), f (x) <Th2 - in (x) - if (x) and vote on the third class (Class3), Th2 + (x ) ≧ f (x) ≧ Th2 If so, vote for the first class (Class1) and the third class (Class3). Similarly, voting section 12, the output value f of the third support vector machine (x) threshold Th3 + (x) and Th3 - compared to (x), there by f (x)> Th3 + (x) situ vote for the first class (Class1), f (x) <Th3 - voted for the fourth class if (x) (Class4), Th3 + (x) ≧ f (x) ≧ Th3 - (x) If so, vote for the 1st class (Class1) and the 4th class (Class4). Furthermore, voting section 12, the output value f of the 36 support vector machine (x) threshold Th36 + (x) and Th36 - compared to (x), if f (x)> Th36 + ( x) eighth and vote on the class (Class8), f (x) <Th36 - in (x) - and vote on the ninth class if (x) (Class9), Th36 + (x) ≧ f (x) ≧ Th36 If so, vote for the 8th class (Class8) and the 9th class (Class9).

なお、本実施形態では、入力データが2以上のクラスのうちいずれか1つに属すると確定できない場合に、2以上のクラス全てに投票することとしているが、2以上のクラスいずれにも投票しないという処理であってもよい。例えば、投票部12は、第1サポートベクターマシンの出力値f(x)を閾値Th1+(x)及びTh1-(x)と比較して、f(x)>Th1+(x)であれば第1クラス(Class1)に投票し、f(x)<Th1-(x)であれば第2クラス(Class2)に投票し、Th1+(x)≧f(x)≧Th1-(x)であればいずれにも投票しないという処理を行ってもよい。 In the present embodiment, when it cannot be determined that the input data belongs to any one of the two or more classes, all the two or more classes are voted, but none of the two or more classes is voted. It may be the process. For example, voting section 12, the output value f of the first support vector machine (x) a threshold Th1 + (x) and Th1 - compared to (x), if f (x)> Th1 + (x) vote for the first class (Class1), f (x) <Th1 - in (x) - if (x) and vote on the second class (Class2), Th1 + (x ) ≧ f (x) ≧ Th1 If there is, you may perform the process of not voting for any of them.

スイッチ13は、後述する再投票処理の際に、抽出された分類器に関する投票を判定部14に伝え、それ以外の分類器に関する投票を遮断する。初回の投票時には、スイッチ13は、全ての分類器についてオンであってよい。 The switch 13 transmits the vote regarding the extracted classifier to the determination unit 14 at the time of the re-voting process described later, and blocks the vote regarding the other classifiers. At the time of the first vote, the switch 13 may be on for all classifiers.

判定部14は、複数のクラスごとの得票数に基づいて、入力データが複数のクラスのうちいずれに分類されるか判定する。判定部14は、複数の分類器11に関する投票の得票数を合計して複数のクラスごとの得票数を算出し、入力データが、最多投票数を得たクラスに分類されると判定してよい。ただし、得票数が上位所定割合であるクラスが2以上ある場合、後述する再投票処理が行われてよい。ここで、上位所定割合は、例えば上位5%であったり、上位1%であったりしてよい。 The determination unit 14 determines which of the plurality of classes the input data is classified based on the number of votes obtained for each of the plurality of classes. The determination unit 14 may calculate the number of votes obtained for each of the plurality of classes by totaling the number of votes obtained for the plurality of classifiers 11, and may determine that the input data is classified into the class with the largest number of votes. .. However, if there are two or more classes in which the number of votes obtained is the highest ratio, the re-voting process described later may be performed. Here, the upper predetermined ratio may be, for example, the upper 5% or the upper 1%.

分岐部15は、得票数に基づいて、入力データが複数のクラスのうちいずれに分類されるか判定された場合(ケース2)、特定されたクラス(Identified class)を出力する。また、分岐部15は、得票数が上位所定割合であるクラスが2以上ある場合(ケース1)、スイッチ13のオン・オフを制御して、得票数が上位所定割合である2以上のクラスに対応する出力値を出力した分類器を抽出してよい。 The branching unit 15 outputs the identified class (Identified class) when it is determined which of the plurality of classes the input data is classified based on the number of votes obtained (Case 2). Further, when there are two or more classes in which the number of votes obtained is a high-ranking predetermined ratio (case 1), the branching unit 15 controls on / off of the switch 13 to obtain two or more classes in which the number of votes obtained is a high-ranking predetermined ratio. A classifier that outputs the corresponding output value may be extracted.

本実施形態に係る判定装置10は、入力データが2以上のクラスのうちいずれか1つに属すると確定できない場合に、2以上のクラス全てに投票若しくは2以上のクラスいずれにも投票しないことで、誤分類を防止して、入力データがいずれのクラスに属するかをより精度良く判定することができる。 When the determination device 10 according to the present embodiment cannot determine that the input data belongs to any one of the two or more classes, it does not vote for all the two or more classes or for any of the two or more classes. , It is possible to prevent misclassification and more accurately determine which class the input data belongs to.

図1に示すように、閾値は、複数の分類器11毎に設定されていてよい。複数の分類器11毎に閾値を設定することで、複数の分類器11により用いられる特徴空間に適した閾値を設定することができ、入力データがいずれのクラスに属するかをより精度良く判定することができる。 As shown in FIG. 1, the threshold value may be set for each of the plurality of classifiers 11. By setting the threshold value for each of the plurality of classifiers 11, it is possible to set the threshold value suitable for the feature space used by the plurality of classifiers 11, and it is possible to more accurately determine which class the input data belongs to. be able to.

なお、複数の分類器11には、リサンプリングや各次元の数値に対する規格化等を入力データに施してフォーマット化したデータが入力されてよい。もっとも、複数の分類器11には、入力データが直接入力されてもよい。 Note that the plurality of classifiers 11 may be input with data formatted by resampling or standardizing numerical values in each dimension. However, input data may be directly input to the plurality of classifiers 11.

図2は、本実施形態に係る判定装置10の物理的構成を示す図である。判定装置10は、演算部に相当するCPU(Central Processing Unit)10aと、記憶部に相当するRAM(Random Access Memory)10bと、記憶部に相当するROM(Read only Memory)10cと、通信部10dと、入力部10eと、表示部10fと、を有する。これらの各構成は、バスを介して相互にデータ送受信可能に接続される。なお、本例では判定装置10が一台のコンピュータで構成される場合について説明するが、判定装置10は、複数のコンピュータが組み合わされて実現されてもよい。また、図2で示す構成は一例であり、判定装置10はこれら以外の構成を有してもよいし、これらの構成のうち一部を有しなくてもよい。 FIG. 2 is a diagram showing a physical configuration of the determination device 10 according to the present embodiment. The determination device 10 includes a CPU (Central Processing Unit) 10a corresponding to a calculation unit, a RAM (Random Access Memory) 10b corresponding to a storage unit, a ROM (Read only Memory) 10c corresponding to a storage unit, and a communication unit 10d. And an input unit 10e and a display unit 10f. Each of these configurations is connected to each other via a bus so that data can be transmitted and received. In this example, the case where the determination device 10 is composed of one computer will be described, but the determination device 10 may be realized by combining a plurality of computers. Further, the configuration shown in FIG. 2 is an example, and the determination device 10 may have configurations other than these, or may not have a part of these configurations.

CPU10aは、RAM10b又はROM10cに記憶されたプログラムの実行に関する制御やデータの演算、加工を行う制御部である。CPU10aは、入力データが複数のクラスのうちいずれに分類されるか判定するプログラム(判定プログラム)を実行する演算部である。CPU10aは、入力部10eや通信部10dから種々のデータを受け取り、データの演算結果を表示部10fに表示したり、RAM10bやROM10cに格納したりする。 The CPU 10a is a control unit that controls execution of a program stored in the RAM 10b or ROM 10c, calculates data, and processes data. The CPU 10a is a calculation unit that executes a program (determination program) for determining which of a plurality of classes the input data is classified into. The CPU 10a receives various data from the input unit 10e and the communication unit 10d, displays the calculation result of the data on the display unit 10f, and stores it in the RAM 10b or ROM 10c.

RAM10bは、記憶部のうちデータの書き換えが可能なものであり、例えば半導体記憶素子で構成されてよい。RAM10bは、CPU10aが実行するプログラム、学習データといったデータを記憶してよい。なお、これらは例示であって、RAM10bには、これら以外のデータが記憶されていてもよいし、これらの一部が記憶されていなくてもよい。 The RAM 10b is a storage unit capable of rewriting data, and may be composed of, for example, a semiconductor storage element. The RAM 10b may store data such as a program executed by the CPU 10a and learning data. It should be noted that these are examples, and data other than these may be stored in the RAM 10b, or a part of these may not be stored.

ROM10cは、記憶部のうちデータの読み出しが可能なものであり、例えば半導体記憶素子で構成されてよい。ROM10cは、例えば判定プログラムや、書き換えが行われないデータを記憶してよい。 The ROM 10c is a storage unit capable of reading data, and may be composed of, for example, a semiconductor storage element. The ROM 10c may store, for example, a determination program or data that is not rewritten.

通信部10dは、判定装置10を他の機器に接続するインターフェースである。通信部10dは、インターネット等の通信ネットワークに接続されてよい。 The communication unit 10d is an interface for connecting the determination device 10 to another device. The communication unit 10d may be connected to a communication network such as the Internet.

入力部10eは、ユーザからデータの入力を受け付けるものであり、例えば、キーボード及びタッチパネルを含んでよい。 The input unit 10e receives data input from the user, and may include, for example, a keyboard and a touch panel.

表示部10fは、CPU10aによる演算結果を視覚的に表示するものであり、例えば、LCD(Liquid Crystal Display)により構成されてよい。表示部10fは、例えば、分類器の学習結果を表示してよい。 The display unit 10f visually displays the calculation result by the CPU 10a, and may be configured by, for example, an LCD (Liquid Crystal Display). The display unit 10f may display, for example, the learning result of the classifier.

判定プログラムは、RAM10bやROM10c等のコンピュータによって読み取り可能な記憶媒体に記憶されて提供されてもよいし、通信部10dにより接続される通信ネットワークを介して提供されてもよい。判定装置10では、CPU10aが判定プログラムを実行することにより、複数の分類器11、投票部12、スイッチ13、判定部14及び分岐部15等の様々な動作が実現される。なお、これらの物理的な構成は例示であって、必ずしも独立した構成でなくてもよい。例えば、判定装置10は、CPU10aとRAM10bやROM10cが一体化したLSI(Large-Scale Integration)を備えていてもよい。 The determination program may be stored in a storage medium readable by a computer such as RAM 10b or ROM 10c and provided, or may be provided via a communication network connected by the communication unit 10d. In the determination device 10, various operations such as the plurality of classifiers 11, the voting unit 12, the switch 13, the determination unit 14, and the branch unit 15 are realized by the CPU 10a executing the determination program. It should be noted that these physical configurations are examples and do not necessarily have to be independent configurations. For example, the determination device 10 may include an LSI (Large-Scale Integration) in which the CPU 10a and the RAM 10b or ROM 10c are integrated.

図3は、本実施形態に係る学習装置により実行される閾値設定処理の概要を示す図である。ここで、学習装置は、判定装置10と別対のコンピュータで構成されてよいが、判定装置10と一体で構成されてもよい。本実施形態において、入力データは、時系列データであり、複数の分類器11は、時系列データの複数の時点における値をそれぞれ2以上のクラスに分類する複数の出力値を出力する。図3では、ある分類器11にクラスAに属する時系列データを入力した場合の出力値f(x)を示した第1グラフG1と、同じ分類器11にクラスBに属する時系列データを入力した場合の出力値f(x)を示した第2グラフG2と、それらの出力値に基づいて設定された閾値Thi+(x),Thj-(x)を示す第3グラフG3と、を図示している。なお、入力データは、時系列データに限定されず、任意の次元のデータであってよい。 FIG. 3 is a diagram showing an outline of the threshold value setting process executed by the learning device according to the present embodiment. Here, the learning device may be configured by a computer paired with the determination device 10, but may be integrally configured with the determination device 10. In the present embodiment, the input data is time series data, and the plurality of classifiers 11 output a plurality of output values for classifying the values of the time series data at a plurality of time points into two or more classes. In FIG. 3, the first graph G1 showing the output value f (x) when the time series data belonging to the class A is input to a certain classifier 11 and the time series data belonging to the class B are input to the same classifier 11. FIG third graph G3 showing the (x), a - and a second graph G2 shows the output value f (x) in the case of, their output value threshold was set based on the Thi + (x), Thj Shown. The input data is not limited to time series data, and may be data of any dimension.

第1グラフG1及び第2グラフG2に示すように、時系列データは、所定の時間間隔でサンプリングされて分類器11に入力され、その出力値f(x)が得られる。なお、第1グラフG1、第2グラフG2及び第3グラフG3では、横軸にデータ番号を示しており、データ番号は、時系列データを所定の時間間隔で分割した場合に時系列順に付された連続番号である。 As shown in the first graph G1 and the second graph G2, the time series data is sampled at a predetermined time interval and input to the classifier 11, and the output value f (x) thereof is obtained. In the first graph G1, the second graph G2, and the third graph G3, the data numbers are shown on the horizontal axis, and the data numbers are assigned in chronological order when the time series data is divided at predetermined time intervals. It is a serial number.

判定装置10は、時系列データを所定の時間間隔でサンプリングした値を分類器11によってそれぞれ分類し、その出力値を閾値と比較して投票処理を行い、得票数に基づいて、時系列データが全体としていずれのクラスに属するか判定する。このように、時系列データの複数の時点における値に関する分類器11の出力値を用いて投票を行い、時系列データが2以上のクラスのうちいずれに分類されるか判定することができる。 The determination device 10 classifies the values obtained by sampling the time series data at predetermined time intervals by the classifier 11, compares the output value with the threshold value, performs voting processing, and obtains the time series data based on the number of votes obtained. Determine which class it belongs to as a whole. In this way, voting can be performed using the output values of the classifier 11 regarding the values of the time series data at a plurality of time points, and it can be determined which of the two or more classes the time series data is classified into.

第1グラフG1及び第2グラフG2において、出力値f(x)が負の場合がクラスAに対応し、出力値f(x)が正の場合がクラスBに対応している。そのため、第1グラフG1では、データ点P1が誤ってクラスBと判定されるデータとなっている。また、第2グラフG2では、データ点P2が誤ってクラスAと判定されるデータとなっている。 In the first graph G1 and the second graph G2, when the output value f (x) is negative, it corresponds to class A, and when the output value f (x) is positive, it corresponds to class B. Therefore, in the first graph G1, the data point P1 is erroneously determined to be class B. Further, in the second graph G2, the data point P2 is erroneously determined to be class A.

閾値を設定する学習装置は、誤判定されたデータ点P1の値を閾値Thi+(x)に設定し、誤判定されたデータ点P2の値を閾値Thj-(x)に設定してよい。ここで、i及びjは、データ番号を表す。また、学習装置は、誤判定しなかったデータ点について、閾値を0に設定してよい。このように、学習装置は、データ点毎に閾値を設定してよい。もっとも、学習装置は、複数のデータ点に共通の閾値を設定してもよい。例えば、学習装置は、データ点P1の最大値及びデータ点P2の最小値を共通の閾値に設定してもよい。その場合、Thi+(x)は、全てのiについてデータ点P1の最大値となり、Thj-(x)は、全てのjについてデータ点P2の最小値となる。 The learning device that sets the threshold value may set the value of the erroneously determined data point P1 to the threshold value Thi + (x) and set the value of the erroneously determined data point P2 to the threshold value Thj (x). Here, i and j represent data numbers. Further, the learning device may set the threshold value to 0 for the data points that have not been erroneously determined. In this way, the learning device may set a threshold value for each data point. However, the learning device may set a common threshold value for a plurality of data points. For example, the learning device may set the maximum value of the data point P1 and the minimum value of the data point P2 to a common threshold value. In that case, Thi + (x) becomes the maximum value of the data point P1 for all i, Thj - (x) is a minimum value of the data point P2 for all j.

本実施形態において、閾値は、学習データを用いて複数の分類器11の学習処理を行う場合に、複数の分類器11が誤分類した学習データに関する出力値に基づいて設定されている。本例の場合、複数の分類器11が誤分類した学習データは、データ点P1及びデータ点P2である。このようにして、複数の分類器11が誤分類し得るデータを、2以上のクラスのうちいずれか1つに属すると確定できないデータとして扱うことができ、入力データがいずれのクラスに属するかをより精度良く判定することができる。 In the present embodiment, the threshold value is set based on the output value related to the learning data misclassified by the plurality of classifiers 11 when the learning processing of the plurality of classifiers 11 is performed using the learning data. In the case of this example, the learning data misclassified by the plurality of classifiers 11 are the data point P1 and the data point P2. In this way, data that can be misclassified by the plurality of classifiers 11 can be treated as data that cannot be determined if it belongs to any one of two or more classes, and which class the input data belongs to can be determined. The judgment can be made more accurately.

図4は、本実施形態に係る学習装置により実行される学習処理及び閾値設定処理のフローチャートである。学習処理において、学習装置は、はじめに、リファレンス波形の選定を行う(S1)。リファレンス波形の選定は、予め収集した時系列データの中から、特定のクラスを代表するデータを選定することで行われてよい。 FIG. 4 is a flowchart of the learning process and the threshold value setting process executed by the learning device according to the present embodiment. In the learning process, the learning device first selects a reference waveform (S1). The reference waveform may be selected by selecting data representing a specific class from the time series data collected in advance.

次に、学習装置は、リファレンス波形の学習フォーマット化を行い(S2)、フォーマット化したリファレンス波形を学習データD1として記憶する。学習フォーマット化は、公知のデータ前処理を適用することで行われてよい。例えば、学習フォーマット化は、リサンプリングや各次元の数値に対する規格化等をリファレンス波形に施すことで行ってよい。 Next, the learning device performs learning formatting of the reference waveform (S2), and stores the formatted reference waveform as learning data D1. The learning formatting may be performed by applying a known data preprocessing. For example, learning formatting may be performed by applying resampling, normalization for numerical values of each dimension, or the like to the reference waveform.

最後に、学習装置は、SVM(Support Vector Machine)の機械学習を行い(S3)、生成された学習モデルD2を記憶する。ここで、サポートベクターマシンの機械学習は、マージン最大化を行うようにサポートベクターを選ぶ公知の学習処理によって行われてよい。また、学習モデルD2は、複数の分類器11を含んでよい。 Finally, the learning device performs machine learning of SVM (Support Vector Machine) (S3) and stores the generated learning model D2. Here, the machine learning of the support vector machine may be performed by a known learning process that selects the support vector so as to maximize the margin. Further, the learning model D2 may include a plurality of classifiers 11.

閾値設定処理において、学習装置は、はじめに、学習モデルによって学習データを分類する(S4)。ここで、学習データD1及び学習モデルD2が参照される。 In the threshold setting process, the learning device first classifies the learning data according to the learning model (S4). Here, the learning data D1 and the learning model D2 are referred to.

そして、学習装置は、学習モデルによる分類結果が正しいか確認する(S5)。分類結果の正誤は、学習データD1とあわせて生成された正答値D3を参照して確認される。学習装置は、誤分類時の学習モデルの出力値D4を記憶し、その最大値及び最小値によって閾値D5を設定する。以上により、学習処理及び閾値設定処理が終了する。 Then, the learning device confirms whether the classification result by the learning model is correct (S5). The correctness of the classification result is confirmed by referring to the correct answer value D3 generated together with the learning data D1. The learning device stores the output value D4 of the learning model at the time of misclassification, and sets the threshold value D5 according to the maximum value and the minimum value thereof. As a result, the learning process and the threshold setting process are completed.

図5は、本実施形態に係る判定装置10により実行される投票処理のフローチャートである。はじめに、判定装置10は、時系列データを分割した値xを取得する(S10)。そして、判定装置10は、複数の分類器11に値xを入力し、その出力値がThi+(x)≧f(x)≧Thi-(x)を満たすか否かを判定する(S11)。 FIG. 5 is a flowchart of a voting process executed by the determination device 10 according to the present embodiment. First, the determination device 10 acquires the value x obtained by dividing the time series data (S10). Then, the determination device 10 inputs the value x to the plurality of classifiers 11 and determines whether or not the output value satisfies Thi + (x) ≧ f (x) ≧ Thi (x) (S11). ..

出力値がThi+(x)≧f(x)≧Thi-(x)を満たす場合(S11:YES)、判定装置10は、クラスA及びBに投票する。すなわち、2以上のクラス全てに投票する。 Output value Thi + (x) ≧ f ( x) ≧ Thi - if satisfying (x) (S11: YES) , the determination unit 10, vote for class A and B. That is, vote for all two or more classes.

一方、出力値がThi+(x)≧f(x)≧Thi-(x)を満たさない場合(S11:NO)、判定装置10は、出力値がf(x)>Thi+(x)を満たすか否かを判定する(S13)。出力値がf(x)>Thi+(x)を満たす場合(S13:YES)、判定装置10は、クラスAに投票する。一方、出力値がf(x)>Thi+(x)を満たさない場合(S13:No)、すなわち出力値がThi-(x)>f(x)を満たす場合、判定装置10は、クラスBに投票する(S15)。 On the other hand, the output value Thi + (x) ≧ f ( x) ≧ Thi - is not satisfied (x) (S11: NO) , the determination unit 10, the output value of the f (x)> Thi + (x ) It is determined whether or not the condition is satisfied (S13). When the output value satisfies f (x)> Thi + (x) (S13: YES), the determination device 10 votes for class A. On the other hand, if the output value does not satisfy the f (x)> Thi + ( x) (S13: No), that is, an output value Thi - if satisfying (x)> f (x) , the determination unit 10, Class B Vote for (S15).

その後、判定装置10は、投票処理を全ての分類器11について完了したか否かを判定し(S16)、全ての分類器11について投票処理が完了していない場合(S16:NO)、処理S11〜S15を残りの分類器11について実行する。 After that, the determination device 10 determines whether or not the voting process has been completed for all the classifiers 11 (S16), and if the voting process has not been completed for all the classifiers 11 (S16: NO), the process S11. ~ S15 is executed for the remaining classifier 11.

一方、投票処理を全ての分類器11について完了した場合(S16:YES)、判定装置10は、時系列データを分割して得られる全データについて投票処理が完了したか否かを判定し(S17)、全データについて投票処理が完了していない場合(S17:NO)、処理S11〜S16を残りのデータについて実行する。 On the other hand, when the voting process is completed for all the classifiers 11 (S16: YES), the determination device 10 determines whether or not the voting process is completed for all the data obtained by dividing the time series data (S17). ), If the voting process is not completed for all the data (S17: NO), the processes S11 to S16 are executed for the remaining data.

一方、全データについて投票処理が完了した場合(S17:YES)、判定装置10は、クラス毎に得票数を合算する(S18)。以降、次図に示す判定処理に続く。 On the other hand, when the voting process for all the data is completed (S17: YES), the determination device 10 adds up the number of votes obtained for each class (S18). After that, the determination process shown in the next figure is continued.

図6は、本実施形態に係る判定装置10により実行される判定処理のフローチャートである。判定装置10は、投票が一回目であるか否かを判定する(S20)。投票が一回目である場合(S20:YES)、判定装置10は、得票数が上位所定割合であるクラスが2以上あるか否かを判定する(S21)。得票数が上位所定割合であるクラスが2以上ない場合(S21:NO)、判定装置10は、得票数最多のクラスを判定結果として出力する(S22)。一方、得票数が上位所定割合であるクラスが2以上ある場合(S21:YES)、判定装置10は、当該2以上のクラスに対応する出力値を出力した分類器11を抽出する(S23)。そして、抽出した分類器11について、図5に示す処理S10〜S18を実行し、再投票処理を行う。 FIG. 6 is a flowchart of the determination process executed by the determination device 10 according to the present embodiment. The determination device 10 determines whether or not the vote is the first time (S20). When the voting is the first time (S20: YES), the determination device 10 determines whether or not there are two or more classes in which the number of votes obtained is the highest predetermined ratio (S21). When there are no more than two classes in which the number of votes obtained is a higher predetermined ratio (S21: NO), the determination device 10 outputs the class having the largest number of votes as a determination result (S22). On the other hand, when there are two or more classes in which the number of votes obtained is a higher predetermined ratio (S21: YES), the determination device 10 extracts the classifier 11 that outputs the output values corresponding to the two or more classes (S23). Then, the extracted classifiers 11 are subjected to the processes S10 to S18 shown in FIG. 5 to perform the re-voting process.

判定装置10の投票部12は、得票数が上位所定割合であるクラスが2以上ある場合に、当該2以上のクラスに対応する出力値を出力した分類器11を抽出し、抽出した分類器11それぞれの出力値を閾値と比較して、2以上のクラスのうちいずれか1つに再投票又は2以上のクラス全てに再投票若しくは2以上のクラスいずれにも再投票せず、判定部14は、再投票された複数のクラスごとの得票数に基づいて、入力データが複数のクラスのうちいずれに分類されるか判定してよい。このようにして、得票数が上位所定割合であるクラスが2以上あり、入力データが当該クラスのうちいずれに分類されるか確定できない場合に、当該クラスに対応する出力値を出力した分類器11によって再投票を行い、入力データがいずれのクラスに属するかをより精度良く判定することができる。 The voting unit 12 of the determination device 10 extracts a classifier 11 that outputs an output value corresponding to the two or more classes when there are two or more classes in which the number of votes obtained is a high-ranking predetermined ratio, and the extracted classifier 11 Each output value is compared with the threshold value, and the determination unit 14 does not re-vote for any one of the two or more classes, re-votes for all the two or more classes, or re-votes for any of the two or more classes. , It may be determined which of the plurality of classes the input data is classified based on the number of votes obtained for each of the plurality of re-voted classes. In this way, when there are two or more classes in which the number of votes obtained is a high-ranking predetermined ratio and it is not possible to determine which of the classes the input data is classified into, the classifier 11 that outputs the output value corresponding to the class. It is possible to re-vote by and more accurately determine which class the input data belongs to.

投票が一回目でない場合(S20:NO)、すなわち再投票の場合、判定装置10は、得票数が上位所定割合であるクラスが前回投票と同一であるか否かを判定する(S24)。得票数が上位所定割合であるクラスが前回投票と同一でない場合(S24:NO)、判定装置10は、再投票の得票数について、処理S21〜S23を実行する。 When the vote is not the first time (S20: NO), that is, when the vote is re-voted, the determination device 10 determines whether or not the class in which the number of votes obtained is the highest predetermined ratio is the same as the previous vote (S24). When the class in which the number of votes obtained is the highest predetermined ratio is not the same as the previous vote (S24: NO), the determination device 10 executes processes S21 to S23 for the number of votes obtained for re-voting.

一方、得票数が上位所定割合であるクラスが前回投票と同一である場合(S24:YES)、判定装置10は、各クラスの学習データと入力データの差分の総和を算出する(S25)。そして、判定装置10は、得票数が上位所定割合であるクラスについて差分の総和が等しいか否かを判定する(S26)。差分の総和が等しくない場合(S26:NO)、判定装置10は、差分の総和が小さいクラスを判定結果として出力する(S27)。一方、差分の総和が等しい場合(S26:YES)、判定装置10は、得票数が上位所定割合である2以上のクラスのうち順番が若いクラスを判定結果として出力する(S28)。以上により、判定処理が終了する。 On the other hand, when the class in which the number of votes obtained is the highest predetermined ratio is the same as the previous vote (S24: YES), the determination device 10 calculates the sum of the differences between the learning data and the input data of each class (S25). Then, the determination device 10 determines whether or not the total sum of the differences is the same for the class in which the number of votes obtained is the upper predetermined ratio (S26). When the sum of the differences is not equal (S26: NO), the determination device 10 outputs a class having a small sum of differences as the determination result (S27). On the other hand, when the sum of the differences is the same (S26: YES), the determination device 10 outputs the class having the youngest order among the two or more classes having the higher predetermined ratio of the number of votes obtained as the determination result (S28). With the above, the determination process is completed.

以上説明した実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。実施形態が備える各要素並びにその配置、材料、条件、形状及びサイズ等は、例示したものに限定されるわけではなく適宜変更することができる。また、異なる実施形態で示した構成同士を部分的に置換し又は組み合わせることが可能である。 The embodiments described above are for facilitating the understanding of the present invention, and are not for limiting and interpreting the present invention. Each element included in the embodiment and its arrangement, material, condition, shape, size, etc. are not limited to those exemplified, and can be changed as appropriate. In addition, the configurations shown in different embodiments can be partially replaced or combined.

10…判定装置、10a…CPU、10b…RAM、10c…ROM、10d…通信部、10e…入力部、10f…表示部、11…分類器、12…投票部、13…スイッチ、14…判定部、15…分岐部 10 ... Judgment device, 10a ... CPU, 10b ... RAM, 10c ... ROM, 10d ... Communication unit, 10e ... Input unit, 10f ... Display unit, 11 ... Classifier, 12 ... Voting unit, 13 ... Switch, 14 ... Judgment unit , 15 ... Branch

Claims (8)

入力データを複数のクラスのうちの2以上のクラスに分類する値をそれぞれ出力する複数の分類器と、
前記複数の分類器の複数の出力値をそれぞれ閾値と比較して、前記複数の分類器ごとに、前記2以上のクラスのうちいずれか1つに投票又は前記2以上のクラス全てに投票若しくは前記2以上のクラスいずれにも投票しない投票部と、
前記複数のクラスごとの得票数に基づいて、前記入力データが前記複数のクラスのうちいずれに分類されるか判定する判定部と、
を備える判定装置。
Multiple classifiers that output values that classify input data into two or more classes out of multiple classes,
The plurality of output values of the plurality of classifiers are compared with the threshold values, and each of the plurality of classifiers is voted for any one of the two or more classes, or for all of the two or more classes, or the above. A voting department that does not vote for any of two or more classes,
A determination unit that determines which of the plurality of classes the input data is classified based on the number of votes obtained for each of the plurality of classes.
Judgment device including.
前記入力データは、時系列データであり、
前記複数の分類器は、前記時系列データの複数の時点における値をそれぞれ前記2以上のクラスに分類する複数の出力値を出力する、
請求項1に記載の判定装置。
The input data is time series data and
The plurality of classifiers output a plurality of output values that classify the values of the time series data at a plurality of time points into the two or more classes.
The determination device according to claim 1.
前記投票部は、得票数が上位所定割合であるクラスが2以上ある場合に、当該2以上のクラスに対応する出力値を出力した分類器を抽出し、抽出した分類器それぞれの出力値を前記閾値と比較して、前記2以上のクラスのうちいずれか1つに再投票又は前記2以上のクラス全てに再投票若しくは前記2以上のクラスいずれにも再投票せず、
前記判定部は、前記再投票された前記複数のクラスごとの得票数に基づいて、前記入力データが前記複数のクラスのうちいずれに分類されるか判定する、
請求項1又は2に記載の判定装置。
When there are two or more classes in which the number of votes obtained is a high-ranking predetermined ratio, the voting unit extracts a classifier that outputs an output value corresponding to the two or more classes, and outputs the output value of each of the extracted classifiers. Compared to the threshold, do not re-vote any one of the two or more classes, re-vote all of the two or more classes, or re-vote either of the two or more classes.
The determination unit determines which of the plurality of classes the input data is classified based on the number of votes obtained for each of the plurality of classes that have been re-voted.
The determination device according to claim 1 or 2.
前記複数の分類器は、前記2以上のクラスそれぞれについて1の代表データを含む学習データを用いて学習された複数のサポートベクターマシンを含む、
請求項1から3のいずれか一項に記載の判定装置。
The plurality of classifiers include a plurality of support vector machines trained using training data including one representative data for each of the two or more classes.
The determination device according to any one of claims 1 to 3.
前記閾値は、前記複数の分類器毎に設定されている、
請求項1から4のいずれか一項に記載の判定装置。
The threshold value is set for each of the plurality of classifiers.
The determination device according to any one of claims 1 to 4.
前記閾値は、学習データを用いて前記複数の分類器の学習処理を行う場合に、前記複数の分類器が誤分類した学習データに関する出力値に基づいて設定されている、
請求項1から5のいずれか一項に記載の判定装置。
The threshold value is set based on the output value of the learning data misclassified by the plurality of classifiers when the learning process of the plurality of classifiers is performed using the training data.
The determination device according to any one of claims 1 to 5.
判定装置に、
複数の分類器によって、入力データを複数のクラスのうちの2以上のクラスに分類する値をそれぞれ出力することと、
前記複数の分類器の複数の出力値をそれぞれ閾値と比較して、前記複数の分類器ごとに、前記2以上のクラスのうちいずれか1つに投票又は前記2以上のクラス全てに投票若しくは前記2以上のクラスいずれにも投票しないことと、
前記複数のクラスごとの得票数に基づいて、前記入力データが前記複数のクラスのうちいずれに分類されるか判定することと、
を実行させる判定方法。
For the judgment device,
Outputting values that classify input data into two or more classes out of multiple classes by multiple classifiers, and
The plurality of output values of the plurality of classifiers are compared with the threshold values, and each of the plurality of classifiers is voted for any one of the two or more classes, or for all of the two or more classes, or the above. Do not vote for any of the two or more classes
Based on the number of votes obtained for each of the plurality of classes, it is determined which of the plurality of classes the input data is classified into.
Judgment method to execute.
判定装置に、
複数の分類器によって、入力データを複数のクラスのうちの2以上のクラスに分類する値をそれぞれ出力することと、
前記複数の分類器の複数の出力値をそれぞれ閾値と比較して、前記複数の分類器ごとに、前記2以上のクラスのうちいずれか1つに投票又は前記2以上のクラス全てに投票若しくは前記2以上のクラスいずれにも投票しないことと、
前記複数のクラスごとの得票数に基づいて、前記入力データが前記複数のクラスのうちいずれに分類されるか判定することと、
を実行させる判定プログラム。
For the judgment device,
Outputting values that classify input data into two or more classes out of multiple classes by multiple classifiers, and
The plurality of output values of the plurality of classifiers are compared with the threshold values, and each of the plurality of classifiers is voted for any one of the two or more classes, or for all of the two or more classes, or the above. Do not vote for any of the two or more classes
Based on the number of votes obtained for each of the plurality of classes, it is determined which of the plurality of classes the input data is classified into.
Judgment program to execute.
JP2019050865A 2019-03-19 2019-03-19 Apparatus, method and program for determination Pending JP2020154513A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019050865A JP2020154513A (en) 2019-03-19 2019-03-19 Apparatus, method and program for determination

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019050865A JP2020154513A (en) 2019-03-19 2019-03-19 Apparatus, method and program for determination

Publications (1)

Publication Number Publication Date
JP2020154513A true JP2020154513A (en) 2020-09-24

Family

ID=72559119

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019050865A Pending JP2020154513A (en) 2019-03-19 2019-03-19 Apparatus, method and program for determination

Country Status (1)

Country Link
JP (1) JP2020154513A (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010272053A (en) * 2009-05-25 2010-12-02 Victor Co Of Japan Ltd Data classifier creation device, data classification device, data classifier creation method, data classification method, data classifier creation program, and data classification program
JP2018510013A (en) * 2015-03-31 2018-04-12 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. Automatic detection / classification of ECG cable replacement for different ECG guidance systems

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010272053A (en) * 2009-05-25 2010-12-02 Victor Co Of Japan Ltd Data classifier creation device, data classification device, data classifier creation method, data classification method, data classifier creation program, and data classification program
JP2018510013A (en) * 2015-03-31 2018-04-12 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. Automatic detection / classification of ECG cable replacement for different ECG guidance systems

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
中台慎二、登内敏夫: "サポートベクターマシンを用いた事例ベース障害検出", 電子情報通信学会技術研究報告, vol. 第108巻,第288号, JPN6020006736, 6 November 2008 (2008-11-06), JP, pages 1 - 6, ISSN: 0004437513 *
杉山将, イラストで学ぶ機械学習 最小二乗法による識別モデル学習を中心に, vol. 第1刷, JPN6021002982, 20 September 2013 (2013-09-20), pages 066 - 074, ISSN: 0004437512 *

Similar Documents

Publication Publication Date Title
Derrac et al. Analyzing convergence performance of evolutionary algorithms: A statistical approach
Bilalli et al. Intelligent assistance for data pre-processing
Mantas et al. Analysis of Credal-C4. 5 for classification in noisy domains
Carrizosa et al. A nested heuristic for parameter tuning in support vector machines
KR102337070B1 (en) Method and system for building training database using automatic anomaly detection and automatic labeling technology
Liu et al. Granular computing-based approach of rule learning for binary classification
Jatav An algorithm for predictive data mining approach in medical diagnosis
JPWO2018079225A1 (en) Automatic prediction system, automatic prediction method, and automatic prediction program
Langone et al. Kernel spectral clustering for community detection in complex networks
JP2021096775A (en) Learning method, learning program, and information processing device
US20210004698A1 (en) Prediction method, prediction apparatus, and computer-readable recording medium
Rodriguez et al. Multi-objective information retrieval-based NSGA-II optimization for requirements traceability recovery
JP2020154513A (en) Apparatus, method and program for determination
Abellán et al. An experimental study about simple decision trees for bagging ensemble on datasets with classification noise
Cano et al. Training set selection for monotonic ordinal classification
US20230115697A1 (en) Non-transitory computer-readable storage medium for storing prediction program, prediction method, and prediction apparatus
Ribeiro et al. Multi-objective support vector machines ensemble generation for water quality monitoring
Verbeeck et al. Multi-objective optimization with surrogate trees
Kar et al. Estimation of raw silk quality using rough set theory
Li et al. An incremental decision tree for mining multilabel data
Daud et al. Scalable link prediction in twitter using self-configured framework
Piantoni et al. Impact of base partitions on multi-objective and traditional ensemble clustering algorithms
Nguyen et al. Early in-trouble student identification based on temporal educational data clustering
Cruz-Reyes et al. Simplification of decision rules for recommendation of projects in a public project portfolio
Chen Research on teaching methods of teachers’ ideological education based on large data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190319

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200420

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200812

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201112

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20201112

C11 Written invitation by the commissioner to file amendments

Free format text: JAPANESE INTERMEDIATE CODE: C11

Effective date: 20201125

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20201225

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20210105

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20210205

C211 Notice of termination of reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C211

Effective date: 20210209

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20210308

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20210405

C13 Notice of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: C13

Effective date: 20210810

C23 Notice of termination of proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C23

Effective date: 20211101

C03 Trial/appeal decision taken

Free format text: JAPANESE INTERMEDIATE CODE: C03

Effective date: 20211201

C30A Notification sent

Free format text: JAPANESE INTERMEDIATE CODE: C3012

Effective date: 20211201